中国古典文献学作为现代大学的一个学科门类是二十世纪才建立起来的,但作为一种知识或学问体系,却是非常古老的,至少可以追溯到汉代的刘向、刘歆父子。经过历代无数文献学家的努力,这门学问的主干知识(如目录学、版本学、校勘学、典藏学)的古典形态已经发展得比较成熟了。但是,随着科技现代化的飞速发展以及电子信息技术的日新月异,这门古老的学问今天正面临“与时俱进”的挑战或压力。电子计算机技术在古籍整理与研究中的普遍运用,不仅使古籍电子文献日益增多,而且使古籍整理与研究的手段正在发生革命性的变化。如何应对这些变化对古典文献学学科建设的影响,恐怕是我们这些从事古典文献学教学与研究的人文工作者不能不认真加以思考的。 首先,在古典文献学教材编写中应包括电子文献的内容。 教材是学科建设中的一个重要的中间环节。教材通常是一门学科知识的历史积淀和系统总结。一部好的教材,除了准确地表述已经定型的知识,还应该及时反映或提炼这门学科在当代的发展中所形成的新知识、新成果、新方法、新手段等。这一方面是博古通今的需要,同时也是学术“预流”的体现。正是本着这样的认识,我们在编写《中国古典文献学》(华中师范大学出版社2003年3月版)时,首次将“电子”概念引入文献的载体形式。有关的表述是这样的: 电子,是一个物理学概念。一切物体都是由大量原子构成的,而原子则是由带正电的原子核和带负电的电子构成。作为文献载体的“电子”,与物理学意义上讲的“电子”有所不同。它是记载、传递信息的一种物质状态或方式,与电子计算机密切相关。电子计算机是一种能自动、高速、精确地进行算术计算和逻辑计算并具有存储记忆功能的电子设备。如果从1946年美国宾西法尼亚大学诞生的第一台电子计算机算起,电子计算机的历史也不过50多年,但它对人类科技发展的推动是无法估量的。电子计算机不仅极大地改变了人类传统的生产方式和生活方式,也极大地改变了文献的载体形式。(●见张三夕主编:《中国古典文献学》,华中师范大学出版社2003年3月版,第24页) 接着,我们分析了电子文献载体的若干特色,此处不赘引。我曾经和一位上海交大毕业的计算机专业的研究生反复推敲这一节内容的表述,他认为能够成立,使我这个非计算机专业的人感到稍稍有点心安。最近看到一位图书馆馆长的类似说法: 数字图书馆中的众多信息资源,不论是传统的文字、图像,还是声音、影像乃至气味、动感等多媒体信息,都以“比特”的形式永久性地存储在电、磁、光介质之中,能够方便地流动在信息网络上,成为人类共享的知识财富。(●见邓新民:《数字图书馆的三大定律》,载《光明日报》2004年8月4日C2版) 所谓“比特”,是电子计算机存储信息的最小单位即一个二进制位,“比特没有颜色、尺寸或重量,能以光速传播。”(●见尼葛洛庞帝:《数字化生存》,胡泳等译,海南出版社1997年版,第24页。)比特是数字化计算中的基本粒子,好比人体中的DNA一样。 除了在文献载体形式中提出“电子”概念,我们还在教材的第九章专门讲授电子文献的检索,介绍了《四库全书全文检索系统》等电子文献全文检索系统以及各种网络数据库。我们认为,电子文献最强大的功能就在于检索方面。正是电子文献强大的检索功能极大地改善了学术研究和文献考证的手段。比如任意一个字词在某一总集(如《全唐诗》、《全唐文》)或综合文献(如《十三经》、《二十五史》)、大型丛书(如《四库全书》、《古今图书集成》)中出现的次数或频率,靠手工统计几乎是不可能的,而在电子文献全文检索系统中则易于反掌。电子文献强大的检索功能使某些证据的收集可以穷尽。 在古典文献学的教学活动中,教师现在面临电子文献飞速发展的挑战或压力是很大的。我们除了要教会学生熟悉并掌握古典文献学的传统知识,同时,也要求学生学会使用大量的古籍电子文献,而有些教师本身在这方面也需要学习与提高,有的学生在这方面的技能甚至超过老师。古典文献学的有些知识需要更新或充实,比如校勘学,电子文献文本的文字讹误,是由于不同的字符输入方式所造成。五笔字型输入法和拼音输入法所带来的文字讹误是不同的。如果新编古典文献学教材,应该反映这方面的问题。最理想的状态是古典文献学教材的编写能够与古籍电子文献的发展同步。在条件成熟时,我们设想有可能出现一个新的分支学科——古籍电子文献学。(笔者曾有过这一课题的编写计划,但囿于计算机水平的低下,不敢贸然动手。)它的知识结构是跨学科的,但在学科种属或级别关系上则分属于古典文献学之下。至少它可以成为一个学科发展的专业方向。 古典文献学学科建设面临更为巨大的矛盾或冲突是,当电脑越来越普及,古籍电子文献成为学生或研究生的阅读的主要文本形式,势必就造成当代文史专业的大学生读线装书的机会越来越少,能力越来越差。如何克服这种矛盾或冲突,是我们必须加以研究的问题。 其次,古典文献学要加强对古籍整理的电子出版物进行研究。 电子古籍出版物可以分为正式出版物或非正式出版物。所谓正式出版物指一些公司(尤其是数字化公司)或个人与出版社合作出版的数据光盘,如香港迪志文化出版有限公司和上海人民出版社合作出版的《文渊阁四库全书》电子版,北京书同文数字化技术有限公司、万方数据电子出版社合作出版的《四部丛刊》电子版。所谓非正式出版物指一些公司或个人研制的数据光盘,不是经由出版社出版的。这类古籍电子出版物可以北京国学时代文化传播公司尹小林研制的《国学宝典》和陕西师大历史文化学院袁林主持研制的《汉籍全文检索系统》为代表。 电子古籍出版物与传统的纸质文献相比,优势十分明显。一张光盘可存储3亿2千5百万个汉字,如果平均按20万字一本书计算,一张光盘可存储纸质书1625本,这样巨大的存储量是古人绝对无法想象的。光盘作为一种新型的存储介质,具有存储量大,携带轻便,使用方便,易于保管,成本低廉等优点,因而具有广阔的用途。一套经过缩印的《文渊阁四库全书》单排书摆放,需要近10个2米高1米宽的书柜,而一套《四库全书》的光盘,只用一两个抽屉就可以放下。 电子古籍出版物在检索功能上远远超过纸质文献,电子文献一般都具有全文检索功能,如《国学宝典》和《汉籍全文检索系统》既可以对其所收全部文献进行检索,也可以选择部分文献或一种文献进行检索。检索的结果可以文本文件的形式打印。它还具有统计功能,统计任意字、次在文献中出现的频率和次数。这对于学术研究和文献考据非常有帮助。电子文献在版本的更新上也非常快。如《国学宝典》在不断扩充收录的文献种类的过程中也不断更新版本,在短短的几年中它就出到7版,其V7.0版收录的中国古代典籍1400多种,3亿多字。天津永川软件技术有限公司开发的《二十五史全文检索阅读系统》从2?0版升级到3?0版,就解决了很多生难字的录入和编码问题。 电子古籍出版物一方面向大而全的方向发展,如上文提到的《四库全书》光盘、《国学宝典》和《汉籍全文检索系统》等,又如台湾中央研究院与一些大学合作开发的汉籍电子文献《瀚典全文检索系统》,已经涵盖唐以前绝大部分传世文献,目前该数据库以至少每年1000万字的速度增长。另一方面向专业化和学科化方向发展。最近,一种由首都师范大学牵头,联合南京师范大学、四川师范大学、鞍山师范学院共同开发的《中国古代文学电子史料库》光盘由商务印书馆国际有限公司正式出版发行。这套电子史料库是按断代编排,尽可能把某一个时期的文学史料收集齐全,它对于古代文学的教学与研究是很有用处的。比如首先推出的《隋唐五代卷》收入公元581年至960年间现存的136部、近亿字的重要文献,是研究隋唐五代政治、经济、文化、军事的必备电子资料。 近十年来,电子古籍出版物的研制工作可以说是突飞猛进,但是古典文献学学科内的专家学者对这一新的载体形式的文献的研究却滞后。它突出地表现为以下三方面的问题。 其一,古典文献学的专家学者参与电子古籍出版物研制工作的还不多,这主要是受到软件开发的专业知识和技能欠缺的限制。由于缺少专家学者的主动参与,使得某些电子文献的质量和功能还存在很多值得改善的地方,比如很多电子文献录入时在文字校勘上就存在很多问题。古籍电子出版物的成书一般包括以下程序:挑选书目→数据规划→人工录入或扫描转换→补字→打印校对→标引→软件设计→数据联调→软件测试→美术设计→包装。(●参看《专家传统学术与古籍电子化》一文中尹小林语,见《人民政协报》2004年5月17日《学术家园》版。)在这些程序中,至少在挑选书目、数据规划、打印校对这几个环节应该有专家学者的参与或把关。挑选书目涉及到目录学和版本学的专门知识,打印校对涉及到校勘学的知识,而数据规划更需要专家学者根据教学和研究的需要提出一些有针对性的要求。如果这些环节做得不好,就会大大影响电子文献的质量。古典文献学在学科发展中今后要注重培养既有文献学方面良好素养又懂计算机软件设计的复合型人才,可以适当从有志于古典文献学整理和研究的理工科专业毕业的大学生招收研究生(我本人就招了一个),同时在研究生的学位论文的写作上,应有这方面的选题。(●华中师范大学历史文献研究所刘韶军教授有一位硕士写了一篇题为《中国历史文献网络应用研究》的学位论文,我个人认为很有价值。) 其二,古典文献学的专家学者注意编写古籍电子文献目录书的工作非常欠缺。近十年来,电子古籍出版物可以说如雨后春笋一样层出不穷,但有关的版本著录、书目提要之类的书基本阙如。要做好这方面的工作需要一定的人力和物力的投入,笔者曾计划编写一部《古籍电子文献书目提要》,终因条件限制没有着手。从学科发展史的角度看,学术界缺少对古籍电子文献的目录学工作,会造成一些不可弥补的损失。有些古籍如《全唐诗》、《二十五史》、《论语》等世界各地研制过多种电子版。以《二十五史全文检索系统》为例,港台不算,大陆仅笔者所知在1999年前后就有湖南青苹果数据中心、陕西师大古籍所袁林、天津永川软件技术有限公司开发的三种比较好的电子版问世。有些古籍电子版的新版本出现后,老版很快就淘汰了,市面上也很难找到。就一般的使用者而言,当然是喜新厌旧,但从版本学的角度看,某些旧版本仍然有其版本或文献价值。 其三,汉语学术界缺乏对古籍电子文献的研制、开发和利用的统一与协调。我们在实际使用古籍电子文献过程中,迫切感受到,汉语学术界没有一些专业化的组织或机构来统一和协调古籍电子文献研制和开发中出现的问题。比如,汉语古典文献文本字符的编码存在通用性和兼容性较差的问题,台湾与大陆,简体与繁体都是五花八门的(大陆流行GB2312,港台流行Big5,还有GBK,国际标准Unicode等等),读者在具体使用或转换过程中非常不方便。另外,很多典籍都存在重复研制、重复开发的问题。比如《十三经》、《二十五史》、《全唐诗》、《四库全书》等典籍的电子版,有没有必要一而再、再而三的重复出版,其中全文检索功能大同小异。这样实际上很浪费人力物力,有时候还会出现令人不快的版权纠纷(如尹小林研制的《国学宝典》和袁林主持研制的《汉籍全文检索系统》之间的争议)。 为什么在一个最需要资源共享的领域里人们却缺乏资源共享的意识?因此,有的学者早就呼吁应该避免重复和浪费,提倡古籍数据库的标准化工作。如葛剑雄教授早在1998年就指出:“希望千万不要花大量人力物力去做表面热闹的‘大工程’,中国学术界需要的是一套完整的、代表当代学术成就的古籍,每种古籍应该选择最好的版本,包括经过整理校勘的、逐步形成一个标准的古籍数据库。”(●《何必将〈四库全书〉制成光盘》,载《中华读书报》1998年4月15日,第2版。)然而,开展古籍数据库的标准化、通用化的工作谈何容易! 最后,古典文献学要注重研究电子文献网络化、数字化发展的趋势。 古籍电子文献的发展从一开始就与国际互联网的发展联系在一起,形成网络数据库。读者可以通过国际互联网检索利用中国古籍的电子文献数据库。这类数据库,有“书目检索”、“全文检索”和“全文浏览”三种类型。书目检索数据库,可查询有关馆藏古籍的书名、作者、版本;全文检索数据库的功能与《四库全书》等光盘数据库的检索功能大致相同;全文浏览则是在网络中选择某书后,可阅览其全文,但没有检索功能。网络数据库通常要依托一个或几个网站。如中国国家图书馆公共检索服务系统中“联机公共目录馆藏查询”数据库,可查询该馆所藏古籍目录。既可从国家图书馆网站(http://www.nlc.gov.cn)主页的“数据库检索”进入,也可由http://fgopac.nlc.gov.cn直接进入。登陆北京大学中文系网站可查询《全唐诗》电子检索系统(htpp://Chinese.pku.edu.cn/tang/)和《全宋诗》检索系统(http://162.105.161.41/songpoem/cgi--bin/songlibrary.exe)。上国学网站(http://www.guoxue.com)也可查询《国学宝典》所收全部文献目录介绍和使用手册。 古籍电子文献网络化可以说是古典文献学学科建设的一个重要发展方向。高校中每一古典文献整理与研究的系所或机构,都应该建立自己的网站,网站收藏有丰富的古籍电子文献,它向所有的学生开放,学生可以自由地阅读、复制和下载。一方面可极大地弥补图书馆向学生提供某些纸质典籍文本的不足,同时也可节省图书馆或学生购书的费用。各高校的专家学者也可以随时将自己有关古典文献整理与研究的成果挂在网上,以供学术交流。如果全国高校古典文献整理与研究的系所或机构都有自己的网站,这些网站又进行友情链接,那么,在文献资源共享上就会进入一个全新的境界。我们高兴地看到,有些个人的古典文献方面的网站办得很有特色,如台湾学者陈郁夫教授1998年将单机版数据库改为网络版“故宫寒泉古典文献全文检索数据库”(其网页和系统存放在台湾故宫博物院的服务器上,故名“故宫寒泉”),除了《十三经》、《二十五史》等常用典籍外,还有《资治通鉴》、《续资治通鉴》等特色数据库供广大人文爱好者或学者阅读、使用。 古籍电子文献实际上是整个数字化技术发展的一个结果。数字化技术包括各种视听技术和多媒体技术。现在,数字化技术已经广泛运用于博物馆、图书馆等文化场所。比如故宫就已建成了数字化博物馆,观众可以在网上参观故宫,不必亲临现场。数字化图书馆将极大地改变传统图书馆的功用。有人指出,数字图书馆的最终目标是两个“五任何”,即: “任何人在任何地方任何时间使用任何数字化设备可以访问任何人类知识”、“任何地方任何时间产生的任何新知识可以通过任何数字化设备推送给任何需要的人”。(●见邓新民:《数字图书馆的三大定律》,载《光明日报》2004年8月4日C2版。) 如果这样的数字图书馆最终能够建立,那对于人们阅读、存储、复制和利用古典文献就达到了“随心所欲”的地步。 古典文献的数字化无疑是古典文献学学科建设的另一重要发展方向。 (责任编辑:admin) |