语言文学网-学术论文、书评、读后感、读书笔记、读书名言、读书文摘!

语文网-语言文学网-读书-中国古典文学、文学评论、书评、读后感、世界名著、读书笔记、名言、文摘-新都网

当前位置: 首页 > 学术理论 > 古籍整理 >

网络古籍全文检索系统简介

http://www.newdu.com 2017-10-30 中国文学网 陈爽 参加讨论

     古籍的全文检索是网络文史应用最为直接和最为有效的手段。就目前状况而言,网络文史资源分布极不均衡,最主要的古籍全文检索系统几乎全部集中在台湾。由于近几十年大陆古籍整理成绩斐然,台湾网站的数据库底本大部分采用了近年来大陆出版的标点和校刊成果,从这个意义上讲,这些检索系统也是两岸学者共同的心血结晶。
    中央研究院汉籍电子文献
    中央研究院汉籍电子文献(旧称瀚典全文檢索系統)是迄今最具规模的中文古籍数据库,也目前网络中资料整理最为严谨的中文全文数据库。它包含整部二十五史、整部阮刻十三经、超过2000万字的台湾史料、1000万字的大正藏以及其它典籍,合计字数13400万字,并以每年至少1000万字的速率增长,蔚为壮观。
    汉籍电子文献所有资料包括二十五史、诸子、古籍十八种、古籍三十四种、大正新修大藏经、上古汉语语料库—摘要(《论语》、《孟子》、《墨子》、《庄子》、《荀子》、《韩非子》、《吕氏春秋》、《老子》、《商君书》、《管子》、《晏子春秋》、《孙子》)、台湾方志(通志、府志、县志、厅志、采访录、一般志书与舆图、补阙)、台湾档案、台湾文献、文心雕龙(《文心雕龙义证》、《文心雕龙考异》、《文心雕龙注》)、佛经三论(《中论》、《十二门论》、《百论》)、清代经世文编(贺长龄《清代经世文编》、葛士浚《清代经世文续编》、《盛康清代经世文续编》)、新民说、中华民国史事日志、姚际恒著作集、词话集成(《时贤本事曲子集》、《复雅歌词》、《拙轩词话》、《浩然斋词话》、《乐府指迷》、《吴礼部词话》、《艺苑卮言》、《爰园词话》、《七颂堂词绎》、《填词杂说》、《金粟词话》、《铜鼓书堂词话》、《雕菰楼词话》、《介存斋论词杂着》、《乐府余论》、《双砚斋词话》、《问花楼词话》、《词径》、《雨华盦词话》、《词论》、《近词丛话》、《饮冰室评词》、《近代词人逸事》、《彊村老人评词》、《窥词管见》、《词概》、《珠花簃词话》)、新清史·本纪、乐府诗集、闽南语俗曲唱本《歌仔册》、人文资料库师生版等内容。以上部分资料的查询属于有偿服务(需付费取得密码方能检索),部分资料属有条件开放(能够检索古籍,但不能全文浏览,检索结果只能显示少量段落),大部分资料则免费开放,不仅提供查询,还可全文浏览古籍。
    在汉籍资料库的一级栏目的最后,有一个不太引人注目的人文资料库师生版,是为普及文史教育而向台湾大中小学师生免费开放的,其中包括了许多文史研究的重要典籍,总量约7000千万字,占整个汉籍资料库文献的一半。除二十五史和十三经的部分内容外,还包括中诸子中选出的《抱朴子内篇校释》、《庄子集释》、《东观汉记校注》、《国语》、《古本竹书纪年辑证》、《墨子闲诂》、《列子集释》、《晏子春秋集释》、《四书章句集注》、《战国策》、《老子校释》;从古籍十八种中选出的《新校搜神记》、《齐民要术校释》、《洛阳伽蓝记校注》、《颜氏家训集解》、《山海经校注》、《通典》;从古籍三十四种中选出的《太平经合校》、《鬼谷子》、《孔子家语》、《艺文类聚》、《论衡校释》、《九章算经点校》、《周髀算经》、《吴越春秋》、《朱子语类》、《楚辞补注》、《文选》、《古小说钩沉》、《世说新语》;从大正藏中《百喻经》、《法句经》、《佛说父母恩难报经》、《高僧传》、《续高僧传》等。
    资料库包含层级式目录,可经由目录、页码调阅正文或逐段、逐页浏览正文或藉目录限定检索范围以任意字词、字符串进行快速检索取得完整的检索结果。浏览者可选择某一部古籍单独查询,也可选择多部古籍综合查询。查询结果以段落显示(显示检索语词所在的段落正文,并将所检索的语词用红线标出)、列表显示(显示检索语词出现的次数以及每一条所在的卷数和页码)。检索结果包括“检索条列”、“检索报表”、“部分/全段显示”几种选择,如选择全部二十五史,输入散骑常侍,短短一两秒内,便能找到3743条符合条件的相关资料,通过其中“检索报表”则可以将这三千多条资料在一个网页内全部列出。
    汉籍资料库的最突出特点是内容全面,版本精赅。如二十五史所选用的录入底本,是台湾鼎文公司翻印的大陆中华书局点校本(台湾称为“新校本”),多名台湾学者参与了校订工作,每部史籍都经过至少4次校阅。对于校阅中所发现有疑误的文字,经查对该书三种以上之主要版本(如百衲本、武英殿本、汲古阁本等),并参照中华书局校本,确定系点校本排印时未校出的错字,或所据以排版的刻本误字时,始加以更动。而资料库的所收录的先秦诸子,底本也多选用了大陆中华书局近年整理出版的“新编诸子集成”本,部分古籍还收录了多种的整理版本,如《文心雕龙》就有三种版本之多。
    遗憾的是,汉籍资料库的程序内核开发较早,不支持复合检索(布尔检索)。此外,由于资料库完成时间先后不同,在目录结构上缺乏有效的整合,网页导航支蔓众多,缺乏完整的内容介绍,许多不熟悉的浏览者很难摸到门径,许多重要的资料库被隐没在层层页面之下。
    故宫寒泉检索系统
    
这一检索系统是由台湾陈郁夫先生主持开发,因网页和系统资料存放在台湾故宫博物院的服务器内,故而称为“故宫寒泉”。
    寒泉的全部资料包括十三经、二十五史、先秦诸子、全唐诗、宋元学案、明儒学案、白沙全集、四库总目、朱子语类、红楼梦、资治通鉴、续通鉴等。就规模而言,尚无法与汉籍资料库相比,且不能浏览原文、但有通鉴、续通鉴这样的“特色收藏”,更难能可贵的是,系统支持复合查询,对文史研究尤为实用有效。
    台大中华电子佛典线上藏经阁大正藏全文检索
    
这个系统是台大佛学资料库的一部分,台大佛学研究中心的研究主题包括佛教哲学、历史、文学、艺术,文献资料横跨中西,在目前网络佛教资料库中最为完备,可做佛学书目、期刊原文检索,并有多种语文佛典原文,汉文部份可做检索。
    中华电子佛典线上藏经阁大正藏CBETA 电子数据库是以日本大藏出版株式会社《大正新修大藏经》第1卷至第85卷为录入底本。系统支持复合检索,以大正藏各分册为单位分别查询,不能一次检索全部分册。
    汉籍资料库的大正藏检索系收费服务,而台大的大正藏检索则是免费服务。此外,系统还提供多种格式的大藏经文档下载。但目前整个系统还处于测试阶段,文字校刊、检索功能都不够理想。
    简帛金石资料库
    简牍帛书是本世纪重大学术发现之一,简帛资料信息量大、研究成果分布零散,即使是专业研究人员,也很难在短时期内将难将大量文献资料收集齐备。与简帛资料的整理考释工作相比,检索编制工作相对滞后,海内外尚未出版一部权威性的简帛资料索引。由台湾中央研究院历史语言研究所文物图像资料室开发的简帛金石资料库,收集了大陆、台湾和日本的40余种资料,包括了已经整理出版的先秦至魏晋的简牍、帛书、碑刻、官印、镜铭等,还收录了相关的书目、索引等,总字数达3,401,684字,内容极为丰富,既包括《睡虎地秦墓竹简》、《居延汉简甲乙编》、《居延新简》、《敦煌汉简》等大型报告,也包括了近年来散见于各种文物考古刊物中有关新出土的张家山汉简、尹湾汉简的部分释文,还有大陆学者难得一见的《两汉镜铭集录》等内容。大部分资料的底本,选择了大陆学者的研究成果。分全文和书目两部分,可进行复合检索,输出方式包括释文、编号、所在图书页码等。
    中研院历史语言研究所古籍数据库
    
这个系统开发较早,近年内容没有太多更新,内容包括历代名臣奏议、红楼梦、中国诗词(古诗十九首、汉乐府等)、唐诗三百首四个数据库。内容不多,但非常实用。
    台湾元智大学“网络展书读”中华典籍网络资料中心
    
这一资料库由罗凤珠先生主持开发,以中国古典文学资料为主要特色。包括诗经、全唐诗、唐宋词、宋诗、台湾古典汉诗、红楼梦、三国演义、水浒传等多个各自独立的全文检索系统。其中唐宋词全文数据库收录唐五代词二千五百余首,全宋词近二万首;宋诗包括资料内容包含苏轼、晁补之、陆游、范成大、杨万里、王禹偁、范仲淹、晏殊、梅尧臣、欧阳修、苏舜钦、苏洵、王安石、苏辙、邓忠臣、秦观、黄庭坚、贺铸、陈师道、张耒、李廌、晁说之、王令等宋代名家诗全文。检索系统大多支持复合检索,并根据不同的文学体裁的特点,在检索选项上加以变通,使查询更为便利。如唐宋词检索,可依作者、词牌、词序、词题、词文、词文等进行检索,其中作者可用作者本名、字、别号等检索,检索结果可列出该作者生平资料、作品目录及浏览全词;词文可使用关键词和模糊句检索。宋诗检索提供了作者、诗题、诗句、综合检索等几个栏目。例如要查苏轼的诗作中有关茶的诗句,先到宋诗的查询页,若用诗句检索,将会得到所有宋诗人的相关诗句,但若用综合检索──作者栏输入“苏轼”、诗句栏输入“茶”,就可找全苏轼所有品茗说茶的诗五十首;在诗题项目上点一下,就可看到某首诗的全文,十分便捷。
     以上介绍的几个网络古籍全文检索均属台湾网站。除了内码显示和繁体输入等问题,大陆学者使用这些数据库还存在某些障碍:古籍中的缺字要通过浏览者安装系统提供的造字档案来补足,因编码区位不同,大五码造字档案与大陆的简体中文造作系统不能兼容,加上大陆与台湾网路连接不够稳定和通畅,大陆的教育网无法直接访问台湾网站,大陆学者使用台湾有偿资料库尚没有确定的中介机构,从而造成了一定程度的资源浪费。
     相对而言,台湾研究机构在古籍数字化方面起步较早,在资金投入、软件开发等方面积累了丰富经验,而大陆学者和学术机构在版本占有、校勘整理等方面也有着得天独厚的优势。由两岸学者共同合作,开发多内码、跨平台的网络古籍检索系统,应成为大势所趋.
    【网络古籍全文检索系统网址】
    台湾中研院汉籍电子文献 http://www.sinica.edu.tw/ftms-bin/ftmsw3
    史语所中文资料库 http://www.ihp.sinica.edu.tw/database/index.htm
    史语所简帛金石资料库 http://saturn.ihp.sinica.edu.tw/~wenwu/search.htm
    中华电子佛典线上藏经阁大正藏全文检索 http://ccbs.ntu.edu.tw/cbeta/result/search.htm
    故宫寒泉资料库 http://libnt.npm.gov.tw/s25/index.htm
    诗经全文检索 http://cls.admin.yzu.edu.tw/NPB/home.htm
    全唐诗全文检索 http://cls.admin.yzu.edu.tw/QTS/HOME.HTM
    宋诗全文检索 http://cls.admin.yzu.edu.tw/QSS/HOME.HTM
    唐宋词全文检索 http://cls.admin.yzu.edu.tw/TST/HOME.HTM
    台湾古典汉诗全文检索 http://cls.admin.yzu.edu.tw/cp
    红楼梦全文检索 http://cls.admin.yzu.edu.tw/HLM/retrieval/database/database.htm
    三国演义全文检索 http://cls.admin.yzu.edu.tw/san/bin/s_full.HTM
    水浒传全文检索 http://cls.admin.yzu.edu.tw/shz/bin/s_full.HTM
    原载:《文史知识》2002年第4期 (责任编辑:admin)
织梦二维码生成器
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
评论
批评
访谈
名家与书
读书指南
文艺
文坛轶事
文化万象
学术理论