语言文学网-学术论文、书评、读后感、读书笔记、读书名言、读书文摘!

语文网-语言文学网-读书-中国古典文学、文学评论、书评、读后感、世界名著、读书笔记、名言、文摘-新都网

当前位置: 首页 > 学术理论 > 古籍整理 >

浅谈古书籍书目数据库的建设

http://www.newdu.com 2017-10-30 中国文学网 范月珍 参加讨论

    建立全国统一的古籍书目数据库,近年来已成为许多古籍专业及计算机专业人士所关注的一件事。1995年国家古籍整理规划小组便将此事提到议事日程上来,但中国统一的古籍书目数据库建设是一件大事,遇到的困难比较多。一是我国计算机和网络通讯技术与发达国家相比,还有很大差距,需要配套的各项条件一时还跟不上;二是所需经费比较庞大,一切相关工作一时恐怕难以进行;三是各馆目录标准化程度不一,积几十年的目录,在短时间内进行核查,工作量很大;四是尚没有制定出适合古籍图书的机读目录格式;五是没有规定出统一的古籍分类标准。
    这便是古籍书目数据建设工作停滞不前的主要原因,这些困难在一两年内恐怕是无法完全解决的,尤其是经费问题。但是,如果各馆利用现有设备和经验,对现有标准加以改造并严格执行,各自建库,在时机成熟的时候相互转换和交流信息数据应该说是不会有太大的障碍。正是基于这一考虑,山西省图书馆对馆藏的一万五千余种、二十余万册普通线装图书做了数据化处理,并成功地转化成书本式目录。由于这项工作我省走在全国同行前面,工作中遇到的问题是今后各馆将要遇到的,所以谈几点个人的认识,供同行参考。
    一、 古籍书目数据库建设的规范化
    规范是工作的准则和尺度。我们建库的目的不仅要供工作人员和读者的检索,最重要也是最终目的是要实现网络化,实现图书资源共享,最大限度的扩大读者面,不受时间、地域所限。而网络化要求数据库必须有统一的标准,为此,古籍书目数据库必须做到以下几个统一。
    1、严格执行标准的著录规则
    《古籍著录规则》GB3792·7-XXXX,是依据GB3792·1《文献著录总则》,参照《国际标准书目著录(古书)》[ISBD(A)]修订而成的。规定了古籍著录项目及排列顺序,著录用标识符号,著录用文字,著录信息源,专门的术语和特殊的著录方法。这一标准在1987年版的基础上修订,较之于1987年版,格式与国际标准更加接近,在项目选择和确立上更科学和合理。在版本项,将原来的递修本、套印本、增修本等统归于刻本之下,彻底改变了旧标准中不同版本区分的模糊、交叉现象;抄刻项下,强调各项之间文学的规范化,要求各著录项都要按照图书的客观情况加以说明,为读者提供准确的判断依据,编目者个人的认识或考证,必须加以[]来区别,并在附注项说明依据。这便杜绝了著录中的主观性错误,所以建库必须遵循这一标准。
    2、机读目录格式的规范化
    《中国机读目录格式》(CNMARC格式)是我国文化行业的唯一机读目录标准格式。它适用于中国国家书目机构同其它国家书目机构之间及中国国内图书情报部门之间以标准的计算机可读形式进行信息交换,在数据规范方面为书目数据库的建立和书目数据处理提供参照或依据。深圳图书馆等单位研制的ILAS、文津、息洋等软件,就是在这一格式的基础上取得的成果。我馆及省内各级图书馆便采用的是ILAS系统。
    但是,CNMARC格式的字段是以中文普通书刊及音像制品为主要对象而设置,没有考虑到古籍图书的复杂性和特殊性,尤其是在出版发行项上,所以用来套录古籍书目非常勉强。但是,在没有制定出统一的古籍机读目录格式的情况下,它是唯一的具有普遍意义的机读目录标准格式。而且,无论将来的古籍机读目录格式如何制定,格式及字段的选择和确立上,必须依据CNMARC格式。由于这一基本原则不会改变,我们在建库中,要求字段格式适应CNMARC格式,字段内容必须符合古籍著录规则。
    3、使用统一的中国古籍分类法
    我国传统的图书分类一般采用经、史、子、集四部分类法。解放后各图书系统所采用的分类法五花八门,各不相同。一般有科图法、人大法和中图法。这几种分类法大都适合普通图书及刊物并得到很好的应用。而古籍与普通图书的差异性较大,用一种标准来类分二者,势必造成类表在款目设置及对应性方面不能尽善。此外,还有一些馆包括北京图书馆及我馆,采用的是刘国钧先生的十五大类分类表。这是在旧的四部分类表的基上改造而成的,此表虽然在增加新内容、新学科方面做了大胆的尝试,但是弊端较多,如大类设立不合理,地志门、艺术门、古器物门、社科门等存在着类目交叉,概念含糊不清,详简级次不切实际等问题,所以也没能推广开来。而近年来,希望将四部分类法做为统一的古籍分类体系的呼声甚高。早在50年代末,《中国丛书综录》便成功地改造应用了四部分类法,成为书目典范。这是因为四部分类法虽然有缺陷和不足,但是,它被应用了一千三百多年,历史上的官私目录都采用它做为分类体系,原因是它本身基本反映了中国学术发展和目录学思想体系,其分类是就书的内容、学术发展和目录学体系而设立,非常容易类分中国古籍。所以建立统一的古籍书目数据库,应当以改造的四部法,做为统一的分类体系。
    4、使用规范的繁体汉字
    由于古籍本身使用的是繁体汉字。所以,从客观著录的角度来说,必须使用繁体汉字,其次,从文学发展的角度看,中国汉字源远流长,几千年来,文字意义变迁很大,很多字由于原有语境的消失,字义发生了变化,甚至已不再被人们应用,产生了通假、异体、古今、繁简等一些复杂关系。虽然简化字科学易用,但它与繁体字不能做到字义上的一一对应,所以使用起来会有许多不妥之处。此外,在某些领域应用繁体文字与简化字的推广毫不相干。古籍无论有多浩瀚,它与今天及未来的图书出版发行量相比,都是极为有限的,不会妨碍简化汉字的传播与应用。所以,为了客观、准确地表现古籍图书情况,必须使用繁体汉字。
    以上便是我们建库的标准,有了统一标准数据库建设方有据可循、有章可依,也才能具备建立大型中国古籍书目数据库的条件。但是,由于目前尚没有统一的古籍机读目录格式,所以我们在CNMARC格式、古籍著录标准及书本式目录(因为本书目要转换成书本式目录)的相互兼容方面遇到很多困难,做了一些尝试性工作,以下单就建库中CNMARC格式与古籍著录标准之间的问题做一简述。
    二、工作中的问题及解决方法
    1、责任者项。古籍标准著录要求以正文卷首卷端所题著录,而CNMRC格式要求著录责任者的姓名、朝代(国别)、修饰词、著作方式。二者在文字表述上是不同的。如《石镜山房增订周易说统》一书卷端题为:仁和后学张振渊彦陵父辑 男懋忠增订。这种著录能够客观、完整、准确地反映原书,但却不符合CNMARC格式的要求,按照CNMARC格式,该书的责任者应当著录为:(清)张振渊辑;(清)张懋忠增补。为了解决这一矛盾,我们利用ILAS系统的特点,在200字段的责任者项下,依古籍著录规则录入,而在具有检索意义的7字段,则依据CNMARC格式的要求录入,补充说明纳入附注项下。这样既不影响人机检索,又能在转化成的卡片式目录中遵循古籍著录规则。
    2、版本项。依照CNMARC格式,版本项下的@b是除铅印外的其它版本形式。而古籍的版本要复杂的多,所以,我们赋予@b的内涵为可容纳一切版本形式,有助于版本识别的说明文字紧跟其后,并加括号区分。如@b刻本(郭象升题跋)。
    3、出版发行项。CNMARC格式在出版项下,设置的项目及字段符号为:@a出版地、@c出版者、@d出版年;@e印刷地、@g印刷者、@h印刷年。我们将此项改为抄刻项,它所包括的项目及字段符号为:抄刻项(@a抄刻地、@c抄刻者、@d抄刻年)、修版项(@a修版地、@c修版者及方式、@d修版年)、印刷项(@e印刷地、@g印刷者、@h印刷年及方式)。这样便出现了抄刻项与修版项使用了相同符号的问题,所以必须改动系统命令,使二者可以并存,但是,修版项必须在抄刻项之后著录。这样,自动生成的卡片式目录便是,在有修版项时为:抄刻地:抄刻者,抄刻年;修版地:修版者及方式,修版年;在有后印及递修时为:抄刻地:抄刻者,抄刻年(印刷地:印刷者,印刷年及方式)。这一格式完全符合古籍著录标准。但是本应在抄刻项著录的藏版项,由于作为ILAS系统应用者没有更多的权限更改程序,只能将其纳入附注项下说明,这是我们唯一没能解决的问题。
    通过改造ILAS系统的字段定义来制定古籍机读目录格式的方式是正确的。但是,如何使这一格式更标准、更严谨、更科学,具有更广泛的可检性,必须要求古籍工作者与计算机工作者携手来做,很好地完成这项工作。
    原载:《山西科技》1999年第3期 (责任编辑:admin)
织梦二维码生成器
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
评论
批评
访谈
名家与书
读书指南
文艺
文坛轶事
文化万象
学术理论