全文型文献数据库是当前图书馆和情报所对外提供文献服务的重要文献资源,具有集成度高、信息量大而全、可获得性强等特点。在国内,万方、维普、清华同方、书生和超星等机构都有自己成熟的全文型文献数据库产品;在国外,Elisever、EBSCO、Blackwell等公司也有各自的全文型文献数据库对外提供服务。本文拟在阐述当前全文文献数据库新的特点的基础上,对全文型文献数据库的评价标准进行讨论和分析。 1 全文型文献数据库的新特点 全文型文献数据库经过多年的发展和完善,在现阶段呈现了以下新特点: (1)强大的检索性能,检索结果处理多样化 全文型文献数据库已不是简单意义上提供关键词检索和外部特征字段检索并提供全文即完成任务的传统数据库。事实上,随着其检索入口和手段的不断丰富,各类索引技术(包括基于形态的字索引技术、基于语义的词索引技术、基于内容的主题索引技术完全匹配的高效串索引技术以及字词混合索引技术)的开发,全面提高了全文型文献数据库的检索速度、查准率和查全率,检索功能不断加强。如EBSCO的图片检索、索引词检索和引文检索,清华同方期刊全文数据库的引文检索,维普全文数据库的同义词词典等,均大大加强了全文型文献数据库的检索功能。同时,许多数据库在检索结果的显示方式上灵活多样,更加人性化,主要表现为:显示记录数的限定;排序方式的多样化,可按相关度、出版时间、文献标题、著者、来源、语言、出版国等多种方式升序或降序排列:显示格式的多样化,可提供题录、题录+文摘、全记录或选择字段等多种格式显示。 (2)类型多,收录文献全,数据库质量高 如Elsevier收录的270种医学类期刊中,有171种被SCI收录,20种被SSCI收录;部分期刊从创始年开始收录,回溯检索与印刷型期刊同步发行与更新;数据标准、规范、多元,都支持IE、Netseape等通用浏览器,且支持功能强,数据更新及时,大多为日更新:网络型期刊通常使用PDF格式文档的标准阅读器Acrobat Reader等。许多全文型数据库提供了多种形式的链接,用户通过检索不但能看到全文,也为读者提供了其他服务线索。 (3)用户界面友好方便,易于理解,便于使用 数据库的用户界面设计通常直观清晰、图文并茂,如不同的文献类型用不同的图形符号表示。数据库往往设有专门的功能帮助键,帮助信息详略适当、清晰,便于查阅。 (4)增加了个性化服务内容 任何文献用户都有其特殊的文献需求,越来越多的全文型文献数据库开始为用户提供强大的个性化服务内容。例如,EBSCO的host文件夹就是一个强大的个性化服务工具,其功能包括保存结果列表(Resuh List Items)、网络链接保存(Persistent Links to Searches)、检索历史保存与定制提醒(savedSearches/Search Alerts)、期刊提醒(Journal Alerts)、资料整理网页(Web Pages)等。 2 全文型文献数据库的评价原则 对于用户和图书情报机构来说,如何选择全文型文献数据库,对于相同类型的全文型文献数据库如何进行评价和选择,是一个很重要也很现实的问题。一般来说需遵循以下原则: (1)科学性原则 全文型文献数据库既是网络资源,也是科技文献的一种。要求指标的定义、计算方法等应符合网络资源评价分析和一般文献评价的基本理论,在考虑应用的同时需要与此相互协调。 (2)整体性原则 建立数据库评价指标体系是一项系统性的工作,应该使评价指标全面反映评价对象多方面的主要特性。因此,评价指标体系应体现主客观相结合、定性与定量相结合的特点。整体性原则还要求各指标间相互独立,指标间的相关性,不仅增加了评价工作量,而且直接影响评价的有效性和可靠性,使评价结果出现偏向性。因此,在建立指标体系时要考虑各指标反映的信息是否与其他指标存在重叠,并尽量减少这种相关性。 (3)可行性原则 评价指标应力求简便、实用、指标涵义明确,数据便于获取。同时,数据在时间和空间上要具有可比性。 (4)动态性原则 指标应能够反映系统动态变化的特点,即反映全文型文献数据库内容变更、软件升级、软件服务变化等动态特性。 (5)针对性原则 指标体系应该符合读者使用需求的特点。表征全文型文献数据库的指标很多,如果选取的指标太多,一方面难以突出影响数据库品质的主要因素,另一方面太多的指标也增加了指标间相关的可能性。同时,评价体系以满足文献用户的一段时间的特定需求为目的,没有必要采用太多的指标。 3 全文型文献数据库的评价要素 根据以上评价标准设定的原则,综合分析国内外诸多全文型文献数据库,我们认为,可由内容、界面设计、检索功能和可获得性4个要素作为全文型文献数据库的评价标准。 3.1 内容(Content) 内容代表了一个数据库的真正价值,内容的质量又可由权威性、覆盖面和收录时间3个方面来体现。 (1)权威性(Authority) 全文型文献数据库的权威性体现在出版者、审查制度和收录文献3个方面。例如,ScienceDirect是Elisever公司出版的全文型文献数据库,该公司是国际知名的科学和工程技术文献提供商,历史悠久,并且在业内享有很高的声誉和口碑,用户普遍有认同感,该数据库收录的文献都是特定专业领域的高质量论文,有非常严格的审查制度,保障了数据库的权威性。 (2)覆盖范围(Coverage) 覆盖范围包含覆盖内容和覆盖时间两个方面的含义。全文型文献数据库根据覆盖内容和领域分为综合性和专业性两类全文型文献数据库,如ScienceDirect是世界上最大的科学、技术和医学文献数据库,而Emerald则是管理学和图书馆学情报学专业类数据库,其建设目标都是给文献用户一个彻底的全文解决方案,因此数据库覆盖本文原文的广度、提供内容的多少等是至关重要的:对于时间上的覆盖范围来说,文献数字化的浪潮出现在上世纪90年代末和本世纪初,文献全文数字化程度与其加工能力有很大提高,因此全文型文献数据库收录文章一般都是从上世纪90年代开始的,这也是我们判断全文型文献数据库好坏的重要依据。 (3)时间性(Timeline) 全文型文献数据库与纸质型文献相比在出版上要滞后一个时间差,这个时间差如果过长,读者就会转而去查阅纸质型文献或者其他数据库产品。随着读者需求的进一步提高,许多数据库生产商正在努力减少甚至消除这种时间差,有的数据库产品与纸质型文献做到了零时差,有的数据库生产商能够提供预印本期刊全文,有效地消除了时间差。 3.2 界面设计(Interface De-sign) 因为读者对数据的浏览和检索都要通过人机界面来实现,优秀的人机界面会对用户起到良好的引导作用,而不好的人机界面常常会有误导、出错等情况产生,因此界面的设计也是评价数据库系统的重要指标。有的数据库系统界面除了有很多类信息外,还提供了很多使用工具和选择项,但同时也产生了负面影响,就是界面过于纷乱复杂;而有些数据库界面就比较简洁直观,读者也比较容易上手,类似于搜索引擎的Google和Baidu。因此,特定需求下的一些功能和界面的设计是非常有用的,比如清华同方的“知网节”为读者提供了单篇文章的关联线索,包含了单篇文献的题录摘要以及该文献各种扩展信息的入口汇集点,这些扩展信息通过概念相关、事实相关等方法揭示知识间的关联,达到知识扩展的目的,帮助实现知识获取和知识发现,也为读者二次检索提供了方便;SeienceDirect有一个“主题页面”的界面(subjeet Homepage),对用户使用数据库提供了记忆功能,可以记忆用户使用系统的路径,避免了老用户对使用路径的多次反复操作,而且作为国际文献提供商,还提供了多种非英语语言的支持。 3.3 检索功能(Search Func—tionality) 首先,优秀的全文型文献数据库可以提供读者适用的检索工具,包括检索语句、下拉菜单等,检索功能的优劣要靠系统响应速度、使用灵活性以及读者对人机交互能力的控制上来判断。同时,强大的浏览功能也是必不可少的,因为许多读者的需求要用检索和浏览交替进行来实现。 其次,系统提供的下载速度和功能也很重要,下载速度过慢会导致读者心理焦虑和信心丧失,对数据库评价降低。HTML文本格式下载速度较快,消耗系统资源也较少;相反,PDF格式的文本需要更多的下载时间,但是它更能完整地反映文本的原貌,所以系统使用何种文本格式对系统的检索功能构成影响。 3.4 可获得性(Accessiblity) 数据库产品目前有单机版和网络版之分,网络版的数据库可通过局域网进行共享,产品可获得性较好;单机版数据库只能在一台计算机上使用,共享性差。除此之外,数据库还应配有FAQ和HELP等性质的文档供用户学习借鉴,用户可以方便地进入和使用数据库,有的数据库系统还专门为图书馆员配备了专门HELP系统,可以帮助他们更好地开展参考服务。 综上所述,在全文型文献数据库不断发展和完善的今天,用户对全文型文献数据库提出了更新的要求,如何选择高质量又符合用户需求的文献数据库产品,对于文献用户特别是图书情报机构愈发显得重要,我们希望本文的论述能对他们的工作和实践产生一定的帮助。同时要指出的是,很少有全文型文献数据库产品都做得近乎完美无缺的,最重要的是它们在满足用户需求方面做得如何。 原载:《中国信息导报》 2007年第1期 (责任编辑:admin) |