语言文学网-学术论文、书评、读后感、读书笔记、读书名言、读书文摘!

语文网-语言文学网-读书-中国古典文学、文学评论、书评、读后感、世界名著、读书笔记、名言、文摘-新都网

中文网络信息保存体系探讨

http://www.newdu.com 2017-10-29 中国文学网 钟常青/杨道玲 参加讨论

    1 引言
    随着计算机和通信技术的飞速发展,网络已成为我们这个世界重要信息源之一和主要的信息传播媒介。作为全球最大的信息资源库,网络信息资源日益成为我们文化遗产的重要组成部分。
    随着我国互联网基础建设投入加强,网络需求亦步入成熟期,近年来中文网络信息资源增长速度惊人。统计表明[1],截至2005年12月31日:我国网上资源增长更加迅速,网页总数约为24.0亿个,同期相比增幅为269%。网页字节总数约为67,300GB,一年内增长46,763GB,同期相比增长率达到227.7%。这些数据充分表明,我国网络信息资源的发展势头十分强劲,在数量、质量和服务方面都取得了新的进展。而且网页更新频率相当高,一周以内更新的占10.36%,一至三个月内更新的占56.72%。但同时,这些中文网络信息资源又存在以下问题:(1)资源良莠不齐,影响利用;(2)重复率高,造成网络负担;(3)杂乱无章,查找困难;(4)保存不力,重要资源流失。
    目前,我国已经启动几个保存网络信息资源的项目[2],但都还处于初步探索阶段。它们大多从技术的角度考虑如何采集与保存网络信息资源,但很少从宏观战略的角度来考虑中文网络信息资源的保存体系问题。有鉴于此,结合中国电子政务及中文网络发展的实际,我们认为:目前最迫切的任务是从宏观角度较为系统的探讨中文网络信息资源保存体系,以便有组织有计划地构建一个国家中文网络信息资源长期保存的协作网,对中文网络信息的创建、流通、维护与存档进行严格的监管。
    2 中文网络信息保存体系构成分析
    网络信息保存体系是一种解决与网络信息资源保存相关的一系列问题的整体方案。我们构建中文网络信息保存体系的目的是建立一套网络信息保存的宏观框架,将与网络信息保存的各方面的问题都纳入这个框架体系之中,并最终以指导原则或方案的形式指导保存实践,以便最全面、最经济、最合法、最有效地实施对网络信息资源的长期保存。所以,笔者认为,在构建中文网络信息保存体系时应该遵循宏观性、通用性和实用性的原则。
    通过对国内外相关实践的研究[3],结合中文网络的实际情况,我们认为:在建立中文网络信息资源保存战略体系时,应该从宏观上研究如下4个纬度的问题(即“4W”):为谁保存(Whom)、谁来保存(Who)、保存什么(What)、如何保存(How),分别对应保存中的4个基本模块:保存目的、保存主体、保存对象、保存方法。如下图所示:
    2.1 为谁保存(Whom):保存目的
    在进行网络信息保存活动之前,需要明确保存目的。保存目的的确定需要分三个步骤:
    (1)用户需求分析。确定保存网络信息是满足哪些用户群体的需要,满足哪些方面的需要;并且在进行需求分析时不能仅仅局限于目前的需求,还要考虑到未来研究我们今天的历史时的需求。只有确定了当代和未来对保存网络信息的需求,才能更准确地设定我们的保存目标。
    (2)确定总体目标。根据需求分析来确定保存活动的总体目标。笔者认为对于中文网络信息资源保存来说,我们的总体目标应该是:尽可能地保存已有的中文网络文化遗产,为当代和后代服务。
    (3)阶段性任务。要实现总体目标,我们还必须设定每个阶段的具体目标或任务。当前我们进行中文网络信息保存的任务是:研究中文网络信息的特点,充分吸收和借鉴国内外的研究与实践成果,探索适合我国国情的保存策略与方法,并制定中文网络信息保存工程的规划与规章,以确保这项事业的长期顺利进行。
    2.2 谁来保存(Who):保存主体
    目前,缺乏专门的机构对整个中文网络信息保存负责,也没有统一的政府级别的组织来制定采集标准或网络保存策略。因此,各自为政的现象极为普遍,许多文化收藏机构都在积极探索网络信息保存问题,包括档案馆、艺术馆、国家图书馆、博物馆等等,甚至是网站所有者本身。这就形成了一种相对分散的保存局面,各个保存行动的采集策略和采集内容都有很大的差别,如果没有一个统一的组织来引导其合作,势必造成两种后果,一是大量的重复采集,造成人力、财力的浪费;二是会有许多中文网络信息因相互推诿责任而得不到及时采集,造成重要文化遗产的流失。
    到底由谁来负责中文网络信息资源的长期保存?是由信息的产生者还是出版者,或是传统的文献保存机构如图书馆、档案馆,抑或是他们合作来实施保存职责?如何确定保存主体,划定各方的保存责任并确保其贯彻实施,是制定保存战略必须紧迫解决的问题。
    因此,对于本模块,需要重点解决三个问题:
    (1)确立中文网络信息保存的组织模式与领导机制。目前,国际上网络信息保存的组织模式主要有集中式和分散式两种。如英国艺术与人文科学数据服务部就是采取集中式保存策略,而澳大利亚、美国的很多保存项目都是采取分散模式。国际图书馆与信息资源委员会(CLIR)认为“分散式保存模式已经不适合于数字时代的保存,而应该采取集中式的大规模的保存方式”[4]。而CPA与RLG在1996年发表的联合报告认为:“目前可行的办法是建立一个分散的、而不是集中的保存框架”[5]。笔者认为,到底采取哪种模式,应结合网络信息的分布特点以及保存机构合作模式来确定。
    关于保存活动的领导者问题,联合国教科文组织在2003年颁布的《数字遗产保存宪章》中指出:尽管数字保存必须在合作的基础上进行,但必须有相应的机构来承担领导职责[6]。国内有学者指出:“既然国家图书馆拥有法定权利去获得和保存该国出版的文化财产,并且大多数国家图书馆目前也在进行获取数字出版物的实践,因此国家图书馆,以及其他主要图书馆和机构,应该在网络信息资源的长期保存中起领导作用。”[7]
    (2)建立网络信息保存的责任体系,划定各方的保存职责。2002年6月,国际图联(IFLA)与国际出版协会(IPA)联合发表了一个声明[8],声明指出:“出版机构承诺短期保存他们出版的数字形式的出版物,而图书馆则应通过与出版机构协商,承担起长期保存这类出版物的责任”;“各国的国家图书馆是获取和保存各国这类形式出版物的最佳场所,实际上许多国家图书馆也正在从事这项工作,国家图书馆与其他一些主要图书馆和图书馆组织应该担负起长期保存数字信息的主要责任”;“出版机构和图书馆工作小组将进一步开展有关数字信息保存方面相关的技术、经济和政策问题方面的合作,其中包括在合适的条件下成立与其他相关组织协同工作的统一机构。”该声明的发布,对我们划分保存责任具有极大的借鉴意义。
    (3)探讨可行的合作模式。这里的合作不仅是技术、保存内容方面的合作,还包括不同体制、系统以及地域之间的配合与协调,因此必须从深层次理解合作精神。
    一是积极参与国际合作,包括制定统一的标准、参加有关国际会议,或者直接参与国际Web保存项目。通过合作,可以充分吸收和借鉴国外的优秀经验、管理模式以及先进技术。
    二是国家文献保存机构之间的通力合作。如图书馆、档案馆、博物馆等,是我国主要的文献收藏机构,相互之间可以也应该进行协调,技术上合作攻关、资源保存上合理分工、资金上实现最佳分配,这样不仅可以节省人力、物力,避免重复建设,而且也有利于保存体系的完整与优化。
    三是保存机构应与网络信息出版者、IT界、法律部门等保持密切联系与合作,建立多学科、多行业合作的平台。共同探讨与保存网络信息相关的管理问题、法律问题与技术问题,以便达成共识和建立协调合作的平台;同时也要借助各方面的专业技能来解决不断涌现的新问题。
    2.3 保存什么(What):保存对象
    保存对象的选择在整个保存体系中至关重要。所谓“选择”,就是及时挑选网络上值得保存的信息资源,并通过各种方法进行收集与归档,以备当代和后代人利用。网络信息选择是整个网络信息保存工作的首要环节,“选择原则”决定了网络信息的最终命运:留存或者遗弃。与传统资源的选择工作相比,网络信息选择涉及的问题更为复杂,难度更大。因而,制定合理的网络信息选择策略对人类记忆的留存与防止智力资产的流失是极为关键的,目前世界各国都在为此积极探索。
    保存对象的选择,说到底需要解决三个根本性问题:
    (1)确定保存范围。包括确定采集级别、归档网络空间划定以及制定内容选择原则等问题。具体来说,首先确定采集级别,采集级别一般分为档案级、服务级与链接级。保存目的不同,采集级别也会不同,那么采集的策略与要求也会变化;然后划定归档网络空间,即划定哪些网站应属于采集范围;由于网络信息的庞杂性,具体到每个网站内部,需要制定网站内容的选择原则,明确到底哪些资源值得保存,哪些不需要保存。
    (2)选择采集方式。保存对象的选择与采集方式极为相关,使用不同的采集方式,结果采集的内容也会不同。纵观各国的网络信息保存行动,主要有 5种采集方式:捐赠、呈缴、选择性采集、全采集、联合方法等。其中,前两种是被动的获取,后面三种是主动的获取方式。我们需要结合中文网络信息的特点,提出适合的采集方案。
    (3)确定采集频率。网络一直处于不断变化、更新的动态环境之中,新的网页不断产生,旧的网页也在不断地消失。由于各个网页的更新频率不同,因而需要调整采集频率,以保持同步,否则就可能遗漏很多重要信息。因此必须基于中文网络信息资源的种类与特点,探索合适的采集频率。
    2.4 如何保存(How):保存方法
    保存目标能否顺利实现,技术是一个很关键的因素,但绝对不是唯一因素,还包括法律、经济、管理等多方面因素共同起作用。
    因此,保存方法的研究主要应包括如下几个方面:
    (1)选择合适的技术实现方案。网络信息保存中所涉及的主要技术有网络信息采集技术、长期存取技术、安全控制技术等。目前许多国家都开发了各自的核心技术,这些技术各有优劣。笔者认为,在选择技术方案时,应本着三个原则:
    第一,满足采集与保存要求。在采集方面,所采取的技术能高效、自动地采集所需归档的资源;在保存方面,把网络信息作为一个离散的整体保存;能保存信息的真实性、完整性和可用性的必要特征;保证数据的易处理性(“易”指不受时间、空间、费用的限制,“处理”包括复制、存取、传输等)。
    第二,技术上的可实现性。理想的保存方案不但要求在技术上是可实现的,还应尽量要求在实际使用操作时是简便易行的。
    第三,合理的经济代价。一种方案要能应用于实际成为真正解决问题的方法,必须考虑经济问题,这关系到该方法的市场认可度和应用推广度。此外,保存技术的成本应与利用所保存信息产生的经济效益、社会效益成正比,并保持尽可能高的成本效益比。
    另外,应制定长期保存的元数据方案。长期保存元数据是辅助管理网络信息资源长期保存活动的一种手段和方法。可以借鉴OAIS模型建立适合自身保存活动的元数据方案。
    (2)探讨解决相关法律问题的途径[9]。按照一般著作权法原则,从网上获取每一个文件都要得到许可。但这实施起来是很不现实的,因为不仅需要大量人力和财力投入,还有可能造成许多网络文化遗产因为得不到法律许可而永远丢失。目前我国还没有一部法律来解决网络信息的保存与呈缴问题,因此,需要探索适合中国国情的网络信息资源保存的法律问题解决方案,包括网络信息采集、保存与提供利用过程中涉及到的知识产权问题、网络出版物的呈缴体制问题以及数据保护的相关法律适用问题。
    第一,实践过程中要遵守有关法规。在保存活动中必须要有法律意识,自觉遵守相关法律法规。同时,也要充分利用这些法律来保护自己的权益不受侵害。
    第二,借助著作权集体管理制度来解决保存过程中复杂的网络著作权问题。国务院颁布了《著作权集体管理条例》(2005年3月1日实施),其中明确规定:“著作权法规定的表演权、放映权、广播权、出租权、信息网络传播权、复制权等权利人自己难以有效行使的权利,可以由著作权集体管理组织进行集体管理。”据此,我们认为可以效仿数字图书馆在作品数字化时的做法,建立并完善著作权集体管理制度,并将其扩展到网络信息资源领域,即建立网络著作权集体管理组织和相应的管理制度,这将有助于解决保存过程中复杂的网络著作权问题。
    第三,应建立和完善数字资源呈缴本制度并修改相应的知识产权法,以立法的形式确保一个国家产生的网络信息都置于国家的控制之下,确保其得到最大程度的保存。
    第四,网络信息保存不仅在内容方面要与有关国际法协调,而且归档保存的信息资源一旦在因特网上传播,还会有许多与国际法相关的新问题产生,这也是需要认真研究解决的。
    (3)经济问题。经济问题是网络信息保存的每个环节都必须考虑的一个敏感问题。网络信息保存是一项大规模的长期工程,所需费用比保存传统印刷文献要多得多,且难以准确预算。保存纸质文献的费用主要涉及到保存这些资料的馆库累积费用、物质空间以及环境控制费用,这些费用对于网络信息长期保存也是最基本的,但这并不是主要的费用,它还涉及到诸如采集过程的投入、存储管理、技术转换、资源维护、长期存取等多方面的费用。因此,应该分析网络信息资源保存的成本,建立相应的成本-效益模型,并寻求多渠道的资金解决方案。
    第一,作为一项需要长期投入的项目,需要成本效益关系,综合考虑与保存相关的各方利益,如协调网络信息的拥有者或权利人、保存机构与最终受益者之间的利益关系,从而形成的一个长效的激励机制,确保保存方案的经济可行。2003年,OCLC发表了长达51页的研究报告《数字保存的动机研究:角色、情境与经济决策》,该报告将数字保存的各相关利益方分为权利人、保存者和受益者三个角色,并在分析这三方的保存动机的基础上提出了5种经济模型,分别是:向心模型、离心模型、供方模型、需(求)方模型、联合模型。[10]
    第二,寻求多渠道的资金解决方案。目前的保存资金主要来自于政府投资、各种基金与协会的资助以及用户交纳的费用。随着保存活动的不断深入,所需资金会越来越多,将来还需要寻求其他的资金来源,例如,可以探索保存机构自营投资的新方式。同时也要实施成本控制,加强成本管理,从而降低投入的成本。
    (4)管理问题。中文网络信息保存活动的顺利进行,还需要借助强有力的管理。不仅要遵守相关政策、法规,更要建立一整套规章制度来保证保存目的的实现。具体包括:
    第一,构建宏观管理政策。其主要作用是对保存活动进行政策性的引导与指导。因为网络信息资源保存活动涉及到资源的获取、存储和利用等环节,在国家政策的指导下应着重从如下几个方面进行研究与探索:完善和发展中文网络信息保存的组织结构;规划归档资源的建设原则与方法;加强数字信息长期保存技术与标准的研究与合作;以规范的形式确立法律、经济等问题的解决原则;建立激励机制,以激励各保存主体主动履行各自职责并开展合作。
    第二,建立保存主体内部的管理机制。要制定保存主体内部的组织管理措施,如有效的规章制度和规范的工作程序,这是实现各方利益协调与确保保存职责得以履行的必要手段。
    【参考文献】
    [1] 中国互联网络信息中心(CNNIC).2005年中国互联网络信息资源数量调查报告(2006年5月16日发布). [2006-10-14],http://www.cnnic.net.cn/download/2006/20060516.pdf
    [2] 杨道玲.中文Web资源保存现状与思考.大学图书馆学报,2006(2)
    [3] 赵俊玲.国外关于网络信息资源保存的研究.中国图书馆学报,2004(3)
    [4] CLIR. Access in the Future Tense.[2007-05-21], http://www.clir.org/PUBS/reports/pub126/pub126.pdf
    [5] CPA/RLG. Preserving digital information: report of task force on archiving of digital information. [2007-07-21], http://www.rlg.org/legacy/ftpd/pub/archtf/final-report.pdf
    [6] UNESCO. Guidelines for the preservation of digital heritage. [2007-07-21], http://unesdoc.unesco.org/images/0013/001300/130071e.pdf
    [7] 赵俊玲,卢振波.网络信息保存的责任体系分析.大学图书馆学报,2006(2)
    [8] IFLA, IPA. Preserving the Memory of the World in Perpetuity: a joint statement on the archiving and preserving of digital information.[2007-07-21], http://www.ifla.org/V/press/ifla-ipa02.htm
    [9] 钟常青,杨道玲.Web资源保存中的法律问题探讨.情报理论与实践,2006(3)
    [10] Brian F. Lavoie. The Incentives to Preserve Digital Materials: Roles, Scenarios, and Economic Decision-Making. [2007-07-21], http://www.oclc.org/research/projects/digipres/incentives-dp.pdf
    原载:《图书馆杂志》20084
    
    原载:《图书馆杂志》20084 (责任编辑:admin)
织梦二维码生成器
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
评论
批评
访谈
名家与书
读书指南
文艺
文坛轶事
文化万象
学术理论