语文网-语言文学网-读书-中国古典文学、文学评论、书评、读后感、世界名著、读书笔记、名言、文摘-新都网移动版

首页 > 学术理论 > 语言学 > 词典学 >

语料库建设与词典编纂(9)


    四、语料更新与词典修订 
    正如有关专家指出,语料库一旦建立,其中的材料就已成为语言历史资料。要想让所建语料库及时反映语言的最新变化,其内容就必须不断更新。目前国内许多词典内容比较陈旧,修订版也未见多大改观,其原因恐怕在于最新语料的采集与利用不足。 
    关于语料更新,COBUILD 项目主持人辛克莱尔教授提出设立“监控语料库”(monitor corpus)的主张,即建立一个专用语料库,不断采集最新语料,对语言的发展变化实施监控。词典编纂者如果需要了解新词新义及其他语言变化情况,可以在这个语料库中检索。 (注:Sinclair J M.(ed.).Corpus, Concordance, Collocation. Oxford: Oxford University Press,1991.) 
    建立“监控语料库”的最大益处是既可以避免主语料库规模变得过于庞大,又能满足词典修订的实际需要,具有事半功倍之效。而且,监控语料库还可以通过划定最新语料年代范围(如从10年、5年或3年前至今),扩大到一定规模,作为编纂新词新义词典的语料库使用。 
    随着语料库建设的蓬勃发展,语料库语言学(corpus linguistic)这门新兴学科应运而生。高度重视这方面的基础研究,积极建立科学、实用的语料库,对于促进辞书出版事业的繁荣,可谓功莫大焉。需要指出的是,在高度重视电脑语料库建设的同时,也不要忽视手工语料采集的工作,因为人工选录的例句针对性较强,占用电脑的系统资源又很少,可对主语料库起到重要的辅助作用。 
    南京大学张柏然教授主持的《综合英汉大词典》编纂项目在实施过程中制定了系统的阅读计划,课题组成员每周完成一定数量的例句摘录工作,日积月累,受益良多。复旦大学陆谷孙教授主编《英汉大词典·补编》,在编写过程中不仅通过阅读最新英美报刊搜集英语新词新义,而且通过互联网汲取有用的资料,实践证明非常成功。 
    “手工资料的优点在于精,而计算机语料库中可有可无的资料太多,很容易膨胀得无法驾驭。”(注:陆谷孙.词典的继承与创新.辞书研究,1998(1))我们在加强语料库建设时要适当注意这一点, 不要完全放弃手工资料采集。  (责任编辑:admin)