语文网-语言文学网-读书-中国古典文学、文学评论、书评、读后感、世界名著、读书笔记、名言、文摘-新都网移动版

首页 > 学术理论 > 语言学 > 词典学 >

语料库建设与词典编纂(2)


    语料库(corpus)是语言研究和词典编纂的重要工具。许多现代语言研究中心和词典编纂中心都把语料库建设作为至关重要的基础工程来对待,利用丰富的语言资源,开发科学性更强的语言研究成果和词典新品。例如,英国伦敦大学的英语用法研究中心利用自己创建的“国际英语语料库”(International Corpus of English,简称ICE)编写了《牛津英语语法》(Oxford English Grammar,Sydney Greenbaum 著, 1997);英国伯明翰大学英语系与柯林斯出版公司合作建立了“英语语料库”(the Bank of English), 以此为基础编纂出版了颇具创新意义的《COBUILD英语词典》(COBUILD Dictionary of the English Language,1987);南京大学双语词典研究中心与商务印书馆合作,建立了CONULEXID语料库,并开发了有关应用软件, 作为《综合英汉大词典》的高效编纂工具。 
    一、语料先行与语料库建设 
    词典编纂是一个深入研究词汇诸多层面、展示各种语言信息的过程。这项工作必须以丰富、翔实的语言材料为基础。古往今来,词典编纂界的有识之士都高度重视语言材料的收集。各种词典类经典之作均以可靠的语言材料奠定基础。语料先行应该说是词典编纂工作的基本原则。 
    在早期词典编纂中,语言材料的准备主要通过人工阅读书籍摘录例句,做成卡片(slips)后用于分析词义和作为书证。英国词典史上的经典之作——约翰逊博士编纂的《英语词典》就是这样做的。首先,这部词典的收词,原则上以收集到的书证为依据,一般不收录仅在某本词典中见到而别无佐证的词,剔除了以往词典中一些以讹传讹的“鬼词”(ghost words)。再者,这部词典援引了11.4万条书证来阐明词义、说明用法、展现优雅文体,对英语语言规范的确立起到了很大的推动作用。1879年开始编纂、1928年全书才出齐的《牛津英语词典》(Oxford English Dictionary),则动员全社会力量, 不遗余力地搜集资料,历时近三十载,制作引文资料卡片500多万张,为这部按历史主义原则编纂的大型语文词典奠定了坚实的基础。  (责任编辑:admin)