二 研究建设标准的目的与原则 (一) 目 的 研究语料库建设标准的目的有两个:直接目的和最终目的。前者为语料库建设服务,后者为汉语的教学与研究服务。 为语料库建设服务,就要总结以往建库实践中的经验教训。总结经验可以认识语料库的建设规律,加快建设速度,提高建设水平;总结教训可以使新的建库工作不必从头摸索,少走弯路,减少语料库建设中的低水平重复。 为对外汉语教学与研究服务,就要了解广大教师和研究人员的实际需求,并根据这些需求确定语料标注内容。例如,学界的研究兴趣可能分布在汉字、词汇、语法、语篇、语体、语义、语用、辞格、交际文化等各个方面,作为通用型语料库,就应为满足各种研究目的而做语言文字乃至交际文化等各个方面的标注;有做偏误分析的需求,就要做偏误标注; 有做表现分析的需求,就要采用“偏误标注+基础标注”的模式进行标注(张宝林,2008、2013);总之,应尽可能满足教学与研究方面的多种需求,理论上是满足所有需求。 (二) 原 则 1.全面性 研究语料库建设标准的目的决定了本项研究必须贯彻全面性原则。从其直接目的看,语料库建设从设计到施工,从收集语料到语料标注,从研制管理与查询系统到上网运行与维护,是一项非常复杂的系统工程,涉及很多方面的很多工作内容和细节,哪个环节处理不好都会影响语料库的建设。因此,语料库建设标准的研究要全面。 从为教学与研究服务的角度看,不同研究者的关注点与研究兴趣往往存在很大差异,研究的对象与内容各不相同,使用电脑的习惯方式也可能多种多样。在语料库建设过程中,就要从语料类型、语料标注、语料检索与呈现方式等方面进行妥善的设计与安排,确保语料库功能的全面,以满足他们的需求。这同样需要贯彻全面性原则。 2.可行性 建设标准的制定要有充分的现实基础,有些虽然需要但暂时做不到的事情不能作为标准。例如使用计算机进行自动标注,不但效率高,标注的一致性也好,但中文信息处理除分词和词性标注达到实用水平之外,对其他语言层面的自动标注尚无实用价值,目前就不能把自动标注作为建设标准。 3.区别性 汉语中介语语料库包括口语语料库和笔语语料库,通用型汉语中介语语料库的建设标准理应包括口语语料库和笔语语料库的建设标准。由于两种语料在承载媒介上的根本区别,建设标准必须对不同类型的语料库做出不同的规定。例如,口语语料库必须包括声音语料,这是笔语语料库所没有的;为了满足对中介汉字的研究需求,笔语语料库必须进行汉字标注,而口语语料库的文本部分系由母语者转写,因而无需进行汉字标注。 (责任编辑:admin) |