谈汉语中介语语料库的建设标准(8)
http://www.newdu.com 2024/11/24 10:11:48 《语言文字应用》2015年第 张宝林 崔希亮 参加讨论
3.只标不改 即只是指出语料中的偏误现象与偏误类型并进行分类标注,而不做任何修正。这样处理的原因,一是同一个错误可能存在多种不同的改法,在语料库中很难将所有改法一一列出; 二是修正会导致语料“失真”,影响研究结果的客观性; 三是对于广大用户来说,语料库的最大价值是提供汉语中介语的语言事实,从中可以发现各种偏误现象及数量、比例等相关数据,进而通过研究得出结论指导教学。要达到这样的目标,标出偏误即可,而无需修改。 (四) 资源共享 1.现 状 有研究指出,近十年来,虽然语料库数量众多,类型丰富,但可公开使用的语料库并不多。如何最大范围地实现语料库的资源共享模式,让语料库研究成果的受益群体最大化,仍然是一个值得研究的课题。(谭晓平,2014)十多年前,当我们设计“HSK动态作文语料库”时,就提出了语料库建设的开放性原则。(张宝林、崔希亮、任杰,2004) 语料库建成后,我们立即兑现承诺,向海内外各界人士免费开放; 后来又应用户要求,取消普通用户与高级用户的区分,提供语料下载功能,全面开放了语料库。自2006 年语料库建成以来,为数以万计的海内外用户提供了语料支持,发挥了其应有的作用。 近年来,要求语料库开放的呼声越发强烈。这种呼声有其充分的合理性,因为语料库本来就“应该是一个可以被人类和科学研究者重用的、共享的资源”(郑家恒等,2010:6) 。 2.资源共享的理据 梁任公有言: “夫学术者,天下之公器也。”此言之重要前提,学术研究之材料亦当为天下之公器,否则,无学术矣。(故纸沉吟,2011)语料库之语料即“学术研究之材料”,实乃公器,本来就应该为天下人所用。 国家资助语料库建设的目的就是促进学术发展,推动国家教育事业与科学技术的进步,而实现最充分的资源共享是达此目的的前提。 公民作为国家税收的纳税人,完全有资格与权利使用国家科研经费资助的科研成果,当然,涉密的成果除外。 近年来,随着我国经济的持续发展和国际地位的不断提高,在全球范围内希望了解中国、愿意学习汉语的人越来越多,汉语国际教育形势迅猛发展。在这种情况下,我们更应关注、了解各类学习者的汉语学习状况,探索与总结面向各类汉语学习者的教学规律,千方百计提高教学效率。在这方面汉语中介语语料库有着不可替代的重要作用,应该积极主动地、全心全意地为汉语的教学与研究服务,尽快开放。 今天是一个以互联网、云计算、大数据为显著特征的信息时代,其核心观念是开放。目前国外一些国会图书馆和大学图书馆的数字化成果都是全数上网,完全公开,免费下载。这已成为一些国家进行公助数字化项目的前提。人文计算是一个新兴的将现代信息技术深入应用于传统人文研究的跨学科领域。数据是人文计算的基础,从目前整个学科的发展来看,数据开放、数据共享已经逐步成为这一学科的趋势。(李启虎等,2014) 据我们了解,我国国家图书馆的数字文献只要是不涉及版权问题的也都能上网阅览、下载,而且是免费的。 我们认为,汉语中介语语料库及基于语料库的相关研究是信息技术的成果、网络时代的产物,属于人文计算的范畴,同样应该贯彻数据开放、资源共享的时代精神。 (责任编辑:admin) |
- 上一篇:中国少数民族语言规划百年议
- 下一篇:“语言特区”的性质与类型