谈汉语中介语语料库的建设标准(5)
http://www.newdu.com 2024/11/24 10:11:44 《语言文字应用》2015年第 张宝林 崔希亮 参加讨论
语料的代表性指所选语料要能真实反映学习者整体或大多数学习者的汉语面貌与水平,而不仅仅是反映个别或某一小部分学习者的汉语学习情况。因为“我们需要分析由许多说话者收集的大量语言,以保证我们的结论不是基于少数说话者的个性语言而做出的”,“语料库的代表性反过来决定研究问题的种类和研究结果的普遍性”(道格拉斯·比伯等,2012:152)。为了确保语料的代表性,语料应达到较大规模,应来自较多样本、较大范围。例如全球汉语中介语语料库的语料将来自全球的汉语教学单位,数万个样本,5千万字规模,无疑将具有非常充分的代表性。 真实性是建设汉语中介语语料库的基本前提,没有这个前提,语料库就不能反映汉语学习者真实的语言面貌,基于语料库的研究及得出的结论也必然是毫无意义的。而代表性与真实性密切相关,在某种程度上可以说是一种更大范围和更高层次上的真实性。 (2) 平衡性与系统性 语料的平衡性指不同类型的语料在分布上应尽可能均匀,例如不同国籍、不同母语、不同学习时间、不同专业背景、不同专业方向、不同汉语水平的汉语学习者所产出的语料数量应该完全相同。 然而这样理解平衡性并不恰当。因为现实情况根本无法达到这样“理想化的绝对平衡”。以国籍而言,学习汉语的外国人本来就以韩国、日本、东南亚居多,而欧美较少,非洲、南美洲更少。现实情况如此,我们不可能从学习者国籍的角度保证语料的绝对平衡性。另一方面,“理想的绝对平衡”也不应该是我们追求的目标,因为那并不符合外国人学习汉语的实际分布情况。 因此,我们必须实事求是地对不同类型的语料在选择上有所区别。例如从汉语水平角度看,初级、中级、高级三个学习阶段学习者的语料数量应完全相同。从国别角度看,则应采取分层抽样的方法: 学习者多的国家的语料多取; 学习者少的国家的语料少取; 只有个别或很少学习者的国家的语料则暂时不取,因为语料太少将无法保证研究结论的客观性、普遍性与稳定性,因而是没有意义的。 成系统的语料能够反映学习者的整个学习过程和完整的语言面貌,便于从各种角度对语料进行观察分析,对基于语料库的相关研究具有重要意义。 语料的系统性体现在三个方面:[1]语料和学习者的背景信息齐全,并能够一一对应;[2]同一名学习者或同一个学习者群体在不同学习阶段或不同年级的语料齐全;[3]在各类考试中,通过考试和未通过考试的考生的语料齐全,通过考试的不同档次分数的考生的语料齐全。 (责任编辑:admin) |
- 上一篇:中国少数民族语言规划百年议
- 下一篇:“语言特区”的性质与类型