语文网-语言文学网-读书-中国古典文学、文学评论、书评、读后感、世界名著、读书笔记、名言、文摘-新都网移动版

首页 > 学术理论 > 语言学 > 词汇学 >

汉语词汇统计研究

汉语词汇统计研究
王惠
新加坡国立大学中文系
chswh@nus.edu.sg

    1、词汇统计概说
    词汇统计研究是汉语词汇学的一个重要方面,它可以通过对汉语词汇的各种现象的量的描述得出质的评价,从而揭示汉语词汇的各种统计特性。这种统计研究可以由人来做,也可以由计算机来做。
    从词汇研究的角度来看,词汇统计研究已有很长的历史了。古印度语言学家在研究婆罗门教的经典《吠陀经》时,就进行过单词数目的统计。1898年德国学者F.W.Kaeding编制了世界上第一部频率词典《德语频率词典》。1944年,英国数学家G.U.Yule发表了《文学词语的统计研究》,大规模地使用概率和统计方法来研究语言。1949年,法国学者R.Michea提出建立“统计词汇学”。1965年,德国学者R.D.Keil把词频统计与现代统计学结合起来,提出了“词汇计量学(lexicometric)”。
    近40年来,由于语言统计研究中广泛地采用计算机,逐渐改变了传统的手工查频、手工统计的办法,提高了统计的效率和精度,词汇统计学在国际上有了巨大的发展。
    我国也早在20世纪20年代就进行过汉语词汇的统计研究。70年代末以来,我国开始利用计算机进行汉语词汇的统计研究,除了统计字、词频度以外,还以此为基础建立了汉语的语料库,编制了各种频率词典、词表,并对现代汉语的常用字、常用词、构词规则等进行了多方面的研究,取得了可观的成绩。

    2、二三十年代的汉语基本词汇统计
    在汉语教学中,究竟应该选择哪些字最先教给学生?哪些字是最常用的?哪些是次常用的?一个人至少要掌握多少字,才可以完成基本的阅读与写作?所有这些,无疑是语文教学首先就遇到的问题。因此,编选常用字表给学生学习使用就成了中国语文教育的传统。《千字文》(1000字)、《三字经》(1248字)是古代汉语教学的重要模式。我国第一个进行现代意义上的字频统计分析,是语言学家黎锦熙在1922年发表的《国语基本语词的统计研究》(《国文学会丛刊》1卷1号)。其后,教育学家陈鹤琴根据6类材料55万汉字,历时两三年,选出了4261常用字,1928年6月完成了《语体文应用字汇》。此外,王文新也编写过《小学分级字汇研究》一书。1934年,彭仁山对三民主义用词作了一些统计与分析 。1946年,四川省教育科学院颁发了《常用字选》,收录2000个字。
    这些统计都是手工查频,材料零星分散,而且统计单位只限于汉字。


汉语词汇统计研究
(责任编辑:admin)