语文网-语言文学网-读书-中国古典文学、文学评论、书评、读后感、世界名著、读书笔记、名言、文摘-新都网移动版

首页 > 学术理论 > 语言学 > 词典学 >

汉语词汇定量研究的运用及其特点——兼谈《语言学方法论》的定量研究观

汉语词汇定量研究的运用及其特点
——兼谈《语言学方法论》的定量研究观
(刊《厦门大学学报》2001年第4期)
苏新春
厦门大学
    摘 要:定量研究的兴起是当代汉语语言学一个引人注目的特点。它把对语言规律与特点的阐述融于对大批量语料的定量分析之中,使语言研究更富于客观性、科学性,语言的一些本质特征更容易凸现出来。本文详细论述了定量分析方法在汉语词汇学中推广运用的历史背景与使用特点:对汉语研究史中“例不十,不立法”传统的继承与光大;以专书研究为计量研究崛起的主要标志;以词量为定量研究的主要内容;并正处在由手工统计向语料库使用的转换时期。提出在词汇定量研究中要注意的三个要点。文章最后对《语言学方法论》中把定量方法等同于实验方法的观点作出了商榷意见。
    关键词:定量研究方法   汉语词汇学    数据库  统计分析
    中图分类号       文献标识码:    文章编号:
    一、汉语词汇计量研究的形成与运用
    语言研究中的定量方法就是通过对语料进行数的反映,以达到认识语言规律和特点的作法。定量研究方法认为,事物的质与量是有着密切关系的,质存在于量之中,量反映质,重要的语言现象都会以较多的量的形式表现出来。80年代以来,加强定量研究的倡导在汉语词汇学界得到很好的呼应。第一部有着严格统计学意义上的反映词量、词长、词汇分布、词语构成等断代词汇状况的数据词典《现代汉语频率词典》于1986年正式出版。[1]先后还出版了一些大型词汇统计数据资料书。[2][3]但定量研究方法对汉语词汇研究产生更大影响的还不是几部词汇数据词典的出版,而是它在专业工作者的实践工作中日益受到重视,并得到应用。几千年来的汉语词汇研究传统,都是以具体词语词义为主要对象,以考释为主要目的,以研究者的主观感悟为主要手段。到现代,虽然重视了对词汇整体的理论属性的探讨,逐渐摆脱了专注于具体词义的考释性研究的旧格局,但在研究手段上却一直没有大的改变,靠的仍是研究者个人的语感,靠的是个人所熟悉的部分语料。因此,定量研究方法的引进与推广,在当代词汇研究中有着重要的革新意义。
    汉语词汇定量方法的应用与发展,有着特定的学术背景与表现形式:
    1,对“例不十,不立法”传统的继承与光大。
    汉语言学界一直流行着“让材料说话”的观点,特别强调对语言材料的充分占有。不说空话,不作无根底的文章,成为长期以来评判语言学论文的一条不成文的,却几乎至高无上的标准。如方言学中的词汇研究,在相当长的时间,只要收集到了方言词语,并略加甄别,就能受到录用、肯定。“让材料说话”铸成了汉语言学界特有的求实之风。在20世纪中前期,它一直是对汉语研究者最具影响力的因素之一。在这种思想的观照下,在语料挖掘与理论概括之间有着一句流传面很广的名言:“例不十,不立法”。王力先生对此很推崇,把它作为汉语史研究的基本原则之一加以论述:“所谓区别一般和特殊,那是辩证法的原理之一。这里我们指的是黎锦熙先生所谓的‘例不十,不立法’。我们还要补充一句,就是‘例外不十,法不破’。我们寻觅汉语发展的内部规律,不免要遭遇一些例外。但如果只有个别的例外,绝对不能破坏一般的规律。古人之所以不相信‘孤证’,就是这个道理。”[4](P19)这里的“十”还不是定量,只是从谨慎立论的角度来说,却含有明显的以“量”取胜的意思。不以孤证立论,根据语料的多少立论,这就是汉语研究中最朴素的量的观念,它已成为中国语言学研究中的一种潜意识与自觉行为。
    2,以专书研究为计量研究崛起的主要标志。
    言语材料的无限,使得语言研究要实行量化总会面临舍取难处的尴尬,这就很自然使人们转而考虑选取既容纳有相当言语材料,又有一定时代和语言特征的专书。符合这两个要求的当然首先是经过历史检验的汉语史各个阶段的书籍,如《左传》《国语》《战国策》《诸子》之于先秦、《史记》《汉书》《论衡》之于两汉、《世说新语》之于魏晋南北朝等。因此,重视专书研究的作法首先在汉语史学界流传开来也就是很自然的事了。《左传》《史书》研究专家何乐士先生的一段回忆,颇为真实地记载了这一风气之端起:
    数十年我们的师辈一直不间断地倡导专书研究。拿我亲身感受而言,60年代初,陆志韦先生就亲自带领我们投身这项工作。吕叔湘先生在担任语言所所长期间曾不止一次对古汉语研究室的研究人员强调,汉语史研究应以专书研究作为基础。1979年他在写给古汉语研究人员的一份建议书中写道:“要对古代汉语进行科学的研究,就要注意时代和地区的差别。对这些差别,现在还只有一些零碎的认识,还缺少系统地探索的成果。要进行研究,现在还只能先拿一部一部的书做单位,一方面在同一作品中找规律,一方面在作品与作品之间就一个个问题进行比较。”丁声树先生生前也一再教导我们说,那种任意选取例句的作法不能科学地总结规律,应对专书进行穷尽的调查研究。[5]
    专书研究的风气真正刮起来是在20世纪的80年代。这时各个历史阶段的专书都陆续有人进行了专门的研究,他们努力于反映该书的词汇整体面貌,如何乐士的《左传》《史记》研究、[6]张双棣的《吕氏春秋》研究[7]、毛远明的《左传》[8]研究等。张双棣先生这样描绘了《吕氏春秋》的词汇概况:“全书有单音词2972个,复音词2017个,总共近五千词。单音词中,名词最多,达1371个,动词次之,有1298个,形容词又次之,有464个,其他类词共有272个。从这个数字中,我们清楚地看到,《吕氏春秋》中动词的数量很大而形容词的数量相对小得多,这与《吕氏春秋》的语言风格关系很大。”[7]这已经是相当严格的定量研究了。尽管学者们大多依靠的是手工操作,语料统计数字还难保绝对的准确,但从数量的多少来看词汇的结构规律,已成为一条基本准则。
    而放眼于近代汉语、敦煌学、佛教词汇学、语用学、社会语言学等相关学科中展开的其它词汇专题的定量研究,成果更是蔚为可观。这些专题性的词汇定量研究论文都采用了统计的方法。如程湘清先生的《先秦双音词研究》:“上述词语共615个,其中最多的是指人,指事物、指时地的名词语,共386个,占全部词语的62.76%;其次是指动作、行为或变化的动词语,共139个,占22.6%;再次是指人和事物的性质、状态的形容词语,共90个,占14.64%。从结构上看,绝大多数是运用语法手段词序的特点构成的,共586个,其中居首位的是并列式,共307个,占52.4%。”[9]程文作于80年代初,他所作的定量工作在当时算是相当彻底的。它的彻底性与同时代的论文稍作对比就可看得很清楚,如另一篇论文:“本文对《史记》《汉书》《论衡》三部著作中的复音实词作了全面的观察研究。我们把重点放在汉代用而现代汉语还在用的那些复音词上,这些复音词的构词格式我们全部写入了本文。汉代用而现代不用的那些实词,它们的构词格式和前者基本上相同,我们只是将这些词中的一部分写入了本文。”[10]尽管这里统计了汉代三种书的所有词语,但后续的定量工作没有跟上,因此文中仍处处可见“很少见到”“才慢慢多起来”“大部分”“较少”类的词语。这样的作法显然离定量研究还有很大的距离。 (责任编辑:admin)