“词”为何物:对现代汉语“词”的一种重新界定
http://www.newdu.com 2024/11/24 11:11:53 未知 邓盾 参加讨论
摘 要:文献上通行的现代汉语“词”的定义——最小的能够独立活动的有意义的语言成分(朱德熙,1982:11)——所依赖的两个关键性鉴定标准都难以贯彻执行。“能够独立活动”会将以“的”为代表的虚词排除出词的范畴,并且其背后隐藏着认识论和方法论之间的逻辑冲突。确定“最小”所借助的扩展法(陆志韦等,1957)缺乏定义,在实际应用中其所预设的前提经常是不成立的,执行该方法得到的结论往往也无法站住。本文主张将“词”处理为句子生成过程中所产生的单位,而不是用来生成句子的起点单位,并将“词”重新界定为:“在以语素为起点生成句子的过程中产生的,具有句法完整性的最小语言片段。”文章展示了这一新的定义如何能够解决现有通行定义存在的问题,并对新定义所给出的鉴定标准与通行定义之外被广泛用来界定“词”的相关鉴定标准进行了比较,指出了它们在不同界定目的之下的长短。 关键词:“词”;界定;动态词观;句法完整性 作者简介:邓盾,博士,清华大学中文系副教授。主要研究领域为生成框架下的汉语词法与句法以及面向自然语言处理的语言资源建设。 基金:国家社科基金重大项目“生成语法的汉语研究与新时代汉语语法理论创新”(18ZDA291)的资助。 一 引言 一般认为,语素、词、词组、句子是语法研究的四级单位(朱德熙,2010:33)。这四级单位的界定与相互区分是语法研究的基础性课题。对现代汉语而言,语素的界定最容易,因为有形式标准可以利用。具体来说,单个音节是鉴定现代汉语语素的重要形式标准。除去从其他语言借入的外来词、属于历史遗存的连绵词以及由儿化、合音等形态音系操作造成的派生形式,现代汉语共时平面上本源的非派生语素,语音形式都是单音节的。也就是说,现代汉语通过自身语音形式的手段将语素这一级单位给标示了出来。因此,语素可以视作现代汉语的一级天然的语言单位。语素的“天然性”有两方面的体现:首先,现代汉语的书写系统将其离析了出来。除去外来词等特殊情况,现代汉语的一个语素在书写上用一个汉字代表,并且汉字与汉字在书写时是相互分开的1 。其次,除去外来词等特殊情况,现代汉语的母语者单凭语感就可以在话语片段中将语素辨识出来。一句话,即使是问一个没有任何语言学知识的汉语母语者它里头有几个字,一般都能得到正确的答案,并且这个答案可以得到其他母语者的认同,在母语者中取得广泛一致。 与语素不同,词、词组、句子都不是现代汉语的天然单位。以词为例,现代汉语没有音节数量或重音模式等语言自身形式上的手段将之标示出来2。词的这种“非天然性”也有两方面的体现。一是现代汉语的书写系统没有把词离析出来,汉语在书写时分字不分词。正因为如此,计算机自动分词(segmentation)是汉语自然语言处理(NLP)的重要任务。二是现代汉语的母语者不能单凭语感将话语片段中的词辨识出来。笔者曾在三个不同的学期以“我的水杯放在桌上”为例,让三十名左右没有学习现代汉语语法的大二学生回答这个句子包含几个词,调查结果是:4个、5个、6个、7个都有人回答,并且没有哪个答案在统计上占优。这说明汉语母语者对什么是词并不能简单轻易地取得一致意见。这个调查结果与文献上对词的界定的研究完全吻合:正因为词为非天然单位,所以需要语言学家去进行界定;在界定的时候,不同理论背景的学者往往会有不同的视角和鉴定标准,因此不同的著作对什么是词会有非常不同的意见(词的界定有影响的早期尝试见陆志韦等(1957),最近的一种观点见程工(2019))。 本文的目的是对现代汉语的词进行重新界定。 二 现代汉语词的通行定义及其存在的问题 关于现代汉语词的界定,很多有影响的现代汉语语法著作(如陆志韦等,1957;朱德熙,1982),以及在高校流通的诸多现代汉语教材(如黄伯荣、廖序东主编,2002;北京大学中文系现代汉语教研室编,2004;胡裕树主编,2011;邢福义主编,2015;邵敬敏主编,2017等),都采用了在内容实质上相同的一个定义。以朱德熙(1982:11)为例,该书为“词”下的定义是:“最小的能够独立活动的有意义的语言成分。”其他的语法著作和一些教材给出的定义可能在文字上与上述定义存在差异,比如把“能够独立活动”表述为“能独立运用”,把“有意义的语言成分”表述为“音义结合体”(陆俭明,2003:19),但这些都只是表达用语上的差异,并不影响内容实质上的一致性。因此,可以认为朱德熙(1982)给出的是在学界通行的定义,本文下面的讨论就以这一通行定义为准。 上述通行定义包含两个关键性的鉴定标准:一是“能够独立活动”,这个标准是为了把黏着语素排除出词的范畴。“民、骄、讽”等都是最小的有意义的语言成分,但它们不满足能够独立活动这一条件,所以不是词。另一个标准“最小”是为了把词组和句子排除出词的范畴。“很好、他去”等虽然都是能够独立活动的有意义的语言成分,但它们不满足最小这一条件,所以也不是词。通行定义在现代汉语的教学和研究中影响很大,但是却存在比较严重的问题,具体表现在该定义所依赖的两个关键性鉴定标准都难以贯彻执行,下面进行论证。 2.1 “能够独立活动”在贯彻执行时存在的问题 “能够独立活动”在贯彻执行时存在的主要问题,朱德熙(1982:12)已经指出:“绝大部分汉语虚词都是粘着形式,可是我们不能不承认虚词是词。”事实是:“的、所、吧、呢、从、向、且、或、也、就”等虚的成分都不能独立活动,如果严格执行通行定义给出的鉴定标准,这些成分都要被排除在词的范畴之外。如果坚持要把这些成分算作词,就必须修改定义。遗憾的是,笔者所知的语法著作和教材,一方面采用通行定义,另一方面又认定以“的”为代表的成分是词,这就自相矛盾了。如果真要贯彻对以“的”为代表的成分的定性,那么“-子、-儿、-头”等虚的成分是不是也应该算作词?举例来说,“冰箱里没什么吃的”和“这东西没什么吃头”里的 “的”和“头”,在性质上有很大的相似性。两者都是没有实在词汇语义的后置定位成分,都不能够独立活动,而且功能上都是与动词性成分组合以后造成一个整体为名词性的片段。但笔者所知的语法著作和教材都将“的”处理为虚词,而将“头”处理为词缀,这种区别对待的道理何在,文献上鲜有令人信服的说明。 陆志韦等(1957:14)意识到了以“的”为代表的成分对通行定义带来的挑战,因此专门提出了一种剩余法来解决它们所带来的问题。具体做法是:在分析一个语言片段时,“挑出了能独立的词之后,剩下来的成分,不妨叫做‘剩余的词’。”剩余的词也算作词。比如说“你去吧”,“你”和“去”都能够独立活动,根据定义可以确定为词。将这两个词挑出来,剩下的“吧”也算作词。这个办法在解决一个问题的同时又制造了新的问题。以“他很爱惜医院的钱财”为例,如果对这个片段进行分析,鉴定其中的词,“他、爱、医、钱”都能够独立活动,算词。将这四个词挑出来后,剩下的“很、惜、院、的、财”,根据剩余法,也应该算作词3。 但这明显不是想要的结果。只要在语料分析中执行剩余法就不难发现,该方法固然可以将话语片段中虚的成分(如上述例子中的“很”与“的”)鉴定为词,同时也会将很多实的黏着成分(如“惜”和“财”)鉴定为词。前者是剩余法想达到的目的,后者却是剩余法不希望得到的结果。但若执行剩余法,上述结果不可避免。另外,剩余法也解决不了“吃的”和“吃头”里“的”与“头”的区分问题。一旦使用剩余法将“吃”挑出去,剩下的“的”和“头”都会被鉴定为虚词。因此,剩余法并不是一个能够解决这里所指出问题的办法。 除了虚的成分带来的问题,“能够独立活动”这一鉴定标准背后还隐藏着认识论和方法论之间的逻辑冲突。朱德熙(1982:25)认为:“语法分为句法和词法两部分。句法研究的是句子的内部构造,以词作为基本单位;词法研究的是词的内部构造,以语素作为基本单位。可见句法和词法是属于两个不同平面上的东西。”朱德熙(1982:11)还指出:“所有的词都可以看成是由语素组成的。由一个语素形成的词叫单纯词,由两个或更多的语素形成的词叫合成词。”结合以上两个论述,不难得出如下结论:不管是单个语素直接实现成单纯词,还是多个语素相互组合构成合成词,都是词法平面上的现象,不能与句法平面混为一谈。但事实是:在现代汉语里,不管是判定单个语素能否直接实现为单纯词,还是判定由多个语素组合成的片段是合成词还是词组,都需要借助句法平面上的标准才能做出判断。“能够独立活动”这一鉴定标准的设立是为了判定单个语素是否能够直接实现为单纯词。吕叔湘(1979:15-16)指出:在现代汉语里,一个语素能否独立活动,要放到具体的语境中去看。同一个语素,受到语境的语体等因素的影响,其独立与否的情况可能会有不同。以“携”为例,如果该语素用在口语语境中,它不能作为句子的谓语动词带宾语。但如果用在书面语的语境中,它可以作为句子的谓语动词带宾语。如: (1)a. *这周末你能携孩子去动物园吗?Symbol}B@ *你身上携零钱了吗? b. 当地时间4号深夜,沙特国王萨勒曼抵达俄罗斯首都莫斯科,俄罗斯外交部副部长波格丹诺夫率领俄方代表团,携俄罗斯第154独立警卫团仪仗队和军乐团在机场迎接萨勒曼。(网易新闻) (1)中的事实表明:“能够独立活动”是一个句法层面的标准,因为该标准需要借助语素出现的句子来进行判定。“*携孩子、*携零钱”不合法的原因是动宾搭配不协调,具体来说,是动词“携”与其宾语“孩子”或“零钱”在语体特征上不搭配。若将“孩子”和“零钱”换作与“携”语体特征相匹配的“幼子”和“重金”,再将“携幼子、携重金”放到“携幼子去拜访阁下、携重金潜逃”等适当的语境里,可接受性就变了。动词与其宾语的搭配属于动词对其宾语的次范畴选择,具体到此处所讨论的情况,是动词“携”对其宾语有语体特征上的次范畴选择要求,这是一种句法现象。因此语素“携”能否独立活动(即能否实现为单纯词)取决于句法平面上的标准。朱德熙(1982)在词的认识论上认为词法是和句法处于不同平面上的东西,在界定词的方法论上又借助“能够独立活动”这一句法层面的标准去对词法层面的成词与否进行判定,两者之间存在逻辑冲突。 2.2 “最小” 在贯彻执行时存在的问题 “最小”这一鉴定标准在贯彻执行时存在的问题是:如何确定一个给定的片段是最小的?单个语素构成的片段没有问题,如“沙发、人、民、高、吃”等都是最小的,如果这些片段同时还满足能够独立活动的条件,就可以判定为词。问题是如何知道由两个及以上语素组成的片段是不是最小的。下面以两个语素构成的片段为例进行讨论。两个语素组成的片段,若根据每个语素自由或黏着的不同,共有四种组合上的逻辑可能: (2)a. 自由+自由,如:“红布、白菜” b. 自由+黏着,如:“人民、修理” c. 黏着+黏着,如:“经济、商量” d. 黏着+自由,如:“雄鸡、琢磨” 根据通行定义,可以从逻辑上推出(2b-d)里的组合都是词,因为这三种组合内部都包含不能够独立活动的黏着成分。通行定义规定不能独立活动的成分不是词,既然这三种组合内部都包含非词成分,它们就不可能是词组(词组一定是词与词的组合),而只能是词(相关讨论参看朱德熙,1982:33)。问题来自(2a)里的组合,该组合内部的两个组成成分都是能够独立活动的自由成分(即单独来看可以是词的成分),所以(2a)有可能是词组而不是复合词。也就是说,(2a)有可能不是最小的能够独立活动的单位(词),而是比词大的单位(词组)。因此,“最小”这一鉴定标准在执行时所面临的问题是:有什么方法可以用来判定(2a)这种类型的组合是词还是词组? 对于上述问题,陆志韦等(1957:6-9)提出的扩展法在学界影响最大。(2a)所代表的片段,比如“红布”,到底是词还是词组,很多语法著作和笔者所知的所有现代汉语教材都借助了扩展法来进行判定。比如朱德熙(1982:34)提出了四条区别复合词和句法结构(即词组)的标准,其中一条是:“不能扩展的是复合词,能扩展的是句法结构。”朱先生给的例子是:“生姜、大车(用马或骡子拉的车)、金笔(自来水笔)”是复合词,而“生肉、大车、金表”是句法结构,理由是后者可以扩展为“生的肉、大的车、金的表”,而前者不可以。 扩展法最关键的问题是:到底什么是扩展?比如能否根据“嫩生姜、旧大车(用马或骡子拉的车)、新金笔(自来水笔)”来断定“生姜、大车(用马或骡子拉的车)、金笔(自来水笔)”可以扩展,因此是词组?遗憾的是,笔者所知的文献都只是通过实际的应用来例示扩展法,没有对扩展法给出严格精确的定义。更遗憾的是,文献上运用扩展法所得出的结论,如果仔细推敲,很多均缺乏根据。比如说认为“生肉”可以扩展为“生的肉”,因此“生肉”是词组,这其实是站不住脚的。运用扩展法得出的结论能够成立的前提是:扩展后得到的片段(称之为B)与扩展前的待判定片段(称之为A)之间具有派生关系。如果B根本不是由A扩展而来的,就不能根据B来下结论断定A是否可以扩展,从而判定A是词还是词组。仍以“生肉”和“生的肉”为例: (3)认为“生肉”是词组的观点预设的“生的肉”的生成过程: a. 第一步,取“生”; b. 第二步,取“肉”; c. 第三步,组合“生”与“肉”得到“生肉”; d. 第四步,取“的”; e. 第五步,将“的”插入“生肉”,扩展“生肉”得到“生的肉”。 只有(3)中的生成过程成立,才能保证“生的肉”与“生肉”之间的派生关系,才能说“生的肉”是“生肉”扩展而来,然后才能进一步说因为“生肉”可以扩展为“生的肉”,所以是词组。但事实上,“生的肉”是按照如下的步骤生成的: (4)“生的肉”的实际生成过程: a. 第一步,取“生”; b. 第二步,取“的”; c. 第三步,组合“生”与“的”得到“生的”; d. 第四步,取“肉”; e. 第五步,组合“生的”与“肉”得到“生的肉”。 本文之所以认为(4)才是“生的肉”的实际生成过程,是因为朱德熙(1961、1966)令人信服地论证了“生的肉”里的“的”是一个后附性成分而不是一个插入性成分。“生的肉”做层次分析应该是“生的/肉”(“生的”和“肉”组合得到“生的肉”)而不是“生肉”加“的”(“的”插入“生肉”得到“生的肉”)。如果接受(4)才是“生的肉”的生成过程的结论,不难看出,在上述过程中,根本没有出现“生肉”。也就是说,“生的肉”不是“生肉”通过扩展而来的,两者不具有派生关系。既然如此,就不能以“生的肉”作为依据来下结论说“生肉”可以扩展为“生的肉”,所以是词组。 正因为扩展法没有严格的定义,如果照葫芦画瓢,按照文献上已有的实践来贯彻执行扩展法,会得出完全反直觉的结论。比如若要根据扩展法来判定“生的肉”这个片段是词还是词组,因为“生的肉”不能被扩展为“*生的的肉”,所以“生的肉”是词4 。也就是说,如果按照插入“的”这种方法来执行扩展法,去判定“生肉”和“生的肉”这两个语言片段的性质,会得出“生肉”是词组而“生的肉”是词的结论。很明显,这一结论很难令人接受。 三 对现代汉语词的一种重新界定 上一节讨论了目前学界通行的现代汉语词的定义存在的问题。为解决这些问题,本文主张从语言生成的动态视角来认识词。以动态词观为基础,本文把现代汉语的词重新定义为:“在以语素为起点生成句子的过程中产生的,具有句法完整性(syntactic integrity)的最小语言片段。”下面先介绍动态词观和句法完整性的具体内涵,然后再论述新的定义如何能够解决通行定义存在的问题。 3.1 动态词观与句法完整性的内涵 动态词观作为词的一种认识论5,其具体内涵是:词不是先于句子生成而存在的、在句子生成时现成可取的静态单位,而是在句子生成过程中产生出来的单位。也就是说,在本文看来,词不是所谓的词库里存储着的可直接取来用于句子生成的原材料,而是在句子生成过程中的产物,是话语生成过程中产生出来的过程物。一般认为,语素和词都是词库里的单位,语素在词库里通过构词规则组合成词,词再作为起点性的原材料单位,从词库进入句法,在句法里根据句法规则组合生成词组和句子。换句话说,词是句法生成过程的起点,其产生先于句子的生成,与句子的生成无关(朱德熙,1982:25)。本文认为,现代汉语语法体系的基本单位库里静态存储的、直接可取的现成原材料是语素这级天然单位,语素才是句法生成过程的起点。另外,现代汉语的语法体系并不存在构词部门和造句部门以及构词规则和造句规则的区分,生成的部门只有一个,即句法;生成的规则也只有一套,即句法规则。词和词组、句子一样,都是在以语素为原材料的言语生成过程中通过句法规则相互组合而产生的。 以上述认识论为基础,本文采用句法上的完整性作为界定词的鉴定标准。事实是:在以语素为起点造句的过程中,语素与语素相互组合一旦生成了一个词,这个词就具有了句法上的完整性,具体的体现是词的内部组成成分不能进行句法上的操作。词的这种完整性特征,在很多语言里都有事实上的体现。下面仅举一个英语例子来进行简单说明。green house这个片段,有语音形式上的手段来标示其性质。如果片段的主重音落在house上,片段整体是一个名词词组,义为“绿的房子”。如果片段的主重音落在green上,片段整体是一个复合名词,义为“温室”。也就是说,green house是词还是词组,有语音上的标记,这是一个独立存在的事实。有意思的是,当主重音落在house上,即green house为名词词组时,其内部组成成分green可以作为句法操作的对象,比如能受到程度副词very的修饰,得到very green house“很绿的房子”。但是当主重音落在green上,即green house为复合名词时,其内部组成成分green不能作为句法操作的对象,比如不能用程度副词very去修饰green。这一事实表明:词具有句法上的完整性,而词组没有这个特点,此即著名的“词项完整性假说”(Lexical Integrity Hypothesis)的事实依据(参看Di Sciullo & Wiliams,1987:46-54)。陆志韦等(1957)提出的扩展法背后所隐藏的出发点应该也是词的完整性:正因为词具有完整性,所以不能被扩展。可惜的是,扩展法作为一种方法,因为缺乏定义和认识论的支持,文献对它的使用并没能很好地体现出词的完整性特征。 基于上述讨论,本文提出如下界定词的操作程序和判定标准: (5)动态词观下界定词的操作程序与判定标准: 在以语素为起点造句的过程中,组合成分X和Y得到了片段XY,如果: a. X或Y可以进行句法操作,那么片段XY是一个词组,其组成成分X和Y都是词; b. X和Y都不能进行句法操作,那么片段XY是一个词,其组成成分X和Y都是词内成分。 首先需要指出的是,(5)规定了判定的对象只能是由两个成分组成的片段。单个语素不与任何成分组合,我们无法判断其身份。比如单独拿出“人、大、去”中的某一个语素,我们无法判定它是不是词。只有知道接下来与它组合的成分是什么,才能做出判断。比如说与上述三个语素组合的分别是“呢、的、吧”,由此得到“人呢、大的、去吧”,因为这三个片段都不具有完整性(具体证明可参考下文对“吃的”的证明,此处略),所以三个片段整体都是词组,每个片段内部的两个组成成分都是词。如果与上述三个语素组合的分别是“民、方、处”,由此得到“人民、大方、去处”,因为这三个片段都具有完整性(具体证明可参考下文对“吃头”的证明,此处略),所以三个片段整体都是词,每个片段内部的两个组成成分都是词内成分而非词。不难看出,这样的结论是符合事实和直觉的。 本文把(5)中的关键概念“句法操作”定义为成分的组合(merge)。一个成分X可以进行句法操作,就是X可以和另一个成分Z进行组合(组合的语序无关紧要,XZ和ZX都是X进行句法操作的结果)。(5)中的句法操作需要满足如下条件:成分X进行句法操作的结果(即X与Z组合得到的片段XZ或ZX)必须与X在句法功能上保持一致。举例来说,若X是“生肉”里的“生”,X进行句法操作意味着与一个成分Z进行组合,上述要求规定Z可以是“很”,因为“很生”与“生”的功能一致,但Z不能是“的”,因为“生的”与“生”功能不一致。 最后需要指出的是,(5a)用了表示析取(disjunction)的“或”,因此只要X或Y中的一个可以进行句法操作,XY这个整体就不具有完整性。(5b)用了表示合取(conjunction)的“和”,只有X和Y都不能进行句法操作,XY这个整体才算具有完整性。 3.2 解决通行定义存在的问题 首先看虚的成分以及扩展法给通行定义带来的问题。运用新的定义,上文讨论过的“生肉”和“吃头”会被鉴定为词,而“生的肉”和“吃的”会被鉴定为词组。 先看“生肉”。在造句过程中,组合“生”和“肉”得到“生肉”这个片段。事实是:“生肉”一旦生成,就具有了完整性,片段内的两个组成成分“生”或“肉”都不能进行句法操作,比如说二者分别带上进行修饰的成分,其结果是不合法的:“*很生/肉、*生/那块肉”。既然“生肉”生成后具有完整性,按照新定义的鉴定标准,“生肉”是词。 再看“生的肉”。上文已经指出,“生的肉”的生成过程是先取“生”,再取“的”,组合二者生成“生的”;然后取“肉”,将之与已经生成的“生的”组合,生成“生的/肉”。先看组合“生”和“的”生成的“生的”。事实是:“生的”生成后,不具有完整性,因为其内部组成成分“生”可以与修饰成分组合,结果是合法的:“很生/的”。既然“生的”生成后不具有完整性,按照新定义的鉴定标准,“生的”是词组。再看组合“生的”与“肉”得到的“生的/肉”,这个片段也不具有句法上的完整性,因为其内部的组成成分“肉”可以与修饰成分组合,结果是合法的:“生的/那块肉”。既然“生的肉”生成后不具有完整性,按照新定义的鉴定标准,“生的肉”是词组。 接下来看“吃头”和“吃的”。造句时,组合“吃”和“头”得到“吃头”,该片段生成后具有完整性,因为其内部组成成分“吃”不可以与状语或宾语等句法成分组合:“*经常吃/头、*吃螃蟹/头”,根据新的鉴定标准,“吃头”是词。与之相对,组合“吃”和“的”得到“吃的”,该片段生成后不具有完整性,因为其内部组成成分“吃”可以与状语或宾语等句法成分组合:“经常吃/的、吃螃蟹/的”,根据新的鉴定标准,“吃的”是词组。 在“生的肉”这类片段的定性上,新的鉴定标准要优于扩展法,因为被广泛采用的插入“的”的扩展法会把“生的肉”鉴定为词。在“生肉”这类片段的鉴定上,朱德熙(1982)等持通行定义的著作运用插入“的”的扩展法将之鉴定为词组,上文已经论述,这一结论是站不住脚的。还有些著作从别的鉴定标准出发也将之鉴定为词组,下文第四节对此会有讨论和说明,此处不赘。在“生的、吃的、吃头”的鉴定上,新的定义将前两者界定为词组,将最后一个界定为词,这一结论符合母语者的语感和研究者的共识。从这一结论出发,可以进一步确定“的”是虚词而“头”是词缀,因为“生的、吃的”是词组,根据(5a),“生、吃、的”都是词。“吃头”是词,根据(5b),“头”是词内成分,即词缀。在“的”和“头”的定性上,尽管采取通行定义的著作所持的结论与本文根据新定义得出的结论相同,但通行定义并不是通过执行其所给出的鉴定标准而得到上述结论的(如果严格执行其鉴定标准,“的”不可能被判定为词)。因此,在“的”和“头”的定性上,新的定义要优于通行定义。同时需要指出的是,因为新定义直接执行就可以解决“的”和“头”等虚的成分的定性问题,因此无需借助剩余法,也不会出现把黏着实语素鉴定为词的情况。 需要说明的是,有人认为本文所使用的鉴定方法其实就是扩展法,比如本文以“很生的”来证明“生的”里的“生”可以进行句法操作,这实质上与认为“生的”可以扩展为“很生的”没有区别6 。本文不认可这种看法,本文的鉴定方法和扩展法有一个很重要的区别:扩展法预设“很生的”是通过扩展“生的”里的“生”派生而来的,但本文并不认为“很生的”是“生的”里的“生”进行句法操作以后得来的。本文依据的事实是:“生的”这个组合的前一个组成成分“生”,在与后一个组成成分“的”组合之前,可以与“很”组合,“生”与“很”的组合并不影响接下来与“的”的组合(“很生/的”)。这与“生肉”不同。“生肉”这个组合的前一个组成成分“生”,在与后一个组成成分“肉”组合之前,不能与“很”组合,一旦“生”与“很”组合,接下来就不能再与“肉”组合了(“*很生/肉”)7 。基于此,本文说“生的”里的“生”可以进行句法操作,而“生肉”里的“生”不可以。但本文并不认为“生的”和“很生的”有派生关系。事实上,“很生的”是先组合“很”与“生”得到“很生”,然后组合“很生”与“的”得到的,在这个生成过程中并没有出现“生的”,因此“很生的”和“生的”不存在派生关系。本文的观点与这一事实相符。 接下来看以“携”为代表的成分的处理。事实是:在口语中,“携”不成词;但是在书面语中,“携”可以成词。这一事实使得通行定义处于一种尴尬的境地:如果依据口语事实,认定“携”不能独立活动,书面语的事实无法解释;如果依据书面语事实,认定“携”能够独立活动,口语的事实又无法解释。如果要兼顾口语和书面语,则只能说“携”有时能独立活动,有时又不能独立活动。新定义严格根据“携”在造句中的组合情况来对它的身份进行判定,不会出现上述尴尬局面。造句时,如果取了“携”这个成分,新定义要求将语素置于组合的过程中去进行身份判定,如果接下来取的组合成分是“带”,组合“携”与“带”生成“携带”,事实是:“携带”生成后具有句法上的完整性,“携带”是词,“携”和“带”因此都是词内成分。如果接下来取的组合成分是“仪仗队”8,组合二者得到“携仪仗队”,事实是:“携仪仗队”这个片段生成后不具有句法上的完整性,比如以“仪仗队”为并列项,将“仪仗队”与新取的某个成分,比如“军乐团”进行并列,得到“携仪仗队、军乐团”。既然“携仪仗队”生成后不具有句法上的完整性,按照新的鉴定标准,该片段是一个词组。“携仪仗队”是词组,根据(5a),其内部两个直接组成成分“携”和“仪仗队”都是词。不难看出,新的定义根据成分在造句过程中的具体组合情况来判定其身份,可以很好地处理“携”这类在不同语境中成词与否发生变化的成分。另外,上文已经指出,“携”的处理暴露了通行定义背后所隐藏的认识论和方法论之间的逻辑冲突,很明显这个冲突在新定义里不存在,因为新定义明确认为词是句法生成过程中产生的单位,因此根据句法上的标准来鉴定词是顺理成章的。 最后,对新定义中出现的“最小”这一标准做一说明。“最小”必须放到句子生成的过程中去理解与执行。举例来说,生成时若先取“研”,再取“究”,组合得到“研究”,“研究”算不算最小,取决于生成过程的下一步。如果下一步取“鱼”,将之与已经生成的“研究”组合生成“研究鱼”,因为“研究鱼”不具有完整性(可以针对“鱼”进行句法操作得到“研究/那种鱼”),所以“研究鱼”是一个词组,由此可以进一步判定“研究”和“鱼”都是词。如果生成“研究”后的下一步取的不是“鱼”而是“生”,组合已经生成的“研究”和“生”得到“研究生”。因为“研究生”具有完整性(其内部任何一个组成成分都不能进行句法操作),所以“研究生”是词,此时“研究”是词内成分。在前一种情况下,“研究”算最小的具有完整性的片段,而在后一种情况下,“研究生”才算最小的具有完整性的片段。换句话说,新定义里的“最小”不是指绝对的大小,一个片段是否最小要依生成过程中的组合情况而定。这种处理可以解决“研究”这样既可以作词又可以作词内成分的情况。 四 界定词的不同鉴定标准的比较 上文讨论并比较了现代汉语词的通行定义与本文给出的新定义。在对现代汉语的词进行界定时,除了通行定义所给出的鉴定标准,文献上还出现了其他一些鉴定标准。本节的目的是对这些标准进行评述和比较。篇幅关系,本文不能逐一讨论文献上出现过的所有标准。下面仅选取通行定义之外最常被用来鉴定词的两条标准,比较它们和本文界定词所依赖的鉴定标准之间的长短。 在比较之前首先需要指出的是,词的鉴定标准的选择很大程度上取决于界定词的目的。如果界定词的目的不同,所选取的鉴定标准往往会不一样。概言之,有两类界定词的目的:一类是实用取向的目的,如词典编纂、计算机自然语言处理、语言教学等;一类是理论取向的目的,如构词规律的挖掘、语法理论体系的建构等。在比较不同的鉴定标准时,需要考虑标准所服务的目的。服务于完全不同目的的鉴定标准,有时可能不宜比较,更无所谓优劣。这一点在学术争鸣中很容易被忽略,所以首先将之指出来。本文界定词是出于纯理论的目的,即为了现代汉语语法体系的建立。本文提出的界定词的鉴定标准是服务于上述理论目的的。在这一背景下,下面讨论通行定义之外文献上经常采用的两个界定词的鉴定标准与本文所采用的鉴定标准之间的长短。 规则性(regularity)和能产性(productivity)是文献经常用来界定词以及区分词和词组的两个标准。这两个标准是紧密联系的,一般来说,规则的组合通常能产,能产的组合一般是规则的;而不规则的组合往往不能产,不能产的组合很有可能是不规则的。文献一般认为规则和能产的语言片段是词组,而不规则和不能产的语言片段是词。如何判定一个片段是否规则和能产呢?规则主要有两方面的体现:一是意义的组合性。规则的片段,其整体意义是部分意义之和,整体没有不能从部分意义推知的约定俗成的意义。另一方面的体现是组成部分的可替换性。规则片段内部的组成部分可以为同类的成员所替换。能产则一般是通过同类型片段的成员数量来界定的,一个具体的语言片段,如果有很多与之同类型的其他成员存在,则该片段所代表的组合是能产的。对规则性和能产性在现代汉语语法单位界定中的讨论与应用,可以参看陈保亚(1999、2005、2006)。 对很多语言片段的定性,如果以规则性和能产性为鉴定标准,会得出与本文观点不同的结论。如上文讨论的“生肉”,按照规则性和能产性会被判定为词组。从规则性的角度来看,首先,“生肉”的意义是“生”和“肉”意义的加合,整个片段没有不能从“生”和“肉”的意义推知的约定俗成的意义;其次,“生肉”的两个组成部分都可以被较多的同类成分所替换,如“生”可以被“熟、肥、瘦”等成分替换,而“肉”可以被“鱼、饭、米”等成分替换。替换后得到的片段,如“肥肉”和“生鱼”,都是与“生肉”同类型的片段。因为同类成员多,所以“生肉”这个组合的能产性高。既规则且能产,若以规则性和能产性为鉴定标准,则“生肉”是一个词组。这个结论被很多的语法著作所采纳,其背后的原因在于,这些著作或直接或隐含地采用了规则性和能产性作为鉴定的标准(当然还有基于插“的”扩展法的考量)。 本文将“生肉”界定为复合词而不是词组。不同的定性源于不同的鉴定标准。从规则性和能产性的角度来说,“生肉、生鱼、生饭”和“生姜、生水、生菜(一种蔬菜)”等不一样,前者是规则组合,因此是词组;后者是不规则组合,因此是词。但如果从句法完整性来看,两类片段的表现完全一样:两类片段生成后都具有完整性,其内部组成部分都不能进行句法操作,所以两类片段都是复合词。那么,到底该如何看待这种定性上的区别呢? 正如本节开头指出的,对于界定词的不同鉴定标准的比较,需要把界定词的目的考虑进来。如果是出于实用的目的,比如为了词典编纂,规则性和能产性应该作为主要的鉴定标准,完整性的考量应该在其次。原因在于:不规则的单位需要专门解释,而且只能一个个记忆,因此应该作为词条收入词典,这是编纂词典的目的所在。规则单位不需要专门进行解释,也无需一个个去记,所以无需收入词典。另外,能产性很强的片段收入词典是不现实的,因为词典的容量再大也是有限的,而非能产的单位则可以作为词条收入词典。因此从词典编纂这一实用目的出发,将规则性和能产性作为鉴定词典所收词条的首要标准,是完全有道理的。在上述目的和标准下,不把“生肉”作为词典里的词条,本文赞同这种处理。 但如果是出于纯理论的目的,即为了从理论上澄清词的性质与地位,以便于语法体系的构建,本文认为完整性的考量应该放在首位,规则性和能产性则不宜选作界定词以及区分词和词组的标准。原因在于规则组合与词组、不规则组合与词之间并无对应关系。跨语言来看,词组和句子可以是不规则组合,比如说“大水冲了龙王庙、癞蛤蟆想吃天鹅肉、拍马屁、敲竹杠、the shit hit the fan(大事不妙)、the cat is out of the bag(秘密穿帮)、kick the bucket(翘辫子)、beat a dead horse(徒劳无益)”等要么是句子,要么是词组,但它们都是不规则组合,因为这些片段都具有不能从部分意义推知的约定俗成的习语义。与此同时,跨语言来看,词可以是规则组合。比如英语的kindness这类由形容词加后缀-ness构成的抽象名词,片段整体的意义可以从部分意义推知,并且作为片段组成部分的形容词可以被同类的成员替换,因此这类名词是规则的组合。类似地,现代汉语的“推子、剪子、镊子、钳子、梳子、夹子”以及“吃头、喝头、看头、听头、写头”等两类名词因为具有意义上的组合性和成分的可替换性,因此也都是规则的组合。 至于能产性,跨语言来看,词并不一定没有词组能产。举例来说,朱德熙(1979)认为能进入“我送给他一本书”这类句式的动词“是一个不大的封闭类”。据朱先生自己统计,常见的只有54个,比如“送”。换句话说,这类结构的能产性其实并不是很高。与之相对,有些构词组合的能产性却极高。现代汉语的“类词缀”(参王洪君、富丽(2006)的定义和讨论)所构成的片段,如“现代化”,一般认为是词,这类词是极其能产的,而且还在不断产生新词,如“特朗普化”等。 综上所述,根据规则性和能产性来鉴定词,一方面会把句法表现一致的片段分为两类,比如将“生肉”定性为词组而将“生姜”定性为词,尽管两者从句法完整性来说表现一致。另一方面,会把句法表现很不一样的成分归到一起,比如把“生姜”和“拍马屁”都定性为词,但两者从句法完整性的角度来看表现迥异。“生姜”生成后具有句法完整性,而“拍马屁”不具有,因为其内部组成成分可以进行句法操作,比如“拍/他的马屁”。以完整性为鉴定标准,“生肉、生姜、剪子、吃头、现代化、kindness”等都是词,因为它们都具有句法完整性,尽管其中有些片段是规则组合而有些片段不是。“拍马屁、kick the bucket、送给他一本书”等都是词组,因为它们不具有句法完整性,尽管其中有些片段是规则组合而有些片段不是。这一结论不仅能反映这些片段在句法上的特性,也更加符合母语者的直觉。从理论研究的角度来说,采取完整性作为界定词的鉴定标准,似乎更优。9 五 结语 出于构建现代汉语语法体系的理论目的,本文采取动态词观,对现代汉语的词进行了一种重新界定。新的定义可以解决现有通行定义存在的诸多问题。尽管如此,因为新定义是一种新尝试,仍有很多问题需要探讨解决。希望本文的讨论有助于加深学界对现代汉语词这一级语法单位的认识,推动现代汉语语法体系的构建与完善。 参考文献 北京大学中文系现代汉语教研室编 (2004) 《现代汉语》,北京:商务印书馆。 陈保亚 (1999) 《20世纪中国语言学方法论》,济南:山东教育出版社。 陈保亚 (2005) 再论平行周遍原则和不规则字组的判定,《汉语学习》第1期。 陈保亚 (2006) 论平行周遍原则与规则语素组的判定,《中国语文》第2期。 程工 (2019) 句法构词理论中的语素和词,《语言学研究》第1期。 邓盾 (2018) 构词中的语段——以现代汉语后缀“-子”的构词为例,《外语教学与研究》第6期。 邓盾 (2020) 从分布式形态学看“炒饭”类名词性片段的性质与生成,《当代语言学》第3期。 胡裕树主编 (2011) 《现代汉语》(第7版),上海:上海教育出版社。 黄伯荣、廖序东主编 (2002) 《现代汉语》(第三版),北京:高等教育出版社。 陆俭明 (2003) 《现代汉语语法研究教程》,北京:北京大学出版社。 陆志韦等 (1957) 《汉语的构词法》,北京:科学出版社。 吕叔湘 (1979) 《汉语语法分析问题》,北京:商务印书馆。 邵敬敏主编 (2017) 《现代汉语通论》(第三版),上海:上海教育出版社。 王洪君 (1994) 从字和字组看词和短语,《中国语文》第2期。 王洪君、富丽 (2005) 试论现代汉语的类词缀,《语言科学》第5期。 邢福义主编 (2015) 《现代汉语》,北京:高等教育出版社。 赵元任 (1975) Rhythm and structure in Chinese word conceptions(汉语词的概念及其结构及节奏),王洪君译、叶蜚声校,收于《中国现代语言学的开拓和发展》,北京:清华大学出版社,1992年。 朱德熙 (1961) 说“的”,《中国语文》第12期。 朱德熙 (1966) 关于“说‘的’”,《中国语文》第1期。 朱德熙 (1979) 与动词“给”相关的句法问题,《方言》第1期。 朱德熙 (1982) 《语法讲义》,北京:商务印书馆。 朱德熙 (2010) 《语法分析讲稿》,北京:商务印书馆。 Di Sciullo,Anna & Edwin Williams (1987) On the definition of word.Cambridge:MIT Press. 注释 1这种书写的现实情况是语言自身特点的反映,语言自身的标示使得相应的书写成为可能。类似地,英语的书写系统把word这级单位离析出来,书写时word和word相互分开,而morpheme这级单位却没有在书写上被离析出来,这也是由英语语言自身的特点决定的,相关讨论参看王洪君(1994)。 2感谢一位匿名评审专家告知作者:最早提出并全面论证词在现代汉语中不是天然语言单位的是赵元任(1975)。需要指出的是:“学生、窗户、桌子”等一般被认为是词的片段有特定的重音模式,即前重后轻,但这并不表示现代汉语通过重音将词标示了出来。因为:首先,前重后轻这种重音模式并不是上述片段所独有的,“好了、买的、去吧”等一般被认为是词组的片段也是前重后轻。其次,前重后轻这种重音模式也不是普遍的,还有很多被认为是词的片段是前轻后重或前后等重的重音模式,如“老师、阿姨、窗帘、桌面”等。从事实的角度来说,现代汉语并没有某种特定的重音模式来标示词。 3注意:这个片段里哪些成分是词是需要分析的,不能先入为主地认定“他、爱惜、医院、钱财”都是词,然后再通过剩余法得出“很”和“的”是词的结论。分析之前,唯有片段本身和组成片段的语素是现成的,片段里哪些成分是词并不清楚,因此科学的做法是针对片段里的一个个现成的语素去运用定义进行判定,判定完之后再使用剩余法。吕叔湘(1979:15)已发现剩余法带来的问题,但并未提出解决办法。 4一位匿名评审人指出:扩展法并没有规定只能加“的”来进行扩展,“生的肉”扩展成“生的那块肉”是没有问题的,因此不能说“生的肉”不能扩展。这里的根本问题还是扩展法的界定。严格说来,“生的那块肉”是对“生的肉”里的“肉”进行扩展而得到的,因为“肉”是“生的肉”的组成部分,部分得到扩展,整个片段当然也得到了扩展,但这种扩展并不是直接针对“生的肉”这个整体进行的扩展。笔者所知的文献在使用扩展法时,都默认扩展是对整个片段的扩展而非只是针对片段内部组成部分的扩展,比如朱德熙(1982:34)给出的“生肉、大车、金表”的扩展式是“生的肉、大的车、金的表”而不是“生牛肉、大货车、金手表”,背后隐含的理由应该是只有前者才是对整个片段的扩展,而后者只是对片段内部一个组成部分的扩展。不管扩展的具体内涵和使用方法如何,“生肉”和“生的肉”之间没有派生关系是事实,因此本文这里的主要立论(即不能根据“生的肉”来判定“生肉”的性质)是没有问题的。 5不把词视为先于句子生成的现成的静态单位,而是从语言生成的动态视角来看待词,国外理论语言学界最近二十多年有不少人持这种观点。在国内学界,这种看法也早已有之。陆志韦等(1957:1)开门见山就指出:“构词研究的原始资料不是词,分析语言片段而发现其中有能‘自由活动的最小单元’,那才是词。已经发现了词,然后能说这句子,这大篇文章是由词组成的。”陆先生的意思很清楚:词并不是现成的语言单位,应该回归到话语片段中去分析和发现词。动态词观牵涉语法体系的建立以及语法体系内部各部门的任务分工等诸多重大的理论议题,篇幅关系,本文无法做深入论述。关于这一观点所涉及的理论背景及其在现代汉语构词研究中的运用,可以参看邓盾(2018、2020)及其所引文献。 6作者在西安外国语大学中文学院报告时,西北大学杨炎华老师提出了这一看法。作者表示感谢。 7语言事实比这里讨论的要复杂。“鲜肉”里的“鲜”在与“肉”组合之前不能与“很”组合:“*很鲜/肉”,但是却可以与“新”组合:“新鲜/肉”。类似地,“肉”在与“生”组合之前不能与“那块”组合:“*生/那块肉”,但是却可以与“牛”组合:“生/牛肉”。这里最关键的区别是选择来参与组合的成分的性质:“很”与“那块”都是功能性(functional)成分,而“新”和“牛”都是词汇性(lexical)成分。如果规定组合成分的性质,可以把两者区分开。篇幅关系,我们将另文讨论“新鲜肉、生牛肉”等全部由实语素复合而来的片段的生成。 8“仪仗队”当然也是生成的,其生成过程与此处讨论无关,忽略不论。如果取的组合成分是“零钱”,得到的“*携零钱”是不合法的,因为违背了“携”的搭配要求。“*携零钱”不合法的事实与“携”的身份判定没有因果关系。 9除了规则性和能产性,长度也是很多研究者或明或暗所采用的一条标准。一位匿名评审人指出:“按照作者的观点,‘大事’应该是词,因为具有完整性,这一点很有价值。不过‘重大事件’也具有完整性,因为不能说‘特别重大事件’,也不能说‘重大一个事件’,但‘重大事件’显然不是一个词。这个问题作者没有讨论。”评审人认为“重大事件”显然不是一个词,但没有给出理由。我们推测这一判断背后或许隐藏着长度上的考虑,即“2+2”的四音节片段,一般会认为是词组而不是词。本文贯彻自己提出的标准,一个片段只要具有句法完整性,哪怕再长,比如七音节的“布宜诺斯艾利斯”,也是词。因此,既然“重大事件”具有完整性,按照本文的鉴定标准,它就是词,具体来说是一个复合词,类似于英语的green house(温室)。在词的界定上,最重要的考量应该是界定的目的以及逻辑上的自洽。与界定目的不相关、会导致前后逻辑不一致的因素(比如长度的考量)不宜混杂进来,否则界定就丧失意义和科学性了。 (责任编辑:admin) |