语文网-语言文学网-读书-中国古典文学、文学评论、书评、读后感、世界名著、读书笔记、名言、文摘-新都网移动版

首页 > 学术理论 > 语言学 > 词典学 >

元语言研究的三种理解及释义型元语言研究评述(4)


    《朗曼》2000释词具有以下特点:
    首先是通用性词语。《朗曼》释义词基本都在《朗文》所收的17000条词语的范围内,而后者正是供语言初学者使用的词典,它针对语言学习者而精选词语的做法是得到学术界公认的。定义语言的通用性,与学习词典的词语通用性,在这里正好发生了很贴切的自然吻合。
    其次是分布面广。《朗文》所收词语对整个英语词汇来说虽然不很充分,但在某种程度上来说却是完整的。因为要全面达到英语学习与使用的交际水平,它就必须要照顾到语言表达与实际使用的各种需要。因此,所挑选出来的词语必须是全面的。而且《朗文》的分类正是体现出了一种语言的词汇整体使用功能的特点。以“人类的社会生活为中心,围绕着社会中的人”,这正是人类社会,也就是语言社会的生成与分布的最大特点。《朗曼》的定义语言正好均匀地分布在语言社会的各个方面。
    再次是常用性词语。《朗曼》定义语言的另一个特点就是常用性,必须通俗、易懂才能更好地完成对其它语言的说明与定义任务。在《朗文》中,同一小类的词语排列在前的词语大都就是常用词。如A20“动物的幼仔”收了“young、offspring、progeny、issue、litter”,《朗曼》释义词young位于其首。A54“狗与同类动物”收了“dog、puppy、hound、sheepdog、mongrel、cur、bitch”,《朗曼》释义词dog位于其首。
    最后是充分利用了英语词汇以派生构词法为主,构词能力强的优势,收录了数十个常用的构词缀,这样可以在有限的释词范围内较灵活地搭配重组,再造出新的适用词语来。但这种做法可能是太看重“2000”数字的封顶而不愿突破。把一些比词低一级的构词单位放到释义词语中,可视作是一种变通的做法。既做到了释义词语的“有限性”,又不妨碍它的扩张性与组合能力。
    长期以来,《朗曼》的有限释词的做法一直得到人们的赞同,2000释义词也保持着相当的稳定性,与它以上的这些特点是分不开的。《朗曼》释义词语的选用很大程度借鉴了威斯特的词频统计结果,而威斯特的选词主要依靠的是长期的英语教学经验。结果证实,好的释义元语言一定要有很充实的语言使用经验作基础,也就是说要以“实用”为第一测量标准,而这正是语言最本质的特点——交际功能的实现。
    四.张津、黄昌宁对汉语定义原语的提取
    清华大学计算机系智能技术与系统国家重点实验室的张津、黄昌宁二先生1996年提出了国家自然科学基金重点项目研究报告:《从单语词典中获取定义原语方法的研究及现代汉语定义原语的获取》,这是汉语学界第一份关于汉语释义元语言研究的报告。他们的做法是以有完整释义的汉语词典为封闭材料,通过数学模式来计算释义词与被释词之间的语义关系,从而得出最低数的释义词语,形成了含3857条词的释义元语言集。他们的工作是这样的:
    1.对象语料
    使用的是《现代汉语词典》中所有复音词目的定义与《现代汉语通用字典》中所有单字词的定义。[28]其所收录词语及义项容量如下:
    2.理论与方法
    使用的数学理论和模型是“图论”。
    根据这种形式化描述我们可以把词典转化成一种用有向图表示的方法,并为从词典中获取原语的问题建立一个数学模型,将这个问题转化为一个图论的问题。[29]
    图论是有着广泛应用领域的数学理论。它把研究对象都看作是一个有“顶点”和连接顶点的“边线”组成的“图”。图论就是研究这样的“顶点”与“边线”构成的“图”的科学,其实也就是研究“顶点”与“边线”的关系。“图”用G表示,V表示“顶点”,E表示“边线”,图论最简单的公式就是“G=[V,E]”。与V关联的边的条数叫做“顶点V的次数”。由于图中每条边都有两个不同的顶点,在计算次数时,每记一条边同时都要相应地记其端点两次(两个顶点)。“图论为任何一个包含了一种二元关系的系统提出了一个数学模型。”[30]
    图论在它的理论论述中有这样两点尤为值得我们注意:1.“一个‘图’中各顶点之间相互位置的摆法一般来说对我们并不重要,我们关心于一个‘图’的只是它具有哪些顶点;其次,图中所划出的各条边的长短、曲直我们也不予关心,我们关心的只是哪一个顶点与哪一个顶点之间有或者没有边相连。”2.“图论中不允许出现没有端点或只有一个端点的边。这是因为……一个图中的顶点可以代表各种事物,而边则代表事物之间的某种特定的关系,因而可以想像,不可能出现没有事物的‘关系’,也不可能只有一个事物而没有其对立面的‘关系’。”[31] (责任编辑:admin)