九十年代汉语词汇地域分布的定量研究(3)
http://www.newdu.com 2024/11/27 12:11:58 华语桥 汤志祥 参加讨论
2.2 “双区域通用词语”举例 “双区词语”又分作三部分:(1)京、台通用词语,(2)台、港通用词语,(3)京、港通用词语。这类词语主要是双音节词和三音节词。它们出现的序号一般都比较靠后。现将各自的四十个例词分别例举如下[13]: 2.2.1 京、台通用词语 (1) 单双音节词(按频率递降序,序号从3757号到6685号) 栋、 坑、县府、额度、违章、组建、摊贩、编列、违规、片子、酱油、缓解、民营、交割、路子、公交、搭配、评比、管线、告发; (2) 三音节词语(按频率递降序,序号从4258号到12939号) 废弃物、被害人、乡公所、复印机、企事业、电信局、大奖赛、全方位、侦查员、海洛因、合作社、交换机、学杂费、冰淇淋、社会化、政策性、阶段性、根据地、管委会、认购证; 2.2.2 台、港通用词语 (1) 双音节词(按频率递降序,序号从2863号到6629号) 民运、飞弹、疲弱、片商、私校、录影、同业、权证、预估、私家、社工、籍着、相较、房车、核武、知会、影带、厘定、国父、执业; (2) 三音节词语(按频率递降序,序号从5348号到13038号) 嘉年华、高峰会、影印机、偷渡客、六合彩、年增率、精神科、大陆客、停车位、荷尔蒙、公民权、争议性、水族馆、剧情片、生育率、民营化、同意权、移民潮、海洛英、伴唱带; 2.2.3 京、港通用词语[14] (1)双音节词(按频率递降序,序号从1104号到10080号) 靓、 碟、今次、通胀、船民、展销、楼宇、的士、物业、软件、录像、弱智、汇报、首期、型号、客商、车匪、打印、拚搏、街坊; (2)三音节词语(按频率递降序,序号从4799号到18802号) 录像带、录像机、游戏机、大耳窿、公积金、打印机、商品房、紧迫感、大排档、直通车、赞助商、国庆节、咨委会、再生产、朱古力、外省市、一次过、集团化、发行师、回乡证; 2.3 “单区域独用词语”举例 “单区词语”又分作三部分:(1)大陆独用词语,(2)台湾独用词语,(3)香港独用词语。一般也是双音节词和三音节词。它们出现的序号一般都很后。现将各自的四十个例词分别例举如下: 2.3.1 大陆独用词语 (1) 双音节词(按频率递降序,序号从3745号到10585号) 案犯、团伙、民警、房改、荧屏、粮店、房管、面料、解困、民办、公房、评委、十佳、剧组、老伴、老区、信访、上岗、三产、动迁; (2) 三音节词(按频率递降序,序号从6418号到14479号) 居委会、供销所、文化站、监督局、粮食局、离退休、粮管所、群众性、小商品、面包车、煤气灶、特困户、人贩子、节假日、小公共、文化馆、豆制品、自觉性、影剧院、指战员; 2.3.2 台湾独用词语 (1) 双音节词(按频率递降序,序号从2002号到7967号) 国中、国小、安打、职棒、联考、行库、国代、课征、窃盗、国协、软体、上档、电玩、港剧、列管、宣导、费率、查报、税捐、房贷; (3) 三音节词(按频率递降序,序号从6911号到13120号) 选委会、证交税、公权力、国中生、立法院、歌仔戏、交流道、零组件、公交法、自营商、公私立、原住民、督察室、幻像机、原委会、双年展、电影处、防火巷、印表机、参与率; 2.3.3 香港独用词语 (1) 双音节词(按频率递降序,序号从4063号到8555号) 按揭、视乎、公屋、求证、轻铁、中六、经已、若然、规例、楼盘、加幅、押后、羁留、发牌、失车、沽盘、收生、楼市、学额、美仙; (2) 三音节词(按频率递降序,序号从5741号到12201号) 大律师、开幕礼、入境处、保护令、消防处、临屋区、发展商、颁奖礼、电话卡、平方口尺、蓝筹股、回报率、区局节、律师行、音统处、护卫员、反黑组、民主派、评议会、赔偿额。 3. 当代汉语三个区域词汇共时分布的数量和比例 3.1 不考虑词频的纯语料库数量统计和“人工干预”[15] 统计如果不考虑词频,仅仅根据《汉库》纯语料库语料的统计,我们可以得出一个“语库统计”的数量和比例。如果再经过“人工干预” 后的“定性”再“定量”的计算,可以得出一个“人工干预”后的统计结果。 “共用词语”词条与总词语词条的数量及比例的结果分别如下: 《汉库》中总词语词条与“共用词语”词条的数量及比例 《汉库》中总词语词条与“双区词语”词条的数量及比例 《汉库》中总词语词条与“单区词语”词条的数量及比例 但是经过“人工干预”的“定性”结果,则极不相同。“单区词语”只有6.70 % ,“双区词语” 只有2.17 %,绝大多数是“共用词语” ,占了91.12 % 。这个对比充分说明了两点: (1)《汉库》的语料量对正确显示三个地区的词语的“共同底层词汇量”及其相互之间的“差异量” 还显得不够,因此偏差还比较大[16]。 (2)光看词语数词的绝对数量,还不能揭示汉语词汇的真实共时状况。“词频” 、“累计词频” 、“地区分布比”和“地区词频”是考察词语分布状况的重要参量。 (责任编辑:admin) |