语言文学网-学术论文、书评、读后感、读书笔记、读书名言、读书文摘!

语文网-语言文学网-读书-中国古典文学、文学评论、书评、读后感、世界名著、读书笔记、名言、文摘-新都网

当前位置: 首页 > 学术理论 > 语言学 > 词汇学 >

九十年代汉语词汇地域分布的定量研究(3)

http://www.newdu.com 2018-05-30 华语桥 汤志祥 参加讨论

    2.2 “双区域通用词语”举例
    “双区词语”又分作三部分:(1)京、台通用词语,(2)台、港通用词语,(3)京、港通用词语。这类词语主要是双音节词和三音节词。它们出现的序号一般都比较靠后。现将各自的四十个例词分别例举如下[13]:
    2.2.1  京、台通用词语
    (1)    单双音节词(按频率递降序,序号从3757号到6685号)
    栋、  坑、县府、额度、违章、组建、摊贩、编列、违规、片子、酱油、缓解、民营、交割、路子、公交、搭配、评比、管线、告发;
    (2)    三音节词语(按频率递降序,序号从4258号到12939号)
    废弃物、被害人、乡公所、复印机、企事业、电信局、大奖赛、全方位、侦查员、海洛因、合作社、交换机、学杂费、冰淇淋、社会化、政策性、阶段性、根据地、管委会、认购证;
    2.2.2        台、港通用词语
    (1)    双音节词(按频率递降序,序号从2863号到6629号)
    民运、飞弹、疲弱、片商、私校、录影、同业、权证、预估、私家、社工、籍着、相较、房车、核武、知会、影带、厘定、国父、执业;
    (2) 三音节词语(按频率递降序,序号从5348号到13038号)
    嘉年华、高峰会、影印机、偷渡客、六合彩、年增率、精神科、大陆客、停车位、荷尔蒙、公民权、争议性、水族馆、剧情片、生育率、民营化、同意权、移民潮、海洛英、伴唱带;
    2.2.3        京、港通用词语[14]
    (1)双音节词(按频率递降序,序号从1104号到10080号)
    靓、  碟、今次、通胀、船民、展销、楼宇、的士、物业、软件、录像、弱智、汇报、首期、型号、客商、车匪、打印、拚搏、街坊;
    (2)三音节词语(按频率递降序,序号从4799号到18802号)
    录像带、录像机、游戏机、大耳窿、公积金、打印机、商品房、紧迫感、大排档、直通车、赞助商、国庆节、咨委会、再生产、朱古力、外省市、一次过、集团化、发行师、回乡证;
    2.3  “单区域独用词语”举例
    “单区词语”又分作三部分:(1)大陆独用词语,(2)台湾独用词语,(3)香港独用词语。一般也是双音节词和三音节词。它们出现的序号一般都很后。现将各自的四十个例词分别例举如下:
    2.3.1  大陆独用词语
    (1)        双音节词(按频率递降序,序号从3745号到10585号)
    案犯、团伙、民警、房改、荧屏、粮店、房管、面料、解困、民办、公房、评委、十佳、剧组、老伴、老区、信访、上岗、三产、动迁;
    (2)        三音节词(按频率递降序,序号从6418号到14479号)
    居委会、供销所、文化站、监督局、粮食局、离退休、粮管所、群众性、小商品、面包车、煤气灶、特困户、人贩子、节假日、小公共、文化馆、豆制品、自觉性、影剧院、指战员;
    2.3.2  台湾独用词语
    (1)  双音节词(按频率递降序,序号从2002号到7967号)
    国中、国小、安打、职棒、联考、行库、国代、课征、窃盗、国协、软体、上档、电玩、港剧、列管、宣导、费率、查报、税捐、房贷;
    (3)        三音节词(按频率递降序,序号从6911号到13120号)
    选委会、证交税、公权力、国中生、立法院、歌仔戏、交流道、零组件、公交法、自营商、公私立、原住民、督察室、幻像机、原委会、双年展、电影处、防火巷、印表机、参与率;
    2.3.3   香港独用词语
    (1)  双音节词(按频率递降序,序号从4063号到8555号)
    按揭、视乎、公屋、求证、轻铁、中六、经已、若然、规例、楼盘、加幅、押后、羁留、发牌、失车、沽盘、收生、楼市、学额、美仙;
    (2)  三音节词(按频率递降序,序号从5741号到12201号)
    大律师、开幕礼、入境处、保护令、消防处、临屋区、发展商、颁奖礼、电话卡、平方口尺、蓝筹股、回报率、区局节、律师行、音统处、护卫员、反黑组、民主派、评议会、赔偿额。
    3.  当代汉语三个区域词汇共时分布的数量和比例
    3.1   不考虑词频的纯语料库数量统计和“人工干预”[15] 统计如果不考虑词频,仅仅根据《汉库》纯语料库语料的统计,我们可以得出一个“语库统计”的数量和比例。如果再经过“人工干预” 后的“定性”再“定量”的计算,可以得出一个“人工干预”后的统计结果。
    “共用词语”词条与总词语词条的数量及比例的结果分别如下:
    《汉库》中总词语词条与“共用词语”词条的数量及比例
    “双区词语”的“纯语料库统计” 以及“人工干预”后的数量和比例,分别如下:
    《汉库》中总词语词条与“双区词语”词条的数量及比例
    “单区词语” 的“纯语料库统计”以及“人工干预”后的数量和比例,分别如下:
    《汉库》中总词语词条与“单区词语”词条的数量及比例


    很明显,以上统计很清晰地反映了一个强烈的反差:根据纯语料库语料统计,三地“单区词语”占的比重超过一半( 53.55 % ),“共用词语” 次之( 27.53%),而“双区词语”最少( 18.92 % )。三者相对比例约为: 5 : 3 : 2。
    但是经过“人工干预”的“定性”结果,则极不相同。“单区词语”只有6.70 % ,“双区词语” 只有2.17 %,绝大多数是“共用词语” ,占了91.12 % 。这个对比充分说明了两点:
    (1)《汉库》的语料量对正确显示三个地区的词语的“共同底层词汇量”及其相互之间的“差异量” 还显得不够,因此偏差还比较大[16]。
    (2)光看词语数词的绝对数量,还不能揭示汉语词汇的真实共时状况。“词频” 、“累计词频” 、“地区分布比”和“地区词频”是考察词语分布状况的重要参量。 (责任编辑:admin)
织梦二维码生成器
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
评论
批评
访谈
名家与书
读书指南
文艺
文坛轶事
文化万象
学术理论