语言文学网-学术论文、书评、读后感、读书笔记、读书名言、读书文摘!

语文网-语言文学网-读书-中国古典文学、文学评论、书评、读后感、世界名著、读书笔记、名言、文摘-新都网

当前位置: 首页 > 学术理论 > 语言学 > 语言应用 >

军事英汉汉英平行语料库建设存在的问题及对策(3)

http://www.newdu.com 2017-11-16 《解放军外国语学院学报 王岚 严灿勋 参加讨论

    根据目前全自动机器翻译的技术现状来看,翻译质量好的机器翻译系统一般是多引擎系统,即基于规则、基于统计和基于实例的3种翻译引擎协同工作。要提高全自动翻译引擎的翻译质量,基于规则的机器翻译现在更加注重前期借助句子级和更细颗粒度的双语对齐平行语料库自动获取翻译规则,基于统计的机器翻译必须利用大规模的句子级和更细颗粒度的双语对齐平行语料库训练翻译模型,基于实例的机器翻译必须在大规模的至少是句子级对齐的双语平行语料库基础上计算句子相似度,寻找最匹配的句子和译文。因此,一套实用的翻译系统必须利用双语句子对齐平行语料库。2012年第八届全国机器翻译研讨会上,有研究者指出,对于一个专业领域的全自动机器翻译,三四百万以上的句对可以满足基本需求,句对数据质量越高,翻译性能才能越好,不能指望仅靠数量来提高翻译质量;对于新词问题,还要不断获取新的训练数据,对有用的新词数据进行自动挖掘,必要时人工提取。(杜金华等2013:7)根据紫冬口译软件框架流程来看,语音翻译系统除了自动语音识别器和语音合成器之外,其核心依然是全自动机器翻译技术。另外,紫冬口译软件目前的首要问题就是双语口语平行语料匮乏问题,虽然可以从网络获取大规模数据,但存在数据领域适应问题。(杜金华等2013:4)由此可以推断,美军的一系列情报提取系统、全自动机器翻译系统和语音通信翻译系统实现的前提条件是具备大规模的双语平行语料库,其中不乏军事领域的双语平行语料,否则,系统就不可能满足实用要求,不可能达到预定的性能指标。 
    1.2国内军事双语平行语料库发展现状 
    国内军事双语平行语料库建设严重不足。就军事英汉汉英平行语料库而言,目前国内公开的相关报道仅有麻丽莉(2009:24)为研究平行语料库在军事翻译教学中的应用而建设的40万词的小型军事科技句子对齐平行语料库,杨阳(2011:32)为进行基于语料库的军事装备术语的翻译研究而自建的一个大约2万句的军事装备句子对齐平行语料库。其他军事双语平行语料库建设方面,崔卫、张岚(2014:84-85)在其俄汉翻译语料库下建设了军事外宣汉俄翻译子库,规模为俄文约16.8万词、中文约28.3万字。多家使用机器辅助翻译系统的单位在从事军事资料翻译时发现,他们最缺的就是相关领域的双语句子对齐平行语料库。 
    2.我军军事英汉汉英平行语料库建设存在的问题 
    2.1缺乏紧迫的需求牵引 
    美军军事平行语料库的建设发展与其紧迫的需求密不可分。美军全球范围的情报搜集、伊拉克战争和阿富汗战争等非英语环境下的军事行动、多国联合军演等都需要利用高科技辅助满足其语言活动需求。与美军相比,我军对高科技辅助下的语言活动需求并不紧迫,有翻译需求时,更倾向于用人力完成。因此,像军事英汉汉英平行语料库这样的基础建设在我军没有得到应有的重视,发展速度缓慢。 
    2.2各军事子领域英汉汉英平行语料相对匮乏 
    几乎所有语料库的应用,都会考虑语料的领域问题,尤其在机辅翻译和全自动机器翻译中,语料领域对翻译的效率和结果影响非常明显。军事领域涉及面广,包含众多子领域,而且,在绝大多数军事子领域,很难从公开渠道获得相关的英汉对译文本。我军有些单位或多或少地做一些军事英汉汉英翻译工作,但是这些力量没有得到整合。有些单位虽然翻译了一定数量的军事英语、军事汉语资料,但是由于多种原因,有的翻译资料没有完整保留下来。  (责任编辑:admin)
织梦二维码生成器
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
评论
批评
访谈
名家与书
读书指南
文艺
文坛轶事
文化万象
学术理论