机译代人工译,真者可乎?
http://www.newdu.com 2024/11/24 05:11:09 《重庆晚报》 李梦真 参加讨论
机器翻译代替人工翻译,真的可能吗?这句话,近日爆红网络的百度文言文翻译器将它翻译成了我们今天的标题。 6月6日,新浪博友@独角兽少女发表一条名为“百度翻译可以翻译文言文了!”的帖子,短短几日,就吸引近10万网友参与转发评论。网友“芙蓉锦”认为,翻译仅仅流于表面,不够地道,很多关键字词韵味不够,读起来也不够顺畅。网友“笔记本”等则表示,其中不少词语翻译得挺到位,借它提升下格调绰绰有余了。 昨日,记者也点击进入百度翻译器,一探究竟。记者分别输入了《岳阳楼记》和《围城》中的一段话。 文言译白话 《岳阳楼记》原文:庆历四年春,滕子京谪守巴陵郡。越明年,政通人和,百废俱兴。乃重修岳阳楼,增其旧制,刻唐贤今人赋于其上。属予作文以记之。 百度翻译:庆历四年的春天,滕子京谪守巴陵郡。到了第二年,政事顺利,百姓和乐,百废俱兴。于是重新修建岳阳楼,扩展它旧有的规模,刻唐贤今人写在上面。属我写一篇文章来写的。 老师点评:重庆市育才中学高中部语文老师王振顺说,方向性的内容翻译得还是比较到位,但一些关键以及难字把握不够。 “比如‘谪’,译文原封不动保留,但这个字放在高中语文考试中就是重要得分点,意为降职。又比如‘刻唐贤今人赋于其上’,‘赋’被直接漏掉了。再比如‘属’,是一个通假字,也是一个关键字,意为嘱托,同样也没有体现出来。”王振顺说,假如这是一道10分的考题,百度翻译能得6或7分。 开发团队 机器翻译模型+海量数据 昨日,百度翻译团队相关负责人向记者透露,这个定位的初衷就是从两个方面考虑—学习和娱乐。 知情人士透露,该团队收集了大量文笔优美的古文进行机器训练学习,完成韵律模型。整个翻译原理就是结合收集的海量数据和机器翻译模型,在保证翻译结果基本正确的情况下,综合考虑古诗文的韵律、乐感、平仄声交错等规则,得出最后的翻译结果。团队还专门招聘了古代汉语文学专业的学生进行质量评估,对翻译提供建议和意见,帮助机器翻译优化。 白话译文言 《围城》原文:人生据说是一部大书。假使人生真是这样,那么,我们一大半作者只能算是书评家,具有书评家的本领,无须看得几页书,议论早已发了一大堆,书评一篇写完交卷。 百度翻译:人言是一部大书。使人信然,然则,我一半人家乃书评,有书评家之术,不须看的数页书,议早发一百,书评一篇写纳卷。 老师点评:王振顺表示,译文古今夹杂,不少语言不通顺,也不符合古文的常识。“比如人言是一部大书,‘是’明显是现代白话的表达方式。” 对于这个翻译器,王振顺认为,文言文的虚词和句法都有严格规范。想要真正学习文言文,还是进行系统规范的方式更科学。 王振顺试翻:人生乃一大书也。若其果如斯,则吾属多止为书评者。其具书评之能,阅书徒数页而发论多矣。是时,一书评亦毕矣。 机译代人译 啥时能实现? 美国发明家、未来学家雷·科兹威尔(Ray Kurzweil)接受《赫芬顿邮报》采访时曾预言,到2029年机译质量将达到人工翻译的水准,情况真的如此乐观吗? 1949年美国数学家沃伦·韦弗正式提出了机器翻译的思想。韦弗将机器翻译定义为一种加密解密的过程,也就是说他将俄文材料视为密码,希望通过一定的技术手段将其转化为英文。 20世纪70年代末至80年代末,靠专家们写下一条条翻译规则,计算机“唯命是听”的方法逐渐成熟。这种基于规则的翻译法,就像刚学话的小孩一样,教一句就会一句,不教就不会。 20世纪90年代,能够依靠大量语料自主“学习”的机器翻译技术迅速发展,风头逐渐超越之前的技术。这种基于语料库的翻译法,会从语料库中寻找相似的句子,并对源句进行适当改动,得出翻译结果。 如今,更加高级的基于语料库的方法,是利用机器学习和数学建模技术来实现自动翻译系统构建,常称为统计机器翻译。这是如今比较主流的机器翻译方法,谷歌、百度等都是使用这种方法。 (责任编辑:admin) |
- 上一篇:高校求变不能止于“卖萌”
- 下一篇:“标题党”恶意制造坑人噱头有点损