李生:机器翻译界的“愚公”(3)
http://www.newdu.com 2024/11/25 12:11:58 中国科学报 胡珉琦 参加讨论
充满挑战的机器翻译 近年来,随着网络和国际化对翻译需求的增大,以及翻译软件商业化日趋逼近,机器翻译研究也进入了一个新的时期。不过,李生坦言,与人工翻译相比,至今机器翻译译文质量就“忠实度”和“流利度”而言,都还很难达到理想的标准。这与计算机翻译的方法、策略有关。 最早的机器翻译主要是基于规则的翻译系统,它是由词典和规则库构成知识源。李生介绍说,要想翻译一个中文句子,计算机首先要学会分词,就是将一句话或短语切分成一个一个单独的词语,同时确定这些词语的词性和语法结构的组合,然后对照汉英字典词典,找出对应的英语单词,并根据英语结构规则生成最终的句子。 “问题在于,不同语系的语言,词序不一样,语法不一样,结构不一样,翻译容易引起歧义。”李生指出,比如在英文中,单词以空格分开,而中文词语却没有形式上的分界符,也没有形态变化,在语音层面,汉语中还存在大量同音字词,又包含复杂的声调系统和变音变调现象,在不同语义环境中,词汇的词义和词性都无法轻易确定,这给计算机理解和分析自然语言带来了很大的困难。另一方面,人的翻译靠知识和经验的积累,常识性的积累越多,翻译起来越容易,否则,就会影响翻译的效果。 尔后,随着计算机速度、存储容量的提升,基于语料库的翻译系统开始占据主流。这种方法以语料的应用为核心,由经过划分并具有标注的语料库构成知识库。最初,研究者希望借助最基础的中文和英文句式做替换练习,因此,它主要的知识源就是双语对照的实例库。不过,人们很快发现,由于该方法需要一个很大的语料库作为支撑,语言的实际需求量太过庞大。最终,国际上选择了基于统计的翻译系统作为最常用的方法之一。 事实上,这些方法都曾是李生在30多年间研究机器翻译的工具,更重要的是他为机器翻译在国内的发展作出了开拓性贡献。他所带领的团队所研制的汉英机器翻译系统CEMT-I于1989年成为我国第一个通过技术鉴定的汉英机器翻译系统。尔后,他主要在计算机对句法、语义分析等自然语言处理的策略方面进行了中国化的探索。 (责任编辑:admin) |
- 上一篇:用“积极向上”扫除网络语言尘埃
- 下一篇:网络语言别拿低俗当“个性”