如何使计算机高效识别、处理日常生活中的自然语言,正成为众多学科联合攻关的热门研究领域,涉及的学科包括逻辑学、语言学、计算机科学等。基于各种自然语言的计算机处理系统、语言翻译软件等相继问世,但仍未有一项成果能够完全“打通”自然语言与计算机信息处理两种差异性机制。 攻克技术难题离不开基础理论的支撑,逻辑语义学研究便是近年来面向自然语言信息处理的基础理论先导工作。 语言信息处理的“天生同盟军” 自然语言伴随人类文化的演化而产生、发展、演变。自然语言信息处理研究的目的是实现人与计算机的有效通信。20世纪中叶以来的每一次计算技术变革尤其是当今大数据、云计算技术和社会化网络模式,给自然语言信息处理带来了新的发展契机和探索空间。 杭州师范大学教授冯志伟介绍说,自然语言信息处理研究一般有三个过程:第一,把需要研究的问题在语言学上加以形式化,使之能以一定的数学形式严密而规整地表示出来;第二,把这种数学形式表示为算法,使之在计算上形式化;第三,根据算法编写计算机程序,建立自然语言处理系统。 正如当代语言学家王士元所指出,“现代逻辑学和计算机科学有共同的宗旨:扩展人类大脑功能,帮助人脑正确、高效地思维。它们是天生的同盟军,分别作战在基础理论和实用技术两条战线上。”中国社会科学院哲学研究所逻辑学研究室主任邹崇理认为,逻辑作为人类知识结构的基础在自然语言信息处理领域内发挥着巨大作用。逻辑语义学以自然语言的意义为研究对象,以逻辑为研究方法刻画自然语言结构,其研究结果是计算机自然语言信息处理的理论基础。 20世纪90年代以来,欧美国家先后成立了以自然语言信息处理为导向的逻辑研究机构,如荷兰阿姆斯特丹大学的逻辑、语言和计算研究所。该所创立了《逻辑、语言和信息》期刊,并以此为基础每年举办“逻辑、语言和信息”暑期学院。 这种横跨逻辑学、语言学和计算机科学的交叉研究在近十多年来发展迅猛。中国社会科学院哲学研究所、中山大学逻辑与认知研究所等机构已有一批初步研究成果。邹崇理认为,从逻辑语义学角度对自然语言尤其是对汉语进行形式化研究,能够拓宽我国计算机自然语言处理思路,提高处理效率。 (责任编辑:admin) |