二、语境语义与自然语言处理 自然语言处理的专家在不同程度上意识到“语境”的消歧作用,但往往还停留在短语、句子、篇章和文本的上下文的层次上。(22)目前缺乏的是对语用语境和社区语境在整体语言框架中作用的认识。下面我们试图说明什么是“语用语境”和“社区语境”。 如果我们播放一段录音,例如,公共汽车上的报站录音,这是一种“低科技”的应用;录音机谈不上有什么人工智能,自然也没有任何语法语义智能技术在里面。而且,它也没有“语境智能”,甚至可能在错误的地点放录音而造成报错站的结果。事实上,这个语境功能往往由人工完成,司机到了某地点即启动或停止录音。但是,该播放系统似乎也可以增加一点“高科技”,例如,通过GPS定位系统来决定何时何地启动录音的播报,以获得最佳的效果。这样一来,该机器是否就有了一点“语境智能”了呢?可以说是的。这就是对人类说话人的“语境意识”的一个模拟:正常的说话人总是要考虑说话的场合和时效。 语境不仅仅是言语活动的物理环境,更重要的是社会环境。语言学家海姆斯(23)分析了构成语境的要素,列出了环境和场合活动参与者目标和效果行动顺序方式和风格交际工具交际规范语体分类等8项内容。(24)例如上述的言语活动的场合就是“公车报站”,活动的参与者包括“报站者”和“乘客”,报站者的目标是及时准确地报出即将到站的站名,要达到的效果还包括乘客能听清楚和理解报站的话语;参与该活动的乘客的目标是听懂报站的站名,避免下错车并及时准备下车等等,参与活动的双方是具有合作性的目标;行动顺序是报站者需要间歇性地发出话语,根据时间地点选择何时发话,而乘客只是被动接受话语,没有主动言语行为;说话的方式和风格应该简单明确,适应其向公众提供信息的目标;所使用的工具,在过去售票员报站使用嗓音,劳动强度较大;现在的工具是录音和扩音设备;如上所述,报站是向全体乘客的广播,因此不能个人化,也不可能进行互动式交流,提供的是提示性的信息,没有详细的解释;这些恐怕都是公认的规范;语体的分类也很清楚,公告式通知性的语体决定其文本措辞,不带感情色彩。如果把所有这些内容都由一个会说话的机器人自己来选择决定,确实需要一些复杂的人工智能。 自然语言处理的科学研究就是要解决上述语言智能的问题。虽然录音机解决了现代社会生活中信息传递的一些问题,高智能化的语言机器必然大大提升人类生活的品质。如上所述,如果报站装置能够全自动化,甚至提供个性化、互动式的服务岂不更好?现在的报站是面对所有乘客,不管他们是否需要报站。如果乘客有需求才报站,对于不需要报站信息的乘客是否就可以减少一些干扰的效果。如果可以由乘客自由启动和关闭报站系统,似乎可以做到这一点。许多公交车装有要求停站的按钮,是否也可以增加一个要求报站的类似装置?是否也可以语音启动呢,就像问售票员或司机一个问题一样?机器就需要有语音识别和理解问题的功能。话语理解目前还是一个人工智能难题,可能还不能提供。但是,如果语境明确,机器只需要识别出是要求报站的话语,就可以回答了。如果乘客问当地房价如何,报站机器人回答“听不懂”是最合适的回答。目前具有互动功能的会话机器人有足够的智能可以在几个话轮之内澄清乘客的问题,因为与该语境有关的话语和词汇都是比较有限的。 我们可以为人造语言机器设立超越人类语言能力的功能标准,但是首先需要的是达到或接近人类语言能力的标准。因此,一些人类语言处理能力的局限性可以成为机器处理模型的重要参考。以乘客询问到站信息为例,一位乘客可以有千变万化的组词造句方式来问下一站到站的站名,但是,我们实际到公交车上去观察,却会发现多数情况是几种常见问话方式。甚至,听到一句不同寻常的问话,经多见广的司机也不一定就能马上理解。 上述例子说明,人类语言的开放性是受到言语互动的社会规范性制约的。在研发应用性的自然语言处理设施时,我们需要有足够的语言规范意识,特别是语境语言规范。语境规范可以消除语音词汇语法等多个层次上的歧义。所以,与掌握社区交际规范的会话人会话,会话机器人需要掌握的话语模式是比较有限的。在高度城市化的社区内的柜台服务,大量的言语互动可以有效地启用机器,人工服务可以聚焦到固定程序之外和超越言语规范的特殊情况,由此可以大大提高劳动生产率。 (责任编辑:admin) |