语言文学网-学术论文、书评、读后感、读书笔记、读书名言、读书文摘!

语文网-语言文学网-读书-中国古典文学、文学评论、书评、读后感、世界名著、读书笔记、名言、文摘-新都网

2017年度语音学学科发展报告(上)

http://www.newdu.com 2018-09-10 中国社会科学网 语音室 参加讨论

    一、语音学发展前沿动态
    近年来,人工智能和脑计划在国际和国内范围持续升温,未来中国的“一体两翼”脑计划也将涉及“大脑本体的认知机制”“面向脑病的研究”和“面向人工智能的类脑计算”等内容。其中,言语作为人类认知智能的重要组成部分以及人机交互最自然的方式,无疑将在国家的重点发展战略中面临重大的机遇和挑战。而语音与言语科学研究也进入了一个新时代,呈现出多学科交叉融合的特点,逐渐与认知科学、神经科学、生物科学、计算机深度学习等领域深度结合,通过对相关理论开展证实或证伪研究,产生了一些新的研究领域。正如王士元先生所说,“如果我们的目的是要真正理解语言是什么,那么我们就不能把自己的视野限制得太狭窄,就不能因已有的学科界限而墨守成规。不同学科之间的边界犹如划在沙滩上的线条,随着每一次先进知识的波涛到来,这边界就会发生变化,甚至完全消失。人类的知识,特别是研究语言的知识,应该彼此相连,并且最终是相互贯通的。”(《语言、演化与大脑》,2011 年,商务印书馆)2017年国际和国内范围的语音学研究除了延续语音学研究的传统领域外,还在学科交叉的新领域中有所深化,本综述将主要从发音生理研究、言语产出研究、言语感知与认知机理研究、语篇-韵律接口研究以及语音发展研究这六个方向,对2017年国内外的语音学研究进行一次梳理。
    1.1 发音生理研究
    发音生理建模
    在2017年国际言语处理顶级会议Interspeech中,多篇论文运用统计学习和深度神经网络对发音器官轮廓的自动提取技术做了探索性研究。比如,Somandepalli 等在 Semantic Edge Detection for Tracking Vocal Tract Air-Tissue Boundaries in Real-Time Magnetic Resonance Images 一文中提出了基于卷积神经网络的编-解码结构,对大规模实时MRI图像中的发音器官轮廓进行标注的方法。而在文章Vocal Tract Airway Tissue Boundary Tracking for rtMRI using Shape and Appearance Priors中,Asadiabad 等则提出通过建立发音器官轮廓和纹理统计特性的统计分析模型,并利用训练得到的统计模型对MRI中的发音器官进行分割的方法。然而,这两种方法均需要对发音器官的轮廓进行大量的人工标注,然后基于标注的轮廓训练统计模型,来对MRI图像中的发音器官进行分割。而如何利用图像自身的灰度信息和发音器官轮廓的先验信息直接从图像中抽取出发音器官的轮廓还是一个很有挑战性的问题。此外,姚云等的《矢量半径驱动的汉语普通话立体声道模型》(《清华大学学报(自然科学版)》第57卷第9期)从MRI3-D图像数据中提取了汉语普通话7个单元音的声道边缘、中线和矢量半径数据,并建立了用矢量半径驱动的汉语普通话立体声道模型。
    利用口鼻气流计的鼻化度研究
    2017年的《中国语音学报》集中刊登了一系列利用口鼻气流计技术的鼻化度研究。比如谭力超等的《北京话双音节中鼻音韵尾鼻化度的大样本统计分》(第7辑)、王静和时秀娟的《北京话句子中语速对鼻化度的影响》(第7辑)、王李和时秀娟的《广州普通话陈述句语调停延率的大样本分析》(第7辑)、黄小干等的《Daniel-IPA元音系统唇形参数数学模型的探讨及其在汉语韵母系统定量与动态分析中的应用》(第7辑),以及张婧祎和时秀娟的《北京话CVN音节鼻尾鼻化度的统计》(第8辑)。
    病理语音发音研究
    在病理语音发音方面,原梦和王洪翠等发表了《构音障碍话者与正常话者发音的比较分析》(《中国语音学报》第7辑)。文章利用电磁发音仪采集了正常话者和脑瘫引起的构音障碍话者的发音数据,从声学分析和发音运动分析两方面对比了构音障碍话者和正常话者的发音特点。实验结果表明使用隐马尔可夫模型的方法可以有效区分正常话者和构音障碍话者;两者在发音运动方面也有显著差异,比如,构音障碍话者的舌头位置状态不稳定,呈现多种类型,在发不同音素时,发音运动形状和轮廓也很难区别等。
    1.2 言语产出研究
    2017年的言语产出国际会议ISSP发表了多篇关于言语产出的研究。比如,Hool等用调节听觉反馈的方法考察被试对言语中时间结构扰动的敏感度,发现被试对音节起始位置的扰动比对音节结尾位置的时长扰动更敏感 ( Probing the Representation of Temporal Structure in Speech Using Auditory Feedback Manipulation )。 Trudeau-Fisette 等考察了先天失明的人与正常人在听觉反馈受到干扰的情况下发音动作和声学特征的补偿情况,发现先天失明的被试听觉目标比正常人的变动区域小 ( Contribution of Vision in Speech Production: Acoustic and Articulatory Compensations to Auditory Feedback Perturbations in Congenitally Blind and Sighted Speakers )。 Birkholtz等考察了不同的唇几何模型对声道一维声管模型的影响 ( Considering Lip Geometry in One-Dimensional Tube Models of Vocal Tract )。 Cattelain 等用表面肌电考察了法语唇部塞音发音过程中口面肌的时间活动模式 ( Time Activation Patterns of Orofacial Muscles in French Labial Stop Consonants )。 Laprie等用多元线性回归的方法对会厌软骨进行了统计建模,其模型考虑了下颚、舌和喉等多个器官对会厌软骨形状和位置的影响 ( Artciulatory Model of Epiglottis )。 W.-S. Lee用EMA技术考察了粤语中CV和CVC音节中辅音-元音、元音-辅音的协同发音现象,发现音节起始位置辅音-元音的协同发音程度依 /p/、/k/、/t/ 的顺序逐渐减弱,音节尾位置的元音-辅音的协调发音程度依 /p/、/t/、/k/ 的顺序逐渐增强 ( CV and VC Coarticulation in Cantonese )。
    2017年的《中国语音学报》中,有关言语产出的研究内容涉及了元音和声调,研究对象多样,包含汉语普通话、方言、中国境内的濒危语言以及非洲语言。比如杨青和曹文的《儿韵的构音方式和实际音值》(第7辑)、王萍和石锋的《汉语普通话基础元音三维空间的统计性研究》(第8辑)、陈玉东和吕士楠的《从五度标调法到五度值的准确推算》(第8辑)、刘新中等的《海南付马话的文白两套声调系统的实验研究》(第8辑)、曹梦雪的《昌黎城关方言单字调研究》(第8辑)、祖漪清等的《用语言复制的方法记录濒危语言——锡伯语案例》(第8辑),以及Sandrine等的《喀麦隆Ghomálá语声调实验研究》(第8辑)等。
    语调和韵律研究中的关键议题,如焦点的韵律表征以及疑问句的语调等,2017年仍然受到了广泛关注,内容涉及多种语言。比如,Rao等人 ( Acoustic Correlates of Focus in Marathi: Production and Perception,Journal of Phonetics 第65期 )考察了马拉地语中焦点的实现;Kelly和Smiljanic ( The Effect of Focus and Phrase Position on East Norwegian Lexical Tonal Accents, Phonetica 第74期 )考察了挪威语Trondersk方言中焦点和短语位置对L和HL两种词汇音高重音的影响。Zygis等人 ( Segmental Cues to Intonation of Statements and Polar Questions in Whispered, Semi-Whispered and Normal Speech Modes, Journal of Phonetics 第63期 )考察了波兰语中正常嗓音、半耳语和耳语中陈述句与极性疑问句语调的差别。
    从方法论上来说,除了传统的实验语料,越来越多研究开始使用语料库进行韵律和语调研究。例如,为了考察法语中上升语调与升降语调的不同,Portes和Lancia ( Earlier or Higher? Comparing French Rising-Falling Contour with Rising Contour in A Corpus of Conversation,Journal of Phonetics 第63期 )采用了基于小波的函数混合模型,对电台辩论节目的录音进行了分析。Simko等( Comparing Languages Using Hierarchical Prosodic Analysis,Proceedings of Interspeech 2017 )运用小波变换的方法,通过对不同语言语音信号的基频和能量包络进行分析,并按照分析后的信号成功对不同韵律结构的语言进行了聚类和区分。
    对不同语言语调以及韵律系统的描写也有一些成果。Rognoni等( Pashto Intonation Patterns,Proceedings of Interspeech 2017 )利用仔细标注的对话语料系统描写了普什图语的语调系统,包括普什图语中最常用的语调模式、疑问句的语调以及焦点实现等现象。Chong和German ( The Accentual Phrase in Singapore English,Phonetica 第74期 )考察了新加坡英语的韵律层级。此外,在2017年Walter de Gruyter出版社出版的Intonation in African Tone Languages一书中,作者Downing和Rialland系统描写了非洲声调语言的语调系统,全书涵盖了不同系属的十二种语言,为探讨声调与语调的互动以及语调在声调语言中的变异提供了丰富的数据。
    北京大学中文系语言学实验室针对少数民族语言以及戏曲嗓音发表了系列研究。比如,孔江平的《藏语声调起源的多维视角》(《语音乐律研究报告2017》)从不同的视角对藏语声调的产生和起源进行了研究。刘文和张锐峰的《鱼粮苗语低平调和低降调的声学感知研究》(《语言学论丛》第五十四辑)以基频、开商和速度商为参数,对鱼粮苗语的声调调值和发声进行了系统的声学分析,并进一步通过感知实验发现,在鱼粮苗语中,除了基频外,发声对低平调和低降调的感知起主要作用。刘文等的《新寨苗语单字调及双字调声学实验研究》(《民族语文》第2期)基于田野实地录音语料,分析了新寨苗语单字调及双字调的基频模式。董理和孔江平的《昆曲闺门旦颤音的嗓音特征》(《清华大学学报(自然科学版)》第57卷第6期)对2名专业的昆曲闺门旦演员演唱颤音时的喉头仪信号进行分析,从颤音周期、幅度、发声类型、生理动作等角度研究该行当颤音的特性,揭示了闺门旦颤音的产生有其独特的发声规律。 (责任编辑:admin)
织梦二维码生成器
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
评论
批评
访谈
名家与书
读书指南
文艺
文坛轶事
文化万象
学术理论