• 工作总结
  • 工作计划
  • 心得体会
  • 领导讲话
  • 发言稿
  • 演讲稿
  • 述职报告
  • 入党申请
  • 党建材料
  • 党课下载
  • 脱贫攻坚
  • 对照材料
  • 主题教育
  • 事迹材料
  • 谈话记录
  • 扫黑除恶
  • 实施方案
  • 自查整改
  • 调查报告
  • 公文范文
  • 思想汇报
  • 当前位置: 雅意学习网 > 文档大全 > 公文范文 > 正文

    基于元音声学空间的汉语方言与普通话间话者识别探究

    时间:2023-06-12 18:35:20 来源:雅意学习网 本文已影响 雅意学习网手机站

    赵擎华,杨俊杰

    (1.山西大学语言科学研究所,山西 太原030006;
    2.山西警察学院,山西 太原 030401)

    目前,司法诉讼领域涉及到方言性伪装语音的话者识别案件逐渐增加。犯罪嫌疑人或被告人在违法犯罪或侵害他人合法权益时与在采集语音样本时故意分别使用汉语方言和普通话,以达到伪装真实身份的目的,导致在进行司法话者识别时只能在汉语方言与普通话语音之间进行比对。我国汉语方言复杂多样,普通话普及率也日益提高,研究汉语方言与普通话之间的语言性伪装语音的话者识别问题至关重要。

    20世纪30年代至今,司法话者识别技术虽已经历了近九十年的发展历程,形成了声学语音学识别、全自动话者识别及半自动话者识别等识别方法,但依靠“听觉-声学-语音识别”由专家进行综合判别的声学语音学识别方法,因其结论准确性及可解释性为各国法庭普遍采信,成为国内外司法话者识别专家普遍采用的方法。该方法一般是以检材和录音样本中的相同音段作为比对对象。对于汉语方言与普通话之间的话者识别研究,已有的研究成果也主要是基于两者间的相同音段。比如:公安部物证鉴定中心国家“九五”课题报告[1]、《山西方言与普通话进行司法话者识别可用特征音段研究》[2]等。然而,汉语方言,即使是官话与普通话的语音系统也存在一定的差异,在进行汉语方言和普通话之间的话者识别时,时常面临可提取的相同音段数量不足的困境。因此,如何充分挖掘不同音段的语音特征并充分利用有限的相同音段来进行话者识别,成为汉语方言与普通话之间话者识别的重要方向。

    元音声学空间是根据元音的共振峰数据建立的一种展现元音相对关系的抽象空间。国内外众多学者研究发现,元音声学空间与生理和感知空间都有一定的对应关系。JOOS[3]、DELATTRE[4]、鲍怀翘等[5]研究发现,发音时共鸣腔最低的共振峰(第一共振峰,简称为“F1”)反映发音人舌位的高低,一般来说数值越高,则舌位越低。共鸣腔次低的共振峰(第二共振峰,简称为“F2”)反映舌位的前后,一般来说数值越高,则舌位越靠前。此外,F2也反映了圆唇的特征,圆唇会降低F2的数值。赖福吉[6]从感知声学角度使用“元音高低”“元音前后”术语描写元音,同样认为F1大致与感知的元音高度相关,F2与感知的元音前后相关。同时也有研究表明,尽管不同的人所发同一个元音共振峰的频率不同,但是每个人所发的各个元音在元音声学空间上的相对位置基本上是稳定的,总体层级关系、对应关系不会颠倒[7-9]。因此,有理由相信,把某个说话人的方言元音放到由某个普通话元音构建的元音声学图中时,如果是同一说话人的方言与普通话语音,则两者的各个元音间的相对位置应该符合同一人的空间关系,若不符合这一关系,则说明方言与普通话语音有可能来自不同的说话人。

    针对司法话者识别中元音声学空间的应用研究,NOLAN等[10]通过比对检材与样本(同种语言的语音)中相同元音的元音声学空间分布范围,有效排除了犯罪嫌疑人的嫌疑。GURSKI[11]通过分析英法双语之间的相同元音在元音声学空间中的重叠程度,论证了通过元音声学空间实现跨语言语音比较的可行性。以上研究仅考察了相同元音的空间分布范围,并未关注不同元音的空间相互分布关系,同时也未充分利用元音声学空间的整体特征和度量方法。为此,本文将以元音为比对对象,将汉语方言和普通话语音中的元音叠置于同一元音声学空间中,通过考察相同元音之间的相似度、不同元音之间的位置关系以及相同音位元音鼻化的一致性,来进行汉语方言与普通话之间的话者识别探究。

    1.1 设备与参数

    1.1.1 设备

    北京阳宸IV-12计算机语音工作站(V10.5);
    联想Y7000笔记本电脑;
    罗技H111耳麦。

    1.1.2 参数设置

    11 kHz采样率,16位,单声道。男性带宽一般设置为300 Hz,具体依据个体基频进行调整,带宽调整范围为300~500 Hz,但需保证同一个体参数的一致性。

    1.2 方言选择与声样录制及提取

    山西汾城方言属于中原官话汾河片,与普通话对比,两者之间相同元音与不同元音的数量都较多,适宜作为验证语言。同时,汾城方言中基本不含独立的鼻化元音,适合检验个体在非鼻音语境中口元音的鼻化现象。此外,元音声学空间的准确性对元音的听辨要求较高,汾城方言是本文两位作者的母语,有天然的听辨优势。选择母语进行跨语言比较也符合国际司法语音和声学协会的工作守则(IAFPA Code of Practice 2020)[12]对从业人员的建议。

    1.2.1 发音人

    10位男性发音人的年龄为17~19岁,并且所有发音人都来自山西汾城方言片村庄,自小说汾城方言,现就读于同一所农村高中,且均能说比较标准的普通话。录音时身体健康,无嗓音疾病。

    1.2.2 语料文本

    录音文本分为普通话文本和方言文本,每种文本又分为词语和长句两个部分。语料覆盖普通话和山西汾城方言中所有的韵母。其中,普通话韵母音系参考《现代汉语》[13],汾城方言韵母音系综合参考多位学者的研究[14-16]。

    1.2.3声样录制

    在安静的室内环境中,10位发音人分别录制3次普通话和方言语音。选择其中1次普通话语音作为“检材”声样,3次方言语音全部作为“样本”声样。

    1.2.4 元音提取与标注

    方言和普通话声样的元音均选择音系层面的口元音(oral vowel),取自单元音韵母和真性复合元音(即两个目标元音在语图上各自有较长的稳定段)[17]。其中,真性复合元音中的两个目标元音根据其实际音值分别标注。

    由于语音环境和语速的改变都会导致元音不到位(vowel undershoot)[18],在语流中会出现大量的音位变体。如使用语言学研究中常用的“宽式标音”(broad transcription)则不能反映出音位变化,故应使用系统严式标音法(systematic narrow transcription),即采用音位变体标音法(allophonic transcription)来标注元音。严式标音法通过增加附加符号来表示音位变体(allophonic)与正则元音之间的变化,可以包含更多的语音细节。使用严式音标标音时,坚持“一符一音、一音一符”的原则,即两个元音在听感上能够清晰区分出高度和前后有所不同,便标注为两个不同的元音,不能使用同一个元音符号来表示。

    将方言和普通话声样的元音放在同一个声学空间坐标系中,从元音空间轮廓、相同元音的相似度、不同元音的位置关系及非鼻音语境中元音的鼻化现象四个维度来比对两者的元音声学空间特征。

    2.1 元音声学空间图绘制方法

    以“F1”为纵轴、“F2”为横轴,出于对感知因素的考量,刻度关系调整为巴克标度(Bark Scale),赫兹与巴克的转换公式如下[19]:

    其中:B为其振峰的巴克值,Bark;
    f为其振峰的频率值,Hz。

    2.2 元音空间相似和差异特征的标注规则

    (1)元音空间轮廓的标注规则。元音空间轮廓可以非常直观地展示元音的整体分布范围和空间大小。用线段将两种语音中的边缘元音连接起来以勾勒出元音空间的轮廓。其中,边缘元音选择发音人方言和普通话语音之间的相同元音或邻近元音,使轮廓具有可比性。方言和普通话的空间轮廓使用不同颜色加以区分。

    (2)相同元音的标注规则。方言和普通话声样中的相同元音根据元音位置的相似度标注异同。元音的相似度通过元音空间距离、F1的差异范围、F2的差异范围、F2-F1的差异范围四个量化指标来度量。当相同元音对的四个度量指标都在阈值内时,使用绿色的虚线椭圆标注该元音对,否则使用红色虚线椭圆标注。

    在二维元音空间中,元音可以看作欧式平面中的一个点,这样普通话元音(F2普,F1普)与方言元音(F2方,F1方)之间的距离D可以通过两点的欧氏距离来计算,计算公式如下:

    其中:D为普通话元音与方言元音之间的欧氏距离,Hz;
    F1普、F2普、F1方、F2方分别为普通话元音和方言元音的第一、第二共振峰,Hz。

    两个元音之间的F1差异、F2差异、F2-F1差异可通过以下公式计算:

    其中:diff为普通话元音和方言元音之间的差异值;
    V普、V方分别为普通话元音和方言元音的共振峰频率值,Hz;
    Vmax为V普、V方两者之间的最大值,Hz。

    本文统计分析了10位说话人的普通话和方言中共120对相同元音的相似度,其空间距离等4个量化指标的阈值范围分别如图1、图2所示。图1中,95%范围以内的元音空间距离阈值为64.5Hz,图2中,F1差异阈值为4.6%,F2差异阈值为5.1%,F2-F1差异阈值为10.8%。

    图1 相同元音距离阈值范围

    图2 F1差异、F2差异、F2-F1差异阈值范围

    (3)不同元音的标注规则。个体相邻元音及音位变体之间具有明确的稳定位置关系,根据位置关系标注“不同元音”的异同。考虑鼻化元音与口元音的位置关系非常复杂且尚存在争议,在考察元音位置关系时,只关注口元音与口元音或鼻化元音与鼻化元音的位置关系。不同元音的位置关系通过箭头线段来标注,符合元音高低前后层级关系和位置关系的元音对使用绿色箭头线段表示;
    相反,位置错位甚至颠倒的元音对则使用红色箭头线段表示。为避免同一个元音既考察相似度,又考察位置关系,致使同一个特征重复计数,因此只有两个元音在方言和普通话声样中都无法找到相同元音时,才比较位置关系。

    (4)非鼻音语境中元音的鼻化现象的标注规则。方言和普通话声样中相同音位的元音鼻化情况一致时,根据相似度或位置关系规则标注;
    当元音鼻化现象不一致时用红色虚线方框标注。

    根据标注规则,将每位发音人普通话声样与各自的3遍方言声样进行比对,绘制10位发音人共30组元音空间图来考察说话人内(intra-speaker)差异;
    将每位发音人的普通话声样与其他9位发音人的1遍方言声样进行比对,总共绘制90组元音空间图来考察说话人间(inter-speaker)差异。

    3.1 相同发音人的元音声学空间

    10位发音人的普通话声样与各自的方言声样进行比对,都显示出高度相似性。10位发音人的元音声学空间图如图3所示,限于篇幅,每位发音人只列一组空间图。从相同发音人的元音声学空间图中可以直观看到,普通话和方言分开观察时,元音的系统性和层级性都非常清晰;
    将方言和普通话中的元音放到同一个元音声学空间图中整体来看时,两者之间的元音混合在一起依然是整齐的系统,且空间轮廓高度相似;
    从局部来看,相同元音对的位置基本固定,不同元音对的位置关系以及相同音位的口元音鼻化现象也相当一致。10位发音人个体内的具体统计结果如表1所示。

    表1 10位发音人个体内的差异统计

    图3 相同发音人的元音声学空间图

    3.2 不同发音人的元音空间

    10位发音人的普通话声样分别与除自身外的其他9位发音人的方言声样进行比对,都显示出较高的差异性。篇幅所限,只列出发音人男1的普通话声样和与其他9位发音人的方言声样的元音声学空间图,具体如图4所示。

    图4 不同发音人的元音空间图

    由不同发音人的元音声学空间图可以直观看出,普通话和方言分开观察,各自元音的系统性和层级性都非常清晰。然而将方言和普通话的元音放到同一个元音空间图中整体来看,两者之间的元音混合在一起后,其层级性、系统性变得叠合纷乱,各自的空间轮廓也有明显差异;
    从局部来看,相同元音对的位置游离范围大,不同元音对的位置关系以及相同音位的口元音鼻化现象不一致甚至相互矛盾。发音人男1与其他9位发音人个体间的差异统计结果如表2所示。

    表2 发音人男1与其他9位发音人个体间的差异统计结果

    3.3 比对结果

    实验结果表明,每个说话人的元音声学空间都比较稳定,且不同说话人之间又各有区别。使用元音空间法进行方言和普通话间的话者识别时,说话人的个体变异远小于说话人的人间差异,同一说话人表现出显著一致性,不同说话人表现出显著差异性。同时,也使得可比音段数量都比较充足,其中10位相同发音人的比对音段数量最小为13,最大为19,平均数量为16.3;
    不同发音人的比对音段数量最小为11,最大为15,平均数量为12.8。

    4.1 严式标音法可提高判别准确度

    使用严式音标标注元音可避免将不同音位变体归为同一个音位,可使相同元音的游离范围更加集中。从上文可知,使用严式音标标注元音时,元音空间距离、F1的差异范围、F2的差异范围、F2-F1的差异范围这四个量化指标的差异阈值都较小,这样有利于提高判别相同元音相似度的准确度。

    4.2 元音声学空间具有清晰的系统性和层级性

    边缘元音可以很好地体现说话人发音的“极限范围”,边缘元音的位置是说话人生理特征的声学体现,其间接描述了口腔,尤其是下颌和舌头在发音时的运动区域。10位发音人的方言和普通话分别放置于同一个元音声学空间图中,非常清晰地显示了元音间的系统性和层级性。前后元音分开来看,元音分布情况都有较好的可比性。具体可以看到:

    (1)前元音/i/、/e/、/ε/、/æ/、/a/随着元音高度由高到低,F1显著增加,同时F2依次减小;
    其中/i/F1最小,F2最大,/a/F1最大、F2最小。因此,元音图左边线基本是由左向右倾斜的。

    (2)后元音/u/、/o/、/ʌ/、/ɑ/随着元音高度由高到低,F1显著增加,同时F2依次增大;
    其中/u/F1、F2最小,/ɑ/F1、F2最大。因此,元音图右边线基本是由右向左倾斜的。

    (3)低元音/a/、/A/、/ɑ/在元音图上并非只是元音前后的区别,元音高度也逐渐升高。因此,低元音的连线基本是由左低向右高倾斜的。

    同一说话人的方言和普通话的边缘元音交替连接形成的元音空间轮廓符合上述系统性和层级性;
    然而,由不同说话人的方言和普通话的边缘元音交替连接形成的元音空间轮廓,其连线的倾斜方向、元音的高低前后层级都变得错乱,具体如图5、图6所示。

    图5 男1普通话与男1方言边缘元音空间轮廓

    图6 男1普通话与男9方言边缘元音空间轮廓

    4.3 元音位置关系具有重要的区分价值

    我国汉语方言丰富,各汉语方言与普通话的语音系统均存在不同程度的差异。即使官话与普通话的语音系统相对接近,在进行汉语方言和普通话间的话者识别时,也时常提取不到足够多的相同元音,难以满足鉴定需要。实验发现,两者之间不同元音的位置关系具有重要的区分价值,可作为话者识别的有力依据。

    如图7所示,男1普通话声样和男9方言声样之间,相同元音只有/i/、/y/、/ɿ/3对(其中2对相似),显然只通过3对相同元音不足以得到认定结论。但通过考察不同元音的位置关系,可找到9对可供比对的不同元音,这样总比对数量达到12,可以满足认定要求。在图8中,男8普通话声样与男6方言声样中,虽然相同元音数量达到5对,且4对相同元音都高度相似,仅/u/的F1差别较大。即便如此,也需要谨慎得出是同一说话人的认定结论。通过考察9对不同元音的位置关系,其中8对都显示明显的位置错位。这样总共14个元音对中显示有9处差异,明显不可将两个声样认定为来自同一说话人。

    图7 男1普通话与男9方言元音空间图

    图8 男8普通话与男6方言元音空间图

    4.4 非鼻音语境中元音的鼻化现象具有重要的区分价值

    由于鼻化元音的成因较为复杂,鼻化元音与口元音在声学上没有清晰的比对规律,实践中很少将两者视为可比对的音段。在以往的研究中,已发现鼻化现象存在个体差异,虽然某一方言点的多数人把某一韵母发成口元音,但该方言点的某些个体所发的却是鼻化韵母[20]。为挖掘个体鼻化现象的利用价值,如上文已介绍,本文所选的声样在音系学上都属于非鼻音语境中的口元音,声样中排除了受语言因素影响形成的鼻元音和鼻化元音。如果音系学上的口元音在语音学上测得的是鼻化元音,则多是由说话人发音习惯和生理因素所致。说话人的这种鼻化现象在正常交流时不能轻易通过自然手段改变,具有较强的稳定性。实验结果表明,非鼻音语境中元音的鼻化现象的一致性可作为区分不同说话人的有力特征。在普通话和汉语方言中的相同音位,对于同一个说话人,普通话声样中的口元音发生鼻化,对应的方言声样中的口元音也会发生鼻化。如果一种语音发生鼻化,另一种仍保持口元音,则不符合个体的生理特征,两个语音可怀疑来自不同的说话人。如图9所示,普通话声样和方言声样来自不同的说话人,其中,普通话声样中的中低元音/ε/、/æ/、/a/、/A/、/ʌ/都发生鼻化,而方言声样中相同的音位都是口元音。

    图9 男3普通话与男6方言元音空间图

    元音声学空间可以呈现不同元音在空间内的距离、层次及变体,能把个体元音在共振峰声学参量上的相似和差异以图形方式清晰表达出来,结果具有很强的直观性。同时,说话人语音在元音声学空间中的元音空间轮廓、元音相似度、元音位置关系以及鼻化现象差异性四个指标上,表现出较好的个体稳定性和人间的差异性。此外,通过元音声学空间实现了汉语方言和普通话之间不同元音的特征比对,验证了两者间的不同元音也具有良好的区分价值。

    猜你喜欢 元音声学普通话 元音字母和元音字母组合的拼读规则考试与评价·七年级版(2021年1期)2021-08-14元音字母和元音字母组合的拼读规则考试与评价·七年级版(2020年1期)2020-10-23爱的就是这股Hi-Fi味 Davis Acoustics(戴维斯声学)Balthus 70家庭影院技术(2020年6期)2020-07-27Acoustical Treatment Primer:Diffusion谈谈声学处理中的“扩散”家庭影院技术(2019年1期)2019-01-21Acoustical Treatment Primer:Absorption谈谈声学处理中的“吸声”(二)家庭影院技术(2018年11期)2019-01-21Acoustical Treatment Primer:Absorption 谈谈声学处理中的“吸声”家庭影院技术(2018年10期)2018-11-02我是中国娃爱讲普通话学苑创造·A版(2018年9期)2018-10-22Playing with “ar”小学生时代·大嘴英语(2014年6期)2014-11-0417时代英语·高三(2014年5期)2014-08-26广而告之推广普通话高中生·职教与就业(2013年11期)2013-12-09

    推荐访问:汉语 元音 声学

    • 文档大全
    • 故事大全
    • 优美句子
    • 范文
    • 美文
    • 散文
    • 小说文章