计算机工程与应用 ›› 2013, Vol. 49 ›› Issue (5): 230-235.
鲁小勇1,杨鸿武2,郭威彤2,裴 东2
LU Xiaoyong1, YANG Hongwu2, GUO Weitong2, PEI Dong2
摘要: 提出了一种基于PAD三维情绪模型的情感语音韵律转换方法。选取了11种典型情感,设计了文本语料,录制了语音语料,利用心理学的方法标注了语音语料的PAD值,利用五度字调模型对情感语音音节的基频曲线建模。在此基础上,利用广义回归神经网络(Generalized Regression?Neural?Network,GRNN)构建了一个情感语音韵律转换模型,根据情感的PAD值和语句的语境参数预测情感语音的韵律特征,并采用STRAIGHT算法实现了情感语音的转换。主观评测结果表明,提出的方法转换得到的11种情感语音,其平均EMOS(Emotional Mean Opinion Score)得分为3.6,能够表现出相应的情感。