计算机工程与应用 ›› 2019, Vol. 55 ›› Issue (24): 117-121.DOI: 10.3778/j.issn.1002-8331.1808-0432
贾兵兵,曹辉,秦驰杰
JIA Bingbing, CAO Hui, QIN Chijie
摘要: 为降低声学特征在语音识别系统中的音素识别错误率,提高系统性能,提出一种子空间高斯混合模型和深度神经网络结合提取特征的方法,分析了子空间高斯混合模型的参数规模并在减少计算复杂度后将其与深度神经网络串联进一步提高音素识别率。把经过非线性特征变换的语音数据输入模型,找到深度神经网络结构的最佳配置,建立学习与训练更可靠的网络模型进行特征提取,通过比较音素识别错误率来判断系统性能。实验仿真结果证明,基于该系统提取的特征明显优于传统声学模型。