摘要: 为实现文本/语音驱动的说话人头部动画,本文提出基于贝叶斯切线形状模型的口形轮廓特征提取方法和基于动态贝叶斯网络(Dynamic Bayesian Network, DBN)模型的唇读系统。在描述词与它的组成视素关系的基础上,得到视素时间切分序列。为比较性能,音素DBN模型和HMM的音素识别结果被影射成视素序列。在评价准则上,提出绝对视素切分正确性和基于图像与嘴唇几何特征两种相对视素切分正确性的评价标准。实验表明,DBN模型识别性能优于HMM,而基于视素的DBN模型能为说话人头部动画提供最好的口形。
吕国云 赵荣椿 蒋冬梅 蒋晓悦 侯云舒 H.Sahli. 基于BTSM和DBN模型的唇读和视素切分研究[J]. 计算机工程与应用, 2007, 43(14): 21-24.
Dongmei Jiang xiaoyue jiang yunshu hou hichem sahli. BTSM AND DBN MODEL FOR CONTINUOUS SPEECH RECOGNITION AND VISEME SEGMENTATION[J]. Computer Engineering and Applications, 2007, 43(14): 21-24.