语音驱动的人脸动画研究现状综述

doi:10.3778/j.issn.1002-8331.1704-0345

计算机工程与应用 ›› 2017, Vol. 53 ›› Issue (22): 21-28.DOI: 10.3778/j.issn.1002-8331.1704-0345

语音驱动的人脸动画研究现状综述

李欣怡，张志超

武汉大学遥感信息工程学院，武汉 430000

出版日期:2017-11-15 发布日期:2017-11-29

Review of speech driven facial animation

LI Xinyi, ZHANG Zhichao

School of Remote Sensing and Information Engineering, Wuhan University, Wuhan 430000, China

Online:2017-11-15 Published:2017-11-29

摘要/Abstract

摘要： 利用语音来驱动人脸动画，是虚拟现实（Virtual Reality）等领域重要的智能技术，近年来虚拟现实技术的飞速发展更进一步地突出了在沉浸环境下的人机自然交流的迫切需求。语音驱动的人脸动画技术能够创造出自然生动、带有情感的动画，相对于传统预设的人脸动画而言能够更好地辅助人机交互、提升用户体验。为推进该技术的智能化程度和应用，针对语音驱动人脸动画的关键问题：音视频映射，综述了逐帧分析、多帧分析和逐音素分析的映射方法，同时也梳理了多种脸部模型的思想，动画合成、情感融合、人脸动画评价的方法，及可能的研究发展方向。

关键词: 语音驱动, 人脸动画, 虚拟现实, 神经网络

Abstract: Using speech data to drive facial animation is an important intellectual technology in areas such as Virtual Reality（VR）. Recently the rapid development of VR stresses an urgent need for natural human-computer communication in immersive environment. The speech-driven facial animation technology can produce vivid animation with emotion, thus it can better help human-computer interaction and improve users’ experience compared with the traditional presupposed facial animation. In order to improve theintelligenceofthis technology and its applications, focusing on the key issue of speech-driven facial animation：audio and video mapping, methods including frame by frame analyzation, multi-frame analyzation and phoneme by phoneme analyzation are reviewed. Meanwhile, ideas of several facial models, means of animation synthesis, emotion fusion andevaluation are summarized, and possible directions for future studies are provided.

Key words: speech driven, facial animation, Virtual Reality（VR）, neural networks

李欣怡，张志超. 语音驱动的人脸动画研究现状综述[J]. 计算机工程与应用, 2017, 53(22): 21-28.

LI Xinyi, ZHANG Zhichao. Review of speech driven facial animation[J]. Computer Engineering and Applications, 2017, 53(22): 21-28.

[1]	许昊，张凯，田英杰，种法广，王子超. 深度神经网络图像描述综述[J]. 计算机工程与应用, 2021, 57(9): 9-22.
[2]	冉蓉，徐兴华，邱少华，崔小鹏，欧阳斌. 基于深度卷积神经网络的裂纹检测方法综述[J]. 计算机工程与应用, 2021, 57(9): 23-35.
[3]	牟清萍，张莹，张东波，王新杰，杨知桥. 目标丢失判别机制的视觉跟踪算法及应用研究[J]. 计算机工程与应用, 2021, 57(9): 140-147.
[4]	包志强，邢瑜，吕少卿，黄琼丹. 改进YOLO V2的6D目标姿态估计算法[J]. 计算机工程与应用, 2021, 57(9): 148-153.
[5]	王林，柴江云. 深度神经网络在多场景车辆属性识别中的研究[J]. 计算机工程与应用, 2021, 57(9): 162-167.
[6]	赵志焱，杨华，胡志伟，宇海萍. 基于TACNN的玉露香梨叶虫害识别[J]. 计算机工程与应用, 2021, 57(9): 176-181.
[7]	周伦钢，孙怡峰，王坤，吴疆，黄维贵，李炳龙. 目标多种多值属性的端端快速识别网络[J]. 计算机工程与应用, 2021, 57(9): 182-190.
[8]	张成，戴俊峰，熊闻心. 融合LeNet-5改进的扫描文档手写日期识别[J]. 计算机工程与应用, 2021, 57(9): 207-211.
[9]	麻哲旭，杨峰，乔旭. 铁路路基病害智能检测方法[J]. 计算机工程与应用, 2021, 57(9): 272-278.
[10]	蒋斌，钟瑞，张秋闻，张焕龙. 采用深度学习方法的非正面表情识别综述[J]. 计算机工程与应用, 2021, 57(8): 48-61.
[11]	李震霄，孙伟，刘明明，郑丽丽，陈劭颖. 交通监控场景中的车辆检测与跟踪算法研究[J]. 计算机工程与应用, 2021, 57(8): 103-111.
[12]	张越，黄友锐，刘鹏坤. 引入注意力机制的多分辨率人体姿态估计研究[J]. 计算机工程与应用, 2021, 57(8): 126-132.
[13]	李现国，冯欣欣，李建雄. 多尺度残差网络的单幅图像超分辨率重建[J]. 计算机工程与应用, 2021, 57(7): 215-221.
[14]	翟正利，李鹏辉，冯舒. 图对抗攻击研究综述[J]. 计算机工程与应用, 2021, 57(7): 14-21.
[15]	祝钧桃，姚光乐，张葛祥，李军，杨强，王胜，叶绍泽. 深度神经网络的小样本学习综述[J]. 计算机工程与应用, 2021, 57(7): 22-33.

语音驱动的人脸动画研究现状综述

Review of speech driven facial animation

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics