ITD在语音情感识别中的研究

计算机工程与应用 ›› 2014, Vol. 50 ›› Issue (22): 203-206.

ITD在语音情感识别中的研究

叶吉祥1，2，刘亚1

1.长沙理工大学计算机与通信工程学院，长沙 410114
2.中南大学信息科学与工程学院，长沙 410083

出版日期:2014-11-15 发布日期:2014-11-13

Speech emotion recognition based on Intrinsic Time-scale Decomposition

YE Jixiang1，2, LIU Ya1

1.College of Computer and Communication Engineering, Changsha University of Science and Technology, Changsha 410114, China
2.College of Information Science and Engineering, Central South University, Changsha 410083, China

Online:2014-11-15 Published:2014-11-13

摘要/Abstract

摘要： 为了更好地表征语音情感状态，将固有时间尺度分解（ITD）用于语音情感特征提取。从语音信号中得到前若干阶合理旋转（PR）分量，并提取PR分量的瞬时参数特征和关联维数，以此作为新的情感特征参数，结合传统特征使用支持向量机（SVM）进行语音情感识别实验。实验结果显示，引入PR特征参数后，与传统特征的方案相比，情感识别率有了明显提高。

关键词: 固有时间尺度分解, 合理旋转分量, PR特征参数, 情感识别

Abstract: In order to express speech emotional state better, this paper takes the Intrinsic Time-scale Decomposition（ITD） into extracting speech emotion features, decomposes the emotion speech into a sum of Proper Rotation（PR） components, extracts instantaneous characteristic parameters and correlation dimension as new emotional characteristic parameters, combines with traditional features and uses Support Vector Machine（SVM） for speech emotional recognition. The results show that recognition accuracy is improved obviously through using PR features parameters.

Key words: Intrinsic Time-scale Decomposition（ITD）, Proper Rotation components（PR）, PR features parameters, emotion recognition

叶吉祥1，2，刘亚1. ITD在语音情感识别中的研究[J]. 计算机工程与应用, 2014, 50(22): 203-206.

YE Jixiang1，2, LIU Ya1. Speech emotion recognition based on Intrinsic Time-scale Decomposition[J]. Computer Engineering and Applications, 2014, 50(22): 203-206.

[1]	蔡冬丽，钟清华，朱永升，廖金湘，韩劢之. 三维输入卷积神经网络脑电信号情感识别[J]. 计算机工程与应用, 2021, 57(5): 161-167.
[2]	米珍美，赵恒斌，高攀. 基于ConvLSTM网络的维度情感识别模型研究[J]. 计算机工程与应用, 2021, 57(18): 289-296.
[3]	宋冠军，张树东，卫飞高. 音视频双模态情感识别融合框架研究[J]. 计算机工程与应用, 2020, 56(6): 140-146.
[4]	胡章芳，刘鹏飞，蒋勤，罗飞，王明丽. 基于3DC-BGRU的脑电情感识别[J]. 计算机工程与应用, 2020, 56(20): 111-117.
[5]	孙晓虎，李洪均. 语音情感识别综述[J]. 计算机工程与应用, 2020, 56(11): 1-9.
[6]	张雪英，王薇蓉，孙颖，宋春晓. 面向脑电情感识别的改进多分类RVM模型研究[J]. 计算机工程与应用, 2019, 55(9): 112-117.
[7]	陈景霞，王丽艳，贾小云，张鹏伟. 基于深度卷积神经网络的脑电信号情感识别[J]. 计算机工程与应用, 2019, 55(18): 103-110.
[8]	缪裕青1，邹巍1，刘同来1，周明2，蔡国永1. 基于参数迁移和卷积循环神经网络的语音情感识别[J]. 计算机工程与应用, 2019, 55(10): 135-140.
[9]	陈闯1，RYAD Chellali1，邢尹2. 改进GWO优化SVM的语音情感识别研究[J]. 计算机工程与应用, 2018, 54(16): 113-118.
[10]	张小华，黄波. 基于Bandlet和KW技术的移动应用面部情感识别[J]. 计算机工程与应用, 2018, 54(10): 213-218.
[11]	姜晓庆1，2，夏克文1，林永良1，3 . 使用二次特征选择及核融合的语音情感识别[J]. 计算机工程与应用, 2017, 53(3): 7-11.
[12]	李宇驰，李海芳，介丹，阴桂梅，呼克佑. 基于复杂网络的情感脑电相位同步性分析[J]. 计算机工程与应用, 2017, 53(18): 230-235.
[13]	张卫，张雪英，孙颖. 融合模糊认知图用于语音情感识别[J]. 计算机工程与应用, 2017, 53(15): 14-17.
[14]	唐闺臣1，冯月芹1，梁瑞宇1，2，包永强1，赵力2. 面向语音情感识别的语谱特征提取算法研究[J]. 计算机工程与应用, 2016, 52(21): 152-156.
[15]	孙波，刘永娜，罗继鸿，张迪，张树玲，陈玖冰. 基于张量分析的表情特征提取[J]. 计算机工程与应用, 2016, 52(20): 145-148.