基于样本熵的语音/音乐识别

计算机工程与应用 ›› 2012, Vol. 48 ›› Issue (23): 125-127.

• 数据库、信号与信息处理 • 上一篇下一篇

基于样本熵的语音/音乐识别

杨松，于凤芹

江南大学物联网工程学院，江苏无锡 214122

出版日期:2012-08-11 发布日期:2012-08-21

Speech/music discriminator based on sample entropy

YANG Song, YU Fengqin

School of Internet of Things Engineering, Jiangnan University, Wuxi, Jiangsu 214122, China

Online:2012-08-11 Published:2012-08-21

摘要/Abstract

摘要： 传统的MFCC及短时能量特征只反映了信号序列的静态特征，目前基于这些特征的语音/音乐识别率为79%~86%。样本熵可以反映信号序列中的新信息量的大小以及新信息量的变化程度。以样本熵作为特征对语音/音乐进行分类识别，提取混合信号的样本熵，计算每段信号样本熵的均值和方差，采用[k]均值聚类进行识别。仿真实验结果表明，基于样本熵的语音/音乐识别的识别率可提高到88.073%。

关键词: 语音/音乐识别, 样本熵, k均值聚类

Abstract: Mel frequency cepstral coefficients and short time energy only reflect the static characteristics in signal sequence and the recognition rate of speech/music discrimination is 79%~86%. Sample entropy reflects the size and variational extent of new information in signal sequence. This paper conducts speech/music discrimination using sample entropy. The mean and variance of the sample entropy are calculated after extracting the sample entropy of mixed signals, then each signal is recognized by k-means cluster. Simulation experimental results show that the recognition rate of speech/music discrimination reaches 88.073% when using sample entropy.

Key words: speech/music discrimination, sample entropy, k-means

杨松，于凤芹. 基于样本熵的语音/音乐识别[J]. 计算机工程与应用, 2012, 48(23): 125-127.

YANG Song, YU Fengqin. Speech/music discriminator based on sample entropy[J]. Computer Engineering and Applications, 2012, 48(23): 125-127.

[1]	易灵芝，王仕通，易芳，邓栋，易志敏，姜鹏. 基于EEMDSE-ILSTM的风电场超短期风速预测[J]. 计算机工程与应用, 2021, 57(22): 288-294.
[2]	恩德，张凤磊，张昭，忽胜强. 模糊熵在车载环境下语音端点检测中的应用[J]. 计算机工程与应用, 2016, 52(10): 147-150.
[3]	黄芬1，于琪1，姚霞2，商贵艳2，朱艳2，伍艳莲1，黄宇2. 小麦冠层图像H分量的K均值聚类分割[J]. 计算机工程与应用, 2014, 50(3): 129-134.
[4]	许竣玮，徐蔚鸿. 基于扰动免疫粒子群和K均值的混合聚类算法[J]. 计算机工程与应用, 2014, 50(22): 163-169.
[5]	常天庆，李勇，陈军伟，张洋. 基于最大能量匹配与样本熵的小波降噪方法[J]. 计算机工程与应用, 2014, 50(21): 210-213.
[6]	赵杰1，桑庆兵1，刘毅锟2. 基于分裂式K均值聚类的肤色检测方法[J]. 计算机工程与应用, 2014, 50(1): 134-138.
[7]	胡伟. 改进的层次K均值聚类算法[J]. 计算机工程与应用, 2013, 49(2): 157-159.
[8]	曾接贤1，王军婷2，符祥1. K均值聚类分割的多特征图像检索方法[J]. 计算机工程与应用, 2013, 49(2): 226-230.
[9]	王立梅1，李金凤1，岳琪2. 基于k均值聚类的直推式支持向量机学习算法[J]. 计算机工程与应用, 2013, 49(14): 144-146.
[10]	王树朋，闫丽，付丽华，李宏伟. 基于非正交核函数的NARX系统辨识[J]. 计算机工程与应用, 2012, 48(22): 166-170.
[11]	汪亮，解建仓，罗军刚. 基于K均值聚类和LK算法的应急物资调度[J]. 计算机工程与应用, 2012, 48(21): 35-40.
[12]	郭兴明，胡童宜，汤丽平. 心脏杂音提取和分类识别研究[J]. 计算机工程与应用, 2012, 48(15): 149-152.
[13]	姚敏锋1，李心广1，黄文涛2. 一种k均值和神经网络集成的语音识别方法[J]. 计算机工程与应用, 2012, 48(12): 144-147.
[14]	刘彬，王朝英，侯志强. 融合聚类和分级区域合并的彩色图像分割方法[J]. 计算机工程与应用, 2011, 47(30): 202-205.
[15]	李杉，张化祥. 基于分类的半监督聚类方法[J]. 计算机工程与应用, 2011, 47(3): 132-134.

基于样本熵的语音/音乐识别

Speech/music discriminator based on sample entropy

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics