摘要: 传统的MFCC及短时能量特征只反映了信号序列的静态特征,目前基于这些特征的语音/音乐识别率为79%~86%。样本熵可以反映信号序列中的新信息量的大小以及新信息量的变化程度。以样本熵作为特征对语音/音乐进行分类识别,提取混合信号的样本熵,计算每段信号样本熵的均值和方差,采用[k]均值聚类进行识别。仿真实验结果表明,基于样本熵的语音/音乐识别的识别率可提高到88.073%。
杨 松,于凤芹. 基于样本熵的语音/音乐识别[J]. 计算机工程与应用, 2012, 48(23): 125-127.
YANG Song, YU Fengqin. Speech/music discriminator based on sample entropy[J]. Computer Engineering and Applications, 2012, 48(23): 125-127.