计算机工程与应用 ›› 2009, Vol. 45 ›› Issue (15): 54-57.DOI: 10.3778/j.issn.1002-8331.2009.15.016
李杨寰,高 峰,李 腾,周智敏
LI Yang-huan,GAO Feng,LI Teng,ZHOU Zhi-min
摘要: 将信息论中熵的概念应用到特征选择中,定义了两种信息测度评价特征——误差熵和混叠熵,然后阐述了两种定义的不用物理意义,分析了计算熵中最关键的区间划分问题,并提出一种较好的区间划分方法。由于熵不能将相似的特征进行剔除,结合相似系数提出了一套完整的基于熵的特征选择过程,并通过仿真实验进行验证。