计算机工程与应用 ›› 2016, Vol. 52 ›› Issue (18): 74-78.
王晨曦1,林耀进2,刘景华2,林梦雷2
WANG Chenxi1, LIN Yaojin2, LIU Jinghua2, LIN Menglei2
摘要: 针对邻域信息系统的特征选择模型存在人为设定邻域参数值的问题。分别计算样本与最近同类样本和最近异类样本的距离,用于定义样本的最近邻以确定信息粒子的大小。将最近邻的概念扩展到信息理论,提出最近邻互信息。在此基础上,采用前向贪心搜索策略构造了基于最近邻互信息的特征算法。在两个不同基分类器和八个UCI数据集上进行实验。实验结果表明:相比当前多种流行算法,该模型能够以较少的特征获得较高的分类性能。