计算机工程与应用 ›› 2010, Vol. 46 ›› Issue (20): 153-156.DOI: 10.3778/j.issn.1002-8331.2010.20.043
蒋盛益1,王连喜2
JIANG Sheng-yi1,WANG Lian-xi2
摘要: 提出了一种基于特征相关性的特征选择方法。该方法以特征之间相互依赖程度(相关度)为聚类依据先对特征进行聚类,再从各特征簇中挑选出具有代表性的特征,然后在被选择出来的特征中删除与目标特征无关或是弱相关的特征,最后留下的特征作为最终的特征子集。理论分析表明该方法的运算效率高,时间复杂度低,适合于大规模数据集中的特征选择。在UCI数据集上与文献中的经典方法进行实验比较和分析,结果显示提出的特征选择方法在特征约减和分类等方面具有更好的性能。
中图分类号: