计算机工程与应用 ›› 2011, Vol. 47 ›› Issue (26): 186-188.
张 齐1,林媛媛1,余国先2
ZHANG Qi1,LIN Yuanyuan1,YU Guoxian2
摘要: 在很多的机器学习和数据挖掘任务中,特征子集选择是重要的数据预处理步骤之一。提出一种基于图方法的无监督式特征选择方法(GBFS),构造一个以样本数据为顶点,数据间相似性作为边的图,再根据各特征的得分优先选择那些具有局部信息保持和全局区分能力的特征。实验结果表明,基于该方法选择的特征子集,在大多数情况下都能取得较好的分类效果。