计算机工程与应用 ›› 2009, Vol. 45 ›› Issue (36): 165-169.DOI: 10.3778/j.issn.1002-8331.2009.36.049
游文杰1,2,吉国力1,袁明顺2
YOU Wen-jie1,2,JI Guo-li1,YUAN Ming-shun2
摘要: 针对一类高维少样本数据的特点,给出了广义小样本概念,对广义小样本进行信息特征压缩:特征提取(降维)和特征选择(选维)。首先介绍基于主成分分析(PCA)的无监督与基于偏最小二乘(PLS)的有监督的特征提取方法;其次通过分析第一成分结构,提出基于PCA与PLS的新的全局特征选择方法,并进一步提出基于PLS的递归特征排除法(PLS-RFE);最后针对MIT AML/ALL的分类问题,实现基于PCA与PLS的特征选择和特征提取,以及PLS-RFE特征选择与比较,达到广义小样本信息特征压缩的目的。
中图分类号: