计算机工程与应用 ›› 2013, Vol. 49 ›› Issue (11): 105-109.
高宏宾,侯 杰,李瑞光
GAO Hongbin, HOU Jie, LI Ruiguang
摘要: 分析了数据流降维算法PCA和KPCA的原理和实现方法。针对在大型数据集上PCA线性降维无法有效实现降维且KPCA的降维效率差,提出了一种新的降维策略GKPCA算法。该算法将数据集先分组,对每一组执行KPCA,然后过滤重新组合数据集,再次应用KPCA算法,达到简化样本空间,降低了时间复杂度和空间复杂度。实验分析表明,GKPCA算法不仅能取得良好的降维效果,而且时间消耗少。