计算机工程与应用 ›› 2010, Vol. 46 ›› Issue (7): 218-220.DOI: 10.3778/j.issn.1002-8331.2010.07.066
孙晶京1,王力波2,罗 伟1
SUN Jing-jing1,WANG Li-bo2,LUO Wei1
摘要: 基于基因表达谱的特征基因提取方法已经成为当今研究肿瘤分子诊断的热点,但由于基因表达谱数据存在维数过高、样本量很小以及噪音很大等特点,使得肿瘤特征基因选择成为一件有挑战性的工作。提出了一种新的寻找特征基因的方法。首先基于区间间隔或覆盖比的方法来初步选出一些特征基因,而后删掉其中的冗余基因,达到以最少的基因数得到更高的分类准确率的目的。实验采用了3种肿瘤样本集来验证新算法的有效性。针对这3个样本集,只要2或3个特征基因就能得到100%的5-折交叉验证识别准确率。与其他肿瘤分类方法相比,显示了它的优越性。
中图分类号: