计算机工程与应用 ›› 2010, Vol. 46 ›› Issue (28): 40-42.DOI: 10.3778/j.issn.1002-8331.2010.28.011
彭红毅1,叶燕锐2,张俊辉2,罗泽举3,奉国和4
PENG Hong-yi1,YE Yan-rui2,ZHANG Jun-hui2,LUO Ze-ju3,FENG Guo-he4
摘要: 常用的排列方法从DNA微数据中选择的基因集合往往会包含相关性较高的基因,而且使用单个基因评价方法也不能真正反映由此得到的特征集合分类能力的优劣。另外,基因数量远多于样本数量是进行疾病诊断面临的又一挑战。为此,提出一种DNA微阵列数据特征提取方法用于组织分类。该方法运用K-means方法对基因进行聚类分析,获取各子类DNA微阵列数据中心,用排列法去除对分类无关的子类,然后利用ICA方法提取剩余子类集合的特征,用SVMs方法构造分类器对组织进行分类。真实的生物学数据实验表明,该方法通过提取一种复合基因,能综合评价基因分类能力,减少特征数,提高分类器的分类准确性。
中图分类号: