计算机工程与应用 ›› 2008, Vol. 44 ›› Issue (23): 191-192.DOI: 10.3778/j.issn.1002-8331.2008.23.057
桑 军1,胡海波1,叶春晓2,向 宏1,傅 鹂1,蔡 斌1
SANG Jun1,HU Hai-bo1,YE Chun-xiao2,XIANG Hong1,FU Li1,CAI Bin1
摘要: 为了综合体现训练样本的共性和个性,应用动态聚类技术,通过对于训练样本集中的同类别样本进行动态聚类,形成若干样本子集,并将这些子集的类心作为代表用于距离计算,避免了采用样本全集类心作为代表所导致的样本个性削弱,也比采用所有训练样本作为代表样本减少了存储空间和计算时间。此外,通过对于训练样本进行筛选,去除了孤立样本的影响,避免了“过拟合”现象。实验结果证明了算法的有效性。