计算机工程与应用 ›› 2009, Vol. 45 ›› Issue (30): 123-125.DOI: 10.3778/j.issn.1002-8331.2009.30.038
李 贤,罗 可
LI Xian,LUO Ke
摘要: 数据聚类是数据挖掘中的重要研究内容。现实世界中的数据往往同时具有连续属性和离散属性,但现有大多数算法局限于仅处理其中一种属性,而对另一种采取简单舍弃的办法丢失聚类信息和降低聚类质量。一些能处理混合属性的算法又往往处理的属性过多,导致计算量的大增。提出了一种基于BIRCH算法的混合属性数据的聚类算法;在UCI数据集上的实验表明,文中提出的算法具有较好的性能。
中图分类号: