计算机工程与应用 ›› 2011, Vol. 47 ›› Issue (4): 141-145.DOI: 10.3778/j.issn.1002-8331.2011.04.039
程转流1,2,胡为成2
CHENG Zhuanliu1,2,HU Weicheng2
摘要: 提出一种基于滑动窗口的概率数据流聚类方法PWStream。PWStream采用聚类特征指数直方图保存最近数据元组的信息摘要,在允许的误差范围内删除过期的数据元组;并针对数据流上概率元组提出强簇、过渡簇和弱簇的概念,设计了一种基于距离和存在概率的簇选择策略,从而可以发现更多的强簇。理论分析和实验结果表明,该方法具有良好的聚类质量和较快的数据处理能力。
中图分类号: