计算机工程与应用 ›› 2010, Vol. 46 ›› Issue (24): 138-140.DOI: 10.3778/j.issn.1002-8331.2010.24.042
孟彩霞
MENG Cai-xia
摘要: 针对数据流的特点,对数据流中频繁模式挖掘问题进行了研究,提出了数据流频繁项集挖掘算法FP-SegCount。该算法将数据流分段并利用改进的FP-growth算法挖掘分段中的频繁项集。然后,利用Count Min Sketch进行项集计数。算法解决了压缩统计和计算快速高效的问题。通过和FP-DS算法的实验对比,FP-SegCount算法具有较好的时间效率。
中图分类号: