摘要: 模式树是目前频繁项集挖掘最常用的数据结构,使用模式树可以有效地将数据库压缩于内存,并在内存中完成对频繁项集的挖掘。为了进一步提高频繁项集挖掘算法的可扩展性,本文对模式树进行了细致的研究,在此基础上提出了一种挖掘频繁项集的新算法,FP-DFS算法。该算法通过对模式树的各种操作简化了对频繁项集的搜索过程。实验表明,该算法对于频繁项集挖掘具有比较高的效率。
战立强 刘大昕 张健沛. 一种基于模式树的频繁项集快速挖掘算法[J]. 计算机工程与应用, 2007, 43(11): 15-16.
Da-xin LUI. A Fast algorithm for frequent item-set mining based on Pattern tree[J]. Computer Engineering and Applications, 2007, 43(11): 15-16.