计算机工程与应用 ›› 2017, Vol. 53 ›› Issue (6): 101-105.DOI: 10.3778/j.issn.1002-8331.1508-0158
孙 俊,张曦煌
SUN Jun, ZHANG Xihuang
摘要: 频繁模式挖掘的模式数量通常过于巨大,在实际应用中只有少量的频繁模式被使用。Top-k频繁模式挖掘通过排列模式频数限制频繁模式的数量,有效提高了算法效率。提出了TPN(Top-k-Patterns based on Nodesets)算法,该算法使用了节点集的概念,将数据压缩于Poc-tree,通过Top-k-rank表重新计算最小支持度限制生成候选模式的数量。实验通过与ATFP,Top-k-FP-growth算法比较,证明该算法有较好的效率。