计算机工程与应用 ›› 2009, Vol. 45 ›› Issue (13): 156-159.DOI: 10.3778/j.issn.1002-8331.2009.13.045
王 乐1,王 水2,陈 波1,董 鹏1
WANG Le1,WANG Shui2,CHEN Bo1,DONG Peng1
摘要: 发现最大频繁项目集是数据挖掘应用中的关键问题;为寻求避免生成大量的候选项集,或生成频繁模式树的挖掘算法,提出一种从事务项集对应的最大频繁项集求全部属性项集的最大频繁项集的新算法IPA(Intersection Pruning Algorithm)。该算法通过交集剪枝实现自顶向下和自底向上的搜索最大频繁项集,并使用属性项的分布数据和已生成的交集等多种信息来减少求交集的次数;该算法最多只用求(1-最小支持度)×|D|+1个事务项集和其他事务项集的交集,从而可有效降低算法的时间复杂度;实验表明该算法有效可行,并且该算法易于实现。