计算机工程与应用 ›› 2020, Vol. 56 ›› Issue (19): 86-93.DOI: 10.3778/j.issn.1002-8331.1911-0052
顾军华,苏鸣,张亚娟,张丹红
GU Junhua, SU Ming, ZHANG Yajuan, ZHANG Danhong
摘要:
多数基于FP-growth思想的频繁模式挖掘算法存在建树过程复杂、支持度计算繁琐的问题。针对这些问题,提出一种基于位编码链表(Bitmap-Code List,BC-List)的频繁项集挖掘算法(BC-List Frequent Itemsets Mining,BCLFIM)。该算法首先采用基于位图表示的节点编码模型生成位图树(BC-tree),以BC-tree的节点信息作为数据结构通过按位运算来快速获取BC-List的节点集,避免了复杂的交集运算,提高了连接效率;其次通过使用超集等价和支持度计数剪枝策略,缩小了挖掘频繁模式的搜索空间。实验结果证明,该算法相比于FIN算法和DFIN算法具有更快的挖掘速度。