关联规则中频繁项集高效挖掘的研究

doi:10.3778/j.issn.1002-8331.2011.03.042

计算机工程与应用 ›› 2011, Vol. 47 ›› Issue (3): 139-141.DOI: 10.3778/j.issn.1002-8331.2011.03.042

• 数据库、信号与信息处理 • 上一篇下一篇

关联规则中频繁项集高效挖掘的研究

张云涛¹，于治楼²，张化祥¹

1.山东师范大学信息科学与工程学院，济南 250014
2.浪潮集团有限公司，济南 250101

收稿日期:2009-06-26 修回日期:2009-10-23 出版日期:2011-01-21 发布日期:2011-01-21
通讯作者: 张云涛

Research on high efficiency mining frequent itemsets on association rules

ZHANG Yuntao¹，YU Zhilou²，ZHANG Huaxiang¹

1.School of Information Science and Engineering，Shandong Normal University，Jinan 250014，China
2.Inspur Group，Jinan 250101，China

Received:2009-06-26 Revised:2009-10-23 Online:2011-01-21 Published:2011-01-21
Contact: ZHANG Yuntao

摘要/Abstract

摘要： 针对Apriori时间性能较低的缺陷，结合二项集支持度矩阵提出了Apriori改进算法Apriori-M。在扫描数据库时生成一个二项集支持度矩阵，利用矩阵的性质提高了连接和剪枝的效率；通过第二次扫描数据库就能正确地获取所有的频繁项集，并很好地解决了Apriori生成无效二项集的问题。实验结果表明Apriori-M的性能优于Apriori。

关键词: 关联规则, Apriori算法, 事务数据库, 频繁项, 支持度矩阵

Abstract: An improved algorithm Apriori-M which combines with 2-itemsets support count matrix is brought forward for its lower efficiency of time.The algorithm scans the database to generate 2-itemsets support count matrix，and then improves the efficiency of the connectivity and the pruning by the character of the matrix；gets all the frequent itemsets correctly by scanning the database second time，and also solves the question about generating 2-itemsets invalid.Experimental results show that the capability of the improved algorithm is more efficient than Apriori.

Key words: association rules, Apriori algorithm, transaction database, frequent itemsets, support matrix

中图分类号:

TP391.4

张云涛¹，于治楼²，张化祥¹. 关联规则中频繁项集高效挖掘的研究[J]. 计算机工程与应用, 2011, 47(3): 139-141.

ZHANG Yuntao¹，YU Zhilou²，ZHANG Huaxiang¹. Research on high efficiency mining frequent itemsets on association rules[J]. Computer Engineering and Applications, 2011, 47(3): 139-141.

[1]	张振海，张湘婷. 上下文感知的高铁信息服务推荐方法研究[J]. 计算机工程与应用, 2021, 57(12): 231-236.
[2]	杨葛英，沈夏炯，史先进，张磊. 以概念格为背景的关联规则可视化[J]. 计算机工程与应用, 2021, 57(1): 84-91.
[3]	纪文璐，王海龙，苏贵斌，柳林. 基于关联规则算法的推荐方法研究综述[J]. 计算机工程与应用, 2020, 56(22): 33-41.
[4]	顾军华，苏鸣，张亚娟，张丹红. 基于位编码链表的快速频繁模式挖掘算法研究[J]. 计算机工程与应用, 2020, 56(19): 86-93.
[5]	刘莉萍1，章新友1，牛晓录2，郭永坤1，丁亮1. 基于Spark的并行关联规则挖掘算法研究综述[J]. 计算机工程与应用, 2019, 55(9): 1-9.
[6]	杨珍，耿秀丽. 考虑多粒度属性约简的关联规则挖掘研究[J]. 计算机工程与应用, 2019, 55(6): 133-139.
[7]	曹卫东1，2，许代代2，王静2，王家亮2. 民航NOSHOW预测及强因子关联分析[J]. 计算机工程与应用, 2019, 55(2): 221-227.
[8]	郭鹏，蔡骋. 基于聚类和关联算法的学生成绩挖掘与分析[J]. 计算机工程与应用, 2019, 55(17): 169-179.
[9]	曹菁菁1，任欣欣2，徐贤浩2. 基于并行Apriori的物流路径频繁模式研究[J]. 计算机工程与应用, 2019, 55(11): 257-264.
[10]	郭世伟，孟昱煜，陈绍立. 改进的PSOGM算法在动态关联规则挖掘中的应用[J]. 计算机工程与应用, 2018, 54(8): 160-165.
[11]	赵慧茹，林民. 融合关联规则的学术论文主题学习及表示方法[J]. 计算机工程与应用, 2018, 54(20): 159-165.
[12]	石陆魁1，张欣1，师胜利2. 基于Spark的FP_Growth算法的并行与优化[J]. 计算机工程与应用, 2018, 54(13): 52-58.
[13]	刘琰，张进，陈静，尹美娟，张伟丽. 基于最大频繁项集挖掘的微博炒作群体发现方法[J]. 计算机工程与应用, 2017, 53(4): 90-97.
[14]	王晓丹，王建宇. 自动售药机配仓算法研究[J]. 计算机工程与应用, 2017, 53(4): 256-262.
[15]	颜宏文，邹丹. 基于关联规则的PSO-Elman短期风速预测[J]. 计算机工程与应用, 2017, 53(23): 261-266.

关联规则中频繁项集高效挖掘的研究

Research on high efficiency mining frequent itemsets on association rules

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics