滑动窗口中数据流最大频繁项集挖掘算法研究

计算机工程与应用 ›› 2015, Vol. 51 ›› Issue (22): 145-149.

• 数据库、数据挖掘、机器学习 • 上一篇下一篇

滑动窗口中数据流最大频繁项集挖掘算法研究

尹绍宏，单坤玉，范桂丹

天津工业大学计算机科学与软件学院，天津 300387

出版日期:2015-11-15 发布日期:2015-11-16

Mining algorithm research of data stream maximum frequent itemsets in sliding window

YIN Shaohong, SHAN Kunyu, FAN Guidan

School of Computer Science and Software Engineering, Tianjin University of Technology, Tianjin 300387, China

Online:2015-11-15 Published:2015-11-16

摘要/Abstract

摘要： 数据流最大频繁项集的项集数目相对很少并且已隐含所有的频繁项集，所以数据流中最大频繁项集的挖掘具有很好的时空效率并且有很大的意义，也受到了业界更多的关注。针对数据流最大频繁项集的挖掘，提出了在滑动窗口中基于矩阵的数据流最大频繁项集挖掘方法SWM-MFI，主要采用两个矩阵来存储数据信息：一个矩阵是事务矩阵，存储事务数据；一个矩阵是二项集矩阵，存放频繁2-项集。通过二项集矩阵扩展得到频繁k-项集，基于SWM-MFI算法挖掘出最大频繁项集。经过理论和实验证明该算法具有很好的时效性。

关键词: 数据流, 滑动窗口, 最大频繁项集, 矩阵

Abstract: The number of itemsets in data stream maximum frequent itemsets is relatively few and has implied all frequent itemsets, so mining data stream maximum frequent itemsets has better efficiency in time and space and has great significance. It has gotten more attention by the industry. In view of the data stream maximum frequent itemsets, this paper proposes a mining method called SWM-MFI based on matrix of data stream maximum frequent itemsets in sliding window. The method stores the data information using two Matrixes：one called transaction matrix stores the transaction data and the other one called 2-itemsets matrix stores frequent 2-itemsets. Frequent k-itemsets can be got through the 2-itemsets matrix and the maximum frequent itemsets can be mined based on the method of SWM-MFI. The theories and experiments show that the method is better on time efficiency.

Key words: data stream, sliding window, maximum frequent itemsets, matrix

尹绍宏，单坤玉，范桂丹. 滑动窗口中数据流最大频繁项集挖掘算法研究[J]. 计算机工程与应用, 2015, 51(22): 145-149.

YIN Shaohong, SHAN Kunyu, FAN Guidan. Mining algorithm research of data stream maximum frequent itemsets in sliding window[J]. Computer Engineering and Applications, 2015, 51(22): 145-149.

[1]	邹杰，李俊. 多策略协方差矩阵学习差分进化算法[J]. 计算机工程与应用, 2021, 57(7): 78-87.
[2]	杨力，吴义，魏德宾，潘成胜. 基于时空相关性的卫星网络流量预测[J]. 计算机工程与应用, 2021, 57(7): 101-106.
[3]	逯曼皎，张伟，徐涛. 基于动态矩阵模型的可优化的补货策略[J]. 计算机工程与应用, 2021, 57(7): 263-268.
[4]	甘昕艳，高翔. 基于犹豫模糊决策算法的云制造系统选择研究[J]. 计算机工程与应用, 2021, 57(2): 134-142.
[5]	丁玉祥，卞维新，接标，赵俊. 融合邻域回归和稀疏表示的图像超分辨率重构[J]. 计算机工程与应用, 2021, 57(2): 230-236.
[6]	王英博，孙永荻. 基于GNN的矩阵分解推荐算法[J]. 计算机工程与应用, 2021, 57(19): 129-134.
[7]	张呈玲，李进金，林艺东. 基于OE-概念格的形式背景属性约简[J]. 计算机工程与应用, 2021, 57(15): 82-89.
[8]	夏英，张金凤. 融合社交关系和局部地理因素的兴趣点推荐[J]. 计算机工程与应用, 2021, 57(15): 133-139.
[9]	白璐，赵鑫，孔钰婷，张正航，邵金鑫，钱育蓉. 谱聚类算法研究综述[J]. 计算机工程与应用, 2021, 57(14): 15-26.
[10]	王俊红，郭亚慧. 面向动态数据块的非平衡数据流分类算法[J]. 计算机工程与应用, 2021, 57(13): 124-129.
[11]	张阳，鲁鸣鸣，郑一基，李海峰. 基于图自编码器模型的学生成绩预测[J]. 计算机工程与应用, 2021, 57(13): 251-257.
[12]	周玉，朱文豪，房倩，白磊. 基于聚类的离群点检测方法研究综述[J]. 计算机工程与应用, 2021, 57(12): 37-45.
[13]	郑淋文，周金治，黄静. 深度稀疏自编码器在ECG特征提取中的应用[J]. 计算机工程与应用, 2021, 57(11): 156-161.
[14]	王杰，黄丽霞，张雪英. 改进DSB方法的语音信号多声源定位[J]. 计算机工程与应用, 2021, 57(1): 173-180.
[15]	张进，孙福振，王绍卿，王帅，鹿祥志. 融合社交关系与地理信息的兴趣点推荐模型[J]. 计算机工程与应用, 2020, 56(5): 173-178.

滑动窗口中数据流最大频繁项集挖掘算法研究

Mining algorithm research of data stream maximum frequent itemsets in sliding window

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics