一种基于模式树的频繁项集快速挖掘算法

计算机工程与应用 ›› 2007, Vol. 43 ›› Issue (11): 15-16.

一种基于模式树的频繁项集快速挖掘算法

战立强刘大昕张健沛

哈尔滨工程大学计算机科学与技术学院哈尔滨工程大学计算机科学与技术学院

收稿日期:2007-01-18 修回日期:1900-01-01 出版日期:2007-04-11 发布日期:2007-04-11
通讯作者: 战立强

A Fast algorithm for frequent item-set mining based on Pattern tree

Da-xin LUI

Received:2007-01-18 Revised:1900-01-01 Online:2007-04-11 Published:2007-04-11

摘要/Abstract

摘要： 模式树是目前频繁项集挖掘最常用的数据结构，使用模式树可以有效地将数据库压缩于内存，并在内存中完成对频繁项集的挖掘。为了进一步提高频繁项集挖掘算法的可扩展性，本文对模式树进行了细致的研究，在此基础上提出了一种挖掘频繁项集的新算法，FP-DFS算法。该算法通过对模式树的各种操作简化了对频繁项集的搜索过程。实验表明，该算法对于频繁项集挖掘具有比较高的效率。

关键词: 关联规则, 频繁项集挖掘, 可扩展性, 模式树

Abstract: Pattern tree was the most frequently used data structure in frequent item-set mining. By using Pattern tree, database could be effectively compressed into main memory, and the subsequence mining task could be completed in main memory. To make further improvement on the scalability of the algorithm, we made a further study on the Pattern tree, and proposed a new algorithm called FP-DFS based on the study. FP-DFS simplifies the mining processes through applying various operations on Pattern tree. The experiments show that FP-DFS had good efficiency in frequent item-set mining.

Key words: association rule, frequent item-set mining, scalability, Pattern tree

战立强刘大昕张健沛. 一种基于模式树的频繁项集快速挖掘算法[J]. 计算机工程与应用, 2007, 43(11): 15-16.

Da-xin LUI. A Fast algorithm for frequent item-set mining based on Pattern tree[J]. Computer Engineering and Applications, 2007, 43(11): 15-16.

[1]	张振海，张湘婷. 上下文感知的高铁信息服务推荐方法研究[J]. 计算机工程与应用, 2021, 57(12): 231-236.
[2]	杨葛英，沈夏炯，史先进，张磊. 以概念格为背景的关联规则可视化[J]. 计算机工程与应用, 2021, 57(1): 84-91.
[3]	纪文璐，王海龙，苏贵斌，柳林. 基于关联规则算法的推荐方法研究综述[J]. 计算机工程与应用, 2020, 56(22): 33-41.
[4]	顾军华，苏鸣，张亚娟，张丹红. 基于位编码链表的快速频繁模式挖掘算法研究[J]. 计算机工程与应用, 2020, 56(19): 86-93.
[5]	刘莉萍1，章新友1，牛晓录2，郭永坤1，丁亮1. 基于Spark的并行关联规则挖掘算法研究综述[J]. 计算机工程与应用, 2019, 55(9): 1-9.
[6]	郭鹏，蔡骋. 基于聚类和关联算法的学生成绩挖掘与分析[J]. 计算机工程与应用, 2019, 55(17): 169-179.
[7]	郭世伟，孟昱煜，陈绍立. 改进的PSOGM算法在动态关联规则挖掘中的应用[J]. 计算机工程与应用, 2018, 54(8): 160-165.
[8]	赵慧茹，林民. 融合关联规则的学术论文主题学习及表示方法[J]. 计算机工程与应用, 2018, 54(20): 159-165.
[9]	石陆魁1，张欣1，师胜利2. 基于Spark的FP_Growth算法的并行与优化[J]. 计算机工程与应用, 2018, 54(13): 52-58.
[10]	王晓丹，王建宇. 自动售药机配仓算法研究[J]. 计算机工程与应用, 2017, 53(4): 256-262.
[11]	颜宏文，邹丹. 基于关联规则的PSO-Elman短期风速预测[J]. 计算机工程与应用, 2017, 53(23): 261-266.
[12]	柳毅1，杨领1，杨育斌2. 基于Rabin算法的可扩展RFID双向认证协议[J]. 计算机工程与应用, 2017, 53(2): 15-20.
[13]	徐珺1，李明霞2，刘保相2. 基于区间概念格的规则优化方法与应用[J]. 计算机工程与应用, 2017, 53(13): 167-173.
[14]	薛福亮1，马　　莉2. 利用动态产品分类树改进的关联规则推荐方法[J]. 计算机工程与应用, 2016, 52(4): 135-141.
[15]	曹博1，倪建成2，李淋淋1，于苹苹1，姚彬修1. 基于Spark的并行频繁模式挖掘算法[J]. 计算机工程与应用, 2016, 52(20): 86-91.