计算机工程与应用 ›› 2008, Vol. 44 ›› Issue (36): 156-159.DOI: 10.3778/j.issn.1002-8331.2008.36.044
汪维清,罗先文,胡继宽
WANG Wei-qing,LUO Xian-wen,HU Ji-kuan
摘要: Apriori算法虽然在候选集的产生时利用了剪支技术,但每次扫描数据库时都必须扫描整个数据库,因此扫描的数据量大,速度较慢。Apriori-sort算法是在Apriori算法基础上的改进,基本思想是把事务数据库变为以度表示的事务度数据库,并对事务度数据库进行排序。Apriori-sort算法查找频繁项集时,只扫描数据库Dd中满足d(Ck)≦d(Ti)的事务。对扫描数据库进行了有效剪支,因此Apriori-sort算法的计算效率高。并用仿真数据对Apriori-sort算法和Apriori算法进行了仿真对比实验,实验结果证明了新算法的高效性。