计算机工程与应用 ›› 2010, Vol. 46 ›› Issue (35): 126-128.DOI: 10.3778/j.issn.1002-8331.2010.35.036
王玉荣,钱雪忠
WANG Yu-rong,QIAN Xue-zhong
摘要: 针对目前关联规则挖掘的数据集不断增大,而很多抽样算法精度不高还要解决一系列NP难问题等情况。在分析利用频繁1项集进行抽样处理的基础上,提出了高精度的基于频繁n项集平均划分的关联规则挖掘算法——EHAC算法。理论和实验都表明,EHAC能够提高数据挖掘精度,在数据平均划分的同时,尽量保证频繁n项集能够平均划分,减少了数据库扫描次数,一定程度上缩减了数据库规模。
中图分类号: