计算机工程与应用 ›› 2013, Vol. 49 ›› Issue (20): 112-117.
李伟卫1,赵 航2,张 阳1,王 勇3
LI Weiwei1, ZHAO Hang2, ZHANG Yang1, WANG Yong3
摘要: MapReduce是一种编程模型,可以运行在异构环境下,编程简单,不必关心底层实现细节,用于大规模数据集的并行运算。将MapReduce应用在数据挖掘的三个算法中:朴素贝叶斯分类算法、K-modes聚类算法和ECLAT频繁项集挖掘算法。实验结果表明,在保证算法准确率的前提下,MapReduce可以有效提高海量数据挖掘工作的效率。