计算机工程与应用 ›› 2014, Vol. 50 ›› Issue (15): 101-106.
姜 麟,米允龙,王 添
JIANG Lin, MI Yunlong, WANG Tian
摘要: 上、下近似空间是粗糙理论的重要概念,解决上、下近似问题是海量数据挖掘的基础。经典的近似空间算法不适合处理海量数据,更不适合处理带缺失信息的海量数据问题。为此,通过深度分析带缺失信息的海量数据特征,结合MapReduce编程模型,提出了基于MapReduce框架下近似空间的并行算法,以处理带缺失信息的海量数据,实验结果表明了该并行算法的有效性。