计算机工程与应用 ›› 2010, Vol. 46 ›› Issue (5): 123-125.DOI: 10.3778/j.issn.1002-8331.2010.05.037
李 宏,阿玛尼,李 平,吴 敏
LI Hong,EMMANUEL Amani,LI Ping,WU Min
摘要: 实际应用中存在大量的丢失数据的数据集,对丢失数据的处理已成为目前分类领域的研究热点。分析和比较了几种通用的丢失数据填充算法,并提出一种新的基于EM和贝叶斯网络的丢失数据填充算法。算法利用朴素贝叶斯估计出EM算法初值,然后将EM和贝叶斯网络结合进行迭代确定最终更新器,同时得到填充后的完整数据集。实验结果表明,与经典填充算法相比,新算法具有更高的分类准确率,且节省了大量开销。
中图分类号: