计算机工程与应用 ›› 2021, Vol. 57 ›› Issue (14): 27-38.DOI: 10.3778/j.issn.1002-8331.2101-0187
熊中敏,郭怀宇,吴月欣
XIONG Zhongmin, GUO Huaiyu, WU Yuexin
摘要:
大数据时代,数据爆炸式的增长,数据获取变得更容易的同时数据缺失现象也更加普遍。数据的缺失极大地降低了数据的实用性。数据缺失问题的处理成为大数据处理的热点研究课题。介绍了数据缺失问题的研究意义和国内外研究现状。系统地分析了造成数据缺失的原因,对数据缺失问题进行了分类。对近年来国内外缺失数据处理方法进行了综述,总结了各自优缺点、适用范围、效果评价指标。重点阐述了回归填充、聚类填充等填充方法。对缺失数据处理方法领域进行了总结与展望。