摘要: 针对中文数据清洗研究进行了综述。阐明了全面数据质量管理与数据清洗之间的关系,给出数据清洗的定义及对象;介绍中文数据清洗问题产生的背景、国内外研究现状与研究热点,并简介其基本原理、模型及已有算法;着重阐明了中文数据清洗的方法;总结中文数据清洗研究的不足,并对中文数据清洗的研究及应用进行了展望。
叶 鸥1,张 璟1,李军怀2. 中文数据清洗研究综述[J]. 计算机工程与应用, 2012, 48(14): 121-129.
YE Ou1, ZHANG Jing1, LI Junhuai2. Survey of Chinese data cleaning[J]. Computer Engineering and Applications, 2012, 48(14): 121-129.