摘要: 重复记录的清除是数据清洗领域的核心问题,但如何实施有效的清除一直是研究的难点。提出了一种通过建立聚类反馈模式规约来验证重复记录的有效性方法。依据经过聚类后各个类别间的关联性关系分析,首先提出了聚类模式和反馈模式的概念和实现方法;然后给出了数据清洗中聚类反馈模式规约;最后应用项目案例验证了它的有效性。
石彦华,李蜀瑜. 聚类反馈学习的数据清洗研究[J]. 计算机工程与应用, 2011, 47(30): 127-131.
SHI Yanhua,LI Shuyu. Research of data cleaning based on clustering feedback[J]. Computer Engineering and Applications, 2011, 47(30): 127-131.