《计算机工程与应用》唯一官方网站
 首页  |  期刊介绍  |  编委会  |  投稿指南  |  道德声明  |  中图分类号  |  期刊订阅  |  联系我们  |  English
《计算机工程与应用》唯一官方网站
博士论坛 最新目录 | 下期目录 | 过刊浏览 | 高级检索  |   
基于聚类和自动编码机的缺失数据填充算法
卜范玉1,2,陈志奎1,张清辰1
1.大连理工大学 软件学院,辽宁 大连 116620
2.内蒙古财经大学 职业学院,呼和浩特 010010
Missing value imputation algorithm based on clustering and auto-encoder
BU Fanyu1,2, CHEN Zhikui1, ZHANG Qingchen1
1.School of Software Technology, Dalian University of Technology, Dalian, Liaoning 116620, China
2.College of Vocation, Inner Mongolia University of Finance and Economics, Huhhot 010010, China
 全文: PDF (529 KB)   HTML (1 KB)  输出: BibTeX | EndNote (RIS)      背景资料
摘要 当前的不完整数据处理算法填充缺失值时,精度低下。针对这个问题,提出一种基于CFS聚类和改进的自动编码模型的不完整数据填充算法。利用CFS聚类算法对不完整数据集进行聚类,对降噪自动编码模型进行改进,根据聚类结果,利用改进的自动编码模型对缺失数据进行填充。为了使得CFS聚类算法能够对不完整数据集进行聚类,提出一种部分距离策略,用于度量不完整数据对象之间的距离。实验结果表明提出的算法能够有效填充缺失数据。
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
卜范玉1
2
陈志奎1
张清辰1
关键词不完整数据   快速密度聚类算法(CFS)   自动编码机   部分距离策略     
Abstract: Existing algorithms are of low efficiency and effectiveness in imputing missing data. Aiming at this problem, the paper proposes a missing value imputation algorithm based on the CFS clustering and improved auto-encoder model. To cluster the incomplete data set, it improves the CFS clustering algorithm by introducing the partial distance strategy that is used to measure the distance between two objects with missing values. It uses the improved CFS algorithm to cluster the data set. The improved auto-encoder is used to estimate the missing values according to the clustering result. Experiments demonstrate that this proposed algorithm can impute the missing values effectively.
Key wordsincomplete data   Clustering by Fast Search and find of density peaks(CFS)   auto-encoder   partial distance strategy   
引用本文:   
卜范玉1,2,陈志奎1等. 基于聚类和自动编码机的缺失数据填充算法[J]. 《计算机工程与应用》唯一官方网站, 2015, 51(18): 13-17.
BU Fanyu1,2,CHEN Zhikui1 et al. Missing value imputation algorithm based on clustering and auto-encoder[J]. CEA, 2015, 51(18): 13-17.
链接本文:  
http://cea.ceaj.org/CN/
 
没有找到本文相关图表信息
没有本文参考文献
[1] 奉国和1,5,彭红毅2,蒋春福3,杜 明4. 基于ICA与SOM的不完整数据处理[J]. journal6, 2008, 44(4): 166-168.
[2] 陈景年1,2,黄厚宽1,田凤占1,薛小平3. 一种基于特征选择的不完整数据分类方法[J]. journal6, 2007, 43(31): 23-24.
版权所有 © 《《计算机工程与应用》唯一官方网站》编辑部
通信地址: 北京619信箱26分箱 邮编: 100083 电话: (010)89055542 E-mail: ceaj@vip.163.com
技术支持:北京玛格泰克科技发展有限公司
京ICP备13024262号-1