计算机工程与应用 ›› 2019, Vol. 55 ›› Issue (14): 61-68.DOI: 10.3778/j.issn.1002-8331.1811-0103
李叶飞1,2,官国飞2,葛崇慧2,陈 翔3,倪 超1,钱柱中1
LI Yefei1,2, GUAN Guofei2, GE Chonghui2, CHEN Xiang3, NI Chao1, QIAN Zhuzhong1
摘要: 软件缺陷预测先前的研究工作主要关注软件缺陷分类问题,即判断一个软件模块是否含有缺陷。如何量化一个软件模块中含有软件缺陷的数量问题还未被很好地研究。针对该问题,提出了一种两阶段的软件模块缺陷数预测特征选择方法FSDNP:特征聚类阶段和特征选择阶段。在特征聚类阶段中,使用基于密度峰聚类的算法将高度相关的特征进行聚类;在特征选择阶段,设计了三种启发式的排序策略从簇中删除冗余的和无关的特征。在PROMISE数据集上,使用平均错误率和平均相对错误率指标,与6个经典的方法进行了比较。实验结果表明,FSDNP能够有效移除冗余的和无关的特征,构建高效的软件缺陷数预测模型。