计算机工程与应用 ›› 2021, Vol. 57 ›› Issue (16): 125-133.DOI: 10.3778/j.issn.1002-8331.2005-0212
周爱君,努尔布力,艾壮,肖中正
ZHOU Aijun, NURBOL, AI Zhuang, XIAO Zhongzheng
摘要:
为解决WebShell样本在文本向量化处理中出现的“维度灾难”和检测效果差的问题,提出了基于近邻成分分析(Neighborhood Component Analysis,NCA)的WebShell特征处理算法。算法通过NCA自动化学习投影矩阵,在保留全局信息的同时完成高维特征空间的约减,为避免过于依赖总体训练样本,采用ReliefF特征选择方法从局部信息的角度进一步优化特征处理,提高WebShell模型检测性能。实验表明,基于近邻成分分析的WebShell特征处理方法能有效检测WebShell,并在准确率、召回率上优于大多数传统特征处理算法的WebShell检测模型。