计算机工程与应用 ›› 2020, Vol. 56 ›› Issue (6): 86-91.DOI: 10.3778/j.issn.1002-8331.1811-0323
顾兆军,吴优,赵春迪,周景贤
GU Zhaojun, WU You, ZHAO Chundi, ZHOU Jingxian
摘要:
针对传统基于机器学习的流量分类方法中数据不均衡影响分类效果的问题,提出了一种基于重采样的梯度增强树算法。该算法利用流量数据的统计特征,通过回溯搜索策略优化特征集合并设计适用于流量分类的树结构参数,构造最优模型;利用结合重采样的LightGBM算法修正数据不平衡性并进行分类测试。经实验验证,该算法提高了不平衡数据的分类效果,并且具有性能稳定、快速的优点。