计算机工程与应用 ›› 2012, Vol. 48 ›› Issue (5): 71-74.
周剑峰1,阳爱民2,刘吉财2
ZHOU Jianfeng1, YANG Aimin2, LIU Jicai2
摘要: 在基于C4.5算法的网络流量分类方法中,网络流量数据量的海量性及其特征的多样性使得决策树的构建速度、分类速度成为评价网络流量分类器的重要标准。在原C4.5算法的基础上提出一种改进的信息熵的计算方法,通过减少计算函数的复杂度,提高决策树的构建速度。实验表明,基于改进后算法的分类器在达到原有分类准确率的同时,极大地缩短了决策树的构成时间。