计算机工程与应用 ›› 2021, Vol. 57 ›› Issue (21): 102-108.DOI: 10.3778/j.issn.1002-8331.2010-0096
李珑珠,林耀进,吕彦,卢舜,王晨曦
LI Longzhu, LIN Yaojin, LYU Yan, LU Shun, WANG Chenxi
摘要:
开放动态环境下的机器学习任务面临着数据特征空间的高维性和动态性。目前已有在线流特征选择算法基本仅考虑特征的重要性和冗余性,忽略了特征的交互性。特征交互是指那些本身与标签单独统计时呈现无关或弱相关,但与其他特征结合时却能与标签呈强相关的特征。基于此,提出一种基于邻域信息交互的在线流特征选择算法,该算法分为在线交互特征选择和在线冗余特征剔除两个阶段,即直接计算新到特征与整个已选特征子集的交互强弱程度,以及利用成对比较机制剔除冗余特征。在10个数据集上的实验结果表明了所提算法的有效性。