计算机工程与应用 ›› 2009, Vol. 45 ›› Issue (7): 159-163.DOI: 10.3778/j.issn.1002-8331.2009.07.048
陶剑文1,2,赵杰煜2,姚奇富1
TAO Jian-wen1,2,ZHAO Jie-yu2,YAO Qi-fu1
摘要: 基于频繁模式的分类应用研究尚处于初始阶段,但其在关系数据、文本文档与图等方面的分类应用已取得初步成果。系统地研究了基于信息增益区分的频繁模式分类问题,提出了一种基于信息增益区分的频繁模式分类模型(IGFPC),从理论上论证了该模型的可行性。通过建立模式频率与基于信息增益区分度量间的联系,提出了一种在挖掘有用频繁模式上设置最小支持度阀值的方法,基于该方法和提出的特征选择算法(IGPS),生成用以构建高质量模式分类器的区分频繁模式。实验研究显示基于信息增益区分的频繁模式分类框架模型能在分类大数据集上达到较好的扩展性能和较高的分类精度。