计算机工程与应用 ›› 2017, Vol. 53 ›› Issue (18): 115-120.DOI: 10.3778/j.issn.1002-8331.1604-0023
魏 文1,杨辉华1,2,李灵巧1,2,杨 浩1,何胜韬3
WEI Wen1, YANG Huihua1,2, LI Lingqiao1,2, YANG Hao1, HE Shengtao3
摘要: 以智慧城市管理应用系统中的案件上报短文本为对象,研究有效的特征生成和特征选择方法,实现案件快速准确地自动分类。根据案件描述短文本的特点,提出一种互邻特征组合算法,以生成描述力更强的组合特征;为进一步约减特征并优化特征空间,提出一种新的隶属度函数来为分类体系中的每个类别构建一个类别特征域,然后利用类别特征域进一步优化选择原始特征与组合特征,最终得到对分类贡献最高的特征表示集合。以南宁市青秀区“城管通”App中的案例分类为实例,验证提出的特征生成及选择方法,实验表明相对于文档频率、互信息和信息增益,提出的方法对案件分类的准确率更高,引入组合特征能显著提升分类准确率。