计算机工程与应用 ›› 2010, Vol. 46 ›› Issue (34): 123-125.DOI: 10.3778/j.issn.1002-8331.2010.34.037
范小丽,刘晓霞
收稿日期:
2010-05-18
修回日期:
2010-07-06
出版日期:
2010-12-01
发布日期:
2010-12-01
通讯作者:
范小丽
FAN Xiao-li,LIU Xiao-xia
Received:
2010-05-18
Revised:
2010-07-06
Online:
2010-12-01
Published:
2010-12-01
Contact:
FAN Xiao-li
摘要: 针对互信息特征选择方法由于没有很好结合正相关特征和负相关特征,影响在不平衡语料集上分类效果的问题,用平衡因子调整正相关和负相关特征比例,加强特征选择时负相关特征的作用。同时引入特征分布差异因子,区分类强相关特征,提高分类效果。最后通过实验证明,改进的互信息特征选择方法具有可行性和有效性。
中图分类号:
范小丽,刘晓霞. 文本分类中互信息特征选择方法的研究[J]. 计算机工程与应用, 2010, 46(34): 123-125.
FAN Xiao-li,LIU Xiao-xia. Study on mutual information-based feature selection in text categorization[J]. Computer Engineering and Applications, 2010, 46(34): 123-125.
[1] | 陈 旺1,李 波1,史彦军2,滕弘飞2. 求解RCPSP问题的带分布估计的差异演化算法[J]. 计算机工程与应用, 2011, 47(4): 1-4. |
[2] | 沙全友1,施进发1,秦现生2. 航空产品研发过程实时动态分解与优化配置[J]. 计算机工程与应用, 2011, 47(4): 9-12. |
[3] | 戴 芹,刘建波,刘士彬. 群智能方法在遥感信息提取中的应用分析[J]. 计算机工程与应用, 2011, 47(4): 13-16. |
[4] | 刘光帅,李柏林,何朝明. 分段光滑曲面重构的面片图稀疏优化方法[J]. 计算机工程与应用, 2011, 47(4): 22-25. |
[5] | 龙银芳,尚俊娜. MC-CDMA系统载波频偏估计[J]. 计算机工程与应用, 2011, 47(4): 102-104. |
[6] | 于江德1,王希杰1,樊孝忠2. 汉语分词中上文和下文重要性比较[J]. 计算机工程与应用, 2011, 47(4): 117-120. |
[7] | 裴英博1,刘晓霞2. 文本分类中改进型CHI特征选择方法的研究[J]. 计算机工程与应用, 2011, 47(4): 128-130. |
[8] | 张 瑜,罗 可. 基于OC-SVM的大型数据集分类方法[J]. 计算机工程与应用, 2011, 47(4): 131-133. |
[9] | 刘荣辉1,2,郑建国1. Deep Web下基于中文分词的聚类算法[J]. 计算机工程与应用, 2011, 47(4): 138-140. |
[10] | 才让加. 藏语语料库词类描述方法研究[J]. 计算机工程与应用, 2011, 47(4): 146-148. |
[11] | 刘秀玲,刘 京,王洪瑞,郭 磊. 改进型蜂窝状空间分解的实时碰撞检测[J]. 计算机工程与应用, 2011, 47(4): 149-153. |
[12] | 张 聪,桂志国. 噪声控制的图像非线性锐化方法[J]. 计算机工程与应用, 2011, 47(4): 154-156. |
[13] | 付小君1,郭鹏江1,郭 竞2,冯 筠2. 统计特征和Markov模型在三维模型分类中的应用[J]. 计算机工程与应用, 2011, 47(4): 157-159. |
[14] | 陈慧杰,赖惠成,贾志强. 图像混合和小波变换的双重彩色图像隐藏[J]. 计算机工程与应用, 2011, 47(4): 171-173. |
[15] | 杨晓琴,季晓勇. 基于H.264的快速运动估计算法[J]. 计算机工程与应用, 2011, 47(4): 174-175. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||