计算机工程与应用 ›› 2014, Vol. 50 ›› Issue (19): 113-117.
徐 明1,高 翔2,许志刚2,刘 磊2
XU Ming1, GAO Xiang2, XU Zhigang2, LIU Lei2
摘要: 通过对微博文本特征信息的分析与研究,提出一种基于改进卡方统计的微博特征提取方法。扩充微博信息分类特征,在传统的卡方统计量的基础上,引入了频度等因素,改进特征选择方法;在传统的特征项权值计算的基础上,提出了新的改进卡方统计量的方法,改进权重计算效果。对上述方法利用经典KNN和SVM算法进行了测试,实验结果表明该方法提高了微博信息分类的准确率。