计算机工程与应用 ›› 2012, Vol. 48 ›› Issue (5): 110-112.
阿力木江·艾沙1,2,吐尔根·依布拉音2,艾山·吾买尔2,马尔哈巴·艾力2
Alimjan AYSA1,2, Turgun IBRAHIM2, Hasan OMAR2, Marhaba ALI2
摘要: 随着Internet上维吾尔文信息的迅速发展,维吾尔文文本分类成为处理和组织这些大量文本数据的关键技术。研究维吾尔文文本分类相关技术和方法,针对维吾尔文文本在向量空间模型(VSM)表示下的高维性,采用词干提取和IG相结合的方法对表示空间进行降维。采用基于机器学习的分类算法(kNN和Na?ve Bayes)对维吾尔文文本语料进行了分类实验并分析了实验结果。