计算机工程与应用 ›› 2011, Vol. 47 ›› Issue (28): 139-142.
林 伟,孟凡荣,王志晓
LIN Wei,MENG Fanrong,WANG Zhixiao
摘要: 文本分类是组织和处理海量文本信息的关键方法。目前的文本分类模型多用关键词特征向量描述文本资源,造成向量的高维性和稀疏性。引入文本资源的概念特征,将文本资源描述由关键词级提升至概念级,提高文本资源描述的准确性,并提出了基于概念特征的语义文本分类模型。仿真实验的结果表明,该模型能有效克服资源特征向量空间的高维性和稀疏性,确保向量空间的正交性,在语义文本分类的效率和正确性上都有良好的表现。