计算机工程与应用 ›› 2007, Vol. 43 ›› Issue (12): 162-163.
赵鹏 蔡庆生
ZHAO Peng1,2,CAI Qing-sheng2
摘要: 针对基于关键词集的中文文本聚类算法中存在的问题,本文将《知网》引入到中文文本的特征表示中,并在此基础上提出了一种基于《知网》的中文文本聚类算法。该算法在中文文本表示中加入了基于《知网》的概念特征,实验结果表明该算法能够更好地将语义相关的中文文档聚集在一起,与传统的基于关键词集的中文文本聚类算法相比,聚类质量得到了较大提高。