计算机工程与应用 ›› 2009, Vol. 45 ›› Issue (34): 144-146.DOI: 10.3778/j.issn.1002-8331.2009.34.044
刘金岭
LIU Jin-ling
摘要: 给出的算法思想是首先计算出中文短信的相似度,再通过使用Isomap方法得到短信在语义空间中的嵌入情况,然后将短信在低维嵌入上进行聚类分析。该算法克服了短信的传统聚类分析在表示层次上遇到的困难,也克服了词频统计法不能将内容意思相似的短信聚集在一起的缺点,实验表明该算法是行之有效的。
中图分类号: