计算机工程与应用 ›› 2009, Vol. 45 ›› Issue (31): 118-121.DOI: 10.3778/j.issn.1002-8331.2009.31.035
麻雪云1,肖诗斌1,2,王弘蔚1,2,施水才1,2
MA Xue-yun1,XIAO Shi-bin1,2,WANG Hong-wei1,2,SHI Shui-cai1,2
摘要: 目前,搜索结果聚类方法大多数采用基于文档的方法,不能生成有意义的聚类标签。为了解决这个问题,提出一种基于关键名词短语聚类的中文搜索结果聚类方法,该方法将名词短语、相关搜索词作为候选聚类标签,利用C-Value算法、IDF值筛选标签,然后使用Chameleon算法将标签聚类,最后将搜索结果划分到最相关的聚类簇。实验证明,该方法把关键名词短语和相关搜索词作为聚类标签,有效地提高了标签的描述性,降低了聚类算法的时间复杂度。
中图分类号: