计算机工程与应用 ›› 2009, Vol. 45 ›› Issue (13): 160-162.DOI: 10.3778/j.issn.1002-8331.2009.13.046
郭建永,蔡 勇,甄艳霞
GUO Jian-yong,CAI Yong,ZHEN Yan-xia
摘要: 相似文档检索在文档管理中是很重要的,提出一种在大文档集中基于模糊聚类的快速高效的聚类方法,传统方法大都通过词与词之间的比较来检索文档,该方法让文档通过两层结构得出相似度。系统用预定义模糊簇来描述相似文档的特征向量,用这些向量估计相似度,由此得出文档之间的距离,系统应用了新的相似性度量方法,并通过实验证实了其可行性和高效性。