计算机工程与应用 ›› 2008, Vol. 44 ›› Issue (13): 141-143.
赵小龙,张步群,丁为民
ZHAO Xiao-long,ZHANG Bu-qun,DING Wei-min
摘要: 提出了一种基于粒计算Web文档聚类(WDCGrc)方法。该方法通过TF-IDF法则计算文档词条的权值,采取设定文档阈值和平均权值相结合的方法实行降维,抽取出每篇文档的主干词;建立了文档的主干词和二进制粒之间的转换,提出了基于粒计算提取文档间的关联规则算法来获取文档间的频繁项集,由频繁项集形成初始聚类,使用优化算法对初始聚类进行优化,得到最终聚类结果。实验结果表明,该方法切实有效,聚类质量较好。