摘要: 提出一种新的基于术语簇和关联规则的文档聚类方法。首先对文档集合进行分词,根据术语之间的平均互信息形成术语簇,用术语簇来表示文档矢量空间模型,使用关联规则挖掘文档的初始聚类,对此进行聚类分析获得最终的文档聚类。实验结果表明,与传统的聚类方法相比,其运行速度快,聚类效果和聚类质量都有明显提高。
徐建民 成岳鹏 辛丽军. 一种基于术语簇和关联规则的文档聚类方法[J]. 计算机工程与应用, 2007, 43(5): 178-181.
YuePeng Cheng. A Document Clustering Approach Based on Term Clustering and Association Rules[J]. Computer Engineering and Applications, 2007, 43(5): 178-181.