计算机工程与应用 ›› 2011, Vol. 47 ›› Issue (5): 118-122.
阳小兰,钱 程,赵海廷
YANG Xiaolan,QIAN Cheng,ZHAO Haiting
摘要: 设计了一种在中英文环境下、能够对Nutch的搜索结果进行聚类处理的搜索结果聚类系统,该系统基于k-means算法和后缀树聚类算法,是一个由Nutch搜索引擎、文本分词、TF-IDF权重计算以及文本聚类等模块构成的搜索引擎结果文档聚类系统,并通过实验对k-means算法和后缀树算法进行了对比。