计算机工程与应用 ›› 2008, Vol. 44 ›› Issue (4): 187-189.

• 数据库与信息处理 • 上一篇    下一篇

基于用户兴趣的搜索结果动态聚类算法

李 营1,2,王儒敬1,2,王大为1,2,魏保子1,2   

  1. 1.中国科学院 合肥智能机械研究所,合肥 230031
    2.中国科学技术大学 自动化系,合肥 230026
  • 收稿日期:2007-06-06 修回日期:2007-08-02 出版日期:2008-02-01 发布日期:2008-02-01
  • 通讯作者: 李 营

Algorithm to cluster search results based-on users’ interest

LI Ying1,2,WANG Ru-jing1,2,WANG Da-wei1,2,WEI Bao-zi1,2   

  1. 1.Institute of Intelligent Machines,CAS,Hefei 230031,China
    2.Department of Automation,University of Science and Technology of China,Hefei 230026,China
  • Received:2007-06-06 Revised:2007-08-02 Online:2008-02-01 Published:2008-02-01
  • Contact: LI Ying

摘要: 目前搜索引擎返回的结果往往比较多,而且各类文档混合在一起,没有针对性,使用者仍然需要花费大量时间来寻找自己感兴趣的文档。提出了一种对搜索结果动态聚类算法,利用用户的兴趣特点,从搜索结果的文档中抽取摘要,利用这种摘要随着用户的浏览进程进行动态聚类,将这些文档聚成不同类别。用户只需要找出自己感兴趣类别,便可以得到足够多感兴趣的文档。实验证明,这种方法是有效的,并具有抗噪声等良好性能。

关键词: 搜索引擎, 文本聚类, 用户兴趣聚焦

Abstract: A method to cluster,the results of the search engine is proposed.Based on the users’interest,a document digest algorithm is discussed.Using this digest,it can cluster the raw result of search engine into different topic dynamically when user browsing. Experiments show that this method is effective.

Key words: search engine, text clustering, user interest focuses