计算机工程与应用 ›› 2009, Vol. 45 ›› Issue (27): 140-142.DOI: 10.3778/j.issn.1002-8331.2009.27.042
何 明1,周 军1,李树友2
HE Ming1,ZHOU Jun1,LI Shu-you2
摘要: PageRank算法是一种用于网页排序的算法,它利用网页间的相互引用关系评价网页的重要性。但由于它只考虑网页与网页之间的链接结构,忽略了网页与主题的相关性,容易造成主题漂移现象。在分析了原PageRank算法基础上,给出了一种基于语义相似度的PageRank改进算法。该算法能够按照网页结构和网页主要内容计算出网页的PageRank值,既不会增加算法的时空复杂度,又极大地减少了“主题漂移”现象,从而提高查询效率和质量。
中图分类号: