摘要: 本文分析了当前Web信息检索的技术现状,指出检索效率不高的根本原因在于搜索引擎所采用的排序函数和标引词加权技术。介绍了传统的信息检索排序函数和标引词加权技术。分析了Web文档的特点,指出其主要形式HTML文档是一种结构化文档,结构由标签显式的定义,不同文档结构对检索性能的贡献不同。对本领域国内外学者的成果作了对比研究。最后探讨了Web信息检索排序函数及标引词加权技术的发展方向。
赵正文 康耀红. Web信息检索结构化排序函数与标引词加权技术[J]. 计算机工程与应用, 2007, 43(11): 181-184.
Zhao Zhengwen YaoHong Kang. Survey on Structured Ranking Function and Term Weighting Technology of Web Information Retrieval[J]. Computer Engineering and Applications, 2007, 43(11): 181-184.