计算机工程与应用 ›› 2014, Vol. 50 ›› Issue (2): 129-132.
白培发1,王成良1,2,徐 玲2
BAI Peifa1, WANG Chengliang1,2, XU Ling2
摘要: 相似度评分算法是Lucene引擎中的核心部分之一。对Lucene内部的相似度评分算法进行研究分析后,针对Lucene只关心查询词出现的频率,而不关心它们所在的位置这一缺陷提出了一种改进的算法。改进的算法将词语位置关系特征融合到Lucene原始相似度评分算法中。在TREC数据集上的实验结果表明:改进后的算法与Lucene原始算法相比,在MAP和P@n指标上都有一定程度的提高。