计算机工程与应用 ›› 2008, Vol. 44 ›› Issue (1): 155-158.
刘俊强1,2,苗克坚1,霍 华2
LIU Jun-qiang1,2,MIAO Ke-jian1,HUO Hua2
摘要: 为提高检索性能,提出将基于高斯分布-指数分布混合模型的融合方法应用于分布式检索系统的多站点融合。该方法利用高斯密度函数和指数密度函数分别描述站点检索结果集合的相关文档和非相关文档的相关分值分布,并用基于混合模型的方法对相关分值进行规范化处理,然后对规范化处理后的相关分值进行合并。该融合方法考虑到了相关文档和非相关文档在分值分布上的差异,使计算出的相关分值更加准确,而且可以为性能比较好的站点分配更高的权重值,以提高整个系统的平均查准率。实验结果表明该方法优于其它融合方法。