计算机工程与应用 ›› 2012, Vol. 48 ›› Issue (35): 106-109.
王 磊,黄广君
WANG Lei, HUANG Guangjun
摘要: 查询扩展是在原查询词的基础上加入相关的词或者词组,以克服自然语言的“二义性”问题,改进查询意愿的描述。在概念语义空间中进行查询词扩展,可以充分挖掘出查询词之间的关联程度,在整体上把握查询意愿。利用WordNet语义词典中的上下文关系和相似度关系为各个原始查询词构建语义树,并将这些语义树向上溯源建立完整的概念语义空间,以共现信息为特征参数对扩展源中的词进行筛选,以避免过度扩展引起查询语义漂移。还引入动态观察窗口加权模型,以强化共现信息对单词之间关联度的表示。实验结果表明,该扩展算法比传统伪相关反馈算法的扩展质量有明显提高。