计算机工程与应用 ›› 2008, Vol. 44 ›› Issue (5): 180-183.
刘凤晨1,刘庆文2,胡 玥2,黄 河1
LIU Feng-chen1,LIU Qing-wen2,HU Yue2,HUANG He1
摘要: 对分词检索算法n-Gram/2L的索引结构作了改进,在第二级倒排表中加入对文章标识的索引,提出一种基于Zigzag的分词检索算法n-Gram/2LZ(n-Gram/2L on Zigzag join)。在对数据量较大的文章进行检索和索引时,该算法在保留原有算法特性的基础上进一步减少了索引冗余,降低了索引的存储量,同时对查询算法的优化降低了查询时的系统开销,并且减少索引中记录访问次数,提高了查询效率。