%0 Journal Article %A $authorName.trim() %T 一种新的英文文本检索算法 %D 2010 %R 10.3778/j.issn.1002-8331.2010.05.007 %J 计算机工程与应用 %P 21-23 %V 46 %N 5 %X 提出一种新的英文文本检索算法,该算法将英文文本映射为26阶频率矩阵,然后通过奇异值分解,对文本表示空间进行降维处理,并融合第一奇异值分量和第二奇异值分量的特征,得到既反映字母统计频率,又反映文本字符间顺序结构的复特征向量,最后利用向量间余弦相似度作为文本检索的相似度度量。数据对比表明,算法取得了较好的实验效果,且在检索准确率和运算效率上优于经典的LSA算法。 %U http://cea.ceaj.org/CN/10.3778/j.issn.1002-8331.2010.05.007