计算机工程与应用 ›› 2016, Vol. 52 ›› Issue (7): 86-90.
任建华,沈炎彬,孟祥福,王 伟
REN Jianhua, SHEN Yanbin, MENG Xiangfu, WANG Wei
摘要: 针对现有的空间向量模型在进行文档表示时忽略词条之间的语义关系的不足,提出了一种新的基于关联规则的文档向量表示方法。在广义空间向量模型中分析词条的频繁同现关系得到词条同现语义,根据关联规则分析词条之间的关联相关性,挖掘出文档中词条之间的潜在关联语义关系,将词条同现语义和关联语义线性加权对文档进行表示。实验结果表明,与BOW模型和GVSM模型相比,采用关联规则文档向量表示的文档聚类结果更准确。