计算机工程与应用 ›› 2020, Vol. 56 ›› Issue (5): 179-185.DOI: 10.3778/j.issn.1002-8331.1811-0304
樊玮,刘欢,张宇翔
FAN Wei, LIU Huan, ZHANG Yuxiang
摘要:
针对现有的基于图的关键词提取方法未能有效整合文本序列中词与词之间的潜在语义关系的问题,提出了一个融合词向量与位置信息的基于图的关键词提取算法EPRank。通过词向量表示模型学得目标文档中每个词的表示向量;将该反映词与词之间的潜在语义关系的词向量与位置特征相结合融合到PageRank评分模型中;选择几个排名靠前的单词或短语作为目标文档的关键词。实验结果表明,提出的EPRank方法在KDD和SIGIR两个数据集上的各项评估指标均高于5个现有的关键词提取方法。