计算机工程与应用 ›› 2012, Vol. 48 ›› Issue (31): 115-119.
彭 浩1,蔡美玲1,2,王瑞龙3,余炳锐1
PENG Hao1, CAI Meiling1,2, WANG Ruilong3, YU Bingrui1
摘要: Web网页中往往包含许多主题噪声,准确地自动抽取关键词成为技术难点。提出了一个文本对象网络模型DON,给出了对象节点的中心度概念和基于中心度的影响因子传播规则,并据此自动聚集DON中的主题社区(topic society),从而提高了模型的抗噪能力。提出一个基于DON的网页关键词自动抽取算法KEYDON(Keywords Extraction Algorithm Based on DON)。实验结果表明,与基于DocView模型的相应算法相比,KEYDON的准确率提高了近20%,这说明DON模型具有较强的抑制主题噪声能力。