计算机工程与应用 ›› 2011, Vol. 47 ›› Issue (24): 199-201.
冷强奎1,秦玉平1,王春立2
LENG Qiangkui1,QIN Yuping1,WANG Chunli2
摘要: 提出一种基于句子相似度的论文抄袭检测模型。利用局部词频指纹算法对大规模文档进行快速检测,找出疑似抄袭文档。根据最长有序公共子序列算法计算句子间的相似度,并标注抄袭细节,给出抄袭依据。在标准中文数据集SOGOU-T上进行的实验表明,该模型具有较强的局部信息挖掘能力,在一定程度上克服了现有的论文抄袭检测算法精度不高的缺点。