计算机工程与应用 ›› 2012, Vol. 48 ›› Issue (3): 137-139.
陈芯莹,李雯雯,王 燕
CHEN Xinying, LI Wenwen, WANG Yan
摘要: 提出了将语言计量研究成果应用于语言风格对比及作家判定中的方法。通过对两个75 000字的语料中12个语言结构特征分布的统计对比,发现了7个具有显著分布差异的语言结构特征。并以这7个语言结构特征作为文本表示特征对两个75 000字的未知作家文本做了相关性分析,并准确判定了未知作家文本的作者。以语言结果的计量特征表示文本的方法加强了语言风格对比及作家判定研究的可解释性,具有较高的理论和应用价值。以语料库和统计方法进行语言结构特征计量研究是汉语语言风格描写研究及作家判定研究的重要方法。