计算机工程与应用 ›› 2009, Vol. 45 ›› Issue (16): 159-161.DOI: 10.3778/j.issn.1002-8331.2009.16.046
章舜仲1,2,王树梅1,黄河燕3,陈肇雄3
ZHANG Shun-zhong1,2,WANG Shu-mei1,HUANG He-yan3,CHEN Zhao-xiong3
摘要: 针对朴素贝叶斯分类的属性独立性假设的不足,讨论了相关性及多变量相关的概念,给出词间相关度的定义。在TAN分类器的词间相关性分析基础上,提出一种文档特征词相关度估计公式及其在改进朴素贝叶斯分类模型中应用的算法,在Reuters-21578文本数据集上的实验表明,改进算法简单易行,能有效改进贝叶斯分类性能。