计算机工程与应用 ›› 2009, Vol. 45 ›› Issue (4): 156-158.DOI: 10.3778/j.issn.1002-8331.2009.04.044
杨林波1,王士同1,2
YANG Lin-bo1,WANG Shi-tong1,2
摘要: 类别的中心和边界是类别的重要特征.利用训练样本的中心和边界作为分类准则,提出了一种基于边界可信度相似的快速文本分类算法。通过类别边界可信度调整文本与类别的相似性,克服了数据集类别间样本分布不均衡和类别中样本密度不均的缺点,提高了分类性能。实验结果表明该算法提高了文本分类的效果,显示出了较好的鲁棒性,并显著提高了文本分类效率。