计算机工程与应用 ›› 2008, Vol. 44 ›› Issue (28): 226-229.DOI: 10.3778/j.issn.1002-8331.2008.28.074
司志刚,牛 琳,常朝稳
SI Zhi-gang,NIU Lin,CHANG Chao-wen
摘要: 依据公安情报文本中不同位置的词条对区分文本类别的贡献显著不同的特点,引入位置权重系数,改进了经典的文本特征权重计算方法(TF-IDF),使文本的权重能够更加全面地反映文本的类别信息。根据公安情报分类系统的需求,设计了基于支持向量机(SVM)的公安情报分类系统,该系统不仅能够实现情报文本的自动分类,而且能够保留在情报文本分类的不同阶段语料的特征信息,为情报信息的进一步加工处理提供支持,同时系统中各模块间采用松耦合的方式衔接,提高了系统的适应性和灵活性。通过实验验证了系统设计的合理性和有效性。