基于概念特征的语义文本分类

计算机工程与应用 ›› 2011, Vol. 47 ›› Issue (28): 139-142.

• 数据库、信号与信息处理 • 上一篇下一篇

基于概念特征的语义文本分类

林伟，孟凡荣，王志晓

中国矿业大学计算机科学与技术学院，江苏徐州 221008

收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2011-10-01 发布日期:2011-10-01

Concept-features-based semantic text classification

LIN Wei，MENG Fanrong，WANG Zhixiao

School of Computer Science and Technology，China University of Mining and Technology，Xuzhou，Jiangsu 221008，China

Received:1900-01-01 Revised:1900-01-01 Online:2011-10-01 Published:2011-10-01

摘要/Abstract

摘要： 文本分类是组织和处理海量文本信息的关键方法。目前的文本分类模型多用关键词特征向量描述文本资源，造成向量的高维性和稀疏性。引入文本资源的概念特征，将文本资源描述由关键词级提升至概念级，提高文本资源描述的准确性，并提出了基于概念特征的语义文本分类模型。仿真实验的结果表明，该模型能有效克服资源特征向量空间的高维性和稀疏性，确保向量空间的正交性，在语义文本分类的效率和正确性上都有良好的表现。

关键词: 语义文本分类, 概念特征, 本体, 支持向量机

Abstract: Text classification is the key method of mass text messages organizing and processing.Most current text classification models use keywords eigenvector to describe the text resources which makes the vector high dimensional and sparse.This paper introduces the concept-features instead of keywords to describe the text resources，which improves the accuracy of text resources description.A concept-features-based semantic text classification model is put forward in this paper.The results of simulation experiments show that the model can overcome the vector space’s high-dimensionality and sparsity，and ensure the orthogonality of the vector space.The semantic text classification presents a fine performance both in efficiency and accuracy.

Key words: semantic text classification, concept-features, ontology, Support Vector Machine（SVM）

林伟，孟凡荣，王志晓. 基于概念特征的语义文本分类[J]. 计算机工程与应用, 2011, 47(28): 139-142.

LIN Wei，MENG Fanrong，WANG Zhixiao. Concept-features-based semantic text classification[J]. Computer Engineering and Applications, 2011, 47(28): 139-142.

HTML			PDF

最新录用	在线预览	正式出版	最新录用	在线预览	正式出版
0	0	0	0	0	44

来源	本网站	其他网站

次数	42	2
比例	95%	5%

摘要

最新录用	在线预览	正式出版

0	0	52

	来源	本网站

	次数	52
	比例	100%

[1]	高一锴，彭力，徐龙壮. 改进AFSA算法优化TWSVM的火焰识别方法[J]. 计算机工程与应用, 2021, 57(8): 204-213.
[2]	韩卫宇，程龙生. 结合马田系统-SVM的滚动轴承故障模式分类研究[J]. 计算机工程与应用, 2021, 57(6): 239-246.
[3]	雷恒林，古兰拜尔·吐尔洪，买日旦·吾守尔，张东梅. 新奇检测综述[J]. 计算机工程与应用, 2021, 57(5): 47-55.
[4]	温杰彬，杨文忠，马国祥，张志豪，李海磊. 基于Apex帧光流和卷积自编码器的微表情识别[J]. 计算机工程与应用, 2021, 57(4): 127-133.
[5]	徐先峰，蔡路路，张丽. 融合MLP和DBN的光伏发电预测算法[J]. 计算机工程与应用, 2021, 57(3): 266-272.
[6]	李俊侠，张秦，郑桂妹. 超宽带雷达人体姿态识别综述[J]. 计算机工程与应用, 2021, 57(3): 14-23.
[7]	陈富健，谢维信，夏婷. 基于LCT+的自适应抗遮挡目标跟踪算法[J]. 计算机工程与应用, 2021, 57(22): 190-198.
[8]	杨泉. N1+N2结构语法关系判定的SVM算法[J]. 计算机工程与应用, 2021, 57(20): 104-108.
[9]	高晋，赵云芃，Godfred Kim Mensah，李欣芸，刘志芬，陈俊杰，郭浩. 静息态功能脑连接的空间动态分析及分类研究[J]. 计算机工程与应用, 2021, 57(2): 150-155.
[10]	秦博宇，郝晓燕，刘永芳. 基于SVM和CRF双层模型的FrameNet框架消歧[J]. 计算机工程与应用, 2021, 57(18): 255-262.
[11]	郑淋文，周金治，黄静. 深度稀疏自编码器在ECG特征提取中的应用[J]. 计算机工程与应用, 2021, 57(11): 156-161.
[12]	温廷新，孔祥博. 不平衡样本下的金融市场极端风险预警研究[J]. 计算机工程与应用, 2020, 56(8): 256-260.
[13]	陈菲雨，岳文斌，饶颖露，邢金昊，马晓静. 基于改进TLD算法的无人机自主精准降落[J]. 计算机工程与应用, 2020, 56(7): 247-254.
[14]	马玲，罗晓曙，蒋品群. 基于模板匹配和支持向量机的点阵字符识别研究[J]. 计算机工程与应用, 2020, 56(4): 134-139.
[15]	张忠林，冯宜邦，赵中恺. 一种基于SVM的非均衡数据集过采样方法[J]. 计算机工程与应用, 2020, 56(23): 220-228.

基于概念特征的语义文本分类

Concept-features-based semantic text classification

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐 0

Metrics