一种印刷体数学公式优化提取策略

doi:10.3778/j.issn.1002-8331.2010.15.043

计算机工程与应用 ›› 2010, Vol. 46 ›› Issue (15): 146-149.DOI: 10.3778/j.issn.1002-8331.2010.15.043

• 图形、图像、模式识别 • 上一篇下一篇

一种印刷体数学公式优化提取策略

张灿龙^1，3，唐艳平²，王强¹，韦春荣¹

1.广西师范大学计算机科学与信息工程学院，广西桂林 541004
2.桂林电子科技大学材料科学与工程学院，广西桂林 541004
3.上海交通大学航空航天学院，上海 200240

收稿日期:2009-12-08 修回日期:2010-03-17 出版日期:2010-05-21 发布日期:2010-05-21
通讯作者: 张灿龙

Printed mathematical expressions extraction method based on ICSA-SVM and K-L transform

ZHANG Can-long^1，3，TANG Yan-ping²，WANG Qiang¹，WEI Chun-rong¹

1.College of Computer Science and Information Engineering，Guangxi Normal University，Guilin，Guangxi 541004，China
2.School of Material Science and Engineering，Guilin University of Electronic Technology，Guilin，Guangxi 541004，China
3.School of Aeronautics & Astronautics，Shanghai Jiaotong University，Shanghai 200240，China

Received:2009-12-08 Revised:2010-03-17 Online:2010-05-21 Published:2010-05-21
Contact: ZHANG Can-long

摘要/Abstract

摘要： 提出了一种先版面行分类后符号识别的印刷体数学公式提取策略。策略中两次应用K-L变换，分别完成版面行特征的降维和公式符号特征的提取，并采用免疫克隆选择算法优化支持向量机的训练参数，以构建出最优的版面行分类器和公式符号识别器。通过对300多份印刷体中文科技文档进行扫描识别测试，所得结果的公式提取率可达94%以上。

关键词: 印刷体数学公式, 支持向量机, K-L变换, 免疫克隆选择

Abstract: A new approach for separating both isolated and embedded expressions in printed Chinese technical documents is presented，which includes two steps：line classification and symbol recognition.In the approach，K-L transform is applied to eliminate interrelation among line features and extract symbol features，and immune clone selection algorithm is used to optimize parameters of line classifier and symbol classifier based on support vector machine.The testing result to about 300 printed Chinese technical documents indicates that the expressions extraction accuracy is 94% above.

Key words: printed mathematical expression, support vector machine, K-L transform, Immune Clone Selection

中图分类号:

TP391.41

张灿龙^1，3，唐艳平²，王强¹，韦春荣¹. 一种印刷体数学公式优化提取策略 [J]. 计算机工程与应用, 2010, 46(15): 146-149.

ZHANG Can-long^1，3，TANG Yan-ping²，WANG Qiang¹，WEI Chun-rong¹. Printed mathematical expressions extraction method based on ICSA-SVM and K-L transform[J]. Computer Engineering and Applications, 2010, 46(15): 146-149.

[1]	高一锴，彭力，徐龙壮. 改进AFSA算法优化TWSVM的火焰识别方法[J]. 计算机工程与应用, 2021, 57(8): 204-213.
[2]	韩卫宇，程龙生. 结合马田系统-SVM的滚动轴承故障模式分类研究[J]. 计算机工程与应用, 2021, 57(6): 239-246.
[3]	雷恒林，古兰拜尔·吐尔洪，买日旦·吾守尔，张东梅. 新奇检测综述[J]. 计算机工程与应用, 2021, 57(5): 47-55.
[4]	温杰彬，杨文忠，马国祥，张志豪，李海磊. 基于Apex帧光流和卷积自编码器的微表情识别[J]. 计算机工程与应用, 2021, 57(4): 127-133.
[5]	徐先峰，蔡路路，张丽. 融合MLP和DBN的光伏发电预测算法[J]. 计算机工程与应用, 2021, 57(3): 266-272.
[6]	李俊侠，张秦，郑桂妹. 超宽带雷达人体姿态识别综述[J]. 计算机工程与应用, 2021, 57(3): 14-23.
[7]	陈富健，谢维信，夏婷. 基于LCT+的自适应抗遮挡目标跟踪算法[J]. 计算机工程与应用, 2021, 57(22): 190-198.
[8]	杨泉. N1+N2结构语法关系判定的SVM算法[J]. 计算机工程与应用, 2021, 57(20): 104-108.
[9]	高晋，赵云芃，Godfred Kim Mensah，李欣芸，刘志芬，陈俊杰，郭浩. 静息态功能脑连接的空间动态分析及分类研究[J]. 计算机工程与应用, 2021, 57(2): 150-155.
[10]	秦博宇，郝晓燕，刘永芳. 基于SVM和CRF双层模型的FrameNet框架消歧[J]. 计算机工程与应用, 2021, 57(18): 255-262.
[11]	郑淋文，周金治，黄静. 深度稀疏自编码器在ECG特征提取中的应用[J]. 计算机工程与应用, 2021, 57(11): 156-161.
[12]	温廷新，孔祥博. 不平衡样本下的金融市场极端风险预警研究[J]. 计算机工程与应用, 2020, 56(8): 256-260.
[13]	陈菲雨，岳文斌，饶颖露，邢金昊，马晓静. 基于改进TLD算法的无人机自主精准降落[J]. 计算机工程与应用, 2020, 56(7): 247-254.
[14]	马玲，罗晓曙，蒋品群. 基于模板匹配和支持向量机的点阵字符识别研究[J]. 计算机工程与应用, 2020, 56(4): 134-139.
[15]	张忠林，冯宜邦，赵中恺. 一种基于SVM的非均衡数据集过采样方法[J]. 计算机工程与应用, 2020, 56(23): 220-228.

一种印刷体数学公式优化提取策略

Printed mathematical expressions extraction method based on ICSA-SVM and K-L transform

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics