计算机工程与应用 ›› 2010, Vol. 46 ›› Issue (15): 146-149.DOI: 10.3778/j.issn.1002-8331.2010.15.043
张灿龙1,3,唐艳平2,王 强1,韦春荣1
ZHANG Can-long1,3,TANG Yan-ping2,WANG Qiang1,WEI Chun-rong1
摘要: 提出了一种先版面行分类后符号识别的印刷体数学公式提取策略。策略中两次应用K-L变换,分别完成版面行特征的降维和公式符号特征的提取,并采用免疫克隆选择算法优化支持向量机的训练参数,以构建出最优的版面行分类器和公式符号识别器。通过对300多份印刷体中文科技文档进行扫描识别测试,所得结果的公式提取率可达94%以上。
中图分类号: