计算机工程与应用 ›› 2017, Vol. 53 ›› Issue (4): 200-204.DOI: 10.3778/j.issn.1002-8331.1506-0160
尹 芳1,2,郑 亮1,陈田田1
YIN Fang1,2, ZHENG Liang1, CHEN Tiantian1
摘要: 提出了一种基于Adaboost算法的场景中文文本定位的新方法。首先利用边缘特征进行文本区域的检测,即对数字图像进行边缘提取、二值化处理,然后通过连通域分析去除明显的非字符连通域,并获得候选的文本区域。对场景中文文本区域进行分析,提取了场景中文文本的4类特征,并利用这4类特征经过分类与回归决策树构造了Adaboost强分类器。将候选文本区域送入强分类器,得到正确的文本区域。实验结果表明方法不仅对场景文本图像中字体、大小和颜色多变的文本具有很好的定位效果,而且具有很高的召回率和准确率。