计算机工程与应用 ›› 2020, Vol. 56 ›› Issue (16): 132-138.DOI: 10.3778/j.issn.1002-8331.1906-0027
艾合麦提江·麦提托合提,艾斯卡尔·艾木都拉,阿布都萨拉木·达吾提
Ahmatjan Mattohti, Askar Hamdulla, Abdusalam Dawut
摘要:
为了准确有效地定位出图像中的维吾尔文本区域,提出了一种基于通道增强最大稳定极值区域(Maximally Stable Extremal Region,MSER)和卷积神经网络(Convolutional Neural Network,CNN)的图像文本区域定位方法。应用通道增强MSER提取候选区域,根据文本特征的启发式规则以及CNN分类结果去除非文本和重复区域,通过区域融合算法得到词级别文本区域,根据该区域的色彩相近程度和空间关系召回遗漏的文本区域,并通过CNN网络对召回的区域分类融合,定位出图像文本区域。实验结果表明,该方法可以准确有效地定位文本区域,具有鲁棒性和应用性。