计算机工程与应用 ›› 2021, Vol. 57 ›› Issue (1): 161-167.DOI: 10.3778/j.issn.1002-8331.1910-0008
方承志,火兴龙,程宥铖
FANG Chengzhi, HUO Xinglong, CHENG Youcheng
摘要:
针对自然场景下多方向文本对象,提出一种基于深度学习的文本检测方法。该方法在设计锚框时剥离锚框的方向特征但保留其长宽比特征,在覆盖相同长宽比范围时,锚框设计数量减少,从而缓解采样密集时正负样本类别失衡的影响。在方法的后处理阶段,提出一种边界框校准算法,该算法利用最大稳定极值区域(MSER)获取字符边缘信息,通过基于规则的逻辑判断,对边界框进行收缩或膨胀操作,从而达到边界框校准目的。通过在公开数据集ICDAR2015上的测试与比较,验证了所提边界框校准算法的有效性。