卷积神经网络在验证码识别上的应用与研究

计算机工程与应用 ›› 2016, Vol. 52 ›› Issue (18): 1-7.

卷积神经网络在验证码识别上的应用与研究

刘欢1，2，邵蔚元1，郭跃飞1

1.复旦大学计算机科学技术学院，上海 201203
2.上海市智能信息处理重点实验室（复旦大学），上海 201203

出版日期:2016-09-15 发布日期:2016-09-14

Research on captcha recognition with convolutional neural networks

LIU Huan1，2, SHAO Weiyuan1, GUO Yuefei1

1.School of Computer Science and Technology, Fudan University, Shanghai 201203, China
2.Shanghai Key Laboratory of Intelligent Information Processing, Fudan University, Shanghai 201203, China

Online:2016-09-15 Published:2016-09-14

摘要/Abstract

摘要： 针对日前在互联网中被广泛使用的验证码，提出将卷积神经网络引入到验证码识别之中。通过设计新的卷积网络拓扑结构，针对可分割成语验证码提出基于k-means聚类的字符分割方法，以及仿真验证码图片自生成训练集，通过预训练过程使得卷积训练网络具有良好初值，加速收敛并提高模型泛化能力；针对不可分割验证码，省去字符分割操作直接将验证码整体作为卷积模型输入，引入仿射变换、水漫填充等预处理和SVM算法二分类，或者结合多标记学习方法设计卷积拓扑等。最终实验研究证实卷积神经网络对于可分割及不可分割验证码的平均识别准确率均收敛于99%左右。

关键词: 卷积神经网络, 验证码, 模式识别, 预训练, 二值化

Abstract: At present, captcha is widely used on the Internet. This paper introduces convolutional neural networks method to captcha recognition. By customizing new convolutional training networks, this paper uses k-means algorithm method for divisible idiom character segmentation, and through model pre-training to auto-generate images to enrich training dataset. Pre-training makes training network have a good initial value, thus speeds up the network convergence. Aiming at indivisible captcha, it leaves out character segmentation and inputs whole image to the convolutional networks model. It uses affine transformation, flood fill, and SVM classification or combines multi-label learning for captcha recognition. Finally, experimental study confirms that the method which is based on convolutional neural network, on average, achieves test accuracy of around 99% in the three types of CAPTCHA.

Key words: convolutional neural networks, captcha, pattern recognition, pre-training, binarization

刘欢1，2，邵蔚元1，郭跃飞1. 卷积神经网络在验证码识别上的应用与研究[J]. 计算机工程与应用, 2016, 52(18): 1-7.

LIU Huan1，2, SHAO Weiyuan1, GUO Yuefei1. Research on captcha recognition with convolutional neural networks[J]. Computer Engineering and Applications, 2016, 52(18): 1-7.

[1]	牟清萍，张莹，张东波，王新杰，杨知桥. 目标丢失判别机制的视觉跟踪算法及应用研究[J]. 计算机工程与应用, 2021, 57(9): 140-147.
[2]	包志强，邢瑜，吕少卿，黄琼丹. 改进YOLO V2的6D目标姿态估计算法[J]. 计算机工程与应用, 2021, 57(9): 148-153.
[3]	赵志焱，杨华，胡志伟，宇海萍. 基于TACNN的玉露香梨叶虫害识别[J]. 计算机工程与应用, 2021, 57(9): 176-181.
[4]	周伦钢，孙怡峰，王坤，吴疆，黄维贵，李炳龙. 目标多种多值属性的端端快速识别网络[J]. 计算机工程与应用, 2021, 57(9): 182-190.
[5]	张成，戴俊峰，熊闻心. 融合LeNet-5改进的扫描文档手写日期识别[J]. 计算机工程与应用, 2021, 57(9): 207-211.
[6]	张朕通，单玉刚，袁杰. 联合多尺度和注意力机制的遥感影像检测[J]. 计算机工程与应用, 2021, 57(9): 212-216.
[7]	麻哲旭，杨峰，乔旭. 铁路路基病害智能检测方法[J]. 计算机工程与应用, 2021, 57(9): 272-278.
[8]	冉蓉，徐兴华，邱少华，崔小鹏，欧阳斌. 基于深度卷积神经网络的裂纹检测方法综述[J]. 计算机工程与应用, 2021, 57(9): 23-35.
[9]	张韩钰，吴志昊，徐勇，陈斌. 增强卷积神经网络的人脸篡改检测方法[J]. 计算机工程与应用, 2021, 57(8): 220-224.
[10]	张越，黄友锐，刘鹏坤. 引入注意力机制的多分辨率人体姿态估计研究[J]. 计算机工程与应用, 2021, 57(8): 126-132.
[11]	李现国，冯欣欣，李建雄. 多尺度残差网络的单幅图像超分辨率重建[J]. 计算机工程与应用, 2021, 57(7): 215-221.
[12]	侯旋，薛飞，陈涛. 无人机目标检测量子多模式识别优化算法[J]. 计算机工程与应用, 2021, 57(7): 228-236.
[13]	梁芳烜，杨锋，卢丽云，尹梦晓. 基于卷积神经网络的脑肿瘤分割方法综述[J]. 计算机工程与应用, 2021, 57(7): 34-43.
[14]	杨培伟，周余红，邢岗，田智强，许夏瑜. 卷积神经网络在生物医学图像上的应用进展[J]. 计算机工程与应用, 2021, 57(7): 44-58.
[15]	常昊，陈晓雷，张爱华，李策，林冬梅. 嵌入改进SENet的卷积神经网络连续血压预测[J]. 计算机工程与应用, 2021, 57(7): 130-135.