我们将创建一个具有CTC损失的卷积循环神经网络来实现我们的OCR识别模型。
一、数据集
我们将使用 Visual Geometry Group 提供的数据。
Visual Geometry Group - University of OxfordComputer Vision group from the University of Oxford
https://www.robots.ox.ac.uk/~vgg/data/text/#sec-synth        这是一个总共 10 GB 图像的巨大数据集。在这里,我仅使用 135000 张图像作为训练集,使用 15000 张图像作为验证数据集。该数据包含文本图像片段,如下图所示:


![洛谷 P3252 [JLOI2012] 树](https://img-blog.csdnimg.cn/50bc2d549f0e4c79814cbebddb373342.png)
















