本发明提供了一种场景图像的文本检测方法。
场景图像的文本检测方法包括获取场景图像,通过卷积神经网络模型提取所述场景图像的卷积特征;将所述场景图像的卷积特征送入递归神经网络模型,生成文本候选框序列,对所述文本候选框序列进行后处理,获取文本行区域。本方法通过递归神经网络模型对卷积特征进行训练,可以利用卷积特征的上下文本信息进行训练,有利于提高文本检测的鲁棒性,并且不局限于单一语言分类器,可以适应多语言文本的检测要求,而且无需人为设定复杂的先验条件,在不同场景下有利于提高检测的稳定性。场景图像的文本检测方法通过利用重叠区域的计算资源,可以有效的提高计算效率,通过端到端的模型,可以简化计算处理的步骤。