本发明适用于文字识别技术领域,提供了一种识别场景文字的方法及装置。
识别场景文字的方法包括获取文本图像中的候选文本成分,对获取到的候选文本成分进行预处理,提取成分区域关联特征;获取该文本图像中的全局特征;将该成分区域关联特征以及该全局特征输入至预先建立的深信度网络模型;根据预先建立的深信度网络模型中的字符识别器,识别出该成分区域关联特征所属的字符;对识别出的字符进行配对,组成文本行或者词条。本发明避免了逐行扫描大量滑动窗口所带来的巨大运算量的情况,并避免了滑动窗口扫描仅局限于水平方向上的文本检测的情况,从而减少了运算量,识别场景文字的方法在多个方向上进行检测,并且利用深信度网络有效地降低误检测率,提高了文字识别的效率和准确率。