OCR是什么?浅显易懂的解释

2020.09.14 -

   

光学字符识别(OCR)定义了将手写,键入或打印的文本的扫描图像机械或电子转换为机器编码的文本的过程。将其视为转换模拟数据,数字化的过程。

在这篇介绍性文章中,您将了解:

什么是OCR技术?

光学字符识别如何工作?

您无需成为经验丰富的开发人员或技术人员,即可了解什么是OCR并了解其工作原理。在这里,我们将以最少的技术术语来解释该技术。

如果您已经知道什么是OCR,请直接跳到有关其工作原理的部分,或者从使用该技术可以做什么的示例开始。

OCR

什么是OCR技术?

由于OCR代表光学字符识别,因此OCR技术解决了识别各种不同字符的问题。手写和印刷字符都可以被识别并转换为机器可读的数字数据格式。

通过使用OCR,您可以将需要数字化的任何类型的序列号或包含数字和字母的代码转换为数字输出。该技术利用了许多不同的技术。简而言之,对所拍摄的图像进行处理,提取字符,然后对其进行识别。

光学字符识别如何工作?

让我们看一下光学字符识别的三个基本步骤:图像预处理;字符识别;以及输出的后处理。

步骤1:OCR中的图像预处理

OCR软件通常会对图像进行预处理,以提高成功识别的机会。图像预处理的目的是改善实际图像数据。以此方式,抑制了不想要的失真并且增强了特定的图像特征。这两个过程对于以下步骤很重要。

步骤2:OCR中的字符识别

车牌字符识别

对于实际的字符识别,重要的是要了解什么是“特征提取”。当输入数据太大而无法处理时,只会选择一组简化的功能。选择的功能有望成为重要功能,而那些被认为是多余的功能将被忽略。通过使用减少的数据集而不是初始的大数据集,可以提高性能。

对于OCR的处理,这一点很重要,因为该算法必须检测数字化图像或视频流的特定部分或形状。

步骤3:OCR中的后处理

后处理是另一种纠错技术,可确保OCR的高精度。如果输出受词典限制,则可以进一步提高精度。这样,该算法可以退回到例如允许在扫描文档中出现的单词列表。

OCR不仅用于识别正确的单词,还可以读取数字和代码。这对于识别数字和字母的长字符串很有用,例如许多行业中使用的序列号。

为了更好地处理不同类型的输入OCR,一些提供商开始开发特定的OCR系统。这些系统能够处理特殊图像,并提高识别精度,甚至还结合了各种优化技术。

例如,他们使用了业务规则,标准表达式或彩色图像中包含的丰富信息。合并各种优化技术的这种策略称为“面向应用的OCR”或“定制的OCR”。它用于名片OCR,发票OCR和ID卡OCR等应用程序。

OCR技术的用例

由于OCR可以与多种技术结合使用,因此使用光学字符识别软件的可能性十分广泛。以下是一些可能的用例示例,包括OCR软件:

OCR中的识别过程

护照中的机器可读区域(MRZ)

护照和ID具有可以扫描的机器可读区域(MRZ)。OCR可以加快身份识别和注册过程。这对于边界或其他检查站的安全部队很有用。它还可以用于商业目的,以提高客户参与度,例如酒店内的入住过程或在银行和其他企业的注册过程。

付款流程中的OCR

使用OCR进行IBAN扫描

国际银行帐号(IBAN)用于标识跨国银行帐号。IBAN的长度可能不同,可以由数字和字母组成。为了简化跨境交易,银行应用程序可以轻松集成OCR软件。这样,他们的客户就可以扫描自己的IBAN,而不必繁琐地输入。

OCR工具

有很多OCR软件专门针对一种特定的用例,例如信用卡扫描或文档扫描。但是OCR可以在我们生活的许多不同部分中发挥作用。企业通常需要将OCR解决方案结合在一起,因此,最好与可以处理多种扫描的提供商合作。

Tesseract是一种受OCR开发人员欢迎的免费开源OCR引擎。但是,实现和修改可能很痛苦。相比之下,与Tesseract不同,Anyline提供了易于集成的OCR SDK,您可以免费下载它并在移动设备上完美运行。

本站文章禁止转载,违者必究
阅 104
0

光学字符识别(OCR)定义了将手写,键入或打印的文本的扫描图像机械或电子转换为机器编码的文本的过程。将其视为转 […]

湘公网安备 43011102001693号

    湘ICP备19003021号-1