什么是OCR文字识别技术
OCR英文全称是Optical Character Recognition,中文叫做光学字符识别。它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够接受、人又可以理解的格式。
OCR字符识别技术的应用场景
OCR字符识别技术广泛应用于银行票据、文献资料录入和处理领域。适合于银行、税务等行业大量票据表格的自动扫描识别及长期存储。在机器视觉领域,OCR同样具有多方面的应用,通过工业相机、工业镜头拍摄文字图像,运用机器视觉软件进行相应处理以获取我们需要的信息,常见的应用有:
1、仪器仪表上的数据读取,如居民生活中得到水表、气表、电表的数值读取;
2、产品的日期、批号读取,获得产品的过期信息及可追溯信息;
3、智能交通的车牌识别,获取违章车辆的信息。
机器视觉方面的OCR应用
1、检测条码/字符印刷缺陷、完整度
2、检测条码/字符的对错、是否漏印
3、检测物体的方向是否正确
4、静态或动态检测
5、OK/NG产品系统输出相应控制信号。
OCR文字识别常见应用
OCR技术确实也在改变着我们的生活:比如一个手机APP就能帮忙扫描名片、身份证,并识别出里面的信息;汽车进入停车场、收费站都不需要人工登记了,都是用车牌识别技术;我们看书时看到不懂的题,拿个手机一扫,APP就能在网上帮你找到这题的答案。这都是于基于OCR技术的应用。
OCR技术的发展
在一些简单环境下OCR的准确度已经比较高了(比如电子文档),但是在一些复杂环境下的字符识别,在当今还没有人敢说自己能做的很好。现在大家都很少会把目光还放在如何对电子文档的文字识别该怎么进一步提高准确率了,因为他们把目光放在更有挑战性的领域。OCR传统方法在应对复杂图文场景的文字识别显得力不从心,越来越多人把精力都放在研究如何把文字在复杂场景读出来,并且读得准确作为研究课题,用学界术语来说,就是场景文本识别(文字检测+文字识别)。