Javamoon

2020-03-25

力压谷歌微软!阿里巴巴光学字符识技术刷新世界纪录

日常办公学习中,我们经常会有这样的需求,如何快速地把一张打印的文档或图片中的信息作快速提取?比如我有一张打印好的课程表,但是我并没有它的原始电子文档,但是这时候我又想快速拥有这样一个电子文档,怎么办?别急,我们只需要搜索OCR(Optical Character Recognition,光学字符识别,就能很快找到相应的解决办法。OCR是指通过电子设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。近日,阿里知产保护科技大脑中的一项OCR技术刷新世界纪录。“知产保护科技大脑”是一套阿里巴巴20年间积累的海量线上线下假货特征库、打假经验聚合而成的算法技术系统。目前阿里OCR就是这个大脑中的一项技术,这个“大脑”包含上亿个商品特征、百余个算法模型,效率相当于5万人同时工作。