最近,手机QQ最新版本升级了“图片文字提取”功能,可以将图片中的文字提取出来并可以随意编辑,用起来简直方便到逆天。
只要打开手机QQ,长按对话框中的图片选择“提取图中文字”,或是点击“扫一扫”中的“文字提取”,在超有科幻感的“正在识别中”完成之后,用户就可以得到图片中转化出的文字。提取出的文字还可以随意编辑,复制粘贴修改都没问题。
手机QQ的这一新大招,正是基于腾讯优图实验室提供的OCR文字识别技术。
复杂场景也不怕 OCR技术带来的读图识字时代
优图的OCR文字识别技术,顾名思义,就是将图片上的文字内容,智能识别成为可编辑的文本。
无论是生活中复杂多变场景,还是不同光照条件,甚至透视变形的情况下,优图OCR技术都可以在任意版面下识别出整图的文字,包括中英文、字母、数字、标点等共1000标签,并覆盖到数十种字体,满足生活中大部分场景的读图识字需求,以解决生活和沟通中的痛点。
背后的黑科技是基于优图实验室世界领先的深度学习技术,识别准确率也居于业界一流水平。近期,优图团队在国际权威的ICDAR2015“Robust Reading Competition”的自然场景文本检测项目,以及ICDAR2015“Focused Scene Text”场景文字识别任务中,均以优越的表现超越众多竞争对手,取得了排名第一的佳绩。
OCR技术实现多场景应用落地让沟通无障碍
实际上,在我们的日常生活中,不少细微之处都有读图识字的需求,优图OCR技术贴心地填补这些细节的需求空缺,从而提高了人们生活的品质和工作的效率:
在日常会议或课堂中,用手机拍下PPT、演示稿,能立即对图片中的文字进行编辑,而不再因为慌于抄写而错过了台上的精彩分享;
在超市里,随手拍下想买的商品分享给家人,即时从图片中提取文字而不用拉动图片放大看文字,快速解决“选择困难症”;
在编辑室内,随手拍海量纸质资料进行图片文字提取编辑,以便排版、存档、检索,传统媒体数字化转型无需再消耗巨大人力在前期资料归集上;
在家里,长辈为拉近与儿孙辈的距离,不用再对着年轻人发来的图片一筹莫展,通过图片文字提取识别便能够看清图上文字;
而对于存在视觉障碍的人群而言,OCR技术还能帮助他们读图识字,甚至结合语音技术,这些文字能被转化为语音,进而避免很多沟通障碍,更具社会意义。
除此之外,优图的OCR技术还支持印刷体和手写体识别,包括身份证、名片等卡证类,也支持票据、运单等定制化场景的识别,这些让信息录入更加快速高效,而录入人员再也不用敲键盘到手酸了。同时,OCR通用识别还可应用于互联网内容审核管理,能够高效、智能识别广告图片中的所有文字内容,准确过滤掉广告中的违规文字及黑产广告。
潦草的手写体也能识别快递不会再送错人了
优图的OCR技术与传统行业的结合,还能对行业产生更深远的影响。如在物流行业,OCR技术的应用就能够提高快递运单的识别效率,从而给消费者带来更便捷高效的快递服务。
现如今,依然有很多快递单上都是手写的地址信息,潦草的字容易认错而加大了物流中的人力、物力和时间成本。近期,优图的OCR技术就与顺丰技术团队合作,实现快速识别手写体的快递单,再潦草的手写寄件收件信息也能够识别,并接近人工识别水平。
优图的OCR技术也在展开积极的内外部合作。手机QQ、顺丰之外,优图OCR识别技术也与腾讯微云达成合作,为其用户提供图片内文字的检测和识别服务。
在云时代,通过技术的不断优化和广泛的内外部合作,在随手可及的细微之处满足日常生活的图文转换需求,对接行业成为数字化迭代的源动力,优图OCR技术的意义正在于此。目前优图的OCR技术已经通过腾讯云对外开放,用科技连接各行各业,带动行业的智能化变革。在未来,希望每一个普通人也都将从中受益。
A5创业网 版权所有