手写中英识别是亮点 讯飞输入法文字扫描领先一大步

来源:互联网 时间:2019-12-02

在信息爆炸时代的正确打开方式不再是用手打字,而是用互联网工具为我们的生活找到快捷通道。比如现在手机输入法异常强大,可以帮我们快速从纸质材料中提取文字内容,原本费时费力的人工输入瞬间变得简单。讯飞输入法推出的“智慧扫描输入”,不管是图片、书籍还是手写文字,都能轻松变成电子版,对上班族族而言简直是“致命的诱惑”!

那么,这个强大的功能在哪里呢?小编一步一步教大家。大家都在用的讯飞输入法Android版和iPhone版,里面就内置这一功能。这次就以Android版为例来介绍。

打开任意输入框,在讯飞输入法输入面板点击讯飞图标,弹出窗口就有“文字扫描”功能。

接下来,对需要转录的图文进行拍照,选择识别范围,稍等3-5秒即可呈现扫描结果。最终的文字结果可以复制到文本框,发送到手机其他应用或者PC端进行后期编辑。基于科大讯飞成熟的数字图像识别机制、机器学习等方法,对拍照内容进行实时处理,快速提取信息特征,从而实现对手写体、中英混以及特殊符号的所见所得。是不是觉得好神奇,有了这一功能再也不用手动码字了?

其实,讯飞输入法内置文字扫描功能不仅对印刷体有很好地识别效果,即便是手写体还是中英混合,也有着相当出色的表现。

因为它底层的OCR识别引擎借鉴了手写文字识别技术中基于空间注意力机制的Encoder-Decoder思想,实现数学公式的字符和位置关系的端到端的识别,同时科大讯飞提出了多尺度空间注意力机制以解决由字符尺寸差异较大带来的识别字符丢失问题。所以非印刷体的字体也能准确识别。

针对不同书写者书写风格迥异的问题,科大讯飞提出了空间注意力引导机制和时间注意力机制,从空间时间两个维度提升注意力的准确度,最后融合多种不同模态的信息提升了系统最终决策的效果,有效强化了场景识别的泛化能力。中英文手写也No problem。

一直以来,讯飞输入法除了深耕语音识别领域,还不断引入各项A.I.核心技术,探索新的应用,提升用户体验。比如通过计算机视觉技术的产品化来提高文本转电子档的效率。那些纸张的材料、手写的记录、长篇大论的书籍,通过文字扫描3-5秒钟时间就能轻松转化成可编辑的电子档,再也不需要人手一个字一个字的敲击键盘输入。对比其他输入法,讯飞输入法在拍照输入方面做到了行业最佳,拥有绝对的代差优势。

项目推荐

A5创业网 版权所有

返回顶部