搜狗推“个性化语音识别”，将颠覆与改变未来人机交互模式

来源：A5专栏时间：2019-08-15

专业机构发布《2019年语音技术》报告称，语音将成为未来十年决定性主题之一，与人工智能一起从根本上改变人与机器的关系。近日，搜狗输入法在语音输入领域率先推出“个性化语音识别”功能，突破语音识别技术瓶颈，大幅优化个人词汇录入的直接准确性，在语音输入领域实现“更懂用户”。

搜狗“个性化语音识别”打造用户专属输入法

在日常交流中，个人口头禅、惯用语经常会干扰双方的信息传达，这一问题在人机语音交互中尤为凸显。在语音输入时，往往用户只是想录入一个名称，输入结果却显示的是音同意不同的另一项结果。比如，当用户希望输入法显示人名“凭远”时，通用的语音识别往往将大众常用的“平原、品源”列在前列的候选词汇，用户的个性化内容并不在其中。除此之外，用户习惯使用的个人词汇，以及一些多音字、读音差错也会对语音识别结果造成影响。

基于以上原因，搜狗语音率先对语音识别技术进行了革新优化，推出“个性化语音识别”服务。经过本轮更新，用户只需在搜狗输入法App选择一键登录个人账户，即可体验此项服务。成功开启后，“个性化语音识别”会通过强化学习用户习惯使用的个人词汇，为每个用户建立定制化语音输入法。此后，在用户需要进行语音输入时，输入法会根据语言环境，结合上下段落语句进行分析，快速输出符合用户心意的文本内容，有效减少用户手动进行二次更改的频率。

搜狗语音又诞生“黑科技”语音识别更精准

搜狗“个性化语音识别”不仅可有效提升用户个性化词句的识别准确率，同时全自动词库学习这一特色极大保证了系统的处理及反馈速度，实现整个学习个性化特征的过程在“毫秒级别”就可以全部自动完成。

通过DTSS（Deep Transformer-based Sequence to Sequence model）的端到端声学模型、神经网络语言模型和智能标点预测等技术，搜狗输入法引入前沿深度学习技术，对语音识别进行仿真模拟和训练，有效提高语音录入在通用场景下的识别准确性，精准度已达到领先业内。“个性化语音识别”可基于用户数据分析，对用户习惯使用的个性化词组进行扫描记录，在语音输入时，优先选择用户习惯用语进行文本输出。通过此项技术革新，在保障通用识别准确性的前提下，使用户常用语的字词错误率下降40%，攻克语音识别精准化的技术难关。

掌控AI从个性化语音识别开始

手和舌头是人类最灵活的两个部分，从移动智能设备发展以来，各种触控交互无不依赖于手的操作。而当语音技术和人工智能同时走向成熟时，或许就像《2019语音技术报告》中所描述的那样：语音交互扭转了以往人机交互的存在形态，用户与设备间基于语音交互的全新关系开始搭建，与之前互联网向移动互联网过渡一样，其对底层平台的全新需求也在酝酿当中。

新时代即将来临，为应对人工智能、虚拟现实等技术的革新以及不同维度、多场景使用的需要，用户输入法的使用习惯逐渐向语音输入转移。同时，与文本输入相比，语音输入注定成为最主要的人机互动接口。优化语音识别技术，为用户提供更自然、更便利、更高效的语音录入服务，是智慧输入法的发展趋势。

随着语音识别技术的不断成熟，以及用户个性化词库的不断丰富，搜狗将聚合用户级语音个性化资源，实现“定制化语音输入法”。使每个用户基于“定制版”、“更懂自己”的搜狗语音识别的支持，在日常生活以及医疗、法律等专业领域，有效提高线上交流和人机沟通的效率及准确度，或将成为人工智能时代输入端的全局掌控者。

搜狗推“个性化语音识别”，将颠覆与改变未来人机交互模式

相关文章

瓯江论道：AI赋能绿色发展

王通：未来个人创业的十个机会

百度智能云PaddleOCR 3.1正式发布：关键能力支持MCP

AI工具导航网站，未来的发展前景怎么样？

微信AI搜索被指“强行开盒”：名字成了数据入口，腾讯回应“仅用公开信息”