灵伴AI开放平台上线ASR功能，构建智能生态未来

来源：互联网时间：2019-12-05

近日，灵伴AI能力开放平台上线了ASR功能模块，继TTS赋予机器开口说话的能力之后，本次ASR功能的开放将使用户的产品具备听觉感知能力、使其能够轻松听懂人类的话语，与TTS构成语音交互的核心环节，使更多产品及用户能够在零技术门槛下完成整体交互方案。

近年来，语音交互被看作连接各种智能服务的入口，虽然已经落地多个行业应用场景，但仍然有很多不尽如人意的地方。具体到ASR技术方面，业内普遍宣称的97%识别准确率，多数是指局限于安静室内的近场识别，而在真实使用场景中，使用者的口音复杂多变、距离麦克风的远近、周围环境的噪音等都会严重影响到语音识别的准确率，从而使交互的体验感大打折扣。

灵伴AI开放平台ASR功能界面展示

灵伴的ASR技术作为整体交互服务方案中的重要环节，已经经历了来自市场的严苛检验，并在实践中不断迭代和完善，能够以高标准胜任实际业务场景的需求。

国际领先的识别技术

灵伴ASR算法模型具有较强的鲁棒性，具备复杂环境识别能力，基于自研抗噪和远场处理技术，有效分离噪音、混响，极大提高户外、室内、车内等复杂环境下语音识别准确率，使得用户无论在何种嘈杂环境下，都能够最大程度被识别;独创说话人识别和语音识别同步处理技术，实现实时的说话人区分及语音内容识别;先进的深度学习算法模型，保证系统具有较高的准确率、识别效率及较低的计算成本;

20+领域识别引擎

得益于长久以来专注于语音交互领域的优势，灵伴智能服务方案在银行、保险、教育、医疗等20余个行业落地并积累了海量业务数据及经验。经过实际业务场景的应用反馈进而对算法模型的迭代优化，使得灵伴ASR作为单项技术能力也有着高于业界平均水平的识别准确率;

卓越的产品性能

灵伴ASR不仅支持中文普通话识别、中英文混说识别，也支持带有方言口音的普通话识别，这一能力在实际落地过程中不断完善。因为多数企业面向全国用户提供服务，而带方言口音是影响ASR在实际应用中准确率的主要因素之一。灵伴ASR立足先进的算法模型、多年业务积累及庞大的数据库支撑，在识别不同方言口音普通话方面具有较高的精准度;

支持个性化定制

灵伴ASR技术还支持个人或企业用户的个性化需求定制，提供基于细分领域的行业模型定制、方言、语种等多种需求定制。

作为智能语音交互领域的先行者，灵伴是业内为数不多拥有语音交互全栈技术的企业之一，在AI商业化落地过程中可根据实际业务情况进行快速调整及应对，而不用依赖他人，这也是灵伴AI技术产品能够深入业务场景的重要因素之一。本次ASR功能的开放，意味着灵伴AI能力开放平台对全行业更为全面、深度的赋能，也表达了灵伴愿意与更多企业一起构建未来智能生态的美好愿景。