灵声电话机器人:一分钟带你了解语音识别

来源:用户投稿 时间:2018-08-09

语言是人类最重要的交际工具,也是人们进行沟通的主要表达方式。人类能在优胜劣汰的自然界中生存下来,除了具有创造力之外,另一个重要原因就是形成了自己的语言。人们借助语言保存和传递人类文明的成果。

语言就广义而言,是一套共同采用的沟通符号、表达方式与处理规则,符号会以视觉、声音或者触觉方式来传递。严格来说,语言是指人类沟通所使用的语言-自然语言。

语音信息处理及语音识别

21世纪是一个被各种信息包围的数据信息时代,人类利用语言来进行信息交流,其中最方便简单的就是语音表达方式了,这也是人类最基本重要的技能之一。随着信息社会的发展,人与机器之间每时每刻也要进行大量的信息交换,如何与机器进行语音交流,让机器明白你在说什么,一直是人们长期以来的一个梦想。

息交流与处理过程

人类在利用语音进行信息交流时,说话人的大脑会产生思想,通过语言转换,再经过发生器官发出相应的语音;语音的声波经过空气传播传到听话人的耳朵,通过听觉器官传送到大脑,由此理解该语音所表达的意思。

计算机正是模拟人类的进行信息交流与处理的过程,才能明白你在说什么,其中就包括以下几个步骤:

1、将大脑产生的思想转换成语言;

2、将语言转换成相应的语音;

3、识别表达语言的语音内容;

4、理解语音所表达的语言意义。

语音识别的发展历程

1952

贝尔研究所Davis等人成功研究出了世界上第一个能识别10个英文数字发音的实验系统:Audry系统。

60年代

计算机的应用推动了语音识别技术的发展,其中线性预测分析是进行语音信号分析最有效和最流行的分析技术之一,它较好的解决了语音信号产生模型的问题,对语音识别技术的发展产生了深远影响。

70年代

在小词汇量、孤立词的识别方面取得了实质性的进展,并且提出了矢量量化(VQ)和隐马尔可夫模型(HMM)理论。在同一时期,统计方法开始被用来解决语音识别的关键问题,这为接下来的非特定人大词汇量连续语音识别技术走向成熟奠定了重要的基础。

80年代

逐渐由孤立词识别转向连接词识别。1987年,IT界知名人物李开复开发出世界上第一个“非特定人连续语音识别系统”,用统计方法提升语音识别率。

90年代

大词汇量连续语音识别得到优化。1997年。IBM Viavoice首个语音听写产品问世,你只用对着话筒喊出你要输入的字符,它就会自动判断并且帮你输入文字。

2010

Google Voice Action支持语音操作与搜索,该系统具有说话人自适应能力,新用户不需要对全部词汇进行训练便可在使用中不断提高识别率。

2011

微软的深度神经网络DNN模型在语音搜索任务上获得成功,科大讯飞将DNN首次成功应用到中文语音识别领域,并通过语音云平台提供给广大开发者使用。

2011.10

苹果iphone 4s 的发布,推出了个人虚拟语音助理Siri,人工交互的革命史翻开了新篇章。

2013

Google发布了Google Glass,苹果也加大了对iwatch的研发投入,穿戴式语音交互设备成为新热点。

未来

从此,语音识别技术陆续进入工业、家电、通信、车载导航、医疗、家庭服务、消费电子产品等各个领域。当未来有一天,机器能够真正理解人类的语言,并做出回应,那时,我们将会迎来一个崭新的时代。

灵声机器人免费体验 :https://www.admin5.com/xm/lingsheng/?wz

相关文章

A5创业网 版权所有

返回顶部