星火认知大模型发布,科大讯飞入场科技巨头AI大战?

来源:A5专栏 时间:2023-05-08

自从ChatGPT横空出世,一个更美好的世界开始向我们招手。为了推开新时代的大门,几乎所有人工智能厂商都投入了最大的热情逐浪AIGC。

5月6日,科大讯飞召开了“讯飞星火认知大模型”成果发布会。发布会现场,科大讯飞董事长刘庆峰展示了科大讯飞在认知大模型领域1+N的整体布局体系,并通过七大维度评价星火认知大模型的能力。

通过语音输入、实时互动,科大讯飞证明了无论是文本生成、语言理解,还是知识问答、逻辑推理,亦或是数学能力等,星火大模型都表现出色。

同时,我们也见证了讯飞AI学习机、讯飞听见、讯飞智能办公本、讯飞智能座舱、讯飞开放平台与星火认知大模型结合后的现场成果演示。

这样一场专注产品与技术展示的发布会,让我们真正理解了认知大模型将如何带来生产力的变革。正如科大讯飞董事长刘庆峰所说:“认知大模型成了通用人工智能的曙光。”

众所周知,自然语言处理是人工智能皇冠上的明珠,科大讯飞准备好了摘下这颗明珠?

一、追赶OpenAI第一步:星火背后的“七个维度”

“ChatGPT 所代表的大模型意义不亚于电力革命中的交流电与信息革命中操作系统的诞生。”

民生证券分析师吕伟表示,AI时代以ChatGPT为代表的大模型AI的成熟如同交流电发电站和电脑硬件成熟一样,拥有需求爆发的基础;而ChatGPT+Plugin的开发模式重要性如同电气时代的交流电和信息时代的操作系统,完善生态平台,空前的AI时代应用需求爆发已经到达奇点。

作为A股AI龙头,科大讯飞显然站在这场浪潮的潮头,也不可避免地受到外界关注。

认知大模型“星火”,是科大讯飞牵头国家专项,在国产化训练推理平台建设和优化方面持续投入的成果。此前,科大讯飞总裁吴晓如曾表示:“讯飞有信心在中文认知领域形成独特优势,同时在教育、医疗等多个行业领域形成业界领先的深度创新应用。”

在发布会上,科大讯飞展示了自身在认知大模型领域的整体布局——“1+N”:一个通用模型,教育、办公、汽车和数字员工等N个行业领域应用。

在会议的前半部分,我们见证了通用人工智能将如何改变当前的信息分发和获取的模式。

当我们想获得某些信息,认知大模型可以直接给出答案,甚至是融合多种相关结果,触类旁通以后整合出来一种答案。这也意味着内容的生产模式将被重塑,AI将成为最重要的生产工具,替从业者写发言稿、邮件、广告文案以及调研报告等。

对于通用人工智能,科大讯飞提出了7个维度的评价标准。对此,刘庆峰表示:“如果我们要让这次智慧涌现的认知智能是真的解决社会刚需,而不是简单的PR去做宣传的话,我们就要建立一套实实在在的脚踏实地又科学系统的评测体系。”

通用认知智能大模型七大维度能力

会上,科大讯飞采用真机实测,展示了自身在七大维度的能力。包括多风格多任务长文本生成、多层次跨语种语言理解、泛领域开放式知识问答、情境式思维链逻辑推理、多题型可解析数学能力、多功能多语言代码能力以及多模态输入和表达能力等。

“星火”模仿小红书风格写篇讯飞翻译机4.0新品品宣文案

值得注意的是,认知大模型本质上是一个对话式的人工智能工具,语音和语言的核心能力是所有评价维度的基础。

星火各方面表现突出的背后,是科大讯飞深耕自然语言理解领域多年的技术沉淀。

从2014年开始,科大讯飞启动了讯飞超脑计划,努力让机器像人一样具备能理解会思考的能力;2022年,科大讯飞在人工智能关键核心技术领域摘取16项国际人工智能大赛的冠军,其中涉及13项常识阅读理解挑战赛OpenBookQA、QASC、ReClor等认知智能国际竞赛冠军。

同时,科大讯飞建成的4城7中心深度学习计算平台,是大模型训练平台的硬件基石。

这些技术和硬件让科大讯飞在工程技术方面实现了百亿参数大模型推理效率的近千倍加速,为未来更大更多认知智能大模型技术经济实惠规模化应用提供了可能。

不过,在发布会现场,刘庆峰也坦言,纯大模型技术还是有一些技术缺陷的。

比如,由于训练素材的滞后性,新知识难以及时更新;同ChatGPT类似,在处理事实类问答时会出现“张冠李戴”的现象,目前模型还不能提供合理的证据进行可信性的验证;在特定的专业领域上表现不足,受专业领域数据限制,星火可回答的知识范围还是有明显的边界。

这些缺陷充分说明AI技术需要进一步演进。今天的认知大模型还是刚刚起步,在快速成长和迭代过程中。

但是,正因如此,其他认知大模型才有追赶ChatGPT的机会。认知大模型是掀起新一轮AI热潮的重要引擎,中国科技公司有必要掌握自主可控的产学研源头技术,并追求在产业链的应用落地。

二、参与内容生产力变革,星星之火正在燎原

当解决自然语言处理这一认知智能核心问题的一条可能路径就在眼前,人工智能行业对很多领域和行业的颠覆已经可以预测。

比如,讯飞星火认知大模型将显著提升智医助理、智能客服、智慧家庭、智能汽车的人机交互体验,将实现英语听说、AI学习机、讯飞听见、办公硬件等内容生成及批改辅导产品功能跃升,将使因材施教解决方案、个性化学习手册、慢病管理等个性化服务更加精准。

因此,《新一代人工智能发展规划》指出,我国2030年有望实现人工智能核心产业规模超过1万亿元,带动相关产业规模超过10万亿元。

基于此,百度、阿里、腾讯、商汤科技等国内科技大厂已经将大模型作为一种社会基础设施来部署。在终端硬件变革开启前,先在大模型领域追求源头技术的自主可控。

一时间,大量GPT模型应运而生。

但是,在产业场景中应用落地,是目前所有大模型产品尚未实现的目标。要做到这一点,还需要更多知识迁移调试,即将已有的预训练模型更快更好地迁移到下游应用上。

在产业落地方面,各大厂都快马加鞭地进入生态内测阶段。

比如,百度文心大模型与各行业企业联手,在通用大模型的基础上学习行业特色数据与知识,建设行业AI 基础设施。目前包括能源、金融、航天、制造、传媒等行业。

再比如,华为将大模型划分为3个层级,分别为基础大模型L0、行业大模型L1、细分场景模型L2。华为云人工智能首席科学家田奇表示,华为云早于2021年4月发布三个基础大模型,包括NLP大模型、CV大模型和科学计算大模型,之后又陆续发布了各种行业大模型包括气象大模型、药物分子大模型、矿山大模型、海浪预测大模型等。

而看似“姗姗来迟”的讯飞星火认知大模型,实际上也走得既快且稳。目前,科大讯飞的训练、推理在国产平台上的方案已跑通成型,围绕教育、医疗、人机交互、办公等“N”个行业领域应用开发专用大模型版本。

在发布会现场,科大讯飞从教育、办公、汽车、数字员工四大业务方向展示了讯飞星火认知大模型的应用效果。

首先是“大模型+AI学习机”。搭载认知大模型的科大讯飞AI学习机T20系列产品实现了中英文作文类人批改,并像口语老师一样实景对话。

相比于传统学习机只能针对字词标点纠错、识别句式修辞错误这些基础批改,讯飞AI学习机实现了围绕写作要求、分析全篇结构和文采的深度高阶批改。

AI学习机T20 Pro现场演示批改作文

其次是智能办公,包括“大模型+智能办公本”与“大模型+讯飞听见”。

面对口语稿阅读困难、纪要整理耗费精力、已有素材难成稿、长篇章难抓要点等痛点,搭载大模型技术的讯飞智能办公本升级了会议纪要、语篇规整两大功能。

语篇规整

同时,讯飞听见通过AI分析文字内容,可以一键生成包括全文摘要、工作待办、工作计划、新闻稿件、宣传文案、多语种翻译等多种文本,还可以根据原文件内容,进行AI对话并对原文内容进行提问追溯。

再次是“大模型+智能座舱”。作为国内汽车智能语音应用市场占有率第一的品牌,科大讯飞已为数千个车型提供业界领先的智能语音交互服务,提供多轮、多人、多区域、多模态的语音交互,累计服务用户已经超过4610万。

最后是“大模型+数字员工”。科大讯飞推出的虚拟人智能交互机,让数字员工实现24小时不打烊的服务。据悉,首批10家讯飞官方直营店将率先上线。

毫无疑问,讯飞星火认知大模型在产业化应用方面把握住了人工智能高速发展的战略机遇。通过软硬件结合,科大讯飞用“星火”巩固了自身产品的市场竞争力。同时,讯飞星火认知大模型还将赋能包括医疗、城市、政法、工业等在内的更多行业,向着“N”的方向延伸。

以认知大模型“1+N”架构为抓手,科大讯飞推开了广阔新世界的大门。

三、从“解决问题的一半”开始,迎接人工智能新发展阶段

“提出问题是解决问题的一半。”

站在人工智能新的起点,刘庆峰认为,在认知智能带来智慧涌现并不断进化的过程中,善于提问比以往任何时候都更具有独特的价值。因为只要你会提问、善于启发,你就可以把通用的人工智能助手的潜力充分释放出来。

而作为人工智能助手,讯飞星火认知大模型将点燃每个人的想象力。

一方面,在“1+N”的架构中,通用大模型将成为每个人的AI助手。它将帮助人类在工作、在生活、在创意和想象中带来更多的获得感,成为每个人创意涌现的加速器。

目前,科大讯飞已经有了400多万实名认证的开发者,500多万合作伙伴。对于此次认知能力的升级,刘庆峰认为星火将使得创业者的门槛极大降低,因为很多创业者只要有创意有想法,很多开发性工作,星火大模型将协助创业者实现。

另一方面,在实现了核心技术自主可控和国产化适配,尤其是在中文认知领域保持一定优势的情况下,科大讯飞加快了跟各领域的龙头企业共建产业生态的步伐。

发布会上,刘庆峰透露,发布会之前已经有36个行业,超过3000家企业跟科大讯飞达成了生态合作,现在还在源源不断地增加之中。

不难看出,认知大模型正在使科大讯飞“用人工智能建设美好世界”的产业梦想成为现实。而科大讯飞也把握住了这次机遇,一步步探索完善“星火”,照亮前进的道路。

而随着认知大模型不断升级,未来将如刘庆峰所说,属于掌握了AI的新人类。

“语言能力是人类最重要的能力,而语言能力根本是什么呢?是始于最开始的那次提问。”从第一次对话开始,认知大模型的星星之火,终将成燎原之势。

文章来源:松果财经(公众号:songguocaijing1)旨在提供活泼、深度的财经商业价值解析,做一个有态度的行业观察者!

项目推荐

A5创业网 版权所有

返回顶部