大模型中场战事,讯飞星火找到领先时刻

来源:A5专栏 时间:2023-08-20

落地为王阶段,在算力、平台、模型、应用、生态等方面,都有持续深入的企业,对产业来说有更强的吸引力。

作者|刘珊珊

编辑|杨 铭

轰轰烈烈大模型,走到市场化大规模落地前夜。

8月15日,《生成式人工智能服务管理暂行办法》施行。这是我国第一部AIGC管理办法,明确行业健康、安全、规范同时,进一步促进生成式人工智能应用的加速落地。

这被解读为,在国内已经打响半年,热度空前的“千模大战”迎来关键战场节点,正式进入应用PK、“落地为王”阶段。

硝烟背后,业界与大众普遍关心话题是:当大模型逐渐变成一种基础能力,如何进行技术上的迭代升级?又如何与更多行业结合,提速规模化、商业化进程,在竞赛长跑中占据领先地位?

这考验着入局者的智慧,亦决定入局者未来命运走势。

“通用人工智能绝不仅仅是单个企业、单个科研院所的使命,而是整个社会的机会,大模型赋能个体和行业的大未来正在到来。”8月15日,长达140多分钟的讯飞星火认知大模型V2.0升级发布会上,身着传统黑西裤、白衬衫的科大讯飞董事长刘庆峰说。

这是科大讯飞大模型又一次重要亮相——自5月6日对外正式展示至今,讯飞星火认知大模型刚好100天,期间经历了V1.5的迭代。

当前V2.0 升级,是在提升通用能力基础上,重点突破代码能力和多模态能力。根据刘庆峰的说法,代码能力是支撑认知大模型智慧的关键维度,多模态能力则是实现通用人工智能的必经之路。

这些能力,已同步在iFlyCode1.0(编程助手)、讯飞智作2.0(视频创作平台)、星火语伴2.0(练习口语)等应用和产品上,成为科大讯飞大模型落地应用和商业化上的重要一步。

从技术能力来看,讯飞星火V1.5Python语言效果只有41分,V2.0已有61分,接近ChatGPT。根据计划,到今年10月24日,讯飞星火各个代码纬度能力将比ChatGPT,实现中文超越、英文相当的水平,到明年上半年对标GPT-4。

这意味着,伴随大模型进入“落地为王”的中场战事阶段,中国大模型也将迎来自己的领先时刻。

01大模型落地,从产业开始

命运齿轮,转动于5月6日。彼时科大讯飞躬身入局,发布星火认知大模型1.0版本。

短短几个月,大模型已在国内掀起一场场“肉搏战”。通用、行业、垂直、开源和闭源等不同类型大模型,基于GPT,就像树干上的枝丫一样,疯狂开枝散叶。互联网、人工智能巨头、创业公司、各类型中小企业、研究机构入局者数不胜数,几乎每天都有不同类型大模型推出。

比如,10亿级参数规模大模型——参数量被默认为通用大模型、垂直和行业模型区别重要因素。规模参数越高,对算力、数据、资源、技术要求就更高,但在国内,10亿级参数以上多模态大模型却超80个。

这并不意味着赛道的真正崛起。在国内,投资者逐渐趋冷,部分入局者黯然离场;在国外,ChatGPT诞生9个月花费近2亿美元,高昂成本让OpenAI有“破产风险”。

盲目烧钱不可持续,大模型成本、商业化落地两大难题,让大众开始重新审视,大模型的经济和社会价值。

各界“到底需要什么大模型”探讨中,深耕行业,与生态结合,让大模型在不同行业、不同类型企业发挥生产力作用,成为解决大模型难题,真正产生价值行业共识。

“谁能在具备社会刚需的应用场景落地,谁就能最先形成自我造血的良性循环。”刘庆峰明确断言。在他看来,对科大讯飞这样体量的公司,不做通用大模型就不可能在国际舞台上未来争得一席之地,连上桌机会都没有。

通用还是垂直选择题上,每家企业都有自己理由和抉择。多模态通用大模型,被业界视为“综合大学学生”,可能在某些垂类领域沉淀数据有所不足,却是各个行业通向智能化、通用化必由之路,也是业界公认事实。

事实上,应用落地才是衡量一切大模型价值最高标准。最大难题是,如何搞懂行业、每个客户需求,以及应用安全、易用,具备产业价值。

行业场景分为政府及大型企业(ToB、ToG)、个人(ToC)、中小企业(ToSME)等不同类型。不同行业与大模型结合本质逻辑不同,如ToB、ToG,往往要求逻辑复杂定制化场景中,必须做到可控、可追溯、可修正。ToSME同样有定制化需求,但降本增效,给企业带来增长价值,却是衡量关键。

多位观察人士认为,深入行业Know-how基础上,和大模型能力融合,是大模型产业化最有效路径。

刘庆峰认为,其前提是,要在国产算力安全和数据安全下,回归场景驱动。“场景给客户带来的价值是什么,新增效益,还是节约成本、提高质量,同时能够让用户快速地、低技术门槛训练,才能够使它赋能千行百业。”

这是科大讯飞在8月15日推出星火一体机重要原因——其与华为昇腾AI联合研发,意在为每一家企业提供专属的大模型,适合有数据安全需求的大型客户。

“开箱即使用,提供从底层算力、AI 框架、训练算法、推理能力、应用成效等全栈 AI 能力。”刘庆峰称。

对科大讯飞来说,TOB端探索出的大模型赋能路径是,在研、产、供、销、服、管等各维度赋能。例如,大模型掌握行业基本能力、通用知识后,结合企业专属知识库,让新员工也能迅速掌握经验和知识,大幅提升工作效率。

不止科大讯飞,百度、腾讯、阿里、360都试图通过为企业提供专属大模型,加快产业融合、落地速度。“落地为王阶段后,淘汰赛就会一触即发。”多位观察人士判断。

必须意识到,受制于数据、算力、场景等限制,真正能跑通大模型商业化的入局者,数量将不会太多。其一,大模型仍会像互联网、人工智能、云计算一样,以互联网、科技大厂为主导;其二,大厂不会局限于泛通用行业,而是“大模型+业务”深入垂类,走通用+垂类“并行”路径。

比如科大讯飞,星火是多模态通用大模型,却早已开枝散叶,应用在教育、医疗、办公、数字员工、汽车、金融、工业等多垂类场景。

02千模大战,讯飞星火凭啥第一?

当前,赛道各大玩家纷纷结合自身已有业务场景,试图在大模型释放更大价值前,抢占战场制高点。

但客观来看,科大讯飞目前是脱颖而出,走得最快的那个。

这从科大讯飞最新财报,大模型加持后的商业化增长,得到印证。今年上半年,教育、开放平台及消费者、智慧汽车、智慧医疗、智慧金融等业务收入分别为22.9亿元、24.2亿元、2.1亿元、1.9亿元、0.9亿元,分别同比增长3.63%、21.6%、26.14%、37.13%和22.19%。

"可以看到,大模型正实实在在推动产业前进。" 刘庆峰称。

这也让外界颇为疑惑:ChatGPT都遭遇变现难题时,科大讯飞为何领先业界,先一步尝到大模型的商业化甜头?

有人工智能从业人士对“极点商业”称,大模型应用落地,其实是一条技术—产品—场景—规模化的演变路径。“就像一个木桶,不能存在短板,才有成功接受市场考验可能。”

大模型并非短期内一蹴而就,而是长期技术沉淀下所推动。1999年成立的科大讯飞,24年来在刘庆峰博士带领下,一直是人工智能领头羊形象存在,在深度学习算法、行业大数据、知识图谱、多模态感知、系统工程等技术方面有着深厚积累。

外界未曾关注到的是,其在认知大模型上也有近十年沉淀。2014年,科大讯飞启动“讯飞超脑”计划,实现机器从“能听会说到能理解会思考”。到2022年,累计摘取16项国际人工智能大赛的冠军,其中认知智能领域有13项冠军。

这离不开研发的持续投入。2022年,科大讯飞总研发投入33.6亿元,研发人员数量占公司总人数的比例为约60%。而根据最新财报,科大讯飞上半年研发支出16.6亿元,同比去年同期16亿元增加大约3.8%。这是星火认知大模型短时间内多次重要升级关键。

研发投入、技术领先带来的,是在G/B/C端应用场景不断拓展,占据更多用户心智。根据IDC《中国人工智能软件2022年市场份额》,在语音语义AI市场,科大讯飞位于榜首,持续领先百度智能云、阿里云。

长达20年多年的技术沉淀,让科大讯飞在大模型的打造上,有了“所有技术平台完全自主研发,每一阶段技术都可控”的底气。

比如,在大模型多个关键技术,多家权威评测就将讯飞火星排在了第一位。

根据新华社研究院中国企业发展研究中心发布《人工智能大模型体验报告2.0》(以下简称《报告》),讯飞星火以总分1013分位列本次国产主流大模型测评榜首位,超过商汤商量、通义千问等大模型,在四大评测维度中的智商指数、工具提效指数两个维度获得第一。

IT之家评测中,在完善度、功能性、易用性等维度,讯飞星火同样超过文心一言、通义千问、360智脑,排在第一。

《麻省理工科技评论》则将讯飞星火称为“最聪明”的大模型。在8个一级大类的600道题目的测试和盲评中,讯飞星火认知大模型V2.0在编程能力、理科综合、逻辑思维、数学专项、语言专项和综合知识6个大类中得分率排名第一,超过文心一言、商汤商量、通义千问,获得“最聪明”的国产大模型称号。

商业化探索上,有别大多数大模型,科大讯飞采取的是“技术能力+落地应用”并行策略。

一个细节是,科大讯飞在5月6日推出讯飞星火时,尽管发布时间并不领先,却在现场明确了教育、医疗、金融、办公、汽车、工业六个行业的应用场景。

此后两次升级,也有明确加速上述行业探索边界,推进其规模化应用落地和产业生态的构建——值得一提的是,科大讯飞是第一个在发布时,即明确阶段性升级时间,并同步生态应用规划的企业。

另外,LUMIE 10系列、智能办公本X3等与讯飞星火结合的硬件产品,在展示技术能力时,也同步落地上市。

“不仅要做基础通用大模型,还要同步做落地教育、医疗、办公场景的产品应用。”今年4月,科大讯飞副总裁、研究院执行院长刘聪曾透露,为进一步提高大模型细分行业的实用性,科大讯飞实行了“1+N”攻关体系。其中,“1”是通用认知智能大模型算法研发及高效训练底座平台,“N”则是应用于教育、医疗、人机交互、办公等多个行业领域的专用大模型版本。

“‘1’ 的能力融入到 ‘N’ 的产品应用中,‘N’ 的数据和场景更新到 ‘1’ 里迭代能力,构建一个循环的系统性工程。”刘聪说,讯飞大模型的技术、产品与服务,一直是围绕产业应用场景来展开。

因此,外界也得以在短短三个月内,就清晰看到了科大讯飞大模型,在C端和B/G端的齐头并进。

C端,科大讯飞消费者产品覆盖AI办公、AI学习、AI健康三大赛道,是国内AI应用产品最丰富的企业。

其中在AI学习赛道,仅仅是5-6月,科大讯飞AI学习机GMV就分别同比增长136%和217%;讯飞AI硬件在今年6.18获得京东和天猫双平台7类销售冠军。

当前AI学习机为代表的智能学习硬件市场强敌林立、同质化严重,是各路巨头都看上的市场,包括小度、步步高、猿辅导、作业帮、读书郎等新老玩家齐聚。科大讯飞利用AI大模型能力,是其差异化突围关键。

B/G端,作为AI“国家队”,科大讯飞已在政务、电力、医疗、工业、司法、金融等行业深耕多年。

金融领域,讯飞和人保科技等达成合作,推进大模型技术在金融垂直领域的应用;工业领域,星火大模型搭载在羚羊工业互联网平台,智能匹配方案、服务商、专家等资源,实现供需匹配;医疗领域,讯飞诊后康复管理平台基于大模型技术进行了升级,与北京协和医院、四川华西医院等多所医院进行合作,覆盖20多个科室的主要病种。

在8月15日的发布会上,刘庆峰强调说,讯飞星火已完成金融、政务、汽车等领域9个专属大模型数据显示,在场景任务优化、私域知识增强等方面增效20%。

03竞赛马拉松,科大讯飞如何走更远

大模型竞赛是一场马拉松,当下大模型仍然处于一个技术不断迭代、培育市场、抢占用户心智阶段。

这意味着,眼前领跑之外,更重要的是未来如何走得更远。

对于未来,科大讯飞从未掩饰它的“野心”,在5月推出讯飞星火时,就成为国内首家明确公布时间表的企业:今年10月24日,讯飞星火代码各维度能力将超越ChatGPT,明年上半年对标GPT-4。

此前,因为种种原因,几乎所有国内大模型都被外界认为,在技术、算法、可应用性上和ChatGPT存在差距。显然,在算力、算法等底层能力上保持迭代优化,并和产业应用紧密结合,是科大讯飞能否实现上述目标的保障。

“对代码能力的逻辑、算法、方法、体系、数据准备已经全部就绪,所需要的就是时间和算力。”刘庆峰称。

技术永无止境。多次迭代后,讯飞星火大模型核心能力、应用和产品正不断扩容。比如此次讯飞星火2.0,科大讯飞就对代码能力进行5个维度的升级,包括:代码生成、代码补齐、代码纠错、代码解释、单元测试生成。

图像描述、图像问答、识图创作、文图生成、虚拟人合成等多模态能力方面,讯飞星火大模型也全面升级。在代码能力和多模态能力迭代基础上,科大讯飞推出了能够进行视频创作的讯飞智作2.0、“智能编程助手iFlyCode2.0”、一键生成课件星火教师助手等,作为AIGC内容的生产工具。

代码能力和多模态能力升级,意味着帮助专业程序员提升效率,创造更大价值。

从演示来看,借助iFlyCode1.0工具,简单几步Prompt完iFlyCode界面后,一行代码都不用写,就可以马上实现“凌空手写”功能。以前,经验丰富的工程师要半天到1天才能完成,现在只需要几分钟。

过去一个月,iFlyCode在讯飞内部有2000多名员工实现试点应用,代码采样率超过30%,编码效率提升30%以上,综合工作效率提升15%,能明显感受到大模型带来的效率提升。

此外,哪怕不是编程高手的普通人,只要发挥想象力、基于对应用场景的认知,也可以“零门槛”进入代码世界。

例如,使用Python画红色的心形线、用代码生成“贪吃蛇”等小游戏、利用小视频做表情包等需求,讯飞星火都能迅速完成。

此前,科大讯飞已将星火大模型的能力,包装为中英文类人批改、英语类人口语对话等诸多应用场景,置入进T20、LUMIE 10、T10等AI学习机产品。有经销商表示,用户对搭载星火大模型的旗舰产品,热情度非常高。

升级后的星火大模型,围绕教育落地多款产品和功能。星火教师助手应用在讯飞教育数字基座上,零编程基础的老师也能使用,并满足学校管理数字化转型中的个性需求和定制开发。AI 智能编程助手和 AI 创意绘画伙伴的推出,标志着大模型对AI学习机赋能,更全面贴近新课标的要求。

代码和多模态能力的升级,也是大模型降低门槛,解放生产力,释放想象力的关键。目前,结合原有应用数据和场景描述,集成讯飞星火的代码能力和语言理解能力,大大提升学校开发效率:原有开发应用周期从17天缩短至1天,投资成本由15万降低至1.5万元。根据科大讯飞透露,该教育数字基座已经在上海、湖北、安徽的一些学校试点落地。

产业生态上,为行业、政务提供业界领先、自主可控的私有化代码能力平台——比如星火一体机。另外,开发者生态也是大模型产业良性循环关键。

5月6日星火大模型发布后两个月内,讯飞人工智能开放平台开发者数量增加了85万家。6月9日以来,已有4000余个助手开发者团队加入进来,开发出了7800多个助手。

随着生态集中,大模型不仅与产业应用更紧密,加快赋能千行百业进程,也能通过正向反馈,促进基础研究和关键技术的自主迭代,更大程度解放生产力,释放想象力。

科大讯飞就表示,当前多模态能力已广泛应用在教育、医疗、工业、汽车、机器人等领域。真实世界获得的数据,将提升产品终端的学习、训练,从而推出更自主的工业机器人、更好的自动驾驶、走入家庭的陪伴机器人等等。

“这会是一个长期过程。在算力、平台、模型、应用、生态等方面,都有持续深入的企业,对产业来说有更强的吸引力。”一位人工智能分析人士说。

写在最后:

大模型落地道阻且长。总体而言,当前大模型尚未完全离开“喧嚣”,各行各业大多处于赋能阶段,想收获大规模产业价值,还有很长的路要探索。

如同比尔·盖茨在《人工智能时代已经开启》中所描述,自1980年图形用户界面出现以来,大模型是所见过最具革命性的技术进步。一场事关所有产业的商业变革,已经拉开了大幕。

通过技术、产品、应用深耕,讯飞星火大模型“长坡厚雪”,正率先走向产业深处。

项目推荐

A5创业网 版权所有

返回顶部