大模型中场战事，讯飞星火找到领先时刻

来源：A5专栏时间：2023-08-20

落地为王阶段，在算力、平台、模型、应用、生态等方面，都有持续深入的企业，对产业来说有更强的吸引力。

作者|刘珊珊

编辑|杨铭

轰轰烈烈大模型，走到市场化大规模落地前夜。

8月15日，《生成式人工智能服务管理暂行办法》施行。这是我国第一部AIGC管理办法，明确行业健康、安全、规范同时，进一步促进生成式人工智能应用的加速落地。

这被解读为，在国内已经打响半年，热度空前的“千模大战”迎来关键战场节点，正式进入应用PK、“落地为王”阶段。

硝烟背后，业界与大众普遍关心话题是：当大模型逐渐变成一种基础能力，如何进行技术上的迭代升级？又如何与更多行业结合，提速规模化、商业化进程，在竞赛长跑中占据领先地位？

这考验着入局者的智慧，亦决定入局者未来命运走势。

“通用人工智能绝不仅仅是单个企业、单个科研院所的使命，而是整个社会的机会，大模型赋能个体和行业的大未来正在到来。”8月15日，长达140多分钟的讯飞星火认知大模型V2.0升级发布会上，身着传统黑西裤、白衬衫的科大讯飞董事长刘庆峰说。

这是科大讯飞大模型又一次重要亮相——自5月6日对外正式展示至今，讯飞星火认知大模型刚好100天，期间经历了V1.5的迭代。

当前V2.0 升级，是在提升通用能力基础上，重点突破代码能力和多模态能力。根据刘庆峰的说法，代码能力是支撑认知大模型智慧的关键维度,多模态能力则是实现通用人工智能的必经之路。

这些能力，已同步在iFlyCode1.0（编程助手）、讯飞智作2.0（视频创作平台）、星火语伴2.0（练习口语）等应用和产品上，成为科大讯飞大模型落地应用和商业化上的重要一步。

从技术能力来看，讯飞星火V1.5Python语言效果只有41分，V2.0已有61分，接近ChatGPT。根据计划，到今年10月24日，讯飞星火各个代码纬度能力将比ChatGPT，实现中文超越、英文相当的水平，到明年上半年对标GPT-4。

这意味着，伴随大模型进入“落地为王”的中场战事阶段，中国大模型也将迎来自己的领先时刻。

01大模型落地，从产业开始

命运齿轮，转动于5月6日。彼时科大讯飞躬身入局，发布星火认知大模型1.0版本。

短短几个月，大模型已在国内掀起一场场“肉搏战”。通用、行业、垂直、开源和闭源等不同类型大模型，基于GPT，就像树干上的枝丫一样，疯狂开枝散叶。互联网、人工智能巨头、创业公司、各类型中小企业、研究机构入局者数不胜数，几乎每天都有不同类型大模型推出。

比如，10亿级参数规模大模型——参数量被默认为通用大模型、垂直和行业模型区别重要因素。规模参数越高，对算力、数据、资源、技术要求就更高，但在国内，10亿级参数以上多模态大模型却超80个。

这并不意味着赛道的真正崛起。在国内，投资者逐渐趋冷，部分入局者黯然离场；在国外，ChatGPT诞生9个月花费近2亿美元，高昂成本让OpenAI有“破产风险”。

盲目烧钱不可持续，大模型成本、商业化落地两大难题，让大众开始重新审视，大模型的经济和社会价值。

各界“到底需要什么大模型”探讨中，深耕行业，与生态结合，让大模型在不同行业、不同类型企业发挥生产力作用，成为解决大模型难题，真正产生价值行业共识。

“谁能在具备社会刚需的应用场景落地，谁就能最先形成自我造血的良性循环。”刘庆峰明确断言。在他看来，对科大讯飞这样体量的公司，不做通用大模型就不可能在国际舞台上未来争得一席之地，连上桌机会都没有。

通用还是垂直选择题上，每家企业都有自己理由和抉择。多模态通用大模型，被业界视为“综合大学学生”，可能在某些垂类领域沉淀数据有所不足，却是各个行业通向智能化、通用化必由之路，也是业界公认事实。

事实上，应用落地才是衡量一切大模型价值最高标准。最大难题是，如何搞懂行业、每个客户需求，以及应用安全、易用，具备产业价值。

行业场景分为政府及大型企业（ToB、ToG）、个人（ToC）、中小企业（ToSME）等不同类型。不同行业与大模型结合本质逻辑不同，如ToB、ToG，往往要求逻辑复杂定制化场景中，必须做到可控、可追溯、可修正。ToSME同样有定制化需求，但降本增效，给企业带来增长价值，却是衡量关键。

多位观察人士认为，深入行业Know-how基础上，和大模型能力融合，是大模型产业化最有效路径。

刘庆峰认为，其前提是，要在国产算力安全和数据安全下，回归场景驱动。“场景给客户带来的价值是什么，新增效益，还是节约成本、提高质量，同时能够让用户快速地、低技术门槛训练，才能够使它赋能千行百业。”

这是科大讯飞在8月15日推出星火一体机重要原因——其与华为昇腾AI联合研发，意在为每一家企业提供专属的大模型，适合有数据安全需求的大型客户。

“开箱即使用，提供从底层算力、AI 框架、训练算法、推理能力、应用成效等全栈 AI 能力。”刘庆峰称。

对科大讯飞来说，TOB端探索出的大模型赋能路径是，在研、产、供、销、服、管等各维度赋能。例如，大模型掌握行业基本能力、通用知识后，结合企业专属知识库，让新员工也能迅速掌握经验和知识，大幅提升工作效率。

不止科大讯飞，百度、腾讯、阿里、360都试图通过为企业提供专属大模型，加快产业融合、落地速度。“落地为王阶段后，淘汰赛就会一触即发。”多位观察人士判断。

必须意识到，受制于数据、算力、场景等限制，真正能跑通大模型商业化的入局者，数量将不会太多。其一，大模型仍会像互联网、人工智能、云计算一样，以互联网、科技大厂为主导；其二，大厂不会局限于泛通用行业，而是“大模型+业务”深入垂类，走通用+垂类“并行”路径。

比如科大讯飞，星火是多模态通用大模型，却早已开枝散叶，应用在教育、医疗、办公、数字员工、汽车、金融、工业等多垂类场景。

02千模大战，讯飞星火凭啥第一？

当前，赛道各大玩家纷纷结合自身已有业务场景，试图在大模型释放更大价值前，抢占战场制高点。

但客观来看，科大讯飞目前是脱颖而出，走得最快的那个。

这从科大讯飞最新财报，大模型加持后的商业化增长，得到印证。今年上半年，教育、开放平台及消费者、智慧汽车、智慧医疗、智慧金融等业务收入分别为22.9亿元、24.2亿元、2.1亿元、1.9亿元、0.9亿元，分别同比增长3.63%、21.6%、26.14%、37.13%和22.19%。

"可以看到，大模型正实实在在推动产业前进。" 刘庆峰称。

这也让外界颇为疑惑：ChatGPT都遭遇变现难题时，科大讯飞为何领先业界，先一步尝到大模型的商业化甜头？

有人工智能从业人士对“极点商业”称，大模型应用落地，其实是一条技术—产品—场景—规模化的演变路径。“就像一个木桶，不能存在短板，才有成功接受市场考验可能。”

大模型并非短期内一蹴而就，而是长期技术沉淀下所推动。1999年成立的科大讯飞，24年来在刘庆峰博士带领下，一直是人工智能领头羊形象存在，在深度学习算法、行业大数据、知识图谱、多模态感知、系统工程等技术方面有着深厚积累。

外界未曾关注到的是，其在认知大模型上也有近十年沉淀。2014年，科大讯飞启动“讯飞超脑”计划，实现机器从“能听会说到能理解会思考”。到2022年，累计摘取16项国际人工智能大赛的冠军，其中认知智能领域有13项冠军。

这离不开研发的持续投入。2022年，科大讯飞总研发投入33.6亿元，研发人员数量占公司总人数的比例为约60%。而根据最新财报，科大讯飞上半年研发支出16.6亿元，同比去年同期16亿元增加大约3.8%。这是星火认知大模型短时间内多次重要升级关键。

研发投入、技术领先带来的，是在G/B/C端应用场景不断拓展，占据更多用户心智。根据IDC《中国人工智能软件2022年市场份额》，在语音语义AI市场，科大讯飞位于榜首，持续领先百度智能云、阿里云。

长达20年多年的技术沉淀，让科大讯飞在大模型的打造上，有了“所有技术平台完全自主研发，每一阶段技术都可控”的底气。

比如，在大模型多个关键技术，多家权威评测就将讯飞火星排在了第一位。

根据新华社研究院中国企业发展研究中心发布《人工智能大模型体验报告2.0》（以下简称《报告》），讯飞星火以总分1013分位列本次国产主流大模型测评榜首位，超过商汤商量、通义千问等大模型，在四大评测维度中的智商指数、工具提效指数两个维度获得第一。

IT之家评测中，在完善度、功能性、易用性等维度，讯飞星火同样超过文心一言、通义千问、360智脑，排在第一。

《麻省理工科技评论》则将讯飞星火称为“最聪明”的大模型。在8个一级大类的600道题目的测试和盲评中，讯飞星火认知大模型V2.0在编程能力、理科综合、逻辑思维、数学专项、语言专项和综合知识6个大类中得分率排名第一，超过文心一言、商汤商量、通义千问，获得“最聪明”的国产大模型称号。

商业化探索上，有别大多数大模型，科大讯飞采取的是“技术能力+落地应用”并行策略。

一个细节是，科大讯飞在5月6日推出讯飞星火时，尽管发布时间并不领先，却在现场明确了教育、医疗、金融、办公、汽车、工业六个行业的应用场景。

此后两次升级，也有明确加速上述行业探索边界，推进其规模化应用落地和产业生态的构建——值得一提的是，科大讯飞是第一个在发布时，即明确阶段性升级时间，并同步生态应用规划的企业。

另外，LUMIE 10系列、智能办公本X3等与讯飞星火结合的硬件产品，在展示技术能力时，也同步落地上市。

“不仅要做基础通用大模型，还要同步做落地教育、医疗、办公场景的产品应用。”今年4月，科大讯飞副总裁、研究院执行院长刘聪曾透露，为进一步提高大模型细分行业的实用性，科大讯飞实行了“1+N”攻关体系。其中，“1”是通用认知智能大模型算法研发及高效训练底座平台，“N”则是应用于教育、医疗、人机交互、办公等多个行业领域的专用大模型版本。

“‘1’ 的能力融入到 ‘N’ 的产品应用中，‘N’ 的数据和场景更新到 ‘1’ 里迭代能力，构建一个循环的系统性工程。”刘聪说，讯飞大模型的技术、产品与服务，一直是围绕产业应用场景来展开。

因此，外界也得以在短短三个月内，就清晰看到了科大讯飞大模型，在C端和B/G端的齐头并进。

C端，科大讯飞消费者产品覆盖AI办公、AI学习、AI健康三大赛道，是国内AI应用产品最丰富的企业。

其中在AI学习赛道，仅仅是5-6月，科大讯飞AI学习机GMV就分别同比增长136%和217%；讯飞AI硬件在今年6.18获得京东和天猫双平台7类销售冠军。

当前AI学习机为代表的智能学习硬件市场强敌林立、同质化严重，是各路巨头都看上的市场，包括小度、步步高、猿辅导、作业帮、读书郎等新老玩家齐聚。科大讯飞利用AI大模型能力，是其差异化突围关键。

B/G端，作为AI“国家队”，科大讯飞已在政务、电力、医疗、工业、司法、金融等行业深耕多年。

金融领域，讯飞和人保科技等达成合作，推进大模型技术在金融垂直领域的应用；工业领域，星火大模型搭载在羚羊工业互联网平台，智能匹配方案、服务商、专家等资源，实现供需匹配；医疗领域，讯飞诊后康复管理平台基于大模型技术进行了升级，与北京协和医院、四川华西医院等多所医院进行合作，覆盖20多个科室的主要病种。

在8月15日的发布会上，刘庆峰强调说，讯飞星火已完成金融、政务、汽车等领域9个专属大模型数据显示，在场景任务优化、私域知识增强等方面增效20%。

03竞赛马拉松，科大讯飞如何走更远

大模型竞赛是一场马拉松，当下大模型仍然处于一个技术不断迭代、培育市场、抢占用户心智阶段。

这意味着，眼前领跑之外，更重要的是未来如何走得更远。

对于未来，科大讯飞从未掩饰它的“野心”，在5月推出讯飞星火时，就成为国内首家明确公布时间表的企业：今年10月24日，讯飞星火代码各维度能力将超越ChatGPT，明年上半年对标GPT-4。

此前，因为种种原因，几乎所有国内大模型都被外界认为，在技术、算法、可应用性上和ChatGPT存在差距。显然，在算力、算法等底层能力上保持迭代优化，并和产业应用紧密结合，是科大讯飞能否实现上述目标的保障。

“对代码能力的逻辑、算法、方法、体系、数据准备已经全部就绪，所需要的就是时间和算力。”刘庆峰称。

技术永无止境。多次迭代后，讯飞星火大模型核心能力、应用和产品正不断扩容。比如此次讯飞星火2.0，科大讯飞就对代码能力进行5个维度的升级，包括：代码生成、代码补齐、代码纠错、代码解释、单元测试生成。

图像描述、图像问答、识图创作、文图生成、虚拟人合成等多模态能力方面，讯飞星火大模型也全面升级。在代码能力和多模态能力迭代基础上，科大讯飞推出了能够进行视频创作的讯飞智作2.0、“智能编程助手iFlyCode2.0”、一键生成课件星火教师助手等，作为AIGC内容的生产工具。

代码能力和多模态能力升级，意味着帮助专业程序员提升效率，创造更大价值。

从演示来看，借助iFlyCode1.0工具，简单几步Prompt完iFlyCode界面后，一行代码都不用写，就可以马上实现“凌空手写”功能。以前，经验丰富的工程师要半天到1天才能完成，现在只需要几分钟。

过去一个月，iFlyCode在讯飞内部有2000多名员工实现试点应用，代码采样率超过30%，编码效率提升30%以上，综合工作效率提升15%，能明显感受到大模型带来的效率提升。

此外，哪怕不是编程高手的普通人，只要发挥想象力、基于对应用场景的认知，也可以“零门槛”进入代码世界。

例如，使用Python画红色的心形线、用代码生成“贪吃蛇”等小游戏、利用小视频做表情包等需求，讯飞星火都能迅速完成。

此前，科大讯飞已将星火大模型的能力，包装为中英文类人批改、英语类人口语对话等诸多应用场景，置入进T20、LUMIE 10、T10等AI学习机产品。有经销商表示，用户对搭载星火大模型的旗舰产品，热情度非常高。

升级后的星火大模型，围绕教育落地多款产品和功能。星火教师助手应用在讯飞教育数字基座上，零编程基础的老师也能使用，并满足学校管理数字化转型中的个性需求和定制开发。AI 智能编程助手和 AI 创意绘画伙伴的推出，标志着大模型对AI学习机赋能，更全面贴近新课标的要求。

代码和多模态能力的升级，也是大模型降低门槛，解放生产力，释放想象力的关键。目前，结合原有应用数据和场景描述，集成讯飞星火的代码能力和语言理解能力,大大提升学校开发效率：原有开发应用周期从17天缩短至1天，投资成本由15万降低至1.5万元。根据科大讯飞透露，该教育数字基座已经在上海、湖北、安徽的一些学校试点落地。

产业生态上，为行业、政务提供业界领先、自主可控的私有化代码能力平台——比如星火一体机。另外，开发者生态也是大模型产业良性循环关键。

5月6日星火大模型发布后两个月内，讯飞人工智能开放平台开发者数量增加了85万家。6月9日以来，已有4000余个助手开发者团队加入进来，开发出了7800多个助手。

随着生态集中，大模型不仅与产业应用更紧密，加快赋能千行百业进程，也能通过正向反馈，促进基础研究和关键技术的自主迭代，更大程度解放生产力，释放想象力。

科大讯飞就表示，当前多模态能力已广泛应用在教育、医疗、工业、汽车、机器人等领域。真实世界获得的数据，将提升产品终端的学习、训练，从而推出更自主的工业机器人、更好的自动驾驶、走入家庭的陪伴机器人等等。

“这会是一个长期过程。在算力、平台、模型、应用、生态等方面，都有持续深入的企业，对产业来说有更强的吸引力。”一位人工智能分析人士说。

写在最后：

大模型落地道阻且长。总体而言，当前大模型尚未完全离开“喧嚣”，各行各业大多处于赋能阶段，想收获大规模产业价值，还有很长的路要探索。

如同比尔·盖茨在《人工智能时代已经开启》中所描述，自1980年图形用户界面出现以来，大模型是所见过最具革命性的技术进步。一场事关所有产业的商业变革，已经拉开了大幕。

通过技术、产品、应用深耕，讯飞星火大模型“长坡厚雪”，正率先走向产业深处。