“混战”大模型，知乎、小红书、快手各有所长

来源：A5专栏时间：2023-06-12

一直以来，追逐风口都是互联网企业的天性。因此，继元宇宙风口之后，横空出世并火遍全国的AIGC和ChatGPT，便又成为了各行业企业追逐的焦点。在此背景下，无论是国内互联网大厂，还是科技公司，亦或是内容平台，但凡有些实力的玩家都纷纷下场，围绕AI大模型展开了一场激烈角逐，“千模大战”也就此拉开了帷幕。

一场基于大模型的创业浪潮开始席卷开来，国内陆续布局大模型的企业也如雨后春笋般争相涌现。只不过，与百度、阿里、华为这类打造通用大模型的“高端”玩家不同，知乎、小红书、快手等则选择了另辟蹊径。而作为内容问答、短图文、短视频等主流内容形式的代表，知乎、小红书、快手这些小巨头们对大模型的探索，自然也就成为了外界关注的重点。

竞逐大模型

大模型无疑是今年最热的风口，国内企业早就陆续宣布对大模型展开探索，而不管是投资还是自建，已经开始进场分羹的不在少数，知乎、小红书、快手自然也不会错过这班“列车”。众所周知，互联网大厂对大模型展开研发及相关布局，是高度符合其产业互联网战略的，而相比之下，知乎、小红书、快手这三个平台的进场，虽是意料之外，却也依旧在情理之中。

一方面，AI技术逐渐普及，玩家们充分受益于人工智能技术浪潮，自然不想错过这个时代的变革。AI技术的发展将会带来产业的进步和新机遇的诞生，而伴随着人工智能技术不断取得突破，AI大模型也呈现蓬勃发展态势。AI大模型浪潮席卷全球，只有先上牌桌，才能抓住规则这张“王牌”，因此，知乎、小红书、快手等玩家进军大模型就变得刻不容缓了。

另外，对于这些玩家来说，一旦别家的大模型落地，或会对其构成一定的威胁，而为了防范风险，入局就变得顺理成章了。进入AIGC时代，基于深度学习的大模型将极大提升内容生产的速度和数量。在此背景下，拥有了“技术优势”的竞争对手很可能会迅速突破知乎、小红书、快手的护城河，因此，布局大模型就变成了这些小巨头们保持竞争力的一种方式。

另一方面，在移动互联网红利消退的背景下，选择拥抱大模型，可以让这些玩家的内容变得更加多元化，有望带来新的增长点。由决策式AI到生成式AI的演变正在将大模型应用推向更加多元化的场景，知乎、小红书、快手等平台推出大模型产品，则可以提高内容生产的速度和质量，以拓展更多新内容；还可以更好地满足用户的需求，从而吸引更多用户留存。

另外，这些玩家都或多或少地面临着商业化困境，而利用大模型，有望助其更好地实现商业化。一直以来，小红书都困于“站内种草，站外拔草”，商业化闭环难构建；知乎和快手也分别因为难抵广告收入下滑和营业成本高昂，以及深陷直播电商竞争，而常年处于亏损之中。而其对AI大模型的训练，能给内容社区带来一波红利，从而反哺业务增长以及商业化加速。

从以上角度来看，布局大模型，似乎已经成为了知乎、小红书、快手等小众玩家不得不打的一场仗。只不过，由于每家的商业逻辑和入场角度不同，每家在大模型上的优势和表现也是不尽相同。而凭借着自身在AI技术和内容上的积累，这些平台们也开始在大模型领域各显神通。

知乎快人一步

作为国内领先的问答社区及原创内容平台，知乎早就将大模型能力应用到了平台中。据悉，4月，知乎发布了大语言模型“知海图AI”，并内测首个站内大模型应用功能“热榜摘要”；随后，又发布了一款大模型智能应用功能“搜索聚合”。得益于此，知乎已经成为国内首批具备大语言模型能力的公司，而知乎之所以能加入生成式AI的战局，自然是具备了一些特色和优势。

一是，知乎大规模、高质量的中文数据池是训练大模型的良好素材，将大幅度提升训练效率。知乎PUGC的运营模式为其积累了海量、优质的数据。据悉，截至2022年第四季度，知乎社区上累计内容达6.5亿条，其中包括5.1亿条问答，就连微软NewBing都将其视作中文数据源之一。可见，知乎对于训练大模型类的AI来说，无疑是一个非常优秀的数据库资源。更何况，这些数据从形式上就十分契合大模型输入、输出的训练方式，能有效提升训练效率。

二是，知乎基于问答的讨论场是大模型天然的应用场景，能够快速精准地为用户提供大模型服务。众所周知，知乎是国内最有名的知识问答社区，这些年知乎积累了海量的问答资源，而提供这一资源的用户来自各行各业，拥有不同的知识背景和经验，他们的答案通常会更为专业、详细和科学，可以有效确保内容的准确性和深度。而这也就意味着，知乎大模型可以从多个角度学习和理解问题，并对用户进行更精准的推荐和问答。

三是，知乎与面壁智能的合作，能助其在训练人工智能模型时，获得更专业、更先进的技术支持。由于没有大厂的雄厚实力，知乎这类中厂便开始通过联合研发与战略投资的方式，与国内大模型团队共同开发中文大模型。知乎的合作伙伴——面壁智能是一家专注于大模型研发的企业，其在自然语言处理和机器学习领域拥有深厚的技术积累。与面壁智能的合作，可以为知乎AI大模型的研发提供更加专业和及时的技术支持。

小红书稳步推进

事实上，除知乎之外，小红书已秘密筹备了“大模型”团队，抢先参与到大模型技术的研发布局中。有消息报道称，小红书在4月悄然上线了一款名为“Trik”的AI创作应用，主打AI绘画。

显然，与大厂相比，小红书的资金储备和技术实力都不够雄厚，而鉴于大模型研发需要高昂的算力、数据以及人力成本，小红书参与大模型研发的概率并不高，更多地可能会聚焦大模型应用环节，围绕平台内用户运营，以及创作者工具提供等方向展开。尽管如此，小红书布局大模型，依旧有着自己的底气。

一来，小红书多类型数据的内容社区，是大模型极佳的实践场景。经过多年积累，小红书的社区内容生态中的内容量丰富且多样，据悉，小红书已经成长为一个月活超2亿的UGC内容社区，涵盖了视频、图片、文字、笔记、用户评论等多个类型的数据。而这些数据也将会为自然语言处理、AI辅助内容的生成提供多模态的数据基础和应用场景。

二来，小红书结构化的笔记内容，更方便大模型进行套路的学习和输出。根据小红书在“WILL商业大会2023”上公布数据显示，通过将笔记、用户行为数据结构化，小红书识别了26万的属性词、600万+的昵称词、700万+的情感描述词。而小红书可拆解、规律化的平台属性，更有利于大模型应用的模仿，从而也能够为平台带来生产效率的提升。

三来，小红书千人千面的推荐系统，有望成为大模型训练的样本。基于大规模的用户行为的产生，小红书团队根据用户的特点去做了更加个性化的搜索。小红书中的瀑布流或者内容流，就是系统根据用户行为中的规律，找出了用户感兴趣的内容并推荐给了用户。而针对小红书平台产生的海量数据参数，将有可能会被实时送到模型中去做预估，而且随着样本的不断变化，模型参数也将会不断更新。

快手跃跃欲试

知乎和小红书一直在积极筹备，快手自然也不能落后。据程一笑介绍，快手目前已组建了大模型研发团队，并依托过去在AIGC算法和大规模语言模型方面的技术积累，按计划推进大模型开发和训练，只是当前模型还处于训练阶段。快手虽然暂时没有对外发布大模型产品，但能看出其对大模型是持积极拥抱态度的。而在快手积极布局背后，自然也有着涉足大模型的驱动力。

一方面，快手的视频生成是生成式AI相对缺乏的细分领域，有助于形成差异化优势。入局大模型赛道的玩家有很多，但相比较而言，作为国民级短视频应用的快手的探索方向就显得十分与众不同。据了解，快手目前在大模型方面的尝试包括大规模语言模型、多模态预训练大模型、智能创作工具等。除了文本之外，快手还在语音、图像、视频、3D图形等各个模态的内容生成方面均有所尝试。

另一方面，快手短视频平台具有娱乐化属性，能给予大模型一定的试错空间。据目前透露的消息来看，快手大模型目前主要由两部分功能组成，一种是类似于Midjourney的文生图功能，一种是类似于ChatGPT的对话式AI工具。而尽管快手称“语言描述的精准度不及Midjourney”，但相较于极度追求专业化的Midjourney，以UGC为主的快手本身对大模型的要求不会有太高。

作为各行业的代表企业，知乎、小红书、快手争相拥抱大模型，固然有其必要性和优势条件，但AI大模型所伴随的深重危机感也不容忽视。上面所提到各个内容平台的表现，都只是其增加了一些有关大模型的“新功能”，其AI大模型产品距离成熟还有很远，实现商业化落地，更是难上加难。

目前来看，国内大中小厂扎堆大模型的现象已经是屡见不鲜，对于参赛的玩家而言，大模型的能力虽是比拼的重点，但具体的场景和落地应用同样关键。而最终谁能在这场“大模型混战”中存活下来，并拔得头筹，也还需要时间来检验。不过，可以肯定的是，知乎、小红书、快手想要从中突围，还有很长的路要走。