30个大模型，抢着落地｜焦点分析

在2023年上海人工智能大会（WAIC）逛一圈，如果你想找大模型厂商，无需思考——找人扎堆的地方就可以。

作为国内AI界当之无愧的风向标，WAIC这次的主题前所未有地清晰——AI大模型。本届WAIC邀请超过400个企业参会，主办方甚至特设了AI大模型展区，大模型参数在10亿以上的AI厂商数量，就超过30家。

“大模型太多了！如果有哪家AI公司不做大模型，都不好意思露面了。”人声鼎沸的大模型展区中，一位投资人对36氪如此感叹。

(相关资料图)

无论是大厂还是垂直厂商，AI+多个行业解决方案已是标配。大模型展区宛如一个大型超市，专属解决方案琳琅满目，陈列其中：大模型+云计算、大模型+金融、大模型+教育……

但火热表象下，国内大模型产品“大同小异”——是36氪得到的普遍反馈。这既是技术发展初期的无奈，也同样是一种理性的现实。

百度文心一言企业级平台展区拍摄：36氪

错位

ChatGPT火爆全球大半年后，如果说还有什么东西成为共识，“先落地”可能算第二个。

AI厂商再也不吹概念，迅速寻求在B端落地，这和2015年的AI浪潮全然不同。比如，腾讯云至今没有公布通用大模型“混元”的进展，但在6月中旬先高调公布了“行业大模型”的路线，一口气抛出10大行业超过50个解决方案。

这明显是国内客户更感兴趣的方向。

在百度文心一言、阿里通义千问的展位上，“企业级平台”、“专属大模型”被围了里三层外三层，来询问的企业客户络绎不绝。

一位文心一言员工告诉36氪，来咨询的客户，最关心的问题在于价格，其次是数据安全。“都直接问卖多少钱，什么时候能开始用。”

但大模型私有部署和使用成本还是太高，再加上算力供不应求。大部分企业其实暂时很难用上大模型，这种错位可能还要持续一段时间。

比如，阿里和腾讯如今都还是只定向邀约客户使用，标准化的API服务还没有全面开放。

一位外企IT从业者对36氪表示，他在日本的老板“很着急，很希望能尽快把大模型放到产品里，6月专门来国内找AI大模型服务商，8月还打算再来一趟。”

但在WAIC逛了一圈，上述从业者发现，现在的模型体量还是太大，部署太贵，“我们还是希望先找一个小的切入点，比如用较小的模型做智能客服，嵌入到业务当中。”

另一位阿里云员工则告诉36氪，现在做一个行业或者专属大模型，一般需要千万级别以上的预算，更适合业务体量较大的央国企和大公司。“部署成本比较高，我们也希望尽快把模型压缩到大家能接受的水平。”

为了解决“贵”的问题，阿里云也在通过开源模型、做生态来补足。阿里发起的大模型开源社区“魔搭”，就想做成一个大模型超市，陈列出更偏行业化的专属模型，目前已经聚集了900多个AI模型。

大会上，阿里云也发布了新产品“魔搭GPT”（ModelScopeGPT）。用户通过输入指令，可以一键调用其他的AI模型，用多个模型协同完成复杂任务，这也是降低大模型使用门槛的方式。

AI落地难，大模型要再经历一次

从年初业内惊叹ChatGPT的涌现算起，AI大模型的热度也不过半年。国内AI厂商离ChatGPT仍有不短的距离，但随着国内厂商迅速选择落地，不少难点已经显现。

本质上，AI大模型训练仍然昂贵，即便是大厂，也不可能不求回报地一直投入。这意味着，国内厂商刚开始做大模型，就面临着更残酷的生存考验。抢着在行业落地，也是希望能尽快商业化，再投入到AI模型的开发和训练中。

但资金只是入门券。抢先在行业落地，厂商们更多的是想抢占数据“高地”。

如果是做模型是烹饪，数据好比是食材，大模型对高质量的“食材”需求更高。但在公开互联网中，中文的高质量数据本就偏少，大模型厂商其实很难建立起数据壁垒。在国内厂商尚在追赶GPT-3.5的情况下，没有谁能显著拉开差距。

在很长一段时间中，数据会是更难的一环。一位头部社交公司战略人士告诉36氪，ChatGPT出来后，公司团队迅速就将国内大模型看了一遍，也都进行相应测试，“但他们既没有这个赛道的高质量数据，通用大模型能力又尚不足以支撑业务需求，测试下来，大家效果都一般般。”

为了拿到数据，一位大厂的大模型产品负责人对36氪表示，在其合作模式中，如果企业客户愿意提供数据（越有行业属性越好），他们愿意在商务权益上做出极大让步，甚至愿意免费为提供数据的客户部署大模型。

想要大模型顺利落地到场景中，难度也丝毫没有减小。

“企业需要的，是在实际场景中真正解决某个问题，而不是在100个场景中解决了70%-80%的问题。”腾讯云副总裁吴云声在WAIC演讲中表示。

问题在于，上一波以视觉识别（CV）为首的AI浪潮里，厂商们更先发展的是单点AI能力——比如用AI进行人脸识别，以API形式单次收费是更普遍的形式。但随着技术走向同质化，AI厂商们到后来只能开始做大项目、私有化部署。由于难标准化，账其实很难算得过来。

将大模型用在业务里，AI模型会和客户的核心数据结合得更加紧密。这意味着，想要真正解决客户最核心的业务问题，私有化必不可少，程度可能还会更深——厂商们也许需要帮助客户，从头对核心数据进行标注、训练，再进行模型训练。

谈及私有化大模型的投入产出比，账能算得过来吗？腾讯副总裁、腾讯云智能负责人吴运声对36氪坦承：“从现在的时间节点上看的话，确实会有比较大的挑战。”

如今，腾讯采取一种较为折中的办法——上个月，腾讯推出面向文旅、政务、教育、金融等十大行业，超过五十个解决方案。相当于“前进半步”，客户并不需要从头提供行业数据进行训练。在这些模型的基础上，客户只需要加入自己的场景数据进行精调，就可以快速生成“专属模型”。

归根到底，AI大模型技术仍然在快速发展中，成本上的博弈其实尚无定论。大模型的核心技术，以及算法、芯片等上游产业链都在快速迭代，成本下降其实很快。以百度为例，百度在今年3月发布AI大模型，到了5月，调用文心一言的成本，就已经降低到刚发布时的10%。

而在另一边，AI大模型会带来更大的应用层机会，用户付费意愿也会更高，这会带来更大的收入增量。

比如，近期行业里就冒出了不少针对营销场景的AI产品，有了AI大模型加持后效果显著，比如AI数字人——近期，不少数字人公司因此焕发新机，产品也迅速带来公司收入提升。

关键词：