头图来自:视觉中国
【资料图】
作者:杨晓鹤
2023年,知名投资机构老虎基金募资不成的消息,悄然传遍了整个互联网。
在习惯了风口创业的过去10年中,“投资人寒冬”似乎还是第一次出现。这与新消费、直播带货、元宇宙几个风口悄然落幕,并购和中概股等退出渠道的大门半遮半掩,种种不利因素都息息相关,创投市场似乎要真正冷清下来。
创业公司融资艰难,大佬的二次创业也不好找方向。从美团退休的王慧文,研究了好一阵的Web3和元宇宙。被腾讯收购公司后离开的王小川,试水了AI医疗。但一切转变在2022年末,ChatGPT 3.5发布,迅速让市场形成共识,AGI(通用人工智能)时代来了,全行业开始跑步入局大模型。
据了解,当时在低调创业的王小川,已经成立了公司做智能硬件。意图帮助有睡眠障碍的上亿人,打造一款治疗打鼾的智能枕头。当3月份大模型热潮兴起后,王小川用了2周时间做了决定,放下这个创业项目,布局大模型。
王小川找来原搜狗CTO杨洪涛帮忙接管医疗项目,原搜狗COO茹立云在这家公司的股份,也兑给了杨洪涛,追随王小川的大模型创业。王小川共拿出5000万美元成立“百川智能”,并邀请了Soul的技术人才来做算法负责人,加速去做大模型。而王慧文的故事,大家就十分熟悉了,酒桌上发布英雄招募贴,成立光年之外公司做大模型。
在互联网大厂中,大模型也带来了翻天覆地的影响。有大模型的项目负责人,年前因为升职不成的问题,从而提出离职。年后3个月时间后,该集团CEO就成为大模型的总负责人,举公司之力All in大模型。
没有人想错过这波AGI时代的浪潮,大家都相信AI在经过三起三落的发展后,通用人工智能的奇点正在来临。毕竟在AI热潮下,类似ChatGPT和Midjourney等几十人规模的公司,创造40亿美金左右的估值,美股“七巨头”总市值一年飙至11万亿美元,大涨60%。这些激动人心的爆发式增长的故事,再一次搅动了国内科技商业市场。
国内互联网大厂中,李彦宏、张勇、张一鸣、王兴等大佬都已经亲自挂帅,可以说除了拼多多,已经全部入局大模型。正如7月19日,微软和英伟达的市值增加了1750亿美元,马斯克在评价相关推文时惊叹:“疯狂的时代。”
即将沉寂的科技商业市场,突然迎来了AI这一兴奋剂,也让互联网进入了最后一次的狂欢。
一、低谷中燃起的新曙光
李明是一家创业公司的CEO,团队规模在100多人。2023年是他最为融资发愁的一年。
最开始创业的过程十分顺利,早期拿到知名天使投资机构的天使和A轮融资。“那时候工业互联网还是个热门赛道,也不像很多AI项目那么浮夸。”李明告诉AI鲸选社,但2023年中,他在启动的新一轮融资中,慢慢发现了行情不对。
投资机构不仅看数据和故事,还要看营收了。此前执着产品化的李明,根本还没意识到,投资风向的变化。用梅花创投创始合伙人吴世春的话讲,就是现在投资项目“既要(技术),又要(数据),还要(营收)”。没办法,他开始找FA机构帮助融资,而且融资轮次也退步,求个A++。
“FA帮找了30多家投资机构,都不了了之了。”融资的不顺利,让李明有些泄气。但在6月份,他感受到大模型的威力,于是内部上马了基于ChatGPT的产业化业务。“现在也还没融到资,不过投资人会主动找来交流,对方明显感兴趣了。”
而对于袁进辉的一流科技来说,大模型也是个救命稻草。2022年,这家做AI深度学习框架的公司,已经到了融资不顺,不得不裁员生存的地步。此前公司3次濒临资金链断裂,都是找天使投资人,也是当时快手CEO的宿华借钱。
“做的事情和百度的飞桨、华为昇思差不多,最重要的是那时候市场大模型训练的业务还没起来。”一流科技员工告诉AI鲸选社,公司属于有钱的时候(2021年)没业务,有业务的时候(2023年)没钱了。
就在袁进辉感觉前途无望的时候,2023年公司迎来了收购的机会。2023年4月份,在清华科技园的一流科技公司内,迎来了一位贵宾,他就是刚刚宣布进军大模型的美团联合创始人王慧文。
最终的收购价格还可以,一位被裁员的一流科技的员工告诉我们,“能与上一轮高瓴资本投资的估值相当,自己的期权也有着落了。”
而成为光年之外联合创始人的袁进辉,终于再也不用为融资发愁。王慧文的融资能力,在当下创投圈无出其右。根据后来的美团收购协议显示,光年之外在没有大模型产品的情况下,就融资了20亿元。
当然,这波行动中更早布局的投资人,已经成功狩猎到独角兽。
Minimax是在2021年11月成立,在2022年1月获得天使轮投资,2023年初公司估值就达到独角兽级别。最早4家投资机构中,还有上海游戏公司米哈游,据悉是因为两家创始高管中有家人关系。而据鲸选社了解,智谱最近也在以100亿人民币的估值融资。
这两家公司的成立时间都不到2年,却都已经成为独角兽,大模型赛道的发展速度惊人。
而AGI热潮,对于那些老牌AI公司也是一次救赎。此前,出门问问的IoT上市故事,已经历经几次无功而返。伴随着大模型“序列猴子”和4款AIGC产品的故事推出,尽管其大模型还小心翼翼不对外公开测评,但也让出门问问终于有了新故事可讲,目前已经提交港股上市申请。
更多的大模型和AIGC创业者走在了路上,甚至在一家创业营里,60%的项目都和AI相关,拥有轻资产、高壁垒、天花板高的优点,AGI彻底成为当下最火的赛道。
二、将AGI的梦想做到最巅峰
如果说2023年是大模型创业“元年”。那么互联网大厂最早入局大模型的“源年”,则可以追溯到2019年。
阿里是2019年9月开始布局大模型,2021年4月发布PLUG大模型。而早在ChatGPT 3.0面世之前,国内就已经有多家万亿参数的大模型,他们分别是达摩院的M6和华为云的盘古大模型,以及智源的悟道2.0。和ChatGPT相比,尽管模型参数超越了,但数据丰度不一样,效果还没法比较,在达摩院的张聪看来,国内大模型起大早赶晚集,最重要的是没做两件事。
第一件事是没做对齐。那时候阿里有很多大小模型,主要没有做训练结果对齐。“你看现在ChatGPT能做诗会聊天,很像人的智力,实际上就是与人的价值观对齐。”张聪讲道,这些都需要对推理结果进行人为调整,而不是用机器的逻辑去做。
第二没有去做高质量的数据集,ChatGPT早期利用菲律宾的大学教授进行数据标注,国内是利用中专生做标注,语料的问题也十分影响结果。在张聪看来,7月19日公布的Llama 2的精调Chat模型,就是在100万人类标记数据上训练的,训练token总数增加了40%,相比Llama的提升是全方位的。“所以大模型并不是大力出奇迹的发明,而是精心设计的工程创造”。
并且反观国内AI产业,也会面临很多其他因素干扰。当时,达摩院主要有两个团队做大模型,一个是金榕领导的机器智能团队,司罗负责的是AliciMind;一个是周靖人领导的自然语言实验室,其中杨红霞负责的是大模型M6。
在2022年末的测评中,M6大模型的成果稍具优势,二者最终整合成现在的通义大模型。“实际上,达摩院大模型团队只有二三十人,主要它的预训练,都放在阿里云。”张聪告诉AI鲸选社,不过现在通义是集团的重要项目,涉及到的人员有600多人,现在很多资源都倾斜给大模型,集团CEO每2周过问一次技术进展。
而对于百度来说,这波AGI热潮,可是自己从2016年就预言来临的AI时代,自然也不会错过。
今年2月7号在内部正式立项,3月16号正式发布。这期间直接上升到百度集团优先级最高的项目, 李彦宏亲自督战,CTO王海峰博士直接挂帅,那时候百度阳泉超算中心就专门为大模型训练。
百度算法工程师赵辉告诉AI鲸选社,百度自然语言处理部一直就在研究NLP等技术,首席科学家吴华也一直是领导,这个部门就有几百人。百度的ERNIE2.0后转成文心大模型,“以前就在做百度大脑,现在都说是大模型文心么。”
做的事情有相似,当然也有区别。赵辉提到,以前百度会做很多垂直搜索的Rank,就是为了根据人为的点击,重新排序搜索的结果。大模型出现后,这些能力都会被沉淀在大模型的算法中,也有利于给出的回答更精准。
对于百度来说,大模型推动下一代搜索质变,已经写进了李彦宏的OKR。不过,对于生态来说,百度的文心大模型是基于bert模式,“包括智源的GLM都是独立的技术路线,和国际的GPT并不一样。”一位百度云的人员告诉AI鲸选社,这点其实倒也不用担心,文心千帆什么类型的模型都有,GPT2、3、4也非常不同。
而说回从阿里离职的杨红霞, 她在去往海外后,也被字节跳动挖去做北美大模型的研发负责人。张一鸣一直在研究大模型会开源还是闭源,所以也没要求集中力量赶工。“年底前会有真正意义上的突破。”杨红霞对AI鲸选社说道。
综合来看,字节跳动应该是继百度之后,在业务上与大模型更匹配的公司。有猎头告诉我们,虽然大模型不着急,但在AIGC领域还是挺激进。比如TikTok在做广告创意业务AIGC,总监职务给出预算100~150W,要求是88后带队。
至此,互联网大厂除了拼多多,已经全部入局大模型。大厂入局的热情,甚至比当年的O2O和直播还有过之而无不及。
三、分水岭突然出现的那一夜
6月份,在北京搜狐大厦,光年之外这家融资最多的大模型企业,正热火朝天地创业。
原一流科技的Oneflow深度学习框架还寻思继续做,但被大模型业务抽调了很多人。可就在6月23日,突然有人在社交媒体上透露王慧文病了,当时公司还有人去求证,得到的是没有这回事的消息。可是在25日晚,美团突然宣布联合创始人王慧文因为抑郁症住院,辞去公司董事一事,其创业的光年之外公司面临出手的新闻。
一时间,光年之外做不下去,王慧文提前跑路的新闻,成为一些人的猜测。AI鲸选社从投资人圈得到的消息,是王慧文的病情确实很严重。最后王慧文睡在上铺的兄弟,美团创始人王兴帮助接盘了光年之外。
大模型真的不行了吗?大家萌生出此疑问。那期间,正好知名投资人朱啸虎和猎豹创始人傅盛也在朋友圈争论,大模型行业是否有泡沫。朱啸虎极度看衰市场一拥而上,做通用大模型的现状,认为绝大多数都会在年底死掉。
光年之外的主动变动,也是否印证了朱啸虎的言论?
从AI鲸选社获得信息看,收购了光年之外的美团,目前并没有停止大模型的脚步。不仅独家投资了智谱AI数亿元,当下还在招聘大模型的项目总监,给出的年薪高达300万元,甚至还在美国成立技术研究院。赚辛苦钱的美团,也并不想在这波科技大潮中落后,尤其在饿了么明确要接入通义大模型,有业务竞争的携程,也已经推出了大模型之后。
但对于国内市场来说,通用大模型确实已经太多。据不完全统计,短短不到8个月时间,已经有超过85家大模型发布,其中很多成了上市公司的套现概念。
Wind数据显示,2023年24家“AIGC概念股”已经合计发生67笔减持,大股东的离婚潮也令人惊叹。2023年初至今,近十家AI板块公司大股东家庭被曝离婚。备受关注的是,A股AI企业昆仑万维,最近就发生占股11%的李琼女士(创始人周亚辉的前妻),计划减持3%的股份(大概13亿元),然后有息借给公司。据了解内情的人向AI鲸选社介绍,感受到了AGI红利的昆仑万维,不仅做了大模型,最近还在密集组建团队,全力以赴做对标微软的Copilot。
上市公司利用AGI 抓紧炒概念,套现离场。大模型创业公司则在内卷到死。
一位在近期成立了AIGC基金的投资人张阳告诉我们,伴随着开源免费且强大的Llama 2袭来之际,下半年很多大模型企业势必会面临融资难的问题。
如今一切已经有端倪,在7月11日,百川智能推出了百亿级别参数的大模型Baichuan-13B,不仅宣布开源,同样还是免费可商用。虽然Baichuan-13B的参数规模不大,但是基于精准的中文语料训练,在百亿规模参数的大模型中,百川经常排名头部。
Baichuan-13B的免费策略,大大冲击了国内大模型付费行情。目前,智源AI就在14日宣布,企业登记获得授权,允许免费商业使用ChatGLM-6B和ChatGLM2-6B。
越来越多的大模型开源免费后,大模型的死亡淘汰赛正式开启。一位基于大模型创业公司的CTO对AI鲸选社表示,智源的大模型从最开始的私域部署要2000万元,到年初的调用价格为180万到30万选包,再到现在的免费,行业变化非常之快。傅盛认为这是市场从大模型参数之争,进入生态规模之争。
互联网大厂并不愁生态建设,由于内部模型非常多,也有免费和付费之分,最主要的大模型目前还是闭源和付费形态。创业公司要建立生态就比较困难,很多初创企业做大模型已花光了力气,做生态就难免力有不逮。据了解目前MiniMax是创业公司中,为数不多坚持公有云,做MaaS模式的大模型企业。
丁香园CTO范凯形容这波开源免费潮,就像把自来水厂(大模型)免费接到用户家里,让每家人手一个水龙头,那些闭源的自来水厂,最好你的水无敌好喝,大家才愿意付费去你那。
四、AGI发展进入分岔路口
分水岭出现后,当下创业竞争已经发展了三派。
一派是坚持全自研大模型,都是实力选手。这一派主要是百度、阿里、字节等互联网大厂以及智谱、MiniMAX、衔远等创业企业。但这些实力选手也被划分成两类企业。
第一类是坚持做自研的通用大模型,对标ChatGPT,不断追赶ChatGPT的迭代速度。
在云启资本董事合伙人陈昱看来,通用大模型是必经之路,垂直大模型发展受限。“因为对于通用大模型而言,垂直领域并不需要重新训练,通用大模型可以通过向量数据库做行业深化,垂直大模型却很难智能涌现。”
从目前看,有梦想的肯定还要做通用大模型,毕竟做成了可以成为下一个互联网大厂。ChatGPT 在协同办公、电商、代码生成、辅助设计等领域已经展现出了这种颠覆性潜质。
第二类是认清现实聚焦落地,坚持做垂直大模型,这一派包括最后达成观点统一的朱啸虎和傅盛,二者都认为垂直大模型将更有产业适用性。
通用大模型一般是在千亿参数以上,而垂直大模型则在百亿或者70亿规模左右。达观数据的大模型产品曹植,参数就都在500亿规模之间。
据达观数据的CEO陈运文告诉AI鲸选社,“曹植”大模型采用混合训练数据方案,分别是50%的通用混合语料+50%垂直专业语料。“我们在金融、政务等领域做文本智能很多年,很多数据是独有的,客户也要求我们做私有化训练。”陈运文告诉AI鲸选社,“以前四五个人用一个星期做一份报告,现在AI半天做好了。”
放弃成为下一个ChatGPT的梦想,才能在商业场景中尽早落地,这是很多垂直大模型的清醒认知。
在行业看来,通往AGI圣殿的第二条路线,是基于别人的模型(如GPT),然后结合自己的行业Know-how去做训练。“对于第二类能不能成功,我觉得需要时间去验证,现在还不明确。原因在于大家还不知道如何把行业Know-how去和大模型做融合的有效路径,如何在有护城河的同时又有可持续的商业模式,这仍是个未知数。”
“尤其很多大模型,本身就有套壳的嫌疑,”投资人张阳告诉AI鲸选社,结合行业做商业化的时候,就会面临很多问题。据悉,两个知名同姓创业者的大模型,是基于Faceboook的开源Llama;某游戏和防护公司用的是智源大模型的基础框架。
更强的开源大模型正在来袭,Meta近期发布免费可商用版本Llama 2,傅盛对此就在朋友圈表示:“这一下不知道多少公司笑醒在深夜,多少公司哭晕在厕所….”朱啸虎对此也评论道:很多人要笑醒了吧,大家都可以Take free ride(搭便车)了。
傅盛的“笑醒”所指,和朱啸虎略有不同。傅盛笑醒指的是使用开源大模型开发AIGC应用的企业,也能做出更好的产品,朱啸虎笑醒是指那些号称自研实则套壳的大模型企业,最近也要宣布升级了。大家所指的哭晕内容相同,都是那些号称自研的大模型企业,国外大模型最强之一Llama 2 宣布开源免费,大家都基于相同的开源大模型,怎么在行业中做出特色能力?
AGI的第三条路线是纯粹做应用,是将模型拿来直接使用,这种的壁垒会较低。朱啸虎也不看好这类模式,认为如果90%的能力是ChatGPT 提供,那么AIGC应用就没有什么投资价值。
在OpenAI的生态中,山姆·奥特曼承诺尽量避免做应用层,和生态开发者竞争,因此效仿Google做了ChatGPT Plugin,从目前看,国内还没有谁做出这种承诺。
文心一言和通义千问,已经有了上百个功能更新,这些功能也覆盖了一些开发者的工作。虽然文心一言也有插件,但目前就两个,一个是百度搜索,另一个是ChatFile(长文档的分析处理能力)。百度千帆和阿里魔搭的生态发展如何协调,还是个有挑战的命题工作。
坚定看好AGI的朱啸虎,认为通用大模型的创业和投资窗口期已过,不绝对依赖某家大模型能力的AIGC,才是AGI时代低垂的果实。比如,近期朋友圈突然蹿火的“妙鸭相机”,算是国内AIGC第一个爆火的产品,国外也曾火过类似的产品“lensa”,月收入曾达到800万美元。
时代的浪潮袭来之际,投资人吴世春就曾打趣问道朱啸虎:“投AI赚的钱把投SaaS亏的钱,弥补回来了吗?”朱啸虎回答,还没,但是AI的前景无限。
目前,创投圈也都认可朱啸虎表达的道理,但很多人并不期待朱啸虎说出实话,诸如“ChatGPT对创业公司很不友好,未来两三年内请大家放弃融资幻想”这些带有寒意的话。
“大模型就是互联网的房地产,就算有泡沫也是美丽的泡沫,”一位刚下场做AI职业教育培训的创业者说道,雷军曾在2013年互联网红利消失之际疾呼,要相信互联网的力量,今天我们也要相信AGI,无论它有没有泡沫。
注:本文中李明、张聪、赵辉等为化名。
关键词: