最近,AIGC最大一笔收购案诞生:一个62人的初创企业,竟然卖了94亿元。
6月26日,大数据巨头Databricks宣布收购MosaicML。
Databricks于2013 年成立,是一家大数据公司(Pre IPO阶段),使命是:简化数据和 AI ,并使之民主化。该公司2022年的估值约380亿美元,每年营收超10亿美元。
(资料图)
而MosaicML则是一家妥妥的初创公司,成立于2021年,由2名前英特尔高管联合创立,目前已融资超过6400万美元,机构包括DCVC、Lux Capital等。
2年时间,94亿RMB,Databricks为何要花重金收购MosaicML?
为什么值94亿元?
这一切还是与ChatGPT掀起的AI大潮有关。
Databricks本身正在研发大模型,只是思路与OpenAI略有不同:前者想用更少的参数,实现ChatGPT的同样效果。
自去年以来,ChatGPT的惊艳是有代价的:耗时7年,每代大模型的迭代周期约1-3年。并且大模型的训练非常昂贵,单次成本可达100万美元。
Databricks的思路较有突破性,这意味着未来大模型的开发将更省时、省力、省钱。
今年4月12日,Databricks发布大模型Dolly 2.0。
与GPT4相比,Dolly 2.0的训练参数仅为120亿个,而前者为100万亿个;而Dolly 2.0的前身(Dolly)则更省时、省力,训练成本仅为30美元、一台服务器、3个小时。
大模型的智慧程度,已经被行业共识;但降低大模型的开发难度,也已成为行业共识。这个方向,不仅只有Databricks在努力。
今年3月,斯坦福大学研究人员也完成了一项特殊尝试:用600美元的成本,复制了GPT3模型,耗时也仅有2个月。
那么以上又与MosaicML有什么关系?
MosaicML也是一家AIGC(生成式AI)公司,也有自己的大模型产品(MPT),但它的定位专注更鲜明:主要面向to B,产品主要给企业用,让企业自己训练、部署AI模型。
在to B方向,与ChatGPT相比,其产品成本更低、用时更短。比如GPT3等同类产品训练成本约数千万美元,而MPT-30B则仅需要70万美元。
MosaicML的一个重要使命,是把大模型从“天价”打到了“亲民价格”,为大模型在企业的普及创造了可能。
那么,Databricks又为什么要收购MosaicML?
因为MosaicML主攻的客户群体,正是Databricks的客户群体。后者的客户多为大型企业和组织,需求是处理大量数据+数据分析+机器学习。
而从to B 方向来看,Databricks的整体进展落后于MosaicML。从未来看,大模型AI产品将取代传统AI产品,Databricks如果此刻不下手,未来就有被替代的可能。
MosaicML已经拿下甲骨文等KA客户,并且在商用大模型里排名较靠前。
今年5月,MosaicML发布可商用大模型MPT-7B,包含70亿个参数。在各类性能评估中,MPT-7B与META的大模型LLaMA打了个平手。
而在商用大模型的评比榜单里,甚至看不见Databricks的产品。
启示:新风口来临
抓住风口,鸡犬升天。
不得不说,MosaicML是一家幸运的公司,仅仅2年卖出94亿元价格。其创始团队成员一共4位,CEO名叫Naveen Rao,曾任英特尔副总裁兼AI产品事业部总经理。他曾于2014年创办AI芯片公司Nervana,后于2016年以4.08亿美元卖给英特尔,耗时2年。
结合此次并购经历,可以看出Naveen Rao兼具战略眼光与资本运作能力。
公司卖给英特尔后,Naveen Rao加入了英特尔,成为其AI产品集团负责人。2020年,英特尔放弃了Naveen Rao所负责的产品,导致后者出走。
与Naveen Rao一起出走的,还有一位华人Hanlin Tang。他本科毕业于普林斯顿大学,后赴哈佛大学攻读博士,后担任英特尔AI实验室高级主管。
据外媒援引官方消息,被收购时该公司拥有62名员工,其中研究人员15名。此前,该公司曾获得约6400万美元融资,估值2.22亿美元——不到2年时间,估值增长6倍。
这桩交易也将给国内AI创业带来启发,尤其是企业版大模型方向。
国内的通用大模型正处于百花齐放,百度、阿里、华为、腾讯、字节、360等,但企业商用版大模型目前暂未出现。综合铅笔道观察,大模型的商业化必然to B先于to C,就和计算机的问世一样,也是to B先于to C。
据铅笔道了解,一些早期创业者已经悄悄杀入该领域,使命是:在省时省力省钱的前提下,帮助企业搭建AI大模型。
MosaicML的收购证明:该赛道既有商业化前景,又有巨大的资本化空间。
本文不构成投资建议。
关键词: