瞄准ChatGPT,谷歌的下一枚炮弹已经准备好,只待发射。而担负起发射任务的,是谷歌DeepMind。
昨天,谷歌DeepMind的CEO德米斯·哈萨比斯(Demis Hassabis)在采访中放出豪言:他们正在研究开发的Gemini,将比OpenAI的GPT-4能力更强。
德米斯·哈萨比斯
(资料图)
之所以这么自信,是因为Gemini有一个重磅武器:AlphaGo。没错,就是那个在2016年打败世界顶尖围棋选手李世石、两年后在中国乌镇打败当时世界第一柯洁的AlphaGo。
“你可以认为Gemini结合了AlphaGo系统的一些优势,和大模型惊人的语言能力。”哈萨比斯透露,“我们也有一些创新,这些创新将非常有趣。”
哈萨比斯称,结合大语言模型LLM技术和AlphaGo的强化学习技术,让Gemini具备计划和解决问题的能力。消息一出,不少人直呼期待:AlphaGo擅长的逻辑和推理,不正是ChatGPT的短板吗?
就在2个月前,谷歌母公司Alphabet将谷歌大脑和DeepMind合二为一,成为谷歌DeepMind,由DeepMind的联合创始人哈萨比斯出任CEO。
扬言超过ChatGPT背后的GPT-4模型,是哈萨比斯最具野心并且高调的表态。
去年DeepMind就提出了另一个名为Sparrow的模型,可以在回答问题时,利用谷歌搜索的信息作为支撑。彼时被谷歌收购了8年的DeepMind,还是一个拥有很高独立性的存在,张口闭口喊谷歌是自己的“合作伙伴”。
然而不久之后,OpenAI发布了ChatGPT,整个AIGC领域都变了天。Sparrow就此推迟发布,谷歌母公司Alphabet干脆将长期各自为政的谷歌大脑和DeepMind合并,双方对几年前还在聊“分手”选择性失忆,共同向OpenAI发起进攻。
Gemini,将是这场联手对外刺出的第一拳。
与此同时,OpenAI也已经杀到了DeepMind家门口。就在今天,OpenAI宣布将在英国伦敦设立新的办事处,这是其在海外的第一个分部。而伦敦正是DeepMind所在地,别的不说,这下抢人才方便多了。
这一边,马斯克心心念和扎克伯格的“约架”,亲妈出面叫停都不好使,在垫子上翻滚、苦练格斗的照片飞满社媒。
另一边,华盛顿大学计算机科学与工程学教授在推特上感叹:“真正的笼中斗不在马斯克和扎克伯格之间,而在DeepMind和OpenAI之间。”
A
DeepMind与OpenAI的笼中斗,也许是命定必有的一劫。
OpenAI的创办,和DeepMind脱不了关系。
2014年,谷歌宣布以4亿英镑(6亿美元)的价格,收购DeepMind。彼时DeepMind是一家刚成立三年多的AI初创公司,只有50名员工。
外界一头问号,左看右看只能看出一件事:谷歌对AI是真舍得下本。
此举还引起了另一个人的警觉,那就是“硅谷钢铁侠”埃隆·马斯克。马斯克早期就投资过DeepMind,对其能力心里有数。联合创始人之一的哈萨比斯既是神经科学家,也是游戏开发者,DeepMind一开始的目标就很明确:将机器学习和系统神经科学结合,建立强大的通用学习算法。
而在谷歌宣布收购DeepMind之前的一个月,这家公司已经用玩游戏的AI小试牛刀,演示了用其研发的软件在太空入侵者、乒乓球等雅达利游戏中超越人类。此前还没有机器能从零开始自行学习规则,掌握这种复杂程度的游戏,DeeMind在业内引起关注。
时任硅谷创业孵化器Y Combinator总裁的山姆·阿尔特曼(Sam Altman)和马斯克有相似的想法。在他们二人眼中,DeepMind是最有可能率先开发出通用人工智能(AGI)的公司。
于是,在2015年的夏天,距离谷歌收购DeepMind过去一年多,阿尔特曼在硅谷组织了一场私人晚宴,出席者包括马斯克、支付独角兽Stripe前CTO布洛克曼、谷歌大脑知名研究员Ilya Sutskever等人。
OpenAI由此诞生了,9位个人和机构捐出10亿美元作为启动资金,阿尔特曼和马斯克出任联席董事长。以非营利组织存在,OpenAI立志:一,让AGI造福人类,二,阻止谷歌在该领域形成垄断。
但AI项目的研发,是一件费钱的事。非营利性质的OpenAI在最初几年预算有限。2017年,OpenAI职能支出2688万美元,其中云计算花费790万美元,还要从谷歌那里租CPU和GPU。同年,DeepMind总支出则高达4.42亿美元,算力则可以直接从谷歌申请内部支持。如此悬殊的投入差距,OpenAI想要“防止谷歌垄断”的梦,显得有些遥远。
2016年,OpenAI发布OpenAI Gym和Universe,刚刚小有名气,有点像2013年底以游戏AI引发关注的DeepMind。
但在那一年,DeepMind的AlphaGO来了,在全世界的关注下,AIphaGO击败了围棋顶尖选手李世石,两年后,又在中国乌镇以3:0的战绩击败了当时世界围棋TOP.1的柯洁,谷歌出尽风头,DeepMind名声大噪。也是在2018年,DeepMind带着AlphaFold参加第13届CASP竞赛,一举夺冠,用AI解决“蛋白质结构预测”的生物学难题。
2019年,想通了的OpenAI终于改制,从非营利组织向商业公司转型。它如愿抱上了另一个科技巨头微软的大腿,后者投资了10亿美元。而马斯克也在这一时期与OpenAI分道扬镳,阿尔特曼成为OpenAI的CEO。
有了钱的OpenAI终于可以甩开膀子搞研究。2020年,在训练约2000亿个单词、烧掉几千万美元之后,大语言模型GPT-3横空出世,是彼时全球最大、最先进的语言模型,参数达到1750亿个。GPT-3的发布震惊四座,成为当年最重要的AI大事件之一。
至此,虽然二者的项目方向有不同,但是在AI领域来看,OpenAI和DeepMind是平起平坐的玩家了。
B
只是DeepMind和OpenAI,在2020年时大概都没有想到,两家的正面交锋就在短短几年后。
ChatGPT问世进入1年倒计时,DeepMind与谷歌却浑然不觉,甚至差一点分手。
2021年,传出DeepMind和谷歌进行分离谈判的消息,而且据称4月时谈判已经结束,但没有达成协议。
还记得OpenAI创立的初衷吗?造福人类、避免谷歌垄断AGI。有趣的是,DeepMind和OpenAI英雄所见略同,虽然早早卖身谷歌,但DeepMind一直担心AGI若真的实现,可能会被滥用。
也因此,DeepMind的管理层在背靠谷歌的这么多年里,一直努力在维持自主性,保持和谷歌的距离。谷歌自己的谷歌大脑,和远在伦敦的DeepMind,甚至一直存在竞争关系。
当年的报道中最有意思的一个细节是,由于担心谷歌的监视,DeepMind的一些员工甚至会使用加密消息应用来通信。
在DeepMind内部,旨在获得更多自主权的计划,甚至拥有姓名——Watermelon西瓜计划,后来在其领导层中被正式命名为Mario马里奥计划。有知情人士称,2017年,DeepMind把分离的打算告诉了员工。2019年,DeepMind还注册了一家公司和一家新控股公司,似在为分离做准备。
不过这手,终究是没分成。而且谷歌还显露出收紧对DeepMind控制的迹象。2022年1月,谷歌吸收DeepMind健康部门,这代表后者走向商业化。这次兼并显得有些突然,DeepMind只向其合作医院发出了三天的更改通知。一些DeepMind健康部门的员工很不满,并计划在合并完成后离开。
盘算着和谷歌分离的DeepMind,对于这样的发展自然不会有多满意。
在此期间,DeepMind和谷歌本身的研发工作一直没有停止。在2022年的上半年,DeepMind发布了Gato,这是一个AI“通才”,可以执行600多种不同的任务,DeepMind向那个终极梦想AGI迈进。但能力还有限,需要随着未来算力的提升慢慢优化。
也是在这个时期,谷歌发布了大预言模型PaLM,拥有5400亿参数。在风险厌恶下,PaLM就像谷歌的不少其他研究成果一样,没着急应用在消费级市场。
接下来的事情,咱们都知道了。ChatGPT如一道闪电,划破AI长空,成为史上增长最快的消费级应用。微软追加百亿美元,剑指谷歌,扬言要“摧毁谷歌搜索的高利润率”。
再也没有什么出于谨慎的按兵不动,谷歌不进,就是退。
而谷歌,在最初几个月的犹豫之后,最终选择迎战。它推出了基于LaMDA模型的Bard,却并没有对ChatGPT造成什么冲击,反而是演示视频中的事实错误让谷歌股价震荡。
讽刺的是,已经告别非营利属性、抱上另一个巨头微软大腿的OpenAI,确实以ChatGPT兑现了成立时的“初衷”:不能让谷歌称霸(至少暂时做到了)。
谷歌和DeepMind,则因为OpenAI的这招出其不意感情升温。今年早些时候,谷歌母公司Alphabet表示,不再将DeepMind视为“其他赌注”中的独立业务,希望利用其成果加快整体AI业务的发展,降低该部门独立性。
今年3月,就已经传出了DeepMind和谷歌大脑的工程师合作,开发ChatGPT竞品Gemini的消息。一个月后,4月,谷歌母公司Alphabet正式宣布,DeepMind和谷歌大脑合并,成为谷歌DeepMind。原谷歌大脑的负责人担任谷歌及谷歌Deepmind首席科学家,而哈萨比斯,则成为了谷歌DeepMind的CEO。
相比于过去长达8年的同床异梦,今年DeepMind和谷歌之间进展神速。不知道DeepMind如何处置曾经的担忧,但可以看到的是,在对抗ChatGPT这件事上,它肩有重任。
C
毫无疑问,Gemini将获得谷歌的极大支持,这要是在国内互联网公司,就是SSS级的重点项目。
整合也整合了,DeepMind当家本领AlphaGo的技术也拿出来了,总可以力大出奇迹了吧?
然而,用尽全力,不代表就能一拳KO对手。
在高调宣称Gemini将超越GPT-4的同时,哈萨比斯也表示,这个项目还需要数月的时间,耗费数亿美元。相比而言,ChatGPT在发布前的成本是1亿美元。
而数月,在后ChatGPT时代,是很长的时间跨度。今年ChatGPT已经发布了GPT-4,以及ios端应用、插件计划,最新“浏览”功能则接入了必应搜索。微软在短短半年内,已经发布了新必应、Office 365 copilot,并积极带GPT上云,还已经尝试将GPT直接融入到Windows11操作系统中。
图源:微软官网
另一方面,玩家纷纷涌入。比如今年大火的基于大语言模型的聊天机器人character.AI,在iOS端首周的下载量超过170万,远超ChatGPT。“下一个ChatGPT”好像随时会出现。
更糟糕的事情是,AI创业潮中,谷歌DeepMind成为了被猛“薅”人才的冤大头。如DeepMind的联合创始人苏莱曼(Mustafa Suleyman)创办了Inflection AI,今年5月推出了聊天机器人Pi,对标ChatGPT。前面提到的Character.AI,其创始人是前谷歌首席软件工程师,也是Transformer的论文作者之一,这家公司还吸收了多名谷歌大脑研究员、LaMDA论文作者。
这么热闹当然少不了马斯克,他在今年张罗着自己的X.AI公司。4月,媒体报道称马斯克已经邀请了DeepMind前研究工程师巴布什金(Igor Babuschkin),以及其他6名成员。此时巴布什金刚刚离开DeepMind,连领英上的信息都还没修改。
最后,别忘了,就连谷歌大脑和Deepmind合体这件事本身,也暗藏隐患。多年的不和不会在一夜消失,而他们还需要并肩完成一个艰巨的任务。新的部门谷歌Deepmind,究竟能不能平稳地走过这“数月”,也要打一个问号。
DeepMind已经走进笼中,准备好与OpenAI正面交锋。在八角笼中,什么都有可能发生。
参考资料:
1、腾讯科技:《控制AI之战:揭秘谷歌与DeepMind的爱恨情仇》
2、机器之心:《逃离谷歌,多年来DeepMind一直在寻求独立:还搞了「Mario」计划》
3、硅谷101:《揭秘OpenAI成长史:理想主义,冲突,抉择与权力斗争》
4、DeepTech深科技:《DeepMind发布“通才”AI模型Gato,能完成600多项任务,单一架构且参数仅约12亿》
5、新智元:《七年之痒?DeepMind为何坚决要和谷歌「分手」》
关键词: