本文来源:时代周报 作者:何珊珊
(资料图片)
6月29日,美团宣布以20.65亿人民币收购光年之外境内外主体100%股权,入局大模型之战。
之前有消息称王慧文遭遇个人健康问题,已离岗就医,4天后美团宣布收购光年之外。
美团方面向时代周报记者确认,目前光年之外在两个月内完成了以产品和技术人才为主的团队搭建,目前团队规模在70人左右。
6月28日,字节也发布了“火山方舟”。
值得注意的是,火山方舟并非字节自研大模型,而是大模型服务平台,字节方面称平台集成智谱AI、MiniMax、百川智能等7家AI科技公司及科研院所的大模型,对外提供服务。
对于自研大模型,字节方面对时代周报记者表示,“探索中,暂无预期对外发布时间”。
截至目前,百度、阿里、360等多家头部互联网大厂已发布了自研AI大模型并开始更新迭代。在此基础上,各家也积极探索大模型的落地应用,360宣布依托智脑大模型打造数字人社区;百度文心开拓更多行业应用领域,阿里则推出专攻音视频内容的AI产品通义听悟。
AI大模型的“诸神之战”已然正式拉开帷幕。
诸神之战加速
近期,中国科学技术信息研究所发布《中国人工智能大模型地图研究报告》,据不完全统计,中国已发布10亿参数以上的大模型已多达79个。
报告显示,这些大模型覆盖了自然语言大模型以及图像、语音、视频等多模态领域,参与研发的主体既有高校也有学术界,国内的大模型市场态势可以说是如火如荼。
自2023年3月百度拉开“竞赛帷幕”,各大科技互联网公司纷纷加速进入大模型产业的赛道,先后发布自研大模型或大模型服务平台。百度的文心、华为的盘古、阿里的通义千问、360的智脑、科大讯飞的星火、商汤的大模型、字节的火山平台、腾讯的MaaS平台都在AI大模型之路上加快探索。
其实早在4年前,百度已开始研发文心大模型1.0版本并不断迭代。2023年6月26日,李彦宏在世界互联网大会演讲时提到,文心大模型已迭代至3.5版本。
李彦宏透露,“文心大模型3.5版本相比3.0版训练速度提升2倍,推理速度提升17倍,模型效果累计提升超过50%,在数据质量、生成效果和内容安全性上,都得到了明显提升。在行业合作上,目前百度披露的数字是已有650家合作伙伴接入文心一言。
随后在3月29日,360对外发布智脑大模型,77天后,周鸿祎表示360智脑已从1.0迭代至4.0版本,在多模态等关键能力上完成迭代。
与百度的文心一言积极接入各行业公司不同,360智脑大模型4.0目前仍未对外开放,暂时只接入浏览器、搜索、安全卫士等“360全家桶”产品。
4月8日,华为云人工智能领域首席科学家田奇在人工智能大模型技术高峰会上介绍了华为盘古大模型的进展及其应用,4月10日,商汤科技董事长兼CEO徐立在商汤技术交流日上发布“日日新”大模型体系。
阿里的通义千问也在4月11日发布,很快,6月1日阿里云宣布聚焦音视频内容的AI新品“通义听悟”正式上线,成为国内首个开放公测的大模型应用产品。
5月6日,科大讯发布星火大模型。在6月28日的上海世界移动通信大会上,公司联合创始人、高级副总裁江涛表示,星火大模型今年第四季度目标是在中文领域超越ChatGPT,英文基本达到相当的水平。近日,基于星火大模型开发的APP讯飞星火全面上架各大应用商店,据时代周报记者观察,6月27日更新后,截至6月30日,该APP在安卓应用商店内下载量已超过1万次。
之后,腾讯也宣布发布了自己的行业大模型,但自研大模型“混元”进度仍是是雾里看花。但在一季度财报会上有腾讯高管透露“研发进度不错”。
字节则另辟蹊径,6月27日,在火山引擎与英伟达合办的创新科技峰会上对外发布了大模型服务平台“火山方舟,号称集成智谱AI、MiniMax、百川智能等7家AI科技公司及科研院所的大模型。字节跳动内部人士表示,“字节自研大模型还在探索中,但还不成熟,未有预期对外发布时间。”
而美团则通过收购光年之外股权加入大模型之战,光年之外是今年2月由美团联合创始人、前董事王慧文创立的科技公司,王慧文当时称“将打造中国的OpenAI”。彼时他个人出资5000万美元,估值2亿美元,通过资金占股25%。
美团方面表示,通过收购事项获得领先的AGI技术及人才,有机会加强其于快速增长的人工智能行业中的竞争力。并购完成后,将支持光年团队继续在大模型领域进行探索和研究。
至此,中国大的互联网巨头几乎不同程度投入了这场大模型的竞赛中。
各家各开花,各有方向
大模型的战况如火如荼,但是关于大模型的价值之争也甚嚣尘上。
几天前,顶级VC代理人朱啸虎还与猎豹移动(前金山网络)CEO傅盛为“AI投资价值”在朋友圈争论起来。
争论起因是朱啸虎此前在社交平台表示,GPT赛道对创业者很不友好,不建议创业者选择这一方向。随后,傅盛转发朱啸虎否定大模型创业的相关文章,并表示“硅谷一半的创业企业都围绕ChatGPT开始了,我们的投资人还能这么无知者无畏。”双方就此展开激烈的辩论。
朱啸虎称:“99%的价值都是GPT创造的,这样的创业公司有什么价值。”傅盛则认为价值要看怎么定义,“如果只有底层原理才是价值,那企业的存在就没有必要了。“今天的问题是大模型不能简单解决问题,这就是价值机会。”朱啸虎则坚持对GPT不要有太高的期望值“不要迷信通用大模型。”
不仅投资人对通用大模型创业有分歧,对于通用大模型直应用领域,各家公司似乎也有不同打法。
百度的文心一言和阿里通义千问定位为千行百业赋能。据阿里前CEO张勇之前在阿里云合作伙伴大会上透露,已有超20万企业用户申请测试千问大模型,涉及领域包括通讯、电子产品、企业服务、金融信息,到交通、电力、油气、服饰甚至乳制品等。同时,阿里自身也接入了“通义千问”进行全面改造。
周鸿祎表示看好的大模型应用创新领域是AI数字人,并认为“数字人是未来人工智能大模型的最重要的应用入口,要打造有灵魂的数字人”。
华为盘古的应用场景更多聚焦在B端垂直行业大模型,华为此前表示,大模型聚焦于工业端的应用,已融入煤矿、气象、金融等多个行业,已经在100多个行业场景完成验证,华为的盘古药物分析大模型、矿山大模型、气象大模型、海浪大模型等均已亮相。
相比其他大厂在大模型上挖矿的做法,腾讯和字节另辟蹊径。腾讯日前发布依托腾讯云TI平台打造的行业大模型精选商店,字节则是发布了火山方舟大模型服务平台。
对于方向的选择,据火山引擎相关业务人士对时代周报记者表示:“当前搭建大平台是基于火山引擎的业务属性决定,火山引擎此前已经在提供云服务,发展到一定阶段,结合大模型搭建了平台。”火山引擎智能算法负责人吴迪在发布会上表示:“火山方舟要加速大模型和大算力的应用落地,加快大模型在各行业发挥商业价值。”简单来说,火山方舟不做自己的大模型,而是集合其他大模型的能力提供服务。
对于腾讯的选择,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生在6月19日的大模型技术峰会上表示,“生态共建是AI发展的有效路径,腾讯将坚持生态开放,为企业提供高质量模型服务。”
对于国内大模型产业的未来发展方向与实际应用领域,暂时抛开能否赶超ChatGPT的话题,各家都还有很长的路要探索。
关键词: