360智脑加入大模型竞赛 “百模大战”谁将胜出?
本报记者 李昆昆 李正豪 北京报道
(资料图片仅供参考)
近日,360智脑大模型连续押中全国甲卷和新课标II卷的两道作文题目,被网友称为“预言帝”。据了解,“360智脑”为360公司自研的千亿参数大语言模型。360方面最近宣布,6月13日将正式推出360智脑大模型应用。
谈及360在AI方面的应用,360方面向《中国经营报》记者介绍称,“‘360智脑’结合360浏览器、搜索、安全卫士等优势场景的落地应用已陆续成熟,并部分开放内测,为个人用户打造全能的AI助手。同时,我们预判多模态+物联网将成为大模型的下一个风口。不久前,我们发布了360智脑·视觉大模型,它将在智能硬件这个场景发挥重要作用。此外,还有即将发布的360智脑大模型应用。”
360智脑表现如何?
最近,360公司创始人、董事长兼CEO周鸿祎在谈到大模型发展现状时对媒体说,“大家都感觉很焦虑,三个月就像三十年,每天都有层出不穷的围绕大语言模型的成果,软的硬的以及各种框架开源工具都有出来。”
今年4月份,周鸿祎要求公司全面拥抱人工智能,基于大模型能力开发全端产品。360智脑已通过结合360搜索、智能硬件等优势场景落地应用,并开放内测。
5月31日,360又追加了视觉版,发布了“360智脑·视觉大模型”。据悉,360在视觉感知基础上,与“360智脑”大模型相结合,清洗训练了十亿级互联网图文数据,并针对安防场景数据进行微调,推出了视觉及多模态大模型。
不过,速途研究院院长丁道师告诉记者,“做大模型有很高的门槛,360做大模型效果目前还不好说,但360做基于大模型开发的一些具体应用,则可以期待一下。360懂用户,产品能力强,在大模型(比如GPT或者文心一言)的加持下,很多产品的效力会进一步发挥出来。”
那么,360智脑到底好用吗?记者获取了360智脑内测资格,并试问360为什么要做大模型?360智脑回答,“360做大模型是为了提供更好的智能服务和用户体验。通过大模型的应用,360可以实现更精准的图像识别、语音识别和自然语言处理等功能,让用户获得更好的交互体验。此外,大模型也是360在人工智能领域保持竞争力的重要手段之一。”
谈及360做大模型的优势,360方面告诉记者,“与其他公司相比,我们在技术积累、搜索增强和大模型安全上具有竞争优势。在技术积累上,360是国内少数持续深耕人工智能核心技术的公司。2015年,我们成立了AI研究院,自2018年开始探索多模态、跨模态技术应用以及NLP等大模型核心技术。在搜索增强上,作为国内第二大搜索引擎厂商,360发展大模型不仅具有天然技术基因优势,同时,搜索增强优势还可以补足GPT实时性、准确性不足的能力短板,使大模型和搜索引擎相互增强,形成双向循环。在大模型安全上,360以安全起家,在AI安全领域已有多年积累,其中全球首创大模型安全风险评估体系‘AISE’,能够为全球大模型安全赋能,确保大模型技术的安全。”
对于360在AI方面如何布局的问题,360方面回复称,“在AI布局上,360坚持‘两翼齐飞+四路并发’战略。一方面,我们坚持自主研发,自研360GPT,造‘发动机’。另一方面,做大场景优势。除面向C端消费者,打造个人用户全能AI助手外,360还将围绕中小微企业、行业等的不同需求,打造不同的大模型产品及服务。”
360方面称,中小微企业是未来大模型的蓝海市场,中小企业需要的不是私有大模型,而是人工智能驱动的各种实用的办公工具,需要SaaS化服务。为此,会跟行业里SaaS化的初创公司合作,基于人工智能和大语言模型能力,做出各种垂直的AI生产力工具,提供给中小企业。
企业、政府、城市是GPT的巨大增量市场。未来,中国不只有一个大模型,政府、企业、城市都会有自己的专属大模型。360方面称,后续其将在通用人工智能的基础上,把每个城市、每个政府部门、每个企业各自的私域知识训练进去,形成各自专有的大模型。同时还将携手龙头企业,合作训练行业大模型,向行业内的其他企业开放,赋能百业千行。
谁更有优势?
丁道师表示,目前国内公司在AI大模型方面的竞争非常激烈,因为这关系到未来人工智能产业的发展格局。各大公司都投入了大量资源来研发和应用AI大模型技术,希望能够在这一领域占据领先地位。同时,由于AI技术的广泛应用前景和商业价值,许多创业公司也纷纷涌入这一领域。整个行业处于快速变化和发展之中,值得关注和期待。
在周鸿祎看来,中国不会只有一个GPT4.0,也不会只有一个大模型。现在有一个趋势是把大模型做小,小到一台安装英伟达3090、4090芯片的机器可以微调,甚至是将来在IoT(物联网)设备上部署,这就决定大模型算力结构将来会无处不在。
“你用GPT就会发现很多问题,它貌似能回答,但缺乏行业深度,因为它太通用了。如果把大语言模型看作一种生产力工具的话,我非常坚信在垂直领域其实很多机会远远没有被表现出来。”周鸿祎说,“要是真正完全用ChatGPT4.0看病,开的药方你敢吃吗?你真正完全用ChatGPT写诉状打官司,那不是会出事吗?美国有一个例子就是一家公司打造了法律行业的大模型,它不会唱歌、不会写诗、不会做脑筋急转弯,但会回答法律问题。因此,很多企业都需要自己定制的ChatGPT。”
创新工场董事长兼CEO李开复则认为,内容生产、娱乐等是AI2.0最快也最易于落地应用的领域,这些领域有一定的容错空间,也能通过人工干预校准错误。未来,随着AI2.0的不断迭代发展,“胡说八道”的问题也有望解决。
谈及更看好创业公司还是互联网巨头做AI的问题,丁道师认为,这要根据不同的情况来看。创业公司在某些方面可能更具创新性和灵活性,可以更快地适应市场变化和需求;而互联网巨头则可能在数据、技术、资金等方面具有更大的优势。因此,选择哪种方式取决于具体情况。
“总体上来看,像目前的环境,我觉得还是大型的科技公司做大模型更有机会一些。国外就不用说了,咱们以国内为例,百度、阿里、科大讯飞,它们都有自己的大模型,但是目前做的好的只有百度,因为这个事情还得让大公司来做,大公司不仅仅有钱、有资源、有人,也有数据的积累,算力也很强大,所以说它们更有可能做好这个大模型。”丁道师说。
不过,李开复认为,AI2.0市场规模巨大,足以容纳巨头、中小企业和初创公司在里面“赛马”。创业公司与巨头各擅胜场,正如ChatGPT背后的OpenAI公司一样,创业公司更灵活、更专业。从硅谷经验来看,很多技术创新的发起者,都技术领先、策略灵活、市场反应快。落地执行力强的团队将是中国大模型公司成功的关键。
业内认为,未来不可能有50家大模型公司存在,会收敛到一个很小的数字上。不过,在当前大模型这个领域,大家都在追赶,可以鼓励以各种不同的模式去先行先试,优秀的技术产品是“赛马”赛出来的。
关键词: