>首页> IT >

“AI春晚”落幕:中国一半大模型都来了,带来对AI的中国式思考

时间:2023-07-09 06:20:44       来源:腾讯网

编辑:腾讯科技/郭晓静


(资料图片)

被称为“AI春晚”的世界人工智能大会在7月8日热闹落幕, 这可能是AI界最有“人缘”的一届大会了。超400家企业参展,30多个大模型集中亮相,展区面积达到了5万平方米,创历届之最。

展馆内,展位按照行业的布局划分得整整齐齐——大模型、算力、应用、具身智能,观展的“专业观众”能一眼看清楚排布,而参展的厂商和友商并列在同一区域,大有群雄逐鹿的架势。从现场流量来看,最受关注的肯定是大模型,另外就是可以实际体验的应用,比如机器人、办公软件等。

有些展商甚至还提前开始了流量焦虑:“大模型的现场可体验场景不多,我们认真讨论了如何用一些游戏的方式来吸引参展观众。”这种流量焦虑侧面反应了这半年AI行业尤其是大模型赛道的“热与卷”,三个月内发布76个大模型、仅现场参展的大模型就有30多个。

一、中国大模型,“用起来”比“做出来”更重要

被称为AI奠基人的特伦斯·谢诺夫斯基(Terrence Sejnowski)这样描述大语言模型的出现:“奇点降临,似天外来客,忽纷沓而来,语四国方言。”这句话形象地描述出大众面对大模型技术突破之后的反应——惊喜、警觉、期待一个新时代的可能到来。

虽然争相推出大模型,但是中国产业界,思考也会更加现实。如何落地?如何让客户买单?华为常务董事、华为云CEO张平安直接给“盘古”定调——华为盘古大模型“不做诗,只做事”。 在其主办的论坛中,华为与30多家公司、研究机构发布了大模型训练、推理部署计划。华为云也正式发布了盘古大模型3.0。

然而,新的算法不再开源、算力底座不稳、高质量训练数据稀缺,被称为人工智能发展的三驾马车中,似乎每个要素都布满荆棘。国内短期内发布这么多大模型,是不是同质化严重?区别于其它大模型的核心竞争力究竟在哪里?

商汤科技首席科学家、联合创始人,在大会现场对腾讯科技谈到对大模型壁垒的看法:“大模型的护城河主要体现在三个方面:第一是算力基础设施;第二是大模型的能力,好的大模型就像有天赋的运动员,能够很好地完成任务;第三是和垂直行业深度结合,并基于行业快速迭代的能力。”

将大模型落地于行业和垂直场景,是这次大会上被频繁讨论到的议题。

落地于具体行业,深耕于具体场景,不盲目追求规模,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生,在大会全体会议-产业发展论坛上表示,“通用大模型有很强的能力,但并不能解决很多企业的具体问题。企业的大模型应用需要综合考虑行业专业性、数据安全、持续迭代和综合成本等因素。基于行业大模型,构建自己的专属模型,也许是企业更优的选项。”

“通用大模型可以在100个场景中,解决70%-80%的问题,但未必能100%满足企业某个场景的需求。”企业如果基于行业大模型,再加上自身数据进行精调,可以建构专属模型,打造出高可用的智能服务。而且模型参数比通用大模型少,训练和推理的成本更低,模型优化也更容易。

另外,大模型落地过程,还需要经过算法构建、模型部署一系列环节,每个环节都不能“掉链子”。模型后续还需要不断地迭代调优,这需要用到系统化、工程化的工具。

针对这些问题,腾讯云最近也公布了腾讯云MaaS服务全景图,基于腾讯云TI平台打造行业大模型精选商店,提供金融、文旅、政务、医疗、传媒、教育等10大行业,50多个解决方案;推出行业大模型精调解决方案,帮助模型开发者与算法工程师,一站式解决模型调用、数据与标签管理、模型精调、评估测试与部署等任务,减轻创建大模型的压力。在这些模型和工具平台基础上,企业只用加入自己的场景数据,就可以快速生成自己的“专属模型”。

2014年就深耕TOB模式的第四范式,推出了式说大模型,大胆尝试了过去深耕、但是在行业看来,很难使用大模型的垂直领域,比如医疗、金融。大模型目前还有一个未解的技术难点,就是产生“幻觉”,一本正经地胡说八道,所以这种要求十分严谨的行业,应用大模型可能会有一定困难。

“大模型自身的技术决定了可靠性一定不是它的原生特性,如何让大模型做100%准确的事情?需要分成三层:一小部分100%准确的内容可以即时满足用户需求,我们要通过技术迭代,让这部分内容越来越多;第二层是不那么准确的事情,模型要能告诉用户,这个可能是不准确的,来源是这些,用户可以二次确认;第三层是模型完全不知道的,一定要能说“我不知道”。一个通用语言大模型,通常是不会说“不”的,它会一本正经的告诉你很多理由,而在工业等场景,一定要让他说“不”,再配合其它的运营、数据的闭环等等,让大模型可以落地到严谨的应用场景,帮助企业降本增效。”

AI创业投资:机会很大,泡沫也很大

算力成本高,门槛不低,这个行业是否给创业公司留有机会?清华大学教授、中国工程院院士张亚勤认为,大模型的出现,对创业公司是一个机会,但即使存在商业的大模型和开源的大模型,作为创业公司,可以直接调用这些模型,不需要自己从头做起。因此,对于创业公司来说,这是一个巨大的机会,进入门槛更低了。

中金公司原总裁兼CEO朱云来则提到,大平台公司可以推动科技进步,小公司有强烈的创新冲动。但需要防止大公司过分垄断,同时鼓励和保护小公司。这样,平台和小公司都可以生存,推动社会更系统、更快的进步。

张亚勤称,“如果我是投资者,我现在会非常害怕。”不管投大模型也好,垂直模型也好,可能95%甚至更高,两三年之后都没了,但是又不能不投,因为这个机会成本太高。虽然有很多机会,但大部分投资可能会一无所获。“现在的人工智能有点像98年的互联网。机会很大,但也有泡沫。”

朱云来接着阐述了他的观点,“人工智能会在这个泡沫中涌现出来”。从投资的角度看,你需要关注的是整个大局,而不只是某个特定领域。只有当你做出投资决策时,才有可能获得成功,而如果你没有投资,那肯定会失败。但请不要误以为,只要你投了,就可以高枕无忧,自认为是最大的赢家。其实,你需要不断的投资和调整,保持谨慎,持续关注市场的变化。

启明创投合伙人周志峰在现场展示了AI创投领域的变化曲线。

与AI1.0时代不同,周志峰认为,这次由超大规模预训练模型所掀起的AI浪潮,实际是解决了过去AI企业无法实现产业化落地的难题。比如,AI算法的训练、数据、推理和具体应用场景无法实现规模性落地,完善的开发基础设施与环境也没有建立,同时,也缺乏对AI上市公司和资本市场估值体系等。

而在AI2.0时代,所产生的泛化与涌现能力,提振了投资人、创业者与科技大厂对这一代的AI的信心。在他看来,大厂业务的边界自然会随着技术的演进拓展边界,但创业者并非没有机会。“要寻找自己创业的黄金通道,跨过死亡峡谷。”

AGI之辩:人类必须严肃认知AI风险

关于技术的未来,MidjourneyCEO大卫·霍尔兹在2023世界人工智能大会上发言,他并不确定可能的走向。但融合模型(图像 /文字用的模型进行融合)可能是比较可能的发展方向。他认为AI的这次技术进步的潜力还没有完全发挥出来,比现在强上十倍,百倍的进步是必然的。

AI将成为创造和想象力的新的载体和引擎。通过AI,我们有可能放大整个人类种族的原始想象力。到目前为止技术上的大部分进步都来自于试图让人变得更好,试图放大人的能力。因此AGI也许并非是必要的,AI作为我们人的延伸,赋能人类才是更好的选择。

图灵奖得主,Meta AI基础人工智能研究(FAIR)团队首席AI科学家杨立昆(Yann LeCun)依然直言,“不喜欢AGI(通用人工智能)这个名词。”他也曾不止一次的表达过,类ChatGPT产品并不能真正理解世界,更无从谈起实现人类智慧。杨立昆认为,现在还没有一个足够智能的系统来处理各种事情,所以人工智能系统需要一个世界模型(World Model),这个模型主要通过观察来训练,并通过少量交互处理不确定性。世界模型就像人类理解世界的方式一样,通过物理直觉等方式了解世界的一切,对于未来10年的人工智能研究来说,这是个巨大挑战。

CEO埃隆·马斯克(Elon Musk)在大会开场演讲警示说,“计算机和人类的比例每年都在急剧升高,这意味着机器和生物之间的算力差距在进一步扩大。这将导致根本性变化,对未来人类文明产生深远的作用和影响。因此,当下就是对人类文明最为关键的时期。”

关于AGI的潜在风险,清华大学电子工程系长聘教授,IEEE Fellow周伯文表示,从技术角度来讲,需要在三个方面做出准备,一是如何从治理的角度对ChatGpt的输出加以标注,如何能够自动识别出哪些是AGI生成的;二是关注ChatGpt引发的知识产权问题;三是关于ChatGpt对行业造成的冲击如何界定等。

而在中国,目前对于人工智能的治理和呼吁有三个特点,一是促进发展、发展第一;二是重视治理;三是伦理约束。所以在支持治理的前提下,技术上一个重要的点在于如何做到可信赖的AI,让监管的可行性更容易落地,也让用户更放心使用。

无论如何,未来已来,AI已经走入普通人的视野和生活,夏日高温之下,连续三天每天不到九点,观众就已经聚集在世界人工智能大会场馆外面排起长队,还有许多人因为没有提前预约而无法进入会场,甚至拿着手机在门口看起了直播。

关键词: