国产大模型,再添新劲旅。
9月7日,在腾讯一年一度的全球数字生态大会上,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生宣布,腾讯将迈入“全面拥抱大模型”时代。同时,其自主研发的通用大模型——混元也正式对外发布,揭开了外界猜测已久的腾讯大模型面纱。
坦白说,在四、五月份国内大模型“遍地开花”时,与其他厂商相比,腾讯的确会有一点略显“沉默”的感觉,所以在这次混元大模型发布后,业界也不乏有腾讯在大模型赛道上“姗姗来迟”的声音。
(资料图片)
但从汤道生的分享以及混元背后的故事来看,于大模型,腾讯可以说是“蓄谋已久”,其思考点和发力方向也很不一般。
具体来看,我们可以梳理为以下4点:
第一,务实主义,从产业痛点出发,做的是解决实际问题的事。
在腾讯的视角中,大模型的能力绝不仅仅局限在聊天上,而是要能够与产业场景和企业需求相结合,实实在在给到企业和行业支持。
因此,在今年6月,混元大模型亮相之前,腾讯就先行一步公布了腾讯云MaaS服务和行业大模型精调解决方案,也基于行业大模型,对现有的To B产品线,做了智能化的升级,为的就是让大模型的能力,在产业中快速用起来。
比如腾讯会议,借助大模型,已经可以实现自动整理会议摘要、会管会控等功能,极大提升了会议效率,这就是把技术能力真正落地到了实际场景和需求当中。
第二,心态开放,允许企业根据不同业务场景,选择不同的模型,做定制化开发和精调。
腾讯混元大模型是一个基底模型,企业可以通过API调用,结合自有数据做模型精调,与业务场景无缝结合。但这不是企业的唯一选择。
腾讯云的MaaS服务,提供的是一个模型精选商店,不仅有混元,也提供了超过20个开源大模型,客户可以有多元化的选择。
于腾讯而言,大模型的目标一直很明确,就是能够帮助不同企业解决真问题、真痛点,把选择权交到客户手上。不得不说,这就是一种典型的开放心态。
第三,保持节奏,任“风口”来袭,亦不改步伐,一切凭产品力说话。
有句话讲,“慢慢来比较快”。从腾讯来看,“慢工出细活”一直是其很鲜明的一大特质,这一点在大模型的研发上也得到了明显体现。
早在2016年,腾讯便已经建立了四大AI实验室,涵盖AI从全面基础研究到多种应用研发,去年4月,又披露了混元AI大模型的研发进展。
显然,在大模型的探索上,这些年来腾讯就没停下过脚步,但为什么直到今天才正式亮相呢?原因无他,就是要反复锤炼,把大模型的准确度和可靠性打磨到最佳。
正如马化腾所言:
“对于工业革命来讲,早一个月把电灯泡拿出来,在长的时间跨度上来看是不那么重要的。关键还是要把底层的算法、算力和数据扎扎实实做好”。
今天来看,这就是“做三四月的事情,在八九月自有答案。”
第四,笃信未来,看重的是长期价值而非短期利益。
目前来看,在大模型的商业化上,腾讯并没有显得特别着急,更多的还是将其视为业务的“倍增器”,重点在于让更多的客户接触和使用到,进而不断丰富和完善混元大模型解决问题的能力。
这方面,汤道生讲得也很透彻:
“ToB的技术以及市场渗透可能是以十年作为单位,大模型是一场马拉松,现在可能才跑到一公里。”
我们可以理解为,腾讯是把大模型的商业回报放在了未来,而当下要做的是让产品有用,让技术发展。
“现代管理学之父”德鲁克先生曾说过这样一句话,被认为“商业之美”最好的形容:“世界上之所以出现鞋匠,是因为有人需要鞋,而不是因为鞋匠需要钱。”
一样的道理,大模型技术最终也是要为人而服务的,是要满足某种需求的,是能够切切实实解决问题的。
从这一角度来看,腾讯背后的那份务实与本分,真的很值得行业深度思考一番。
以下是汤道生接受媒体时的专访内容,细细品读,相信你一定能从中感受到腾讯大模型的朴素务实和与众不同。
来 源:正和岛(ID:zhengehdao)
腾讯集团高级执行副总裁、腾讯云与智慧产业事业群CEO汤道生
记者:其实2021年开始,每个云厂商都在反思大集成模式,转到健康可持续增长的道路上去。但是我们发现,很多公司至今依然非常摇摆,管理层内部也有很大分歧,与之相反,腾讯云执行得非常彻底。今年看财报来说,已经走过了“最难的阶段”,这个过程中,腾讯云有过哪些阵痛?为何能够如此坚定地推动转型?
汤道生:我们从来没有犹豫过要不要走回头路,做健康可持续的业务,一直是腾讯做业务、做事情的基本原则。做TO C业务的时候是这样,今天做TO B也是一样。腾讯的管理层在这个问题上是高度一致的,相对来讲,我们可以走得更坚决、更纯粹。
要坚定地推动转型,首先是要想清楚,到底什么指标是最重要的。
衡量业务发展的指标有很多,整体的收入数字,只是其中一个,而且不一定有代表性,关键还是要看收入的结构,其中有没有水分,比如转售的比例有多少?人力外包的服务有多少?不应该把这么多不同的产品混在一起,只看一个笼统的大指标,用这个指标,来评判每个不同团队做得好不好。这不科学,也没有意义。我们要把指标拆开,一个一个看。想明白了,知道什么指标更重要,那就坚持往那个方向走。
既然我们想清楚了,腾讯的To B业务要走“被集成”,基于自研产品来发展,那么业务的关注点,就放在了每一个产品赛道上,考核指标就会围绕产品来设定。
比如腾讯会议,我给团队的考核更多是,你在会议这个市场,有没有做到极致,做到客户认可你的价值。至于收入多少,这和业务所处的阶段有很大关系,我更相信未来的潜力。腾讯会议现在已经有比较好的基础,未来十年甚至更长时间,这个产品也会一直往正向发展。
再比如数据库,尽管市场竞争激烈,但我们的产品,在这个市场得了客户的认可,有很多国有大银行的订单,口碑非常不错。
其实,每一个产品所在的领域,都是一个相对独立的市场。我考虑的是,如何确保这个产品模块的团队,做到行业数一数二。
比如“零信任”产品,是否已经做到国内客户最认可?再比如音视频,虽然我们连续好几年在国内排名第一,但面对新场景不断冒出的机会,我们的团队有没有抓住?团队的小伙伴,也一直在往这个方向努力,像音视频,最早是服务泛娱乐直播场景,到现在是远程会议场景,最近两年,又有很多新的产业场景,比如矿山里的无人矿车、集装箱码头的无人集卡,都有用到我们的音视频技术。
记者:把指标拆开看,反映了腾讯非常“务实”的一面,这一点在AI布局上似乎也能看到。比如当初,咱们没有跟风去抢发一个通用大模型,而是立足产业,率先推出了“行业大模型”,能否具体谈谈,咱们在AI尤其是大模型上的布局思考?
汤道生:AI在今年确实很热,客户需求很强。不仅仅是大语言模型,而是所有AI相关的能力,比如机器视觉、语音识别、数智人等等,都特别感兴趣。我们其实一直持续在AI上加大投入,从研究算法到服务客户的场景需求,全面地布局。
很多人都喜欢从TO C的角度,去关注和使用通用大模型,比如,很多人花很大的精力去测试,让一些通用大模型去“胡言乱语”,而不是把它用在产业上。
我觉得对于大模型,最务实的做法,还是回到每个企业自身的痛点,比如降本或者增效,基于痛点,用大模型去解决产业实际问题。可能刚开始使用的版本,只能解决问题的80%,但因为你有一个很清晰的使用场景,用户的反馈,能够形成反哺,帮助你不断打磨模型性能,让解决问题的准确率,一步一步地提高。
正是基于这样的考虑,我们从几个方面,帮助产业,真正把大模型的能力用起来。
首先是打造高性能的AI基础设施。海量大数据处理,模型的训练、推理、部署和运维,以及智能化应用开发、调试等等,都离不开高性能的计算、存储和网络通信能力。
所以我们打造了高性能计算集群HCC、高性能网络星脉、向量数据库等产品,能够帮助客户快速、低成本构建大模型和智能应用。
二是提供多元化的模型选择和精调解决方案。随着大模型的产业落地,大家更关注如何寻找与自身业务更匹配的模型底座,训练出符合自身需求的专属模型,为此我们推出了腾讯云MaaS服务,打造“行业大模型精选商店”和精调解决方案。
今年大会的主论坛中,我们正式亮相了腾讯自研通用大模型——混元,它有超千亿参数规模,预训练语料超2万亿tokens,有强大的中文理解与创作能力、逻辑推理能力,以及可靠的任务执行能力,经过腾讯内部的很多产品中验证,效果不错。企业可以通过API调用混元,或者将混元作为基底模型,为不同产业场景构建大模型应用。
混元之外,在腾讯云行业大模型精选商店中,我们还上架了20多种行业最新、最流行的开源大模型,以及20多个领域的行业大模型。企业可以根据需要,选择合适的模型,然后借助腾讯云智能的TI平台,导入企业专有数据,做进一步的训练与精调,快速生成更有针对性的专属大模型,满足企业个性化需求。
三是推出一系列智能化的应用,推动业务全链条智能。我们基于大模型打造了全栈产品体系,应用于业务不同环节,帮助企业全链条提质增效。比如金融行业,大模型的能力已经应用在开户、业务处理、风控、售后客服等多个业务场景。
客户服务中,专属大模型与数智人的结合,几分钟就可以完成一次在线开户;在海量单据处理中,基于大语言模型能力TI- OCR,通过少量标注样本,就可以识别回单、发票、申请书等多种表单,准确率超过95%,而且还能自动提炼核心标签,生成电子数据文件,进行后续的商业分析。
借助金融风控大模型,金融机构通过小样本提示,就可以自动生成专属的反欺诈模型,建模整个流程时间从2周减少到2天,整体反欺诈效果也提升了20%左右。
记者:您觉得,通用大语言模型未来最有潜力的应用场景是什么?腾讯云的行业大模型,会重点选择某些行业吗?比如像你刚刚提到的金融行业。
汤道生:大语言模型的核心是自然语言处理,语言一般首先是用在跟用户有沟通、交流的场景中,比如客服、售后。通过大语言模型,能够实现降本增效,或者提升用户体验。所以,跟用户打交道比较多的场景,大语言模型能发挥价值的地方也更多。还比如文生图的能力,可以用在需要频繁做图的场景,比如广告投放、营销等等,但也不是所有的行业,都需要做在线投放和营销,还需要对行业和客户做进一步筛选。
其实,各行各业对大模型普遍都很感兴趣,都在各自探索创新的落地方式。比如医疗领域,腾讯健康积累了很多健康领域的知识,给超过1000家医院去提供AI导辅诊的能力,为患者提供更准确的咨询、更详尽的解答。
刚才跟一个客户交流,他们非常感兴趣怎么通过医疗行业大模型来服务聋哑群体。融合大语言模型、数智人、机器视觉技术,就能把语音沟通变成手语沟通,帮助患者解答健康问题。
通过这些案例可以看到,大模型的产业应用,可能不一定是天马行空、很“嗨”的场景,也许就是怎么让售后服务高效,能更快解答客户的疑问,虽然朴实但有用。
我们自己就比较喜欢基于自身的业务场景去构造产品,打磨产品,达到满意的效果,然后把产品开放出来,给行业客户去用。
比如我在会上分享的乐享,它也是我们内部知识库社区,CSIG上万人中,大量一线人员都是通过这个平台,了解产品的最新功能,反馈问题,让产品不断去补齐能力;产品人员也可以把经典的客户案例、产品QA放在上面,方便一线销售人员去应对客户咨询和提问,信息非常丰富。
但是以前,员工想要从这么大体量的知识库里,找到想要的信息,不是那么容易的。所以,我们基于行业大模型,打造了AI助手,用户通过自然语言提问,就能快速从繁杂多样的资料中,快速找到想要的信息,效率非常高。
这个过程中,也会面对大量数据的存储、查询等突出问题,我们通过向量数据库,把非结构化的数据,有序地存储以及快速检索,很好地解决了这个难点。
不只是乐享,当年我们做腾讯会议,也是觉得原来的会议软件不好用。如今,我们又在腾讯会议中上线了AI小助手,能够实现会议内容自动摘要、会管会控;还有客服场景,我们也非常关注,重点打造了腾讯企点智能客服这个产品,借助大模型,我们把产品和服务的相关资料输进系统,给到客服人员,他们给企业提供售后和服务时,就能够快速找到答案,更高效地完成一个工单。这些场景,其实都很实在。
过去四个月,我们不断地通过大模型,去升级腾讯云的所有产品,基于自身的场景,打磨产品,很多客户对于腾讯云产品的这些新能力都非常感兴趣,也觉得很实在。
记者:在激烈的市场竞争中,腾讯的行业大模型上有哪些突出的差异化优势?基于这些优势,行业大模型会我们带来哪些商业上回报?
汤道生:我们更多关注的是,让很多行业客户去使用,看看到底怎么用好大模型的能力,去解决具体的问题。也不仅仅关注模型本身,还包括,如何帮助客户用好本身已有的数据,这些数据可能都不是公开的,但却是在企业自身的业务场景里,回答某些问题时所必须的。
用好数据的过程中,会涉及到模型的训练、精调、数据标签的管理等工作,同时要降低模型的使用成本,还需要做训练加速的工作。
所以,从一个大模型,到提供一个用户可以感受到的服务,中间有很多的环节和工序。腾讯其实是提供,整个端到端的AI服务流程中所需要的“全链条工具”。我们的TI平台就是一个能满足整个工序、环节的需求,给客户提供高效模型搭建服务的重要工具。这可能是大家比较少从友商那里听到的。
至于商业化,现在谈这个可能有点早,但很多机会是能够看到的,比如训练需要非常大的算力,今天的计算成本很高,会带来一定收入。另外,模型搭建和精调过程中,要用到的工具,形成客户依赖,长期来看,也会建立起一个可持续的商业模式。
记者:听您介绍说,混元在腾讯内部已经有超过50个业务场景中有应用,未来公司管理层对于腾讯内部业务,接入混元的态度,更会类似于业务全面上云、统一动作,还是说,业务可以自主选择是否做接入?
汤道生:我们的内部管理相对比较开放。很多场景、产品都在使用大模型,方式也比较多样。他们接入了混元,但同时也会针对业务自身的场景数据,做一些定制化的模型开发和精调。
腾讯做大模型,既有整合力量办大事的地方,比如说混元,公司只会有一个,因为它有非常高的投入,也需要非常专业的人才、资源来支持。但是针对不同的产品场景,其实需求差异蛮大的,我们会允许不同的应用,去选择最符合客户需求的一些模型,重点是每一个产品是不是能够给用户,提供最好的体验。
比如,腾讯会议其实在早期,也尝试接入了第三方的模型,跑通整个业务流程。有些甚至就是在客户自己的开源模型上,基于企业数据构建一个专属模型,来对接腾讯会议。
对内我们保持开放,对外也是一样。今年6月,我们在行业大模型技术交流会上就说,不同行业、不同场景的需求很不一样,可能需要不同的模型,有针对性地提供支持,需要有多样化的模型选择。我们既给客户提供混元大模型这样一个底座,也把几十个开源模型,放在腾讯云智能的大模型商店里,提供给客户使用。
开放,其实是我们做To B业务的一个非常重要的价值观。不只是大模型,包括像数据库,也有很多细分类目,这么多年,大家一直在用不同的数据库,解决不同的问题。我们的TDSQL在TPC-C打榜拿到了世界冠军,解决的是海量高并发场景下在线交易的问题,如果用AP分析型数据库,可能就无法解决。
前一阵,我们也发布了针对大模型场景下,满足客户需求的向量数据库,解决的是企业使用大模型前需要处理的数据清洗、处理等问题。
我一直觉得,要比较务实地看待技术,什么问题适合用什么技术、什么方式来解决,就去给用户提供合适的工具。而不是说你手上有一个锤子,看到什么都是钉子,只有一招。这不是CSIG用技术解决产业问题的理念。
记者:最后想问的是,大模型发展初期,需要不断试错,技术成型可能需要十年或者几年的长度,我们一方面要降本增效,另一方面又要去做这样的长期投入,这么去平衡?
汤道生:资源分配需要有节奏,我有一个“721”的管理理念,70%的资源投入在当期收入和利润上,这样才能让团队生存;20%投入在发展中期的技术,这种技术可能再多两年,就会有商业化变现,可以作为增补项来补充成熟业务;最后的10%,是投在仍处于发展早期的前沿技术,是面向未来的机会布局,可能要三五年甚至更久才能带来商业回报。对于腾讯这样的公司来说,我觉得这样的规划是比较合理的。
AI将会是我们的一项长期的、战略性的投入,因为我们非常看好它的未来。就像90年代互联网,作为新技术,大家也有很高的期望,但也经历2000年的泡沫破灭,这并不代表互联网技术就没有价值。后来,随着PC互联网的发展,互联网能连接很多数据、设备,兴起一波浪潮,腾讯也是获益的企业之一。再到移动互联网时代,能连的设备更多了,终端的能力也更强了,又迎来一次新的爆发。
我觉得AI技术也是这样一个发展模式,早期的AI能力能在部分场景,解决部分问题,但是每一次的技术升级、能力进步,又会打开更多新的机会,AI未来还会有更多能力的提升,我们非常看好,也会持续投入。
排版| 星辰
编辑| 星辰 轮值主编| 夏昆
关键词: