来源:视觉中国
作者 | 肖望
出品 | 棱镜·腾讯小满工作室
(资料图)
大模型正成为互联网巨头的必争之地。
知名咨询机构麦肯锡在近期发布的一份报告中认为,生成式人工智能每年将为全球经济带来2.6万亿-4.4万亿美元的增加值,相当于英国一年的GDP。
在8月23日举行的“北大光华度小满‘金融大模型’技术与应用论坛” 上,来自学界、金融机构和科技公司的代表们对大模型在金融领域的落地应用进行了探讨。
大模型的全称为Large Language Model(大语言模型)。在哈尔滨工业大学计算学部长聘教授车万翔看来,语言是人类思维最重要的工具,其中蕴含大量的知识。如果知识量少,就没办法从中学习到一个有用的模型。大模型属于自然语言处理的研究领域,属于人工智能的一个分支。
清华大学人工智能研究院常务副院长孙茂松表示,要想做到ChatGPT那样的精准度,需要大模型、大数据、大算力。当前全球的人工智能高潮从2012年的ImageNet 项目演化而来,当时是图灵奖获得者与谷歌合作,借助于强大的算力才能算出来。大模型对算力的要求在呈几何级增长,好在算力成本也在降低。例如2012年计算ImageNet 要花很多钱;到2015年在云服务中计算大约需要1000美元;而到了2021年,大约只需要5美元。算力需求增长很快,但成本也在不断降低,对企业来讲,能找到成本可承受的平衡点。
孙茂松介绍,大模型正带来产业的重新洗牌,海外就催生了大批创业公司,包括文本生成类的,人机对话服务的,消费者反馈分析、总结等与金融服务相关的公司等。
“金融大模型是一定要做的,否则肯定要落后,这属于兵家必争之地。”孙茂松表示。
金融是大模型的潜力场景,但落地存在诸多挑战。度小满数据智能部总经理杨青指出,金融业落地大模型存在包括行业监管严格、GPU(图形处理器)算力不足、优质数据缺乏、通用模型难胜任以及场景落地应用难等挑战。
亦有一位金融机构负责人直言,“很羡慕大行能自己买得起GPU,反正我买不起。”
该负责人表示,算力是专业能力,但不是银行的核心能力。将行业的知识库与大模型能力相结合,以银行的小规模算力打造轻量级的精调模型,会是大多数银行能够承担的方式。
有金融机构负责人坦言,金融机构训练大模型面临着风险、隐私、成本和能力等四大挑战。金融机构对客户数据保护极为严苛,数据不允许出银行,一般都要求进行本地化部署。
金融业未来如何实现大模型的落地和应用?度小满CTO许冬亮认为,每家机构独立去解决这些问题既是不现实的,也是不经济的,科技公司和金融机构在金融大模型上的合作非常有必要。
此外,8月15日,面向大模型的第一个监管文件《生成式人工智能服务管理暂行办法》已经开始实施。 如何平衡大模型落地收益和大模型风险控制,将成为企业发展大模型时的必答题。
许冬亮表示,“科技巨头提供通用大模型,或者技术能力强的金融科技公司提供金融行业大模型,具体的金融机构基于这个行业底层模型,用自己的业务数据去做私域的训练,然后做私有化的部署和应用”。这将是未来相当长时期里大模型在金融领域落地的合作模式。
关键词: