腾讯科技讯 8月9日,英伟达宣布推出一款新芯片,旨在在人工智能硬件领域抵御竞争对手,包括AMD、谷歌和亚马逊。
据估计,目前英伟达在AI芯片市场占据了超过80%的市场份额。该公司的专长是图形处理单元(GPU),已成为支撑生成式人工智能软件(如谷歌的Bard和OpenAI的ChatGPT)的大型AI模型的首选芯片。但由于科技巨头、云服务提供商和初创企业争夺GPU容量来开发自己的AI模型,英伟达的芯片供应短缺。
(资料图片)
英伟达最新发布的芯片GH200,与该公司目前最高端的AI芯片H100采用相同的GPU。但GH200还配备了141GB的尖端内存和一个72核的ARM中央处理器。
英伟达CEO黄仁勋在周二的演讲中表示:“我们给这个处理器加了一些提升。”他补充说:“这个处理器是为全球数据中心的规模而设计的。”
据黄仁勋透露,这款新芯片将于明年第二季度在英伟达的经销商处上市,并计划在年底前提供样品。英伟达的代表拒绝透露价格。
通常,处理AI模型的过程至少分为两个部分:训练和推理。
首先,使用大量数据对模型进行训练,这个过程可能需要数月时间,有时需要数千个GPU,例如英伟达的H100和A100芯片。
然后,该模型将在软件中用于进行预测或生成内容,这个过程称为推理。与训练类似,推理需要大量的计算资源,并且每次软件运行时都需要大量的处理能力,例如生成文本或图像时。但与训练不同,推理是几乎持续进行的,而训练只在需要更新模型时才需要进行。
黄仁勋表示:“你可以将几乎任何大型语言模型放入其中,它将进行疯狂的推理。大型语言模型的推理成本将大幅降低。”
英伟达的新芯片GH200专为推理而设计,因为它具有更大的内存容量,可以容纳更大的AI模型在单个系统中。英伟达副总裁伊恩·巴克在与分析师和记者的电话会议上表示,英伟达的H100具有80GB的内存,而新的GH200则有141GB的内存。英伟达还宣布推出了一种将两个GH200芯片组合到一台计算机中的系统,以支持更大的模型。
巴克表示:“更大的内存使得模型可以常驻在单个GPU上,而不需要多个系统或多个GPU来运行。”
此次宣布正值英伟达的主要GPU竞争对手AMD推出面向AI的芯片MI300X,该芯片支持192GB的内存,并被市场推广为适用于AI推理。谷歌和亚马逊等公司也正在设计自己的定制AI芯片用于推理。
审校:小北
关键词: