Ada Lovelace显卡性能值得期待 制造工艺终于不再“拖后腿”

时间:2022-09-26 16:15:42       来源:快科技

在时隔两年之后,NVIDIA终于推出Ada Lovelace架构显卡,首款产品GeForce RTX 4090将于10月12日正式上市。RTX 4080 16GB/12GB也将于11月上市。

与Ampere使用三兴8nm工艺相比,Ada Lovelace架构的制造工艺终于不再“拖后腿”,台积电工艺带来巨大的能效提升,同时也让显卡频率更高。

凭借更多的CUDA和更高的频率,GeForce RTX 4090(82.6TFlops)理论传统性能(FP32)是RTX 3090 Ti(约40 TFlops)的两倍。

就算16GB版RTX 4080(48.7 TFlops)还是比RTX 3090 Ti高23.5%左右,对比RTX 3080 Ti(34 TFlops)高40%。

有趣的是,12GB版RTX 4080(40 TFlops)的理论传统性能与RTX 3090 Ti相同,意味着Ada Lovelace首发的三款产品,理论性能至少达到上一代旗舰产品的水平,旗舰产品的对比甚至实现翻番。

虽然FP32无法直接提现到游戏、专业加速软件中,但NVIDIA至少实现了在发布会上性能翻番的目标。

在Ada Lovelace的缓存系统存在极大的差异。老黄在发布会上只字未提3D封装的缓存,意味着这一代GPU以然是传统设计方案。

不过没有3D缓存系统并非不可理解,隔壁AMD在锐龙7 5800X3D(105W热设计功耗)上的选择就可以看到,3D封装必然要牺牲一定的散热性能。考虑到首款三款显卡(285W-450W)都是发热大户,使用3D封装带来的性能提升,或许不远不如提升散热性能重要。

在显存上,三款显卡更是体现出巨大的差异,这些差异未来将会体现到全系列的产品线上。

不同核心将会直接决定GPU的显存位宽,AD102最高384-bit位宽,未来不排除RTX 3080 Ti/Super会使用AD102核心。

同时将显存位宽削减至320-bit。AD103核心最高显存位宽定在256-bit,除了某些缺陷特别严重的核心需要屏蔽更多单元外。

至于AD104核心,它的最高显存位宽为192-bit,对应RTX 4070系列显卡(12GB版RTX 4080大概率是原RTX 4070)。

老黄挤爆牙膏!Ada Lovelace显卡性能值得期待

在具体的显存上,采用AD102核心的GeForce RTX 4090使用与上一代相同的384-bit位宽和21Gbps的GDDR6x显存,显存带宽与RTX 3090 Ti相同的1008GB/s,但至少没有开“倒车”。

至于为何没有使用RTX 4080 16GB的23Gbps显存,笔者猜测有两种可能,第一是显存产能较低,无法满足NVIDIA的需求。第二就是考虑到显卡的供电和散热需求,无法搭载发热更高的23Gbps显存。

与AD102核心不同,使用AD103核心的GeForce RTX 4080 16GB在显存带宽上就开了“倒车”,主要原因还是显存位宽从上一代RTX 3080的320-bit看到256-bit。

虽然显存频率从19Gbps提升到23Gbps,但带宽依然从760GB/s降低至736GB/s。只是,未来不排除NVIDIA会推出256-bit位宽的RTX 4070 Ti/Super。

最后是使用AD104核心的RTX 4080 12GB,在192-bit位宽和21Gbps显存下,其显存带宽仅有504GB/s,比RTX 3070高12.5%,大幅落后RTX 3070 Ti的604GB/s。

如果说RTX 4080 16GB保住80级别定位的话,那RTX 4080 12GB就是拿来凑数的,更准确的命名应该是RTX 4070。

老黄挤爆牙膏!Ada Lovelace显卡性能值得期待

老黄挤爆牙膏!Ada Lovelace显卡性能值得期待

用户最关心的性能方面,NVIDIA官方提供部分游戏的性能预览。从给出的数据来看,RTX 4090相对于RTX 3090 Ti,微软的飞行模拟提升将近一倍。

赛博朋克更是超过4倍。至于为何提升幅度如此之大,应该是NVIDIA精选游戏有关。两款RTX 4080对比的是RTX 3080 Ti,提升幅度在1.5倍到3倍之间。

事实上,NVIDIA在Ada Lovelace上堆料,Tensor Core从上一代的320个提升至1400个,并加入从Hopper上下放的各种Transformer Engine引擎,能够带来更好的加速训练效果。最重要的DLSS 3,基于光流的补帧设计可以带来更高的理论帧率。

在功耗不变的情况下,NVIDIA采用比8nm先进两代的4nm工艺,能耗比的提升应该会远超想象。

最直观的对比,就是从Maxwell(GTX 980 Ti)到Pascal(GTX 1080 Ti),两者的热设计功耗都是250W,但实际游戏性能提升超过60%,这就是Ada Lovelace的游戏表现值得期待的原因。

写在最后:

从目前公开的数据来看,NVIDIA Ada Lovelace的性能提升是非常值得期待。NVIDIA精选了部分对自家显卡优化更到位的游戏来展示性能提升,虽然实际游戏提升不如宣传,是同样值得期待。

另外,NVIDIA两款RTX 4080显卡更像为清空RTX 30系列显卡做出来的产品,两款显卡明显有“智商税”的嫌疑。笔者认为NVIDIA不会大量出货这两款RTX 4080,在完成30系显卡清仓后更新产品线,带来更具性价比的产品,以满足用户的使用需求。

关键词: 显卡性能 架构显卡 能效提升 制造工艺