英伟达解释 RTX 4060 Ti 采用 128bit 显存:L2缓存增加16倍
对此,英伟达在一篇博客文章中进行了解答,与具有 128 位显存位宽的上一代 GPU 相比,全新 NVIDIA Ada Lovelace 架构的存储子系统将 L2 缓存的大小增加了 16 倍,极大提高了缓存命中率。
如上图所示,Ada GPU 中的 L2 缓存带宽已显著增加。这使得在处理核心和 L2 缓存之间传输更多数据成为可能。
此外,英伟达工程师测试了具有 32 MB L2 缓存的 RTX 4060 Ti 与仅使用 2 MB L2 的 RTX 4060 Ti 的特殊测试版本。
在各种游戏和综合基准测试中,与 2 MB 二级缓存的性能相比,32 MB 二级缓存将显存总线流量平均降低了 50% 以上。这种 50% 的流量减少使 GPU 能够更有效地使用其显存带宽,效率提升可达近 2 倍。因此,在这种情况下,隔离显存性能,具有 288 GB / 秒峰值显存带宽的 Ada GPU 的性能与具有 554 GB / 秒峰值显存带宽的 Ampere GPU 的性能相似。在一系列游戏和综合测试中,大大提高的缓存命中率将游戏帧率提高了高达 34%。
英伟达称,从历史上看,显存位宽一直被用作确定新 GPU 的速度和性能等级的重要指标。然而,显存位宽本身并不能充分表明存储子系统的性能。相反,更全面地了解存储子系统设计及其对游戏性能的整体影响是有帮助的。
由于 Ada 架构的优势,包括新的 RT 和 Tensor 核心、更高的时钟速度、新的 OFA 引擎和 Ada 的 DLSS 3 功能,GeForce RTX 4060 Ti 比上一代采用 256 位的 GeForce RTX 3060 Ti 和 RTX 2060 SUPER 显卡更快,同时功耗更低。
整理 RTX 4060 Ti 和 RTX 4060 显卡参数信息如下:
RTX 4060 Ti 拥有 4352 CUDA 核心,配备 8GB / 16GB 128bit GDDR6 显存,TGP 功耗 160W / 165W,采用 PCIe 4.0*8 连接,售价 3199 元起,5 月 24 日开卖。
RTX 4060 显卡拥有 3072 CUDA 核心,配备 8GB GDDR6 128bit 显存,功耗 115W,采用 PCIe 4.0*8 连接,售价 2399 元起,7 月上市。
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。