NVIDIA Vera Rubin架构将为AI推理带来十倍成本优化新闻
当前位置: 主页 >新闻动态 >NVIDIA Vera Rubin架构将为AI推理带来十倍成本优化新闻 >NVIDIA Vera Rubin架构将为AI推理带来十倍成本优化
相关推荐: 1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18.19.20.21.22.23.24.25.26.27.28.29.30.
NVIDIA Vera Rubin架构将为AI推理带来十倍成本优化2026-01-07 06:16:03 来源:互联网 浏览量 :加载中...在2026年国际消费电子展(CES)上,理带NVIDIA首席执行官黄仁勋正式揭晓了下一代人工智能计算架构“维拉·鲁宾”(Vera Rubin)。倍成本优该架构预计将成为未来游戏显卡的理带基础,并已进入全面投产阶段 ,倍成本优计划于今年下半年开始向客户交付。理带

作为当前Blackwell架构的继任者,维拉·鲁宾在性能上实现显著突破。理带据NVIDIA介绍,倍成本优其在推理任务中性能提升高达5倍,理带大型语言模型训练效率提高3.5倍 ,倍成本优同等任务所需GPU数量可减少至原先的理带四分之一。


该架构主要由六大核心组件构成 :
基于Armv9.2的88核Vera中央处理单元
采用NVFP4格式 、算力达50 petaflops的理带Rubin图形处理单元
带宽达3.6 TB/s的第六代NVLink交换机
ConnectX-9 SuperNIC网络适配器与BlueField-4数据处理单元
Spectrum 6以太网交换机

新架构在能效与可靠性方面尤为突出。通过集成Spectrum-X以太网光子技术与光学连接 ,倍成本优功耗降低至原先的理带五分之一 ,连接可靠性则提升十倍 。黄仁勋指出 ,这一飞跃得益于制造工艺的进步,尽管晶体管数量仅增加1.6倍 ,但整体效能大幅跃升 。首批合作客户将包括云服务商CoreWeave与Microsoft Azure。
此次发布正值AI加速器市场竞争加剧之际。面对AMD等传统对手以及谷歌等客户自研芯片的挑战 ,NVIDIA试图通过维拉·鲁宾架构实现性能与成本的双重突破——预计将使AI推理的每token成本下降至原来的十分之一。








