咨询服务热线:400-0698-860
邮箱:info@chaoqing-i.com
业务中心 - 上海超擎数智科技有限公司:上海市徐汇区龙启路158号1幢灿星大厦19层1911
业务中心 - 北京超擎数智科技有限公司:北京市海淀区北三环西路99号西海国际中心1号楼907
研发中心 - 武汉超擎数智科技有限公司:武汉东湖高新区金融港二路9号联发科武汉研发中心2楼
通过跨 NVIDIA Vera CPU、Rubin GPU、NVLink 6 交换机、ConnectX-9 SuperNIC、BlueField-4 DPU 和 Spectrum-6 以太网交换机的极致协同设计,大幅缩短训练时间,降低推理 token 生成成本。

CES – 太平洋时间 2026 年 1 月 5 日 – NVIDIA 今日发布 NVIDIA Rubin 平台,开启了新一代 AI 之旅,该平台由六款专为打造超凡 AI 超级计算机而设计的全新芯片组成。NVIDIA Rubin 树立了新的标杆,能以最低的成本构建、部署和安全运行全球最大型、最先进的 AI 系统,以助力加速主流 AI 的采用。
Rubin 平台对六款芯片——NVIDIA Vera CPU、NVIDIA Rubin GPU、NVIDIA NVLink™6 交换机、NVIDIA ConnectX® -9 SuperNIC、NVIDIA BlueField® -4 DPU 和 NVIDIA Spectrum™ -6 以太网交换机——进行极致协同设计,从而大幅缩短训练时间并降低推理 token 成本。
NVIDIA 创始人兼首席执行官黄仁勋表示:“训练和推理的 AI 计算需求不断激增,Rubin 的问世恰逢其时。凭借我们每年推出一代新 AI 超级计算机的节奏,以及对跨六款新芯片的极致协同设计,Rubin 朝着 AI 的新前沿迈出了关键一步。”
Rubin 平台以 Vera Florence Cooper Rubin 命名,这位具有开创精神的美国天文学家,她的发现改变了人类对宇宙的理解。Rubin 平台包括 NVIDIA Vera Rubin NVL72 机架级扩展解决方案和 NVIDIA HGX Rubin NVL8 系统。
Rubin 平台引入了五项创新技术,包括新一代 NVIDIA NVLink 互连技术、Transformer 引擎、机密计算和 RAS 引擎以及 NVIDIA Vera CPU。这些突破将以 NVIDIA Blackwell 平台低至十分之一的 token 成本加速代理式 AI、高级推理和超大规模混合专家 (MoE) 模型推理的发展。NVIDIA Rubin 平台在 MoE 模型训练中使用的 GPU 数量仅为前代平台的四分之一,从而可加速 AI 的采用与普及。
广泛的生态系统支持
预计采用 Rubin 的全球领先 AI 实验室、云服务提供商、计算机制造商和初创公司包括 Amazon Web Services (AWS)、Anthropic、Black Forest Labs、思科、Cohere、CoreWeave、Cursor、戴尔科技、Google、Harvey、HPE、Lambda、联想、Meta、微软、Mistral AI、Nebius、Nscale、OpenAI、OpenEvidence、Oracle Cloud Infrastructure (OCI)、Perplexity、Runway、Supermicro、Thinking Machines Lab 和 xAI。
OpenAI 首席执行官 Sam Altman 表示:“智能随着算力而扩展。当我们增加算力时,模型就会变得更强,就能够解决更棘手的问题,并对人类产生更大的影响。NVIDIA Rubin 平台助力我们持续扩展这一进程,让先进智能惠及所有人。”
Anthropic 联合创始人兼首席执行官 Dario Amodei 表示:“NVIDIA Rubin 平台的效率提升代表了基础设施的重大进步,实现了更长的上下文记忆、更好的推理能力和更可靠的输出。与 NVIDIA 的合作为我们的安全研究和尖端模型赋能。”
Meta 创始人兼首席执行官马克·扎克伯格表示:”NVIDIA 的 Rubin平台有望带来性能与效率的跃阶式提升 ,满足为数十亿用户部署先进模型的需求。”
xAI 创始人兼首席执行官埃隆·马斯克表示:“NVIDIA Rubin 将成为 AI 火箭的引擎。如果你需要大规模训练和部署尖端模型,这就是基础设施的不二之选——Rubin 会向世界重申 NVIDIA 是黄金标准。”
微软董事长兼首席执行官 Satya Nadella 表示:“我们正在打造全球最强大的 AI 超级工厂,以极致的性能和效率处理任意工作负载而不受地点限制。随着 NVIDIA Vera Rubin GPU 的加入,我们将为开发者和企业组织赋能,支持其以焕然一新的方式创作、推理和扩展。”
CoreWeave 联合创始人兼首席执行官 Mike Intrator 表示:“我们构建 CoreWeave 的目的就是用我们的定制 AI 平台为先行者提供卓越性能,在技术演进中为不同工作负载匹配适用的技术。NVIDIA Rubin 平台在推理、代理式 AI 和大规模推理工作负载方面实现了重大突破,我们期待将其纳入我们的平台。以 CoreWeave Mission Control 作为运营标准,通过与 NVIDIA 深度合作,我们可在高效整合新技术的同时保障生产级规模的稳定运行。”
AWS 首席执行官 Matt Garman 表示:“AWS 与 NVIDIA 携手推动云 AI 创新已 15 年有余。NVIDIA Rubin 平台登陆 AWS 标志着我们持续致力于提供尖端 AI 基础设施,为客户带来卓越的选项与灵活性。通过融合 NVIDIA 的先进 AI 技术与 AWS 久经验证的规模、安全性以及全面的 AI 服务,客户能以更高效率和更低成本构建、训练及部署要求最严苛的 AI 应用 ,从而加速实现从实验到任意规模量产的跨越。”
Google 和 Alphabet 首席执行官 Sundar Pichai 表示:“我们珍视与 NVIDIA 深厚而持久的合作关系。为满足客户对 NVIDIA GPU 的巨大需求,我们正着力在谷歌云上为其硬件打造最优运行环境。我们将持续深化合作,同时用 Rubin 平台的卓越能力赋能客户,为其提供突破 AI 边界所需的规模化性能。”
Oracle 首席执行官 Clay Magouyrk 表示:“Oracle Cloud Infrastructure 是专为极致性能打造的超大规模云平台。通过与 NVIDIA 的合作,我们正致力于拓展客户利用 AI 构建和扩展业务的疆界。借助由 NVIDIA Vera Rubin 架构驱动的 10 亿瓦级 AI 工厂,OCI 为客户提供推动模型训练、推理和对现实世界 AI 影响极限所需的基础设施。”
戴尔科技董事长兼首席执行官 Michael Dell 表示:“NVIDIA Rubin 平台代表着 AI 基础设施的重大飞跃。通过将 Rubin 集成到 Dell AI Factory with NVIDIA,我们正在构建能够处理海量 token 和多步骤推理的基础设施,同时提供企业和新型云服务商大规模部署 AI 所需的高性能和弹性。”
HPE 总裁兼首席执行官 Antonio Neri 表示:“AI 不仅在重塑工作负载,更是在重构 IT 基础架构,这要求我们对从网络到计算的每个基础设施的层级都进行重新构想。依托 NVIDIA Vera Rubin 平台,HPE 正在构建新一代安全的 AI 原生基础设施,将数据转化为智能,助力企业转型为真正的 AI 工厂。”
联想董事长兼首席执行官杨元庆表示:“联想计划采用新一代 NVIDIA Rubin 平台,结合我们的 Neptune 海神液冷解决方案以及我们在全球范围内的规模、制造效率与服务覆盖优势,助力企业构建作为智能加速引擎的 AI 工厂,加速洞察与创新。我们正共同架构 AI 赋能的未来,确保 AI 成为每一家企业组织的标配。”
专为扩展智能而设计
代理式 AI 和推理模型以及先进的视频生成工作负载正在重新定义计算的极限。多步骤问题解决需要模型具有跨长 token 序列进行处理、推理和采取行动的能力。专为复杂 AI 工作负载需求设计的 Rubin 平台采用了五项突破性技术,包括:
AI 原生存储与安全软件定义基础设施
NVIDIA Rubin 推出 NVIDIA 推理上下文记忆存储平台,这是一种全新的 AI 原生存储基础设施,旨在实现超大规模推理上下文扩展。
该平台由 NVIDIA BlueField-4 提供支持,可在整个 AI 基础设施中高效共享和重复使用键值 (Key-Value) 缓存数据,提高响应速度和吞吐量,同时实现可预测、节能高效的代理式 AI 扩展。
随着 AI 工厂越来越多地采用裸金属和多租户部署模式,保持强大的基础设施控制和隔离变得至关重要。
BlueField-4 引入了高级安全可信资源架构 (ASTRA),这是一种系统级信任架构,为 AI 基础设施构建者提供了一个单一的、可信的控制点,以便在不影响性能的情况下安全地调配、隔离和运行大规模 AI 环境。
随着 AI 应用向多轮智能体推理的演进,AI 原生企业必须管理和共享跨用户、会话和服务的大量推理上下文。
不同形式针对不同工作负载
NVIDIA Vera Rubin NVL72 提供了一个统一、安全的系统,集成 72 个 NVIDIA Rubin GPU、36 个 NVIDIA Vera CPU、NVIDIA NVLink 6、NVIDIA ConnectX-9 SuperNIC 和 NVIDIA BlueField-4 DPU。
NVIDIA 还将推出 NVIDIA HGX Rubin NVL8 平台,这是一个通过 NVLink 将 8 个 Rubin GPU 互连的服务器主板,为基于 x86 的生成式 AI 平台提供支持。HGX Rubin NVL8 平台可加速 AI 和高性能计算工作负载的训练、推理和科学计算。
NVIDIA DGX SuperPOD™ 可作为大规模部署基于 Rubin 的系统的参考架构,它集成了 NVIDIA DGX Vera Rubin NVL72 或 DGX Rubin NVL8 系统、NVIDIA BlueField-4 DPU、NVIDIA ConnectX-9 SuperNIC、NVIDIA InfiniBand 网络和 NVIDIA Mission Control™ 软件。
新一代以太网网络
先进的以太网网络和存储是 AI 基础设施的重要组成部分,对于确保数据中心全速运行、提高性能和效率以及降低成本至关重要。
NVIDIA Spectrum-6 以太网是用于 AI 网络的新一代以太网,旨在以更高的效率和更高的可靠性扩展基于 Rubin 的 AI 工厂,其支持 200G SerDes、光电一体化封装以及 AI 优化的网络技术。
基于 Spectrum-6 架构构建,Spectrum-X 以太网光电一体封装硅光交换机系统为 AI 应用提供 10 倍的可靠性和 5 倍的持续运行时间,并实现 5 倍的能效提升,与传统技术相比,可更大限度地提高每瓦性能。作为 Spectrum-X 以太网平台的一部分,Spectrum-XGS 以太网技术将相距数百公里及以上的多个基础设施连接在一起,作为单个统一的 AI 环境运行作业。
这些创新共同定义了新一代 NVIDIA Spectrum-X 以太网平台,为 Rubin 实现极致的工程协同设计,以驱动大规模 AI 工厂,并为未来百万 GPU 环境铺平道路。
Rubin 供应情况
NVIDIA Rubin 现已全面量产,基于 Rubin 的产品将在 2026 年下半年通过合作伙伴提供。
2026 年首批部署基于 Vera Rubin 实例的云提供商包括 AWS、Google Cloud、微软和 OCI 以及 NVIDIA 云合作伙伴 CoreWeave、Lambda、Nebius 和 Nscale。
微软将部署 NVIDIA Vera Rubin NVL72 机架级扩展系统,作为其新一代 AI 数据中心 (包括未来的 Fairwater AI 超级工厂基地) 的一部分。
Rubin 平台旨在为训练和推理工作负载提供前所未有的效率和性能,因此它将为微软旗下的新一代云 AI 能力提供基础。Microsoft Azure 将推出经过严格优化的平台,助力客户能够加速企业、研究和消费应领域的创新。
CoreWeave 将从 2026 年下半年开始,将基于 NVIDIA Rubin 的系统集成至其 AI 云平台中。CoreWeave 专为多架构并行运行打造,因此客户能够将 Rubin 部署至其环境,用于提升训练、推理和代理式工作负载方面。
CoreWeave 将与 NVIDIA 合作,帮助 AI 先行者利用 Rubin 在推理和 MoE 模型方面的突破,同时通过 CoreWeave Mission Control 在整个生命周期中继续提供生产级 AI 所需的性能、运行可靠性和扩展性。
此外,思科、戴尔、HPE、联想和 Supermicro 预计将推出基于 Rubin 产品的各种服务器。
Anthropic、Black Forest、Cohere、Cursor、Harvey、Meta、Mistral AI、OpenAI、OpenEvidence、Perplexity、Runway、Thinking Machines Lab 和 xAI 等 AI 实验室都在寻求借助 NVIDIA Rubin 平台来训练更大、功能更强的模型,并以比之前几代 GPU 更低的延迟和成本来为长上下文、多模态系统提供服务。
基础设施软件和存储合作伙伴 AIC、Canonical、Cloudian、DDN、戴尔、HPE、Hitachi Vantara、IBM、NetApp、Nutanix、Pure Storage、Supermicro、SUSE、VAST Data 和 WEKA 正在与 NVIDIA 合作,为 Rubin 基础设施设计新一代平台。
Rubin 平台标志着 NVIDIA 第三代机架扩展级架构的问世,目前已有 80 多家 NVIDIA MGX™ 生态系统合作伙伴。
为了释放这种密度优势,红帽今日宣布扩大与 NVIDIA 的合作,借助红帽的混合云系列产品,包括红帽企业 Linux、红帽 OpenShift 和红帽 AI,提供针对 NVIDIA Rubin 平台优化的完整 AI 堆栈。绝大多数《财富》全球 500 强企业都在使用这些解决方案。
公众号

电话
需求反馈