400-0698-860

新闻中心

洞悉超擎数智品牌力与AI变革

SC25 | 加速计算和网络推动 AI 时代的超级计算

时间:2025-11-26
来源:超擎数智
阅读量:2
分享:

从 NVIDIA DGX Spark 到 NVIDIA BlueField-4 DPU,新一代网络和量子技术实现了飞跃。在 SC25 上展示的加速系统突显了全球超级计算和 AI 的进展。

 

 

 

在 SC25(全球超级计算大会)上,NVIDIA 展示了在 NVIDIA BlueField DPU 及新一代网络、量子计算、科学研究、AI 物理等领域的进展。加速系统正推动 AI 超级计算的新篇章。

 

NVIDIA 加速计算业务副总裁兼总经理 Ian Buck

在 SC25 上发表了特别演讲。

 

NVIDIA 创始人兼首席执行官黄仁勋惊喜现身 St. Louis 活动现场,并向出席 SC25 的观众分享了 NVIDIA 最新的超级计算进展。

 

 

 

黄仁勋还带来了一份特别礼物,NVIDIA DGX Spark AI 超级计算机,这是迄今为止全球最小的超级计算机。

 

 

 

  • 最新的 AI 物理开放模型系列 NVIDIA Apollo 正式发布:NVIDIA 在 SC25 上还推出了面向 AI 物理的开放模型系列 NVIDIA Apollo。该开放模型系列利用 AI 物理领域的最新成果,将神经运算符、Transformer 和扩散技术等领先的机器学习架构,与特定领域的知识相结合。Apollo 将提供用于训练、推理和基准测试的预训练检查点和参考工作流,使开发者根据其特定需求集成和自定义模型。

 

 

 

  • NVIDIA Warp 助力物理模拟:NVIDIA Warp 是一个专门构建的开源 Python 框架,可将计算物理和 AI 的 GPU 加速提升高达 245 倍。NVIDIA Warp 为仿真、机器人和机器学习工作负载提供了一种结构化方法,它结合了 Python 的易用性以及与原生 CUDA 代码相当的性能。

 

 

NVIDIA BlueField-4 DPU:

驱动 AI 工厂操作系统的处理器

 

  • 展示为 AI 工厂操作系统赋能的 NVIDIA BlueField-4:在 GTC 华盛顿特区上亮相的 NVIDIA BlueField-4 DPU 正在为 AI 工厂操作系统赋能。NVIDIA BlueField-4 集成了 64 核 NVIDIA Grace CPU 和 NVIDIA ConnectX-9,大幅提升了性能效率和零信任安全性。通过卸载、加速和隔离网络、存储和安全等关键的数据中心功能,NVIDIA BlueField-4 DPU 可以释放 CPU 和 GPU,使其完全专注于计算密集型工作负载。

 

 

NVIDIA ConnectX-9 SuperNIC

 

  • NVIDIA CPO(光电一体化封装)技术,提高速度和可靠性:NVIDIA Quantum-X Photonics 网络交换机能够大幅降低 AI 工厂和超级计算中心的能耗和运营成本。NVIDIA 已经实现了融合电路和光通信一体的大规模部署。NVIDIA Quantum-X Photonics 平台包括 NVIDIA Quantum Q3450 CPO InfiniBand 交换机和 ConnectX-8 SuperNIC,专为需要显著降低功耗、提高可靠性和降低延迟的高性能环境而设计。

 

  • 全球超级计算中心采用 NVQLink:全球十余个顶尖科学计算中心正在采用 NVQLink,这是一种连接加速计算和量子处理器的通用互连技术。借助 NVQLink,科学家和开发者在量子硬件和经典硬件之间架起了通用桥梁,使可扩展的纠错、混合应用和实时量子 GPU 工作流变得切实可行。

 

 

 

  • 开发现实世界的混合应用:NVQLink 将量子处理器与 GPU 超级计算相结合,实现可扩展的纠错和混合应用。科学家可以通过 CUDA-Q API 获得统一的编程环境。开发者可以实时构建和测试量子-GPU 工作流。借助 NVQLink,全球超级计算中心正在为实用的量子经典系统奠定基础,以前所未有的速度和规模将不同的量子处理器与 NVIDIA 加速计算单元相连接。

 

  • Arm 采用 NVIDIA NVLink Fusion:AI 正在重塑数据中心,每瓦效率成为衡量成功的关键。核心驱动力是 Arm Neoverse,其部署核心数已超过 10 亿。为了满足激增的需求,Arm 正在通过 NVIDIA NVLink Fusion 扩展 Neoverse。Arm 和 NVIDIA 共同为 AI 基础设施设定了新标准,使生态系统合作伙伴能够构建差异化、高能效的系统,加速整个 AI 时代的创新。

 

  • 为加速计算提供更智能的动力:随着 AI 工厂规模的扩大,能源成为新的瓶颈。NVIDIA Domain Power Service(DPS)将这一限制转化为机会,将电力转化为一种动态、可协调的资源。DPS 与用于设计和运营新一代数据中心的平台 NVIDIA Omniverse DSX Blueprint 紧密集成。

 

  • NVIDIA 与 CoreWeave 获得 Graph500 BFS 基准测试冠军,性能较此前纪录提升翻倍:NVIDIA 在第 30 期 Graph500 宽度优先搜索(BFS)榜单中获得第一名,使用部署在 CoreWeave 达拉斯数据中心的 8192 块 NVIDIA Hopper GPU,取得了每秒遍历 410 万亿条边(TEPS)的成绩,性能较此前最优纪录提升超两倍。

 

以上为摘要内容,扫描下方二维码阅读完整内容: