咨询服务热线:400-0698-860
邮箱:info@chaoqing-i.com
业务中心 - 上海超擎数智科技有限公司:上海市徐汇区龙启路158号1幢灿星大厦19层1911
业务中心 - 北京超擎数智科技有限公司:北京市海淀区北三环西路99号西海国际中心1号楼907
研发中心 - 武汉超擎数智科技有限公司:武汉东湖高新区金融港二路9号联发科武汉研发中心2楼

NVIDIA 今日推出 NVIDIA Cosmos™ 3,这是一款面向物理 AI 的开放世界基础模型,基于突破性的混合 Transformer (Mixture-of-Transformers) 架构所构建,将视觉推理、世界生成和动作预测集成至单一系统中。
Cosmos 3 是全球首款完全开放的全模态模型,能够以领先的物理精度原生理解并生成文本、图像、视频、环境音和动作,将物理 AI 的训练和评估周期从数月缩短至数天。
NVIDIA 同时宣布成立 NVIDIA Cosmos Coalition,这是世界模型构建者与 AI 开发者的全球协作组织 —— 成员包括 Agile Robots、Black Forest Labs、Generalist、LTX、Runway 和 Skild AI —— 旨在共同推动下一代世界模型发展。
NVIDIA 创始人兼首席执行官黄仁勋表示:“得益于多模态推理语言、视觉和世界模型领域的多项突破,物理 AI 爆发的时代已近在眼前。Cosmos 3 系列开放前沿全模态模型,助力开发者在构建机器人、智能汽车和视觉 AI 方面实现了代际飞跃,使其能够在物理世界中完成感知、推理、规划并采取行动。”
面向物理 AI 的全新架构
Cosmos 3 解决了物理 AI 的一项核心难题:使机器人、智能汽车或视觉智能体能够在训练数据有限和仿真堆栈碎片化的情况下,在现实世界中进行泛化。
该模型的混合 Transformer 架构将推理 Transformer 与专家生成 Transformer 相结合,从而使 Cosmos 3 能够在生成视频和动作轨迹前,完成对对象交互、运动及时空关系的解析。
该模型在最大型的多模态物理 AI 数据集之一上进行训练 —— 包括数十亿条文本、图像、视频、声音和动作轨迹样本 —— 为开发者提供了强大的预训练基础,助力其以更少的数据和更低的训练成本构建物理 AI 系统。
以上为新闻摘要内容,如需阅读新闻全文,请点击“阅读原文”或扫描下方二维码:

公众号

电话
需求反馈