2026年6月1日,英伟达在GTC Taipei大会上正式发布Cosmos3,全球首款全开源全模态物理AI大模型。这款模型整合了视觉推理、世界生成与动作预测三大核心能力,标志着物理AI从实验室走向产业化的关键一步。
技术架构:混合Transformer创新
Cosmos3采用混合Transformer架构,基于数十亿条文本、图像、视频、音效及动作轨迹数据进行训练。其物理仿真精度达到业界领先水平,在Artificial Analysis、Physics-IQ、RoboLab等多项评测中,开源模型均位列榜首。
三个版本精准覆盖不同场景
Cosmos3推出了三个差异化版本:Super版主打机器人与自动驾驶的二次训练精度,适合需要高精度物理仿真的企业用户;Nano版专注秒级视频解析与动作推理,适合实时响应场景;Edge版面向边缘端实时推理,可在低功耗设备上运行。
英伟达宇宙联盟
英伟达联合Agile Robots、Black Forest Labs、Runway、Skild AI等多家企业发起英伟达宇宙联盟,构建从模型到应用的完整物理AI生态。在中国AI视频生成领域,可灵AI和Runway等工具也将受益于这一生态。
优缺点分析
优点:全开源降低研发门槛、物理仿真精度领先、三版本架构覆盖云端到边缘、强大的生态联盟支持。
缺点:主要面向B端和开发者、普通用户上手门槛较高、需要一定硬件支持才能发挥全部性能。
适合人群
机器人研发企业和研究机构、自动驾驶技术团队、AI视频生成领域的开发者、物理仿真和数字孪生研究人员。
评测总结
Cosmos3的发布标志着英伟达从AI算力提供商向AI基础设施平台的战略延伸。全开源策略降低了研发门槛,三版本架构覆盖了从云端到边缘的完整场景,物理AI时代正在加速到来。如果你关注AI在物理世界的应用,这篇评测不容错过。