阿里Qwen-Robot具身大模型三连发：机器人有了灵巧的手和会思考的大脑

AI聊天 2026-06-17 5 阅读

阿里千问具身智能机器人 Qwen-Robot

Qwen-Robot系列概览

2026年6月16日，阿里巴巴正式发布千问具身智能大模型Qwen-Robot系列，这是千问大模型家族首个完整的具身智能模型系列。系列包含三款模型：VLA操作模型Qwen-RobotManip、VLN移动模型Qwen-RobotNav和世界模型Qwen-RobotWorld，分别赋予机器人"灵巧的手、认路的脚和会思考的大脑"。

Qwen-RobotManip：灵巧的操作之手

Qwen-RobotManip是基于视觉-语言-动作（VLA）架构的操作模型，训练数据覆盖超过38100小时的真实操作场景。该模型能够理解自然语言指令并转化为精确的机械臂操作，从抓取物体到精细组装均可胜任。在标准操作基准测试中，Qwen-RobotManip在抓取成功率、操作精度和任务完成率等关键指标上均达到行业领先水平。

Qwen-RobotNav：认路的移动之脚

Qwen-RobotNav是视觉-语言-导航（VLN）模型，解决机器人在复杂环境中的自主导航问题。模型支持自然语言路径规划，例如"去厨房把桌子上的杯子拿来"，机器人能自主避障、路径规划和目标识别。该模型在室内导航和动态环境适应性方面表现出色。

Qwen-RobotWorld：会思考的世界模型

Qwen-RobotWorld是系列中最具前瞻性的世界模型，纳入20余种机器人本体进行联合训练。它能够预测环境变化、理解物理因果，为操作和导航提供高层决策支持。世界模型的引入让机器人从"执行指令"进化到"理解场景"，这是通向通用具身智能的关键一步。

协同运转：三位一体的优势

三款模型既可单独部署，也能协同运转。协同模式下，RobotWorld提供场景理解和任务分解，RobotNav负责路径规划，RobotManip执行精细操作。这种分层架构实现了"思考-移动-操作"的闭环，大幅提升了复杂任务的完成率。

行业影响与展望

Qwen-Robot系列的发布标志着千问大模型从数字世界向物理世界的延伸。消息发布后带动机器人相关ETF及概念股明显上涨。随着具身智能行业标准YD/T 6770—2026的实施，阿里此举将进一步推动具身智能产业从实验室走向产业化。

总结

阿里Qwen-Robot系列是中国科技巨头在具身智能领域的重磅布局，三款模型的协同架构为机器人提供了完整的感知-决策-执行能力。这不仅展现了千问大模型的技术延展性，也预示着2026年具身智能商业化将进入加速期。

❓ 常见问题

Qwen-Robot系列包含哪些模型？

包含三款模型：VLA操作模型Qwen-RobotManip、VLN移动模型Qwen-RobotNav和世界模型Qwen-RobotWorld。

Qwen-RobotManip的训练数据有多少？

训练数据覆盖超过38100小时的真实操作场景，支持自然语言指令到机械臂操作的转化。

三款模型可以协同使用吗？

可以。三款模型既可单独部署，也能协同运转，RobotWorld提供场景理解，RobotNav负责导航，RobotManip执行操作。

Qwen-Robot对行业有什么影响？

标志着千问大模型从数字世界向物理世界延伸，发布后带动机器人相关ETF和概念股明显上涨。