Qwen-Robot系列概览
2026年6月16日,阿里巴巴正式发布千问具身智能大模型Qwen-Robot系列,这是千问大模型家族首个完整的具身智能模型系列。系列包含三款模型:VLA操作模型Qwen-RobotManip、VLN移动模型Qwen-RobotNav和世界模型Qwen-RobotWorld,分别赋予机器人"灵巧的手、认路的脚和会思考的大脑"。
Qwen-RobotManip:灵巧的操作之手
Qwen-RobotManip是基于视觉-语言-动作(VLA)架构的操作模型,训练数据覆盖超过38100小时的真实操作场景。该模型能够理解自然语言指令并转化为精确的机械臂操作,从抓取物体到精细组装均可胜任。在标准操作基准测试中,Qwen-RobotManip在抓取成功率、操作精度和任务完成率等关键指标上均达到行业领先水平。
Qwen-RobotNav:认路的移动之脚
Qwen-RobotNav是视觉-语言-导航(VLN)模型,解决机器人在复杂环境中的自主导航问题。模型支持自然语言路径规划,例如"去厨房把桌子上的杯子拿来",机器人能自主避障、路径规划和目标识别。该模型在室内导航和动态环境适应性方面表现出色。
Qwen-RobotWorld:会思考的世界模型
Qwen-RobotWorld是系列中最具前瞻性的世界模型,纳入20余种机器人本体进行联合训练。它能够预测环境变化、理解物理因果,为操作和导航提供高层决策支持。世界模型的引入让机器人从"执行指令"进化到"理解场景",这是通向通用具身智能的关键一步。
协同运转:三位一体的优势
三款模型既可单独部署,也能协同运转。协同模式下,RobotWorld提供场景理解和任务分解,RobotNav负责路径规划,RobotManip执行精细操作。这种分层架构实现了"思考-移动-操作"的闭环,大幅提升了复杂任务的完成率。
行业影响与展望
Qwen-Robot系列的发布标志着千问大模型从数字世界向物理世界的延伸。消息发布后带动机器人相关ETF及概念股明显上涨。随着具身智能行业标准YD/T 6770—2026的实施,阿里此举将进一步推动具身智能产业从实验室走向产业化。
总结
阿里Qwen-Robot系列是中国科技巨头在具身智能领域的重磅布局,三款模型的协同架构为机器人提供了完整的感知-决策-执行能力。这不仅展现了千问大模型的技术延展性,也预示着2026年具身智能商业化将进入加速期。
❓ 常见问题
Qwen-Robot系列包含哪些模型?
包含三款模型:VLA操作模型Qwen-RobotManip、VLN移动模型Qwen-RobotNav和世界模型Qwen-RobotWorld。
Qwen-RobotManip的训练数据有多少?
训练数据覆盖超过38100小时的真实操作场景,支持自然语言指令到机械臂操作的转化。
三款模型可以协同使用吗?
可以。三款模型既可单独部署,也能协同运转,RobotWorld提供场景理解,RobotNav负责导航,RobotManip执行操作。
Qwen-Robot对行业有什么影响?
标志着千问大模型从数字世界向物理世界延伸,发布后带动机器人相关ETF和概念股明显上涨。