当AI开始长出手脚,竞争就不再只是参数和算力,而是现实世界里的效率、成本与产业主导权。所谓物理AI(也常被称为具身智能),就是把模型装进手臂、腿、轮子与传感器,让机器在真实环境里看得见、判断得了、动得稳。屏幕里的AI说错一句话,最多尴尬;现实里的机器人走错一步、抓错一次,可能就是停线、损耗甚至伤人。因此物理AI真正的门槛,从来不是会不会说,而是能不能长期稳定地做,并且在失败时安全、可控、可追责。
这也解释了为什么当下最值得关注的主线,是美国与中国的竞速正在分化为两种打法:美国更像在造大脑,押注基础模型、仿真与平台化;中国更像在造身体,押注供应链、制造效率与价格曲线。两条路线对撞的结果,将决定人形机器人究竟是昂贵的展品,还是像工业设备一样可复制、可扩张、可算账。
中国阵营的杀手镧,首先是成本下探带来的普及速度。宇树在2025年推出R1,把人形双足机器人的起售价打到3.99万元人民币,显著低于其上一代产品的价格区间。价格不是面子工程,而是落地的通行证:当一台机器从“科研预算”变成“设备预算”,企业才会认真算ROI,才会从一两台试点走向几十台、上百台的铺开。与此同时,中国完整的零部件供应链与制造体系,让降本不仅发生在整机端,也能渗透到电机、减速器、驱动、结构件、线束与装配工艺上,形成更快的迭代节奏。
优必选则代表了另一种更接近工业现场的路径:强调交付与可用性。其Walker S2主打面向工厂等场景的规模化部署,并披露过量产、批量交付与订单规模等进展。对行业而言,这类信息比任何翻斤斗视频更关键,因为它意味著质控、售后、备件、现场集成与人员培训都在被验证。更现实的一点是,真正能创造价值的往往不是“像人一样灵活”,而是“在有限任务上足够可靠”:搬运、分拣、巡检、简单装配、上下料、按流程协作,把重复劳动变成稳定产能。
但中国路线也伴随典型风险:同质化与泡沫。大量公司在相近的硬件方案与场景里拥挤竞争,短期可能靠价格和融资扩张,长期则必须用可靠性、能耗、维护成本、软件能力与场景深耕拉开差距。淘汰赛不可避免,而真正留下来的,往往是能把硬件工程、供应链管理与数据闭环一起做扎实的少数玩家。
美国路线的优势则更集中在大脑与平台。NVIDIA在2025年发布Isaac GR00T N1,释放出一个明确信号:人形机器人正在复制大模型时代的范式——用更通用的模型能力做底座,再通过仿真、合成数据与少量真实数据把能力迁移到具体任务与具体机器上。美国擅长把工具链做成生态:训练框架、仿真环境、数据生成、部署加速、开发者接口,目标不是只卖一台机器人,而是让更多机器人“跑同一套更聪明的大脑”。
资本市场也在押注“通用机器人模型”的平台想像:如果未来机器人形态五花八门,那么最值钱的可能不是哪家硬件,而是能跨形态迁移、跨场景泛化的模型与软件栈。整机层面,美国同样有明星选手:Figure与OpenAI的合作把生成式AI能力直接导入人形机器人;特斯拉则把Optimus定位为处理危险、重复、枯燥任务的通用劳动力,并多次表达过在内部场景逐步试用的计划。美国叙事的关键词,是通用性与可扩展:让机器人更像一台可以安装新技能的软件平台。
不过,物理AI终究不是纯软件。美国路线的现实约束,往往来自供应链与制造:关键材料、关键零部件、产能爬坡、成本控制、质量一致性,都可能决定“能不能大量交付”。尤其在人形机器人这种机电系统极复杂的产品上,哪怕模型成熟,若硬件成本与供应稳定性跟不上,规模化仍会被拖慢。换句话说,大脑跑得快,还得身体跟得上。
把中美放在同一张地图上看,胜负不在谁的机器人更像人,而在谁能更快把闭环跑起来:大脑(模型与工具链)、身体(硬件与可靠性)、数据(持续回流与迭代)、制造(规模与成本)缺一不可。中国更可能在短期把人形机器人推向“买得到、用得起、出得来”;美国更可能在中长期用基础模型与平台化建立更强的软件标准与生态控制力。
最终决定行业格局的指标其实很朴素:单台成本下降速度、连续运行时长、故障率与安全停机机制、部署换线时间、维护与备件体系、数据回流与迭代周期、以及关键零部件供应的稳定性。物理AI的终点不是发布会,而是成千上万次重复动作里的稳定收益。当AI真正长出手脚,改写的不只是工厂效率,更是全球真实经济的成本结构与产业版图。
本文观点,不代表《东方日报》立场