这两家企业近期常被业内以“南宇树北银河”的说法同时提起,分别代表着硬件本体和软件大脑的两条核心技术路径。在这场大会上,Omniverse与仿真模拟技术副总裁 Rev Lebaredian、宇树科技创始人王兴兴与银河通用机器人创始人及CTO、智源学者王鹤罕见同框,三人围绕
就像当年押注OpenAI一样,黄仁勋正在重注中国未来的具身智能巨头,但不同的是,黄仁勋这次把筹码分散下注在了多家中国机器人公司身上。
本次大会,众多英伟达的机器人生态合作伙伴亮相,除了上述银河通用和宇树科技,中坚科技、傅利叶智能、北京创新中心、加速进化、星动纪元、逐际动力、优必选、乐聚机器人、星海图、众擎机器人等也悉数现身。
此前,英伟达在CES 2025一次性展示的 14 款中,也有 6 款来自中国;在北京 2025WRC 现场,又把这些中国伙伴放到舞台 C 位,无疑再次凸显了英伟达利用中国供应链、场景与数据红利的策略 。
可以看到,英伟达的机器人生态并非简单采购关系,而是以“算力-仿真-数据”三环相扣的基础设施,把分散的硬件本体、垂直场景、算法团队编织成一张可快速商业落地的网络。
从英伟达的布局来看,涵盖了具身智能、机器人、多场景应用等多个关键领域。在技术层面,借助合作伙伴在硬件研发和软件算法的创新,结合自身的AI技术、仿真技术以及机器人超级计算机,构建从模型训练、仿真测试到终端部署的全栈机器人技术体系;
在市场应用方面,英伟达通过与不同特点的企业合作,覆盖工业制造、商业零售、物流、城市服务、教育、娱乐等多元场景,加速机器人在各行业的渗透和普及。
其中,银河通用自研的、内置英伟达Thor芯片的人形机器人Galbot,就在本次WRC大会上引起了关注。记者在大会现场的搬运任务展示环节看到,Galbot可快速滑步至货架,自主完成装卸动作,全程无需人工干预。
英伟达把专注不同环节的两家标杆性企业同时放进生态,或有对冲风险和加速收敛之意。
本次三人对谈内容涵盖其大规模商用过程中的难点、面临的关键挑战、存在的技术瓶颈与发展风向,人形及双足设计的必要性,中国企业在物理AI与机器人领域的优势,以及预计将率先实现普及的应用场景等方面。
Rev Lebaredian率先抛出了主要论断:过去计算主要影响信息世界,而现在借助人工智能,计算能通过机器人进入物理世界,连接信息与物理世界,挖掘100万亿美元物理世界市场的潜力。
中国在AI人才(全球近半)、电子制造能力、制造业基础(提供机器人部署测试场景)上具有独特优势,是物理AI和机器人发展的理想之地。
在英伟达的机器人相关布局上,Rev Lebaredian表示,需打造机器人本体计算机(如Jetson Thor)、AI工厂计算机(如DGX系统)、仿真计算机三类计算机,分别用于机器人内部运行、开发“大脑”、生成数据和测试。
对人口与机器人关系的看法上,他认为,机器人数量与生育率无直接关联,但机器人可作为“人工人口”提升生产力,应对人口缩减带来的经济问题。
王兴兴将人形机器人视为通用机器人的重要载体,结构相对简单(由关节电机串联而成),未来有望像组装电脑一样普及,且通用AI成熟后对硬件要求会降低。
对于宇树的产品进展,王兴兴披露,此前发布的人形机器人售价9.9万元,新版本降至3.9万元,具备竞争力,外观可定制,现货供应且年底量产。
技术与应用上,利用NVIDIA的Isaac Sim平台训练机器人动作,但受硬件物理极限限制,复杂动作执行受限;
自主开发20自由度灵巧手,目标是让机器人执行日常任务;通过采集人体动作数据结合深度强化学习训练动作;
王鹤则表示,银河通用的目标是打造通用机器人,其核心要素包括本体、具身智能模型、数据支撑。
未来与商业化方面,银河通用商业化落地案例包括全球首个24小时智慧药房解决方案(签约超100家药店)、24小时智慧零售店项目(已在部分城市落地)。
他表示,未来十年人形机器人产值增长迅速,市场规模有望超越当前工业机器人。限制人形机器人规模化部署的关键是干活能力不足、任务类型有限,解决目标识别和定位问题后,市场规模可观。
1、 宇树R1定价3.99万元,这是否意味着硬件成本已不再是影响机器人商业化的障碍?现阶段,推动人形机器人规模化商用还存在哪些难点?
王兴兴:我一直认为,人形机器人商业化的关键不在成本和硬件。毕竟哪怕一台机器要10万、100万,只要能用,很多场景照样能落地。
现在最棘手的问题是具身智能模型的泛用性和实用性还不够。其实硬件在过去一两年就已经够用了,后续无非是在可靠性、成本上再优化,但它并非限制因素。
王兴兴:未来机器人会更实用,但发展周期较长,像新能源车一样,成熟需要时间。现在的机器人技术才发展两三年,和十几二十年前的技术水平完全不同,不能混为一谈,整体还需时间培育。不过行业成长迅速,未来几年人员和出货量有望每年翻倍。
若有更通用的AI大模型,机器人在工厂、家庭等更多场景的表现会更好,也更容易普及。整体来看,普及周期会更长,尤其是家用领域,难点不在技术,而在伦理、安全等要求高,导致普及门槛高。
3、今年,许多人形机器人已开始在汽车工厂进行训练。机器人真正能在工厂车间投入工作还需要多长时间?还有哪些关键挑战需要解决?
王鹤:今年,不少人形机器人已开始在汽车工厂接受训练。目前多数公司在工厂推广这类机器人,主要聚焦搬运和分拣两大方向。
搬运方面,银河通用近期展示的机器人视频显示,其搬运速度已接近人类,每小时搬运量与人类相当,现已非常接近实际工厂部署水平,预计今年年底可能有几十台投入车间实际应用。
但搬运只是开端,还需实现码垛的闭环能力。只有搬运和码垛均形成闭环,机器人才算真正胜任整套工作流程,否则任务只完成一半,效果会打折扣。
分拣则是更大的挑战。无论是从传送带取物还是从货架取货,当前最大的难题是速度。熟练工人取物速度很快,而机器人目前在模型和硬件层面,还难以达到这样的效率。
我们研发的零售机器人,从货架或桌面取物的技术本质与工业分拣类似,只是零售对节奏要求较低,拿错货的后果也较轻。但在工业场景,比如汽车制造厂,生产线停机一分钟就可能造成上万元损失,因此对分拣的精度和速度要求极高。
总的来说,分拣技术虽已有不小进步,但目前尚未达到人类工人的水平,仍需一定时间进行技术迭代和突破。
王鹤:最核心的问题很简单:机器人干活能力还不够强,能做的任务类型有限。但如果能把这些有限技能做到足够通用,就能快速赋能很多场景。
银河通用目前最主要的突破在“抓取”和“移动”上。只要机器人能抓住任何物体,能在场景中完成下肢移动、上肢伸展,最后准确放置物体,这三个能力具备了,很多应用场景就能落地。这背后需要精准的目标识别和定位系统,我们目前正通过合成数据推进这项技术。
当然,就算解决了这个关键问题,仍有不少任务是机器人暂时做不了的。但只要攻克了目标识别和定位难题,人形机器人市场至少能达到千亿级规模,而且五年内就能看到成效。突破这个技术瓶颈后,有了庞大的市场投入,机器人肯定能解锁更多技能,向万亿市场迈进。
机器人形态与技术路线、国内外专家和企业对“人形”的必要性争议不断,有人认为人形是AGI的最终载体,有人认为未来十年人形机器人的占比只有10%,银河通用如何看待人形的必要性?
未来十年,人形机器人的市场占比会很可观。目前全球工业大机械臂总产值约1000亿元,而人形机器人按10万元一台算,销量不用太高就能超过这个规模。我预计它的产值每三年会翻10倍:现在头部企业卖1000台,三年后能到1万台,再三年到10万台;按每台几十万元算,10万台就能达到千亿元规模,超过现有工业机械臂的总产值。
所以未来十年,人形机器人市场规模会超过当前所有工业机器人;再往后十年,甚至可能达到万亿级,超越汽车、手机市场。
6、针对具身智能大脑的基础模型,宇树科技主要聚焦哪些方向的探索?能否透露一些具体内容?
我们公司尝试过不少方向。比如去年探索用视频生成模型作为“世界模型”来驱动机械臂并实现动作对齐,取得了一些效果,但这类模型训练规模太大,受限于公司的算力和投入,没能大规模推进。而且我们发现其泛用性也没达到预期,后来就没再继续。不过最近谷歌发布的新视频生成模型物理对齐效果很好,还公开尝试将其作为世界模型用于机械臂和通用智能,这让我觉得这个方向值得重新探索。
受公司规模、算力和人才限制,我们只是初步尝试,没有深入。但谷歌的成果证明了其潜力——视频生成模型在时间维度、数据源和效果上已达到不错水平。比如生成机器人打扫全屋的视频后,理论上只要让机器人动作与视频对齐,就能实现类似效果,只是目前对齐工作仍复杂且有挑战。这个方向对机器人应用和视频生成技术本身都很重要,大公司也会持续投入优化。
如果机器人能高效完成任务,腿的控制自然不会差;反过来,要是连腿都控制不好,说明还没达到真正通用的AI模型水平。所以双腿是一个重要的发展方向。对我们公司来说,深耕腿部技术顺理成章,而且这个方向本身也很有吸引力,大家普遍认可。再者,要是都去做轮式底盘,容易陷入同质化竞争,没必要。我们专注腿部研发,希望提升机器人的整体运动和作业能力,这个方向很有前景。
我也做过轮式底盘,清楚轮式和腿式各有优劣,且随着时间变化。目前轮式在工业开阔场景和货架间穿梭时,稳定性好、能耗低,但面对复杂环境可能受限;底盘做小了,稳定性又会下降。所以不同阶段,机器人下半身的方案必然不同。但我坚信腿是未来——它能让上半身触及更大范围,还能灵活调动腰部。不过不同阶段有不同的最优落地形态,我们不会局限于单一方案,现在同时用轮式底盘和人形机器人做全身控制研究。
8、在像医疗和养老这样高精度应用场景中,NVIDIA Omniverse如何确保用仿真数据训练的机器人具备可靠性和安全性?
Rev:如果你想构建一个能够在现实世界中行动且安全可靠的机器人系统,实际上唯一的选择就是使用仿真。举个例子,你希望系统足够智能,能够应对那些很少发生的特殊情况,甚至应对你希望永远不会发生的紧急情况。以自动驾驶为例,我们绝对不希望车撞到人或者孩子,但当街上出现小孩时,车辆的大脑该如何反应,如何获取训练这类系统的数据呢?唯一的办法就是通过仿真。因为我们绝不可能将孩子置于汽车前作为训练样本,这样做是不道德的、危险的,而且耗时且昂贵。
即使训练完系统,在将它部署到现实世界之前,也需要在这些相同场景中进行测试,确保在真正发生类似情况时,它能够正确反应。因此,真正的选择只有通过仿真实现,因为现实世界测试过慢、成本高且危险,我们不希望机器人在现实世界先失败。换句话说,如果我们无法让仿真足够准确以测试机器人,那么我们将无法制造出可靠的机器人。幸运的是,目前已有非常准确的仿真器。不过,这些仿真器计算量大且成本高昂,我们面临的真正挑战是如何提升仿真速度,使其在大规模系统构建中具有成本效益,这也是我们一直努力的方向。