×
加载中...
有人造本体,有人训模型,刚融资的Uncharted Dynamics在重写机器人世界的物理法则
暗涌Waves 2026-05-11 09:04

型够不够强、算力是否满足、数据规模还能不能扩张——这些讨论几乎每天都在具身智能行业发生。随着大语言模型的路径被反复验证,“Scale everything”逐渐成为一种共识也自然延伸到了机器人领域。于是,从遥操作设备到数据采集工厂,从开源数据集到仿真平台,整个行业似乎都在朝着同一个“相对明确的方向”用力。

但数据量的提升,并没有带来预期中的性能跃迁。同一个模型在仿真中表现稳定,一旦部署到真实环境,成功率明显下降。继续加数据,改善有限;调整模型结构,效果也不稳定。

很多人会将这种差异解释为“现实世界太复杂”,有一家水下公司Uncharted Dynamics并不认同。创始团队更倾向于认为,如果模型无法稳定迁移,问题可能不在现实,而在于“我们用来训练机器人的那套物理模型本身”。

也就是说,数据本⾝的“物理真假”才是瓶颈。 数据在物理层面是否成立,是一个被行业长期跳过的前提——尤其在接触密集、刚柔耦合这类真正难的场景里。试想一下,如果据里的物理规律本⾝是错的,模型学到的就是⼀套在真实世界⾥站不住脚的“直觉”。

Uncharted Dynamics的团队构成是理解这家公司的起点。CEO贺哲文拥有计算神经科学背景,深度参与过大语言模型的Scale阶段,见证了数据质量如何决定模型能力上限和泛化的可能性。核⼼团队来⾃⼯业物理与机器⼈仿真⽅向,⻓期从事复杂接触系统的建模与求解研究。他们毕业于加拿大麦吉尔大学,相识超过十年,多位工业物理博士曾服务过庞巴迪、丰田、加拿大宇航局及北美头部机器人公司。

目前在具身行业,这样的组合还比较稀有。贺哲文告诉我,那是因为,工业软件领域已经有成熟的高客单价生意,很少有人愿意离开舒适区,去服务一个还在成长期的机器人行业,而机器人行业又很难管理做机械物理出身的科学家。

而Uncharted Dynamics之所以能够组建,是因为他们共同意识到:具⾝智能,需要⼀个物理基建。

决定创业前,贺哲文曾走访过一些北美的客户,她发现大家面临同样头疼的问题:主流的开源或商业求解器,在简单刚体场景中尚可工作,但一旦进入更接近真实世界的复杂交互——例如刚柔耦合、柔性接触或形变计算,往往迅速失真甚至失效。这也解释了为什么模型可以在仿真中表现良好,却难以稳定迁移到现实世界。

「暗涌Waves」独家获悉,Uncharted Dynamics近日已完成数千万元首轮融资,由险峰长青领投。本轮资金将主要用于高精度多体动力学求解器的研发以及北美市场拓展。

我很好奇,具身数据的“物理失真”究竟发生在哪个环节?为什么Scale之前必须先解决物理一致性问题?在中美之间,他们打算如何让这门“地基生意”跑通?前不久,我和CEO贺哲文聊了聊。

以下为对话,经编辑——

Part01

被忽略的前提

「暗涌」:过去两年整个行业的努力让机器人第一次有了“模型”,兴奋是有道理的。但你们做物理一致性这件事,似乎给行业泼了一盆冷水?

贺哲文其实我们不是唱反调。恰恰相反——正因为相信Scale是对的方向,才更要把Scale的前提讲清楚。

仿真基建是具身落地的必经之路,这个判断在行业里已经是共识。但“仿真能用”和“仿真能用来训练模型”是两件事。在平坦地面行走、做基础拾取这类相对简单的场景,现有仿真器够用,Sim-to-Real也相对可控。但一旦进入接触密集、高自由度灵巧手、刚柔混合这类真正难的场景,现有仿真器的物理计算就是粗糙的、近似的。

力的传导、摩擦的变化、材料的形变——这些真实世界每时每刻都在发生的事情,仿真里算出来的结果和真实物理之间存在巨大gap。

业内一直在说Sim-to-Real Gap,它有多重来源——视觉渲染、传感器噪声、执行器延迟都有贡献。但在接触密集场景里,真正决定成败的,是仿真里的物理规律是否算对。而这恰恰是长期被简化、被近似处理的一层。

「暗涌」:就如同⽤⼀本物理公式写错的教科书上课。简单的题⽬,答案或许还能蒙对。但⼀旦遇到复杂的问题,学⽣就会暴露。不是因为学生不努⼒,⽽是他学到的东西本⾝就是错的。
贺哲文没错,这是由行业发展阶段决定的。过去两年AI几乎被Scaling Law定义——更多数据、更大模型、更强能力。这条路径在语言模型上被充分验证。但AI走进物理世界之后,有一个前提很少被正面讨论:数据必须在物理层面是成立的。

如果训练数据里的物理规律本身有偏差,模型学到的只是一套在真实世界里不稳定的“近似直觉”。视觉可以被采集、轨迹可以被记录,但真正决定结果的,是接触发生那一瞬间的物理过程——力、摩擦、形变。这些关键变量要么缺失,要么被长期简化。

「暗涌」:你的意思是,模型在训练过程中学习到的,并不是一个完整的物理过程,只是在某种视觉、触觉状态下,执行某种动作?

贺哲文有的只是一种表面上的映射关系。这种学习方式在特定环境中可以成立,但缺乏泛化能力。一旦环境发生变化,比如物体材质不同、摩擦条件变化,这种映射就会失效。

今天主流的仿真平台各有来源:PhysX起源于游戏物理、MuJoCo最初面向机器人控制和低维优化问题。它们在各自的原始场景下都做得不错,但都不是为今天具身智能需要的大规模、高精度、复杂接触训练而设计的。

一旦进入刚柔混合、密集接触的场景——比如灵巧手抓一个柔性物体,两者共同的短板就暴露了:摩擦力、形变这些高度非线性的过程,现有求解器没有足够的物理模型支撑。

「暗涌」:最容易被忽视的,是哪个环节或者说瞬间?

贺哲文触。从视觉看,这只是一个短暂的帧变化,但在物理层面,它决定了后续所有过程:力的分布、摩擦的变化、物体的响应方式。一旦这一环节的建模出现偏差,后续所有状态的预测都会带有系统性误差。

在短链路中,这种误差不明显;一旦链路拉长,就会累积为不可忽视的偏差,最终表现为模型无法稳定迁移到真实环境。

「暗涌」:所以你们就先做了一个物理求解器,能不能用通俗易懂的方式,解释下为什么一定要用到这个?

贺哲文比一下——电脑里的图形引擎负责把代码算成你看到的画面;物理求解器负责把物理定律算成机器人能学习的物理过程。每一次接触发生时,力怎么传、摩擦怎么变、物体怎么形变,都由它精确算出来。

没有它,仿真里所谓的“物理”其实是一堆近似和省略;模型从这种数据里学到的,只是表面的视觉-动作映射。换上求解器算出来的数据,模型学的就是物理因果——力作用上去会发生什么、为什么会这样。

这是一个本质的差别。前者换个材质、换个摩擦条件就失效;后者才有可能在真实世界里站得住。

「暗涌」:工业软件领域不是也有高精度的多体动力学求解器吗?为什么不能直接拿来用?

贺哲文业软件只保精度,不保速度。那些软件算几秒钟的复杂接触,可能要花几个小时甚至十几个小时。这种精度对航空航天、军工是合适的,但模型训练需要的是实时、可并行、大规模的物理计算。

我们真正的技术工作,是在高精度和训练速度之间重新找到一条路——既能保证物理正确性,也能跑到训练可用的速度。

Part02

从近似到成立:

重写物理引擎

「暗涌」:你们提到一个概念叫“Physics-Augmented”数据。一条普通的机器人操作数据,在你们眼里缺了什么?

贺哲文理层面的因果标签。普通数据记录的都是肉眼能看到的东西——手的位置在变、物体的位置也在变。但真正决定这件事能不能成立的,是肉眼看不到的部分:施加了多大力、力作用在哪个方向、物体受力后怎么形变、摩擦怎么变化。这些才是物理上真正在发生的事。

「暗涌」:这些力的标签不是从真实传感器采来的,是通过求解器算出来的。算出来的力和真实传感器测出来的力,做过对比验证吗?

贺哲文是我们前期和种子客户在重点做的事。我们在加拿大有一个轻量化机械臂的合作方,他们本身就是工业级物理求解器的重度用户,传感器和测量基础设施非常完整。

我们用两层证据来验证:

第一层是物理精度验证——我们每开发一个新模块,就把求解器在标准接触场景下算出来的力、力矩、形变结果,和他们机械臂上传感器实测的数据做逐点对比。在我们已经覆盖的接触类型里,误差能稳定控制在工程可接受的范围内。这是'数据是真的'的直接证明。

第二层是下游效果验证——光算得准还不够,关键是这些数据能不能让模型训得出来。在一些过去算法完全无法收敛的接触密集任务上,换上我们生成的数据,同样的算法能快速收敛、稳定提升Benchmark。这是'数据是有用的'的证明。

两层证据放在一起,物理真值的价值就站住了——既对得上真实物理,又能直接转化为模型能力。

「暗涌」:也就是说,有些任务过去用别的方法根本训练不出来,用你们收敛后的数据就能训出来了?

贺哲文对,这是我们信心最足的地方。在一些小规模、简单算法的测试里,不到 1000条高质量测试数据,就能在同样的算法上看到Benchmark的明显提升。因为物理上对了,模型不用再花大量时间“纠错”那些失真的物理信号。 

但我想强调一点——这不是反对Scale。Scale的方向是对的。我们说的是:Scale之前必须先保证物理一致性,否则是在错误的地基上堆数据,量越大,纠偏的代价越大。物理正确性,是让Scale真正发挥作用的前提。

「暗涌」:听起来你们的商业化路径有两条:一条是直接卖数据服务,一条是卖求解器的能力。

贺哲文:准确来说是三层结构。最底层,是物理求解器本身——这是我们的技术内核。前期我们会把它封装成 API,嵌入到像 NVIDIA Isaac Sim 这样的主流平台里,免费开放给开发者。这一层不收费,目的是建立技术标准和开发者认知,就像每台电脑里都有一个图形引擎,我们想让每个具身训练流程里都有一个物理引擎。 

中间层,是物理因果数据集——基于求解器生成的、带完整力学标签的训练数据。这是我们商业化的主战场之一。客户可以是自己做模型的机器人公司,也可以是其他数据供应商(他们采集回来的原始数据交给我们做物理校正,把缺失的力学标签补上)。

应用层,是端到端的仿真服务——帮客户直接解决 Sim-to-Real的误差收敛问题。适合那些有明确落地任务、但被Gap卡住的团队。 底层免费建生态,中间和上层收费做商业化——这是一条递进的路径。北美市场已经证明,好的物理数据是有人愿意花大价钱买单的。

「暗涌」:这也是本轮融资把拓展市场放在北美的原因?

贺哲文:我们目前团队的人脉、客户关系基本都在北美,这是一个很自然的选择。但更深层的原因是,北美客户对物理一致性的需求已经到了非常迫切的阶段。

北美很多团队的切入点从一开始就聚焦在复杂的灵巧操作上,接触密集、任务链长、需要泛化,仿真里的误差对他们来说是每天都要面对的痛点。

国内团队这两年主要精力还放在Locomotion——让机器人走起来、跑起来。在这个阶段,物理一致性问题确实不是最急迫的。但从能动到巧动的拐点已经在出现——越来越多国内团队开始转向家务、柔性装配、复杂操作这类场景,物理问题会成为绕不过去的一关。我们已经在和几家头部国内团队密切接触,当他们需要的时候,我们会是一个现成的选择。中国是我们同等重要的市场,不会放弃。

「暗涌」:你在跟北美客户打交道时,有没有遇到过那种让你觉得“他们居然连这个都在乎”的苛刻要求?

贺哲文们对数据分布的敏感度,常常超出我预期。比如他们会很具体地问:哪种类型的接触数据、在什么样的分布下,能让某个 Benchmark 指标有所提升。不是泛泛地“我要更多的数据”,而是要看到数据组合和模型表现之间的因果。他们会自己设计对比实验来进行验证。

但这不是谁更厉害的问题,是路径不同。中国团队的优势在硬件供应链,擅长把本体成本压下来、先让机器人跑起来;北美团队更愿意在算法和 Infra 层做长期投入——对数据质量的敏感度,正是这种长期投入自然长出来的。只是阶段不同。

当国内团队从“能动”走到“巧动”那一步——开始做柔性装配、复杂操作、长链路任务时,就会需要这种对数据分布的拆解能力,我们的求解器和数据集那时候就有用武之地了。

「暗涌」:如果中国的具身公司不重视物理底层,继续用粗糙的仿真数据去训练,最坏的结果是什么?

贺哲文坏的结果是——模型在仿真里表现很好,一到真机部署就失败,反复调参、反复采数据,却始终定位不到根因。因为根因藏在最底层的物理建模里,而大家都在更靠上的层面努力。 

到底什么样的数据才值得被Scale?我们认为,物理一致性是前提。在这个前提之上,再去讨论数据的分布、数量、场景覆盖,才有意义。Uncharted Dynamics想补的,就是具身智能里这一层长期缺失的基础设施。

Part03

理解智能的人,

遇上工业物理的人

「暗涌」:贺总的学科背景是计算神经科学,这个专业的人很多去做脑机接口了。你为什么选择来做具身智能的底层物理引擎?

贺哲文其实对我来说不是一个大型转变。神经科学教会我的核心方法是——去看一个智能系统最底层的信号是怎么被表征、处理、转化为行为的。不管是生物大脑还是AI模型,输入信号的质量决定了输出的上限。我也亲身经历了LLM从堆量到重质的完整过程,看到模型能力的上限,往往不由模型本身决定,而由数据的结构和真实性决定。 

从脑到LLM到具身,对我来说其实是同一条主线——智能如何从底层信号中涌现。只是认知层级在下探:从生物智能、到语言智能、到物理智能。真正推动我选择具身的,是一种更长期的判断。脑机接口确实重要,但它的瓶颈在生物学和监管,周期非常长。

具身智能是AI真正进入物理世界的入口,这个入口的市场规模、紧迫性、可以被我们这种团队解决的问题密度,都要高得多。而且我们不想做表层的东西——模型、本体、demo已经有很多人在做。我们想做底层的、作为基石的技术。物理之于具身智能,就是这样一块基石。基石铺好了,上面长什么都有可能;基石不稳,上面盖得越高塌得越狠。

「暗涌」:你也亲身经历过大语言模型的Scale阶段。那段经历对现在有什么影响?

贺哲文:大语言模型早期也是堆语料,后来大家发现光堆量不行,开始转向数据质量、数据分布、各种微调。在Physical AI领域,物理一致性就是数据质量的底线。如果这条线没守住,上面做再多数据配比、算法创新,根基都是不稳的。我们现在做的事,相当于在具身智能的“预训练”阶段,先把语料的物理正确性保证了。

「暗涌」:Uncharted Dynamics 的团队本身是“智能”与“物理”的交汇点:一端理解数据如何塑造智能,另一端能够建模真实世界。 为什么后者以前不做这件事?

贺哲文为动力不够。工业软件的客户是重工业、军工、航空航天,客单价极高。机器人公司对他们来说是一个不太稳定、付费能力也相对有限的群体。让他们去改动框架、服务机器人客户,意愿很弱。而机器人的博士们又很难管理做机械物理的博士——大家虽然都是科学家,但关注的东西完全不一样。

「暗涌」:那你是怎么把这些人聚到一起的?

贺哲文我们核心团队在麦吉尔大学就认识了,做这件事是我们一起讨论出来的。那些工业物理的博士们也认为,这个问题非常重要,到了该被解决的时候。大家理念一致,各自做擅长的事。

团队非常的交叉互补:计算神经科学、工业物理与多体动力学、机器人仿真与强化学习。成员主要毕业于麦吉尔大学、伦敦大学学院、清华大学等学校,多位拥有多年工业物理研发经验,曾曾深度参与过头部航天机构、国际顶级车企,以及全球领先AI实验室的核心项目。

我自己之前是一家AItoC公司的联合创始人,那段经历让我清楚地知道,数据质量如何决定模型能力的上限——这也是我选择来做具身物理基石的直接原因。

这样一个组合在具身行业里相对稀缺:一端理解数据如何塑造智能,另一端能把真实物理建模出来。这两件事过去几乎从不在同一支团队里。

「暗涌」:如果具身智能类比造车,有人在造轮子,有人在训司机,你们把自己放在哪个位置?

贺哲文现阶段我们做的是最底层的路基。路基不平,再好的车和司机也跑不快。我们现在做的事,就是先把这条路修平、修结实。

未来我们想成为藏在操作系统最底层的一个引擎。你可能感知不到它的存在,但每一台机器人在理解物理世界、规划动作时,都依赖它提供的物理一致性。就像今天每一台电脑里都有一个图形引擎一样,未来每一台通用机器人的“大脑”里,都应该有一个物理引擎。我们想做那个引擎。

「暗涌」:更强的模型、更灵活的本体、更惊艳的demo,这些都更容易被感知,也更容易被放大。相比之下,底层物理建模显得不那么“性感”吧。

贺哲文但这是刚需。物理求解器这个领域,不是靠堆人、堆钱就能短期赶上的。它需要的是长期积累的物理建模经验和工程化能力,我们团队在这个领域有超过十年的积累。一旦我们把最难的刚柔混合、复杂接触场景跑通,这个优势会保持相当长的时间。

Part04

结语

“Scale 之前,先让物理成立。”这句话听起来像反共识,但顺着这个逻辑往下推,会发现整个行业其实都在朝同一个方向走。

越来越多的团队开始谈论世界模型——让机器人不只是模仿动作,而是在脑子里建立起对物理世界的理解和预测。但世界模型要真正立得住,前提是它内部的物理本来就是对的。否则模型的“想象”越精细,离真实世界反而越远。

从这个角度看,Uncharted Dynamics做的事——给具身智能补一层物理基建——并不是一条独立赛道,而可能是所有上层叙事最终都要落到的同一块地基。

这条路注定不性感。但它可能是Scale真正发挥作用的地方,也可能是世界模型真正长出来的地方。

(来源:暗涌Waves)



扫码下载app 最新资讯实时掌握