核心观点:如果说生成式AI完成了对人类大脑皮层(逻辑与语言)的模拟,物理AI则是补全了小脑与脑干(运动与感知)的拼图。在我看来,这不仅是技术的迭代,更是资本从“数字”向“物理世界”回流的历史性时刻。
从2022年ChatGPT的横空出世到各种AI智能体如春笋般不断涌现,几乎所有人都对未来充满了美好的想象与巨大的恐惧,一是畅享未来的智能生活,二是担心被AI替代的恐惧。但是,随着资本市场的不断投入,人们发现AI面临“莫拉维克悖论”:对人类而言,像散步、抓握等习以为常的“简单”技能,对机器却异常困难。例如,让机器人清洁一个油腻的锅具,远比让它解一道数学难题更具挑战性。物理AI就是想让机器具备在物理世界中感知、理解并执行任务的能力。回望过去二三十年,我们经历过com带来的泡沫,也看到了移动互联时代风带来的巨大造富效应,可以毫不夸张的说,投资的核心范式无疑是“软件吞噬世界”。以云服务、SaaS和移动互联网为代表的数字经济,利用零边际成本的特性创造了巨大的财富效应。然而,生成式AI(GenAI)虽然在信息处理上取得了突破,却始终面临一个硬约束:它无法直接干预物理世界。Physical AI(物理AI),或称具身智能(Embodied AI),正是在这一背景下诞生的新万亿级风口。它不仅是原来微软+Intel的合体,而是想赋予机器“身体”,从原来单纯的信息处理者转型为物理世界的执行者,包括从软件模型、训练平台到硬件芯片的全栈解决方案。01. 奇点临近:为何现在是布局的窗口期?
投资的本质是寻找技术成熟度与商业落地可行性的交叉点。为什么是现在?因为驱动物理AI爆发的“三驾马车”已在2025年前后完成了关键性的历史聚合,从技术完整度上奠定了基础。在很长一段时间里,大众眼里的机器人只是那些被困在工厂围栏内、机械重复指令的铁臂。它们本质上是“自动化”的某种延伸,远未达到“智能化”的程度。所以说,“动不了”不是其最大瓶颈,最大的难点在于其“听不懂”和“泛化难”。而现在,大语言模型(LLM)的通识能力赋予了机器人“常识”——理解能力成几何级增长,使其能听懂“把那块过期的面包扔掉”这类包含复杂语义和模糊边界的非结构化指令。过去机器人依赖工程师手写“运动树”,每个新增动作都需大量代码。现在VLA(Vision-Language-Action视觉-语言-动作)模型的出现是一个里程碑,它真正打通了从视觉感知到关节控制的端到端链路,让机器人具备了在开放环境中工作的可能性,实现了从视觉输入到动力输出的直接映射。目前的机器人拥有双层思维:一是负责场景规划的“显意识”,能理解“我饿了”背后的复杂指令;另一是神经网络驱动的“潜意识”,让它在坑洼地面行走时,通过数字孪生环境中的大量虚拟训练,形成类似于人类的“小脑反射”。有句话说的特别好,世界上没有白走的路,每一步都算数。物理AI就是如此,为什么它能够发展起来,因为它是站在新能源汽车巨人肩膀上的产业。得益于电动汽车产业链的极度成熟,高能量密度电池、高性能电机、功率半导体等核心部件的成本大幅下降。据我了解,制造一台高性能机器人本体的BOM(物料清单)成本,正从实验室级别的天价,迅速滑向十万元的可商业化区间。这几乎是所有硬科技普及的终极前提。举一个例子,去年我看过一个新能源汽车电机项目,如果从投资角度看,汽车行业高度内卷,不是一个好赛道。但是他们生产的电机恰恰能用在人形机器人上,这让整个项目的想象力上了一个新的台阶。正是基于之前的技术优化与大规模生产,让其在机器人领域上也能很好的控制成本。Sim-to-Real(从仿真到现实)技术的突破,解决了物理数据稀缺的难题。通过在NVIDIA Isaac Sim等高保真虚拟环境中进行数以亿次的低成本训练,机器人能够将习得的技能迁移至现实世界。这种“虚拟试错,现实执行”的模式,极大地降低了算法迭代的边际成本。说到这里,大家也能发现,物理AI带来的转变将极其深刻。过去五十年,机器人被视为“昂贵且笨拙”的设备,主要用于替代体力劳动,估值基于机械设备的折旧周期。现在,它们正进化为“新物种”。从投资角度看,定价权正从折旧资产向具有复利属性的智能资产转移。02. 产业链图谱:挖掘新的Alpha
在物理AI的版图中,价值链并非均匀分布。个人感觉,当然也曾与众多投资人沟通过,大家普遍认为,真正的Alpha将集中在以下三个具有极高护城河的维度:这一层级是机器人生态的“大脑”和“神经系统”,也是高毛利的根本来源。英伟达的GR00T平台类似于Windows。软件商的护城河在于“数据飞轮”,而非代码。对于机器人生态平台,拥有最多真实场景部署案例者能训练出更强的模型。过去,训练一个稳定步态的机器人需要一年;现在在英伟达的Isaac Sim中,借助大规模并行算力,机器人可以在虚拟世界中加速训练十年,并迅速部署到现实。这种“仿实结合”大大缩短了产品迭代周期,显著降低研发成本。类似于PC时代的操作系统,未来极有可能出现少数几家掌握核心Foundation Models(基础模型)的平台型公司。它们解决的是最底层的感知与规划问题。投资的胜负手在于:谁能率先解决跨场景的泛化难题?谁能建立起最大的物理世界交互数据库,从而形成数据飞轮?如果说模型是大脑,传感器与执行器就是感官与肌肉。触觉感知这一长期被忽视的领域正迎来新的爆发期。机器人要完成精细操作(如拿捏草莓),仅靠视觉是不够的。高分辨率、柔性电子皮肤及视触觉融合传感器(GelSight类)目前仍是蓝海,技术壁垒极高。以我跟踪的六维力传感器领域为例,去年有多家创业公司密集融资。这背后反映了我之前报告中提过的一个趋势——这些公司在前几年,都是默默无闻,不受投资机构青睐,但现在迎来了新的发展期。在执行器方面,传统谐波减速器面临挑战,随着本体放量,行星滚柱丝杠(PRSM)和空心杯电机等新方案迎来爆发,蕴藏巨大国产替代机会。关于人形与非人形的争论,其实意义不大。对于机器人,关键在于能否商用化、创造价值,无论是跳舞还是做工,只要有人买单,就是好项目。在中短期,我更看好在特定垂直场景落地的非人形或半人形形态,如物流仓储的移动搬运机器人、电力巡检的四足机器人。这些产品技术成熟,ROI计算清晰,能更快产生正向现金流。长期来看,通用人形机器人是终极梦想。人类基础设施(楼梯、门把手、工具)为双足双手设计,只有人形能无缝接入。尽管目前面临能耗与平衡控制挑战,但其潜力最大,一旦突破,将重塑家庭与服务业格局。因此,在我的投资逻辑里,当前的顺序是‘先零部件,再蹲平台,慎选本体’。 零部件(如六维力传感器)的确定性最高,如同淘金潮中的‘卖铲人’;平台型公司天花板最高,但需要押注;而本体公司则需火眼金睛,在特定场景中验证其ROI。03. 商业闭环与冷思考:从Demo到Product
与其他行业类似,物理AI的商业化将遵循严格的演进逻辑:首先在结构化环境(工业/仓储)解决“招工难”问题,当机器人的全生命周期成本(TCO)低于人类蓝领工人年薪的1.5倍时,B端采购将爆发;接着进入半结构化环境(商业服务)解决效率问题;最后才能进入非结构化环境(家庭)解决情感与照护问题。本质上,我认为物理AI是劳动力要素的资本化。它允许企业将劳动力支出从波动、不可控的运营成本(OpEx),转化为可控、可折旧的资本支出(CapEx)。这种财务结构的改变,是企业拥抱物理AI的根本动力。黄仁勋预测未来十年,AI将从“数字智力”跨越到“物理智能”。物理AI系统不再仅是执行命令的工具,而是能感知环境、理解上下文、做出决策并执行任务的协作者。对于投资人而言,这并非一场百米冲刺,而是一场考验战略定力与认知的马拉松。在这个阶段,我们寻找的不是完美的成品,而是那些掌握了核心数据飞轮、能够在特定场景率先跑通ROI、并具备快速硬件迭代能力的团队。
评论