“物理AI的ChatGPT时刻已经到来。”黄仁勋在CES 2026上说出这样一句话。随着AI的从“认知与生成”层面,涌向“理解与行动”的深水区,我们不仅需要更多的算力,也需要更多的模型和软件。
在本届CES上,英伟达发布的大量的产品。这些产品都是什么,具体有什么功用?本文将详细总结。
自动驾驶车辆,物理AI的第三类机器人
“物理AI和机器人技术将成为最大的消费领域,未来所有可移动的物体都将实现完全自主,并由物理AI驱动。”英伟达汽车业务副总裁阿里·卡尼(Ali Kani)表示,AI发展经理四个阶段:感知AI阶段使机器能够观察、识别和检测;生成式AI阶段赋予创造力;智能体人工智能(Agentic AI)带来了推理、思考和行动能力;现在我们正进入物理AI时代,智能开始融入现实世界。这些模型理解物理定律,并能直接根据对物理世界的感知生成行动。
构建物理人工智能需要三类计算机:从边缘到云的全栈专用加速系统、操作系统库和应用程序。英伟达的独特之处在于同时构建了这三类计算机:DGX用于训练人工智能模型;Omniverse和Cosmos用于模拟、测试和验证模型;而AGX则用于将模型部署到现实世界。目前,物理AI浪潮才刚刚开始,这些计算机为英伟达的物理AI业务带来了近万亿美元的机遇。
物理AI体现为三种类型的机器人:工厂机器人、普通机器人和自动驾驶车辆。英伟达此前开发了两类模型,Cosmos WFM(用于世界生成和理解的基础模型)和GR00T(用于通用机器人技术)。本次CES上,英伟达全新发布的AlpaMayo,用于能够“思考”的自动驾驶车辆。英伟达开源了这些模型、数据库、训练脚本和蓝图,以帮助生态系统的开发者进行开发。
AlpaMayo,首个汽车开源VLA
Ali Kani表示,自动驾驶是物理AI首个真正惠及数百万道路使用者的实例。汽车软件在过去十五年间经历了巨大变革:第一代自动驾驶仅具备感知能力;AV 1.5在感知基础上增加了基于模型的规划;AV 2.0采用了直接从数据中学习驾驶行为的生成式端到端人工智能;而现在,我们正迈向AV 3.0——即智能体物理AI时代,车辆能够像现实世界中的得力助手一样进行推理、规划和驾驶。这一演进过程将使每一辆汽车都成为持续学习、改进的物理人工智能系统。
物理AI对开发者的安全性提出了独特挑战。AlpaMayo则是一个包含开源AI模型、仿真工具和物理AI数据集的家族,旨在加速基于推理的安全自动驾驶开发。AlpaMayo产品组合为全球汽车制造商、供应商、初创企业和研究人员提供了构建L4自动驾驶系统所需的基础模块。这些工具共同为基于推理的自动驾驶栈实现了自我强化的开发循环。
“正如大语言模型通过ChatGPT引爆了智能体人工智能的浪潮,推理视觉语言行动模型(VLAs)也正成为物理AI的核心架构——而汽车行业的首个开源VLA AlpaMayo,已率先驶入这条道路。”Ali Kani介绍道,AlpaMayo是该模型家族的核心,是首款能让自动驾驶车辆“思考”的模型。这种视觉语言行动模型使自动驾驶车辆能够处理复杂的边缘场景,例如在没有先前经验的情况下,应对繁忙十字路口的交通信号灯故障。它通过将问题分解为步骤、推理各种可能性,然后选择最安全的路径来实现这一点。
AlpaMayo拥有100亿参数,规模足以处理自动驾驶任务,同时又足够轻量,可以在为自动驾驶研究人员定制的工作站上运行。它接受文本、环绕摄像头、车辆历史数据和导航输入等信息,并输出轨迹和推理过程,从而解释自动驾驶车辆采取某项行动的原因。
AlpaMayo如何让汽车“思考”并推理复杂场景,对乘客来说具体体验如何?Ali Kani表示,AlpaMayo的关键在于其基于良好驾驶行为进行训练,结合了模仿学习和强化学习,因此其驾驶方式像正常人一样,这在城市场景中尤为重要。与传统基于规则的自动驾驶栈相比,其驾驶体验更自然舒适。同时,作为一个具备推理能力的视觉语言行动模型,即使遇到未训练过的场景(如交通灯故障),它也能通过分解问题、推理可能性并选择最安全路径来处理,这是其核心创新。
除了AlpaMayo,英伟达还发布了用于训练它的部分数据,超过1700小时驾驶数据的物理AI开放数据集,使其成为行业内最大、最多样化的公开自动驾驶数据集。
一同发布的,还有AlpaSim,一个用于评估推理VLA(如AlpaMayo)的完全开源仿真框架。开发者可以使用自己的数据对AlpaMayo进行微调,也可以使用Cosmos生成合成数据,然后在真实和合成数据的组合上训练和测试他们的自动驾驶应用。
Drive AV,英伟达自动驾驶未来路线图
英伟达于2025年Q2在欧洲与梅赛德斯-奔驰CLA车型上首次推出了Drive AV自动驾驶平台。该平台包含一个能够处理最具挑战性城市场景的端到端模型,同时也与一个完全可追溯、功能安全的基于规则的栈并行运行。英伟达为其首个全栈合作伙伴梅赛德斯-奔驰的首发车辆赢得了欧洲Euro NCAP五星安全评级,并且在2025年所有提交Euro NCAP测试的车型中获得了最高的安全评分。
本届CES上,英伟达宣布其自动驾驶栈将登陆美国市场,并在今年晚些时候推出增强的驾驶功能,包括高速公路上的双手脱离方向盘驾驶,以及从家到工作地点等城市场景的端到端驾驶。其技术栈的进展速度在行业内是无与伦比的。
英伟达还分享了其Drive AV路线图以及迈向L4级自动驾驶的未来规划:2025Q2在欧洲首发;今年发布L2++城市驾驶功能;随后将扩展到欧洲、日本和韩国等其他地区;最终,从2027年开始,首先在Robotaxi上实现完全自动驾驶,随后几年内扩展到消费级汽车。随着AlphaMayo等推理VLA、Cosmos WFM基础模型、神经重建和高性能计算等技术的进步,几年前看似科幻的愿景如今已触手可及。
此前,英伟达推出了Drive Hyperion,一个用于L4自动驾驶车辆和Robotaxi的参考生产平台。Hyperion由双冗余车载计算机、安全的Drive操作系统、摄像头、雷达和激光雷达的多模态传感器套件组成,并由Halo系统提供支持,确保在任何单个计算机或传感器故障时,车辆仍能安全停车。
本届CES上,英伟达宣布全球Drive Hyperion生态系统正在扩大,几乎涵盖了所有行业关键的一级供应商、汽车集成商和传感器合作伙伴,包括 Stellantis、Lucid、梅赛德斯-奔驰、沃尔沃卡车、比亚迪、吉利和小米等,这些合作将推动基于Drive Hyperion 的Robotaxi、乘用车和长途货运车辆实现四级自动驾驶准备。英伟达也与所有领先的自动驾驶软件公司合作。
Cosmos进一步升级
“通过Drive AV,英伟达学习了物理AI和机器人技术的基础知识,并将这些经验应用到物理AI的新领域。物理AI让机器人能够感知现实世界,但仅有感知是不够的。无论是视觉AI智能体、自动驾驶车辆还是人形机器人,这些系统都需要类似人类的深度推理才能有效运作。”英伟达Omniverse与仿真模拟技术副总裁Rev Lebaredian介绍道,为此英伟达构建了Cosmos,一个专为高级世界生成和理解设计的世界基础模型平台。
本届CES上,英伟达发布了Cosmos Reason 2,这是一个完全开源的推理视觉语言模型,专为物理AI的需求而构建,能更好地感知物体和事件、精确定位,并逐步解释其决策过程。
训练这些机器人还需要大量多样化的数据集,而这在现实世界中难以获取。英伟达同时发布了Cosmos Predict和Cosmos Transfer的更新,这些开放世界模型能够为机器人仿真和测试创建基于真实物理的合成数据。这些模型已向全球开放,为机器人开发者带来了世界级的性能。Cosmos在理解物理世界方面超越了GPT-4o和Gemini等顶级模型,在物理推理和物理人工智能基准测试等关键排行榜上得分更高。这些模型已被下载超过400万次,广泛应用于制造业、物流、医疗保健和移动出行等行业的实际应用中。
Isaac和GR00T也在进化
Rev Lebaredian提到,当前大多机器人都比较“专用”,擅长单一任务但无法适应其他情况,未来属于“通用”机器人,它们结合了广博的知识和深厚的专业知识,既多功能又可靠。英伟达的开放机器人平台Isaac提供了构建这些“通用”机器人所需的开源框架、模型和库。
从零开始训练机器人模型需要大量的时间和资金投入。英伟达通过预训练这些模型并向所有人开放,降低了这一门槛。CES上,英伟达宣布GR00T 1.6全面上市,这是专为人形机器人打造的最新开源推理基础模型。GR00T 1.6包含两项重大更新:首先使用Cosmos Reason作为其“长思考大脑”,提升了推理和上下文理解能力;其次为人形机器人解锁了全身控制能力,使它们能够同时移动和处理物体。GR00T 1.6是社区热门模型,在Hugging Face上是下载量最高的机器人基础模型之一,今年下载量已超800万次。
构建机器人很难,而在笔记本电脑、实验室机器和云端之间连接和协调工作则更难。为此,英伟达开发了NVIDIA OSMO,一个简化开发的开源指挥中心。OSMO就像“粘合代码”,统一了整个流程,实现了从数据生成到训练在桌面和云端之间的无缝衔接。最后,在现实世界中测试机器人技能极其困难。为了简化这一过程,英伟达发布了Isaac Lab-Arena,这是世界上首个用于在仿真中安全测试机器人技能的开源框架。它统一了访问、训练脚本和最重要的机器人社区基准测试,成为社区评估机器人技能、在现实世界部署前进行基准测试的单一事实来源。
Rev Lebaredian强调,领先的机器人公司已经开始基于Isaac和GR00T构建其下一代物理人工智能系统。波士顿动力推出了基于Jetson Thor并在Isaac Lab中训练的新Atlas人形机器人;Franco Robotics使用GR00T模型驱动其双臂机械手;Robot Lem Surgical使用Isaac和Cosmos Transfer训练其手术机器人;LG电子推出了能处理各种家务的新机器人;Neura推出了由GR00T驱动、与Isaac Lab共同开发的保时捷设计人形机器人;XR Lab使用Thor和Isaac为外科医生提供实时人工智能指导。
机器人世界正在开源推动下快速发展。为了支持这一点,英伟达和Hugging Face正在合作,连接英伟达的200万机器人专家和Hugging Face的1300万人工智能开发者。通过将英伟达的最佳工具集成到开发者已经工作的环境中,使开发更加容易。英伟达的Isaac和GR00T技术现已内置到Hugging Face的Layerrobot库中,让开发者能即时访问GR00T等模型以及Isaac Lab Arena等仿真框架。在硬件方面,一切都能无缝协作:开源VT2人形机器人将在英伟达Chat GPT和四代芯片上无缝运行,让开发者能将高级人工智能模型直接部署到机器人上;对于桌面项目,Reaching Mini与DGX Spark完美搭配,可在本地运行自定义的AI语音和视觉模型。
Jetson T4000登场
除了运行在前两类计算机上的开源模型和框架,还有第三类计算机——机器人内部的计算机,其每一次运行都至关重要。
英伟达在CES上最新推出了Jetson T4000,这是基于Blackwell架构的Thor家族新成员,现已全面上市。它为现有客户提供了具有成本效益的升级方案,提供1200 TFlops的AI计算能力和64GB内存,功耗仅为40~70W,其AI性能和能效是AGX Orin的四倍,并且与T5000的安装尺寸完全相同,便于生产更换。这些模块可为从机械手到自主移动机器人再到人形机器人的多种机器人类型提供动力。
值得注意的是,Jetson T4000沿用与前代Jetson产品相同的统一内存架构,CPU和GPU共享访问64GB内存。

总结
物理AI的浪潮正重塑万亿美元产业。它驱动机器人从单一的作业工具,转变为能理解环境、作出判断并安全协作的伙伴。就像英伟达所说的,“这不仅是技术的演进,更是让机器真正融入物理世界、服务人类的关键一步。”而在这之前,技术的迭代是关键。
上一篇:12月移动机器人新品图鉴!
下一篇:扩展物理AI业务,Mobileye将以9亿美元收购人形机器人企业Mentee
推荐阅读最新更新时间:2026-03-25 12:56
- 用于 7VIN 至 16VIN、1.5V 和 1.2V 输出的 LTM4628EV DC/DC 模块稳压器的典型应用电路
- 使用 Analog Devices 的 LTC3728LIGN 的参考设计
- DER-406 - 适用于 A19 灯的 5.76 W 高 PF 非隔离降压-升压型 TRIAC 调光 LED 驱动器
- ADR5045B 5V 输出精密微功率并联模式电压基准的典型应用
- LT3970EDDB-3.42 2.5V 降压转换器的典型应用
- MC78M08BDTG 8V 电流调节器的典型应用
- LT1021DCN8-5 精密电压基准的典型应用
- DER-282 - 100W, 扁平(11 mm), LLC DC-DC转换器
- REF193 低压差开尔文连接电压基准的典型应用电路
- LT3088EM 线性稳压器用于添加软启动的典型应用

工业机器人性能测量与校准技术(PPT)
桌面AI交互机器人源码
非常经典的关于LLC的杨波博士论文
7662CPA






京公网安备 11010802033920号