英伟达发布 Alpamayo-R1模型:为 L4 自动驾驶注入“常识”推理力

  12 月 2 日, 正在加利福尼亚州圣地亚哥进行的 NeurIPS 人工智能大会上,半导体巨头英伟达(NVIDIA)揭橥推出一项旨正在加快“具身智能”(Physical AI)生长的重点本事底子方法。具身智能被英伟达连结创始人兼首席奉行官黄仁勋视为人工智能的下一波海潮,其重点正在于制造不妨感知、明了并与实际天下互动的机械人和主动驾驶编制。

  此次宣布的重点是 Alpamayo-R1——一款面向主动驾驶磋议的开源推理型视觉道话模子(Visual Language Action Model)。英伟达称,这是业界首个专一于主动驾驶周围的视觉道话手脚模子。这类模子不妨同时管束车辆界限的图像音信和文本指令,让车辆不只能“看”到界限境遇,还能基于这些感知内容举行逻辑推演并做出决定。

  Alpamayo-R1 模子的推理才具,设备正在英伟达此前宣布的 Cosmos-Reason 推理模子底子之上。Cosmos 系列模子的一大特质是具备正在反映挺进行逻辑推演的才具,这种机制旨正在付与主动驾驶车辆相似人类的“常识”,使其不妨更稳妥、更和平地应对丰富的驾驶场景和纤细的决定需求。英伟达夸大,对付尽力于达成 L4 级主动驾驶(正在特定区域和限制前提下达成一律主动驾驶)的企业而言,Alpamayo-R1 这类本事至合首要。

  为激动具身智能和主动驾驶本事的生长,英伟达采取了盛开计谋。目前,Alpamayo-R1 已正在 GitHub 和 Hugging Face 平台全数开源宣布,为环球的磋议者和开垦者供应了一个宏大的磋议用具。

  其它,英伟达还同步正在 GitHub 上推出了名为“Cosmos Cookbook”的完善开垦资源包。这个资源包供应了详尽的分步指南、推理用具以及熬炼后事务流,旨正在助助开垦者更高效地针对自己运用场景操纵和熬炼 Cosmos 系列模子。资源包内容涵盖了数据清理、合成数据天生和模子评估等众个症结合头,极大地消浸了开垦门槛。