尽管我们有时称Gemini和ChatGPT等聊天机器人为机器人◈★ღ★,但生成式AI正在真正的物理机器人中发挥越来越重要的作用◈★ღ★。继今年早些时候发布Gemini Robotics后◈★ღ★,谷歌DeepMind现在推出了一款新的设备端VLA(视觉语言动作)模型来控制机器人◈★ღ★。与之前的版本不同◈★ღ★,这个版本不依赖云端组件◈★ღ★,让机器人能够完全自主运行◈★ღ★。

  谷歌DeepMind机器人部门负责人Carolina Parada表示◈★ღ★,这种AI机器人方法可以让机器人在复杂环境中更加可靠◈★ღ★。这也是谷歌机器人模型的首个版本◈★ღ★,开发者可以根据特定用途对其进行调优◈★ღ★。

  机器人技术对AI来说是一个独特的挑战◈★ღ★,因为机器人不仅存在于物理世界中◈★ღ★,还会改变其环境◈★ღ★。无论是让机器人移动积木还是系鞋带◈★ღ★,都很难预测机器人可能遇到的每种情况◈★ღ★。传统的通过强化学习训练机器人动作的方法非常缓慢◈★ღ★,但生成式AI允许更大程度的泛化◈★ღ★。

  它利用Gemini的多模态世界理解能力来完成全新的任务◈★ღ★,Carolina Parada解释道◈★ღ★。这使得Gemini不仅能够生成文本◈★ღ★、写诗◈★ღ★、总结文章◈★ღ★,还能编写代码◈★ღ★、生成图像◈★ღ★,同样也能生成机器人动作◈★ღ★。

  在之前的Gemini Robotics版本中(这仍然是谷歌机器人技术的最佳版本)◈★ღ★,平台运行混合系统◈★ღ★,机器人上有一个小模型南波杏◈★ღ★,云端运行一个更大的模型◈★ღ★。你可能看过聊天机器人在生成输出时思考几秒钟◈★ღ★,但机器人需要快速反应◈★ღ★。如果你告诉机器人拾取并移动物体◈★ღ★,你不希望它在生成每个步骤时暂停◈★ღ★。本地模型允许快速适应◈★ღ★,而基于服务器的模型可以帮助处理复杂的推理任务◈★ღ★。谷歌DeepMind现在将本地模型作为独立的VLA发布◈★ღ★,它的表现出人意料地强大◈★ღ★。

  新的Gemini Robotics设备端模型的准确性仅略低于混合版本◈★ღ★。据Parada介绍尊龙凯时人生就是博尊龙凯时人生就是博◈★ღ★,许多任务可以直接使用◈★ღ★。当我们与机器人互动时◈★ღ★,发现它们在理解新情况方面能力惊人◈★ღ★,Parada告诉Ars◈★ღ★。

  通过发布带有完整SDK的模型◈★ღ★,团队希望开发者能为Gemini驱动的机器人提供新任务并展示新环境◈★ღ★,这可能会揭示模型标准调优无法处理的动作◈★ღ★。使用SDK◈★ღ★,机器人研究人员能够仅用50到100次演示就让VLA适应新任务◈★ღ★。

  在AI机器人技术中◈★ღ★,演示与其他AI研究领域有所不同◈★ღ★。Parada解释说◈★ღ★,演示通常涉及远程操作机器人——手动控制机械设备完成任务来调优模型◈★ღ★,使其能够自主处理该任务◈★ღ★。虽然合成数据是谷歌训练的一个要素◈★ღ★,但它不能替代真实数据◈★ღ★。我们仍然发现◈★ღ★,对于最复杂◈★ღ★、最精细的行为◈★ღ★,我们需要真实数据尊龙凯时人生就是博◈★ღ★,Parada说◈★ღ★。但通过仿真可以做很多事情尊龙凯时人生就是博◈★ღ★。

  然而◈★ღ★,这些高度复杂的行为可能超出了设备端VLA的能力范围南波杏◈★ღ★。它应该能够毫无问题地处理简单动作◈★ღ★,如系鞋带(这对AI机器人来说传统上是一项困难任务)或折叠衬衫◈★ღ★。但是◈★ღ★,如果你想让机器人为你制作三明治◈★ღ★,它可能需要更强大的模型来进行必要的多步推理南波杏◈★ღ★,将面包放在正确的位置◈★ღ★。

  团队认为Gemini Robotics设备端版本非常适合云连接不稳定或不存在的环境◈★ღ★。在本地处理机器人的视觉数据对隐私保护也更有利南波杏尊龙凯时人生就是博◈★ღ★,例如在医疗环境中◈★ღ★。

  无论是提供危险信息的聊天机器人还是像终结者一样的机器人◈★ღ★,AI系统的安全性始终是一个关注点◈★ღ★。我们都见过生成式AI聊天机器人和图像生成器在输出中产生虚假信息南波杏◈★ღ★,驱动Gemini Robotics的生成系统也不例外——模型不是每次都能做对◈★ღ★,但给模型一个带有冰冷金属抓手的物理实体让问题变得更加棘手◈★ღ★。

  为确保机器人行为安全◈★ღ★,Gemini Robotics采用多层方法◈★ღ★。通过完整的Gemini Robotics◈★ღ★,你连接到一个能够推理什么是安全行为的模型◈★ღ★,Parada说南波杏◈★ღ★。然后让它与实际产生选项的VLA对话◈★ღ★,接着VLA调用低级控制器◈★ღ★,后者通常具有安全关键组件南波杏◈★ღ★,比如可以施加多大力量或手臂可以多快移动◈★ღ★。

  重要的是◈★ღ★,新的设备端模型只是一个VLA◈★ღ★,所以开发者需要自己构建安全机制◈★ღ★。不过◈★ღ★,谷歌建议他们复制Gemini团队的做法◈★ღ★。建议早期测试程序中的开发者将系统连接到标准的Gemini Live API◈★ღ★,其中包含安全层◈★ღ★。他们还应该实施低级控制器进行关键安全检查南波杏◈★ღ★。

  任何有兴趣测试Gemini Robotics设备端版本的人都应申请加入谷歌的可信测试程序◈★ღ★。谷歌的Carolina Parada表示◈★ღ★,过去三年中机器人技术取得了许多突破◈★ღ★,这只是开始——当前发布的Gemini Robotics仍基于Gemini 2.0◈★ღ★。Parada指出◈★ღ★,Gemini Robotics团队通常比Gemini开发落后一个版本◈★ღ★,而Gemini 2.5被认为在聊天机器人功能方面有了巨大改进◈★ღ★。也许机器人也会如此◈★ღ★。人生就是博官网尊龙凯时首页◈★ღ★,人生就是博·(中国区)官方网站◈★ღ★,尊龙凯时登录◈★ღ★,人生就是博中国区官方网站◈★ღ★。尊龙凯时人生就是博人生就是博智能显示◈★ღ★。


上一篇 : 尊龙官方论文有多水?这个AI系统一眼识破:KnoVo自动评估学术论文创新值|艳修
下一篇: 没有了


尊龙凯时 - 人生就是搏!| http://www.airzhongyi.com