00:00 / 02:05
连播
清屏
智能
倍速
点赞240
00:00 / 01:17
连播
清屏
智能
倍速
点赞58
00:00 / 02:12
连播
清屏
智能
倍速
点赞1114
00:00 / 03:14
连播
清屏
智能
倍速
点赞3
google神秘具身智能实验室2025年最新技术突破 谷歌(Google)在具身智能(Embodied AI)领域的角色类似于“规则制定者”和“算力底座”。它并不直接大规模生产机器人硬件,但通过 DeepMind 实验室,它提供了全球公认的机器人“大脑”架构和训练数据标准。 截至2025年,谷歌在这一领域的贡献和最新进展可归纳为以下四个核心维度: 1. 核心模型进化:从 RT 系列到 Gemini Robotics 谷歌的研究路径经历了从专用机器人模型到通用大模型的整合。 1.1 RT-2 (Robotic Transformer 2): 2023年推出的里程碑模型,首次实现了 VLA(视觉-语言-行动) 架构。它让机器人不仅能看(视觉),还能听懂“把恐龙放到心形图标上”这种模糊指令,并直接输出动作。 Gemini Robotics 1.5 / ER (2025最新): 2025年9月,谷歌发布了专为具身推理优化的 Gemini Robotics 1.5。 思考型模型: 引入了“思维链”(Chain-of-Thought)推理,机器人现在在操作前会先在内部进行逻辑规划(例如:要清理桌面,先移开水杯,再擦桌子)。 Gemini Robotics-ER (Expanded Reasoning): 进一步强化了在复杂多变环境下的实时修正能力,解决了以往机器人指令执行“死板”的问题。 2. 基础设施:Open X-Embodiment 与 RT-X 这是谷歌对全球具身智能社区最大的贡献,解决了“数据孤岛”问题。 Open X-Embodiment 数据集: 谷歌联合斯坦福、伯克利等全球33家实验室,开源了包含22种不同机器人形态、100万个真实世界轨迹的数据集。 RT-X 通用模型: 基于该数据集训练的 RT-2-X 模型显示出了惊人的“跨形态迁移能力”——即在一种机器人上学到的抓取技能,可以快速迁移到另一种完全不同的机械臂上。这被认为是实现“机器人界安卓”的关键一步。 3. 世界模拟器:Veo 与 Genie 3 (2025突破) 李飞飞强调“空间智能”,而谷歌通过其视频生成模型 Veo 和 Genie 实现了类似的逻辑。 4. 虚拟与现实的桥梁:SIMA 2 SIMA (Scalable Instructable Multiworld Agent): 这原本是一个在 3D 游戏环境中学习的 AI 智能体。
00:00 / 17:43
连播
清屏
智能
倍速
点赞4
00:00 / 00:45
连播
清屏
智能
倍速
点赞41
00:00 / 01:48
连播
清屏
智能
倍速
点赞88
00:00 / 08:09
连播
清屏
智能
倍速
点赞24