00:00 / 00:00
连播
清屏
智能
倍速
点赞404
00:00 / 00:00
连播
清屏
智能
倍速
点赞715
00:00 / 00:00
连播
清屏
智能
倍速
点赞2551
00:00 / 00:01
连播
清屏
智能
倍速
点赞1701
今天我们聊聊:Pelican-VL 1.0 中国开源具身智能的里程碑突破 2025年11月,#北京人形机器人创新中心 开源全球参数量最大的具身智能多模态大模型Pelican-VL 1.0(7B-72B参数),首次实现从「视觉理解」到「物理执行」的全链路智能。该模型在空间推理、精细操作等12项基准测试中超越谷歌Gemini-RoboticsER,推动人形机器人从「马拉松冠军」进化为「会思考的执行者」。 核心技术突破:从感知到行动的闭环 Pelican-VL通过三大创新重构具身智能范式: 刻意练习机制(DPPO) :模型在失败中自我诊断,空间理解能力较基线提升47%,能像人类般通过「试错-修正」掌握复杂操作 感知运动闭环:三阶段抓取框架实现毫米级精度——视觉预判物体属性生成初始力(主动预测)、触觉传感器实时微调抓力(触觉适应)、交互经验存入物理记忆图谱(记忆更新),成功抓取生鸡蛋等易碎物体 跨模态长程规划:解析自然语言指令并分解为可执行步骤,如「整理房间」任务中自主规划移动路径,完成鞋架归位、垃圾清理、衣物分类等多步骤操作 开源生态与产业影响 项目全面开放模型权重与推理代码(GitHub星标数3天破万),形成「通用大脑+硬件平台+场景数据」三位一体体系: 降低研发门槛:提供「视觉理解→长程规划→物理操作」全链路训练范式,企业可基于此快速开发特定场景应用 多机协作能力:支持轮式/双臂机器人协同,如灯泡质检流程中动态分配「系统启动」与「结构检测」任务 千台数据计划:部署机器人在工厂/酒店采集真实场景数据,加速制造业自动化与家居服务落地 Pelican-VL的开源标志着中国在具身智能基础研究领域实现从「跟跑」到「领跑」的跨越,其「智能操作系统」理念或将重塑全球机器人产业格局。
00:00 / 00:00
连播
清屏
智能
倍速
点赞1
00:00 / 00:01
连播
清屏
智能
倍速
点赞3651