00:00 / 01:45
连播
清屏
智能
倍速
点赞0
00:00 / 06:07
连播
清屏
智能
倍速
点赞1
李飞飞眼中AI 的下一个十年 著名科学家李飞飞最近在一篇万字长文中指出,AI的未来,不能仅仅停留在“鹦鹉学舌”的语言层面,而是要真正“睁开眼睛”,理解我们生活的这个三维物理世界。 那么,怎么才能让AI“开眼看世界”呢?李飞飞给出的答案是——**世界模型 (World Models)**。 现在的大模型就像一个只通过读书来学习世界的“学霸”。它读了海量的书籍,知道了“苹果是圆的”、“冰箱能制冷”。但它从未亲眼见过、亲手摸过,所以它的知识是扁平的、缺乏直观感受的。 而“世界模型”,就是要给这个“学霸”装上一双“眼睛”和一个“身体”,让他变成一个“实践家”。这个“实践家”脑子里有一个我们真实世界的模拟沙盘 。他不仅知道苹果和冰箱的知识,还能在这个沙盘里推演:如果我伸手去拿苹果,苹果会有什么反应?如果我打开冰箱门,会感觉到冷气。 李飞飞指出,一个真正的“世界模型”必须具备三个核心能力: 第一,**生成能力 (Generative)**。它得像一个“造梦师”,能在脑海中创造出一个符合物理规律、几何关系自洽的虚拟世界。比如,它能想象出一个球掉在地上会弹起来,而不是穿过去。 第二,**多模态性 (Multimodal)**。它要能像我们一样,眼耳鼻舌身都能接收信息。不仅能看懂图片、听懂声音,还能理解动作、触感这些复杂的信号。 第三,**推理与交互能力 (Reasoning & Interaction)**。就像一个“第一反应者” ,它能在复杂的动态环境中,快速理解发生了什么,并做出流畅、合理的应对。比如在自动驾驶中,能瞬间判断前方突然出现的障碍物并选择最佳避让路线。 简单来说,李飞飞教授认为,未来的AI不应该只是一个会聊天的“语言模型”,而是一个拥有“空间智能”的“世界模型”。这就像我们人类,不仅会说话,更重要的是我们能在这个三维世界里活动、交互、解决实际问题。 从只能处理文字的“二维生物”,进化到能够理解和预测物理世界的“三维智能体”,这才是AI走向真正通用智能的关键一步。这不仅会让机器人、自动驾驶变得更安全、更智能,甚至会深刻地改变科学研究、内容创作等各个领域。#人工智能
00:00 / 02:18
连播
清屏
智能
倍速
点赞7
00:00 / 01:04
连播
清屏
智能
倍速
点赞2
00:00 / 00:16
连播
清屏
智能
倍速
点赞15
00:00 / 00:59
连播
清屏
智能
倍速
点赞29
00:00 / 02:11
连播
清屏
智能
倍速
点赞6
00:00 / 04:33
连播
清屏
智能
倍速
点赞326