00:00 / 01:16
连播
清屏
智能
倍速
点赞99
Karpathy给2025年的AI发展做了总结(1) Karpathy2025年LLM回顾来了!注意别看这篇文章很短,但其实这背后有一整条完整的AI进化的故事线,信息量是很大,所以如果你想通过最直观的方式理解AI到底发展到了什么程度,那今天这个视频保证一次性给你深入浅出的讲清楚!请耐心看完。 第一,训练方法变了。 以前是预训练、SFT、RLHF三板斧。今年多了RLVR——让模型在能自动判对错的任务上狂练。这个阶段吃掉了大量原本要投入预训练的算力,也带来了一个新的能力调节旋钮:让模型在回答问题时"想"得更久。 第二,我们对LLM智能的理解变了。 以前大家习惯用"进化"、"成长"这些词来描述AI,好像在养一只越来越聪明的动物。但实际上LLM的智能是"参差不齐"的——某些领域像天才,某些领域像傻子。因为它的优化压力跟动物完全不一样,所以出来的东西也完全不一样。顺带一提,benchmark越来越不可信了,因为它们天然容易被RLVR刷分。 第三,LLM应用层开始成型。 Cursor火了,说明在"底层大模型"和"最终用户"之间确实有一个有价值的中间层。这个层负责上下文工程、多模型编排、垂直领域UI、自主程度控制这些事。LLM公司培养"通用大学生",应用公司把他们变成"垂直领域专业人士"。 第四,AI开始"住在"你电脑上。 Claude Code的意义在于它跑在本地,用的是你自己的环境、数据、配置。这跟"去一个网站跟AI聊天"是完全不同的交互范式。Anthropic在这件事上比OpenAI更早想明白了。 第五,普通人可以写代码了。 Vibe coding让编程不再是专业人士的专利。同时它也让专业程序员能写更多"本来不会被写出来"的软件——代码变得免费、临时、用完即弃。 第六,LLM需要自己的GUI。 现在跟LLM聊天有点像80年代在电脑上敲命令行。人其实不喜欢读文字,喜欢视觉化的信息。LLM应该用图像、动画、交互式应用来跟人沟通,而不只是吐文本。Google的Nano Banana是这个方向的早期探索。 #ai #K和他的AI同事 #karpathy #ai年度总结 #AIGC
00:00 / 04:58
连播
清屏
智能
倍速
点赞14
Karpathy断言:应用商店模式将过时,以后APP几秒直出 Karpathy:应用商店模式已过时,未来App由大模型即时生成 知名AI专家Andrej Karpathy基于亲身实践提出,传统应用商店模式正逐渐被淘汰,未来高度定制化的软件将由大模型实时生成。 Karpathy以个人健身计划为例,为在8周内将静息心率从50降至45,他需要追踪特定时长的有氧运动数据。借助Claude模型,仅用一小时便生成了一个专属可视化面板,直接逆向破解了Woodway跑步机的云端API,完成数据提取、处理及前端页面开发。尽管过程中需手动修复单位混淆等小问题,但整体效率远超传统开发模式。 基于此,他提出两大核心观点: 无需专属应用商店:此类定制化需求仅需几百行代码,大模型可秒级生成。用户不再需要搜索、下载特定应用,智能体可随时按需生成“用完即走”的临时应用。 产业需转向AI原生服务:设备(如跑步机)应直接提供AI可调用的API,而非仅供人类操作的界面。当前大多数服务仍依赖传统网页或文档,迫使人类执行本应由AI代理的机械操作,效率低下。 Karpathy对技术落地速度表示失望,但坚信未来只需一分钟即可生成定制化工具。实现这一愿景需AI深度理解用户背景,自动整合数据与技能库,全面托管个性化应用。 总结:应用商店的离散应用集合模式即将过时,未来属于由大模型调度AI原生传感器与执行器、实时生成高度定制化应用的无缝服务网络。
00:00 / 06:25
连播
清屏
智能
倍速
点赞3
必看:AI大神Karpathy 2025AI行业总结(2) Karpathy2025年LLM回顾来了!注意别看这篇文章很短,但其实这背后有一整条完整的AI进化的故事线,信息量是很大,所以如果你想通过最直观的方式理解AI到底发展到了什么程度,那今天这个视频保证一次性给你深入浅出的讲清楚!请耐心看完。 第一,训练方法变了。 以前是预训练、SFT、RLHF三板斧。今年多了RLVR——让模型在能自动判对错的任务上狂练。这个阶段吃掉了大量原本要投入预训练的算力,也带来了一个新的能力调节旋钮:让模型在回答问题时"想"得更久。 第二,我们对LLM智能的理解变了。 以前大家习惯用"进化"、"成长"这些词来描述AI,好像在养一只越来越聪明的动物。但实际上LLM的智能是"参差不齐"的——某些领域像天才,某些领域像傻子。因为它的优化压力跟动物完全不一样,所以出来的东西也完全不一样。顺带一提,benchmark越来越不可信了,因为它们天然容易被RLVR刷分。 第三,LLM应用层开始成型。 Cursor火了,说明在"底层大模型"和"最终用户"之间确实有一个有价值的中间层。这个层负责上下文工程、多模型编排、垂直领域UI、自主程度控制这些事。LLM公司培养"通用大学生",应用公司把他们变成"垂直领域专业人士"。 第四,AI开始"住在"你电脑上。 Claude Code的意义在于它跑在本地,用的是你自己的环境、数据、配置。这跟"去一个网站跟AI聊天"是完全不同的交互范式。Anthropic在这件事上比OpenAI更早想明白了。 第五,普通人可以写代码了。 Vibe coding让编程不再是专业人士的专利。同时它也让专业程序员能写更多"本来不会被写出来"的软件——代码变得免费、临时、用完即弃。 第六,LLM需要自己的GUI。 现在跟LLM聊天有点像80年代在电脑上敲命令行。人其实不喜欢读文字,喜欢视觉化的信息。LLM应该用图像、动画、交互式应用来跟人沟通,而不只是吐文本。Google的Nano Banana是这个方向的早期探索。#K和他的AI同事#AI人工智能#ai#大模型#karpathy
00:00 / 03:18
连播
清屏
智能
倍速
点赞24
什么是Vibe Coding?它不是纯粹瞎聊,希望能给你启示 最近很多朋友问我,零基础想做个小工具是不是非得学半年代码?其实,OpenAI创始人之一Karpathy提出的Vibe Coding正在改变规则。 简单来说,它不是让你和AI“瞎聊”,而是通过自然语言传递你的意图(Intent)或感觉(Taste),让AI负责实现具体的逻辑。这期视频我不聊虚的,只分享我在实战中总结的几个“避坑”硬核点: • 先写文档,再写代码:高手玩的是“结构化闲聊”。我会教你如何引导AI先出具PRD(产品需求文档),明确功能边界,防止AI把代码写成一碰就塌的“纸牌屋”。 • 掌握核心口诀:“友好的猫经常跳舞”:这代表了Vibe Coding的五大底层能力——Thinking(深度思考)、Frameworks(框架意识)、Checkpoints(版本检查点)、Debugging(调试)和Context(上下文信息)。 • Git是你的“后悔药”:万一AI跑偏了,学会利用Git版本控制一键回退,不被烂代码绑架。 • 从MVP(最小可用产品)开始:不要指望一步到位,先做出核心功能并不断迭代,这才是正确的编程心态。 编程的本质正在从“手速”转向你的品味和想法。如果你也想把脑海中的点子在周末就变成现实,这期视频分享的方法论一定会对你有帮助 #VibeCoding #氛围编程 #AI编程 #人工智能 #编程范式革命
00:00 / 10:36
连播
清屏
智能
倍速
点赞53
Karpathy最新访谈(P1):LLM认知缺陷全解析 #Andrej Karpathy #LLM #AGI 本视频为 Andrej Karpathy (特斯拉前AI总监, OpenAI创始成员) 在 Dwarkesh Patel 播客上的最新访谈(2025年10月)的第一部分内容。 【本期主题:LLM的认知缺陷】 Karpathy 详细分析了为什么他认为AGI仍需十年,以及当前大语言模型(LLM)存在的根本性“认知缺陷”。 本期(P1)核心看点: 1. **“特工十年”而非“特工之年”**:Karpathy 认为业界对“AI Agent”的预测过于乐观,要实现真正有能力的Agent,我们还有十年(Decade)的工作要做 [00:01:02]。 2. **“幽灵”而非“动物”**:他提出一个深刻比喻,我们现在不是在创造“动物”(有完整认知能力的生物体),而是在召唤“幽灵”—— 一种模仿人类的、飘渺的数字实体 [00:00:16]。 3. **核心缺陷:工作记忆 vs 模糊回忆**:Karpathy 剖析了LLM的记忆机制。模型的权重(Weights)只是对训练数据的“模糊回忆” [00:18:51];而模型的上下文窗口(Context)才像是“工作记忆” [00:19:05]。 4. **缺失的“蒸馏”能力**:LLM 最大的缺陷之一,是它“缺失”了人类那样将“工作记忆”中的信息提炼、“蒸馏”并固化到“长期记忆”(即权重)中的能力 [00:24:20]。 5. **为何LLM不是好“实习生”**:正因为上述缺陷,Karpathy 直言你无法雇佣LLM当实习生,因为它充满了我们都能直观感受到的“认知缺陷” [00:21:54],它还“缺失了某些大脑部件” [00:21:59]。 本系列将持续更新 Karpathy 这场长达2.5小时的深度访谈,下一期(P2)我们将探讨“RL(强化学习)为何如此糟糕”。 如果觉得内容有价值,请一定“一键三连”,这是我们更新的最大动力! 视频来源:Dwarkesh Patel @ YouTube 原视频标题:Andrej Karpathy — “We’re summoning ghosts, not building animals” 原视频链接:https://www.youtube.com/watch?v=lXUZvyajciY 🙏 感谢您的观看 【智译工
00:00 / 30:33
连播
清屏
智能
倍速
点赞293
我们正处在软件发展的第三次大变革中 在这场题为《Software Is Changing (Again)》的演讲中,Andrej Karpathy用一种极具冲击力的视角,重新定义了“软件”本身。 他开门见山地指出:我们正处在软件发展的第三次大变革中。 第一次,是传统编程——工程师一行行写代码(Software 1.0); 第二次,是机器学习——人类不再写规则,而是用数据训练模型(Software 2.0); 而现在,第三次变革已经到来:人类用自然语言直接“编程”AI(Software 3.0)。 这听起来像科幻,但实际上已经发生。你写下一个需求,AI就能生成应用、网站、甚至完整系统。Karpathy把这种方式称为“vibe coding”——你不再精确控制每一行代码,而是表达意图,让模型去实现。这一刻,编程不再是工程技能,而更像是一种“表达能力”。 但真正颠覆性的,不只是编程方式,而是计算机本身正在改变形态。 Karpathy提出一个极具洞察的比喻: 👉 大语言模型(LLM)其实是一种“新型计算机”。 它们不像传统CPU那样确定、可预测,而更像一个“概率性的智能体”。你给它输入提示(prompt),它返回结果——就像在调用一个带有“人类思维风格”的操作系统。 甚至可以这样理解: Prompt = 程序 上下文窗口 = 内存 模型 = CPU 但这个“CPU”有个致命特点:它会犯错,而且是以一种“很像人”的方式犯错。 Karpathy形容它像“一个聪明但不完全可靠的实习生”——有时惊艳,有时离谱。 这也带来了一个关键设计问题:我们该如何构建基于不确定性的系统? 他的答案不是完全自动化,而是提出一个极其重要的理念: 👉 “部分自动化(Partial Autonomy)” 未来的软件,不是“AI全权负责”,也不是“人类完全控制”,而是一个动态协作系统。就像自动驾驶一样,AI可以处理大部分任务,但人类必须随时可以接管。 这直接引出了另一个更深层的变化: 👉 软件的“用户”正在发生转变。 过去,软件是为人设计的; 未来,越来越多的软件,是为AI设计的。 AI代理(Agents)将浏览网页、调用API、执行任务。 这意味着整个互联网的设计逻辑都可能被重写: 页面不只是给人看的,也要给AI读 API不只是接口,而是“行动能力” 文档不只是说明,而是“训练数据”
00:00 / 00:48
连播
清屏
智能
倍速
点赞6
00:00 / 07:22
连播
清屏
智能
倍速
点赞547