粉丝17.6万获赞47.2万

啊,欢迎来到今天的深度解析,今天我们要为你带来一份那个非常硬核而且充满反叛精神的开源资料。 没错,是一个在 g hub 上狂揽了两万五千颗星的项目。对,而且它的名字非常直接,甚至有点粗暴,就叫 get shit done, 简称 g s d。 这个名字确实啊,毫不拖泥带水。好吧,让我们来拆解一下。 今天的任务就是解析这款由独立开发者 taches 为 cloud code 的 这种 ai 编程助手打造的系统,主要是看看它是如何解决 ai 编程里最致命的痛点,还能赢得大厂工程师信任的。对,你平时如果也写代码,可能体验过那种叫 web coding 的 玩法, 就是一开始你只要凭直觉描述需求, ai 写出来的第一版简直惊艳没错,但只要项目越变越大, 代码最后就变成了一堆不连贯的垃圾,完全没法用。 taishis 把这个现象精转地称为上下文腐败。上下文腐败这个词真的很贴切。作为一个独立开发者, taishis 非常痛恨那种过度复杂的敏捷开发流程。 资料里原话是怎么说的来的?嗯,他说那是企业角色扮演的废话。对,企业角色扮演的废话, g s d 的 核心价值就在于它把复杂性留给了系统本身,而不是强加在你的工作流上。也就是说,你不需要搞什么冲刺会议,直接专注创造就行了。而且看它的运行逻辑,它不仅仅是一个简单的提示词工具,它是怎么定义的 一个上下文工程层,他会不断向你提问来提取需求,帮你把 ai 的 大局视野规划好。但这就引住了一个问题最有趣的地方来了,如果他掌握了这么庞大的大局,信息直接全塞给 ai, 难道不会力测引法刚才说的上下文腐败吗? 这里最令人着迷的是他的技术精髓。他并没有把所有东西打包丢给 ai, 而是用了一个轻量级的编排器。编排器自己不写,代码绝对不写,他只负责发号施令, 生成多个并行的子智能体去干活。但多个智能体并行代码不会互相卡位打架吗?这就是它聪明的机制了,叫做波浪式子行波浪。对互不干扰的独立任务,在同一个波浪里并行处理, 如果有前后依赖关系,就会被分配到后续的波浪里,按顺序执行。懂了!如果第一波的基础任务在错误的代码上继续跑, 更关键的是,每一个子计划都在一个全新的二十万偷克上下文中执行。二十万偷克,这对听众来说怎么理解最直观?就相当于系统给每个子任务分配了一个干干净净的专属工作台。 ai 在 这里只看得到当前任务需要的核心要求,永远不会被之前的杂乱代码干扰,等于每次都清空了杂念去写当前模块,彻底消除了上下文腐败。 而且,每一个微小任务完成后,系统会自动进行原子级的 get 提交。哇,连 get 提交都自动化了,万一哪里出错,也能极其精准地一键回滚。不仅如此,它还会自动生成带有结构化 xml 格式的验证计划, 机器可以直接读取并执行这些测试清单,来验证代码到底能不能跑通,而不是光听 ai 的 文字忽悠。所以这意味着什么? 对于你,也就是我们的听众来说,这意味着如果你需要快速构建可靠的软件, g s d 能让你一个人就拥有一个五十人中型开发团队的产出质量,而且不需要假装自己是个大企业。如果我们把这和更大的途径联系起来看, g s d 其实向我们证明了一个直观重要的事实,当前的 ai 系统并不是能力不足。没错,只要给予正确的精心设计的上下文环境,它们已经极其可靠了。这确实让人忍不住去想一个终极问题, 当 ai 已经可以通过多指令替自我分派任务管理上下文,甚至自己写严格的 xml 测试清单去验证代码时,未来人类程序员的核心竞争力 究竟还是不是主行写代码?这是一个非常深刻的问题。或者说,我们未来的终极角色是否仅仅是作为 ai 系统架构的提问者而存在?留给你去思考吧,我们下期深度解析,再见!

如果你还在把 cloud code 当成一个只会在终端里聊天的窗口,那你可能只发挥了它百分之十的功力。作为一款真正的 a 阵开发工具,它拥有强大的文件操作、终端控制和外部工具集成能力。 下面是我经过深度使用总结出的全套快捷键命令、配置项及工作流。在使用 cloud code 的 时,不要傻傻地全部手打, 熟练使用快捷键能让你的操作速度翻倍。 shift 加 tab 能让你在普通对话自动同意修改和计划模式之间快速切换。当你要写一段很长的提示词时,在终端里修改非常痛苦。 按下 ctrl 加 g, 它会自动调用你的默认编辑器,写完保存,关闭,自动传回终端。遇到了 u i 错位报错、截图甚至带有手绘箭头的草图,直接通过 control 加 v 粘贴进终端, cloud 完全看得懂。想让他看某个特定文件,不需要等他自己找,直接输入 at 符号,他就会弹出所有的文件内容,选中就能读取。在对话框输入斜杠即可触发,这是管理 ai 状态的核心。 clear 是 最常用的命令,没有之一。 每次切换任务或修完一个 bug 后,一定要清空上下文。 compact 记忆压缩,当进度调爆红,但你又不想清理对话时,使用此命令,它会总结前面的对话并释放空间。 rewind 列出当前绘画的所有操作快照 ai 改版的代码,你可以一键回滚到指定节点。 model, 根据任务难度随时切换引擎 cost, 实时查看当前配置白名单面板。 在项目根目录创建一个 cloud md, 这是最高优先级的系统提示词。不要长篇大论,重点写项目的技术栈是什么,每个目录是干嘛的?代码规范是什么?怎么跑测试。我已经将完整的内容整理成了飞书文档评论区 c c。


二零二五年, agint 成为了 ai 的 主流形态,模型开始会规划、拆解任务,自己调用工具。但当问题变得复杂时,再强的 agint 也只能同时思考有限的事情。本质上它仍然是一个单体智能, 但复杂问题从来不是靠一个大脑就能解决的。就像人类文明的跃迁,靠的不只是更聪明的人,还需要分工和写作。 ai 已经足够聪明,所以 ai 的 下一步进化方向很可能不再是更强的单体 agent, 而是让多个 agent 协同工作,形成真正的 agent 的 集群。我们已经看到各个大模型厂商在新一代大模型中探索落地这种多 agent 的 写作模式。比如 cloud code 的 agent teams, 它允许多个 cloud agent 像一个团队一样, 在一个项目上并行工作,每个 agent 负责自己的任务部分,并且能直接互相沟通和协调,压缩传统串行工作所需时间。 国内的 kimi 大 模型甚至更早就开始探索多 agent 的 方案,在大模型训练的时候就引入了并行设计能力,在这个基础上推出了 agent swarm 功能 open ai, 在 gpt 五点三 codex 相关的文章里也暗示了下一步 agent 迭代将朝着多 agent 的 交互上做努力。那么问题就来了, agent teams 和 agent swarm 的 区别是什么?和 sub agents 有 什么区别?我们先从单 agent 的 情况说起。 从单 agent 到 agent teams, 我 们知道 cloud code 最基础的功能就是在一个窗口上让一个 cloud agent 替你干活,如果有多个任务,就在一个窗口里依次串行执行,但这样所有对话都挤在一个聊天框里,有上下文过长的问题, 所以我们一般会自己拆分任务,手动开多个窗口并行执行。但这样要是各个窗口改动出现冲突,就需要自己手动和代码。 于是 cloud code 又引入了 sub agents 功能,通过一个主 agent 来控制多个子 agent 的 工作,效果上相当于让主 agent 替你开多个子窗口,独立进行执行,最后由它来自动汇总结果。 但子 agent 之间没法直接交流,所以更适合改动相对独立、偶合较少的任务。于是 cloud code 又又引入了 agent teams。 在 agent teams 里,依然有一个主 agent 的 角色,他将任务通过共享任务清单的形式把任务给到各个子 agent, 子 agent 并行申领并执行任务,并且可以互相通信,这样多 agent 间协作可以更紧密。 agent teams 实测大概原理懂了,我们用一个实际例子看一下 agent teams 的 工作流程。我们先执行 cloud update, 确保 cloud code 是 最新版本。然后在 cloud settings 点 json 文件里将 team 相关的环境变量打开。在 cloud code 输入框里提到 agent team 关键词就可以触发相关功能。 比如使用 agent team 创建多个 agent, 从不同角度讨论二零二六年还适不适合在上海买房, cloud code 就 会创建多个 agent, 并行的从不同角度去做头脑风暴。最后给出一份讨论结果看起来挺好,但我认为短期内它依然只能是个实验性功能,因为它有两个比较严重的问题, 首先是 token 量爆炸。 sub agent 方案里,子 agent 会把执行上下文总结后返回给主 agent, 所以 上下文长度更可控。而在 agent 的 teams 里,则会让所有子 agent 的 共享上下文,每个 agent 的 每一轮提示词都要包含所有 agent 的 历史消息,任务越往后,执行。 agent 的 的历史消 息任务越往后,执行。 agent 的 成员通常在任务开始时就根据角色定下来了,很难在任务中途根据工作量动态扩容。 比如,我一直想做一个关于硅基文明简史的话题,讲述从二进制到计算机,再到 transformer 等一系列推动 ai 发展的一百个事件。 它分成几个阶段任务。首先是需要一位研究员收集人类历史出现过哪些关键事件,审核员筛选事件 图片生成源,生成一百张图片,图片审核员教演图片风格是否一致,再让 ui 设计师生成网页风格。最后才是给程序员开发网页。 这个例子中, agent team 只会创建六个 agent, 尤其是在图片生成阶段,可能还是由那一个图片生成员慢慢画一百张图,他不会因为发现任务量大,就临时裂变出多个 agent 同时开工。那有方案可以解决上面提到的两个问题吗?有。让我没想到的是,国内的 kimi agent swarm 把问题给解决了。 kimi agent swarm 功能实测,我们先来看一下执行效果,再了解下 kimi agent swarm 和 agent teams 的 区别。先将上面提到的归机文明简史任务描述粘贴到 kimi 下拉框,选择 agent swarm 执行, kimi 会启动一个叫 kimi's computer 的 虚拟机, kimi k 二点五会作为主 agent, 像项目经理一样,将复杂任务拆分成多个步骤的子任务,并现场决策生成六个子 agent, 每个子 agent 只负责这一个阶段子任务的上下文,这样 agent 的 上下文更短,注意力更聚焦,可以大大降低幻觉和出错概率。 点击每个 agent 都能看到它对应的照片和角色描述,就像一个电子员工一样。其中,研究员会在互联网上发起多轮搜索,从国内知名技术资讯站点获得几千条搜索结果,再从里面筛选出一百三十八个候选事件,生成一个 md 格式的结果文档交付给审核员。点击底部的 all files, 可以找到这个结果文件。点击查看文件内容,可以看到研究员已经将收集的内容按年代进行排序,并给出事件的历史意义。审核员淘汰三十八个,留下一百个真正改变世界的技术。以 md 文档格式给到图片生成员, 图片生成员拿到审核员筛选过的文件内容后, kimi k 二点五发现多张图片。生成一百张图片的任务时间会很长,于是将子任务进一步拆分成五个小批次,临时创建五个新的子 agent 并行去执行生图任务。 比起单个 agent 挨个串行执行任务改成并行之后,任务的实际运行时间会明显变短。 点击列表里的任务,可以看到每个任务的具体执行情况。注意看,这里面会有一些失败和报错, a 警的内部会不断调整策略,重试并最终完成子任务。 这要是在传统多个单体的 a 警的架构中,一个 a 警的内部报错,就算内部有重试,也会大大增加执行耗时。而 a 警的 swarm 架构中,局部任务的失败并不会严重影响大局,这样系统稳定性更高。之后经过图片审核员、 ui 设计师和程序员的写作完成了网页可以看到,网页按时间线给出了每个年代影响 ai 的 重要事件,且美术风格一致。 kimi agent swarm 通过多个 agent 的 互相协助,只花了几分钟时间就完成了我可能需要花一天甚至几天才能完成的任务。 agent teams 和 kimi agent swarm 的 区别最后总结下 kimi agent swarm 和 agent teams 的 差异。首先是架构逻辑不同, kimi agent swarm 逻辑上更接近 sub agents 的 增强版。 子 agent 之间上下文物理隔离,只负责局部的子,任务生产的中间结果会被总结后再返回给主 agent, 这样既保证了任务聚焦,又把 token 消耗压到了最低。 其次,支持动态并行。 kimi k 二点五在训练时引入了并行代理,强化学习技术,也就是 p a r l, 这让他具备了动态编排的能力。他像一个聪明的项目经理,能根据工作量现场摇人,比如身徒任务多,他会动态创建几十个 a g 的 并行跑,效率能比传统串行提升四倍以上。 最后是集成度不同, cloud code 更像是一个程序员的专业工具。想用好 a g 的 teams, 你 需要自己配环境,安装各种 skills。 而 kimi agent swarm 自带 kimi's computer 虚拟机,申图、搜索、写代码、运行网页,全是开箱即用,对普通用户来说更友好。从单体智能到群体协助, ai 正在复刻人类文明的跃迁路径,不是更聪明的大脑,而是更聪明的协助。 当无数 a 警特学会像团队一样并肩作战、分工配合, ai 就 不再是工具,而是队友,而这可能才是通往通用人工智能的真正基点。现在大家通了吗? 好了,如果你觉得这期视频对你有帮助,记得转发给你那不成器的兄弟,文字版的笔记见评论区,这里是小白的 bug, 我 们聚焦一切可能影响人类历史进程的技术,如果你感兴趣,记得关注我们,下期见!嘟嘟嘟嘟嘟。

为什么别人可以用 cloud code 这样子的 code agent 开发出企业级的代码? 比如 antropic 说接下来三到六个月内,会有百分之九十以上的那个代码由 ai 来写,但是对于我们自己却只能开发出类似于四三九九一样的非常基本款的小游戏,比如说贪吃蛇。 code agent 有 很多,尤其是以 cloud code 为首的终端 agent, 那 么也是最近非常风靡的一种选择,包括 code x 千万 code 的 ctrl c l i f o c l i。 但是哪怕大家在用 cloud code 这样子的顶级产品的时候,开发出来的效果依然有所不同,我觉得这里唯一的区别就是大家使用 code agent 的 方法有所不同。这里我从啦到吭给大家排序一下, 接下来我也会带大家用比较吭的方式使用 coi agent 来带大家开发两个实际的项目,也是我最近开发的两个项目, 大家可以评判一下这两个项目做的怎么样。接下来就分别讲一下从拉到憨的三种不同的方法,不知道大家用的是哪一种?首先是第一种拉中拉,就比如说我现在要做一个项目,你你跟他讲一句话说,嘿,帮我做一个 video chapter 吧。 那么然后让 ai 去生成,然后再生成出一坨史商代码,这样一坨代码基本上属于狗都不用。第二种呢,它会把自己的需求写得非常的详细,比如说我这里,呃,我想开发一个工具,是 能够将 s r t 的 字幕文件转化为视频的进度条,然后核心功能有一二三四五,然后让 ai 去生成代码,然后我们再循环去修改我们的需求,然后最终生成一个勉强可用的一个勉强可用的代码,这就属于 介于拉和夯之间的 npc 的 一种使用方法,这也是我相信大多数人的呃使用方法。今天呢,我们其实核心就是想要介绍一下呃 spike 驱动。 spike 驱动呢,也是我个人认为最夯的一种使 使用 code agent 的 方式,那么它这里的核心区别是我们要先把自己的需求完全说清楚,然后再让模型去做开发。我们要一次性把我们的需求 和设计文档以及任务文档都生成出来,然后再让模型去做生成,这样才能产生出企业级的代码,否则我们只能采用最后一种拉中拉的方法去只能生产这种贪吃蛇小游戏。最后来暂停看一下 大家用的是哪一种方法,然后呢,我就会带大家用 i f o c l i 这样一个 c l i 终端的 agent 来演示一下 spike 驱动到底是怎么做的, 来做一个我自己的一个项目。这里的话,呃用这个 i f o c l i 的 核心原因就是因为我觉得呃它不需要翻墙,然后它是免费的,基本上可以做到 国内的 t 梯队的模型是免费使用的,比如说 kimi k two k two thinking、 千问三 ko 的 glm 四等一系列的模型,然后它的呃 登录什么的,下载什么的都很方便,然后也可以非常方便的集成到我们的开发环境里面,所以这里我会用它来演示 spark 驱动开发一个自己的小产品。大家可以看一下我最终开发出来的,这是我 上个月开发的一个叫做 auto chapter 吧,就是这个网页里面的就是一键生成视频章节,然后它核心的能力就是你贴上你的字母文件,然后它给你生成一个这样子的一个 呃小视频,然后你把它拖到那个剪映里面,就可以直接在视频的上方或者说下方有一个进度条一样的东西。接下来就带大家讲一下 spike 驱动具体是怎么做的。这里我们用一个开源项目叫做, 大家猜一下叫什么叫做 open spike, 就是 用这一个开源项目来给大家讲解一下什么叫 spike 驱动,这里 呃可以看到它的那个是怎么样运作的。其实核心就是指你第一步先把自己的开发需求告诉 ai, 然后再循环地让 ai 去生成一些 任务,按照特殊的规范去生成一些任务,然后直到他把这一个需求描述清楚了,然后再让 ai 去开发,让大家更方便的理解。我可以 呃用比较通俗易懂的语言来给大家解释。首先就是你的输入,先把我们要做什么东西告诉 ai, 然后 ai 去整理整理你的需求,然后我们去做澄清,确认相关那些东西,然后我们一般来说会生成三个文件, 呃,这个的话,文件的话,呃,其实不同的工具它的命名都不一样,但是为了相对来说比较通用的话,我自己个人的话就采用了类似于 requirements, 就是 你的需求,然后以及设计文档,然后详细任务,类似于这样一种方式来做描述,然后通过这种循环 去沟通的方式去生成最终三个文件,然后再让 ai 去做执行。因此它整体的逻辑是,呃先做任务的输入,然后澄清需求,澄清需求得到了三个或者说四个详细的文件,然后再让 ai 去做生做任务的一个执行, 然后我们搜索一下 iphone c i, 然后进入到这个 gitlab 的 链接里面,去看一下它是怎么样安装的。这里的话它可以一键安装,针对于啊 mac 用户可以直接一键安装,然后我是一个 mac 用户,然后直接复制到这里,但是我已经我已经安装过了 啊,安装完了之后他就直接登录了,就是长这个样子。刚刚跟大家讲过了,其实我们最终的目的就是想要生成三个 需求文件,来告诉 ai 我 们的详细的需求是什么样子的,然后以及我们的架构选型要怎么样做,然后以及把任务拆解的更开,能够让 ai 更好的执行。这里其实说白了就是要给 ai 更好的上下文,然后能够让帮助他执行的更好。 所以这里我们用那个 i flow c i 来演示一下我具体是怎么样跟 ai 做对话的,然后生成出来的结果具体是长什么样子的,这里我们用左右两边的屏幕来演示看一下。你看比如说我登录了,刚刚登录了之后我就跟 ai 聊天说, 嗯,叫他在做写代码之前,先把任务需求写到这个 require requirements 里面,然后我就跟他讲我的那个需求是什么,比如说,呃,我先告诉他我的任务是什么,就是我想要为视频生成一个 chapter 吧, 然后这里的话主要就是呃输入功能,对应我们这里的第一第一个第一个输入功能,输入功能部分,然后 ai 就 会去 呃整理这个需求,然后找我们澄清,你看他就会找我们澄清说,哎,你想要生成什么东西?比如说我这个 java 到底想要做什么东西啊?我这里 然后输入输出具体长什么样,然后章节信息要什么东西,然后最终的目标是什么?然后我就非常清晰地告诉他,我希望做一个视频进度条,能够 直接导入到 capcut 等剪辑软件里面,然后最终发布到那个视频里面,然后我跟他聊很多,聊很多,然后聊很多之后,然后他就最终呃 最终把这些内容都写到了这个 requirements 里面。我们来看一下他最终写出来的那个内容是不是符合我们的要求。 你看他的那个输入输入规范写的非常的清晰,这样模型在开发代码的时候就不会跑偏,他就知道具体要做什么,然后有哪些可配置的一些参数, 然后以及一些制作流程,然后技术站什么的其实都写到了。当他写完了之后,你其实还可以对他去做调整的。比如说对于我这里,他写完了之后,他问我还有什么需要改进的地方吗?那我们肯定得要把事情说清楚。那么这里可以 让他基于呃 spike 原则去告诉他我开发的这个软件他的面向用户是什么。比如说对于我这里的, 我其实面向的用户是 b 站知识区的 up 主,主要是做技术课程,然后还有说 youtube 的 教育创作者,还有企业培训人员的一些视频制作,然后他就会再去做思考,然后把 把最终的这个用户故事相关的一些,比如说,嗯,他要一键去生成进度条,然后可以, 呃,验收标准是什么?然后他的目标是什么?做完刚刚那一些事情,他不是生成了一个 requirements 文件吗?对吧?然后我们接下来要做的是什么?看到这里来说,我就需要有一个详细的设计 design 的 文档,然后我这里是啊,是这样跟他说的,哎,我们先把这个给关掉, 我先把这个给关掉,接下来我要让它根据这个 require 的 内容帮我生成一个 design 的 文档,然后这里需要包含核心目标设计架构图,这个设计架构图是非常重要的, 然后模块划分,然后组建结构也设计清楚,列出相关的依赖,这样子就是你你解释的越具体,它生成的就会越好。我们这里来看一下它最终生成的那个结果,你可以看到 他的那个设计文档其实比我们自己写的还要相对来说更清晰。然后他还是按模块划分的,这样子对于他后续的开发来说,就返工的情况就会变得很少。可以看一下他的设计,他设计真的非常的好,我觉得比大多数 算法工程师,比如说以我为例的算法工程师,其实他都是做的要更好的。然后他还把你的包管理依赖工具相关的一些, 呃,怎么使用啊?巴拉巴拉的一系列的东西都写的很清楚,然后再去做开发,这样会事半功倍。把这一个 d 站文档输出出来了之后,我们接下来要做的是什么?我们接下来就是让他不要修改任何的代码,还是说我们要去生成这样一个 task 任务,去把任务支解, 然后它也是同样的去读取了你的 requirements 和设计文档,之后去把任务分解,生成出最终的那个 task 文件,然后 task 文件它分了八个阶段,三十二个任务。 这样子的话,每一次我们就可以让 ai 去只做一个任务,就每一次开发只开发一小个步骤。 然后我们来看一下我们最终生成出来的那个结果,结果就是三个文件,然后最终我们来看一下它生成的那个代码,它生成的代码也是非常规范化的,就是先去做那个 chapter 的 提取,然后再去做 呃视频的一个生成器,这个是我最后在跟 ai 对 话的时候,让它去做了一些性能相关的优化,然后还有你的字幕的一个解析器,其实主要就这这三大块,然后还有 c l i 的 一个工具,我还让它帮我生成了一个,呃,这个叫 landing page, 然后大家也可以直接去搜一下,叫做 auto chapter 吧,然后我们可以可以免费试用,这个我已经也已经部署了,我们可以看一下,就是在 github 里面。呃,目前为止包括我自己在内一共有五个人点了 star。 呃,这个是上个月生成的,然后这些所有的内容都是用 ai 生成的,然后主要的方法就是采用了 f 六。呃, c i 用 spike 驱动的方式去做代码的生成,然后可以看到 这样一个 auto chapter bar 的 一个能力,大家可以去呃上传自己的一个字幕文件,然后去做那个 chapter bar 的 生成,最终生成一个类似于这样子的小视频,这个大家自己去体验就好了。然后除了这个, 就是昨天我又基于 spark 驱动的原则去开发了一款工具,就是做英语学习的。就比如说我经常会问 ai 说,哎,这个东西用英语怎么说,这个,用这个东西用英语怎么说?然后, 呃,但是每次说完之后我就不记得了,所以我想开发一个自己的小工具,能够把这些东西给记录下来,比如说啊,很多话,很多话,我其实,呃, 说完之后,我希望能把它记录下来,然后我就可以去通过类似于 anki 的 一种学习方式,卡片学习方式 glad to help you 去学习我以前遇到的一些句子和句式,这些都是用它开发的,然后我可以 glad to help you, glad to help you。 然后假设已经 记清楚了, thanks a million for your help。 然后不记得,我就重重新学习, this thing is very expensive。 翻译,就这些东西 都非常的简单,但是你要是真的让 ai 一 口气生成这样子的一个 内容的话,那它其实是做不到的。但是如果说你用 spike 驱动的原则,它其实就可以完成这样子的一个任务,而且我这些数据其实都是有数据库的,就以这个为例,你看其实 都是有数据库的,这里我有几个表,我有几个表,这都是我的一些对话的历史,可以看到吧,就是他都是有数据库的,因此最终的话是可以使用的。所以说我非常推荐大家用 spike 驱动的方式去开发自己的产品,然后能够真实的用起来,而不是说仅仅停留在 小游戏里面。类似于这样子的一个简单的四三九九小游戏,这样子的话基本上是没有什么意义的,我们要开发的话还是要开发一些比较有意义的产品以上。

今天学习了一下可乐的扣子的原码,就是把他的原码下下来,然后让 ai 读原码,根据他的原码,然后画了一个他的业务流程图啊,长这个样子,感兴趣的同学可以点暂停看一下。 呃,可以看出来就是有点超乎于一些,就是比较简单,比想象的简单太多了。 他总的来说其实就两个部分啊,第一个部分就是用户的内容输入进来之后呢,他会去 做一个上下文的组装,这个上下文里面他包含的内容可能就稍微细一点,然后主要是环境那种,比如甚至有没有自己的仓库这种啊,他都会包进去。然后呢我也给大魔仙进行第一次处理,第一次处理之后呢就开始进入一个循环,然后这个循环也很简单啊,就是魔性决策, 然后工具执行,执行结果再为回位的模型,然后再小模型自己去决策。 其实则部分呢也很简单,有也比我想象的简单的多,就是它没有特别复杂的流程啥的东西,它没有写那些东西, 它写的都是相对来说是边界性或者原则性的东西啊,比如安全策略问题,然后还有比如对一些细节,比如对 u r l 的 处理问题,然后还有 比如,哎,就是设计这一原则,比如不能过度设计啊,然后呢就是不要保留荣誉代码,不要为了兼容性去写那些荣誉代码,就是类似的这种东西, 就他没有指导下的东西,就是说你必须得先怎么样怎么样,然后再怎么样啊,他没有这这种类似的其实词,他都是边界性质的和原则性质的其实词, 这个就怎么说呢,现在现在就很不解啊,因为你这么简单的一个东西的话,为什么 costco 的 就比其他的好用那么多呢?对吧?不知道,这个是真的不知道, 然后根据,然后又跟叉的 j p c 聊了一下,那叉的 j p c 给的结论类似的就是说 a 阵它的核心,它不在于循环啊,也不在于那个技能啊,都不在,都不是关键,这些都不是关键。什么是关键呢?就是那个 世界模型啊,当然这个词用词可能比较大。那啥意思呢?简单来说就是比如我们用 a 键他,那你肯定有任务进来,对吧?那你的任务相关的各种信息,是不是又组成了一个任务的相关模型? 然后呢,那你这个人啊,你的用户,那你的各种行为习惯啥的,是不是就能构建出来一个你的一个用户的模型? 然后呢,你这个 agent 他 能在一个什么像环境下运行,对吧?他能调用哪些工具等等,而且这些东西他可能组成了一个环境模型,类似的这一大堆模型啊,合一块啊,你可以把它叫世界模型啊,但是这个词我觉得太大了。 总之来说呢,就是把这个东西构建出来之后呢,然后呢,你在每一步循环的时候利用这些信息,然后再去构建记日词,然后我也给打磨清啊,就是不需要特别复杂的循环,但是呢,上下文可能会比较多, 叉的 j b c 表示呢,这也是未来,一个也不应该不是未来,就是现在的一个发展方向吧?就是不是多次循环了啊,不追求多次循环,而是要追求尽可能少的循环,然后每一次循环呢,都尽可能去喂更多的双亚文啊。大概就这么一个思路。 但是根据我之前给自己定下来的原则呢,就是独立实践啊,独立思考,虽然他们都这么干的。嗯,到底怎么样,我还是自己先实践吧。 接下来呢,就先按照 cloud code 的 这种模式。我觉得先试一试吧,把它里面跟编程相关的其实对吧?全改了,全改了,然后去模仿它的玄幻组装逻辑, 然后再尝试一下吧,希望有好运。

antropic 最近一直在高频更新 cloud code 的 各项功能,这让他成为了目前市面上最强大的 ai 编程助手之一。老实说,他很快就成了我最常用的 ai 助手。 如果你还不了解的话, cloudco 是 anselpic 推出的终端 ai 编程助手,让你能直接在终端完成应用的构建、调试和发布。它的定位是能与你并肩工作的自主开发者,助你大幅提升从构思到软件落地的效率。 而就在本周, anselpic 又发布了几项重磅更新,这从核心层面优化了智能体的能力, 大幅提升了人机写作时的智能化水平。此次升级让 ai 更懂工作流,任务执行也更加稳健可靠。 说实话,这绝对是颠覆性的进步。不仅如此, auto 模式现已正式回归。该模式增加了 opus 和 sonnet 等模型的推理预算,从而赋予模型更充足的思考时间,以便在处理复杂编程任务时提供更高质量的代码产出。 最后压轴登场的是远程控制功能,这是专为抗衡 cloud bot 推出的新功能,现已面向 astropics 所有付费订阅正式上线。该功能支持远程操控,并直接通过手机运行。 cloud code, 让你能随时管理构建项目,即便不在电脑前也能处理各项任务。此次更新的内容远不止于此,话不多说,我们直接深入了解。 首先来看看重大更新,涉及 cloud code 智能体技能部分, cloud code 的 智能创建器迎来了重磅升级,让开发者能更轻松地测试、衡量并不断优化智能体技能。我们可以通过这张图表来看一下, 此次更新内置了评估生成以及精准测试和多智能体测试功能。开发者可以借此验证技能的有效期,确保其仍正常运行,并检测功能回归, 并随着模型的眼镜持续优化技能描述。举个例子,这里有一项 pdf 处理技能已配置给这个 cloud code 的 实力。以往它在处理不可填写表单时表现欠佳, 就像这里,这个表单中有很多缺失的字段。而在使用技能创建器运行评估后,它就能针对失败的部分进行优化, 并发布了修复方案,通过铆定位置来精准提取文本坐标。凭借这次评估,它得以显著地使 ai 编程智能体提升该项技能,从而让 ai 智能体能够不断迭代, 专注于准确填好所有字段。这只是其中一个案例,这也是你能做到的一个典型势例。利用技能创建器提升智能体技能我个人非常喜欢的一点是,它本质上为智能体技能引入了 类软件开发的测试与迭代机制,且无需用户编辑任何代码,而这正是最关键的一点。 但在正式开始之前,想要开始使用技能创建器操作其实非常简单。首先,请确保你的 cloud code 已更新至最新版本。如果你还没有更新,首先再次运行 cloud code 的 安装命令,即可安装最新的软件包。接着前往 cloud code 实力中的插件选项卡, 进入插件界面后确认已安装技能创建器,你可以直接搜索并找到它。你所需要做的是根据你的实力偏好进行安装。我这就演示一下操作。安装完成后,你还需要确保记得重启 cloud code。 现在来看一个简单的演示。我已经创建了几个技能。我可以告诉技能创建器,让它能够深层针对我现有技能的评估测试。 既针对代码审查技能,我之前已在 cloud code 实力中完成设置,然后它会自动运行评估, 随后它将执行大规模精准测试。这是另一个我还没怎么细说的功能,但这也是他们推出的一个重要更新。在这里,你可以进行大规模的评估测试, 并衡量性能指标,如通过率,运行时间以及 token 使用量。现在在你基本上运行了技能创建器提示词来生成评估测试后, 系统将成功加载该技能并自动生成测试内容,配合精准提示词以及观察技能在不同阶段的表现。 无论是修改后还是在新模型发布后。运行评估测试后,它已为 cloud code 创建了三个测试场景。系统可以自动生成测试,以验证我的代码审查技能是否依然有效。这项评估包含一段简单的代码 以及一个审查技能应当捕获的预期问题。当你运行这些测试时,它能自动检查该技能是否准确识别了这些问题和格式,并确保这些技能可以持续引进, 在新模型上表现更加即 cloud 未来将发布。这样你就不必重新创建技能,只需持续优化即可,因为它会自动帮你处理这些繁琐的工作。 这就是智能体技能功能的颠覆之处。接下来的更新是 ultra 模式正式回归,现已支持 oppo 四点六以及 sonata 四点六。你只需要做的就是在 cloud code 界面输入 ultra scene, 随后你就能看到这项新功能已成功起用, 它能分配更多的推理预算,从而在给出答案前进行更深入的思考。在实际应用中,这意味着它处理复杂代码的表现会更出色。它在处理凭借更长的上下文窗口,它在代码调试方面表现极佳, 无论是处理大型代码库,还是执行复杂的多部智能体任务都游刃有余。随着该功能在特定模型版本中上线,它现在能够实现更精准的输出,并在处理大型项目时展现出更高的可靠性。 比如,现在我正让他开发一个基于 react 和 type script 的 现代化全站日历应用,你可以看到他的表现确实更胜一筹,特别是在开启 ultra sync 模式后, 它能构建出所需的全部组建,以确保该应用能正常运行。你也能直观地了解应用的具体运行情况,以及让这款应用出类拔萃的其他诸多组建。接下来, cloud code 的 远程控制功能现已面向 ansorek 的 所有付费用户开放, 让你能够控制并运行你的编程助手,通过手机或其他设备远程操作。这意味着你可以随时启动任务,监控进度并与 cloud code 的 交互,即便你仍不在电脑旁, 让你能更轻松地管理构建任务,以及随时随地管理耗时较长的助手工作流。还有一个细微却惊艳的功能,那就是新推出的语音模式。该功能目前正陆续在 cloud code 的 实力中上线,目前也有约百分之五的用户可以使用该功能,并在未来几周内逐步覆盖所有用户。 获得权限后,在主页上你会看到欢迎使用语音模式的提示。想要使用该功能,你只需简单地在您的 cloud code 里输入 wise 即可,这样就成功使用了。现在,我只需按住空格键直接对着麦克风说话,系统就会自动将其转录。 比如我可以对它说, hi, cloud code 帮我写一个 size 产品的落地页,它立刻就能把我对着麦克风说的话转成文字。 这个功能真的非常实用。 twitter 上的 danielson 对 此做了很好的介绍。我会把它的推特链接放在下方的简介栏里。它主要介绍的是 cloud code 的 一项新内置技能, 也就是 cloud api。 我 个人认为这个能自动识别编程语言的新功能确实非常厉害。它还会自动选择最佳接口,无论是直接 api 工具还是 a j s d k, 并将所需的参考文档直接加载到当前绘画中。 它支持流式传输、批量请求文件 a p i 结构化输出及工具模式,同时也支持 m c p, 并能自动配置模型默认参数,让你无需在凭空猜测。在使用 cloud code 编辑提示提示时, 简而言之,它让你能直接在 cloud 上开发,无需在代码和文档间来回切换,确保在需要相关上下文时,一切信息都触手可及。此外, cloud code 指南中还内置了一个子智能体, 您可以在最新版本中体验到它只需吩咐 cloud 使用即可。直接唤起该智能体。直接内置在 cloud code 中, 它并非你项目中的本地文件。它的作用是解答关于 cloud code c i i 智能体 s d k 及 cloud api 的 疑问。它会调用 log grab reader、 web fetch 和 web search 等工具,但它无法对文件进行编辑或写入。它的唯一职责是提供解答与指导。 这一点我之前还真不知道。另一个不容错过的重点是全新的内置 sendify 命令。它会审查修改后的代码,寻找重复逻辑或可提取模式的附用点。 虽然这些改动非常细微,但绝对能显著优化你的开发流程。这也是我非常欣赏但如此重视这些更新的原因,所以我也极力推荐大家在 twitter 上关注它。 代码质量是另一项你能从 simplify 命令中获得的。它会重点审查修改后的代码,确保质量可靠,包含命名与结构,并分析是否存在影响效率的容易复杂性, 或是容易操作。随后,它实际上会修改你的代码,而不只是给出修复建议。它的用法非常简单,你只需像往常一样修改代码, 然后运行 simplify 命令即可。接着, cloud code 会分析你的代码改动,找出其中可能存在的任何问题。它将自动应用这些修复。在你确认了它发现的任何改动之后, 它甚至能调用 hikou 四点五启动并行代理。虽然我觉得它不算最顶尖的模型,但它能让分析过程变得既快速又高效。当然,你也可以将路由代理换成 opus 之类的模型。 对很多人来说, slack 集成是一个不起眼但非常棒的功能。通过这款新插件,在 cloud code 中让你能够直接连接 slack。 有 了它,你可以搜索消息、发布更新,创建文档。功能远不止于此,它能直接将 slack 的 上下文信息引入 cloud code, 这样 ai 就 能完全掌握你的工作进展, 这实际上会带来颠覆性的改变,尤其是对那些深度依赖 slack 沟通的开发团队。这次更新的内容远不止于此,你可以直接去 get up 仓库翻阅更新日记,查看其中的 新版本中引入的每一项细节改进。总而言之,各位,这些就是新增的核心功能,均源自本次 cloud code 更新, 整体使用体验确实提升了不少,特别是全新的技能创建器,它能进一步优化你的智能体技能,从而更出色地执行各项操作。我会把相关链接都放在视频下方的。

下面我会顺带介绍 oppo 的 这个东西,其实我觉得大多数人需要的并不是 ko 的 这个东西, ko 这个东西他还是蛮复杂的,而且 你经常跟他交互,他经常忘事情,有的时候就特别卡。其实 oppo 呢,就垂直垂直领域的这种 a j 已经非常好用,他一样可以去你的电脑上去操作一些文档,你也不一定是要去用它去编码或者去 写一些内容创作啊,写一些文章啊,或者你去介入一些 a p i 啊,去搞一些图片啊,一些视频都是可以的。这个可能代码东西我就介绍的少一些吧。 这个如果是做开发的应该都都知道这些东西,光刻的这个东西它它是开源的嘛?是对标的这个 c c 酷狗的就是 isolex 和 gemini c i 这个东西也没什么好多说的,反正会用的人自然会用。

看到了吗?三个 ai 同时在写代码,这就是 cloud code 的 agent teams, 让 ai 像真实团队一样写作 cloud code 的 三次进化,单 agent 写着写着就忘了。 sub agents 能分工,但是只能向上汇报, agent teams 才能相互讨论。真正写作 agent teams 怎么过 工作的呢?一个 team lead 负责协调多个 team mates 并行开工,每一个都是独立的 cloud 实力,拥有完整的上下文。看看真实的案例。我的 ui 组件库项目 teammate 一, 开发按钮组件 teammate 二,写表单组件 teammate 三,编辑测试用力,三个 ai 同 时开工,效率直接起飞。它更强的是智能体协作, teammates 可以 互相发消息,讨论方案。按钮组件完成表单组件自动引用测试发现 bug, 通知开发修改,全程自动化。怎么用呢?三步搞定,第一步,开启实验特性。第二步,用自然语言描述团队需求。第三步,坐等 ai 团队完工。想看分屏效果,那目前只有 mac os 通过 teamworks 或者是 item two 支持 windows 用户,抱歉,只能用单窗口模式,我严重怀疑 cloud code 开发人员压根不用 windows, 什么时候用哪个呢?改小 bug, 单 agent 到 sub agents, 再到 agent teams, ai 编程正在进化成真正的团队合作。这就是我用 agent team 完成的 ui 组件库评论区,聊聊你会用它做什么项目。

hello, 大家好,我是一一。那今天我们来讲一下 cloud code。 呃,首先我想来说一下,就是每次让 ai 写周报的时候呢,我们基本上都会在开头去粘贴一段五百字的格式要求。那上周我看了一下,一个月大概我粘贴了四十多次,我给 ai 呢攒了十几套提示词,写代码一套,做菜谱一套,翻译一套等。 问题呢是每次我开心的对话框,我都得手动去选一套,贴上去 ai 根本不知道该用哪一套。那我在想,如果 ai 能够像真正的秘书一样知道我是谁,今天我要干什么,并且学会翻哪本厚厚的操作手册,不需要我每次都重新教一遍呢?那这就是我今天要聊的东西, cloud code, 它具体是一个什么东西呢? 啊? cloud code, 它是 eshoping 公司推出的一款 ai 编程助手。听到 ai 编程助手,你先别急着划走,虽然说它的名字里有 code, 但如果你只是拿它来写代码的话,那格局就太小了。 esploic 自己的法务营销团队都在用它,官方甚至说它最被低估的用法就是做你的思维搭档。那它跟我们在网页上用的那些聊天 ai 有 什么区别呢?这里我可以借用博主秋之的一个案例来进行比喻,我们可以把它想象成一个非常酷炫的一个 在博的小区吧。你在网页上用的那种普通 ai 呢?它其实像小区门口的一个问询处的一个机器人,它智商很高,但是它并没有手脚, 不认识你,也没有办法帮你干活。你问他问题呢,他只能给你回一段话,市面上打包好的那些 a 证的产品呢?它相当于一个前台小姐姐机器人,他也不认识你,但是它能够帮你打打电话,敲敲电脑。而 cloud code 呢,它是小区专门给你配的贴身秘书机器人。那这就很有意思了, 它有三个关键特征,首先认识你,你的资料、习惯、偏好,它都能够随时去调动,去查看,甚至拿着你家钥匙帮你打扫卫生。第二,工具箱无限。除了默认工具之外,它还能给你接入社区成千上万的 m c p 外挂工具,那关于 m c p 不 了解的,可以去翻看之前的视频。第三个,能带团队,它相当于一个大秘书,能够根据你的需求调排不同特长的小秘书上场。 那 cloud code 和普通的 ai 聊天到底有什么区别呢?首先,第一个是上下文能力不同。网页版的 ai 呢,它能够读取你的整个项目文件夹,几万行代码,几百个文档对它来说都不在话下。 二是执行力的不同。网页版 ai 呢,只能给你建议 cloud code, 它可以直接动手创建文件、运行、测试、发消息、查数据库,它呢是手脚眼必用的工作流。不同,以前你是写代码遇到问题,打开浏览器问 ai, 复制答案,回到编辑粘贴。那现在呢,你可以直接在中端说,帮我重构这个模块,那它就开始。 嗯,改完测试好提交 get, 然后帮你继续干活。第四个是扩展性的不同,普通的 ai 是 个孤岛。 cloud code, 它可以通过 m c p 连接飞书、 google map、 天气 服务数据库,它是一个开放平台。那现在想象一下,如果你是一个技术负责人,遇到一个比较复杂的问题,你会怎么做呢?嗯,你大概会喊小张,你去研究一下文档,小李你去调试一下代码 bug, 小 王你去写一下测试的新功能。 那 cloud code 的 现在也可以这么干了。你可以开多个 cloud code 的 实力,一个专门研究代码结构,一个专门研究调试模块,一个专门研究写的新功能。他们各自独立工作,又能相互协助,这对于大型项目来说,效率是指数级翻倍的。过去我们为了提高效率,我们花了很多时间去挑备忘录、体重记录、 app 日报模块。那现在我们有了另一种选择,自己定制 color code, 它不只是一个编程工具,它更像是一个数字员工互挂器。你不需要写代码,只需要用自然语言描述清楚你的需求,定义好角色,配好工具,它就可以帮你把那些琐碎的、重复的、需要,调动多个 app 工作的、自动化的跑起来。哪怕你完全不懂编程,只要你有一个自己明确的目标,你就能给自己造一个专属的、有智力的,贴命于你的秘书团。

彻底火了兄弟们,八二扣子被反翻译破解,百分之九十八的核心架构设计被深度还原!最近,在 github 上一个开源项目的作者对八二扣子进行了逆向反翻译,并把他的核心系统架构和完整的研究资料全部扒了个底朝天,包含多 a 证实现机制调度逻辑、 mark 协议集成、机制分析等等。 他借助 cologne 的 自行分析, cologne 本身混淆后的 gs 代码,覆盖了从 ui 交互到 a 阵核心引擎的完整技术栈,成功还原了 cologne 的 核心技术架构。文档里 他把研究目标、核心技术发现、核心架构流程图、完整代码仓库以及技术分析文档等等全部分享出来了,真的做到了用 ai 来打败 ai! 感兴趣的兄弟们可以去体验一下。


如果你也是 cloud code 的 忠实用户,请千万不要错过这期内容。刚满一周岁的 cloud code 已经成为了全球最受欢迎的 a 阵的产品, 没有之一。谁也不会想到,一个藏在命令行里的工具能掀起这么大的波澜。最近,作者 boris 参加了一档补课节目,透露了太多让人惊讶的数字和判断。软件工程这个职位可能会迅速消失,产品经理、设计师、财务都将成为程序的构建者。 不要试图创造新的需求,而是观察用户已经在做什么,然后让这件事情变得更容易。你现在维护的一些技能和脚本,几个月后都可能被模型的原生能力所覆盖,那这些反而成了你的负担。 今天这期视频,我就把这场访谈里让我印象深刻的几个观点跟你详细聊聊。 boris 说,他们最初做 cloud code 的 时候,其实没有抱太大希望。 当时所有人都在想,命令蛤蟆就是个过渡,三个月后肯定换成更现代化的界面。结果呢?一年后,终端不仅没有被淘汰,反而成为各大厂商相近模仿的设计方案。 boris 的 原话是,我们居然还在使用终端,这本该是一个过渡的起点。很多人觉得终端简陋,但 boris 说为终端做设计其实非常困难。八十乘一百个字母,单一字号二百五十六种颜色,没有鼠标交互, 哪怕是一个加载动画,都需要五十到一百次的试错迭代。但正是这种看似简陋的形态,反而成就了这款带有终端能力的 ai agent。 boris 讲了个故事,最开始他给模型开放了 bash 权限,然后随口问了一句,我现在在听什么歌?模型居然自己写了一段 apple script 去读取麦克的音乐播放器。 boris 说,这是他第一次感受到了 agi 的 活化 模型已经不止于聊天,他更想使用工具,他想和这个世界交互,不只是说说而已。 boris 本人已经百分之百依赖 cloud code 的 编程, 他的原话是,我卸载了 ide, 再也不自己写代码了,每天打开 cloud code 就 能拿到二十个 paul request。 他 们公司内部早已从用 ai 辅助编程变成了 ai 编程人类监督的模式了。不只是 boris 本人这么做,整个开发流程都在被 ai 改变。 克拉蔻的插件功能就是一个例子。这个功能不是人类工程师做的,而是一群 ai agent 一个周末自主跑出来的,全程没有人类干预。 s robin 内部有一个理念,不按今天的模型做产品,而是按六个月后的模型做。 这意味着克拉蔻始终处于持续重构与优化之中,每一行代码都在不断地被推倒重来,没有一部分代码是六个月前还在使用的。 这听起来很疯狂,但这就是他们的日常。所以 sroglik 给创业者的建议是,别用今天模型的眼光去做产品,模型进化比你想象的还要快,你现在觉得他做不到的事,过半年他可能就能搞定。 boris 还提到一个产品思路浅藏需求,意思是你无法让用户去做一件全新的事,你只需要让用户正在做的事情变得更简单。 plan mode 就是 一个最好的例子。 团队发现,用户在使用 code code 时,已经习惯在聊天窗口里自动手动规划任务,于是他们把这个用户已经在做的事情正式优化,做成了一个独立的 play mode 功能。 然后, boris 最近说,这个功能可能寿命有限。过去使用 play mode 是 因为模型常常会跑偏,人类需要不断地纠正。但现在新模型只要给定方向,就能自己保持在正确的轨道上。也许再过几个月, play mode 就 不再是必需品了。 无论是专家还是通才,都正在面临着同一个挑战。如何保持初学者心态?过去资深工程师价值体现在有主见,你必须能够拍板,必须能给出明确的方向。但现在模型进化太快了,过去那些的经验和方法论分分钟过时。 那现在最重要的是保持谦逊,承认自己可能会犯错,要从第一性原理出发思考,抛掉所有的经验和假设,回到最基本的事实去推理。招人的时候, boris 最喜欢问的一个问题就是,你犯过什么错误?你是怎么承认错误的? forrest 有 一个预测,未来软件工程师这个头衔可能会彻底消失,不再有专职的程序员、产品经理也写代码,设计师也要写代码,财务也要会写代码, 代码会成为一种基本技能,就像现在会打字一样。实际上,这个趋势已经开始了。 as robin 内部调查发现,财务团队、设计团队、数据团队都在使用 code code, 但中端对非技术用户不太友好。团队就用十天时间,完全用 ai 写了一个桌面端程序,底层还是 cloud code, 但加了 gui 界面更安全,对非技术用户也更友好。这是最震撼的数据。 srog 每位工程师生产能力提高了百分之一百五十。 bois 过去在 madata 负责代码质量,他说当时几百人的团队努力一年,生产力提升百分之二已经是极限。现在一个人加一个 ai, 就 等同于过去几十人的工作效率。 cloud code 正在用一种前所未有的方式重新定义工作本身。 好了,今天的分享就到这里,智能只是手段,人类才是答案。这里是头哥不请自来,我们下期再见,拜拜。