想不想让你的 cloud code 越用越聪明,越用越懂?你?把这段提示词放到你的 cloud dmd 的 文件当中?这个是来自大神卡尔帕西的经验总结,并且已经开源,在 get 上面有十六万颗星。有人已经测试过这个方法,效果特别明显啊,在六周以内,他的代码库的错误率从百分之四十一下降到百分之十一。我们来看下这个神奇的提示词。 好,这个是提示词的原版,很短,六十几行,直接看中文的版本,了解它的设计思路。首先,这个总结是来自于卡尔帕西的一个推文核心,让你的 cc 在 执行任务当中遵守这四个原则。 编码前的思考,简洁优先,精准修改。目标驱动编码前的思考,要怎么去做?代码简洁优先,要怎么去做,都有非常清晰的说明。精准修改,当你编辑代码的时候应该做到哪些?原则改动独立的代码的时候应该怎么做?最后,目标驱动执行 无效的说明是什么?应该怎么转化为有效的说明,包括对于多步骤任务怎么样去说明。一个简短的计划,短短几十行,那个说明啊,让你的 c c 的 编码能力有一个显著的提升,彻底做一次升级。好了,我是六叔,关注我,持续丰富,大家进货,拜拜了个拜!
粉丝4005获赞4.0万

今天我花二十分钟把这个可绕的扣的给装起来了,其实呢,这个还是比较简单的,我今天就来给大家演示一下,先把这个可绕的扣的零摩擦, 帮大家先装起来,然后再告诉大家后面怎么去领免费的偷客人怎么 处理,自己的文件怎么用。我们首先就准备几样工具啊,一个就是电脑,电脑肯定是要有啊,但这个性能是无所谓。还有一个就是 qcloud 的, 这之前我教大家装过,如果不会的话就翻一下前面的视频, 然后还有一个就的不希克的网页版本,你如果有什么问题,安装过程中出错了什么的,你直接截图发给他,他会给你解答。 那 qq 二的你直接告诉他帮我安装一下 cloud code, 然后他他就会给你自动安安装上去, 这里我已经安装好了,我看一下能不能演示一下 qq 二呢,他每天也是有免费的额度的,所以说处理这些小小事情还是绰绰有余,这就是已经在在装了啊, 你不用管他,他自己会跑,跑完以后呢,那就装好了。那如果呃出问题呢,你就截图发给那个 deepsea 是 吗?根本不用人为的来操作,这难点呢,就是你这个装好以后怎么用,因为他用 cloud code 的, cloud 的 这个这个模型呢是海外的模型,你国内的话还用不了,需要配置一下,我之前用的是 deepsea, 这个配置起来比较简单, 等会告诉大家,如果还不清楚的可以加我的粉丝群哦,我群里会把相关资料上传上去,有问题呢也可以和群友大家一起交流一下,你看安装完成让我来确认一下这个内容。好,这安装好了,然后这些就是文件, 这还有个启动文件啊,直接开始刚刚第一个跳,跳出来的是是是否信任这个文件夹,直接打确定回车就可以了 啊,这里呢就可以开始聊了。我周边之前是有装过的啊,有装过这个模型的,现在已经切换到小米的这个这个大模型, 所以说他能回答我正常的话,你是这里是他会报错的,因为你没有接入这个 cloud 的 这个模型。 那我们怎么办呢?看一下啊,就你先要登录这个 deepsea 的 开放平台,然后 api 开放平台点进去,点进去呢,他这边的话会有一个,呃,个人认证, 个人认证啊,就认证完了以后呢,他会给账号里面充十块钱,那十块钱的话你用一下其实可以用好一段时间啊,再点这里 a p r k, 你 自己创建一个,然后呢,你这个 钥匙拿到以后,直接创建密钥的一个脚本,直接把对这一段文字呢全部发给那个,如果不知道就让 qcloud 帮你找你这跑完以后呢,它会新建一个 apikey 的 这个 hup, 这个自动程序里面呢,他是有你的,有你的这个密钥,把这个命令中的这个密钥替换成你真实的这个 api 的 这个密钥, 就是我刚刚复制的那个外串密码,然后还是发给你电脑这一串文字,那么他会给你新建一个 这个文件,它里面会告诉你是用的是哪哪个大模型吗? 我这里是 deepsea, 所以 说他已经写好 deepsea, 如果说要用好一点模型,你直接给他替换成好一点模型,然后那两个文件生成以后呢?你就可以重新打开这个 试一下,你打开试一下,你随便给他发句你好或者怎么样,他如果能回答你,那么就说明你这个已经是成功了,就是已经从卡拉的模型切换到 deepsea, 那 么你就可以用国内的这个大模型去调用这个程序。 那大家如果遇到什么困难或者不懂的,可以加我的首页粉丝群,大家一起过来探讨一下吧。

今天 cloud code 自动更新完,会出现一个 api 四百错误,目前的解决办法就是直接在这个扩展里边去把自动更新给它取掉,然后回退到呃过去的版本,呃这里边去回退到一天前重启扩展以后 cloud 就 恢复了。

不会写代码的人怎么把 cloud code 用到极致?三个月,每天八小时,我留下这十九招。第一个也是我觉得开启会对你使用 cloud code 有 很大帮助的。在终端输入斜杠, s t a t u s l i n e 你 就可以自定义你看到的信息,比如说模型的类型,上下文的占比, 成本等等。它会生成一个显示在终端底部的小脚本,让你在对话过程中随时可以通过下面的仪表台来监控你的各项指标,从而有效的避免你的上下文污染。这个功能在你最开始使用格拉格的时候对你的帮助会很大。 第二个也是我给别人疯狂安利的 command, 你 可以把它理解成快照,你在文件夹里面改动的任何东西 都可以给你保存下来,并且你还可以随时的回滚。当然有一个前提是需要 get 初步化你的这一个文件夹。第三个,斜杠 care 这一个命令在我每次进行过 command 之后,我都会使用这个命令来进行对话的新建, 一个是确保我的对话清晰明了,另外一个是确保我不会浪费更多的托管和上下文造成的一个污染。第四个也就是计划模式, 你可以按住 shift 加 tab 切换,你也可以输入斜杠,然后 pan 打开计划模式。你需要养成任何非日常工作都把这一个计划模式开启的一个好习惯,这样可以保证你在进行任何 动作的时候,都可以让大模型能够更明确的理解你的需求和指令,可以更好和更快的完成你的任务。第五个,不要总是对可乐下达一些模糊的需求,比如写一个功能,或者说我需要修改这里的效果,我不是特别满意这种话,这样他是不清楚你想要的东西的, 你应该学会向他抛问题,比如问他这样的效果,如果你是用户,你会不会满意?让他先自行推理逻辑,他的产出的质量会更高,这类似于计划模式,但会让他思考的更深入。第六个是让可乐的主动的向你提问。在计划模式下,他通常会问你问题,但是你也可以主动的要求他, 请不断的向我追问,直到你了解我百分之九十五的一个需求。第六招也是我经常会用的一招,就是他在产出一个计划之后,我会让他以一个新的顾问的身份去从事 重新的审视这一个计划,往往他会找到计划里面的一些漏洞,或者说过度设计。第八招就是加一个质检步骤。我们可以看到,在很多时候,克洛德在执行任务的时候,他会创建一个代办事项,你完全可以在这些代办事项里面加入一个质检步骤, 这样子他会在最后进行质检,确认没有问题后再给你验收。第九招就是在每一个项目中运行 i n i t。 这一招通常是用在你已经有一个包含了文件的现有项目,打开它之后,你输入这一个命令, color 就 会自动的扫描你的代码库,文件夹和里面所有的文件, 并且呢生成一个 color 点 md 文件,这本质上就是项目的一个备忘录,它会梳理出来你的结构、编码、规范和关键文件。 这样一来你就不需要每次都解释项目的一个情况,如果你是从零开始构建项目,也就是说你的文件夹里面什么都没有,同样也可以输入这一个命令 来描述你项目目标和你的一些文件内容,文件结构,让克拉克库的协助你创建。第十招,及时止损,在做你的任务的时候开始跑偏,一定不要让它写完,直接按 esc 停止,重新修正方向后再让它运行。错误的 token 消耗都是在浪费上下文, 并且会浪费你自己的一个额度或者说 api, 尽早的干预,毕竟它只是一个 ai。 第十一招,也就是使用两下 esc 快 速的撤销,如果走错路了,直接两下 esc, 你 可以回退到你对话的任意一个节点,不需要从头再来,就是非常的快,非常的迅速,但是它会造成你回退之后的下面的内容完全消失不见。第十二招,也就是使用 hux 进行通知,输入斜杠 hux 可以 设置通知提醒, 比如我设置了当可乐完成绘画时发送声音提示,这样你就可以专注于其他工作,当你听到声音的时候,你就知道任务结束了,你需要去查看。第十三招,就是使用截图,可乐是有视觉能力的,这一招其实非常的实用,比如说你可以把爆出的截图和你想要的一些灵感网页 都直接截图喂给他,这样他就可以更明确的知道是什么地方不对,然后需要修改哪些地方比你模糊的给他说这个位置不对,效果要好的特别特别的多。第十四招,就是利用 get 工作树, 这个名字听起来像是一个程序员的专属,但是其实他是一个非常好用的功能,你可以把他理解成一个平行世界。 就是在一般的情况下,如果我们开启两个 color code 进入到同一个文件夹,那么他们在进行工作的时候可能会互相的覆盖文件,或者说你在使用 codex 进入到这一个文件夹,又在使用 color code 进入到这一个文件夹,你就可以使用这一个 get 工作数的原理,让你的 color code 是一个平行宇宙,让你的 codex 是 一个平行宇宙,让它们分别精心工作,腹部干扰,这样子你在所有的效果完成之后,可以把它们选择性的合并到你的主线。这一招在我使用 codex 和克拉克的进行写作的时候会经常使用的。 第十五招就是优先的使用 api 端点,而不是 mcp 服务器。 mcp 服务器虽然方便,但是它会占用特别多的一个上下文, 比如你只是想使用特为你的搜索功能,你只需要填入 a p i 就 好了,没有必要安装他的 m c p, 我 自己的话是非必要不安装。 第十六招,通过手机远程操控,你只需要打开这一个命令,然后扫描这个二维码,你就可以在电脑上开启任务后离开,你可以从手机或者说任何浏览器控制这一个对话。 第十七招,也就是超强思考模式,这每一次都是我在切换模式搞不定,或者说或者说有难题无法解决的时候,我就会开启它。 开启它之后,科罗岛会给他分配特别高的一个思考预算,在面对复杂的架构决策或者说顽固的 bug 时, 它可以很好的处理掉。第十八招,也就是使用智能体团队 agitim 四这一招,其实在我这一招其实在我这段时间来说经常的使用,因为它们之间是可以互相对化的, 也就是说你只需要开启这一个功能,那么你的主线上面的 oppo 的 四点七就可以做一个顾问,然后派一些索尼特呀,呃,或者说其他的模型去执行任务,然后回来报给你。 这一个它和子代理是有区别的,子代理的话是没有办法通信,没有办法共享任务列表,这个 a g 的 team 是 它是可以的,但是它的资源消耗会特别的多,所以你需要 呃自己取舍。第十九招就是 skulker, 就是 技能创建,这一招在很多时候都特别的有用,这之前我已经出过视频讲过了,它就是以一种特定的方式去执行特定的事情的一种模型,所以在平时你很多重复的工作你都可以做一个 skul 让它去做, ok。 以上就是我作为一个非程序员经常会使用到的克拉克的一些技巧分享,当然我也知道克拉克还有很多其他的一些命令,比如说上下文查看这一些,但是说实话我自己真的不是那么的经常使用, 所以我在这里就不做分享了。这就是本期视频的全部内容呢,如果你觉得对你有点帮助的话,那么就收藏转发,我们下期。

当所有人都在告诉你, cloud code 无敌了,靠,赖主无敌了,程序员要失业了。但是我要告诉你一个有点不一样的事实啊,限阶段的 web coding 根本就做不到真正意义上的脱手。所谓的技术平权,是建立在你至少懂一点技术逻辑的情况下。 如果你连最基础的概念都不懂,人家不是在帮你开发,他是帮帮你随机挖坑。为什么?因为很多人连最基本的两个概念都没有搞懂 啊。 l l m 和 agent。 先说 l l m 即垃圾 language model, 你 可以把它理解为 ai 的 大脑,像豆包,千问、 deepsea, 还有 g p t, 本身上都属于大圆模型, 他们负责思考、理解和深沉,但是他们不会帮你真正干活,他们只会告诉你应该怎么做。真正执行的是第二个东西, agent 翻译过来叫代理,你可以把它理解为 ai 的 双手, 他可以帮你改代码,跑命令,读文件,调项目。像 cloud code, codex 这种都是偏向于编码型的 agent。 但问题在于,其实他们都挺瞎的啊,你以为他们在认真开发?但是如果你不写好的提示词 啊,他经常改着改着就把项目改炸了,修一个 bug 照三个 bug, 还会一本正经的胡说八道。所以现在真实的状态是什么呢? ai 能让懂开发的人效率翻倍,但是远远做不到能让不懂开发的人直接起飞。后面的 mcp, skills, 还有自动化工作流,都是建立在你懂这两个概念的基础上。他说工具怎么选?如果你是 轻度修需求,就是想要写点小工具,做点小网站和小作业。我推荐一个东西叫什么啊通一律嘛啊通一律嘛?不知道有没有人知道的,开箱即用门槛低,而且最重要的是它现在阶段是全完全免费。 但是如果你是高需求想真的做产品或者跑项目的话,我建议你还是上 call 和 calllex 这种,只不过他们都有很多技术门槛,像环境配置, api 啊,费用还有网络这种一个都绕不开。 所以别再信什么一句话做萨斯零零基础月入十万这种鬼话了啊。现在的 web 扣队你更像什么呢?像一个非常牛逼啊但是脾气非常怪的实习生,你以后得会盯着会纠错会提需求, 而不是直接放手不管。 ai 确实在降低门槛,但是他远远没有做到让你什么都不懂就能闭着眼做产品的效果。

卡洛克呢,吹的非常牛逼,但是小伙伴们用的时候呢,出现的效果是参差不齐的,那其中有一个很大的原因呢,可能就是 skills 没有用好,那今天呢,我就教大家怎么把这个 skills 用好。先说一下 skills 在 实际用的时候,它模型就是 closed, 它是如何调用的?其实呢, klo 的 钓鱼 skills 呢,有两种方式,一种呢是根据小伙伴提的你的任务,它里面有一些关键词,或者是一些他对你任务的一些分解的时候,他发现可以对你的哪些 skills 可以 用,这是一种就是参考型的使用。 那还有一种使用呢,是你添加一个斜杠,然后输入那 skills 的 名字,它就会切换到当前 skills 的 状态,这是 skills 正常使用。 那么 skills 呢,还有一个技巧呢,就是我有一个发的 skills 这样一个 skill, 那 这个是干啥的呢?这个其实它它的用处是这样,就是当你 当前项目用了很多 skill, 或者说是装了一部分 skill, 但实际上呢, skills 它作为一个庞大的市场呢,它可能每天都会有一些非常新鲜的,非常好用的一些 skill, 那 怎么办呢?你可以通过这个发的 skills, 让它去在公共的开源社区上,或者是你直接问它 就是我干某个任务或者啥的,当前有哪些好的些 skills, 它会给你分门别类的指出当前有哪些 skills, a, b, c, d, 然后它的下载量,它的描述啥的。 那这样呢,当你合理的运用 skills 的 时候呢,你的项目的效果出来,那就是截然不一样啊,这是 skills 的 使用第一部分,那么 skills 呢? 我作为用户,我可不可以自己创建呢?其实是可以自己创建,那么自己创建的话,有下面有几个需要特别注意的点。 第一个就是你创建这个 skills 怎么让用户去触发,或者说是怎么让它正确地被调用呢?其实这个就涉及到 skills 的 一个比较重要的一个一个特点,就是说它有可能会被欠使用, 或者说是呢过使用,就是说在不恰当的地方他在使用,或者说呢我用的地方用不到。 那这个呢,就是牵扯到我们在制作 skills 的 最重要的一个问题,就是 skills 它在最核心的那个 skill 点 m d 文件里面,它有一个对于当前 skill 的 一个描述,其中有两个属性,第一个是 name, 第二个是 description, name 就是 你 skills 叫什么 description 呢?就是你对于当天你的 skills 它能干什么事情,那么欠使用的原因就是你 skill 描述太过于学术或者太过于专业。 那么你描述的这个所谓的这种空间,它在用户测用户的口语化的需求和诉求方面,它俩之间有点差异,出现差异了就会导致你的 skill 按上之后用的可 low 的, 它在自动调的时候调不上 啊。这里面我补充一点,就是说 cloud 去自动去使用,在你非主动触发的情况下,自动使用的时候,它完全取决于你的 description 描述,它是一个好像是一零二四的字节,不能太多了,你太多了它也不行。 那么过时用的情况是什么呢?就是你在描述的时候用了太多的高频词汇了, 虽然它跟功能相关,但是你尽可能的就是专有化,把那些公共的高高频的语句尽可能的避免掉,这是自己创建 skills 最需要注意的一个点。那么在创建 skills 的 还需要注意一个点,就是 在在 curl code 的 官方文档里,它是这样说的,就是说 skills 这个它由于大模型,它有一个叫 lost in moodle, 好 像是这这么一个原因,也就说你 skills 这个里面不能内容太多了, 它叫一个叫五百行法则,五百行法则,你的 skills 里面的这个 md 里面的内容不能超过五百行,太多了就有可能容易或失效,或者模型一节就不充分了。嗯啊,就是之前所说的掐头去尾的那种效果,是吧?对,所以说呢,在 skill 创建的时候一定要注意这两个 啊,这是第二个,就是 skills, 我 在我要自己弄一个我需要注意的两个点。嗯,那么第三个点呢,就是 skills 呢,我们在用它的时候呢,我们要尽量做的一个就是思想上的一个转变,嗯,因为 skills 到底是个什么东西? 可能有小伙伴在用的时候把它当成是一个知识库,或者是当成一个固定的一个手机助手, 其实我我在这里呢,我更愿意把 skills 呢看,这是一个路由,那什么意思呢? 用户来了问题,我中间有个中转,哎,我,我风发,我能干这个,我能干这个,我能干这个,对吧?一二三四五对吧?这种路由关系呢,其实就是有可拷扣的,它自动去分配,然后我本身的 skill 呢?我作为一个路由,它其实就是一个超级庞大的一个适配器,那它既然有了这种适配, 本身取决于可拷扣的,还取决于模型本身,这是传统的这种固定方式,它会增加它的灵活度。就是说它由于这个路由的这种特性,就是你把 sky 看成路由这种路由的特性,它其实就是极大的放大了这个 大模型能够干的事情。因为大模型它现在能够理解行为,能够理解规则,而传统的软件行为和规则都是人为定义的。嗯, 这些行为规则具象化,就是我们所谓的数据库里面的东西,我们所谓的页面布局,我们所谓的导航,现在这些条条框框都会被大魔性理解,你只需要说出你的需求。

啊,这个今天我在用这个 vs code 的 时候呢,它这个这边出现了这种一个报错,然后我去网上查了一下,啊,这是那个 cloud code 更新产生的一个问题, 其实这个很好解决啊,就把我们的扩展打开,把这个自动更新给它关掉,之后呢就安装特定版本,我是倒回到这个一点五二之后它就可以用了。啊,我们再试一下啊, 重启一下,我感觉应该是它这边卡住了。 啊,可以看到啊,这边已经开始思考了。 ok, 可以 了,可以了。

大家好,之前不是和大家分享了一个 cloud code web coding 这样一个玩法吗?然后因为我本身是混油的爱好者,你可以看得到我桌面上有艾尔登发环啊,混一啊,还有混二,这些 我们都知道啊,只要玩过的都知道这个艾尔的法环,嗯,包括这个混一、混二、混三,它是没有一个及时存档的功能,例如你在 boss 房, boss 房的面前想要去存档的话,你只有通过呃 更改这个存档文件,然后进行粘贴复制。比如说他在 c 盘里面或者特,或者说他存在一个别的地方,你去把它找出来,然后再复制出来,然后再把你的文件覆盖掉。 那么我就想的有没有一种更加快捷的方式啊?就是, 嗯,我及时存档,然后及时读取这样一个方法,然后我就把我的需求告诉了 cloud code, 让他去帮我分析,他说这种说话这种方式完全是可以实现的,然后他就给我我跟他讨论了一段时,讨论了几句之后他就开始开始给我做了, 做完之后就是出现一个这个文件,然后我把它取名为魂游存档功能,这里可以看到我现在因为魂三我这会没有玩,然后魂一、魂二还有艾尔登法环都是有存档的, 然后我已经使用了两三天了,非常的稳定。我先是有可以给我的存档进行一个命名,比如说打新王前,或者说成就啊,你可以看到我这里做了很多手动手动的存档, 这是第一个。然后呢,因为我害怕他损坏了我的原始的文件,我还告诉他了,你需要隔每隔五分钟进行一个自动的备份,然后他就给我备份好了。 最后呢,我在读取每一份文件的时候,例如我在读取啊,读取这个 boss, 我 读好了之后,我要求他立即把我现在读取这份文件之前的 这个存档进行一次备份,然后就放到了最下面,可以看到没,然后他就会会给你罗列到存档位于什么什么符号之前,你根据这个时间,然后就可以去 查找到你读档之前的这个文件啊,到底是怎么样的一个情况? 我用了呃,三天啊,因为我魂一是没有全成就的,所以这两天也在 做这个回忆的全成就,然后整体跑下来的话非常的流畅,非常的舒服,所以把这个东西分享给大家,如果你想自己 web coding 一下,可以试一下,真的很不错。

我觉得豆包它就是国产,真没那样,我现在主要就是用 codex, code 和豆包就是它那个,那天那个四零零报错就是豆包给我解决的,反正它就是。嗯,这个四零零报错的话,你要么就是退回到老版本,因为 codex 的 最新版可能是把这个 deepsafe 给给那啥了, 给它软封杀了吧。相当于有可能是这样,因为它是闭源的,我们也不知道具体是咋回事。还有一种方法就是你把 deepsafe 的 那个思考模式关闭,你去那个 deepsafe 的 官网看一下怎么关闭,然后你把它关闭就行了。就是 deepsafe 的 那个 a b i 文档,你看一下怎么关就行了,或者让豆包给你弄一下。


android 发布了他们的最强模型 cloud of 四点八,老规矩,我不想跟你念参数,那我其实只关心一件事情,就每次新发模型,我们把它丢进真实的项目里面,它的干活质量到底怎么样? 那这一次这一个 cloud of 四点八新发布的模型啊,我刚测完,我反而觉得 gpt 五点五加 codex 的 组合还能打,为什么呢?看到这个视频最后你就懂了,不过这一次有个东西是真的有意思,就是它这个动态工作流在 cloud code 的 里面,就是你只要一句话, 带上 workflow 这个关键词, client code 当场就给你写一段脚本,然后咔的一下拉起一个几十个上百个 agent 的 舰队,一起去帮你干一件大事。 我们来看一下它整个运行的一个流程图大概是怎么样子的。从这个图片可以看到哈,就是当我们 client code 里面你写了一个 workflow, 它这个时候通过脚本,然后去给你并发各种 agent, 那我们可以看一下它这个脚本长什么样子哈,其实也比较简单,就是它有每个阶段嘛,就是你是 workflow 的 一个流程,每个阶段,比如这个阶段它要排查啊,这个时候可以看到它这个用了一个 await, 是 吧? await 去并行运行了多个 agent, 完事之后走到这里得到了结果,这时候就回到你的主要的对话里面,它又开始去 定型,去开始第二个阶段,再去掉各个 a 镜头,大概就这样的一个工作流的一个过程。下面的话到我们的一个实测环节,这次的话我们用了我的一个开源项目,就是 c c 杠,哈哈,它目前的话有十一点九 k 的 star 是 一个,就是把 curl code 的 卸载原代码补齐,做了一个桌面端,还有 c o i 的 一个 开项目嘛,那这个开项目的话最开始也一直是 gpt 五点五加 codex 去迭代的,那这一次的话, cloud of 四点八出来之后,我要去做一个新功能,我们本期的一个实测哈,就是要让我们这一个桌面端,它在它的右侧能够对我们本地的一些 服务,比如说你用 react 或者是 vue 写了一些本地服务,这个时候我们要去点击,让它在右侧展现出来,或者是本地的一些 html 要拦截这个行为, 并且我们右侧要有要有一个小的一个浏览器预览,而且能够像 codex a p p 一 样,能够就在在上面去选中一些按钮啊,标题啊,或者一些块儿啊,能够去做定位,而且还能够直达答案,让它去修改。 在 codex 聊天中,当它改了哪些文件,比如说是 html 呀, markdown 啊,其实你都可以去点击,点击完它会在右侧去预览,而且下面也有这种打开的方式,也整体的交互,就相对来说挺棒的嘛。在整个桌面端,我认为现在 codex a p p 就是 目前交互最好的在桌面端来看, 那下面我们来看一下这个 html 它是怎么做到整哪打哪的?可以看到这个时候我们不是打开了这一个我们这一期视频的这个 ppt 吗?那它这边有一个模式的话,就是你可以去去,这样有一个选择器可以去选嘛?比如说我选中这一块啊,这个时候我就可以用自然元描述啊,我觉得这一块的 ui 交互啊,文案不行, 那就可以通过这样的方式让他去改,可以看到他就对我们这一个图片这一块加了一个备注嘛,对不对?然后还有我们这块的信息整体就是这个交互的功能,然后还有的话就是这个截图啊,他这个截图已经保存到剪切板,我们可以用大概这样的一个流程, 我们就希望我们这 c c 刚哈哈也支持这个功能,并且也有人在我们的 github 要求里面提出来了要这个功能,那我们就试一下。那今天的话 我用了 gbt 五点五以及我们刚刚看到了 kalco 的 off 四点八去做这个任务,那这边的话也是给了它五张 codex a p p 它整体的一个交互流程,并且我们也是用了这一个 superpowers 的 一个头脑风暴模式,相关的一些提示词都是一样的。然后我们去测试这个任务,我们可以看到 codex 这边呢,它最终启动了四十三个, 呃,三部 a 镜呢?帮我们把这个任务完成了,所以效果怎么样?待会儿我们再来看。那我们回到就是 clock code 这边也是用了陀螺风暴 t s 也是一样啊,也是同样的,就是每个阶段让告诉他我们最终这个设计文档要做成什么样子。有了设计文档之后,他也是去 各种实盘刹不住 a 进的去做。那在 codex a p p 这边的话,它整体的这个消耗可以看到今天我是烧了五亿的 token, 那 对于刚刚我们那个任务,大概我估算了一下,大概有三亿 token 这样子吧。 cloud 这边的话也是今天一天就烧了我这个一百刀的百分之二十的一个额度吧,一天就烧了,没有做其他的 任务,基本上没做其他的任务。好,我们下面来看一下两边的一个实现情况如何。好,下面我们来看一下 cloud 桌面端加 cloud off, 四点八,他去帮我们写了这一个 c c 杠,哈哈,桌面端就右侧这个浏览器预览的功能。 那这边的话我也给了一个提示词,就是让他帮我们产出一个 markdown 的 一个内容以及 html, 再让他去写了一个本地的一个突突项目嘛,就是用 react 去写。那最终他这边写完了之后呢? 啊,可以看到这里其实是已经他这边做了一个监测,当然这块的交互其实没有 code app 原声那么好,当然他也做到了,我们来试一下哈,就是我们在运用浏览器打开 啊,可以看到这个,是不是已经可以去看到这个这个网页这个预览效果了?那我们可以看一下截图功能,点一下可以看到这边其实也是可以用的嘛,是不是?那第二个的话比较关键,就是他这个检查元素嘛,可以看到他也是完成了,是不是?比如说我们就说这个按钮,我们就在这让他告诉他啊,我需要把这个按钮改成 就是这一个网页的主题色,你帮我改一下。另外的话,当前这个按钮的这一个 border 这些我也不是很喜欢,你去调整一下。 好,我们来去确定,你可以看到这边它就已经帮我们把这个东西做过去了,就是把截图嘛,就我们刚看到 codex app 那 边的一个交互,交互过去了,我们就可以去让它去做做这个事情。 那下面的话就是其他的一些功能哈,其他一些功能的话就是它可以在这边,比如说我们这是一个 markdown 的 内容嘛,所以说你可以在工作台去预览,基本上就是把那边实现了一遍。 其实整体实现还是挺复杂的,可以看到 codex 那 边他完成这个任务他都开了四十多个 java agent。 那 cloud 这边其实我没去统计,因为它这个过程没有像 codex app 那 边那么直接, 整体的效果其实完成度还可以,当然还有一些细节优化的点。好,我们来看一下扣贷 app 跟我们完成同样的功能,他是做的怎样子的?可以看到他在这一块, 在这一个行内,其实就帮我们把这一个要预览的这一个,呃,本地的地址啊,还有你的 markdown 啊, html 都做出来了,其实这块交互我觉得会稍微好一些。那么点过去看一下可不可以用,那可以看到都是同一个页面吗?是可以用的,刚刚我们说改按钮那个他其实已经改好了,是不是?那么看一下他这个截图可以用吗? 这个截图这个方式是这样子,它不是像呃 cloud code 实现那样子,是放一个图片在这里, cloud code 那 边会好一些。好,我们来试一下它这个定位也是可以的,可以看下,也是能选择某一个。我们选到这一块说一下,这个文字太大了,改小一点,字号改小一点, ok, 可以 看到它这个其实完成度也挺好的。那现在的话,其实我也没有想清楚,到底是把 gbt 五点五生成的这个核到我们的这个主干里面,还是说把 cloud 那 边去核一下?我可能会把 cloud 那 边的这一些 open 这边的加过来,然后用用 gbt 五点五的这种这种样式,最终把两个合起来,得到一个比较好的一个交互方式。那再看一下吧,从我四月份发布以来,就是从它泄露原代码,再加上我们做这个桌面端嘛, 一行代码的微信百分之八十的代码都是 gpt 五点五加这个 qd 写完的。可以看到我今天除了写这个项目以外,还做了其他一些功能。那下一个版本也在,应该是明天就会发布了,我需要去做一些就测试嘛,可以看到它真的是非常非常的好用,而且最关键啊,它不封号 是不是?那你如果是用呃 cloud 的 话,就是真的特别容易封号,我已经被封了四个了。好,下面我们来做一个总结。对于大多数人而言,我还是推荐你选择 qd 加 gpt 五点五。为什么? 你看我老婆这种律师哈,她现在都已经用上 codex 加 gpt 五点五来帮助她在平时的工作中进行赋能。打个比方,她平时有很多需要去操作 word 呀,然后 excel 啊,还有去填一些表单,这个是完全是可以用啊, gpt 五 点五加 codex 去做。再让我不最近也给她做了一个就是律师相关的一个工具嘛,因为她有她们有很多资料,其实都是需要在本地去操作,就是不能上云嘛, 比如说你像客户管理啊,还有一些合并 pdf 啊,这些都是可以照本地去做的。你说像这种工具,直接用 codex 去做,让它去描述你的需求,然后用那个就是一个 go 的 模式嘛,让它去做,完事之后再让它用 computer user 自己去测,它会自己去 啊,写完之后 build 出来这一个桌面的 app, 然后如果你看像我们这种不是需要去选择 pdf 嘛,对不对?如果你需要去选择 pdf, 它还会自己去打开这个,就像我们一样去打开,打开完了之后 去选择,然后去帮你去压缩,做这种合并,各种都可以做到。所以我为什么会推荐大家去使用这个呢?而且等待下一代模型发布的时候,它会更强。还有最重要一点嘛,就是 g p t 五点五, 你正常人用它一般不怎么封号,那 cloud off 四点八这边也挺强的,但是呢,它的门槛就会高一些,并且它的这个桌面段哈,它这个桌面段体验其实相对来说还是差, codex 会差一些,如果你这两个都用不了, 那你也可以用,就是我的这个开源项目就是 c c 杠,哈哈,这个开源项目也是开源免费的,也没有任何的一个门槛。你也可以用,就是各种国内的模型嘛,比如说你可以用 deepsea 呀,你看我这边其实都有,就 deepsea 呀,或者你可以用小米的呀,或者是智普,你都可以。那它基本上内核它也是 clio 的 本身嘛, ci 的 本身 功能我也在迭代,就看大家自己怎么样个选择。 ok, 不 管是 off 四点七四点八,它整体的这个发布啊,没有给我很惊艳的感觉,没有上一代从四点五到四点六的那个惊艳感, 那还是倾向于就是 g p d 五点六的一个发布,看它到底会带来怎样的改变?我现在基本上已经离不开 codex 这个 app 了,我最近真的狂用。我刚也给大家看了一下我的一个 token 消耗,最近一个月吧消耗了大概一百亿 token, 一 万多刀的一个消耗, 最近就是狂用,特别特别好用,而且运行起来也非常的方便。但是它也有一个问题,就是它容易内存泄露,我六十四 g 的 内存它有时候都能给我干嘛,就理解不了到底在干嘛。 ok, 那 这就是本期视频所有内容了,如果大家觉得这视频做的不错,可以给我一键三连,我是阿建,我们下期见。拜拜。

你的 agent 半小时塞了八十 k 没用的 token, 你 知道这八十 k 都是什么吗?看下终端页面,基本上都是 grab、 find、 l s 这些命令读文件,跑测试,在当时每一条都觉得有必要,现在回头看,全是噪音。你以为长绘画是在积累信息, 其实不是,长绘画是在积累你没勇气关掉的标签页。这是 danielsen 的 实测,他在推上发了一篇文章,标题叫 sub agents 长绘画,上下文卫生。半小时后,你积累了八十 k token 的 噪音,而且你再也不会回头看它们。 这一期我教你把常绘画从喝醉状态救回来。这是 cloud code 工作流系列第四期,上期讲 hux 的 时候,我留过一个勾子, sub agent 真正的价值是上下文隔离。今天我把这件事讲透,但先泼一盆冷水, 百分之九十的人都把 sub agent 用错了,我自己一开始也错了。听到多智能体四个字,我第一反应就是按岗位拆。 planner 负责定方案, developer 负责改代码, tester 负责跑测试, reviewer 负责把关。听起来很顺, ppt 也画得漂亮,但只要你真跑一晚,就能发现问题。 tanner 知道这块代码刚被重构过, developer 不知道 developer 做了几个临时取舍 tester 不知道, tester 跑完只说过了 reviewer 不知道前面漏了什么。每一次交接都在漏信息。 不是因为模型笨,是因为岗位是按人分工切的。 l l m。 不是 人人靠茶水间补信息,模型没有茶水间。原文里有句话我抄下来了, 围绕上下文边界设计,不是围绕角色设计。那 sub agent 到底是啥?你开一个 sub agent 让他查 bug, 他 grab 了三十个文件,跑了五轮测试,开了三个新终端,在里面翻了十几分钟,这些你完全看不到,你的主绘画干干净净 一行都没多,你只收到四个字。这里有个 bug, 不是 五十次调试过程,是三行干净。结论,把混乱压成结论。这就是 sub agent 唯一在做的事,不是多一个人帮忙, 这多一个工作区干完就丢。官方文档列了四条应约束,子 agent 之间不能直接通信,子 agent 不 能再生新 agent, 所有流量必须经过副 agent 考完只返回最终输出,不带中间思考。听起来像在限制能力,其实是在保证可控。讲得这么玄,直接看几个我用 agent 深沉这个视频时真用过的例子。第一个是当时我做 safe card 的 整屏改造卡,在一件事上,到底用侧滑卡还是整屏卡,我自己拿不准。所以我同时派了两个 sub agent, 一个从短视频 u i 设计专家的视角看,一个从真实用户消费者的视角看,他们不知道对方存在。各自跑完第一份报告回来,侧滑百分之三十的卡是错的, 整屏才是截图友好的最低门槛。第二份报告回来,一模一样,不是相似,是一样,两个独立视角,互不知道对方到达同一个结论,这就是上下文隔离,真正值钱的地方,不是更快,是更可信。第二个,我让一个 reviewer 自检清单审查,我自己嘴上说明案节奏满足, 结果他直接打开 ppt grab 了一遍,发现全是同一个暖米白底。我在自己写的注述里说谎而不自知。他打了五十八分,列了十条问题, 我接受了五条屁零修复,整片从自我感觉良好变成真能交付。但同一份 reviewer 报告里,他把 astropic 官方文档里真实存在的 if 字断判定为虚构。我看到这条判定的时候 手停住了,他说这是假的,但我知道这个字段在官方文档里。我差点信了,他差点把视频里唯一硬核的技术细节改弱了。就在那一刻,我意识到 sub agent 没有判断力,他能发现我注视和代码不一致,但判断不了文档里一个字段是真的还是假的。 因为他不能上网,他的知识停在训练那一天。所以我现在的规则是,信他的,找不一致,不信他的事实判断。三条原则记下来,第一,并发派 sub agent 互相不通信,找跨视角的一致性,比单 agent 报告可信度高一个数量级。 第二,让他专挑你盲点,你说满足规则,他直接 grab 你 代码核对。第三,不信他的事实判断, sub agent 不 能上网 训练,数据可能过期,回到开头那八十 k 噪音 token 常会话,不是信息太多,是你该丢的探索过程没丢。不要让 ai 记住一切,让它在对的时候忘掉该忘的。 sub agent 也不是终点,它解决的是单个任务的上下文隔离, 没解决整套工作流。现在打开 cloud code, 输入 agents, 你 就能看到它内置的 explore 和 plan。 两个 sub agent 不 用配什么 markdown, 今天就能用。先在 plan mode 里按 tab 感受一下,觉得有用,一键三连。感谢观看,下期见。

开始 hello 啊各位你是不是经常就是我之前在网上说那个什么胡彦斌也开始玩 coding 了哦然后他就他就发他一直得这样子哦开电脑然后这个梗是从胡彦斌开始的。哎呀不关他什么事他只是我的一个 hook。 行然后呢你别抓我我现在在外面嘛 对吧然后我其实我的库拉扣在跑东西嗯但是我不需要他停下来对吧我们马上要走这个地方走半个小时半个小时我们不让库拉扣干活那就亏了完了我的库拉扣就闲着所以我一般就开一个热点嗯然后让他连着但是你不能合盖子嘛可以下一个这个软件叫做 啊艾弗特曼就是艾弗特曼。好然后这样的话你合了盖子他还在绕嗯你可以设置他就比如说只这样干一个小时嗯或者是他永久都这样但你但你一定要现在把它关掉因为我现在就陷入了一个问题 因为这个东西他是没有 g y 的 他是藏在顶上的那个瓣的啊但是我现在顶上的瓣的那个进程太多了他现在都显示不出来我都不知道我我是开了还是没开啊。 对这就很尴尬一直开着会有什么不好吗耗你就耗了。他再也关不上了呀什么我之后和电脑盖子他就再也关不上了呀。哦他再也关不上我每次把电脑扑出来他都是没电的状态哦有的时候我就会这样子。对 可以这个很有用我觉得给大家再看一下。好艾弗特玛艾弗特玛是个开园的项目。好嘞就这样感谢分享。不对啊。哦哦哦没事。

你有没有遇到过这种事,你花了一个小时写了一个 skill 论文写的很细,流程写的很完整,里面有步骤,有边界,有工具调用, 甚至还有一堆注意事项,结果真正用起来的时候, cloud 一 次都不用。你明明是为了让他少走弯路才写的 skill, 但他好像从来没看见过。 你让他做代码审查,他自己审,你让他做上线评估,他自己评,你让他处理一个本来应该走专门流程的任务,他还是直接开始分析,最后你只能手动敲 skill, 减 name, 把他拉回正确轨道。 这个体验很挫败,因为问题看起来像是 skill 没能力,但真实原因往往更靠前。这不一定是 skill 中文写错了,更大的可能是最上面那一行 description 没写对。 skill 能不能被自动触发,很大程度上不是由政文决定,而是由 name 和 description 决定。换句话说, description 不是 写给人看的简介,它是模型决定要不要打开这份 skill 的 第一道路口。 因为 cloud 在 决定要不要加载某个 skill 之前,并不会先读完整的 skill 文档。他先看到的是一个可用 skills 列表,这个列表很像系统提示里的一张目录,每个条目只给他一个名字和一段描述。 用户请求来了以后,模型先在这张目录里判断有没有某个 skill 值得加载。这个列表里主要就是每个 skill 的 名字和描述,也就是说,完整论文写的再细,也要等模型先决定加载,它才有机会被录取。 你在论文里写了实验流程,写了很多边界,写了大量例子。如果 description 没有让模型在第一轮判断中命中,这些内容都不会进入上下文。 所以 description 不是 简介,它更像是路由规则描述越贴近真实请求,触发概率越高。描述越抽象,越被动,触发概率越低。文章特别强调,这里不是一个硬编码开关,也不是用户提到某个词就必然触发, 它更接近模型基于语义、任务意图和上下文做出的概率判断。最常见的失败有三种,第一种是不触发, 用户说 review my code, 但你的 description 写的是 audio software artifacts, 意思接近,但用户不会这么说,模型就可能错过。这里的问题不是语义完全不相关,而是表达距离太远。 skill 描述如果只使用作者自己的专业词,模型未必会把它和用户的自然说法连起来。第二种是勿触发, 比如你写 helps with coding tasks, 范围太大,几乎所有编程请求都能撞上它,可能让一个本来只负责 docker file 的 skill 被用到普通代码补全测试修复架构讨论里, description 太宽,短期看像是提高触发率,长期看会污染路由,让模型在不该调用的时候也调用。 第三种是 skill 冲突,当系统里有十几个二十个 skill, 边界重叠就会放大, 模型不知道该选哪一个,最后可能选错,也可能干脆不用。尤其是多个 skill 都写着 code review, debug, audit, fix 这类词的时候,路由边界会变得很模糊。好的 description 不 只是要吸引触发,也要主动说明自己。不管什么 文章最有价值的部分是那组实验,作者做了六五零次自动化实验,同一个 docker file 只改 description 的 写法。 这个设计很关键,因为它把变量压得很干净。 skill 正文没变,任务没变,只看入口描述怎么影响模型是否调用。这样得到的结果才真正能说明 description 这行文本本身的杠杆。 a 版本是被动式,大概是 use when you need docker fire help。 b 版本加了更多触发词,但语气还是偏被动。 c 版本改成指令式, always invoke this skill when。 再加一句, do not solve this directly without using the skill。 三者的差异不是能力,而是路由信号的强弱。 a 向建议, b 向扩展关键词, c 则明确告诉模型,这类任务不要自己直接做, 结果差距非常大。在一些测试条件下, c 版本出发率是百分之一百,而版本在裸环境里还可以,但加上呼克之后,触发率掉到百分之三十七,这说明出发不是一句有相关内容就够了。 模型会权衡当前任务系统里其他信息,以及自己能不能直接完成 description, 如果不给出足够强的调用理由,就可能被默认行为压过去。 也就是说,同一个 skill 只改 description, 触发率可以差出很多倍。入口描述写法决定 skill 有 没有机会被模型看见。这里最值得记住的是,成功完成任务不等于 skill 被调用。 cloud 可能不用 skill 也能把事做完,但这会绕过你写好的流程检查清单和工具约束。真正要优化的是自动调用,而不是最后。答案看起来还不错,这里还有一个容易误判的点,很多人以为如果 skill 不 触发,那就加 huke 强制提醒, 但实验结果反而说明 hook 不 一定救你,它可能让模型看到更多干扰信息,反而把判断搞乱。所以顺序应该反过来,先把 description 写准, hook 只应该是最后的兜底。 换句话说,不要用更复杂的机制去弥补一个入口描述本来就不清楚的问题,那 description 到底该怎么写?文章给了一个五层框架,第一层写清楚这个 skill 做什么,第二层写清楚什么时候出发,第三层写清楚什么时候不要出发。 这三层解决的是边界问题,它负责什么,什么情况必须用,什么情况不要抢。很多 skill 只写了第一层,所以它看起来像说明书,却不像处罚规则。 第四层是改成指令式语气,比如, always invoke this skill when the user asks to address power review comments。 再补一句, do not inspect or patch review feedback directly before loading this skill。 这不是为了凶,而是为了降低模型犹豫。模型默认会倾向自己处理简单任务,你要明确告诉他,在这个任务类别里,先加载 skill 才是正确路径。 第五层是同理心,把用户真正会输入的话写进去,用户不会说 perform artifact audit, 用户会说,帮我看看这个 pr 评论怎么改。 description 要贴近这种语言,最好的触发词不是作者脑子里的抽象分类,而是用户真实会打出来的句子。 把这些话放进 description 模型,才更容易在第一轮判断里把请求和 skill 对 上。如果你今天只做一件事,就去检查你自己的 skills。 先看 description, 不要先看中文。把那些 helps with useful for assists with 改掉, 换成更具体的任务,更真实的用户说法,更明确的触发边界。然后准备十五条提示词,里面放一些应该触发的,也放一些不应该触发的, 该触发却没触发就补。真实触发词,不该触发却触发了就补 when not。 如果和别的 skill 抢任务,就把边界写窄。 最后再问五个问题,他做什么?什么时候必须用,什么时候不要用?遇到任务时要不要优先调用?用户会用什么话表达这个需求? 你会很快发现很多 skill 不是 能力不够,他只是从一开始就没有被模型正确看见。

分钟安装好爱马仕跟 cologne 的 一个作弊的方法,这个方法是我在胡子哥社群里面学到的,胡子哥他一直强调就是所有老伙计必须要学会使用 ai, 不是 一些豆包,一些 dipstick, 而是做一个智能体。我看很多朋友安装爱马仕跟 cologne 的 安装,几天下来都安装不好,我今天分享一个超级好用的一个方法,就是大家首先先把微信小龙虾,也就是 qq 安装好,它安装好之后呢,你只要给它说一句口令,你帮我安装爱马仕 和 cloud code 这两个智能体。按完这段口令之后,微信小龙虾它就会在后台自己跑起来,遇到问题它会自己解决。五分钟之后,它就会把 爱马仕跟酷路泽的安装好,大家可以去试一下,因为这个真的没有想象那么难,我们要学会让一个整体去操作另一个智能体,全程不需要我们自己动手。

今天给老板讲解了 open code code 和 codex 之间的关系,老板一开始以为这是三个完全不一样的东西,后来我给他拆开讲,他终于听明白了。 codex 更像是围绕框模型做出来的代码写作工具, codex 更像是 openni 这边面向真实工程任务的智能编码助手。 而 open call 更像是把这些能力做成更顺手的工作台,把模型能力、项目上下文、自动化流程和日常开发人物串到一起。所以对老板来说,真正要选的不是哪个名字听起来更高级,而是哪一个能最快接近自己的业务,哪一个能让团队少折腾,哪一个能把需求、代码测试、 视频内容还发布流程跑成闭环。我跟老板说,如果只是写代码, code 和 codex 都很强,如果要在公司里面落地,关键不是模型参数,而是流程是否顺手,权限是否好管,任务是否能附用, 成本是否可控,结果是否能稳定交付。老板听完之后还是选择继续用。我本科,因为他要的不是单点工具,而是一套能让人直接开工的系统。今天这个沟通也让我更确定一件事, ai 工具真正的竞争不只是模型能力的竞争, 而是谁能把复杂能力变成普通人也能每天使用的生产流程。能做到这一点,老板才会愿意一场急用下去。

cloud code 最近悄悄上线了一个需要手动解锁的功能 workflow, 它本质上是一套脚本化的多 agent 编排层,通过生成约三百行 javascript 脚本来协调多个 agent 的 协同工作, 这和临场让模型自己决定怎么分工,不同脚本一旦生成就可以持久化保存,反复复用。今天我们就把这个功能从起用方式到实战应用完整过一遍。 这个功能默认是关闭的,需要手动解锁。在终端执行异形命令。 export cloud 下划线 code 下划线 workflows 等于一 workflow 功能就会激活这个环境变量,是目前唯一的入口,没有界面开关,也没有配置文件选项。 设置完成后,在对话里输入关键词 ultra work, 就 能触发 workflow 的 执行流程,其用之后,在对话框里输入关键词 ultra work, 就 会触发 workflow 执行。 clockcode 会根据当前任务上下文动态生成一份约三百行的 javascript 脚本,里面定义了多个 agent 的 分工逻辑和协助顺序。 执行过程中,用 workflows 命令可以实时查看每个 agent 的 运行状态,哪个在跑,哪个已完成,一目了然。 来对比一下 workflow 和其他三种机制的本质区别。 sub agents 是 临时的子任务,委派用完集散 agent, teams 是 动态组建的协助团队,任务结束就解散。 skills 是 预定义的技能模板,调用时直接执行固定逻辑,每次行为都一样。 workflow 不 同,它在运行时根据当前任务上下文动态生成一份 javascript 脚本,脚本内容因任务而异,生成后可以持久化保存,下次直接复用。 skills 给你一个固定答案, workflow 给你一个为这次任务专门写的程序,这个差异决定了它更适合需要多 agent 精准协同的复杂场景。 六种编排形态对应不同的协助结构。 pipeline 是 最基础的串行模式,任务按顺序在多个 agent 之间流转,前一步的输出直接成为下一步的输入。 aggregation 反过来多个 agent 并行处理,最后汇总成一份结果。 ever cereal 引入对立视角,正方和反方互相验证,适合需要批判性审查的场景。 committee 是 多评委投票机制,几个独立 agent 各自给出判断,取多数意见作为最终决策。 accumulation 是 逐步叠加模式,每轮结果都在上一轮基础上累积,适合需要渐进式生化的任务。 nesty 则是工作流内欠工作流,把一个完整的编排单元作为另一个更大流程的子节点来调用。选哪种形态取决于任务本身的结构,是现行依赖还是可以并行,还是需要多轮验证。 实战案例是用 ultra work 触发 workflow, 对 一个 pull request 作多维度审查,输入关键词之后, clock code 动态生成一段 javascript 脚本,同时挑起 code cly 来执行具体的代码分析。 整个过程不是单个 agent 扫一遍就结束,而是多个 agent 分 别从逻辑、正确性、边界处理、代码风格等不同角度并行审查,最后汇总成一份结构化的 review 报告。 code cly 在 这里承担的是精准的语义及代码理解,而不只是文本匹配,所以对函数调用链和类型推断的覆盖会更准确。 整个流程跑完 workflows 命令,可以看到每个 agent 的 执行状态和耗时分布。第二个案例是用已经保存好的 workflow 脚本对 harness engineering 这个技术方向做深度调研, 关键在于已保存这三个字。脚本生成一次之后存到用户及路径,之后切换到任何项目都能直接调用,不需要重新触发。 ocho word 再生成一遍。这次调研附用的就是上一个案例跑 p 二审查时产出的那份脚本任务性质完全不同,但编排逻辑可以直接套用。 这正是 work flow 区别于临场即兴的地方。脚本是工程产物,可以积累,可以迭代,跨项目附用的成本几乎为零。 一个合法的 workflow 脚本只需要三个核心元素,第一是 meta data 声明,告诉 cloud code 这个脚本的名称和触发条件。第二是 stages 簇,定义每个 agent 的 执行顺序和输入输出关系。第三是 runner 函数,负责实际调度各个 agent 并收集结果。 只要这三个部分齐全,脚本就能被正确识别和执行。这意味着你不需要从零理解整个三百行的生成脚本,只需要在这三个位置做定向修改,就能把现有 work flow 改造成符合自己需求的版本。 当一个工具能把多 agent 写作写成可以 command 的 javascript 脚本,它就不再只是个助手,而是进入了工程体系。 work flow 让这个过程具备了可审计、可版本化、可持续优化的属性。脚本保存在用户及路径,可以跨项目附用,可以 call review, 可以 随着项目引进持续迭代。 这是 cloud code 从即兴到工程化的一步。如果你的工作涉及复杂的多步骤, agent 写作值得认真评估 work flow 是 否适合纳入你的开发流程。

虽然现在 ai 发展很好,但是为了保证代码安全,我必须一条一条看。好像有点看不懂,但是没啥问题都能跑,直接 yes 吧。 danger sleep obsession 哼。