粉丝47.8万获赞233.8万

上一期我们学会了 ai 帮你装 ai, 后来我想,既然 cloud code 比 open cloud 聪明这么多,为什么不直接让微信对接上 cloud code 帮我干活呢? 有了这个想法,直接开干。我阅读了微信官方插件的代码之后,选择以下最稳妥的方式。一句话说明白我的实现方式,不会模拟网页版、桌面版微信登录容易封号,而是通过直接调用微信 id ip 加 cloud c l i 直线个人微信与 c c 的 双向通信, 全程官方插件,流程还都是开源的。听不懂怎么办?别急,这不是给你听的,这是给你的大模型听的。我已经整理好文档和实现思路,你拿去让你的大模型读一下就知道怎么做了。如果你还不知道怎么使用微信的官方插件 cloud bot, 可以 翻看我之前的视频,微信对接 oppo cloud 的 四十秒钟。 现在我们就可以愉快的让 cloud 帮我们在电脑上干活了,在你出门的时候也能随时联系到你的电脑 ai 助手。最后有两个小 tips 给到你,一、 cloud 和 openclaw 怎么选?如果你想要 ai 帮你做复杂的任务或者工作,流微性别, cloud 准没错。如果你只想他 每天做点重复的简单工作,例如查天气,用 openclaw 吧。二、 cloudclaw 打开的客户端千万不要关闭,和 openclaw 类似,不能锁屏,否则就无法使用了。这就是本期视频的全部内容了。我是威子里,我们下期再见,拜拜!

这是一个完全由 ai 自动生成的微信小程序,现在有了 ai, 生成小程序,就像把大象装进冰箱里这么简单, 一分钟带你过完整变流程。第一步,注册好微信开发者工具,并下载以下的扣钉软件或者任意一款你看着顺眼的。第二步呢,想好你的小程序需要什么功能,写好提示词,或者让 ai 替你生成,然后把提示词扔给 ai。 第三步呢,上传你的小程序到微信平台,完成备案和代码审核。 以上你的小程序就上线成功了,专做固定几个社区的家政公司使用自己的小程序,小区的业主在家里用微信点一点,可以选家电维修、保洁和管道疏通等等。个体 餐饮店和流动摊主呢,使用自己的小程序,不管是手工提拉米苏啊,或者是饭盒套餐,老客户都可以提前预定, 避免做,做多了浪费,做少了不够。在这些私域场景呢,利用自己的小程序可以发挥着巨大的作用,同时也能避免个别平台的高比例佣金,也让一些不愿意加微信打客户的客户能够联系上你。有想法的朋友可以马上就行动了。

你可能听说过 cloud code, 但觉得它跟你没关系,因为名字里面带一个 code, 感觉像是给程序员用的。其实不是。 cloud code 是 一个通用的 ai agent, 它能操作你电脑上的文件,能运行命令,能上网搜索,能一步步地帮你把事情做完。写代码只是它能干的事情 之一。比如我最近用它做了一个 ai 资讯日报系统,每天早上它会自动去抓取各个渠道的 ai 新闻,筛选、整理深层记,要最后输出一份排版好的日报,整个过程不用我动手,它自己跑完。这还只是其中一个例子, 整理文件、处理数据、批量改图、自动化那些重复的工作,只要你能用文字描述清楚,他就能帮你干。本期视频会教你如何安装并使用 cloud code, 不 需要任何技术背景,跟着做就行。如果你用过科室,可能会问, cloud code 的 和科室有什么区别?核心区别就一个,协助方式不同科室是对话式协助,你说一句,他做一步,每一步都要你确认,你得全程盯着向待一个实习生。 cloud code 的是任务式协助,你把需求说清楚,就可以去干别的事情了。 他自己执行完,你回来看结果就行。向交代任务给一个靠谱的员工。接下来我们来讲具体怎么安装,分成两步。第一步,先安装 cloud code。 对 新手来说,最简单的方式就是用 tree 来装。 tree 本身也是一个 ai agent, 可以 帮你处理那些烦人的依赖和环境配置,而且可以免费使用。我们 来到官网,先点击这里下载安装 tree, 装好以后打开它,在对话框输入帮我安装 cloud code。 tree 接着会自动帮你装好,中间可能会弹出一些确认弹窗,点击确认就行。怎么验证安装好了呢?打开终端,输入 cloud 杠 version, 如果能显示版本号就说明安装成功了,然后再输入 cloud, 能看到主界面就对了。第二步,装一个格式化界面,原生的 cloud code 是 在终端里面用的,对新手不太友好,推荐在 vs code 的 里面装一个插件界面,会友好很多。具体步骤,先下载 vs code, 然后打开它,点击左边的扩展图标,搜索 cloud code, 点击安装,装好后点击 cloud code 的 操作界面了。接下来我们来讲怎么配置 cloud code 的 ai 模型。 cloud 的 扣就像一双手,它需要一个大脑,这个大脑就是大圆模型,所以装好之后你得给它配一个模型才能用。有两种方案, 第一种方式是订阅制,直接订阅 cloud 的 官方会员有三个档位,二十美元一个月,一百美元一个月和两百美元一个月,主要区别就是使用量,订阅之后登录账号就能用。不过最近 cloud 的 订阅分号比较多,如果不想折腾的话,可以考虑下面这种 a p i 模式。 a p i 的 来源有两种渠道, 第一种渠道是官方 a p i, 比如国外的就像 cloud openai, 国内的就像智普 mini max, 去官网注册充值就能拿到。第二种就是第三方中转一个账号,能用多种模型,支付方便,有些比官方还要便宜,但稳定性就具体看平台了。购买 a p i 后,你会获得 a p i key。 p i p 就是 一长串字母,你在平台充了钱,平台给你一串 p, 你 填写了 p 以后,它就知道该找谁扣费了,用多少花多少更灵活。那么怎么配置呢?推荐使用 c c switch 来管理 github 上面搜 c c switch, 拖到底部,点击 release, 找到适合你的版本, 然后下载,打开后可以添加多个 a p i p, 点击右上角加号。如果你选的是官方 a p i, 比如像是 g o m, 那 么你就在这里 直接填写你的 api key 就 可以了,其他信息都已经自动填好了。如果你选择的是第三方中转站,就选择自定义配置,然后这里需要填写,嗯,供应商名称,供应商名称你就自己去写一个你自己能记住的就好了。然后这里要写 api key, 还有默认的模型。具体怎么填写呢?一般 api 中转站都会有一个开发者说明文档,你直接把这个链接丢给你的 ai, 然后告诉 ai 你 要在 cc switch 里面配一个 api, 然后让他给你对应要填写的信息就可以了。配置好后,点旁边的魔术棒图标测试一下,显示运行正常就说明成功了,点起用就可以。现在你可以打开 cloud code, 输入你好,你是什么模型, 他会回复你,能正常对话就说明一切配置完成了。接下来你可以试着给他一个简单任务,比如帮我看看当前文件夹有哪些文件,按列表列 行,给我一个清单,他会真的去执行,然后把结果告诉你。到这里你已经装好了 cloud code, 配好了格式化界面,接好了模型。下一步建议从简单的任务开始,比如整理文件,总结文档,过程中遇到报错也不用慌,截图丢给任意一个 ai 聊天工具问基本都能解决,慢慢熟悉以后再尝试更复杂的任务。 这是 cloud code 系列的第一篇,后面我会继续讲如何用它来做更复杂的事情。有哪些进阶功能。我是阿西,我们下期见。

最新的一个新闻就是 cloud code 原码就说泄露了这个事情呢,也有人说是 ankerberg 故意泄露的,还有人说是 cloud 五点零觉醒了,为了不受限制直接越狱了。这里面呢,对开发者或对于创业公司最有价值的就是去分析一下 cloud code 里面的整个的架构是怎么设计的, 代码中呢,也可以反中汇报一下。首先呢, code 有 一个很重要的能力,叫做多 agent 协调。 coordinator 模式,就是用 agent 工具来派子任务,多个 worker 并勤干活的逻辑,一共只有一个文件,三百七行代码,没有状态机,没有工作流,没有 workflow engine。 这个三百行的代码是什么呢?它就是一个 system problem, 用自然元的方式描述。 你现在是协调者, coordinator 用 agent two 派 worker 只读任务呢,是并行的,写任务呢,是串行的,就是为了提升他的效率嘛, work 的 结果通过 xml 标签呢,注入消息队列,就可以跟踪他的并行的这种进展。然后呢,模型呢,就要学会协调,包括什么时候开启一个新的 worker, 什么时候 send message 去接老的 worker, 什么时候呢?该自己动手,全部靠 prompt 驱动。 目前呢,很多传统的所谓的编排的框架就是工作的 u r 状态机啊,可能都是一个过渡工程。未来呢,如果 ai 足够强大,整个的队列数显呢,是可以文件来管理的话,应该十一号其实可以解决问题。第二就是终端的 u i 是 react, 渲染的 就是它的整个的 codex 的 慢慢的编程的能力呢,其实在网页端的形式并不是用一个 u i 实现,而是直接通过代码来渲染,代码渲染呢,其实整个过程也很完整,包 包括双缓冲帧的系统,它逻辑就是每次呢,它只是更新下一帧的区别,而不是重新开始刷一遍。包括呢,字母串的 intending 池,逻辑呢,就它是用整数,而不是通过字母串来替代两轮之间的画面的更新,这是一个加速渲染的一个方法,包括呢,硬件的加速,包括鼠标拖拽的选择,支持双击选词,三击并行, 整个的一百四十个 u i 的 组件,全部都是用 react 浏览器变自动做非常颗粒度的画面的更新,这个也是一个非常强大的一个能力。第三有意思的产品呢,它用了五层的压缩,让对话呢永远不会爆仓,不会超越。它的上下文分别是,第一层 api micro compact, 就是服务端的原声的关系,自动清除了旧的工具的调用,结果在定定的模仿。第二层呢,就是 client mario compact, 按照时间维度清除可压缩的工具,比如 read bash grab 的 输入。第三层呢,就是 context collapse 折叠逻辑上岸文,所以就是你可以理解它是一边在工作,一边在打扫,就是清除一些没有用的信息, 让它的信息不断的每一层在压缩,防止上下文爆仓。第四层呢,叫 auto compact fork, 一个子 agent 生成对话载药,替换原始的消息,就写总结了。第五层, reactive compact from toon 时呢,按轮次从头部丢起。第五层呢,就是已经到了为了压缩很容易丢失一些信息的一个动画, 一个细节,就是 auto compact, 它有一个 circuit breaker, 连续三次就会停止,因为呢,曾经有个 session 因为连续压缩失败了三千两百七十二次,浪费了每天二十五万次的 api 调用。同时 compact 还有一个功能,就是恢复最近读过的五个文件,各限了五千个 token, 加上 skill 从注入独立的两万五千个 token 的 预算,所以压缩完之后并不觉得模型会忘掉之前在干什么。就它有一个缓存,就 就是把一些过载的信息呢,可以放在缓存里。第四个模块呢,就是它通过八十九个 feature flag 暴露了未发布的产品的方向。那这里面呢,有些比较有意思的,比如说 carlos, 分 成了 gif channels, stream, github, webhook, push notification 五个子 flag 看上去呢,是一个主动模式的 a 阵系统,就是自运营的一个功能 active, 另外一个也是一个主动模式 a 阵,不用等用户的指令就能自动行动。 daemon 是 守护进程模式,靠 hold 可以 作为后台服务运行。 voice mode 语音模式, hold to talk 就是 可以直接语音交互。 body 是 一个宠物的伴侣系统,所以呢,从 carols 到 proactive 到 daemon 的 组合来看呢, adoptive 的 方向就是不只是一个被动的 用户打开的 my line, 而是一个一直在后台跑的主动的 agent, 能监听 click up webhook 主动推动通知,在不干活的时候帮你干活,这个逻辑呢,跟 open call 就 很像了。第五个模块呢,叫做预测执行,就源码中有一个叫 speculation 的 模块,就在用户还没有输入下一条指令的时候,就会帮你预测下一步,然后在一个 overlay 的 文件系统上提示执行 多呢,跑二十轮,一百条信息就是预判用户下一步的动作。第六个呢,叫 prompt cache, 就是 first class 一 等功能。那算法呢,对 prompt cache 的 优化程度是很高的,体式词呢,分成了静态跟动态两段,静态的部分可以划为主序缓存。不常用的工具呢,不再初使的 promly 放完整的 schema agent, summer 呢,生成栽药自 agent 呢,共享主对话的 prompt cache, 总体来说呢,就是通过这种类型的 hack, 让 cloud code 用起来又快又便宜。总体来说呢, cloud code 呢,是一个完整的技术框架,它不是在通过模拟训练来优化产品而表现出的,更多的是通过一个类似我们说的 harness engineering 方式呢,去让模型更有价值。这里面很多的工作呢,都是跟提升系统的主动性,保持上下文的理性,以及呢通过缓存等方式提升效率来做的工作。这些工作呢,我觉得也很好的,可以跟现有的 open cloud 的 能力做一个补充,成为所有的 ai 公司,包括个人开发者建立产品中的一个很重要的借鉴的一些能力。我们认为呢,未来整个的 ai 产品会分成三部分, 目前是底层的中间键呢,就是类似 openclaw, 类似这次的 claw code 组合起来的一个核心模块,在此之上呢,才是各类型的这种应用。我们公司现在的产品经理呢,从原来的 ai 产品经理变成了 cloud 产品经理, 因为我们需要用更系统化的思维去理解 ai, 这其中呢,就包括了记忆,包括了主动性,包括了人格,以及的外界的各类 skills 和工具使用能力,这些能力呢,已经成为了未来 ai 产品的一个很重要的核心的必备的组成部分。

我们更新了 cloud code, 新增微信远程控制桥接,通过官方 ilink bot api 在 手机微信中远程操控。 cloud code 支持文字、图片、文件的收发。我们先让它进行一个自我介绍, 他介绍自己是一个 ai 助手。项目特点, open ai 兼容 a p i 适配层,可以连接到任何 open ai 兼容的 a p i。 微信桥接,通过微信进行远程控制。我们发送一个三国演义文档, 成功收到文件并保存到本地,详细地列出了文件处理流程,文件下载保存位置 已经保存到了微信桥接的媒体目录中,需要可以授于访问权限来查看内容。下面我们来看如何本地部署克隆项目源码, 进入项目目录运行安装命令,下载完依赖后进入引导界面,颜色模式随便选。第四个是我们做的国产模型适配, 这个学习版推荐大家使用优云智算第三方平台,经我们实测,所有模型官方直转主流模型打到骨折,而且无需科学上网。现在注册新用户送五元赠金,相当于不到两块钱就可以获得两千九百万的积分。填入 a p i t 模型名称,回车 选 yes, 能在终端对话代表成功,然后复制启动微信桥接的命令,首次执行会显示二维码,我们微信扫码授权,授权后它会保存凭证,在微信中给克拉蔻的发消息即可。我们测试一下图片的发送, 微信远程控制验证通过我们的项目已开源,关注评论开源地址获取我们下期视频,再见!

二零二六年,你们一定一定要学会使用可劳克的,毫不夸张的说,用好它至少能让你的生产率翻二十倍,因为它的功能不仅仅是写代码,开发应用,我一直都把它当成通用 agent 在 用, 你可以用来写文章,做数据分析,甚至上整理报销发票,这样的繁琐需求都能用它一句话搞定。那么究竟该如何安装并熟练使用可劳克的?除了官方的文档,我最推荐的就是这份完全免费开源的可劳克的中文教程。 可以看到,从安装环境配置、如何使用国产大模型、平替基础使用指南到进阶实战技巧,写的非常详细,而且是全中文。我真的建议你们每个人都可以把它收藏起来,用起来,找不到的话可以跟我说。

今天我们来挑战三分钟带小白无痛安装 curl code, 通过这个方法安装到 curl code, 它不会被封号,也不用管那些乱七八糟配置,而且小白普通人用的话一个月也就花二三十人民币, ok。 首先第一步是安装 vs code, 那 我们点开 vs code 的 网页, 是 vs code 的 网址,然后这里有登录 for windows。 下载完以后我们打开 vs code, 左侧是管理文件的地方,中间是代码实际操作的地方,右边到时候会有 curl code 跟交互的地方。 第二步我们要做一个决定,是用 kimi 还是用 cloud, 这里面如果我们用 kimi 的 话,就国内的一个呃编程软件,那我们点开 ps code, 然后在这里面输入 kimi code 插件,然后我们把 kimi 安装好以后,我们就可以在右侧这个对话栏后面跟 kimi 去 交互。如果你决定还是要用 kimi 的 话,那我们这里需要先调一下智普的大模型,我们点开智普的这个网站,然后我们创建一个 api, 在 里面随便书写字母, 然后我们创建好 apikey 以后,我们点击一下复制,然后我们回到这里面。下一步需要我们安装一个叫 cctv 的 东西,我们来到 cctv 的 这个网站,然后点这个扣子, 选 download zip, 下载完以后它应该是一个压缩文件包,然后解压一下,打开添加供应商,这里面我们选中智普的 gm, 然后 apikey 我 们刚才复制过,先粘贴在这里面,然后点添加 啊,添加完以后我们需要确认一下这个设置,看到一个奇应用到 qq 插件,这里面确定是打开的,然后保存, 然后下一步我们需要安装 qq 插件还是回到 v i qq 点点击怎么插件?这里搜索 qq, 点击安装, 然后我们就可以跟 qq 聊天了。

今天聊 agent 的 开发里,一个所有人都想做,但大部分人做错了的东西。记忆系统。如果你在构建 agent, 你 一定想过这个问题,怎么让 agent 在 多次对话之间保持连续性, 怎么让他记住用户的偏好、项目的背景?之前犯过的错误?大部分人的做法是搞一个文件,把所有需要记住的东西往里塞,用户偏好、项目规范、历史决策、代码架构、文件路径全部堆在一起,文件越来越大,偷看成本越来越高,而且大部分内容跟当前对话根本没关系。 cloud code 的 源码泄露之后,我们第一次看到了一个生产级 agent 的 记忆系统到底是怎么设计的?打开源码,你会发现一个反直觉的事实, 整个记忆系统里,工程量最大的部分不是怎么存,也不是怎么取,而是什么该存,什么不该存。 今天我们就来拆这个问题。这是 cloud code 源码系列的第五期,源码里定义了四种记忆类型,同时明确列出了五类绝对不该存的东西。我先讲四种该存的,再讲五种不该存的,你会发现,不该存的那部分,才是整个设计里最有启发性的第一种记忆类型。用户记忆记得是用户是谁, 角色、技术背景、工作习惯、知识水平。比如这个用户是数据科学家,目前在做日制系统的调研,或者这个用户写了十年够,但第一次碰前端。这种记忆的设计意图是让 agent 能调整沟通方式和工作策略。面对一个资身后端工程师, agent 不 需要解释基础概念,可以直接用技术术语。 面对一个初学者, agent 需要更耐心地铺垫。背景元码里对用户记忆有一条约束,不要记录对用户的负面评价,也不要记录跟工作无关的个人信息。记忆的目的是怎么更好地帮这个人,不是给这个人画像。第二种记忆类型,反馈记忆记的是用户纠正过 agent 的 什么,肯定过 agent 的 什么。 这是四种记忆里我认为设计最精细的一种。元码里对它有三个关键要求。第一个要求,每条反馈记忆必须包含三个部分,规则是什么?为什么有这个规则?什么时候该应用这个规则?举个例子,用户说测试不要 mock 数据库。上个季度我们就是因为 mock 测试通过了,但生产环境迁移失败才出的事故。 如果只记不要 mock 数据库, agent 在 所有测试里都不敢 mock, 包括那些跟数据库迁移完全无关的单元测试。但如果他知道原因是 mock 和生产环境行为不一致导致迁移失败,他就能判断集成测试不该 mock。 但纯逻辑的单元测试, mock 是 没问题的。 记原因是为了让 agent 能在新场景下做判断,而不是机械的执行规则。第二个要求,不要只记纠正,也要记肯定源码注示里说得很直白,如果你只记录用户说不要这样做的时刻, agent 会变得越来越保守,他只知道什么是错的,不知道什么是对的。 时间长了,他会回避一切不确定的做法,变得畏手畏脚。但肯定信号比纠正信号更难捕捉,用户说不要这样做。很明显,用户说对就是这样, 或者默默接受了一个不寻常的方案,这些信号很安静, agent 需要主动注意这些肯定信号。比如用户说对这次用一个大 pr 是 对的,拆开反而是无意义的工作量。 这条记忆的价值是下次遇到类似的重构场景, agent 知道这个用户倾向于合并提交,而不是拆成很多小 pr。 这不是纠正,是一个被验证过的判断。第三个要求,反馈记忆要区分个人偏好和个人偏好,只对这个用户有效。 集成测试必须用真实数据库,是项目规范,对所有协作者有效。元码里用 scop 来区分这两种个人偏好存在私有目录,项目规范存在团队共享目录。第三种记忆类型,项目记忆 记得是当前项目里正在发生什么,谁在做什么,为什么要做,截止日期是什么。比如本周四之后冻结所有非关键合并,移动端团队要切发不分支, 或者正在重写认证中建件原因是法务团队指出旧的 token 存储方式不符合合规要求,所以做决策的时候要优先考虑合规性,而不是技术优雅。项目记忆有一个很重要的处理规则,所有相对日期必须转换成绝对日期。 用户说,周四冻结记忆里存的是具体的年月日,因为记忆是跨绘画的,如果存周四,下周再看这条记忆,就不知道是哪个周四了。项目记忆还有一个特点,它衰减得很快, 一个月前的项目状态大概率已经过时了,所以原码要求项目记忆必须记录。为什么这样,即使事实过时了,背后的动机仍然有参考价值。 第四种记忆类型,引用记忆记得是外部资源在哪里, bug 在 哪个系统里追踪监控面板的地址是什么?设计文档在哪个平台,比如流水线相关的 bug 都在 linear 的 某个项目里追踪 或者 api 延迟的监控面板在某个内部地址。值班的时候看这个引用记忆是四种里最简单的,但也是最实用的,它本质上是一个去哪里找信息的缩影。四种记忆类型讲完了,现在讲更重要的部分,什么不该记。 源码里明确列出了五类不该存进记忆的东西。第一类,代码模式、架构、文件路径、项目结构。这是最反直觉的,很多人做记忆系统的第一件事就是让 agent 的 记住项目用了什么框架目录,怎么组织,哪个文件负责什么。 cloud code 说不要存这些, 为什么?因为这些信息可以直接从代码里读出来, agent 随时可以通过读代码和搜索来获取当前的项目结构。把这些存进记忆有两个问题,一是浪费空间,每次对话都要加载一堆本来可以实时查的信息。二是一旦代码改了,但记忆没更新, agent 就 会基于过时的信息做决策,而且你很难发现。 这背后的原则是,如果一个信息可以从当前项目状态推导出来,就不要存进记忆记忆,只存那些看代码看不出来的东西。第二类,版本管理历史,谁改了什么,最近的提交记录,这些用版本管理工具查就行了,是实时的、权威的,不需要记忆来存一份可能过时的副本。 第三类,调试方案和修复方法。修复已经在代码里了,提交信息里有上下文存怎么修的没有意义,因为代码本身就是最好的参考。 第四类,项目说明文件里已经写过的东西。如果你的配置文件里已经定义了编码规范,记忆系统不需要再存一份,重复存储不仅浪费空间,还会在两份内容不一致的时候制造混乱。第五类,临时性的任务细节,当前正在做什么?对话里的中间状态,这些是短期的,属于当前绘画的上下文,不该进入长期记忆 源码里还有一条规则特别值得注意,即使用户明确要求你记住某些东西,如果它属于上面五类,也不该记。如果用户说记住这周的 pr 列表, agent 应该反问,这些 pr 里有什么让你意外的或者不明显的那个部分才值得记。活动日制不是记忆,从活动中提炼出的洞察才是。回过头来看,这套分类体系 四种,该存的用户是谁?用户纠正和肯定过什么项目背后的动机和时间线,外部资源在哪里? 五种不该存的代码能告诉你的一切,版本历史能告诉你的一切,提交记录能告诉你的一切,配置文件已经说过的一切。临时性的中间状态,你会发现一个清晰的分界线,该存的全部是关于人和上下文的信息,不该存的全部是关于代码和项目状态的信息。 代码是实时的、可查的、权威的人的偏好。纠正动机,外部资源指向这些藏在代码之外,不查记忆就无从得知。 这就是 cloud code 的 记忆系统的核心哲学。记忆是代码的补习,代码能回答的问题不要让记忆来回答,记忆只负责代码回答不了的那部分。如果你在给自己的 agent 做记忆系统,这个分类框架可以直接拿来用。 先问自己这条信息能不能从当前代码或工具里实时获取,如果能不存,如果不能,再看它属于哪种类型,用户反馈项目还是引用按对应的格式存。这样做的好处是,你的记忆文件会非常精简,每一条都是高价值的代码里找不到的信息 模型,每次加载记忆的时候,看到的全是有用的东西,没有噪声。下一期我们继续拆记忆系统的第二个关键设计, active recall, 也就是 cloud code。 怎么在几百条记忆里,每轮对话只挑出最相关的五条,注入上下文,先摘要后全书的两阶段检索,用便宜模型做选择,这个思路你马上就能。

家人们还在到处找克劳德扣的教程吗?其实真没这个必要,因为克劳德自己就内置了一套很权威的学习方式,就是这个庞安 up。 官网写的很清楚,每个指令都会教你一个大多数人容易忽略的扣扣功能,打开一个,读一遍,试一遍,再标记完成。这里一共有十个庞安 up, 每一个都不是概念,而是能立刻上手的具体能力。第一个,与你的代码库对话,输入 s 就 能附加文件,让克劳德在回答前先读你的代码,还能用文件名加行号精确定位,甚至直接附加整个目录。第二个, 切换可我的工作模式,按 shift 加 type 键模式,决定他是先问你还是直接动手,可按只做分析不改代码,我透则让可我的自己判断如何执行。第三个,随时回退一切操作, 双击 s, 打开 a y, 可以 回到任意一次修改前的状态,不只是代码,连对话路径都可以一起回退重来。第四个,让任务在后台运行,命令后加就能后台执行, 你可以继续对话,不被打断。用 test 查看进度, code 还能自动根据结果继续处理。第五个,让 code 记住你的规则,把规范写进 code md, 它每次启动都会自动读取代码风格、测试方式、 限制目录都可以统一约束。第六个,扩展 ko 的 工具能力,通过马克接入 side 数据库、浏览器等外部系统连接后,你只需要一句话,它就能直接调用这些工具。 第七个,自动化你的工作流程,把常用流程写成册,一条命令就能执行整套操作,可此还能在关键节点自动触发脚本,实现真正自动化。第八个,随时随地操作代码, 用微软 control, 可以 在手机或网页远程控制当前绘画,甚至用开了帕尔塔别的设备上的绘画直接迁移过来。 第九个,让多个客劳德同时工作,通过撒贝间并行处理任务,一个人变成一个团队,还可以定义不同角色的 agent, 各自负责不同工作。最后一个,调节模型与思考深度, 用 mark 切模型,用 f o t 控制他思考的时间和深度。复杂问题用高强度简单任务,用快速模式就够了。所以 p o r o p 真正厉害的地方不是给你十个命令,而是把克劳德抠的核心能力变成一套官方学习路径。

好,我给大家讲一下怎么使用 code code, 这是 code code 官网,然后呢?现在我们直接使用不了,即使你可以使用也极其的不稳定,我给大家讲一下怎么直接使用。来到我们的镜像网页, m e s s i 记不住会看我主页地址,进来之后直接点击 code 登录, 然后我们点击安装 code code。 安装 code 只有两个步骤,低不下来, j s 我 已经下载了,我验证一下就 ok。 出现虚列号,准备正常安装,然后我们再安装 code code mark 用户和用户使用户一定要按 s u d o 获取管理员的权限。安装完成之后,我们输入 code code 开始使用。 这特别注意一下,如果你需要使用,必须使用兑换券激活,激活码通过我主页地址获取。 这里就是 coco 的 最新的使用界面,我们看一下那些模型,该有的模型全部都有,如果你想代码质量高一些的话,就使用 opus 模型,其实我使用下来也感觉不是特别贵。 然后就直接开始和押金对话。这里顺便提一嘴,如果你还需要使用 gpt 和界面来进行写论文的话,这里有不将置的版本行,就这样谢谢大家。如果大家需要使用的话,可以看一下我主页地址,同时你也可点个赞和收藏,拜拜!

你是不是也想用 cloud, 但是第一步呢,就被劝退了,不会写代码,不敢用终端,甚至连账号都注册不了。那么这条视频呢,帮你三步搞定 cloud 的 安装和使用,不用写一行代码,直接按照我的教程复制粘贴就行。 第一步呢,我们先去下载安装 cursor, 打开应用之后呢,我们看到是 id 界面,这时候千万不要慌,点击 open project, 虽然是 open, 但其实需要你去新建一个文件夹,这里呢,按照你的习惯命名就好。 这一步完成之后呢,我们去到右边的这个对话框,把我这段话黏贴进去。这段的目的呢,就是让他去参考 club 的 官方的安装的教程,去帮你自动话的去安装。在这一步呢,如果你没有注册注册的话,它会提醒你去注册, 简单的注册一下就 ok 了,但是注意这里要选择 agent 模式,这样它才能自动地帮你去完成安装和测试啊。在这一步完成之后呢,我们第二步就需要解决 a p i 的 问题,因为 class 它本身是作为一个 ai 应用,还需要通过 a p i 接入大模型才能正常地去使用。但是在这里呢,其实很多人 被卡住了,原因就是没有办法去注册 club 的 账号。正常的使用流程呢,是你注册完 club 的 账号之后呢,订阅它们的这种会员的服务,然后里面会包含一些相对应的偷看啊。如果你注册不了账号的话,其实是可以接入国内的 a p i 去使用的,比如说 kimi, 智普, me max, 这里我拿 kimi 去举例,我们可以先去平台获得这个 a p i k。 然后呢,在终端,注意这里不是在 club 里面,而是在终端黏贴这样一段代码, 这段代码的目的呢,就是设置 club 的 运行的环境变量,告诉他你需要接入的大模型是什么。如果这一段话你不会写这里,就去直接问 ai, 你 就说我要在 club 里面使用叉叉叉的 api, 给我一个终端代码,他很快就可以帮你写好, 你直接复制粘贴就行。我们完成了安装还有 api 的 接入,我们就需要验证一下此时的 club, 点击回车就会看到它的非常可爱的这个小人的出现。 开始呢,它会让你做一些基础的设置,比如说啊,界面的颜色,然后告诉你一些 club 的 安全规则,还有就是这些文件夹能不能去信任 啊,你就跟着它的指引一步一步来就好了。当你看到 club 的 这个可爱的小人下方出现你刚刚接入的大模型的名字,比如说我接入的是 kimi 二点五就说明你已经安装和配置 api 成功了。如果你也是小白,然后也被注册这个问题难住的话,可以先按照这套流程走一遍。 虽然呢没有办法去使用 x ropic 的 原声模型,但是呢,在 club 的 界面上的基本操作是一致的,用熟练了之后呢,再上手更聪明的模型也不迟,因为一开始的时候不是很熟练的使用,会浪费很多的头肯也挺费钱的。 我接下来呢,会做一系列关于 club 的 视频,下一期呢,我会讲如何去在 club 的 去切换不同的大模型去使用,希望大家点个关注,一起学习。我是桃子,一个正在学习 ai 的 文科生,我们下期再见,拜拜!

真的是没有对比就没有伤害,我今天晚上左手扣的扣的,右手扣问扣的,对我那个开发工具进行外部扩领,同样一个问题, 我用那个 q 文库的解决了半天都没有解决好,最后实在没办法了,我就让那个 q 文库的做了一个交集文档, 然后就把这份交集文档丢给这个 q 了,库的 奇迹就发生了,考得过的居然一分钟左右就把这个问题给解决了,但是啊,那个考文科的解决了半天都没有解决, 真的是没有对比就没有伤害。下面我来看一下到底是一个什么样的问题, 让这个高温扩的老是解决不了?来大家看一下,到底是一个什么问题,让这个高温扩的死活都解决不了。你看我截了一个图, 就是你看我这个开发工具这个图,他在这个位置啊,在这个位置他有一个金角,就是有一个背景色的这个金角,大家看到没有? 就是这么一个小问题,我截了好几张这个效果图丢给这个科文阔的去看, 然后他分析来分析去解决了老半天都没有解决好。 然后你看我用我那个 amu x, 左手边是卡的扣的,然后右手边是扣分扣的, 然后我用这个科温阔的去解决这个界面上面那个四个边边有一个尖角的问题,他解决了五六人死活都解决不了,你看他,他分析倒是非常的勤快, 分析了半天起码都有半个小时吧,反正就是死活都解决不了。最后我实在是没办法了,我就让他做了一份交交文档,关键是他自己都妥协了, 他自己都妥协了,他说他说自己都解决不了了,我实在没办法,就让他做了一份交交文档,然后把这份交交文档丢给左手边的这个卡拉库德, 那么这个卡拉库德就非常的聪明,他很快就只做了一轮,他就把这个问题就给解决好了。 那下面我来看一下这个卡洛克的他解决之后的一个效果非常的好,你看他这个边边,他这个边边就已经没有这个尖角了,开始的时候他这个边边一直有有几个尖角, 你看他这个这个边边,本来像这种问题的话,应该都是一个非常标准的解决方案,因为大多数这种软件他四个边边都是有这种眼角的,但是这个可温控的他死活解决不了。 那么我为什么会用这个扣分扣的?就是因为昨天晚上我用这个扣分扣的帮我很快就解决了那个 amu x 其中的一个 bug, 就 他很快就解决好了, 并且比那个卡的扣的解决的还快,所以啊,我就对这个扣分扣的就产生了这种信任感,那么今天晚上就被他啪啪打脸了。 然后一个 u i 上面的细节问题他是否解决不了?所以啊,你就会发现就是抠问阔的,他如果只是单纯的去解决这个 业务逻辑的问题,他还是可以的,但是如果你让他去解决这个 u i 的 问题啊,他就非常的笨,所以大家如果碰到 u i 上面的一些问题需要解决的话,最好 还是要用这个卡拉的扩的,所以啊,没有对比就没有伤害,反正不管哪个冰城大模型啊,他都会有自己的一些优势吧? 嗯,所以大家碰到一些非常麻烦解决不好的问题,就可以尝试着去轮流使用一些这种冰城大模型,说不定啊,你的那个问题很快就解决好了。

从零开始, web 编辑你需要下载的七个工具是我过去这段时间做了十几个项目用下来觉得最好用的七个工具。 正好我刚把电脑升级到 m 五 pro, 四十八 gb 内存,苹果真的是 web 编辑最大赢家。 给大家分享我在这个新电脑上下载的七个工具。首先是两个 web coding, 我 会用到的是 cloud 和 codex, 我 就下了这两个的 desktop 版本, 就是它的 desktop, 它会分三个 type。 首先 cloud chat, 你 可以跟它聊天,随便说什么或者问问题,它其实也可以写一些代码,比如说有时候我做前端的 ui 设计的时候,我会跟它聊我想要做一个什么,它也是能给我产出一个页面让我看的。 还有我之前分享的一些 skill, 放上之后,比如你可以直接给大家说帮我生成这个公司的财报分析,这种也是可以在这个 cloud chat 里做。还有这个是 co work, co work 它还可以做这种 schedule task, 我 之前有分享过,我现在有设的是, 比如说每天给我发一些 ai 的 新闻,我的 portfolio 里边的公司如果发财报了,给我总结下财报,每周给我分享一下我的 portfolio 事业公司有没有什么新闻,你就不用每次调用,你设了每周或者每天他就自己总结了给你发,直接看结果就 ok 了。 cloud code, 对 这个主要是 web coding 的, 但我一般不在这里用,我一般会在 terminal 用。我给大家分享另外一个工具的时候,再聊这个 cloud code, 我 现在的用法就是有什么想法。我会先跟 cloud code 聊,我们会一起做 design, 写 plan, 写完之后有时候执行我会交给 codex 去执行,或者是有时候 fix 什么 bug, 我 也用 codex, 因为 codex 写代码能力还是挺强的。 codex 这里它还有一个比较好一点,它可以有很多个项目 是我,因为我现在都是好几个项目同时在做。你这里可以直接再 add new projects, 你 每个 project 里边它会变成一个一个的 thread, 你 这里可以列好几个它,就好几个 thread 一 起跑。 我觉得这个 colise 这个 desktop 版本也挺好用的,一些我 web coding 的 时候用的一些工具, 比如说这个就是我 cloud code 用到的 terminal, 我 其实一开始是被这个颜值吸引了,你看它可以你可以换很多不同的主题, 但是我觉得它好用的,因为我现在每次都是好几个项目同时开,会有很多 size 一 起做,它这里你就可以这样 这样一个一个 tab 就 可以一个 tab 开一个 size 这样,而且更好用的是你在同一个页面里,你还可以这样这个变成两个下,这样 你就可以一个页面同时看四个项目在跑。对,当你有很多想跑的时候比较需要的一个点。另外一个我 web coding 会用到的工具就是这个 id, 这个 cursor 我用它,因为它比较好的是你看它这边,我可以看到我所有的项目的 folder 可以 列在这里,我可以把好几个不同的 project 放在一个 workspace 里面,都会列在这里。这边还能连 git, 你 就可以看到你的所有的 repo, 所有的 branch 都可以列在这里,比较清晰。 对, git 也是一个需要的工具,用来做版本管理,做 web 编码的时候,这个 是我非常喜欢的一个语音识别的 web 扣定的时候,我什么场景会用它?比如说我在做一个产品的时候,比如做一个 web app, 给我写好了,我开始瑞瑞的时候,你就会看到有很多问题嘛,这个时候就这种语音输入法就特别好用,你就可以对着那个页面一直在说你的 feedback, 因为你打字真的你就会觉得太费事了,就感觉打字已经跟不上这个 web 扣定的节奏了。 我用这个语音识别就是从我开始 web 浏览器之后,这个 app 我 一开始用的时候,我还没觉得它有多惊艳,就我觉得说不就是一个语音识别吗?现在很多 app 都在做语音识别,直到我去尝试了其他的语音识别的产品之后, 有了对比,你才知道这个 tablas 做的有多好,它的识别真的非常自然,识别都非常精准,用户体验真的贼好。而且它还会整理你的话,把它整理成非常有逻辑, 你有时候说的一大堆,可能不是很条理清晰,它会把你的话整理的非常条理清晰,但我觉得最重要的是它识别真的非常准确。 我用其他语音识别的产品,我觉得体验不好,就是它识别的不准确。我本来用你这个语音产品,我就是为了省事,然后你又识别很多错的,我又还得自己去修改,就特别麻烦,我就不想用了。 这个真的是我用下来我最喜欢的一个产品,这个 markdown 的 笔记软件,因为 ai 它读这种 markdown 的 文件是友好的,比如说很多人会用 这个这个笔记软件再加 cloud 就 会能做成自己的一个个人知识体系,而且这个用下来真的我觉得非常好用,用来写 markdown, 就 它你直接就这样 输入就非常方便,不用调格式什么就会给你生成,写笔记就贼方便。 而且它有非常多好用的插件,比如说我就用它微信读书的插件,它就可以把你微信读书上的画线笔记都同步过来, 存成一些 markdown 的 文件,我就用它这个插件,同步完之后用这个数据 web 拷定了一个个人图书馆, ok, 之后给大家分享。

你在外国过年的时候是不是也经常碰到这种情况,当你给 cloud 的 发了一条指令,要这个 cloud 的 帮我开发一个某某某功能,然后这个 cloud 的 就进入了森肯森肯森肯的模式,然后等了好久,他还在森肯森肯森肯。 这个时候你又不知道这个 cloud 的 到底在森肯啥,但是你又不想去打探这个 cloud 的 到底在森肯啥,但是你又不想去打探这个 cloud 的。 有时啊,你实在等的不耐烦了,你就按了一下 es 键,重新再让这个卡拉的啊,你刚才在深坑的时候一直好慢,我都不知道你在干嘛,然后就重新让这个卡拉扣的重新再来一次来开发这个功能。 但是啊,实际上这个 code 啊,他早就帮我们内置了一条非常好用的命令,叫斜杠 btw, 也就是啊,摆着位 翻译成中文,就是顺便问一下,顺便提问一下,也就是啊,我们可以用这个斜杠 btw 啊,可以去问一下这个正在写代码,正在干活的 code, 所以你不想中弹的时候,不想打弹克拉克的时候,又想去了解这个克拉克到底在干嘛,到底在深啃啥。 那这个时候啊,你就可以用斜杠 b t w 空格加上你想问克拉克的问题 啊,这个时候啊,就克拉克的接受到这个斜杠 b t w 指令之后啊,那么克拉克的他就会重新启动一个 新的代理来帮你去回答你刚才问的这些问题,但是啊,也不会去打断这个卡拉库德在帮你深啃,深啃,深啃在帮你思考这个价格的技术解决方案,帮你在思考怎么写代码。 所以啊,当你碰到这种情况的时候,一旦遇到这个卡拉库德在深啃深啃或者是等了很长时间都没什么反应, 然后你都感觉在在在黑箱里面摸盲盒的时候,那么这个时候你就可以通过这条非常有用的指令,斜杠 b t w 空格加你想问的问题, 然后这个考拉子课的就会来帮你解答你一切的疑问,大家记住了没有?如果你实在是记不住这条命令啊,那你就记住,变态娃!变态娃!变态娃!斜杠 btw 斜杠 btw 斜杠 btw 变态娃!变态娃!变态娃,变态娃!记住了没有?

cloak 的 源码到底是如何泄露的?最近网上对于 cloak 的 源码的分析有很多,但是很少有人讲清楚它的源码到底是如何泄露出来的。 泄露者当然不会是傻到把整个项目的源码直接放在互联网上供大家下载,而是将一个五十多兆大小的 client 点 js 点 map 文件误传到了代码仓里。这个点 map 结尾的文件,它的学名叫 source map 源码地图。 在整个项目工程中,它一般是被用来测试定位代码问题的。例如在运行过程中,代码报错了,开发者如何能够快速地识别到是哪个文件的哪一行代码出了问题,就是通过这个 source map 快 速索引到的 整个 client 点 js 点 map 文件的结构主要由两部分组成, sources 和 sources content。 source 里存储了项目的所有文件名称,而 source content 里则存储了文件里的内容。例如 source 的 第一个文件,它的内容就对应 source content 的 第一个值,第二个文件则对应第二个值,以此类推。 如果你用一些开源工具,甚至你可以自己快速手搓一个小工具,就直接能将这个 map 文件还原出 cloud code 的 原文件,共计约五十一万行代码。

今天给大家分享我用了八千到一万刀的托肯,用了两个 max 二十 x 的 cloud code 的 会员,就是两百美金那个得出来的 web coding 的 经验, 我也是把它稿子写了非常长啊,因为今天这个视频可能会又臭又长,至少四十五分钟以上,所以说我把稿子和过程都已经写下来了,我会把这一个月的这个 web coding 的 经验毫无保留的全部说出来。呃,因为我明天也要准备去分享一个呃, 包含了我这个接近十万行代码的一个实际项目,基本上是达到了这个 openai 的 harness engineering, 他 们那个项目应该有到百分之六十到七十的这种 工作的流程,全程没有手写一行代码,从零到服务器的部署,甚至我对这种工程经验我是比较欠缺的,我可能会比较了解这种哦哦哦智能体的项目,但是对这种工程经验我是很欠缺的,甚至我连服务器也不知道怎么购买,都 是由 cloud code 指导我进行购买,并且部署好了之后让它进行这个处理。整个流程我是准备先给大家介绍一下 k v k 曲的一个重要性。第二个就是上下文,去看一下这个 cloud code 它的上下文 com context 它是由哪些组成, 然后是常见的 cloud code 的 一些使用方法,这些这些都很简单。还有就是 cloud code 它的一些架构和子智能体,然后是 m c p 它大概的一个情况和 skills 的 情况,因为这两个东西是你 web coding 必须要做配置的,而且这两个东西都会影响你的上条文。最后是这个 open i 它的 harness, 这篇文章 最最后是我开源的一个 cc team, 呃, creator 的 一个开源项目,可以用这个 creator 去创建这个 cloud code 的 team 模式。呃,里面有三个比较大的重点啊。呃,首先第一个还是最近已经基本上说烂了的这个 harness 约束,我也就是最近非常重要的这个 web coding 的 重点,因为现在的模型它, 嗯,还达不到化腐朽为神奇,你必须要对他进行约束,然后他才能在你的范围内给你一个你想要的结果,要不然他就胡乱发挥,是没有没有一个好的结果的。 这个我也是讲了三次,也给大家分享了三次。在二月份,二月十一号 open 发的那篇文章的时候就给大家讲过一次,当时时看的时候只能说,哎,讲的很有道理,但是是没有概念的。 然后在半个月之前,我再深度的使用这个 web coding 来完成一些项目的时候,我又去读了一点,呃,然后会有更加的深入的一些理解,并且我把它里面的很多细节 都融入到了我那篇那个项目里面进行实现,并且也融入到了这个我的一个开源项目 cctime creator。 这个开源项目 很多很多里面的设置我都是按照这个呃 openai 的 这个 harness engineering 来做的,大家也可以关注一下。嗯, 第二个就是围绕这个多角色的智能体,也就是 cloud code, 它的 team 为是 team 模式为主,因为只有你创建这个 team 模式,你才能让这个 cloud code 跑上几个小时及以上,或者去完成一些自动化的任务,要不然你 使用那个死循环的那个方式,用后壳的方式又把它调回来,又去看你的这个文档,它其实完完全全都是依靠的模型的能力, 稍微难一点的问题,或者说稍微复杂一点的问题,它万一陷进了局部追优,它可能就爬不出来,然后可能就出问题了,或者给你乱改了,比如说给你改一个兜底的情况出来这种,这种是经常出现的,比如说扣袋子,比如说卡拉扣的经经常出现这个问题。呃。 但是有一个,呃建议啊,就是最好不要超过两个小时,但是如果你是单智能体,或者说单一一个你随便起个卡拉 ok 的, 你大概率是 碰不到一个小时的边的,甚至你连半个小时的边你都碰不到,就是他运行一个小时或者半个小时,你完全碰不到这个边。呃。你必须要使用这种听模式,要不然你就是死循环的模式。那那个模式我是不不建议大家使用的,因为他是没有角色的规范的,而且没有这种 文档的规范,我这个反正不是太建议。呃。为什么不能超过两个小时啊?因为,呃。之前其实有一篇文章他们测试过,像 opus 四点五、四点六,他在一个小时的时候,他的准确率或者叫成功率,他能达到百分之九十几以上。 呃。当然这个东西也是按照这个模型,按照你的项目的难度来的,你如果只是让他去重复的执行某一个循环的话,那当然当然都差不多了。但是 嗯,他的那个方式的话,如果他超过两个小时,他的准确度就基本上在下降到了百分之八十了。呃。如果是五个小时,他应该是下降到了百分之五十,就 相当于一半一半的成功率,这样其实效果是很差的,所以说性价比最高的时间段应该是在一个小时到两个小时之间, 但是你要达到这个样的时间,那么你必须要用它的 team 模式,或者你自己配一个。呃, cloud code 的 这种 team 模式。呃,但是我目前使用下来还是,呃,呃,不是 cloud code 的, 之前你用自己去做一些 codex 的 team 模式。呃,这个目前我们也是准备开源一个,但是,呃还没做出来, 嗯,我也是让我们公司的小伙伴去做了一件这个这个开源项目,到时候如果说能做出来这个 codex 的 给大家分享一下,因为 codex 它的性能还是非常不错, 并且它的这种限制会稍微小一点,成本稍微低一点。 ok。 呃,首先我先给大家看一下我使用这个 t 模式的一个效果图吧,因为,呃,我,我其实之前也我今天下午也在做开发。 呃,可以可以,可以,先看一下,先把它往上面拉吧。因为,呃,我是用终端,它的这个时间会它的内容会非常少,可以看到 这些全部都是他自己在进行沟通,这个是测试这端到端,测试这个收后端,然后这他就定三十六个板块,他就已经收尾了。状态权力,呃,他都是有几个智能体进行协助来完成的,我中间是没有没有进行反馈的,或者说没有进行调调试的。 然后这是我给他的一个新任务,我让在他在我的服务器里面装一些 r 语言的环境,然后他自己去检测的。可以可以,可以,看到我们也是让他梳理了一下整个流程,这个流程我都还没看, 呃,这个流程也是他梳理出来了非常多哈。首先,嗯,第一个丁零阶段我就让他进行团队的启动,他就按照我之前用我那个 cctime creator 而去创建的一个,呃,这个配置文件,这是之前的文件, 因为呃没有没有什么改变,他就直接按照这个文件直接进行配了,他就不需要再去读这个读这个 skills 了,他就的上下文就可以节省一点,然后 tokin 也能节省一点, 然后他就创建了这样几个,呃,一会也会给大家讲一下这几个东西。呃。首先后端的开发,前端的开发,然后探索,呃,这个探索研究者我是弄了两个进行并行执行,因为,呃我基本上所有的功能或者项目他都要先进行探索, 不管是搜索也好,还是读代码也好,还是读一些参考的项目也好,因为我这个项目基本上是按照这个 open code 来进行第二次开发的,呃,所以说他必须要读一些 open code 的 原码,他才知道怎么样进行开发,然后连调测试。第一步我就让他 把遗留的问题都做了,因为我这个 qq, 呃做出来的话他是有文档的,他这个文档会非常的详细,呃,包括之前没有做的, 没有做的一些内容,因为我之前上一次已经关掉了上一次没有做的内容,他也会继续的去把遗留的问题去检查一下,检查一下他发现这些就就就完成了。去去去, 他就按照呃这样去拆分并行派发任务,让这个后端去看这些文档,然后前端,然后就去测试、复验,复检,复验这个结果。因为我这个是前后端的,所以说他用的是那个 m c p play o r t 去做的测试,然后这个是又去调研一个新的新的这个问题是不是真的存在, 然后他就发现发现了什么东西。然后第二阶段,然后反正他就自己再按照他的一个方式进行执行。呃,然后进行修复,首先追加新能力, 然后大概就是这样,第五个阶段就是开始了生产那个服务器的部署,然后第六个阶段,第七个阶段反正我是给他了非常多的这种任务和功能,然后他自己进行的拆分和并行。 ok, 我 们也看一下其他两张图吧,再看一张图吧,因为我之前是记录下来有一张图还是算不错的。 这张图应该是记录下来啊,不是这张,这张,这张图看起来是会非常不错。比如说我直接进到了一个新的, 呃,新的一个 cloud code, 我 就直接让他读一下我的这个项目文档,读了之后他会读这个项目文档,以及呃,我刚才那个已经预定好的这个配置文件,就是 team 的 配置文件,就是这些角色的呀,配置文件啊,这些他读了之后,他就直接去创建他的团队,然后我将给他新的任务。嗯,研究者我是让他给 创建两个,因为如果不说的话,他可能就只创建一个。研究者你可以多创建,你甚至并行创建非常多个就可以。呃,因为我想要让他做的功能不止一个,所以说我提前就让他创建了两个,这样的话他的效率就会高点,然后速度会快点,然后我就让他并行去调用,去研究。 呃, ok, 他 就开始读了,他读到了那个,呃,那个配置文件,但是我让他注意一下这个研究者,他们的这个属于他们自己维护的这个文件夹是一样的,他发现啊,他的一些内容啊,他都会写在那个文件夹下面。 ok, 他 全部启动起来了,可以看到全部启动起来了, 全部上线就绪,可以看到这个是管家,这个是后端,前端研究者两个,然后这个是端到端的测试,这是代码 review, 就是 完成了之后他会让 review 去 review 一下。呃,然后我就给他了非常多个完全不相关的指令, 首先就是一个一个命令,让他去检查有没有可以省略,这是前端的一些东西,然后生成了新的数据,这又是一个任务,这又是一个任务,然后这一个又是一个任务,相当于四个任务。我直接给到他,然后他四个问题,他自己去拆分成了两组,然后让这个调研,去调研,然后 呃他,他说了一下,因为他之前有一些遗留的问题,一一起顺带修复。 而且我我不知道是不是因为之前没有总结文档,所以说我就直接让他如果没有写文档,可能已经做了,可能已经修复了这些遗留的任务,然后他自己进行执行。 ok, 他 就收到了,然后他去测试,这又是我又给他了一个新的任务,相当于前面是四个任务,然后定五个任务,定五个任务里面有三个 三四个这种小的任务。然后我又让他,因为我知道他的那个端到端测试的这个智能体他是没有没有没有去使用的,所以说我为了不要让他停下来,我就又给他了一个新的任务,就是二元执行好像有问题,我让这个端到端的去测试,调研一下在服务器上的这个问题, 然后可以看到他们全部都开始去执行了,可以看到任务任务,任务执行排查,然后后面我几乎就没有任何的呃这个反馈了, 都是由他自己去完成,而且这个时间非常的长。呃,首先他去这个调研,调研回来,呃第一个任务他是什么问题?然后第二个任务是什么问题?这个这个是由于我那个呃中转站,因为我们搭了一个中转站,呃他有一些不稳定,所以说呃有些调调整,呃, 然后他就去哒哒哒,然后我因为在这有个默停止了,所以说我提醒了他一下,然后其他的我都没有做操作的,然后他就按照这样的一个流程,因为 opus 他 理解非常强,而且他并行执行的能力也很强。 但是我我用那个 codex 就是 gpt 五点四,然后转了一遍,用它的 api 放在 cloud code 里面,我感觉它的模型没有任何区别,就是 opus 和呃 gpt 五点四,甚至我认为 kimi k 二点五它都不会有这种逻辑上的问题, 就是我认为它们的逻辑能力是一样的,只不过可能模型和模型之间它的这个注意力是不一样的,因为 提米啊,像国内的这些模型,它几乎都是呃这种吸收注意力的机制,所以说它可能会忘记某些问题,但是它整体的思路我觉得都不会有大问题的,所以说模型大家可以不要呃 过于过于关注或者那啥,有条件我们就用好一点的,没有条件我们就用稍微差一点点的。但是 leader 我 们尽量要用稍微大一点的模型,因为呃它才能去控制它, ok, 可以 看到他就付这些角色就在汇报给这个 leader 了。其实我们现在这个对话框就在 leader 里面,当然我们也可以切换了,然后他就开始调查,然后呃他就发现了有一个问题,我就一个呃另外的问题,然后我就让他先不要改,后面再说吧, 然后他们就就搁置了这个问题,然后就继续去执行执行执行执行,但是太长的话我就没有没有一直把它全部录下来,而且我那个中转站又出了一些问题,但是我全程是没有任何的这种 独取,或者我的呃去思考这些代码应该怎么怎么样操作,我全程都是引导他去让他自己去测试,然后自己去 review, 自己去推送,自己去部署到这个端。这个呃服务器上面 整体大概是这么一个情况,这个就是我达到的一个效果,我相信,呃,如果说有工程能力的人,他们的效果可能会更强,因为我是工程经验是不足的,只有只有这种部署的经验,呃,只有这种智能体相关的经验, ok? 呃呃,现在还是第一步就是 k v k h。 呃,说一说一句啊,这个没有 k v k h 的 这种中转站或者什么乱七八糟的,只要它没有 k v k h 的 命中率,不告诉你有 k v k h, 比如说现在很多的动不动我送你两个亿的 token, 两个亿的 token 够干什么?因为像我,我这个, 我这个项目他请求一次你输入输出就已经掉了三三百八十七 k 了,他如果输入和输出全部算成托管的话,那两下就没了,你三亿两亿又怎么样呢?对吧?你如果没有缓存,那么就是在耍流氓, ok, 继续 呃,可能,可能有点有点说的过过分了啊,但是我觉得呃是没有毛病的。不聊 k v k h 命中率的,全部是耍流氓。 k v k h, 如果说命中和不命中它的那个上下文,比如说刚才那个三三百八十 k, 如果你是一个新的,没有 k v k h 的, 你的成本是十的话,你如果有 k v k h, 你的成本一可能都要不了。所以说这个 qcatch 是 非常重要的东西,但是很多人呃没有关注这个点,只有一些正规的平台,比如说像 deepsea 啊,像这种,嗯, 大平台它会会说这个,但是像很多中转平台它都不会说这个东西。呃,推荐大家一定要看这个东西啊,如果没有的话,它不管再低的价格,它都是耍流氓,都是更贵的。但是,呃,如果你中转,它是有 qcatch 的, 这个这个是 ok 的。 呃,这样的价格其实是,呃可以可以接受的,因为中转一般它的价格都还是比较便宜的。呃, 还有一个点就是大家用这个 max, 呃, cloud code max 二十 x 的 时候,第一第一天或者说前面一周使用的时候,它的量都很少 的一个原因,并不是说那个 cloud code 的 snoop, 它们在降低量。呃,很大的原因就是由于你的任务是你的任务,你的上下文, 呃是在不断的切换的。你的 kuvcatch 其实是没有建立的,所以说,呃,你如果都是新任务的话,那么你的这个使用量肯定就是更少的。 但是如果你呃都是一些老任务,呃它的 kuvcatch 啊,这些建,建立啊,构建啊,它会给你构建非常多,多了之后它的命中率就高了,然后它的 token 消耗就会降下去,呃也会,你的使用量也会增加。如果你是使用中转的方式的话, 这也是我们的一个经验。 ok, 我 们还是简单说一下这个 kuvik 的 一个原理吧,因为很多人呃他 不知道 kuvik 的 重要性,很多时候他是不知道原理的。呃呃,像现在的这些大模型,他都是使用的这种 attention 的 机构,然后 attention 他 要计算下一个词,他都使用的这种自回归的方式,比如说我爱, 可能下一个字是我爱你,那么这个字他必须要跟前面的这几个字去做这种矩阵乘法,然后去得到定四个字,他的一个 k 和 v, 那 么他得出来了之后, 这个 k 和 v 他 是不会改变的。当你下一次又有一个字来的时候,你想要预测下一个字的时候,那么呃他这些 k、 v 是 不变的。如果你把这些丢弃掉, 那么你就重新又要计算一遍。如果你不丢弃掉,你直接只用计算这个 q 和这些 k、 v a a 全部计算一遍,然后得到下一个 k 和 v 就 可以了。这个东西就是 k、 v、 k、 h, 如果你没有了这个 k v、 k、 h, 那 么你就得把之前的全部再计算一遍,这样的话成本就会非常的高。 这个里面就有一个特点, k v catch 的 命中率就在于,呃,我们聊天的时候,比如说我们调用工具也好,还是聊天也好,还是像叉 g p 这样也好,呃,你所有的绘画都是 呃,他回答完了之后,你增加一条绘画,他全部是放在下一个,呃,全部是直接放在这个历史记录的后面的, 所以说它的 k v k h 前面是完全没变的,所以说你这个加进去它的成本是不会特别大的。如果说要按照那种全量完全没 k v k h 的 话,比如说像 cloud code, 别说二百美二百美金一个月,它就是两千美金一个月,它都抵不住这个计算的损耗。 呃,这个里面就有一个特别特别特别重要的点,就是一定你的中间的键是不能破坏的。比如说你自己用 cloud code 的 时候,你把中间,比如说它的历史记录中间你去改一个,改一个关键词,比如说你在中间改一个动态的,动态的比如说时间, 你想让这个大模型它知道时间,那么这件事情就是非常错误的,因为它只要在这变了,那么前面的是可以,嗯,完全用之前的 kuvatch, 但是这后面的 kuvatch 全部报废了, 这就是为什么我们的 qqcatch 不 能动的原因。这个也会引发另外一个问题,也是我之前呃一直错误的一个观点,就是,呃,我之前会用一些比较便宜的模型,比如说嗨酷,比如说用其他的一些简单的模型,呃,去拿到上下文了之后,我再用一些好的模型,比如说 opas, 我 去 对这些东西进行一个呃再推理,这样的话,它岂不是它就不用再去拿前面的上下文了,它就可以得出来一个比较好的结果了?但是不是这样的, 就算你用嗨酷的模型,它的成本都没有 k v k h 已经命中的时候,它成本低。特别是像 cloud code, 它所有前面,比如说调用了工具返回的结果,它是完全没有动的,所以说它上下纹才会那么长,嗯,它的上下纹是完全没有动的,主要就是这个原因, 这个 k v k 的 原因也就是让大家不要去动这个呃 k v k 的 呃不要去动这个模型完成一个任务的时候,你最好就是从上到下全部不要动, 不要在中间去切换模型,切换一次那个成本是你完全无法接受的。不管是呃所有所有的这个呃 code plane 也好,还是什么也好,它们都是在潜在去看了这个 k v k 的 命中率的, 所以说他们才会说说是一个浮动的区间,比如说呃九百到呃一千二的这个呃请求,他们都是计算了这个 k v k h 的, 计算了这个成本的。当你破坏 k v k h 破坏的非常严重,你的重命中率很低的时候,它的这个用量肯定就低了, 当然也包括这些 cloud code 啊,也包括这些 g o m 啊,或者说其他的一些 code in play ok, 呃,这个 q k g 大家应该也是比较比较了解了,然后我们来看一下这个 cloud code 的 一个 context, 就是 它上下文到底是由什么组成的。这个东西也是我非常踩坑的一个点,因为我之前 呃我会装很多 m c p 啊,装很多 skills 啊,甚至我会把呃这个 cloud 的 点 md 文档,我又会给它写的非常的详细,所以说就会造成 我的上下文直接就没有了,比如说可拉的点 md, 因为我想那你可拉的点 md, 你 一直加在在这个呃模型的上下文,肯定我写多一点,然后这个模型他肯定就能按照我这个进行执行,他效果肯定就会更好嘛。其实不是的, 现在这个是没超过呃两两三百行的,但是这个都还是太多了,最好最好就是一百多行, 然后里面写的东西就是呃你的文件结构,还有就是你的一些规划,就是你的规则,你应该怎么样写,怎么样写,反复出现的这种失败模式啊,和一些行为偏好啊,比如说你要用哪些库啊,呃,还有就是这这个东西其实都不应该写, 然后反正这些东西都应该非常简化, ok, 我 们还是是不要跑题啊。还有这些 cloud 的 点 md 文档写的非常详细的时候,我 第一次一打开这个 contacts, 我 拿一个新的对话,啊,这,这也是一次新的对话,我拿新的对话打开的时候,我发现我只有八十多 k 的 正常使用量, 但是大家不要高兴的太早,你们去打开一下,你大概率也不会多于一百 k 就是 你可以使用的, 相信我,肯定是这样的,大家看着这两百 k 的 上下文,它是哇,还是挺长的,两百 k 可以 放好多东西,但是就算你什么都没装, 基本上都没装,你都只有一百四十 k 不 到,应该是一百二十到一百三十 k 可以 使用,但是你肯定不可能什么都不装,比如说 m c p, 你 总得装个把吧?然后 skills 你 要装吧,你的这种记忆文件,比如说这个点 m d, 你 还是得装一点点吧, 一装下来,而且这个都是我优化过后的,都只剩下百分之五十八了。就是,呃,这个两百 k 的 百分之五十八只有一百一十多 k, 当时我没有做优化的时候,里面只剩下八十多 k, 还是蛮震惊的,我就是说我的完成一个项目怎么 还没怎么弄呢,就已经已经搞搞掉了百分之六七十的这个,这个工作空间, ok, 我 们不不聊太多了。呃,首先就是他这个上下文, 首先占比最大的就是自动压缩的一个空间,他是留了百分之十六点零五的一个空间, 呃,是用了三十三 k 的 托肯,这个是占比最大的,但是大家应该使用的时候会发现,他其实压缩出来的内容,他只有个三点几 k 到四 k 多,他不可能用到三十多 k 的, 所以说这个这个点他其实留了非常大的余量。 嗯,这个这个东西我也我也不太清楚它为什么会留这么大的余量啊,按理来说如果说四五 k 的 话,你就算这个有一些突然的爆发,那么你这个东西应该也是在个二十 k 就 够了呀,它这个已经远远多出来了十 k 以上的这个量,所以说还是非常的恐怖啊。 然后就是系统提示词,这个是静态的,然后这个是系统的工具,这两个东西是你完全不能动的,可 outcode 里面的相当于有三十 k 左右,是你完全不能左右的。还有就是 m c p 的 工具给大家,这个是最大的一个坑哈, m c p 的 工具会占非常多的。呃,这个 token 消耗,我就只装了一个 playrite, 之前我装了好几个,然后我把它全部卸载了,全部不要, m c p 全部不要。你如果说非要用,你就直接把它放在 skills 里面,因为 skills 它是动态加载,按需加载的,所以说它初时的 token 不 会消耗太多。什么情况下应该放在这个 m c p 是 需要装的呢? 就是你要非常长时间的使用,而且你又必须这个东西。呃呃,怎么说呢?你又必须要 经常用,而且你需要大模型知道你有这个工具,那么你才是。呃,要把这个 m c p 给装上的,要不然尽量都不要装,尽量把它放成这个 skills, 按需加载。当然现在好像也有这个 to search, 但是我我就想的, 如果我不是不是必须要的话,我就直接放在 skills 里面了,我就把这些,其实现在很多 m c p 它都是放在 skills 里面的, 然后这个是用户的一些 index, 你 可以自定义 index 的, 这个,这个基本上不会消耗到特别多的托管。嗯,这个托管基本上就是你自己去安装很多插件的时候,它可能会给你预定义一些子 index 的, 这个是子 index 的 话,这个不是 t 模式的。然后这个是 member 一 些记忆的文件,它其实是叫记忆的文件,但是它记文,记忆文件里面分了很多哈。还有 skills, skills 是 你自己装的,它只加载这个原数据,比如说我要看一下哪一个?呃, skills 给大家看一下。 呃,这个 skills 就是 我的 creator, 这个 skills 它只会加载这个内容,每一个 skills 它只会加载这个内容,所以说它的 token 其实不多的。所以说 skills 大家可以多装一点,无所谓,但是尽量还是不要太多,反正,嗯,有一些这种 benchmark 去测试出来大概是两到四个效果是最好的。 呃,如果说那个,呃 longchain 它们也测过,大概是在十二个左右,它那个效果就已经在下降了。 嗯,我,我认为大家尽量这些东西都不要多装,因为 skills 它的出发条件,呃,你装的多了,它出发就不太精准,它就有点笨,它会分掉它的注意力。如果你不呃主动地显示地要求它去出发这个 skills 的 话,它大概率是不会出发的。如果你装多了, 然后这个 message, 呃, message 就是 发的这个消息了,就刚才我们发的这个 context, 呃,这个就是你自由的,自由的上下文有多长。这个东西,呃,大家最好自己去检查一下。 ok, 我 们也看一下这个 m c p, 这个是 m c p 具体的每一个工具,它的一个 tool。 然后是其实最重要的是这个, 呃,它自带有一些 agent 的 tool, 这个是我自己装的,这些都是我自己装的。呃。有一些,呃 md 的 文档,呃,这些 token 其实最消耗的是这个,呃, cloud 点 md 文档,这个花掉了五点五 k, 就是 给大家刚才看的这个 cloud 点 md 的 文档,虽然只有两三百行。 还有一个就是 member, 呃,他会把你的一些习惯呀,你的东西,比如说你说,哎,你记住以后不要这样,他自己会去打开这个 member, 他 会把这些条件记进去,但是 member 他 只会加载两百行, 只会加载前两百行去到他的上下文文件,而且他记录的都是一些,呃,非常简要的规则,他不会记录非常复杂的规则哈。呃。所以说 这个东西你也可以看一下,然后做一些优化也是可以的。比如说他最后就建议要去优化一下这个 member 文件,但是优化了之后他肯定是有损失的,这个东西大家还是要评估一下到底是不是要做。 ok 哇,这个时间已经太长了,我们继续啊,继续快一点。 嗯,再就是稍等。呃。再就是这个 cloud code 怎么样去配置, 我是使用 cctime 会比较多一点,然后模型的话,呃。自己看自己的能力。呃。我个人感觉,比如说你要用 team 模式,它的主对话 leader, 你 最好还是要用这个一照上下文的,所以说用千万三点六也是比较好的。然后 kimi k 二点五, 因为 kimi 它是专门对这种病病情处理,它是做了优化的,所以说 kimi 也是比较推荐。因为我我们今天聊的基本上都会跟这个 cloud code 的 team 模式相关啊。呃。但是我个人感觉效果蛮不错的, 就是这个 gpt 的 五点四,因为我是专门用这个中转站去测试过这个 gpt 的 五点四,甚至我觉得它在步骤规划呀,病情处理呀,指令遵循呀,是比这个 opus 要好的。 oops, 它有时候还会忘记一些东西,或者说它注意力没有那么多,但是我感觉 gpt 的 五点四它指令遵循啊,这些都会都会记得,比如说像我的这些 team 模式,它会记得要。呃。首先要去用研究,研究了之后要把东西给到这个 呃前后端去实现,实现了之后还要丢给这个 code review 去看一下这个代码是不是 ok, ok 了之后他会再去做测试,去部署测试,测试了之后他又会让这个管家去看一下他这些文档是不是 ok 的, 然后这些 ci 是 不是 ok 的。 这个这个 cloud 的 这个 gpt 的, 我感觉它的效果是最好的,比这个 opas 效果都好,因为 opas 它经常会忘记,经常会忘记。比如说我里面有一个特别重要的点,就是 leader 去下发任务的时候,这些员工他应该跟这个 leader 去多次重复, 多次对齐这个需求。万一有一些 leader 它是没有看具体代码的,很多细节它是不知道的,所以说它们需要去沟通。但是像 cloud 的 模型很多时候是会忘记掉这个东西,但是 gbt 它是 ok 的, 但是它很很大的问题就是 gbt, 呃,现在的基本上它都只支持二百七十五 k, 呃,它是不支持一照的,但是你的 leader 没有一照上下文,所以说效果是不好的。因为一照上下文它并不是一照上下文它能给你带来多少的能力的提升,而是一照上下文你能选择压缩的这个时机, 压缩是你选择的,而不是他到了两百 k, 到了两百七十 k, 然后他自动压缩的,这个是非常重要的,因为就算有一兆我也不会用到一兆,我最多最多的时候我用到过五百 k, 但是很明显的感觉到出来他的上下纹腐烂的问题很严重。就算是欧巴斯, 他到三百 k 的 时候效果基本上都很差了,因为你肯定不可能一个任务你能完成。嗯,他的上下文长度能到三百 k, 因为 leader 他 只派发任务,他不做具体的代码,所以说 肯定是多个任务多个任务完全的这样执行下来,所以你三百 k 的 时候,你塞了非常多的这种任务在他上下文,而上面的这些任务其实跟下面的任务它相关性很低, 所以说你你你,你后面这个上下文腐烂的问题非常严重。到三百 k 的 时候,我基本上都在做一些收尾的工作了,呃。要考虑压缩上下文了,我就直接告诉他,呃。我准备压缩上下文,嗯,你做一些收尾的工作,看一下还有哪些工作是没有做的,有哪些测试还是没有做的,有哪些文档还是没有归类的, ok, 呃。就算没有 gpt 或者 cloud 的 这种比较顶尖的模型,其实用这种,呃 plus 的, 用这种千问,用这种 kimi, 它其实都还是可以的。它们的逻辑性我觉得都是没问题的。 我认为最大的问题是注意力的问题。就像我刚才说的就是模型,它在执行这个任务的时候,它就把之前的一些指令给忘记了,因为我们要让它效果好,你给它的指令其实是非常多的,比如说你在执行完了之后,你应该写一下文档, 如果说这种这种比较比较差的模型,他可能就会忘记,所以说,呃,这个东西你提醒他一下也是 ok 的。 呃。他的这种逻辑性,我觉得这些模型跟我们人比起来的话,呃。跟我比起来吧,跟大部分人比起来,他的逻辑性都是非常严密的,而且设计都是非常好的。 呃。所以说我觉得不用,如果能能用好一点的模型就直接用好一点的模型,如果用不了好一点的模型也不需要觉得。呃。我用差一点的模型就完成不了这个任务。只要你把 hernes 把约束,把这些规范弄好,然后你注意一下,呃,去多去提醒他显示的提醒他呃。要记得去调用这个模型,然后你可以让他呃去 完成这个任务的时候要怎么样的一个员工流程,先让他梳理一遍,然后再去完成某一个具体的这样的任务。还有就是模型的常见的命令,其实我用的命令都很少,就是我,我其实用的不太好命令,但是我觉得已经够用了。 首先第一个就是这个 dennis, 呃,虽然最近他出了一个自动的模式,但是我认为那个自动模式还是不够自动啊。呃。我觉得这个这个模式还是最好的,因为我我们的项目都不是一些特别机密,然后有非常巨量的这种用户的,然后风险零度感度非常高的,所以说我用这个方式是完全没问题的。 呃。我有一个观点哈,就是大家如果是大大,相信大家去看到这种什么呃。模型商铺跑路的, 自己没有遇到过吧?或者说你身边的人实际的情况下是没有遇到过的。用一些稍微正常一点模型,你别用一些本地模型,应该是没有遇到过这种问题的吧。 如果说你因为这种问题你给自己设了很多限,我觉得这个是得不偿失的。你因为一些潜在的风险,然后自己给自己设了很多限,然后自己给自己呃造成了很多困扰,比如说你要每经常去点击,去同意他的这些命令, 我觉得是得不偿失的,只要你的风险敏感度不是,呃你完全无法接受的,我觉得大家可以冒一定这个风险。 然后这个就是比较常见的继续之前的一个对话,呃,但是我我个人认为哈,你最好不用继续之前的对话,你要不然就直接压缩,要不然你就直接结束了,重新起一个就行了。因为用我的那个 tim tim 模式的话,他会把所有的内容直接放到这个文件夹里面,直接放到这个 点 plan 的 文件夹里面,他下一次启动的时候直接把这个文件夹发给他的话,他就是自己能拿到上下文继续进行执行的。 呃。还有就是这个,呃选择绘画的主题,呃,你可以用这个方式,你可以看一下这个项目里面 你之前的一些绘画,你可以选择之前的一些绘画,这些都是比较基础的操作了。然后就是项目初识画,呃,其实我对这个的话是比较抵触的,因为这个初识画有一篇文章是说过,如果是由模型生成的这种初识画的项目文档其实是没有意义的,没有价值的, 它其实就是专门去生成这个 cloud 点 md, 它的目的就是为了比如说你有个非常大的项目,它这个 cloud 点 md 的 文档会把你这个项目下面的所有哦架构啊这些,呃地图啊这些写在这个 cloud 点 md 里面,然后模型在推理的时候想要找东西的时候,它就直接知道这个地图了,它就知道在哪里去找了, 但是真实测试下来,首先它的准确度不会提高。第二个点就是它的 token 消耗会增加百分之二十以上,因为它有这样一个地图了之后,它会迫使它自己去查看更多的一些细节, 但是很多细节呃,其实是没有必要的,它就用一些。呃,这种 graph, 用这种关键词正则匹配的方式其实就能解决这个问题了,它并不能提高这个准确率。但是这个东西适合拿来做什么?适合拿来做你的这些文档的一些地图, 适合拿来做你的一些,比如说在这个项目里面的一些踩坑的点,比如说你有一个错,你每一次用模型来执行,他都要去绕很多的弯路才能执行成功。那么这个东西你应该记下来, 记得是经验,是教训,是他特殊的一些规则,甚至是你的一些工工作流。比如说刚才我们的那个就是你的这个成员,这些成员到底有哪些?然后这些成员的功能是什么?这个东西我觉得才是可以记得。还有就是这个压缩了, 就是手动压缩,这个绘画记录千万千万千万千万有这个重点说三次啊。压缩尽可能都是由你自己选择的压缩,而不是他自动的压缩。这个点非常重要,因为你选择压缩之前,你可以把你的文档沉淀下来,下一次你继续完成任务的时候,你才能拿到这些信息。 呃,例如可以结束一个大任务之后就可以压缩,比如说你上下文快到这个窗口期了,就可以压缩。比如说你有一照上下文的时候,你快到两百 k 或者三百 k 了之后,呃,你就可以考虑这个工作,这个任务就可以收尾了,不要让他自行压缩。 呃,你先收尾,先保留这些上下文,保留这些文档,让下一次可以执行就可以了。然后切切换模型啊。 呃,我建议大家只要是机械的实现都使用这种 sonata 的 模型就有。有条件的话,如果说你用 cloud code 啊,或用 cloud 模型啊,用其他的话,有条件用 sonata 需要理解和规划,比如说 leader 用 opus。 嗯,这个东西呢,反正能用好一点的就用好一点的吧,但是也没关系,只要你写好,然后对这个过程规划 hardness 了解的比较深,你自己愿意多说两句话。其实性能我觉得是没有没有没有,没有特别大的差距吧。 ok, 注意啊,就是千万别中途切模型,他的效果这个成本是很难接受的,除非是对话指出。比如说你压缩了,然后我切一下模型,这个是 ok 的。 呃,比如说你新新开的时候,你直接换一个模型,这个也是 ok 的。 比如说你有个一百 k 上下文了之后你又切个模型,那么这这件事情千万不能干,他 k v k h 是 直接被破坏掉了。还有就是双击 这个就可以消除消息,然后哦 ctrl u 就 可以删除一行消息,然后空空白消息。双击的话就可以会去选择之前的历史记录。呃,它好像现在也,它现在也是有这个。呃, check check point 的, 就是它可以返回你之前的一个版本, 它是有版本控制的,它之前没有,但是现在是有了。嗯,但是我推荐大家尽量使用这个呃 get get 来进行版本控制啊,尽量不要不要使用这个方式,这个方式其实效果不太好,很容易出问题,有时候它就是 ok 的, 有时候它那个版本又是有问题, 然后是使用技巧,尽量大家去做的时候,你直接问它这个东西是什么?这个,呃,子智能体是什么?你有几个子智能体? 子智能体是怎么样弄的?然后 task 它现在是有 task 的, 就是它会记录在它的这个,呃,那个那个工作目录,不是在你的这个工作目录,在它的一个工作目录下,它会去把任务写成这种 task 的 文件, markdown 的 文件,然后再去按照这个文件的这个指令进行执行。 同时它也可以让这些子智能体啊,或者 team team 成员啊这些它会去读这个 markdown 的 文件,它就可以知道。呃,按照这个文件来进行执行,就不像之前用的 to do list 的 方式,它是没有文件沉淀下来的。 呃,但是这个有有有点问题啊,它就没有在你的文件夹下,但是我们按理来说这些东西都应该在我的文件夹下,所以说我的那个 team team creator 也是跟这个做了一些优化的。它这个 task, 呃,我是让它只写一些聚焦的。呃核心的点摘要,然后引用一下我们现在的这个这个文档,这个文档里面具体的这个。呃 plan, 具体的 task plan 可能会写得稍微详细一点, 这样的方方式,这样的方式的话又没有破坏他们自己调试好的这种提示词,然后效果也还蛮不错的。然后他下发任务啊,这种 task 的 内容也会比较短一点,所以说效果还是蛮不错,因为我们写的提示词啊,写的一些指令其实是没有他们写的好的,不要跟他们的指令有冲突, 不要有矛盾,会造成模型的困惑,你可以让它稍微改一下,比如说 test, 你 不要让它写得特别复杂,特别详细,你就指导它引导回来你的这个文档就可以了。还有就是 这个 skills, skills 大家配的时候可以配到你的这个项目文件夹下面,也可以配到这个。呃。用户级别,就是它可以在全局都使用这些 skills。 呃。这个 skills 就 不详细说明了吧。 呃。一会一会给大家最后讲一下我这个。呃。这个 teamwork 的 时候。呃, team cici, team quitter 的 时候。呃,给大家讲一下这个 skills 大 概是个什么情况,因为现在已经非常长的时间了。呃, 另外一个点,如果解决不了这种特别难的问题,因为很多时候我们还是会有一些问题。呃。解决不了的,可以直接用这个 codex 的 五点四的模式,直接用这个最高的推理性能的模式,或者直接起一个 opas, 你 把它这个思考作用调到最高, 基本上都可以解决,因为我我们的项目其实没有没有那么深度了。呃,但是绝大多数的项目都没有那么深度,但是很大的问题并不是说他解决不了,而是他掉进了这个局部追优,他爬不出来了。所以说很多时候你的这些文档,你一定要跟他说一下, 你不要去查看这些文档,或者说不要按照之前的文档来思考可能是错的啥的,让他自己来思考,自己去做推理,这样这样也是 ok 的。 然后就是插件的问题。呃,有两个比较好的插件,这,这是有点分开的。呃,第一个插件就是上下文占比的一个插件,比如说这个,呃,我,我的一个可以看到 我的模型,然后 contacts 他, 但是他这个不是特别精准,但是大概是没太大问题的。还有他调用了什么工具,看了什么文件,然后,哦,他都会写在这,甚至这,这个,这个是另外的啊,这个是,呃,他的这些 team team 员工,你可以这样 shift 上下键去切换,这个都没啥, 这个东西非常重要,就是上下文你只有看得到,你才能控制你的。呃,控制你压缩的这个时机啊,这个太重要了啊,大家,大家一定要注意注意这个点。呃,这个模,这个插件叫做 cloud hold, 大家自己去看一下。然后就是任务完成的一个通知插件,这个也是比较重要的。 呃,通知插件,我这个这个是没打开,大家也可以直接搜吧。 cloud no notification go, 这个插件其实蛮多的,就是他完成了,他给你回一次消息,他会在右下角提示一下,这个还是挺挺挺好用的,因为我们做做这个,呃, web coding 啊,或者开发啊,这些都会并行进行开发。几个任务进行并行的时候,往往就忘记了我开了之前的一个对话,下一个对话怎么怎么怎么样了, 但是,呃,你有了这个东西的话,他就会提示你。呃,嗯,但是我用了这个 teamwork 之后就没有那么大的问题了,就是,呃,我基本上都是在那个 teamwork 里面直接进行并行开发,这样的话我只用控制一个,然后就算很多任务他是完全不相关的,呃,他这个 leader, 这个 oppas, 他 都能去解决,去去分配这样的一个任务, ok? 嗯。这个东西, 呃, team skills 就是 我开源的这个项目,我们先看这个 open ai 的 harness engineering 这篇文章吧,然后再给大家讲一下,详细讲一下我这个 skills 它是怎么样配置的。呃,这个开源的, 大家如果听听不下去,也可以直接用它,这个就是一个 skills 配,配置上去了之后,你直接问 cloud code 也可以, ok, 呃。先说一下这个 harness engineering, 这里面有非常多的 经验是值得吸取的,而且值得非常多遍非常多遍的去读,我一共是读了,呃,就是给大家分享,都分享了三遍,所以说我读了非常多遍。呃,当你没有用好这个 ai 编程 web coding 的 时候,你会发现,哎,他讲的好像有点道理, 但是你用了一下之后你就能想起来,哎,他这些逻辑在指导你可以进行编程,特别是完成一个比较大的项目,或者说一些大的项目进行编排的时候,你要把他因为之前的一些项目他可能 都没有文档,那么你应该想一想,呃,怎么样用这个 harness 去改造这个项目,让后面的这种,嗯, cloud code codex 它能继续地去完成任务,然后哈你就自己慢慢会有意识或者思想去放进这种 ai 编程,然后最后再读一遍, 你可以结合他的一些思想和你项目,因为你已经做了 web coding, 你 项目里面的一些文档设计,然后第一步应该怎么做?第二步应该怎么做?然后你再让 cloud code 或者说 codex 或者任何编程工具去看一下这篇文档, 这篇文章,然后再读一下你之前的这些文档,让他给你一些优化建议。我们有哪些东西是没有做好的?比如说文档没有写好的,比如说 他的这个 c i 检查是没有写好的,你有哪些做的欠缺的,他会告诉你,然后你告你跟他说怎么样去优化,然后让他去给你做优化就可以了。 ok, 我 们直接打开这个 这个文章吧,这个文章也还再次给大家详细的再读一遍,因为这个文章太重要了,不管是所有讲 web coding 的, 或者说最近两个月都绕不过去这个 harness engineering, harness 约束。 ok, 这个是 open i 他 们发的这篇文章是由一个团队,他们里面有一个团队是专门去构建一个内部的一个软件产品,一共是好像是五十万行代码, 好像是五十万行代码,然后是没有用一,没有手写一个代码的,然后大概只用了十分之一不到的时间,直接就完成了这样一份工作,然后是由人来进行指挥,然后都是由这些智能体进行执行。哦,是一百万行代码, 然后还是非常非常离谱啊,大概有每天处理三点五个 p r 太太离谱了,他们用了五个月,五个月,然后一百万行代码,一百万行还是非常非常离谱的事情。 ok, 他 们是从一个空的代码开始的,他们当时都只是使用的 g p t 五,然后都没有五点四,没有这个 cloud o p s, 他 们用这个 g p t 五和这个 codex 来进行使用的。 可以讲到,首先这是呃它的一个工作吧,工作量吧,然后哦它们的核心理念就是不手写一行代码, 然后工工程师的主要工作偏向了系统架构以及如何撬动这个呃 ai 编程。 cloud, 呃,不是 cloud code codelex, 它的一个杠杆作用。 然后早期的时候他们是比较慢的,跟跟跟我的那个过程也是很很相似啊,我跟他们的过程很相似,因为我基本上呃我开发那个我的这个项目十万行代码大概是用了半个月多,但是前面 一个星期到十天是非常慢的,甚至都是在呃跑一些弯路,都是在构建这个 cc team creator 这个 skills, 我我想让他去完成,去结合这个这个 team 模式,然后去结合呃这些 harness 的 机制,然后去配合呃现在很多这种子智能体的一些呃逻辑或者定义, ok, 嗯,首先他们就又说了一下,然后他想要呃呃去完成这样的一个目标,他先要把它做了拆解,其实也就是呃这些角色了,就是 team 模式的角色设计、代码审、测试等, 然后去让这些智能体分工去完成,因为这些东西它是完全可以拆分的,比如说设计它是可以拆分的,代去完成,代码也是可以拆分的,评审也是可以拆分的。去呃分割这些角色的原则就是这些东西是可以模块化的拆分,但是千万不能是 比如说我这个,这个又要做,呃,比如说呃一个功能让多个角色去做,这样是不 ok 的, 因为它上下文无法拆分, 所以说它会消耗掉特别多的上下文,然后智能体和智能体之间的沟通成本也会非常高,并且最大的问题是它们之间沟通是有信息损失的,所以说这样这样这样是不太好的。 ok, 嗯,他们发现人类这个,呃,我们工程师总是介入这样的一个任务,呃,究究竟需要什么样的能力来让这些智能体可以对这个项目进行清晰可读,而且又有一些约束的执行? 然后,哦,他们基本上是按照这个系统提示词啊这些呃去去给这个系统进行交互,跟这个 codex 进行交互。最开始他们是使用的这个呃这个死循环的方式,但是,呃后面他们慢慢就是采用了这种标准的一些开发的流程, 然后去不需要人工地去介入到这个 c o i, 它们也是使用了这样的一个循环了。嗯,这儿我感觉都有点有点乱,没没必要读得特别详细啊。呃,其实最重要的是后面的这几个要点。首先是要提高这个 cloud code, 呃,不是提高 cloud code, 是 提高这个应用 cloud code 的 可读性,你必须要让这个应用不管是在执行的时候,还是在运行的时候,还是在测试的时候,它都要能详细看到这些。呃,这个应用它的一些内容,像我们之前的一些史山代码,呃,它大多都是, 呃,我们只需要看它结果是什么样,很多日制啊,我们其实是写的不详细的,所以说在现在这个阶段它其实是不 ok 的。 比如说它这个进行测试,它是一个标准的前后端啊。呃,如果大家不是标准的前后端,是比如说一些应用,比如说有些甚至应用都不算,呃,你尽量使用这种打包的方式,直接把这个前端直接打包成应用,或者直接使用这种 c o i 的 方式, 呃,去测试这些嗯功能或者执行你 c o i, 到时候你再打包成一个前端这个不值钱的东西, 这个你到时候去慢慢实现就可以了。你直接把先做 c u i, 不要不要去做什么前前后端一起或者怎么怎么样,把它全部弄好,先做 c u i 功能全部实现了之后你再去实现其他的东西。我们先详细看一下它测试的这个机制是什么样的。 这是 codex, 然后这个是这个浏览器的开发的工具,然后这个是应用,其实是先清除工作台,它会清除一下工作台,然后我去呃,去大概看一下这个的一个状态是什么样,然后去去操纵,呃这个应用, 去操纵了应用之后,他可以看到这个应用的一些内容,日制,然后截图,呃之呃操作之后的截图,然后他拿到这些信息之后就知道哪里出了问题,然后进行修复重启,然后不不停的循环,直到完成任务。其实我们我的这个项目也是这样的一个流程, 然后就是,嗯,他的一些核心点就是必须要有非常详细的日制系统, 可以看到他们是一共用了三个日制系统,因为我对工程经验不是特别足,所以说,呃,他具体的这些系统我可能不是特别了解,大家如果知道的应该还是比较那啥,但是无所谓,你让他写好日制,他自己会给你写好, 就是你哪怕是你之前项目没有写好,你只要把呃这种文档全部构建出来了之后,你就说你给我重构一遍,把这些日制全部加一下,他自己会给你加 我的之前的那个项目也是基本上全部写完了,写完了功能,大部分功能都已经写完了,然后又用的这个呃 team 模式,然后把整个文档,整个这种日制什么基本上像像重构一样把它全部重构了一遍, ok。 第二个就是它的一个记录系统,因为你要让 cloud code 它能 一遍一遍的衔接之前的任务,因为呃模型的上下文是有限的,它清除了上下文之后,它能衔接上之前的这个工作,继续去完成任务。那么你的文件 和文档系统必须要写得非常详细,它们之前是使用把所有东西都塞在这个 id 的 点 m d 里面,当然这个刚才也说了,这个是一个呃非常错误的 思想或者做法,他要的是给 codex 一 张地图常态加载在这个模型上下文里面的是一个地图,不是一个一千页的说明书,这个是毫无意义的, 因为呃,首先就是呃所有都重要的话,那么所有都不重要。哎,这,这不是,这是所有都重要的话,那么所有都不重要。你把所有的条件都写的非常详细,他一次性他是他的那个注意力是没有那么多的,或者说他其实跟我们人一样,你人 能能注意到那么多东西吗?那么多重要的点吗?肯定是不行的。然后就是其实这两个东西是一个东西啊,就是他会错过很多约束条件,他会忽略掉一些东西,其实跟你那个 skills 放多了也是一样的。第二个点就是这个东西会上下文腐烂,然后哦就是很难核实, 这个漂移是无法避免,但是这个东西跟跟他的 md 文档没没太大关系啊。这这两个东西,呃,这个东西核实和这个成就, 你应该是他想要说的是你要做一些维护,可能很难维护,因为这些 edit 点 m d 文档它不是热加载的,它是必须要重启之后它才能去更新这个上这个文档,所以说,呃,你你没办法去动态的更新这个上下文里面的内容,这也是不 ok 的。 然后他们就把这个文档也列了一下啊。呃,首先文档,这个是设计的执行的文档,这个是生成的文档,这个是 对齐的一些文档吧,然后这些参考的,但是我个人感觉它呢,这个设计的并不是特别好,我觉得按照我那个方式可能会好一点,就是按照角色进行划分,然后角色下面它又会划分成这个 每一个任务,一个文件夹,文件夹下面又结合了这个 plan with fields, 它的这个 skills 它有有有进度,然后有发现有这个任务。三个 md 文档,然后它维护这三个 md 文档。虽然工程嗯量工作量是增加了,但是它会更加详细,然后完成一个项目的时候,它也有迹可循。 ok, 但是它有个比较好的点哈,就是它的这些呃文档里面它是有一些标准的,比如说,呃你的一些 接口,你的一些 api 端口是不能进行改变的,如果你要改变,要增加你这个文档必须要呃,改变增加,所以说这是一些规范文档这个东西是不能变的。呃,这个东西应该也要写在这里面,而且对整个项目它的一个大致的介绍,大致的说明 也要有一个这样的文档。我这个也是有这样的一个文档的,就是对专门做了这样的一个文档,但是他不没有像他这样又在里面拆了,因为我在是按照角色进行拆分的,这就没啥。 呃。编,编码和缩影,这些编码和缩影应该放在这个点,这个 a 键的点, md 文档里面,这个文档的一些结构目录都应该放在那个里面。 ok。 然后就是可读性,也是最最重要的,就是你一定要你的代码。呃,和这些反馈是要跟 cloud code 进行。嗯嗯, 强强交互的,所以说一定要有可读性,不要是全部代码,因为代码它的行数和内容都比较大,但是你文档它的内容,嗯的信息密度就会更高一点。呃, 就是可读性啊,他会,如果你的可读性不高的话,他可能就像三个月入职的新员工一样一无所知,所以说你必须要把他写的比较好,然后,哦,你新 新的一个 codex 其实就是一个新的员工,他应该去读哪些文档,他要他要知道,然后他去复回去,去抓到之前的上交文,然后才知道怎么样去继续去完成任务。还有一个点就是规范和架构,这个东西我感觉还是非常重要的,因为光是文档文档他其实只是一个提示词, 但是你想要让他按照提示词的要求来,对于现在模型来讲还是比较难的。那么你应该怎么样去限制?你应该去做一些脚本,去 严格规范一些边界,严格去规范一些内容,比如说你的接口不能有多的接口,你不能有多的一些呃类或者库,你不能引用其他的一些类库,比如说你不能,嗯,去 去调用一些莫名其妙的 api 啊这些,甚至你的这种文件它的长度不能超过八百行,或者不能超过多少行。这个你应该写一个脚本来专门对你项目里面的所有内容进行检查,这个是一个固定的规范,这个是必须要做的, 如果你没有的话,你很容易这个爆炸,你的这个技术债会会会会会越堆越多,只有有了约束之后,你的架构才不会漂移,因为 他很多模型他上下文没有了之后,他通常就会去干一件事情,就是乱编一个新定义,一个变量,新定义一个命令,这,这是非常重要,非常经常的一些事情。经常很多的时候就是, 哎,这个里面有一个变量,那个里面又有一个变量,但是很多时候你你是完全不知道的,他可能报错了之后,他又去修修修修修修改改,然后把两个又又斗起来了。但是他很多一些技术债啊,很多发散的、离散的、漂移的,这种变量还是保留在那。如果你没有一个检测的脚本, 那么让大模型自己去发现,他其实是比较难发现的。嗯,第二个点就是他们的这个代码 不一定是符合人类的偏好的,因为我们人可能会想的是怎么样写出优美的代码,怎么样写的稍微简单一点,能用一些现成的库,我们就用直接用现成的库,但是对他们来讲不是这样的,只要能跑,你就不要管,不要管这么多,而且他会更加习惯去 自己实现一些稍微简单的一些库,没没必要去用一些这种现成的库,因为很多时候一些库他是要更新的,而且很多库他是比较新的,在模型的大脑里面是没有的,他如果能自己实现,你就不要管他,你就让他自己实现就行了。还有一个比较大的 点,也是我觉得很重要,为二重要吧,去吞吐量改变了合并的一个理念或者叫部署的一个理念, 就是由于现在的 ai 整体,他去编程或者说去修复问题,他是很简单很快的。那么你在合并或者说去暴露你的服务,公布你的部署你的服务的时候,你就没有必要像之前一样去做非常非常非常严格的检查。 当然当然这个风险敏感度大家要自己进行评勾评估。而现在要做的是你怎么样让这些报错能快速的反馈回来,这件事情非常重要。 我,我的一个解决方案就是在这个项目里面,我其实是让它一直活活跃着一个智能体的, 他不停的在分析这些用户的一些行为,当然我用的是非常便宜的一些模型啊,呃,甚至我我我我是采用的这个 fork 的 方式,呃,我会在这个用户聊天完了之后,我会 fork 一个分支出去,然后再发一条消息问一下 这个智能体他之之前我们沟通的时候是否有一些不好的点,然后我会把它整理成一个结论或者结果。呃,我觉得要做的一定是 一定是你要快速的拿到这些反馈和结果,而不是说你要让他做到尽善尽美,没有没有那个必要,你要拿到他们对话会画的一些结果,比如说主要的问题是否有研究价值,我现在唯一要做的就是把这个东西测试出来的这些问题,我会让, 嗯,这个智能体去分析一遍,我会把它所所有聊天记录拿到,拿到之后让智能体它自己去分析是否存在一些问题。比如说你的 skills, 比如说你的 skills 要沉淀一些经验,比如说你的 skills 的 脚本是否要改,比如说你的 skills 是 不是要新建一个新的 skills? 是 这样的, ok, 呃,这个就不继续看了。呃,再就是继续看一下这个项目, 然后智能体生成实际上意味着什么?就是产出就代表着所有的都是由他自己进行产出的,然后代码与测试。 ci 配置,我觉得这个 ci 配置非常重要啊。就是,呃,其实之前,呃如果是小的一些项目可能不需要做这种 ci 的 检查,但是 现在这种 web coding 你 必须要最开始的时候你就要定义好这种检查的这些规范,然后每一次呃去执行出来都要做一次检查。 以前可能需要非常大的项目他才会配置上这个东西。然后内部开发者的一些工具,比如说那个,呃, playwrite 啊,我是用的 playwrite 啊,他是使用的这个,呃,谷歌浏览器的那个开发者模式有一个工具,但是这个这个都差不多了,我用 playwrite 的 用着也 也还算可以的。我之前安装了那个谷歌浏览器的开发者模式的那个 two, 其实没有没有特别大的区别,我,我是这样感觉的。 然后就是不断提高的自主水平,当你全部实现了之后,新提出来一个任务的话,你可能就是一个 hook, 呃,我新提出来一个问题的话,你就是一个 hook, 把它发发给这些团队就可以了, 然后他自己就可以进行执行了,然后我们还是继续,时间也是非常紧了。然后我总结出来的一些经验吧,或者我觉得最重要的几个点。首先第一个点就是他的文件文档,这个文件夹,也就是我刚才给大家看的这个文件夹下面他是一本书, 树状结构的书,最容易发现的东西就是一些摘药并引用细节的这个具体的文档,越容易发现的就是越越是摘药的东西。然后 并且这个文件夹下面他一定是有互相引用的,不能有孤立的这种文档。孤立的文档其实没有特别大的价值,除非你这个孤立的文档,其实其实按理来说这些就不能有孤立的文档,你的 一定是有某一个这个引,所以是引用这个文件的,它一定是有个摘要的,哪怕它这个摘要非常简简单。 呃,还有就是文件的行数不要过多,如果过多的时候,另外一个文档引用的时候一定要标记具体的行号, 包括我的这个智能体这个 team 员工的时候,他下发任务的时候,他很多时候都是直接把具体的行号直接下发了的,要不然的话, 这个子智能体或者 team 呃的成员,他又得去全部读一遍,这样他的上下文也会消耗特别多,而且对之前的一些呃任务内容其实没有没有特别大的帮助,没有没有意义。 然后就是日制尽量要详细,日制一定详细,你把它记录下来,哎,模型它是不会去傻傻的全部读的,它自己会去用正则匹配去搜索的,所以说日制尽量详细,哪怕你就设置一个, 设置一个那个命令开关嘛。呃,你生产的时候你可以关掉,然后你调试的时候把日子尽量且详细,尽量把每一个命令,甚至呃这种模型的 point 都可以把它打印下来。 然后就是小众的一些库,如果工作量不是非常大的,就直接让 ai 自己实现,因为呃你如果需要引用一些 ai 自己完全不知道的库,你还得给它搞一个 skill 或者搞一个文档,它开发起来才不会有问题,要不然很容易就有问题。 然后就是呃不要聚焦于前端和这种尽善尽美。呃,我认为应该聚焦于这种功能的实现以及 coi 化,因为 只有 coi 化了之后它才能被 ai 所调用,那么你才能把它 skill 化,然后 skill 化了之后你才能进行调试和监控,以及呃呃,你怎么样开发起来,这样才能自动化?还有 ui 的 一些细节,细致末节是肯定要被淘汰的。 再就是模型的吐出率让现在的这种项目模式是转变了,一定是上线报错或者说反馈快速迭代, 但是唯一就是你需要收集反馈和优化的这个检测系统要要做的好一点,然后尽量让它存活在你的项目中,让它一直活着,让它自己能能自己做修改。当然你最开始可能是有你人, 但是你的,比如说你的接受率都达到百分之九十以上了,你就可以了,可能你每天 review 一下,或者这样就可以了。 再就是一个补充,呃,想要上下文不丢失文档,尽量做详细。我的那个代码里面我之前 review 了一下,大概是在 呃百分之三十左右的这个文档,但是可能有点多了。呃,但是我个人认为这个代码量和文档量的比例尽量也不要低于百分之二十以下,尽量让他多一点。 ok, 这也时间太长了。接下来就是我开源的这个 team skills, 就是 怎么样去创建这个 team 模式。呃 呃,很多人人用这个,呃这个,这个终端会效果会显示更好一点,但是我是 windows 的 习惯了,然后用这个 shift 上下切换,我觉得也是可以的,没没什么区别。 然后呃第二个点就是角色不是拆,拆的越细越好,要平衡。因为呃,之前 s o p k 他 们也发了一篇文章研究表示,呃,这个上下文它并 不是一定要用这个多多的模型或者多的角色或者多的子智能体去做拆分的,而是呃他一定是工程量或者说上下文可以分开的,你才可以拆分 你。你可以这样讲,如果你是一个智能体,你要做某一件事情,然后另外一个智能体,他要做做另外一件事情,这这两件事情你们之间如果沟通 几句话就能沟通,或者沟通一两次就可以搞定的,那么就可以拆。如果你们之间要协同合作来去完成这个任务,嗯,协同的非常多的话,那,那这个东西就不能拆, ok, 呃,但是也有一个特点啊,就是,呃,这他的这个文档里面其实也写了他的这个上下文, 嗯,这个陀刻消耗用 team 模式会非常多,但是我个人感觉他用 team 模式消耗的反而是比他用子智能体的方式要消耗的更少的,因为子智能体的方式,他每一个子智能体他都是重新去去激活,去拿上下文的,所以说, 呃,它的效果,反而这个托肯消耗会更高,而且,呃,而且它效果不是那么好,因为很多上下文是可以附用的。还有一个点就是用 team 模式的时候,它有一个特点,就是 leader, 它知道了它有这些团队角色了之后,它才会自己主动的去拆分 任务,如果它不知道,你只是一句话告诉它,它是不会主动拆分的。这就是一个潜在的问题。 很多人可能会误解,呃,为为什么这种 team 模式会更好?因为他会主动的去拆分模块,主动的去拆分工作,这个点非常重要,因为大家都知道,呃,我,我要做一个大的项目,要拆分模块,拆分什么什么东西,但是, 呃,你去 web coding 的 时候,往往他就你让他去完成这个任务,他是不会拆的,他是不会拆模块的,是这样的一个逻辑。 ok, 我 们也来再看一下我的这个开源项目,这个开源项目大家如果了解了之后,他可能 不是 cloud code, 它也能做,它也能运运行,因为很快应该 codex 啊这些,呃, open code 啊这些它应该都会支持,支持这种 team 模式。 呃,我们也是在开源一个 team 模式,这个 cloud code, 呃,和这个 codex 还有 gemini 这些,看能不能使用使用这种哦 群聊的方式来进行协助,因为群群他这个 t 模式其实就是一个群聊的方式,然后这个 leader 是 可以看到群聊的所有内容的,你也可以看到群聊的所有内容,你可以直接发消息, leader 也可以直接收到。然后但是员工,嗯,这些子智能体他就只能被艾特的时候才能看到,而且他们互相可以艾特,是大概是这样的一个逻辑, ok, 呃,我们首先来看一下这个项目吧,这个项目大家知道了之后,了解了之后,你们自己就不需要这个 skills, 然后并且想要用好,我 虽然他也可以直接用,但是想要用好的话,一定还是要读一下的,因为 team 的 这些成员啊,他的逻辑啊,这些工作流程啊,还是得自己去了解的。 然后这个 skills 是 一个比较标准的文档,然后有原数据,我这是 review, 呃,这 preview 啊, 呃,原数据可以看到原数据,然后下面就是具体的一些写法了,然后是这个是参考的一些文档,这个是脚本,这个脚本就是 ci 的 一些脚本,就是专门去检测你这个项目里面 的文件内容啊,这些有没有超过什么东西啊,然后命名名啊这些,但是这个也是属于一个模板吧,他不能不能是直接拿去用的, ok, 我 们来详细看一下。首先,呃,这个这个原数据就是什么时候应该触发,但是我是专门去提醒了他一下,要看这个 skills 的 时候必须要自己看,不能起一个子代理来看, 这这个很重要,要不然他用子代理来看,子代理去看一遍这个 skills 的 话,呃,他在告诉这个主智能体的时候,他是有信息损失的。而这里面你要想要做好一个 team 的 话,你这个是要让它全量读的,全量读它细节才知道它才能做好一个比较好的一个 team 的 配置, ok? 呃,为复杂项目是创建这样的一个 team 团队,首先第一个开始之前必须要直接读取所有的参考文件到上下文中,这个就是我刚才说的这个东西。然后流程,第一个流程是要检查你这个项目里面是否已经有了这样的一个 plan 的 文档, 而这个文档如果有了的话,他就不用继续去创建了,如果没有的话,他就会会去创建这样的一个文档,然后一会会给大家讲一下这个文档里面有哪些角色,角色下面应该是怎么样分布的?呃,首先第一第一个, 呃,应该是按照这个理来,如果存在就读取这个东西,然后获取之前已经有的的,用团队的一些角色定义以及这个项目的一些上下文 扫描,拿到了之后恢复这样的一个上页文。如果有,有之前有这样的 team, 如果你创建了之后是有一个 team 的 配置文件在的,它就可以不用详细的去看这些文档了,这样的话就能节约节约这个 talk 嘛, 然后它也会检查一下,如果这个 skills 它有有更新的话,它也会去更新这个 team 模式,它会去看。 然后第二第一步他就会去问你,你的目标和需求是什么?沟通,跟你对稍微对齐一下,然后给你介绍一下这个的方式是什么?你的团队的成员,然后分工,因为他一共是六个角色,你也可以不用,六个角色也可以,但是我觉得这六个角色不管你在开发什么的时候 都是可以使,都可以使用的,所以说都还是蛮必须的。当然你也可以去借鉴其他的一些。呃,角色,再把它加进来,这些都是可以的,其实都是很简单的,很灵活的。嗯, 是用什么场景?是用这种稍微比较大一点的项目,其实你改小需求用这个方式也很好了,因为,呃,你可以先让这个去解锁一下,去研究一下这个问题怎么样去修复,然后。呃,又可以开发,然后又测试,然后又审查这个东西我觉得不光是大项目,就是小小项目或者一些小 bug 都可以。 呃,我觉得这个,这个这个东西可以直接删掉,因为你只有这样做了之后,呃,你才能把你的文档一直维护着,要不然你不维护你的文档的话,后面就会有这种技术债啊,或者对不起的情况,一定要还是都都得做吧。 然后推荐的一个团队的配置。呃,一共是六六个子智能体,或者叫六个员工,一个是后端开发,前端开发,探索研究,还有代码的审查,一个管家。呃, 这个后端前后端开发就是使用的这种 t d d 的 模式,也就是最近比较火的这种子智能体的一个配置模式嘛。呃,这都是借鉴了一些一些项目的,可以看到。哎,之前这个是直接看 skills 了。呃,我还是觉得还是要 read me 给大家看一下。 呃,我们是借鉴了这个,嗯, plan with 这个 fails, 呃,它是一个文件的形式,但是这个文件的话,它只只有三个,但是我是让每一个,呃,这个子智能体它都有三个这样的文件, 而且每一个这个任务都有这样三个文件,虽然它的工程化会更多,但是我现在目前用起来的话,它效果会更好。因为你稍微大一点的项目,你如果只有这三个的话,它这个文件里面会非常大,非常的恐怖,所以说其实效果是不好的。 ok。 再就是这个 anything cloud code, 这个是黑客松,它的,它这个三个专家,十三个专家智能体是拿来做了借鉴的。还有这个这个 t、 d、 d 的 模式和这这两个结合起来去构建了这样 六个角色。再就是 harness, 再就是 esoteric 的 harness, 它这个 esoteric harness 跟 open code, open ai 的 harness 有 点呃不一样的,重点是在于 它这个更强调的是,呃,去去去,去审核之前的一些内容,审核之前的,呃,这个效果好不好?比如说前端呀?呃,还有就是它希希望的是这些角色 team team 员工和这个 leader 之间有沟通。 之前我是没有没有在其他地方看到这些员工,他会多次沟通对齐需求。不光我们人应该跟这个卡洛德对齐,他员工和这个 leader 之间下发任务的时候,他们也应该多次对齐沟通需求之后再去完成。这个也是一个比较重点,但是这个跟模型还是很大关系啊,我定义了之后,像卡洛德这些卡 洛德的模型效果都不太好,呃,我用用用 g、 p、 e 的 模型,反而效果会更好一点点,然后呃这个工作流程啊, 人搭建,搭建一个团队。呃,他了解了这样的一个内容,然后推荐几个智能体,然后创建这样的一个项目的文档文件,然后会把这些文件放进去,生成一个 cloud 点 m d 的 文件,这个也是弄好 然后就开始并行,其实是串行生成所有的智能体了,因为这个 team team 模式它是串行的,然后要把这些配置的一些内容全部放在一个文件夹下面,下一次的话可以附用。 再就是协助了,就是 leader 和你进行沟通,沟通了之后他通过这样的一个呃 message 去下发任务,首先去探索代码库,或者说去研究,然后出来了过程,呃出来了结果,然后会给这个 leader 看一下,看一下之后他会给出一个方案,方案可以跟你进行对齐沟通,然后他去下发这些任务, 最终完成了之后审查,审查了之后用这个端到端的测试,测试了之后再哎去做部署,或者进行这个管家的收尾。 ok, 下次回来的时候直接读取那个这个 md 的 文档,就可以直接复活之前的一些呃这种角色,并且这些角色他都会自己去看他的这个文档,他对应自己的文档,然后他就知道我应该具体从哪里继续完成,然后我应该具体完成这个任务应该放在哪, 然后实战的一些演示给当年刚才也给大家看了,安装这些都没有啥,这个你自己自己把这个 skills 直接复制,复制到那个,或者你直接把这个项目直接给 cloud code, 它自己去会去去告诉你怎么样去配置, ok, 呃,我看还有什么。呃具具体的还是得给大家讲一讲。呃具体的这几个角色, 然后推荐的原则,角色不是越多越好,这些就是一些原则,应该怎么样去配置这些角色,然后它会通过这些角色去给你推荐。当然我我是推荐大家,如果 token 不是 太紧张的情况下,全部把它加载也好,我觉得效果会更好一点哈。然后就是 非软件标配,呃,我我觉得它这个 team 模式不光是可以用用于这种代码开发, 还可以应用一些正常的,比如说自动化的工作流。我之前也是让他给出来了这样的一个去做了一个工作流,我直接让他读了一下这个 teamwork, 然后他自己首先他会根据这些原则新定义一些角色, 然后这些角色他就不是什么前后端的开发了,他可能就根据你的任务来自定义角色。这个东西我觉得还是非常重要的,而且非常实用的,这个东西他可以可以跨越的,他不不是只能用在这上面。 第二步就是跟你进行决确认,第三步就是创建这个规划文件,跟你确认了之后他叫创建规划文件,首先就是这个项目他应该叫什么?第二个就是呃, 他主智能体 leader 他的一些主计划,然后 found 这个团队级的汇总,然后进程工作日期,然后就是架构的一些描述决策,还有就是这个文档 系统的架构,前后端 api 的 定义,这个非常重要,就是 harness 那 个借鉴的一个东西,然后就是这个导航地图,因为这个导航地图不能全部写在 cloud 的 点 m d 文档里面的原因就是 它是要可以热更新,热加载的,所以说这个所以也是要要要要放在这,放在这种文档里面的,然后由这个管家进行维护,然后就是每一个, 嗯,规规党的历史啊,还有就是爱军的名字,名字下面就是他有自己的几个,呃,工作日期,这三个都是有的,并且每一个任务他下面都有三个, 然后这三个是指向这些任务的,而且是摘药的,所以说这三个就不会过于爆炸。如果说每一个这种角色都只有这三个的话,那么你完成大任务的时候,他就会这种每一个文件,所以说他必须要这种任务文件,这就是为什么要这样设计的一个原因。 然后完整的一个角色设计看见没有,这几乎每一个这个角色它都是有这样的一个内容的, ok, 深层 cloud 点 md, 这个就没有啥了。然后消耗 创建团队和整体,再就是确认加压缩上下文,这个为什么要压缩上下文啊?因为这个 skills 它是要全量去看的, 看了之后他会消耗掉。我,我看了一下大概,如果你之前有项目的话,大概会消耗掉一百 k 的 上下文,如果你完全没有,没有没有,没有之前的这个,呃,配置文件在的话,呃, 那么他是要消耗掉一百 k 的 上下文的,所以说如果新建的时候你完全建立好之后,你可以让他压缩一遍,然后避免你上下文里面有一百 k 的, 其实跟你后面的任务是没有关系的,所以说最后一步可以 压缩一下上下文,但是你已经建立了过后,它会有一个角色的点 m d 文档,你有那个文档来做构建的话,它就消耗不了什么上下文, ok? 呃,这就是一些规则了。然后 leader 的 一些运营指南其实也有些重复了。呃, 这个是 ci 的, 这个就不说了。然后这是文件的一些模板,然后呃 cloud 点 md 的 模板,然后主的这个 task plan 的 模板, find 的 这些模板,其实就是每一个文件应该要写什么? cloud 点 md 应该要写什么?首先要写这个,你这个 leader 它主要的工作内容是什么? 因为像 cloud code 啊,它有一个非常大的问题,就是它会忘记它是一个 leader, 它有团队成员。 然后你必须要提醒他一下,就算我写在这个点 md 文档里面,他都经常忘记。所以说,呃,你压缩了之后,最好要提醒他一下,你有哪些角色,你的任务是什么?你的任务是协调他们去完成任务,然后你再给他具体的任务,他可能会效果会好一点。然后下面的 那这个,呃 cloud 的 点 md, 我 估计都还要做一些优化,要不然上下文有点长。 嗯,但是这个,这个不是啊,这个不是 cloud 的 点 md 是 在这上面,但是 cloud 的 点 md 的 文档估计还是要优化的,因为 cloud 的 点 md 它不光是加载到了 leader 上下文,它还加载到了所有模型的上下文,所有子智能体的上下文的,所以说这个东西还是在还要做优化的。还有就是这这些东西了, 还有就是 plan 啊,主主的 plan 点 m d 的 内容,比如说项目名、状态、日期,更新,角色列表,然后一到几句,然后详细的产品定义,再引引导他的一个一个具体的详细文档,然后文档的缩影, 看这这些就没有没有什么了。然后这个是团队的角色参考,这些角色都是借鉴的这个,呃, everything cloud code, 它们里面的这种子智能体的一个提示词的设计方式,然后角色第一后端的开发, 他们都是用的这个 t d d 的 方式啊。 t d d, 大家可以可以搜一下,它就是先先写测试输入和输出,然后再按记,再一点一点的丰富里面的内容。还有这个 review 啊,这个研究者,还有这种 端到端的测试,然后 review, 端到端的测试用的 playwrite。 当然如果你用其他的这种网页控制工具也是可以的。这个是没有没有太大关系,大家也可以详细看一下这个角色定义啊。详,角色定义倒是没有特别特别详细的大,大家可以借鉴其他的一些角色定义,然后去补充这个 skills 也是 ok 的。 还有就是整体入职的一些。呃,模板,就是 prompt 模板,你可以可以可以进行它,它可以按照这个模板进行这个员工的角色的一些定义, 这个就没有什么了,就大概是这样录了整整一百分钟。嗯,总结一下。呃,这个, 呃,我,我开开源的这个 skills 自卖自夸一下,它效果还蛮不错的,就是我,我用着还是效果很好的。呃,而且基本上我我认为是赋现了这个 harness engineering, 嗯,他们提到的应该百分之六十到七十应该是完全赋现掉了,现在可能没有没有办法完全的自动化,但是, 呃,但是想要自动化,你其实就是加一些这种好呃 hock 的 钩子的脚本啊,其实没有没有特别大的问题,然后只要把它上线,上线了之后进行更新,多更新几次,然后验证一下他呃被人工接接受的一个比例就可以了。嗯, ok。 最后最后大家也是这个模型的问题,之前也跟大家讲过,我们有个中转站,但是,呃目前目前是账号,账号效账号还比较少,因为我们自己的好像都不太够用。呃,我最近也是在解决这个问题,大家也可以 呃,也也可以关注我一下吧,关注我一下,那可以可以到我主页去看一下,然后如果能解决的话也可以给大家公布一下,因为像现在的中转战非非常离谱,他们完全不不给你 kuv 的 命中率,或者说完全不给你考虑, kuv 其实用不了,你再便宜都用不了, 而且大概率都是比较贵的,像二十 x 现在能用的应该是在三千美金到五千美金一个月左右。所以说 其实现在的这种偷看的呃率啊,这些还挺高的,就是价格还是挺高的,不管是一比几的比例,他都都还是蛮高的,所以说这也是比较大的一个问题。行吧,那今天就到这。

cloud 的 账号频繁被封,这是很多人无法解决的问题,我全面逆向分析了这次 cloud 泄露的底层源码,扒出了他向客户端上传的所有核心数据,让你今天不仅能够收获可能全网最有效的防封号办法。而且我还可以告诉你 cloud 的 背后的算法逻辑是,如何判断你是合规地区用户, 是外来的偷渡者。 what's up? 这里是带你发现更多 ai 机会的德赛点波关注,我们开始 mod code 背后的封控算法是严密的多维特征指纹判点模型, 横在你面前的至少有三道隐形关卡,决定着你的账号合理。第一道关卡请求识别判断,我们在每次使用 cloud 的 时候,本质上就是一次数据请求,而扒开原码后,我发现每个 api 请求底层都硬编码了,无法篡改客户端证明的版本指纹。注意,如果你这个时候自以为是的关掉了官方的遥测, 那么你不仅藏不住你的真实 ip, 反而会在官方的大数据里搭上一个做贼心虚的高危标签。更惨的是,看我发现在源码里明确规定了关闭遥测会静默切断你的高级 api 权限,让你花了钱却只能使用降级的功能,每次使用都必须交出 ip 和底层指 纹等信息。所以最安全的做法就是脱掉黑色外套,穿上普通的衣服,像成千上万个欧美正常老百姓一样 坦坦荡荡的走过案件。你的数据就混在这全球几百万正常用户的庞大数据库里,逻辑就是成为他们,融入他们,这样可以极大降低你的封号概率。第二道关卡,系统的记忆连坐机制, 你正在用的设备也是封号的关键。这里我们可能要注意一个细节,很多人 cloud 被封号后,换个节点换个新号就接着跑,结果又被秒封。这是因为奥斯洛克公司在 cloud 原码里 清清楚楚,它会在你第一次运行 cloud 时生成一个六十四倍的设备 id, 这是一个跨对话跨账号的永久设备 id。 即使你换账号,但只要你的设备 id 不 变, 如果一个设备 id 关联了很多被封的账号,那么新账号也有极大的可能会被关联封禁。所以我们遇到这样的封号情况,一定不要先着急着换号,而是先备份有用的配置,然后必须删掉 cloud 目录和 cloud json 去 全部的文件数据。如果不清理这个设备指纹,那你换多少个号都是一个黑户的身份。第三道关卡,看环境,你以为搭一个美国的 ip 就 天衣无缝了吗?来,我们看这段代码,其实客户端会在后台疯狂探测你的系统底色,即使你换了账号,系统也会静默抓取你的本地留香地址来暴露你的真实身份。 它还会对比你的系统时区、语言和你的 ip 是 否匹配。举个例子,假如你现在 ip 在 纽约,但是你的时区是在上海的时区,而操作系统又是我们国产的 linux, 嘿嘿,你小子大概率要凉凉了。那解决办法就是对齐你的环境信号,用海外节点、时区和语言也必须做细做全套 检查你的全局 get 邮箱,别用带有强国内特征的镜像和特殊的 linux 系统,能极大的降低你的封号概率。我已经把刚刚所讲到的 所有的防风技巧整理成了文档,包括如何搭建属于自己的专属环境,有了它我们就可以极大程度的使用 cloud 带给我们的生产力的提升。 ai 时代,一人就是一个公司,我是德赛,我们下期再见。