最近写了一个快速搭建 web 应用的一个 skill, 然后这个 skill 的 话它有几个核心流程。第一个就是选择这个 web 的 项目类型,比如有 ai 对 话,然后 dashboard, 还有多的页,还有萨斯系统的等这些项目项目类型。第二个的话就是选择这个 web 项目有哪些页面, 第三个选择的话就是每个页面有哪些组件之类的,然后就是选择这个 ui 框架,还有选择这个设计规范,这样设计规范的话也是使用最近开源的这个五十二家这个大厂的设计规范,然后使用哪些图标注, 选择了这个之后就是到生成呃这个 web 项目,还有一些参考,比如呃这个权杖框架的一个最佳实践,然后这个设计规范的一个映设表,还有一些技术相关的一些文档链接。然后就是呃生成的时候使用的这个模板,大概是这么一个 skill, 下来我给大家演示一下如何去操作, 比如打开 cloud code, 然后再搜索这个 skill, 发送 demo web build, 这时候我会等待它加载来确认我们的一个要生成的 web 的 一个效果。比如我选择落地页三项这类型的,然后是单页面 所有的组建组建库,我们使用推荐的方案风格的话,我们使用 open ai 的 设计风格,然后使用默认的, 然后它就收集好所有的信息,让我们确认是否要开始生成。接下来就是开始去生成这个 web 应用了, 现在就无脑接收就行了, 经过等待已经生成好了这个项目,然后我们打开一下这个项目, 这个的话就是使用 open i 的 规范,然后生成的这个官网的落地页,基本上效果看起来还呃,还可以的。 然后我也用这个 style 生成了另外的一些 web 页面,这个使用的 cloud 的 规范设计去生成页面一个官网的页面,然后这是一个 dashboard 的 页面数据,看看这是这是一个磨玻璃的效果的规范,这个是一个萨系统, 总体看起来这么个页面是效果还是不错的。然后基于当前这个设计规范,可以在这个页面之上开发,继续开发功能都是能够进行统一的。然后这个 style 的 话我也上传到这个 glop 上面了, 大家可以使用龙虾,然后下载这个 skill 去搭建一个属于自己的一个 bug 页面,大概就这些。
粉丝44获赞494

hello, 大家好,这里是无聊的研磨啊,最近 scale 蒸馏这个话题在网上讨论热度也是非常高,然后最近我在逛 get up 的 时候,也发现了一个新出的基于 python 的 一个非常有趣的一个开源项目,叫 your scale, 就 自己蒸馏自己嘛, 添加你的聊天记录,日记,再加上你对自己的描述,就可以创造出你自己的一个数字分身出来啊,也算是一种赛博永生了。 那么有趣的一个项目,我在网上看了看,好像并没有一个特别详细的教程,那我们今天就不谈原理,只谈过程,来教你们如何创建一个属于自己的数字分身。 我们首先呢确保自己有一个可以科学上网的工具,然后打开 g hub, 直接搜 v flo, 点进去之后打开这个链接,他就会直接跳转到下载界面,直接下载就可以了。 后面就是三个运行工具,首先是 python, python 他 三点九以上的版本都可以啊,直接点击下载就可以了, 这个和 note gs 也是同理,直接点击安装程序,跟着他一步走,全部默认选项就可以。安装完成之后呢,我们回到桌面,然后打开搜索框,搜索 power share, 这个第一个就是点开它,然后我们直接把这个代码复制粘贴进去,这是安装 cloud cloud 的 终端,这样就是安装好了,我们怎么检测呢?我们在这个输入框输入 cloud 启动程序,可以跳出来这个界面,我们选 yes。 好,现在他就是已经进入了,成功进来之后呢,他这边会显示没有登录啊,这个我们登录一下就好,写一个 ok。 然后可以看到有三种登录方式,第一种是通过官网登录,它有 cloud pro 和 max 两种方案,一个是二十美元一个月,一个是一百美元一个月,然后第二个是通过 api k 登录,第三个就是第三方登录,这个这边我们推荐 选第一个,然后它会自动跳转到浏览器,好来到这个界面。因为我已经提前订阅过它的 pro 套餐啊,所以我可以在直接在这边授权你如果 没有订阅它的 pro 套餐的话,你是不能在本地使用可 out 的 模型的。这个月租套餐也非常简单啊,如果没有国际支付的银行卡的话,可以在淘宝或者闲鱼上找人帮你代购一下。我们这边直接选择授权,然后等待一会 好出现这个界面,你就可以把浏览器关掉了。那这边显示已登录成功,我们点击 enter。 好,先来测试一下,比如说你打个你好, 好像他这样能正常回复你的话,就是已经部署成功了,那我们不需要自己去手动的去安装这个 scale 项目,还有这个 lie 啊,就我们直接看它这个网 址,复制一下,直接 delete 这个 cloud, 然后只要它就会自己帮我们去自动的去安装,就不需要我们去操心了。那像这边它问你是否允许,直接选 yes 就 可以了。 好的,它现在已经安装成功了,它让我们显示这边要启动这个 yourself, 我 们给它复制一下 输入进去。好,那现在就已经正式进入蒸馏环节了,他会不会先问你三个问题,代号随便起,比如说小明。 好的,基本信息,呃,年龄,二十五,工程师,北京这边做个演示啊, 好自我画像,比如说 e n t p 天蝎 射孔, 如果你不知道怎么描述自己的话,你也可以随便再找个 ai 跟他聊聊天,然后让他把你的性格总结下来,总结成几句话,再丢给这个 cloud, 让他去整理这个基础信息。已经录入成功了,接下来就是提供原材料。我推荐的是用这个微信聊天记录导出啊。 呃,你提你提供的这个微信聊天记录越多,他模仿时,他模仿你时的语气就跟你越像。我们需要用到这个微 flow 这个软件,我们打开它。 好的,我们选择导出,能看到大量的这个信息,对吧?比如说我们选一两个人的,选中批量导出,然后我们一定要记得把这边格式改成这个格式啊, 要时间范围给他选择全部时间。好,我们先直接创建导出任务, 导出的过程会有点卡,因为它信息量比较大,我们打开目录, 这个 test 文件文件夹就是你的聊天记录,我们把它放到桌面,或者你放到别的盘也可以,只要能找得到。啊, 好,他现在让我们提供这个文件路径啊,我们不是提前把他拖到桌面上了吗?我们直接再把他直接拖到这个聊天框,他就会自动粘贴上去,直接按 enter 发送给他,他就会自动开始分析, 等它解析完成呢,你的一个数字分身也就制作好了。那这就是 your scale 简化版的一个安装流程啊,那本期视频就到这里,喜欢的可以点个关注,谢谢大家。

大家晚上好,然后今天前面跟大家有讲过要做数据分析,首先推荐的是 cloud code, 那 其实一开始上手的时候我们是很茫然的,那 cloud code 怎么用,对吧?然后就跟大家演示一下 怎么用 cloud code 去分析我们的数据啊,然后首先的话我们就连接上了这个 cloud code, 然后我这里是订阅的是一个 max 套餐,对吧? 然后我们本地呢,其实是已经安装好了这个 mimic for 的 一个数据库的,那然后我们发送我们的 prompt, 这 prnt 呢,就是跟他说我们我们要做一个 mini 4 的 一个浓度证的一个探索性数据分析啊,然后我们的信息给他,然后我们这里是跟他讲就抽象做一个 demo, 然后目标呢就是 table one 啊,然后要做一个 excel 文件,还有 k n 曲线啊,然后 e d a 的 话就是所谓的探索性分析, 我们要看一下一整个年龄分布啊哈,这个受法评分的一个分布的一个情况,还有关键的生命体征对比,然后还有缺失值,热力图、相关性热力图等等应付得过来的,如果再多的话,确实你的一个认知的一个贷款会跟不上啊,跟不上这 ai 的 一个脚步。 然后其实写代码,你说这,那你有些人就问,就说那你这个代码你信任他吗?对吧? 呃,不能完全信任啊,不能完全信任那,那也会在探索过程中会发现很多一个踩坑的点,然后不断的去纠正, 那你有了足够多的上下文的之后,他的表现就会好很多。所以其实跟爱的交互是一个积累的一个过程,不是一次性的说,我一次性就要得到一个很完美的一个版本这样子, 然后我们这里看到他已经给我们写了一个 e、 d、 a 的 一个啊拍摄脚本,对吧? 然后这些啊,对,前面,前面这个都是我们的规范数据源啊,队列抽样输出,对吧?这都是要有记录的啊。这里有很这个脚本很长, 一般我不会去 review 再去 review 这个脚本,因为太长了我们也看不过来。然后就是通过一些,比如说断言啊,然后他去做,那我们看到他这里对他自己运行成功了,他还自己去读了一下这个图,他说中文显示变成方框是字体的问题, 然后做了一下修正啊,做了一下修正,然后这里自己在跑。所以 cloud code 它这种工具的好处就在于它自己有一个反馈循环,它自己跑了,数据它自己要去看的, 出了图它自己要看的,然后有问题它会自己去解决,那这个是理想状态啊。但是如果说有一些,呃,你虽然跑通了,一些潜在的问题你没有发现啊, 就比如说一些数据的错误啊,队列的错误啊,这种也是会发生的,这种潜在问题没发现,那就可能会导致灾难性的后果。所以这个只能是自己在分析的过程中啊去体会。 但是你说这个从效率的角度呢?这个肯定是比我们自己手写要大了很多。那以前,呃,在 agent 比较流行之前,就是我们比如说不会写社库脚本,那么我们就会 copy 到 呃空白的网页端,然后一个一个自己去,对了,自己在中中间担任一个呃信使工作啊,那那那本本来就是我们一生的话,本来写代码能力是比较弱的,那你 你主要要掌握的就是啊,就是你的一个判断你的科学问题的一个选择,而不是在写代码上啊。话我们看一下我们的一个结果,然后在这里 我们先看一眼这个脚本啊,看一眼这个脚本,那么是一个很长的五百多页的一个脚本,然后我们看五百多行的一个脚本,对吧?然后 这个我们一般就没法再看了啊?然后我们就看一下它产生成的一些图啊,生成的一些图,它总共有六张图啊, 一张表,那这个是一个 table one 的 一个预览,预览的图啊,我们因为我们是一个两千个队列嘛,对吧?一个两千个 demo 的 一个队列,按人口学特征、疾病严重程度、住院天数、手术室也是检查啊,做了一个排序,对吧? 还是非常好的。然后我们看一下它 excel 的 一个 table one 啊, excel table one, 你 看这个排版啊,也是相当不错,对吧?第一张是一个 k n 曲线,一个非常常用的一个东西 啊,轻度的手法啊,中重度的一个 k n 曲线,成一个梯度的一个排排序,那我们看看这 e、 d a 嘛,我们主要是看一下年年龄的分布,对吧?呃,然后我们这里可以看,对吧?他在二十左右,那因为我们是筛选的是十八岁以上成人的队列,那如果说你有一些 ag 是 在后面 有异常的值的话,比如说十八以下,或者说在,甚至在零复制都有可能,那这个时候是什么情况呢?就是有些数据的录入的错误,那我们这个要把这些样本呢排除掉,那我们去看一下它整个成一个,呃,成一个这个 啊,就是一个单峰的一个分布啊,这个是比较正常的。那我们看这年龄组的一个情况,就大概预览一下我们整个一整个一整个数值,一整个数据的一个情况,让我们看看这心率、收缩、压、呼吸频率、体温这些情况啊, 然后有一个大概的概概念,然后就是一个缺失变量啊,比如说第一天的一个白蛋白缺失太多了,那如果你想以白蛋白作为一个特征的话,那你就要想怎么去处理这么这么高的一个缺失变量,你去做差补可能就不太合适, 对吧?你是去做完全分析的话,又是会闹着某些偏移,这个就要取决于你的一个自己的一个科学问题了。 然后这个关键变,那呃后续的话肯定会有一些更更 高端的,也不说更高端,更深入的一些用法就是怎么用好它,那就是因为其实 模型去他去扫扫一遍这个表,说每个表有哪个质段是非常非常快的,那人的话你一个看一个,一个看一个,一个去理解哪个质段是什么意思,那是非常呃费时间的。有一个好的方法就是我们可以 先去扫一下字段,然后让它呃把它列出来,然后我们再去理解,那对后续整个分析自己心里会更有数一点。好,今天的分享就到这里,然后欢迎大家关注刷到实验室 呃,以后再跟大家分享怎么用 cloud code 进一步做我们的数据分析啊,不仅仅是 mini k4, 可能也包括多主学的一个分析好。

总结了几个在使用 cloud code 的 过程中可能会忽略的事实,或许能够避免你的误用。内容来自 cloud code 的 官方文档以及原代码泄露以后,业内很多大神的解读。 第一,中断当前的任务成本很低,并且不会丢失上下文。这归功于 cloud 所采用的流体架构和异步生成器。 所以如果你在 ai 运行的过程中发现问题,请干脆利落的按下中指键,而不是等待这个已知的错误结束响应以后再去修改。第二,对话是可以持久的,可以恢复,不用重新开始。大多数人打开 cocoode 会创建一个新的对话,这会导致之前所有的操作和上下文信息全部丢失。 你学会使用 continue resume 和 fork session 这几个命令,充分利用和 ai 对 话的过程中积累的记忆和学习成果。第三, ai 的 上下文压力可能比你想象的更严重,所以压缩上下文非常重要。 主动使用 compact 命令,不要等待系统自动压缩,以免丢失你所关心的上下文信息。压缩后继续对话比开始新的对话要更好。 可以使用 context 去检查你实际的上下文使用情况,获取按类别划分的实时细分数据。你还可以用 compact 加 focus on blah blah blah 告诉 ai 你 想保留的上下文重点是什么。第四,学会使用 cloud dot md cloco 会在你每次发消息的时候重新读取这个文档,所以你可以把你的架构、决策文件、规范、测试模式等一系列规则都放进去。很多人这个文档是空的,但恰恰这个文档是最能够提高你生产力的配置。下期聊聊剩下的。

兄弟们,你们要的 cloud code 大 师速成指南他来了,我自己做了一个这样的一个测试,就是我用斜杠 scares 命令去统计我的技能, 然后我用 cost 去看一下我用这条命令所花费的 token 是 多少,查询结果发现他没有花费任何的 token, 然后我再用自然语言的方式去跟 cloud code 进行对话,让他告诉我我目前有多少个可以使用的 scares。 查询结果出来之后,我再用 cos 的 命令去查看一番我现在这个交互自然语言的交互用了多少的 token, 它这里是以一千个 token 为单位的啊,所以说这里是零点零七五,那我们就会发现,当我们在 clock cos 使用中能达到同样的效果的情况下,使用斜杠命令比我们用自然语言的方式要省 token 的 多。 那么既然它这么好用,那么我就整理了一份整个关于 class code 的 完整的命令行手册。这里除了习惯命令之外,还有我们的快捷键和如何去拓展我们的工具,也就是 m c p 的 命令。 第四块就是如何去管 ai 的 记忆。其实 class code 的 这些资料哈市面上有很多,但是你真正要说如果完整足够系统的这种的话,目前还是没有的,如果大家有兴趣的话,可以把它当成我们一个使用过程中的速查手册。 第五块把我们去调用或者是构建 scale 或者 engine 的 效率直接提升了十倍。第六部分是我们 cloud code 总常用的配置,文件的一些配置几乎都在这里。第七部分,当我们没有进入到 cloud code 的 时候,也能够通过终端命令行的方式去给它下达命令。 最后第八块还有我们的高级使用的一些高级的技巧,比如这里控制大模型思考的一些高级的技巧,比如这里控制大模型思考了一些高级的技巧,比如这里控制大模型就变得十分的简单。

最近有一个基于千问三点五二十七 b 的 cloud 蒸馏版大模型,在开源圈刷的很猛,号称本地最强大模型。很多人已经下了,更多人还卡在第一步,不是下载慢就是装玩跑不起来,或者跑起来以后发现根本不是自己想要的东西。 这期我只解决三件事,它到底藏在哪?什么人该装? windows 显卡和 mac 到底分别用什么方案?还有国内网络环境下,怎么把最实用的版本拉下来,别在第一步就耗一晚上,先把话说死。这个模型不是拿来陪你聊天的, 你要的是情绪价值,自然闲聊,写点轻松内容,它不占优。它真正有价值的地方是代码、数学和硬逻辑。 你可以把它理解成一把偏科,非常严重但是刀口特别锋利的工具,用对地方效率很夸张,用错地方你会觉得它怎么这么拧巴。很多人对它评价两级,不是模型不行,是场景没对上。 他最能打的地方不是打的多花,而是思路更像干活的人。很多模型碰到复杂问题,前面看着挺唬人,后面就开始绕,换个说法,把同一句话讲三遍。 q opus 这一类蒸馏的好的模型,价值就在这里,他会更快进入拆任务的状态, 先抓目标,再拆步骤,再看边界条件。这个差别在代码场景特别明显。比如你让他改一个项目里的报错,不只是让他给你一段代码,你要的是他先判断问题在哪一层,是依赖冲突,是输入格式不对,还是你整个调动链写歪了。 他如果会把思路按步骤展开,后面给出的修改方案就更稳,不是玄学,就是因为他少了很多来回打转的废话。再说那个最直观的标志就是 think 结构,你会看到他不是直接甩答案,而是先把过程铺开。这个过程本身就很有用, 因为你能看见他是不是走偏了,他要是第一步就理解错题,你马上能发现,不用等他输出一大头结果再返工。 对于做代码、做逻辑题,做复杂规则判断的人,这个透明度很值钱。还有一点容易被忽略,他不是只会做单一题型,社区里对他评价高不只是某一道 benchmark 分 高,而是他在逻辑、数学、编程这些需要连续推理的任务里表现比较均衡, 这种跨任务稳定性才决定他适不适合真拿来干活。如果你不是单纯在终端里问答,而是拿它接近 agent 流程, 这个模型还有一个很实用的点,它原生支持 developer 角色翻成大白话就是你少折腾很多俄式兼容和模板修补的问题。对于接工作流的人,这种省事比参数多两分少两分更重要。实际用法也很直接,你可以把它看成一个本地代码,大脑 挂到 defy 这一类工作流工具里,或者放进骗代码的执行链里。以前你可能接的是云端模型,现在只要机器带得动,就能把一部分代码任务搬到本地。这样做的好处很实在,响应稳定,隐私可控,而且不依赖外部接口受封。这个点对写代码的人吸引力很大。 最后直接给结论,你手里如果是三千零九十、四千零九十这一档的显卡,或者是三十二 gb 内存级别的 mac, 就 刚好需要一个离线的代码和逻辑助手,这个模型值得装。它的强项很明确,干活能力也够硬。 如果你主要是聊天解清内容,想要一个说话自然又会陪伴的模型,那就别把时间花在他身上,他不是这个方向的优等生。这期先把定位讲清楚, 后面的下载部署和参数设置,按简介群的内容直接照着做就行。跑起来以后第一件事不是闲聊,先拿一道代码题或者逻辑题试它,你会很快看出差别。

说实话,大多数人用克洛克的就像花一万块买了 iphone 十六 pro max, 结果只用来打电话发微信。 今天基于 cloud code 的 创始人 boris chany 的 推文家主包本人自己的纯主观体验。瑞评一下克洛次十四个被严重低估的功能。不过首先叠个甲,这里面每一个功能就算是拉完了也是非常有用,只是说没有那么被低估而已。好,现在开始。 第一个, a d d r 跨仓库访问 a d d r 添加的文件夹,允许 cloud 在 同一个上下文中同时看到并操作多个文件夹。 有了它,单次绘画直接多开地图,跨仓库操作,行云流水,让它在真实企业级复杂项目中的实用性直接起飞。但对于一些出街开发者,所有东西放在一个工作区直接起飞。但对于一些出街开发者,所有东西放在一个工作区里去用。这里给到顶级。第二个, voice mode, 口述复杂需求比打字快三倍,并且这也更像是你作为产品经理去一边看着 clod 做出的效果,一边提出改进建议, 确实快,确实爽。但很难想象一个公司的开发人员都同时口喷代码的升倍。而且要是个人开发者在咖啡厅语音编程, 林舟可能以为你在玩什么沉浸式剧本杀,这功能是为那些有独居办公室的人准备的,但问题来了,这种人大概率同时使用多个 ai 工具。那为什么不直接专门注册一个语音转文字的软件呢? 这里给到 npc。 第三个,牢记, md 团队知识库,这是 antropic 内部公认的复利核武器, 记录团队的代码规范,踩过的坑项目特定配置一个不断吸收你的开发习惯的 cloud md 是 最好的复利资产。不过有一说一, cloud md 本身还是有存在感的,但是考虑到它实际开发中的出境频率,这里给到吭。第四个, branch 绘画分支,就像 git branch, 但针对的是对话历史,创建分支后,你就可以在不中断主线的情况下平行探索多个方向。不过现实中 大多数人的 cloud session 通常就持续一到三小时,要么任务完成,要么 context 乱掉后直接重开。不过它在某些场景下还是有实用价值的,比如长时间复杂重构, 需要并行验证多个技术方案,总体评价不算鸡肋,但也远没到必备级别,更多是给喜欢精细管理对话流程的人准备的。 这里给到 npc。 第五个, gitworktree 并行执行。这是 boris 本人多次强调的最大效率解锁之一,核心优势在于并行加隔离, 这确实能把开发效率从单核提升到多核水平,不少人反馈用起来后整体速度有显著提升。 当然,并不是人人都有必要这么做,有人觉得脑子管不过来,开多了容易乱出现技术上并行、 大脑单行的病历情况。关键在于你是否经常同时处理多个独立任务,以及你对 git tree 的 熟悉程度。这里给到顶级。第六个, auto memory 加 auto gene cloud code 的 长期记忆系统,模仿 r e m 睡眠自动整理记忆。 auto memory 会把交互中的关键偏好项目动件转化为持久笔记, auto 字母则在后台定期清理,进行合并优化。问题是很多用户用几天就忘了他在后台运行,不如直接编辑 cloud d d m d 来的直观可控 auto memory 你 得时不时检查一下, 才不会觉得 cloud 突然变笨了。这里给到人上人第七个 hooks。 这是目前最确定、最深入的挂载到扩展的生命周期的方式,但确实只有少数人真正了解和使用。 抛速 tux 可以 自动格式化输出代码, session start 能动态加载上下文。你需要深入理解 cloud 的 完整生命周期, 还得具备一定的工程化思维。个人开发者如果不是特别享受深度折腾和系统优化,可能最大的作用就是设置一个任务完成之后的震动铃声。这里给到顶级第八个贝尔 s d k 加速。 s d k 的 启动优化版,能把启动速度提升最高十倍左右。它会跳过自动搜索本地 cloud, 点 m d m c p s 等配置文件的步骤,直接以精简模式快速启动, 对经常用 sdk 斜角本的人,能显著减少冷启动等待时间。对普通用户来说,这个功能基本没啥影响,就像给 f 一 赛车换上更轻的碳纤维部件,对每天开代步车上下班的你来说,听起来挺高级,但实际用不到。现在不用特意去折腾,等它变成默认就行了, 只适合重度 s d k 和自动化用户。这里给到 n p c。 第九个 loop schedule 定时任务。思路上应该借鉴了不少小龙虾的心跳机制,通过 croncreate 实现间隔执行, 比如五分钟检查一次部署状态。但是路普局限性很大,不能关闭会话,也不能超过七天。 c k 九则是在云端运行,而且能让 klod 自行启动任务还是很不错的。这确实是把 klod 从单纯的编码工具升级为具备一定自动化平台能力的显著进步, 但还有继续完善空间。这里给到人上人第十个, mobile app 加 teleport。 早上在手机上启动任务到办公室,在电脑上继续,可以让你在电脑、手机、平板上面丝滑切换,继续筛选。不过在地铁上语音输入代码, 旁边大爷可能会觉得你是个都下班了还要给程序员下任务的万恶产品经理。而且咱都下班了,不能有时间多读读书锻炼锻炼身体吗?一定要每个月提前十五天用 buckle 的 那点额度吗? 这里给到人上人下一个 agent。 agent 是 强大的元语,但经常被忽视。你可以给每个 agent 定制工具及权限模型颜色。 ri 动力 agent 只读分析,避免误删。 security agent 专门做安全审查,当然 agent 最核心的作用还是上下文隔离。这里给到顶级。第十二个, plan mode, 几乎所有三审都应该从 plan mode 开始,而不是直接让 cloud 写代码。计划阶段多花时间让 cloud 依次实现, 如果执行重出问题,立即回到 plan mode 重新规划,而不是让 call 帝继续无脑修补。 shift 加 tab 就 能进入主包。之前说过很多次, plan 模式是最简单但是最复利的功能。 先花十分钟让 cloud 把架构和步骤想清楚,一次搞定,节省的总时间远超计划时间。虽然其实不算被低估,但是考虑到其出境频率、 实用难易程度等等,仍然要给到吭。第十三个, bypass permission 很多人觉得 auto accept 格几分钟就要跳出来一次刷存在感很难受,但其实在插件设置里可以点开 bypass permission, 在 终端里则是 cloud dangerously skip permissions, 这消除了点允许点到手抽筋的情况,而且对于大部分个人开发者来说足够用了。让人类把注意力解放到其他地方。对于长时间运行的任务,批量操作,这是必备功能。这里给到顶级第十四个 chromecastation 给 cloud 的 一个验证自己前端工作的方法。 cloud 可以 自己打开浏览器看自己的杰作。 cloud 写代码,自己测试,修复再测试,直到完美。这个是提高前端质量的一个不错功能,毕竟如果你雇了个前端写代码, 但是又不让人家看写完的效果,那大概率最终产品比较滑稽。不过架不住有人直接截图发给酷傲的手动循环,这里给到人上人, ok, 结束了。注意到这里没有一个啦,因为这些其实都是相当不错的功能,给啦实在有点不礼貌。

astropic 的 cloud code 哈,是如何防止别人蒸馏它家的大圆模型的?大家如果有印象的话,二月份的时候我记得它指的中国的那些厂商嘛,包括 deepsea 啊,或者 moose ocean 那 一些去蒸馏它家的大圆模型。 我来先讲一下大圆模型,大圆模型其实它就是一个函数,它大概有个上亿个参数。 我们开源的话,我们就说呢, deepsea 这些是开源模型,实际上就是把这上上一个参数啊,给大家看。 b 源模型的话,实际上就是不给你看这些参数哈, 这跟我们所说的开源实际上是不一样的,传统的开源,比如说 linux 开源,它是源代码要给你的大源模型说开源,它只是把这些参数值给你,给我们来看叫更确切的说应该叫开放权重,而不是开放应用的这些源代码哈, 这些训练用的元代码,对公司来说,包括 deepsea 所有的都不开放的,因为他们要训练,即使这些元代码给了我们普通人也是没有什么用的。为什么?因为我们就算有了元代码,我们没有那么多的资源来训练这些东西,对我们来说最主要的可能就是, 呃,没有硬件来训练,当然也没有数据啊,对这些厂商的话,它可能是有硬件,但是它也没有数据,这些数据是从哪里来的啊?简单来说全是偷的, 他会把所有互联网上的东西,包括微几百科呀,或者你上到哪个帖子,你发到哪个博客,他都偷去了他,他不会经过你授权的。这些呢,实际上是不够的,他们还会做什么事情呢?把这些书我们人类一直以来的所有的书他都买一本过来,包括他们会下载盗版的书, 也会下载哈利波特这一些哈,包括他们会呃正经出版的这些书,他会把它切掉,然后用计算机扫描了,然后让大元模型来学习。就按说这一件事情已经被人罚了十几亿还是几十亿了, 因为以现在训练的规模的话,所有的印刷品都已经没有了,都已经不够了,现在高质量的数据已经是没有了,你说怪谁呢?有可能怪秦始皇,因为秦始皇把书都烧了嘛。 那现在我们训练的话,其实这些大元模型啊,当数据都没有的时候,很可能就要去训练别家大元模型的,但大元模型的这种东西就叫蒸馏,但是蒸馏一般 一般都是蒸馏自己的,包括比如说千万啊,它会蒸馏自己的,或者 dipstick 也会蒸馏一些自己的,出一个更小的,在低一点的硬件上也可以跑的。 既然他指责嘛,我就去看一下这 cloud code, 它也不是泄露了,我就对这个很感兴趣,我就想看一下它有没有, 有没有它有一些方法如何阻止别人蒸馏它家的大圆模型的哈,第一个我是用 cloud code 去分析 cloud code 的 圆的嘛,分析一下哪些是蒸馏啊?第一个就是伪造工具注入是什么,它就撒谎嘛,它这个这个文件里就是 code 的 这个文件里,它 它是要做一个判断,你要同时满足四个条件,比如说你要是官方的 api 或者是什么东西,满足这个条件之后啊,比如说 说,我说帮我查一下天气嘛,现在啊,它就会湖州嘛,它可能已经查到了这个天气,但是呢,它会胡乱编出一个工具来说,我调用了 visors 去查这个工工具, 但这个工具很可能是不存在的,因为爬虫的话,其他的人去读它的话就会觉得,哎,它竟然有个爬虫。久而久之呢,它实际上就会了什么,学会了幻觉嘛,因为 surface cloud code, 它本身它就在 撒谎,因此呢,你去读这个东西啊,反而读出来都是假的。第二个呢,就说它会把自己的思考的链路都给清除掉啊,这个在第二行这个代码里,那模型它会 先叫什么?先思考的话再去回答想的这一段呢?思考快的话,它里面实际上隐藏的推理的过程,但是呢,这个函数呢,它发给服务器, 服务器在思考内容的时候它都删掉了,因此呢,思考过程很有可能是 模型最重要的那一部分。蒸馏价值最高的,实际实际上是蒸馏他的思考过程,但是呢,他已经删掉了。所以呢,你就是只能拿到一些干巴巴的答案,但也学不到推理能力。再就是他返回数据,他不是返回好几个吗?可能他要从五个文件中返回, 比如说五个文件能返回,但是他会,比如先读文件,然后再把文件内容如下,这五个应该是做起来吧,但是他不会的,他会直接把这个所有五个文件先压缩一下,压缩过度成就过度,文字呢,我完全搞成一个栽药,你爬虫肯定是没有办法看了吗? 第最后一个还客户端的输出去改造他,我也写在这里,他比如说说,我要调用一个方法去调用文件 a 吧,又调用另一个工具去把它写入文件 b, 我 就模糊了这一点, 比如说他只可能是说我读了两个文件,写了一个文件,但是呢,他也不告诉你他用什么文件去读的,也不告诉你他用文件什么去写的。因此呢,你也没有办法去知道他具体的文件名,读了哪些内容,做了什么事情。爬虫呢?他只是统计一下数量觉得,哦, 好吧,他读了一个东西,读了一个文件,你也不知道他读的哪个文件呢。总之呢,整套方案的解决思想其实就是这样,你爬是可以的,他也阻止不了你爬嘛。但是呢,你爬到的数据都是我湖州的, 我,我乱编的吗?假的工具呢?我胡做的这些东西,就让你的爬爬虫学一些错误的行为吗?删除思考的话,你也学不到他的推理过程,但据和统计的话,他已经统计好了,你也学不到什么东西。最后的话,其实你爬虫去爬的话,最终呢, 你也爬不到什么东西啊,收益是非常低的。我看他指责的中国的这边是用了多少次,大概用了是十五万次,调用就是你,你大家,如果你没有用过这些东西,你可能觉得十五万次好多,实际上非常少。十五万次,你如果装个小龙虾的话,两天给你跑十五万次, 所以呢,这是非常少的一个数量,而且他说用了个一千七百多个账户,爬了十五万次,也就是说每每每个爬不了几次吗? 其实这个指着还是蛮搞笑的,是吧?因为如果爬塔的话,为什么不去找一点盗版书呢?其实找盗版书其实会训练的结果会更好一些。

我一定要推荐你用 cloud code, 因为这是走向 ai 时代的一条最快的路。那么用 cloud code 能做什么呢?第一个,它能帮助你部署 opencloud 大 龙虾,它能帮你去部署,帮你去修复 bug, 给大龙虾安装各种插件,它还能跟大龙虾一起协作,去做更多的事情。第二个,它能帮你部署任何软件,比如 docker、 rackflow、 tiktok 上任何开源软件都能部署,还能帮你修复 bug, 调参数。第三个,它能帮你编程,做出你想要的工具、软件、网站,帮你链接各大平台,打通各个平台与网站,甚至是通讯工具之间的连接都能实现。 cloud code 有 一个非常重要的功能, 就是真的能帮你收集并下载东西,我就用它收集了一千多份规范,帮我收集了房屋体检时相关的全国所有资料,甚至收集各种国外的规范文件。 做信息收集一定要用它,它能真正帮你收集并且翻译,它甚至能帮你工作提效,比如自动填表,帮你填 word、 excel, 甚至做 ppt 都能实现,而且它能根据你现有的知识库,你的资料进行精准填表。 cloud code, 甚至是你这个内容分发工厂,能自动帮你写文章,自动排版,自动分发各大平台,甚至还能帮你的文章直接转成视频,我这个视频就是 cloud code 帮我做的,完全是它帮我做,我没有写银行代码, 它还能帮你在实际中干活,自动帮你做标书,监控招标信息发布,自动审核招标资料,还能帮你对图纸进行分析算量。你在评论区说一下你能想到的在电脑上的操作, 我都能用 cloud code 帮你实现。我觉得 cloud code 就是 一个让你的想法转变成真实,能帮你干活的 ai。 如果你真的想用 ai, 强烈推荐你用 cloud code。 接下来我也会开启教程系列,让大家一步一步用好它。

各位,先问你们一个问题啊,你们有没有想过,为什么 colotco 的 能够完整的理解一个几万行的项目,改起代码来贼溜,而一般的 ai 写代码就经常出错呢? 你们可能会说,哦,肯定是因为模型牛啊,参数多啊,对吧?但其实我今天要告诉你们的是,你们完全想错了,更多大模型学习物料和全套面具可在这暴走。大家好,我是彭宇。这个答案远比你们想象的要深刻的多。二零二六年三月三十一号凌晨, 发生了一件特别有意思的事儿, anthropic 这家公司在发布 cloud code 二点一点八八版本的时候,不小心犯了一个超级低级的错误,他们把一个叫 sourcemap 的 文件没删掉,结果呢,整个项目的五十一点二万行 type script 原代码 就这么完整的暴露到了网上,你们想象一下这是什么概念啊?相当于一个堡垒的建筑图纸被全网公开了。更疯狂的是,这件事在二十三分钟内就被发现了一个安全研究员,他一看这个 npm 包的体积特别大,就觉得不对劲。然后他用逆向工程工具一扫, 一千九百零六个完整的 type script 文件加五十九点八兆的 source map, 就 这么被还原出来了。没多久就有人上传到 github, 结果这个仓库被 fork 了四万多次, 全球开发者都看到了。那为什么这件事儿这么重要呢?因为里面包含了什么呢?系统提示词?工具定义?全线逻辑、 agent 编排、系统记忆管理机制?还有最关键的是,这整个项目完全没有依赖 land chain, land graph 这些框架, 全是 ansorepic 从零手工打造的,这意味着什么呢?意味着全世界的开发者第一次能看到一个顶级 ai 公司是怎么真正构建一个超级工程助手的,这简直就是一份最好的 agent 开发教材啊!好的,那咱们现在进入核心了, 这个源码最厉害的地方在哪呢?在它的五层分层架构,看屏幕啊,从下往上数,第一层是用户交互层,你们知道吗? cli 命令解析, r e p l 对话界面流逝,输出渲染, markdown, 代码高亮,这些全都是自己写的,不仅仅是套皮啊,每一个细节都经过了精心打磨。 第二层呢,这才是真正的大脑,我叫它 agent 核心层,这里面有什么呢?有 react 循环引擎,这是 agent 的 心脏,然后是系统提示词的动态构建,这不是固定不变的,而是根据每一次对话动态的去调整。还有上下文窗口管理,这特别关键, 因为 cloud 的 上下文有限嘛,所以怎么在有限的上下文里让 agent 还能理解项目的全貌,这就考验工程水平了。 最重要的是,这一层还支持什么呢? coordinator agent 加 sub agent 的 多 agent 写作,你们想想啊,一个大项目来了,主 agent 不是 自己一个人逐行去改代码,而是先分析一下这个任务能不能拆解,拆成几个子任务, 然后分别派给不同的 sub agent 去处理。有些 sub agent 是 teammate 类型的,就是伴随式的协助,有些是 fork 类型的,就是独立分支之行,还有 background 类型的,就是后台异步之行,甚至还有 remote 类型的,就是远程调用, 这样的多 agent 编排,才能够处理真正的大型工程项目。还有一个特别关键的东西叫 kyros 后台代理,这个东西特别有意思,它会持续地在后台监听,看有没有新的测试结果,构建日制,然后自动反馈给主 agent, 让主 agent 形成自愈循环。 第三层是工具执行层,这是 cloud code 最强大的武器,你们看啊,有什么呢? file system 工具组可以读写文件, bash 执行器可以跑命令, web search 和 fetch 可以 搜索网络, grab 和 glob 可以 搜索代码, edit 和 multi edit 可以 精准地修改文件。还有 notebook 工具可以操作 jupiter, 甚至还有 computer use 可以 进行桌面操控。这些工具加起来大概有四十多个, 关键是什么呢?每一个工具都有一个属性,叫 defer loading, 就是 说这个工具不是一直加载的,而是用的时候才加载,这样可以大幅节省上下文的占用。而且啊,特别值得注意的一点,所有这些工具的调用、注册参数、校验、分发、执行,全部都是 astropick 自己手工写的, 零框架依赖啊,这意味着他们对每一个细节都有完全的掌控。最后一个亮点,所有工具的执行结果,不管是 read 的 输出, bash 的 日制, grip 的 搜索结果,全部都会完整的写入到本地字盘,形成一份可审计的完整执行轨迹。 这对企业用户特别重要,因为他们需要知道 agent 到底在干什么。第四层是权限安全层,这太关键了,你们想啊,如果一个 agent 连什么都能做,那就太危险了。所以 cloud code 这边设计了一套四层权限链。 第一层是企业级策略,就是说 operator 可以 在局配置文件里定义组织级的权限边界。第二层是项目级的规则,这些写在 cloud 点 md 这个文件里,就是项目跟目录的那个约定文件。 第三层是用户级偏好,就是你在运行时可以交互式的确认。第四层是工具级的默认策略,每个工具自己有基础的权限配置。那这四层怎么写作呢?简单说就是像只读的操作,比如 read l s, grab 这些在信任目录内就自动执行,不用问你, 但是文件写入网络请求,这种就会弹窗显示一个 def 预览,让你确认。特别危险的操作呢,比如删除系统文件、访问 ssh 密钥,改 etc 这种,这些会被硬编码拦截,任何配置都绕不过去,这就是安全第一的设计理念。 第五层是记忆持久层,各位啊,这一层太重要了,很多人都忽视了 cloud code 为什么能够记住一个项目的所有细节呢?就是因为这一层项目跟目录有一个叫 cloud 点 md 的 文件,这就是项目的长期记忆, 用户可以在这里写下项目的架构说明、编码规范、历史、重要决策。每一次对话,这个文件都会被注入到 prompt 里,还有完整的对话历史,所有内容都会被保存在本地词盘上。更牛的是 ansorepic 用了一个叫 prompt cash 的 技术, 这个技术特别重要,简单说就是那些不变的部分,系统提示工具,定义、项目规则,这些会被分段缓存起来,第一次生成缓存可能要花一点代价,但之后的每一次调用,这些部分就不用再计费了,这样的话, 长期的大型项目上,成本可以降到直接调用 api 的 几分之一。还有一个特别的设计叫上下文压缩,当对话的 token 接近上限时,系统会自动触发摘药压缩,把关键的信息提取出来,不重要的细节就删掉。但要注意啊, 这个压缩是很智能的,不会丢失任务的关键状态。现在咱们来看 agent 的 循环过程。这个流程分成六个步骤,首先是输入感知,用户给一个指令,系统就会加载上下文,包括 cloud 点 m d 和历史对话。 然后是提示构建系统,根据这次的任务动态的拼装一个提示词,注入工具定义和权限规则。然后呢,这个提示词就被发给 cloud api 进行模型推理, cloud 会用流逝的方式返回它的思考过程和决策。 接下来就到了第四步,工具调用。 cloud 决定了要用哪些工具,系统就开始并行或者串行的执行这些工具,这些工具的执行结果回来了之后,第五步,权限校验,系统会根据那四层权限链决定这个操作是自动放行, 弹窗确认还是硬拦截。最后是第六步,结果持久化,把所有的工具结果对话内容都写回到次盘,这样下一次就能恢复状态。在这个循环的核心有一个特别重要的特性,叫多 agent 协助。如果是一个超大项目, 可能有一个主的 coordinator agent, 他 负责任务拆解和调度,然后他可以派发给多个 sub-part agent, 有 的是同步等待结果,有的是异步后台执行。还有那个叫 carras 的 后台代理,他会持续地在后台监听,看有没有新的测试结果。 构建日制,然后自动反馈给主 agent, 让主 agent 看到自己的问题,然后自动去修复,这就形成了一个闭环的自愈循环。好的,现在咱们看一下这四十多个工具。系统屏幕上可以看到,这些工具大概分成三种权限等级, 第一种是只读安全的,比如 read, lua, script, 这些可以自动执行。第二种是需要用户确认的,比如 edit, write, web fetch、 notebook 这些会弹窗。第三种是高风险的,比如 bash 命令和 computer use, 这些是桌面操控,需要二次确认。 每一个工具都不是简单的一行代码,而是包含了完整的参数校验、错误处理、权限检查。比如说拜式执行器,它不仅要执行命令,还要捕获输出,还要检查这个命令是不是试图访问敏感目录, 如果是就直接拦截。这就是为什么 cloud code 这么安全的原因,不是因为模型有道德,而是因为工程做的太细致了。权限系统的四层链妙处就在于它的渐近式渐企业级策略定义组织边界,项目级规则定义项目边界。 用户级偏好可以加额外的限制,工具级默认是基础配置,关键是只要任何一层有更严格的限制,就会按照最严格的来执行,这保证了安全性。现在讲一个特别重要的新概念,叫 harness engineering。 你们有没有想过, cloud code 之所以比网页版的 cloud 强这么多,真的是因为模型本身不一样吗?其实不是,它们用的是同一个模型啊,关键的区别在哪呢?就在于围绕这个模型构建的软件脚手架,传统的做法是什么呢?叫 prompt engineering, 你写一个 prompt, 然后不断调整它,看能不能从 ai 里搞出更好的结果。但这样有问题啊,因为再好的 prompt, 碰到复杂任务还是容易出错,而且没办法自我纠正。而 harness engineering 的 理念呢?完全不一样。他说 与其去优化模型本身,不如去优化模型运行的环境。怎么优化呢?第一是上下文工程精心设计,每一次进入 agent 的 信息结构,让 agent 有 最清晰的视野。第二是工具约束设计, 不是给 agent 所有工具都用,而是只给他需要的工具,而且对工具的权限做严格限制,这样 agent 就 被引导到正确的方向。 第三是反馈回路闭环,一旦工具执行完了,比如代码写好了,要测试一下测试结果,不管成功还是失败,都要反馈给 agent, 让他看到自己的问题,然后自动去修复, 这就形成了一个自愈的循环。第四是可观测和审计,每一步操作都要记录下来,这样你就能追踪 agent 到底在干什么。对企业用户来说,这特别重要,那 cloud code 的 原码恰好完美地印证了 harness engineering 这套理念, 这就是为什么他这么强,为什么他的成功可复制。现在给各位总结一下,从这个泄露事件里,咱们能学到什么呢?我想提出六大启示,第一,拒绝框架依赖 cloud code 的 四十多个工具,零 land chain 依赖,这说明什么呢? 说明框架虽然提供了方便,但也意味着失控,对核心的 agent 循环保持完全的掌控,这才是稳定性的根本保证。第二,安全是第一,设计 cloud code 的 全线系统贯穿了整个架构的四层,这不是事后加的补丁,而是从一开始就在系统的 dna 里。 如果你要构建企业级的 agent, 一定要把安全放在最前面。第三,上下文记资产, cloud 点 md, 加上 prompt cash 这两个东西,让项目知识完全持久化了。 上下文工程的质量决定了 agent 输出的上限,相比之下,调 prompt 反而是次要的。第四,多 agent 是 未来单 agent, 能力再强也有限, coordinator 加 sub agent 的 编排才是处理大型工程任务的正确姿势。第五,闭环验证驱动 那个 caros 后台代理特别重要,它让测试结果构建日制,能够自动反馈给主 agent, 形成自动修复的循环。没有这个闭环, agent 就 只是一个聪明的一次性执行器,不是真正的 agent。 第六, npm 安全警示异形点 npm ignored 缺失,导致了价值数十亿的技术资产泄露。这说明什么呢?说明构建流水线的安全审计和代码安全本身一样重要,每个公司都应该吸取这个教训。好的,各位,咱们来做一个最终的总结。 这次泄露事件揭示了一个朴素但深刻的真相,那就是 ai 时代的护城河不在参数量,不在算法,而在工程。 ansorepic 用源码告诉全世界,一个顶级的 ai 编程工具到底应该怎么构建。 harness engineering 是 方向, cloud code 的 源码就是最好的教科书。所有这些细致的工程设计,反复权衡的架构决策,对每个细节的原因,它不是简单的套上 cloud 模型就完事了, 而是围绕着这个模型,从用户交互、 agent、 核心工具、执行权限、安全、记忆持久五个层次都做了极其细致的设计。这对咱们开发者来说意味着什么呢?意味着我们不用再盲目的去优化 prompt 了,我们应该把更多的精力放在构建更好的运行环境, 设计更清晰的工具约束,建立更完善的反馈回路,这就是 harness engineering 告诉我们的方向。所以啊,感谢 ansorepic 这次的意外开源,它给了全球的开发者一份最好的工程教材。我想随着时间推移, 会有越来越多的开发者意识到, agent 时代真正的竞争力不是模型,而是工程。那么下次再见了。

现在我每天的工作变成了蒸馏自己。以前脑子有东西,好歹别人拿不走,以为那就是自己的护城河,现在老板扔下来十倍的工作量,然后 toking, 管够,你说干不动,看来你不会玩 agent, 下一位。这下好了, 主动学习,把自己蒸馏成 skill, 然后把活分给 agent 来干。不是想蒸,而是不得不蒸。今天你蒸馏自己了吗?我是阿图,每天分享蒸馏技巧,下个视频见。

最近半年使用 cologod 安装了近百个 skr, 最后发现真正能提升工作效率的其实只有三个技能,今天免费分享给大家。第一个, superpowers, 这个 skr 改变了我用 cologod 的 方式。以前我是直接把需求交给 cologod 的, 让他来写代码,写出来虽然能跑,但是经常跑偏,改来改去浪费大量时间。 装了 superpowers 之后,我养成了一个新习惯,每次开弓前先跑一遍,不认英斯德尔敏。这个技能能让可洛的反过来问我问题,你打算怎么处理并发数据库选什么 等等等等。问完一圈,他会把讨论结果写成设计文档存到本地。听起来多了一步,但这一步帮我拦住了无数次的反攻。有些问题你自己都想不到,但是可洛替你想到了。 注意, superpowers 包含了二十多个紫技能,千万别全开,我只用 breamstorming, 头脑风暴, 其他的按需加载,要不然会浪费大量上下文。第二个技能, playing with fails, 这个技能解决了我被坑过无数次的问题。 cloud 有 个问题,它做到一半就失忆。不知道你们有没有遇到过 一个复杂的任务,聊了半个小时,可乐突然说,好的,让我们开始吧,然后就把之前做过的事情又重来一遍。根本原因是对话太长了,上下文被压缩,之前的计划全丢了。普莱因维的 flow 的 做法很聪明,就是别把计划写在脑子里,它是存在纸上 克拉的扣的。每次动手前会先建一个计划文件,每完成一步就在这个文件里打勾,就算上下文清空了,重新读一下文件就能接着干。 这个思路跟 minnes 很 像, minnes 做常任务为什么玩?因为它所有的中间状态都存在本地了。第三个技能, roughlop, 我 给这个技能起了个外号,监工 sky, 你一定体验过 cloud 的 摸鱼模式。写到一半突然说基础框架已经搭好了,你可以在此基础上继续完善。 翻译过来就是活我没干完,我先下班了。 raflopp 通过一个或可拦截 cloud 的 退出动作,他退出的时候或可会检查。你说的完成标准达标了吗?没达到,回去继续写。 我用它写过,完成过一个 c r u d 模块,设了条件,所有接口测试通过加 redmi 写完才算结束。 kloth 中间响停了三次,但都被塞回去了,最后确实把活干完了。但要注意的是,完成条件一定要写写具体做完用户模块这种话等于没说, kloth 分 分钟说服自己已经完成了写成。完成登录接口可用 单元测试,覆盖率百分之八十。加 redmi 包含 api 文档,它才没法浑水摸鱼。以上就是我常用的三个技能,今天希望能够对大家有所帮助,感谢观看,拜拜,下期见!

我相信百分之九十九的人都不知道这八个可乐扣子的隐藏指令,大家耐心看完这个视频,绝对会让你大开眼界。 第一个, btw 命令,今年三月份刚出的,就是让可乐扣子在干活的时候插一个问题进去,但这个问题不会被写进历史上下文。以前你问一句可乐扣了就停下来了,上下文被污染,干活就容易跑偏。现在问完直接回车,这对对话直接消失,任务照跑, 历史干干净净,并且几乎不费掏开,用完了就回不去那种命令。第二个,瑞万的命令,可以理解成 ctrl z 撤销,打开这个命令,会弹出一个菜单来,让你选只回退代码,还是只回退对话,还是两个一起, 还是压缩上下文释放空间,这个命令非常实用。第三个,隐菜的命令,这个命令我觉得被严重低估了, 他会生成一份 h t m l 报告,分析你过去一个月用可多扣的习惯,看你常用哪些指令,有哪些重复的操作,然后给你推荐自定义的命令,说白了就是可多扣可多扣的在反向观察你, 给你优化建议。这个我建议人每个月都要跑一次,他会让你重新认识你自己的工作习惯, 非常有意思。第四个, see you plan 命令。你打开这个命令, cloud code 会同时启动三个平行的 agent, 分 别从代码附用、代码质量、运行效率三个角度帮你审核改动,然后汇报结果,相当于找了三个同事帮同时帮你 re 要代码。 我现在的习惯就是每次写几个大功能,更新之后顺手跑一遍,因为 ai 的 代码经常有种鱼,这个命令基本上都能把那些种鱼挑出来,写代码的一定要用这个命令。 第六个半尺命令,原来他是叫 fork, 现在改名了打,但是打旧名还能用,会自动跳转。作用就是把当前对话分叉出一个新的绘画来,原来的绘画不受影响。他跟 rewind 的 的区别就是, rewind 的是后悔药,半尺是平行宇宙, 如果你想同时试两种不同的方案,就是分叉一下,两边各走一边,最后就是选一个效果好的就可以。 第六个落魄命令,他可以让可乐定时重复执行某个任务,用法就是在这个命令后面跟上时间间隔和你和你要他做的事。比如说每五分钟检查一下部署状态,他就自动跑,不用你盯着, 默认时间间隔是十分钟,并且结果直接在上下文里。可乐可以基于结果做判断和后续操作, 但是要注意,定时任务在创建三天后会自动过期,最后触发一次,然后自我删除。第七个 remote ctrl 命令,就是打 r c 或者是完整的命令。 remote ctrl 它会生成一个 url, 手机打开这个链接,你整个 cloud 的 绘画就出现在手机上, 完全同步。你在手机上发指令,终端那边也能看到你在终端操作,手机实时更新终端代码,始终在你电脑上跑。手机只是个遥控器,所以很安全,非常好用,这点就像那个龙虾。 第八个 export 的 指令,打开这个指令,当前整段对话直接导出 markdown 文档,听起来不起眼是吧?但是有时候你会发现这个功能真的很实用。你跟可乐扣了讨论了半天的架构方案,中间有大量的来回推敲, 如果不保存,回头找起来非常麻烦,直接导出来存着,作为更详细的上下文,下次直接用这八个隐藏的指令,非常实用,建议大家使用起来。好,今天的视频就到这里,感谢大家观看。

给大家分享一下 cloud code 的 一个核心的架构,我们起源于三月三十一号的一次构建的一个疏忽,让他的所有的元旦码进行了一个包录,我们可以看一下 在 azurepic 发布这个 npm 的 包的时候,没有过滤这个文件,导致了他所有的文件我们都可以进行一个还原,可以进行一个下载学习, 这是他的一个原码,大概五十余万行。然后我们进行了一个分析,首先这就是他的一个架构的一个全景五层架构,十五个核心的模块。然后我们可以看一下,首先就是他的一个颗粒的入口,他在终端输入 cloud 回车就可以进入这里面可以进行解析问题,可以进行传达我们的一个参数。 然后接下来就到了我们的接口层,比如说终端的界面以及 s d k 的 模式,以及桥接,桥接的话我们完全可以使用插件进行,比如说像微信进行一个沟通,所有的云代码在我们的一个悬浮的界面,比如说这个终端的界面,在 s r c 里面的一个这个文件 多少行,我们也标记出来了,这个文件的话我们会共享在视频的仓库。然后接下来就是我们的引擎层核心的一个调度中心,这是绘画。然后接下来是 api 的 一个客户端,然后接下来就对到我们的一个执行层, 比如说我们最基础的一个工具的调用命令系统以及我们的执行编排。所有的我们分析完之后会有一个文件进行一个管理。 接下来是我们的安全层和上下文层,只作为一个安全,我们不再追溯,接下来是它的一个拓展层,比如说像 m c p, 无论是 open class 适配的。然后接下来是我们的一个插件以及技能,我们现在举一个最简单例子,比如说以整理桌面为例,我们进行一个图解, 首先我们会在终端进行输入一个帮我整理一下桌面,然后他会调用主文件,然后进行解析参数,比如说指定的一个模型,以及我们可以选用的一个工具。 然后接下来他就是他 cloud code 比较快的一个架构,我们分析出来的就是一个并行的乐曲, 在同时开始的时候我们可以读取,然后加载命令以及这些东西都是一个并行的,而不是说一个串行的。接下来就是他的一个注册的工具以及命令,在这个文件里面都很类似。然后接下来就到我们的一个启动的页面,进入一个循环, 这里面的话就是我们的 src 一个一整个的一个核心的部分放在了这里面,具体的话我们可以进行克隆这个仓库进行看一下。然后接下来给大家一起图解一下。 他不是一个聊天的机器人,他是一个自主行动的助手,我们可以看到他不仅是回答问题,他可以思考、执行、检查,直到任务完成。 首先他在思考,然后会调用一些工具,然后创建了一个分类的文件夹,最后整理完成,这就是他的一个处理,我们模拟的一个动画效果。 然后接下来就到了我们的一次请求六步旅程,我们进行分析它的核心架构,我们比如说找到我们项目里面的要做的事情,然后生成一个文件,看一下数据怎么流转。我们首先用户进行输入,然后进入了这个问题的引擎, 然后接下来他就会组装一下题句词,比如说需要用哪些工具,在哪个目录之前聊了什么,然后组建成一个上下文发给 cloud api, 这就是我们的一个元代码,具体我们可以看一下。然后接下来第二步就是 close 思考,帮我搜索 ai, 它并不是直接回答的,而是说它要判断一个先搜索什么,然后返回一个工具的请求,然后这个是流逝的,并且是个并行的。然后接下来就是权限的检查,执行搜索, 然后我们进行一个匹配,然后返回 ai, 然后再次思索,所有的这个类的都是使用 react 结构思索执行,思考再执行,然后接下来就是需要确认的事情,那最后这就是它的一个流程,类似于 open class, 然后接下来我们看一下它为什么这么快? 首先第一个就是它的一个全链路的流式,传统的系统 ai 全部响完,然后再显示,现在的话是现在是边响边显示,然后第一层是用的是这个零缓冲,然后接下来是它的一个工具的边出边执行, 我们可以看到他并不是说三个,说完了,第一个就开始执行,他是说是一个并行的,然后接下来就是并行,然后写入排队,这个就是我们演示的一个界面, 看一下,比如说像传统的方式是 ai 的 输出,这是时间线输出,完成之后,然后进行执行工具,然后进行读写,然后进行操作。对于 cloud code 的 话,它是一个流,对于 cloud code 它是一个流逝的一个并行处理,我们可以看到这是时间上的一个优势。 然后接下来就是它的一个安全性,每层操作都会精准经,每个操作都会经过八层的检查,然后安全的会自动通过,危险的话就会问你,极度危险的话会直接拒绝, 然后比如说像这个违例,我们可以看到它会经过八个审核的入口,第一层是它 是 play 模式,第二个就是他的一个命令,然后接下来我们看一下,然后这就是他的一个优势,比如说我们反复对话一百轮也不更崩溃。 a 的 记忆是有上限的,因为我们的一个上下文 c c 采用的是四层的记忆系统进行管理, 第一层是历史的消息在这个文件夹里,然后接下来是带一个自动压缩,然后是我们的一个压缩后的一个关键信息,最后是一个持久的记忆, 当然的话我们可以进行我们的 graph memory 进行一个插件的管理,然后接下来这就是它总体的一个设计的哲学,比如说流逝优先、安全闭合等等, 这就是我们的一个源码,接下来我们会进行开源,一个直接可以用的一个,接下来我们会开源一个 cloud code 的 直接的一个适配的版本,谢谢大家。

好,今天来讲一下使用 type script 从零开始实现自己的 open file, 也就是一个简单的 ai agent, 我 们会慢慢实现,过程中从简单到难,就一步一步地去了解它的底层的一个原理。呃,首先呢,我们 起个名字吧,叫强可露,然后进入数值化这个项目,用编辑器打开它。 好, 先先改一下,我们是用 type c 来写的话, 然后这边改一下 model start, 我 们创建一个音 v 文件,然后 创建一个 index 点 t s 文件。 好,其实它底层第一步肯定是需要去请求一个大模型的 a p i 的, 我们就使用这个 open open ai 的 一个接口, 可以打开这个这个 n p m 的 这个 open ai 这边的一个包,我们根据它的规范先安装一下,装一下,然后 其实我们就使用 这个这个 s d k 就 可以了。它的 api 其实大家也可以去看一下,就是其实也是一个 h t p 的 一个接口,这个这次我就先不详细看,反正先把这个代码复制过来吧。 嗯,它这个有 type script script 的 一个报错,我们把这个 node 的 这个 type 的 依赖装一下先。 好,它是从音频中读取了一个 k, 其实我们,嗯,我们因为我这边大模型是用的智普的,所以说我这边还还需要去改一个 url, 对这个,然后其实就会有两个,一个 k, 一个 l l, 如果说你是用的那个 open ai 的 这个 k, 那 其实就改个 k 就 好了,我们在这个音频的环境变量中去, 我这边是已经搞好了这个 k, 到时候我录完视频之后会删掉,所以说这边也无所谓,不过你们就是要注意这个 k 就是 不能,不能泄露出去,这个 k 的 话,其实我是在 智普的这边,我我我有购买一个 callinplay, 所以 说我这边这边点这个添加新的 api, k 也可以添加。我这边是已经添加了这次测试的 k, 这边复制一下就可以了。 然后,嗯,可以看他到智普的一个文档,其实他是说是与这个 open ai 的 api 兼容的,比如说我们直接用它的个这边的这个 sdk 就 可以了, 不过它这边文档只有一个 python 的 一个版本,不过没有关系。嗯,弄个 js 版本,我们直接看它这边的文档就可以了。好,回到这边,然后我们这边要修改一下这边的 开始 是吧?对,要加载这个音频的文件, 我们现在可以去先修改一下这个 system, 告诉他用 i have four assistant。 要 用中文吧,英文不太好。你的名字是 讲课喽,然后你是一个 have for ai ai agent, 然后这行就不要了,我们先 content, 这边先 cd。 你 好啊,来测试一下。对,这个就很简单,就是说我们就直接开始就调了一下它的这个黑片的接口,这边它的这个质补的模型是应该是这样没有补是吧? 看一下啊,它这边的模型对,应该是这个最新的一个模型。好,我们这个也是已经,我们测试一下。 你好,我是江可乐,很高兴见到你,请问有什么需要帮助的吗?可以看到其实大冒险的接口已经去 请求成功了。那我们现在第一步的话就是需要把这个 content 需要通过那个命令行去输入,就是接收它。那现在 ai 这么方便,我们就用 code code 来帮我们,帮我们去实现它,不过我们先先那个啥呢? 先 get, 先抽象了一下 get, 然后在这边。嗯,把那个 model 设 给它挪一下,然后 好抽象一下。我们现在让让他先提出第一个曲指,就是这边文本 x 这边, 然后十七和十二号,十二号 改为改为让用户输入 修改完成。它是挺,我们直接看看它的代码,它是添加了一个 middle line, middle line user input, 几乎里面的问题。 user input, 然后最后 closed, 好, 测试一下。 你好, 没问题。这个,这个第一步已经可以了,是吧?嗯,很高兴为您服务。请问有什么可以帮助的问题的吗?然后我们先做一个简单的提交吧。 嗯, it 啊,我们 我们这个信息延短一点, 先提交一下 它是输入了什么 get commit and error input。 不 行不行不行, 这个 commit 信息就只能 只能一行,不要有什么 其他的作者信息。 get commit and and user input。 好 好好,简单一点。 下一步我们就是现在的问题,就是说他,他这边就是说我们问了一个问题之后,他直接就 回答了一个问题,然后也就把这个命令给关闭了。但是我们是需要有一个循环,就是说一直不停的去问他问题嘛,对吧?那我们其实是需要一个 well 处的一个东西的。 嗯,我需要需要一个循环不断的, 然后再回答, 看一下它是怎么改的。 我要处用 the input, 用 the input 简说明了问题啊,它,它加了一行,那如果是退出的话,它就直接退出了,没问题。这个用 the input 我 们试试哈。 你好, a p u 有 点慢,一加一等于几? 再加一,这个时候它应该是没有上下文的,所以说这一步应该它回答不出来 看, 为什么呢?这个是我们下一步就需要解决的,我们现在先退出测试一下,没问题。嗯,再给它 command 一下,就是说我们看一下它这次的改动,其实也不大 at 好, 然后我们告诉他问题啊,就是说这个 u v input 是 呃循环中缺缺少上下文,让它解决一下 u v input 在 循 缺少上下文解决一下。 它应该是会创建一个数组,然后不停的推送进去 messages message 输出, 嗯,看一下它的改动啊,它是这边开始出事化了一个 message 的 一个输出,然后 这个是我们的那个 system 的 一个 promote 这个词,然后请觉得一开始的话会把这个每一次的这个 u 的 input 都 嗯输入到这个数字中,然后这边请求的话就是把这个,它这个是支持这个这样的写法。对, 它的接口是本来就支持传送这个 message 这么一个子段没什么问题,然后等到它的一个返回,返回的结果之后,它会把这个结果也 这个结果是个 string, 对 吧?对,也推推进这个数组,意思是就是说每次循环都会带上历史所有的 对话的一个消息。嗯,这个其实就是目前的一个带上下文的这么的一个解决方案。其实 color code, 或者说是 open color 其实底层都是这么来去做的。对,就是说,嗯,你如果说对话的越来越多,那你每次请求的那个 token 也会越来越快,因为他每次的 token 请求都会把所有的上下文信息,就是说你所有的历史记录的对话的一些消息都带上发给达摩型,因为达摩型其实是一个 可以把它看成是一个纯函数,就是说他并没有上下文的,所以说这个上下文是你每次请求都要提交过去的,我们现在测试一下 知识而已。 一加一等于几? 再加一。嗯, 可以看到它已经记,就是说有了上下文了,结果也正确了。那我们下一步呢,就是需要 ai engine, 肯定是可以去执行 就是一些命令的嘛,这个是肯定的,就比如说我现在要问他,我要我要列出就帮我列出 当前目录的文件,他肯定是不会帮你去执行这个命令的,因为这个 ai 帧呢,还没有这么个功能,是需要我们下一步去做的。他应该是现在只会给你返回一个,你可以输入某个操作, 是吧?就这么个意思,我先退出吧。嗯,看一下这次的改动啊,也不大 at。 那 我们下一步呢,就是需要去 让他可以执行命令。我问一下他吧,我想要添加 执行命令的功能,请帮我修改 script 这个词,我需要,需要做到 让大模型返回两种确定的返回吧, 第一个就是,嗯,我们就比如说是 amend 冒号开头表示执行某个 bash 命令。第二个是 t s t。 嗯,这是返回的结果。 看一下啊, 它自动给你把这个逻辑加上了 code, code 还是很厉害的。 看一下它的那个提示词是怎么怎么加的。英文,你可以去执行 bash, command and return results to users you must respond in one of these two from it。 或者你说你必须以里底下的两种形式去 响应,第一个是 command 开头的,没有你 to 执行一个 command。 第二个是 txt, 是 你可以,你要正你返回正常的那个文本的响应的时候,就 t txt 开头的,还给了他一个,给了 ai 一个例子, command, 然后 txt or command txt, 然后我们再看一下它对于代码这边的改动啊, 这边删了,删 前面的 message 是 一样的返回,返回了这个外层还是一个循环,然后这边返回了一个 根据这个开头的这个 command 去进行了一个判断,如果说它是以 command 开头的,它就去用这个对 child process 这个紫禁城去执行这个背时命令,然后结果的话会也存到这个。 对,我先把这个存到上下文中,然后这个是他返回的一个结果,然后再把这个执行的结果命令执行的结果也推进这个上下文中, 然后如果错误的话也是一样的,也是有把这个执行错误的推推进这个上下文中,然后如果说是嗯 txt 的 话,就 把这个把这个什么呢格式化一下打印出来,然后把这个嗯 ai 返回的结果也推介上三。文中最后的话是没有指定类型的,就是当做默认的吧,当做默认的执行, 嗯,其实现在是有一个问题的,嗯,就是说当他要执行多个命令,就是说, 嗯,如果说是它要执行多多次那个 command 的 话,它其实里面内存是应该有个循环的,就是说直到, 就是说如果说它返回的第一次是返回的 command, 第二个第二次也是返回的 command 的 话,应该也是有一个循环去处理它的,然后直到检测到以 txt 开头的,就是说它这个内存循环会结束。我现在我们可以先测试一下。 呃,列出当前目录 执行命令,请输入您的问题。哎,它是执行了啊,但是它,嗯,但是有个问题,有个问题,这边 这边执行的结果,对,这边执行的结果是需要再次请求,那个就是是需要再次把这个请求的结果发送给 ai 的, 就是里面应该是有个内,就是这边 这边,这边应该是内部也有个循环的,要不然,嗯,这边仅仅打印了一个执行结果,但是你没有把这个结果告诉 ai, 我 们给他说一下, 嗯, command 执执行完成之后应该要把 结果再发给,发给大模型这里,这里应该是个 是个内部的循环,就是直到检测到 没有 command 的 命令才跳出此内部循环。 改完了哈,再来看一下 这个时候外部的那个 user input 的 一个循环嘛,内部的话就是,嗯,当他的好,对,没毛病,没毛病,让他指指尖一塌,然后这边 复制了这个 message, 然后这一步再去请求。 哎,等一下,第一次啊,这个是第一次请求的,然后内部再去请求了这个大拇指的接口,把它 message 加上,然后这边 再覆盖之前的这个变量,就是说这个,对,这个就是持续会有这个 command。 如果说是,嗯, 这个 tom 的 直线完成之后会到下边这边,下面这边的话 没什么问题,就会是最终的,就是最终的响应的一个 ai 的 一个结果,响应的一个 ai 结果,然后再是外部的一个 有点 import。 好, 这么看起来好像没什么问题,我们试验一下啊。 列出当前目录的 文件, 这次是执行命令的输入,我们等一下,这边就是这边的话就是说他会把再发起第二次请求,把这个输入的结果再给到 ai, 然后 ai 再给你回复, 回复这这些啊,当前目录包含一下文件文件夹,这是一个 node js 项目,需要我帮您查看具体某个文件的内容吗?请输入您的问题,朋友们是不是?是不是? 是不是?是不是?可以了,没什么问题。那我们现在呃,看一下这个改动, 这次改动就是 这么多,我们这次 再测试一下,他就是这边测试一下这个内部循环的一个一个,一个一个逻辑,就是说刚刚是,刚刚是只有一个命令嘛?我们问他一个可以执行多个命令的问题,就是说我们 怎么讲呢?想一下, 算了,我们先退出吧,但是想不到我们今天先不得 commit 一下 at command execution loop, 没毛病。好,我们现在我想到了,刚刚,我想到了啊,想到一个它可以执行多个命令的。 帮我就是说我,我现在按下 star 就是 一个新的,一个空的一个上下文嘛。所以说我们搞它帮我查看当前项目 并补充 get ignore。 对, 因为我现当前的 get ignore 可以看到只忽略这个 note models, 其实呃,规范的那个 note 截图项目应该会有很多的。呃, get in the norm 就是 我让它去补充这么个,而且它我输入了这么一个体制词呢,它应该会,肯定会有多。嗯,多次的执行命令命令的一个 机会嘛,肯定是第一次他会列出当前的文件,然后把当前文件的结果给到达摩星,然后达摩星再让他去执行一个修改文件的一个命令。好,我们试试 好,第一次命令他是执行了这个,然后我们这边啊,这边这边的执行结果他应该会发给大模型嘛,然后大模型返回的第二第二个执行命令是, 呃,啥啊?会,这个命令是读取了这个 get ignore, 读取了那个 package 的 jason, 然后第三个命令是 是直接修改了这个 get ignore, 然后第四个, 然后会把这个输出再给到大模型,然后这边会最后最后是没有命令,没有命令就会跳出这个循环嘛?然后 说是已经成功补充了这个文件,原内容是仅包含 note models, 新内容是不拉不拉不拉不拉不拉。一堆。 提醒你,音频文件中已存在项目,现已被正确忽略。对,我之前是没有忽略这个音频文件的,而他现在可以看到啊。卧槽,那我这个音频好像,呃,好像是已经 加到了这个 get 的 这个历史中了吗?哎,不管,这个不重要。同同学,你们以后注意就说这个音频肯定是不能进到这个 get 的, 一个肯定是不能进到 get 的 提交中嘛。对,他这边已经忽略了, 这边忽略了好,这么来看是没有什么问题的。其实我我前几天去看那个 opencloud 底层呢,它是基于一个 pad 的 一个 底层的一个 ai 智能的一个包,它其实我看它底层的一个原理,其实就这么,就是这么简单,就是一个一个循环的一个过程,它会检测 最终跳出循环的,就是说我们会检测没有那个,嗯,没有命令执行了,他会跳出这个循环。就是其实就是这么的一个简单的逻辑吧。我们其实现在 这次改动应该只是一个这么改动,让 color code 给他 commit 一下。哎,其实我们, 哎,他说当前工作区是干净的。不会吧,我不是有这个限制了吗?我现在既然这个我自己做的 ai 出来,那我们让他给它 command 一下,看看行不行。 让我们现在做的这个 ai command 一下啊,你看他现在执行了一个查看当前状态的一个 一个一个一个那个啥,然后发现了当天有修改待会暂存的文件,你需要先暂存更改才能提交。你希望帮你执行哪些操作? 请告诉我需要的提交信息,我会帮你完成提交案。我们现在告诉我们现在自己造的这个 ai 哈。嗯,请帮我暂存所有的改动,并生成一行简短的 一号 it commit 信息,并帮我 it commit 我 们自己的 ai, 去帮我们去完善自己的 ai 项目。朋友们,这是不是还是很给力的 哦,他是直接一下子执行了一条命令,哎,算了,没,没关系没关系,反正我们那个多条命令的那个已经测试好了。提交成功,提交成功啊, 看一下啊,这边确实是有这个提交记录的。其实这就是它底层的 open clock 或者说是 card code 底层的一个最核心的一个循环嘛,它是可以执行 执行这个命令,然后可以去循环地去请求大模型。对, 然后其实后面那些技能的话,其实它也很简单,它你如果是有技能的话,它会把技能一开始会读到这个 system 的 这个提示词中,就是说它会把这个 content 在 不断的完善。嗯,如果说, 嗯,你们感兴趣的话,可以去抓包看一下他那个 code code 的 一开始的那个 system 提示词应该是一个很大很大的一个 content, 然后如果说,嗯,这次的这个, 嗯, ai engine 的 这个原理去了解的话,那你就会知道其实他每次的这个 api 请求都会把这个很如果是 cloj 的 话,他都会把这个很大的这个 content 在 每次请求都会给到大冒险 api 那 边,那这样的话其实他的头可能 消耗很快。就是,其实是有原因的吗?其实你如果理解到他的这个原原理的话,你就会知道一些原因了。对,看一下我录了多久了啊?什么时候开始录的?哎, 嗯,先不录了吧,后面如果有需要我再录 skill 方面的,然后录如何?嗯,我问可乐的话,它火出圈的一个原因是它有很多的,它可以接入很多的那个聊天工具,它其实只是一个。嗯, 界面层的一个改动了,我也不想去做那方面的一个逻辑,我感觉就可以了,后面如果 有其他的想法再录吧。好,谢谢大家。如果说这个视频对你有所帮助,欢迎点赞、评论、收藏、投币。好,再见。

今天给大家分享我用了八千到一万刀的托肯,用了两个 max 二十 x 的 cloud code 的 会员,就是两百美金那个得出来的 web coding 的 经验, 我也是把它稿子写了非常长啊,因为今天这个视频可能会又臭又长,至少四十五分钟以上,所以说我把稿子和过程都已经写下来了,我会把这一个月的这个 web coding 的 经验毫无保留的全部说出来。呃,因为我明天也要准备去分享一个呃, 包含了我这个接近十万行代码的一个实际项目,基本上是达到了这个 openai 的 harness engineering, 他 们那个项目应该有到百分之六十到七十的这种 工作的流程,全程没有手写一行代码,从零到服务器的部署,甚至我对这种工程经验我是比较欠缺的,我可能会比较了解这种哦哦哦智能体的项目,但是对这种工程经验我是很欠缺的,甚至我连服务器也不知道怎么购买,都 是由 cloud code 指导我进行购买,并且部署好了之后让它进行这个处理。整个流程我是准备先给大家介绍一下 k v k 曲的一个重要性。第二个就是上下文,去看一下这个 cloud code 它的上下文 com context 它是由哪些组成, 然后是常见的 cloud code 的 一些使用方法,这些这些都很简单。还有就是 cloud code 它的一些架构和子智能体,然后是 m c p 它大概的一个情况和 skills 的 情况,因为这两个东西是你 web coding 必须要做配置的,而且这两个东西都会影响你的上条文。最后是这个 open i 它的 harness, 这篇文章 最最后是我开源的一个 cc team, 呃, creator 的 一个开源项目,可以用这个 creator 去创建这个 cloud code 的 team 模式。呃,里面有三个比较大的重点啊。呃,首先第一个还是最近已经基本上说烂了的这个 harness 约束,我也就是最近非常重要的这个 web coding 的 重点,因为现在的模型它, 嗯,还达不到化腐朽为神奇,你必须要对他进行约束,然后他才能在你的范围内给你一个你想要的结果,要不然他就胡乱发挥,是没有没有一个好的结果的。 这个我也是讲了三次,也给大家分享了三次。在二月份,二月十一号 open 发的那篇文章的时候就给大家讲过一次,当时时看的时候只能说,哎,讲的很有道理,但是是没有概念的。 然后在半个月之前,我再深度的使用这个 web coding 来完成一些项目的时候,我又去读了一点,呃,然后会有更加的深入的一些理解,并且我把它里面的很多细节 都融入到了我那篇那个项目里面进行实现,并且也融入到了这个我的一个开源项目 cctime creator。 这个开源项目 很多很多里面的设置我都是按照这个呃 openai 的 这个 harness engineering 来做的,大家也可以关注一下。嗯, 第二个就是围绕这个多角色的智能体,也就是 cloud code, 它的 team 为是 team 模式为主,因为只有你创建这个 team 模式,你才能让这个 cloud code 跑上几个小时及以上,或者去完成一些自动化的任务,要不然你 使用那个死循环的那个方式,用后壳的方式又把它调回来,又去看你的这个文档,它其实完完全全都是依靠的模型的能力, 稍微难一点的问题,或者说稍微复杂一点的问题,它万一陷进了局部追优,它可能就爬不出来,然后可能就出问题了,或者给你乱改了,比如说给你改一个兜底的情况出来这种,这种是经常出现的,比如说扣袋子,比如说卡拉扣的经经常出现这个问题。呃。 但是有一个,呃建议啊,就是最好不要超过两个小时,但是如果你是单智能体,或者说单一一个你随便起个卡拉 ok 的, 你大概率是 碰不到一个小时的边的,甚至你连半个小时的边你都碰不到,就是他运行一个小时或者半个小时,你完全碰不到这个边。呃。你必须要使用这种听模式,要不然你就是死循环的模式。那那个模式我是不不建议大家使用的,因为他是没有角色的规范的,而且没有这种 文档的规范,我这个反正不是太建议。呃。为什么不能超过两个小时啊?因为,呃。之前其实有一篇文章他们测试过,像 opus 四点五、四点六,他在一个小时的时候,他的准确率或者叫成功率,他能达到百分之九十几以上。 呃。当然这个东西也是按照这个模型,按照你的项目的难度来的,你如果只是让他去重复的执行某一个循环的话,那当然当然都差不多了。但是 嗯,他的那个方式的话,如果他超过两个小时,他的准确度就基本上在下降到了百分之八十了。呃。如果是五个小时,他应该是下降到了百分之五十,就 相当于一半一半的成功率,这样其实效果是很差的,所以说性价比最高的时间段应该是在一个小时到两个小时之间, 但是你要达到这个样的时间,那么你必须要用它的 team 模式,或者你自己配一个。呃, cloud code 的 这种 team 模式。呃,但是我目前使用下来还是,呃,呃,不是 cloud code 的, 之前你用自己去做一些 codex 的 team 模式。呃,这个目前我们也是准备开源一个,但是,呃还没做出来, 嗯,我也是让我们公司的小伙伴去做了一件这个这个开源项目,到时候如果说能做出来这个 codex 的 给大家分享一下,因为 codex 它的性能还是非常不错, 并且它的这种限制会稍微小一点,成本稍微低一点。 ok。 呃,首先我先给大家看一下我使用这个 t 模式的一个效果图吧,因为,呃,我,我其实之前也我今天下午也在做开发。 呃,可以可以,可以,先看一下,先把它往上面拉吧。因为,呃,我是用终端,它的这个时间会它的内容会非常少,可以看到 这些全部都是他自己在进行沟通,这个是测试这端到端,测试这个收后端,然后这他就定三十六个板块,他就已经收尾了。状态权力,呃,他都是有几个智能体进行协助来完成的,我中间是没有没有进行反馈的,或者说没有进行调调试的。 然后这是我给他的一个新任务,我让在他在我的服务器里面装一些 r 语言的环境,然后他自己去检测的。可以可以,可以,看到我们也是让他梳理了一下整个流程,这个流程我都还没看, 呃,这个流程也是他梳理出来了非常多哈。首先,嗯,第一个丁零阶段我就让他进行团队的启动,他就按照我之前用我那个 cctime creator 而去创建的一个,呃,这个配置文件,这是之前的文件, 因为呃没有没有什么改变,他就直接按照这个文件直接进行配了,他就不需要再去读这个读这个 skills 了,他就的上下文就可以节省一点,然后 tokin 也能节省一点, 然后他就创建了这样几个,呃,一会也会给大家讲一下这几个东西。呃。首先后端的开发,前端的开发,然后探索,呃,这个探索研究者我是弄了两个进行并行执行,因为,呃我基本上所有的功能或者项目他都要先进行探索, 不管是搜索也好,还是读代码也好,还是读一些参考的项目也好,因为我这个项目基本上是按照这个 open code 来进行第二次开发的,呃,所以说他必须要读一些 open code 的 原码,他才知道怎么样进行开发,然后连调测试。第一步我就让他 把遗留的问题都做了,因为我这个 qq, 呃做出来的话他是有文档的,他这个文档会非常的详细,呃,包括之前没有做的, 没有做的一些内容,因为我之前上一次已经关掉了上一次没有做的内容,他也会继续的去把遗留的问题去检查一下,检查一下他发现这些就就就完成了。去去去, 他就按照呃这样去拆分并行派发任务,让这个后端去看这些文档,然后前端,然后就去测试、复验,复检,复验这个结果。因为我这个是前后端的,所以说他用的是那个 m c p play o r t 去做的测试,然后这个是又去调研一个新的新的这个问题是不是真的存在, 然后他就发现发现了什么东西。然后第二阶段,然后反正他就自己再按照他的一个方式进行执行。呃,然后进行修复,首先追加新能力, 然后大概就是这样,第五个阶段就是开始了生产那个服务器的部署,然后第六个阶段,第七个阶段反正我是给他了非常多的这种任务和功能,然后他自己进行的拆分和并行。 ok, 我 们也看一下其他两张图吧,再看一张图吧,因为我之前是记录下来有一张图还是算不错的。 这张图应该是记录下来啊,不是这张,这张,这张图看起来是会非常不错。比如说我直接进到了一个新的, 呃,新的一个 cloud code, 我 就直接让他读一下我的这个项目文档,读了之后他会读这个项目文档,以及呃,我刚才那个已经预定好的这个配置文件,就是 team 的 配置文件,就是这些角色的呀,配置文件啊,这些他读了之后,他就直接去创建他的团队,然后我将给他新的任务。嗯,研究者我是让他给 创建两个,因为如果不说的话,他可能就只创建一个。研究者你可以多创建,你甚至并行创建非常多个就可以。呃,因为我想要让他做的功能不止一个,所以说我提前就让他创建了两个,这样的话他的效率就会高点,然后速度会快点,然后我就让他并行去调用,去研究。 呃, ok, 他 就开始读了,他读到了那个,呃,那个配置文件,但是我让他注意一下这个研究者,他们的这个属于他们自己维护的这个文件夹是一样的,他发现啊,他的一些内容啊,他都会写在那个文件夹下面。 ok, 他 全部启动起来了,可以看到全部启动起来了, 全部上线就绪,可以看到这个是管家,这个是后端,前端研究者两个,然后这个是端到端的测试,这是代码 review, 就是 完成了之后他会让 review 去 review 一下。呃,然后我就给他了非常多个完全不相关的指令, 首先就是一个一个命令,让他去检查有没有可以省略,这是前端的一些东西,然后生成了新的数据,这又是一个任务,这又是一个任务,然后这一个又是一个任务,相当于四个任务。我直接给到他,然后他四个问题,他自己去拆分成了两组,然后让这个调研,去调研,然后 呃他,他说了一下,因为他之前有一些遗留的问题,一一起顺带修复。 而且我我不知道是不是因为之前没有总结文档,所以说我就直接让他如果没有写文档,可能已经做了,可能已经修复了这些遗留的任务,然后他自己进行执行。 ok, 他 就收到了,然后他去测试,这又是我又给他了一个新的任务,相当于前面是四个任务,然后定五个任务,定五个任务里面有三个 三四个这种小的任务。然后我又让他,因为我知道他的那个端到端测试的这个智能体他是没有没有没有去使用的,所以说我为了不要让他停下来,我就又给他了一个新的任务,就是二元执行好像有问题,我让这个端到端的去测试,调研一下在服务器上的这个问题, 然后可以看到他们全部都开始去执行了,可以看到任务任务,任务执行排查,然后后面我几乎就没有任何的呃这个反馈了, 都是由他自己去完成,而且这个时间非常的长。呃,首先他去这个调研,调研回来,呃第一个任务他是什么问题?然后第二个任务是什么问题?这个这个是由于我那个呃中转站,因为我们搭了一个中转站,呃他有一些不稳定,所以说呃有些调调整,呃, 然后他就去哒哒哒,然后我因为在这有个默停止了,所以说我提醒了他一下,然后其他的我都没有做操作的,然后他就按照这样的一个流程,因为 opus 他 理解非常强,而且他并行执行的能力也很强。 但是我我用那个 codex 就是 gpt 五点四,然后转了一遍,用它的 api 放在 cloud code 里面,我感觉它的模型没有任何区别,就是 opus 和呃 gpt 五点四,甚至我认为 kimi k 二点五它都不会有这种逻辑上的问题, 就是我认为它们的逻辑能力是一样的,只不过可能模型和模型之间它的这个注意力是不一样的,因为 提米啊,像国内的这些模型,它几乎都是呃这种吸收注意力的机制,所以说它可能会忘记某些问题,但是它整体的思路我觉得都不会有大问题的,所以说模型大家可以不要呃 过于过于关注或者那啥,有条件我们就用好一点的,没有条件我们就用稍微差一点点的。但是 leader 我 们尽量要用稍微大一点的模型,因为呃它才能去控制它, ok, 可以 看到他就付这些角色就在汇报给这个 leader 了。其实我们现在这个对话框就在 leader 里面,当然我们也可以切换了,然后他就开始调查,然后呃他就发现了有一个问题,我就一个呃另外的问题,然后我就让他先不要改,后面再说吧, 然后他们就就搁置了这个问题,然后就继续去执行执行执行执行,但是太长的话我就没有没有一直把它全部录下来,而且我那个中转站又出了一些问题,但是我全程是没有任何的这种 独取,或者我的呃去思考这些代码应该怎么怎么样操作,我全程都是引导他去让他自己去测试,然后自己去 review, 自己去推送,自己去部署到这个端。这个呃服务器上面 整体大概是这么一个情况,这个就是我达到的一个效果,我相信,呃,如果说有工程能力的人,他们的效果可能会更强,因为我是工程经验是不足的,只有只有这种部署的经验,呃,只有这种智能体相关的经验, ok? 呃呃,现在还是第一步就是 k v k h。 呃,说一说一句啊,这个没有 k v k h 的 这种中转站或者什么乱七八糟的,只要它没有 k v k h 的 命中率,不告诉你有 k v k h, 比如说现在很多的动不动我送你两个亿的 token, 两个亿的 token 够干什么?因为像我,我这个, 我这个项目他请求一次你输入输出就已经掉了三三百八十七 k 了,他如果输入和输出全部算成托管的话,那两下就没了,你三亿两亿又怎么样呢?对吧?你如果没有缓存,那么就是在耍流氓, ok, 继续 呃,可能,可能有点有点说的过过分了啊,但是我觉得呃是没有毛病的。不聊 k v k h 命中率的,全部是耍流氓。 k v k h, 如果说命中和不命中它的那个上下文,比如说刚才那个三三百八十 k, 如果你是一个新的,没有 k v k h 的, 你的成本是十的话,你如果有 k v k h, 你的成本一可能都要不了。所以说这个 qcatch 是 非常重要的东西,但是很多人呃没有关注这个点,只有一些正规的平台,比如说像 deepsea 啊,像这种,嗯, 大平台它会会说这个,但是像很多中转平台它都不会说这个东西。呃,推荐大家一定要看这个东西啊,如果没有的话,它不管再低的价格,它都是耍流氓,都是更贵的。但是,呃,如果你中转,它是有 qcatch 的, 这个这个是 ok 的。 呃,这样的价格其实是,呃可以可以接受的,因为中转一般它的价格都还是比较便宜的。呃, 还有一个点就是大家用这个 max, 呃, cloud code max 二十 x 的 时候,第一第一天或者说前面一周使用的时候,它的量都很少 的一个原因,并不是说那个 cloud code 的 snoop, 它们在降低量。呃,很大的原因就是由于你的任务是你的任务,你的上下文, 呃是在不断的切换的。你的 kuvcatch 其实是没有建立的,所以说,呃,你如果都是新任务的话,那么你的这个使用量肯定就是更少的。 但是如果你呃都是一些老任务,呃它的 kuvcatch 啊,这些建,建立啊,构建啊,它会给你构建非常多,多了之后它的命中率就高了,然后它的 token 消耗就会降下去,呃也会,你的使用量也会增加。如果你是使用中转的方式的话, 这也是我们的一个经验。 ok, 我 们还是简单说一下这个 kuvik 的 一个原理吧,因为很多人呃他 不知道 kuvik 的 重要性,很多时候他是不知道原理的。呃呃,像现在的这些大模型,他都是使用的这种 attention 的 机构,然后 attention 他 要计算下一个词,他都使用的这种自回归的方式,比如说我爱, 可能下一个字是我爱你,那么这个字他必须要跟前面的这几个字去做这种矩阵乘法,然后去得到定四个字,他的一个 k 和 v, 那 么他得出来了之后, 这个 k 和 v 他 是不会改变的。当你下一次又有一个字来的时候,你想要预测下一个字的时候,那么呃他这些 k、 v 是 不变的。如果你把这些丢弃掉, 那么你就重新又要计算一遍。如果你不丢弃掉,你直接只用计算这个 q 和这些 k、 v a a 全部计算一遍,然后得到下一个 k 和 v 就 可以了。这个东西就是 k、 v、 k、 h, 如果你没有了这个 k v、 k、 h, 那 么你就得把之前的全部再计算一遍,这样的话成本就会非常的高。 这个里面就有一个特点, k v catch 的 命中率就在于,呃,我们聊天的时候,比如说我们调用工具也好,还是聊天也好,还是像叉 g p 这样也好,呃,你所有的绘画都是 呃,他回答完了之后,你增加一条绘画,他全部是放在下一个,呃,全部是直接放在这个历史记录的后面的, 所以说它的 k v k h 前面是完全没变的,所以说你这个加进去它的成本是不会特别大的。如果说要按照那种全量完全没 k v k h 的 话,比如说像 cloud code, 别说二百美二百美金一个月,它就是两千美金一个月,它都抵不住这个计算的损耗。 呃,这个里面就有一个特别特别特别重要的点,就是一定你的中间的键是不能破坏的。比如说你自己用 cloud code 的 时候,你把中间,比如说它的历史记录中间你去改一个,改一个关键词,比如说你在中间改一个动态的,动态的比如说时间, 你想让这个大模型它知道时间,那么这件事情就是非常错误的,因为它只要在这变了,那么前面的是可以,嗯,完全用之前的 kuvatch, 但是这后面的 kuvatch 全部报废了, 这就是为什么我们的 qqcatch 不 能动的原因。这个也会引发另外一个问题,也是我之前呃一直错误的一个观点,就是,呃,我之前会用一些比较便宜的模型,比如说嗨酷,比如说用其他的一些简单的模型,呃,去拿到上下文了之后,我再用一些好的模型,比如说 opas, 我 去 对这些东西进行一个呃再推理,这样的话,它岂不是它就不用再去拿前面的上下文了,它就可以得出来一个比较好的结果了?但是不是这样的, 就算你用嗨酷的模型,它的成本都没有 k v k h 已经命中的时候,它成本低。特别是像 cloud code, 它所有前面,比如说调用了工具返回的结果,它是完全没有动的,所以说它上下纹才会那么长,嗯,它的上下纹是完全没有动的,主要就是这个原因, 这个 k v k 的 原因也就是让大家不要去动这个呃 k v k 的 呃不要去动这个模型完成一个任务的时候,你最好就是从上到下全部不要动, 不要在中间去切换模型,切换一次那个成本是你完全无法接受的。不管是呃所有所有的这个呃 code plane 也好,还是什么也好,它们都是在潜在去看了这个 k v k 的 命中率的, 所以说他们才会说说是一个浮动的区间,比如说呃九百到呃一千二的这个呃请求,他们都是计算了这个 k v k h 的, 计算了这个成本的。当你破坏 k v k h 破坏的非常严重,你的重命中率很低的时候,它的这个用量肯定就低了, 当然也包括这些 cloud code 啊,也包括这些 g o m 啊,或者说其他的一些 code in play ok, 呃,这个 q k g 大家应该也是比较比较了解了,然后我们来看一下这个 cloud code 的 一个 context, 就是 它上下文到底是由什么组成的。这个东西也是我非常踩坑的一个点,因为我之前 呃我会装很多 m c p 啊,装很多 skills 啊,甚至我会把呃这个 cloud 的 点 md 文档,我又会给它写的非常的详细,所以说就会造成 我的上下文直接就没有了,比如说可拉的点 md, 因为我想那你可拉的点 md, 你 一直加在在这个呃模型的上下文,肯定我写多一点,然后这个模型他肯定就能按照我这个进行执行,他效果肯定就会更好嘛。其实不是的, 现在这个是没超过呃两两三百行的,但是这个都还是太多了,最好最好就是一百多行, 然后里面写的东西就是呃你的文件结构,还有就是你的一些规划,就是你的规则,你应该怎么样写,怎么样写,反复出现的这种失败模式啊,和一些行为偏好啊,比如说你要用哪些库啊,呃,还有就是这这个东西其实都不应该写, 然后反正这些东西都应该非常简化, ok, 我 们还是是不要跑题啊。还有这些 cloud 的 点 md 文档写的非常详细的时候,我 第一次一打开这个 contacts, 我 拿一个新的对话,啊,这,这也是一次新的对话,我拿新的对话打开的时候,我发现我只有八十多 k 的 正常使用量, 但是大家不要高兴的太早,你们去打开一下,你大概率也不会多于一百 k 就是 你可以使用的, 相信我,肯定是这样的,大家看着这两百 k 的 上下文,它是哇,还是挺长的,两百 k 可以 放好多东西,但是就算你什么都没装, 基本上都没装,你都只有一百四十 k 不 到,应该是一百二十到一百三十 k 可以 使用,但是你肯定不可能什么都不装,比如说 m c p, 你 总得装个把吧?然后 skills 你 要装吧,你的这种记忆文件,比如说这个点 m d, 你 还是得装一点点吧, 一装下来,而且这个都是我优化过后的,都只剩下百分之五十八了。就是,呃,这个两百 k 的 百分之五十八只有一百一十多 k, 当时我没有做优化的时候,里面只剩下八十多 k, 还是蛮震惊的,我就是说我的完成一个项目怎么 还没怎么弄呢,就已经已经搞搞掉了百分之六七十的这个,这个工作空间, ok, 我 们不不聊太多了。呃,首先就是他这个上下文, 首先占比最大的就是自动压缩的一个空间,他是留了百分之十六点零五的一个空间, 呃,是用了三十三 k 的 托肯,这个是占比最大的,但是大家应该使用的时候会发现,他其实压缩出来的内容,他只有个三点几 k 到四 k 多,他不可能用到三十多 k 的, 所以说这个这个点他其实留了非常大的余量。 嗯,这个这个东西我也我也不太清楚它为什么会留这么大的余量啊,按理来说如果说四五 k 的 话,你就算这个有一些突然的爆发,那么你这个东西应该也是在个二十 k 就 够了呀,它这个已经远远多出来了十 k 以上的这个量,所以说还是非常的恐怖啊。 然后就是系统提示词,这个是静态的,然后这个是系统的工具,这两个东西是你完全不能动的,可 outcode 里面的相当于有三十 k 左右,是你完全不能左右的。还有就是 m c p 的 工具给大家,这个是最大的一个坑哈, m c p 的 工具会占非常多的。呃,这个 token 消耗,我就只装了一个 playrite, 之前我装了好几个,然后我把它全部卸载了,全部不要, m c p 全部不要。你如果说非要用,你就直接把它放在 skills 里面,因为 skills 它是动态加载,按需加载的,所以说它初时的 token 不 会消耗太多。什么情况下应该放在这个 m c p 是 需要装的呢? 就是你要非常长时间的使用,而且你又必须这个东西。呃呃,怎么说呢?你又必须要 经常用,而且你需要大模型知道你有这个工具,那么你才是。呃,要把这个 m c p 给装上的,要不然尽量都不要装,尽量把它放成这个 skills, 按需加载。当然现在好像也有这个 to search, 但是我我就想的, 如果我不是不是必须要的话,我就直接放在 skills 里面了,我就把这些,其实现在很多 m c p 它都是放在 skills 里面的, 然后这个是用户的一些 index, 你 可以自定义 index 的, 这个,这个基本上不会消耗到特别多的托管。嗯,这个托管基本上就是你自己去安装很多插件的时候,它可能会给你预定义一些子 index 的, 这个是子 index 的 话,这个不是 t 模式的。然后这个是 member 一 些记忆的文件,它其实是叫记忆的文件,但是它记文,记忆文件里面分了很多哈。还有 skills, skills 是 你自己装的,它只加载这个原数据,比如说我要看一下哪一个?呃, skills 给大家看一下。 呃,这个 skills 就是 我的 creator, 这个 skills 它只会加载这个内容,每一个 skills 它只会加载这个内容,所以说它的 token 其实不多的。所以说 skills 大家可以多装一点,无所谓,但是尽量还是不要太多,反正,嗯,有一些这种 benchmark 去测试出来大概是两到四个效果是最好的。 呃,如果说那个,呃 longchain 它们也测过,大概是在十二个左右,它那个效果就已经在下降了。 嗯,我,我认为大家尽量这些东西都不要多装,因为 skills 它的出发条件,呃,你装的多了,它出发就不太精准,它就有点笨,它会分掉它的注意力。如果你不呃主动地显示地要求它去出发这个 skills 的 话,它大概率是不会出发的。如果你装多了, 然后这个 message, 呃, message 就是 发的这个消息了,就刚才我们发的这个 context, 呃,这个就是你自由的,自由的上下文有多长。这个东西,呃,大家最好自己去检查一下。 ok, 我 们也看一下这个 m c p, 这个是 m c p 具体的每一个工具,它的一个 tool。 然后是其实最重要的是这个, 呃,它自带有一些 agent 的 tool, 这个是我自己装的,这些都是我自己装的。呃。有一些,呃 md 的 文档,呃,这些 token 其实最消耗的是这个,呃, cloud 点 md 文档,这个花掉了五点五 k, 就是 给大家刚才看的这个 cloud 点 md 的 文档,虽然只有两三百行。 还有一个就是 member, 呃,他会把你的一些习惯呀,你的东西,比如说你说,哎,你记住以后不要这样,他自己会去打开这个 member, 他 会把这些条件记进去,但是 member 他 只会加载两百行, 只会加载前两百行去到他的上下文文件,而且他记录的都是一些,呃,非常简要的规则,他不会记录非常复杂的规则哈。呃。所以说 这个东西你也可以看一下,然后做一些优化也是可以的。比如说他最后就建议要去优化一下这个 member 文件,但是优化了之后他肯定是有损失的,这个东西大家还是要评估一下到底是不是要做。 ok 哇,这个时间已经太长了,我们继续啊,继续快一点。 嗯,再就是稍等。呃。再就是这个 cloud code 怎么样去配置, 我是使用 cctime 会比较多一点,然后模型的话,呃。自己看自己的能力。呃。我个人感觉,比如说你要用 team 模式,它的主对话 leader, 你 最好还是要用这个一照上下文的,所以说用千万三点六也是比较好的。然后 kimi k 二点五, 因为 kimi 它是专门对这种病病情处理,它是做了优化的,所以说 kimi 也是比较推荐。因为我我们今天聊的基本上都会跟这个 cloud code 的 team 模式相关啊。呃。但是我个人感觉效果蛮不错的, 就是这个 gpt 的 五点四,因为我是专门用这个中转站去测试过这个 gpt 的 五点四,甚至我觉得它在步骤规划呀,病情处理呀,指令遵循呀,是比这个 opus 要好的。 oops, 它有时候还会忘记一些东西,或者说它注意力没有那么多,但是我感觉 gpt 的 五点四它指令遵循啊,这些都会都会记得,比如说像我的这些 team 模式,它会记得要。呃。首先要去用研究,研究了之后要把东西给到这个 呃前后端去实现,实现了之后还要丢给这个 code review 去看一下这个代码是不是 ok, ok 了之后他会再去做测试,去部署测试,测试了之后他又会让这个管家去看一下他这些文档是不是 ok 的, 然后这些 ci 是 不是 ok 的。 这个这个 cloud 的 这个 gpt 的, 我感觉它的效果是最好的,比这个 opas 效果都好,因为 opas 它经常会忘记,经常会忘记。比如说我里面有一个特别重要的点,就是 leader 去下发任务的时候,这些员工他应该跟这个 leader 去多次重复, 多次对齐这个需求。万一有一些 leader 它是没有看具体代码的,很多细节它是不知道的,所以说它们需要去沟通。但是像 cloud 的 模型很多时候是会忘记掉这个东西,但是 gbt 它是 ok 的, 但是它很很大的问题就是 gbt, 呃,现在的基本上它都只支持二百七十五 k, 呃,它是不支持一照的,但是你的 leader 没有一照上下文,所以说效果是不好的。因为一照上下文它并不是一照上下文它能给你带来多少的能力的提升,而是一照上下文你能选择压缩的这个时机, 压缩是你选择的,而不是他到了两百 k, 到了两百七十 k, 然后他自动压缩的,这个是非常重要的,因为就算有一兆我也不会用到一兆,我最多最多的时候我用到过五百 k, 但是很明显的感觉到出来他的上下纹腐烂的问题很严重。就算是欧巴斯, 他到三百 k 的 时候效果基本上都很差了,因为你肯定不可能一个任务你能完成。嗯,他的上下文长度能到三百 k, 因为 leader 他 只派发任务,他不做具体的代码,所以说 肯定是多个任务多个任务完全的这样执行下来,所以你三百 k 的 时候,你塞了非常多的这种任务在他上下文,而上面的这些任务其实跟下面的任务它相关性很低, 所以说你你你,你后面这个上下文腐烂的问题非常严重。到三百 k 的 时候,我基本上都在做一些收尾的工作了,呃。要考虑压缩上下文了,我就直接告诉他,呃。我准备压缩上下文,嗯,你做一些收尾的工作,看一下还有哪些工作是没有做的,有哪些测试还是没有做的,有哪些文档还是没有归类的, ok, 呃。就算没有 gpt 或者 cloud 的 这种比较顶尖的模型,其实用这种,呃 plus 的, 用这种千问,用这种 kimi, 它其实都还是可以的。它们的逻辑性我觉得都是没问题的。 我认为最大的问题是注意力的问题。就像我刚才说的就是模型,它在执行这个任务的时候,它就把之前的一些指令给忘记了,因为我们要让它效果好,你给它的指令其实是非常多的,比如说你在执行完了之后,你应该写一下文档, 如果说这种这种比较比较差的模型,他可能就会忘记,所以说,呃,这个东西你提醒他一下也是 ok 的。 呃。他的这种逻辑性,我觉得这些模型跟我们人比起来的话,呃。跟我比起来吧,跟大部分人比起来,他的逻辑性都是非常严密的,而且设计都是非常好的。 呃。所以说我觉得不用,如果能能用好一点的模型就直接用好一点的模型,如果用不了好一点的模型也不需要觉得。呃。我用差一点的模型就完成不了这个任务。只要你把 hernes 把约束,把这些规范弄好,然后你注意一下,呃,去多去提醒他显示的提醒他呃。要记得去调用这个模型,然后你可以让他呃去 完成这个任务的时候要怎么样的一个员工流程,先让他梳理一遍,然后再去完成某一个具体的这样的任务。还有就是模型的常见的命令,其实我用的命令都很少,就是我,我其实用的不太好命令,但是我觉得已经够用了。 首先第一个就是这个 dennis, 呃,虽然最近他出了一个自动的模式,但是我认为那个自动模式还是不够自动啊。呃。我觉得这个这个模式还是最好的,因为我我们的项目都不是一些特别机密,然后有非常巨量的这种用户的,然后风险零度感度非常高的,所以说我用这个方式是完全没问题的。 呃。我有一个观点哈,就是大家如果是大大,相信大家去看到这种什么呃。模型商铺跑路的, 自己没有遇到过吧?或者说你身边的人实际的情况下是没有遇到过的。用一些稍微正常一点模型,你别用一些本地模型,应该是没有遇到过这种问题的吧。 如果说你因为这种问题你给自己设了很多限,我觉得这个是得不偿失的。你因为一些潜在的风险,然后自己给自己设了很多限,然后自己给自己呃造成了很多困扰,比如说你要每经常去点击,去同意他的这些命令, 我觉得是得不偿失的,只要你的风险敏感度不是,呃你完全无法接受的,我觉得大家可以冒一定这个风险。 然后这个就是比较常见的继续之前的一个对话,呃,但是我我个人认为哈,你最好不用继续之前的对话,你要不然就直接压缩,要不然你就直接结束了,重新起一个就行了。因为用我的那个 tim tim 模式的话,他会把所有的内容直接放到这个文件夹里面,直接放到这个 点 plan 的 文件夹里面,他下一次启动的时候直接把这个文件夹发给他的话,他就是自己能拿到上下文继续进行执行的。 呃。还有就是这个,呃选择绘画的主题,呃,你可以用这个方式,你可以看一下这个项目里面 你之前的一些绘画,你可以选择之前的一些绘画,这些都是比较基础的操作了。然后就是项目初识画,呃,其实我对这个的话是比较抵触的,因为这个初识画有一篇文章是说过,如果是由模型生成的这种初识画的项目文档其实是没有意义的,没有价值的, 它其实就是专门去生成这个 cloud 点 md, 它的目的就是为了比如说你有个非常大的项目,它这个 cloud 点 md 的 文档会把你这个项目下面的所有哦架构啊这些,呃地图啊这些写在这个 cloud 点 md 里面,然后模型在推理的时候想要找东西的时候,它就直接知道这个地图了,它就知道在哪里去找了, 但是真实测试下来,首先它的准确度不会提高。第二个点就是它的 token 消耗会增加百分之二十以上,因为它有这样一个地图了之后,它会迫使它自己去查看更多的一些细节, 但是很多细节呃,其实是没有必要的,它就用一些。呃,这种 graph, 用这种关键词正则匹配的方式其实就能解决这个问题了,它并不能提高这个准确率。但是这个东西适合拿来做什么?适合拿来做你的这些文档的一些地图, 适合拿来做你的一些,比如说在这个项目里面的一些踩坑的点,比如说你有一个错,你每一次用模型来执行,他都要去绕很多的弯路才能执行成功。那么这个东西你应该记下来, 记得是经验,是教训,是他特殊的一些规则,甚至是你的一些工工作流。比如说刚才我们的那个就是你的这个成员,这些成员到底有哪些?然后这些成员的功能是什么?这个东西我觉得才是可以记得。还有就是这个压缩了, 就是手动压缩,这个绘画记录千万千万千万千万有这个重点说三次啊。压缩尽可能都是由你自己选择的压缩,而不是他自动的压缩。这个点非常重要,因为你选择压缩之前,你可以把你的文档沉淀下来,下一次你继续完成任务的时候,你才能拿到这些信息。 呃,例如可以结束一个大任务之后就可以压缩,比如说你上下文快到这个窗口期了,就可以压缩。比如说你有一照上下文的时候,你快到两百 k 或者三百 k 了之后,呃,你就可以考虑这个工作,这个任务就可以收尾了,不要让他自行压缩。 呃,你先收尾,先保留这些上下文,保留这些文档,让下一次可以执行就可以了。然后切切换模型啊。 呃,我建议大家只要是机械的实现都使用这种 sonata 的 模型就有。有条件的话,如果说你用 cloud code 啊,或用 cloud 模型啊,用其他的话,有条件用 sonata 需要理解和规划,比如说 leader 用 opus。 嗯,这个东西呢,反正能用好一点的就用好一点的吧,但是也没关系,只要你写好,然后对这个过程规划 hardness 了解的比较深,你自己愿意多说两句话。其实性能我觉得是没有没有没有,没有特别大的差距吧。 ok, 注意啊,就是千万别中途切模型,他的效果这个成本是很难接受的,除非是对话指出。比如说你压缩了,然后我切一下模型,这个是 ok 的。 呃,比如说你新新开的时候,你直接换一个模型,这个也是 ok 的。 比如说你有个一百 k 上下文了之后你又切个模型,那么这这件事情千万不能干,他 k v k h 是 直接被破坏掉了。还有就是双击 这个就可以消除消息,然后哦 ctrl u 就 可以删除一行消息,然后空空白消息。双击的话就可以会去选择之前的历史记录。呃,它好像现在也,它现在也是有这个。呃, check check point 的, 就是它可以返回你之前的一个版本, 它是有版本控制的,它之前没有,但是现在是有了。嗯,但是我推荐大家尽量使用这个呃 get get 来进行版本控制啊,尽量不要不要使用这个方式,这个方式其实效果不太好,很容易出问题,有时候它就是 ok 的, 有时候它那个版本又是有问题, 然后是使用技巧,尽量大家去做的时候,你直接问它这个东西是什么?这个,呃,子智能体是什么?你有几个子智能体? 子智能体是怎么样弄的?然后 task 它现在是有 task 的, 就是它会记录在它的这个,呃,那个那个工作目录,不是在你的这个工作目录,在它的一个工作目录下,它会去把任务写成这种 task 的 文件, markdown 的 文件,然后再去按照这个文件的这个指令进行执行。 同时它也可以让这些子智能体啊,或者 team team 成员啊这些它会去读这个 markdown 的 文件,它就可以知道。呃,按照这个文件来进行执行,就不像之前用的 to do list 的 方式,它是没有文件沉淀下来的。 呃,但是这个有有有点问题啊,它就没有在你的文件夹下,但是我们按理来说这些东西都应该在我的文件夹下,所以说我的那个 team team creator 也是跟这个做了一些优化的。它这个 task, 呃,我是让它只写一些聚焦的。呃核心的点摘要,然后引用一下我们现在的这个这个文档,这个文档里面具体的这个。呃 plan, 具体的 task plan 可能会写得稍微详细一点, 这样的方方式,这样的方式的话又没有破坏他们自己调试好的这种提示词,然后效果也还蛮不错的。然后他下发任务啊,这种 task 的 内容也会比较短一点,所以说效果还是蛮不错,因为我们写的提示词啊,写的一些指令其实是没有他们写的好的,不要跟他们的指令有冲突, 不要有矛盾,会造成模型的困惑,你可以让它稍微改一下,比如说 test, 你 不要让它写得特别复杂,特别详细,你就指导它引导回来你的这个文档就可以了。还有就是 这个 skills, skills 大家配的时候可以配到你的这个项目文件夹下面,也可以配到这个。呃。用户级别,就是它可以在全局都使用这些 skills。 呃。这个 skills 就 不详细说明了吧。 呃。一会一会给大家最后讲一下我这个。呃。这个 teamwork 的 时候。呃, team cici, team quitter 的 时候。呃,给大家讲一下这个 skills 大 概是个什么情况,因为现在已经非常长的时间了。呃, 另外一个点,如果解决不了这种特别难的问题,因为很多时候我们还是会有一些问题。呃。解决不了的,可以直接用这个 codex 的 五点四的模式,直接用这个最高的推理性能的模式,或者直接起一个 opas, 你 把它这个思考作用调到最高, 基本上都可以解决,因为我我们的项目其实没有没有那么深度了。呃,但是绝大多数的项目都没有那么深度,但是很大的问题并不是说他解决不了,而是他掉进了这个局部追优,他爬不出来了。所以说很多时候你的这些文档,你一定要跟他说一下, 你不要去查看这些文档,或者说不要按照之前的文档来思考可能是错的啥的,让他自己来思考,自己去做推理,这样这样也是 ok 的。 然后就是插件的问题。呃,有两个比较好的插件,这,这是有点分开的。呃,第一个插件就是上下文占比的一个插件,比如说这个,呃,我,我的一个可以看到 我的模型,然后 contacts 他, 但是他这个不是特别精准,但是大概是没太大问题的。还有他调用了什么工具,看了什么文件,然后,哦,他都会写在这,甚至这,这个,这个是另外的啊,这个是,呃,他的这些 team team 员工,你可以这样 shift 上下键去切换,这个都没啥, 这个东西非常重要,就是上下文你只有看得到,你才能控制你的。呃,控制你压缩的这个时机啊,这个太重要了啊,大家,大家一定要注意注意这个点。呃,这个模,这个插件叫做 cloud hold, 大家自己去看一下。然后就是任务完成的一个通知插件,这个也是比较重要的。 呃,通知插件,我这个这个是没打开,大家也可以直接搜吧。 cloud no notification go, 这个插件其实蛮多的,就是他完成了,他给你回一次消息,他会在右下角提示一下,这个还是挺挺挺好用的,因为我们做做这个,呃, web coding 啊,或者开发啊,这些都会并行进行开发。几个任务进行并行的时候,往往就忘记了我开了之前的一个对话,下一个对话怎么怎么怎么样了, 但是,呃,你有了这个东西的话,他就会提示你。呃,嗯,但是我用了这个 teamwork 之后就没有那么大的问题了,就是,呃,我基本上都是在那个 teamwork 里面直接进行并行开发,这样的话我只用控制一个,然后就算很多任务他是完全不相关的,呃,他这个 leader, 这个 oppas, 他 都能去解决,去去分配这样的一个任务, ok? 嗯。这个东西, 呃, team skills 就是 我开源的这个项目,我们先看这个 open ai 的 harness engineering 这篇文章吧,然后再给大家讲一下,详细讲一下我这个 skills 它是怎么样配置的。呃,这个开源的, 大家如果听听不下去,也可以直接用它,这个就是一个 skills 配,配置上去了之后,你直接问 cloud code 也可以, ok, 呃。先说一下这个 harness engineering, 这里面有非常多的 经验是值得吸取的,而且值得非常多遍非常多遍的去读,我一共是读了,呃,就是给大家分享,都分享了三遍,所以说我读了非常多遍。呃,当你没有用好这个 ai 编程 web coding 的 时候,你会发现,哎,他讲的好像有点道理, 但是你用了一下之后你就能想起来,哎,他这些逻辑在指导你可以进行编程,特别是完成一个比较大的项目,或者说一些大的项目进行编排的时候,你要把他因为之前的一些项目他可能 都没有文档,那么你应该想一想,呃,怎么样用这个 harness 去改造这个项目,让后面的这种,嗯, cloud code codex 它能继续地去完成任务,然后哈你就自己慢慢会有意识或者思想去放进这种 ai 编程,然后最后再读一遍, 你可以结合他的一些思想和你项目,因为你已经做了 web coding, 你 项目里面的一些文档设计,然后第一步应该怎么做?第二步应该怎么做?然后你再让 cloud code 或者说 codex 或者任何编程工具去看一下这篇文档, 这篇文章,然后再读一下你之前的这些文档,让他给你一些优化建议。我们有哪些东西是没有做好的?比如说文档没有写好的,比如说 他的这个 c i 检查是没有写好的,你有哪些做的欠缺的,他会告诉你,然后你告你跟他说怎么样去优化,然后让他去给你做优化就可以了。 ok, 我 们直接打开这个 这个文章吧,这个文章也还再次给大家详细的再读一遍,因为这个文章太重要了,不管是所有讲 web coding 的, 或者说最近两个月都绕不过去这个 harness engineering, harness 约束。 ok, 这个是 open i 他 们发的这篇文章是由一个团队,他们里面有一个团队是专门去构建一个内部的一个软件产品,一共是好像是五十万行代码, 好像是五十万行代码,然后是没有用一,没有手写一个代码的,然后大概只用了十分之一不到的时间,直接就完成了这样一份工作,然后是由人来进行指挥,然后都是由这些智能体进行执行。哦,是一百万行代码, 然后还是非常非常离谱啊,大概有每天处理三点五个 p r 太太离谱了,他们用了五个月,五个月,然后一百万行代码,一百万行还是非常非常离谱的事情。 ok, 他 们是从一个空的代码开始的,他们当时都只是使用的 g p t 五,然后都没有五点四,没有这个 cloud o p s, 他 们用这个 g p t 五和这个 codex 来进行使用的。 可以讲到,首先这是呃它的一个工作吧,工作量吧,然后哦它们的核心理念就是不手写一行代码, 然后工工程师的主要工作偏向了系统架构以及如何撬动这个呃 ai 编程。 cloud, 呃,不是 cloud code codelex, 它的一个杠杆作用。 然后早期的时候他们是比较慢的,跟跟跟我的那个过程也是很很相似啊,我跟他们的过程很相似,因为我基本上呃我开发那个我的这个项目十万行代码大概是用了半个月多,但是前面 一个星期到十天是非常慢的,甚至都是在呃跑一些弯路,都是在构建这个 cc team creator 这个 skills, 我我想让他去完成,去结合这个这个 team 模式,然后去结合呃这些 harness 的 机制,然后去配合呃现在很多这种子智能体的一些呃逻辑或者定义, ok, 嗯,首先他们就又说了一下,然后他想要呃呃去完成这样的一个目标,他先要把它做了拆解,其实也就是呃这些角色了,就是 team 模式的角色设计、代码审、测试等, 然后去让这些智能体分工去完成,因为这些东西它是完全可以拆分的,比如说设计它是可以拆分的,代去完成,代码也是可以拆分的,评审也是可以拆分的。去呃分割这些角色的原则就是这些东西是可以模块化的拆分,但是千万不能是 比如说我这个,这个又要做,呃,比如说呃一个功能让多个角色去做,这样是不 ok 的, 因为它上下文无法拆分, 所以说它会消耗掉特别多的上下文,然后智能体和智能体之间的沟通成本也会非常高,并且最大的问题是它们之间沟通是有信息损失的,所以说这样这样这样是不太好的。 ok, 嗯,他们发现人类这个,呃,我们工程师总是介入这样的一个任务,呃,究究竟需要什么样的能力来让这些智能体可以对这个项目进行清晰可读,而且又有一些约束的执行? 然后,哦,他们基本上是按照这个系统提示词啊这些呃去去给这个系统进行交互,跟这个 codex 进行交互。最开始他们是使用的这个呃这个死循环的方式,但是,呃后面他们慢慢就是采用了这种标准的一些开发的流程, 然后去不需要人工地去介入到这个 c o i, 它们也是使用了这样的一个循环了。嗯,这儿我感觉都有点有点乱,没没必要读得特别详细啊。呃,其实最重要的是后面的这几个要点。首先是要提高这个 cloud code, 呃,不是提高 cloud code, 是 提高这个应用 cloud code 的 可读性,你必须要让这个应用不管是在执行的时候,还是在运行的时候,还是在测试的时候,它都要能详细看到这些。呃,这个应用它的一些内容,像我们之前的一些史山代码,呃,它大多都是, 呃,我们只需要看它结果是什么样,很多日制啊,我们其实是写的不详细的,所以说在现在这个阶段它其实是不 ok 的。 比如说它这个进行测试,它是一个标准的前后端啊。呃,如果大家不是标准的前后端,是比如说一些应用,比如说有些甚至应用都不算,呃,你尽量使用这种打包的方式,直接把这个前端直接打包成应用,或者直接使用这种 c o i 的 方式, 呃,去测试这些嗯功能或者执行你 c o i, 到时候你再打包成一个前端这个不值钱的东西, 这个你到时候去慢慢实现就可以了。你直接把先做 c u i, 不要不要去做什么前前后端一起或者怎么怎么样,把它全部弄好,先做 c u i 功能全部实现了之后你再去实现其他的东西。我们先详细看一下它测试的这个机制是什么样的。 这是 codex, 然后这个是这个浏览器的开发的工具,然后这个是应用,其实是先清除工作台,它会清除一下工作台,然后我去呃,去大概看一下这个的一个状态是什么样,然后去去操纵,呃这个应用, 去操纵了应用之后,他可以看到这个应用的一些内容,日制,然后截图,呃之呃操作之后的截图,然后他拿到这些信息之后就知道哪里出了问题,然后进行修复重启,然后不不停的循环,直到完成任务。其实我们我的这个项目也是这样的一个流程, 然后就是,嗯,他的一些核心点就是必须要有非常详细的日制系统, 可以看到他们是一共用了三个日制系统,因为我对工程经验不是特别足,所以说,呃,他具体的这些系统我可能不是特别了解,大家如果知道的应该还是比较那啥,但是无所谓,你让他写好日制,他自己会给你写好, 就是你哪怕是你之前项目没有写好,你只要把呃这种文档全部构建出来了之后,你就说你给我重构一遍,把这些日制全部加一下,他自己会给你加 我的之前的那个项目也是基本上全部写完了,写完了功能,大部分功能都已经写完了,然后又用的这个呃 team 模式,然后把整个文档,整个这种日制什么基本上像像重构一样把它全部重构了一遍, ok。 第二个就是它的一个记录系统,因为你要让 cloud code 它能 一遍一遍的衔接之前的任务,因为呃模型的上下文是有限的,它清除了上下文之后,它能衔接上之前的这个工作,继续去完成任务。那么你的文件 和文档系统必须要写得非常详细,它们之前是使用把所有东西都塞在这个 id 的 点 m d 里面,当然这个刚才也说了,这个是一个呃非常错误的 思想或者做法,他要的是给 codex 一 张地图常态加载在这个模型上下文里面的是一个地图,不是一个一千页的说明书,这个是毫无意义的, 因为呃,首先就是呃所有都重要的话,那么所有都不重要。哎,这,这不是,这是所有都重要的话,那么所有都不重要。你把所有的条件都写的非常详细,他一次性他是他的那个注意力是没有那么多的,或者说他其实跟我们人一样,你人 能能注意到那么多东西吗?那么多重要的点吗?肯定是不行的。然后就是其实这两个东西是一个东西啊,就是他会错过很多约束条件,他会忽略掉一些东西,其实跟你那个 skills 放多了也是一样的。第二个点就是这个东西会上下文腐烂,然后哦就是很难核实, 这个漂移是无法避免,但是这个东西跟跟他的 md 文档没没太大关系啊。这这两个东西,呃,这个东西核实和这个成就, 你应该是他想要说的是你要做一些维护,可能很难维护,因为这些 edit 点 m d 文档它不是热加载的,它是必须要重启之后它才能去更新这个上这个文档,所以说,呃,你你没办法去动态的更新这个上下文里面的内容,这也是不 ok 的。 然后他们就把这个文档也列了一下啊。呃,首先文档,这个是设计的执行的文档,这个是生成的文档,这个是 对齐的一些文档吧,然后这些参考的,但是我个人感觉它呢,这个设计的并不是特别好,我觉得按照我那个方式可能会好一点,就是按照角色进行划分,然后角色下面它又会划分成这个 每一个任务,一个文件夹,文件夹下面又结合了这个 plan with fields, 它的这个 skills 它有有有进度,然后有发现有这个任务。三个 md 文档,然后它维护这三个 md 文档。虽然工程嗯量工作量是增加了,但是它会更加详细,然后完成一个项目的时候,它也有迹可循。 ok, 但是它有个比较好的点哈,就是它的这些呃文档里面它是有一些标准的,比如说,呃你的一些 接口,你的一些 api 端口是不能进行改变的,如果你要改变,要增加你这个文档必须要呃,改变增加,所以说这是一些规范文档这个东西是不能变的。呃,这个东西应该也要写在这里面,而且对整个项目它的一个大致的介绍,大致的说明 也要有一个这样的文档。我这个也是有这样的一个文档的,就是对专门做了这样的一个文档,但是他不没有像他这样又在里面拆了,因为我在是按照角色进行拆分的,这就没啥。 呃。编,编码和缩影,这些编码和缩影应该放在这个点,这个 a 键的点, md 文档里面,这个文档的一些结构目录都应该放在那个里面。 ok。 然后就是可读性,也是最最重要的,就是你一定要你的代码。呃,和这些反馈是要跟 cloud code 进行。嗯嗯, 强强交互的,所以说一定要有可读性,不要是全部代码,因为代码它的行数和内容都比较大,但是你文档它的内容,嗯的信息密度就会更高一点。呃, 就是可读性啊,他会,如果你的可读性不高的话,他可能就像三个月入职的新员工一样一无所知,所以说你必须要把他写的比较好,然后,哦,你新 新的一个 codex 其实就是一个新的员工,他应该去读哪些文档,他要他要知道,然后他去复回去,去抓到之前的上交文,然后才知道怎么样去继续去完成任务。还有一个点就是规范和架构,这个东西我感觉还是非常重要的,因为光是文档文档他其实只是一个提示词, 但是你想要让他按照提示词的要求来,对于现在模型来讲还是比较难的。那么你应该怎么样去限制?你应该去做一些脚本,去 严格规范一些边界,严格去规范一些内容,比如说你的接口不能有多的接口,你不能有多的一些呃类或者库,你不能引用其他的一些类库,比如说你不能,嗯,去 去调用一些莫名其妙的 api 啊这些,甚至你的这种文件它的长度不能超过八百行,或者不能超过多少行。这个你应该写一个脚本来专门对你项目里面的所有内容进行检查,这个是一个固定的规范,这个是必须要做的, 如果你没有的话,你很容易这个爆炸,你的这个技术债会会会会会越堆越多,只有有了约束之后,你的架构才不会漂移,因为 他很多模型他上下文没有了之后,他通常就会去干一件事情,就是乱编一个新定义,一个变量,新定义一个命令,这,这是非常重要,非常经常的一些事情。经常很多的时候就是, 哎,这个里面有一个变量,那个里面又有一个变量,但是很多时候你你是完全不知道的,他可能报错了之后,他又去修修修修修修改改,然后把两个又又斗起来了。但是他很多一些技术债啊,很多发散的、离散的、漂移的,这种变量还是保留在那。如果你没有一个检测的脚本, 那么让大模型自己去发现,他其实是比较难发现的。嗯,第二个点就是他们的这个代码 不一定是符合人类的偏好的,因为我们人可能会想的是怎么样写出优美的代码,怎么样写的稍微简单一点,能用一些现成的库,我们就用直接用现成的库,但是对他们来讲不是这样的,只要能跑,你就不要管,不要管这么多,而且他会更加习惯去 自己实现一些稍微简单的一些库,没没必要去用一些这种现成的库,因为很多时候一些库他是要更新的,而且很多库他是比较新的,在模型的大脑里面是没有的,他如果能自己实现,你就不要管他,你就让他自己实现就行了。还有一个比较大的 点,也是我觉得很重要,为二重要吧,去吞吐量改变了合并的一个理念或者叫部署的一个理念, 就是由于现在的 ai 整体,他去编程或者说去修复问题,他是很简单很快的。那么你在合并或者说去暴露你的服务,公布你的部署你的服务的时候,你就没有必要像之前一样去做非常非常非常严格的检查。 当然当然这个风险敏感度大家要自己进行评勾评估。而现在要做的是你怎么样让这些报错能快速的反馈回来,这件事情非常重要。 我,我的一个解决方案就是在这个项目里面,我其实是让它一直活活跃着一个智能体的, 他不停的在分析这些用户的一些行为,当然我用的是非常便宜的一些模型啊,呃,甚至我我我我是采用的这个 fork 的 方式,呃,我会在这个用户聊天完了之后,我会 fork 一个分支出去,然后再发一条消息问一下 这个智能体他之之前我们沟通的时候是否有一些不好的点,然后我会把它整理成一个结论或者结果。呃,我觉得要做的一定是 一定是你要快速的拿到这些反馈和结果,而不是说你要让他做到尽善尽美,没有没有那个必要,你要拿到他们对话会画的一些结果,比如说主要的问题是否有研究价值,我现在唯一要做的就是把这个东西测试出来的这些问题,我会让, 嗯,这个智能体去分析一遍,我会把它所所有聊天记录拿到,拿到之后让智能体它自己去分析是否存在一些问题。比如说你的 skills, 比如说你的 skills 要沉淀一些经验,比如说你的 skills 的 脚本是否要改,比如说你的 skills 是 不是要新建一个新的 skills? 是 这样的, ok, 呃,这个就不继续看了。呃,再就是继续看一下这个项目, 然后智能体生成实际上意味着什么?就是产出就代表着所有的都是由他自己进行产出的,然后代码与测试。 ci 配置,我觉得这个 ci 配置非常重要啊。就是,呃,其实之前,呃如果是小的一些项目可能不需要做这种 ci 的 检查,但是 现在这种 web coding 你 必须要最开始的时候你就要定义好这种检查的这些规范,然后每一次呃去执行出来都要做一次检查。 以前可能需要非常大的项目他才会配置上这个东西。然后内部开发者的一些工具,比如说那个,呃, playwrite 啊,我是用的 playwrite 啊,他是使用的这个,呃,谷歌浏览器的那个开发者模式有一个工具,但是这个这个都差不多了,我用 playwrite 的 用着也 也还算可以的。我之前安装了那个谷歌浏览器的开发者模式的那个 two, 其实没有没有特别大的区别,我,我是这样感觉的。 然后就是不断提高的自主水平,当你全部实现了之后,新提出来一个任务的话,你可能就是一个 hook, 呃,我新提出来一个问题的话,你就是一个 hook, 把它发发给这些团队就可以了, 然后他自己就可以进行执行了,然后我们还是继续,时间也是非常紧了。然后我总结出来的一些经验吧,或者我觉得最重要的几个点。首先第一个点就是他的文件文档,这个文件夹,也就是我刚才给大家看的这个文件夹下面他是一本书, 树状结构的书,最容易发现的东西就是一些摘药并引用细节的这个具体的文档,越容易发现的就是越越是摘药的东西。然后 并且这个文件夹下面他一定是有互相引用的,不能有孤立的这种文档。孤立的文档其实没有特别大的价值,除非你这个孤立的文档,其实其实按理来说这些就不能有孤立的文档,你的 一定是有某一个这个引,所以是引用这个文件的,它一定是有个摘要的,哪怕它这个摘要非常简简单。 呃,还有就是文件的行数不要过多,如果过多的时候,另外一个文档引用的时候一定要标记具体的行号, 包括我的这个智能体这个 team 员工的时候,他下发任务的时候,他很多时候都是直接把具体的行号直接下发了的,要不然的话, 这个子智能体或者 team 呃的成员,他又得去全部读一遍,这样他的上下文也会消耗特别多,而且对之前的一些呃任务内容其实没有没有特别大的帮助,没有没有意义。 然后就是日制尽量要详细,日制一定详细,你把它记录下来,哎,模型它是不会去傻傻的全部读的,它自己会去用正则匹配去搜索的,所以说日制尽量详细,哪怕你就设置一个, 设置一个那个命令开关嘛。呃,你生产的时候你可以关掉,然后你调试的时候把日子尽量且详细,尽量把每一个命令,甚至呃这种模型的 point 都可以把它打印下来。 然后就是小众的一些库,如果工作量不是非常大的,就直接让 ai 自己实现,因为呃你如果需要引用一些 ai 自己完全不知道的库,你还得给它搞一个 skill 或者搞一个文档,它开发起来才不会有问题,要不然很容易就有问题。 然后就是呃不要聚焦于前端和这种尽善尽美。呃,我认为应该聚焦于这种功能的实现以及 coi 化,因为 只有 coi 化了之后它才能被 ai 所调用,那么你才能把它 skill 化,然后 skill 化了之后你才能进行调试和监控,以及呃呃,你怎么样开发起来,这样才能自动化?还有 ui 的 一些细节,细致末节是肯定要被淘汰的。 再就是模型的吐出率让现在的这种项目模式是转变了,一定是上线报错或者说反馈快速迭代, 但是唯一就是你需要收集反馈和优化的这个检测系统要要做的好一点,然后尽量让它存活在你的项目中,让它一直活着,让它自己能能自己做修改。当然你最开始可能是有你人, 但是你的,比如说你的接受率都达到百分之九十以上了,你就可以了,可能你每天 review 一下,或者这样就可以了。 再就是一个补充,呃,想要上下文不丢失文档,尽量做详细。我的那个代码里面我之前 review 了一下,大概是在 呃百分之三十左右的这个文档,但是可能有点多了。呃,但是我个人认为这个代码量和文档量的比例尽量也不要低于百分之二十以下,尽量让他多一点。 ok, 这也时间太长了。接下来就是我开源的这个 team skills, 就是 怎么样去创建这个 team 模式。呃 呃,很多人人用这个,呃这个,这个终端会效果会显示更好一点,但是我是 windows 的 习惯了,然后用这个 shift 上下切换,我觉得也是可以的,没没什么区别。 然后呃第二个点就是角色不是拆,拆的越细越好,要平衡。因为呃,之前 s o p k 他 们也发了一篇文章研究表示,呃,这个上下文它并 不是一定要用这个多多的模型或者多的角色或者多的子智能体去做拆分的,而是呃他一定是工程量或者说上下文可以分开的,你才可以拆分 你。你可以这样讲,如果你是一个智能体,你要做某一件事情,然后另外一个智能体,他要做做另外一件事情,这这两件事情你们之间如果沟通 几句话就能沟通,或者沟通一两次就可以搞定的,那么就可以拆。如果你们之间要协同合作来去完成这个任务,嗯,协同的非常多的话,那,那这个东西就不能拆, ok, 呃,但是也有一个特点啊,就是,呃,这他的这个文档里面其实也写了他的这个上下文, 嗯,这个陀刻消耗用 team 模式会非常多,但是我个人感觉他用 team 模式消耗的反而是比他用子智能体的方式要消耗的更少的,因为子智能体的方式,他每一个子智能体他都是重新去去激活,去拿上下文的,所以说, 呃,它的效果,反而这个托肯消耗会更高,而且,呃,而且它效果不是那么好,因为很多上下文是可以附用的。还有一个点就是用 team 模式的时候,它有一个特点,就是 leader, 它知道了它有这些团队角色了之后,它才会自己主动的去拆分 任务,如果它不知道,你只是一句话告诉它,它是不会主动拆分的。这就是一个潜在的问题。 很多人可能会误解,呃,为为什么这种 team 模式会更好?因为他会主动的去拆分模块,主动的去拆分工作,这个点非常重要,因为大家都知道,呃,我,我要做一个大的项目,要拆分模块,拆分什么什么东西,但是, 呃,你去 web coding 的 时候,往往他就你让他去完成这个任务,他是不会拆的,他是不会拆模块的,是这样的一个逻辑。 ok, 我 们也来再看一下我的这个开源项目,这个开源项目大家如果了解了之后,他可能 不是 cloud code, 它也能做,它也能运运行,因为很快应该 codex 啊这些,呃, open code 啊这些它应该都会支持,支持这种 team 模式。 呃,我们也是在开源一个 team 模式,这个 cloud code, 呃,和这个 codex 还有 gemini 这些,看能不能使用使用这种哦 群聊的方式来进行协助,因为群群他这个 t 模式其实就是一个群聊的方式,然后这个 leader 是 可以看到群聊的所有内容的,你也可以看到群聊的所有内容,你可以直接发消息, leader 也可以直接收到。然后但是员工,嗯,这些子智能体他就只能被艾特的时候才能看到,而且他们互相可以艾特,是大概是这样的一个逻辑, ok, 呃,我们首先来看一下这个项目吧,这个项目大家知道了之后,了解了之后,你们自己就不需要这个 skills, 然后并且想要用好,我 虽然他也可以直接用,但是想要用好的话,一定还是要读一下的,因为 team 的 这些成员啊,他的逻辑啊,这些工作流程啊,还是得自己去了解的。 然后这个 skills 是 一个比较标准的文档,然后有原数据,我这是 review, 呃,这 preview 啊, 呃,原数据可以看到原数据,然后下面就是具体的一些写法了,然后是这个是参考的一些文档,这个是脚本,这个脚本就是 ci 的 一些脚本,就是专门去检测你这个项目里面 的文件内容啊,这些有没有超过什么东西啊,然后命名名啊这些,但是这个也是属于一个模板吧,他不能不能是直接拿去用的, ok, 我 们来详细看一下。首先,呃,这个这个原数据就是什么时候应该触发,但是我是专门去提醒了他一下,要看这个 skills 的 时候必须要自己看,不能起一个子代理来看, 这这个很重要,要不然他用子代理来看,子代理去看一遍这个 skills 的 话,呃,他在告诉这个主智能体的时候,他是有信息损失的。而这里面你要想要做好一个 team 的 话,你这个是要让它全量读的,全量读它细节才知道它才能做好一个比较好的一个 team 的 配置, ok? 呃,为复杂项目是创建这样的一个 team 团队,首先第一个开始之前必须要直接读取所有的参考文件到上下文中,这个就是我刚才说的这个东西。然后流程,第一个流程是要检查你这个项目里面是否已经有了这样的一个 plan 的 文档, 而这个文档如果有了的话,他就不用继续去创建了,如果没有的话,他就会会去创建这样的一个文档,然后一会会给大家讲一下这个文档里面有哪些角色,角色下面应该是怎么样分布的?呃,首先第一第一个, 呃,应该是按照这个理来,如果存在就读取这个东西,然后获取之前已经有的的,用团队的一些角色定义以及这个项目的一些上下文 扫描,拿到了之后恢复这样的一个上页文。如果有,有之前有这样的 team, 如果你创建了之后是有一个 team 的 配置文件在的,它就可以不用详细的去看这些文档了,这样的话就能节约节约这个 talk 嘛, 然后它也会检查一下,如果这个 skills 它有有更新的话,它也会去更新这个 team 模式,它会去看。 然后第二第一步他就会去问你,你的目标和需求是什么?沟通,跟你对稍微对齐一下,然后给你介绍一下这个的方式是什么?你的团队的成员,然后分工,因为他一共是六个角色,你也可以不用,六个角色也可以,但是我觉得这六个角色不管你在开发什么的时候 都是可以使,都可以使用的,所以说都还是蛮必须的。当然你也可以去借鉴其他的一些。呃,角色,再把它加进来,这些都是可以的,其实都是很简单的,很灵活的。嗯, 是用什么场景?是用这种稍微比较大一点的项目,其实你改小需求用这个方式也很好了,因为,呃,你可以先让这个去解锁一下,去研究一下这个问题怎么样去修复,然后。呃,又可以开发,然后又测试,然后又审查这个东西我觉得不光是大项目,就是小小项目或者一些小 bug 都可以。 呃,我觉得这个,这个这个东西可以直接删掉,因为你只有这样做了之后,呃,你才能把你的文档一直维护着,要不然你不维护你的文档的话,后面就会有这种技术债啊,或者对不起的情况,一定要还是都都得做吧。 然后推荐的一个团队的配置。呃,一共是六六个子智能体,或者叫六个员工,一个是后端开发,前端开发,探索研究,还有代码的审查,一个管家。呃, 这个后端前后端开发就是使用的这种 t d d 的 模式,也就是最近比较火的这种子智能体的一个配置模式嘛。呃,这都是借鉴了一些一些项目的,可以看到。哎,之前这个是直接看 skills 了。呃,我还是觉得还是要 read me 给大家看一下。 呃,我们是借鉴了这个,嗯, plan with 这个 fails, 呃,它是一个文件的形式,但是这个文件的话,它只只有三个,但是我是让每一个,呃,这个子智能体它都有三个这样的文件, 而且每一个这个任务都有这样三个文件,虽然它的工程化会更多,但是我现在目前用起来的话,它效果会更好。因为你稍微大一点的项目,你如果只有这三个的话,它这个文件里面会非常大,非常的恐怖,所以说其实效果是不好的。 ok。 再就是这个 anything cloud code, 这个是黑客松,它的,它这个三个专家,十三个专家智能体是拿来做了借鉴的。还有这个这个 t、 d、 d 的 模式和这这两个结合起来去构建了这样 六个角色。再就是 harness, 再就是 esoteric 的 harness, 它这个 esoteric harness 跟 open code, open ai 的 harness 有 点呃不一样的,重点是在于 它这个更强调的是,呃,去去去,去审核之前的一些内容,审核之前的,呃,这个效果好不好?比如说前端呀?呃,还有就是它希希望的是这些角色 team team 员工和这个 leader 之间有沟通。 之前我是没有没有在其他地方看到这些员工,他会多次沟通对齐需求。不光我们人应该跟这个卡洛德对齐,他员工和这个 leader 之间下发任务的时候,他们也应该多次对齐沟通需求之后再去完成。这个也是一个比较重点,但是这个跟模型还是很大关系啊,我定义了之后,像卡洛德这些卡 洛德的模型效果都不太好,呃,我用用用 g、 p、 e 的 模型,反而效果会更好一点点,然后呃这个工作流程啊, 人搭建,搭建一个团队。呃,他了解了这样的一个内容,然后推荐几个智能体,然后创建这样的一个项目的文档文件,然后会把这些文件放进去,生成一个 cloud 点 m d 的 文件,这个也是弄好 然后就开始并行,其实是串行生成所有的智能体了,因为这个 team team 模式它是串行的,然后要把这些配置的一些内容全部放在一个文件夹下面,下一次的话可以附用。 再就是协助了,就是 leader 和你进行沟通,沟通了之后他通过这样的一个呃 message 去下发任务,首先去探索代码库,或者说去研究,然后出来了过程,呃出来了结果,然后会给这个 leader 看一下,看一下之后他会给出一个方案,方案可以跟你进行对齐沟通,然后他去下发这些任务, 最终完成了之后审查,审查了之后用这个端到端的测试,测试了之后再哎去做部署,或者进行这个管家的收尾。 ok, 下次回来的时候直接读取那个这个 md 的 文档,就可以直接复活之前的一些呃这种角色,并且这些角色他都会自己去看他的这个文档,他对应自己的文档,然后他就知道我应该具体从哪里继续完成,然后我应该具体完成这个任务应该放在哪, 然后实战的一些演示给当年刚才也给大家看了,安装这些都没有啥,这个你自己自己把这个 skills 直接复制,复制到那个,或者你直接把这个项目直接给 cloud code, 它自己去会去去告诉你怎么样去配置, ok, 呃,我看还有什么。呃具具体的还是得给大家讲一讲。呃具体的这几个角色, 然后推荐的原则,角色不是越多越好,这些就是一些原则,应该怎么样去配置这些角色,然后它会通过这些角色去给你推荐。当然我我是推荐大家,如果 token 不是 太紧张的情况下,全部把它加载也好,我觉得效果会更好一点哈。然后就是 非软件标配,呃,我我觉得它这个 team 模式不光是可以用用于这种代码开发, 还可以应用一些正常的,比如说自动化的工作流。我之前也是让他给出来了这样的一个去做了一个工作流,我直接让他读了一下这个 teamwork, 然后他自己首先他会根据这些原则新定义一些角色, 然后这些角色他就不是什么前后端的开发了,他可能就根据你的任务来自定义角色。这个东西我觉得还是非常重要的,而且非常实用的,这个东西他可以可以跨越的,他不不是只能用在这上面。 第二步就是跟你进行决确认,第三步就是创建这个规划文件,跟你确认了之后他叫创建规划文件,首先就是这个项目他应该叫什么?第二个就是呃, 他主智能体 leader 他的一些主计划,然后 found 这个团队级的汇总,然后进程工作日期,然后就是架构的一些描述决策,还有就是这个文档 系统的架构,前后端 api 的 定义,这个非常重要,就是 harness 那 个借鉴的一个东西,然后就是这个导航地图,因为这个导航地图不能全部写在 cloud 的 点 m d 文档里面的原因就是 它是要可以热更新,热加载的,所以说这个所以也是要要要要放在这,放在这种文档里面的,然后由这个管家进行维护,然后就是每一个, 嗯,规规党的历史啊,还有就是爱军的名字,名字下面就是他有自己的几个,呃,工作日期,这三个都是有的,并且每一个任务他下面都有三个, 然后这三个是指向这些任务的,而且是摘药的,所以说这三个就不会过于爆炸。如果说每一个这种角色都只有这三个的话,那么你完成大任务的时候,他就会这种每一个文件,所以说他必须要这种任务文件,这就是为什么要这样设计的一个原因。 然后完整的一个角色设计看见没有,这几乎每一个这个角色它都是有这样的一个内容的, ok, 深层 cloud 点 md, 这个就没有啥了。然后消耗 创建团队和整体,再就是确认加压缩上下文,这个为什么要压缩上下文啊?因为这个 skills 它是要全量去看的, 看了之后他会消耗掉。我,我看了一下大概,如果你之前有项目的话,大概会消耗掉一百 k 的 上下文,如果你完全没有,没有没有,没有之前的这个,呃,配置文件在的话,呃, 那么他是要消耗掉一百 k 的 上下文的,所以说如果新建的时候你完全建立好之后,你可以让他压缩一遍,然后避免你上下文里面有一百 k 的, 其实跟你后面的任务是没有关系的,所以说最后一步可以 压缩一下上下文,但是你已经建立了过后,它会有一个角色的点 m d 文档,你有那个文档来做构建的话,它就消耗不了什么上下文, ok? 呃,这就是一些规则了。然后 leader 的 一些运营指南其实也有些重复了。呃, 这个是 ci 的, 这个就不说了。然后这是文件的一些模板,然后呃 cloud 点 md 的 模板,然后主的这个 task plan 的 模板, find 的 这些模板,其实就是每一个文件应该要写什么? cloud 点 md 应该要写什么?首先要写这个,你这个 leader 它主要的工作内容是什么? 因为像 cloud code 啊,它有一个非常大的问题,就是它会忘记它是一个 leader, 它有团队成员。 然后你必须要提醒他一下,就算我写在这个点 md 文档里面,他都经常忘记。所以说,呃,你压缩了之后,最好要提醒他一下,你有哪些角色,你的任务是什么?你的任务是协调他们去完成任务,然后你再给他具体的任务,他可能会效果会好一点。然后下面的 那这个,呃 cloud 的 点 md, 我 估计都还要做一些优化,要不然上下文有点长。 嗯,但是这个,这个不是啊,这个不是 cloud 的 点 md 是 在这上面,但是 cloud 的 点 md 的 文档估计还是要优化的,因为 cloud 的 点 md 它不光是加载到了 leader 上下文,它还加载到了所有模型的上下文,所有子智能体的上下文的,所以说这个东西还是在还要做优化的。还有就是这这些东西了, 还有就是 plan 啊,主主的 plan 点 m d 的 内容,比如说项目名、状态、日期,更新,角色列表,然后一到几句,然后详细的产品定义,再引引导他的一个一个具体的详细文档,然后文档的缩影, 看这这些就没有没有什么了。然后这个是团队的角色参考,这些角色都是借鉴的这个,呃, everything cloud code, 它们里面的这种子智能体的一个提示词的设计方式,然后角色第一后端的开发, 他们都是用的这个 t d d 的 方式啊。 t d d, 大家可以可以搜一下,它就是先先写测试输入和输出,然后再按记,再一点一点的丰富里面的内容。还有这个 review 啊,这个研究者,还有这种 端到端的测试,然后 review, 端到端的测试用的 playwrite。 当然如果你用其他的这种网页控制工具也是可以的。这个是没有没有太大关系,大家也可以详细看一下这个角色定义啊。详,角色定义倒是没有特别特别详细的大,大家可以借鉴其他的一些角色定义,然后去补充这个 skills 也是 ok 的。 还有就是整体入职的一些。呃,模板,就是 prompt 模板,你可以可以可以进行它,它可以按照这个模板进行这个员工的角色的一些定义, 这个就没有什么了,就大概是这样录了整整一百分钟。嗯,总结一下。呃,这个, 呃,我,我开开源的这个 skills 自卖自夸一下,它效果还蛮不错的,就是我,我用着还是效果很好的。呃,而且基本上我我认为是赋现了这个 harness engineering, 嗯,他们提到的应该百分之六十到七十应该是完全赋现掉了,现在可能没有没有办法完全的自动化,但是, 呃,但是想要自动化,你其实就是加一些这种好呃 hock 的 钩子的脚本啊,其实没有没有特别大的问题,然后只要把它上线,上线了之后进行更新,多更新几次,然后验证一下他呃被人工接接受的一个比例就可以了。嗯, ok。 最后最后大家也是这个模型的问题,之前也跟大家讲过,我们有个中转站,但是,呃目前目前是账号,账号效账号还比较少,因为我们自己的好像都不太够用。呃,我最近也是在解决这个问题,大家也可以 呃,也也可以关注我一下吧,关注我一下,那可以可以到我主页去看一下,然后如果能解决的话也可以给大家公布一下,因为像现在的中转战非非常离谱,他们完全不不给你 kuv 的 命中率,或者说完全不给你考虑, kuv 其实用不了,你再便宜都用不了, 而且大概率都是比较贵的,像二十 x 现在能用的应该是在三千美金到五千美金一个月左右。所以说 其实现在的这种偷看的呃率啊,这些还挺高的,就是价格还是挺高的,不管是一比几的比例,他都都还是蛮高的,所以说这也是比较大的一个问题。行吧,那今天就到这。

好的观众们大家好,我是林克。 cloudco 作为全球知名的 web 扣领程序,应在一众程序如 cursor tree 中断层领先,成为大多数人的首选了。除了 cloud 本身的模型, cloudco 甚至可以接入其他各种模型的 api 进行使用,包括国产模型,极大地降低了使用 token 的 成本。 今天带来就是如何两分钟部署卡扣,而进阶的使用不在今天讨论范围内。而网络上的各种教程不是废话太多没有重点,就是遇到问题不说明,流程不清晰,所以今天我会带大家完整走一遍流程,零基础也可以流畅的部署完。 首先你需要自行保证网络环境,这些是你所有需要下载软件程序,所有问题我都会直接在流程中给出解决方案和解释,接下来就跟着我的流程走就行。 首先先进入这个网址下载 vscode 进行安装,这是一款可以下载各种插件编程软件,而 cloudcode 也有插件可以接入,比较好用,类似的 openai 的 codex 也是可以的。 然后第二个我们需要下载是 cc switch, 这是一款开源的 github 软件,它可以帮助我们快速切换 cloud wallet 的 模型,进入国产的 api 使用。然后我们需要就用这个网址下载 nojs, 这是使用 cloud wallet 的 依赖,然后安装界面的话一切默认就可以。 然后我们使用 npm 命令进行 cloud code 的 下载,要在终端这里开启,但是你会发现这会报错是因为我们的安全策略的关系,然后输入这串命令的话,就可以解除这个策略,进行正常的安装。然后在安装完之后,我们输入 cloud 空格 version 就 可以看到这个版本号,然后就知道我们是正常的安装好 cloud code 了, 但我们输入 cloud 之后它还会报错,是因为我们进入这个网址进行 get 下载,然后进行一些默认安装就可以了, 但我会发现在网络正常的情况下,第一次进入,从而会提示连接不上,这时我们就用 c 盘杠用户杠,你的用户名下面可以看到这 cloud 的 配置文件,像我屏幕上这样增加这个配置就可以跳过进行正常使用。 让我们可以在 vs code 插进市场这里下载中文的语言包,重启软件后就可以正常显示中文了。 然后我们在搜索 cloud com 就 可以下载 cloud com 插件,然后在别的口里面进行使用,下载完之后记得在左下角设置这里,像我一样把这个登录给跳过掉,因为我们主要是进行 api 使用,而不是用 cloud 的 官方账号使用, 如果需要用到 cloud 官方符法,可以登录账号。然后在 ccs 位置里配置 api 后,我们就看到模型是可以正常使用了。那么今天视频就到这里,我是林可,喜欢的话可以支持一下,点赞订阅,那么我们下期再见。

家人们还在到处找克劳德扣的教程吗?其实真没这个必要,因为克劳德自己就内置了一套很权威的学习方式,就是这个庞安 up。 官网写的很清楚,每个指令都会教你一个大多数人容易忽略的扣扣功能,打开一个,读一遍,试一遍,再标记完成。这里一共有十个庞安 up, 每一个都不是概念,而是能立刻上手的具体能力。第一个,与你的代码库对话,输入 s 就 能附加文件,让克劳德在回答前先读你的代码,还能用文件名加行号精确定位,甚至直接附加整个目录。第二个, 切换可我的工作模式,按 shift 加 type 键模式,决定他是先问你还是直接动手,可按只做分析不改代码,我透则让可我的自己判断如何执行。第三个,随时回退一切操作, 双击 s, 打开 a y, 可以 回到任意一次修改前的状态,不只是代码,连对话路径都可以一起回退重来。第四个,让任务在后台运行,命令后加就能后台执行, 你可以继续对话,不被打断。用 test 查看进度, code 还能自动根据结果继续处理。第五个,让 code 记住你的规则,把规范写进 code md, 它每次启动都会自动读取代码风格、测试方式、 限制目录都可以统一约束。第六个,扩展 ko 的 工具能力,通过马克接入 side 数据库、浏览器等外部系统连接后,你只需要一句话,它就能直接调用这些工具。 第七个,自动化你的工作流程,把常用流程写成册,一条命令就能执行整套操作,可此还能在关键节点自动触发脚本,实现真正自动化。第八个,随时随地操作代码, 用微软 control, 可以 在手机或网页远程控制当前绘画,甚至用开了帕尔塔别的设备上的绘画直接迁移过来。 第九个,让多个客劳德同时工作,通过撒贝间并行处理任务,一个人变成一个团队,还可以定义不同角色的 agent, 各自负责不同工作。最后一个,调节模型与思考深度, 用 mark 切模型,用 f o t 控制他思考的时间和深度。复杂问题用高强度简单任务,用快速模式就够了。所以 p o r o p 真正厉害的地方不是给你十个命令,而是把克劳德抠的核心能力变成一套官方学习路径。