粉丝21获赞150

今天分享两个孩子自学 ai 用的网站,国内可用,而且完全免费。第一个是全球顶级的 ai 教育网站 code 点 og 推出的公益活动,让孩子每天玩一个小时就能学会 ai 的 原理。 进去之后最下面可以更改为简体中文,不同年龄的孩子有不同的课程,课程内容丰富有趣,而且部分有演示视频。第二个是 view to ai, 这个是国内 ai 大 佬们汇集的圈子,完全公开免费 知识库里面从提示词到 ai 绘画、智能题等内容的教程都应有尽有。缺点是内容太繁杂,没有具体的学习路径,更适合喜欢自己钻研研究的孩子。不知道怎么开始的可以参考我下面给出的路径。还有问题评论区留言。

看,这个是写成程序了啊?这个是 python 标志,这个是它的用户页面啊,然后你点这个开始上架,可以选直接发布还是不直接发布?咱们就先不直接发布,就用你们自己的配置啊。开始上架 后台就已经开始自动操作了,看到了吧?中行笔 上传图,这图片你们没给我,我就自己生成了 属性。

这是一条 web coding 纯小白入门的保姆级教程,让你从一个什么都不懂的小菜鸡,完成属于你自己的第一个 web coding 作品。 我会基于我这几年 ai 编程的实战经验,用最简单的大白话把整个过程完整演示一遍,没有专业术语,不留任何卡点,确保你跟着做一定能学会,无需魔法,全程干货。 首先我们要用到三个工具, cloud code、 c c switch 和 deepsea。 你 可以这样理解, cloud code 就是 你的 ai 编程,员工听你发号施令。 deepsea 是 员工的脑子,负责思考、推理和生成代码,而 c c switch 就是 让它装上这个脑子,正式入职。 是的,兄弟,你是老板,我们先打开 deepsea 的 开发者后台。为什么推荐它呢?因为它是目前为止国产 ai 大 模型里面性价比最高的,且真的能干活的东西。信我啊,我最近用它做了很多事情, 洋人 ai 不 敢做的东西,比如这种整理题材异动的,他能帮我做。洋人 ai 做不到的东西,比如中文语境的改文案,写小说,他更是断档。第一关键是便宜,真他妈便宜, 用了快一个月了,一点五亿的 token, 十几块一杯奶茶钱,所以普通人充十块钱就可以用很久很久。然后进入这里创建一个你的 api key, 随便取一个名字,比如测试它只显示一次,复制后要妥善保存,并且不要泄露给别人。然后到下面的接口文档选择接入 a 帧的工具。这里就有关于 gala code 的 安装教程, 非常非常简单,一行指令就能搞定。比如你用的 windows 电脑,按下键盘的 win 加 r 键,输入 c m d, 回车会弹出一个命令行窗口,复制这行命令,按下鼠标右键,直接粘贴回车就可以了。 然后你再输入 cloud version, 返回版本号,就说明安装成功了。文档下面关于配置环境变量的步骤。对小白不太友好,所以要用 cc switch 这个工具一键搞定。 这个就是它的开源仓库,如果你没有魔法,也可以飞鸽工具箱。是的,这个整个网站也都是 web coding 做的。打开之后选这个命令行版本的 cloud 图标,点击添加,找到 deepsea, 把你刚才申请的 a p i k 填好。最新版的 city switch 呢,已经把模型名配置好了, 这里建议勾选一百万的上下文,然后添加保存点,这里可以测试,确认成功就行了。现在你可以重新打开一个命令行窗口,输入 cloud 回车。第一次配置呢,需要你选风格默认就好了。然后是确认授权管理这个项目,这里会显示用的是 deepsea v 四 pro 的 模型,你也可以问他一句,靓仔,你用的是什么模型? 看到他的回话了吧,恭喜你,你已经给你的 ai 员工装上了 deepsea 的 脑子。现在我们就可以愉快地 web coding 了。 我们先创建一个文件夹,也叫项目,相当于给你的员工一个临时工位。这里更好的用法是你可以在这个文件夹的路径框选中一下,再输入 cmd 回车。这就相当于你在这个项目下启动了 cloud code。 然后你输入 cloud, 开始写任务要求。比如我们这次演示开发一个个人薄客的网站。作为新手小白,你可以参考这个五步模板,明确身份。我是谁?我是新手,你不要默认我懂技术,明确目标,我要做什么东西?明确功能,这个东西要有什么功能?明确复杂度, 你别搞得太复杂,避免 ai 呢,把很简单的东西复杂化。最后就是明确流程,先整理需求,再写代码,这样能有效减少返工,省拖延,省精力。比如你可以参考这一张截图, 这里呢,我提一个间接技巧,如果后期你的项目变复杂了,就可以让 ai 帮你创建一个 cloud 点 m d 文件,你可以把它理解成写给员工看的工作说明书,就是员工手册。以后他每次进到这个项目都会先看这个文件,知道他是干什么的,用的什么技术,有什么规则,让开发更加高效。指令可以这么写啊,你也可以截图一下, 给到上面的新手提示词。之后呢,他会帮我们梳理需求,很多你没想到的,他就能帮你去丰富和完善。确定好了之后,就可以让他写代码了。 等到他跑完之后呢,我们就可以看到第一版,按照要求呢,他给了我们一个网页文件,我们双击就可以打开,能看到这个界面,做的还是挺不错的。如果哪里有需要优化的地方,你可以继续像聊天一样,告诉他哪里需要改,改成什么样的,直到你满意为止。 好了,到这里你就已经入门了。很多人不是不想尝试,其实就是被这种看似很复杂,但其实非常简单的门槛给拦住了。 我们这个演示全程都没有用到任何魔法墙,你用自己家里的电脑和网络就可以搞定了。后边你有任何的想法,想做哪种提高你工作效率的软件工具,都可以举一反三,让 ai 帮你做到,甚至是可以思维再打开, 不让它开发软件,而是帮你实时解决电脑上的问题。比如设置定时关机,清理大文件,给他文案,让他改写总结,电脑缺组建,让他帮你修好等等,都是可以搞定的。 如果大家感兴趣,我也会在后期慢慢多出一些硬核的干货视频,站在小白的角度上,多讲一些间接学习的思路和技巧。 ai agent 是 时代的潮流,我的好兄弟,不要掉队。

今天的话我们来详细讲解 cloud code 它底层的源代码,然后这节课的话,我们会通过详细的讲解 cloud code 它源代码是怎么被开发出来的,普通人怎么样去二次开发 cloud code, 以及 cloud code 所有的底层技术原理是怎么样规划开发出来的,那么以及教会大家用 ai 编程怎么样去一步一步开发出自己想要的 cloud code, 或者是呃基于这个 cloud 去做其他的一些事情。 那么我们继续讲解 aspapi 在 二零二六年发布的这一个重点的这一个报告,就是人工智能辅助如何影响编程的技能这些, 那么这里的话就是存在一个效率的这个微局。首先的话就是我们会发现, 那么在推进这个企业或者一人公司 ai 转型或者 ai 诞生的时候,很多高管和 hr 部门陷入了一种狂热,只要给所有的员工配备好这个 ai 的 助手,公司的效率就一定能够瞬间翻倍,人力的成本也能够大幅度削减削减。而但是这一个 asp 它 做了大量的这个研究发现,比如基于这个软件工程师进行深度的研究之后,发现接受了一个致命的权衡,就是过度的依赖会 摧毁你公司的未来的这个人才梯队。那么这里的话其实重点就是说这是一个非常具有前瞻性的这个研究,就是精准的如何转化成我们内部使用 ai, ai 的 培训工具的裁买人才架构的这个建立这些首先的话就是 我们从低信原理来来看待的话,就是说要区分这个产能释放和技能降级,那么传统的妙物就是认为 ai 帮员工把代码写了报告出了,这就是绝对的好事情。 但其实的话, srb 官方他的这个数据就是在测试这个掌握度和使用这个 ai 辅助的级别,他的得分比纯手写低 这一个组低了百分之十七,然后相当于就是成绩的这个下降低了整整两个等级。最可怕的话就是这一个调调试的这个 bug 环节,由于员工没有亲身经历这个卡壳和试错,所以他们识别和诊断代码的错误能力大幅度下降。 那么在这里的解法就是要建立这一个 ai 使用白名单和黑名单。企业必须要明白, ai 可以 极大地加加速这个成熟的技能员工以及能够懂得领域的这个生产力,但极有可能会阻碍这个新技能的习得。 落地的这一个动作就是对于资深的架构师,鼓励他们用 cloud code 自动化的去执行这个繁琐的日常工作。但对于这个新入职的管理培训生和这一个 初级的这个研发人员,必须要限制其在特定的核心模块使用 ai 直接生成最终的代码,强制要求他们用原生的方式去理解底层的逻辑,就算要做的话,也是他们配合 ai 一 步一步自己要进行实操和操作。 其次的话就是这一个企业的实战落地,打造高分的这一个 ai 交互模式。如果不能够阻止员工使用 ai, 那 么企业必须要教导这个员工如何正确的与 ai 进行互动。 报告通过这个录屏分析,找出了这一个高分和这个低分的两级交互模式,这也是企业的 ai 员工培训手册最佳的蓝本,那么我们要坚决地抵制这个低分的模式, 严禁在企业内部的蔓延,比如说 ai 的 这个伪派,直接把这个需求扔给 ai, ai 生成什么代码就用什么代码,完全不看这是生产石山的这个代码和未来灾难的这一个源泉。 第二部分的话就是这一个迭代, ai 调试出了报错,不是自己去想为什么,而是直接 a log, 把这个 a log 复制给这个 ai 求解决,这会导致员工彻底的丧失排障的这个能力。 那么我们要做的一件事情就是在我们企业的内部要去做好,就是相关的这一个培训,要培训全员推广高得分的模式。在培训过程中我们要必须要强制要求我们员工采取三种模式。第一个的话就是概念的探求,遇到不懂的库技术,或者是 哪怕是一些词汇,不要问这个 ai 怎么写代码,而是问 ai 这个库的核心原理是什么, 靠自己去提升的理解去完成任务,这是速度和得分都最高的一个最佳模式,就是你要懂知其然,并且要知其所以然,你不要让他直接基于这个库去写代码,而是让你自己先懂这一个 库的核心的原理。第二点的话就是生成后理解,要允许 ai 生成代码,在复制到这个项目之前,必须要向 ai 追加提问,请给我解释这段代码用到了某某模式。 第三点的话就是混合代码的解释,那么在最初的这个 prompt 里面就写死这个规矩,给我生成代码,并且在代码下方逐行的解释,你为什么要这样这么设计? 那么组织架构的这个重塑就是要防范这个开门人的危机。报告里面其实提出了一个极其敏感的这个宏观问题,就是如果代码越来越自动化,人类最终的这个角色就会变成这个监督者。 但是如果这一个初级的工程师因为过度的依赖 ai 而没有积累扎实的底层的技能,未来谁来监督那些在极高风险环境下面运行的由 ai 写的这个百万的行的这个代码? 企业落地的这一个职责的话,其实就是要做好这一个, 比如说采用这种设计反脆弱性的这个人才培培训体系,开启这一个学习模式,强制这一个企业版的 ai 工具在内部培训或者试用期员工的这个机器上,然后开启这个学习模式和解释模式。 对,这个很重要,就是你要企业版的这个 ai 工具,你要设置好学习模式和这个解释模式,系统会拒绝直接给出标准答案,而是像苏格拉底式的一样的去引导员工自己去进行推理 推导,那么刻意的制造这个困难。在内部的这个晋升考核里面必须要引入这个断网断 ai 纯手工提 bug 环节,确保那些即将负责审核 ai 的 代码的高级的人员 依然能够保持敏捷的这个代码直觉和这个调试能力。这里的这个互动演示,就是比如说我们企业的这个人才技能培养和 ai 短期的这个沙盘,那么我们的 hr 负责人和技术总监要证明我为什么我们不能放任 ai 当员工的拐杖,而是要把 ai 当做健身的器材,这就是我们可以用这个定制沙沙盘。第一个的话就是 ai 的 拐杖效应的话, 我们会发现就是如果 ai 只当拐杖的话,那么它会处在一个智力降级的风险中,整个企业都会处在一个智力降级,员工会呢,虽然会在短期内复制 ai 的 代码提升这个速度, 但是它最底层的逻辑一窍不通,一旦进入到这个线上排障的环节阶段的话,那么团队将会面临彻底的瘫痪,交付的速度和 debug 存活率以及核心的技能掌握度以及系统的风险都会非常的高。第二点的话就是这一个, 这一个当导师当,如果 ai 当做导师的话,那么虽然前期的这个交付会存在这个认知磨合期,但是员工会在这一个通过 ai 导师 构建真正的这个底层的模型。长期来看的话,这种快慢就是快的这一个策略确保了这个技术底座的极端的稳健。那么苏格拉底士的这个提问帮助这一个工程师和员工进行深度的这个学习, 那么它的交货速度也有保障,然后 debug 这个存活率也有保证,同时它的核心技能掌控率也比较高,系统风险是受控的。 那日常开发的这个阶段的话,当拐杖的时候它会也有,比如说它的这个交付速度的确非常快,但是 debug 存活率可能会比较低,同时的话,它的这个核心技能掌握的话,以及这个系统风险的话,它其实会 降低我们用户的这个认知和他努力的程度。那么基于这份报告的话,其实我们重点想告诉的就是,我们要 保证就是这个企业他的这个认知努力和陷陷入困境,以及这一个对于培养精通的这个能力可能会更为重要。在帮助我们企业进行 ai 转型的时候,我们必须要向决策者传递一个核心的观点,就是真正的 ai 转型不是消灭一切工作中的痛苦和摩擦, 相反的话是为了保持组织的韧性,我们甚至需要刻意的去设计一些困难的环节,不要让这一个 ai 剥夺了人类思考的权力,利用这一个 ai 加速常规的事物, 把这一个需要深度思考的,需要磨练团队的核心竞争力的这些硬骨头留给人类,这才是让人类在这一个智能革命中永不掉队的这一个终极的策略。

我找到了一个免费使用 cloud code 的 办法,不需要购买模型,厂商的 coding plan 也可以使用。今天分享给大家,我刚刚成功领取到了小米赠送的 talking 余额,够用一段时间了。看完这个视频,你也可以领取并接入到 cloud code 之中。 这个就是小米推出的创造者百亿 token 激励计划。链接我已放入评论区,只需要五步就可以免费申请领取。首先我们点击立即申请前三项,按照我们的实际情况进行,填写 你的邮箱常用的开发工具。然后目前使用的底层模型。第四项和第五项是需要我们重点填写的。第四项,我们可以将我们的日常项目进行包装,利用 ai 进行润色描述, agent 或者 ai 驱动的具体成果 写的越丰富,通过率也就越高。第五项,可以上传我们 ai 平台的账单截图,还有终端运行日记等, 这个最多支持五个文件,可以上传图片或者是录屏都可以。在最后可以覆盖我们 github 的 演示地址。 点击提交,系统会在三个工作日内提交评估结果,之后会收到这样的一个小米 miimo 创造者激励计划。然后我们在这里点击开放平台地址, 我们点击控制台,这样平台送给我们的余额已经到账。我们选择 api case, 新建 api case, 填写 api k 名称,选择比较好记忆的名称,点击确认即可,这时会弹出一个 k, 它只会显示一次,我们要把它提前复制好。接下来我们使用 cc switch, 我们在添加中添加新供应商。以下是 cloud 供应商,我们选择小米米某。需要注意的是,供应商名称官网链接已经填写就绪,我们只需要在这里粘贴我们刚才复制好的 api k 即可。 我们要注意是否请求地址与以上保持一致。还要注意的是目前主流模型有 v 二 pro, 如果想体验小米最新模型,我们可以把这里换成 v 二点五 pro, 点击添加, 这样即可生成。我们点击旁边的这个按钮,点击起用。我们在终端输入 cloud, 这样我们就会发现 mini v 二 pro 已经被我们正常使用了。以上就是全部内容,如果有什么问题,我们可以在评论区沟通,我们下集再见。

好,这节课我们讲 cloud code 能做的两件事,规划和思考。它们其实很不一样。思考是让 cloud code 先想方案,再写代码。规划是让 cloud 自己整理行动计划,说明他打算怎么实现功能,并让你批准。 那我们先从规划开始。上。节课结尾你可能已经看过一点,当时我们用 alt 加 m 切换下面的自动编辑选项,按一次 alt 加 m 会开启接受编辑,按两次就进入规划模式。 规划模式适合那种会改很多文件的任务,但每个改动本身不一定很复杂, 也可能复杂,但通常不一定,不过这些改动的范围可能很大。有了计划, cloud code 更容易保持方向,并按顺序完成每个任务。那我们保持规划模式开启,然后让他做这个。 你能做一个自定义头像组建吗?不要图片,只用首字母,并找出项目里能替换的头像模板。我按回车看看。 首先他在分析代码库,看看头像组建哪里能用。他在搜索,也在读取不同文件,未完待续。好,现在他已经在这里给出了计。 我们滚到顶部,可以看到它发现了类似头像的实现。在博克系统的几个地方,比如博克卡片和最近活动里还有侧边栏,它检测到了它建议用头像组建位置。对 ui 下的 avatar avatar x, 它会做基于首字母的头像,也就是取名字第一个字母,支持多种尺寸,颜色变体样式也统一。它基本沿用了按钮组建的模式。这点不错。 实施计划里,他会先创建头像组建,然后替换博克卡片里现有的头像代码,而且还明确写了会在哪些地方替我们修改。 接着他说会处理博克侧边栏,还会把头像加到单篇博克页面里,也就是博克详情页。然后创建一个测试文件,他会沿用现有按钮测试的模式,这样头像组建也能测试。然后在顶部导航里加一个头像预览链接, 你可以直接接受这个计划,也可以接受计划,但继续手动批准。每次编辑或者拒绝继续规划,并给计划反馈让它调整。我会选上面的第一个,也就是同意并自动接受编辑。 它想运行 npm run test, 我会选第二个同意,并且以后 mpm run test 不 再询问我。这么做之后,它应该会自动写进这里的 settings local 文件,可以看到确实写进去了,很好。 好。这次它想链接这个文件,我还是选下面的第二个选项 好。最后看起来已经完成了。他创建的计划里所有项目都已经勾选完成,所有测试也都通过了。我们关掉这里,再看这边,应该能看到新的 avatar 文件夹。好,他其实给头像创建了一个完整页面, 也许计划里有写,只是我没完全看明白。我以为他只是会加到阅览页里,但 ai 有 时会跑偏,比如 code, copilot 等, 所以让它保持方向很重要。不过对这个任务来说,其实问题不大,反正只是预览。我之后可以删掉这个页面,但你可以看到下面有这个组建文件夹。 avatar 里面有测试文件,也有头像组建本身这里默认尺寸设成了 medium, 变体是 gradient, 但上面 props 里也有不同尺寸和不同变体选项。这里有尺寸类,变体类,下面就是头像本身, 好看看浏览器能不能用。可以看到它加了头像页和顶部链接,有点太积极了。现在看下面,可以看到所有不同的变体,不同尺寸,甚至还有下面这些使用场景,我觉得这些整体都挺不错。它创建了组建,也展示了不同用法。 现在如果我去网站的博客部分,你可以看到这里已经在用这个头像了,最近活动里面也在用。如果我点开某篇博客,比如这一篇,也能在详情页看到头像。 他唯一做了我不想要的事,就是把头像链接放到上面,还创建了完整头像页面。但我在 coolmd 文件里写过,它们应该放到预览文件里。 可能是我说的不够具体,也可能是我看计划太快了,我也不确定。不过这个很好修,我直接删掉这些页面就行,没问题。所以我刚告诉 colo 删除头像页面,改成把所有势力放进预览页, 他应该已经做完了,这样就好。我还更新了 colo md 文件,在底部加了更具体的说明, 说创建新页面组建时一定要在顶部导航加链接, ui 组建也这样。我补了这句,只处理页面组建,别处理 ui 或组建。所以这也说明写指令时必须说清楚你想让 cloud code 做什么 好,这样效果应该不错。我觉得开启规划模式确实帮 cloud code 正确完成了任务。当然,不开规划模式它也可能完成,但开启之后我发现对范围更大的任务,它更容易保持方向。 这次任务范围不算特别大,但也包括创建、组建、测试组建、寻找可用位置、编辑这些文件等等。 总之,现在我们来看思考模式。当你想让 cloud code 处理更复杂的逻辑时,思考模式很有用。它不一定像规划模式那样范围很大,可能范围很小,但逻辑更复杂。 比如,我可能想给博客加个评论系统,让用户能在文章下留言,这里面可能还要想清楚具体该怎么实现,要不要用认证服务,用哪一种,需要做哪些 react 取促建,可能还要新增哪些页面,实时更新怎么办?整体结构又怎么和应用配合?好 像这种任务你就可以开启扩展思考模式,不过它会消耗更多 token, 但它能让模型多推理、多思考,找到真正可行的完成方式。说实话,让 ai 实现一整套系统,就有点进入氛围编程了。我个人会把它拆成更小的任务,再用 cloud code 一个个处理, 这样我就能更容易引导 ai 按我想要的方式来做。但为了这节课,也为了演示思考模式,我们就用这个例子。我先把这段提示词粘贴进来,内容是给应用实现评论系统,让用户能登录并在薄客文章下评论, 认真思考。实现方式包括数据库结构认证、服务审核和实时更新。 我也会继续开着规划模式,这样能看到 cloud code 做出的计划。现在我在提示词里用了 think 这个词来触发思考模式,只要 cloud code 在 提示词里看到这个词,就会使用扩展思考模式。那我现在按回车,看看 cloud code 会怎么做 好。现在灰色这部分已经能看到它在思考过程,因为用了 think 关键词,我们就开启了这个思考模式。 好,现在它已经生成了一个计划。这确实花了更久一点,因为 cloud code 刚才在思考,这就是它的计划,内容相当完整,里面包含很多步骤。好,上面这些浅灰色的内容都是 cloud 的 思考过程, 它前面还会加上一个标识,就是这里这个 thinking 文本,它一思考就能看到。好在想,所以它确实会想很多。接下来我不会真的执行这些修改,因为那会儿让我的项目现在发生很大变化,而且我还得配置一些外部服务。另外,我通常也不会让 ai 完全放开手做这种任务, 我不知道他会朝哪个方向做下去,相反,我会把他拆成有逻辑的步骤,也许就按计划里的这些检查点一个一个来处理,这样我就能一直参与其中,每一步都手动检查代码,需要的时候再自己做调整, 一次性全做完,有时候后面会更难维护。我发现很快你就会脱离过程,被带进那种彻底的氛围。编程体验只是不停让 cloud 修所有问题,然后完全不看代码,所以我现在不会继续做这个。但在视频结束前,我想很快提一下, cloud code 其实有不同等级的思考模式可以开启。 刚才的例子里,我说的是 think hard, 但你也可以只说 think, 这样会触发较少量的思考和推理。 同样,你也可以反过来说 think harder, 这样思考强度会更高。如果你想拉满,还可以让 cloud ultra sync 开启最强思考模式。 但还是要记住,思考会消耗更多 token, 你 让 cloud code 想得越深,用掉的 token 就 越多。好了,现在我们了解了一点规划和思考,下一节来讲命令。

我用 cloud code 跑通了视频自动剪辑,给大家实操展示一下,现在的 cloud code 太牛了,我深度使用了一个半月了,它能解决电脑上百分之九十的事情,我养过小龙虾一阵子,那 open clock 就是 个智障儿童。 这个剪辑软件已经开源了免费软件,我放在了评论区,给大家看一下。剪辑过程简直是自媒体的福音,从此不用再吭哧吭哧花时间剪视频了,开始实操。 运行了这个免费的开源工具以后,他开始帮我解析视频,看到我的视频有十二秒我的视频一个内容的结构,这是我拍的一个口播的数字人,他分析完我的视频以后,因为我全程没有口气词, 嗯,十秒一进到底,语速偏快但清晰,所以他给出了一个建议,方向,加字幕调色,加动画叠层,想问我往哪个方向走。接下来他就自动开始写脚本,写代码,我全程没有操作。 然后他开始生成三个动画,进行一个渲染,现在到了渲染环节,这是最终的一个产物,这是最终的视频,我们拉到最下面啊,直接直接丢出来了一个这个视频,结果牛不牛?现在 ai 太牛了,卡的酷的,赶紧用起来,点个关注,谢谢!

我的 cloud code 开始干活了,今天要写一部小说穿越剧。呃,目前看还是比较符合预期的。 呃。目前已经写了约十万字。呃。三卷都已经完成。 这是左边的,右边呢。我计划用这个 skill 组件来进行审核,审查 他的写作的能力有没有什么漏洞缺陷。呃,基本上是这样,目前看还是比较好的。

obscene 加 cloud code 知识库搭建好了之后,它就是一套内容产出自动化的流水线。现在它可以帮我写公众号,做小红书,整理口播文案管理。一个人在干一个团队的活儿。之前我在去用 ai 的 时候,即便是你给他固化了题 是词,有了智能体,但是它的记忆你需要随时去更新你的资料,在各个智能体之间,它们是没有关联的。 upcity 知识库不一样,它是在你的电脑本地,你在启用你的 cloud code ai 之后,它会自动读取你所有的文件内容,懂你的执行规则,自动阅读你所有的 skills。 只需要跟他说一句,从 哪个选题库当中去写一条口播文案,它就能够分分钟整理好。我只需要自己改动一下,然后再发布,就可以适配于各个平台的发布方式、写作方式。前期你把 skills 固定好,它都可以同步去完成 知识库的整个结构的全貌。就是这样的一个格式化的文件夹,也就是我桌面上的文件夹,现在是一个呈现出来的状态,右面是我的 c c 的 操作界面,你去用哪个文件的时候就直接拖过来。我上个星期把我所有的体检记录全部都整理了一下,放在这个知识库当中了,让 ai 去给我做分析, 这个适配度真的让我惊了。 ai 时代,数据非常重要,不管对于企业还是对个人都是这样的。你过往的所有的经历,比如说我公众号,或者我以前特别爱写日记,我把这些东西都投递给他,我认为是一些无用的东西, 但是他可以从我过往经历当中去抽出来很多我自己都没有意识到事情。比如说我问他一个问题,通过我这些行为模式或者我的情绪各种反应来讲,你去跟我说一下有什么东西 是我自己没有意识到,但是你提出来之后对我的生活改变将会巨大的一个点。他提出来之后好神奇啊,你所有的数据都放到这个知识库当中,怎么去放入 ai 的 插件?我上一条视频也有说过,真的强烈建议每个人都去搭建好自己的知识库。

今天我用 curl code 帮我做一个中等以上需求的一个需求说明书,考虑到 curl 的 像大模型都是一个注意力机制的这么一个大模型,那我可能我的第一步就是在 tst 里边先把整个需求的背景,包括需求的功能点,包括让它呃要设计的一个注意注意要点,然后包括我对这个需求的整体的一个理解,把它呃列举成一二三。然后我在 tst 文档里边 梳理一下整个需求,然后就让 clark called 帮我做做一个详细的设设计说明书,然后他做完做完出来之后,他给我设计的相关的表结构,然后接口说明文档,包括还有时序图,包括还有那个注意事项,甚至还有一些测试的案例。 那设计完了之后,我就会对整个文档做了一个呃快速的呃浏览之后发现它里边其实还有一些设计的点比比较粗,比如说有一些定时任务,它可能是就默认了就每五分钟执行一次,但是它和实际的那个 呃时间是有冲突的。比如说我定时计划是一个随机的九点十三分来执行一个任务,如果他每五分钟来执行一次的话,他在极端情况之下,他可能会在九点十七分才会执行到我九点十三分的一个任务,那在这种情况之下就会造成那个任务的延时, 所以我就让他,我说,我就让他呃做任务的一个前置,然后再呃单独再做一个派发的任务,那就显显著的降低了这个任务的 呃时效性。然后在关于这个 clock code 帮我设计的需求说明书,他也是不断地在从事啊,不断地在迭代,然后最终把这个设设计说明书呃给出出来 啊,最终呢,有一点就是因为它设计说说明书里边本来我已经配置了很多的呃本,本来我已经配置了基本的 clock code 点 m d, 包括 enigma 点 m d。 在 这个不断的对话的过程中,因为这个需求的文档在不断的迭代,也触发了它好几次的那个压缩机制。 所以我觉得就是有一个技巧,就是当你把那个设计说明书如果说多次绘画呃到一定程度的时候,可以执行一下杠 clear 来,嗯,把那个上下文给清空一下,然后再基于它现在生成的那个文档来继续来生对文档进行处理,这样可能 呃让这个自然理更聪明,不会让它产生幻觉。呃,我从这个计划说明书的这个实践过程中,我觉得 clockcode 呃做设计说明,然后再让 呃,比如说 ctrl 或者是去来编编辑代码会更加的呃快速和有效。你们觉得呢?欢迎评论留言。

今天的话我们来详细讲解 cloud code 它底层的源代码,然后这节课的话,我们会通过详细的讲解 cloud code 它源代码是怎么被开发出来的,普通人怎么样去二次开发 cloud code, 以及 cloud code 所有的底层技术原理是怎么样规划开发出来的,那么以及教会大家用 ai 编程怎么样去一步一步开发出自己想要的 cloud code, 或者是呃基于这个 cloud 去做其他的一些事情。 那么我们继续讲解 aspapi 在 二零二六年发布的这一个重点的这一个报告,就是人工智能辅助如何影响编程的技能这些, 那么这里的话就是存在一个效率的这个微局。首先的话就是我们会发现, 那么在推进这个企业或者一人公司 ai 转型或者 ai 诞生的时候,很多高管和 hr 部门陷入了一种狂热,只要给所有的员工配备好这个 ai 的 助手,公司的效率就一定能够瞬间翻倍,人力的成本也能够大幅度削减削减。而但是这一个 asp 它 做了大量的这个研究发现,比如基于这个软件工程师进行深度的研究之后,发现接受了一个致命的权衡,就是过度的依赖会 摧毁你公司的未来的这个人才梯队。那么这里的话其实重点就是说这是一个非常具有前瞻性的这个研究,就是精准的如何转化成我们内部使用 ai, ai 的 培训工具的裁买人才架构的这个建立这些首先的话就是 我们从低信原理来来看待的话,就是说要区分这个产能释放和技能降级,那么传统的妙物就是认为 ai 帮员工把代码写了报告出了,这就是绝对的好事情。 但其实的话, srb 官方他的这个数据就是在测试这个掌握度和使用这个 ai 辅助的级别,他的得分比纯手写低 这一个组低了百分之十七,然后相当于就是成绩的这个下降低了整整两个等级。最可怕的话就是这一个调调试的这个 bug 环节,由于员工没有亲身经历这个卡壳和试错,所以他们识别和诊断代码的错误能力大幅度下降。 那么在这里的解法就是要建立这一个 ai 使用白名单和黑名单。企业必须要明白, ai 可以 极大地加加速这个成熟的技能员工以及能够懂得领域的这个生产力,但极有可能会阻碍这个新技能的习得。 落地的这一个动作就是对于资深的架构师,鼓励他们用 cloud code 自动化的去执行这个繁琐的日常工作。但对于这个新入职的管理培训生和这一个 初级的这个研发人员,必须要限制其在特定的核心模块使用 ai 直接生成最终的代码,强制要求他们用原生的方式去理解底层的逻辑,就算要做的话,也是他们配合 ai 一 步一步自己要进行实操和操作。 其次的话就是这一个企业的实战落地,打造高分的这一个 ai 交互模式。如果不能够阻止员工使用 ai, 那 么企业必须要教导这个员工如何正确的与 ai 进行互动。 报告通过这个录屏分析,找出了这一个高分和这个低分的两级交互模式,这也是企业的 ai 员工培训手册最佳的蓝本,那么我们要坚决地抵制这个低分的模式, 严禁在企业内部的蔓延,比如说 ai 的 这个伪派,直接把这个需求扔给 ai, ai 生成什么代码就用什么代码,完全不看这是生产石山的这个代码和未来灾难的这一个源泉。 第二部分的话就是这一个迭代, ai 调试出了报错,不是自己去想为什么,而是直接 a log, 把这个 a log 复制给这个 ai 求解决,这会导致员工彻底的丧失排障的这个能力。 那么我们要做的一件事情就是在我们企业的内部要去做好,就是相关的这一个培训,要培训全员推广高得分的模式。在培训过程中我们要必须要强制要求我们员工采取三种模式。第一个的话就是概念的探求,遇到不懂的库技术,或者是 哪怕是一些词汇,不要问这个 ai 怎么写代码,而是问 ai 这个库的核心原理是什么, 靠自己去提升的理解去完成任务,这是速度和得分都最高的一个最佳模式,就是你要懂知其然,并且要知其所以然,你不要让他直接基于这个库去写代码,而是让你自己先懂这一个 库的核心的原理。第二点的话就是生成后理解,要允许 ai 生成代码,在复制到这个项目之前,必须要向 ai 追加提问,请给我解释这段代码用到了某某模式。 第三点的话就是混合代码的解释,那么在最初的这个 prompt 里面就写死这个规矩,给我生成代码,并且在代码下方逐行的解释,你为什么要这样这么设计? 那么组织架构的这个重塑就是要防范这个开门人的危机。报告里面其实提出了一个极其敏感的这个宏观问题,就是如果代码越来越自动化,人类最终的这个角色就会变成这个监督者。 但是如果这一个初级的工程师因为过度的依赖 ai 而没有积累扎实的底层的技能,未来谁来监督那些在极高风险环境下面运行的由 ai 写的这个百万的行的这个代码? 企业落地的这一个职责的话,其实就是要做好这一个, 比如说采用这种设计反脆弱性的这个人才培培训体系,开启这一个学习模式,强制这一个企业版的 ai 工具在内部培训或者试用期员工的这个机器上,然后开启这个学习模式和解释模式。 对,这个很重要,就是你要企业版的这个 ai 工具,你要设置好学习模式和这个解释模式,系统会拒绝直接给出标准答案,而是像苏格拉底式的一样的去引导员工自己去进行推理 推导,那么刻意的制造这个困难。在内部的这个晋升考核里面必须要引入这个断网断 ai 纯手工提 bug 环节,确保那些即将负责审核 ai 的 代码的高级的人员 依然能够保持敏捷的这个代码直觉和这个调试能力。这里的这个互动演示,就是比如说我们企业的这个人才技能培养和 ai 短期的这个沙盘,那么我们的 hr 负责人和技术总监要证明我为什么我们不能放任 ai 当员工的拐杖,而是要把 ai 当做健身的器材,这就是我们可以用这个定制沙沙盘。第一个的话就是 ai 的 拐杖效应的话, 我们会发现就是如果 ai 只当拐杖的话,那么它会处在一个智力降级的风险中,整个企业都会处在一个智力降级,员工会呢,虽然会在短期内复制 ai 的 代码提升这个速度, 但是它最底层的逻辑一窍不通,一旦进入到这个线上排障的环节阶段的话,那么团队将会面临彻底的瘫痪,交付的速度和 debug 存活率以及核心的技能掌握度以及系统的风险都会非常的高。第二点的话就是这一个, 这一个当导师当,如果 ai 当做导师的话,那么虽然前期的这个交付会存在这个认知磨合期,但是员工会在这一个通过 ai 导师 构建真正的这个底层的模型。长期来看的话,这种快慢就是快的这一个策略确保了这个技术底座的极端的稳健。那么苏格拉底士的这个提问帮助这一个工程师和员工进行深度的这个学习, 那么它的交付速度也有保障,然后 debug 这个存活率也有保证,同时它的核心技能掌控率也比较高,系统风险是受控的。 那日常开发的这个阶段的话,当拐杖的时候它会也有,比如说它的这个交付速度的确非常快,但是 debug 存活率可能会比较低,同时的话,它的这个核心技能掌握的话,以及这个系统风险的话,它其实会 降低我们用户的这个认知和他努力的程度。那么基于这份报告的话,其实我们重点想告诉的就是,我们要 保证就是这个企业他的这个认知努力和陷陷入困境,以及这一个对于培养精通的这个能力可能会更为重要。在帮助我们企业进行 ai 转型的时候,我们必须要向决策者传递一个核心的观点,就是真正的 ai 转型不是消灭一切工作中的痛苦和摩擦, 相反的话是为了保持组织的韧性,我们甚至需要刻意的去设计一些困难的环节,不要让这一个 ai 剥夺了人类思考的权力,利用这一个 ai 加速常规的事物, 把这一个需要深度思考的,需要磨练团队的核心竞争力的这些硬骨头留给人类,这才是让人类在这一个智能革命中永不掉队的这一个终极的策略。

我今天第一天用 cloud code 跑了一个股票回测的开源项目,写了五个策略,结果最高年化收益才百分之十。 agent 把回测跑得又快又好,但是真正想出 idea 并且决策使用它的人是我,如果我的认知再差,那么它也就上限不会很高。这简直太打脸了,他把我提出的一个一个想法回测高达百分之二十五。 我发现 ai 能力这么强,但是自己的认知跟不上也完全不可以。这倒逼我们提升自己的认知,考验你对一件事情,你真正的理解,经验和思考工具只负责执行,还会给你提出建议,但是你才是真正的决策者。

一句话让克拉克的帮我完成独立站产品的批量优化,可以看到我在 shopify 后台上架了三个蜡烛相关的产品,当前的状态都是草稿,我们随便点进一个进来看一下 现在产品的标题描述,还有产品的标签,包括产品的卖点信息,都是从供应商同步过来的,和当前品牌的一个品牌背景,品牌调性存在一定的差异。 我现在让 cloud code 帮我来进行这三个产品的批量优化,然后我们回到 cloud code 这边,我直接告诉 cloud code 我 在上面后台上架了三个蜡烛相关的产品,让他去帮我优化一下标题描述,买它信息,还有标签 以及结合我之前做的一个产品策略综合进行分析一下。然后可以看到他就去项目里面寻找我之前上架的这三个产品, 以及调查我一个品牌调性相关的信息,作为辅助参考。然后可以看到他获得了完整的一个品牌策略和调性指南,以及发现了我上架的三个产品的一个实际数据。接着进行产品优化方案的分析, 然后可以看到他说计划已经写好了,然后提到我说我的这个定价和产品策略有点出入,包括产品的幺幺幺过长,就他存在一些疑问,然后后面等待我去确定。下面是一个具体的优化方案, 可以看到他首先是对我这三个产品进行了一个诊断,发现第一个产品是标题式过度的物料堆积,就描述过于深意,没有什么品牌感。 然后第二个是标题里面出现了这个品牌违禁词,或这几个产品的 su 标题描述, 还有图片描述都是一个空缺的状态,然后标签打的也不是很好。接着他还参考了我之前提前做的一些关于这个产品的一个扑克内容的铺垫,然后就开始重写这个产品的标题描述 以及产品的 icu 信息。接着是优化产品标签,添加产品图片的描述文本,这个是我没有告诉他的,但他也发现这个问题,然后现在他需要我同意,他就可以去动手去优化产品了,然后这边我点击同意,然后等一会可以看到他已经完成三个产品的更新了, 下面是他的更新总结,有新的标题描述,买塔信息标签还有图片的描述文本都已经全部添加好了。可以看到三个产品都是保持草稿状态,等待我去后台省略发布,然后我们去后台看一下,点进去一个草稿,可以看到这边的标题还有和描述 已经改了,改成和我之前一样的一个描述的样式了,包括这个标签已经帮我优化过了, 还有这个麦达信息,然后这个 u r i 我 打算让他再帮我修改一下,他之前也没考虑到这个 u r i 如果被谷歌锁屏的话,修改会失去之前的 su, 但实际上这个产品我还并没有发布, 所以说现在改这个 u r i 也没问题的。我现在准备让他帮我把这三个产品的 u r i 再批量改一下, 优化一下,然后回到 class code 帮我把这三个产品的 u r l 再优化一下,然后我感觉标签有点多,可以稍微适当精简一下。等待一会后可以看到他已经帮我完成这些产品链接的优化了,变得更加简短好看一点了,包括也完成了标签的一个优化。 然后我觉得他这次帮我优化产品的这个优化脚本固化到这个 工作流里面,然后我告诉他可以把这次优化产品的思路以及你写的这个优化脚本优化产品的这个方式总结,总结放到 memory 里面,下次就可以直接用了,这样的话我们就能够 越用越让我们的这个工作流变得更加顺畅更好用。这个 memory 文件夹就相当于其实是一个 这个项目的一个他的记忆的地方,他每次运行工作,每次启动他,他都会先去读 memory 里面的内容,这样我们下次做同样的事情就不用再从零开始了,就可以直接有一定的基础。然后可以看到他已经把刚刚的这个工作经验保存到项目里面了, 下次再优化这个产品的话,他就会按照先去做计划,然后写这个优化脚本优化后再去验证的一个工作模式去工作优化产品了。

今天和大家去聊一下 starbucks 在 上周发布的一篇文章,关于大项目里边实际去使用 cologne 的 一个最佳实践。那这篇文章里边其实大概讲了 cologne 怎么来用,然后后边呢?其实主要去讲 harness 为什么重要? harness 工程怎么来去做? 这里面其实我认为有很多东西的话,我们之间已经讲过很多遍了,那这里面非常关键的一个点呢?我认为是有两张图的,那一张图呢,其实是关于 colaco 的 这个 harnis 的 一个 session 里边,不同的这些组件在整个 session 里边占的一个周期和量级是什么样的?那第二个呢,就是这些组件 有很多地方其实是被我们误用的,那误用的地方呢?是有哪些?那所以我认为这两张图是非常关键的,我跟大家先讲一下整个的一个流程和这篇文章的主 主要的骨干,然后我们去主要介绍这两张图非常有价值,非常有收获。其实整个文章啊去讲 cologoth 在 一个大型编码中的一个最佳时间,实际他去讲的其实是 harnes 的 一个最佳时间。这边在说为什么我们使用 cologoth 的 时候,我们再用本地的代码去剪辑啊?因为这个 public 呢,其实它是有一定的一个时间周期的, 那这个时间周期下的一个处理呢,其实会让我们误读很多文件,所以会导致代码的不实时性,所以呢他就直接去使用读代码这个 grab 的 方式去读取。 那如果我使用直接读的一个方式呢?那其实我更希望的话是他能知道我现在的代码呢,到底的结构是什么样的?那这个呢,就是我们多次去提到这个 cloud 点 md 的 一个文件,它就隐身出了一个 harness, 那 harness 它的核心的组成呢?其实是有五大部分的,那 这五大部分呢?就是一个是 cloud 点 md, 我 们知道整个的这个目录的信息和需要注意的关键点是在哪些,还有呢就是在整个 a 阵生命周期里边的 hook 我 们怎么来做?然后能做哪些功能? 还有一些呢?我们认为是一些流程性的一些东西, work flow 的 东西,我们把它变成一个 skills, 然后这些 skills 是 人来去使用也好,是给 ai harness 去用也好,这也是非常关键的一部分。 还有呢就是我们要把这些搭建好的东西进行一个组织和团队的一个传承,那就用到一个 plagis, 把它进行一个打包和一个分发。 还有呢有一些工具呢,我们需要把它进行一个结构化,暴露出来之后呢形成一个服务,那这个服务呢通过 m、 c、 p 的 一个协议呢接入进来,那除此之外呢, l、 s, p 呢,也就说我们知道整个代码里边的关键定位是怎么样的,而不是说通过整个的字母串呢,就去读这些代码的 l、 s、 p, 然后和里边的 sub agents, 这两个呢,又把上面的整个能力呢,又给它进行了一步的增强。那所以呢,这就到了我们非常关键的两个对照表了。那第一个对照表呢,我们就讲这些组件儿,它其实误用的地方是在哪儿?我认为这个其实是非常关键的,你比如说 cologold 啊,它最常 见的一些误区呢,就是我们把所有东西都放在 cologold, 那 这个不其实是不对的,我们应该把一些 skills 这些东西呢,我们应该放在相关的一个技能里边,比如说它是一个 workflow 型的一个东西,我们应该把这些东西拆出来,而不是说全都放在 colog 点 m d 中。所以对于 cloud 点 m d 的 误区呢,就是我们把 skills 的 一些东西其实也放在 cloud 里边儿,那我们 cloud 点 m d 里边儿应该保证它非常简洁。那 第二块儿呢,就是关于 hux, hux 里边儿其实最适用的其实是在固定的一个生命周期里边儿,我们触发一些事情,比如说 commit 啊,或者固定的 t d d, 固定的 review, 那 这些是比较适合于整个生命周期的一个触发的。那对于一些提示型脚本,比如说提示词的一些东西的话,其实我们不需要去放在 hux 里边儿,我们更多的话是把它放在一些 一致性的一些检查呀,然后还有一些固定化的一个,嗯,陷入到生命周期这种调用我们才使用 hux。 那 skills 呢,就是我们保证专业的东西呢,可以让它专业化的这些东西呢,我们就放在不同的这个 skills, 而不是说把它全都放在 collab 里边,这个跟我们上面说那点是一样的。 然后 plugins 呢,我们就发现啊,有很多我们自己用的已经很好的东西,但是如果你要让它去呃团队扩扩展起来去用的话,其实你最好的方式是把它进行了一个打包,然后团队呢都有相同的一个环境,那这是 plugins 的 一个应用,那很多时候我们其实是放在呃本地的一个环境里面,大家其实是无法进行复制的。 那对于 lsp 呢,其实我们最多误解呢,是以为这是 coloclo 自带的一个一个方式,其实并不是,它更多的话是基于现有的一个环境,然后我们可以通过伏尔级的东西去固定的呃,去准确的定位到相关的目录里边,所以呢,这类能力其实不是模型本身的一个能力。 那对于 mcp 的 这个 server 来讲的话,就是我们的 harnis 其实还没有搭建好的时候,其实我们就着急去建很多的 mcp servers, 其实我就见过很多企业,他们在做一个东西,就是 呃,我现在要把所有的接口都进行 m c p 化,其实这个呢,对应这一条来讲,它其实也是错误的,就没有必要把所有东西都建成 m c p, 你 需要把它的基础设施啊,然后它的约束啊,它的 hux 啊,生物周期的侵入,把这些东西先做好,然后慢慢呢,我们一步一步再结合 m c p servers 来做。对于整个 seven ages 啊, 我们最大误区呢,就是我们不见 sam 一 阵子,我们把所有的这里边的探索,呃目录啊,探索项目啊,然后呢,包括改 bug 呀,包括主流程的一些设计思考和编码工作,我们都放在一个对话中了,那这个其实是错误的,其实更多的时候,比如说我们再探寻一个项目也好,我们再写一个测试用力也好, 那这个过程呢,我们需要给 subordinates, 让主 agent 呢有更干净的一个上下文,那这个呢,是非常重要的一个点,那这些点呢,其实就促进了我们可以把整个的 harness 做好,那所以为什么我认为这张表呢,其实是非常关键的。 除此之外呢,这还有一张它整个的一个 harness 的 一个 session time, 它们所占的时间,我为什么觉得这张表是非常关键呢?其实你会发现啊,这里边占的时间越多的地方呢,其实是我们更多应该花时间去做的一个地方,就它收获会比较大。呃,比如说我们会把 cloud 点 m d 这个文件呢,它在整个绘画中它占的这个比中是非常大的, 我们就把这个文件需要给它好好去设计一下。其实所以你会发现之前我在讲很多关于 cloud 三层设计也好啊,其他设计方式也好, cloud 点 md 这个文件其实我们经过了很长时间打磨和探索,然后除此之外呢,有一些固定化的东西,可以沉淀化的东西呢, 我们要嵌入到生命周期中,所以你会发现 hux 也是非常重要的。我们比如说,呃,沉淀的一些复利工程也好啊,然后去做 ttd 也好啊,然后去做 review, 自动化的一些 review 也好,我们把 hux 做好。那其实你哈尼斯这两部分其实你已经完成很多了嘛? 还有一部分呢,就是关于我们要把上眼纹做的比较干净的情况下,我们把问题解决。所以呢,你如果可能情况下,你多做一些 sub agency, 因为它也是在整个 section time 里边占了很多的周期的。那剩下其实就比较符合我们的直觉了,就是我们 lsp, 我 们开了之后呢,然后固定了 workflow 呢,我们就变成 skills, 然 然后有一些需要提供服务,需要让模型去掉,我们就变成 m, c, p, 然后最后呢把这些所有做好的东西呢,进行一个打包分发和共享,让团队呢都可以基于这一套 harnis 去做,有效的去做开发。所以这两张图呢,我觉得是非常重要的,那这些内容呢?分享给大家,希望呢?对大家都有收获,关注雷哥,关注 ai 工程化落地。

cloud code 真的 一定要每个月付费吗?如果你的目标是学习离线实验或者做日常代码辅助,其实可以用本地模型搭一个免费方案。 关键点是 cloud code 是 编程助手,真正产生费用的是背后的大模型服务。 我们可以把模型端点换成本地运行的 oled, 让请求留在自己的电脑里。开始前先检查硬件,推荐至少十六 gb 内存, 如果有五大显卡,六 gb 显存,可以跑清了模型,十二 gb 以上体验更好。访问欧拉玛 com 下载桌面版 windows 用户按安装向导,完成后在 power shell 里运行 olama version, 看到版本号就说明安装成功。 模型按用键选择现存充足选快二点五 co 的 资源,一般选 jimmy 二老机器可以用 fly 做轻量体验。 模型下载完成后,启动饿了么服务,看到 local host 一 万一千四百三十四端口正在监听,就说明本地模型服务已经准备好。接下来设置两个环境变量, andropic 下划线, base 下划线 u r l 指向本地,欧拉玛 andropic 下划线 p i 下划线,替填一个占位置,然后启动 cloud code。 现在你就可以让 cloud code 独取项目 分析代码,给出修改建议。整个过程在本地完成,不需要把代码上传到云端模型,本地模型不一定比云端最强模型更聪明,但他免费可离线,隐私更好。 对于学习和日常辅助,这个方案很值得尝试。先跑通清亮模型,再根据硬件升级, 后面可以继续做故障排除和性能优化。

美好啊,朋友们,这是一期 codex 奶妈级的零基础系统教程,这期视频我会从安装开始,手把手地把 codex 的 基础能力到高级功能的组合,以及最新的手机端操作,用十个实战场景来带大家彻底拉通 以后这一类的 ai 产品,出一个算一个,你都会触类旁通,游刃有余。我也把这期的文字课间整理成了文档,那这期的含金量可谓是 biu biu biu biu biu, 一个点赞收藏关注是最起码的。好了,不多说,学费都交了吧,我们上课, 那在开始之前,我先说一下 codex 和 cloud code 的 区别。从本质上来说,它俩都是由编程 agent 逐步转向了通用 agent, 分 别是 ansapi 和 open ai。 这两家出的 cloud code 呢,默认使用 cloud 模型,但是我们可以自行替换成任意其他的模型,那在易用程度上, codex 桌面端的产品设计是会更友好的, 更适合零基础的白领工作者,而 cloud code 有 更高的自由度。在功能上, cloud code 原本是最齐全的,什么 skill、 mcp、 斜杠命令、 hock、 远程操控,这都是人家先发明的。但是呢,最近的 c c 更新稍微不如 codex 那 么快了,会更加偏向专业开发者一点。 而 codex 发了非常强的浏览器操控和 computer use, 还内置了最近的 image 二深图模型, 而且昨天还刚刚发布了手机端和 hock, 可以 直接用你的手机 check gpt 来控制电脑上的 codex 干 活。那价格和额度方面呢? codex 的 会员额度非常大方,二十到的会员就很够用,而且还不封号。 而 cloudpod 呢,大多数人可能都没法用它的官方账号基本上都得自行调用 api 的 费用属于是花多少用多少,风险由人。那在使用场景上,我个人喜欢用 cloudpod 搭配 cloud 模型来写作,因为 ops 四点六的写作和规划能力真的很强, 那 codex 的 执行和解决问题的能力也很强。日常的办公场景,我会选择用 codex, 那 在编程的时候嘛,我就两个都用上,所以结论是,入门的朋友用 codex 就 很强了,有条件的朋友呢,两个都来是最完美的, 不过两者的逻辑其实都是一样的,我们学一个,另一个也就会用了。那 cloud code 我 也做了一期系统教程,想拥有左膀右臂的朋友可以去看看。 ok, 正式开始 使用 codex, 我 们唯一需要准备的就是一个叉 gpt 账号,免费的也行,只是会额度稍微少一点。那有了账号之后,我们就直接去它的官网双击安装, 然后安装好之后登录我们的叉 gpt 账号,然后这些设置我们可以先随便选一点啊,选个日常工作,反正后续呢,我们都是可以改的。那搞定了, 那进来之后呢,大家会看到这个对话窗口,好像跟 chat gpt 是 很类似的。那我们打开两边的侧边栏也蛮眼熟的,左边呢,可以管理对话和任务的列表, 那中间就是聊天,右边大概是结果之类的吧,大家应该都能猜个七七八八,所以我们先不深究它的页面,我们直接开用,这其实也是我探索所有的 ai 工具的独门秘方。 我打开一个陌生界面呢,我先不管别的,我先找到我能对话的框,我先聊,先找到我能看得懂的按钮,先按,按着按着你就会了。你看看,独门秘籍都教给大家了,以后你们就是为师的弟子了。 ok, 众弟子不必拘礼,我们还是以学业为重啊。那我们第一个要了解的 codex 能力呢,就是本地文件操作, 也是这一类桌面端的 agent 跟对话 ai 最显著的区别和能力。因为过去我们用叉 gpt, 如果说我们要让它看到我们本地的内容,我们只有两种方式,一个呢就是复制粘贴到这个对话里,另一种就是以它允许的格式和数量把文件给上传上去。 但是 codex 不 一样,它可以自主地读取和操作我们的本地文件,而且不限数量。比如说我作为一个剪辑,我的本地里面存了八十多条视频素材,这都是我剪辑要用的, 但是呢,这个命名全都是乱的,完全看不懂,所以我想以这些视频的内容来命名,到时候我们看见文件名的时候,我们就知道这个素材是什么。那这事 check gpt 肯定是做不了的,但是 codex 可以 我们来看这两个地方,它都显示了一个概念,叫做项目, 我们选择一下,哎,一选择项目,他就让我们选择本地的文件夹了,那我们只要选中这个文件夹,那这个文件就是我们的项目了,里面所有的文件 codex 都可以自由的读取和操作, 当然这需要我们给他权限。大家看这里的权限选择啊,目前呢,我们是一个默认的权限,我们再点开,他有三种权限模式, 那默认权限的意思呢?就是在我们当前的文件夹内,他可以自由的去读写这些文件,但是如果他想要联网呀,或者是帮我们下载一点东西啊, 或者是碰这个文件夹之外的其他文件,那他是不行的,如果他必须要做,就会要向我们提出提高权限的请求,我们点同意才能继续。 那自动审查呢?顾名思义就是有个 ai 自动帮我们审查,由 ai 来判断这个操作危不危险,如果危险呢,就来问我们不危险的,比如说他去下一个知名的这种官方软件什么的,他就直接开干了。 自动审查比默认模式要更宽松和智能,建议大家选这个就完了。那最后呢,是完全访问权限,这意味着 codex 可以 在你的电脑上几乎什么都能干,它可以修改删除任何文件,它可以在任何位置执行命令,例如说它可能会去把你的 cloud code 给删了。 开玩笑啊,它一般情况下是不会这样抽风的。 ai 呢?也没有嫉妒情绪吗? 大家尤其是新手朋友就选择自动审查模式,相信 ai 就 完了,毕竟咱又能审的比 ai 好 多少呢啊,对吧? ok, 那 我们选中了刚刚的这个视频的文件夹,继续来提出我们无理的要求,让他帮我们把这个文件夹里的所有视频素材都按他们的实际画面来重新命名。哎,他就开始做了, 而且大家看他非常的聪明,他先看了看我们到底有多少个视频,然后他选择用抽帧的方式抽取关键画面来判断内容是什么,而且他还知道他不要一张一张图去看,他给拼成了缩略图的形式,一组一组的去看。 ok, 很 快啊,这个文件夹里面的文件名就全改变了。过程中呢, codex 也是没有向我们提全的,因为他都是在这个文件夹内去操作的。那我们也可以检查一下他都对应好了没有。 ok, 钢琴家音乐演奏厅,没错, 雪山近身格斗,没错,旗袍女人夜巷卖热饮哇!而且他的这个命名还遵循着一个序号,任务、场景、行动的一个清晰的命名格式。 ai 做事的这个细心程度啊,人类你不服不行。那另外呢,我们其实也可以在同一个项目里面去开多个不同的对话,它们的上下文都是不一样的,但是同样都可以随时的访问我们这个文件这个项目。 比如说,我们在另外一条对话,我们又给他一个不同的任务,让他想办法把所有关于风景的视频都剪成一整条。 哎,没想到吧,他真的能剪,他自己想办法,用了一些工具问我们要了一些权限,用这个 ffmpeg 给它拼在了一起,效果的确是关于风景的都剪成了一条。 ok, 那 如果我们要创建一个新的任务,我们其实也可以手动的在这边创建,他也会自动的在我们本地创建一个文件夹。 然后呢,我们跟 codex 对 话的整个过程, agent 产生出来的任何文件啊, pdf 啊,什么 markdown, ppt, 它都会直接存在我们本地的电脑上。 ok, 到这里,大家应该 get 了 codex 呢,可以随时地访问我们的本地文件,去读取内容,写文件,删文件,移动文件,文件夹里的内容也就成了我们的 codex 随时可以获取的上下文,那这里的项目也就对应着我们在本地的一个文件夹, 哎,那刚刚这么个任务会花我们多少上下文呢?我们只要看这里就能看到了。 那这个小圈代表的是我们现在的这个对话和里面的操作,一共使用了 gpt 五点五的多少上下文窗口。 如果我们把鼠标悬上去呢,它还会有更详细的一个信息,当上下文快满的时候, codex 会自动地帮我们压缩上下文。不过其实当我们一个任务告一段落之后,不用等它快满了,让它自动压缩,我们也可以自己通过斜杠压缩这个命令 来手动的去压缩上下文,这样呢,可以让模型更聚焦在我们的新任务上,也省一点上下文的额度。那当然大家除了这个对话的上下文余量,其实我们还想知道我作为一个免费用户,或者是我作为一个 pro 用户, plus 会员,我还有多少总共的额度可以用,对吧? 这个呢,有两个方式查看,一个呢是左边的设置,这里我们点开剩余额度,就能看到你五小时内还剩下多少,那本周内又还剩下多少, 甚至呢,也有什么时候到期会刷新的一个提示,这个产品的设计还是比 cloud 的 友好很多的。那另一种方式呢,就是我们可以直接在对话框里输入斜杠,然后找到这个状态, 那打开这个状态之后,它的绘画这里就会持续的显示我们的上下文余量,这个五小时和一周的限额。但再次说实话,这个 codex 的 额度还是非常大方的,二十到的额度我认为是可以满足大多数白领工作的高频使用的。 ok, 那 顺便呢,我们也介绍一下这里的模型选择, 那点开之后,我们可以选择速度,快速呢,就相当于加急通道,会消耗我们更多的额度。那这里呢可以选择其他模型,但是大家都选五点五,因为它确实更好用。然后呢,这里可以选择智能程度,其实呢一般中度智能就够了, 所以我们选高。 ok, 那 这个小麦克风呢,肯定就是语音输入功能了,比手打字还是要快很多的,但是呢,它的转录速度远不如大家去下载一个语音输入法,还是非常推荐大家用语音输入的 好。那现在我们通过一个本地文件处理的案例,也了解了 codex 上常用的一些功能。那 codex 的 第二大能力就是命令行工具使用。 其实刚才我们说到权限的时候就有提到,在默认权限下,它可以读写文件,但是却不能执行一些命令,一些联网的操作。那这些命令是什么意思呢? 刚刚的案例其实也已经用到过了,比如说它把视频抽帧出来,还把几个视频拼接到一起,它用到的 ffmpeg 就是 命令行工具。 还有一些我们熟悉的命令,比如说我们在终端里面来克隆一个 gitup 仓库,或者是大家近期比较熟悉的,我们在命令行里面输入一些命令来下载龙虾和各种依赖。那 codex 的 第二大能力就是在我们授权的情况下,可以使用我们的终端来替我们做这些事。 那我们就来让 codex 帮我们来安装一些平时对于小白来说非常复杂的东西吧。第一类,常用依赖,比如说什么 node gs 啊, git 什么的, 也是大家以后使用各种 agent 或者是做其他项目必备的一些工具啊,那之前大家要装这依赖都得去看一个手把手教程,然后照着命令抄,挨个装。那现在我们就直接跟 codex 说帮我安装个 node js 给他发过去, 也是因为这些东西呢,其实都是比较常见的东西了,所以在我们的自动审核的权限模式下,你看他基本上都不问我们要提权,就熟门熟路的帮我们装好了。 那第二类,就是那些爆火的但是有上手门槛的一些新的 agent, 比如说龙虾,爱马仕,甚至还有这个 codex 的 竞品 cloud code, 我 们都可以让 codex 帮我们装完了呢,它还能教我们该怎么用。那我们装一个 hermes 吧, 我其实都不需要给它官网和仓库链接,我就说最近有一个叫 hermes 的 agent 很 火,你帮我安装一个吧。 哎,他就会自己去搜索,然后帮我们判断到底是哪一个。然后呢,他根据官方的文档帮我们陆续的装好了,还帮我们验证过已经装好了,你瞧瞧,那我们照着他说的来启动一下试试。 哎,真的帮我们装好了,那往后的配置我们就不在这里继续了,但是大家应该 get, 有 了 codex 以后,那些复杂的要收你五九九的部署,你都可以直接让 codex 帮你做了,怒省五九九。而且我们在使用的过程中遇到任何问题,还可以截图去问 codex, 什么瞎死了马挂了,升级出现了问题都可以让 codex 直接帮你修,是不是很方便? 那第三类有点没那么必要,但它其实也可以,就是像 cursor integrity 这种软件应用, 平时都是我们去手动在网页上下载的,它也可以帮你下载和卸载。那大家用 codex, 我 其实也建议大家去下载一个 agent 的 ide 啊,因为现在 codex 有 个缺点是它没有办法打开我们的文件内容,直接去手动编辑。 虽然这个侧边栏呢,是可以看到一些文件结构和内容的,但是我们都没法编辑,所以大家可以让 codex 下载一个自己喜欢的,比如说我们就这样下载。那下好之后呢,我们再执行一个 git i n i t 一个初步化, 那右上角就会出现这个东西,随时可以把我们的项目在编辑器中打开,我们来手动编辑。 那第四类就比较重要了,就是 agent 本身会常用到的那些 skills 啊, mcp 啊和 selli。 那 skill 和 mcp 本身 codex 也是支持的,我们后面会详细讲到, 我先挑两个大家安装一下,方便我们后面综合起来来做案例。那这些 skill 和 c i 呢?通常来讲不像那些 get 那 种大项目那么著名,所以我们最好是找到它的具体仓库,或者是明确的官网地址。比如说我们下载一个专门找 skill 的 这个 find skill 哦,方式就是直接把链接拷贝给 codex, 然后跟他说帮我装一下这个 skill。 那 在他装的期间,我们也说一下 codex 的 另一大好处,并行任务处理, 我们完全可以在他做这个事情的时候再开一个对话,让他去下载一个别的。那我们下载一个飞书 c l i 吧。飞书 c l i 其实非常的典型, 因为现在呢,有一些积极 ai 化的软件,把几乎所有他在软件里能做的操作都做成了命令,让 agent 能够方便的去操作,我们把这个链接发过去,让他开始下载, 那这边呢,其实会显示每一个正在处理当中任务的情况,这个在转呢,就说明它正在执行中,那这个蓝色的点呢,就说明已经完成了,有时候还可能会出现一个需要你申请权限的一个标识。 ok, 那 这里 fan skill 呢?它是已经装好了,我们再看飞书 c l i 这边,它会引导我们去做一些授权, 我们就跟着它的引导去完成就好了。 ok, 那 装好飞书 c l i, 那 codex 就 能帮我们去做飞书里的各种操作了,比如说写文档,发消息,见日历,做表格什么的了,我几乎每天都在用, 好大功告成。我们就这么一个小章节,我们就用自然语言的方式让 codex 帮我们装上了 hermes node, 飞书 c l i 一 大堆东西,这就是 codex 作为 agent 的 第二大常用能力,命令行使用。 那这个能力和这个章节的演示也是希望大家能够 get 到一点,就是我们现在在电脑上想去做的很多很多事情,都可以让 codex 这样的桌面 agent 去做了。那 codex 的 第三大能力是持久记忆。 看过我那篇 cloud code 的 朋友应该都知道, c c 呢,有一个手动的持久记忆, cloud 点 md, 还有一个自动的记忆系统, 都是把我们希望 agent 能够长期记住的,比如规则、篇号和我们的信息之类的东西,以本地文件的方式存在我们的电脑上,然后事实的时候把这些记忆以上下文的方式注入到 agent 里去。那 codex 也是类似的,它也有这两套持久的记忆系统 在 codex 里面呢,手动的持久记忆文件叫做 agents 点 m d, 而且它也有一个自动的记忆机制,来我们打开设置,找到个性化, 那在这里的这个自定义指令实际上就是一个全局生效的 agent state md, 它会在我们任意的项目跟 codex 对 话的时候,它都第一时间作为上下文发给大模型,那我们可以手动地自己在这里写,不过我更喜欢呢,直接在对话中去跟 codex 说, 比如说我说一个,我希望你以后对非书文档里的任何修改都使用一个专属的你的文字颜色和用删除线的方式来修改,不要直接的修改。然后这个帮我寄到局的 a 正 c m d 里。 ok, 那 它这里呢,告诉我们已经写好了,我们再打开个性化这一块,就的确是多出来了这么一套规则,那实际在使用当中,它就会去遵循我们这个规则了。 比如说我这里已经有一篇非输文档了,我在侧面呢也评论了几个我想修改的地方,我直接可以把这个链接发给 codex, 我 让他根据我侧面的评论帮我修改一下。 那因为我们刚才确实已经装好了这个非输的 c r i 也都给他配置好了权限,所以 codex 是 直接可以操作我们的文档的。 ok, 看看它完成之后的效果。 果然他用了紫色的字和删除线的方式来帮我们做的文档修改,那这个呢,是局的 agent md, 适合记一些适用于所有任务的一些大原则,比如说我们的工作习惯,我们要说中文,我们的工作偏好修改文档,要留下这种修改痕迹等等等等。 那另一种呢,就是项目级的 agent md, 这个长期记忆呢,只在这个项目当中生效,我们可以选择一个项目的对话,然后打开编辑器, 自己在这里手动的创建一个 agent 的 md 的 文件,然后我们去写一些针对我们这个项目的一些规则, 当然也可以让 codex 来帮我们写。我个人的建议呢,是在这个项目文件里面有了一些内容之后,让 codex 根据他对我们项目的了解来自己帮我们写。那自动记忆怎么回事呢? 其实我们刚才在这个个性化这个下面我们也看到了,我们需要手动打开这个自动记忆功能, 它的机制是我们打开这个功能之后, codex 会在我们结束对话或者是结束任务,这个对话闲置一段时间之后,它帮我们把那段对话总结成记忆,然后记在一个地方。但是它有几个原则,第一太短的对话它就不记了, 那第二这个对话的总结它一样会消耗我们的额度,所以当我们的额度太低的时候,它也就不记了。 并且这个自动记忆文件呢, open ai 官方是不建议我们去手动修改的,顶多我们可能删一删有些没必要的信息,那这个文件大概是长这样 的,是一个任务,一个任务在记录的,主要呢会写上这个记忆的来源是哪段对话呀?以及它的工作目录是什么,那以及以后触发了什么关键词的时候,它会去召回这段记忆, 再往下呢,是用户在这件事情上的偏好大概是什么样的?那第五段呢,是一些可附用的一些知识,一些踩坑的记录,那这些内容都是 codex 自己记录的,并且以后也是会它自动的招回去使用的,我们就先不修改它, 它这个格式确实也不太方便修改,更多的时候我们对于明确的规则和要求,我们还是通过组织 agent md 来实现。那大家学完这些视频之后呢,我也想给大家再做一期, 通过组织不同层级的这种 agency md 给自己做一个非常懂你的,可以做不同类型事情的超级助手的视频,感兴趣的朋友可以扣个一。 ok, 那 第四大能力就是 codex 可以 直接用到 image, 二来生成图片。不过呢,深图功能其实是一个小功能, 所以这一章节呢,我们不只会用它的图片生成,我们会带大家做一个完整的个人主页的开发项目,并且在了解一些 codex 在 小白开发中的一些用法和功能。那我们再来开一个项目,叫做个人主页, 然后我们点开这个加号,我们把计划模式打开,因为我们要做一个网站嘛,任务会复杂一点,所以打开这个计划模式呢,他会先帮我们列出一个详细的计划,我们确认之后他再开始行动。 计划模式呢,比较适合我们的任务有一定复杂性,或者我们自己还没想清楚,可以跟 ai 讨论出一个计划。那假设我们现在就是第二种情况,我们其实没想清楚,我们直接跟他说我想做一个个人主页, 那你看他看到我们的项目中是没有内容的,所以他以这种选择框的方式来询问我们的细节,这些选项呢,大家可以按照自己的要求去选择,那我就选这个个人品牌吧。 然后如果说这些选项中没有我们满意的呢?我们也可以选到最后一个来填写我们详细的要求,比如说我要他修饰感,也要高级感,然后我选针对合作伙伴,不要个人照 中英双语,巴拉巴拉巴拉。这里真的是问了我们相当多的问题啊,那最后呢,他给到我们出了一个详尽的计划,问我们是否实施此计划,那其实基本的计划我们看着没有什么问题,但我们也可以补充一些调整方案。 比如说我们刚才就要说到了要用它的 image 二的生成能力,我们这里没有体现,我们加一句网页上要多用一些图片,使用 image 二来生成一些高级感的图片,然后我们一起提交。 哎,那他又问我们要走哪种高级感呢?我们如果点开这个小叹号的话,还能看到他说的这个风格到底意味着什么意思,这个产品的小细节真的是我很喜欢,那我们就选他推荐的吧。然后他出了一版新的计划,我瞧着没什么问题, 去吧。 ok, 他 就开始初识化这个项目来逐步帮我们生成了。那这个过程呢,肯定会需要一定的时间,在这个期间我再给大家补充一点点知识点。呦,他的第一张图出来了,不错,挺有艺术感的,果然是最强的 emoji 二,那我要补充的这个知识点呢,叫做引导。 如果说大家在 codex 执行一个很长的任务的过程当中,你觉得他有点跑偏了,我们是可以随时给他补充纠偏的,比如说我们补充一下图片的人味要更强一点,而且不要这么冷的色调。我是一个 ai 博主,然后我们发送出去, 哎,大家会看到他没有立刻打断我们的任务,没有发出去,实际上他在这里排队呢。那我们看到右边的这个引导按钮,他写着我们不打断模型运行,会在下次调用工具后发送过去。这个是非常好的一个功能啊,我们点一下, 哎,他就可以发出去了。这个功能呢,可以让 codex 不 用在错误的道路上一路狂飙,把我们额度都花光,也不会让它重新再跑一轮任务。那另外一个小功能点,我们找到一个已经结束的任务, 我们看一下这个 ai 的 回复,每个 ai 回复的下面都有一个这个按钮,叫做分叉 fork, 这个的意思是我们可以随时从这里开始去开一个新对话,非常适合那种前面聊的还好好的,上下文也非常有价值,但是我们再往下聊,就聊的有点叉劈了的时候。哦,还有个小功能,宠物, 我们点开设置外观,然后这下面就有一小对小宠物可以选,甚至呢,我们还可以点击创建,让 codex 根据对我们的了解来生成一个定制化宠物。那我们先点击唤醒宠物, 哎,就会在桌面上有常驻这么一个小桌宠,脑袋上会冒出来 codex 正在做什么的一个提示,别的呢?好像也没什么用。 ok, 终于在他跑了七七四十九分钟之后,网页完成了, 我们来看看效果,因为 codex 呢,有一个内置的预览浏览器,我们可以直接打开右边的侧边栏啊,我们还给它放大一点。 嗯,这个网页的效果确实是不错啊,不过呢,现在的 a 证呢,其实都有这么一手了,那它这个预览浏览器呢,还有一个好处,我们点击右上方这里的一个批注按钮, 我们就可以在这个页面上选中这里的具体元素去写修改意见,包括重新生成图片,比如说我们要这个 logo 放大一点, 然后 p 住这里这张图加上一个人物,好把这个删掉, 那然后对话框里呢,就会加上我们这几条批注,然后我们点击发送,它就会针对我们的意见进行修改了,是不是挺方便的?那我们现在项目有了雏形之后,我们再 call back 一下刚才说的 agent md, 其实现在呢,就是一个让 codex 帮我们生成项目级 agent md 的 好时候了,因为我们也有了一定的内容,我们就让它自己生成一下,我们打开编辑器看看, 不错,项目的背景,各种信息,各种规则,各种文件路径都已经写好了。那以后呢,无论我们在新开对话,还是我们的聊天记录都已经被清空了, codex 都可以通过这个项目级的 a 证书 md, 立马的了解我们的项目基本情况。 ok, 那 我们先保持这样,先不做精修了,我们直接准备部署上线,当然大家自己做的时候完全可以去打磨的更好,那网页上的这些信息也换成更真实的信息就好。 那我们现在要部署呢,就得要说到 codex 的 第五大能力插件。在现在的 codex 当中,插件大多数是让我们的 agent 跟外部平台、外部工具、外部服务连接的一个作用,它实际上就是我们所说的 skill, mcp, c l i 这一类东西的一个完整集合包,比如说操作邮箱、操作日历、操作 excel 啥的。那我们来点开左边的这个插件栏,我们看这里呢,已经默认帮我们打开了好几个内置插件了,比如说浏览器操作,还有 mac 专有的屏幕操作,还有 excel 表格, ppt 等等。 那他的插件页面没有中文翻译,所以我给大家把这些插件的具体中文意思,分别能干什么也都列出来了,大家课后可以按需装上,点这个加号就好了。那我们先翻到这个 coding 板块,因为我们想要部署上线嘛,通过插件会非常方便。 其实呢,这个 vassel 和 netify 都可以,我们点一个加号给它装上,那如果大家给它没有选上的,也记得要选上。然后我们再回到对话当中,告诉他们,我们想用这个 netify 把这个网站给我们部署上去, 我们大家也不用管他咋部署的,反正他需要干什么呢,他都会告诉我们的。 ok, 他 发现我们没有登录授权,然后主动弹出了这个登录的链接,那这里呢,建议大家用 tapp 账号登录是最方便的, 那登录完之后,他自己就知道我们已经登录好了,然后继续的帮我们部署,这就搞定了。这个链接呢,就是我们最后的网站了, 只要把这个发出去,别人就能访问你的个人主页了。 ai 是 不是个好东西,你说就这么两下子就干了,原来普通人花钱都不一定能干成 o k。 先压抑住我的这个老灯感叹。我们回到刚才我们已经装好的插件, 那其实这里呢,还有两个非常重要的内置插件,就是 browser use 和 computer use, 还有这个 chrome 浏览器, 那这些有什么用呢? browser use 顾名思义呢,就是 codex 可以 直接帮你操控浏览器,比如说它自己点击翻页截图,填写表单等等。通常呢适用于自动化测试前端, 当然也有比较无聊的用途,比如我们可以让 codex 打开这个 m b t i 做个测试试试, 嘿嘿,这样大家能够比较直观的看到它的一个效果吧。那这个鼠标呢,是它自己在移动,然后它是自己看了上面的答案在自己填写,然后填完这一页,它也会自动的翻页, 那随着它的一通操作,结果出来了,原来 gpt 五是 i n t j 啊,我说怎么跟我这么聊得来呢? ok, 那 这个 chrome 的 插件呢,也是控制浏览器,但是它控制的是我们自己已登录的自己的浏览器,它不会再新开浏览器, 那我们如果把它给勾选上之后,它会引导我们去 chrome 里面装一个插件,那装好之后呢,它就可以操作我们自己的浏览器了, 而且它有个好处,它是可以直接在后台执行多个页面的浏览器操作的,就是并不会占用我们的整个浏览器,我们不用真等着看它这些操作,我们该用浏览器干,别的我们可以接着干。 ok, 那 computer use 就 更厉害了, 它不只能够操控浏览器,连你电脑上的这些 app 它都可以操作,只不过呢,暂时只有 mac 有 这个功能。比如说我们新开一个对话,我们在加号,这里来看最下面的这个插件选项,我们手动地把电脑插件选上, 我们再来几个没什么用的奇迹引巧吧,帮我放一首九九年最火的歌,然后用我的微信给 qq 发条微信,说,请收下我一个点赞、收藏、关注,懂了吧? ok, 他 陷入了思考,然后他看到我们的应用都正在运行中,并且向我们使用了这个音乐软件。我们点同意看,这个就是 codex 自己干的啊。他帮我们搜索歌曲, ok, 音乐响起了, 但是他还有活,他还在问我们要微信的权限,我们也给他允许一下。 ok, 看他这个小鼠标,他正在犹豫着准备搜索点击,好朋友们失败了, 因为我上次都成功了,但是我估计现在微信已经开始严防这种 a 证的操作了,直接给我退出去了。 但是呢,他的确成功操作了这个音乐软件。其实我还让他操作了剪映,并且给我们的最新的项目加上了音乐。 那总之呢,意思大家都懂了吧,就是它可以操作浏览器,并且可以操作我们的电脑。当然,实际上我觉得它的操作效率目前来说还是稍微有点低的,我不太喜欢用这两个强大的功能。不过后面我要说的这个 skill 就是 我每天都会用的东西了。 那 skills 我 的确也已经跟大家说过很多次了,好学的朋友一定要去补补课。那 skill 本质上呢,是我们人为沉淀的一些可附用的方法、流程和工具的组合, 相当于给 agent 做某些具体任务的一些行动指南。那因为之前我们已经让这个 codex 帮我们装过一个叫做 find skill 的 一个原 skill 了, 所以后续如果大家想要去装,或者是找一些社区上的 skill, 都可以直接用 codex 拿语言直接让它下载。比如说我们下载一个必备的 ansapic, 那 个前端设计的 skill, 还有一个去 ai 位的,那我们这两个都发给他,等会儿都会刚好有用 欸,很快他就帮我们装好了。那以后大家想要下载 skill 呢?如果说遇到这个 find skill, 他 找不到的东西,也可以直接把链接发给 codex, 让他帮你下载就好了。不过我在 c c 那 期也说过,最好用的 skill 还是自己创建的,符合自己工作的专属 skill。 那 创建 skill 呢,也有两种方式,第一呢,就是直接告诉 codex 你 想要创建一个什么样的 skill, 通过跟他讨论打磨得出来一个 skill。 那另一种呢,就是我们接下来要演示的,先跑通流程,然后让它形成 skill, 这也是一种更推荐的做法。那比如说我们想做一个自动化写这类文章,并且帮它配图的 skill, 这种大家应该都看过吧, 那我们就得先通过一步步的引导 codex, 让它真正实现一个我们满意的文章。来我们新开一个对话。那正好呢,我们刚才不是装过这个 github 插件吗?我们可以直接先问它最新的 github 流行项目,热门项目都有哪些? ok, 它的确帮我们找到了一些,那我们再让它清晰地解释一下这些项目都分别是干嘛的。嗯, 那我们再让他挑其中新星数量最多的,来帮我们写一篇本周 get up 热门项目推荐这样的一篇文章。 好,那他写好了这一篇之后,我觉得稍微有点太人机了,我希望可以更口语化一点,并且我只想要五个精选的,那我们就告诉他,然后还要覆盖到这几个层面,那我们这里就可以用到刚刚我们下载的那个去 ai word 的 那个 skill 了,我们斜杠给它调出来。 好,那看到他的结果稍微优化了一点,但是我们还希望加一个我们固定的开头,我们的结尾,并且还要让他用上 image 二来帮我们生成一些配图。最后呢,我还希望他不要是这个格式,他要是一篇非输文档的格式,然后图文并茂的。 ok, 结果来了,他确实是有了,但是呢,我觉得这个配图不够丰富,于是我又经过几轮调整才觉得差不多满意。并且我还给他最后加了一步,要让他把这个飞书文档发送到指定的群里,让大家都来看看。 那最终呢,他的效果是这样的,果然发出去了。其实啊,如果想更加一步到位的朋友,也可以结合刚才我们说的这个浏览器操控,让他直接打开那个发布页面,直接就帮你发布出去。 那总之,我们对他这一套结果满意了之后,我们就可以直接让他把这一整套的标准和动作做成一个 skill 搞定了。那我们再输入斜杠,再往下找,我们就发现就有了这个 skill, 我 们可以直接这样手动地调用这个 skill, 也可以直接说生成一篇热门项目推荐图文这一类的触发词,也会让 codex 自动调用。 不过因为现在 github 上面实时的热门项目肯定是没有更新的,所以我们再调用一次呢,它大概率会写出差不多的文章,所以我们就不试了。但是大家都理解了吧, skills 呢,可以把我们经过验证调好一次的一整套流程和方法给它固定下来。 下次做这件事情呢, codex 就 可以按照这个方式稳定的输出。 ok, 那 下一个能力则是 mcp。 其实 mcp 现在已经用的不太多了,所以我只简单的示范一下那 codex 的 mcp 藏在设置里面的 mcp 服务器。 只不过小白看这个肯定是有点不太知道怎么填的,所以跟我们之前说的一样,我们最好的方式还是把你想装的那个 skill 的 链接拷贝给 codex, 让他自己装就完了。比如说我们来装一个 notebook lm 的 一个 mcp 发给他, 他就会引导我们来做授权登录,登录完就搞定了。那我们再试一个我存了非常多访谈视频的一个笔记本,我们来问一下他。 欸,那这样呢, codex 也就可以直接获取我们 notebook lm 上面的这些外挂知识点了。 ok, 最后一个 codex 能力是自动化定时任务。 其实定时任务本身并不稀奇啊,比如什么每天早上提醒我吃药,提醒我喝水这一类的事情,普通的软件也能做,但是我们把它放到最后一个说呢,就是因为它可以结合我们之前学到的各种能力,把一整套组合起来的任务,让 agent 定点执行 自动化,加上智能化和定制化方显美妙。比如说刚才我们做的这个热门项目图文的这个 skill, 我 们就可以把它设成每三天或者是每周,让它定时定点的产出一篇 dapp 热门项目推荐发出来。 那我们要创建自动化任务呢,其实也分两种方式,第一种就是选到这边的自动化面板,那它这里呢,有一些官方的参考视例了,不过大多数是跟开发相关,那我们选择新建一个自动化, 其实你看要填写的东西也非常简单,其实就是用提示词写好这些自动化是要做什么,然后我们可以在这里选好什么时候出发,我们也是可以自定义一个出发时间的, 然后这边就可以选择执行的模型和思考强度,最后点击创建即可。不过呢,我也还是倾向于让大家用第二种更简单的方式,就是直接在对话里跟 codex 说,那我们直接跟他说 帮我创建一个自动化任务,每周一早上九点自动化执行热门项目推荐的这个 skill, 产出一篇图文发到群里, ok, 那 我们在看自动化这里,它就已经帮我们设好了这个任务,我们随时也可以去改变它的时间。 再比如当你的这个邮箱插件 github 飞书都已经连上了 codex, 那 么你也可以让他每天下午六点帮我汇总日历上完成的会议, github 上面的提交记录和我的邮箱回复记录,生成一份全面的工作日报。 最后手机操控 codex 设置方法非常简单,手机上的 check gpt 和电脑上的 codex 都把它更新到最新版。之后打开手机上的 check gpt, 然后点击侧边栏的那个 codex, 它就会提示你允许这台手机控制你的电脑,直接就搞定了。如果你有多台电脑的话,也可以给它分别连上。这就等于你不管在大街上、地铁上还是朋友聚会,都可以随时随地地用手机下发一个任务,让 codex 在 你的电脑上干完一个活, 它就更像一个可以跟你远程协助的同事了。这个功能呢,目前免费版也可以用,但是主要能连的是 mac 系统的 codex。 好, 那到这里 codex 的 所有核心能力我们就全部过完了。来我们回顾一下。 codex 呢,可以操作我们的本地文件,可以使用我们电脑上的终端命令行工具。它还有两种构建持久记忆的方式,它还可以生成图片,而且它可以通过计划模式来做一个完整的项目开发。 那它有丰富的插件,可以操控浏览器和电脑,还可以把知识和流程沉淀成可附用的 skill 技能, 它可以使用 m c p 连接,外部它还可以设置自动化的定时任务。不过其实比起这些功能本身,我也希望大家记住两件事,第一就是我们真的有很多事情是已经可以交给 agent 做了。 那第二呢,就是我们已经从问 ai 的 阶段走向了管理 ai 的 阶段,因为过去我们使用 chat gpt 就是 有问题了,我们问一下,然后得到答案我们就走了。 那现在使用 codex 这类的 agent 呢?每个人都得像领导一样,帮他准备他所需要的上下文和工作环境,给他指明一些任务目标,然后来检查他的计划,监督他的过程,验收他的结果。 那同时领导还要负责把好的方法和流程沉淀成可付用的技能,把反复要做的事情设成自动化执行的规矩。好了,恭喜大家今天都升职了,记得点赞收藏关注我们下次见了。

hello, 大家好,我是阿江,今天给大家分享的视频是在 cc 里边如何免费使用这个 deepsea 的 新模型。 首先我们需要下载这个 cloud code, cloud code 就是 你打开你的这个命令行,比如说你是 windows, 你 就把这一段粘进去就可以了。 如果你是这个苹果,你就把这个命令粘进去,它自己去安装了。安装之后让我们找到一个目录,直接输这个 cloud, 它这边就可以了,具体的就可以上网上去查一下教程,这个非常简单,上次我推荐那个 o b 去启动这个 cloud 的 时候,小伙伴问我如果有中转站或者是有其他的是怎么去配?我们这边需要用到一个工具,就是这个 cc switch, 可以 在这去下载适合你的这个版本, 像我这个就是 windows 版本的。我们今天免费用这个 deepsafe 是 通过这个平台摩塔的话,它免费提供一些额度,我们直接就是在我们这库里找到我们想用的,比如就 deepsafe 吧, 等它进去之后,它这儿会有一个查看代码视例,它这边就有你的 key, 你 把这个 key 复制,这是你的 key, 这是你这个 u l l 的 链接,就是对应的是这是你的 key, 这是那个链接。配置好之后, 可能有的人没有,你把这得点开,有的人会这块会被被折叠,你点开它有一个获取模型列表,可以获取到六十三个模型,我们要用的那个模型,往后看,这是 d 和 c flash, 我 们就用这个 flash 吧,它速度非常的快,我们就把这些主模型啊,这个海库啊, smartnight, opus 都配好 好之后点保存去测一下就是配置,配置好起用之后直接点可乐,他这边就运行了,所以就是大家想免费尝试的话,可以通过这个摩塔还有 cc switch 在 可乐里边使用。 ok, 那 这期视频就到这,如果各位小伙伴还有什么关于 ai 想要了解的内容,欢迎在我的视频下方留言,拜拜!

cloud code 架构解读,这个其实会稍微有一点点的这个小小的这个难度啊,但是我们会尽量的在今天晚上这个讲解过程当中呢,把这个难度降一下来进行一个讲解的介绍啊。因为 cloud code 它作为目前可以说全球最顶尖的 agent 架构,它底层的原理其实非常非常复杂,内部的这个架构呢,也非常非常复杂, 对吧?源码出来之后总共又是五十一万行啊,这样的一个很大的这个项目,虽然里面其实会有一些这个技术债在里边啊,但是其实不是很多 啊,整个源码的这个结构还是非常的这个紧凑,然后效率也是非常高的啊,所以我们才有说围绕他这个内容来进行解读的这个必要。我们今天晚上在课间里边有一个百度网盘,网盘里面就包括包含完整的 cloud code 这个项目的这个源码啊,然后呢我是给大家准备了两个 啊,一个叫 beautiful 杠 folk 的 一个原码,还有个 collection, 这两个原码像这个 beautiful folk 啊,直接打包运行,就可以直接去在本地运行一个 cloud code 啊这样的一整套原码。然后这个 collection 呢,实际上是一些更加零散的啊,一些这个原码,下面有非常非常完整的这个原码参考说明哈。大家这个领取原码之后呢,可以自己去看一下啊,这个呢是 它的这个完整这个原码,但是呢它因为它这个原码有五十一万行啊,所以呢,如果你想呃自己从头去进行这个开发啊,或者是自己来进行打包的话啊,也可以试着来进行一些这个运行啊,当然我们说如果你只是去用 clock code 的 话,那么拿它的原码或许没太大用啊,但如果你是想 去参考 clock code 的 这样的架构,然后来进行二次开发啊,那这个原码可能就很有用了。对于 clock code 来说,它总共是五十一万多行的这个代码,其实它的这个项目体量呃是非常大的一个这个项目哈, 那么在五十一万多代码里边,我相信可能很多同学就会比较感兴趣啊,那他什么这个代码会比较多呢?对不对啊?那个是不是调用模型代码会比较多呢?啊?构建一个 a 政策让他能够顺利调用工具代码比较多呢?还是用于去构建上下文的啊?这个代码比较多呢?还是要内置工具的 使用代码会比较多呢?还是他的这个内部的 skype 代码会比较多呢?那么同学其实会有这方面的这样的这个想法,但实际上啊,我们如果去看 clock 它完整的这个代码体系的话,那么你会发现它里边啊,只有不到百分之五的这个代码 是用于去给你构建一个完整的这样的一个 agent 啊,就是啊,大模型啊,这个调用某些工具啊,然后呢给它写成是一个 look, 对 不对?对不对啊?这个 agent 运行时嘛,一个这个循环,它会不断地调用这工具来完成对应的这样的一个这个工作,它里边啊,总共是只有不到百分之五代码是去写这些东西的, 剩下所有的这个代码,其实基本上全部都是 harness engineering 啊,就是我们呃上一场公开课讨论的这个内容啊,所谓这 harness engineering 要指的是它这里面基本上很多很多代码都是为了 如何让一个 agent 更加稳定,长期稳定啊,这个并且能够非常好的理解用户意图来进行一个这个运行好的,但这个其实对于现在我们在进行 agent 开发的很多同学啊,甚至是对于比如说啊,像 long chain agent school 啊,这些 agent 的 开发框架来说,都有非常好的这个借鉴意义啊,因为其实啊, 现就是呃大模型技术发展到现在,你会发现让一个模型会调用工具啊,会多用调部工,呃,会多部调用工具对不对?会一边思考一边调用工具等等等等啊,这个事情其实已经不是什么特别难的这个事情了啊, 包括现在大魔仙本身上下纹也很长啊,然后呢,工具识别能力也很强啊,在这样的情况下呢,你要去定义一个 agent 的 loop 啊,一个运行的这个循环啊,其实非常简单,你让它调用各式各样的工具,其实它也都也能够也都能够来进行很好的调用,但是呢,难就难在 很多复杂的工作,你怎么让 agent 去做呢啊?很多需要长时间啊,来进行运行的这个事务怎么样让 agent 去完成呢?很多需要非常非常长的上下文,长期持续专注去解决某些问题啊,怎么去交给 agent 来进行运行呢?这个其实才是现在我们在去使用 agent 的 一个非常大的一个难题。 那所以哈,我们前段时间公开课讲的 harness engineering 啊,这个驾驭工程啊,就指的是,哎,我们现在呢是要需要给当前的 agent 更好的一些 约束对不对啊?约束好了之后,他才能够长期稳定的去完成某一些这个工作,这其实是一个架构的这个理念。而在 cloud code 他 这次泄露的这个原码里边,我们就能够非常好的看出啊,他的这个驾驭工程是怎么做的啊?所以啊,我们 这次的 cloud code 这个原码的个泄露啊,也有很多技术人觉得说啊,这就是一个非常好的一次这个驾驭工程的落地实践的这样的样板啊,值得好好学习。 我们都知道在 a 证的运行的过程当中,其实需要他如果需要长期运行的话,会有很多很多很多问题的啊,比如说什么上下文越来越大, a 证的越迟钝,然后关掉就失忆啊,然后这个重开的 之之前的这个所有的这个记忆全全部都没有了啊,然后呢,比如说他的安全性的这个问题,对不对?然后比如说他的在伴随着运行的过程当中啊,他的这个实际的运行成本是限性增长啊,并且呢他其实会有个海量的啊,这个知识方面的这个商增啊,非常迅速的这个知识方面商增的这样的过程啊, 那么这些结都是会去影响一个 agent 的 长期稳定来进行运行的这样的一些这个不利的影响因素啊,那么其实从 code 完整的架构里面我们就能看得出来,哎,他呢是怎么去考虑解决的啊?解决这个问题,那么其中呢,既有一些 我们现在通用的啊,知道的一些这个解法的代码层面上的实现啊,同时呢他也会有一些啊,这个我们可能之前不太了解啊,甚至都没有听到过的 一些这个方法啊,来进行这个实现,等等等等啊,那么我们接下来在接下来的课程里面都会来进行一个这个介绍,那么这部分工作之所以会非常有价值的一个原因啊,其实也是因为大冒险本身啊,他的这个模型或者这个算法 导致的他本身运行的这个不确定性。那么我们在使用大模型的时候啊,其实经常啊,大家会觉得说啊,我们运行一个同一个任务,运行多次,他的结果不一样,我们在使用大模型的时候,很多时候都是在类似于像绝经的这样的过程,哎,他这次运行效果好了, 说不定啊,我们就有很大的这个用处,那这次运行效果不好,我们可能很可能很多时候甚至希望他多运行几遍,那至于这样的场景,我们当然是希望大冒险每次运行都能够长期稳定的,对不对啊?运行的这个很好啊,所以这才是所谓的这个驾驭工程的这样的一个啊,他的核心的这个出发点啊,跟现在这套技术最有价值的这个地方啊, 当然如果类比,比如说现在很多的一些这个啊,视频啊, ai 生成的这个视频的这个领域,它现在不仅仅是说啊,在在在什么这个提示方面会有些优化啊,甚至还出现了类似于这个抽卡这样的个流程啊,就同一个 场景啊,同一段故事啊,他可能会生成很多遍啊,然后你去找那些生成效果最好的那样的一些这个内容啊。当然我们想,如果你可以通过驾驭工程啊,假设类似这样的场景能够让当前这个 a 阵子长期稳定的去生产对应的这个结果的话,那么其实这个过程中间你要省去的成本或者提高效率就非常的可观了。 所以这就是我们接下来啊,需要去看现在的 cloud code, 它的这整个架构,或者我们通过今天晚上这样的一个学习啊,最后能够收获到的啊,最可贵的这样的这个知识和内容。哈哈,好,那么接下来我们就来看看啊,现在的这 cloud code 的 整个的这个架构啊,长什么样啊?以及呢,我们怎么样去啊,它,它是怎么样 很好的去引导当前这个 agent 长期稳定高效的就产出基金的这个内容的,对不对啊? ok, 好, 那么首先哈,我们会先,我们会先从一个 很简单的一个这个代码,呃,一个这个 demo 入手啊,跟大家来进行一个讲解的介绍啊,这也是考虑到我咱们今天晚上可能有一些呃,之前零基础的这个同学啊来听课, 那证明我们学上是借助了一个项目啊,叫 learn cloud code 啊,这个项目啊,这个项目其实是一个大家如果想要去深入学习 cloud code 的 每一个技术细节的话,一个非常不错的一个,呃,之前是一个逆向 去拆解 clock code 的 一个这个项目啊,然后现在呢, clock code 的 原码卸灭了之后呢,这个项目也火了啊,因为他很多之前对 clock code 的 一些这个猜想是对的啊,呃,大概猜对了三四层吧,啊哈哈,剩下的都都 不太对啊。然后呢,在这个项目里边其实有很多的一些围绕 cloud code 的 一些基本的底层功能的一些 demo 级的这样的实现啊,所以呢,我们接下来呢,在进行运行的时候呢,也会采用啊这个项目里边的一些这个代码给大家来进行演示啊,就是出于一个教学或者零基础理解这样的场景下,哎,我们看看 agent 是 怎么运行的,它会有什么样的问题,以及如何来进行解决 好,那么首先哈,我们需要知道当代 agent 在 进行运行的时候,其实它的这个呃整体的这个运行逻辑或者核心股价其实非常非常简单啊,就是一个呃能调用工具的这个大模型啊,加上这个 c m d 命令行工具啊,基本上就构成了我们现在看能看到的所有的 agent 最核心的这个股价。 那么所谓的这个 cmd 命令行这工具哈,它呢,实际上啊,就是一个这个 tour, 对 不对啊?这就是一个工具啊,然后呢,这个工具呢,它可以操作你当前的环境这个命令行,然后你只需要给它输入命令,然后它就可以自动来进行执行,你可以这么来进行理解就可以了。那这个工具之所以会成为当代 a 阵的最为核心的这工具, 大家想一想嘛,啊,你用这个 openclo 是 不是你动不动让它什么生成个文件啊,这个整理个桌面啊,啊,做这个事,做那个事啊,阅读下自己的这个记忆啊,修改自己的记忆啊,它背后怎么来进行的,基本上都是靠 这个命令行来进行实现啊,命令行就是操作你当前这个电脑最为核心的这样的工具啊,那么呃这个呢,是第一个,那么命令行工具在上面这个项目里边啊,回大家可以自己 在我们的课程的课间里面能找到哈这样的这个项目,然后里面有这个代码啊,让大家看一下啊,命令行工具,一个典型的命令行工具定义长什么样?然后同时呢啊,关于这个核心的 agent 在 运行的过程当中,它的核心功能其实都是通过一个叫做 agent loop 的 这样的工具来啊这样的一个形式来实现的啊,稍等 大家课间放大一点。然后呢,所谓啊这个 agent loop 呢,它呢实际上就指的是我们在进行调用的时候啊,啊,在大模型的工具的这个时候啊,基本上它就是属于一个啊 循环的这样的状态啊,那么这个循环它循环的是啊,我这次在进行工具调用啊,在这个看它能不能成功啊,如果成功了的话,我们就退出这个循环啊,给用户一个答案啊,如果成功了的话,我们就退出这个循环啊,给用户一个这个循环啊, 当然我们一会去看 cloud code, 它其实也是哈,那这个它里面这个源码其实也是一个这个 loop 啊,也是一个循环这样的概念。那么现在为什么啊?这个 agent 运行的这个核心本质上就是个 loop 啊,也非常重要的原因是因为现在的大模型性能都非常强 啊,如果是早几年的这个大模型啊,比如说二四年的那个大模型啊,那个时候呢,大模型这个不说调用工具稳定不稳定吧,如果你是把它放到一个 loop 里面来进行这个循环的话,那它就完蛋了哈,因为它根本不知道自己什么时候该停下来, 但是呢,对于现在当代大冒险来说,他其实都会有个非常清楚的这样的一个认识啊,一个呢是对用户的意图更加深刻的这个把控啊,那么除此之外呢,他也有一套自己啊非常清晰的去判断,关于说,哎,我现在运行到这个什么程度,或许需要停下来啊, 这样的一个这个状态啊,所以呢,基本上核心的这个 a 阵,它都是在一个 log 里面来进行运行啊,就是不断不断不断的尝试这样用各式各样的工具啊,去完成当前用户的提出这样的问题啊,完成了之后呢,就跳出这个循环啊,或者失败了很多次之后,觉得自己没必要再试了,也可以跳出这个这样的个循环啊,否则就一直在循环里面来进行。 那么有了这个 log 啊,然后呢又有了这个命令行工具之后啊,那么接下来啊,我们说你的这个 agent 啊,就属于一个基本成型的这样的一个这个状态啊,因为它可以持续不断地调用命令行,去完成各式各样这个操作啊,当然这个其实也是 cloud code 啊,里边核心源码的这个部分啊,这里面大家如果感兴趣的话,可以在这个 呃, beautiful s r c 的 那个文件里边能够去找到它完整这个源码啊,然后呢,这部分的它的内部的 agent 运行的这个源码核心代码呢,是在这 q r 点 t s 里边啊,大家可以去看一下, 发现啊,它其实也是一个也是一个 loop, 对 吧啊,它其实就是在不断的调用当前的 cloud cloud 这样的模型,在进行一个这个循环啊,差不多是这样的一个这个情况, 所以啊,你会发现,呃,整个的啊,我们当代的 ag 的 核心呢,就是要需要构建好这样的个 loop 啊,当然我们这一期讲的会比较简单哈,真正在构建 loop 的 时候,你可能好歹得用些这个工具啊,得用些这个框架啊,然后呢辅助你更好的去完成这样的这个 loop 啊, 这里大家可以自己去试一试啊,我们上面给大家给出的这个原码啊,就是上面呃,我们这个教学视力的这个代码啊, 就 learn cloud code 啊,这里面这个代码,大家可以自己去尝试着去用用,看一看啊,感受一下啊,他现在整个的这个核心的这个路谱呢,大概长什么样啊?你现在呢,让他呃这个执行简单的任务,他就是一步啊,这样工具结束了啊,如果让他执行复杂任务,他可能会 多部啊来调用这工具啊,但总之呢,有了这个命令,行啊,有了能够啊,有了这个能够调用工具的这个大模型啊,再加上一个路谱啊,基本上我们的 agent 的 核心呢,就这么构成了啊,是这样的这个情况, 当然哈,我们去构建这样的 agent 的 这个核心啊,大家肯定会想啊,那呃,他肯定会有些不太够的地方,对不对啊?你好歹给他多整一点这个工具啊,给他搞一点这个复杂的上下文啊,等等等等, 那我们说所有的啊,其他的这个 agent 的 这个架构,基本上都是以这个为核心去进行那些功能的这个拓展,我们这也就不展开了来说了,但是大家需要知道的是一个基于 look 啊和啊基于这个命令行为核心工具的这样的 agent 的 体系,它其实会面临很多问题的啊,我们接下来主要是看它会有什么样这个问题,以及呢 cloud code 到底是如何来进行解决的? 那么他会有哪一些问题呢啊?首先第一个就是上下文会不断的增加,对不对啊?这其实是非常明显的一个这个问题啊,也是我们在实际对话过程当中迅速就会遇到的这样的这个问题啊,上下文会越来越长, 越来越长,并且呢伴随着像现在啊,我们很多比较复杂的这工具在进行调用的时候啊,他这个上下文呢,实际上是会呈现这个指数级的这个上涨这样的情况, 上下文一长啊,其实就会带来很多的非常致命的一些这个问题哈,就比如说一个呢,是模型的啊,他会有个上下文的这样的窗口啊,超过这窗口他就没法来进行运运行了,必须要去裁剪一下之前这样的记忆啊。那么第二个呢,是 伴随上下文越长啊,其实模型的注意力呢也会被稀释掉啊,这就是所谓的现在我们在去使用,比如说 color code 呀,或者是大家去用很多的一些大模型,你会发现前半段啊,运行的还很好啊,愿意去生成一些很长的这个结果。到后半段 啊,尤其是这个模型快到自己的上下文窗口的时候,他就开始疯狂的输出啊,对不对啊?也不管这个输出对不对啊,或者质量好不好啊,甚至是这个给你乱输出一通啊,总之就是会迅速在短时间内把这任务给结束掉啊,这就是所谓的当代大模型的上下文焦虑,哈哈,会存在这样的这个问题。 那么第二个就是对于每一个 a 阵在这运行的过程当中啊,他其实会存在关掉就失忆啊,重开全部知道啊,这样的这个情况啊,但是这个情况 大家都能理解,对不对啊?因为上下文没了嘛啊?但是呢,我们说在当代的 agent 的 这样运行体系里面,为什么这点会变得非常重要啊?其实是因为我们现在的很多 agent 在 运行的时候,它往往不是一个 agent, 它是很多个 agent 啊,这个时候呢,它我们在实际执行任务的时候,就需要非常合理的给不同的 agent 啊,给他来进行非常精密的上下文,这样的匹配才能够迅速的带入到自己的这个角色里面来啊,来完成运行啊。所以呢,对于现在的 agent 运行过程当中来说啊,我们说合理的给他匹配上下文也是非常重要的一个方面。 第三个就是安全方面这样的问题,对不对啊?那安全方面问题呢?呃,之前我们在讲 cloud code 啊,讲 open cloud, 其实有讲到过啊,就是由于你现在啊 这个 a 智能很厉害啊,对不对?他自个又很聪明哈,然后呢,他又有智慧啊,又可以操作命令行者工具啊,对你各种环境的一通操作哈,那么这个时候呢,呃,他这个安全问题就会变得非常重要啊,因为他一不小心把你什么关键文件给删了哈,对不对?那这个事情就很尴尬了啊,所以呢,对于现在的这个 a 智能运行来说,安全其实是一个很大的 一个这个需要考虑的一个方面。那么 agent 的 安全哈,跟传统的软件安全还不太一样啊,传统的软件安全,它其实是可以通过一系列这个测试给它测试下来的哈,就去看啊,关于啊,你在各个场景下你的所有功能是怎么样来进行运行的,一个一个来进行安全测试,测试完了之后就可以上线。 但是对于大模型来说啊,它呢是一个有智慧的工具啊,那么呃,你引导它去工作啊,那么也可能会它呢也可能会被别的一些信息给忽悠瘸了啊,这个时候呢,你就得这个想办法,对不对啊?这个用魔法,对方用魔法对抗魔法啊,才能够解决大模型的安全性的这样的问题。 我们现在说 open cloud 啊,这个很多的安全性问题,非常的这个显著,有很多隐患需要来进行修复。但实际上呢, cloud code 啊,它作为目前非常通用的这个智能体, 他的安全的这个级别是非常高的,他也是之前经历了很长一段时间安全啊,踩坑啊,甚至被竞争对手殃流啊,这样的这个情况之后啊,现在他才这个逐渐逐渐逐渐提升了啊,他的安全性,这样的这个啊,提升他的安全性的一些这个措施,那么现在啊卡扣的的安全的很多措施我们会看啊,其实还是非常精彩的。 那不管怎么样,我们说对于安全性这个问题,哎,它其实也是属于,对吧?啊,整个 agent 在 进行运行的过程当中啊,这个我们是要时刻关注的啊,就比如说这里面我们现在给大家的这个视力代码里边啊,这个不是呃,这个不是 clock code 的 这个原码哈,这是我们给大家视力代码里,比如说 一些就包含了一些非常基础的安全性啊,这样的一个解决这个问题,比如说啊不让他去使用什么 r m 杠 r f 这样的这个命令啊,还有这个什么 s u d u 啊,这个全部权限这个命令啊,还有这个杀档啊,关闭某些东西这个命令等等等等啊,会有这样的这个提示啊,等等等等。 当然啊,还有一个非常重要的一个这个问题啊,就是他其实 a 阵的运行的过程当中啊,尤其是一些长效长期这样的问题,会带来巨量的知识的,这个 商真啊哈,那么你运行的越多啊,关联的文档就越多啊,他你现在需要处理的这个局面就越就更加的这个复杂啊,他其实是会出现一个非常巨量的、非常快速的这个商真这样的状态, 这个商真这个状态哈,其实会很大程度上啊影响你未来 a 智能是否能长期稳定运行的一个这个点啊,这个其实并不是在于说我现在啊,这个每次带货量我就越多了,然后我付的钱就越多,并不是这样,而是他整个的运行的稳定性 就会遭到巨大的啊,这个呃影响啊,那么就比如说啊,我们这个 agent 的 look 对 不对?在运行的过程当中呢,你会发现啊,这个运行的运行的,运行的每一轮 talk 就 越来越多啊,当然浅层次的呢,是你的费用越来越多啊,但是这个深层次的呢,是伴随着你当前 agent 的 这个商增啊,你其实你的稳定性会受到很大的影响。好, 那这问题怎么解决呢啊?我们接下来其实哈整,如果你去纵观整个 cloud code 啊,它的这些原码,基本上它就是围绕着这 四个问题啊来进行的这个展开啊。我们其实今天晚上的公开课并不会啊,直接去贴一个啊,比如说 clock code 完整的啊,这个什么几十个这个,呃,几十个不同的核心的这个主类啊,还有上百个啊,这个子类它的功能对比的这个表啊,这个其实意义不大啊,我们更多的希望大家能够通 过我们接下来这个解读啊,能够看得出来这个 clock code 是 怎么样啊,去实现这个 harness engineering 的 啊,以及呢我们现在这个 clock code 到底是啊作用于它的核心架构,对我们开发人员来说,它到底是能够解决哪些问题? 那么接下来啊,这个原码这个层面,其实就,呃基本上啊整个扣的这个原码层面都是围绕的我们刚才所说的这四个方面啊来展开的啊。当然大家如果想去看他完整这个原码的话,那么其实呃上面有原码,上面完整这个原码大家可以自己去拿,自己荡下来之后去可以去看一下啊,那么总之呢,现在他总共呢是 五十一万多行的这个代码里代码文件啊,然后总共呢是一千九百多个这个,呃五十一万行的代码啊,主要是 t s 的 这个代码,然后呢差不多是一千九百多个这个代码的这个文件,那么它总共的各式各样的分类呢?差不多是这样的这个情况啊,与它 模型 api 交互的核心代码,差不多是八千行啊,然后呢?这 curry engine 啊,推理引擎啊,差不多是这个 四万六千行啊,然后呢?工具系统啊,还有四十多个工具这个模块啊,差不多三万行代码啊,然后呢?什么这个终端 ui 渲染啊,差不多是两万五千行,剩下的这所有的哈,尤其是这个什么工程基础设施啊,总共有三十六万行代码,剩下这些所有的基本上都是为了啊,让当前这个 agent 给它约束,好 让它更好的去呃,这围绕长期这个问题来进行解决啊,所以呢,你会发现对不对啊?差不多这个百分之九十八啊,都是这个 harness engineering 啊里面相关的这个内容啊,这个呢,就是它完整的项目的这个代码,大家可以自己当下来去看一下,然后下面呢也有关于它的这个代码的 一个基本的这个分布物啊。好,那不管怎么样,我们接下来就来看看到底是怎么去解决这样的一些这个问题的啊,就是怎么去借助这个 harness engineering 这个架构呢,去解决它现在的这个啊,现在 a 证的长期稳定运行的这样的一些这个问题的 啊。当然其实讨论到这 harness engineering 这个的话,其实我们之前是呃有单独讲到过哈,这个 harness engineering 的 这个内容 哎,稍等,我们这个图它裂了啊,我们其实之前有一期公开课专门是讲到过啊,它内部的这个整个的这个 harness engineering 的 这样的一个这个呃基础理论,那么 对于 android big 来说啊,他会觉得整个的啊,这个按整个去构建它的这样高性能这个智能体,我们基本上是需要做好以下这么四个方面的这个工作啊。这个是它的第一版的这个想法。第一个呢是 context engineering 啊,就它上下文工程啊。第二个呢是 啊,我们如何协调内部的 agent 工作流和他的这个决策流程啊?第三个呢是提供高质量的工具接口跟工具描述啊。第四个呢是做好他的安全行为边界这样的个约束啊,差不多是他最开始啊是有这样的一套这个理论体系,这个是他自己的这个博课里面,这个呃博课里面来进行的这个介绍哈啊,当然这个理论其实说起来会比较 呃枯燥,我们接下来直接去看它到底是怎么做的,对不对?我们直接去看它这四个方面啊,到底是如何去解决的啊?那么它整个的 harness engineering 基本上就是集中在这四个方面的工程的实践。一个呢是所谓这个约束工作台啊,专门去进行上下文管理啊。第二个呢是它的这个记忆方面的这个管理啊,它呢是分成了三层来进行记忆管理, 这个记忆管理不仅仅记忆存储哈,还涉及到非常复杂的这个记忆处理的相关的这个内容。然后同时呢还有很多众生防众生的这个防御啊,和它如何来进行成本啊?这是 talking 消耗方面的这个成本的这个约束,我们先来看一下啊,是如何来进行实现的, 当然我们说对于整个的卡扣的来说啊,它的这个整体的这个架构啊,这个我们简单提一句啊,这个我们这个大家感兴趣可以自己去看一下,它的整个架架构其实分为五层的,分别是入口层啊,是是运行层、引擎层、工具能力层、技术设施层啊,差不多是分为这么五层的 啊,这个内容啊,但是入口就指的是它的所有的可以调用的啊,给它来进行信息传递的这样的这个接口,有一点像 opencloud 的 这个 getaway 啊,这样的一个这个系统啊,因为其实对于现在的 cloudcode 来说啊,它呢是可以 在,就比如说这个啊, kelly 啊,对不对啊?命令行里面来进行调用,可以在 id 里面调用,也可以使用这 sdk 啊,也就是这个 opencloud 啊, cloudcode, 不好意思啊, cloudcode 官方他们推出这个 sdk 对 不对啊?来进行调用等等等等。 然后同时啊还有这个运行十层啊,这个运行十层其实主要就是我们之前所说的啊,它的这 agent look 啊,这样的一个这个环节啊,只不过呢它的运行十层里面还包括啊,比如说这 r e p 啊,交互式的这样环境,还包括啊这个后壳的一些这个钩子,还包括它当时运行的过程当中状态的管理等等啊,这个呢是所谓的运行十层,那 再往下啊,就是这个推理的这个引擎层,对不对啊?主要是 q r n g 呢的管理以及呢 compact 非常非常重要的关于上下文压缩的 这样的一个工作的啊,这个实现,然后再往下啊,就是关于工具和能力层啊,内部工具怎么样进行实现,怎么通过啊?插件来进能力拓展啊,还有 m、 c、 p 跟 skill 如何来进行接入, 多 agent 啊,如何来进行复制和分发啊等等等等啊,相关这个内容啊,再往下还有更加基础的一些基础设施啊,什么什么的存储的格式啊,还有这个缓存的这个内容啊等等等等啊,这怎么一系列的这个总共啊,是这么五层啊,来进行的一个架构,当然我们这里啊,接下来重点是来探讨关于它的引擎层和工具能力层啊, 这两层呢,就是主要去解决我们上面所看到的这四个方面核心问题的啊,这两层的这个基本的架构 ok, 行啊,那么首先啊,第一个我们先来看啊,他的上下文是如何来进行管理的, 这个呢,其实是涉及到我们上面啊,关于这四层里边第一个啊,关于约束工作台啊,他的上下文管理的第一个模块的一些扣扣的一些这个措施。那么首先啊,这张图其实非常形象哈,就是它的适用于来去描述啊,关于你现在的 a 证在进行运行的过程当中啊,可能最开始 运行的还不错,对不对啊,是一个非常整洁干净的这个宽敞的这个桌面啊,运行了一段时间之后呢啊,这边乱七八糟啊,你就根本不知道如何进管理它整个的 a 阵呢,进行运行的过程呢,它的这个性能也会下降啊,这是一个非常形象的这样的比喻, 当然我们这里是以以两百两百 k talk 为例来进行的这个说明哈,实际上最新的这 cloud code open 啊, cloud open 四点六,实际上已经是全面升级到一兆风向文了啊,相当于是拓展了这个五倍, 那么这对于这个上下文来说哈,首先啊,两百 k 肯定是一个这个硬的这个极限,然后同时呢,大家也需要知道是他的这个整个 agent 啊,在进行运行的过程当中,他只要啊超过了差不多百分六十之后,他的整 个模型的这个注意力啊,实际上就会被稀释掉啊,也就是他的这个呃呃,他去进行长段内容的输出的意愿就会下降啊,然后同时呢,他对于之前的很多内容的记忆呢,也会下降啊,是那么一回事, 所以哈,也是因为他存在这两方面硬的杠杆啊,一个呢是他两百 k 只有那么长,或者一照他只有那么长哈,那么第二个呢,是你伴随增加的越多,哪怕你没有突破他的这个呃,最大上下纹的这样的限制啊,实际上他也会系的越来越模糊啊,也是因为这有这两层的这个限制,所以呢,我们才需要非常谨慎的啊,给每次的 运行啊,去构建一下上下文,对不对啊?那么在我们现在这个视力项目里面,就是这个 learn cloud code 啊,这个项目里面呢,它呢实际上是提供了一个叫三层压缩的这个策略的一个简单的代码的这个实现,具 体代码实现啊,上面有这个对应实现的这样的脚本啊,大家有感兴趣可以自己去这个运行一下。那么总的来说呢啊,我们说在一个简单的环境下啊,注意哈,一会我们会说哈,这 cloud code 实际上是这个五层实现啊,在简单的环境下啊,实际上大家需要知道是,首先呢是有这么三层的 这个压缩的这个策略是可以来进行选举的,第一个呢叫做微压缩 micro compact 这一点啊, cloud code 也有,那所谓这个 micro compact 它呢实际上指的是我运行很多轮之后,我就把之前的工具调用这个结果给它删了啊,是这样的这个情况, 那么呃,这一点其实也可以理解哈,因为很多时候我们在进行工具调用的时候啊,工具返回的信息其实是非常非常多的啊,就比如说我们查询的天气对不对啊?使用什么 api 查询天气,那么这个时候呢,那他在这个实际工具返回回来这个信息会很多,但 但是呢在当时那一次的绘画过程里面啊,你就必须得包含这一个工具返回的这个信息的这个内容啊,因为它需要依据这个内容呢给用户来进行回复,但是呢伴随着运行的时间越长啊,那么之前的工具 加载这个这个加载的这个内容呢,可能就不是那么重要啊,所以呢我们就可以把它删掉。一般来说呢,是在三到五轮对话之后,那么之前的工具调用这个结果就可以直接把它删了啊,这个呢是指的是这个微压缩,那微压缩基本上是一种无损的一种压缩这样的方法哈,因为毕竟那些工具调用这个信息可能也会不变的,不是特别重要,但这里有一点其实是需要这个, 那这需要说明的一点就在于说我们现在去使用一些 agent 的 skill 啊,大家都知道啊,这个这个 agent 的 skill 啊,它呢是一个灵活自动加载加载的这个上下文,它是一种提示增强了这个策略啊,有了这个 skill 之后呢,这个模型啊,它就它就具有某方面这个能力了。但是这里呢,需要知道的是这个 skill 的 这个加持啊,它呢实际上 也是通过外部工具这样调用啊,通过这个 function response message 的 方式加载到当前的上下文里面来的啊,所以你的这个 skill 啊,它也是会伴随着我多对话几轮之后,它之前你加载调用过的那个 skill 就 忘了啊,会存在这样的这个 情况啊,所以呢,这也是提醒我们在使用 cloud code 的 过程当中啊,你如果你总是需要某一个 skill 啊,你下一次再进行运行的时候,那还需要再把这个 skill 加载加载进来啊,因为它运行两轮之后,就会把之前加载进来这个 skill 给它删了,以维持上下文的,这个对不对啊,不要太长了这样的状态,这是第一个, 第二个呢就是关于自动压缩啊,第三个是手动压缩啊,当然这两种压缩呢,其实呃,都是这个压,都是呃这个同一套流程啊,只不过他们各自压缩的这个方式不一样啊,这种压缩往往是采用这个摘药这样的个形式对之前内容来进行个总结啊,你可以 这么来进行这个理解啊,只不过呢,一个呢是到达预知之后自动来进行处罚,一个呢是手动来进行处罚啊,但是总的来说它都是 compact 这样的过程, 那么这三种压缩策略可以说是非常典型的啊,也非常呃,这个非常通用的啊,这么个压缩策略啊, cologold 是 这样啊,我们现在这个势力项目是这样啊,然后这个 open cologold 也是这样啊,基本上都是这样的一些这个压缩这个策略啊,这种其实属于 一个非常通用的啊,压缩这样的方法。当然啊,下面其实还有啊,具体的代码实现的这个过程啊,大家感兴趣啊,可以自己去运行一下,我们课程就不展开讲啊,因为 cologold 它这个架构内容很多啊,很多手动实践的内容,大家可以去进行实践一下, 然后具体它的 compact 啊,这部分的这个内容,尤其比如说我们刚刚说不是说这个 micro compact, 对 不对啊?这个运行几轮之后,把之前的这个工具栏给它删了哈,这个,呃部分这个源码呢,是在这个 service, 在 s r c 啊,然后呢 services 啊,下面 compact 啊里面这部分这个内容啊,你看它这个 compact 啊,光是这 compact 就 有这么多 哈哈的这个内容啊,这个其实这段原码非常精彩哈,因为之前很多同学一直在问啊,说 cloud code 它是怎么样来进行压缩的,为什么感觉我们会感觉 cloud code 压缩了之后呢,效果性能非常不错啊,跟这个普通的比如说 open code 压缩之后,他基本上记不得之前的这样的信息了。那么其实,呃,大家如果对这种感兴趣的话,就可以看一下啊,它这个 compact 的 这部分原码里面到底怎么写? 这部源码其实非常复杂,它还包括一些康啊,一些这 compact 过程当中的一些这个 prompt 啊,它内部的这个 prompt 是 怎么写?因为它在进行压缩的时候,其实并不是一个机械的压缩的过程啊,由于它需要涉及到这个 summary 嘛,所以呢,它是内部会调用这个 sanate 那 个模型,就中杯那个模型啊,来围绕你之前的这个信息内容来进行一个提取,来进行一个格式化的这个提取, 同时呢,他还会留下你最近那几几次对话的这个 to do list 啊,就是没有完成这个事项,所以呢,你才会觉得说啊,一方面他好像也记得之前这样的事情,一方面又帮我腾空上下文啊,同时呢还能够顺着你这 compact 的 之前的这个事项来进行运行,哎,感觉非常不错啊。其实这样的一个这个原因在里面啊, 这里面大家看的清楚的话,可以自己去看一下啊,这部分,这个原版啊,这部分其实还还是非常精彩的哈,当然就对于 o o cloud code 来说啊,它会啊,什么最近三个工具这个结果不压缩啊,之前都压缩啊,是不是这个 读文件的这个结果永远不压缩啊,然后呢,这个因为这个读取进来这个内容嘛,所以不能压缩,等等等等啊,有很多这个具体压缩规则啊,这个呢是第一个 micro compact, 这个呢叫做自动压缩啊,自动压缩就是指的到达预值之后呢,哎,自动给它来进行压缩啊,当然这个 auto compact 啊,在这 compact 里面啊,在 cloud code 里面也有对应的这个原码,对不对啊?到达预值之后呢?哎,自动的啊,来进行一个这个 来进行一个压缩啊,这里面有非常多的啊,它这个什么预值的这样的一个设计啊,然后呢啊,到多少的时候就来进行触发,等等等等啊,一般来说啊,差不多在百分之八十 到九十左右,它就会触发自动的这个 auto compact 的 这样的过程啊,它是不会到百分之百才进行触发的啊,因为它在它在进行,在在进行最后的 compact 过程当中,它还需要腾出一部分上下文来围绕之前内容来进行一个总结啊,所以一般来说是百分之八十,百分之九十啊,当然我记得最新的这个呃 cloud code 也是呃 二点一点九零这个版本啊,应该是百分之九十二啊,作为预值啊,这个大家感可以感兴趣的话自己去看一下啊,然后呢来进行一个这个压缩啊,差不多这么样的情况,然后除此之外呢,还可以手动压缩,对对,手动压缩跟这个自动压缩跟这个 autocap 的是有一样的这个过程啊,只不过的手动手动压缩呢,是通过 这个斜杠命令来进行的这个触发哎,然后呢它这个手动压缩呢,跟这个 auto compact 啊,基本上是完全一样的这个流程啊,只不过它是允许你在任何时候啊都来进行一个啊 compact 这样的一个操作啊。当然其实如果你不需要这 compact 的 话,你可以直接杠 clear 就 把它删了啊, 这个也是可以的。好,那上面呢是关于这个 open cloud 啊,关于 cloud code 啊,它的一些基本的一些实现方法啊,就我们刚刚所说的 micro compact 啊,然后呢 auto compact 啊,还有这个 menu compact。 那么除了这几种 compact 之外啊,我们说其实 oppo 还有很多的非常精彩的关于它来进行压缩过程当中啊,一些这个啊,所谓的这个防御策略啊,或者说它在压缩过程中可能出现的问题,如何来进行解决啊?你可以这么来进行理解 啊,这里也有四层压缩防御策略。首先啊,第一个肯定是 oppo compact 啊,它会临临临临近上下文的时候呢,自动啊来进行触发。然后呢, oppo 这个 micro compact 当然也是啊,全自动的来进行一个这个触发啊,但是呢,我们说你 compact 可能会 存在一些这个问题,对不对啊?所以呢,当它当它你的 compact 没有办法来进行这个 summary 总结的时候啊,它还会有一个叫这个 reactive compact 啊,这样的这个流程啊,指的是 api 调用,呃, api 调用这个 sunny 的 这个模型 api 来进行 summary 的 过程当中,如果报错了啊,它呢就会啊,这个触发叫所谓的啊,这个 reactive 啊,叫呃 reactive compact 这样的这个流程。 而 reactive compact 这样的这个流程啊,它呢,实际上一旦出发了之后,它就会使用这个 snip 的 这样的方法啊,直接呢大刀阔斧的啊,来进行一些这个压缩啊,或者直接删除上下文啊,这个呢,是有可能来进来这么来进行操作的。 它一般来说哈,这个 reactive compact 其实并不会特别常见啊,因为其实对于现在的这个 sna 的 这个模型的调用来说,相对来说还是比较保险啊,但如果确实是没法出现的话,它就会使用这个 snip, 对 不对啊?来进行一个简单粗暴的啊,这个 完整的呃,大段大段的原始内容的这样的一个这个删除啊,当然在 compact 过程当中呢,它还会出现这个啊,出现一些这个循环啊,因为 compact 的 内容呢,很有可能再次被 compact 啊,这个呢也是有可能的啊,然后呢 它对于啊这个地规呢,还有一些地规的这个防护啊,所谓地规防护指的是我上一次 compact 的 这个内容,这次呢如果按照正常 compact 的 这个过程来说的话,它呢可能会被 大幅的这个降低权重啊,但是呢之前 compact 的 内容往往它可能是比较重要的这个内容啊,所以呢它在下一次 compact 过程当中啊,会尽量的保存你上一次已经 summary 之后的啊,这样的一些这个内容啊,是 这么样的一个这个情况,但是这么样的个情况大家也能够感受到,对不对啊?它迟早有一天会 compact 不 下来啊,就是我们的 compact 之后呢,你的上下文并没有压缩特别多啊,这个时候呢可能就会触发我们上面所说的啊,叫做这个 reactive compact 这样的这个流程啊,它就可以开始给你直接删了啊,是 什么样的这个过程啊?所以呢这个 reactive compact, 它不仅这种是 api 要用调用错误的时候可能会触发啊,你这个 compact 不 下来的时候,它也可能会进行触发, 对不对啊?然后呢这里面啊 compact 这个代码大家可以自己去看一下啊,总之呢这都是在这个原始文件里边啊,然后同时呢除了啊它的 compact 这个策略之外呢,它还有啊叫五步流水线的这样的一个这个处理策略啊,这个呢实际上是它的每一次消息在进行构建的时候,它还会走一遍这样的这个流程啊, 这个流程呢跟上面这个流程其实很多是重复的哈,只不过上面这个流程呢是呃跟着你现在到达某一个预值或者手动输入一些斜杠命令来进行触发啊,来进上下文字压缩。然后下面这个流程呢,实际上是你每次在 在构建这个 system 啊,在构建你的这个 message 的 过程当中呢,会这么样啊,来进行一个这个处理啊,这个呢,大家可以啊自己来去看一下啊,那么其中呢 compact 也是一样的啊,因为你 compact 不 仅仅是在到达预值的时候会会这么来进行一个处理啊,你每次构建构建上下文的时候,它也会啊来进行一个啊简单的一个 compact 的 这样的过程。 然后同时呢啊这里有一些非常有趣的一些地方在于说对于当前的 cloud code 来说,在某些情况下啊,它呢实际上是会把你输入的问题来进行一些重写,可以进行一些优化的啊,这个呢其实是一些 非常细节的一些这个点啊,然后呢他会觉得你这样的这表述其实是会存在一些问题的啊,所以他会对你当你的这个原始这个问题呢啊,来进行一些这个优化啊,当然他也会有这个 prompt catch 啊,对吧?啊,提示词缓存的这样的个策略啊,提示词缓存我们会放在后面统一来讲啊。那总之呢,大家需要知道的是啊,它的这个 compact 啊是 怎么做的啊?然后呢啊,它这个整个的啊,是如何来进行上下文的啊这个压缩的啊?当然其实啊,不管怎么样啊,我们说 compact, 它呢肯定是进行有损的啊,肯定是这个有损类啊,肯定也是这个不可逆的啊,因为之前其实经常有同学会问到啊,说这 cloud code 啊,这 compact 跟是不是这个无损这个压缩啊,但其实只要是压缩它就是有损啊,这个其实 啊不用考虑啊,它肯定是这个无损啊,只不过呢,对于现在的啊这个 cloud code 来说啊,它呢其实并没有采用像 openclock 啊这个 rack 解锁这样的一个这个方式啊,它呢实际上就是单纯的压缩,压缩完了之后呢,把所有上下文带入来进行压缩 啊,代入呢来进行一个这个问答。而啊,就比如说像,呃,这个,呃 open clock 啊,它呢实际上是先它是,它呢实际上是超过了预值之后呢会对它的这个 memory 啊,来进行这个 red 的 这个解锁啊,是这么样的一个这个这么样的这个情况,这 两者他们的技术方案呢,实际上是有区别的啊。当然其实就目前的实践情况来看,如果是普通用户在进行使用的话,肯定会觉得这个 clock code 其实会更加的这个友好一些, ok 啊,怎么样这个情况? 那当然下面还有一些具体的这个细节方面的这个展开的这个说明哈,我们就不继续来进行讲解了啊,大家感兴趣的话自己看一下里面的这个文字。好,然后呢,有一个非常有趣的地方,我们刚刚不是说到 这个 cloud code 啊,它呢实际上是会对用户输入这个内容啊,你在构建上下文的时候,它就会来进行一轮感知,甚至是来进行一些这个修改啊,甚至是把一些重要或者不重要上下文的来进行加载和这个删除,去构建你当前这一次绘画的这个 message 这个列表,这里面操作非常多哈,我举一个小例子啊,大家能感受到它是怎么样 去啊,做到这个非常细节的这一点的这个优化的,就比如说如果你对 cloud code 骂街了,哈哈哈啊,就比如说你说啊,这不不是,就比如说 啊,那就用户的这个情绪啊,上头了啊,对不对啊?用户觉得说啊,你这个做的简直是垃圾啊。那个你这个完全不懂我的这个意思,跟你说了多少次,然后晚上你还是做不对啊,对不对啊?就是如果用户骂街了啊,那这个时候呢,扣扣的就会自动的去检测你上下文,会发现,哎,这个时候呢就触发了啊,所谓叫做这个 沮丧检测的这个机制啊,之后呢啊,他呢实际上就会迅速的啊,来进行一个这个 经典上下文,然后围绕当前这个问题来进行快速的响应啊,他会做这样的一个这个事情啊,并且这个过程他是使用 这个呃正则呃观正正则表达式来进行的剪辑和这个匹配啊,他会有这样的一个啊响应的这个方式啊,这个呢,其实是一个小这个小彩蛋啊,这个大家发现了之后呢,发现啊,这个有这个技术人员发现这个细节之后呢,会觉得很有意思啊,这个 open club club 呢,它其实进行了非常非常多细节方面这个优化, 这个呢是第一方面这个优化啊,总共四个方面优化哈,我们讲完第二个方面,我们再啊中场休息,然后再来进行一个这个啊,再来进行答疑,然后第二方面这个优化呢,实际上啊,是更好的去每一次去 folk 啊,或者说或者说去实力化多个 agent 啊。那么这个呢,也是呃, cloud code 的 一个非常核心的 一个架构方面这样的一个亮点吧,那比如说啊,我们现在呢,每次开启这个 agent 啊,由于呢他其实并没有上下文啊,所以呢他其实什么都不知道啊,这个时候呢,你可能就需要按需呢,对他对这个上下,对当前这个 agent 来进行一个知识的这样的这个贯注,对不对? 那么呃,我们之前在讲 opencll 的 时候啊,其实当时讲过 opencll 的 内部有非常复杂的提示词模板,然后呢我们需要去组建非常复杂的内部这个提示词,然后才能够去开启一个又一个的这个一个又一个 opencll。 那么对于 cloud code 其实来说其实也是类似的啊,然后呢 cloud code 它内部呢,也是啊,每次在运行之前呢,会有非常多的啊,一些这个扫描,我们下面应该会有一个完整的一个这个层级记忆的这个层级的这个图啊,那么 cloud code 呢,是按照这样的个记忆层级来进行剪辑跟架构的。 上面哈,其实有一些啊,上面我们讲的它什么自动加载 system prompt 啊,自动加载这个 skills 啊,然后呢是如果有需求的时候才会去加载对应的这个 skill 啊,这个呢是属于所有的 agent 呢,基本上都是这么通用来进行的。这个执行我们直接看它,像它 对于 cloud code 来说,它的这个整个的新开启的这个 a 阵的记忆架构差不多是这么三层啊,第一个呢叫做 memory 点 m d 永久记忆。第二个呢叫 topic files, 按需加载啊。第三个呢叫 transcripts 啊,只只搜不加啊,差不多是这么三个不同类型的层级的这个记忆。 那么 memory 点 md 这个很明显对不对啊?每次呢它都会啊这个来进行一个加载,那么一般来说哈,呃,当然我们我觉得现在可能很多大家在使用在 cloud code 的 时候,可能压根就不知道啊,它有 memory 点 md 这样的文件,是的,这个文件不对用户开放啊,这个文件呢,是纯粹的,它内部会通过一个非常精妙的过程来去维护的一个高质量的这个记忆文件, 它不是简单的啊,你要记住什么,它就把它写到哪啊,不是这样的,它内部有一个记忆的加载、清洗、分门别类存储,然后记忆的优化,一整个非常复杂流程,共同去维护这个 memory 点 md, 所以 这个 memory md 呢,对用户是不开放的啊,你就去改了,很容易把它改毁了啊,你也不能够去改它这样的文件 下面啊,这个所谓的 topic files, 它呢指的是针对不同的这个事项啊,它呢其实是会有对应的这个存储的文件的,然后这个存储的文件是可以通过 memory md 来进行锁影的,比如说你哈记住一百件事情啊,那一百件事情可能都没有办法全部给它放到这个 memory md 里面,它就需要分门别的来进行存储,然后呢按需来进行锁影, 那么再往下啊,这个 scripts 啊,那么 scripts 呢,实际上就是关于历史的这个绘画了,那么历史绘画其实大家都知道啊,一旦我们现在在 carco 进行 compact 之后呢,历史绘画就不会再再进行加载了,但是呢,历史绘画它是会在本地来进行一个永久的这个存储的啊,所以呢,如果有需要啊,它呢实际上是会通过这个 啊, grab 这个非常简单的这个匹配解锁这样的方式呢,去找啊,你之前的历史对话啊,这也是通过命令行工具啊,直接使用这 grab 的 这样的脚本啊,就可以去匹配啊,去寻找你的一些历史对话。差不多是这么样的这个情况啊,这个呢,就是整个的啊,关于 cloud code, 它的一个永久记忆的这样的一个基本的这个架构啊,当然其实 除此之外啊,这个我们刚刚也说啊,它的什么啊, system prompt 呀,它的这个 skill 啊,也是按区加载的呀,那块其实我们刚刚跳过了啊,大家如果感兴趣可以翻到前面来去看一下啊,那我只觉得这段呢会非常精彩啊,所以呢,给大家来进行一个分享。 ok, 好, 那我们先看啊,这个 memory 点 md 啊, memory 点 md 呢,实际上都是通过啊这个 memory 的 direction 点 ts 啊,这样代码来进行的这个维护啊,它里面呢,实际上是有一套啊,非常精妙的这个维护的这个过程哈, 那么它在记忆的过程当中呢,它会不断地去识别 user 啊,不断地去啊,记住你的行为偏好啊,不断地记住你当前的这个 project 啊项目这样的信息啊,然后呢会去记住资源的位置,这个呢是它构建它当前的这个记忆最为核心的四个要素啊,当然这个四要素它实际上是会伴随着这个运行不断不断来进行加深的。 举个例子啊,就比如说我们在使用 cloud code 的 时候,其实你会有这样的感受哈,就比如说你最开始没有跟他讲过你叫什么名字啊?但是呢,如果在某一个项目里边,哎,你透露了你叫什么名字,你是在干什么的啊?那么其实哪怕你没有让他记住这个信息呢,也会啊,在他的这个漏斗状的这个筛选的过程当中,不断不断的啊被筛到这个 memory 点 md 里边 这么样的这个情况,然后呢在这样的一个啊,这个 memory 的 这个记忆的过程当中啊,它不仅仅是说会围绕这四个非常核心的记忆类型的,有针对性的啊来进行一个这个记忆,然后同时呢 它有很多的啊,一些写入记忆的一些这个纪律,对不对啊?比如说它这个这个很多时候啊是先 先进行缩影啊,再去先创建这个缩影,就是创建这个 topic 的 这样的文件,然后呢再写入到这个 memory 里边。再比如说对于 memory 来说,它呢只会解锁前两百行啊,超过前两百行之后呢,就需要啊给它进行一个这个归类,就需要来进行一个精简,就需要把它放到比如说某一个 topic 里边去, 不断不断的啊来进行一个这个精简跟迭代,然后这个呢是它的这个 memory 啊,部分的这个文件的啊,文件的修改这个流程, 当然下面其实有一段哈,就是关于它的 auto dream 啊,这个 auto dream 呢,实际上是呃整个的 cloud code 非常精彩的一个这个设计啊, 当然上面还有一个关于 cloud cloud 点 md 这个文件,这个加载啊,这个我们就不说了啊,因为这个文这个呃记忆文档,其实是我相信大家其实用 cloud code 其实都会用到过,对不对?你需要在根目录里面创建一个 cloud md 这样的文件,然后它呢其实就是你的 system prompt 啊,的一个最核心的加载的这样的这个文档。 那么呃我们现在来看啊,惯常的 auto dream 啊,这样的一个这个自动的去清洗啊和沉淀记忆的这样的一个流程。 哎呀,说是这个流程,其实上非常的这个魔幻哈,就是我们在实际上呃 cloud code 的 时候,如果它是在你当前进程持续运行啊,但是呢某一些间隙的时候,实际上这 cloud cloud 呢,它是会开始做梦的啊, 它是会有叫睡睡眠记忆巩固的这个时间的,它会在内部悄悄咪咪的 fok 一个 agent 啊,然后呢去审查自己的这个记忆,再根据我们当前白天对话的核心内容去选择性的巩固或者删除一些记忆 啊,这个呢叫做 oto dream 啊,在这个做梦哈,那在利用睡眠来进行记忆巩固啊的这样的一个非常神奇的这个流程, 这东西其实确实这个说起来非常的这个魔幻啊,但是呢它确实是会这么做的啊,首先呢在它空闲的时候啊,就会自动的来进行这个触发啊,然后呢呃它呢?这个呃会单独的 fork 啊,单独创建一个 agent 来去做这样的事情啊,不影响主程序的来进行这个运行。 然后呢,接下来啊,它会去看啊,你当前对话所有这个时间戳对不对?就我们刚刚所说的啊,你越近的这个对话呢,它的这个权重就会更重一些,然后来进行一些这方面这个梳理啊,然后最后呢,单独的啊 for 可以 一个这个 agent, 然后呢通过当前这个 agent 去整理你的 memory 点 md 这样的文档啊, 所以呢,它的这个 memory 点 md 呢,是一个非常非常复杂而且精妙的这个设计的过程啊,不像 openclo 一 样啊,你让它写入它就写入,写入完成之后呢,这个 memory 太长了,就直接来进行 rec 解锁啊,并不这样啊,对于 cloud 来说啊,由于它是通过这样的一个可是非常神奇的这个维护 memory d m d 这样的一个文档的方式啊,所以它其实并不需要啊,所谓的这个 rap 这个流程来进行解锁啊,因为它的上下文呢,其实它的这个上下文其实能够被能够来进行非常好的这样的控制的, 而且 cloud code 本身它对用户的要求也会非常高啊,就比如说我们上面所看到的 cloud 点 m d 这个文件,对不对?那么这个文件呢,其实是所有的 cloud agent 每次在进行运行之前,它都会加载的这样的这个文件。那么只不过啊,大家可能之前不知道的是,对于 cloud 点 m d 这样的文件呢,它和其他的 skype 一 样,只会最多加载五百行, 更多它不会加载了,哈哈,所以呢,你对于 cloud md 来说,你写的再多啊,这个这个意义也不是特别大啊,所以呢,它呢, cloud 它是会盗弊用户,我们在进行实际使用过程当中呢,你得想办法啊,去 主动地去精简这样的一些这个记忆,主动去精简你希望主动让他记住的这样的些这个东西。而它自己维护的这个 memory md 啊,这个呢,是它自己维护的,他们共同构成每次对话这个上下文,那它呢,实际上就会, 对不对啊?这个什么 auto dream 啊,然后呢,它又什么这个啊,会呃,创建一些这个 topic files, 对 不对啊?分门别类的去存储记忆等等等等啊,这个呢,是它自己会去做的这个事情。而对于像 cloud 的 md 啊,需要用户去做的啊,它就没有太多的这个要求啊,跟你说,反正我只读前五百行, 那你自己看着办哈,对不对啊,你自己想办法来对它来进行优化啊。当然其实 cloud 它也有一些 skills, 能够去帮助你的 cloud 点 m d 来进行一些上下文章的优化啊,这个呢就属于应用层面上这个东西了啊,但不管怎么样, 对吧?啊,我们通过这样的一些这个流程啊,还有上面的源码的一些这个实现啊,大家能发现整个的 cloud 啊,它在构建每次对话啊,每个新的这个 agent 的 这个时候啊,它的上下文呢,是如何来进行的创建啊?这里面呢有呃呃,大家如果想看更加详细的源码的话,可以 去找到啊,我们的这 auto dream 啊,点 t s 的 这个文件里边啊,里面呢有非常详细的关于它是如何引导如何 fork 一个当前的 agent 去整理自己的记忆的啊,包括什么审查呀,强化一些东西啊,删除一些东西啊,如果存在矛盾应该如何来进行处理啊?然后如何啊?把 这个什么模糊洞察转化为确定事实啊,如何去重组当前这个记忆啊?哎呀,这个流程其实非常复杂啊,如果有机会的话,我其实还是非常 电影展开跟大家说的啊,因为这个其实还是非常精彩啊,去整理他这个记忆比简单的啊,什么寄到本地文档,再通过 red 来进行剪辑,要好的多啊,要好的多, ok, 当然下面还有一些这个安全的这个措施啊,当然他这个也会有一些这个啊,也会有些这个局限啊,因为他的记忆组装好坏,其实会跟他当前这个模型呢,会有直接的这个 啊,直接很大的这个影响啊,当前模型如果指令跟随能力强的话,那么他记忆组装的其实就会更好。但下面还有啊,什么分层的知识注入啊,然后呢,还有下面的什么提示词啊,什么六层动态组装啊,这些东西呢,其实都是属于怎么去更好的去维护他当前这个上下文的,那这部分其实并不会特别复杂啊,这个大家可以 自己回头去看一下。好,那么到这啊,我们就觉得基本上对于像 cloud code 啊,它的一些架构,就我个人觉得比较精彩啊,两个方面的这个内容啊,一个呢是如何来进行 compact, 对 不对啊?去压缩上下文,够压缩上下文啊,去构建更好上下文工程啊。第二个呢是如何修改它的这个像整个 agent 这样的个记忆, 这两方面的核心的我觉得比较亮眼,功能呢,都就都跟大家讲清楚了啊,那么接下来呢,还有两个方面, cloud code, 它的这个项目架构的优化,一个呢,是 啊,关于他是如何做这个安全检查的啊,第二个呢是他是如何去抵抗啊,一些这个知识的商增的啊,这两部分的这个工作啊,那么接下来啊,我们先稍作休息一下啊,然后呢,我们再来讨论啊,这两部分的这个内容。 ok, 那 我们说了这么多 啊,原理层面的这个,呃呃,原原,原理层面这个问题啊,我觉得很多同学可能都已经有点晕了啊,对于 cloud code 来说啊,它这个,呃,确实。嘿,我们接下来是讲 antispac 的 cloud code 的 最后两个非常核心的架构,一个呢是它的安全防御策略, 一个呢是他的对抗知识商商增的一个这个策略 pdf 里面图是,好,那我们就对着 pdf 来讲,大家看到这个 pdf 里面图应该也是也都是应该,应该也都是 ok 的, 我们是从安全, 其实这个安全呢,不仅仅是啊,它会被有害,而且很多时候指的是对他行为的一些这个约束。 ok, 好,从这啊开始继续好,那么了解啊,关于 cloud code 的 一些很精彩的一些这个架构,对不对啊?上下文怎么管理的呀?这些记忆是怎么约束啊?记忆是怎么优化的呀?之后接下来我们再来看非常重要的一个问题啊,就是 cloud code 啊,它的安全性啊,是怎么做的啊? 这也是我们现在很多在运行 agent 的 时候啊,开发者经常会非常头疼的一个这个事情啊,对不对啊?怎么确保这个我的 agent 它不会做一些有害的这个事情呢啊?那么其实 cloud code 开源之后呢, 泄密了之后,哈哈啊,是给大家有一个非常直观的一个这个感受啊,或者提出了一个非常通用的这样的一个范式啊。当然,其实我们 说伴随着你 a 证本身的应用面越来越广啊,你可能会面临的啊,什么投毒啊,或者其他的些恶劣的情况肯定会越来越多啊,这个属于魔高一,这个魔高一尺,道高一丈的这个事情啊,但是呢, cloud code 确实给你提出了一套作为基础的啊,所有的 a 证都可以上来就可以用的啊,这一套安全的这样的措施,我们看他是如何进行实现的。 首先哈,我们其实呃都知道啊,对大模型来说,他他他有智能啊,所以呢,他的这个安全措施跟跟普通的安全的这个软件啊,可能会不太一样啊,我们其实更多的是需要去约束好当前的 a 阵的这样的行为,才能够防止他作恶。 那么对于像 cloud code 来说啊,他是怎么样啊,来进行的这个思考呢?或者他整个架构是什么样的,基本上是按照这样的架构来去走啊,这个架构应该还是非常清晰的一个这个一个架构哈, 首先第一层啊,自我穿匹配啊,然后第二层呢,正则匹配啊,第三层呢是白名单分类啊,第四层呢,是独立的大模型的对抗审查啊,第五层呢,是人类来进兜底啊,差不多就这么五层的,这个五层的这个措施啊,但这五层措施呢,从上往下啊,这个难度一次增加,然后同时呢它的工程实现的这个复杂度也是在逐渐增加的。 首先啊,第一层啊,关于这个自产匹配,这个其实非常简单啊,就比如下面有个,有一个这个代码啊,基本上就是类似于类似类似像这个代码就可以,就可以就可以能够来进行实现了啊,就比如说无论如何都不能出现在你命令行里面的啊,这样的一些这个 呃这个命令的关键词对不对啊?什么 rf 啊, r m 啊等等等等啊,类似这种啊,然后呢直接把它过滤掉啊,这个呢是第一层啊,直接呢通过自传的自创的这个黑名单啊来进行匹配。那么除此之外,我们还可以更加复杂,通过正则来进行匹配啊,对不对啊?这个正则呢,就比自创表达式来进行匹配啊,它的本质呢仍然还是来进行的匹配。 那么第再往下一层啊,就是关于白名单啊和这个命令分类器啊,就它呢会我们会给出一个接下来啊,或许某一些这个命令呢,是 可以直接啊来进行这个执行的,然后同时呢会对所有这个命令来进行一个这个分类啊,如果你分类呢,最后呢是落到白名单这里,我们接下来就可以直接的来进行一个放行来进行运行。 那么再往下啊,就独立大冒险来进行审查啊,这个其实也会非常关键啊,因为大冒险他就会呃,从一个独立的这个角度啊,就不带入你当前上下文的这样的这个角度,他是一个独立的一个这个 sub agent, 然后呢去审查你当前这样的命令,是不是可以来进行执行的啊?这是第四层,然后第五层啊,就是关于人工来进行判断啊,差不多是这么五层的这样的这个架构, 那么在这五层架构里面啊,刚刚我们也说了这个审查的这个 a 证呢,其实审查大模型呢,跟你执行大模型,实际上它是完全隔离的啊,这两个大模型,一般来说审查大模型是不会带上下文来进行一个这个运行的。 那么最后啊,还有一层啊,关于这个人人类的这个兜底啊,所谓这个人类兜底,就指的是如果有确实不知道啊,这样的这个情况,不管怎么样,最后我们都会有一层啊,让人类来进行审核的这样的一个这个,呃,这样的一个空间啊,或者这样的一个通道。 这个呢,其实我们在平时使用 cloud code 的 时候,我相信大家应该也会遇到过类似这样的情况哈,就比如说哪怕啊,我们给他输入了一些这个指令啊,跟他说,他启动的时候跟他说这个, 呃,这个,呃, skip dangerous 啊,类似这样的这个命令啊,跟他说啊,我们这个他可以直接跳过人类审查这样的环节,直接自动来进行运行,但是你会发现他遇到很多他吃不准的这个东西哈,或者遇到一些比较高权限的这样的问题, 他还是会啊,来进行这个啊,就他还是会来进找人来进行审查啊。所以呢,其实关于这个人类兜底啊,实际上是他的一个不管怎么样都绕不开的一个。最后的这层的这个策略 ok 啊,是这样的一个基本的分类,这样的方式,然后他直接进行审核的时候呢,也都是啊,先看规则啊,再看这个有没有风险啊,再看白名单啊,再看这个大模型分类啊,通过一层一层来进行筛选啊,然后呢,如果规则没问题就直接走了啊,如果规则有问题,我们再来看啊,是不是有 风险啊?有风险我们再看看它是不是白名单啊,白名单就可以放行嘛,对不对?如果还不行啊,就大模型对抗啊,来审查一下啊,然后最后呢啊,还再不行,交给人类来进行审查啊,就这样的一个逐层的啊,来进行审查的,这样的,这管线, 这个实际上是一个非常通用的哈,基本上所有 agent 你 如果要考虑这个啊,考虑安全性的话,都可以这么来做哈,然后呢,对于 cloud code 来说,它的这个 security 点 gs 这样的一个呃,点 ts, 这个呃 代码里边哈,这个大家可以自己去看一下,里面它有非常非常多的啊,一系列的这个安全审查的一些这个事项。然后呢,这些安全安全审查的这个事项啊,其实是我相信对于很多现在做 a 证安全的同学来说,是个巨大的数字资产,因为它这里面很多的 这个安全审查的这个事项哈,都是之前长期的被攻击过之后积累下来的这些规矩或者经验哈,这个其实我们很难一条条跟他讲清楚哈,但是这里面确实有非常非常多安全审查的这个事项,也就是他第一层啊,这个规则啊,他就积累了很多之前踩坑的被攻击的这样一个经验啊,你想想这些经验对于很多的 a 证的开发者来说,当然是这个 这个这个无价之宝这样的一个东西啊,当然这里面大家可以在这呃原码里面能够看到哈,它里面到底是 啊怎么样去进行的这个审查啊?然后同时呢,呃,他还有很多的啊,他真的是这个属于这这被攻击久了就攻击出来这个经验啊,什么临宽制服与控制制服的啊,这样的一个这个防御啊,什么这个什么这个制服里面啊,由于由于我不是做安全的,所以我不是特别了解 啊,这里面到底是什么什么个这个情况啊,但是大概能够明白啊,是说一些非常特殊的攻击的这个指令啊,他其实会通过啊,里面去加入一些什么临宽制服啊,或者控制制服啊, 能够去规避掉啊,它的一些基于规则或者基于准则的这样的检测啊,从而绕过它的这样的防御,然后呢去攻击当前这样的系统啊,所以呢才会基于这样的个问题啊,再来增加对应的啊,这个防御的这个措施等等等等啊,总之呢,其实都是在 这个啊, best security, 点 g s 的, 点 t s 的 这个文件里边啊,这个大家可以自己去看一下,然后呢在这个文件啊,然后呢现在其实对于像 cloud code 来说,它的核心的 c m d 啊,防御它的这个 best 命令行相关的这样的攻击啊,其实其他方面的 攻击并不会涉及到你本质电脑上的这样的一些数据的这样的损坏啊,或者他直接盗取你一些这个文件等等等等啊,这个其实做不到的,其实它最核心的攻击的这个点啊,或者是 它的这个最大的风险这个点啊,所以主要还是要命令行工具的这样的一个使用啊,所以你会发现它基本上所有的这个 security 呢,都是围绕着命令行的这个 best tour 展开的啊,其他的一些这个 tour 呃问题不大啊,其实它往往没有被攻击的这样的一个这个价值。 然后同时呢对于 cloud 呃扣子来说,他的实现这样的这个方式,当然我们刚刚说了,对不对啊?这个总共是这个五层啊来进行的对抗,那么除呃五层来进行的这个审核分别是规则啊,然后呢是这个 啊,正则啊,然后呢是这个白名单,然后呢是大模型,最后呢是这个人工来进兜底,通过这五层来进行的一个这个搭建的一个基本的安全的防护网络。 那么除此之外哈,其实对于 klopp 来说,由于他现在还提供了很多那些企业或者团队内部的这个定制这个版本啊,所以呢他还有很多的围绕的一些给企业提供定制款版本的时候啊,他的些企业的一些特定的啊,一些这个呃安全的这个措施,他其实也会 写在 club code 现在的这个圆码的这个项目里边啊,这个的话就如果是大家去开发企业级定制的,并且是允许啊,企业里边我们去单独的给企业内部的这个企业内部的 a 政设置一些防御测试的话,那么这部分啊,是非常值得大家来进行一个这个学习跟观看的啊,就是什么呃企业内部有统一的什么策略呀?然后呢?有什么 这个呃规范的命令行参数的书写格式啊,还有个人默认的啊,这个纸等等等等,会有这么个五层的 这样的一个这个权限的这样的一个设计啊,这个其实更多的是一些定制化开发这个场景啊,这个大家如果感兴趣的话,可以在这下面能够看到啊,但总之呢他的这套这个防御的这个措施还是非常完善的, 那么除了可以提供一些定制化的防御措施之外,还有什么?这个三三个平台啊,各自有各自平台的这个沙河环境啊,可以来进行一个这个运行啊,沙河环境这个我们之前讲过很多次了,对不对啊? 沙河环境呢,相当于是提供提供一个隔离的独立的一个虚拟环境啊,来进行运行,那么你在这个环境里面进行运行的话,任何的一些有害的指令都影响不到你当前的这个主命令啊,主系统啊,这样的一个这个情况啊,这个呢是他的沙河环境啊里面来进行运行,然后同时呢他还有啊这个默认的一些安全检查啊,这个安全检查呢,实际上是每次启 动过程当中啊,他其实都会默认来进行一轮的这个执行,那么这个安全检查啊,实际上也都是他之前啊这个积累下来的这些坑,对不对出现的这样的这个问题, 然后同时呢它还会有一个啊断路器这样的机制啊,所谓断路器这个机制指的是如果我的 a 证在进行运行过程当中连续撞墙啊,就是他反复去尝试一些这个问题呢,他始终没办法得到解决啊,那么他就会判断,哎,你当前的这样的一次这个尝试或许是有毒有害的,那么之后呢,就会尽量避免出现类似这样的情况, 那这个断路器这个设置和安全这样的问题呢,因为他可能会存在一个暴力破解的这样的情况 啊,所以呢,它的这个所谓断路器这样的设置哈,其实它是一个强硬的这个规定啊,就出现连续三次被拒绝啊,或者连或者累积二十次被拒绝啊,那么它呢就会自动降级你当前的这样的一个这个命令的这个权重啊,换而言就是它会更加倾向于去拒绝执行当前这样的一个这个命令啊,是这样的这个情况, 这呢是一个断路器的一个设置,会在实际运行过程当中不断的来进行积累,当然它的这个氧氣的防御措施,还有一个还有一个方面的这个防御啊,确实是这个久经沙场 积累他的经验啊,就是他还有一个反蒸馏的这个防御啊,这个其实出来之后也非常精彩啊,这个因为安萨佩前段时间还说啊,他的这个模型啊,这个很多被被别人的壳扣子反复吊用来进行蒸馏,对不对?蒸馏别人家的别人家这样的模型啊,然后呢,呃,这个这个大家这个网友就批判批判他啊,说你的这个模型难道不是蒸馏来的吗?对不对? 嗯,这个也不太好说啊,那但是呢,现在对于 cloud code 来说,他确实有一个反真流防御的这样的这个措施啊,就是他呢实际上会去判断你现在在进行调用的过程当中到底是真工具还是假工具啊?如果呢,你是一些假的工具啊?来接。如果呢?呃, sorry, 不是 判断真工具假工具哈, 他是会判断你现在的调用工具这样的一个模式,那么他如果识别到啊,说你现在呢是一个真实的用户在使用 cloud code 的 话,那么他呢就会以真实的用工具这样的流程来进行响应。 如果他现在去判断啊,你现在这个调用工具这个流程呢,是一个蒸馏的这样的过程,你会围绕很多场景会去穷举他的可能性啊,然后呢会围绕一个问题的反复来进行这个运行, 那么这个时候啊,他其实内部会有一套识别这样的一个流程哈,这个我没有展开讲啊,但这个识别流程实际上是个比较精妙的一个这个识别的过程,他既会有一些基于规则的这样的判断啊,他也会 有这个 sanit 这个模型,主观的这个模型的这个识别啊,两层的这样的识别。那不管怎么样识别了之后呢,他会觉得啊,你现在呢就是一个机器人啊,在操作你的 cloud code 啊,然后呢就是为了去获取一些这个数据啊,然后用你这个用这个数据去接下来训练我的呃,去训练别的模型,这个时候他就会 非常激贼的啊,在你在他实际运行的过程当中呢,给他给你手动给你自动的去注入一些假工具的流程啊,就是这工具根本就不存在啊,或者说就直接就给你去 这个创建很多的一些工具调用失败啊的这样的一些这个这样的一些这个数据啊,从而呢他会生成一个这个有毒的这个训练数据啊,防止别人家去进行蒸馏啊,就这么一回事 啊,哈,这个其实还是很有意思的一个这个点哈啊,但如果这个大家确实面临的类似于这个蒸馏或者反蒸馏这个场景的话啊,这块确实是值得学习。 最后呢,就是关于他的这个对抗的这样的一个问题啊,这个点呢,其实是非常值得拎出来来进行单独的这个探讨哈,就是因为其实现在关于双 ai 对 抗的这样的场景,我目前其实在很多地方其实都会有用到过啊,比如说像这个 啊,像我们啊编程的时候对不对啊?有在编程的啊,有在进行审核的啊,包括我们在解决些问题的时候啊,是比如说你做些科研的工作啊,有提出结论的,包括比如说我们现在啊,如果使用 ai 去生成一些这个内容啊,那么有生成内容的,有去批判内容的, 那么现在呢,对于 ans 来 pick 来说,你会发现它的这个双 ai 对 抗这个策略基本上是贯,基本上是贯穿它整个 cloud code 的 各个方面的啊,如果遇到一些你当前大模型它自己不太好判断是不是有问题的这个点的话,那么它就会其实就会启动啊,双 ai 对 抗的这个策略。那么 比如说上面我们说这个安全方面的这个双 ai 对 抗这个策略,这一点我觉得还是比较好理解啊,因为其实一方面提出啊,一个 agent 来负责来进行审核, 那么除此之外呢,其实像 cloud code 里边儿啊,我们之前就有谈到过它的这个命令啊,它的这个压缩呀过程,其实也都会啊,有这个双 ai 双 ai 对 抗的这个影子啊,就一方提出主张啊,一方面提出质疑啊,然后呢,最后综合出一个结论,差不多会有这样的一个这个过程。 而这个双 ai 对 抗啊,实际上也是现在的关于 harness engineering 啊,他的这套体系里面提出来的一个非常有价值的一个观点啊,就是他会觉得啊,在这个多个 ai 从不同角度啊来进行,呃,那他们分别带有不同上下文啊,然后呢,去协助去完成一个事项的时候,往往有助于啊,提升你最后这个作品的这个质量。 举个例子,比如说啊,我们现在经常会使用 ai 去生成一些这个内容,那么生成内容之后呢,如果你让自己让他自己去 去对自己东西来进行审核的话,其实往往就审核的就很一般啊,但如果你有多个 ai 来进行对抗的话,来进行对抗审核的话,他就往往啊就能够提出很多很正确的意见啊,帮你的内容呢朝向更好更更好的方向去发展啊,差不多就这样的一个过程。 总之呢,其实在 cloud code 的 内部,它其实也是广泛应用啊,一些双 a 对 抗这个策略呢,去约束它内部的这个行为啊,这点确实是,呃,很有意思的一点啊,也是我觉得是一个性价比很高的一个策略啊,因为它其实并不会特别复杂啊,但是它能够显著提升你当前 agent 的 这样的一个这个效果,哈哈,是这样的一个情况, ok, 好, 这个呢啊,是关于安全是怎么做的, 那么紧接着还有最后一个问题啊,就是关于他的这个知识商增怎么去解决?哎呀,这个知识商增呢,其实是个非常呃困扰大家的一个这个问题哈,就比如说, 那我们现在啊,假设开发一个项目,呃,这个开发这个项目使用 qq 的 开发一个项目啊,那么呃,前一两千行代码写的可能还是比较顺利的啊,也不会出现什么知识商增的这样的个问题啊,反正就是代码也不是特别多啊,大家一看也能明白是什么样的东西做的呢,可以说是又好又快。好,那接下来 这个两千一两千行代码到一两万行代码的时候,哎,你会发现管理就会很混乱啊,一会我这个 a a 阵子就记不得之前的这个信息了啊,一会这 a 阵子 忽略了某些信息啊,给我堆出一个十三代码,然后呢一会啊,这个呃,这部分修改了之后,关联的那部分也没有修改,等等等等啊,就会出现很多很多这样的问题。而如果进一步的到十万行,到这个一两万行,到这个一二十万行代码,这就更加复杂了。 所以呢,其实现在啊,我们在使用这个 agent 在 进行这个开发的过程当中啊,其实很多时候都会遇到啊,他这个知识双增的这样的个情况,那么对于 cloud code 来说也是类似的啊,那么用户在使用 cloud code, 当然他自己其实是个工具啊,他并不是这个项目本身啊,对 cloud code 来说他是个工具,但是呢,这个这样的工具必须要给用户提供 应对,非常复杂,大规模知识商增这样的情况怎么样?很好的去控制你接下来未来 agent 的 长期这样的运行,就比如说我项目可以很复杂啊,对吧?你可以是一个一二十万行代码这个项目,但是对于 agent 来说,你得有能力去解决这个项目啊, 你不,你不能说这个,我,我上来这个上手这个项目就是一团糟啊,乱七八糟啊,然后呢?这个,呃,也也搞不清楚上下文什么啊,然后呢?也写不明白啊,这可能就不行,那么要做到一个围绕着巨大的这个知识体系来进行管理哈,来进行内容输出啊,代码也可以把它理解成是内容生产的一个缓解嘛, 来进行有效的啊,这个内容输出的话,那么其实对于你当前 a 阵的架构就会提出很高的要求啊,这个其实不仅仅是说我需要有更强的这个模型,有更强的模型只是一方面啊,除之外呢,还需要有 harness engineering, 对 不对?约束好他,好让他好好的哎,去做这些事情啊。所以接下来呢,我们需要解决解决第四个问题啊,就是去看如何通过啊,这个 color code 内部如何通过这 harness engineering 呢?去更好的去实现面对知识商增这样的情况,他如何分文别类的来进行很好的这样的处理。 那么首先哈,我们说对于现在的这个比较复杂的任何比较复杂的任务啊,基本上肯定都不是一个 agent 来进行处理了啊,肯定是很多个 agent 来进行协调的这样的一个处理啊。所以呢,对于 carco 来说啊,他去应对啊,这个知识商增这样的个情况,应对比较复杂,大型代码的或知识类的这样的项目,那么他肯定也是会考虑啊,使用多个 agent 来进行运行。 那么在 cloudco 内部,它的 agent 的 运行模式,其实现在啊,总共是有两种模式啊,一种呢叫做 sub agents 模式模式啊,一种呢叫做这个 agent teams 模式啊,这两种模式其实是不一样的。那么所谓 这个 sub agents 这样的个模式呢,在 cloudco 的 内部,它的这个运行的逻辑是,它会把这些 agents 把它看成是呃这个主 agent 的 一个可以调用的工具啊,它它它它 agent 当然是可以是一个工具了啊,对不对? 那么它如果我的 sub agent 作为主 agent 一个可以被调用的工具的话啊,那么接下来我在运行的过程当中啊,这个过程其实就会呃非常的简单,对不对?我需要它, ok, 我 调用它,然后给它,给它输入上下文,然后它就进行运行就可以了, 那么这个时候 sub agent 跟主 agent 是 不会共享上下文的,那么 sub agent 它不管运行了多少,它最后呢就会把它最终运行这个结果提交给原来的主 agent。 举个例子啊,比如说 大家都知道,对于现在的 cloud code 来说啊,它有这个非常强的呃这个 deep research 这样的能力,对不对啊?非常强的这个呃深度调研的啊,广泛来进行一些搜索这样这个能力。但是其实在呃这个 呃 cloud code 的 内部,这个 deep research 是 由一个单独的 agent 来完成的啊,只不过呢,这个 agent 是 一个 sub agent 啊,它呢是能够被工具呢,能够被各个不同的 cloud code 来进行调用啊, 么样的一个这个情况,也就是说当你如果你需要围绕一个东西来进行深度调研的话,那么这个时候呢,主 agent 啊,实际上是会给一个 sub agent 啊,去发布这样的命令,让他呢去调用自己的网络工具来进行海量调研,调研完了之后呢, ok, 把信息在汇总给你。原来的 agent 是 这么样的一个过程, 当然除了啊这个,呃 sub agent 啊,呃,除了这个 deep research 这样的 agent 之外呢,其实对于 cloud code 来说,它还有很多内置的一些这个 agent 啊,还有这个 plan 啊,它也是一个 agent, 等等等等。 那么不同的这个 agent 啊,它和你现在用的这 cloud code 之间唯一的区别就在于说不同的 agent 呢,它可能它的这个上下文哎,就是 agent agents 点 md 呢,这个东西呢,是不一样的啊,你可以这么来进理解啊,只要它的 agent 点 md 是 不一样的啊,或者它的这个 cloud md 是 不一样,那么它呢在运行的过程当中所调用的上下文,其实就跟你是不一样的啊,你可以这么来进理解,那这个时候呢,这个 agent 啊,就是个全新的一个这个 agent, 这个呢是第一种模式叫 sub agent 的 模式,那么说实话还有种模式啊,是呃,在呃这个今年年初啊,伴随着 cloud 四点六啊,这这个这一系列模型发布的时候呢, anselp 一个主推的一种新的这个模式啊,叫做 agents team 这个模式, 当然哈,这个 agent teams 这个模式呢,其实现在也被称为叫做这个呃,这个 agent swarm 啊,这样的个模式啊,对不对啊?这个 a, 呃,刚刚我们说了,这个子 agent 呢,跟父 agent 呢,它之间没有上下文共享啊,这个我们刚刚也说过了, 那么第二种模式呢,叫做这个 agent 子 agent teams 这个模式啊, agent teams 这个模式呢,它呢其实就不再是这个副 agent 的 调用子 agent 的 这样的一个这个这样的一个这个过程啊,那子 agent 也不是说以工具这样的形式被副 agent 的 调用 它的所谓 agent team 四个模式呢,实际上所有的 agent 呢,都是平等的啊,都是有一个自己维护的独立的上下文的啊,然后呢会有一个主 agent 啊,通过对话啊,去调用不同的这个子 agent 来完成对应的这个事项。然后呢这个子 agent 呢,跟跟主 agent 的 之间这样通近呢啊,实际上是只会发送结论啊,但不会发送上下文。 那么通过这样的个方式其实也是能够很好的去进行不同 agent 的 分门别类的上下文的这样的管理啊,以免上下文交叉啊,所带来的这个呃知识的商增啊,或者这个这个行为轨迹的这个爆炸呀,类似这样的情况。并且呢,目前来说对于 cloud code 来说,它 只有啊一个呃,它它的这个 multi agent 的 这样的模式啊,觉得 agent teams 这个模式啊,只有一种架构的方式,就是一个主 agent, 然后连接一系列一系列的这个 agent 啊,一系连接一系列的这个 team mate agent 啊,就一系列的队长啊,剩下全部都是队员,队员, 然后呢队员跟队员之间啊,是不能够相互通信的啊,然后呢队员跟队长之间啊,是可以相互通信的,所有的工作或者所有的结果都是由主 agent 啊,去给各个不同的子 agent 来进行分发啊,它目前呢是这么两种模式,那么为什么会有这两种模式出现哈,其实也是基于现在的 cloud code 啊,他们可能长期的这个实践 啊,之后最后得出来的这个结论啊,就是会发现我们刚才的啊所说的这两种模式啊,这个是我们刚刚所说的第二种模式 发现。哎,这两种模式呢,其实是最呃能够结在这个确保稳定性的这个情况下去节省 talkin。 而其他啊,大家也知道有很多的一些这个,比如说现在这个 multi agent 呢,有很多的这样的架构,对不对啊?刚才这个架构呢,是一种指挥官式的这样的架构,一个 agent 连接多个 agent 的 这个架构啊, 除此外还有啊,类似于这个蜂巢这种架构,很多 agent 呢之间呢都可以彼此相互通信的啊,这样架构像这些架构呢,目前还没有去集成啊,他也可能也是觉得说这些架构呢,可能运行起来目前来说还不是很稳定。 那么通过啊,我们现在的啊这两种基本的这个模式呢,可以说 cloud code 啊,就能够解决在不同场景下使用不同的 agent 的 一个基本的这样的一个流程,但是呢这个流程还不够啊,我们这个流程,其实所有的咱们的用户啊,只要你使用了这个 cloud code, 都能够感受到 有这样的一个这个流程,那么除了啊有这个流程之外啊,我们说对于 cloud code 来说呢,它还有非常强的一个 talkin 的 一个管理的这样的一个机制啊,哈哈,这里其实就涉及到啊,非常有趣的一个点啊,就在于说有很多同学经常说啊使用 cloud code 啊,这个 talkin 爆炸啊,是吧啊,这个这个动不动这个 talkin 就 不够用了, 哎呀,但实际上 talkin 已经尽力了啊,因为它在它的这个系统里面其实已经有非常非常多啊,这个关于如何去 啊,如何去节省,你当哎,不好意思啊,如何去节省你当前的这个呃 token 的 一些这个措施啊,但是呢仍然啊还是会面临着啊,大家经常会使用这个 token 的 时候感觉 token 包大这样的这个情况啊,当然这个其实也不是很重要啊,重要的是我们需要去看啊这个 anselpik, 那 他们的 cloud code 是 怎么去尽力去节省你的这个 token 啊?那么懂了我们刚刚所说的他们这两种 cloud code 啊,这样的 agent 分 配机制之后,我们接下来看啊,它是怎么样去很好的去啊,把控你现在整体的这个 agent 消耗的。 那么首先哈,我们说刚才的这个副 a 证跟子 a 证的上下文隔离啊,这个呢,其实呃就能够很好的去这个呃避免啊它上下文交叉感染,然后同时也能够去避免单个 a 证过长上下文的这样的一个问题。当然最最最最精彩的实际上是这款就是 关于它的共享 talkin 经济学,哈哈哈。啊,什么叫共享 talkin 经济学啊?这个是什么样的一个意思?那么我们都知道啊,现在对于一个 agent team 的 这样的一个系统啊,实际上你的 这个 agent 呀啊它长什么样的都有啊,对不对啊,我各式各样的这功能的 agent 都有啊,那呃, agent 一 号啊,一号跟 agent 二号啊,它们呢,或许有一些内容是一样的啊,那么或许有些内容呢也是不一样的啊,有的时候呢,这个啊,它有一部分啊是重叠,有一部分也是不重叠的, 那么在这样的一个基本的的这个形态下啊,其实呢, cloud 内部,它会有一个非常巧妙的一个这个分辨啊,它呢会把所有的 agent 稳定的缓存的一些指令区都是共享一套存储策略,你可以这么来理解, 就相当于是一个模型,它运行的时候呢,它有一个快照啊,然后呢从这个快照的时间节点开始啊,那么接下来或许会分呃,或许会分化为很多不同的这个 agent, 那么在这个快照内部,它们的记忆是完全一样的,只不过呢是基于这个快照这个点哎,有的 agent 输入了 a 指令,有的 agent 呢输入了 b 指令啊,然后有的 agent 呢输入了 c 指令, 那么在这快照之前,它们其实保存了同一个这个模型,那么它们通过输入不同指令之后呢,才演化出不同的模型去维护不同的线来进行服务啊,你可以这么来进行理解啊,所以呢,它会在里面,它会在整整个 agent 运行内部去构建一个啊,所谓叫稳定区 的一个全局缓存的这样的一个东西啊,这里面就是会保存所有的 agent 啊,大家共有的相同的这样的一些这个内容啊,然后同时呢, 每一个 agent 都是在全局缓存的稳定区基础上啊,加上一些自己动态的一些这个指令啊,或者自己不一样的这样的一些这个东西啊,然后呢再构成它的上下文啊,咱俩进行不同的这个响应啊,以此呢去构成啊,它的一个提示词这样的一个缓,类似于像提示词缓存的这样的一个机制,去节省它整体的这样的 talk, 其实哈所谓提示词缓存也是这样的过程,对不对啊?就是我们在调模型的这个时候呢啊,你有的时候输入的后面这个提示词呢,跟之前提示词一样的,有些提示词呢,是已经加载到你当前上下文里面之后啊,已经加载到当前上下文里边了,你接下来就不用重复来进行加载啊,这个这个过程其实跟 cloud code 的 内部所建立的啊,所谓这个稳定区跟动态区呢,基本上是 啊差不多的这样的一个这个状态,然后对不对啊?他他有很多的啊,这个这个稳定区指的是什么啊?什么基础指令啊,工具定义啊,全局规划呀,这个都他他不会在绘画中这个反复的变化的啊,都是稳稳定区内容啊,然后动态区指的是绘画特定上下文呐,这个环境状态啊,用户的不一样,这样的个指令啊,等等等等啊, 会有这样的一个这个方式,那么通过这样的一个啊, fork 共享这样的一个方式哈,它呢其实比普通的啊,这个 agent 如果我们在进行多 agent 运行的时候呢,它的这样的状态呢,其实会节省非常非常多的这个成本啊,这个呢,其实是它开源了之后有很多人在进行计算啊,计算它现在内部的多 agent 的 协助过程当中所消耗的 talk 的 这个成本 差不多啊,五个子 agent 约等于一个额外的 agent 的 这个成本,呃,这个五个子 agent 约等于一个一个额外的 agent 的 这个成本,它并不是说我增加了五个 agent, 然后呢就跟一个 agent 的 成本是一样的,不是这样的啊,它指的是如果我额外增加五个 agent 啊,那么就跟,我,那么就跟啊这个呃,在我们现在的这个共享缓存的这样的个 之下啊,那么呢这五个 agent 这个成本差不多能够降低百分之八十啊,你就这么来进行理解就可以了啊,那么这个呢是关于现在的 cloud code 啊,它的内部提示内部的啊,这个提示缓存的这样的一个这个技术啊,那么这个这项这个技术呢,实际上在它内部的这个实现,实际上非常的这个巧妙哈, 完整的这个实现的内容在啊,我们的这个呃题日词缓存的啊,这样的个 t s 文档里边啊,这个大家回头可以自己去看一下啊。总之呢,现在面对着多 agent 里边的非常复杂的啊,系统题日词,它也是采用类似题日词缓存这样的个技术啊,然后呢来进行一个 呃费用上啊,或者 talkin 上的这样的一个这个优化,那这个呢?好,我觉得也是。呃,这个这个功能其实属于一个非常进阶的一个功能哈,我们现在很多大家的这个普通的一些 a 智能在进行架构的过程当中,可能暂时都还用不到啊,这么复杂的一些这个功能啊,但但这功能确实也是我就觉得非常精彩,然后值得大家来进行一个学习的 这样的功能, ok, 好, 那么最后呢,还有关于啊,它的各种子 agent 运行这样的个模式啊,什么在呃县城内来进行运行啊,翼步后台来进行运行啊,远程执行啊,都是可以的啊,然后呢,这个进城内和翼步后台都是你可以操作的啊,远程执行呢,是需要放在 i s r t。 的 服务器上来进行运行啊,这个呢, 也都是 ok 的 啊,总之它的很多的 agent 呢,是支持不同类型的这样的个运行的模式的啊,然后呢,下面还有这个 mailbox 啊,关于它点对点通信的这样的格式。呃,这个的话大家可以自己去看一下哈,这个的话,它主要是些工程上的一些这个说明啊,我们就不展开说了。 那总之呢啊,其实它现在啊有非常多的一些对于当前 agent 的 一些提示词缓存的这样的一个这个技术,然后呢去减少你整个的在面对知识爆炸的这样的情况下,对不对啊,深层非常复杂,多 agent 的 写作体系的过程当中啊,减少整体的 talk 的 这个消耗,这个呢也是呃,我会觉得啊,非常精彩的一个这个实现, 当然最后我们还有一个啊,非常有趣的一个,哈哈。啊,也是最近啊很多同学这个热议的一个这个话题啊,就是关于说你的这个 apple pick 现在一不小心开源了自己的 cloud code 啊,那你的这之前发的那么多技术报告对不对啊,个个看起来都很厉害啊,你的技术报告在你的 cloud code 里面实现了吗?哈哈,这里其实是非常有趣的一个这个啊,有趣的一个 东西哈,首先啊,对 antalfa pig 来说,他的这次开源还是能看得出来他还是非常实诚的啊,因为绝大多数的他之前自己提的这些技术方案啊,在 cloud code 里面都有非常非常好的这个实现啊,教科书般的这个实现。比如说他 最开始讲的啊,这个 context engineering 啊,这个呢,是他去年十月份发的一个这个技术博课啊,然后讲他自己内部他自己的 context engineering 怎么做的,这个是对应的我们的整个的。呃 呃,这个 cloud code 的 架构解读第一部分啊,当时我们去讲的那部分的这个内容,对不对啊?这个呢,他技术报告里面提的内容哎, cloud code 里面都实现了,然后同时呢,他的安全与成本控制,就是我们三四部分讲这个内容啊,他在里面也实现了, 然后呢,多 a 证的对抗啊,他其实也有一部分的这个实现啊,只不过呢,他现在这个多 a 证的对抗没有他现在这个博克里面这个讲 那么强就是了啊,他博客里面说这个,呃,这个 g n 对 吧啊,生成对抗网络的三 a 阵的这个对抗的这样的一个这个形式,目前这个形式呢,在卡扣的内部还没有实现啊,但是未来呢,应该是会逐渐来进行这个实现的啊,这个大家若感兴趣的话可以去 看一下啊。然后同时呢,对于当前的 color code 来说,还有些同学会比较关注于说他现在啊,勇于他,其实,呃,尽管他这个泄密的是二点一点八八这个版本哈,但实际上这个版本里面其实有很多未来的功能,这规划啊,也能看得出来未来 color code 他 会朝哪方向去进行发展啊?就比如说像主要的啊,这个最为核心,也是大家最 看好的一个方向啊,是叫做主动式的这个 agent 啊,什么叫主动式的这个 agent? 这个说起来啊,这个这个说简单一点啊,感觉就像这个定时任务一样啊,就是他呢会这个定时来进行响应啊,但实际上主动式的 agent 呢,没有那么简单啊,他呢实际上是会主动发现问题啊,然后再来 主动的来进行处理啊和这个解决啊。那比如说我们现在去构建很多的开发很多项目,或者做很多的这个事情,你要用这个 agent 做很多事情啊,你往往是 先跟他说怎么做,做完了之后你跟他说你再检查一遍啊,他再检查一遍,检查一遍之后呢,你运行了一下,发现出问题,你跟他说, ok, 你 再写几个测试这个视力,然后他测试视力,测试完了啊,发现有问题去解决问题啊,然后呢你再不断跟他说啊,然后他就不断去解决各种各样的问题啊, 这个呢,其实是属于你问我答的这样的一个状态。而主动式的这个 a 阵呢,他呢其实会发现当前运行过程当中所存在的问题啊,或者他觉得他现在需要去解决的一些这个问题啊,会主动的向你啊来发起这个请求啊,会主动的去完成一下这个事项啊,这个呢,是所谓的这个主动模式啊, carras 的 这样的个模式 啊,这个模式呢,现在还属于规划的过程当中啊,这个呢,其实未来啊,应该会这个上健啊,应该又是一轮不一样的啊,这个 a 政策的使用范式的 这样的一个调整,那么除此之外啊,还有啊,这个什么循环的这个引擎啊,循环这个引擎应该很快就会上线啊,这个其实就跟这个 heartbeat 啊,或者是 crm 定时任务其实是比较类似的啊,就是这个,呃,以这个持续不断的啊,来进行一个运行啊,还有呢,关于这个,这这什么成本 感知让步等等等等啊,这个呢,其实是关于他的一个成本优化的这样的这个策略啊,指的是我提示词换成,如果换成特别久,但是始终没有用到啊,他可能就考虑把这个提示词换成给删了啊,这样的一些这个小的优化,这个点啊等等等等。 然后同时啊,它还有一些啊,这个呃,这个呢,其实主要是它的这个云端的啊,就是服务器上的这个 cloud code 的 一些优化的这个工作啊,这个呢,我们就呃不不 展开来进行讨论了啊。然后呢,这个 skills 的 这个显见的这个显示,这个其实是一个非常非常有效的一个功能哈,这个功能我相信之后上线之后呢,肯定也会对我们现在开发工作会有很大的这个很大的一个促进作用。那么对于多 呃工具啊,或者多 skill 的 管理啊,实际上是现在所有的 agent 都会面临的很大的一个这个问题啊,那么对于像多 skill 的 管理,之前有很多的不同的厂商些提出不同的这个方案啊,然后呢?呃,那么现在啊,对 anfropack 的 他们其实集成了一个更加前沿,他们也会觉得很有用的方案,叫做 skill 渐近显示, 就是在未来啊, clock code 在 运行的过程当中,你甭管你给它绑定了多少个 skill 啊,你给它绑定了一百个也好,它在运行的过程当中,它会根据我当前这个项目推进的情况有选择掉一些这个 啊,然后呢让他每次运行的过程当中去选择那样的这个 skill 这个时机啊,或者选择这样的一个 skill 的 这个时间点来进行一个缩短。好,这个呢是所谓的 skill 渐近渐近的这样的一个显示啊,它呢是能够去进一步的优化你当前每一个 agent 的 上下文啊,同时也能够提升 agent 的 响应速度啊。这个刚刚有同学问到说 cloud 为什么响应速度这么快啊?他代码这么多,为什么响应速度还这么快啊?这个,这个对吧?还有很多这方面优化这个措施啊,所以他响应的速度 啊,是这样的一个这个情况。 ok, 好 啊,这个呢是关于啊他现在的很多未来功能的一些规划啊,当然还有一些这个有趣的功能,对不对啊?赛博宠物啊,赛博宠物呢,这个我们刚刚看过了啊,这个赛博宠物大概就长这样啊,大家可以自己看一下啊,这个呢就是 cloud code 的 一个这个页面啊,然后呢就输入这个呃,八底之后, 然后他就会给你整出一个呃,这个出来一个这个小宠物啊,差不多这样的一些功能等等等等, ok, 行,那这个呢就是关于整个的啊 cloud code, 我 们在今天有限的这个时间点时间里边啊给大家去讲解的 cloud code, 就 我个人认为非常精彩的一些这个架构啊和我觉得啊会对我们后边的啊,这个主要是非常进阶,非常顶尖的,大家来进行 the agent 开发的时候啊,一些这个启发,但是下面啊还有一些可以附用的一些 ai agent 开发的这个模式的一些这个表格啊,大家如可以去看一下,如果你们现在进行开发的时候有类似的一些需求的话,那么你可以考虑参照 cloud code 啊来进行实现。然后同时呢关于 cloud code 啊,其实我们之前没有讲过的一个点呢,暂时说有很多同学会呃比较 关注于说,哎,我现在有拿到克拉扣的这个原码,之后怎么样来接在在本地来进行一个这个部署,对吧?啊,那么首先好,我们说克拉扣的你是可以在本地来进行一个这个呃 build 来进行一个部署的,那么我们再给大家参考资料里面其实有啊,这个是没有什么问题的,但是呢,你的实际的运行过程当中仍然还是需要访问远程的 ansore pick 的 这个模型的这个服务啊,才能够来完成响应和完成认证啊。当然如果你是使用国内的模型的话,可能就没有这样的一个问题,这是起的这是一个, 第二个呢是呃这个东西哈,你最好用的话还是这个呃低调一点啊,因为他确实不是一个 呃完完全全的符合版权的这样的一个这个事情啊,这是为什么?我公开课可能没有去讲啊,拿着原码怎么去进行这个部署,跟本地运行的非常核心的一个这个原因不太适合啊, 这么公开这个场合啊,大唐起鼓的,我们来讨论这样的问题啊,但是呢,我们出于学习的目的,对不对啊,好好的研究一下内部的这个架构啊,给予我们未来开发的一些这个启发啊,以及呢积累一些这个经验。哎,这个还是非常不错的啊,这是没有什么问题的。所以啊,这里啊他有这个八个架构模式啊,如果大家感兴趣的话啊,可以考虑啊,去进行一些 啊,进行一些这个选举啊,或进行一些这个实现这八个架构模式基本上也就是啊,我觉得我们在读完啊 cloud code 的 这个架构之后哈啊整个的这个原码之后,最核心的一些这个启发啊,首先第一个分层降级防御策略啊,第二个呢,分层知识注啊,第三个知识商的这样的一个管理啊,认知商的管理,对不对啊?这个后台做梦啊,整理记忆 啊,还有什么众生防御啊,这个双 ai 对 抗啊,还有感知缓存架构啊,还有这个编排者模式啊,编排者模式,我们刚刚说的这个 multi agent 啊,一个主 agent 分 配多个 agent 来干活这样的个模式。 然后呢还有这个能力边界啊,既架构边界啊,等等等等这样的一些这个模式模式啊,这模式下面都有对应的他的一些这个啊使用的方法和对应的这个方案啊,大家如果感兴趣的话,可以自己去看 下。然后呢我在我们前文里面也都给大家指明了对应的不同的这个方案里边啊,他对应的这个原码的位置啊,大家可以去看一下。总之呢其实对于这个原码来说,你是很难 这个啊,通读的啊,这个其实非常非常困难啊,你只能够根据说 ok, 我 们现在啊,可能大家提炼出了一些比较好这样的模式呢,顺藤摸瓜啊,然后呢来进行一个读取啊,来进行学习,来进行借鉴, 好,那么到这啊,关于 cloud code 啊,它的一个源码的一个这个解读啊,我们这里是拎出了一些这个亮点,对不对啊的这样的这个解读呢啊,就差不多啊,告一段落了啊,我们就打一波广告, 那么也欢迎大家啊,报名由我跟沐雨老师啊,还有啊,还有志杰老师,我们共同来主讲的啊,二零二六大模型 agent 开智能体开发实战课啊,这样的一门付费课程 课程啊,是我们三位老师共同来主讲啊,是一门一百个小时以上的完整体系大课,那么今天我们其实讨论了非常非常多啊,关于大模型 a 智能开发相关的一些这个内容啊,当然我们今天讨论的呃,可以说非常难啊,非常复杂,而且很多都是行而上啊,都是一些理论层面上的啊,这样的一个这个东西, 那么啊,大家如果接下来想进一步的来进行深度的时间落地啊,或者你是想从零开始来学习大模型 agent 开发,就未来想要去参与到啊这个大模型 agent 技术岗位当中去的话,那么那么也非常欢迎大家啊,报名这样的一门啊,由我们三位老师共同来主讲的大模型 agent 的 开发实战课, 那么课程是一百个小时以上的完整体系大课,能够帮大家零基础入门,然后直达目前顶尖大厂大模型 agent 的 开发中高级岗位能力要求的这样的一门课程, 那么这门课程啊,其实我们现在已经开设到第二十四期了哈,这今年的这个春季班啊,已经是第二十四期了,我们从二三年的这个五月份啊开设第一期到现在啊,已经 这已经是将近三年的啊这个时间了啊,三年的时间里面已经也是有两万多名的学员报名了我们这样的一门课程,也有非常非常多的学员啊,现在是已经是加入到啊我们大魔仙 a 智能开发的这样的一个技术岗位当中来了,那么这门课程呢,是可以帮他零基础入门来进行的学习,然后呢可以全方位淬炼大家 大模型 a 证的开发的啊能力的技术体系啊,那么这本课程是可以帮大家零基础入门,然后直达目前顶尖大厂的五十万年薪的大模型 a 证的开发岗位能力要求的 这个五十万年薪啊,这个我们不是随便说说啊,我们也不是随便糊口的个周了一个这个数字出来啊,是因为我们团队其实也是在进行大模型 a 证岗位这样的招聘啊,我们 课程里边讲解的内容就是我们团队的岗位的要求啊,那么那其实我们今年金三银四的内容就是我们团队的要求啊,那么那其实我们今年金三银四的学员群里先 已经进行了很多轮的这个招聘啊,我们招聘要求非常简单啊,大家只要是学了我们的课程啊,学了百分之六十到百分之七十以上啊,就可以啊加入到我们公司团队里面啊,来进行一个这个工作了啊,就可以顺利的拿到大模型 a 证的开发的岗位的这个 offer 了啊,所以呢,我们这样的一门课程是完完全全严格按照目前顶尖的 大厂的技术岗位的要求呢,进行的内容的设计。那么这门课程啊,总共呢是六个模块,我们先给大家看一下啊,现在这门课程完整的课程介绍。 首先啊,第一个模块呢,是来会讲解啊,关于现在顶尖的大模型的一些基本的技术入门啊,包括顶尖的在线大模型的 a p i 的 接入使用,本地开源模型的部署和使用。然后呢,智能体 a 证的开发的理论基础和基本开发工具,然后呢, rack 解锁增强技术啊,开发入门等等等等啊,这是第一阶段,然后第二阶段我们会进一步的来探讨啊,关于热门的 a 证的开发框架的上手实战啊,包括一些零代码啊, d 代码的开发工具啊,像这 codes, define, 还有 n 八 n 呐,也包括那一些顶尖的 rack reg 框架啊,主要是拉玛 index 啊,在开发时代也包括新兴的 agent 开发框架时代啊,像这 agent sdk 啊,还有 agent school 啊,还有 adk 等等等等。然后同时啊,还包括工业级的 agent 开发框架啊,这主要是 long chain and long graph, 那 么这个当然是我们会准备主讲啊,这样的开发框架,那么刚刚啊,我其实 弹幕上啊,有同学在问到啊,说啊,我们能不能够使用 long chain 来复现一版的 cloud code 呀等等等等啊,其实我们课程里面已经使用 long chain 就 复现了一版 open cloud 了啊,然后呢,我们课程里面也有啊, cloud code 的 这个复现啊,只不过呢,使用 agent sdk 去进行的这个开发。 然后呢,当然底层开发思思路其实是一样的。好在我们课程里面啊,我们会从头跟大家去讲啊,关于最新版 long chain 应该做出来进行使用啊,然后呢,如何啊?去复刻这些顶尖的这个,呃, agent 啊,就是这一些像 open cloud 呀,还有 cloud code 呀,这一系列 agent 复刻的这个核心的思路啊和方法 啊,同时第三个第三个板块,我们会进一步来讲解啊,关于工业级的 agent 开发境界的这个技术,包括智能体的内部的啊,多工具的管理呀, m c p 工具的这样的一个使用啊,包括啊,这个 agent, 呃, reg 进阶的这个技术实战呢,包括纯文本的解锁优化啊,包括图文混排的 pdf 解锁啊,多多多模型的 pdf 解锁,结构化数据的解锁和 graph reg 基于知识图谱的解锁啊,还有视频信息解锁等等等等。 那刚刚啊,就有同学问到啊,说我上下文特别特别长啊,然后呢,呃,我们怎么样啊,去这更好的去读取啊,或者是去获取上下文这样的信息啊,那么要么你就是进行 compact 啊,压缩对不对?要不的话,你可能就是采用 reg 技术啊,来进行更高精度的这样的这个解锁。 好,那么再往下啊,还有关于智能体长短期记忆的这样的管理啊,和智能体上下文工程,这都是构建我们智能体直观重要的相关的这样的技术。再往下啊,还有关于多智能,多智能啊,记忆多智能 某体 agent 的 系统开发啊,对不对?然后呢,像对于现在的啊,这个 cloud code 来说啊,它呢其实只有一种啊,这个某体 agent 的 系统就是所谓的 supervisor 这样的架构,一个主 agent 不 负责干活,负责分配活啊,剩下很多的啊,这些 agent 负责来进行干活。 那么除此之外啊,我们说其实还有啊,像这 handoff 的 这个架构,还有这个 router 架构啊,还有 network 架构等等等等啊,有这四种主流这个架构,那么这些架构呢,都会在我们正科里面啊,来进行讲解介绍。那么 再往下啊,还会包括啊,会讲解关于大冒险高效微调啊相关的这样的内容啊和呃,紧接着啊,我们这这个呢,就是我们第三个模块内容啊,第四个模块呢,我们进一步来讲解关于工业级的大冒险 a 阵的部署上线啊相关的一些这个内容,包括 啊,像智能体项目部署上线的这个基本理论啊,包括智能体开发部署上线全部的这个流程对不对?好,从最开始的前后段功能设计啊,到这个接口的这开发啊,到前后段的连调,到最后的项目上线,一整个完整这个流程啊,然后也会来讲解关于两大的 容器啊,交啊,两大容器化啊,这个交付工具这样的实战啊,主要是刀口跟 kbs 的 这样的使用,同时也会来介绍关于智能体的追踪和优化相关的这样的内容。 同时这门课程我们呢现在总共呢还有啊,总共呢是十大项啊,工业级的这个实战的这个案例啊,分别是长文档啊,定制化文档编辑 agent 啊,然后文档审核 agent 啊,图文视频 agent, 语音交互 agent 啊, deep research agent 啊,然后呢数据分析 agent, 然后啊数据分析格式化 agent 啊,垂玉的 agenta reg 系统啊,多模态 reg 本地知识库解锁系统啊, nintendo pro ppt 生成系统啊等等等等,然后同时还会有四大项, 这个百万用户级别的啊,这个商业化的项目,工业级项目实战啊,分别是企业级多模态啊, rek 支付解锁实战项目,然后全新一代智能客服 a 智能开发项目啊,其实我们所有项目都有对应的演示视频啊, 这这这演视频可能会比较长啊,我们这个啊就不展开给大家看了啊,大家可以自己登录我们的主页来进行观看,然后啊包括一比一复刻 mana 通用智能体的啊,这样的项目和啊这个 ai 编程啊跟数据分析 a 阵的开发项目。当然在我们的春季版里面,我们还新增了啊丛林去赴县 open club 啊这样的个项目,完整的相关的内容啊,那么在我们的这个春节班里面,我们是完整的大家去复现了一个啊,这个复翻 openclo 啊,这样的一个这个项目啊,然后呢所有功能呢,都会从零来进行实现啊,这个项目其实就是 呃使用 long chain 啊来进行的开发啊,在开发过程当中呢,我们就跟大家详细去介绍啊,它背后的核心的啊这样的一个理论知识体系。 那么除了啊这样的一门呃大冒险 a 型开发实战课之外呢啊,我们说还有两门课程啊,一门课程呢是 open core 啊,这个技术实战课啊,这门课程呢是由我来主讲的一门啊,这个总共呢是二二二十到三十个小时的啊,这样的 open core 智能 体的应用实战课啊,这门课程是目前是呃,我正在讲解啊,这样的一门联赛更新这样的课程啊,但这门课程其实主要就是来讲解关于 open core 啊,这样的 这个技术应用啊,实战相关的一些这个内容啊,那么 openclaw 这个定位呢,其实和呃 cloud code 还是有些区别哈, openclaw 其实是更加通用的一个智能体啊,它呢其实是更呃有更低的这个使用这样的个门槛,对不对?然后同时呢也能够覆盖更多的啊,一些实际应用的这样的岗位。 那么这个 openclaw 啊,实战课里面我们会给大家介绍各式各样不同类型的这个应用范式啊,和基本上所有工作的各个不同类型的应用范式啊,和基本上所有的课程呢。最后我们还会介绍目前四个 核心的啊,这 open 可捞商业变现的啊,一些这个流程啊,包括全自动的 ai 内容工厂啊,包括这个全自动的啊,公司网站运维和建设啊,包括这什么呃艺人公司的啊, ai ai 员工团队啊,如何进搭建啊,以及呢,包括垂雨 ai 自动化的啊,这个服务开发等等等等啊,这个呢是属于 open cologne 啊,相关的这个技术内容啊,但是 open cologne 其实是一家更加通用的一项啊,技术开发这样的工具啊,或者说一项通用这个智能题使用的这样的个指南,那么和我们刚刚大家所看到的啊,这个 agent 开发实战课其实完全不一样的方向哈,因为 agent 开发实战课其实是更加硬核的 这样的一门啊,这个主要是面向技术人啊,大家如果未来是想做 a 证的开发啊,来去量身定制的这样的课程。但是除此之外,我们还有第三门课程啊,是由木鱼老师来主讲的 web coding ai 编程实战课啊,这个课程,这个啊,重要性就不言而喻了,对不对?这个 web coding 嘛, 哎,这个,这个,去年我们这个时候啊,大家说 ai 编程可能会还会觉得比较早,早啊,时间还比较早,那么到现在啊,大家如果说自己不会 web coding 啊,这个,这个属于是古法编程啊,是不是啊,人类手工编程啊,这是属于非遗传承的这个技术 啊,所以现在我们基本上所有场景里面啊,我们很都会呃,会用到啊,这个 web coding 这样的这个技术啊,都会来进行 ai 编程啊,那这门课程呢,是沐浴老师来主讲的啊,一门可以说啊,已经是开设第二期的 完整的 web coding 的 体系大课啊,然后呢,能够帮大家零基础啊,零门槛啊,上手 web coding 这样的工具,然后呢,开始啊,你的 ai 编程之旅啊,这可以说是现在所有程序员必备的这样的技能了,我们 可以讲解啊,像 course code code 啊,这一系列 ai 编程工具这样的使用啊,然后我们也会来讲解啊,关于像 open code, 对 不对啊,这样的开源的 ai 编程工具,这样的这个使用啊,然后呢来介绍啊,关于 ai 的 skill m c p 啊,这样使用啊,和 像 figma 啊, pencil 来进行前端设计的一些工具啊,然后呢,像以及啊,像这个 openstack, 还有 superpowers 啊,一些非常有用的,非常实用的,能够提升你的 ai 编程的水准的啊,一些这个 skill 的 这个使用啊,也包括像现在 cloud code 啊,它的 agent teams 啊,多智能体协调来进行开发的一些这个方法等等等等。 那么这门课程啊,是由沐雨老师来去主讲的啊,一门课程啊,这个对不对啊?关于 ai 编程的这个重要性啊,这个其实呃已经是非常非常重要的哈,因为其实呃这个不仅仅是现在啊,像 anthonpick 啊,像在国外顶尖的大厂啊,大家是在使用 ai 编程,国内大厂也在用 ai 编程哈, 不仅国国内大厂在用 ai 编程啊,基本上所有的岗位大家都是在用 ai 编程啊,很就是除非一些特特定的这个情况啊,这可能还需要手工编程之外啊,剩下的 ai 编程呢,它已经是属于大模型 a 智能应用的啊,一个非常成熟的这样的一个领域了。 那么在这个课程里面,我们不仅会教大家啊,怎么样从零开始去使用这 ai 编程工具上手来进行 ai 的 编程外部口令啊,同时呢,我们也会 从头啊开始教大家啊,怎么样从最开始能写高质量代码,到做出 demo 啊,到精准的输出啊,到完成一整个完整的应用啊,到推送产品上线啊,到产品二十四小时的这个运行, 到最后啊,对不对啊,全站的开发啊,到运维的完整的这个技能体系啊,写在这么课程里面,我都会来进行详细的这个介绍, 那么刚刚我们给大家看到的啊,像这样的一个复饭,呃呃呃, cloud code 啊, web 这样的一个这个程序啊,其实就是我们当前这门课程里面给大家提供的一个应用的一个工具啊,这是其中一个工具啊,我们这门课程里面其实还很多其他的工具 啊,当然其实这门课程里面我们重点是来讲啊,像 cloud code 怎么样去用好它,去完成一系列的啊,这个开发的这样的一个项目。而啊这是我们的 agent 开发实战课,那门课程里面主要是会讲它底层的原理,一个呢是 进行使用啊,一个呢是底层原理的这个介绍啊,这个呢其实是各不相同,有所侧重的这样的点。当然对于 ai 编程来说,我相信很多同学可能也会有这样的误解,大家会觉得 ai 编程吗?有嘴就行啊,对吧?只要跟他说我要开发什么,他就能完成开发,其实并不是这样,哈哈,现在其实对于很多的 a 证的使用来说,还是有不小的这个门槛的话, 你可能还是需要掌握很多的一些这个技术,然后同时也得积累一些这个经验,然后才能够完成一些很好的产品这样开发。 大家现在看到的都是我们当前课程里边会给大家讲解的啊,一系列这个产品的这样的一个这个开发,那么这门课程啊,我们就会好好的跟大家来介绍啊,关于从工具的使用啊,到我们现在前沿的实践经验的沉淀和总结啊,一整套完整的 web coding 相关这样的内容。好,那么以上啊,就是我们这三门啊,付费课程的内容介绍啊。