粉丝3854获赞16.8万

open code 最近真是太火了, github 上已经有九万多 star, 我 估计全球的大模型厂上都在针对 open code 做测试调优。 open code 是 目前真正能凭借 cloud code 的 工具,也是二零二六年到目前为止最火的 ai 工具。 open code 呢,目前只提供了英文文档,我按照其英文的文档,同时结合了 cloud code 的 学习资料,梳理了一份详细的 open code 的 中文操作手册,包括安装 基础操作、进阶使用等,如果你需要,我也可以发给你。上期呢,根据文档手把手带大家安装了 open code, 相信很多朋友已经感受到了它的强大。本期是 open code 的 第二期,主要带你完成三件事,一、免费进入最强编程模型 gemini 与 cloud。 二、教你安装 skills 与 m c p。 三、安装超级增强插件 all my open code。 话不多说,直接上干货。首先先教大家如何不花一分钱接入 cloud 模型。这里我们要接入一个 google 推出的工具 anti gravity, 中文名是反重力,它本身呢是一个 ai 编程的 ide, 内置了 gem 和 cloud 的 这两个顶级的模型。 在 gethelp 上找到 anti gui 的 这个插件,复制这行安装指令,回到 open code 里粘贴 open code 呢,就会自动下载安装。安装完成后,重新打开终端,复制这行指令回车。 然后我们选择 google, 选择带有 anti gui 字样的这行回车,接着就会跳转到浏览器,登录自己的 google 账号,复制这个 url, 粘贴到终端回车。这样我们就配置完成了。 重新打开一个终端,进入 opencode, 输入 gunmodels, 我 们就能看到 gemini 三 pro 和 cloud 四点五 opus 的 这两个模型了。我们测试一下输入,介绍一下你自己可以看到它正常的输出,证明我们接入成功了。 从现在开始,全是顶级大脑在为你打工,有了顶级大脑呢,还得有强力的四肢。接下来我们要给 opencode 装上它最火的灵魂同版包 oh my opencode, 它内置了七个顶级的编程 agent, 通过多智能体分工协助,帮你自动完成写代码,查 bug, 梳理项目结构的这些开发工作,不用再手动处理很多繁琐的细节。据说呢,是作者花了二点四万美金才搞出来的。安装呢也很简单, 复制 github 上的安装指令丢给 opencode, 它会询问你是否有 cloud 的 gpt 和 jimmy 的 会员啊,你就如实的回答,大概需要一分钟的时间,插件就安装好了。 重启 open code, 可以 使用艾特命令,从七大智能体中挑选一个帮你执行任务。或者呢,直接在提示词里呢输入 u l w, 意思呢就是 ultra work 就 可以使用 oh my open code。 接下来教大家如何在 open code 中使用 scales, open code 呢,可以无缝衔接 cloud code 的 创建的 scales。 首先来到根目录,新建一个文件夹,命名为点 opencode, 再新建一个 scales 的 子文件夹。然后呢,把你的 scale 复制到这个文件夹,就可以在 opencode 中使用了。当然,我们也可以直接在 opencode 中创建 scale, 需要先安装 scale 杠 creator, 有 了它就可以用自然语言来创建 scale。 我 们让 opencode 自己去安装这个 scale 杠 creator。 安装完成后,我们测试一下,让它创建一个翻译功能的 scale, 它会根据你的要求自动执行并创建。创建成功后,重启 open code 就 可以看到这个 skel 已经有了。最后呢是配置 mcp, 我 一般呢都是让它自己来安装 mcp, 比如安装一个浏览器 mcp, 我 会这样在这个 open code 中输入安装 chrome mcp server, 稍等一会它就安装成功了。有些 mcp 呢,需要配置 k, 我 们也可以把 k 给他,让他自己去配置,这样我们就不需要自己去手动去配置了。 然后输入杠 m c p s, 就 能看到所有 m c p。 从白嫖顶级模型到手搓专属 skills, 再到部署全能 m c p, 现在的 open code 应该已经是你的超级 ai 助手。 open code 的 不仅能进行零代码编程,更能帮你处理文件、整理资料,智能写作。下一期我会带大家继续进行进阶的学习,大家点点关注哈,跟着阿亮学 ai!

这是一期 cloud code 的 安装教程, cloud code 是 目前世界上最强的智能体,没有之一。你是不是以为它只是写代码的?但其实它在写作、写 ppt、 写文案、画图等多个领域表现都很好。它可以帮你干任何你在电脑上干的任何事, 甚至爆火的 minus 背后的核心推力引擎也大概率是它。接下来我给大家介绍一下保姆式 cloud code 安装教程。依次执行完下面这三个命令,你就成功安装了 cloud code, 并解决了中国区域 cloud code 不 可用的问题。首次启动需要登录,如果你没有官方账号,可以配置 连接国产模型。配置国产模型有两个方式,第一种方式,修改 colocore 的 配置文件。第二种方式,通过 cc switch 这个软件去自动化配。如果你有谷歌 pro 账号,我们可以把谷歌大删人的模型反带到 colocore 中使用。安装完 colocore 的 一定要安装的一个插件 superpowers 为什么需要它?普通的 ai 往往追求速度,拿到需求立刻开始写代码,这经常导致逻辑漏洞、结构混乱,以及改了一个 bug 却引入三个新 bug 的 恶性循环。 superpass 通过测试驱动开发来保证代码的质量。第一步,当你提出一个需求的时候, ai 会主动向你提问,理清需求细节,探索边缘情况,生成设计文档。 然后它会将大任务拆解为无数个二到五分钟可以完成的小任务,确保执行过程不偏航。最后,它会先写报错的测试,再写通过的代码。这种流程确保了每一行代码都是可工作的。

早上好,家人们,我是鬼子,昨天上午 opus 四点六发了,还发了一个 team agent teams, 我 早上用它做了个视频,说我一小时写了一个 cloud 的 桌面端, 当时我确实很震惊,因为这个事情就是 cloud 的 ui 和 cloud 的 core 的 本身其实连接这块儿很不好做,所以来介绍一下。 我昨天用了一天时间,我给 op 四点六,他给我做成一个客户端了,而且颜值高了非常多,所有的功能全部都齐全。来介绍一下 code palette, 昨天 op 四点六一天做的 cloud code 客户端,目前已经开源。这个客户端主要的能力,它几乎支持 code 的 所有的功能,你的 选择,选择文件夹,切换模型,我们的斜杠命令,你的 skills, 什么调用 skills 都可以。而且它有很多易用性的设置,比如说你可以可生化的去控制你的 cloud code 的 配置文件,你在这儿配置完直接就保存就可以,没有问题。它还支持第三方的 a p i 去配置,比如说这儿 你就可以配置你常用的第三方的 colocode, a p i 也可以。呃,当然,如果你 colocode 本身是授权安装的,或者是你已经改了环境变量,你不需要在这设置,它直接就能提取到。你不用管这个事,格式化的管理你的 skills 和 mcp 文件,还有你的 plugin 直接预览, skills 也可以直接新建,这儿可以新建,你也可以改以编辑和改 skills, 点 m g 可以 直接在这儿修改和预览,还有编辑删除都可以。然后在这里边你可以去 你所有的聊天记录都在可乐扣的最大的一个问题,对于很多小白最大一个问题,我找不着我聊天记录,很多人觉得我的聊天记录其实很有价值,但是我找不着,你用这个就可以找到你所有的聊天记录都保存这样,而且他跟你的文件夹是绑定的, 而右边的话你可以预览你文件夹里所有的内容,这就是你文件夹里所有的东西,它如果是竖的话,它会支持可以预览,但是可以预览, 然后目前只支持了那个文本。哈,后面我兼容一下这个多模态的这个,如果他遇到这个视频和图片的话,就让他打开玉兰,然后你可以改你这个标题,然后也可以去,然后我们这这里边的聊天里边,你看会有会有玉,就是这个你这句话说了多少钱的玉兰? 然后这边新版本可以快速复制,现在我这个是旧一点的版本,新版本可以快速复制,然后你可以在这里快速的查看你的 cologoldoc 的 连接状态,他会告诉你连接还是未连接,如果没有连接的话,你应该怎么去安装 cologoldoc 的? 都是有的, 包括说我们这个删除搜索,基本上跟你看到的市面上的所有的 agent 软件都一样,就等于我实现了一个 co worker, 但是呢比 co worker 更强大,因为它支持 cologoldoc 的 所有的功能, 而且它还是开源的,你可以随便的改。对,这就是昨天用 oppo 四点六和 agent tims 做的可乐扣的桌面端,叫 code palette, 当然我们也可以切换这个明暗模式,都非常漂亮,主要是都非常漂亮,昨天有人喷这个也叫 u i 喷我的人,看看现在这个算不算 u i 朋友们,这个算不算?然后你这个模式切换,这会有 左边会有显示,他会显示当前是什么模式,当前是什么文件夹,什么时候聊的天,同时如果这个聊天这个文件夹正在工作,你看这个文件夹如果正在工作,他会有个红点,你切到其他文件夹再回来,他也会告诉你,他会告诉你哪个文件夹正在工作,就是哪个聊天记录正在工作,这个也是非常好的。 好,就是这些,我们来看一下这个 agent teams 到底是什么东西,就是它可以将一个主的 master 智能体委派给你多个队友,就它会有一个主的智能体控制你多个角色的 agent, 然后让他们相互协助,然后展开调研、调试和构建工作, 然后他们之间是可以互相通信的。每个 a 阵的主 a 阵呢,可以实时的知道子 a 阵的进度,子 a 阵也可以主动汇报给主 a 阵的,所以他们的写作是非常顺畅的。如何起用?其实非常简单,你就找到这个官方文档,然后把官方文档的 扔给他,官方文档直接扔给可乐扣子,让他帮你起用就行,其实就改个参数,他直接就能可以帮你改,然后有一些使用技巧哈, 你可以看到官方文档里有那个使用建议的提示词,就说你要给每个 a 阵子设置角色,每个 a 阵子在干嘛?你可能很头疼,我就是一个任务,怎么我,我还得想这些,你,你还是老问题,你把官方文档扔给他,你就说我要实现一个什么什么任务,你帮我构建一个 a 阵的 teams, 然后你也可以说直接让他帮你去写提示词,写 a 阵的 team 提示词,然后写完以后你审核,也可以说直接让他帮你构建一个 team 词, 让他直接执行就可以了。第二个是前期调研是比较重要的,就是我在昨天写这个客户端的时候,发现前期调研非常重要,在一些客户端选型,在一些架构上,其实你的选错一步,后面就会非常难受。 这里建议就是你要增加一个调研的角色,无论哪个需求都要增加一个调研的角色,让他去查看目前可付用的市面上最好的东西的架构选型应该怎么去结合,要不要去切架构,这些都需要。 哪怕你,哪怕你是说你要去优化 ui, 你 都要去让他找市面上说最好的图标库是什么,然后组建库是什么,这些都要去做。 然后第二个是第三个是 team 的 角色,不要用原来的软件工程去设计,就是我们实际上人是没法变的,你知道就是你,你给你配了什么队伍,你很难配,除非说你开了重新招人干嘛的。但是这里边 team 不是, 就是你可以针对性的设置每一个软件工程的角色,甚至让他有特长。就比如说同样是 qa, 在 去测评逻辑的时候,它就是 code review, 然后去测评那个测评的那那个功能啊,功能逻辑,实现逻辑,然后如果是体验优化,那你这个就可以去搜查视觉,搜查体验就是它,它的长度可能在体验那边同时监 qa 和代码,这个都是可以设置的, 所以不要让自己原有的这个工程能力和工程思路固化。好,这个就是今天发的内容,主要给大家介绍一下昨天发的 logo 的 桌面端 code palette 和我昨天用 op 四点六和 ai team 四的一些感受。 这个时代确实不太一样,就是我发现真的只要你敢给 ai 花钱和敢给 ai 权限,他能做到非常厉害的事情。 你像写个 ios, 写个 macos 客户端,然后非常好用,没有 bug, 所有的功能都能用一天产出来。我以前是根本不敢想的,我觉得很多程序员以前也不敢想。最后说一下这个图标,图标很有意思,为了避免这个 cologne, 我 按所 pick 去,就是即使开源它也有,它也会说你侵权嘛。 所以我做了一个这样的图标,就是从它原始的那个图标的发放射性的那个菊花形状,变成了一个体束的放射性的形状, 你猛的一看有点像,但是他又是一个立体的提速的形状,也很漂亮。你看放在这一堆非常放在这一堆非常著名的工具里边,一点也不违和,而且非常漂亮。好,这就是藏师傅今天的分享,我们明天见。

你在用 cloud code 做一个大项目的时候,是不是经常觉得一个 session 不 够用? 改前端的时候,后端在 id 写测试的时候,主逻辑停了, review 代码的时候,只能从一个角度看,你想让 cloud 同时干好几件事,但一个 session 只有一个脑子干完一个才能干下一个。现在 cloud code 支持了 agent teams, 你 可以同时跑多个 cloud 的 实力,让它们像一个真正的开发团队一样写作。今天这期视频看完,你就能在自己的项目中把 agent teams 用起来了。 大家好,这里是 l l m x factors, 一个专注于拆解大语言模型时代底层逻辑的频道。 今天我会从四个层面帮你完整理解 agent teams。 首先是它到底是什么,我会用一张架构图帮你建立全景认知。然后是核心机制,从起用配置到任务系统到通信方式六个步骤逐一拆解。 接着是三个实战场景,并行 code review、 竞争假设、 debug 以及跨层并行开发。最后是决策框架,帮你判断什么时候该用 agent teams, 什么时候用 subteams 或者 denunciation 就 够了。 好,既然知道了为什么需要它?我们来看看 agent teams 到底是什么?我先给你一张全景图。 agent teams 的 整体架构有四个核心组建我一个一个讲。最上面的 team lead 就是 你当前的 cloud code session, 它的职责是创建团队, 给每个 teammate 分 配任务,最后综合所有人的工作结果,你可以理解成项目经理。下面这些是 team mates, 每个都是一个独立的 cloud code, 实力关键词是独立。每个 team mate 有 自己的 context window, 互相之间不共享上下文,这意味着 team mate a 不知道 team mate b 在 做什么, 除非通过消息系统沟通,然后是两个共享资源。 tasklist 是 所有人都能看到的任务看板 lid 在 上面创建任务, teammates 可以 认领和更新状态。 mailbox 是 消息系统,支持两种模式,点对点发给特定 teammate 或者广播给所有人。 打个类比帮你理解。 agent teams 就 像一个项目经理带几个工程师 pm 在 giro 上创建 ticket, 工程师认领后在 slack 里沟通, team lead 就是 pm, task list 就是 giro, mailbox 就是 slack, 每个 teammate 就是 一个工程师。但这个类比有一个重要区别, 真实的人类团队,工程师可以走到对方工位看代码,或者共享同一个知识库。 agent teams 不 行,每个 team mate 有 自己独立的大脑,也就是独立的 context window, 不 能直接看到其他人在做什么, 所有信息交换都必须通过 mailbox 显示通信。这个区别很重要。后面讲到最佳实践的时候会用到 很多人会把 agent teams 和 subteams 搞混,我们来看看它们的核心区别。从 context 来说, subteams 是 在主 agent 的 session 内运行的,结果返回到主 agent 的 context 里,而 agent teams 的 每个 teammate 有 完全独立的 context window。 通信方式上, subservants 只能向主 agent 汇报,最终结果是上下级关系。 agent teams 的 kinmates 可以 直接互相发消息,是平级协助关系。任务协调方面, subservants 有 主 agent 全权管理, agent teams 有 共享的 task list, team mates 可以 自己认领任务,不用等力的一个一个分配。适用场景上, sub agents 适合聚焦型任务,你只需要最终结果。 agent teams 适合探索型任务,需要团队成员之间的讨论和挑战。最后是成本, agent teams, 因为每个 team mate 都是独立实力, token 消耗会明显更高。一句话总结, sub agents 是 派出去办事,然后汇报。 agent teams 是 组建一个真正的协助团队, 给你一个快速判断逻辑。你的任务需要多个沃克同时工作吗?如果是下一个问题,这些沃克之间需要互相沟通吗?如果不需要,每个人独立完成任务,然后汇报结果就够了, 那用 subordinates, 清亮又慎重肯。如果需要,比如一个人发现了什么,要告诉另一个人,或者需要互相挑战对方的方案,那就用 agent teams。 还有一种情况是任务之间有依赖关系。 agent teams 的 task list 原生支持依赖管理 任务 a 没完成任务 b 就 不会被认领。 sub agents 做不到这种级别的协调。记住这个判断标准,需要沟通。用 teams 不 需要沟通,用 sub agents 有 复杂依赖也优先考虑 teams 概念清楚了,我们来拆解 agent teams 的 核心机制,一共六个步骤,先减后烦,一步一步来。 第一步,奇用功能, agent teams 目前是实验性功能,默认关闭。你需要在 settings 权限里加一个环境变量,把 cloud code experimental agent teams 设成一这个文件在你的后目录下的 cloud 文件夹里。同时你可以设置显示模式。 teammate mode 有 三个选项, auto 是 自动检测, in process 是 所有 team mate 跑在主终端里, timax 是 每个 team mate 一个独立的终端分屏。 auto 模式下,如果你已经在 timax 里,就自动用分屏,否则用 in process。 建议刚开始用 in process 最简单,不需要额外安装任何东西。 第二步,创建团队你不需要写任何配置文件或调用 a p i, 直接用自然语言告诉 crotd 你 想要什么样的团队,多少个成员,每个人负责什么。比如你说帮我创建一个团队来 review p i, 一 百四十二三个人分别看安全、性能和测试覆盖。 crotd 会自动创建团队 深沉共享的 task list spawn, 三个 teammate 给每个人分配对应的任务。你还可以指定具体用什么模型,比如让每个 teammate 都用 sonnet cloud 也可能主动建议创建团队,如果他判断你的任务是合并型处理,他会问你要不要组团,但最终决定权在你, cloud 不 会未经确认就创建团队。 第三步,理解任务系统。 tasklist 是 agent teams 的 核心协调机制。每个任务有三个状态, pending, in progress, completed。 流程是这样的, lead 创建任务后,状态是 pending teammate, 认领任务后,状态变成 in progress。 工作完成后, teammate 把状态改成 completed。 lead 有 两种方式分配任务,一种是显示分配,直接告诉某个 teammate 去做某个任务。另一种是让 teammates 自己认领,完成一个任务后自动去 tasklist 上找下一个没人做的任务。 这里有个细节,任务认领用了文件所机制,防止多个 teammate 同时抢同一个任务。 任务系统还支持依赖关系,比如测试任务依赖于功能实现,任务实现没完成,测试就不能开始。 你可以在创建任务时声明依赖系统会自动管理。当一个任务被标记 completed 后,依赖它的任务会自动解锁,变成可认领状态。 这个设计很重要,它保证了有先后顺序的工作,不会乱套,同时不需要人工去盯着解锁力的,只需要在创建任务时把依赖关系说清楚,后面的调度全是自动的。 到这里,你已经知道怎么起用 agent teams 怎么创建团队以及任务系统是怎么运作的了。 回顾一下,起用只需要在 settings justin 里加一行环境变量,创建团队用自然语言描述就行。任务系统有三个状态支持依赖管理, team mates 可以 自己认领任务, 这三步是基础,掌握了就能跑起来了。接下来是更有意思的部分, team mate 之间怎么沟通,以及几个让你精细控制团队的高级功能。 第四步,通信机制。 teammates 之间通过 mailbox 通信,有两种模式,第一种是 message 点对点发送,你给特定的某个 teammate 发消息,只有他能收到。适合针对性的协调,比如 lead 通知,安全 reviewer, 重点关注某个文件。第二种是 broadcast 广播,一条消息同时发给所有 teammates, 适合全员通知。 比如某个 teammate 发现了一个关键 bug, 需要所有人都知道,但要注意广播的成本,每个 teammate 都会把这条消息写入自己的 context window, 所以 广播用得越多, token 消耗越大。还有一个设计细节, 消息到达后是自动投递的 le 的, 不需要主动轮询, teammate 完成任务后也会自动通知 le 的。 第五步,显示模式。 agent teams 支持两种显示方式, in process 模式,所有 teammates 跑在你的主终端里,用 shift 加上下箭头切换不同的 teammate, 按 enter 查看某个 teammate 的 完整输出, 按 escape 可以 打断它当前的工作。这个模式不需要任何额外安装,任何终端都能用 splitpence 模式,每个 teammate 有 自己独立的终端分屏,你可以同时看到所有人在做什么,点击某个面板就能直接和那个 teammate 对 话, 但这个模式需要 tmax 或者 itm。 二、我的建议是先用 in process 入门,等你熟悉了 agent teams 的 工作方式之后,再切到 splitpence, 获得更好的个性化体验。 第六步,高级控制这里讲三个重要功能。第一个是 delegate mode, 默认情况下, lead 有 时候会忍不住自己动手写代码,而不是等 team mates 完成。你可能已经分配好了任务,结果 lead 自己先做了一半,搞得和 teammate 的 工作重复甚至冲突。 delegate mode 解决这个问题,它限制力的只能做协调工作。 spawn teammate 发消息管理任务,不允许直接修改文件或写代码,所有实际的代码修改都必须交给 teammates, 按 shift 加 tab 就 能激活。这个模式在任务比较复杂, teammates 比较多的时候特别有用。 你希望 lead 专注于总控和综合,而不是分心去做执行。第二个高级功能是计划审批。对于复杂或有风险的任务,你可以要求 teammate 先做计划再实现。 具体流程是, lead 在 spawn teammate 的 时候声明需要 plan approval, teammate 会进入止读模式,只分析问题和制定方案, 不做任何修改。方案完成后提交给力的审批,力的可以通过,也可以拒绝。如果拒绝了,会附上反馈 teammate, 根据反馈修改计划重新提交。只有审批通过后, teammate 才能退出计划模式,开始实际编码。 你还可以给力的设定审批标准,比如只批准包含测试覆盖的方案,或者拒绝修改数据库 schema 的 方案。 第三个是 hooks, 可以 理解成质量文 code code 的 hooks 系统支持两个和 agent teams 相关的钩子, teammate idol。 当一个 teammate 即将进入空闲状态时出发,如果你的 hook 脚本返回 exit code 二,就会把反馈发给 teammate, 让他继续工作,而不是停下来。 task completed, 当一个任务即将被标记完成时,触发同样, exit code 二可以阻止任务完成并发送反馈要求改进。这样你就可以用自动化脚本来做质量检查,比如跑一遍 link, 跑一遍测试不通过就不让 tmit 收工, 机制都清楚了。接下来我给你三个真实的使用场景,让你看到 agent teams 在 实际项目中怎么用。 第一个场景并行 cold review, 传统的 cold review 一个人看往往会偏向某一类问题,比如你可能先看到了安全问题,然后就一直在安全的角度上深挖性能问题,就容易漏掉。用 agent teams, 你 可以同时 spawn 三个 reviewer, 一个专看安全,一个专看性能,一个专看测试覆盖。每个 reviewer 只关注自己的维度,不会互相干扰。看完之后,力的综合三份报告,给你一个全面的 review 结果,这比一个人创新 review 三遍要高效得多。 而且因为每个 reviewer 是 独立的 context, 不 会因为先看了安全问题就对性能问题产生认知偏见。 第二个场景,竞争假设 debug, 这是 agent teams 最有趣的用法。当一个 bug 的 根音不明确时,一个人调试容易陷入铆钉效应,找到一个看起来合理的解释就停了, 其实可能不是真正的原应用 agent teams, 你 可以 spawn 五个 teammate, 每个人负责验证一个不同的假设。关键是这里用了一个对抗式设计。 每个 team mate 不 只是验证自己的理论,还要试图推翻其他人的理论,就像科学辩论一样,最终经受住所有挑战的假设,才更可能是真正的更硬。 这个 prompt 里有一个细节很重要,让他们互相 talk, 互相 disprove, 这正是 agn team's 比 sub agn 强的地方。 sub agn 做不到这种横向讨论。 第三个场景,跨层并行开发。比如你要做一个新功能,涉及前端组建,后端 a p r 和测试。传统做法是串行,先写后端,再写前端,最后写测试。用 agent teams, 你 可以三个 team mate 并行, 一个负责前端,一个负责后端,一个负责测试, lead 负责协调,比如确保前后端的接口齐员一致。当后端 team mate 修改了 api 的 参数格式,它可以通过 mailbox 同之前端 team mate 同步调整。 这里有个重要原则,三个 team mate 要操作不同的文件,如果两个人同时改同一个文件,会导致覆盖冲突,所以在分工的时候要把文件边界划清楚。 场景看完了,最后帮你做一个决策框架,什么时候选 agent teams, 什么时候不需要,先看,什么时候适合研究和 review 任务。多个 team mate 可以 同时从不同角度调查同一个问题。 比如刚才说的并行 code review 新模块开发,每个 team mate 负责一个独立的模块,互不干扰竞争假设 debug 并行测试,多个假设用对抗式辩论收敛。 跨层修改,前端后端测试各一个人,再看什么时候不适合。顺序依赖的任务,后一步必须等前一步完成。并行没有意义。同文件编辑,两个 teammate 改同一个文件会互相覆盖。 简单,任务协调本身就有开销,任务太小的话开销大于收益。 token 敏感的场景, agent teams 的 token 消耗是倍数级的。核心判断标准就一个,你的任务能不能拆成独立的并行单元,能拆就适合,不能拆就不适合。 aging teams 目前还是实验性功能,有一些限制,要了解。第一,不支持 session 恢复。如果你 resume 一个 session 之前的 in process, teammates 不 会恢复, lead 可能会尝试给不存在的 teammate 发消息,这时候你需要告诉他重新 sport。 第二,一个 session 只能管一个厅,想建新团队必须先清理旧的。第三,不能欠套。 teammates 不 能创建自己的子团队,只有力的能管理团队。第四,力的固定,谁创建的团队谁就是力的,不能转让。 第五,任务状态有时会滞后, timet 可能忘了把任务标记成 completed, 导致依赖他的任务一直堵塞,遇到这种情况手动提醒一下就好。第六, splitpence 模式需要 tux 或 iterm。 二 vs code 集成终端和 windows terminal 目前不支持。 最后,给你一个最佳实践速查表。第一,给 timet 足够的上下文, timet 不 继承立德的对话历史, 所以 spawn 的 时候要在 prompt 里把项目背景、文件路径、技术栈关注重点都写清楚。第二,合理拆分任务力度。太小的任务协调开销大于收益,太大的任务, teammate 可能跑偏了你都不知道。 经验值是每个 teammate 分 配五到六个任务,既保证持续生产力,也给力的足够的机会调整方向。第三,避免文件冲突。两个 teammate 改同一个文件会覆盖, 所以分工的时候一定要把文件边界划清楚。第四,定期检查进度,不要让团队 unattended 跑太久。第五,如果你是第一次用,从 review 和 research 类任务开始,这类任务边界清晰,风险低,是最好的练手场景。 我们来回顾一下今天的内容。 agent teams 由四个组建构成, team lead 负责协调。 team mates 独立执行 task list, 管理任务状态和依赖。 mailbox 提供点对点和广播通行。它的核心价值是并行探索和多角度协助,特别是 teammates 之间可以互相挑战对方的方案。 和 substance 相比,如果你的 walker 之间需要沟通,就用 teams, 只需要最终结果就用 substance。 最适合的场景是 code review 竞争,假设 debug 和跨层并行开发, 使用时注意避免文件冲突,保持合理的任务力度。给 teammates 足够的上下文,如果你想试试的话,建议从你下一个 pr 的 code review 开始。 spawn 三个 reviewer 分 别看安全性能和测试,感受一下并行 review 的 效果。 如果这期视频对你有帮助,记得点个关注,这里是 l l m x factor, 我 们下期见。

哈哈,好快呀, cloud bot 又改名叫 mot bot 了,这个爪子机器人又改名叫蜕壳机器人。刚好我有一台空闲的云服务器,试着在云服务器上部署了这个 cloud code, 在 安装了很多包之后,终于进入了 cloud code 的 安装界面,现在在进行一些配置。前面我已经配置好了使用的大模型,我选择的大模型是蒙索, 也就是 kimi 的 a p i。 进入的社交媒体软件是 telegram, 现在正在配置 telegram 的 步骤,需要配置 telegram 机器人的 a p i 和 token。 好, 如果感兴趣的小伙伴可以点赞关注下一个视频,我会介绍怎么在云服务器上安装好 cloud code, 并且接入 telegram 的 聊天,让他帮我们执行一些简单的任务。

大家好,今天呢我们来分享一下可乐的扣的,来加速我们的一个谷歌 ceo 的 一个进程啊,我们如何去配合这可乐的扣的来完善我的一个谷歌的这个节奏?最近我是做了挺多的研究关于可乐的扣的,也是大家的一个学习方式呢,给我一个启发啊。这个的话 最近我是跑的比较多一点,我到给你分享一下大致大致的流程啊,我给你提供一个思路,我目前是这样在做的,你们可以参考整体,你们自己去怎么去用呢?这得看你们的一个想法,只提供一个大致的一个思路和想法,你们可以参考啊,希望对你们有帮助。 做谷歌 ceo 呢,个人有每个人都有每个人的一个方式和方法。这个谷大师的一个情况,我们以前可能有些东西啊,你想要通过这个流程去做这个事情,其实是比较困难的,我们可能得通过很多种工具,或者说通过人工的一个方式去去附和。他现在的话情况就是我,我把我内容提供给他,我写一些规则,他就给我这样子去去替补这个缺口。 那整体很多事情,其实情况这个词具体跟我们这个这个核心的一个页面情况,内容关键词是不是相关,直接就是 a 呀?通过 通过社群能够帮我去查询这个到底合不合适,那这个事情的话,如果我们人工去去做的话,其实工作量就比较大了,但通过他呢,我们可以一方面呢,那我都在保持我原有的一个网站的一个要求下,他能够给我做一个相对细致的一个活,把这个内容进行轮替,或者说精细化的一个修改,这样能达到一个相对稳定的一个结果啊,大概是这个流程, 这个我做的三个步骤,三个步骤我给大家简单的来梳理一下我的一个情况,你可以看一个整体,一个一个结果。最近我做这个事情花了很多时间成本还没去算,它那最核心的就是时间成本。你看我为了优化这一个页面,在我原有的一个支柱页面的一个前提下啊,去做这个东西。他,你看目前他给我把这个东西分析好,弄好 通过可乐扣子去跑,他就得花两到三个小时才能够跑出来整体的一个情况,那这个时间确实是蛮蛮长的,所以的话我们现在的一个工作情况时间上面就增长了啊很多, 但是整体它跑下来的一个结果其实我是比较满意的。所以目前的话,为什么我很多项目目前都是很多玩家,其实我一直拖着没去,没去呃,去做,一方面我们放假,我们要放到三月一号,但实际上我们基本上一直在工作,一直在工作,但是有些活其实我没怎么去干它,因为我我想把这东西跑熟了,去用这些东西去实施它, 因为我们对于整个 so 的 一个轮替更新其实是蛮重要的,一旦有新的想法之后,我就想着能不能用它去做这个事情啊?我,我是对我的一个帮助,应该是会有的,应该是会有的,我觉得可能对效果方面更有把控一点,这样的话我就可能不需要过分的去修改我之前的一个东西了啊,因为去你去修改这些东西挺麻烦的,挺麻烦的。 好,那我大概给你拆解一下,对于这个事情我们去做它该做什么事情啊?首先你做的第一个啊, so 调研是吧?调研之后呢?我们首先第一个调研是我们是提供一些东西的, 那首先我们公司的信息包括一个一个项目背景,这个是你要提供的公司的背景。一方面我们做的模式的时候,首先第一个你客户的一个公司信息,你们是做什么的?你们有什么优势?那这个东西可能得提供给我。另外的话,我们这个关键词做调研, 调研完之后呢,我们会出这样一份报告啊,这个其实是大致的一个一个报告,我会先出这一份,先出这么一份东西啊,大致是这样,会有个流程啊,有大致的一个规划在这里,这是基础,我要提供给我客户的做一个参考,这是第一个,第二个我会跑另外一个东, 这个简单跟你说一下,这一份也是我们跑出来的,后面跑出来的为什么要做东西?这个东西其实有一个很重要的一个点,我们称之为竞争分啊,我们也可以称之为谷歌 s 的 一个优化分啊,你可以看的话其实是基于 mlp 的 一个数据来进行评分的,评分其实蛮重要的,如果你啊 这个评分其实就衡量我们到底这个页面到底有没有用啊?如果说你的优化度高的话,相对比较高的话,那你这个得分就会比较高一点。所以的话,为什么我们刚刚得分会大致的一个情况,我们的目标就是说我提供了一份我的一个运营的一个大致的一个计划,我的目标是能够超越目前, 目前你看 rank 这边有 one 的, 你看他大致这个情况,我们去分析他,所以的话,我的目标是是是怎样,大概是这样,所以的话这个是蛮重要的一个点,所以的话我们目前的一个情况就是如何去做出来这样的内容,做成我们的一个落地页,这个是很核心的一个点啊, 为了能够完成这个点呢,我们提供另外几个东西,所以第一个我们已经有比较成熟的一个东西的,比如说你看我们是不是有相对比较成熟的一套体系在这里啊?我们能做流量,能做比较好的核心子排名,这点是有的。以这个基础呢,一方面我们做落地页的内容还可以,做落地页的话,其实我们还是相对会引用之前的一个做法。首先其实博科业,博科业为什么流量会比较高呢? 我们还能做很多的那种,就是流量比较高的词,那其就是因为什么呢?一篇文章的啊,优化度比较高,写文章其实优化度是相对容易提升的,但是你落地页上提升是比较困难的啊,所以为什么能做那么高流量?其实博客还是占了很大的一部分的,所以我们在这个基础上我们做一份综合指南,在这里 什么一个啊?就这意思,我,我以这个关键词去写出来这样一篇 su 内容啊,大致是这样,这篇的话我们当初写完的话,我们检测过优化度可能在九十分左右就比较高的一个水准,相对比较高的一个水准,这个跑分什么意啊?这个跑分之前跟你讲过,你可以通过一些工具去跑,你看就这个意思啊,这个分数这边是八十八杠一百,但这就是我们所谓的 su 分 数, 你可以去看你内容到底能有多少分,他会给你评分了。所以为什么你们很多的内容可能不达标,不达标就是因为这个分数可能不行,你包含的那个 n、 m、 l、 p 的 关键词词数不达标,还有 l、 s、 r 关键词不合适,你的搜索意图完全可能不太合适,跟你的用户人群各这方面都不太匹配,所以可能你的效果就不会那么好,所以这个怎么称之为质量? 那有了之后呢?我们就用这个 app 调取调取这一个 s 幺 p 查询呢,让他去查询就是谷歌前十或前二十的一个数据,你去看他搜索意图,这个是蛮重要的,我们得研究他搜索意图, 先去跑出来他们的一个情况是什么页面,什么一个情况,他们有什么一个一个要点通过他去分析一下,分析完之后呢?我可能会达到得到这么一个数据,在这里啊,这个就是给我们的搞得看的, 那大致是他们同行是什么一个状态啊?在这里我们去看一看,可能会比较好,对应的我们的关键词的一个 so 格局,我们应该有哪些东西啊? people also、 ask 这边的话我们也会跑出来,跑完之后这些都是去给它基于这些东西去做的。其实这个数据是比较重要的,刚刚我会提供另外一份东西在这, 这个词频是蛮重要的,我们称之为 mlp 的 一个词频,有这个词频之后呢,就会生成对应的,刚刚就是这些东西啊,这边会有一个推荐的一个词频在这里,而有了它之后呢,我们可能为我们后面做内容做基础啊,这 些我们称之为 l s 二关键词对应的它是因为我们一个页面可能会出挺多关键词嘛,它再去查询那对应的它有哪些词是够用的,那这样就是会进行我们的整体的一个关键词的融入进去,那这些都是为我们后面做页面做内容做一个基础啊, 这个逻辑呢,大概是这个意思啊,反正就基于我提供这些东西之后呢,他给我轮替进行复审,再给我,比如说可好的给我写内容,给我做轮替,其实还是基于我刚刚提供的那篇 so 内容, 他能不能给予我提供一个东西,他给我做一些补充修缮,这样子的去去做,做完之后呢,再给我复审,再丢回去,再给我做复审。工作量其实就是通过他,他给我实现了,他给我实现了这段时间你看我,我给他提了很多要求,他这边就是一个一个复审的一个结果,需要花很长的时间, 这个时间如果你去用人工去想,我感觉应该可能一个人一天可能还做不了一个,通过他的话,可能花一个小时就会搞定了,所以这个是我们的一个效率的一个提升啊,所以我觉得比较不错,后面可能还有更多的一个上升空间在这里啊。还有做完做完这个之后呢,他给我申请一篇内容呢,我们还要再通过他去过人工呢, 这个是比较重要的,因为为什么要过呢?其实这这东西做完之后呢,我们有一些检测,其实已经能过的,但是这段时间我发现另外一个东西是目前 s o g 里面是好像比较认可的一个东西,好像不行,就这个东西,这东西,这个是我啊,也是困扰我挺久的,我大概也跑了一天,那天也是熬的挺晚,跑通的。那现在我做了一个落地液,大概给你看一眼啊 内容,这内容是这样的,我我做完它之后呢,我就给他去检测,检测出来呢大概是这个结果,你看啊,这边是获得了这个结果啊,这个是真的挺难的,挺难的,也是中间是消耗了我挺多精力的,好不容易才那样。那为什么要做这个事情?目前我为了避免以后的一个问题啊,我的内容目前看的话,深度各方面都还 ok, 也拿到一些结果,但是我有些网上可能出现被叫醒的一个情况,这个是几个其他的一个风险啊,上次也说过了,正是因为有一个 ai 的 一个情况,在 ai 率的一个情况在,他认为我的这个内容是可能 ai 率我应该有百分之六十到七十的 ai 率吧,他觉得好像不是那么的友好, 我尽可能要降到百分之五十以下,目前啊这个我看有有挺大的概率能够到这个数据的,所以我觉得还 ok。 然后这个是为了避免以后我的他因为我的内容可能是 ai 写的一个惩罚,那这样是能够规避一些风险,所以这个事情得做。 那其实基本上到到这一步的话,我的落地页的内容就基本上是已经完成了,就有了,有了之后呢,我再以这个内容再去做我们的一个页面的设计,做前端, 再把这些内容做到我的那个我的蜘蛛页里面去了。你像这个页面我整体拿到了我的内容之后,我才开始做的,我没有内容的话,我是没有办法开始做框架内容的,这样子做做做做做,目前其实我们主要是在做一些细节,多一点,我尽可能的完善这个过程,让谷歌觉得我的内容相对更好一点,再完善 e a t 吧, 这个也是我最近添的一个东西,希望能对我的内容是更友好一点,这也是我们做的一个改变吧,还是得这一面还没做完,还没做完啊,但内容已经是好的,我准备做完它啊, 这个其实就是我的一个变化,但整体其实有改善了一个空间,我我甚至已经想好后面可能有更好的一个想法。我已经还有很多的一些用法,其实都已经想好了,但只不过有些成本确实相当高,可能有些项目是没办法去覆盖到的,所以目前这个优化越挫,可能成本就越高了, 就挺那个的,但是我觉得是蛮期待的时候能我目前手上接了很多项目的,我能够以这种方式把这个文案做出来去上线看结果,那这个是我比较比较向往的一个东西啊,所以也是尽快吧,尽快赶紧开始把这些事情给罗一下,有些网上能上线的赶紧上线啊,也不想让大家等那么久, 大家也是给给予我很大的一个支持,也没有怎么催我,因为你催我的话其实就没办法去做那么细了,这个东西也没办法啊,就今天大概讲这些吧。

你的 cloud code 是 不是做啥啥不行,感觉像个小白?别怪 ai, 因为你漏了这个百分之九十的人都忽略的隐藏文件,只要配好这个叫 cloud dmb 的 文件,这就相当于你给 ai 写了份岗位说明书,不写他就是个啥都不知道的新人。 写好了,他上来就是老员工。今天直接把官方文档里的几个神奇配置拆给你看。第一个,别往一个文件里什么都塞,两百行以后的内容 cloud 根本不看。很多人想着把所有规范都写进 cloud 点 m d, 结果写了三四百行,但官方文档里明确写了, cloud 只会自动加载前两百行的内容,超过的部分他压根不读。正确做法是,核心信息,精简化 cloud 点 m d 详细的规范,单独放用 add 符号引用。比如你写一句 add docs slash code style dot md, cloud 需要的时候会自己去找来看,这样它每次启动都能抓到重点,回答更精准。第二个, cloud 其实自己会记笔记,但你得知道它记在哪。用久了之后, cloud 会在你电脑上建一个文件夹,路径是到 slash dot cloud projects 里面,按项目存了他自己的记忆笔记。比如你之前调试一个 bug, 他 会把解决方案记下来,但风险在哪呢?如果项目更新了,但记忆没更新,他就会按过时的老方法去做,反而出错。所以建议你定期去那个目录看一眼,或者在 cloud code 里输入 memory, 打开编辑器改一改。第三个,有些配置只想自己用,不想让别人看到。用 cloud local md。 如果你跟别人一起做项目, cloud 点 md 是 大家共用的,但你有自己的习惯,比如喜欢 cloud 回复简洁一点这些个人喜好写进公共文件就不合适了。 cloud code 有 个 cloud local md, 写在里面只对你自己生效,不会影响别人。最后一个技巧,第一次用 cloud code, 先输入斜杠 in it, 它会自动扫描你的项目结构,帮你生成一份基础的 cloud md, 该填什么都帮你。你好了,你只要检查一遍改改就行,比你自己从零开始写快得多。说到底,不配 cloud, 点 m d 就 用 cloud code, 就 像雇了个实习生,但不给他任何交接文档工具,再强不配置就发挥不出来。你们有配过这个文件吗?评论区聊聊。

一觉醒来, flat code 可以 使用最新的奥克斯四点六的模型,然后我去查了一下 这个新模型主要的变化是上下文窗口,原来上下文窗口大概只有二十万头,肯你和大模型聊多了以后,它上下文太长了,会感觉整个模型会有点僵滞,所以我们会需要不停的去清除这个上下文窗口。 现在增强到一百万,可能会对上下文的剪辑帮助会大一些, 然后他的编码能力得到了提升。这份 ppt 是 我让 cloud 自己生成的,当他以为他是业界第一的时候,也就几个小时之后, open ai 就 发布了 gpt 五点三,现在在全民的榜首上排名第一的是 open ai。 第三块知识工作的话,我是觉得现在很多人都在使用 cloud code 去做知识管理。前前两天我还看到一个自媒体博主在做数学的教案, 还有很多人现在都是在拿 cloud code 的 去做公众号发文的 skill。 目前我们搭出来的发文的 skill 还是挺好用的。后面增加了自适自适应思考,原来就是深度开关的开合关,现在有四档控制。其实我是觉得没没必要那么麻烦,正常直接点 high 就 可以了。我做系统加勾的时候肯定会选 max, 然后它还增加了多个智能体验。这个原来我们在 cloud code 里面也是多开窗口去解决的。后面还有一个办公工具深度集成我不是很清楚,因为我用这些办公工具不太多。 cloud 本身就可以和 google drive 可以 连上的, 然后也可以直接通过网页生成 ppt。 这个好像是应该是在 powerpoint 里面,通过 cloud 的 对话可以直接生成一份完整的 ppt, 大 概 这个就是传统的跑分。简单总结下,我觉得这次模型更新其实不是,更新的内容不是很多,主要还是上下文的增 增加。相比较而言,我感觉 openai 的 这次 codex 可能会更好用,现在也出了 mac 的 版本,我准备下一个 mac 的 版本再去跑一跑项目测试一下。 因为大概三四个月前用过,感觉效果不太理想,一个是慢,第二个感觉他就改改 bug 什么的还可以,经常自己的跑车就停了。如果你们有在用 codex 的, 跟我说一下,现在是不是使用的效果会好一点。 看 open i 这边也是支持 powerpoint, 以后通过大模型去做 ppt 肯定是越来越顺畅了。

大家发现没有,最近 cloud code 火的出奇,大家都在聊 web coding, 但同样是用 ai 写代码,有的人是多县城并发,有的人是单县城卡死,窗口堆叠的像千层饼一样,找个日制还得把桌面翻个底朝天。今天我要分享我发现的一款提高 cloud code 开发效率的终极神器 tmax, 它是终端里的空间折叠,带 t max 解决的不仅仅是乱,而是三个降维打击的效率痛点。一、分身术 multi tasking 在 一个屏幕里能同时跟三个 cloud agent 进行对话。二、不死之身,你即便把终端关了, cloud 还是在后台乖乖的帮你跑代码回来,输入一个命令即可恢复现场。 三、纯键盘流手不离键盘通过肌肉记忆快速闪现,这才是真正的 web coding。 如果你是 mac 用户,直接通过 homebrew 即可进行一键安装,只需要在终端输入 brew install tmax。 要理解 tmax, 只需要掌握三个核心概念,一、 session 你 可以把 session 理解为一次登录,每次运行 tmax 命令就可以创建一个新的 session, 在 session 中运行的所有命令,即使你退出了进程,依然会继续运行。二、 window 窗口 一个 session 可以 包含多个 window, 你 可以同时打开多个 window, 每个 window 执行不同的任务, window 就 像是浏览器中的标签页。三、 pane 面板一个 window 可以 分割成多个 pane, 这样你就可以在同一个 window 中同时查看多个终端的输出。 pin 像是分屏软件,把屏幕分成的多个区域。在 t max 里,所有的指令都有一个接头,暗号默认是 ctrl 加 b, 我 管它叫前缀键。你想下命令,请先按 ctrl 加 b, 然后松开,再按其他功能按键输入 t max, 开启一个新的 session, 然后我们启动一个耗时的 cloud 任务,比如分析这个项目的总体架构。然后按下 ctrl 加 b, 再按 d 看,我退了出来,看起来回到了桌面。现在我可以去喝杯咖啡。 one hour later 过来之后,在终端输入 t max a, 看 cloud 的 进度还在跑,一行都没丢。 接下来是让你的工作站看起来像黑客的关键。分屏, ctrl 加 b 再加百分号可以进行垂直分屏, ctrl 加 b 再加引号可以进行水平分屏, ctrl 加 b 加方向键,可以在不同的面板之间快速切换。小技巧,按住 ctrl 加 b, 再按 z, 可以 让当前的面板瞬间全屏。看代码累了就放大,改完了再按相同的命令 缩小回去。虽然高手都用键盘,但新手我强烈建议你开启鼠标模式,你只需要在用户目录下的点 t max config 文件中加入这行命令即可。 这样你就可以直接用鼠标拉动分屏线或者点击进行切换窗口了,这样的过渡更加丝滑。看这个布局,左侧是我的 cloud code, 右边是我的实时日记。 如果想再开一个项目,我不需要新建窗口,我只需要按住 ctrl 加 b, 再按 c, 开启一个新的 window。 tmax 刚开始用会有点不习惯,但一旦你形成了肌肉记忆,你会发现你再也回不去那个满屏找窗口的时代了。 如果你想尝试真正的 web coding, 想让 cloud code 发挥百分之二百的效率, tmax 是 你必须翻过的第一座山。我已经把这份 tmax 常用的快捷键清单和我的配置文件放在文档中, 想要的评论区留言,如果这期内容对你的开发效率有所提升,记得点赞收藏。我是林可 ai 实战路,我们下期见!

windows 或者 open 格式,平时用 browse 这个 skill 去抓网页,是不是有个特别麻烦的问题?很多网站是需要登录的,比如小某书啊叉呀,或者是一些后台系统等等。 每次跑任务,它都会重新开一个新的浏览器环境,登录菜没了, cookie 没了,又得重新扫码,真正浪费时间呢。不是抓数据,而是反复登录。其实解决方法非常简单,只要是一句话,你只要在对话里啊。不是抓数据,而是反复登录,其实解决方法非常简单,只要是一句话,你只要杠杠 browse real 模式, 它会调用你本机真实的浏览器,之前登录过的账号,绘画信息,权限信息都会直接附用,不用登录了,体验是不是完全不一样?很多人觉得访问浏览器的 skill 太笨,其实不是它笨,是模式用错了。

我使用 cloud code, 这里是 cloud code 的 官网啊,现在出了最新的 opus, 不是 opus 就 sorry, 才四点六模型,我必须严重的说一下, 就是 cloud code 现在完全可以取代你所有代码,就是不许,以前还说取代百分之九十,现在不用了,现在直接说百分之百的取代你的代码工作量,但是我们直接使用不了,就说我讲一下怎么直接使用。 来到我们的尽享网页, m e s s i 记不住,看我主页地址, 进来之后直接点击 code 登录 这里,你可以使用 card code 和 yes 这些之类的都是通用的。然后我们点击安装 card code 的。 安装 card code 只有两个步骤,第一步是下载了,我验证一下就 ok, 出现虚列号说明正常安装,然后我们再安装 code code。 mac 用户, linux 用户,右键加 s u d o, 获取管理员的权限,如果你是 windows, 也需要用管理员的权限来执行指令行。 安装完成之后,我们输入 color 开始使用。这里特别注意一下,如果你需要使用,必须将订阅激活,激活码通过我的主页地址获取。 嗯,这里就是 coco 最新的使用界面。然后我们看一下有哪些模型, 现在有 default, 还有缩写。 oppo 这个 default 模型其实就是缩写模型,我建议大家就使用缩写模型,现在还是挺便宜的,然后就可以直接开始使用, 如果你还需要使用 g p t 嗯, gmail 和 call 的 网页的话,我们也行。就这样,如果大家需要使用的话,可以看一下我主页地址,同时也给点个赞和收藏,拜拜。

大家都知道现在 cloud code 是 现在最强的 ai 编程工具,但是很尴尬,它是闭源的,所以说今天给大家分享一个 open code, 它是一个纯开源的,为什么不直接我用 cloud code 就 行了呗,它肯定这个开源的还是比不过闭源的嘛, 是因为这个 open code 基本上一比一赋刻了这个 cloud code 的 功能和代码,基本上是一个逆向的项目,因为 cloud code 的 它的效果非常的好,所以说很多人 或者说我们都是想要去看一下这个 cloud code 它里面到底是怎么样实现的,可以借鉴它的一些机制,可以搬到我们的一些智能体项目上, 因为像这种通用的智能体项目,最强的基本上就是 cloud code 了,如果能复刻 cloud code, 或者说拿 cloud code 的 代码来去梳理一下,那么应用在自己的智能体上,那么你的技术肯定是很牛逼的,而且你的这个应用肯定也达到了现在比较前沿的水平。 ok, 所以 说今天给大家分享这个 opencode 的 这个项目,给大家简单梳理一下它是怎么样构建的。其实我最最重要的是关注它其实也是支持 cloudcode 的 里面的 skills 这个东西的,我想要看一下它是怎么样的一个流程去支持这个 skills 的。 其实 skills 大家都知道它非常简单,只需要读写的一些基础的功能,然后就完成了,但是还是有一些具体的东西你需要去查看的,要不然你自己去想当然的实现,肯定效果是不好的。 ok, 我 们也大概看一下这个,这个安装起来也跟 cloud code 是 差不多的,而且它的功能也是差不多的,此智能体去构建你的规则,构建你的 skills, 这些都是完全可以支持的,这就是这个项目。我也让这个 deep weak 去梳理了一下,我重点是让它梳理了一下它是否支持 cloud code 的 功能,它说它是 ok 的, 它是支持的,它原声也是在检测这种 cloud code 相似的这种文件夹,可以看到它们其实都是一样的,它检在检测这种 cloud code 的 相似的文件夹,你把它放在这种文件夹下面,它就能够支持 cloud code 的 skills。 这个功能 ok, 格式都跟 cloud code 的是一样的格式,我重点是想让它梳理某一个 skills 的 流程,是 怎么样去执行这些 skills 的 一些文件脚本啥的,它就给了我这样一个完整的流程。首先启动这个,它会扫描这个技能的一些目录, 看一下有哪些技能文件,然后解析这个 markdown 的 文件,它会把上面的一些原数据直接加载到智能体的这个上下文中,然后 智能体就知道它有哪些 skills 了。如果你的任务是需要调 skills 的, 它会根据这个原数据的一些提示词,自己去判断是否要调这个 skills 的 工具,然后去读取这个 skills 具体的内容,但是它是没有没有具体去说了,因为下面还有一些 geos, 它的一些脚本或者参考文件,它其实这里还要做很多循环,这样才是一个比较完整的 ok, 它其实扫描这些功能,它都说了,用两个这种关键词嵌入的方式进行的扫描和实现这些就很简单,其实就是用用了一个扫描工具就可以了, 扫描工具的一个脚本预先加载到你的智能体上下文中,然后我就说了一下它这个视力的话,只有一个 markdown 的 文档,而且很多这些 skills, 它还有一些脚本和一些参考的文件资料,它是怎么样看的?我也让它给我梳理了一下,它其实是专门做了一页一个 to 或者叫 m c p 工具也可以,他就用这些 m c p 工具去读取里面具体的一些参考文件,或者是专门写了一个工具去抓取这种脚本,在这个工具里面进行执行, 在沙盒里面进行执行,整个过程是这样的,我也让这个 notebook 整理了一下这个内容,可能会更加的直观清晰一点。 然后他就说了一下这个 skills 有 哪些好处。传统的一些智能体开发它的一些 prompt 上下文非常多,而且非常杂乱,很容易造成里面的一些混杂和冲突,智能体就会造成幻觉。 他就说了一下这些 skills, 它其实渐进式发现动态加载的一个过程,是由智能体自己去判断并加载,而且还有一些脚本是可以附用的,还有一些文件或者参考的数据,你是可以查看的。 ok, 他 就说了下去,为什么要构建这个 skills, 他 是想要按需的加载能力,而不是直接加载到大模型的上下文中。还有统一的资源访问,这些资源可以放在这个文件夹下面,然后由智能体自己去判断是否要去访问这些资源和信息, 可以安全地执行脚本,在沙盒里面执行了脚本,拿到这样的结果之后,然后再去返回到这样智能体的这个结果中。 还有就是这个系统的可维护性,它不像 m c p 工具需要比较重的这种开发,这个 skills 它非常轻,你的脚本开发起来也非常轻,你的 markdown 文件也是修改起来非常轻的。当然它也会带来这一个问题,容易被人注入一些恶意的内容,比如说你的 markdown 文件里面容易被人注入 去修改,当然这个你也可以做一下,它只读,或者说它直接把你这个内容 skills 的 内容直接打包发给别人,这个也是有可能的。 他就说了一下 skills 里面主要包含了什么内容。首先第一个内容就是它的说明书, skills 的 markdown 文件,第二个就是它的资源文件,第三个就是它的脚本,当然还有其他的一些资源文件其实也是可以有的。 这几个参考文件和一些具体的内容这个就不说了,其实最重要的我个人感觉啊是它的 markdown 文件的说明书,这个说明书可以写你的工作流程 以及你应该怎么样使用这些脚本,使用这些资源它可以给你这些资源和脚本说一个简单的一个说明, 它智能体它才知道什么情况下它需要去看这些资源文件和执行这种脚本,而且这种脚本它跟 m c p 是 有一定冲突的,或者说有一定竞争关系的。也是为什么现在很多自媒体或者说我们会觉得它其实是跟 m c p 有 一个替代的关系的, 这些脚本其实都可以把它看作为一个 m c p, 所以 说这个内容 skills 它是能替代掉 m c p 的 一部分功能的。 ok, 然后他就说了一下这个技能目录,它首先它会给智能体它的一个技能有哪些目录,或者说它的一个简要的介绍,然后再去按序加载你想要的那个技能, 解剖了一下它这个名字,这个就不说了,还有 skills 的 一个 markdown 的 文件,这个技能的说明书, 还有这个 jason 文件,其实主要的这个是不加载的,或者说也不用的,主要就是应用于这种你的 skills 的 一些用户的内容版本,以及它是否开源的一些许可证。 这个里面就主要放的一些可执行的脚本,这是一些模板,这是参考的资料,当然这三个都是资料,或者说一些脚本模板啥的,其实这三个把它放成一个也可以,这两个放成一个也可以, 这其实就是一些参考的具体的资料。马赛丹啊, pdf 的 这种具体的内容,这个就是一些静态的资源,比如说图片,你想要展示一张页面的时候,你其实可以加载这里面的图片内容。 case 这个就不说了,都是一些脚本类的东西了,这个可能没有理解到,就是版本作者和他的一些许可证啥的, 当然这个许可证也是防君子不防小人。这个 skills 有 很大的一个垢病的点,就是它的这种隐私性特别差, 很有可能你哪一个权限做得不好,可能智能体就直接把你的 skills 打个包丢给用户了, 或者你的竞争对手拿到了这样的 skills, 相当于你公司的一些精密文件,他就已经拿到了,他想要复刻的话就会非常的简单, 这也是很多人诟病的一个原因。之前都有一个 openai 的 data analyze, 呃,这个应用工具,它把有用户去做这种攻击和恶意注入这种提示词,让这个 data analyze 把它的 skills 的 一些文件打包成了一个内容发给了用户, 让人发现这个 open ai 的 data analysis 也是支持这个 skills 功能的。 ok, 它这个才是我最最想要知道的,就是一个智能体,它要包含什么样的工具或者说流程,它才能支持这种 skills 的 技能。 ok, 它就首先说了一下,发现所有的这个技能其实就是一个工具 tool, 这个工具专门列出所有的技能,并且加载 这个技能,它的一些描述就是它的原提示词了。第二个部分就是另外一个工具,就是加载某一个具体的 skills 里面的 md 的 内容, markdown 的 论文内容。 第三个就是资源访问的工具,你直接输入这个 skills 它的文件,然后会可以查找到有哪些文件是你可以用的。 第二个就是把里面具体的文件拿出来读,然后就是执行工具了,就是你的这个脚本它的脚本怎么样抓取,然后在一个沙箱里进行执行,这就是 run skills 的 一个 script, 其实就是执行脚本了,在沙箱里面执行脚本,这里一定要非常的注意,它执行出来的结果,会返回给这个智能体,当然外部还要做一个智能体,去收集这些工具,执行出来的结果就应该返回一个数据, 这个工具就要做一下,而且这里一定会做一些这种安全性的或者权限的一些限制避免,比如说你不想让他上网,或者不想让他去访问某一些文件夹,在这儿的时候一定要做一些操作,要不然就会造成让人诟病这个 skills 的 原因啊。 然后运行的工作流,比如说一个完整的智能体交互,用户帮我清洗这个数据表格模型,就发现它的有一个技能是可以清洗这个脚本的,然后它浏览了这个目录,它是有这样的一个技能哈,然后它就加载了这个技能的 down 的 文件, 然后根据这个 markdown 里面的文件的工作流,用这个 skills 里面的有一个脚本去执行这样的一个脚本,然后在沙箱里面运行完成,沙箱里面完成的这个结果就会返回给大模型,或者说返回这个文件的 id, 然后大模型就可以用这个文件的 id 再去调用一个工具,再把这个文件返回给用户就可以了,整体就是这样的一个完整流程, 但是一定要注意避免暴露真实的路径,不要让大模型知道在你电脑上的一个真实路径就是容易出问题。还有就是这种 skills 一定访问方式是只读的,它唯一能做的就是它沙箱里面可以执行代码,而且只能在沙箱里面执行代码,避免用户的一些提示词注入的攻击。 他也说了一下,必须要做一些沙箱的一些管理,比如说工作目录的隔离,网络的控制,你到底想不想你的脚本可以访问网络,这个也很重要。还有就是依赖一定要可控,比如说在这种 docker 里面做执行 脚本的白名单,嗯,能不能执行哪些脚本?或者说只能执行那个 jason 文件,在权限文件里面的一些特别的脚本, 它那个节省文件也还可以做一些限制的哈。其实这个 skill 它设计的时候是考虑到了这个问题的,如果你没有做好,其实是你没有详细去看它这个设计, ok。 写入路径的限制也是很重要的,其实不能把它写入路径的限制写死,甚至你不能给他,你最多就是在沙箱里面跑。当然如果你需要访问的,我建议你就直接把这个文件直接丢到沙箱里面去,把沙箱里面的路径把它写死,这样可能会更加的安全一点。 然后就是一些版本和权限管理了,主要是节省文件里面的,还有它也强调了一下这种权限一定危险性,人员和内容和止读,其实止读就已经可以解决大部分问题了。 第二个就是可以用这个文件进行授权,好,这个后面就没啥了,主要的一些框架。如果说你想要构建这样的一个支持 skills 的 智能体,那么应该要做哪些工作?首先你要有这个 skills, 然后 可以列出这些 skills 的 一些原数据,然后可以加载这个工具,要有。然后就是列的一些工具,读取的一些工具,还有执行脚本的一个沙盒工具,工作区要隔离和这种核心安全的一些内容。 还有这种版本号啊和一些权限控制,这个也是非常重要的,这个就是今天的一个内容,就是教大家怎么样去做一个智能体,可以支持现在的 skills?

这个叫 everything cloud code 的 开源项目真的有点离谱,才开源没几天, github 上已经狂揽四万多斯特。它本质是一套开箱即用的 cloud code 全量配置合集, agent、 skill hulk、 快 捷命令规则、 m c p 全都帮你配置好了。 更关键的是,这不是拼凑出来的模板。作者是一位非常资深的 ai 开发者,这套配置是他连续使用十个月高强度实战打磨的结果,而且他就是用这套配置拿下了黑客松冠军,从实战到结果,含金量直接拉满。如果你正在折腾 ai coding workflow, 这个项目真的值得你好好研究研究。

好吧,我的朋友们,现在我们已经设置好 codex cloud 来处理我们的项目。我们可以开始让它运行一些任务并进行一些代码更改。但在我们做任何更改之前,我想先向你们展示一下应用程序的当前状态。它将进行一些工作。 这是一个 next js 应用程序,目前它基本上只是一个名为 ym 二的小项目的用户界面。目的是一个食物搭配网站,用户可以将不同的食物进行搭配。其他用户可以对这些搭配进行评分的。现在并没有后端或其他任何东西与之连接。我, 我们将只关注前端及用户界面的相关内容。现在我们将让 codex 负责处理这个项目中的一些小任务。 那么我们现在如何将任务分配给 codex 在 云端运行这个应用程序呢?嗯,我们需要做的就是首先确保在这里选择了正确的环境。 接下来需要选择正确的分支。 codex 将查看或从中分支的那个分支。在我们的例子中,这将是主分支。然后我们可以在这里开始输入一些内容。现在,在我们这样做之前,实际上我们有两个选择。我们可以选择与 codex 聊聊项目中的代码。 codex 并 不会实际进行任何更改,只是读取你的代码并与你讨论。或者我们可以请求 codex 对 项目进行一些代码更改。因此,让我们首先向 codex 提出一个关于代码库的问题,以检查它是否对项目的内容及各个组成部分有良好的理解。 我们将说你能否探索代码库,并给我这个项目的简要总结。 一旦你写完这个,只需要选择询问选项而不是代码选项,这样 codex 就 不会开始进行任何代码更改。 当我们这样做时, codex 将启动这个任务。即使我们只是问他一个问题,他仍然被视为一个任务。 codex 仍然会启动一个容器来运行代码,以便进行分析。稍后,我们将在任务列表中看到这个任务, 这里就是您当前所有任务将被列出的地方。然后您可以在任务完成后将其归档。 现在,我将点击这个任务,已查看发生了什么。点击后,我们可以选择在这个屏幕上等待 codex 完成任务,并在这里回复我们。 或者我们可以点击这个链接实时查看任务日制。如果我们这样做,我们将看到 codex 在 右侧所做的一切,从设置环境到读取文件,以及它在此过程中所采取的所有推理和步骤。

今天这期视频啊,我们只讲一件事情,就是普通人怎么用 cloud code 把自己需要的工具直接做出来。很多人听到 code 这个单词啊,写代码觉得跟自己完全就没有关系,但其实 cloud code 除了超强的这种写代码能力之外, 它还能做很多日常的任务,比如说数据分析啊,比如说这个每日资讯的爬虫啊,比如说文件管理等等,甚至连修图 p 视频这种活啊,它也能帮你把流程搭起来, 因为他啊,不是某一个具体的工具,他是一个圆工具。什么叫做圆工具呢?就是可以搭建其他工具的工具,你用大白话讲清楚自己的需求,比如说我想做一个网站,我想搭建一个自动化的工作流,我想有一个小助手,每天帮我整理资料,他就能帮你一步一步把这些东西搭出来,能跑能用,最后呢,还能帮你去点 现在每天的新工具啊,越来越多,更新的也越来越快,反而呢,会让我们更容易掉进这种效率陷阱里面,学一堆的零碎的工具,越学越忙,效率越学越低。所以我觉得普通人更应该去学这种顶级的通用的工具,学会一次之后啊,以后想要啥就可以做啥。这期视频啊,是 cloud code 的 入门视频,我 会带你从零上手,先用五分钟时间呢,先讲清楚怎么去安装配置 cloud, 当然已经安装好的同学呢,可以直接跳过这五分钟。第二部分呢,我会教大家第一次启动 cloud 怎么用,怎么去提需求,然后会带大家去做几个案例,比如说从零开始,构建一个精美的笔记软件,一些除了写代码之外的其他的生活当中的使用场景。最后呢,再补充一些我自己总结的使用经验,使用建议帮你少踩坑,用的更加顺畅,就算你完全没有写过代码,完全没有用过 cloud code 的 类似软件 也能跟得上。重要的不是用的好不好,重要的是先用起来。好,我们开始啊,首先呢,我们要来安装 cloud code, 那 基本上呢,至少有三到四种方法可以使用 cloud code, 我 们今天只讲最适合新手最省心的一种方法,就是在像 vs code 或者像 cursor 这样的 ai 编程软件当中去使用 cloud code。 这个呢有两个原因啊, 一个呢就是因为现在这些编程软件的进步速度非常快,不断地推出非常有趣的这些新功能,我们可以在使用 cloud code 的 同时呢,能结合这些编程软件推出的新功能。第二点呢就是 cloud code 啊,原声其实是在终端里面跑的,终端大概就是长这样子,就是一堆文字的这样的窗口,新手一上来呢,其实对着这些窗口啊, 很容易直接劝退,但像 vs code 和 ctrl 这样的编程软件呢,其实界面就更加友好,在这个界面上面点点鼠标就可以操作。我们这个视频里面以 vs code 为例啊,你可以直接去这个 scode 的 官网,然后去下载这个 vs code 的 安装包,然后一键安装,完全免费的。安装好之后啊,就可以直接打开 vs code, 可以 点击这里的 open project 新建一个文件夹,名字叫做 cloud code test 创建让这个文件夹信任这个 vs code 的 里面的工具。好了,你看我们刚才建的这个 cloud code test, 这个文件夹已经打开了。安装完这个 vs code 的 软件之后呢,接下来第二步就是我们要来正式开始安装 cloud code。 cloud code 安装呢,其实也不难啊,我们先去这个 node js 的 官网去 去下载安装这个 node js, 然后你可以用比较简单的下载程序包安装的方式去安装。安装完 node js 之后呢,我们再回到 vs code, 打开这里的 terminal 终端,接着呢,我们把这条命令直接复制进终端,直接按回车,确定输入一下密码,然后系统呢就会自动开始安装 cloud code 了。因为我这里已经安装过了,所以呢就不再去演示了,这个视频里面用到的所有命令,所有提示词呢,我都会放在黑猩猩基地里面, 我真心觉得呢,大家不必害怕这样的终端界面,或者是像类似于这样的终端界面,看起来很专业,很复杂,全是文字,但你刚才看到了我们的操作, 只是一些简单的复制粘贴的操作而已。然后再给大家分享一个比较实用的技巧,就是我一般会在 webcoing 的 时候呢,在旁边开一个其他的 ai 聊天窗口,比如说 jimmy 叉 gpt, 都有包前吻,哪个熟悉的你都可以在安装过程当中有任何的报错,任何按钮找不到了,哪一步卡住了,你都可以截图或者复制错误的信息, 然后直接黏贴过来,它基本上都能帮你瞬间解决掉这个问题。到这一步为止呢,其实 cloud code 已经安装好了,我们可以直接在这个终端里面输入 cloud 的 这个单词, 然后新人这个目录,当你看到这个 cloud code 的 logo 的 时候,说明你这个 cloud code 已经安装成功了,我们先退出。但对于小白来说啊,我觉得其实最好再安装一个 cloud code 的 插件,可以提供一个更好的交互界面。我们在这里插件,这里搜索 cloud code, 然后看到这个 cloud code for vs code 之后呢,这里这里有个按钮,直接一键安装就可以了。然后安装完成之后啊,你会在这里发现有一个 cloud code 的 这个小图标,我们直接点击打开,然后我们最终就得到了一个在 vs code 的 编程软件里面的 带插件的 cloud code。 到这一步的时候呢,你 cloud code 的 整个安装流程就完成了。好安装完成之后呢,还有最后一个关键的问题就是 cloud code 的 里面用什么模型, 这个搞定之后啊,你就可以真正的开始使用 cloud code。 cloud code 的 本质上呢,是一个终端里面的这个智能开发工具,所以它自己啊不产生智能,背后必须接一个大模型的服务。官方默认的呢是走这个 elastic 的 cloud 模型,但因为海外服务,大家都知道这个众所周知的原因, 很多人都会遇到网络啊,支付啊,账号啊,稳定型一堆的这个限制问题。但如果你这些自己都能轻松搞定,那你可能也不需要我这期的入门视频了,所以更常见也更适合大多数人的方案呢,是 直接接国内的大模型接口,价格更便宜,稳定性更好,能力也完全够用,比如说智普的 g l m, 比如说 mini max, kimi 等等。为了让整个这个大模型接口的配置过程也更适合小白更友好,我推荐一个接口的管理工具,叫做 cc switch, 大家可以去搜一下这个 cc switch 的 这个下载和使用教程, 它的作用也很直接啊,就是你可以购买多个服务商的不同的模型,比如说有时候这个模型比较便宜啦,有时候那个模型可以有一些优惠的政策啦。 c c switch 可以 帮助你去管理所有的这些不同的模型, 如果你想切换哪个模型,就直接点一下这个启动按钮就好了,非常方便。顺便说一嘴啊,它除了可以管理 cloud code 的 这个接口以外,它还可以管理 codex 和 和 gemina 的 这开发工具的背后的接口。具体怎么使用呢?第一步啊,你要先去这些大模型的官方网站他们的购买页面去购买他们的 coding plan, 买完之后呢,然后去可以去到他们的这个 apikey 的 管理页面去创建一个新的 apikey, 然后把这个 apikey 复制出来,先放好,因为等一下要用一般都是在用户中心的 apikey 管理页,或者是类似的这样的页面里面。第二步啊,打开刚刚的这个 c switch, 然后这里有一个 添加服务商的按钮,然后先选择你的品牌,然后把你刚刚复制的这个 api key 复制进来,然后添加就行了。添加好之后呢,你就可以在这个首页,然后用这个启用按钮启用你刚才新添加的这个考勤 plan 的 这个接口,这些都完成之后呢,就重启你的 cloud code, 然后你的 这个整个 cloud code 以及它后端的这个模型接口都可以生效了。好了,到这里为止啊,就 cloud code 的 所有安装配置流程都已经全部用完了,我们回到 vs code 的 这个软件里面,打 打开这个 cloud code, 接下来我们就来体验一下,为什么很多人说它是二零二五年,甚至到现二零二六年还是最强的 ai 工具。 先介绍一下这个看起来酷酷的这个界面的主要功能,左边呢是项目文件夹,这个就是我们刚开始建议的这个项目文件夹 c c test, 然后中间呢是编辑器,到时候如果有文件生成,你想看某一个具体的文件内容,就会在这个中间显示。右边呢是 cloud 的 核心的聊天窗口,也是你主要跟 cloud 的 交互的地方。正好我们刚刚添加了我们自己的这个大模型接口,所以呢,我们可以在这里直接问他,你现在使用 的是什么模型?他回答呢就是我们刚刚添加的这个新的模型。从刚刚这个这么小的例子当中啊,你可以体会到我们在使用 cloud 的 过程当中啊,不 管你有什么样的问题,你都可以直接问 cloud code。 然后这里呢还有一种更帅的方式,因为 cloud code 里面它自带了很多实用的功能,这些功能呢都可以用斜杠加一些这个英文单词来调取,比如说 输入斜杠,然后后面加上这个 model, 它就会显示你现在正在使用的模型和其他可选的这个模型选项。当然还有很多其他的这个斜杠功能,但我的建议呢是,你完全不需要在现在这个阶段去死记硬背,慢慢用起来,你自然就会记住了我们的思路呢,也是后面用到什么,我们再会去讲什么 好,我们接下来呢来试着用 curl code 做我们的第一个应用。在开始做应用之前啊,我最后再讲一个关键,关键的功能叫做 plan mode, 你 可以在这里看到,现在呢,这个模式叫做 ask before edit, 就是 每次这个 cloud code 想要编辑的文件呢,它都会问你一下同不同意,你按一下它就会变成这个 cloud code 自动去编辑的模式,你再按一下呢,就会出现这个 plan mode。 plan mode 呢,是整个 cloud code 里面极其重要的一个知识点,它的核心价值呢是它不让 ai 立刻帮你去写代码, 而是让你和 ai 来回的去讨论这个方案。把方案定下来之后呢,再去写代码。很多时候,你想让 cloud code 去真正改代码之前,你希望它真正理解你的需求,真正理解你想要去做什么。这就是 plan model 的 这个用途, 先确定它的计划是否符合你的预期,再去执行。很多人抱怨说这个 ai 智能体 ai agent 不 可靠,然后会乱改东西,也实现不了我的需求。但大部分时候啊,都是这个 plan 不 够好的问题。 如果你能正确的合理的使用这个 play mode 智能机啊,大部分时候都会按照你的要求来做事情。还有一点啊,就是如果你不知道什么时候要选 play mode, 什么时候不选 play mode, 那 我的建议啊,就是你所有时候所有场景都把 play mode 给勾选上。好,接下来我们就开始我们的第一个案例。我的提示词是这样子的, 我想开发一款高级的笔记应用,用户能够在一个强大的编辑当中去记录笔记,能够将笔记保存到这个文件夹中,并按照自己的意愿进行整理,甚至还能结合一些 ai 的 功能。 请你为这款应用赚写一份 prg 的 产品文档。然后 cloud code 呢,会反向来问你这个具体笔记软件的一些这个具体的需求,它有了我们的这个回答之后呢,它可以更具体更准确的去编写这个产品文档。好,需求文档写完了,我们先选择我们手动去看看这个需求文档。 需求文档如我们所想一样,就是写的非常全面,包括了产品概述,技术的架构,然后功能的需求。 主要来看一下这个核心的功能点。第一个呢,就是一个笔记的编辑器,然后是笔记的管理。第三点呢,是 ai 智能写作辅助的功能,它还帮我们设想了一些拓展功能,在后续版本当中可以再添加。但说实话,这种 p r d 呢,当然写得很好,但对于小白或非技术人员来说呢, 真的是太完整,太大太全了。对我们来说呢,最稳的方式就是一次只做一个小版本,然后测试,再确认,再加入下一个功能。所以呢,我跟他说,第一个版本啊,让我们先完成这个前端的部分,做一个本地能运行的 demo, 然后把这个模式改成 play mode 发送。 在 clockcode 执行的过程当中啊,它经常会向你问一些问题,以及申请一些权限。然后呢,如果你想一步步每次都确认一下,你就每次都点 yes, 因为我已经用过 clock 很多次了,所以我一般都直接让它默认帮我执行。因为我觉得一步步去 确认比较麻烦,所以我就选择 yes, 在 这个项目当中都会给你这个权限。 clockcode 大 概花了十分钟的时间帮我们实现了这个第一个版本, 看一下它这个历史的聊天记录啊,最后还去确认一下一开始设计的这功能表当中,是不是把这些所有功能没有遗漏的去完成了。最后呢帮我们在本地运行了一个服 务,让我们打开这个网址,去看一下最终的效果。打开之后这个效果呢,我觉得就非常好了,因为我正好要跟大家去讲怎么样在这个 webcoing 当中去 debug, 因为 debug 是 webcoing 当中非常非常重要的一部分, 本来还想说要自己设计一个这个错误,然后来教大家怎么去这个第八个方式,然后正好这里给了我们一个错误。好,我们现在看到了我们打不开这个网站了,那怎么办呢?根本就不用慌,我们可以直接把这里的错误信息全部复制给 cloud code, 当然有时候呢也可以截图,他这直接提供了这个复制按钮, 点击复制,然后直接把这个错误信息复制给 cloud code, 让他帮我们去修复好,他说修复完成了,我们再回到这个网页。哦, 果然修复完成了,你把错误信息直接复制给 cloud code, 在 百分之九十情况下, cloud code 都能帮你去直接修复。我们来具体看一下 cloud code 的 为我们生成的这个笔记软件,光从页面上来看呢,这个第一个版本已经非常像样了,中间应该是这个核心的主要的编辑区域,然后左边呢是这个 文件夹的管理,文件的管理区,我们来新建一个笔记,随便试一下 markdown 格式,标题序列号 也没问题,虽然有一个小 bug 呢,但是这么复杂的一个笔记软件,这么高级的一个笔记软件,能在十分钟之内完成,还是让人感觉到很爽很爽。这里啊,我再给了一个我自己日常使用的一个小建议,前面也顺带提到过,就是在使用 cloud code, 或者是在这个使用 webcoding 的 时候啊, 旁边一定要开一个这个独立的 ai 聊天助手,你随便选一个主流的大模型都行。这样做呢,其实有两个很现实的好处,第一个呢,就是随时救火, 遇到不明白的按钮啊,报错啊流程可以直接把问题丢给他问。 geocode 是 这两年最强的代码智能体之一,主流的大模型啊,基本上都能知道它的常见的用法跟常见的一些坑,所以呢,能给你立即的解释清楚。第二点就是提高复杂任务的这个成功率,有时候一个项目做不成, 一开始方案就不够稳定,在 cloud code 给出它的方案之后啊,我们再用另外一个模型做一次交叉的验证,往往能补出你没想到一些风险点,一些边界的条件,甚至给出更简单的这些替代的路径。具体来说呢,你可以把 cloud code 的 刚刚生成的这个计划直接复制捏切进来,然后问它这么两个问题,一个呢,就是这份计划当中最大的风险跟缺点是什么? 另外一个啊,就是有没有更稳妥,更简单,成功率更高的实现路径,然后把杰米呢生成的这个方案再黏贴回给 cloud code, 让 cloud code 基于新的建议更新计划,并且继续执行。我们开头的时候说了,这个 cloud code 呢,是一个顶级的通用 ai 工具, 之所以叫通用工具呢,是因为它除了写代码之外,还可以做很多其他的日常任务。我给大家演示几个例子,比如说呢,我打开一个新的文件夹,然后呢,这个文件夹里面有之前我的三个视频, 我现在呢想把它们转换一下格式,并且提取视频里面的音频。这对普通小白来说呢,其实是一个蛮复杂的一个技术性的工作。但我现在可以直接在这个文件夹里面打开 cloud code, 我 可以直接跟 cloud code 说,帮我检查一下当前目录下所有的 mp 四文件, 把它们转化一个格式,并且提取它们的音频,单独存到一个 audio 文件夹里面,保留原来的原文件。我们直接发送给 cloud code, 我们看到因为我们缺少一些视频转换的工具, carlo 会发现这个问题,然后自动帮我们去下载安装这个视频转换的工具。好,任务全都完成了,我们来看一下,它给我们新建了两个文件夹,一个是 odo 文件夹,里面有三个对应的音频, 然后是一个 m o v 文件夹,里面有三个 m o v 的 视频,你们看啊,这样一个视频转换跟音频提取的任务就轻轻松松的搞定了。再来一个案例啊,再比如说,我有一个,比如说这样的一个文件夹 面全是杂乱的这个图片跟视频,然后呢,我想让 carlo corder 帮我去整理一下这个文件夹,直接跟 carlo corder 说,根据文件的类型跟日期,帮我把文件夹里的杂乱文件分别对应到文件夹里发送给 carlo corder, 反而会来问,你说按什么方式去组织这样的文件?呃,比如说,我就选一个按类型跟日期。 好,任务完成了,我们来看一下,有三张图片呢,好像没有被整理进去,但没关系啊,我们先不管他,我们来看一下他帮我们整理的结构,在这个图片文件夹下呢, 这个二四年三月份有一个文件,二五年四月份有十一个文件,二五年一月份有一个文件,然后等等等等,我们来看一下真实的这个文件 家里。 ok, 没有问题啊,他整理的还挺好的,然后速度也挺快的,基本上就花了二十秒钟时间嘛。但是他有时候也会有些小问题啊,比如说这三张图片没有整理进去,但如果你让他再去整理一遍的话,他应该也会帮你把三张图片进去分类。当然这样的场景呢,有很多,我不在这里一一举例了, 大家可以自己去体验一下,自己去探索一下。好了,视频到这里为止啊,我们已经完成了一整套的 clock 的 最关键的入门,我们一开始装好了 clock 的, 接好了模型, 在 vs code 里面跑起来用 play 模式啊,从零开始,做出了一个高级的笔记软件应用,然后正好在录制的过程中啊,我们还碰到了一个 bug, 所以 我们还学了一下怎么用这个 curl code 去 de bug。 最后呢,我们还展示两个日常生活当中会碰到的这个任务, curl code 呢,其实还有很多其他的高阶的玩法,大家应该也听说过,比如说 m c p 啊,比如说 skill 啊,比如说 sub agent 啊,这些呢,我们之后也会介绍,但我想说的是啊,这些其实都不重要,重要的就是你自己先玩起来,先用起来。好了,今天的视频就到这里了,我是李超,我们下次见。

奥利扣子使用半年了,给大家分享我可以马上上手提高代码质量的技巧。 ok, 第一个技巧,你要花百分之七十的时间在 plan mode 上,那这里我要做一个关于账号选题的 skill。 首先我给 club 的 一些我要做这个事情的背景, 然后给出了他具体的要求,同时给了一些案例。而且在 plan mode 里面你是可以让 club 去做调研的,所以这里面我也让 club 去调查一下热点上升词的趋势,分析他们的指标和方法。 这还只是做一个比较简单的一个 skill, 如果你是要做一个很大的 app 的 话,呃, play mode 你 一定要用好,而且它是一个相当大的杠杆,你前面每多花一分钟,可能后面就可以节省十分钟。第二个小技巧就是作为客户的老板,每次他完成任务之后,你可以让他给你一个提示音, 这样就可以他一边做自己的工作,然后你就去刷刷视频,或者是喝杯奶茶,或者做一下进一步调研准备都可以。 第三个是这个 bypass mode, 就是 你只要打开这个以后, carl 的 做车的工作就再也不会问你说能不能打开就能打开,那他都会直接就自动去帮你做,这对于很多小白来说是省很多事情的。 如果你是用终端的话,你在终端里面打开 carl 的 以后,你就输,呃, carl dangerously skip permission。 那 如果你用的是这种插件的话,你点开这边插件,然后点一下这个设置这个东西它需要你手动打开,打开以后在下面就可以去调整了。 第四点是 context window 的 管理,那每次你打开一个新的 cloud 窗口的话,相当于给 cloud 窗口点了一份新的记忆, 那在这个窗口里面,你跟他说的话,他都可以记住的,但是他的记忆是有限的,你每次跟他说的话,如果很多的话,他就会忘掉很多事情,我们这里可以看一下。呃,我点了 context system, power system tool, 这都是必须有的,百分之十已经被占据了,然后 m c p tool, skills 就 占了百分之五十六,剩下只剩百分之十三的空间。 那一般如果是剩百分之三的空间的话,它的回答的性能其实就已经下降很多了。呃,可能百分之四十到百分之六十这个窗口是比较理想的一个窗口, 就这个时候怎么办呢?你可以用一下这个 compad 的 这个技能,用这个技能之后,它会把你之前跟它那个对话记录,它会打包一下,总结一下,然后总结完以后,我们看一下还剩多少。 free space ok。 不知道为啥,这会网络太慢了,一直加载不出来,但你们可以自己试一下 compact, 可以 节省很多的 context window。 或者如果这个是一个很大的 project 的 话,你也可以让 cloud 把进度更新到 cloud md 里面,就不用占用窗口的资源了。 最后一个是关于 mcp 和 skill。 mcp 其实能实现的功能是很多的呃,但是它对 token 的 消耗是 skill 的 几千倍,几百倍。 但同时呢,如果你想从零,没有任何参照物,让 cloud 去帮你搭建一个 skill, 呃,还是挺困难的。所以我建议是,呃,如果你需要连接某些服务,你第一遍,你可以用 mcp 把那个 m c p 文档里面的一个 jason 发给 cloud, 让 cloud 帮他安装。那你用 m c p 运行一遍以后,你让 cloud 去 把这个 m c p 改装成一个 skill, 这样不仅效果基本上不太受影响,而且它对 token 的 消耗还会少很多很多。那其实对 token 消耗少了以后,它不仅是能帮你省钱啊,省省时间。呃,同时对,因为 context window, 它 如果你给他更多的 free space 空,空间更大的话,它的性能就会提高。如果你目前还是一个技术小白,但是你想学好 ai 的 话,关注我,我会带你拆解更多的 ai 技能,带你成为顶级的 ai 玩家。