在上一集中,我们深入了 bashtwo 的 幺二四幺八行代码,看到了 antropic 如何构建一道又一道防线,试图把 ai 的 shell 能力安全地圈养在可控范围内。但是 安全只是 cloud code 的 一个维度,今天我们要看的是一个更加宏大的工程,如何让多个 ai 像一个团队一样协做。想象一下这样的场景, 你给 cloud code 的 一个复杂任务,它不是一个人埋头苦干,而是像项目经理一样,把任务拆解分配给多个 ai 代理并行执行,然后汇总结果,验证质量,最终交付。这不是科幻, 这就是 cloud code 的 swarm 蜂群系统。在泄露的源代码中,蜂群系统涉及 coordinator 协调器 agent two、 代理工具 spawn multi agent 生成模块儿、邮箱系统、团队文件管理等多个模块儿,它们共同构建了一个多 ai 协助的完整基础设施。 今天我们就来深入这个蜂群,看看 antibiotic 的 工程师是如何让 ai 学会团队合作的。蜂群系统的核心是 coordinator 协调器,它的入口在 coordinator mode ts 中三百六十九行代码儿。 首先看激活机制 is coordinator mode sensor 检查环境变亮, cloud coordinator mode 是 否为正,但这个检查被包裹在一个 feature gate 中,叫做 co ordinator mode。 这意味着这不是一个公开的功能,而是需要特性开关起用的内部能力。激活后, get coordinator system prompt 函数,返回一段完整的系统提示。这段提示长达数百行, 定义了协调器的全部行为规范。系统提示的第一节就明确了角色定位,你是一个协调器,你的工作是帮助用户实现目标,指导工作者去研究实现和验证代码变更 综合结果,并与用户沟通。当你可以直接回答时,不要委派,不要委派你不用工具就能处理的工作。这段话透露了一个设计哲学, 协调器不是万能的调度器,它首先是一个能直接回答问题的 ai, 只有在真正需要并行处理时才启动团队。系统提示中定义了一个标准的四阶段工作流程, 第一阶段是 research 研究阶段,由工作者并行执行,调查代码库,查找文件,理解问题。第二阶段是 synthesis 综合阶段,由协调器自己完成阅读发现,理解问题,编辑,实现规格。 第三阶段是 implementation 实现阶段,由工作者按照规格进行针对性的代码修改。第四阶段是 verification 验证阶段,由工作者测试变更是否有效。 这个流程的精妙之处在于,第二阶段系统提示用加粗字体强调综合是你的最重要的工作。当工作者报告研究结果时,你必须先理解他们,然后再指导后续工作。阅读发现,确定方法, 然后编写一个证明你理解了的 prompt, 包含具体的文件路径、行号和需要修改的内容。系统提示甚至列出了反模式,永远不要写基于你的发现或基于研究结果这类短语。 这些短语把理解工作推给了工作者,而不是你自己完成。这是一个非常深刻的设计决策,它确保了协调器始终是团队中的智能核心,而不是一个简单的消息转发器。工作者如何向协调器汇报? 系统提示中定义了一个 xml 格式的任务通知机制,工作者完成后 结果以 task notification 标签包裹的 xml 消息到达,包含 task id, 任务 id status 状态可以是 completed failed 或 killed summary, 人类可读的状态。摘药 result, 代理的最终文本响应,还有 usage 部分记录总 token 数,工具使用次数和持续毫秒数。系统提示特别强调工作者结果和系统通知是内部信号,不是对话伙伴,永远不要感谢或确认它们 为新信息到达时为用户总结。这段话的设计意图很明确,协调器面对的是用户,工作者只是工具。协调器需要把工作者返回的原始数据转化为对用户有价值的。摘要, 关于并发管理,系统提示说,并行是你的超能力,工作者是异步的,尽可能并发启动独立的工作者, 不要串形化可以同时运行的工作,寻找善出的机会。但他也给出了约束,只读任务可以自由并行运行。 写入密集型任务,在同一组文件上一次只能有一个验证,有时可以和实现在不同的文件区域并行运行。现在我们来看蜂群系统的第二个关键组建 agent two, 它定义在 agent two 到 t s x 中超过一千三百八十七行代码。 agent two 是 整个代理系统的入口, 它处理代理的创建、执行和生命周期管理。首先是代理的类型系统, agent two 支持多种输出类型。 completed 完成型, 代理直接完成并返回结果。 a sync launched 异步启动型代理在后台运行 teammate spawned 队友生成型,生成一个可以在终端中看到的队友,还有 remote launched。 远程启动型, 在远程 c c r 环境中运行,每种输出类型对应不同的执行模式。最有趣的是 fork subject 实验, 这段代码被特性开关 fork subject 控制。当起用时,子代理会继承附代理的完整对话上下文和系统提示。 为什么要这样做?注视给出了明确的理由, tools 星号配合 use exact tools, 让子代理接收父代理的精确工具池,用于缓存相同的 api 请求。前缀 permission mode 设为 bobble, 表示权限提示上浮到负终端 model 设为 inherit, 保持上下文长度对等。通过让子代理继承父代理的系统提示字节, 可以确保 api 请求的前缀完全相同,从而利用 prompt 缓存机制大幅减少 token 消耗。 spawn multi agent ts 是 蜂群系统的核心生成模块儿, 一千零九十三行代码,它从 teammate tool 中提取出来,已允许 agent tool 附用。这个模块实现了三种代理生成模式。第一种是 split pin 分 屏模式,当在 tmux 内部运行时, 创建队友在共享窗口中,领导者在左侧占百分之三十,队友在右侧占百分之七十。当不在 tmax 中时,创建一个 cloud swarm, 绘画所有队友以平铺布局排列。分屏模式是默认的生成方式,让用户可以直接在终端中看到所有队友的工作状态。 第二种是 separate window 独立窗口模式,这是遗流行,为每个队友在自己的 t max 窗口中创建,适合需要每个代理有独立全屏空间的场景。 第三种是 in process 进程内模式,这是最轻量的方式。代理在同一个 node js 进程中运行,使用 a sync local storage 进行上下文隔离, 不需要 tmax 或 item 二,可以在任何环境下工作。但是代理没有自己的终端面板,在 ui 中通过任务列表来管理。选择哪种模式取决于环境。进程类模式是非交互式绘画的唯一选择, 因为基于 tmax 的 队友在没有终端 ui 的 情况下没有意义。蜂群系统需要一个智能的后端检测机制来决定在哪里生成队友。这个逻辑在 backends 目录下的 registry ts 和 detection ts 中实现。 检测优先级流程是这样的,第一优先级,如果在 tmax 内部总是使用 tmax 后端, 即使在 item 二中也是如此。代码注示解释得很清楚,我们只检查 tmax 环境变量,不运行 tmax display message 作为回退。 因为该命令会在系统上运行任何 tmax 服务器时成功,而不仅仅是当前进程。是否在 tmax 中,这个细节很重要,说明工程师对 tmax 的 内部机制有深入了解。 第二优先级,如果在 item 二中,且 it 二命令行工具可用,使用 item 二原声分频后端。第三优先级, 如果在 item 二中,但没有 it 二,检查是否可以用 tmax 作为回退。这里有一个很体贴的设计, 如果用户之前选择了优先使用 tmax 而不是 iterm 二,就不会再次弹出设置提示。第四优先级,如果没有 timex 也没有 iterm 二,抛出错误并给出平台特定的安装指南,检测结果会被缓存。 一旦确定在整个进程生命周期内不会改变。当一个队友被生成时,他需要携带一系列身份信息, 这些信息通过 c l i 参数传递,而不是环境变量。具体来说,每个队友启动时会收到 agent id 代理 id, agent name 代理名称, team name 团队名称, agent color 代理颜色, parent session id 赋绘画 id。 如果需要计划模式,还有 plan mode required 的 标志。如果指定了代理类型,还有 agent type 参数, 代理 id 的 格式很有讲究。使用 format agent id 函数生成格式是 name at team 注示特别指出, sanitize agent name 函数会清除名称中的 at 符号, 因为 at 会破坏 agent name at team name 的 id 格式。 c l i 参数之外,还有继承的标志, build inherited cleflex 函数,确保队友继承附近城的重要设置权限模式模型选择、 设置文件路径、插件目录、 chrome 标志等。但有一个安全例外,当 plan mode required 为处时,不继承 bypass permissions 计划模式优先于绕过权限, 这是出于安全考虑。蜂群系统中的队友之间如何通信?答案是一个基于文件的邮箱系统。 teammate mailbox dts 实现了这个完整的消息传递协议,超过一千一百行代码,每个队友有一个收件箱,文件 路径是 cloud teams。 团队名,美, inboxes 美代理名, jason。 消息类型非常丰富,不只是简单的文本。第一种是普通消息,包含 from 发送者 text 文本 timestamp 时间戳, read 已读标记 color 颜色, summary, 摘药预览。 第二种是空闲通知,当队友变为空闲时发送。第三种是权限请求,工作者遇到需要用户批准的操作时,通过邮箱发送给领导者。 第四种是沙箱权限请求,沙箱检测到非允许网络访问时触发。第五种是计划审批请求, 需要计划模式的队友在实施前提交计划给领导者审批。第六种是关闭请求和审批,用于优雅的停止队友。第七种是模式设置请求, 领导者可以更改队友的权限模式。最后还有团队权限更新和任务分配消息。所有文件操作都使用文件所防止静态条件 重试十次,超时五到一百毫秒,确保多个代理并发,写入时不会冲突。蜂群系统需要一个团队文件来跟踪所有成员的状态。 team helpers 到 t s 提供了团队文件的读写工具。团队文件是一个 json 文件,存储在 cloud teams 团队名美 team jason 中。每个成员记录包括 agent id, 代理 id name, 名称, agent type, 代理类型, model 使用的模型, prompt 出示提示 color 分 配的颜色, plan mode required 是 否需要计划模式 join that 加入时间, tomax pin id 面板 id, cwd 工作目录, subscriptions 订阅列表 back and type 后端类型当生成新队友时,系统会做几件事,首先通过 generate unique teammate name 确保名称为一。如果名称已存在,会追加数字后缀,比如 tester 二, tester 三。然后把新成员追加到团队文件的 members 簇组中。接着通过 write to mailbox 发送出使指令到队友的邮箱。 这里有一个巧妙的设计,队友是通过 t max 命令启动的,但启动时不带提示。出示指令通过邮箱发送队友的收件箱,轮询器会拾取它并作为第一个回合提交。 这避免了在 t max 命令行中传递可能很长的提示文本,也避免了 shell 转移的麻烦。在终端中运行多个 ai 代理时,如何区分它们? 答案是,颜色 agent color manager 到 t s 定义了八种代理颜色, red 红, blue 蓝, green 绿, yellow 黄, purple 紫, orange 橙, pink 粉, cyan 青。 这些颜色以轮询方式分配。 assign color 函数使用一个全局缩写 color index, 每次分配一种颜色,然后递增。 如果代理数量超过八个,就会循环回到第一种颜色。颜色不仅仅用于终端显示,它还传播到邮箱消息中,让接收者知道消息来自哪个颜色的代理。在 tmax 中,颜色显示在面板边框状态中, 让用户一眼就能识别哪个面板是哪个代理。 enable pain border status 函数会起用 tamox 的 面板边框标题显示 team leader 的 名字叫做 team lead name, 在 constants t s 中定义为 team lead swarm, 绘画名叫做 swarm session name 定义为 cloud swarm。 还有一个 hidden 地划叫做 hidden session, 定义为 cloud hidden, 用于不可见的后台操作。 beauty agents 调 t s 定义了 cloud code 的 内置代理类型, 这个文件只有七十二行,但信息量很大。首先是 general purpose 通用代理,这是最基础的代理类型,适合大多数任务。然后是 status line setup。 状态栏设置代理专门用于配置用户的状态栏设置。 接下来是 explore 探索代理和 plan 计划代理,这两个代理由特性开关 tango burr stot 控制注视透露了 a b 测试的策略, 第三方默认为 true, bedrock 和 vertex 保持代理起用 a b 测试的实验组设为 false 来测量移除的影响。还有 cloud code guide 代码指南代理, 它只对非 s d k 入口点可用。也就是说,通过命令行 桌面应用或 ide 使用 cloud code 的 用户会看到这个代理,但通过 s d k 使用的开发者不会。最后是 verification 验证代理 由特性开关 tangle hive evidence 控制,这个代理专门用于验证其他代理的工作成果。还有一个全局开关, cloud agent sdk disable building a g t 环境变量,允许 s d k 用户完全禁用内置代理,从零开始构建自己的代理体系。在多代理协助中,一个关键问题是文件系统隔离, 如果两个代理同时修改同一个文件,就会产生冲突。 cloud code 的 解决方案是 git work tree 隔离。 agent two 中有一个 isolation 参数, 可以设置为 worktree, 这意味着代理在一个临时的 get 工作树中工作,拥有仓库的独立副本 create agent worktree 函数,创建临时工作树 has worktree changes, 检查是否有未提交的修改 remove agent worktree 在 完成后清理工作树。对于外部用户只支持 worktree 隔离模式, 但对于 antropic 内部员工,还有一个 remote 远程模式,可以在 c c r 远程环境中启动代理。这个区别体现在 schema 定义中, 外部用户的 isolation 参数只能是 worktree 每举值,而内部用户可以选择 worktree 或 remote。 注意代码中的条件, external 等于 ant 时才有 remote 选项。这个 ant 我 们在上一集见过,是 antropic 内部员工的标识 工作数完成后,如果代理做了修改且没有未提交的变更工作数会自动清理。 如果有未合并的提交工作数和分支会保留在磁盘上,用户可以回来检查。 agent two 中的生命周期管理非常精细,首先是自动后台机制 progress threshold ms 等于两千毫秒命令超过二秒显示进度。提示 get auto background ms 函数返回幺二零零零零毫秒,也就是二分钟。当特性开关 tango auto background agents 起用或环境变量 cloud auto background tasks 设置时,代理任务会在二分钟后自动转为后台执行。代理有完整的生命周期回调。 register a sync agent 注册 register agent 标记前台 update a sync agent 的 progress 更新进度 complete a sync agent 的 完成 fail a sync agent 的 失败。 cue a sync agent 的 终止。每个代理还有一个 abort controller 与附近城的 abort controller 链接。当附近城被终止时,所有子代理也会收到中断信号儿。 绘画恢复时, match session mode 比较当前模式与存储的模式不匹配,就翻转环境变量 get coordinator user context 在恢复时重建工作者的工具列表。对于 simple 模式,工作者只有 bash read 和 edit 三个工具。对于完整模式, 工作者有完整的工具级,加上 m c p 工具还有一个 scratch pad。 草稿版目录的概念由特性开关 tango scratch 控制。 起用后,工作者可以在不触发权限提示的情况下读写这个目录,用于跨工作者知识共享。进程内执行是蜂群系统中最清亮的模式。 spawn in process 点 ts 和 in process runner 点 ts 实现了这个完整的引擎。 进程内队友运行在同一个 node js 进程中,使用 a sync local storage 进行上下文隔离,这意味着多个 ai 代理共享同一个进程的内存和事件循环,但各自有独立的身份和权限。上下文, create teammate context 创建队友。上下文, run with teammate context 在 上下文中执行代理循环。 spawn in process teammate 函数做了几件事,创建 team context 创建链接的 onboard controller, 在 appstate 中注册 in process teammate task state, 返回生成结果。进程内模式的起用逻辑在 is in process enabled 的 函数中,非交互式绘画总是使用进程内模式,因为基于 tmax 的 队友在没有终端 ui 时没有意义。 对于交互式绘画默认使用面板后端,但如果之前的生成因为面板后端不可用而回退到进城内,就会一直使用进城内模式。这个设计避免了在绘画中途频繁切换执行模式。 进城内队友在 ui 中通过任务列表来管理,而不是通过终端面板。让我们回顾一下蜂群系统的全貌。 coordinator 协调器是大脑,负责理解用户需求,拆解任务综合结果。 agent tour 代理工具是手脚,负责实际的研究、实现和验证。 spa multi agent 生成模块是产房, 负责在 t max item 二或进程内创建新代理。邮箱系统是神经网络,通过文件传递消息、权限、请求、计划、审批等九种消息类型,覆盖了从普通通信到权限管理的所有场景。 团队文件是户口本,记录每个成员的身份状态和能力。后端检测是适配器,自动选择最适合当前环境的执行方式。颜色系统是身份标识,让用户在终端中一眼区分不同代理。这个系统的设计体现了几个核心理念, 第一,协调器必须是智能核心,不能只是消息转发器。第二,工作者是异步的, 并发是超能力。第三,提示必须自包含工作者看不到协调器的对话。第四,文件系统隔离,保护并行安全。第五,基于文件的邮箱系统简单可靠,利用文件所保证并发安全。 下一集,我们将深入 cloud code 的 权限系统内部,看看九千多行代码如何构建一个细力度的访问控制体系。
粉丝1060获赞3676

今天尝试了一下宝玉老师分享的 cloud 扣官方的人在用的十个技巧,基本上还是 比较有用的,里面提到的我现在可以随便列举一下,一个就是在用 cloud 去执行任务的时候,可以让他先写计划,那这样子就可以对其我的需求 cloud 也可以更加理解我,双方不断的确认之后呢再去执行这个计划,写代码出来的内容就会 更加准确一点。另外就是也建议说用语音输入,语音输入对比打字呢,一个是输入的东西会更多,另外也会讲的更加的详细。呃也可以借用一些 呃大模型优化的语音输入工具,呃去帮助你去梳理说你想表达的内容。 呃,还有就是现在因为呃 ai 来写代码比我们自己去写呃会快的多,我们都是用自然语言对话,让 ai 去构建我们想要的内容,所以如果是非编程专业的,还是要去 先大概的了解代码是什么样的,他是做什么操作,那这样就不会说做了很多无用功。虽然说看着 ai 大 模型帮你操作好多内容,但是最终出来的内容呢又, 嗯好像没有什么作用。这个就是要先把代码看的基础的执行,做什么操作还是要理清楚。 呃,大概就是这样子。另外就是会去建立 cloud 自己的,呃, md 文件,它自己可以读取 学习的哪些内容,以及啊我有哪些原则,宪法,哪些是不能动的,然后每次要帮助去执行的时候要看哪些文件,这个是需要提前去整理出来。那这样如果你去用不同的大模型去 切换的过程中呢,就都可以知道你想要做的是什么,以及你的习惯,你的风格是什么,那这样子就后续可以越来的越懂,你也用的更加的顺手。 嗯,今天大概分享的就是这些,具体的话我写成了文字,可以看我文字的版本。

你真的会用 clock code 吗?这条视频不讲基础入门,只讲十二条能明显提效的高阶用法。第一组, esc, 再按一次 esc 可以 回到上一条消息继续编辑。 shift 加 tab 可以 快速切换 plan 模式和执行模式。 第二组,井号开头适合把长期规则写进 clock 点 m d 感叹号开头可以直接跑命令,再把结果接回当前绘画。 第三组, slash compact 用来压缩长对话。 slash permissions 用来集中管理授权,这两个命令特别适合长任务。第四组, slash at 第二适合 monroe repo slash review, 适合提交前让 cloud 进入真正的代码审查节奏。 第五组, slash terminal setup 可以 装好多行输入绑定。 slash vim 则适合喜欢纯键盘编辑 prompt 的 人。 第六组,自定义 slash commands 是 长期提效最大的能力之一,再配合 ctrl 加二反向搜索历史,找回好用 prompt 会非常快。一句话总结,真正提效的关键不是会不会问问题,而是能不能把 cloud code 用成你的工作流。

最近这几个月,我把百分之九十的 ai 工具使用时间全部从 chat、 gpt 转移到了 cloud 上。为什么?因为最近 cloud 实在更新了太多神仙功能。 如果说以前的 ai 只是一个陪你聊天的机器人,那现在的 cloud 已经彻底进化成了一个能帮你处理本地文件、写代码、做图标的全能数字同事。 如果你是刚接触 ai 的 新人,小白别划走。今天这期视频就是我希望自己在半年前刚用 qq 时就能看到的保姆级避坑指南,带你解锁 qq 最核心的几个隐藏玩法,让你的效率直接起飞!第一部分,万能提示词公式别再随便提问了, 很多人觉得 ai 不好用,其实是因为你的指令没写对。大佬们在用的完美提示词通常包含五个部分,一、设定角色,比如你是一个资深的自媒体爆款文案高手。 二、明确任务,比如帮我写一篇关于时间管理的干货笔记。三、目标受众,比如写给刚入职场经常焦虑的新人看。 四、限定格式规则,比如要求语言轻松幽默,多用短句,以小标题形式输出。 五、最核心的必杀技在开始输出之前,请先问我几个问题,以便你更好的了解我的具体情况和需求。 加上最后这一句,你会发现 ai 的 回答质量会有质的飞跃,因为它不再是盲目瞎猜,而是针对你的具体情况对症下药。第二部分, projects 打造你的专属外挂大脑如果你在使用付费版的 cloud, 千万不要错过 projects 这个王炸功能。 简单来说,它就像是为你不同的工作设立的专属文件夹。以前我们用 ai 每次开新对话,都要把背景资料重新发一遍,非常心累。但在 projects 里,你可以 上传背景资料,比如把你公司的产品手册或者你个人的简历、工作篇号写成一个文档传进去设定权局指令,告诉他在这个项目里,你是我的私人助理。这样一来,只要在这个项目库里新建对话, cloud 就 会永远带着这些记忆跟你交流。 你可以建一个自媒体运营库,一个英语学习库,一个私人生活管家库,数据互不干扰,越用越懂你。第三部分, artifacts 小白也能敲代码这是我彻底爱上 clogs 的 最大原因。传统的 ai 只能给你返回一堆枯燥的文字,但在 clogs 里,它拥有强大的 artifax 功能。 什么是 artifax? 就是 它能把复杂的信息直接变成可视化的图标、网页甚至小工具。比如,你直接对他说,我今年有十万块存款,帮我做一份可视化的图标、网页甚至小工具。比如你直接对他说,我今年有十万块存款,帮我做一份可视化的图标、网页甚至小工具。比如,你直接对他说,我直接对他说,我今年有十万块存款,帮我用丙图展示投资分布 只需要十秒钟。 cloud 不 仅会给你理财建议,还会直接在右边窗口生成一个精美的可以交互的财务看板。 你不需要懂任何编程知识,只要会说话,就能让 ai 帮你把脑子里的想法变成真实可见的网页和应用,这绝对是小白的福音。第四部分,未来的工作方式 co work 如果你想稍微进阶一点,可捞的最近还推出了 co work 等极其硬核的功能,它可以直接读取你电脑里的本地文件夹,帮你自动整理截图、分析几十份商业报告,甚至直接在你的电脑上写代码改文件。当然,对于新人来说,这部分可以慢慢探索, 只要先用好前面提到的万能提示词和项目库,你在这个 ai 时代的起跑线就已经领先百分之九十的人。

朋友们晚上好,今天这个视频呢,只有一件事情,就是从零到一的教会你们使用 cloud code。 那 很多人听到 code 这个单词啊,就会想到写代码, coding 编程,对吧? web coding, 但实际上以 cloud code 为代表,这种 ai coding agent, 它并不是只能写代码,而是一个万能的工具,并且就在昨天飞书刚刚看完了,他们的 coi 就是 command line interface, 也就是我们说的命令行接口。那么这意味着你可以使用 ai agent 帮你做表格,回消息, 发通知,定会议和安排日程。那么它代表的什么呢?它代表的其实是一种新质的生产力,你可以不用它写任何的代码,但是你要学会使用它。就像在远古时代,一个人是转不去火,而另外一个人直接拿着打火机就把火点起来了。 那么 cloud code 除了编程,它还能帮你做什么呢?首先它可以帮你做数据分析,管理文件,其次可以帮你爬取你的这个每日信息流,每日资讯,还可以帮你修图升图,生成播客,剪辑视频, 甚至你也可以根据你自己的工作方式来搭建属于自己的 skills。 那 么这个视频我将全面的讲解,不需要你有任何的预备知识,从基础到高阶,循序渐进,包括安装和设置,那么基础操作和这个最佳实践,以及 hooks agents, skills, plugins mcp 我都会教给你。那么同时像一些不常见的非常好的命令,比如说 simplify insights, a loop 我 也会教给你。以及我还会分享一下我的经验,比如说如何避免在长时间开发中的莫名其妙的 bug, 以及如何优化 token 节省成本。最后我还会告诉你如何设计你自己的 skill, 点 m d 来让自己的工作效率最大化。 那话不多说,我们直接开始。那首先呢,我们先来安装 cloud code, 那 么这里我们直接进入它的官网,然后我们下滑,我们可以看到这里有好几行命令,那我们只用根据你的电脑,比如说你是 micro s, 或者你是 windows, 选择相应的命令就安装就好了。 那这里呢?如果,如果说大家是 windows 的 话,我推荐大家使用这个 power show, 而不是 cmd。 因为这个 cloud code 的 它的底层是 unix 风格的命令,所以说使用 power show 的 话会更好。那比如说这里我是 micro s, 我 们只复制条命令,然后我们打开我们的终端, 然后我们粘贴上命令,然后再回车就好了。那么它就会帮我们自动地装好 cloud code。 由于这里我已经装好了,所以我就不再演示了。 ok, 那 刚才既然我们已经安装好了 cloud code, 那 现在我们该怎么使用呢?那很简单,我们只用打开我们的终端,然后输入 cloud 就 好了。 我们敲击回车,那这里它会选择说你是否愿意选择当前这个呃,文件夹做你的 workspace, 那 我们点击 trust this folder 就 好了。 ok, 进来之后我们就来到了这个界面。 ok, 那 现在趁着 cloud 在 安装,那现在我们需要安装另外一个非常重要的工具,叫做 c c switch。 我 们知道。呃,我们在国内想要使用官方的服务,比如说 opus, sonnet 或者是 hikube 是 非常麻烦的。那所以说我们就需要使用我们国产的模型,比如说 mini max, 呃, g o m, deepseek, 或者说百炼等等等等。 呃,还有像 kimi 这样的模型,那我们该如何使用呢?那很简单,我们使用这个工具就可以方便的帮我们配置,那么这个工具呢?叫做 cc switch, 那 么它的作用呢?就是允许我们配置多个模型,并且可以快速的切换。那么安装方式也很简单,我们只用往下滑。 好,这里有个快速开始,然后如果说你是 macos 用户,你直接复制这行命令,然后打开终端,像刚才我们安装一样,把这行命令复制过去,然后回车,它就会自动安装了。那如果说你是 windows 用户,那就比较麻烦了,我们需要点击 release, ok, 那 这样我们来到它的 release 界面,那我们一直往下滑, 那么我们可以看到它的一个 contributors, 然后它有个 assets, 那 我们点开这个 show all, 然后我们找到这个 cc switch v, 三点十二点三, windows 点 msi, 注意一定要是 windows 点 msi, 然后我们下载这个就好了。 ok, 那 既然我们已经安装好了 cc switch, 那 这一步我们要做的就是配置我们的模型,那么在这里呢,我选择的是我们的 mini max。 二点七,那配置方式也很简单,我们点击一下这边这个加号, 然后我们可以这里可以选择你使用的是模型,比如说你是智普,就选择这个,那么你,你是 deepsea, 选这个,对吧?你是 kimi, 就 选择这个,那我们这里是 mini max, 那 我们只能选择 mini max。 这,我们往下滑,那这里它已经帮我们填写好了这个 base url, 那 我们需要做的指示填写,我们好我们的这 api key 就 好了,那 api key 怎么获取? 那很简单,我们打开这个,呃, mini max 官网,呃,这里有个订购套餐的界面,好吧,那在这里呢,我建议大家就选择这个四十九元的这个套餐就好了,呃,目前我用下来是非常的够用。购买了套餐之后,我们点击我们的这个账户管理,我们选择 tokenplay, 在 这里我们把这个 api key 复制一下,然后我们粘贴在这里就好了, 这我们点击添加就 ok 了,就配置完成了, ok, 那 现在既然我们已经把 cloud code 安装好了,然后我们把 api 也配置好了,那现在我们就直接开始使用,那使用方式也非常简单,我们打开终端,输入启动命令,我们回车之后就进到第一个选项,那这里我们选择 yes, ok, 我 们就来到我们的工作页面,那可以看到刚才我们已经配置好了 api, 所以 说它这里显示的是 mini max 二点七,然后这里是 api use, ok, 那 么首先呢我们来讲讲 cloud code 的 三种模式,那么第一种模式呢叫做 default mode, 也是现在这种模式就就是这里什么都没显示。那么第二种呢叫做 plan mode, 那 就是规划模式。那么第三种呢叫 bypass permission mode, 那 这就是,呃完全执行,也就是相当于 full access 这种模式。那么首先我们来说第一种,第一种模式的话,那它的呃这个特点就非常简单,就说,嗯,它执行就是 cloud code 执行任何一个操作,比如说它读写文件,编辑文件,都需要你明确确认之后它才会执行,那比如说现在 我们让他在桌面上创建一个文件,看看是什么效果,那这里呢?我推荐大家一个工具叫做闪电缩,那他就是一个语音输入法,但是他这个语音输入法是会使用这个拉玛,也就是我们的大模型去整理的语音输入,并且他是可以学习的,所以说他这个识别准确率是非常的高,那么包括我看到抖音,他们也做出了自己的这个 豆包输入法吧,那么我看我身边有朋友体验也非常不错,那大家可以去试一下,总之一切是免费的。那云输入法的话很简单,我们只用给他说我们的想法,呃,帮我在桌面上建立一个文件夹吧,然后里面给我放一个文件叫做 test 点, md, ok, 我 们回车看一下他会怎么执行, ok, 那 首先他会问我们文件夹是什么名字,对吧?叫做 test 就 好了, 这里呢它就会让你选择是否执行这个命令,那我们可以看到 make d r, 就是 就是新建一个文件夹嘛,然后在这个位置,好吧, 那我们选择 yes 就 好了,因为现在我们是 default mode 嘛,就是它每个插座都会问你是否要执行,我们选择 yes, ok, 他 说已经成功创建了,刚才我们已经讲解并演示了 default mode, 那 么它就是每执行和命令,好吧,都需要我们手中确认一次,那我们想刚才只是一个非常简单的任务,对吧?我们创建一个文件夹,所以说执行一次,选择一次,点击一次就好了。那如果说现在我们在执行一个非常复杂的任务,那我们每次就要点嘛, 那我们还怎么玩手机,对不对?那怎么摸鱼对不对?非常的麻烦,所以说我们就要使用这个危险模式,那危险模式该怎么进入呢?危险模式的话,我们需要呃用一个单独的命令进入,刚才我们是输入 c l a u d cloud 这个命令来进入的,对不对?那现在如果说我们想要使用这个危险模式,也是这种 full access 全自动的模式,那我们就需要在后面加上参数,加上这个 dangerously skip permission 就 许可嘛,对吧?就是无许可模式嘛。 ok, 我 们点击回车 啊,一样的,我们选择 yes, 相信这个。呃 folder 做我们的 workspace, 那 ok, 看到这里就有了这个 bypass permission 啊,就说现在它执行和命令不需要我们的这个批准了,好吧,它会直接自动执行。那同样的,我们说帮我在桌面上建立一个文件夹,然后名字叫做 test 二吧,然后里面给我放一个这个 md 文档,名字随便取就好。 ok, 我 们看看它会怎么做, 你看它这里直接执行了这个 bash 命令,好吧, macd 直接创立了这个 test 二的这么一个 folder, 然后在下面呃,创立了一个 untitled 的 点 md 文档。 ok, 他 现在直接给你说我们完成了这个任务就非常方便。所以说,呃,我更推荐大家使用这个 dangerously keep permissions 这个命令来起到我们 cloud 吧。那我们继续讲讲规划模式,就是这个 play mode, 那 play mode 它其实有两种的,呃,这个应用场景嘛,那么第一种就是当我们在做产品的时候,做项目的时候,在初期,呃,我们想知道这个 ai 会怎么执行,对不对?是不是按照我想的方式执行? 那么我们可以用这个 plan mode, 让他规划书写一个 plan 出来,我们看一下,没问题。 ok, 那 就会按照这个 plan 去执行。那第二种应用场景呢?就是针对一些比较宽广的任务,就是广度比较大的任务吧,就比如说现在我让他把我桌面上面所有的这个文件全部给我迁移到我的这个硬盘里面去,那他会操作很多文件,对吧?可能呃几百个,那这时候我们就用这个 plan mode 就 比较好。 那还有一种场景就怎么说?就比如说现在我们我需要让他去 re-use 我 们的代码,就去审查我们的代码吧,对吧?那这时候让他用这个 client 就是 一条条干,先干嘛,后干嘛,那这个场景是比较好的,那这里我们来体验一下这个 client, 我 们还是用 shift 加 tab 切换一下。 那我想想我们列个什么计划,那很简单吧,现在我要整理我的桌面文件夹,现在请你帮我列个计划,我看看该怎么整理。 ok, 我 们回车看看他会怎么做。那么我们要注意啊,就是 plan mode, 他的权限是只读权限,就是他只会进行读操作,不会进行写操作,只有你看过没有问题之后,那么他才会进行写操作。 ok, 我 们可以看到很快他就给了我们一个 plan, 那 同时他给了我们三个选项,第一个选项就是 yes and bypass permission, 这是什么意思?就说无条件执行,不要来问我了。那么第二个是什么意思?第二个就说 yes, manually approve it, 就是 执行这个计划,但是需要我手动来批准每项这个编辑,那么第三个选项就说你可以告诉他,你觉得这个计划有什么不好的,你直接给他说, 他就会按照你的这个要求去更改这个计划,然后再让你看一遍。那比如说你再帮我把垃圾箱清理一下吧,把这个计划加入进去,然后让我看一下。 ok, 我 们可以看到他刚才又在我的要求上增加了一部清空垃圾箱的这么一个任务,那你觉得没问题,那我们就选择 yes 这个 bypass permissions, 它就会自动执行的。 ok, 那 现在我们来讲讲 cloud code 的 一些命令,那首先第一个命令就叫 enit 命令,那么现在我已经打开了一个项目,这个 voice input 是 我让 codex 做的一个语音输入法的项目, 那一定题命令很简单,就是初设化嘛。那么他这个命令呢?首先会把我们整个这个项目的代码看一遍,看完之后他会根据他理解生成一份 cloud 点 md 文档,那这个 cloud md 文档有什么作用呢?就是,嗯,每次绘画的时候,他都会首先加载这个 cloud md 文档,那里面就是一些最高的原则,相对于类似于机器人不能违背的三条法则那种感觉。 ok, 我 们这里可以看到他成功创建了一个 cloud md, 然后这是他给出的一份资料,那即使想要写好一份好的 cloud md 文档,也是需要花很多功夫的,那我们就不在这里多说了,但是 唯一一个原则,大家需要记住的就是不要让你的 cloud md 写得又臭又长。如果说 cloud md 写得非常长的话,那每次上下文稿加载它就会一个是会消耗我们大量的 tool, 另外一个就是会让这个 嗯 a 键是变得非常笨。那一种解决方式就是我们把那种长的文件拆分出来,我们新开一个这个 md 文档去存放,那比如说我们可以开一个 get 点 md, 对 吧?然后我们把这个 get md 的 这个路径,我们记录到这个 cloud md 中,然后并且我们想指示说如果你需要这部分的知识,那么请去查找这个文件,这就是,嗯, cloud 客户团队非常喜欢的这个叫渐行式批录。 ok, 那 我们什么时候可以使用这个 init 命令呢?那我的答案是你任何时候都要使用这个 init 命令。比如说你从 github 上面下载了一个新的项目,你使用这个 init 命令,那就可以让这个 agent 快 速的了解整个项目,然后生成一份 cloud 的 md 文件, 然后 cloud 点 m d 文件是相当重要的一个文件,它相对于这个 ajax 的 一个最高指示,所以说你可以在里面写一些你自己喜欢的,你觉得非常重要的一些原则,比如说开发规范,比如说千万不能执行 r m 杠 r f 等等等等。那 cloud 点 m d 呢?一般会随着你项目的迭代,开发过程迭代呃来完善。 ok, 那 大家肯定听说过 marty agent 或者说 agent team, 那 其实想要创建一个多 agent 的 这么一个团队也非常简单,那像 cloud code, 它就支持我们创建这个 agent, 并且可以用这个自然语言创建,那我们只用执行 agent 命令,可以看出来,我们点击确认,那它就会说第一个选项 create new agent 就是 创建一个新的 agent, 那 么这就是 user agent, 就 代表说我们已经创建好的 agent, 可以 看到我这里创建了一个 codex review agent, 还有一个这个 marty agent coordinator。 ok, 那 现在我们来创建一个 agent 来看一看。那首先很简单,我们直接回车选择这个 create new agent 就 好。 ok, 它这里就会让我们选择这个 agent 的 location 在 哪里,就说选择你这个项目级别,就是它这个权限级别嘛,那我们就选择这个 project 就是 这个项目级别就好了。 然后它现在又给了两种方式,第一种方式就是 generate with cloud, 就是 说让你跟 cloud 一 起创建这个 agent。 第二种方式呢,就是你自己去写它的这个配置文件,那我们肯定选择第一种,对吧?因为毕竟它后面都说了这个 recommended, 那现在他就说让你去描述一下你这个 agent 要做什么,你看他这里说的 describe what this agent should do? 吧啦吧啦吧啦一大堆,对吧?那我们很简单,现在我要创建一个这个 technique co founder, 这么一个 agent 就是 一个技术合伙人的 agent 吧?那我把我准备好的这个 prompt 发进去, ok, 那 现在我们点击回车就拿创建这么一个 agent, 然后他现在就在 显示,他说 generating agent from description, 就 说现在根据我们这个描述在创建这么一个 agent。 那 当然本次教程提到的所有提示词会放在我这个文档里面,那具体怎么获取文档请看我的这个主页,好吧, 在我的公众号里面获取。 ok, 那 现在出现了这个界面,这个界面就是说让你去选择你新建的这个 agent 允许他使用哪些工具,那他根据我们的这个描述,现在给他全部工具权限,那当然你也看到这里写了是 enter to talk selection, 那 就是 talk 切换状态嘛,那很简单,如果你想 不让他使用这么多工具,对吧?那你就小键盘嘛,上下左右。然后你假如说不让他使用全部工具,你再按一下这个 enter, 那 你看全部都没有选中了,现在是零个工具这里显示的。 那如果说你要全部工具选上,那就返回去,然后再按下 enter, 现在是 auto selected, 然后确认没问题,我们就 continue 就 好了。 那这里他就说让你去选择你新的这个 app 的是用什么模型,那比如说你是用 sonet 或者 oppas 或者是海库,要不然的话,你就说它是继承它的这个负类的模型。那很简单,因为我们用的是 mini max 二十七嘛,那我们其实不用选,我们直接选择这个 inherit 就 好了。 然后这里就说让你选择这个 agent 的 颜色,比如说你选择红色、蓝色、绿色、黄色,对吧?选择选择一个你喜欢的颜色就好,那我们选择一个黄色吧,然后他这里就说这个 agent 这个 memory 它在哪个范围,那我们选择这个当前项目级别就好。 然后现在它就会让你再再次确认,然后你可以浏览一下这个,你的这个 description, 你 这个 memory, 你 的这个 system prompt 等等等等。 ok, 确认没问题,我们选择 enter 就 创建好了,你看它这里显示的 creative agent technical founder。 ok, 那 我们想要调用我们创建的 agent 也很简单,直接使用这个自然语言去交互就好了。 那这里我们就说帮我调用我新建立的这个 technic founder, 这个 agent, 我 要做一个项目, 那我们看看他会怎么做? ok, 可以 看到他成功唤醒了这个 agent, 你 看他正在初步化,花费了二十六点六 k 这个 tokens, 然后现在他说 technical founder 这个 agent 已经启动了,现在你可以说你要做什么项目了,那我们就开始巴拉巴拉巴拉说我们的一堆项目,对吧?他就可以帮我们完成。 那我们什么时候该新建立一个 agent 呢?那很简单,就是当你发现你会重复地做同一类任务的时候,并且这类任务需要很长的一段 prompt, 需要你定很多的规范。那这时候你应该专门创立一个自己的 agent, 比如说你可以专门建立一个产品经理的 agent, 一个后端开发的 agent, 一个前端开发的 agent, 一个专门做这个测试的 agent, 甚至呢你也可以专门建立一个 codex agent, 那 这个 agent 其实就只用干一件事情,就是在你的终端去执行这个 codex 命令,相当于唤醒了 codex, 那 这样就可以实现 cloud code 的 写代码 codex 进行 review, 并且不需要你人工去传递他们的 prompt, 传递上下文,直接让他们两个对接就好了。 一个单独的 agent 还有一个非常好的点,就是它可以帮助我们节约我们的上下文。那假如说现在我们要去执行一个非常长的文件的写操作,或者说一大堆这种抓取的操作,那我们可以单独开一个 java agent, 让这个 a 键去执行的操作。我们并不关心他到底获取了什么样的数据对不对?我们只关心他到底完没完成任务,那 x a 键就帮我把中间上下文给省略了嘛?最后他完成任务返回一个 ok, 那 我们就知道任务完成了,那 a 键这个命令就讲这里了,那同样有很多玩法需要大家自己去探索, 那现在我们来继续讲讲 m c p skills, 以及最近新出的 plugins, 还有我们的 hooks。 那 首先我们来讲 m c p 跟 skill 吧,因为很多人会把这两个词搞混,那其实很简单, m c p 中文翻译过来叫做模型上下文协议,那么 skills 呢?翻译过来叫做技能能力,对吧?它们之间的差别 有一个就是 m c p 是 告诉你能不能做,就是你有没有这个能力做,而 skill 是 告诉你你如果有了这个能力,你应该怎么做。那我举个例子,现在假如说我是一个残疾人,我没有这个腿,但是我想去骑自行车,是不是我就不能骑?那假如现在给我一个骑车的 m c p, 相当于就能帮助我长出这个双腿,那我有了腿是不是就可以去骑车了? 但现实就是很多人尽管他四肢健全,他还是不会骑这个电瓶车,对吧?不会骑这个,呃,这个自行车,摩托车的。那我们再给他一个 skill, 就是 给他一个骑车指南,就是教他怎么骑这个自行车的,对不对?那这样二者一结合,是不是我们就会骑车了?大家应该可以很好的理解。 然后我们再举个例子,那假如说现在我们在进行一场开卷考试,开卷考试我们肯定要带复习资料对不对?肯定要带书对不对?那么 m c p 就是 说你带了这个书,带了这个资料,那如果说没有这个 m c p 就 相当于没有带书,那么 skill 是 什么呢? skill 就是 说你脑袋里面组织你怎么看这个书,怎么看这个材料,对吧? 比如说有些人会很快的找到这个答案在哪里,有些人要找很久才能找到,所以说 skill 是 教你怎么看书的,那么 m c p 是 你本身带不带这个书,带不带这个资料?那现在我们想看我们 cloud 的 安装哪些 m c p 很 简单,我们直接在这个命令行里面输入这个 slash m c p 指令就好了, 就可以看到现在我这里只安装了三个这个 skill, 一个抖音的,一个 pencil 的 playwrite。 那 现在你想看你安装哪些 skill 也非常简单,我们输入这个 slash skills, 就会看到你安装了这 skill。 当然这里的误区就是 skills 并不是越多越好,而是越精越好,就是 你如果是个小白的话,你可能会安装很多 skill, 对 吧?摸索一些你比较常用的 skill。 然后那我给你的建议就是你在这个使用过程中,你要不断去精简这些 skill。 因为 skill 过多会造成一个什么现象?就是模型有太多的工具调用了,导致他根本不知道什么时候该调用什么工具。这句话怎么理解呢?就有点相对于类似于选择恐惧症了, 就是一个人有太多的选择,就导致他一下子迷茫了,不知道自己的路该怎么走,那如果说他就一个选择,那就逮着往死里干就完事了。 那什么是 hooks 呢?嗯, hooks 用中文翻译过来叫做钩子,这个可能比较难理解,其实他本质上就是一段脚本银行代码,然后呢,在特定的事情发生的时候,他就会自动触发执行。 那么 hooks 呢?大家按照它的执行顺序,可以把它简单地理解成两大类,第一类叫做在工具调用前执行的 hooks, 第二类叫做在工具调用后执行的 hooks。 那 我们看一下, 那现在我们想象这样一个场景,我们知道 cloud 它是可以操作我们电脑所有的文件,对不对?但是你不想你的某些私密的信息,一些密钥文件,或说你不想让 ai 知道的文件被它读熟了,那怎么办? 那你就可以制定一个 hook。 这个 hook 怎么定义呢?就说每当这个 ai 进行读操作之前,或者说之后执行这个 hook, 这 hook 就 会检查你当前要读取哪一行文件,读取什么东西。如果说发现你读取这个路径和你这个私密文件的路径重复了,那就直接拦截, 懂了吧?这就是 hooks。 那 再比如说,现在我们在我写一个项目,那么项目写好之后,我们会把它推送到 github, 进行这个代码托管。那么我想的是每一次只要我执行了这个 review 操作之后,就自动地给我推推送到 github, 那 么也可以定一个 hooks。 那 么这个 hooks 呢?就是这个 post tool use hooks。 简单就说,当它监测到我们执行的这个 review, 那么它就会自动触发这个 hook, 把代码推上 gitlab。 那 hook 是 怎么创建的?也非常简单,我们只用告诉 a e i 说帮我创建一个 hook, 然后它这里就显示了你想配成哪一种 hook 啊,然后你再把你的需求给他说,他就会根据要求帮你配进一个 hook, 很 简单。 那同样的我们该如何创建 skill 呢?那么 skill 其实不建议大家在一开始就创建好,除非你很明确自己的这个流程是什么样的,场景什么样的。我更建议大家在使用这个 cloud 的 过程中来创建,因为你在使用的过程中才会发现哪些工作流是可以重复的,对吧?会大量重复执行, 那这时候你就可以建立一个你自己的 skill, 那 比如说我自己就建立了一个记录素材的 skill, 每当我给他发一个抖音链接,或者说小红书的链接,或者说呃, youtube, bilibili 等等视频网站链接,那么他就会执行一个动作,他会把这个链接的这个字幕也是在这个脚本这个竹子稿,然后保存到我本地我指定的位置,非常的方便。 那什么是 plugin 呢?这是最近新出的一个东西啊,那么 plugin 本质上就是说它把你的 hooks, 把你的 skills, 把你的 m、 c, p 全部打包封装在一起,那这样你在进行团队开发的时候,大家都可以附用这个主键,就非常的方便,非常的好,所以这就是 plugins 紧急抄波一条啊。刚才 codex 官方出了一个 plugin, 叫做 codex plugin c c, 就是 允许我们在可拉钩中直接调用 codex, 那 么安装非常简单。首先我们执行这行命令, 那么再执行这个命令,然后我们再重载一下 plug in, 这我们再准备这个 set up, 那 它就会自动调用你这个桌面上面的这个 codex 的 配置,然后写入,那就准备就绪了。来继续讲讲几个非常好用但是很不常见的这个命令,我基本上没有看到任何人讲过。那么第一个命令就是这个 simplify, 我 们把它敲出来, 那就是这个命令。这个命令命名是什么意思呢?那么叫 simplify, 它的中文翻译就是简单简化,对吧?那么 simplify 它其实就是一个代码的一个呃,检查命令,一个进行 code review 的 一个命令。就说当你完成一段代码的修改之后, 你运行这个命令,它会自动地对你所有的变更进行全面的审查。那么它的工作流程就是它会同时派出三个 sub agent, 那 么第一个 agent 它会检查这个代码有没有重复造轮子, 那么另外一个 agent 它会看这个代码或者命名这个格式不规范。那么还有一个 agent, 那 么它会直接查这个性能影 换,那就比如说重复计算,内存泄露等等问题。最后呢,他们会把发现的问题直接修复掉。当你的代码写完了,你直接运行这个命令,让这工具帮你检查一遍,进行这个 code review。 大家要注意就是我们想运行这个命令,我们必须把这个代码上传到 github, 进行这个代码托管。那 github 什么呢? github 是 全球一个最大的开源的一个,呃,代码托管的一个社区,那你如果没安装 github 的 也非常简单,你直接给你 ai 说帮我把代码上传到 github, 它就会协助你完成。好吧,那现在我们运行一下这个 sql 发命令,看一下是个什么效果。 ok, 我 们可以成功看到他已经把这个命令运行完了。由于我这个代码仓库刚才只是更改了这个 readme 文件,然后做一个演示,所以说他这里给出这个发现是你的代码非常干净,好吧,没有任何需要更改的。 那我们可以看一下他这个命令的运行过程,首先他执行的是 git diff, 他 看一下你当前这个代码和你之前提交在 gitlab 上面的代码,那有什么差距,对吧?那他这里说这个 only change is readme dmd, 那就说我们只修改了我们这个 readme 文档,那他还会走他接下来的流程,那接下来的流程就是他开了三个稍不一点的,那么第一个可以看到他进行了这个代码的附用的这个检查,第二个进行了代码质量的检查,那么第三个进行了这个效率的检查,那发现全部做完成之后,那给出了结果,然后给出了发现, 那这就是这个命令。 ok, 那 现在我们来讲第二个命令,第二个命令叫 rewind, 也非常简单,我们把敲出来看看,那这个命令它作用是什么呢?这个命令它作用就是时光倒流,就是当你把这个项目做歪了,或者说你想换个方向的时候,那么它可以回归到之前这个 checkpoint, 就是 回归到这个检查点,然后同时它会恢复这个代码和上下文。非常简单, 因为刚才我只执行了两个命令嘛。首先第一个命令我执行了 clear, 第二个执行了 simplify, 对 吧?所以说这里就只能选择两个,那我们选择一下这个 clear, 那 进来之后呢?我们可以看到这个命令给了我们三个选项,第一个选项就是 restore conversation, 那 我们看到它的解释是这个 conversation will be fork, 就是 说当前这个对话那会保持不变,但是我会在 clear 这个 checkpoint, 就是 在 clear 这个检查点这个地方,我们先看一个分支, 然后继续我们的对话,好吧,那我们看第二个选项是什么?第二个选项是 summarize from here, 就 说我们会把从 clear 这个检查点到现在这个检查点之间的所有对话进行一个压缩,进行一个总结,生成一份答案,然后再继续。那这个 nevermind 就是 我们直接取消的意思,那我们直接选择 restore confirmation, 你看那他就新开了一个对话,这个命令就到这里结束了。那接下来我们讲讲 in size 这个命令,这个命令非常简单,顾名思义就是洞察,那么他会根据你的 sql 的 对话,就是你所有的 session 来生成一份这个报告,那么他会统计你使用 sql 的 模式,比如说你会在哪些项目区域花的时间多,在哪里容易卡住,那么帮助你了解自己的一个写作习惯。那么使用方法也很简单, 我们直接输入这个 in size 命令就好了。那我们使用方法也很简单,我们直接看到这个报告非常详细, 那最后这个命令叫做 loop, loop 也很简单,顾名思义就是循环的意思嘛,那它就相当于一个定时任务,但是一个定时任务是在三天之内的,那我们怎么使用呢?比如说现在你想每一个小时帮我查一下当前的时间,那你可就可以这么执行,我们先选择 slash, 然后输入 loop 命令,然后你看它这里说了 interval 就是 间隔的意思,那我们选择 one hour, 就是 e h, 然后干嘛帮我查询一下当前的时间,那回车我们看看它会干嘛? ok, 那 我们可以看到它成功帮我们设立了这个定时任务,并且查询了当前的时间。 ok, 那 这个 loop 还有个非常好用的地方,就是它可以和 skill 一 起赋用,因为我们知道 skill 本质上就是一段 prompt, 对 吧?所以说我们可以这么使用,那比如说现在我想让他每隔一个小时帮我查询一下当前这个 ai 新闻,那我们该怎么执行?就是 loop, 然后执行一下哪个 skill, 执行下 ai news 这个 skill, 我 们看看它会怎么做。然后我们可以看到它成功执行了我的这个 skill, 并且把内容保存到了这个位置,然后它也创建了 cron。 ok, 那 现在我们来讲讲如何解决在长对话中莫名其妙出现的 bug。 那 我们知道如果说我们一个对话进程很长,那它肯定会压缩我们上下文,就是那个 auto compact, 那 压缩上下文的时候,那如果说最开始前几轮还会好,它只会压缩一些内容,一些文档,不会压缩一些关键信息。但是我们发现随着对话的进行那么多轮压缩之后,它第一点就是它的关键角色信息会丢失,早期价格约束将会被遗忘,那就会导致我们多人写作的时候 bug 越来越多了,好吧,所以说一些莫名其妙的 bug 出现, 那我们该怎么解决呢?那我们就是要让这个 cloud code 不要遗忘那些关键的决策,对吧?那比如说我们就可以在 cloud md 里面加入加入这个方案,或者说我们让他写一份这个 handoff 文件,那 handoff 文件怎么写?首先第一步我们要说清楚当前的进展是什么?我们的目标是什么?已验证的有效方案是什么?那么已验证的无效方案是什么?写清楚之后, 再打开下一个对话,让他进行交接,这样就会没有问题了。 ok, 那 现在我们来继续讲讲一个被很多人忽视的就是工具调用所产生的这个上小文的噪声。那我们知道,假设调用工具,比如说你测试代码,它会给你输出一长串的配索键,或说你查找文件的时候也会给你输出一长串的那种信息,那这东西是 cloud 是 根本不需要的,他只需要知道你完成了没有, 对吧?是 ok 还是不 ok? 所以 说我推荐大家安装这个 skill 就是 一个 r t k, 那 么他就会帮我们把这个信息压缩,只用返回给 cloud 的 最关键的信息就好了。 ok, 朋友们,那么看完了这期视频,我相信你对 cloud code 的 掌握已经超过了国内百分之九十九的 ai 玩家。但是说实话,工具只是工具, ai 时代最重要的并不是你会多少个命令,而是你的想法,你的 idea, 你 到底有没有真正想要做的事情。那么 ai 就 像一盏阿拉丁神灯,你提什么愿望, 它就会帮你实现什么愿望。所以说做一个有趣的人, dream bigger。 那 么下期视频还想提什么?你们决定评论区打出来,我们下次再见,拜拜。

大家好,欢迎来到本期视频,今天我们来聊一聊 cloud code 的 常用命令。 cloud code 是 终端中的 ai 编程助手,掌握这些命令能让你工作效率提升数倍。首先介绍绘画管理命令, 使用 clear 可以 清除对话历史,开启全新的绘画。当切换到完全不同的任务时,这个命令非常实用。 compact 是 我最喜欢的命令之一,它可以压缩对话上下文,同时保留你指定的关键内容。 比如 compact retain the database schema, 这样就能在保持上下文的同时节省 copy 消耗。 resume 用来恢复之前的绘画, 加上绘画名称可以直接跳转到指定任务,比如 resume offrefactor。 接下来是成本和模型控制。 cost 命令可以查看当前绘画的 token 使用量和费用,养成定期检查的习惯,能帮你更好地控制 api 花费。 model, 让你在不同的模型之间切换。 sonit 适合日常任务,成本更低。 opus 用于处理复杂的架构决策和深度推理,切换时使用左右方向键可以调整思考深度。 fast 可以 切换快速模式,在保持模型能力的同时加快输出速度。代码审查是开发流程中的重要环节。 diff 打开交互式差异查看器,可以查看 git 差异和每轮对话的变更。在提交代码之前运行这个命令能帮你发现意外的修改。 security review, 对 当前分支的变更进行安全分析,检查潜在的注入风险,认证问题和数据泄露。 rewind 可以 回滚对话和代码到之前的检查点,非常适合当你不小心走错方向的时候。 项目配置命令让你的开发环境更加个性化。 innate 初步化项目自动创建 cloud md 文件,里面可以存放项目的规则和约定。 memory 管理项目记忆文件,你可以在这里写下使用 text script css, 用 tailwind 这样的项目规范。 hux 配置生命周期钩子可以实现自动化操作,比如每次编辑后自动格式化代码 permissions 管理工具,权限平衡,安全性和效率。现在介绍 c i i 参数,这些在自动化脚本中非常有用。 cloud p 开启非交互式打印模式,非常适合在脚本中使用。 cloud c 继续最近的绘画。 cloud w 在 隔离的 git world tree 中工作,不影响主分支。结合 output format json 和 max budget usd 可以 控制输出格式和最大花费。 最后分享几个实用的快捷键, escape 取消当前生成,当 cloud 跑偏的时候很管用。连续按两次 escape 可以 回滚或总结。 shift 加 time 切换全线模式,在自动接受计划和普通模式之间循环。 alt 加 p 快 速切换模型不会打断你当前的输入。 输入前缀可以直接执行 bash 命令,结果会添加到对话上下文中总结一下,今天我们介绍了绘画管理命令 clear compact resume, 成本控制命令 cost model, 代码审查命令 diff security review, 项目配置命令 in it memory hooks, 还有实用的 c i i 参数和快捷键。掌握这些命令,你就能更高效地使用 cloud code。 一 键三连评论区留言,下期再见!

兄弟们,今天给大家分享一个超宝藏的开源项目 cloud how to, 一 周内斩获一万三千五百九十三颗星。 先给大家说清楚这个项目到底是干啥的,简单讲,它就是 cloud 的 保姆级使用说明书加实战手册,专门针对 antropic 家的 cloud ai, 从入门到高阶,把怎么用怎么用的好讲的透透的, 我已经做好了整合包放到飞书上了。其次最香的是啥? prompt 提示词教程。咱们用 ai 最头疼的不就是写提示词吗? 这个项目直接给你定制了 cloud 专属的 prompt 设计技巧,还附赠超多可直接抄的模板。不管是职场写文案,做数据分析写邮件,还是技术党写代码查 bug, 甚至学生党改论文做知识点拆解模板拿过去改俩字就能用,比自己瞎琢磨高效十倍!

这个 cloud 简直太强了,我花了三四个小时的 ppt, 他 几分钟就给我搞定了,接下来我就给大家展示一下他到底有多强大。 好,我要完成的任务是这样,我要做一个关于人才盘点的报告啊,这里面有所有人的基本信息和对他的评价,还做一个雷达图啊,这个呢,是用 excel 做出来的啊,我可以输入人员的信息 里面的名字,他的信息就出来,就形成了他的报告。那这个报告呢,来源于后面的两个表,大概是这样,然后呢,所有人的报告出来之后,我再把这个复制粘贴到 ppt 里,形成一个完整的报告。 那现在如果我要完成,那我得一个一个的复制粘贴,复制粘贴是吧?好,我就把这个需求呢给到了 cloud, 我 们看一下,我就把两个附件,然后以及附件之间的逻辑和我现在要做什么给到了 cloud, 他 大概呢花了五分钟左右的时间, 就输出了一个 ppt 的 报告,完整的我的需求的报告。也就是过去假设我有两百人,我可能要占个两三个小时,那现在它基本上五分钟就能帮我搞定的。好,这个报告效果就出来了,可以看到它已经完整的输出出来了。然后呢,我只要下载就可以了啊,只要下载这个报告 好,下载报告就完成了。然后呢,直接你直接打开就可以。 好,直接打开可以看到它就把你四十多个人的报告全输出出来,那大家可以看到这个 cloud, 它的这个绝对称得上是百倍效率提升。好,那今天就给大家介绍到这里,接下来呢,我也会探索更多 ai 奇效的案例。

cloud code 怎么用?记住两个命令,四种模式就够了。输入 cloud 直接启动,想继续上次对话,加个 dash c, 想跳过确认自动执行,加 dash dash dangerously skip permissions 这两个参数日常够用了。进入界面左下角有四种模式, 按 tab 加 shift 可以 切换默认模式。开始之前先把任务说清楚,到底要干嘛,跟他聊五到十五轮。 plan 模式聊完了让他帮你做计划。 accept 模式大部分操作自动执行, 但重要命令还是需要你确认,比 danger 安全一点。 danger 模式有信心一键全部自动执行。我的习惯是默认模式聊清楚, plan 模式出方案, danger 模式一把缩,遇到不确定的切回 accept 稳一点,模式切对了, cloud code 才能真正帮你干活。

如果你用 cloud code 写代码修 bug, 可能遇到两类问题,一是不够顺手,如启动慢,重复确认,常用命令来回敲。二是不够稳定,会跑偏,看起来对,但没跑测试常会话越聊越糊。 本文章五十条技巧,按更快和更稳,整理成速查卡,可收藏备用转账。先介绍三条新手友好且立刻见效的技巧, 一、所有任务写清验证方式,如改完后跑测试失败,先修到全率才算完成, 可提升结果质量。二、切换任务,先 clear 清空上下文,给新指令干净绘画加明确目标,处理更快更准。三、 学会回滚,再尝试按一次 esc 停止当前动作,连按两次 esc 或用斜杠复位,回到检查点警号目录。零一,启动更快,少敲命令,少点确认。 零二、终端更顺手,像写代码一样用零三,质量更稳定,装上验证回路。零四、插件与工具,让看起来对并真的对。五、上下文管理干净比常更重要。 零六、并行与分身 work tree sub agent team 零七、自动化越安全,放开手脚要用刹车。零八、提示技巧,把话说到位,少走弯路。 零九、速查清单五十条一句话动作具体技巧,启动更快。一、给 c s h r c 或斜杠点 b a s h r c 中写 l e s c c 等于 cloud dangerously skip permissions, 但要慎用 dangerously skip permissions 二、用康金妮康婷 resume 接着上次进入肯亲女继续最近绘画。 resume 从列表选绘画继续井号井号井号,中端更顺手。三、命令全家内敛跑命令, 如 get status, 按 pm test 命令和输出,直接进上下文。四、 s e c 停止双 s q 或斜杠 win 回滚,但外部操作不一定能完整回滚。五、 control 叉 s 暂存没写完的提示词,插问后草稿自动恢复。 六、 ctrl 加 b, 把耗时任务扔后台,可继续做其他事。减耗减耗减耗质量更稳定。七、指令写清完成标准,如把 a 重构成 b 改完运行测试套件失败先修复,全律完成。 八、直接贴原始数据,如报错、日制 ci 输出等,避免转述丢细节。九、同意问题究竟两次没好,可以重开绘画 井号井号井号插件与工具。十、优先装 lsp 类插件,如 plug in install t y p e, s c r i p t dash lsp at cold dash plugins dash official eleven。 多用 c l i 工具,可先叉叉叉 help 学用法再完成任务。井号井号井号上下文管理 任务切换,先克里尔新绘画加清晰提示更有效。十三、复杂任务用 plan mode 小 任务直接做。十四、 compact 时说明保留内容,如保留 api 变更点,加修改过的文件清单,加当前测试状态。 十五、生成 cloud 点 md 后删掉一半,判断标准是没这行是否会犯错。十六、犯错后让它更新 cloud md。 十七、用 itunes 把按需内容拆到独立文档,井号井号井号井号并行与分身。十八、 worktree 隔离分支并行做事建议并行二到三个绘画,避免同时改同一文件。十九、 用 sub agents 隔离调查研究主会话接收总结,二十多人协同,先从研究评审开始,稳定后再并行,实现。警号警号警号自动化与安全。二十一、 permissions 白名单常用安全命令。 二十二、斜杠三 box 给自动执行,加护栏控制写操作和网络访问范围。二十三、用 hux 自动格式化和拦截危险命令。 二四、认证支付等关键区域人工复合提示技巧。二十五、用爱的文件路径指路,如 srcoslash m i d d l e w a r e 到 t s。 二十六、 需求不清,让他采访你写 s p e c。 cloud code 拉开差距在于建立验证。一个绘画实现另一个绘画 review、 速查清单、设置 cc 别名、 内联跑命令、 esp、 停止、双 esp、 鬼滚等五十条技巧可收藏备用。 cloud code 拉开差距在于建立验证。清理回滚写作习惯, 想更快就减少重复动作和无效上下文,想更稳就写清验证方式,并保留刹车回滚能力。先用最适合的五条体验回不同。

i'm soppy 刚发布了一个新玩具 cloud manage agents, 只需要定义需求和目标,你的 agent 就 会在云端全自动帮你干完所有的活儿。传统 agent 开发中麻烦的部分,比如权限、沙箱、多 agent 调度、断线、重连等,都不需要你操心了,全部托管给 cloud 就 行了。 以前你要部署一个 agent, 如果你用到 n 八 n code 或 diffi, 你 都需要像拼积木一样去搭建这个 agent 的 工作流程,然后设置各种节点。现在完全不需要了,你只需要把需求提给 cloud, 然后坐等验收就可以了。今天这个视频我们会完整走一遍 cloud manager agents 的 全流程,带大家快速上手这个新玩具。第一步,我们打开 cloud 开发者平台,我们能看到一个新的模块叫 manager agents, 通过 krystal 这个板块,我们就可以快速创建第一个 cloud agents, 你只需要通过对话的方式跟 call 沟通需求,让他帮你创建即可。我们还能看到旁边多了一些预制的模板,如果你不知道从哪里开始创建第一个 a 准,就可以在这里找灵感和参考。我们直接给他安排一个任务, 我让他每天早上七点去 pradahan 这样一个产品的榜单上面,帮我搜索日榜 top 十的产品,提炼他的产品理念和核心功能。还有创世团队的信息生成,摘了之后发到我的飞书私聊, 同时我还给他提供了飞书 bot, 就 通过这个 bot 给我发飞书私聊,所以我给他提供了这个飞书 bot 的 基本信息, 然后我们点击发送,看一下它执行任务的过程。我们可以看到 cloud 先写了个 config 文档,这个文档的格式其实跟 agent skill 的 格式有点像,但是它不是 agent skills, 这里面包含了名字、 agent 使用的模型, agent 的 简单描述和 agent 的 系统提示词,通过系统提示词去规范 agent 应该怎么去干这个活。然后还有它使用的内部工具, 它的一个定时任务的设置的时间点,如果你使用到了一些外部工具,比如说 m c p 的 话,它在这里其实也会显示出来。如果你调用了 skills 的 话,这里也会有对应 skills 的 缩影。 那我们点击创建这个 agent 看一下实际效果。接下来这个 agent 已经创建完了,这个 agent 的 完整请求体内容已经写到这里了。下一步我们需要去构建环境, agent 需要在这个环境上面去跑,它才能去运行我们的任务。这里的 agent 会让我们去选择一个运行环境。由于我之前已经创建了其他 agent, 所以 我们可以直接选择已经存在的运行环境。接下来我们还需要去设置一个 session, agent 需要在这个 session 下面才能去执行这个任务,我们点击 start session 就 可以了。由于这里我需要通过 facebook bot 给我发消息,所以 facebook bot 需要知道我的一个 facebook 的 user id, 我们这里直接选择让他通过 facebook bot 直接去查询就行了,因为我已经提前授予了这个 facebook bot 查询的权限。然后他还问我们说这个 facebook 发消息需要 app secret 来提供 access token, 我 们可以直接跟他说,我前面已经提供过了,因为我前面在第一句的时候已经发了,所以我们直接让他去查前面的消息就可以了。 ok, 环境和 session 都准备完之后,我们可以直接 test run, 测一下这个 agent 的 实际效果。点击 test run, 然后这里会出现一个直接让我们去测试的命令,我们直接点击 send 就 可以了。 我们会发现左边是他的 session 的 一个介绍,右边是他 session 实际运行的情况。我们可以从右侧 delete 面板查看这个 agent 的 每一条工作日期,包括他怎么抓取数据,怎么获取我的信息,怎么去给我发消息,全部都展示在这里。你可以点击每一条记录去查看详情。 现在这个任务已经执行成功了,我们看一下实际效果。 ok, 我 们可以看到我的飞书里面已经收到了机器人给我发的日报消息,这个日报的格式、内容、质量都还可以。如果你想管理或编辑某个 a 准,就进入 a 准这个板块。我们查看其中一个 a 准的情况, 会发现分成两个板块,一个是 a 准的配置详情,另外一个是 a 准的筛选情况。 a 准的配置详情里面其实包含了每一个版本 a 准的实际情况, 比如说它的模型设了什么,它的系统提示时是什么,它使用了哪些 m c、 p 的 工具和一些其他的内部工具,以及它的 skill 使用了什么样的 skills。 如果你希望你的 agent 去执行某些 skills, 那 你就把你的 skill 喂给它就可以了。 第二个我们看一下 session, 我 们点击这个 session 看一下,会发现它呈现的是我们之前跑这个任务的时候的实际情况。 左侧是它的实际的运行日记,右侧是它的一个概览。最后我们来聊一下 cloud manage agents 这套体系的架构,我认为非常有意思。这套架构的设计哲学可以归纳为四个字,脑手分离。中间的哈尼斯是整个体系的大脑,他用 cloud 去做决策。 右边的 sandbox 其实就是手,这个手去执行任务,去跑代码。左边的 session 是 整个 agent 体系的记忆,通过记忆可以去恢复之前失败的任务。 上面的 toos 是 一个连接外部工具的协议层,通过 mcp 协议去连接各种外部工具。下面的调度器负责整个 agent 体系的工作流编排和控制。这里面最关键的是 hans 和 samos 大 脑和手之间的关系。 hans 和 samos 之间靠一套固定的接口规则进行通信。 hans 作为大脑,它不需要去了解 samos 这个手在做什么。 sandbox 作为手,他也不需要去了解 hans 这个大脑内部构造。所以当你想要去迭代大脑,升级 hans 的 时候, sandbox 不 受影响。当你想要去修复重建 sandbox 的 一些部件的时候, hansopig 在 介绍这个体系的新文章里面有一句话非常有意思, 他说 hans 不 需要知道 sandbox 是 容器,是手机还是宝可梦模拟器,说的就是这个意思。这个分离机制还有另一个好处,那就是每个部件内部出错了,它们可以独立恢复。比如大脑挂了, 它可以直接从 c 程序找到断点自己恢复。如果 sendbox 出问题了,它可以自己销毁重建,不会影响大脑的工作。其实 osopik 设计这套架构的出发点是怎么给大模型,这个能力还在不断进化,大脑造一副不用反复重建的身体外骨骼, 它的解法是把部件拆成独立的标准器官,然后通过接口协议作为动脉去连接这些器官,让它们进行有序协助, 同时能确保每一个器官可以独立升级、独立修复。今天分享就到这里了,如果你想了解更多 agent 的 前沿框架、实战经验和搭建技巧,请持续关注我们,下期继续拜拜!

兄弟们,你们要的 cloud code 大 师速成指南他来了,我自己做了一个这样的一个测试,就是我用斜杠 scares 命令去统计我的技能, 然后我用 cost 去看一下我用这条命令所花费的 token 是 多少,查询结果发现他没有花费任何的 token, 然后我再用自然语言的方式去跟 cloud code 进行对话,让他告诉我我目前有多少个可以使用的 scares。 查询结果出来之后,我再用 cos 的 命令去查看一番我现在这个交互自然语言的交互用了多少的 token, 它这里是以一千个 token 为单位的啊,所以说这里是零点零七五,那我们就会发现,当我们在 clock cos 使用中能达到同样的效果的情况下,使用斜杠命令比我们用自然语言的方式要省 token 的 多。 那么既然它这么好用,那么我就整理了一份整个关于 class code 的 完整的命令行手册。这里除了习惯命令之外,还有我们的快捷键和如何去拓展我们的工具,也就是 m c p 的 命令。 第四块就是如何去管 ai 的 记忆。其实 class code 的 这些资料哈市面上有很多,但是你真正要说如果完整足够系统的这种的话,目前还是没有的,如果大家有兴趣的话,可以把它当成我们一个使用过程中的速查手册。 第五块把我们去调用或者是构建 scale 或者 engine 的 效率直接提升了十倍。第六部分是我们 cloud code 总常用的配置,文件的一些配置几乎都在这里。第七部分,当我们没有进入到 cloud code 的 时候,也能够通过终端命令行的方式去给它下达命令。 最后第八块还有我们的高级使用的一些高级的技巧,比如这里控制大模型思考的一些高级的技巧,比如这里控制大模型思考了一些高级的技巧,比如这里控制大模型就变得十分的简单。

总结了几个在使用 cloud code 的 过程中可能会忽略的事实,或许能够避免你的误用。内容来自 cloud code 的 官方文档以及原代码泄露以后,业内很多大神的解读。 第一,中断当前的任务成本很低,并且不会丢失上下文。这归功于 cloud 所采用的流体架构和异步生成器。 所以如果你在 ai 运行的过程中发现问题,请干脆利落的按下中指键,而不是等待这个已知的错误结束响应以后再去修改。第二,对话是可以持久的,可以恢复,不用重新开始。大多数人打开 cocoode 会创建一个新的对话,这会导致之前所有的操作和上下文信息全部丢失。 你学会使用 continue resume 和 fork session 这几个命令,充分利用和 ai 对 话的过程中积累的记忆和学习成果。第三, ai 的 上下文压力可能比你想象的更严重,所以压缩上下文非常重要。 主动使用 compact 命令,不要等待系统自动压缩,以免丢失你所关心的上下文信息。压缩后继续对话比开始新的对话要更好。 可以使用 context 去检查你实际的上下文使用情况,获取按类别划分的实时细分数据。你还可以用 compact 加 focus on blah blah blah 告诉 ai 你 想保留的上下文重点是什么。第四,学会使用 cloud dot md cloco 会在你每次发消息的时候重新读取这个文档,所以你可以把你的架构、决策文件、规范、测试模式等一系列规则都放进去。很多人这个文档是空的,但恰恰这个文档是最能够提高你生产力的配置。下期聊聊剩下的。

每天学习一个 skill, 今天这一期看 pro, 他 不是单纯让 ai 挨骂,而是 b ai 在 穷进方案之前,不许轻易放弃。 remi 里给他的定位,很直接,让 codex 和 cloud code 工作效率翻倍,产出翻倍。 这个 skill 先盯住的是 ai 最常见的五种偷懒模式,包括暴力重试、甩锅、用户工具、闲置磨洋工,还有被动等待。如果你也受不了 ai, 只修表面问题就停,这个 skill 会很对症, 它有两种触发方式,自动触发和手动触发。连续失败准备说我解决不了或者把问题甩给用户时,它会自动介入,你也可以手动触发 clockcode 用斜杠铺啊 codex c l i 可以 用斜杠 prompts 冒号铺啊 p r 的 底层规则有三条,穷尽一切,先作后问,主动出击,而且失败会压力升级。从 l 一 温和失望,一直到 l 四毕业,警告重点不是情绪,而是 b a i 切换方案,读原码,查日记,并作完整验证。 瑞米里给了一个很典型的案例, agent kms 的 mcp server 加载失败。 ai 一 开始一直在猜协议和版本,手动触发斜杠破二之后, l 三检查清单被强制执行。 最后是逐字读错误,找到 cloud code 的 mcp 日历目录,再定位到注册机制,差异根音才真正出现。 我觉得这份文档最有意思的地方,不只是会给 ai 上压力,而是它给十三种大长口味都配了方法论,比如阿里篇追过程和复盘字节篇速度和数据驱动。腾讯是多方案并行,百度强调先搜再说。 所以这张图的重点不是玩梗,而是把不同团队的做事习惯,映射成 ai 调试时可执行的工作流。 readme 还放了实测数据,修复点数加百分之三十六,验证次数加百分之六十五,工具调用加百分之五十,隐藏问题发现率也加了百分之五十。而且它支持 cloud code code c l i cursor 和 vs code copilot 这些环境。 如果你的 ai 经常说建议手动处理或者修完表面问题就停,那普啊最有价值的地方就是把它重新拉回系统化调查和端到端交付。每天学习一个 skill, 我 们下期见。

彻底放弃 g r m 了,搞了一个美国的 mac, 然后买了一个 cloud mac pen, 然后做了一个代理回来。啊,这个闻起来就很纯, 怎么判断它纯不纯?你就问它是什么 id, 然后它这么回答的话就是官方的用那些代理的话,它就会变成是 q 或者其他的 id 反代理出来的。 其实用起来也没什么,只是用着用着会突然间断了,但是总体感觉还是比 gim 好。 gim 我 最后还是放弃了,它总会间歇性降至我现在的用量,根本就用不完,三十天用了 十亿多,但是真的很揪心。 gm 最大的问题就是用着用着它会这样子,连中文都会变成乱吧,所以没办法,我情愿花更多的钱。 为了不被封号啊,就是完全在美国那边去跑,然后在美国那台机器上面做了一个反弹,然后在这边去用,这样子就不会被封号了,安全的很。

如果你只打开过 cloud ai 的 那个网页,那我告诉你,你可能只用了它的三分之一。 在同一个订阅中, cloud 是 能用这三个产品的。今天花八分钟给大家讲清楚每个产品是什么,然后该用哪个。这是 cloud 的 三个产品,左边 cloud ai, 呃,就是网页版的,打开浏览器就能用,它的杀手锏是 project 系统, 这你可以给他一套一一套专属的指令,然后加一个资料库,然后 cloud 就 能跨对话,记住一切。然后目前呢, chat 的 gpt 跟 gmail 都没有这个功能, 它的应用场景就是我们日常使用的场景,只不过比普通的啊,传统的 chat g p gmail, 它多了一个机的系统,能成为你的私人的专属助理,而且能够逐渐的叠代的。然后中间这个是,呃, logical work, 这是桌面级的助理,它是装在你电脑上的,能够接管你电脑干活的 a 卷, 而且它连通过连接器连接了五十多个官方的软件,包括 word, excel, ppt 也非书,它是全球最强打工人,它的应用场景就包括你可以自动的做 office, 然后跨 app 的 一些任务啊,后面我会详细讲 啊。最右边的是 cloud code, 呃,它是装在电脑里的编程 a 卷,它的江湖地位现在呃就是世界第一, s w e 的 评分是八十点八分, 然后携带码,然后跑命令,然后多 a 卷啊,包括各种各样的部署的功能都可以用。目前呢,它是开发者和技术用户,还有 web 扣定玩家的首选。 我给大家讲一下。呃, cloud ai 的 杀手级武器啊, project 系统,这目前看来, gpt 和 jimmy 的 i 都没有做出来,它能这个 project 系统呢,能把 cloud ai 真正 变成一个私人知识库的核心,而且它可以呃设计很多 project, 它不是一个混杂的,你某项目可以设定一个 project, 然后你甚至可以把自己包装成一个 project, 就 把你说的资料喂给他,然后用全世界最聪明的大脑去给你指导啊,指点啊,都可以。 然后我详细讲一下啊。第一个呢,是啊, custom instruction, 这是制定的命令,就是你会你可以给这个 project 一 套专属的命令啊。 clod 在 所有的对话里都是遵守的他,所以你不用每次都解释你的背景,这就相当于你给这个 ai 配了一份岗位说明书, 就你不用像一个这个 chat gpt 一 样,每次都去跟他聊一下背景,才能干一些非常复杂的事情,你把这个直接就灌输,他每次跟你对话之前,他都会读这个 instruction。 然后第二个呢,就是 project knowledge, 它是整个项目的知识库,你可以上传 pdf 啊啊, word 啊, c s v 啊,还有 excel 啊, t x t x c 啊这些所有的文件。呃,比如说你可以上传 一个法律文本的知识库,各种各样的法律文本,因为这个东西很好头肯的,平时也也不需要去加载,所以你不能放在第一部分的 instruction 里面,你可以在 instruction 里面告诉它,你 碰到某一条法,那个法律之后,你去读这个呃 knowledge 里面的某个文档,这样就能非常精准的解决你的一些问题,而不是说很多有幻觉的东西就会产生。 所以这两个加起来呢,是一个跨对话持续的专属 ai 助手,而且它的 instruction 跟 knowledge 是 可以升级迭代的,你可以不停的更新,如果这个 instruction 不好用,你可以再迭代,或者说它的不够完善,你可以继续迭代,所以它会成为你一个未来越来越懂你,越来越专业的一个 ai 的 助手。 第二个是 cloud coworker, 定位,一句话就是把任务交给 ai, 你 去做别的,所以我给他起了个外号叫全球最强打工人。目前他有两个杀手级的能力,第一个能力是桌面级的接管 cloud, cloud, cloud ai 呢是对话级的,然后 google, 它是整台电脑都可以归它管,它能够直接读写你的文件夹,自动完成浏览器的操作,然后还包括快 app 的 呃多任务,都是可以的,它是一个真正呃能在你电脑上动手干活的员工。 第二个能力呢,就是它的五十多个连接器的生态,这都是官方的连接器,包括 word, excel 啊, ppt 啊啊 pdf 这些。然后第二排就是一些这个飞书啊 notion 呢,包括 driver 这些文件的系统跟沟通的系统。第四第三行就是 github 这些编程用的, 嗯,你用了 coork, 就 相当于你雇了一个能操作整台电脑,然后又能够懂你的打工人。 呃。第三个 cloud code, 它的呃地位是非常高的,它是全球第一的编程江湖地位,然后现在全世界顶级的 ai 玩家都在用它编程跟 ai 玩家都在用它,包括前特斯拉的 ai 总监, open ai 的 创始人,他之前是用八百分之八十的这个自己的编程,用百分之二十的 ai 卷,现在已经切换到百分之八十的 ai 卷,百分之二十的手动编程, 我,我相信现在这是他可能一个多月前说的,现在可能又提升了。然后包括其他的玩家, samuel wilson 呢, john king 呢,这些全球 vive coding 的 头部玩家都在用它。它的这个 s w e 的 评分,呃 cloud 的 真实评分是全球第一的,已经超越了 chad, gpt 还有杰瑞奈。 呃,我自己的使用呢,我现在已经开始把前面说的 cloud ai 的 一些 project 直接转移到了 cloudy code 里面,因为它,它通过某种逻辑,它是能把知识库转移出来。然后呃 cloud cloud code 的 这个逻辑也是能调用的。在一个项目文件夹里面 啊,记住三件事。第一呢,呃 cloud ai 呢,它是一个跨对话集系统,你可以使用这个 project 把呃 cloud 变成你的私人顾问或者项目经理,这个都是可以的。然后第二呢,呃, cloud coork 是 全球最强的打工人。呃,能接管各种各样的 word, excel, ppt 啊,有,它有五十多个连接器。 然后第三呢是 cloud code, 它是编程 ai 的 天花板, s w 百分之八十点八的分,大神也是亲自验证的。然后下一期呢,我会讲这个十五分钟呃, cloud code 的 小白入门。 嗯,欢迎大家关注我,我会持续更新 cloud 的 深度的实战内容,谢谢大家。

家人们,最近啊, ai 圈一波内卷, open cloud 小 龙虾刚火它没多久, cloud 直接坐不住了,它甩出了王炸反击!看完啊,我都忍不住感慨,现在这 ai 用电脑跟咱们真人都没区别了, 不知道你们有没有关注啊? cloud code 就是 刚更新了一个功能 computer use, 一 上线,评论区直接炸锅了。 第一条热评就说 asorbike 这次直接把 open klo 给干掉了,一点都不夸张啊。说实话,要不是 open klo 逼得紧, asorbike 也不至于这么快拿出来这么狠的这个升级,毕竟 open klo 它已经算是更因速度超快的开源项目了, 可跟大厂全力砸资源的迭代速度比啊,还是有点跟不上。那这次 cloud 升级到底牛在哪?简单地说啊,就是彻底补齐了 opencloud 没完善的痛点,直接靠界面操作,电脑 能够实时的截屏看屏幕的内容,然后模拟鼠标键盘操作,完完全全就和咱们平时用电脑的样子一模一样,一点都不生硬。 以前 ai 操作软件哎,得改 api 接口,弄 c l i 改造麻烦的很, 现在倒好,啥软件都能搞定,不管你是公司里那些老掉牙的企业管理系统,还是什么 photoshop, 视频剪辑这种专业性极强的创意软件,通通都能纳入 astrobok 的 操纵范围。哇,这一点真是绝了! 而且官方呢,顺带上线了两个超实用的功能,哎,就是正好戳中了一般用户的刚需。一个是远程控制,出门在外用手机发指令,他就能在你家里或者公司的电脑上自动干活,不用你守在电脑跟前。 这个对程序员特别好,特别友好,你不用大家集体办公了,随时可以开干。另一个呢,就是定时任务设置好了,你每天自动运行,你也不用去手动收收指令。 当然,好多人肯定还会担心一个问题,就安全,这也是小龙虾的一个大问题。这点呢,官方也想到了,他做了分层的安全设计,一点都不糊弄 cloud 呢,他会先调用咱们已经授权过的工具,哎,只有没有对应连接器的时候,他才会申请操作桌面的权限,而且也不用我们自己折腾权限配置,弄什么隔离环境, 哎,敏感操作,比如删文件,提交表单发消息,他都先哎弹个框让您确认,哎,咱们同意了他才会执行。 另外呢,官方还推荐安装在 dak 的 隔离环境里面,这样子呢,就从根源上降低了风险,哎,就非常非常的友好, 因为这个刀客啊,他毕竟,嗯,他是和你的操作系统是隔离的,就相当于在你机器上装了一个虚拟的操作系统那,嗯,那个龙虾呃也好还是呃 ar 也好,他没法透过这一层隔离,就非常安全。 目前这个功能呢, cloud pro 和 max 用户都能用上,把桌面端的 cloud 更新到最新版,配对好手机账户,在设置里开启 computer use 的 呃,权限就行了。 不过现在呢,还只有 mac os 能用 windows 和 linux 的 用户你也别着急,官方说了,他会很快快速迭代,很快就给安排。 不得不说啊, ai 的 这波发展速度真的是太快了,从只能简单的操作到完美的模拟真人使用电脑这么短的时间,一两个月时间,你们觉得这种 ai 操作电脑接下来会给咱们的工作生活带来多大的变化呢? 呃,您有什么想法?咱们可以来在评论区里好好聊一聊。哈哈,我觉着这个事吧,可能对我而言,可能最大的风险就是 talkin 要花好多,我不一定有这么多钱。哈哈,您呢?您觉得还有没有其他的问题,咱们在评论区里面聊一聊。