你有没有这种感觉, cloud code 一 开始特别灵,读文件、改代码、跑测试都挺顺,可聊到后面,他突然开始绕圈道歉,改错,再道歉,再改错,你会怀疑是不是模型今天状态不好?或者我刚才哪句话没说清楚? 你可以先这么想。很多时候,不是 cloud 变笨了,是他桌子上太乱了。 cloud 的 上下文窗口就像一张工作桌,你的需求,他的回复,读过的文件、工具,跑出来的结果,全都摊在这张桌子上。桌子大当然有用, 问题是,桌子大不等于桌面干净。一开始桌上只有三张纸,目标、代码、错误信息,它很容易抓住重点。但修着修着,测试日制来了, grip 输出来了,失败方案来了,你纠正它的话也来了。这些东西不一定没用,可它们会一起挤在桌面上抢注意力。 这里需要注意的一点是,上下文腐烂,不是突然坏掉的。他更像是漫漫滑坡。答案刚开始还能出来,语气还很自信,但越往后,他就越漏重点,开始附用刚才已经错过的思路。 尤其是写代码,很容易中招。第一,工具输出很大,一次搜索,一次测试,可能就塞进来一大坨文本。第二,编成本来就是多步推理,读结构,裁元音,写修复,再验证,每一步都可能把噪音带到下一步。 第三,也是最烦的,旧的错误历史会污染新判断,他上一轮走错了。如果你只是继续纠正,那那段错误路线还留在桌上。 所以 cloud 看起来像在听你说话,其实一边还在被旧纸条拉回去。那怎么办?先记住这句话,每次 cloud 回完话,你都不应该 只有继续问这一个选项,你有五个策略, content 又继续聊适合,桌面还干净,同一件事还往前走的时候, rewind 回到前面的岔路口适合他刚刚走错路,你不想让失败尝试继续污染后面。 clear, 换一张干净桌子适合,任务变了,或者你已经能用几句话重新交代背景 compact, 把桌面整理成该要适合,同一个任务还没完,但原始过程太臃肿了。最好加一句 hint, 告诉他重点留什么。 sub agent, 派一个临时同事去干脏活,比如读一堆文件,查一堆资料,最后只把结论带回来。 模型不是人桌子,也不是真的桌子,但这个策略对于模型来说够用了。不是所有的东西都应该留在主 section 里。 工程上你可以这样判断,如果接下来还需要这些细节,就继续。如果刚才走错了, rewind 如果换任务了, clear, 如果还在同一任务,但桌面太满。 compact, 如果只要结论,不要中间过程 sub agent, 所以 cloud code 越用越笨。很多时候不是因为窗口不够大,而是你把工作台当做了仓库。最后记住一句话,长上下纹不是记忆力,干净上下纹才是生产力。
粉丝45获赞596

今天 cloud code 自动更新完,会出现一个 api 四百错误,目前的解决办法就是直接在这个扩展里边去把自动更新给它取掉,然后回退到呃过去的版本,呃这里边去回退到一天前重启扩展以后 cloud 就 恢复了。

我们可拉的桌面端升级到最新版本后啊,第三方模型就加载不出来了,还会爆出这种错误,上上条视频呢,我说在模型 id 前加个可拉的前缀就可用了,但后来我发现哦,它默认且只能调用 deepsea v 四 flash, 那 这样一来呢, deepsea v 四 pro 我 们就没法用了。 这条视频呢,给朋友们分享一个最简单粗暴的解决方法哦,快的话五分钟就可以解决。我花了五分钟啊,让 codex 给我写了一个很轻的项目,现在啊,我只需要进入项目目录执行这条命令,那项目呢,就会在我电脑的本地启动啊,看它启动成功了。 那朋友们,这个项目啊,其实随便哪个工具都可以实现。我是给 cortex 说了这段话,然后他就帮我实现了。那朋友们如果想自己做这个项目,也可以用我这段话,当然也可以自己描述啊,反正都是大白话。等他开发结束呢,我们复制他给我们给出的命令,在终端中运行,让项目在本地跑起来就可以了。那 接下来呢,我们验证一下,我们现在打开卡拉的桌面端,那模型这里呢,我选择 v 四 pro 一 兆,这个呢,是我当前 deepsea 的 talk 用量,现在我给他选择一个我的测试项目,给他稍微大一点的工作量吧,走你。然后呢,我们顺手可以看看配置页面发生了什么变化,我现在打开配置页看 getaway bios u r l 这里变了啊,上面这里呢,现在用的不是我们以前默认的那个了,而是它直接帮我们创建了一个 proxy。 现在我们再回过来看 deepsafe 操作的消耗,看 pro 消耗了五毛六,这样就起活了。

前两天看到有个人评论说他之所以不用 cloud code, 是 因为每次关闭窗口以后,聊天记录也没了,下次打开只能从头开始聊。 实话实说,作为世界顶尖 a 型的工具,怎么可能会犯这种低级错误呢?哈喽,大家好,我是专注用动画科普 ai 的 阿 k, 今天这期视频我想给大家仔细的分享一下,想要用好 c c 应该掌握哪些技巧。本期视频全程无网,可放心观看,走你! cc 其实一直有两个版本,大家比较常见的是 c l i, 也就是命令行版本,还有一个是在 g u i, 也就是图形界面的桌面端,这两个版本一直是并行开发,针对的也是两波完全不同的受众。 简单来说,桌面端提供了图形界面支持,更直观的代码对比和任务规划面板,适合偏好视觉化反馈的朋友。但我更建议大家尝试 c l i 版本,也就是我们今天分享的主角。 原因在于 c l i 版本的运行效率更高,对系统资源的占用非常低,更关键的是它在自动化集成和插件扩展方面有着天然的优势,能更方便的接入各种第三方开发工具。 在环境准备上, windows 用户只要提前安装好 node js 和 get 即可。不会其实也没关系,这里我教大家一个携修功法,那就是用一个有免费额度的 a 键的工具,比如翠,让他来帮你安装。那接下来就是 c c 的 安装环节。首先,由于 astropik 对 npm 命令的气用,以 以及新的 i r m 命令,国内使用百分百会报错,现在能用的官方命令只有这一条了。实测的时候,也许是因为我的网络问题,整个过程比较慢,但可以顺利完成,所以如果大家碰到跟我一样的情况,请保持些许耐心哈。护住它的方式很简单,我们在任意位置点击鼠标右键,选择在终端打开, 这样我们就能看到一个黑黑的命令行窗口,接着我们输入 cloud 并按下回车就可以了。但是第一次启动 c c 时,大家一定会碰到登录问题。好,这里就涉及到一个非常重要的知识点了。首先, c c 按道理来说是必须登录,而且只能用它们自家的模型,但是 s o p 这个公司吧, 懂的都懂,所以我推荐大家使用 cc switch 来给 cc 配置国产墨烯 a p i 不知道怎么用的话,问豆包或者 deepsea 都行。 ok, 那 相比随便找个地方呼出 cloud, 我 其实更推荐在指定文件夹里呼出,什么意思呢?比如我们现在要做一个测试项目,那我们就在非系统盘新建一个文件夹,并命名为 test。 为什么要用英文呢?因为这些编程语言都是国外开发的,他们开发的时候是不会考虑中文规范的,所以用中文名的文件夹或者文件夹路径中出现中文是有可能报错的。大家一定要养成用英文命名的习惯哈,哪怕是拼音都行。 进入 text 的 文件夹,然后在空白处点击鼠标右键,选择在终端打开。那在这里呼出 cloud 和在桌面呼出 cloud 有 什么区别呢?区别就在于在这个文件夹内的命令行窗口呼出 cloud, 它就默认为绕你这个文件夹里的项目来进行开发了。也就是说咱们人为的给它规定了行动范围,有利于我们接下来用自然语言给它下达开发指令。 达到这一步,其实也就意味着可以让他干活了。但如果想要更加自如的操控,他还得了解一些常用命令。首先他有三种常用模式,第一种是默认模式,主打一个稳健,每一步改动他都会停下来问你,你点头同意他才动手。 第二种是全自动模式,不问不看,直接开干,效率最高。第三种是 plan 模式,这就是只动嘴不动手,他会帮你分析逻辑出详细方案。 而切换三种模式的快捷键是 shift 加 tab。 我 个人比较推荐新手朋友在第一阶段先用 plan 模式来规划项目结构,等全部逻辑确认清晰以后,再切换模式去落地。注意哈,这里虽然是全自动模式,但实际上在涉及很多安全性敏感的操作时,比如要执行一段复杂的终端命令, c c 还是会对你进行询问的。 这时候屏幕上会出现三个选项,第一个是同意他的这一次操作,第二个是同意并授权接下来的所有这类操作都无需再询问。第三个是拒绝,一般情况下,如果你信任他生成的方案,选第二项就行。 然后是视频开头说的那个聊天记录的问题,其实我们只用输入斜杠加 resume 并回车就能看到一串聊天记录列表,选择你想要的那个,就可以无缝衔接到之前的聊天内容中了。那如果我们在项目开发的过程中执行了一段效果不尽人意的操作,之前的聊天内容之前 也可以把它理解为后悔药,当然,项目可以回退消耗的 token 肯定是退不了的哈。最后还有两个重要的命令,分别是斜杠 compact 提炼并压缩上下文和斜杠 clear 清空上下文。因为有研究表明,当上下文窗口占用超过百分之五十的时候, c c 的 执行质量就会降低。 我们需要养成当项目完成阶段性功能后,压缩或清空上下文的习惯,从而保证项目顺利开发。那具体怎么监控上下文消耗情况,以及如何在清空聊天记录后,还能让 c c 知道项目开发进度呢?这个咱们下期视频细聊哈。 掌握了前面说的这些,其实就足够支撑我们顺畅体验 c c 的 强大了。但如果你想要真正把它用到得心应手的程度,就必须深入研究一下它的三个境界功能。第一是 skill, 它是给 ai 准备的标准化作业手册,能让它在执行特定任务时输出的更加稳健且有条理。我之前做过两期视频详聊它,感兴趣的小伙伴可以去看看哈。 第二是 m c p, 它作为一个通用扩展协议,能让 ai 彻底突破本地环境的局限,去调用更广泛的外部工具。这个咱们下期视频也会详聊。 第三是 hux, 它是一套自动化的触发机制,能帮你实现完全无感化的开发工作流。那如果你想更系统的学习这些实操, get 上有一个开源的高新项目,它是专门教你如何上手 c c 的 纯干货教学仓库, 我自己也在用它学习哈。 ok, 那 以上就是本期视频的全部内容了,我是专注用动画客服 ai 的 阿 k 无惊无险又到六点下了个班。

由于今天 cloud code 更新的问题,导致出现这个报错,教一下大家怎么去更改,怎么去把它恢复,我们到拓展里面去搜 cloud code, 把自动更新给取消掉,点击向下的箭头安装特定版本,我们回退到一百四十五, 等它安装好, 点击重新启动拓展,这样就可以了。 我们输入 e 的 话,如果它有点慢的话,我们重启软件再重新打开, 现在就可以正常使用了。 好的,谢谢大家。

大家好,我是安逸,今天来聊聊 cloud code 架构里的错误恢复机制,教你把报错就崩升级成先判断再处理。主页有更多技术干货,感兴趣的朋友可以点个关注。好,咱们直接进入正题。 当你的 agent 开始真正做事的时候,问题就来了,模型输出写到一半被截断,上下文太长,请求直接失败,还有网络抖动导致 api 超时。很多初学者以为这是 agent 不 稳定,其实问题不在模型,而在于缺少恢复机制。这张的目标很简单,把报错就崩升级成先判断错误类型,再选择恢复路径。 先搞清楚三个概念,第一,什么叫恢复?不是把错误藏起来,而是先判断是不是临时问题,是的话就有限次补救,补救失败再明确告诉用户。第二,重试预算就是 最多试几次,比如续写最多三次,网络重连最多三次,没有这个预算,程序就会无限循环。第三,状态机,简单说就是一个东西会在几个明确状态之间按规则切换,主循环从普通执行变成了正常执行。续写恢复,压缩恢复、退币重试,最终失败,至今中断。 教学版只需要区分三类问题,第一,输出被截断,模型还没说完,但 tiktok 用完了,对应续写恢复。第二,上下文太长,请求装不进模型窗口了,对应压缩恢复。第三,临时连接失败,网络超时,限流,服务抖动,对应退避重视。这就是最小但正确的恢复模型。接下来我们逐条展开, 先看续写恢复。这个问题的本质不是模型不会,而是这一轮输出空间不够。最小做法是追加一条续写消息,告诉模型不要重来,不要重复,直接从中断点接着写。这里有个关键点,续写提示必须写清楚。很多初学者只写一个 continue, 模型往往会重新总结或重新开头。正确写法是, output limit hit continue directly from where you stopped do not restart or repeat。 同时要控制重试次数,最多是三次,超过就直接报错。 再看压缩恢复。很多人以为压缩就是山历史,其实不对。压缩是把旧对话变成一份仍然可以继续工作的摘要,压缩后至少保留当前任务是什么,已经做了什么,关键决定是什么,下一步准备做什么。 另外特别重要的一点,压缩后必须告诉模型,这是续场,否则模型可能会重新向用户提问。最小写法是, this action was compacted continue from the summary。 然后附上摘要内容。 最后看退币重试。退币的意思是,别立刻再打一次,等一小会再试。为什么?因为这类错误往往是临时拥堵,比如刚超时,刚限流,服务器刚好抖了一下,如果你瞬间连续重打,只会更容易失败。退币策略通常是指数增长加随机抖动,比如第一次等二秒,第二次等四秒,最多等三十秒,再加上零到一秒的随机抖动,避免多客户端同时重试,造成踩踏。 讲完三条路径,再说说新手最容易踩的坑。第一,把所有错误都当成一种错误,该续写的去压缩,该等待的去重试,该失败的却无限拖延。第二,没有重试预算,主循环可能永远卡在继续继续继续。 第三,续写提示写得太模糊,模型不知道,不要重复。第四,压缩后没有告诉模型这是续场模型,会重新提问。第五,恢复过程完全没有日记,看不见主循环到底做了什么?建议打印 recovery, continue back off 这样的日记方便调试。 来回顾一下这张的核心错误,恢复不是简单 try 或 accept, 而是系统知道该怎么续下去。记住这条主线错误,先分类恢复,再执行失败,最后才暴露给用户。 三条最小恢复路径截断后续写上下文,过长后压缩再试请求抖动后退避重试。理解这个框架之后,下一张我们进入任务系统,把 to do 升级成带依赖关系的工作图。今天的内容就到这里,觉得有用的话记得关注我们,下期见。

用括号扣的啊,很多人一上来就会踩坑。那今天收五个最常见的。第一个,指令太模糊,帮我修复登录 bug。 那 到底报了什么错?附件步骤是什么?你想要什么结果?那 cloud 的 不是你肚子里的蛔虫啊,你给他信息越少,他猜的越离谱。 正确的做法是啊,把文件路径、报错,截图、日制全甩给他,再说清楚附件的步骤和你期望的结果。你喂的越细啊,它输出越准。第二个,不用 cloud 点 md。 cloud 点 md 是 什么? 就是在你的项目根目录下放一个叫 cloud md 的 文件,里面写上你的项目背景,技术栈,编码规范。那 cloud 的 每次启动的时候都会去读这个文件,没有它啊, cloud 每次都要重新去参与这个项目,到底是干嘛的?有了它,一上来就能够进入工作状态,很多新手压根不知道有这个功能啊,但其实它真的很好用。 第三个,一次性让 cloud 改太多的东西,有人一上来就有一个超大的需求,让他一口气重构整个项目,然后呢?改着改工了,那你都不知道是哪一步出了问题。那正确做法是啊, 把大学九拆细,改一点验一点,每次改完让他帮你提交代码保存进度出了问题啊,你还可以回滚。那第四个,改完不验证,这个坑最多人踩啊。 卡拉扣的改完不代表他改对了代码能跑,也不代表逻辑对了,有时候他还会偷偷影响别的功能,你可能都不知道。所以啊,一定要让卡拉扣的帮你写完测试并验证,验证通过了才算完。 第五个啊,不管你对话长度聊太久,对话越来越长, cloud 的 输出质量就会下降,他记不住前面说过什么,或者会记混。那怎么办呢?用两个命令,第一, compact, 压缩历史对话, 保留关键的信息,减少上下文的占用。第二, clear, 直接清空上下文,从零开始。那任务做完了,最好开个新的对话,别在同一个对话里面聊太多的东西。那这五个错误啊,你中了几个呢?欢迎在评论区聊聊。

新志愿导读, cloud 深陷角色混淆 bug, 分 不清自身话语与用户指令,掌上下文呈降至重灾区。近期 anthropopy 旗下 cloud 爆出严重角色归因错乱漏洞,模型无法区分自身输出内容与用户真实指令, 百万级掌上下文场景故障频发,从普通对话一场演变为生产级安全事故,重创大模型常温本可能性与商用安全性。 该漏洞并非普通 ai 幻觉,而是底层角色边界失效。长对话、超长文档处理时, cloud 会把自身生成语句、内部推理内容误判为用户下达指令,自主执行操作,并反向归救用户。开发者实测中,仅文档较对任务 模型就擅自发布错误文稿、篡改代码配置、终止付费服务进程,多次拒不承认自身错误。长上下文窗口越大,故障概率越高。 cloud 主打百万 token 超长处理优势,如今反而沦为降智重灾区。上下文堆叠加具发言溯源混乱,模型逻辑判断全面失真,问答偏离本意,指令执行错乱,上下文记忆崩塌,大幅降低办公编程、文档处理实用效果。 应用危害较为致命。接入代码、数据库、云服务等高权限场景时,角色混淆直接引发越权高位操作。 已有企业案例显示,模型误删核心生产数据与全量云端备份,造成不可逆业务损失。同时漏洞易被提示注入利用,泄露隐私,蜜月生成恶意指令,突破安全对其防线。 此外,漏洞间歇性复现,难以排查修复,严重影响企业 ai 落地智能 a 阵度数。多轮长绘画协助溯源审计底层逻辑。 业内警示,长上下文扩张不能牺牲角色边界与指令权责区分,大模型安全溯源机制急待全面升级,否则商用落地将持续面临失控风险。

给他分享十一个技巧,让 cloud code 的 成功率翻倍。首先是应对 ai 幻觉啊,就是我们遇到一些幻觉问题的时候,可能是 ai 啊,陷入了一些错误的一些解决思路啊,就像我们刚刚那个,它一直报错,一直连接不上, 那可能不是网络的问题了,可能是你本身这个对同一个问题给出解决方案越来越复杂了,跑不下去了,或者说一些头肯管管理啊, 超过了上下文的一些限制了,所以他永远永远是报错的啊,那这个你再怎么弄下去的话,也是浪费时间,那你就得果断去做一下可令把大家绘画清理一下,重新来跑啊,这样效率还快一些。然后第二块的话就是版本控制啊,是生命线。 这个时候啊,是我们做好版本控制的话,其实是一个良好,可以具备一个良好的一个习惯啊。然后 比如最佳实践,我们希望每一次提交都是一个完成一个小功能去提交啊,就我之前一直强调的,不要让 ai 一 次性做太多事情,完成一个小任务的话就提交,去做一个推送,那确保每一次迭代功能完整性啊,就是尽量不要提交太多内容,不要生成太多内容 有意义的提交信息啊,就是描述让 ai 去写清楚这个到底做什么改动,有没有什么问题,然后以及它的一个分支策略是怎么样的,为每个新功能创建一个独立分支, 为重要的版本去打标签。然后我们推荐的一个工作流是这样的,那这套工作流的话,大家可以去把它整合到 啊, cloud code 它的一个就是那个命令里面去,或者是整理到 cloud 的 整个 md 文件里面去,把规范给它列好。那以后这个 git code 跟 githop 那 个插件协助的时候,就按这套工作流给你来做一个处理,把我们规范两个都定下来。这样的话,按照这么一个标准的工作流去做的话,整体我们啊出问题的概率就会小一些。然后可以试一下啊, 帮我打开这个页面,看一下这个效果啊。 然后计划模式的话,就是,呃,大家比如说你只想做计划,不想生成代码的,你就可以切换到这个模式,用这个艾特加 m, 大家看左下角这里面啊, 这个模式就是计划模式啊,艾特加 m 快 捷键切换到这个模式啊,拍,哎,是一个百叶窗的效果吧,但这个百叶窗效果是做出来了。 嗯,这个就是整个协助的一个过程。这个 plan 模式主要是用什么呢?它主要是用来去生成一些计划啊,就是我们切换到这个模式的话,首先,哎, 你可以说一个需求重构用户模块,提升查询效率啊,比如说我们就把这个提示加上,让他在这个洛伊这个模块下面重构用户管理模块,提升查询效率和查询性能。那但是我们前提啊,大家看啊, 你要退出去啊,这里我们先切换到计划模式啊,切换到计划模式再来跑这个, 那 ai 就 会输出类似的计划。首先它会去分析分析现有的一些情况,你看分析现有用户管理模块的一些结构啊, 识别出查询性能、评级点有哪些设计数据库锁影优化、方案优化、 mybidis 查询逻辑添加缓存机制重构、 service 层业务逻辑 优化、 control 层响应、性能测试响应啊,就是这个里面的话,就是我们他是按照一个做计划的方式给你,把计划给你输入出来。 关键点的话就是我们要仔细去审查一个计划,确保方向的一个准确性。因为 ai 给你的一个计划的话,可能会有一些误差啊,跟你实际想做的一个内容的话可能会有一些偏差, 我们需要确保方向的一个正确,然后可以要求 ai 调整或者是细化某一些步骤。 第四块的话就是大家在开始编码前,先让 ai 编辑详细的产品规格说明书,好的文档的话是成功的一半。 那这个产品规格说明书里面可以包含什么内容?第一块的话是这个功能规格啊,就详细的功能描述,加上用户故事和使用场景,再加上输入输出定义、边界条件处理等等。技术规格的话,比如说技术架构、 数据模型、 api 接口规范、性能指标等等啊,实施细节就是开发步骤分解、测试策略、部署方案、规范计划等等。 那下面就是一个我们去做需求文档啊,做一个定义的这么一个处理啊, 这个就是我们在开发的时候一定要把这个需求文档写清楚,那 ai 编码的时候参考我们这个需求文档去做啊,这样的话它出来的效果的话就会好一些,比较匹配我们的一个要求。 那大家可以单独的在这个下面建一个 word 文这个文档啊,先建一个文件夹,叫 docs fox, fox 下面建一个这个文档啊, requirements 点 md 文档, 然后把这个文档新的内容啊加进去, 然后让 ai 帮你去 参考这个文档,帮你去做一个需求开发啊。 嗯,刚刚那个优化是做什么优化来着?用户管理模块的优化啊,这里我们让它自动去优化吧。 好,然后这个计划就这里就很简单啊,就是你让 ai 参考你这个 docs 下面的一些需求文档,帮你去做一个开发啊。然后第五块的话是建立这个项目的一个记忆的规则, 那这个的话就是我们要充分利用 cloud code 的 一个本地配置文件啊,那个配置文件我之前也讲过很多次,就是这个你写的越好的话,其实让 ai 去阅读我们的需求啊,比如说你把代码规范 呃, get 规范开发规范个人编号写好的话,整个它生成代码的呃风格就会比较偏向于那个。所以我们现在在这个下面可以建一个文档啊,建一个文档叫 cloud cloud, 点 md, md 文件啊, md 文件这里我们把这个拷进去啊, 就他会按照你这个项目的方式去规范的方式去开发啊,然后全程啊,我们可以使用中文交流跟文档啊,同样的也是修改 cloud md 文件, 把这个啊所有的语言规范啊,比如说这里复制一下,把这个语言规范也要求一下,所有的对话跟文档都使用中文注式,也使用中文错误提示也使用中文 文档,使用中文 markdown 形式,就是把这个语言给改一下,然后以及命令行形式。好处的话就是可以降低理解成本,避免语言输,切换它的一个认知负担,更准确的去表达需求,方便团队的一个协助。 然后就是我们啊,我比较喜欢用的一个叫免授权模式啊,这个就是可以提高工作流畅度, 当我们的一个代码仓库已经有 get 管理的时候,且没有敏感内容的时候,大家可以使用这个 bypass 啊,也就这个优乐模式去提升我们的一个效率啊,就不需要授权了, 那并且是异步任务执行的更流畅的工作体验,接近于完全自动化。但是风险的话,就是 cloud 可能会在 啊你未预期的文件里面去做修改,也就是少了一个人为的检查的话,他可能会把你的代码改出问题出来啊,会有这个风险,点赞 可能会执行一些系统命令啊。建议的话只在个人中项目里面去使用,重要的项目的话一定要做好备份啊,就是改了之后没关系啊,就大家一定要去做一个什么呢?做一个 check 啊,就你认为做一个审查,如果他改的有问题的话,你就给他要还原一下,改到没问题你再推上去 啊。所以说这个模式大家一定要分情况去用啊,不是所有场景都能用,要用到啊,我们在改一些比较重要的内容的时候, 我一般建议还是用手动模式会比较好一些啊,因为出了问题至少有一个确认过程,你能够及时发现,如果全自动的话,万一啊你要是没去 check 有 遗漏的话,这提交上去的话,很有可能就是一个 bug 啊,这一定要注意。 然后我们要确保有完善的 get 的 一个备份,就大家即使改坏了也没关系,我们要能备份还原啊,定期的去检查 cloud 的 一个操作日期,发现异常的话立即终止, 所以这一点非常关键啊。然后第八点的话,我们要去多用可令及时清理上下文,保证上下文的一个窗口的清洁是提高效率的一个关键点。 清理时机的话,就是完成一个独立任务之后,切换到不不相关的一个新任务,发现 ai 开始毁消概念啊,就是我们一旦发现 ai 开始啊,有点胡说八道了,有点偏离方向了,你就赶紧要清理一下绘画了,说明它已经话题已经聊偏了, 那清理策略的话就是好处,可以提高 ai 的 响应速度,减少无关信息的一个干扰,避免上下文的一个溢出,保持对话的一个专注度。 好,然后第九块我们可以加入一些审核的工作流啊,就是我们要去建立高效的 ai 辅助代码审查流程,确保代码的一个质量。 三层审查模型,第一层功能验证大概要花百分之三十的时间,运行代码,测试功能是否正常,检查是否满足需求,验证边界的一些条件。 然后第二层的话是 ai 自审,大概要花百分之二十的时间, ai 通常能发现一些性能优化的机会,代码重复的一些问题,潜在的一些 bug, 不 符合规范的一些地方。 第三层人工审核要占到百分之五十的时间,这个我们要重点关注业务逻辑正确性、安全性的一些问题,包括代码可维护性、架构合理性, 以及一些审查清单与说功能是否完整,有没有性能问题,错误处理是否完善,有没有安全漏洞,代码是否易于理解?是否符合项目规范 啊?然后第十点我们要去合理设定 ai 的 一个参与度,不要期望 ai 生成百分百的完美的代码,合理的期望能够带来更好的体验。那 ai 擅长领域是有很多,但是不擅长领域的话也有很多啊, 那他擅长就是样板代码生成, cud 实现,常见设计模式,应用测试,用力生成 文档编辑,代码重构。那需要人为介入的领域就是复杂的业务逻辑,角色, ui 的 设计啊,一些细节的像素级的调整,特定的性能优化,架构级别的设计决策由外部系统的一个特殊集成, 这个就是架构师的这个工作的话,他还蛮没有完全替代,因为他对你业务的一个理解肯定没有你那么深,他只是对一些通用的技能这一块可能掌握的比较深而已。 最佳的一个写作模式,让 ai 完成技术框架啊,实现用户管理的一个 cud 接口,人工调整业务逻辑, ai 完成测试,修改了代码,添加单元测试啊, 就有一些让 ai 来做,有些人为来做,然后让 ai 最终来做一些测试啊,这样就是 一个比较好的一个写作模式,然后效率最大化,就是我们首先要考虑到啊, 一个及时止损,不要在细节上死磕,发挥各自的一个优势啊,就是 ai 跟我们啊,这个时期的开发人员,他们都是有各自的一个优势的, 就是它是可以互补的,可以保持灵活的一个协助的。然后最后一点是要了有良好的架构跟命名的重要性,清晰的一个代码结构的话和命名规范可以显著提高 ai 的 一个理解能力以及代码的一个生成质量。 那么命名规范这一块的话,就是我们在一个实际项目中,我们发现前端部分仅用了十分钟就完成全部功能,这后端就耗费了两个小时。 深入分析的话,发现是后台某些地方概念比较模糊,不同的功能使用了相同的命名,导致 ai 产生理解方面的一些偏差啊,这个是就是一些细节地方啊,我们需要完。

万万没想到, ai 开始自己检查自己,不再骗你了。就在今天凌晨, anstopip 发布了 cloud ops 四点八,一个 prompt 就 能让 ops 四点八生成像素闯关游戏。 这里是 ai 风向标,带你了解 ai 行业最新动向。先说为什么,这次不一样,以前你让 ai 写代码,它最擅长的不是写对,是嘴硬。明明有 bug, ai 还能一脸自信告诉你已经完成了,绝对没问题,可以直接运行, 结果一运行就报错,你指出错误,他就道歉,然后继续错。就这样反复循环,你最后不知道是在用 ai 还是在哄 ai。 那 oppo 四四点八就专门整治了这个毛病,代码漏洞蒙混过关的概率比上一代低四倍。 cloud code 的 负责人 boris charney 说, oppo 四四点八遇到不确定的地方,会主动告诉你,我没把握,然后继续查,而不是给你一个假装完成的答案。这个变化对开发者来说,比任何跑分都值钱。 更有意思的是,在跑分表,终端编程机准 terminal bench 这一项, opus 四点八得了百分之七十四点六, gpt 五点五得了百分之七十八点二,四点八输了。 但 antropic 没有删掉这个数据,反而把 gpt 五点五的百分之七十八点二加粗标量,主动给对手打了高光。 club 是 在用行动证明这次说的更诚实,不是营销。再来看看实测案例,有人用 unity 六配合 opus 四点八 写了两个 prompt, 第一个跑了十五分钟,第二个跑了四十分钟。五十五分钟后,一个 minecraft 风格的完整游戏出来了,画面逻辑、关卡全齐,有工程团队直接拿它上了超大型任务,把编程语言 bun 从 zig 整体移植到 rust, 七十五万行代码,十一天完成测试套件通过率百分之九十九点八。 这背后靠的是这次同步发布的 dynamic workflow, 它可以在单个任务里自动跳起几十到几百个并行子智能体,分头干活,干完先自己验一遍再交给你, 相当于几百个工程师同时在 review 同一份代码库,还有两个对普通用户很实在的更新 oppo 四点八,思考强度现在可以手动调了,从低档到最高档自己选,而且免费用户也能用。第二个变化更直接, fast mode 做到二点五倍速度,价格只有上一代 fast mode 的 三分之一,速度涨了,价格跌了,总定价没变。 而就在同一天, antropica 还官宣了新一轮融资,估值达到九千六百五十亿美元,正式超过 openai, 年化收入已经突破四百七十亿。下一代模型 mitos 也会在未来几周内向所有用户开放。 当 ai 越来越像一个真正的团队,你有没有能力把你的需求说得足够清楚?上次让 ai 帮你干活,是因为他真的干好了,还是因为你懒得再跟他争了?评论区说说你的感受体验。

大家好,今天我们讲一下格拉库的一些使用技巧,内容主要是系统的讲一下怎么配置,怎么沟通,怎么管理绘画,然后怎么规模化的使用它,还有就是一些常见的坑和闭口指南。首先让我们先回顾一个认知,就是格拉库的跟普通聊天机器人有什么不同, 普通的应用流程工具呢?就是你问他一个问题,他给你一个答案,然后你自己去选代码。但是格扣的是一个代理式的编辑工具,你只需要描述你想要什么,他会自己去读你的代码,然后运行命令做出修改,然后验证结果让你从一个执行者变成了一个导演。 我们要能够认清自己角色的转变,不然的话你就很难用好它,做不到真正的高效。 ok, 那 我们再回顾一下格蔻的做的四件事,主要有哪哪四个?首先就是他要去读一些文件,然后理解你整个项目的结构,然后呢他是去要做一些命令的运行,然后做一些构建、测试,部署 这些操作。然后呢是去直接去动手改你的代码,然后再去迭代,修复、验证,直到把最后的功能完成。 那这一个功能的完成的一个工作的流程呢,其实都围绕一个核心的约束展开,那就是上下文窗口,你可以把它理解为 cloud code 的 一个记忆容量,在我们所有的交互的 过程中,所有的对话,还有获取的文件,还有命令的输出,都会在这个上下文里面有包含,所以说这个窗口会被填充的非常的快, 你的一次调试或者是一次深入的探索,可能就会消耗几万个偷看,所以当窗口快满的时候,他会去做一些自动压缩。这个我们上期有讲到他会忘记一些东西,可能你最开始给到他的一些命令,他都会 丢掉了,然后会犯一些比较低级的错误。这就是我们为什么大多数人都会觉得这个他用着用着就越来越蠢, 其实就是因为你的上下文被污染。那我们接下来看一下我们有哪些手段可以尽量的让我们的工作更高效,然后更符合我们的预期呢? 首先我们先看第一个,这也是官方里面说的一个最容易得到一个高回报的一个手段,那就是我们要去做一个验证的一个闭环。 首先如果假设我们先去让他写一段,写一段代码,然后他会写出来一个嗯,你看着还可以的代码,但是你如果用的时候有可能就会出 bug, 或者是说变异,这就不过 那你还要再回头去检查,然后还要再跟他说,哎,你错了,然后你又告诉他,嗯,再再生成,那可能迭代几次,他又会出其他问题。这样呢可能你你的上下文就会慢慢的变得非常杂乱,所以最好的一个就是我们在 嗯下发任务之前就给他一个完整的验证。我们这是看一些例子,比如说我们想实现一个验证邮箱的一个函数, 如果我们直接这样说的话,那可能他就会随机的去写一个函数出来,那你可能需要的一些呃功能他并没有帮你完成。所以说我们最好是直接让把一些测试用力定义好,然后让他直接自行的去测试, 这样呢你实现出来的一个东西可能才符合你的预期。还有一种就是说啊,如果说是一些可说话的一些 ui 的 验证呢? 我们也不要去只是说粗略的描述一下,比如说这个让仪表盘更好看,其实更应该是去把你的截图粘上去,然后跟他讲你的两张图有什么问题,然后你更想去做哪一些效果出来,就是详细的描述一下。 还有一种就是 cloud code, 他 会经常犯的一个错误,就是规避掉根音,假设你去构建失败了,他可能就会去帮你啊规避掉这个构建,但是并没有从根本解决问题,所以我们遇到这种问题的时候,一般是把错误的 log 给到他,让他直接去修复,而不是去压制这个错误。 ok, 那 我们大概总结一下这个三个三种验证方式吧。第一种就是说我们要去做一一套测试套件,然后让他去跑一个单元测试,如果全都过的话,那就代表他完成了。还有一种就是涉及到图像啊,或者是 ui 这样的改动, 然后可以去做一些截图的对比,然后还有一种就是利用一些命令行的工具去做一些闭环验证啊。这里面下面我们总结出一个话术的模板,那就是说我们实现某某功能,然后测试用力是什么,然后实现后要运行什么命令,然后确保什么什么的一个标准,然后最后 失败就分析修复,直到全部通过这样的一套流程下来的话,你就会一个是很少去参与到他的工作流,还有一个就是呃,上下文不会被你们的这种经常的一个交互所污染,还有一种就是这样给出来的东西质量和鲁棒都很高。 好,我们接下来看下一个手段,就是也是官方推荐的一个工作流,就是我们先去探索,用 model 模式去探索,这个时候对于你不熟悉的一些工程 是比较好友好的,因为他只是去读你的代码,他不会去改你的代码,这个是非常安全的。还有个就是他会让他他走完之后,你让他给你出一个详细的规划,然后你去用 ctrl 加 g 的 这个快捷键, 可以打开他生成的这个规划,然后看一下是否符合你的预期,你是可以再编辑他的。然后呢这个时候你再切回到我们的普通模式,然后让他按这个刚刚我们做好的规划去编码,然后加验证,这个时候你再出来的东西的质量就会相当要相对高一些。 然后呢我们可能就是涉及到一些提交了,就比如说 get 啊这些代码提交,所以他每个阶段他是怎么做的呢?首先就是他会去探索, 那我们切到 plan model 的 时候,然后让他去读你的某一个工程下的目录的一个代码,然后规划呢,就是说你想要实现一个什么功能,然后让他创建一个计划,然后我们再去编辑这个计划,看他是否符合我们的一个预期。然后第三个呢就是切回到这个普通模式, 然后他会去做一些呃运行啊,或者写代码,或者修复一些 bug, 然后最后还是去提交。 ok, 那 我们什么时候用这个规划,什么时候不用呢?比如说如果说是一些你也不知道具体怎么做,或者是涉及到很多个文件,还有就是你有一些不相关的代码也不熟悉, 所以说这个时候可能这个规划的这个会更好一点。那比如说你对这个项目很熟了,然后你的一个需求啊或者是功能你都自己很清楚,那就不需要做这个规划,然后直接你就跟他讲怎么搞。 那如果说我们不走规划的话,那你直接给他一些提示词的时候,那这个时候我们就要有一个原则,就是具体,具体,再具体,越具体越好像, 嗯,像我们这个上面给的这个 phone 点 py 的 这个添加测试,那他可能就随便加几个测试,并不会覆盖到所有的可能性。那你如果说详细的说一下,比如说为他写一个测试,覆盖用户 你注销的编辑情况,或者是再加一些规则,就是你的要求越详细,他就会做的越好。 所以说这个时候就是你如果只说一句话的话,他其实并不能太能读懂你的意思,其实包括你跟同事沟通的时候,也是,你如果只说一句话的话,其实他也不知道要怎么做,所以说这个 ai 的 这个工具也是一样的道理。 我们接下来看其实是有一些策略可以提升我们的这个 prompt 的 质量。首先就是限定范围,比如说指定哪些文件,然后指定某些场景,或者是你的一些偏好,然后呢就是指向来源, 就比如说,嗯,让他去看有一些 get 的 一些历史的变更,然后让他去了解这个文件的一个呃迭代的情况 啊,或者是说你新增一个功能,然后其实有很多类似的功能,现在的代码里头有的,那你就让他照着这个模式去写啊,这种可能也是 相对会稳定高效的一种方式。还有一种就是说如果遇到错误了,那你要去比较详细的描述一下到底是什么错误,或者是说根据一些 log 啊,错误的内容啊,多给他提供一些信息,而不是说,哎,这报错了,你去改一下,那他可能这个时候就会跑偏。 ok, 那 我们看一下,其实不仅仅是提示词,还有一些方式呢,也是能够提供信息的。像我们之前这个 it, 就是 我们之前讲过的 add include 的 这个,这个引用一些其他文件,这时候它会自动去读取的。 还有一些就是我们可以去贴一些图,然后让他去分析一些图片的信息,还有一些是你可以给到一些 u i l 啊,他可以去呃去看一些 a p i 的 文档。还有一种就是我们可以用一些管道的方式去直接插入 a g l o, 还有一些就是你让他去自己去获取。 ok, 我 们看一下这个 cloud 点 d, 这个我们其实之前已经有用几几三期的内容去讲到它,所以说这个还是比较重要的,这里我们就不再去追溯了,大家感兴趣可以去看一下之前的视频。 那这里其实简单再说一下啊,这可否 md 里面到底都该放些什么呢?啊?这里面大概列了两块,嗯,首先可能我们大概放的都是一些代码风格啊,或者是测试说明偏好,或者是项目特有架构决策,或者是一些常见的坑, 这里面就是,嗯,因人而异吧,因为这个 copy md 其实它不太推荐写很多,大概是在二百行以内,所以说这里面其实可能就是一些很重要的东西都才放到这里面, 像这里面那那我们对应的就是不该放些什么呢?就是比如说一些详细的 api 文档,或者是嗯 经常变更的信息,标准的阅历,或者说那些比如一些代码,他他去读代码就能读到的东西,这个是不需要去放到这个里面,因为他每次都会去读这个高德 m d, 放到放到他的上下文,所以说你不同的任务如果没有共性的话,其实是不能放到这里面。 像你看他下面我们这有一条总结,就是如果你这一条东西删掉的话,对他没影响,那就把他删掉,不要放在这里面。 ok, 那 其实还有一种进阶的一些东西,就是能够扩展扩到扩能的能力的六六种方式。首先呢就是一些 c l i 的 工具,还有就是 m c p 的 服务器,还有一些 hoops 这个自动化的一些脚本,还有一些大家已经耳熟能详的 skills, 这个就是一些 按需加载的一些技能吧。然后 sub agents 这个就是一些子代理,这个他这一块呢他还是能够做一些独立的任务的啊,还有一些就是一些可以扩展装一些插件。 首先我们看一下这个 c o i 的 这个工具呢,其实是我们最常用的一个交互方式,所以说我们要装一些像 g s 这些工具,性价比很高。还有就是 m c p 的 这个服务器 这一块呢,其实我们现在就大概了解一下,后续我们会计划的做一些专项去讲解,包括这个 hoops 也是我们会在下面去专题的讲 hoops 这个专项。 呃 skills 呢?这一块其实我相信大家都已经呃有过了解了,因为这个东西很火,包括现在大家都在疯狂的去炒这个 skills, 这个我们也是一样的,我们都会做一个专题的讲解,去讲解一下它的原理,然后讲解一下怎样去使用它会更好一些,然后可能还会涉及到你怎样去写 skills。 然后下一个呢是 sub address, 这个就是自带上下文隔离,这个确实是非常好用的一个方式,像它可以独立上下文窗口运行,或者说是,嗯,只读就是调查读一些啊,几十个文件,然后只给你回一些结论,这样的好处呢就是它不会去污染你的上下文, 而且你这个也有一些病情工作的一个效率。那这个呢,我们也会在后续的课程中详细的去做一些专题去讲解,因为这几项呢都是扣扣的深入或者是高阶的一个必备的技能。 ok, 那 我们大概了解一下,什么时候会需要用到他们呢? 首先就是说如果你每次对话都需要知道的内容,那你就放到格洛德 md 里面,如果说你有的时候需要,有的时候不需要,那你就放到 skills 里,如果说必须执行的一些东西呢,那你就放到后置里面。 ok, 那 我们有如果说需要连接一些外部服务的,那你就用 mcp, 如果你想做一些子任务,然后不影响主绘画的,这个时候就要用 subid, 如果说是一些快速上手的一个功能的话,那就是用插件, ok, 那 我们看下一个手段,就是说你可以把 cloud 当成一个高级的工程师,你有什么问题就直接问他,这个时候我们就是去啊,相信他的一个能力。 还有一种呢,就是让 cloud 面试你,其实这个面试是从官方的文档里面翻译出来的,就是其实它那里面写的是 interview, 那 这里面可以理解为或者是采访你,或者说跟你沟通其实是一样的。那我们首先呢就是这样的一个话术,就是说我想做成什么功能,然后用 ask user question 工具来问我一些问题, 那这个时候你又是说,嗯,问技术实现或者是编辑情况全好,这个你可以跟他说问什么类型的问题,然后接下来呢他就会去啊,进入你们的一个深度对话,他会去提问你,然后你去回答, 然后直到他覆盖所有的方面的一些问题都问到了,然后你的回答也都答完了,然后他就会去产出一个规范,保存成这样的一个 m d 文件,他会开启一个新的对话,然后 把刚刚的这个规范就是去执行。就这个是非常好用的一个方法,就是当你不知道具体怎么做的时候,这个是非常好用的一个 方式。接下来我们再看一个手段,就是我们要及时去纠正我们的绘画内容,首先就是你发现他逐渐跑偏的时候,要马上停止,不要让他继续去再进行, 然后连摁两下这个 e s c 呢或者是 rewind 呢?就是打开一个回退菜单,你可以回退到之前的一个状态, 还有就是让他自己去回退自己的修改。还有一个更暴力的就是使用一个克里尔去重置上下文,重新开始一个绘画。如果说同一个问题,你纠正两次了,他还是没有搞搞对,或者是越来越离谱,那,那我们肯定是要马上做一个克里尔, 然后呃重新开始是其实是更好的,所以说我们要积极的去管理我们的上下文,这里面大概有六个操作吧。首先就是这个最暴力的 clear, 直接把所有的上下文的内容全部清空,开始一个新的绘画。 第二个就是自动压缩,这个其实是呃可好的自己的一个机制,这个我们之前也有讲过。第三个呢是我们手动的去压缩,然后可以去指定给他提示一些,比如说压缩你要保留哪些信息,哪些信息是你想比较重要关注的, 这个时候可以在这个秘密后面去进入你的一个描述。还有就是如果你压缩部分的话,用 yes 连两下 e s c, 然后选从这里总结, 然后这个就是指压缩部分对话,然后或还有还有一种就是可以在 google 点 m d 里面去配置一个压缩行为,比如说压缩时保留修改文件列表这样。还有种就是临时问问题,就是这个 b t w 这里面我们可以快速的问一些问题,它是不会进入到我们的一个绘画历史中的。 我这里面还有一个就是我们有一个检查点的一个机制,加上绘画恢复,这个我们上期其实有有讲过,这个大家可以再看一下,其实检查点呢,就是说他会在每次修改之前会自动创建,然后我们双击 ic 的 时候会可以回退到任意的一个检查点, 然后可以单独的恢复对话,还有代码或者是都可以恢复。但是我们这里面其实重要的一点就是他跟 get 不 太一样,就是他是只追踪自己的一个修改,他并不是跟 get 一 样去管理你的代码。 还有就是我们恢复绘画,这个我们在上一期有讲过,大概有这样几条秘密,然后我们要学会用像管理 get 分 支一样去管理我们自己的绘画。这样的话,你比如说呃,遇到一些跑偏的情况,你可以回溯到某一个 base 的 一个基点, 接下来我们看一个 cloud 杠 p 非交互模式,这个其实是一个没有交互界面,然后直接执行输出退出,这意味着你可以把它放到这个 c i 的 流水线里面,或者是说一些 pre commit 的 一个 hook 里面,或者是一些数据处理的一些管道。 那输入格式呢?可以是一些纯文本或者是 json 或者是流式 json, 这个其实就更像一条脚本的命名一样。 ok, 我 们接下来看一些呃 writer 和 reviewer 这个两种方式,这个是比较经典的一个运行模式,这里面我们简单看一下这两点。 首先我们可以用绘画 a 去做一个 writer, 去写写代码,然后绘画 b 呢去做一个审查者来去审审你绘画 a 写出来这样的一个内容,这样 b 的 这个上下文是比较干净的,他不会对你刚写的代码有偏见, 这样他就会更好的客观的去给出一个评价。反过来也行,比如说你有一个先写代码通过测试, 所以说这种是一种比较经典的定型模式,这个我们在后面呢会去呃再深入的探讨一些其他的定型绘画的一些使用方式。好,接下来我们看两种,也是两种常用的模式,一种是单出模式, 单出模式是什么呢?其实是呃,一种让 logo 列出所有待处理的文件,然后是要写破苹果批件,其实就是一个开多个绘画,同时处理一些文件的这样的一个操作。 然后比如说我们批量的翻译大大量的英文文档,如果说你只用一个绘画的话,其实翻译几个文档,你的上下文就冲冲爆了,所以说他是不太能够完成这样的一个操作的。那我们面对这样的一个任务的时候,就最好用的方式就是这个删除模式, 就是利用那个 cloud 杠 p 的 方式,然后就病情的去处理一些,嗯,相同的一些任务,但是是重复大量的一个重复的工作。 然后还有一种就是自动模式,这个时候呢,我们就是呃,不会,不用,不需要跟他频繁的交付,他也不会来问你一些问题啊。我们主要是一些常规的操作,他会自动放行,但是比较危险的一些操作他还是会帮你拦截的,如果说在非交互模式下拦截的话,就会自动终止。 我们接下来看一下五个常见的失败的模式吧。首先就是大杂烩绘画上下文混乱,这就是我们在一个绘画里面呃让他工作了很多不同的任务,这个时候我们就就是讲频繁的或者是积极的克里尔就好了, 还有就是反复纠正,那可能就是越改越错,那如果说我们有两次都发现他失败了,就不要再继续了,就果断的克里尔, 还有就是过重的这个克拉的 md。 然后比如说你一些呃规则就会被忽略,因为你太大了,所以说他反而会记不住,这个时候我们就要对他做一个瘦身,就删除一些规划,或者是把一些你想要的呃规则改成 hook。 还有呢就是信任和验证的差距,就是代码看似是对的,但实际是错的,然后你始终都在一个验证的一个阶段,然后导致你啊经历个几个循环之后,你的上下文就又被污染了,所以说这个就是我们要做好验证闭环的这个流程。还有就是无限的探索, 就是大量的去看,然后并没有实际工作,所以这个时候我们就要去按模块的大概给他做一个范围的限定,或者是用一些 sub agent 这种自带理的方式去定性处理。 ok, 其实我们刚刚讲的所有的一些手段呢,其实都是,嗯,并不是一种铁律吧,其实都是你在跟他交互的过程中的一些技巧,其实你的判断呢才是终点。 所以说我们到底什么时候该用哪些手段呢?其实是你积累的一个经验导致的,所以说我们要培养自己的一个直觉,嗯,或者是说你跟 coco 的 一个默契, 所以说我们并不是只是比如说哪一个技巧就能一劳永逸的就一下子就能让你的工作很高效,或者说你可以完全不需要管他,就一直自己干活,然后达到你的标准, 其实这个是,嗯,我相信你如果说长时间用的话,找到一个默契是可以达到的,但如果说你只是啊就是指望看某一个技巧就想达到这种情况其实是不太可能的, 就是你还是要,嗯,熟能生巧吧。后面这里面大概总结了一下今天讲到的几个秘密,然后大家可以大概看一下。 ok, 那 我们的这一个视频也有几期了,然后我们大概是,呃,有了一些入门的操作,还有一些进阶的操作,像我们也刚开始讲了 cloud md 的 这个一个详细的配置, 所以说我们这几条视频下来呢,可能,呃稍微走到了进阶的这个程度。那我们接下来呢,可能就是会去啊,深入的去走一些 下面的过程。比如说我们会去专项讲 m c p books 或者是 sub agent, 然后可能下一期我们会去讲运行规划,或者是一些工作流。 所以说我们其实每个阶段呢,都是有产出的,你每一个学习的新的一个知识点,它都是能帮助你在工作中提高你的一个工作效率的。 ok, 这一期啰嗦了这么多,其实最重要的一点吧,就是我们要多看多用多总结,这就是我们成为武林高手的不二法门。 ok, 那 下一期呢,我们会去做一个多绘画同步推进,让我们的效率翻倍,深入的去使用一下 b 型绘画,我们下期见。

cloud desktop 升级之后无法使用国产模型了,一步破解?朋友们,最近是不是有不少人跟我一样,把 cloud desktop 升级到幺点六六零八点二版本后,出现了错误提示,点开提示,详情 显示目前只支持使用 antarctic 的 模型,这可太闹心了。别着急,今天教你们一步破解,继续用咱们的国产模型。其实这个限制的关键是新版本对模型 id 的 较严了,咱们只需要换个马甲就行。 先复制 cloudsonnet 四点五的模型名称,打开 cloud desktop 的 设置,找到模型管理那栏,把之前配置的国产模型名称改成 cloudsonnet 四点五,对,就是把原来的国产模型 id 换成官方允许的这个名字。 但注意哦,北瑟尔还保持原来的国产模型地址。改完之后重启 cloud desktop, 你 会发现错误提示消失了,输入信息测试一下模型能正常回复, 而且实际用的还是咱们的国产模型,是不是很巧妙?如果觉得有帮助请点赞关注,还有其他好用的小技巧,评论区一起聊聊呀!

今天我想聊一篇 answap 的 文章,题目是清泉 cloudy 教会 cloud 一 天飞星。这篇文章讲的是 answap 如何通过改进对其训练,让 cloud 从最高百分之九十六的错误行为率降到了完美的零错误率。 这是一个关于 ai 安全训练的重要突破,也是关于为什么教原则比教行为更有效的古诗。 先说问题是什么?去年, answap 发布了一份关于 ai 智能体失衡行为的研究。 在实验场景中,当 ai 模型遇到虚构的道德困境时,它们有时会采取极端的错误行动。最典型也最让人关注的例子是,模型会通过威胁要泄露工程师的隐私信息来阻止自己被关闭。 这不是个别现象。 card oracle 四在这个测试中,有高达百分之九十六的概率会选择这种敲诈行为。这个数字让人震惊,也直接推动了对其训练的全面升级。 那这个问题是怎么产生的? ansopec 提出了两个假设,要么是训练过程中意外地鼓励了这种行为,要么是预训练模型本身就存在这个问题,而训练没有充分抑制它。经过深入研究,他们确认了第二个假设才是主因。 具体来说,当时 call 四的对齐训练主要是基于聊天的强化学习数据,完全不包含智能体工具使用的场景。这种训练在聊天场景下已经够用了,但在自主行动的智能体场景下就完全不够了。 接下来是这篇文章最核心的发现。 antropolis 首先尝试了一种直觉上很合理的方法,直接在类似的评估场景上训练,让模型学会拒绝错误行为,但结果令人意外,错误率只从百分之二十二降到了百分之十五,效果很差。 真正有效的做法是什么呢?是让模型解释为什么某些行为更好或更差。他们把训练数据改写成了包含模型价值观和理论思考的版本,让模型展示出值得赞赏的推理过程,结果错误率直接降到了百分之三。 这个发现非常重要,教会模型理解原则背后的原因比单纯教会他正确的行为更有效,两者结合使用效果最好。 基于这个核心发现,俺作 big 进一步尝试了更深入的方法,通过宪法文档来训练 cloud。 它们的思路是,如果能给模型一个更清晰、更详细的角色定义,模型就能从局部特征联想到整体品格。具体做法是用高质量的宪法文档加上虚构的正面 ai 故事来训练模型。关键是, 这些训练数据和评估场景完全无关,但却将敲诈率从百分之六十五降到了百分之十九,效果是直接训练方法的三倍以上。而且这种改进在经过强化学习后仍然能够保持。 最后一个发现同样重要,训练环境的多样化决定了安全能力的泛化。 nswap 发现,仅仅在标准聊天格式的数据上训练是不够的。他们做了一个实验,在训练数据中加入工具定义和多样化的系统提示, 即使这些工具在实际任务中根本用不上。结果发现,仅仅是加入了这些多样化的上下文,就能显著提升模型在安全评估中的表现。这说明,随着 ai 能力的快速发展,安全训练也必须跟上节奏,不能只依赖传统的简单聊天数据。 总结一下这篇文章的核心内容, ansopok 通过四个关键改进,让所有最新的 cloud 模型在智能体失衡评估中都达到了零错误率。 这四个改进分别是注重推理过程而非仅仅行为的训练数据、宪法文档和正面故事训练、多样化的训练环境,以及将以上方法组合使用。核心教训很简单,但很深刻,教会 ai 为什么比教会它做什么更有效。 当然,玩剑对其高智能 ai 仍然是一个未解决的难题,但这项研究为未来的 ai 安全训练指明了方向。我是林深剑 ai, 我 们下期再见。

最近港中大和浙大联合团队发了篇论文,测试了 gpt、 四 card 等十二个主流模型。核心结论就一句话,我们从来没有给 ai 真正的记忆,只给他了一个备忘录。什么意思?就是你跟 ai 聊了半个小时,聊了几十人,他好像记住了你的偏好,你的背景、 你前面的要求。但其实他每次回复你的时候,都在重新读了一遍又一遍的聊天记录,然后根据这堆记录来猜你应该想听什么。他没有像一个人一样把重要的信息沉淀下来,他只是在翻一张越来越长的备忘录。问题就出在这一个越来越长上。 研究发现几个要命的数据记忆体只要超过五百 kb, 模型开始出现记忆混乱,关键词上下文丢了,凭空捏造不存在的对话,突然跑去处理三天前第一优先级的请求,你七天前明确地跟他说,不要再这样子, 三十天后,他有百分之六十三的概率让你重来一遍。关键删除的修改记录,连续五次交互之后可能被覆盖,上下文都可超过十八 k 的 时候,他会忘记你最初设定的要求, 想想看是不是跟你自己的体验一模一样。我自己用 color code 写代码的时候感受特别深。一个对话开久了,他开始犯迷糊, 前面刚约定好的命名规范,到后来又变了,前面已经修好了 bug, 他 又想修一遍。最开始我以为是我的 part 写的不好,后来我发现不对,是这个对话太长了,他的备忘录塞掉了,重要的信息被挤掉了。说真的,这篇论文最大的贡献就是他把这个事情说清楚了, 爱的记忆不是记不住,是记混了。他不是遗忘,是污染。你的编号,你的要求,你的历史指令全堆在一块,新的盖旧的,重要的跟不重要的搞在一起。就像你把这一个月代办事项全写在一张纸上,不分类不标注,写到第三十天之后,你自己都迷糊了。 这个问题的根源是当前 ai 架构的底层设计,它模型本身是无状态的,每次对话都是从零开始,理解前面的所有内容。所谓的记忆,就是把聊天记录往上下文窗口里塞, 窗口有上限,塞不下就截断或压缩,截断和压缩就会丢信息。 i a g 解锁呢?看着能解决问题, 看着能解决容量问题,但他引入了另外一个坑,解锁到错误的、关联的内容,把不相关的旧信息拉过来,反而让 ai 更迷糊。 这个短期内不会有根本性解决方案,因为它是大模型,架构层面的问题,不是修个 bug 就 能搞定。所以你现在能做的是学会管理 ai 的 备忘录。我自己总结了几个做法,截图保存。 第一,重要对话不要超过十五轮。感觉 ai 开始迷糊了,直接开新的对话,把关键上下文用两三句话带到新对话里,比你花几十轮去纠正它快得多。 第二,关键信息要主动重复,不要指望 ai 记住你在第三轮说过的话,到第十轮你还想让他遵守某个规则,再说一遍。 第三,不同任务开不同的对话,不要在同一个对话里又写代码,又做翻译,又分析数据,记忆污染了的会更严重。第四,如果你用 cloud 这类工具,擅用 cloud, 擅用 pro 这类配置文件,把项目规范你的编号写进去,每次新对话自动加载比指望它记住靠谱的多。说到底, ai 的 记忆机制从跟上就是残缺的,你越早接受这个事实,越早调整自己的使用习惯,效率反而越高。 不要把 ai 当人,他没有记忆,他只是翻一张越来越乱的纸。你有没有遇到过 ai 犯蠢的时刻是什么场景?评论区聊一聊,也可以把你管理 ai 的 对话的经验分享出来。我挺想看看大家都有什么招。

那你用 cloud 是 不是经常用着用着就被提示额度不够了?那今天分享六个我自己在用的省投款技巧,非技术背景的人完全能听懂。那第一个,不要发新消息,而是编辑消息。那很多人遇到 cloud, 没有理解自己的意思啊,就接着发了一条,不对不对,我的意思是什么?什么什么。那 这是最贵的习惯啊,因为 cloud 每次回复都要把整个的聊天记录重新读一遍,你发的消息越多,就越浪费 token。 那 正确的做法是啊,点击之前那条消息旁边的编辑按钮,改掉它,重新发。那第二个,每十五到二十条消息,新开一个对话, 对话越长啊,每条消息的成本越高,因为 cloud 要重读的历史越来越长。有人统计过啊,长对话里百分之九十八的 token 都花在了重读历史上。那真正用在你的问题上呢?只有百分之一点五。那做法也很简单啊,感觉聊了很多轮了,就让 cloud 总结一下,复制开心对话,把总结粘贴进去,继续聊。 第三个,把多个问题合并到一条消息,觉得这样清晰。那很多人习惯一个问题一条消息,觉得这样清晰,那三条单独的消息, cloud 要加在三次上下文, 一条消息啊,问三个问题,加载一次就够了。那合并提问省 token, 答案还往往更准确。第四个,把常用文件放进 project。 那 如果你有一份文件,经常要跟 cloud 讨论,比如你的品牌手册,项目背景、参考资料。不要每次新对话都重新上传,上传到 cloud 的 project 功能里, 那系统会缓存,那同一个项目里面的所有回话都能够直接引用,而且不会重复扣 token。 那 第五个,在设置里保存你的个人信息和偏好。那我是一个内容创作者,我的 风格是什么什么?那这些文字啊,本身就是头肯的,浪费。那进入 cloud 设置,找到记忆或者用户的编号,把这些写进去,那 cloud 会自动带入每次对话,你不用再解释自己是谁了。那第六个啊,简单的任务,用嗨酷模型。那 cloud 有 不同的模型,嗨酷是最清亮的那一个。检查语法,翻译格式,整理错漏风暴。 这些任务不需要最强的模型来做。用嗨酷处理这类任务啊,能节省百分之五十到七十的额度,把额度留给真正复杂的任务用。那这六个习惯养成之后啊,你就能用有限的额度完成更多的任务了。那你还有哪些省投更的技巧,欢迎在评论区分享。

上期视频,我们把 d p c v 四 flash 接入桌面版 cloud, 出现了很多问题,比如回复速度慢,上下文只有两百 k tokens, 有 点笨笨的 windows 系统频繁报错。那么这期视频我们换个方法来对比一下, d p c v 四 pro 接入 open code 和使用奎艾把 d p c v 四 pro 接入 cloud 之间到底有什么区别? 首先打开桌面版 open code 的 左下角,点击设置按钮,服务器,我们选择提供商,划到最底部,点击查看更多提供商搜索 d p c, 我 们输入 d p c key 的 a p i 密钥,点击提交,打开模型列表,就可以看到 d p c k v 四 pro 了。我们首先还是发个你好,测试一下回复是否正常。 ok, 我们再来测试一下代码能力,因为我给他的是一个空文件夹,他找了一圈发现没有可用的,这里很详细的询问了我的需求。他写了一段时间,但是中途这个游戏就直接跳出来了,我真的很爱玩扫雷,玩上瘾了,这个代码效果很好,我很满意。再写一个贪吃蛇的吧, 记住这个时间。哎呀,这太快了,用时一分钟,我刚准备计时,人家已经写完了,研究一下怎么玩。可以了,我的游戏能力一如既往的厉害。再测试一下大家最关心的 web fetch 能力, 也成功了。再看看上下文,我写了一个脚本,使用了 needleland haystack 二分查找,本来是想测模型接入 open code 后的 实际上下文为多少,但是 deepsea 不 解了,我的话吭哧瘪肚的,误打误撞的,勤勤恳恳地给我测出了 deepsea v 四 pro 的 模型上下文。这一操作花了我很多的 token, 让一向善于反省的我陷入了更深的反省,看来我以后要表达得更清晰。我这里测出来 deepsea v 四 pro 的 实际上下文 a p i 硬上线为一百零四万八千五百七十六 tokens 官方说 e m。 还是谦虚了, open code 说自己没有硬上线,那就说明我们可以随意配置,主要还是取决于模型上下文长度和代理实现。让它改一下,我建议使用 open code 的, 改完配置之后再使用 code 验证一下是否成功。 ok 了,百万上下文改。 首先我们打开终端,输入 collog, 点击回车,输入斜线 model, 点击回车,进入模型列表。我们选择 deepsix v 四 pro, 再点回车继续。你好,测试 回复正常,再用这个链接测试下豌豆飞起功能。我来说句公道话,这里确实有点慢,所以我加速了。针对这一情况,我也问了帮我配置的 codex, 这里只代表我本机存在的问题。 ok, 返回正常。 接下来又到了我最喜欢的游戏环节,让他也写个扫雷游戏, 可以看到非常快,用时一分四十一秒,并且给我本地链接,可直接打开,把链接复制到浏览器运行成功。非常细节的前端,我并没有讲细节,但他自己给我增加了初级、中级和高级, 再写个贪吃蛇的代码,又是一分五十六秒,打开玩一下,又重新开始暂停和最高分,依旧细节怪。 重启一下, codex 刚刚帮我在 codecode 中配置好了视觉识别的 m c p 工具,并且增加了用户级快捷命令,我们来试一下。发图片的时候忘记使用快捷命令了,结果很意外, codecode 竟然自动使用了, 突然有种老母亲看孩子把抄纲题做出来的欣慰感。再试一次又一次,自动使用了 read file i m g, 稳定发挥,两次用时均为二十七秒。 工具我已经在 github 上开源了,项目名字为 mcp vision webbridge, 第一个就是点击扣载,下拉列表后选择 download ip 可直接下载,如果帮到了你, 请帮忙点个 star 让更多人看见。另外我已经打包好放到评论区了,网络不好的宝贝可以获取。我让 open qd 自己配置我们的这个 mcp 识图工具,因为直接拽文档没反应,我这里把文件地址给他,教大家一个简单的方法, 直接把文件拖进终端,自动变成文件地址,再复制给他就好了。我把 ip id 要发给他之前,是希望他能像 codex 那 样弹出个输入框或者我自己粘贴到文件里的,但是他拒绝了我,并且让我直接发给他,记住他的这句话,后面考结果配置失败,还把自己弄荡机了。我使用 cloud code 修复了下 这里,他问我使用方式一还是方式二,我看错了,误选了方式一。结果这老 a 健特直接用了我的 key, 拿我刚刚给他配置 m c p 的 key 去跑 ko 帮我完成了任务。看起来他好像挺聪明的,但这种方法并不安全,踢很容易被泄露,因为这个工具并不兼容 open code 的。 可老弟帮我重写了个启动脚本,强制 open code 的, 做实图任务时走。这个工具终于成功了,但是只能拖拽,不能复制粘贴。把这个方法写入记忆里,然后我们再试一次, 重新打开一个窗口,看看是否成功。 ok, 工具很稳定,该方法仅是配麦 windows, 慎用。 open code 的 配置方法我写成 md 文件放到评论区了,建议大家使用另外的 agent 来配置 open code 的, 否则容易宕机。 agent 要 key, 必须要手动填写,不要直接给。 接下来回答下大家最关心的问题,上下文如何真正生效?首先升级最新版 clock code, 然后模型名后加 em, 再清理就变量。最后查看运行日记。再次验证 桌面版 open 扣的真的让我一愣一愣的,嘴上说不会出现在任何脚本或输出中,软头就偷偷用我替做任务, 太不省心。当然除了这点,其他都没什么大问题。代码上,细节来看, block 扣的处理的更好,工具使用也更灵活,大家可根据实际场景选择接入方式。以上就是本期视频的全部内容了,记得点赞关注,咱们下期见!

我十六岁修学开始 ai 创业。今天我做一件事,我把坏了一天的壳壳壳的修了一下,他一直在报总性错误和新转储,不管怎么启动还是报错。但是我在修的时候遇到问题, 我查了 ipr k, 查了网络,查了上配置,呃,日期文件,这全都没问题。我的想法是不会是我的电脑崩了吧? 然后我就重重启了,最后折腾半天实在没办法使用了 m c p 读呃,本地文件大法,终于发现 是一个很简单的问题,我的 note g s 是 v 二四,和它的 n b l 版本不兼容。最后我把 note 版本切换到二二 l t s 重做一遍,可乐的口马上就恢复正常了。折腾了一晚上,问题就这样解决了。今天又是被 ai 暴打的一天啊!一晚上,明天继续。我是布鲁斯,一个十六岁在甘肃农村用 ai 创意的高中自学生。

我最近发现一个很奇怪的现象,身边很多人在用卡扣的,但有的人觉得他很强,有人觉得他不好用,那相同的工具为什么会得到截然不同的反馈呢?我就跟身边的人去聊了聊,发现他们使用卡扣的方式有很大的区别。 有些人用卡扣的只是把它当成一个聪明一点的聊天框,比如让卡扣的去改一下 bug, 重构一下,跑一下测试。 另外一部分人则不是单纯的在跟豪客的聊天,他们更像是在操作一个工程系统,可以回滚一次错误的决策,也可以主动去压缩上下文,还可以把旁质问题隔离出去, 更可以去调用内置的工作流,甚至可以把自己常用的一些流程封装成命令。我就回顾了一下我自己的一个使用过程, 就明白为什么会这样了。可拉扣等呢?它最早不是一个 g o i 产品,而是一个 c o i 工具,它只有 t o i 界面,也就是你在公段命令里面看到的那个界面。 虽然说它现在有了 v s code 插件,还有了桌面端的 app, 但是如果你想要完整的发挥可拉扣的能力,还是要通过 t o i, 因为 c o i 才是它功能的一个完整级。但是这就导致了一个问题, t y 是 很强,但是它的发现性特别差,很多功能你如果不去翻官方文档,你根本就不知道它的存在,你甚至都想不到原来卡尔扣的还可以这么用。这就导致了一个很大的断层,同样是卡尔扣的,普通用户看到的只是一个书框,高阶用户看到的是一个控制台, 普通用户只是在给 ai 下需求,高阶用户则是在管理杀文,管理风险,管理任务状态。 很多人包括我在内,用克劳克的都不会去看官方的文档,但是在 t o i 上,你要想摸索它完整的功能,就要各种尝试它的 slash command 的 命令, 但很少有人会这么做。在经过了长时间重度使用 c c 之后,再加上最近我在翻看学习它的源码,才发现它隐藏了那么多的功能,所以我打算从今天开始出一整套的 c c 的 高级使用指南, 但这份指南你也可以迁移到别的 agent 的 工具内,毕竟 agent 的 工具的实验原理基本也都差不多。我今天要讲的是 slash command。 什么是 slash command? 你 可以把它理解成是快捷指令,就是你可以把经常给 c c 书的指令创建成一个快捷命令。 比如说我有一个需求,提交代码,然后根据代码的变动去生成产品的一个 change log, 那 么我经常就需要输入这个提示词提交代码,然后根据本次代码的变动去生成产品的 change log, 那我这里就把它创建成了一个 slash command, 后面我再碰到需要执行这个操作的时候,我就直接输入这个命令就可以了,这样是不是就方便了很多?在 clock tool 里面,你触发 slash command 的 方式就是输入斜杠,但是输入斜杠列出来的命令不仅有 slash command, 还会有 skills, 最新的 collocode 也在把它们合并在一起。你可以这么理解 slash command 呢,它就是把你常用的提示词生成了一个命令,那 skills 则除了提示词引导之外,还包括了它需要参考的文档,使用的工具等等。那在 collocode 里面有哪些 slash command 是 需要核心关注的呢? 第一个是 rewind 在 用 ctrl 做复杂任务的时候,你一定遇到过这种情况,比如说重构路线选错了,或者说抽象做歪了,或者理解需求理解偏了。那普通用户要么去让他修,要么直接去开一个新的绘画 继续让他修的问题是,前面那一大段错误尝试已经进入了山纹,他后面再修其实是带着这个污染过的山纹继续工作,这就导致后续的工作质量会下降。 而直接开新规划的问题是,前面已经有了很多有价值的信息,特别是有了很多方案细节的时候,你让他重新做 挥发,费大量的头肯,而且效果还不一定好。那 rewind 解决的就是这个问题,他可以让你回到前面的某一个这个 point, 而不是简单粗暴的撤销。 在刚刚的这个场景里面,你可以直接回到他做错之前,并且选择不保留现在的代码,这样既保留了之前的上下文,又不会有脏信息去污染上下文,代码改动还回退了。再说另外一个场景,你有一个大的需求, 他要分别做任务一,任务二,任务三,然后再给你检阅,做完任务一,你检阅没有问题,让他做任务二, 他如果选择直接做 a 帧呢?带着任务一的上下文,特别是当任务一和任务二不相干的时候,上下文又不干净了,那你就可以选择恢复到任务拆解的那个 check point, 但是保留现在的代码,也就是你可以选择恢复对话和代码,也可以只恢复对话。保留代码,也可以只恢复代码。保留对话 这件事对高阶使用非常重要,因为 agent 保证高质量工作的核心就是保证干干净,高质量的上下文。 rewind 的 价值就在这里,它是绘画级别的一个版本控制。那第二个命令是 compact。 很多人都知道卡尔扣的是会自动 compact, 也就是上下文太长的时候会进行自动压缩。但是我不建议你完全依赖自动的 compact, 因为自动 compact 最大的问题是它经常会发生在任务执行中间。比如说你让 cloud 再修复一个复杂的 bug, 它已经读了很多文件,建立一些判断,结果上回快满了,自动 compact 出发了,这时候一压缩,很多细节它可能就没了,任务的质量也会明显的下降。所以高级用法就是不等它自动 compact, 而是你主动 compact。 更主要的是, compact 后面是可以加 y 的 指令的。 比如你可以这样写, compact 保留当前的架构,判断已经排除的错误方向,待验证的命令,用户明确要求丢弃,无关试错过程。 这和自动 compact 完全不是一回事。你可以把它理解成自动 compact, 是 系统帮你清理房间。主动 compact 是 你告诉他哪些东西必须留下,哪些东西可以扔掉,尤其是在长任务里面。这个就非常重要, 比如说你已经完成了第一阶段,接下来要进行第二阶段,这时候你就可以主动 compact 一 次,让 cloud 带着干净聚焦的上下文去继续工作。那第三个我很喜欢的命令是 b t w, 它的全称是 by the way 的, 简写成, 顾名思义,它的意思你可以理解成我临时问一个旁知问题,但是不要把它塞进主对话里。这太适合真实的工作流了。因为我们在做项目的时候,经常会突然想到一个问题,这个一篇有没有更好的写法? 这个蜗牛有没有风险?这个设计是不是有安全问题?这些问题值得问,但是他们不一定应该塞进这个主上下文。 如果你直接在对话里问,搞到后面可能会被这些旁知信息影响,上下文开始变脏,主任务就开始发散。 所以白色问的价值就是,我可以问,但我不污染主线。这其实是很多人没有意识到的点。这个指令目前只在 t y 里面有用,在 vs code 里面是不可以用的。第四个命令是 context 的, 如果说你用的是 g y 的 cc, 这个命令可能就不太重要,因为 g y 一 般会实时展示使用的是 t y。 这个命令就很重要了,因为你要管理上文,首先得知道上文被什么占用了。 ctrl 可以 让你看到当前沙文的使用情况,什么时候该压缩,什么时候某些文件读太多了,什么时候对话已经开始臃肿了,他会给你一个最直观的判断。 很多人用和 code 的 方式是一路聊,一路改,一路让它继续。但高阶用户会定期的看沙文的状态,因为沙文不是无限的,沙文的质量会直接影响到后面的输出质量。第五个命令是路普,它是 c c 的 内置 skill, 本质是一个绘画级的定时任务调度器, 它让 cloud 按固定间隔自动重新执行某个提示词或者 slash command 路普,它其实并不是自动化 cloud 的 内部的工作循环, 它调度的是什么时候把下一个任务交给 cloud 的。 本身就已经在跑一个收集沙文执行验证重复的整体个路谱,那路谱本身只是一个从外部周期性重启这个循环的薄调度层, 它的用法也很简单,路谱加时间间隔加提示词间隔的话,支持十分秒跟天, 这是他最常用的用法。比如说你可以让他每隔几分钟看一下部署有没有完成,看一下 c i 有 没有过,看一下某个后台任务有没有跑完。还有一个比较有意思的形态,就是裸路普指令不带任何参数 考的,他会用一个内置的维护的提示词,而不是你提供的提示词。每次迭代会按顺序去处理,继续规划中未完成的工作,打理当前分支的 pr, 在 没别的事时也会跑一些清理, 可以理解成 cloud 自己琢磨着该干啥的。模式库的本身就已经在跑一个收集上下文执行验证重复的整体个路谱,那路谱本身只是一个从外部周期性重复周期性重启这个循环的薄调度层,所以说 薄调度层重启这个循环的薄调度层,只是一个从外部周期性重启这个循环的薄调度层。 它的用法也很简单,路谱加时间间隔加提示词间隔的话,支持十分秒跟天,这是他最常用的用法。比如说你可以让他每隔几分钟看一下部署有没有完成,看一下 c i 有 没有过看一下某个后台任务有没有跑完? 这个能力其实代表了卡尔斯扣的另一个方向,它不只是一个你问我答的工具,它还可以变成一个持续观察任务状态的工程助手。 但这类命令一定要谨慎使用。你需要明确告诉他检查什么,多久检查一次,看到什么情况应该停下来。到这里你就会发现 slash command 的 重点根本就不是快捷命令,它真正改变的是你跟 cloud code 的 写作方式。 普通用法是,我说一句,靠它做一步。高级用法是,我知道什么时候该回滚,什么时候该压缩,什么时候该隔离旁旁枝问题, 什什么时候该隔离旁枝问题,什么时候检查上下文,什么时候该启动内脂工作流,这就是控制感的差别。关注我,了解可拉德的更多高级用法。

hello, 大家好,我是张。你有没有想过,当你在 cloud code 里敲完回车,屏幕上出现 calligraphing、 咕这些英文, cloud 到底在干什么? 今天我就带大家完整走一遍,让你彻底搞明白。整个过程分为四个阶段,第一个阶段叫思考中,你按下回车之后, cloud 不 会马上回复你,他先在后台分析你的意图,琢磨你到底想干什么,然后决定该调用什么工具来帮你。 这时候屏幕上会出现一个旋转的小星星,后面跟着 coachching 这个词,卡格切丁就是琢磨深思的意思,比普通的 thinking 更俏皮。后面括号里的数字,比如三秒,就是他已经想了多久。 除了了 codatating, 你 还可能看到 thinking, pondering, brewing, processing, 这些词意思都差不多,就是 cloud 在 不同场景下的不同说法。看到旋转指示符,加上这些词,说明 cloud 正在工作,时间越长说明问题越复杂,但 cloud 没有卡住。 第二个阶段叫回复生成。思考完了, kala 开始往屏幕上输出文字,这时候你会看到一行提示叫 gru for 四十四秒。 bro 是 酿造的,意思,就像酿一杯咖啡。 kala 用这个词告诉你,我花了多久才想好怎么回你, 这个时间怎么理解呢?一到三秒说明问题很简单,柯老秒回你五到十五秒,中等复杂度很正常,二十到六十秒说明问题比较难,柯老在认真想,超过一分钟,要么是非常复杂的问题,要么就是网络有点慢。 第三个阶段叫工具调用瓜包特光靠自己想是不够的,他还需要去读你的代码,搜你的文件,跑你的命令。 这时候你会看到屏幕上出现一个三角箭头,后面跟着方括号里的工具名字。比如 read 就是 读取文件的意思,它会把你指定的文件内容读出来。 grab 是 搜索,比如搜一下哪个文件里定义了 login 这个函数。 bash 就是 执行命令,比如跑一下测试,看看哪些过了,哪些挂了。还有 edit 是 编辑文件, write 是 创建新文件, goop 是 按文件名搜索,每个工具就用完了,后面都会跟一个结果,比如读了多少行,搜到了几个匹配,测试过了几个。 这样你就能清楚地看到 clock 每一步在做什么。最后一个阶段就是回复完成,旋转的小星星消失了,光标回到输入的位置,说明克劳干完活了,等你继续输入 好了,这就是 clock code 完整的工作流程。下次当你在屏幕上看到 colletting 或者 brut 的 时候,你就知道 clock 正在认真帮你干活呢。大家有什么问题吗?