今天我们就拿实际的项目来测一测这个烤 pallet 的 套餐到底值不值啊?然后我们全程都用的是 oppo 四四点六的这个模型,也就是可 loft 的 最强模型。工具的话,大家可以按照自己的喜欢自己选啊,我用的是 open code 的, 如果大家有喜欢的其他工具也可以对接啊,反正烤 pallet 都兼容到目前为止这个项目。这这个任务已经跑了大概三十分钟了, 你看这上下纹已经很长了,这已经是压缩了好几轮的了。如果是在可乐扣子里,我可不敢这么跑,因为我的可乐扣子对接的是官方订阅。如果说在可乐扣子里我这样跑的话,那现在早就触发五小时上线了,我估计我这个任务四五四五小时上线都不一定跑得完, 要是对接官方 api 的 话,估计一百多块钱已经出去了。但是现在我们不慌啊,因为我们是用 opencode 加 copilot 的 方案来进行的。 一会我们再来跟大家聊 capitol, 它的这个计价逻辑是什么样子的啊?网上说它是按次数计价的,其实也不完全准确,因为我这个任务其实到目前为止它已经消耗了大概三十积分了。我们到后台看一下, 嗯,它大概是从三十二开始的百分之三十二开始的,到现在为止是百分之四十二了。 我只触发了一轮对话吗?那你看消耗了百分之十就相当于是三十积分吗?按照每个模型的那个单价来算的话, oppo 四点六的单价是一次三积分,那现在已经消耗了三十积分就相当于十次对话了。 嗯,但其实我在工具里其实只跟他说了一句话,所以说大家也不能严格的说按照对话次数来算自己的使用情况, 这里面还是有些微妙的,但是整体来看,他已经很很划算了啊。 我们来继续让他跑 a few minutes later。 哇,他还没跑完呢,现在已经一个小时了。那这样吧,这段时间我跟大家分享一个我个人体验下来比较高效的一个 呃,算是外部抠钉的方法吧。左边的窗口我用 oppo 四点六。然后右边的这个窗口呢,我用的是国产模型,比如说智普的 g l m 五了, mini max 二点七了,或者是 kimi 二点五了这种,这样左右配合,哎,你也不用特别分散注意力。 左侧就是做需求的,然后做架构的,做 plan 的。 右侧呢,就用国产模型改一改明确的 bug, 或者是写一些比较明确的接口,其实 基本也不会出问题的,而且在这个过程当中,你的注意力也不会被分散,你的所有注意力都集中在当前的这两个窗口当中,有点左右互搏的那个意思哈。左手写 bug, 右手改 bug。 对, 这就是 opencode 的 一个好处,就是它所有模型就能对接。你用订阅的方式把 copilot 的 套餐订阅进去, 然后你还可以把很多很多套餐都订阅进去,然后订阅进去以后,你的模型就可以随便选。 你看我左边这个窗口,做架构,做大需求的开发,做大任务的处理,就用 opus 四点六。右边的这个窗口呢,改改小 bug, 写写小接口啊,就用国产模型。然后再跟大家分享一个点,就是在这种方案下, 我们不是分了左右两个窗口吗?左侧这个窗口我们用的是 copilot 的 套餐,这个套餐呢有一个特点就是它大体上还是按照对话次数来扣费的 啊,在你的那个上下文没有超标之前啊,所以你跟他说一句你好哎,他也扣你三积分,但是这就很不值了,对不对?你跑一个满的上下文,他也三积分,你说句你好他也三积分,所以我们不能在左侧的这个窗口和他去做这种日常的交流和对话啊。 那么怎么办呢?我们比如说现在来了一个需求,我们就在右侧的这个窗口,哎,我们用国产模型,让他去结合当前的项目,结合向你提的问题,然后来梳理你的需求。当右侧这个窗口把需求梳理清楚了之后, 你把整个需求丢给左侧的这个窗口,让他一次性出普烂。左侧这个窗口出完普烂之后,你再用 oppo 的 四点六,直接就用最强模型把这个普烂给开发完算了,这样的话你其实消耗不了多少积分, 如果说一个小功能的话,我测下来十积分就能搞定,你一个月有三百积分呢。然后右侧这个呢,就改改 bug 嘛, 好了,他终于把活干完了,干了一个多小时啊,如果说你用官方订阅的话,一个多小时的任务估计要两百块钱左右了,我们来看一下 capelli 这个方案大概要花多少钱吧? 嗯,百分之三十二开始到现在是百分之四十七点多,大概消耗了百分之十五的额度,就是四十五积分,然后我们是十美刀,也就是七十块钱的订阅套餐,算下来 也就是十几块钱嘛,其实已经非常划算了。好了,今天的视频就到这,我们下期再见。
粉丝10获赞88

我用 plan 模式跟 cloud code 聊了两天,打了四千四百四十七个字,然后他用两分钟生成达到我目标的代码,爽。 嗯,马上,今天不错啊,这两天呢,是用这个 cloud code 的 plan 模式去实现了。我当工作当中一直需要手动或者说是 很有限的自动的一部分重复的生成代码的工作。呃,用两天的时间完成,也是一个碎片的时间,这两天的时间,我 绝大部分的时间都是在用 plan 模式去跟 cloud code 去对话,去确认我们这个事情该怎么做。哎,生成代码我感觉两分钟就生成出来了, 但是他非常的爽,因为最终呈现的状态非常的满意,不会再像之前那种哎呀,做一半就非常 confuse, 他 也不知道做到哪里去了,你也乱套了, 然后就放弃了。所以呢,今天来分享的是用这个 class code 的 play 模式去实践的一个 心得。嗯,然后今天换了这里。是因为啊,今天是有稿件的,是写了一个总结的。对。 嗯啊,那第一项是说 play 模式的试用啊,我也用,也就是有过没用 play 模式去帮我随便的用我的已经有的这个 ui 测试的自动 化去生成一个平台,完全没有问题,他自己开启了 play 模式,问了我几个问题,就是架构选型啊,是否需要数据库之类的,他就自己去生成了,完全没有问题。 然后我现在需要做的是,我本身已经有一个接口测试的框架,我在加入新的测试 case 的 时候,那我需要把每一个 嗯接口的架子,它包括一个拍摄文件,一个压缩文件去生成,然后呢,根据我具体的接口,然后去把这个压缩文件,根据这个接口的请求啊,它的,呃 header 的 类型啊,它需要哪一个登录的 cookie 啊?它具体的请求的 参数是什么?参数列表是什么?他,呃请求当中是否要替换的变量?呃。返回了响应之后要提取哪些变量?这些所有的东西原来是我手动的,现在的话呢,只需要输入少量的配置文件,然后呢?再加上, 嗯,我给他提供一个接口的文件,就都能自动化生成了。然后生成这两个文件之后我还有一个列录的文件,就是说我这一个 case 可能需要调用多个接口,并且它是有顺序的,是有依赖关系的, 然后这个也通过我去配置一个简单的这个文件,他都能帮我一步的去生成。 哎,就是说 plan 模式就适合这种。嗯,它是一个以一个平面的形式插入我们的工作,而不是一个,呃,从零到一,你就帮我做个平台吧, 那种的话可能更适合你直接做。然后这种就是我有明确的步骤让你做什么,只是可能我没有梳理的那么清晰具体的实现方案,你能实现什么?不能实现什么?没有那么清晰具体每一个细节我们去做什么?比如说我拿接口,我是用叉二四去给你接口文件, 还是说给你复制粘贴出来还是什么?就这些细节我不确定,但是大的步骤你做什么不做什么是非常清楚的。而且呢涉及到你要改我的代码,你要在我的这个跨文件跨模块当中去提取我的内容,然后生成内容去改代码的,这种就非常适合这个 play 模式。 嗯,这是第一点。然后呢就是开始我们要开始去做了,那这个项目适合去做 plan 模式呢,我们就开始去做。那开始之前呢,一定要做好这个版本管理,因为它是要改我们的项目的, 你要把我们自己的这个项目先保护好,因为万一做砸了呢,是吧?啊?这是第一,第二的话就是思路,就是我刚才之前说的,你可能 思路没有那么清晰,但是你已经有一个大概的框架了,这个还是要有的,具体的内容我们是越聊越有的,包括我们做了什么,我们有时候没想到的这些在我们的 plan 模式当中都能聊到,所以这个不着急。 然后好,那我们就开始做了,开始做的当中呢,这里面呢,我分为三类,一类呢是说要尽早去做的,其实呢就是说把我们, 也就是说 cloud code 它的厉害之处就是在于它能形成上下文,它会有记忆,如果你明确的告诉它,这个我们要形成上下文的,它会记到文件里,记忆不会磨损,不会越做越走形,越做越变形, 所以他不会主动去做的,这个是我们要求他去做的,所以我们要有意识的尽早的在这个 play 模式的讨论中去形成一些内容的上下文。 然而他不一定是一开始就有的,所以有东西一开始我们不确认,有的是确认的,所以我们要有意识的,当我们讨论到这个点的时候,你要告诉他,哎,这个就是我们的约定,就是我们的规则,你要把它记录下来,每一次都去留他去。 对,但包括哪些呢?第一点这个是做之前我们就有的是人设,人设的话呢,我一般我觉得就是说不管你是做一个测试工程师还是一个数据分析师,这些都可以, 第一就是要求他专业,第二是要求他是与我们合作的,就第你首先不是我的下属,不是我说什么就做什么,那你要跟我去讨论,你要主动去思考,你要提出质疑,你要提出更多的方案,提出我这个所想到 所没有想到的地方,我们是合作关系,然后你不能说我干啥你就干啥,你也不问,然后就瞎做,或者说是,哎,做一半发现,哦,我没想全,那 这个 ai 的 话应该已经发展的比他厉害了,这个你要跟他说,然后呢就是告诉他不要擅自行动,我们充分讨论,充分提问,充分之后 再去做,而不是你想象的你就开始做了。这个不要就是说普拉模式的一个克制的精华,就是一定不要着急写代码,这个人设是要跟他说好的,就是专业与合作, 然后呢还要形成上下文的,就是我们慢慢形成的一些规则。第一就是不要着急写代码,我确认了再去写,我们充分的考虑好之后,第二就是你要阅读我现在已有的代码,在你了解我代码库的基础之上去做我们的 讨论,因为这很重要,因为我们的你的工作不是从零开始的。哎,这一点呢,就是 我在做的过程当中发现他 ai 还挺懒的,他总是不愿意读我的代码,我也不知道为什么,可能是我使用的问题还是怎样。嗯,就是他会问我问题,我说这个问题你通过读代码就能解决,我也把这个地址都告诉你了,你为什么不去读呢? 然后他有的时候问我的细节,我说哎,你为什么还没读代码呢?或者他告诉我他读了,我发现他没读全,我说这个你读代码就能解决,你也说你读了,你为什么还问我呢?就是我要一直的去鞭策他, 并且后来我要做去考他,我说那你读完了,你告诉我他的实现路径是什么?实现原理是什么?然后让你让我能安心的让你确定读了 鞭策几次之后是管用的啊,他是会记得这个放在我们的这个规则里面会更好一些啊,但是还是要警惕,要鞭策他啊。然后呢,就是我们在讨论当 中就会形成一些共识的概念,就像我们看一个需求文档一样,那我们在在讨论到我们这个业务当中的时候,是会形成一个 框,定出一个概念,把它提炼出来,方便我们以后去讨论的这个让他记下来这个约定的概念就 ok 了。 然后,嗯,规则的确认,还有包括就是关键逻辑的一个上下文,就是当我们讨论好了一些东西的时候,你就要去记下来,那以后我们讨论都基于此,都基于我们的共识,不要再反复拉抽屉了。这个也是我在这次实践当中发现的, 问了又问,问了还问我说你把它记下来吗?好,然后呢,这些规则在慢慢形成的时候呢,我们也慢慢形成了计划,那计划呢?包括几个方面啊?这里面呢,是我在做了一次实验之后,按照时间的顺序又给 梳理了一遍。第一就是引用的文件和目录,就是你基于哪些你基于我的项目去去上面做改造也好,做开发也好,那我要告诉你我的目录在哪里,你要去看。第二呢就是使用的场景和目标,就是我在一开头说过的,那我是要做什么?原来我的步骤是什么? 呃,我的目标是你用自动化的,你通过我给你提供一些我们讨论之后充分的配置之后,用自动化的方式帮我实现哪哪哪些步骤, 让我达到过高程度的转化。嗯,这个就是我们的目标,那目标也就包括边界了,就是你做什么呢?就包括你不 做什么,就比如说我这里面就是你帮我实现完了这个列录的文档之后,那后面的这些执行都是我去做啊,但是你不告诉 a i i 是 不知道的,我们要在讨论当中把它逐渐的明确出来,然后让它记录到上下文当中啊,这是场景和目标,下面呢就是我们 呃计划里面进行的方案,呃方案就包括大的方案步骤,这个每一个我们讨论充分之后,把它就是具体的我们怎么去做,用什么工具,用什么 方法。然后呢要就是具体的,一个是确定,一个是先进行可行性分析,然后再进行确定,这个有的是他去让你试一下的,你能否提供,你确实是提供完了,我们可以用这个是要进行一些实践的,然后大的方向这个步骤里面的。 呃方案确定了之后,我们还要确定一些细节,就是具体的,比如说我们在确定了就是那我最终还是肯定要给 ai 提供一个配置文件的,那我当我们确定了提供一个配置文件之后呢?我们又分析了我们用什么样的配置文件,是用压缩文件啊?还是用一个? 呃,那个 python 文件呢?或者怎么样?那我们确定用压缩文件之后,就具体的大的方案之后的细节,方案的每一个参数, 我们怎么去约定?他有几个美居值?不同美居值我们需要怎么处理?这个细节也是要讨论出来的, 然后这个也是可包括他的可能性的分析。呃,是可扩展性啊,以后的就是在这个当中你还是可以跟他去对话的,那就是说我有这些计划,你考虑怎么样呢?你基于对我们项目的分析,基于你的经验,基于我们刚才讨论的内容 啊,你分析有什么风险呢?还有什么问题你反过来问我呢?就这些是要跟 ai 去反复的推敲的,你跟他去讨论的,你是真的拿他当一个工作伙伴,甚至他是你的领导,是一个比我们更资深的专家,你要去问他的这个 越问越有还是很好的。这前期确认下来的前景确定性越大,最后那一下两分钟产出的内容越爽。 然后呢?最后呢?对,然后讨,我们一开始给了场景和目标,然后当我们讨论完大的方案和细节方案之后,我们再一次去确认, 再次跟 ai 去确认,通过讨论之后我们的功能是什么?我们的最终形态是什么?我们最终的步骤是什么?再次的确认和对齐,我是这么理解的,你是不是如果有什么问题我们再讨论? 这个一定要,我觉得这个步骤还是很重要的,因为他可能也会聊篇,包括中间我们说的一些规则,一些关键的逻辑,你如果不跟他说保记录上下文,他有的时候确实会记不下来。 嗯,这个还是挺重要的,就是再次去确认。然后呢?当我们快结束的时候,就是你刚才跟他说,那我们确认好了,再生成代码,然后我们后面会有一个验收,我会有一个实际当中的 case, 这是测试吗?那我肯定有一个十岁的 case 我 们去跑通。那如果是写代码的话,可能就是你要通过单测啊,或者你要通过一些 哪些典型 case 的 测试啊,或者怎么样,你要去通过这个测试,或者是一个什么率吧,什么之类的,就是一定要给他一个验收标准,让他在做事情的时候先去自测,先去自我审视,然后再来问我们,然后再出最后的 结果,这个是也是能保证最后结果不跑偏的一个挺重要的工作。嗯,然后以上就是步骤了,就是慢慢的我们通过讨论,哎,最后他就可以开始做了。 嗯,然后呢?下面是在我们做讨论当中的这个注意事项,就是第一不要错过细节。你在讨论当中, 他说的时候,哎,你发现他说的某一个词很模糊,比如说什么,他就说那我们就做一个半自动化,我们就做一个,哎,你就要问他,那你所谓的半自动化到底是哪个步骤自动化,哪个步骤不自动化? 就是这些细节一定要框定好,不然他就按他说的,就像我们在需求讨论中跟人说一样,他就按他说的走了。你这个半自动化太模糊了, 你心里的和他心里的可能不一样,这个一定要说。然后第二呢,就是讨论中啊,你要发现他有错误,一定要指出来,并且让他记住这个很重要,不然他就按错的走了 啊。第三就是刚才说过的,一定要去考他,让他去看代码。嗯,他真的还有点懒,其实我觉得这有点像 ai 幻觉吧,让他说起来就是他总骗你。 然后呢?嗯,第四个讨论中要注意的事项,刚才也说过了,就是要互相提问,互相验证, 对,就是要不断的不要烦,因为前期做的越充分,后面的程度会很好。 嗯,说完了,然后这就是有了这些之后呢,那我们能生成的这个产出,那可能就是刚才像我这个工作,我跟他说的是我们要产生一个 python, 也要做成一个 skill 啊,这个就很简单了,就很轻松,做出来的东西也很容易成功。嗯 嗯,然后呢,还是要注意的,就是第一要物理存档,这个啊,这是一个阶段性的工作,有了成果,或者是你要休息了,或者是你要结束今天的工作了,一定让他存档。但是这个我为什么听说物理存档我觉得很有意思。 他,我今天跟他说存档就是把我们的阶段性的成果,阶段性的这个确认的事项 记录下来,他居然告诉我,哦,好的,然后列下来,我已经存了这些存到塞舍里,我说你怎么存塞舍里?我是一个 windows 电脑,我一会就关机了。呃,我,我可以用 rec 我 们文件去回复,但是 他有失败的可能性了。我说你一定要进行物理存档呢,他会生成一个 percy 的 点 md 文件。哦,那我觉得安心多了。然后就是还是定期去 review, 这是另一个注意事项。呃,以上这些都做到的话,一呃那 cloud code 的 强大指数就会翻倍, 做出很好的。反正我今天的铲除啊,但是我今天其实做到最后还是有 bug 的 啊,但是我已经很满意了,因为他做的东西是我想要的,有点小 bug 再改,明天我再鞭策好了,今天就到这了。

克拉蔻蔻的刚刚推出了一个叫做 alt 旁的隐藏功能,翻译过来就是超级计划模式,它的作用就是让你的计划模式不再只是局限于终端,而是会将你的计划发送给云端,然后由多个 up 四点六的智能体并行的给你进行工作,为你构建出 更深入,结构更完善的一个计划。我使用了一个相同的提示时,分别在普通模式下和超级计划模式下进行运行。在超级计划模式下, 不只是计划的一个构建速度变得更快了,就连执行的时候速度也会变得更快。但是我认为最大的可能性是因为计划模式构建的更加的完善, 所以在运行的时候就能够更好的去追寻他的一个指令。使用方式也特别的简单,你只需要输入斜杠,然后然后输入你的提示词就可以了。 但是这里有几个点也是需要注意的,首先既然叫做 out, 那 么他的头梗消耗肯定是必然会增多的。我使用一个 pro 账号在超级模式下跑了一遍,然后然后我的五个小时的限额就达到了百分之七十, 同样的一个提示值在普通模式下面就只消了百分之三十。其次就是你无法在 cloud code 的 一个桌面端还有网页端进行使用, id 一 扩展也不行,你只能够通过命令行进行调用,也就是终端和 id 一 里面的一个终端。 那么在演示之前,我先快速的给你讲一下它的一个原理,让你有一个基本的了解。我们一开始在本地的电脑上启动 cloud code, 然后和它进行对话,开启超级计划模式, cloud code 会将这一个计划发送到云端, 云端呢会进行有多个智能体并行处理这一个计划,就是说有好几个智能体在云端帮你做这个计划,他们是并行的,这个时候你就可以在浏览器中进行审查,也就是说他发送到云端之后,你需要打开你的浏览器,这个时候 你就可以提出来,然后让他进行修改,然后他再进行规划,然后你觉得 ok 了,你就可以把它发送回你的终端, 终端开始计划的一个执行。那下面我们就进行一个超级计划模式的一个演示。 ok, 我 这个是一个铺账号,然后我们先来看一下当前的一个使用量,我目前是 五个小时,限额是零的,然后目前使用的是二十六点三 k 的 一个托克 模型,是 up 四点六,这里可以看到我是破定云啊,我这里用的提示词都是统一的,包括超级模式下和普通计划模式都是统一的这一个提示词。 当你的提示时钟有超级计划模式的时候,他会提示你是否发送到云端,然后这里选择确定发送到云端之后呢?他会给你一个呃地址,我们只需要把这一个地址复制到你的一个浏览器中打开就可, 然后我们这里可以看到他已经在执行了,可以看到我左边这里是有一个之前就是我在做测试的时候进行的一个计划, 这个时候你其实是可以在你的终端里面进行任何操作的,也就是说,也就是说他云端在执行计划,但是你的终端也可以。呃,做其他的事情,终端不是说你,卧槽,这速度也太快了,我还没有说完, 我们来看一下他的这个,然后他这个在云端执行,你可以进行审查的时候,你是可以评论表情包的,就是类似于我们飞书里面的云文档进行进行评论一样,就是你可以加入表情包, 我们来看一下他的内容是没有问题的审查,如如果有审查呃不对的地方,你就可以在这里进行修改, 我们可以看到他在下面这里有一个呃在云端执行和在终端执行,我们这里把它选择发回终端, 我们可以看到他的在这个呃规划的过程中,他的速度是就是特别快的, 就我刚刚可能说了还没有几句话吧,他就已经是规划好了, 然后执行的时候速度也挺快,一共执行了三分二十秒,他就已经完成了。然后我现在打开我的一个网页,我们进行看一下,可以看到现在我的网页是呃之前是这一个样子,然后 我再让他本地拉开浏览器,看一下他修改之后的一个样子。 ok, 我 们本地打开之后就发现了他的变化还是挺明显的。 ok, 这个就是超级计划模式的一个效果,然后在视频后边我会再放普通模式的一个全程录制, 看一下时间以及托肯的一个消耗。因为现在我的账号是需要等待五个小时之后,他才能够恢复到五个小时零的限额,所以我需要在完全零的限额上面是上面去进行对比,这样才能够知道他的一个托肯消耗量。我们现在先看一下这一个超级计划模式的托肯消耗有多少? 这一个计划模式跑了 pro 账号五个小时限额中的百分之七十,这个其实算很多了,就哪怕是一个普通的 pro 账号也算很多了,因为我提示时写的其实是比较完善的,其实改动的地方并没有很多, 然后他依然跑了百分之七十的一个限额,所以我猜测他可能是在云端进行多个智能体的一个限额,所以我猜测他可能是在云端进行多个托管会特别的多。 然后现在我们切换到普通计划模式看一下,先看一下账号,然后现在是零的额度,五个小时限额是零的,我们复制粘贴我们的一个体制词,和超级计划模式是一样的, 然后你可以看到它的一个计划执行速度是没有超级模式快的,花了四分四十秒才把计划写完,然后现在开始执行计划, ok, 现在执行完了,他现在花的时间是七分三十一秒,也就是说他从写计划到执行计划完成花费了七分三十一秒,而我们的超级计划模式在执行阶段只花了三分半,然后计划规划的时候是特别快的, 话都没有说几句。在普通计划模式下执行的这一个页面其实是有一些小细节在的,比如说你看把鼠标移动至上面会有 高亮,包括他后面的粒子是有点类似于 o c 顶的那一种连接的感觉,这个比之前那个漂浮的粒子是要好的。然后我们来看一下他花费的一个托克量, 个拓展量只有超级计划的一半,它只消耗了百分之三十七。然后现在我必须要告诉你,你不能不知道的它的一个使用前提,以及它的一个使用限制。 首先第一个你只能够在终端里面去使用网页版桌面端和 i d e 插件都是不可以的,除非你在 i d e 插件里面的终端里面去启动。 然后第二个,然后第二个限制,你必须得有一个 get 仓库,因为它要发送到云端,那么云端如果要进行同步,就必须得有一个同步的地方,而很明显在这里的话就是 get 仓库了。 但其实这个是挺简单的,你只需要在你的电脑的任意一个地方创建一个新的文件,然后把这个文件的路径复制下来,打开你的终端,进入到这一个文件,然后打开你的 cloud, 告诉他,告诉他把文档 get 到仓库, ok 就 可以了,就这么简单。但是还有第三个问题,就是当他在云端进行计划规划的时候, skill 会调用失灵,会忽略使用 skill, 目前我还没有找到,目前在我的测试中,我还没有找到好的一个 方法让他去调用 skill, 我 只能够在我只能够在他进行计划规划的时候输入对应的一个审查,审查里面包含了我要调用的一个 skill, 明确的告诉他,他他才能够调用,就类似于我们在终端把 skill 的 名称输入出来, 强制他去调用的那一种感觉。但是从官网里面我没有看到有明确的关于这一个 skill 的 一些 说明,就是他的官网里面关于这一个超级计划模式的说明也特别的少,就是我不确定他是匆匆上线的,还是说在调试中, 然后我还发现了第四个问题,就是这一个问题,我不确定是我自己本身的呃网络原因还是说 是他自己本身的原因,就是如果我说我在云端启动的话,他没有办法同步到我的 get 仓库里面,这时候我们不是有三个选项吗?然后第一个是在云端执行,第二个是发挥谁发送回终端。 然后我在之前的测试中,我选择从云端执行的话,他是没有办法同步 get 到我的仓库的,也就是说他是,也就是说他虽然写了计划,并且也去在云端执行的,但是他没有和我同步。我不确定这是因为我的网络原因的问题,还是说其他什么样的原因。 因为这个超级计划模式是在前两天圆满泄露中呃暴露出来的一个模式。然后就我当前测试下来的一个情况来看,首先他的托梗消耗特别的多,第二速度是比较快的,第三虽然速度快的,但是他在 一些项目进行的时候,如果说他没有主动去调用 skill, 甚至他有时候出来的效果还不如普通计划模式,所以我目前测试下来的一个情况来看,就是他速度特别快 是唯一的一个优点。同时因为我不是程序员,我的手里也没有对应的呃大型的任务,所以我不确定他在大型任务下的一个执行情况会如何,或者说他就是为了一些大型计划模式而去呃推出来的。 如果说你的手上正好有一些超级大型项目的话,你可以使用它去跑一下来看一看效果。 ok, 这就是本期的全部内容, 如果说你觉得对你有所帮助,那么欢迎你留下小心心,这对于我来说很有帮助。同时如果说你有更多的关于 coco 的 问题,欢迎在评论区留言,我们下次再见。

今天啊,我会用一个视频给大家讲明白什么是 cloud 点 md, 以及你应该如何使用它。首先我们来看一看什么是 cloud 点 md。 首先 cloud 点 md 是 一种规定、约法或者是原则,它 可以避免 ai 健忘或者是跑偏。第二, cloud 点 md 是 用于补充上下文的,那我们知道模型的上下文会有哪些内容啊?首先会有你跟他的聊天记录,过往的聊天的历史以及调用各种工具的输入,还有缓存。 cloud 点 m d 补充是什么?上新闻呢?它补充的是那些仅凭项目内容本身无法被 ai 准确推断的信息,比如说你的使用习惯,你的工作流程以及你的代码规范等等。 第三, cloud 点 m d 也是属于按需下载的,它有自己的层级结构,非常类似于公司的组织架构。那我们来对比一下公司的组织架构是什么样的?假如你入职了一家公司,那这家公司一定会有自己的规章制度、章程和文化。 一个公司下面通常会有非常多的部门,比如说有开发部、市场部、产品部、运营部等等。那比如说如果你在开发部门,那开发部门会有自己的技术架构、代码风格以及写作的方式, 市场部门他也会有自己的品牌的定位,受众的群体。那如果我们把这个公司的组织架构放在 cloud dmd 这个层级架构上,你就很清晰的明白了,根目录的 cloud dmd, 它就相当于公司的规章制度、章程和文化,是所有项目都应该遵循的基本的规范和准则。 下面这些部门其实就类似于你电脑上的某一个开发项目,那这个项目会有自己特定的需要被约束的规章制度、规范流程等等。那 给大家看一个括号点 md 呢?它就包含了有代码风格,那你应该使用 e s 的 语法,不要使用 com g s, 那 有可能情况下你先使用结构导入,那以及他都有他的工作流程,比如说在完成一系列代码修改后,务必进行类型的检查,那这就是一种约束和规范。 那我们知道了 colldmd 是 什么,它有层级结构,那我给大家演示一下我本地的 colldmd 是 什么样的。首先我们看看我们根目录的 colldmd 到底是什么样子的, 那我的根目录就要求,比如第一个默认进入 play 模式,第二个是用子代理策略,第三个要做自我的循环的改进,它是一些总体的约束规范,是每个项目都必须遵守的。那我们再看一看一个项目级别的 colldmd 是 什么样的,那比如说这个项目就是我用来把 md 的 文本转成图片的一个项目,那我们看看它的 colldmd 是 什么样子的。 那这个刻到点 m d 呢?就是 ai 来帮我生成的,不是我手工编辑的。每次在我发现 ai 的 输出不准确或反复的犯一些错误的时候呢,我就会让 ai 总结,把这些案例经验都写到这个刻到点 m d 里面。比如说这里的一个案例是说图片高度计算的问题,他反复的出错,那我就会让他把整个的过程给我描述出来,以及说最终 怎么才把这个问题给修复掉的经验全部都总结在这里,以及说一些没有一开始发现的错误,到后期如何去发现它的这个过程,经验教训都放在这里面, 我们可以清晰的感觉到不同层级目录架构的 copy md 内容是不一样的,那在根目录下的它更多的是总体的所有项目都应该遵循的规范和约束。而项目项目的 copy md 更多是和这个项目本身有很大关系的,比如说这个项目的技术架构规范,它的一些经验教学总结等等,也是可以放在项目维度的 copy md 里面的。 那第三,我们如何创建 collude md 文件呢?那创建 collude md 呢?有两种方式,第一种方式就是你手动到项目下面去创建一个 collude md 文件,然后手工去编辑它,那这种方式肯定是比较麻烦的。还有一种方式啊,是 collude code 给我们提供一个很方便的命令,可以让我们一键的生成 collude md。 我 给大家演示一下,首先我们进入 collude, 开启一个绘画,然后斜杠调起一粒的命令,然后回车, 这个时候啊这个命令就会自动的帮助我们去读取当前整个项目的结构规范等等文件,那这个过程会需要一些时间。 好了,那这个时候我们的 cloud dmd 已经创建好了,让我们来看一看它的内容。那首先它这里面有整个项目的概述介绍,这个项目是干嘛的,以及常用的一些命令部署方式以及 它的架构、核心服务,这些全部都给生成出来了。那你之后在迭代过程中,那你的 cloud 就 会去遵循这个 cloud 里面的一些背景信息,然后能够更好的帮助你去迭代。那第四, cloud dmd 的 最佳实践是什么? 经过过去一段时间的使用啊,我总结大概这四点的 color d m d 的 最佳实践,第一点是要保持 color d m d 的 简洁易读和清晰。第二个你需要定期去维护啊,你可以让 ai 帮你去做总结,去写 color d m d, 但是你还是需要定期的去人工 re view 去删除那些可能不太合适的,或者是说非常繁杂庸俗的。第三个呢,是你需要反 反复去测试,如果效果不好,你再去修改,然后再去测试,经过一段时间打磨啊,你会找到一个非常适合你的长期用的 color d m d 文件呢。第三个团队协助。那如果你是存在多个人一起开发一个项目嘛,我建议你把 color d m d 提交到代码仓库里面,这样相当于大家都会遵循同样的一份 color d m d 的 规范去做开发。第四个是本地多项目, 那如果你本地有多个项目需要开发,那我建议你使用拷好点 md, 你 可以把你的工作流程,你的代码规范等等东西都写在拷好点 md 里面,那你这个多个项目都会遵循同样的这个工作流程和风格去开发。那如果你本地只有一个项目,你要不要在公众下面创建?拷好点 md 其实没有那么重要,你可以不用创建。 第五个拷好点 md 的 模板参考,那在这里呢,我整理了两份拷好的点 md 的 模板,一份是简单版本的,你可以直接拿去用的。拷好点 md, 这个我自己用了一段时间之后,我发现效果非常的棒啊,很推荐你来试一下。那如果你还有任何不明白的地方,欢迎你在评论区跟我留言。那我是新起,每天分享一个外包固定的小技巧。

你可能听说过 cloud code, 但觉得它跟你没关系,因为名字里面带一个 code, 感觉像是给程序员用的。其实不是。 cloud code 是 一个通用的 ai agent, 它能操作你电脑上的文件,能运行命令,能上网搜索,能一步步地帮你把事情做完。写代码只是它能干的事情 之一。比如我最近用它做了一个 ai 资讯日报系统,每天早上它会自动去抓取各个渠道的 ai 新闻,筛选、整理深层记,要最后输出一份排版好的日报,整个过程不用我动手,它自己跑完。这还只是其中一个例子, 整理文件、处理数据、批量改图、自动化那些重复的工作,只要你能用文字描述清楚,他就能帮你干。本期视频会教你如何安装并使用 cloud code, 不 需要任何技术背景,跟着做就行。如果你用过科室,可能会问, cloud code 的 和科室有什么区别?核心区别就一个,协助方式不同科室是对话式协助,你说一句,他做一步,每一步都要你确认,你得全程盯着向待一个实习生。 cloud code 的是任务式协助,你把需求说清楚,就可以去干别的事情了。 他自己执行完,你回来看结果就行。向交代任务给一个靠谱的员工。接下来我们来讲具体怎么安装,分成两步。第一步,先安装 cloud code。 对 新手来说,最简单的方式就是用 tree 来装。 tree 本身也是一个 ai agent, 可以 帮你处理那些烦人的依赖和环境配置,而且可以免费使用。我们 来到官网,先点击这里下载安装 tree, 装好以后打开它,在对话框输入帮我安装 cloud code。 tree 接着会自动帮你装好,中间可能会弹出一些确认弹窗,点击确认就行。怎么验证安装好了呢?打开终端,输入 cloud 杠 version, 如果能显示版本号就说明安装成功了,然后再输入 cloud, 能看到主界面就对了。第二步,装一个格式化界面,原生的 cloud code 是 在终端里面用的,对新手不太友好,推荐在 vs code 的 里面装一个插件界面,会友好很多。具体步骤,先下载 vs code, 然后打开它,点击左边的扩展图标,搜索 cloud code, 点击安装,装好后点击 cloud code 的 操作界面了。接下来我们来讲怎么配置 cloud code 的 ai 模型。 cloud 的 扣就像一双手,它需要一个大脑,这个大脑就是大圆模型,所以装好之后你得给它配一个模型才能用。有两种方案, 第一种方式是订阅制,直接订阅 cloud 的 官方会员有三个档位,二十美元一个月,一百美元一个月和两百美元一个月,主要区别就是使用量,订阅之后登录账号就能用。不过最近 cloud 的 订阅分号比较多,如果不想折腾的话,可以考虑下面这种 a p i 模式。 a p i 的 来源有两种渠道, 第一种渠道是官方 a p i, 比如国外的就像 cloud openai, 国内的就像智普 mini max, 去官网注册充值就能拿到。第二种就是第三方中转一个账号,能用多种模型,支付方便,有些比官方还要便宜,但稳定性就具体看平台了。购买 a p i 后,你会获得 a p i key。 p i p 就是 一长串字母,你在平台充了钱,平台给你一串 p, 你 填写了 p 以后,它就知道该找谁扣费了,用多少花多少更灵活。那么怎么配置呢?推荐使用 c c switch 来管理 github 上面搜 c c switch, 拖到底部,点击 release, 找到适合你的版本, 然后下载,打开后可以添加多个 a p i p, 点击右上角加号。如果你选的是官方 a p i, 比如像是 g o m, 那 么你就在这里 直接填写你的 api key 就 可以了,其他信息都已经自动填好了。如果你选择的是第三方中转站,就选择自定义配置,然后这里需要填写,嗯,供应商名称,供应商名称你就自己去写一个你自己能记住的就好了。然后这里要写 api key, 还有默认的模型。具体怎么填写呢?一般 api 中转站都会有一个开发者说明文档,你直接把这个链接丢给你的 ai, 然后告诉 ai 你 要在 cc switch 里面配一个 api, 然后让他给你对应要填写的信息就可以了。配置好后,点旁边的魔术棒图标测试一下,显示运行正常就说明成功了,点起用就可以。现在你可以打开 cloud code, 输入你好,你是什么模型, 他会回复你,能正常对话就说明一切配置完成了。接下来你可以试着给他一个简单任务,比如帮我看看当前文件夹有哪些文件,按列表列 行,给我一个清单,他会真的去执行,然后把结果告诉你。到这里你已经装好了 cloud code, 配好了格式化界面,接好了模型。下一步建议从简单的任务开始,比如整理文件,总结文档,过程中遇到报错也不用慌,截图丢给任意一个 ai 聊天工具问基本都能解决,慢慢熟悉以后再尝试更复杂的任务。 这是 cloud code 系列的第一篇,后面我会继续讲如何用它来做更复杂的事情。有哪些进阶功能。我是阿西,我们下期见。

你真的会用 clock code 吗?这条视频不讲基础入门,只讲十二条能明显提效的高阶用法。第一组, esc, 再按一次 esc 可以 回到上一条消息继续编辑。 shift 加 tab 可以 快速切换 plan 模式和执行模式。 第二组,井号开头适合把长期规则写进 clock 点 m d 感叹号开头可以直接跑命令,再把结果接回当前绘画。 第三组, slash compact 用来压缩长对话。 slash permissions 用来集中管理授权,这两个命令特别适合长任务。第四组, slash at 第二适合 monroe repo slash review, 适合提交前让 cloud 进入真正的代码审查节奏。 第五组, slash terminal setup 可以 装好多行输入绑定。 slash vim 则适合喜欢纯键盘编辑 prompt 的 人。 第六组,自定义 slash commands 是 长期提效最大的能力之一,再配合 ctrl 加二反向搜索历史,找回好用 prompt 会非常快。一句话总结,真正提效的关键不是会不会问问题,而是能不能把 cloud code 用成你的工作流。

今天给大家分享两个项目,专门是用于武装你的 cloud code 和 codex, 它的作者都是一个人,都叫 o my cloud code 和 o my codex。 我 们直接看一下这个 cloud code, 因为 cloud code 它有个 type 模式,效果会比 codex 要好一点。虽然 codex 它的这个模型感觉会更聪明一点,但是 cloud code 它各种配置啊,还是要更好一点的。把这个装上之后,它的功能就会非常的强大, 首先它可以根据你的任务给出这样的一个配置啊,还是要更好一点的。把这个装上之后,它的功能就会非常的修复, 它大概是这样的一个流程,而且每个里面它都有这种团队成员角色,它一共是三十多个,它收集了三十多个,所以说它还是效果非常的好。然后它是可以去协调其他的一些 c i 的 命令,比如说 codex, 比如说 jimmy, 比如说你用一些思考,可以用 codex 这种计划的搭建,比如说像有一些是前端 的一些内容,其实就可以用 gemite, 然后实现的话可以用这 cloud code, 但是它综合都是用的 cloud code 来进行综合的,并且可以进行并行执行啊,因为 cloud code 的 team 模式它就是原生支持并行的,还有其他的一些 hock 啊。 这个分阶段的方式其实跟这个病型是一起的,它用 opus 的 模型,它自己会去判断各个任务之间是否有依赖,它一共有三十二个这种智能体,那我们看一下它是怎么样去安装啊?其实这些都不用管,你直接把这个项目直接给到 cloud code, 它就可以安装了, 然后都推荐大家可以去用这个 team 模式,因为我也是开源了一个专门去创建 team 角色团队的一个项目,叫 cctime creator, 我 认为它这个里面有非常值得借鉴的。首先第一个 他的这些团队成员可以借鉴,他的一些提示词可以借鉴下来。还有就是他的模型的智能路由,因为你必须要去测试了之后你才知道什么模型适合做什么样的一个角色项目。但是他里面也有一个坑了,他也是没有提到的,因为像现在的 cloud code, 他 一照上下文的是 o p s, 如果你授权 o p s 去做执行,他默认是继承的一照上下文,他的成本就很高,他要达到一照的时候,他才会去压缩上下文, 其实在三百 k, 五百 k, 它甚至跟 sonata 的 这种能力是差不多的,但是你要一直到一照上下文,所以说它的这个性价比极差,这也是一个比较大的坑。所以说我的这个项目都是默认 这几个角色都是默认的这个 sonata 的 模型,这也是有一定坑存在。再就是它的这个技能,它技能是可以沉淀下来的,自动的管理技能,自动的进行学习,而且它技能列表也是非常多,这个也可以进行一些借鉴。但是我认为它这个还是有一些欠缺的点在哪里呢?它是没有一个叫 持久化状态,或者说叫文件存储的,它是没有详细去说明它这些任务啊,这些派发的任务啊,进度啊,这些是保存在哪里的,所以说这个点也是它这里面不太好的,它没有借鉴这个 plan with fails 这个项目, 这个项目的话才能让这些智能体在压缩了上下文或者说重新启动的时候,它能继续之前的一个状态进行下一步的执行。 但是它这个就纯是在依赖 cloud code 的 一个能力了。不过整体来讲,它这个东西还是非常完整的,很多东西它都已经加上去了,之前非常火的这个持久进行执行的模式也加上去了,然后它的一个正规的工作流程的编排, 先要 plan, 再去按照这个 plan 做计划维护,再做修复。整个流程它是做的非常好的,但是它 codex 就 没有那么多 codex, 它基本上就不像 cloud code 的, 它是支持这个 p 模式的, 我也一直在找这个,有没有哦。一些框架可以把 codex 直接转化成类似于 tim 模式的方式,因为你起这种子智能体,其实你 token 消耗比 tim 模式还要高,因为其子智能体它都是一次性的, 那很多已经拿到的上下文下一个任务的时候,它其实是可以附用的,但是你起这种子智能体,它状态是没有保留下来的,所以说它做并行处理,做子智能体的时候,它的 token 消耗很恐怖, 而且很多时候他的上下文其实是不饱满的,所以说死神人体你只能把它当成一个工具来用,你没有办法把它当成这种角色,不同角色不同员工之间的这种协调,只有这个 cloud code 的 能去做这样一件事情。 ok, 最后也给大家推荐一下我这个开源项目, cctime quitter, 把这个装到这个 skills 里面, 你去跟他沟通,他自己去创建这几个角色,当然你让他创建其他角色也是一样的,其实他是学会的这样的几个原则。 比如说这个是后端的,这个是前端的,这个是研究调研的,这个是端到端测试的,这个是 review 的, 这个是管理所有东西的管理文档啊,管理这些代码有没有一些技术债啊?这种东西的。

cloud code 源码解析第四期这一期我们单独拆 doing tasks 模块,这部分决定的不是 cloud code 会不会写代码,而是它默认怎么做事。 很多 ai coding 工具的问题不是模型不会写,而是默认工作流太短。 clock code 会先读,先想先计划再动手改,再回来验证。 doing tasks 模块本质上就是 entropic 写给 agent 的 工作 sop。 如果把这一套流程抽象出来,大致就是五步,理解上下文,提出计划、执行、修改、验证结果,最后再收尾同步。重点不是步骤多,而是每一步都在降低瞎改代码的概率。 第一步是先理解上下文, cloud code 会被鼓励先读代码,先查文件,先确认边界,而不是上来就写实线。这一步看起来慢,但它是在减少反攻和误改。 第二步是先有计划再行动,不管是主线程自己规划,还是交给 plan agent, 本质上都是把任务拆清楚再开始改。这一层能让结果更稳,也让写作过程更容易被人类验收。 最后两步是验证和收尾。 cloud code 不 只是改完就走,它会被鼓励跑检查、确认结果、解释改动,并告诉你还有哪些风险没覆盖。所以它给人的感觉不像补全工具,更像一个会交付结果的工程搭子。 所以 doing tasks 模块最值钱的地方是把做事流程写进了默认 prompt。 下期我们继续拆 actions 模块,看高风险动作。为什么一定要先说明再执行再验证?

我使用的 cloud, 让他帮我生成一个 ppt 啊,然后这个是我的一个文字文案,这边写的一个,然后呢让他帮我们去进行申请啊, 它这个是写的一些代码,然后使用到萨纳特四点六模型,然后它生成好了第一个界面是加什么东西,第二个界面等等之类的一些对比啊,我们来看一下,在这里可以去下载 html, 我 们点击下载,下载完之后我们打开这个文件, 然后看看这个效果啊,这个是界面图一,各大 ai 的 优缺点,然后讲了一些竞品的 ai, 然后写作等等之类的 幻觉率,还有各大 ai 的 对比啊, kimi, 豆包啊,就是国内的一些模型,还做了一些评估,星级就是 g p t, 它是比较 ok 的, call 也是比较 ok 的, 还有比较优缺点啊,都给我们详细的列出出来了, 就多模态长文本,提示词比较敏感,推理能力强,逻辑念入清晰,幻觉率少啊,对复杂的论证写作就可以使用到 cloud, 还有等等各种各样的,还有 kimi 上下文 等待深度,各种各样的,都给我们做了详细的测评啊,感觉还是不错啊。如果大家也想使用到 cloud, 用来写作,科研,做数据分析,写代码等等,都可以点击我主页的置顶作品找到我。

大家好,今天聊 ai agent 设计模式系列第二篇, plan and execute。 从一篇 a c l 论文到 antropics 的 工程文章,再到 cloud code 的 源码,看看先想清楚再动手, 这个思路是怎么一路落地的?上一篇讲了 react, react 跑简单任务没问题,但你让他去重构后端跑测试 tpr, 做着做着就忘了最初要干嘛。你看左边这个 react 的 每一步,嗽特只管下一步怎么走,没有一份写下来的大局计划, 遇到长任务就容易跑偏。 plan and execute 就是 来补这个的。右边是解法,先把所有步骤列出来,写成一份任务清单,再按清单一步一步执行。遇到问题也不是临时换个做法,而是退回来看整个计划,方向不对就改计划文件 规划和执行,拆开来做。这个思路学术界早就有人研究过了。二零二三年的 react 论文, plan and solve prompting 编号,二三零五点零四零九一。你看这三张卡片,第一张是问题,第二张是解法,第三张是实验结果。论文发现 zero shortcut 老是出两个问题,计算错误和遗漏步骤,一查原因就是模型没想清楚全区,就直接开始推理了。所以解法很简单,把提示词拆成两步, 第一步先把问题想清楚,列好计划,第二步再按计划一步步解,结果在五类推理基础上,全面超过了 zero shot cut, plan and sovi 加甚至追上了 few shot cut, 而且不需要任何额外势力。论文解的是推理题,但给出的答案跟 a 帧 t 设计思路完全一样, 也就是先规划再执行。顺便解释一下, zero shortcut 就是 只加一句,让我们一步步想来触发推理,不给任何势力。 few shockcat 则是手动写好几个带推理过程的视力塞进提示词,效果好,但费人工。那工程上怎么落地呢?二零二四年底, andrew pick 出了一篇 building effective agents, 用工程的话把规划于执行分离这件事重新描述了一遍, 叫 orchestrate surveillance 模式。这里还是三张卡片对应三个角色。左边 orchestrate 负责规划,把大目标拆成一个个子任务指出方案不动手,中间撒被枕负责执行,拿到此任务就去用工具干活,只管把眼前这部做完。右边两者之间专门留了一道人工审批 计划出来,先给人看一眼,确认了再开始执行。 antropic mate planet execute 这个名字,但 orchestrator's agency 说的就是这回事。规划归规划,执行归执行,中间加一道门。再来看跨的 code 的 原码,实现方式,有点出乎意料, clove code 没有拆出独立的规划组件和执行组件,整个流程就跑在一个 query loop the well 处循环里,靠一个权限值加一份计划文件, 把三个阶段全撑起来了。你看这段代码按颜色分了五块。紫色是 plan 阶段模型,调用 enter plan mode 系统把权限切到止读,写操作直接被拒。 模型在止读状态下翻代码库,把要做的事写进计划文件。橙色是用户审批模型,调用 x, a, p, m, o, d, 等用户确认,用户点头之后, mode 恢复到原来的状态,写操作重新可以用了。 这一步就是 antropica 强调的那道人工确认门,绿色是 execute 阶段 run to us 跑起来模型,对着计划文件逐步改代码。 红色是 replay, 没有独立的触发机制。计划文件就是词盘上的一个普通文件,执行过程中随时能改。发现计划有问题直接用 file 器 tool 改掉,下一步就按新的来,不需要系统介入。 assistant messages 和 tour results 一 起合并记 messages turncount 加一下一轮继续 mod 的 直,决定这一轮干什么。一个全线直控边界,一份计划文件串流程。以上是基于 cloud code 的 本地源码的观察,不代表官方完整实现。好来总结一下。从三个层面看, planet execute。 从论文层面看, planet solve 提供了先规划 在执行的提示,词范是从工程层面看, andropic 的 orchestrator work 讨论的是如何把这种思想做成可上线的 agent 架构。从 cloud code 的 原码来看, plan mode 则是把先想清楚再动手,落实成了实际工作流。规划和执行是两种不同的认知,任务 只有显示分开,长任务才能跑得远不跑偏。从一句提示词到一篇论文,到一套框架指导,再到 quad code 的 原码, planet x q 特的核心从来没变过, 先想清楚再动手。本期的内容就到这里了,感兴趣的话可以去看原论文与 antropics 的 博客,点个关注不迷路,我们下期见。

今天咱们做个真实对比测试。同样的智普官网, glm 五 plan 大 模型,同样的提示词和 md 文档,分别搭配 cloud code 和 tree 两款开发工具,生成一整套前端工程,看看差别到底有多大。 先用 cloud code 搭配 glm 五来生成,整个过程分三步完成,第一步是整体生成文件,一共产出三十六个原码文件,耗时十分五十秒。第二步安装依赖启动前端服务,用时一分三十秒。 第三步生成模拟数据,再次启动服务,用时两分十秒。 整体流程清晰,执行速度也比较快,最终呈现效果如下。 再来看 tree 搭配 glm 五,它支持一步直接生成,不用多轮交互,全程只需要一次对话就能跑完,最终生成三十四个源码文件,整体耗时大约二十一分钟, 最终呈现效果如下。 从最终生成效果来看,两套方案做出来的前端工程其实差别并不大,功能和结构都能满足需求, 但在使用体验和效率上区别就很明显了。 cloud code 需要多轮对话操作,但整体耗时更短。 tree 可以 一键生成,一步到位,不用反复交互,不过时间会更长一些, 所以同一个模型在不同开发工具上的表现确实会不一样。到底是模型更关键,还是工具更重要?大家可以根据自己的使用习惯,自己来判断,自己来选择。


挑扣的可以帮大家做什么呢?你只要说一句话,帮我写一篇文章,做一个 ppt, 再整理一份数据,你会发现几秒钟之后,文件就已经在你的电脑里面生成好了,这个就是现在 ai 已经可以做到的事情。 今天呢,这条视频我想用十分钟的时间带大家从零到一去入门 cloud code, 和大家分享怎么把它用起来。首先呢, cloud code 是 什么?一句话讲清楚, cloud code 呢,是一个住在你电脑里面的 ai 助手,它不是聊天工具,而是一个执行工具,你可以把它当成你的助理或者是员工, 它能帮你去读电脑里面的文件,帮你整理文档,分析数据,上网查资料,做 ppt, 写文章,生成图片,这些它都可以做到。而且最关键的点是,它会把结果直接生成在你的电脑上面,而不仅仅只是给对话建议,它是可以做到执行和交付的。 那具体应该怎么去用 cloud code 呢?首先呢,安装方式我们有三种,第一种呢是桌面版本,这是最推荐的方式,操作很简单,大家可以直接打开 cloud code 的 官网,下载 mac 或者是 windows 的 版本,双击安装 cloud code, 登录你的账号,这个呢就像装微信一样, 然后你下载下来之后呢,直接就可以使用。第二种呢是命令行的安装方式,这种方式会进阶一点,如果你稍微懂一点技术呢,那就可以使用这种方式,大家可以先装 node g s, 然后输入一行命令,然后直接去安装下来。 安装之后呢,你可以打开 terminal 或者是 windows 的 power share, 然后输入 call 就 可以使用。如果你是小白,然后直接用第一种方式就可以了。第三种方式是网页版的,这个是最简单的,就是不用安装,打开网页直接就能用, 但是这个缺点就是它不能够直接去操作你的电脑文件,所以它比较适合体验,但不太适合长期的去用。然后安装完了之后呢,接下来我们就可以开始第一次的对话了,打开之后呢,你会看到一个输入框,这个就像微信聊天一样,你可以输入, 比如说哈帮我写一段自我介绍,然后比如说我是做跨境电商五年,那语气要专业一点,帮我生成这个介绍,然后直接点击回车,那几秒钟之后呢,它输出的一篇非常完整和详尽的内容就出来了,而且 关键的来了就是你还可以去跟他讲帮我对比亚马逊 shopify、 tiktok 以及 shop 帮我做成表格,并且保存成文件。 而且这里要特别的注意就是它不仅仅只是帮大家去分析,它会直接去帮你在电脑上面生成文件,你可以直接在你的下载里面直接把它打开,这个就是和普通 ai 最大的区别。 那第一步跑通之后呢,我们可以进阶更多有意思的玩法,如果你只是一问一答,这个其实只是入门,这里会有几种玩法。第一种玩法呢是直接处理文件, 比如说你可以跟他讲读取我桌面的客户反馈的文件夹,整理差评的原因,做成分析报告给到我,那他就会自动去读取你给到他的文文件,然后去进行分析,原来半天需要做的工作,现在只需要几分钟就可以搞定了。第二种玩法就是一句话,多个任务, 你可以同时让他帮你干三件事儿,比如说翻译文案,做实业 ppt, 写一条推广文案,一句话就可以拿到三个工作结果。第三种玩法就是调用技能 skills, 你 可以理解为就是给他安装各种插件,各种功能,比如说做 ppt, 做推文,生成图片, 直接说他就会在你跟他发出指令的时候,自动去加载和调用这些技能包。第四个玩法呢是联网和调研,比如说你跟他讲说帮我整理二零二六年跨境电商的政策变化,那他就会去在线进行搜索,然后做文件的信息的整理,然后最后帮你输出文档, 一条线就直接就帮你把这些事都搞完了。所以非常建议大家直接去装,直接去试,让他帮你现在就完成你生活当中真实的一个场景,解决你实际生活当中的一个案例,然后让他帮你去提升效率,然后我们就可以用这些节省下来的时间去做其他的事情。

今天咱们来聊一个事儿, cloud code play mode。 欢迎来到 cloud code 全站观察。这是第七集。前几集咱们聊了 skills m c p sub agents work tree。 有 朋友跟我说, cloud 功能越来越强大,但有时候让 cloud 做一个复杂任务,它做着做着就跑偏了,怎么办? 那么问题就来了,怎么让 cloud 在 做复杂任务的时候不跑偏,少返工?还真有办法,就是今天咱们要说的 plan mode。 说到这儿,可能有朋友要问了, plan mode 是 啥?我打个比方你就明白了,盖房子之前,你得先画图纸对吧?不能想到哪盖到哪,不然房子肯定盖歪。 plan mode 就是 让 clod 先画图纸,再干活儿。普通模式下,你说一句话, clod 立刻就开始动手,好处是快,坏处是容易出错。 plan mode 不 一样, 你输入任务后, clod 会先分析再规划,然后给你看完整的执行计划,你确认了,他才开始一步步执行。说到这儿,这就很关键了, plan mode 的 核心价值是先想后做,谋定而后动。进入 plan mode 也很简单,快捷键 shift 加 tab 两次,或者输入斜杠 plan 就 进去了。那么问题就来了, plan mode 到底好在哪? 我总结了三大优势,咱们一个一个说。第一个优势,先想后做,咱们来对比一下,同一个任务,用普通模式 vs plan mode, 结果有什么不一样? 普通模式下,你说帮我把这个 js 项目迁移到 ts, cloud 直接就开始改,改到一半,发现之前的思路有问题,又得返工,最后改得一团糟。 plan mode 下, cloud 会先分析项目结构,然后给你看迁移计划。第一,初步化 ts 配置。第二,安装类型定义。 第三,按依赖顺序迁移核心模块。第四,处理边界文件。第五,运行测试验证。你看完计划,觉得没问题,点确认, cloud 才开始执行。 说到这儿,这就很关键了。数据说话,同样的复杂任务,用 plan mode 反功率从百分之四十降到百分之五。第二个优势,大局可控。 plan mode 下执行计划分布展示, 每一步要做什么,为什么要做,都写得清清楚楚。而且每步执行前都会问你 继续吗?你可以确认修改或者跳过,想调整策略随时暂停,告诉 cloud 新的方向,它会重新规划。这就像什么?就像你开车用导航,普通模式是自动驾驶,你说去哪儿,它就自己开了。路线你控制不了。 play mode 是 先给你看地图,问你这条路行不行,你可以改路线加停靠点。第三个优势,成功率提升。这是最实际的一点。根据实际使用经验,同样的复杂任务,用 play mode 的 成功率能提升三倍以上。为什么? 因为提前规划,避免了返工,就像盖房子先画图纸一样,不容易盖歪了。说到这儿,你可能想试试了,但等等, plan mode 不是 什么时候都用。说了这么多,咱们来做一个实战演示。 假设咱们有一个 javascript 项目,想把它迁移到 type script, 你 会怎么做?传统方式是先搜教程,看文档,然后手动改配置,改文件。最后测试验证用 cloud code play mode, 你 只需要说一句话, 当我将这个项目从 javascript 迁移到 type script, 然后你看它会怎么做?第一步,分析项目结构。 cloud 会先扫描整个项目, 了解有多少文件,什么架构,用了哪些依赖。第二步,制定迁移计划。它会生成一个详细的计划,第一,初步化 type script 配置。第二,安装类型定义依赖。第三, 按依赖顺序迁移核心模块。第四,处理边界文件。第五,运行测试验证。每一步都有说明。第三步,执行计划。你确认了计划之后, cloud 会一步步执行,每完成一步,他会汇报结果,问你下一步继续吗? 如果某一步有问题,你可以让它重做修改,或者跳过这一步。第四步,验证完成。所有步骤完成后, cloud 会运行测试,检查 type script 翻译是否通过, 确保迁移成功。整个过程你只需要说一句话,剩下的 cloud 帮你规划好,执行好。说到这儿,你就明白 plan mode 的 威力了。 最后说说使用技巧,什么时候用 plan mode 复杂任务,比如说添加一个用户认证,系统架构重构代码迁移。不熟悉的项目 什么时候不用简单任务,改个变量名,修个错别字,快速原型验证,直接改,更高效计划力度控制也很重要, 你可以告诉 cloud 规划到什么程度。粗略规划指列主要步骤,详细规划会具体到每个文件的修改。 plan mode 和 sub agents 配合使用效果更佳。先用 plan mode 制定整体策略,然后用 sub agents 并行执行各个子任务。 说到这儿,技巧你也掌握了。好了,今天咱们就聊到这儿,回顾一下重点。第一, play mode 是 先想后做,让 ai 先规划再执行。第二,三大优势是减少反攻,大局可控,成功率提升。第三,复杂任务,用 play mode 简单任务直接来。下一集 咱们要聊的是成本优化省钱秘籍。这是系列的最后一集,咱们来算一笔账,用 cloud code 一个月到底要花多少钱?怎么省钱?下集咱们详细说,别忘了点赞、收藏、关注系列持续更新,咱们下期再见!

大家是不是还在手动画这种机智图啊?今天来给分享一个非常简单的方法,把这个简单的指令以及我们的需求发送给他,他就能直接生成一段提示词,我们复制这段提示词,然后打开配套,我们在这里粘贴, 然后全选,可以选择各种各样的,我们点击机智图等待他就能直接进行生成,并且在这里可以去进行二次编辑分层,也能直接点击下载,如果大家也想使用的话,可以点击我主页的置顶作品找到我。

家人们最近收到超多私信,很多朋友说之前用 cloud 的 时候踩了不少坑,要么官方注册门槛高,要么正常使用过程中账号容易出现异常。一直问我有没有稳定合规 the cloud 官方 api 接入方案必须安排, 今天这条视频手把手教大家零门槛快速上手,全程步骤清晰,看完就能直接用。首先第一步,咱们打开对应的合规 api 服务平台, 进入首页后,先点开模型广场,在这里就能看到全系列的 crood 官方模型,选择非常丰富。咱们先完成简单的注册登录,登录成功后直接进入控制台,找到令牌管理这一栏,点击创建新的令牌,令牌名称可以自定义 使用期限和额度,根据自己的需求设置就可以访问限制,不用勾选。提交保存之后复制深沉的密钥,这一步一定要保存好,切勿泄露。接下来给大家讲问的最多的 code, code 的 api 配置方法一步都别落!首先咱们先下载 cc switch 工具, 这个工具是专门用来做第三方的 api 合规适配登录的。下载完成后,打开选择,添加供应商,点击统一供应商选项, 这里的 api 地址,咱们回到刚才的平台首页,复制官网的主域名地址,粘贴过来。 apikey 就 添咱们刚才复制好的令牌密钥, 官网地址,同样粘贴刚才的平台主域名。咱们回到平台的模型广场, 复制你想用的模型全称,粘贴过来,点击保存。保存完成后返回主页,点击起用,接着打开终端,输入 cloud, 按下回车,选择第一个选项,再按回车, 就能成功进入 cloud code 的 操作界面了,咱们现场测试一下看,已经成功响应,完全可以正常使用了。我是梦花寻影,关注我,解锁更多 ai 技巧。

用了三个月 cloud code, 七个技巧让你效率翻倍。第一,写 c l a u d e d m d, 告诉 ai 你 的规范,输出质量翻倍。第二,用 plan 模式,先出方案再写码,扫走百分之八十弯路。 第三,报错直接粘给他,自动修复。第四,用斜杠命令 compact 压上下文, review 省代码 commit 自动提交。 第五,让他写测试再写代码,覆盖率比手写高。 第六,百万上下文,别浪费相关文件全喂进去。 第七, getwork tree 隔离实验,不怕搞坏主代码,学会这七招,超过百分之九十用户。

大家好,今天来聊 ai agent 设计模式系列的第二篇, plan and execute, 结合蓝铅的工程实践总结以及 cloud code 泄露的原码,一起看看这个模式从定义到落地是怎么一回事。上一篇讲了 react, react 是 reasoning 和 acting 的 合并,本质是一套让模型交替推理与行动的机制。但你让它去重构整个后端,跑测试 tpr, 它就开始出问题了。 做着做着忘了最初要干嘛,在某个细节里越陷越深,最后导致局目标丢了。这不是 react 笨,也不是它的设计失误。根本原因是规划和执行是两种不同的认知。任务规划需要局视角,需要在不确定条件下做延迟判断。 执行需要聚焦当前步骤,需要快速行动,让同一个循环同时承担。这两件事本身就是矛盾的。 plan and execute 的 解法很直接,把规划和执行拆开,各司其职。 plan 阶段,列出任务清单,接到用户目标后,列出一份详细的任务清单。清单内容包括,先做什么 厚做什么、依赖关系是什么、完成标准是什么都写进去。啃烂阶段,不负责动手。 execute 阶段,逐步执行,拿到任务清单后,把每一步翻译成具体的工具调用和代码操作。 execute 阶段,不操心大局,走向 replay, 重新评估判断任务完成了吗?计划还对吗?需要调整继续走吗?关键在于 plan 阶段的输出,不追求更聪明,追求的是足够具体。具体的标准是让 execute 阶段照着走,不会走岔。 lincoln 把这套思路落地成了具体的工程实现,将它规划成 planning agents, 也叫 planet execute agents, 核心流程是三步,第一步, planner, 先列出多部任务清单。第二步, execute 逐步执行每一部调用工具。第三步,执行结束后,系统触发 replanning planner, 再次判断任务完成了就结束,还没完就生成新的任务清单,再跑一轮 execute, 一直到 planner 判断完成为止。 react 是 边想边做,走哪算哪。 plan and execute 是 先想清楚,做完再看是否要重新想。来看看 cladd code 是 怎么把这套思路落地的。 实现方式有点出乎意料, cladd code 的 不拆组建,用同一个 y l 处循环,靠全线状态切换和计划文件,把 plon, execute 催 plon 三件事都跑在里面。 plon 阶段, 模型判断任务复杂后,调用 enterprise mode 工具,把权限状态切到 plan, 权限一切换,系统就会拒绝其他文件的写操作,这是强制约束,不是靠模型自觉被限制住之后,模型只能做一件事,探索代码库设计方案,把任务清单写进计划文件。 escape 阶段,规划完成后,模型调用 exit plan mode 的 提交计划,等用户审批,用户确认后,权限恢复,写操作重新可用。模型照着计划文件开始改代码 replan, 这不是 execute 之后才触发的独立步骤,而是嵌在 execute 里的能力。计划文件是词盘上的普通文件,执行阶段,模型有写权限,随时可以改。模型在执行过程中持续参照这份文件,它是接下来做什么的唯一依据。 发现计划有问题直接改文件就行,改了下一步就按新内容走,不需要等执行结束,也不需要系统触发, 靠的就是普通的写工具。三个阶段跑在同一个 agent 循环里,不拆组建,靠一个权限直划边界,靠一份计划文件做交接。有意思的地方在于,这个循环本身是 react 的 机制实现 planet, execute 是 在它之上, 靠全线状态和计划文件构建出来的模式,同一个循环,不同的抽象层级,这和 lincoln 的 做法形成了有意思的对比。 lincoln 里 planner 和 execute 是 两个独立组建,执行完后由系统主动触发 replining, 这是结构层面的分离。 clog code 没有这种结构分离。不拆 planner 和 execute 在 同一个 agent 循环里,靠权限,只把 plan 和 execute 阶段隔开,靠计划文件把三个阶段串起来。总结一下,两种落地思路解决的是同一个问题,让 agent 在 抢任务里跑得远还不跑偏蓝圈。用架构分离 planer 和 execute, 各管各的 v planning 游戏同主动触发括号 code, 用状态切换,全线直划边界,计划文件传意图,不拆组建,不新增机制。两种方式背后的想法是一样的, 单靠一个循环跑不了长途。先规划再执行,随时能重新评估,是让 agent 真正走完长任务的核心设计。本期内容就到这里,想了解更多细节的同学可以去看下 lincoln 的 博克与 cloud code 的 原码,点个关注不迷路,我们下期见。