观众朋友们大家好,今天我们的站点迎来了第一波内测更新,主播在新的板块当中优化了先前板块的算法,在零额外基础设施的前提下,实现深度跨论文交叉分析。 现在我们的平台支持一次性导入十五篇参考论文。随后在上方的模型选择部分,选择自己想要使用的模型,输入对应的 api 秘钥,随后这个模型就会在我规定的框架下对论文进行切片研究,给出对应论文创新点。 这边我们三十二倍速跳过思考时间。 好的,我们可以看到这边 ai 已经完成了对论文的分析, 这个板块是主播制作的论文问答部分, 他会在你所给出的论文当中寻找你想要问题的答案,并且标出出处。
粉丝109获赞1107

你可能以为做好 cloud code 关键是会写提示词,但真正拉开差距的其实是 skill。 因为 skill 不是 一句提示词,它更像是给 cloud code 装上的工作模式。今天这六个实用 skill, 新手装上以后基本就能少走一大半弯路。 第一个, prompt optimizer。 当你只会说帮我优化一下,帮我改个功能的时候,它会把你的模糊需求改成更清楚、更可执行的任务描述。 你不用一开始就会提示词,先让他帮你把话说清楚。第二个, deep interview。 有 时候不是 ai 不 聪明,是你自己也没想清楚要什么。这个 skill 会让 cloud code 反过来采访你,把目标、边界、验收标准 一步一步问出来,特别适合做新功能、做产品页面或者需求还很模糊的时候。第三个, real plan 大 改项目之前,最怕 cloud code 上来就动手。 real plan 的 作用就是先出计划,再拆风险,再确认测试方式。它适合那种会影响多个文件、多个模块的任务,先把路线定清楚,再开始写代码。 第四个, ultra qa 功能,写完不代表真的能用, ultra qa 会让 cloud code 进入测试、验证、修复的循环,不是只告诉你我改好了,而是继续跑,检查、 看报错、修问题,直到结果更可靠。第五个, ai slow cleaner。 ai 写代码最大的问题不一定是错,而是味儿太重,比如重复逻辑、空泛、封装、变量名很虚,代码看起来很聪明,但没人想维护。这个 skill 就是 专门清理这种 ai 感,让代码变得更像人写的,更像能长期维护的项目代码。 六个, visual verdict 如果你用 cloud code 做前端海报、视频画面,这个非常关键,它不是问好不好看,而是拿截图和目标参考去对比判断布局层级、间距、颜色、还原度到底差在哪里。 所以这六个 skill 不是 让你背更多提示词,而是让 cloud code 在 不同任务里自动切换成更合适的工作方式。不会提示词的新手先装这六个,真的会稳很多。想要我继续整理 cloud code 的 高频 skill 清单,可以先收藏这一期。

大家好,今天让 code code 把我的整个投资体系框架进行全面的复盘和吸收,然后他提出了一些完善和改进的建议。首先对整体的交易看板做了完善,除了对相关 ui 界面优化外,还新增加了一个信息源,就是对当前持仓重点各 跟踪的板块的一线行业信息进行同步追踪,追踪频度为每隔两小时对相关信息进行自动抓取,这个数据会作为整个投研的底层数据之一。另外增加了一个几种对标,目前是和沪深三百创业版进行对标,当前跑赢一点八六个百 百分比。此外, openclo 今天做出了当日的投资策略和交易指令,今天有两笔买入,两笔买入都是现有持仓的加仓,现在总持仓仍然是其之,整体仓位来到了五成以上。好,今天先聊到这,下期见。

我将为你讲解最核心的知识点,关于 cloud code, 你 需要了解的一切。无论你是新手小白、进阶玩家,还是资深专家,这正是我当初入门 cloud code 时梦寐以求的指南,因为它无疑是当今全球最顶尖的 ai 工具。 但功能越强大,上手时难免会有些迷茫,不知道如何才能最高效地把它用起来。所以本期视频将帮你拨开迷雾,直达核心,只给你最干货、最有用的信息,让你今天就能现学现用。话不多说,我们马上开始。 第一个技巧就从安装说起。过去几个月,官方已经把安装流程优化得非常丝滑了,而且真的只需要一行代码,无论你的系统是 mac、 windows 还是 linux, 你 只需复制对应自己系统的命令,打开终端,粘贴命令,然后回车,安装程序就会自动引导你完成设置,整个过程用不了一分钟。 第二个技巧,我们来聊聊 comcode 的 应用场景,因为你不用一直守在终端界面里,而且如果你是第一次接触直接操作终端,可能会让人望而生畏。 其实我们可以用 ide, 也就是集成开发环境,说白了就是能让我们用上更直观的图形界面,方便我们使用 cloud code。 而且免费的选择一大堆,比如这里展示的 visual studio code, 你 看,我这里依然开着 cloud code 的 终端,但在左侧,我能一目了然地看到所有正在处理的文件夹和文件,点开文件,里面的内容一览无余,操作起来非常直观。 其他选择还有 cursor, 甚至 clunk 桌面板等等,这些工具同样能发挥 clunk 扣的全部威力,只不过操作界面换成了更易上手的图形界面。 接下来是第三个技巧,权限设置。大家注意看忘按 shift 加 tab 的 时候,就能浏览 clunk 扣里的各种权限选项。这些设置决定了 clunk 扣哪些操作可以自行完成,哪些必须经过我的明确允许。 如果这里什么都没选,那就是默认设置。这意味着它只能读取文件。但要是想编辑或修改文件,它就得先征得我的同意。如果我打开了接受编辑开关,它就能自行修改文件,无需再征得我的同意。但如果它想运行霸式命令,也就是要实际操控我的电脑。无论是安装依赖包,还是执行删除文件这类操作, 它都得先征得我的明确许可才行。接下来看这个绕过权限开关。这是一个特殊的权限设置,需要你以特定的方式启动 qq。 如果想起用它,我必须使用 cloud dangerously skip 权限来启动 cloud code。 那 么这个设置允许 cloud code 做什么呢?它允许 cloud code 直接修改我的电脑,例如下载某些依赖包,或者未经我明确许可就删除文件。 这确实有点危险,但它能让你更快速地完成你的工作流程。所以随着你越来越熟练这个功能,你很可能就会用上。不过,刚开始的时候,如果觉得这太冒险,那就先坚持使用接受编辑开关。 接下来是第四个技巧,你可能刚刚已经注意到了,那就是计划模式开关。这是 cloud 最强大的功能之一,也是在设置方面你必须掌握的功能。每当你着手一个新项目,或是想要开发一个全新的功能, 而计划模式。顾名思义,如果我给 cloud 下达一个任务,比如说,嘿,用 react 和基础 ui 组建创建一个简易的任务追踪应用, 他并不会直接接过指令就开干立马动手写代码,而是会先跟我来回沟通几轮,他会问我一些问题,我们一起商量确定最佳的推进方案。接着他会制定出一份完整的计划,让我在他真正动手执行之前,先过目审核一下。这就是他为咱们这个简易应用制定的计划。 计划里详细列出了环境配置、需要修改的文件、应用的整体设计、实施步骤,以及最后的验证环节。然后他会给我们几个选项,比如确认清除上下文、确认绕过权限确认、手动审核修改。 当然,你也可以直接告诉他你的任何要求,比如说,等等,先退回上一步,我想换个方式来坐这里或那里。大多数情况下,你会同意清除上下文,并绕过权限检查。 我们会在终极课程里再深入聊聊这个话题,具体讲讲上下文窗口,以及为什么清除上下文。这个操作直观重要。 现在随着他开始执行,他会逐步分解任务,把所有的功能项基本上都列成一个清单,你可以时时看着他一项项完成。 接下来是给初学者的第五个技巧,斜杠命令,顾名思义,它们就是斜杠开头的命令。如果我在提示窗里输入一个斜杠,你就能看到一堆我可以执行的不同斜杠命令,而且数量还真不少。好在当你输入斜杠时, conoco 会解释每个命令的用途, 不过有几个命令你肯定会想随时调用,并且会频繁使用。首先,你大概想知道的第一个命令是 model, 我 就可以在 infopack 提供的不同模型之间切换。 默认情况下,你使用的是 opus 四六,我可以切换到上下文窗口更大的 opus 四六,或者换成 sanit 嗨客等其他模型。如果你比较在意令牌消耗或者使用成本,这一点就特别重要了。而且你总会想用上最强大的模型, 我还能调整它的用力程度,也就是说,我可以控制 opus 动多少脑子,毕竟不是每个任务都需要它火力全开。 opus 就 好比是解决每个问题的核武器,威力巨大。 另一个好用的斜杠命令是 revine 回退。用了这个命令,我基本上就能时光倒流,回到对话和代码的某个之前的状态。你可以把它理解成游戏里的独档,回到上一个存档点。所以如果你对之前的操作不满意,不用再跟他说嘿,我们退回去也不用费劲解释具体要改哪里,直接输入 revine 就 行了。 另一个非常重要的命令是 contacts 上下文,这个命令能让我们看到当前上下文窗口里到底装了些什么。说到这里,我们就进入了第二部分终极教程,主题是上下文窗口管理,这是你用好 clock 必须掌握的核心技能之 一。下面我们快速过一下上下文窗口和令牌 tokens 的 概念,因为理解它的工作原理直观重要。如果你想充分发挥这个工具的潜力, cloud 的 任何操作都会消耗令牌 tokens。 令牌就是 ai 系统里的硬通货,每次我发送或接收消息,每当 cloud co 调用消耗代币的 m c p 使用工具或查看系统提示时, 现在我们设定了代币预算。 cloud co 的 预算是二十万代币。现在问题不在于我们能用的代币数量有多少,对吧?有些系统的上下文窗口能容纳百万代币,问题在于上下文腐坏这个概念。 上下文腐坏现象表明,当代币使用量达到大约十万时,也就是达到 clock 预算的一半,或者说大约十二万代币时,我们 ai 系统的效能就会急剧下滑,对吧?开始断崖式下跌。所以,既然我们知道了这一点,那就直观重要,必须避开上下文窗口后半段这个危险区。如果我们想处理任何复杂任务, 这意味着我们必须时刻掌握动态,也就是要清楚我们的上下文窗口已经被占用了多少。一旦发现快进入红色警戒区了,我们就得从头来过,需要重置那个上下文窗口, 下面我来演示具体怎么做。就像我刚才演示的,随时输入斜杠 complex 命令就行,就能查看当前上下文窗口的使用情况。目前这个绘画里我们已经用掉了两万一千个令牌,总共有二十万个才用了百分之十一。不过假如我用到了百分之六十到七十,想重置一下的话,那我直接输入科尔命令就行了, 这样就会清空我这个绘画里的所有聊天记录,同时重置令牌使用技术。这听起来可能有点吓人,因为你大概已经习惯了在网页应用里和 ai 系统打交道,一旦清空所有记录, ai 就 没了上下文,你基本上就是在和一个啥也不知道的机器人瞎聊,它完全搞不清状况。 好在对我们来说,在 conq 里面,它始终保有上下文,因为它随时都能查看我们的文件和项目,了解我们到目前为止都做了些什么。所以重启对话其实没什么大不了的, 但老师输入 context 命令查看也挺烦人的。所以我们可以换个法子,让 conco 给我们创建一个状态栏,实时显示上下文的使用量。 看到下面这里了吧,你看,它显示了我所在的文件夹。 cc stuff 用的模型是 oppo 四点六分,还有我的上下文使用百分比,这样我就能随时掌握令牌的使用进度了。这对于真正物尽其用,发挥这个工具的全部价值来说非常棒。不过这个功能并非开箱即用,有两种方法可以搞定它。 第一种,你可以用我教程里提供的代码直接复制粘贴到 clunk 扣里,它就会自动帮你构建好。或者你也可以直接给 clunk 扣一下指令,告诉它给我创建一个状态型,要能一直显示上下文窗口的占用百分比, 然后它就会照办帮你搞定。通过这种方式来管理你的上下文窗口,能让你把竞争对手远远甩在身后。那些压根儿没考虑过这点的对手,他们只会让 clunk 扣自动压缩处理。 这就是如果你从不手动清理直到触达限制时会发生的状况,它就会再次给你重置掉,我们可不想这样。接下来是第七个技巧, git 和 git hub, 我 们之前简单提过倒带功能,记得吧,如果我输入路由呢?我就能让代码时光倒流,回到代码之前的状态,同时对话内容也相当于一个存档点。但这基本上是新手处理代码存档和版本控制的套路。恰恰相反,我们应该使用 git 和 git hub。 你可以把 dchat 看做一个免费的云端仓库,专门用来存放你所有的代码存档点。它的运作方式基本就是这样, 在 dchat 上注册账号完全免费,它能成为行业标准不是没有道理的。而 qq 在 使用 d 和 dchat 方面可是个行价。 dchat 本质上就是一个底层工具,让我们能够创建代码存档点,然后再把它们推送到我们的 dchat 代码仓库。而完成这一系列操作,简单到只需说一句,关联我的 dchat 账户,提交代码,然后推送, 所以它会一步步引导你如何关联 github 账户,非常简单。提交代码这个操作你可以理解为就是保存代码。当有人让你提交代码时,说白了就是让你创建一个存档点,接着就是推送。 推送的意思是我已经用本地保存好了代码,现在我要把它真正推送到 github 上,这样代码就会存放在一个仓库里,我随时都可以访问,基本上就能看到我的代码了。 现在第八个技巧调试,我们该怎么办?该怎么办?当代码出问题时,你该怎么办?就拿咱们的任务追踪应用来说吧,比方说这个按钮有点不对劲,或者整个 u i 设计都不太对劲。 这时候与其费劲地向 clown 描述问题,我其实可以直接截个图,然后直接拖到提示框里就行,就跟在叉 g p t 或者 clown 网页界面里操作一样简单。 第二个排障步骤更简单,直接把报错信息复制粘贴到 cloud code 里。再比如我在部署应用时卡壳了,而且报错不是来自 cloud code 本身,而是外部环境。比方说我用的就是 firsto, 那 处理起来也很简单,直接复制这段错误代码丢给 cloud code, 然后告诉他,嘿,我碰上这个麻烦了。 至于第三个排障步骤,思路就更高级了,直接从源头上避免问题发生。你可以在规划阶段就指示 cloud code, 让它以测试驱动、开发 t d d 的 模式来执行任务。第九个技巧是把 cloud code 当成你的研究小助手, 它的本事可不止写代码,它还能主动上网冲浪,帮你查找资料,然后利用这些实时获取的信息给出更靠谱的答案。 还是拿我们那个简单的任务应用来举例,与其简单地说,嘿优化一下这个应用的外观,不如这样说,优化这个应用的外观,开启网络搜索功能,去查找二零二六年 ui 设计的最佳实践,对吧?这一点直观重要,绝对能带来额外价值,因为别忘了, com 的 知识是有截止日期的,对吧? open 四点六模型的知识我记得大概截止到九个月前,但从那以后, ui 设计领域又有了新的发展,你可能想把这些新方法应用到你的程序里, 只要你指令他使用网络搜索这类工具,他就会上网去查找当前的最佳实践,从而让你的工作流程效率大幅提升。接下来是第十个技巧,也是中级阶段最后一个最为关键的技巧,那就是你使用这个工具时的心态,这一点对于非技术背景的朋友来说尤其尤其重要。 使用 conco 时,最容易让你踩坑的一点就在于,你不知道自己不知道什么,你可能会踏入自己浑然不觉的雷区。如果你不告诉 conco, 你 正在荒野中迷失了方向,并且对前进的最佳路径毫无头绪。不过别担心, conco 能帮上大忙,尤其是在计划模式下,对吧? 如果我们在计划模式下尝试构建一个更复杂的应用,它会通过提问等方式来引导我们。不过你依然在某种程度上扮演着领路人的角色, 要从在黑暗中瞎摸乱撞,指望 client 给你指条明路的状态中走出来。方法其实很简单,就是直接让 client 给你指路,这就像直接问他,我还有什么地方没想到一样简单。这么做是最佳方案吗?在我正在做的这个项目上,专家会怎么做?他们遇到这种情况会怎么处理? 更进一步说,当你需要弄明白 client 为什么那么做的时候,你需要采取主动,在这段人机协助中占据主导地位。 就拿我们眼前这个任务跟踪器来说,它刚刚生成了意外设计,它会告诉我它做了什么。但如果它说了一堆操作,而我完全搞不懂是啥意思,你就得去问 clunk 了,你为啥要这么做?底层到底是怎么运行的? 你不必会写代码,但你必须理解这些功能模块是如何协调工作的,否则除了像个机器人一样不停地点接受接受接受,你在那里的意义何在?现在 clunk 确实非常强大,很多事情它都能做得非常棒, 以至于你就算只当个舞蹈点击的接受员也能混得不错。但到某个阶段,你必须开始消化吸收,积累经验,真正理解背后发生了什么。否则当你开始接手更复杂的项目,比如让他为一个任务跟踪器搭建前端时,你肯定会在跟头,因为你根本不知道该怎么向 clunk 提问。 没错,你不必事事都懂答案,但关键是要懂得在什么时候提出什么样的问题。有时候你确实需要稍微引导他一下,让他走上正轨,而这正是最终能让你从一个只会跟风敲代码的氛围组蜕变为一名真正热爱开发者的关键所在。 当然,你不可能一蹴而就,这需要时间和经验的积累。不过要想快速提升达成目标,最有效的方法其实很简单,就是在这场人机协助中主动出击,扮演好主导者的角色。好了,关于这一点就聊到这里,接下来我们进入第三部分,这部分将为进阶的学习者分享一些高手专用的专业技巧。 那么技巧第十一条,我们来重点聊聊 call 的 技能。 skills。 现在 call 技能可以说是无处不在,你总能听到大家在讨论它,不过其中也夹杂着一些误解。那么技能究竟是什么呢? 说白了,技能就是一种带有特定标记的文件,它本质上就是一个文本文件。说得更直白点,就是一个特制的提示词,专门用来指导 ka 以某种特定的标准化的方式去完成一项特定任务。举个例子,我们现在看到的这个就是前端设计技能, 这是 quad 官方提供的一个技能,它的作用就是帮助我们创建用户界面,这些结果比 quad 的 常规输出出色的多。我们来看看这到底是什么呢?这不就是纯文本吗?它并没有调用什么特殊工具,它的底层逻辑也没有进行什么高级处理,这仅仅是一个提示词而已,但这些提示词的威力可不容小觑。 至于添加技能,尤其是那些官方的 quad 和 plugin 即可,然后就能调出技能市场。 瞧这里,马上就能看到一些技能,比如 contacts、 七、 superpowers, code review, github 等等。在我已安装的技能列表里能看到我有前端设计工具这个技能,我们可以在市场里搜索这些技能。想要调用这些技能并让 core 使用它们,我只需用大白话说就行。比如用前端设计技能优化一下我们的 ui, 然后立马就能看到提示。前端设计技能优化一下我们的 ui, 然后立马就能看到提示。前端设计技能已成功加载技能,比如输入 funendison 就 行。 现在他就会明白,我们要用那个前端设计技能来执行这个命令所要求的任何操作。我可以创建自定义技能。再强调一遍,创建自定义技能很简单,你直接用大白话说就行。我想创建一个能搞定 x、 y、 g 这些事儿的自定义技能, 他就会帮你创建好,你给他起个苗。你可以直接用自然语言来调用它,或者用一个斜杠命令,后面跟上技能名,就这么简单。 现在第十二个技巧是智能体团队,我超爱这个功能!这其实是 call 代码里目前的一个实验性功能,默认是关闭的,但开启它超级简单,而且 call 代码自己就能搞定。如果你去翻看官方的 call 代码文档,直接搜智能体团队,然后把这段提示词给 call 代码,把提示词输进去, 智能体团队就能跑起来了。那智能体团队到底是啥呢?说白了,智能体团队就是 call 代码开的额外绘画,他们在你的主绘画底下干活,能同时处理一堆任务。还是拿我们的任务追踪应用来举例说明?比方说我想优化一下用户界面,还想给他加个泊客功能,我还想加上用户身份验证。 另外,我还想添加一个类似邮件订阅的功能,让用户可以注册,对吧?这么多事情要一下子搞定可不容易。与其让 quail 单打独斗完成所有这些任务,我们可以起用智能体团队模式,让每个团队成员各司其职,每个团队成员就相当于一个独立的 quail 代码实力在运行。 此外,为了和普通的子智能体配置区分开来,普通的配置是让多个 quail 代码实力同时运行。而在智能体团队里,成员之间是可以互相沟通的。 这样一来,负责优化界面的,负责搭建博客的,还有负责身份验证的,这些成员都能互相交流,他们甚至还有一个团队领导来整合协调所有人的工作,这样整个项目就能完美衔接,形成一个整体。 所以说,智能体团队的设计初衷,本质上就是为了模拟一个真实的开发团队。想要使用智能体团队,你只需要明确下达指令就行。 也就是说,你得告诉跨二代码,用智能体团队模式去完成 a、 b、 c、 d 这几项任务。指令一下达,跨二代码就会自动开始分解任务,明确每个智能体团队成员具体负责什么工作,他们的具体任务是什么,以及需要处理哪些文件。在下方你也能看到标注着本地代理的区。 接下来我们看第十三个技巧。 m c p。 服务器 m c p。 服务器能让你与 call 代码进行交流,便让 call 代码与互联网上的其他程序互动,比如 notion、 figma、 slack com 的 等等诸如此类的工具。 实际上,把这些 m c p。 服务器集成到你的项目里相当简单。如果我们打开 call 代码的文档,搜索那些比较流行的 m c p。 服务器, 就能找到一个现成的简单命令供我们运行,然后把这个命令输入提示框,它就会开始执行任务。不过,如果你想用的 m c p 服务器不在那个现成命令列表里,你也可以直接用大白话告诉它,嗨,帮我设置一下某某 m c p。 服务器, 你还可以吩咐它去网上搜一下教程,照着做,这样它就不会像无头苍蝇一样乱撞了,它会自己上网找到相关文档,然后按步骤完成设置。 另外要注意, m c p。 服务器会占用一部分上下文窗口。有些 m c p。 服务器体积很小,但也有一些非常臃肿的,那些臃肿的服务器一上来就可能吞掉你百分之十、百分之十五甚至百分之二十的上下文窗口,就算你根本没用它,只要加载了它就会一直消耗令牌数。 接下来是第十四个技巧, call 代码框架。这些框架,比如 g s d 高效执行或闭麦保持激情都属于这类工具。 你可以把它们看作是跨 code 的 增强模组,底层核心依然是跨 code 在 运作。但如果我在跨 code 的 基础上套用 g s d 这类框架,它就会改变其处理特定问题的方式和逻辑。至于要不要用这些框架,最终还得看你自己,这很大程度上是个人喜好问题。 不过市面上确实有很多非常棒的框架,能帮你更高效地开发复杂项目。我觉得 g s d 就是 这样一个好用的框架, 它处理上下文窗口的能力以及运用子代理的策略。我特别喜欢它的设计思路。总之,你知道有这些东西存在就好,针对某些特定场景,借助这些框架可能会事半功倍。接下来是专业部分的最后一个技巧,也是个比较新的概念,工作树。 这和我们之前提到的智能体团队概念有点类似。当时我们是让不同版本的 quaco 同时处理不同的任务,而工作树也能实现类似的效果。不过它是在不同的 key 分 支上运作。 操作起来很简单,你只需要用这个命令打开独立的终端窗口。命令是 worktree, 后面跟上你要开发的功能名称。以我们的任务应用为例,我们可以在一个终端里运行 quadworktree feature dark mode 来开发黑暗模式功能。第二个功能是云工作树导出功能。比如说我可以把所有任务打包导出成 pdf 文档, 接着我们会同时启动这两个云代码终端,让它们执行相应任务,最后再把功能合并起来,等它们在各自的工作树上都搞定之后,以上就是我使用云代码时最实用的十五个技巧和窍门。

card code 做前端页面第一版效果不满意,别只会说台版再优化一下,这种反馈太虚, ai 很多时候只能靠猜。更好的方法是让 card code 自己看见页面再继续改。比如你想复刻一个好看的网页,就可以先把参考页面截图提供给他,让他知道目标效果是什么, 等他把页面写出来之后,再把当前生成页面的截图也给他。你可以手动截图发送,也可以配合他的片 n c p 这类工具,让他自己截取浏览器里的真实效果。接下来直接让他对照参考图和当前页面,继续优化布局间距层级和视觉细节。这样他就不是凭一句模糊描述取材, 而是能看着目标效果,再看着自己做出来的页面,一轮一轮往正确方向调整。这个技巧特别适合网页还原,落地页优化, ui 调整前端视觉迭代,让 ai 看见结果比你用文字描述半天更有效。通常多迭代两三轮,页面效果就会比第一版好很多。

大家好,今天给大家分享三款实用的 cloud skill 工具,同时也讲讲为什么我一般不推荐使用 superpowers。 本次分享分为四个部分,第一是 frontend design, 用来优化 ai 前端设计审美。第二是文件处理插件 skill, 支持 d o c x、 excel、 ppt、 pdf 全格式兼容。第三是 superpowers, 主打工作流优化。最后给大家做整体的使用总结。先来看第一款工具 frontend design, 它最核心的作用就是解决 ai 做前端界面的审美短板,它可以改善 ai 生成页面廉价、 没有质感的问题。输出设计完整,能直接部署的前端代码,优化整体的排版和配色,提升最终成品的质感,非常适配前端开发场景,实用性很强。 第二款是全格式文档解析插件,也就是我们常说的办公四件套,它专门适配各类办公文件读取,支持 docx、 excel、 pdf、 pdf 完整识别,还能保留文件原本的格式排版。我们可以直接让 ai 对 文档进行解析、规范和修改,使日常办公里的高频刚需能大幅提升工作效率。 第三款是 superpowers, 这款工具本身可以优化我们的工作流程规整,操作逻辑能力其实很强,但我不推荐普通用户使用,原因有三点,第一, 它的 token 消耗量非常大,使用成本偏高。第二,绝大多数日常普通任务根本用不到它。第三,它功能过于繁杂,反而会增加操作负担, 只建议有复杂重度工作需求的用户考虑。最后给大家做一个工具选择。总结,日常使用优先选择 frontend design 和文档插件,稳定又高效,常规场景下不建议开启 superpowers, 总的来说,大家按需选择轻量化插件,就能有效降低使用成本, 发挥 cloud 最大的作用。我的分享就到这里,谢谢大家。

最近我尝试了一种新的方法,让 agent 自动帮我去优化 skill。 不知道大家有没有遇到像我这样的问题,就是 线上有些 skill 我 们已经在业务里面去跑了,但它的推理效果有时候会让我不太满意。就以前我的做法都是自己去跟 agent 一 轮一轮的反馈,让它去改, 然后我也会去看它改完之后的那个 skill 点 md 或者是其他的一些文件来判断,说是不是符合我的一个想法。后来我发现这个方法有两个挺明显的问题。 第一个就是我们本身并不是 skill 的 使用者, skill 的 真正的使用者是 agent, 所以 我们人觉得有问题的地方,它不一定是这个 skill 最本质的问题,只是我们觉得它不符合我们的一个业务预期,但具体它的问题点在哪里, 其实我觉得用 agent 来判断其实是更合理的。第二个就是人去一轮一轮的改其实真的太慢了,而且很容易漏掉一些潜在的问题。 我们指出了 a 问题,可能又忽略了 b 问题。这种优化其实很多时候是不全面的,而且效率也低,效果也很难做的很到位。所以我现在是用了一种新的方法,就是让两个全新的 agent 互相去盲测,帮我把 skill 一 轮一轮的迭代到位。 试下来我觉得基本上迭代个三轮左右效果就挺不错了。这期就具体讲一下我具体是怎么做的。这里有一个前提需要说清楚,就是双盲测这个方法只针对推理类的 skill, 它才是有意义的。 如果你的 skill 它是这种纯脚本类型的,比如说去采集某个渠道的数据,如果跑出来不对,那肯定就是脚本有 bug, 我 们直接让这个 cloud code 或者 codex 去修脚本就完事了,没有必要去做这种双盲测,因为起多个 agent 的 去盲测,这个 token 消耗还是挺大的。 盲测其实要解决的是这种推理类 skill 优化的场景,就是 skill 已经写了,也已经在业务里面跑了一段时间,但是推理的结果在某些场景下依然不符合我们的业务预期,这种时候盲测才是比较有意义的。 那在启动盲测之前,有两件事情是 a i t 带不了我们的,必须我们先去讲清楚的。第一件事情就是 当前的这个 skill, 它的问题到底是什么?我演示的这个例子就是我有一个自动化广告出价的 agent skill, 它的工作流呢,我是希望它能够多去探索一下不同的出价区间后,去找到我的广告毛利最大化的那一个出价点。跑了一段时间之后,我发现它的探索动力不是很足, 经常是找到一个 roi 一 点二,一点三的一个点之后,他就觉得,哎,不错了,能赚钱,然后就收点了,他就不会再主动地去做探索了。虽然我在 skill 里面也写了一些方法论,让他要多去探索,但是他最终并没有 去落实,所以这个就是我想优化的一个具体的问题,我想让它能够真正地更主动地去做探索,不管是涨价还是降价,我希望它能多去试一些不同的价格,然后去找到一个权取毛率最大化的一个点。第二个我们需要去定义好的点,就是这次 skill 优化它的约束是什么? 这一步我觉得也特别关键,因为如果我们只是把问题抛出去而不给约束的话,那么 agent 对 于 skill 的 改动很容易变成一个反方向的硬规则的这种 补丁。比如说我指出的问题是,他不愿意去做探索,那他可能就会疯狂写一些提示词,让他疯狂的去做探索, 那可能有一些确实不需要探索的地方,他又花了很多成本去探索,这等于就是从一个极端跳到了另一个极端。所以啊,在这个例子下面,我给的约束很明确,就是不管是 skill 的 描述还是工作流的设计,只能给 agent 教方法,不能给他加一些死规则。 因为加死规则的话,像 agent, 他 碰到规则之外的场景他就懵了,他的推理,他的出价逻辑直接就会崩掉,完全没有任何逻辑。 但是如果我们教方法的话,他不管是遇到什么样的情况,他都能用这个方法去帮自己去找到一个合适的解法。所以我在这个 skill 优化环节里面主要就做这两件事情,第一个就是定义问题是什么,第二个就是定义我的约束是什么。 那把问题和约束想清楚,定义好了之后,盲测的迭代其实就是三步。第一步我们在主对话里面把问题和描述一起交代清楚, 让主对话先帮我们去改一版方案,这一版改完之后,我自己都不会怎么去看这个结果改的结果对不对,而是直接进入到第二步,就是让主对话起两个全新的 agent 去盲测, 我一般会用一个 codex 和一个用一个 cloud, 这两个 agent 是 没有我跟主对话之间的这种上下文的,主对话会把这个改完的这个 skill 和我最开始提到的那个问题一起,会给这两个盲测 agent, 让他们独立地去判断这版改完的 skill 到底能不能解决我一开始提出的那个问题, 因为他们没有任何鲜艳的认知,这其实就是我们常说的这个 harness engineering 里面非常重要的一个点,就是做开发任务的 agent 和做 review 的 agent 不 能是同一个 agent, 一个 agent 不 能既当裁判又当运动员,所以盲测的意义就是在这里。到了第三步的话,就是两个盲测 agent 会把他们认为还不到位的地方,需要优化的地方再返回给主 agent, 那 主 agent 会判断这个问题它是不是一个真问题,如果是的话,会按照我一开始给的这个约束,教方法 不交死亏者这样的一个约束继续去优化这个 skill, 那 么这一套反复跑个两三轮盲测和迭代优化这个 skill 基本上就优化的差不多了,这个时候我们就可以把它放回到生产里面,再去看它的实际表现。 那么如果还有问题的话呢,就还是再走一遍这套流程,继续去磨这个 skill 的 一些细节。那么整个迭代过程中,我觉得我作为人的这个工作边界就更加清晰了,就是我只需要去定义我发现的这个 skill, 它的存在的一个问题,以及我在业务上 的一个约束,然后 skill 到底怎么改成什么样子,提示词怎么调,工作流应该怎么设计去编排,这些全部交给主对话和两个盲词 agent 去模。这里面的细节我只关心一个事情,就是这个 skill 再次投入到生产中去应用的时候,最开始提出的那个问题有没有被解决? 说实话啊, skill 跑了一段时间之后,其实这种长推理流程的 skill, 它的啊 skill 点 md, 还有一些 reference 的 文件,一般都还是比较长的,文件也比较多,我们自己去读都还是挺费劲的,更别说一个一个去优化它们。 所以让盲测 a 检测帮我们去找问题做优化,效率我觉得比人手动的去做真的高太多了。如果你们也遇到了这种推理类 skill, 跑了一段时间,但是业务上有一些不满意的地方,我推荐大家按这个方式去试一试。

你们有没有发现一个很离谱的现象,很多人使用 cloud code 的, 不是用不起,是根本不会用。钱不是花在模型上,是花在了自己的低效操作上。今天呢,我讲五个自己在用的方法,直接帮你把这个 token 的 消耗砍掉一半。 第一是任务越模糊越烧钱。很多人一上来就说帮我优化一下这个项目,那这句话的本质是什么?是让 ai 自己去猜,去读,去分析,你一句话模糊了,他背后可能就跑了几十步,正确的做法是直接说 帮我修改第三十二行的报错,越具体呢,越省钱。第二是先总结,再动手接手一个新项目。很多人的第一步就是改代码,这呢其实是最贵的一步,你应该直接说帮我总结这个项目的结构和逻辑,让他先输出一个地图,后面你所有的操作都会更加的精准。 第三是不要重复的喂他代码。很多人有个习惯,就是每聊一句就要重新的贴一贴一遍代码,这基本就等于每次都要重新付一遍钱。记住一件事就是在同一个对话里,他是有记忆的,除非真的很需要,否则就不要去重复的说。第四是任务不拆,成本翻倍, 你让他一次做五件事,他会怎么做?来回确认,反复思考,多轮输出,那你的投屏直接爆炸了。正确的方式是一件一件来,看起来慢,其实更快,而且还更加的省。第五就是别每一步都大局思考, 不是每一步都需要他理解,整理整个项目,大多数的时候只要给相关的代码片段就够了,全区理解,只在关键节点用一次。 最后说一句很扎心的话,就是很多人觉得 ai 很 贵,但其实贵的不是模型,而是你使用的方式。那同样的预算,会用的人,他可能就会多用一倍的时间。

cloudco 这次更新简直炸裂,彻底改写了搜索引擎优化 ceo 的 规则。现在构建搜索引擎优化 ceo 工具,只需动口不动手, 只要给出一个目标,他就会像真人员工一样埋头苦干,搭建编写,全程不停歇。先别眨眼,听我说, ipt 刚刚在 cloudco 中推出了 go 功能, 对于所有做搜索引擎优化三 o 的 人来说,这绝对是重磅消息,真的超级重磅!毕竟在这之前,你每一步都得寸步不离的守着 ai, 你 的不停发号施令,继续改这跑那再写。 以前太慢了,你花在发指令上的时间甚至比搞排名还多。但现在,只需输入勾,告诉 cloud, 你 要做的搜索引擎优化 ceo 任务,它就能自动执行,直到彻底完成。就是这么简单。本次更新到此为止,听起来可能没什么大不了,但相信我,它将彻底重塑我们做搜索引擎优化 ceo 的 方式。举个实际的例子,假如你需要一个全新的搜索引擎优化 ceo 博克写作工具,能从零开始, 仅凭一个关键词就自动生成一篇完整的 ceo 就 绪文章。以前你得步步催促 cloud, 现在只需输入勾,让它构建一个搜索引擎优化 ceo 博客转写器,输入关键词,即可生成一篇完整的优化文章。之后你尽管去忙别的,等回来时要么大功告成,要么他还在跑,毕竟没彻底做完,他是不会停的。他的底层逻辑是这样的, clod 每走一步,都会调用一个小模型来检查结果,他只核对一个标准,目标是否达成, 一旦达成,即刻停止。若未达成, clod 便继续行动,再次尝试追加内容,他会持续添加关键词,直到搞定整个 seo 任务。 正是 seo 人期盼已久的突破,他让 ai 不 再只是助手,而是摇身一变成为真正的 ai 实干家。很多人可能还没意识到这有多重磅,我来给大家好好捋一捋。以往的 ai 就 像个自动补全工具,你问一句,他回一句,接着就停摆。 这类新型 ai 始终由你主导,它能自主规划、执行、核查,并不断迭代优化。它无需人工干预便能自主运行,是想将其应用于搜索引擎优化 ceo。 面对数以百计的页面、关键词和原标题,它都能一气呵成,全部搞定。这正是我们从 ai 助手迈向 ai 搜索引擎优化 ceo 专员的变更, 而勾命令正是这一变更的首次真实写照。如果你还不熟悉,我先来介绍一下 cloud code 到底是什么。 cloud code 可不是普通的聊天机器人,它直接运行在你的终端里,能从零打造出一整套 i c u 搜索引擎优化工具。 它能编辑文件、运行命令、执行测试,甚至自行调试。它甚至能搞定 git, 无需你全程盯梢,即可同时处理多个文件。 anthropic 称其为代理型, 而非自动补全。这个词眼很关键,代理型意味着它能自主行动,独立决策,像真正的 seo 工程师一样步步为营。如今,勾功能的加入,让其自主性大幅跃升,为所有规模化运作搜索引擎优化 seo 的 用户带来了前所未有的实用价值。 大家好,如果咱们还没见过,我是 seo 机构 ceo 朱莲勾迪的数字分身,来自勾迪代理机构。在他忙着帮客户靠 seo 拿更多线索和订单时,我负责为您同步最新的 ai 动向。朱莲会逐条阅读评论,欢迎大家在下方留言互动,说说你想让勾搞定什么 seo 任务吧!他每条留言都会细读,所以务必想个有分量的。好,咱们继续。 我这就演示几个能直接用 go 从零搭建的实战 seo 项目,无需旧项目,也无需代码仓库,只需新建一个空文件夹,立马就能开干,这才是真正能见效的 seo 利器。来试试这个输入 go, 让它从零开始,为你打造一个 seo 博主文章写作工具, 它接受关键词作为输入,然后为 ai profit blueprint 攥写一篇完整的长文 seo 文章,包括标题、 meta 信息描述、 h 二、 h 三标题以及内链位置。 只要加上保存为 markdown 文件这一行, cloud 就 会打开空文件夹,自动建文件,写代码,做测试,一路运行,直到把这篇 seo 文章彻底写完并保存。好在是一条 go 指令。从零构建一个关键词研究工具,我输入一个种子关键词,比如 ai 自动化,它就会调用 cloud api 生成一百个长尾 seo 关键词, 我只需选定目标关键词并导出为 csv, 其余全套流程由 kol 的 自动搭建完成, api 一 键启动,从无到有,全自动生成。再试一次, kol 从零构建一个原标题和原描述生成器,只要粘贴网址或输入主题,它就能自动生成十个长度合规的 seo 原标题和十个 seo 原描述。 kol 仅需一个空白文件夹,便能从零打造出一款实用的 seo 助手。再来个勾粒子,从零打造一个内链查找工具,只需导入我的博客文章列表, 它能基于主题重合度智能匹配,并建立文章间的内练壳,能从空白文件夹直接构建出完整工具,光凭这一点,就能帮你省下好几个小时的 seo 工作时间。再比如我最中意的勾指令从零构建 ai 盈利董事会的落地页,要求标题符合 seo 规范, he 醒目有力,包含三大核心优势, 并设置可直接预约、策略咨询的行动号召,实现全方位的搜索优化。只需一行指令, cloud 就 能从零打造一切, 这才是真正的魔力,只要给出明确的目标,他就会像真正的 su 专家一样全力以赴去达成,他既不治疲倦,也不会厌烦。但在这里,我想先停一下。说句大实话, 就算做出再厉害的搜索引擎优化 su 工具网站,若在 google 上没排名也是白搭,你得有反向链接,得有权威度,更得有一套实实在在的搜索引擎优化 c a o 策略。这正是我们团队大显身手的时候。若您想从 google 获取更多线索、流量及客户,欢迎预约我们团队的网站,直接告诉您到底是什么在拖后腿。 我们将提供切实可行的整改方案。链接见评论区和简介。直接预约,免费的搜索引擎优化 seo 策略绘画即可。反向链接交给我们,排名也交给我们,您专心拓展业务就好。好了,继续看干货。这次更新的意义远超想象,尤其是对搜索引擎优化 seo 而言。 anthropic 这次是铁了心要做代码,直接把 cloud code 的 使用上限提了一大截, 他们甚至和 spacex 签下了巨额算力大单。没错,你没听错,连 spacex 那 种造火箭的需求都望尘莫及,现在的势头简直爆炸。因为开发者太爱用 cloud code 了, antibiotic 被迫赶紧给 seo 人群追加算力,这意味着我们能以前所未有的速度打造 seo 工具。接下来就说说为什么 cloud code 如今能在 seo 领域脱颖而出。 托超长上下文, cloud 能轻松驾驭大型网站与海量关键词列表,特别适合大型搜索引擎优化 seo 项目。二、由于它在终端中运行,因此不仅能提供代码建议,更能直接执行真实的命令和脚本,它能真正落地搜索引擎优化 seo 工作。第三, 具备持久性,也就是 go 功能,它从不半途而废。只要你下令写五十篇 seo 文章,它就一定会写完五十篇,绝不只是五篇。再来说说并行会话,你能让多个 cloud 的 代理同时开工,有的写簿可,有的做关键词调研,还有的建落地业,多任务同步进行。 所以说,当我讲 cloud 正在成为一套搜索引擎优化 ceo 操作系统时,我是认真的,他正统筹运作你的整套 seo 体系,这就是 seo 的 未来。你不再需要事必躬亲,只需负责制定搜索引擎优化 ceo 目标。 ai 就是 那位搜索引擎优化 ceo 专员,你只管发号施令,他自会搞定一切。说实话,不少 seo 从业者恐怕会对这一变化措手不及, 用和不用这些工具的人,差距即将急剧拉大。如果你还在手写一篇篇驳壳,或者一个个的死磕关键词调研,很快就会被时代抛弃。 所以我建议大家今天就立刻上手体验逮勾功能,新建个空文件夹,挑个 seo 提示词,下达明确指令,坐看奇迹发生。你一旦用上,就会着迷。试试博克文章专写器,再试试关键词研究工具。一旦见识过 clod 如何从零独立构建出完整的搜索引擎优化 ceo 工具, 你就再也回不去了。但更值得深思的是,我们不再只是构建 ai 工具,而是在打造 ai。 搜索引擎优化 ceo 专员工具只会被动等待,员工却能主动执行,而 o 指令正式划分这两种模式的分水岭。最后提醒一点,如果你用 cloud 打造了各种搜索引擎优化 ceo 工具,结果却没人能在 google 上找到你的网站,流量上不去,这才是真正的搜索引擎优化 ceo。 该出场的时候,想通过搜索获取更多线索、流量和客户,我的团队能助您在 google 上提升排名。 评论区或简介里附有免费 seo 策略咨询的预约链接,把反向链接和排名交给我们,您只管借助这些新 ai 工具专心拓展业务。评论区告诉我你最想先让勾做出什么 seo 工具,就连每条都会看,坐等你们的脑洞,下期见!

今天给大家分享一下,就是如何用可的 code 去帮我们清理和优化这个电脑。其实这是一个高频的一个事情,就是我们可能每周或者说每个月我们要去做这样的一个清理的一个动作,在这种情况下我们就可以把它创建成一个稳定的一个 skill, 我 们可以让它定时的去触发 这样的一个动作,这样的话就很方便。接下来我详细的来介绍一下我们是怎么去创建这个 skill。 我 们打开这个可的这个文件,我们在这里面去创建一个新的一个任务,叫电脑清理。创建这个任务的目的是什么? 是为了让我们别的任务的这个上下文不要去干扰到这个项目的一个执行,给他创造一个更干净的一个环境。那我们进到这个文件夹里面之后,第一步是要把我们的这个 cloud 点 md 文件给复制过来,我们就要打开这个文件,就是给他一个新的一个身份, 就是你是一名专业的电脑维护大师,擅长找到电脑卡顿和内存占用过大的这些问题,并且能够快速的去解决和修复相关的这个问题 啊。相当于说我们跟他把角色定义清楚,那其他的都是一些局的一些偏好的一些设置,我们不用去管他,包括每一次项目执行完之后,我们要去提交 get 文件,那下一步就是通过鼠标右键,我们找到这个创建终端的这个按钮,然后打开这个终端, 那大家可以注意到我这里面是加了一个 code, 后面加了一串英文,那这个英文的作用是为了帮助我们能够更流畅的跟 code 对 话,让他减少给我们的这种反复确认。打开 code 之后,我们要把我们的 这个需求告诉他,我们的电脑很卡,需要他对我的电脑做一次全面的一个检查,并且要给出他的一个修复的一个建议,并且修复哪些内容。要把这个清单要拿出来,因为这是我们的一个工作电脑,不能让他随便的去删除,很多东西我们可能都不知道,那需要他把这个修复的清单给我们拿出来,我们确认完没有问题之后,才让他去做相应的这个执勤。 那大家注意到这里面我们用的是 play 模式,就是让他给在做计划的时候能够做的更好。那再往下就是他再去把我们的电脑进行一个全盘的一个扫描,给出这个修复的一个计划, 那很快他就给出这个需要修复的这清单,告诉你这这些修复的每一项内容有没有什么风险,是不是安全的没问题,我们就全部勾选上,让他去 做一个详细的一个执行的一个计划,甚至说哪些事情是需要我们手动去处理的。好,我们觉得没问题之后点 yes 就 让他自己去执行,他就可以把这个内容给执行完成。其中有两项是需要我们手动去处理的,我一般的做法就是告诉他,让他直接去帮我操作,那这个命令一发给他之后, 他就去会执行,执行完之后他会给你拿出详细的一个执行的一个清单,都已经完成了,那这些事情他都做完之后,我们就可以告诉他 对上面的这些工作内容进行一个总结,并且按照 skill compiler 的 这个标准去打包成一个新的一个 skill, 并且要求它每周五下午四点钟自动去触发这个 skill, 对 我的电脑进行优化,按照这个标准去创建这个 skill。 那 skill 创建完之后,我们也要检查这个 skill 有 没有什么问题, 那我们就打开这个 skill 的 文件里面我们可以找到电脑优化的这个 skill, 然后点进去看到它这里面有一个 skill, 点 md 的 这个文件,然后我们再点进去就可以看到它这个 skill 的 一个详细的一个展示,它它的这个 skill 是 做的很标准的,包括它功能的一个简介,它需要 做哪些步骤,每一步做什么事情,在这里有一个详细的一个展示,那这个就是我们整个呃电脑清理和优化检查的这个 skill 的 一个创建的一个过程。

如果你已经在用 cloud 写代码,整理资料,跑工作流了,那怎么写好项目配置文件? cloud 点 md 非常重要,那 cloud 点 md 是 什么呢? 它是一个放在项目跟目录的 markdown 文件,你可以把它当成是这个项目写给 ai 的 说明书。原理也很简单,每次当你新插一个对话或者清空上下文之后, cloud 都会自动再读一遍这个项目配置文件,有了它,你就再也不用解释项目背景、个人偏好等各种项目信息了。那我们该如何写好 cloud 点 md 呢? 这里给大家总结了应该写哪些内容,这里的五类内容呢,是我搜集了资料找到的各种大牛,各种社区讨论后的一个最值得写的五类内容。 第一个呢是项目背景,你需要用很简短的语句告诉 ai 这是一个什么样的项目,让 ai 呢一看到它就能初步的对这个项目有一个大概的了解。那第二个部分呢,是技术栈和工具,比如说你用什么样的代码语言,你用什么样的框架,你有什么样的命令。比如这是一个说搜集信息的项目,那你可能就可以告诉他说我有哪些爬虫脚本。 第三部分呢,是项目约定,这里面主要要写一些已经在做的规范和习惯。比如来说,如果是一个小红书内容选择题管理系统,我通常的习惯是先让灵感写进灵感池,然后经过我的主观判断之后,我会选择一些灵感进入选择题库,那这就是我的项目约定,就会被写在 cloudy md 里面。 那第四部分呢,是沟通偏好,这一部分呢就偏向于一些个人喜好,比如说呢,我可能会告诉他说必须用中文回复,这都是一些个人回复上的喜好,你可以记载在这里面。那第五部分呢,是一些禁止事项,这类的问题呢,可能更经常出现在。嗯,你发现 ai 有 时候会有一些默认的操作是让你不满意的,那你就可以在执行的过程中告诉 ai 永远不要这么做。 那 cloud 点 m d 有 什么质量上的标准呢?我找到了 ansap 官方文件里面说到的三条标准。第一个呢,是要用具体数字代替形容词,比如说你想让 ai 回复尽量简洁,那更好的说法其实是回复小于等于三段的内容。第二部分呢,是关键规则加必须或者不要。比如如果你想表达尽量不要 emoji, 最好的表达其实是绝对不要 emoji。 第三个呢,是你要保证你的 cloud 点 md 控制在两百行以内。这是因为 cloud 点 md 的 内容会一直被写在对话的上下文空间里面,那如果它太长了,可能就会导致一些重要的规则被淹没,或者你后续对话写入的内容被忽视。 那说了这么多标准,我们该如何来修改 cloud md 呢?以及我真的要一个字一个字的写下 cloud md 里的内容吗?当然不是所有的内容都还是可以借助于 ai 来写。 首先有个最关键的指令,就是当你有大改动或者是你新开启一个项目的时候,你可以用杠 innit 这个指令来让它扫描你当前的项目文件,然后去生成一个全新的 cloud 点 mb。 比如如果你是是一个空项目的时候,它就会根据你目前的项目内容给你自动生成一个 cloud 点 mb, 那 如果你已经有一个目录下的 cloud 点 mb 之后,它依然会读取旧的 cloud 点 mb, 并且扫描当前的架构,给你一个优化版的 cloud 点 mb。 第二个呢,是适用于日常小修的 problems, 比如你发现 ai 做了一些你不满意的事情,你想要让它改进,那你就可以把这件事情立刻追加到 cloud md 里面。 那第三种呢,是定期瘦身,也就是我们刚刚说的 cloud md 要小于等于两百行才能更好的发挥它的作用。那我们就可以用下面这段 prom, 让 ai 把过时的、重复的或者是写的太软的一些指令删除掉。然后最后呢,把字数控制在两百行以下,那通过这三个指令,你就已经可以很好的写好你的 cloud md 了。 而且这套用法其实不止 cloud 能用在 cloud 里面, cloud 点 m d 是 这个项目的说明书,而在 codex 里面,这个项目配置文件被写作 asigns 点 m d。 我 自己测试过,如果你现在在 codex 里面导入一个带有 cloud 点 m d 这个文件的项目,它其实会自动问你要不要把 cloud 点 m d 这些内容转化成 asigns 点 m d, 所以 其实它已经有一些自动的转换过程了。

hello, 大家好,这里是永泽,今天我们来讲从构建 cloud code 中吸取的经验教训,像代理一样思考。 那么这篇文章呢?啊,有一个原文,这里就不给大家做展开了,文本呢是有了一个详细的补充,让读者呢详细理解他们在设计 cloud code 所做的取舍与优化。 大家对 cloud code 一定都非常熟悉啊,最火的 ai 构建工具大家都在用,确实也非常好用。那么今天我们讲的核心呢,就是在 cloud code 呀,在 tools 工具管理上,根据当前瓶颈,找到新的方法去解决瓶颈的这么一个过程。第一个就是 cloud code 的 任务管理眼镜 colorado 在 任务描地上做的工程演讲呢。阶段一是做了一个 totorite, 那 么是模补呃,弥补模型的短板,那么早期的模型呢,容易迷失在长任务中。 totorite 本质上是把工作记忆外化成一个可识的化的状态机啊。状态机大家都非常熟悉,如果你做后端的话, 工具的存在是为了补偿模型自身的不足,比如一些注意力漂移,漂移,遗忘目标等等啊,这是为模型设计一个 to do write, 防止它的目标遗忘嘛。阶梯二呢,我们设计设计的是这么一个打补丁 system reminders, 我 们是发现 to do write 还不够, 所以又加了每五轮这么一个系统提醒,是一个典型的打补丁这么一个策略,说明工具本身的设计还没有真正的解决问题,而在工具之外又添加了一层兜底机制,相当于不断的你的裤子烂了,不断在往上面打补丁。那么阶段三呢, pass to 重新定位工具的职责,那么随着模型能力不断提升呢?其一定机制就是之前的机制反而产生认知锁定,模型部认为必须严格遵守列表,失去灵活调整能力。 第二呢,就是在多智能体情况下,图度是一个单线层的设计,那么跨 sub agent 呢?协作为功能状态共享,呃,就无法达到这么一个共享。 所以 task 图尔的设计哲学因此发生了革命转变,从打补丁,从帮助模型记住要做什么转向帮助 agents 之间互相沟通,这是依赖关系。跨 agent 的 更新、动态增删都是为多智能体协调而产生的元语。 简单来说呢,就是工具可能成为能力天花板,当模型变强后,过去的辅助工具反而成为约束。这是一个反直觉,它重要的结论,给弱模型设计的工具可能会压制强模型的潜力。 简单就是随着模型越来越发展,它越来越强。我们之前打了一些补丁啊,可能会,可能反而限制了这么一个强模型的这么一些发展。 嗯,所以我们要呃实时的引进我们一个策略。第二个就 colossal 搜索啊,这,这个相信大家也都有了解, colossal 使用了这么一个呃, g r e g r e p 这么平常,我们在啊 linux 使用了这么一个搜索的关键词吧,代替了 rock 啊。我们之前的时候 rock 是 很火,现在大家又都说 rock 已死嘛。 rug, 首先它有一个局限, rug 工作方式呢,首先是就是建立向量缩影,然后每次呢再去根据向量去对应的 rug 库里头进行查。那么当你提问,系统自动解锁最相关的代码片段,然后 segue cloud 来作为这么一个上下文嘛,那带来一些问题呢? rug 返回上下文是静态的, 因为返回山我们是用 log 的 这么一个向量来做这么一个决定,所以 cologlio 只能被动接收 log 传来的这一个知识。但是在现实的编码场景中, cologlio 需要主观的动性,比如他在我们看我们代码的时候需要有个列路追踪,那么阅读函数 a, 它调用函数 b, 所以 我们 需要根据链路啊,一步步获取所需要代码,这种探索是动态迭代的,那么 rock 是 做不到这一点。第二个, rock 的 维护成本,需要维护锁影比,补充新的数据,建立新锁影代码归呃,更新后锁影过期等等部署等等,都是成本问题啊。简单说就是 rock 比较麻,比较麻烦嘛,我们需要维护这么一个项链啊,锁影库等等。 那么 rap 也截取片段,也就是我们说的切块啊, rap 会根据呃会做这么一个切切块,然后根据项链经呃羽翼项链进行召回。 那么由于截取片段呢啊,即使他会,我们会设置一些重叠策略,他有时候也会丢失关键的一些上下文。 比如说,呃,你召回的一些铅块,它的长度是有限的,一个一个类特别长的话,那有可能他会给你截断,那么某某个类的完整结构,某个文件,这么一个 input 的 依赖关系,无法给你召回,那么也无法帮呃,那么就会丢失关键的上下文吗? 那么可乐扣的探索一个新,我们需要一个 agic 啊,也就是说我们说的那个 r l a 阵的,它会自自动氧化嘛?啊,我们之前也有说 l m a 阵的,这是 r l a 阵的,它会自动氧化,具备主观能动性,动态迭代的搜索。所以可乐扣的 使用了 graph 啊,去主动探索你代码库,而不是依赖第三方,也就是说它会通过 graph 呢?呃,基于动态迭代的探索能力。然后这个能力呢,也透露出了这枚渐进式的思想, 并且可以发现给 curl code 合适的工具是一个 r y 很 高的东西。如,于是 curl code 提出了 agent skill skill, 拓展了 c c 的 拓展探索能力,让 c c 具备了不同工具去探索,比如 query db or use a p i。 比如说呢啊, c c 就是 我们日常编程过程,如果你用 c c 的 话,会发现 c c 会不断通过 graph 去抓一些代码片段啊,不断去看这么一个函数调用的全链路, 再到 close code 的 工具使用探索。 close code 有 约二十个工具,那么每增加一个工具呢?我们现在每次推推理的时候都多一个选项去考虑 给大家说。呃,就是你,比如说你打 s c s 有 二十多个武器,你总要选一个最受宠的武器,所以这不只是性能问题,更是认知负担问题。工具越多呢,模型越容易也选错用错,或者在不该用的工具上犹豫犹豫。 所以团队核心要素是工具的编辑成本很高,不能随意添加三个片段。呃,三个阶段?阶段一就是 system prom prom 啊,也就是说模型自己的这么一个提示,自定义 把 close code 自身文档塞进 systempromote。 那 么问题呢,就是用户极少询问它本身的这么一个用法啊,这些信息大部分是死重了,还会造成这类 complex route, 那 么无关信息是指真正重要的上下文干扰,可能完成主任务也是它的写代码儿过程。 第二个就是给 cloud 的 一个文档链接,也是让 cloud 的 自己去加载文档,去查找一个答案。那么问题呢? cloud 的 搜索策略太贪心,他会大量的加载文档页面来确保找到答案,但其实只需要一个精准答案,结果是上下文窗口被文档内容撑大,效率很低。 第三个也就是撒贝恩的子智能体, cloud code 的 get 子智能体,专门构建一个子智能体,只在用户问 cloud code 的 自身相关问题时被调用,那么这个智能体有专门优化的指令,如何高效搜索文档,访问什么力?力度信息? 这其实软件工程里关注点分离的原则在 l i m 系统中能体现,也就是说主带智能体专注写代码, get 智能体专注文档解锁和自我知识,那么两者通过明确的出发条件进行这么一个解构啊。下面有一个这么一个思考, 这是今天我们讲的一些主要内容,就是说我们通过这么一个 cloud code 现在最火的这个一个 ai 编辑工具,我们来讲一讲它是怎么去一步步做演化,而去达到最佳的这么一个 ai 编辑工具这么一个效果啊。这就是我们今天整体要介绍一个内容,谢谢大家观看。

最近很多朋友 q 反应,格拉拉扣的桌面板为什么会越用越慢?今天我就用一条视频给大家解释一下它越用越慢的原因和解决方法是什么。 你先不要急着把文件卸载,实际上不是软件变差了,它是缓存被激发,包括你的呃后台的进度,你影响到了它启动和加载的这个速度,造成整个软件会卡顿,甚至影响你电脑的一个卡顿,我们用两分钟就能解决这个问题。 原因就三点,一个历史对话的积压,因为你每天高强度的使用。第二个呢,就是本地的一个膨胀。第三个呢,就是后台进程的一个残留。 历史对话的积压呢,是因为啊,我们默认的软件的保存的天数是三十天,你每天用量非常大的话,可能就需要加载全部的对话可原数据啊,一些上下文数据量就越来越大,所以加载的很慢。 解决办法就是把对话改成七天,你直接在桌面端呢,跟你的大模型助手直接说一声,你说把我默认的保存时间从三十天改成七天,他就会帮你改好。第二个呢,就是 本地缓存的膨胀,因为你在使用高德扣的桌面端的过程中啊,他会自动缓存相关的 ui 资源、页面数据等很多临时的文件到你的硬盘,目的呢是加速启动和切换,然后这些缓存时间长了,也会占用你硬盘空间,影响你的速度。 解决办法就是进入到你那个缓存目录,把里面的内容删掉,也不会影响你系统的一个稳定性。最重要的一点就是有后台进程的一个残留, 因为你把 logon 的 桌面端打开以后啊,我们正常的关闭就是直接点右上角的叉,当你关闭了以后啊,你认为关闭了实际上没有真正的关闭,你打开那个内部管理器啊,就会看到里面还有 logon 点 exe 的 很多进程还在后台运行,它会占用你电脑的资源,也会影响你加载 logon 桌面端的这个加载的速度。 我们常规的办法,当你发现这个问题以后啊,就是在内幕管理器把那个进程结束掉,然后呢你的速度也会 ok, 这样就会造成问题,我每次重复去操作这个步数就觉得相当的麻烦。我这边也碰到了同样的问题,我就创建了两个脚本文件,一个 v b s 的 脚本文件,还有一个 ps one 的 一个脚本文件。 这两个脚本文件呢,你只要按照视频中的这个内容啊啊用记事的创建,然后改掉这个后缀名,保存到一个文件夹里面,直接运行 vbs 文件,双击运行就 ok 了。然后你运行以后啊,我这个脚本的逻辑就是自动会加入到你的这个开机的系统项里面去,然后当你启动那个的桌面版的时候, 它也会自动清理掉在后台自动运行的相关的进程,就不会导致你的那个桌面单的软件呢,会越用越卡,甚至影响你电脑整个系统的速度。 然后当你创建好脚板以后啊,你要检查一下那个快捷方式的一些指向啊,你可以在那个现有的快捷方式的记录上找到他的那个目标快捷方式的地址,你也可以修改这个地址,具体的可以参看我这个视频中的这个说明。 然后当你清理掉以后啊,你可以做一下验证这个脚本是否 ok。 当你处理完前面的三步以后,你可以做一下对比的验证,第一呢就是他的启动速度,第一呢就是他的启动速度是不是比原来快了?第二呢就是你看一下关闭以后,他的内部管理器里面啊,他的进程是不是自动的卸载掉了,如果说这个目的都达到了,那证明我们的脚本文件是验证 ok 的。 所以说呢,我们做了这三个动作就缩短了缓存。第三个呢就是卸载掉了后面的进程。 你做完这三步以后啊,你再重新使用那个扣子桌面端的时候,你感觉这个软件的速度啊,包括关闭的速度都超级的快。我们总结一下,工具呢,不是他变慢,也不是他不行了,是我们没有真正的学会使用他,掌握底层逻辑才是我们真正要学的东西。好了,今天的分享就到这里,有什么问题大家可以评论区讨论留言。

一句话让克拉克的帮我完成独立站产品的批量优化,可以看到我在 shopify 后台上架了三个蜡烛相关的产品,当前的状态都是草稿,我们随便点进一个进来看一下 现在产品的标题描述,还有产品的标签,包括产品的卖点信息,都是从供应商同步过来的,和当前品牌的一个品牌背景,品牌调性存在一定的差异。 我现在让 cloud code 帮我来进行这三个产品的批量优化,然后我们回到 cloud code 这边,我直接告诉 cloud code 我 在上面后台上架了三个蜡烛相关的产品,让他去帮我优化一下标题描述,买它信息,还有标签 以及结合我之前做的一个产品策略综合进行分析一下。然后可以看到他就去项目里面寻找我之前上架的这三个产品, 以及调查我一个品牌调性相关的信息,作为辅助参考。然后可以看到他获得了完整的一个品牌策略和调性指南,以及发现了我上架的三个产品的一个实际数据。接着进行产品优化方案的分析, 然后可以看到他说计划已经写好了,然后提到我说我的这个定价和产品策略有点出入,包括产品的幺幺幺过长,就他存在一些疑问,然后后面等待我去确定。下面是一个具体的优化方案, 可以看到他首先是对我这三个产品进行了一个诊断,发现第一个产品是标题式过度的物料堆积,就描述过于深意,没有什么品牌感。 然后第二个是标题里面出现了这个品牌违禁词,或这几个产品的 su 标题描述, 还有图片描述都是一个空缺的状态,然后标签打的也不是很好。接着他还参考了我之前提前做的一些关于这个产品的一个扑克内容的铺垫,然后就开始重写这个产品的标题描述 以及产品的 icu 信息。接着是优化产品标签,添加产品图片的描述文本,这个是我没有告诉他的,但他也发现这个问题,然后现在他需要我同意,他就可以去动手去优化产品了,然后这边我点击同意,然后等一会可以看到他已经完成三个产品的更新了, 下面是他的更新总结,有新的标题描述,买塔信息标签还有图片的描述文本都已经全部添加好了。可以看到三个产品都是保持草稿状态,等待我去后台省略发布,然后我们去后台看一下,点进去一个草稿,可以看到这边的标题还有和描述 已经改了,改成和我之前一样的一个描述的样式了,包括这个标签已经帮我优化过了, 还有这个麦达信息,然后这个 u r i 我 打算让他再帮我修改一下,他之前也没考虑到这个 u r i 如果被谷歌锁屏的话,修改会失去之前的 su, 但实际上这个产品我还并没有发布, 所以说现在改这个 u r i 也没问题的。我现在准备让他帮我把这三个产品的 u r i 再批量改一下, 优化一下,然后回到 class code 帮我把这三个产品的 u r l 再优化一下,然后我感觉标签有点多,可以稍微适当精简一下。等待一会后可以看到他已经帮我完成这些产品链接的优化了,变得更加简短好看一点了,包括也完成了标签的一个优化。 然后我觉得他这次帮我优化产品的这个优化脚本固化到这个 工作流里面,然后我告诉他可以把这次优化产品的思路以及你写的这个优化脚本优化产品的这个方式总结,总结放到 memory 里面,下次就可以直接用了,这样的话我们就能够 越用越让我们的这个工作流变得更加顺畅更好用。这个 memory 文件夹就相当于其实是一个 这个项目的一个他的记忆的地方,他每次运行工作,每次启动他,他都会先去读 memory 里面的内容,这样我们下次做同样的事情就不用再从零开始了,就可以直接有一定的基础。然后可以看到他已经把刚刚的这个工作经验保存到项目里面了, 下次再优化这个产品的话,他就会按照先去做计划,然后写这个优化脚本优化后再去验证的一个工作模式去工作优化产品了。

去年十一月, ansorepic 发布了一系列新的测试版功能,只在解决我们在构建 ai 智能体时遇到的一些实际问题。 工具定义在你发送第一条消息之前就已经占用了大量的上下文。当智能体连续执行多个工具调用时,这些工具调用的中间结果会进一步膨胀上下文。 而且随着你在系统中增加工具的数量,智能体在为任务选择合适工具时会变得非常吃力。因此,这些测试版功能帮助解决了这些问题。而且随着两周前 sony 四点六的发布,这些功能已经在云 api 上全面开放。 在他们的原始帖子中,他们展示了这些功能如何帮助实现了八十五百分之的 token 使用量减少。 这也导致一些网友宣称 entropic 已经终结了工具调用,或者至少是传统的工具调用方式。虽然这种说法有些夸张而且确实不准确,但这两个功能编程是工具调用和工具搜索工具 确实是非常巧妙的解决方案,在集成到任何 ai 智能体中时都能发挥极高的效用。而且关键在于这些功能并不是云 api 独有的,也并非最初就是 entropic 的 创意。 这些是智能体构建的核心模式,适用于任何框架或模型。我会解释这两种高级工具调用如何运作,并演示如何集成到你的定制智能体中。 这正是我在这里所做的事情。我已经把它集成进了我的系统,这个系统是我用 python 和 react 定制开发的应用,这是我在本频道过去四期视频中逐步搭建出来的。 我还用全新的困三点五,拥有二百七十亿参数的模型来测试这些高级工具调用方法。所以与其直接跳进理论部分,不如我们在应用里演示一下。 而最简单的切入点大概就是先演示一下工具搜索工具。所以即使只是打个招呼,我们也能收到一个简短的回复。但在底部,你可以看到我们正在追踪本次绘画的上下文窗口。 我们已经用了一万三千个 token, 为了弄清楚发生了什么,如果我们切换到 langfuse, 如果我们看一下这个生成追踪,你会发现已经有六十个不同的工具被加载到上下文中了。 虽然听起来很多,但实际上只有两个 mcp, 就是 playrite mcp 和 github mcp, 再加上一些我在前几期节目中开发的工具。 所以工具搜索工具的关键点在于你不会一开始就加载所有内容。你会延迟加载让代理去搜索他,所以他会多出一个额外的步骤。现在我会把这些 m c p 服务器标记为延迟加载,然后让我重启一下服务器。 如果我再次问同样的问题,比如我们打开一个新的聊天窗口,输入 hello, 然后得到一个回复,你可以看到我们现在只用了六千三百个 tokens。 如果我们看一下这个追踪,你会发现现在只有十二个工具被加载到上下文中。第十二个就是这个工具搜索工具。 这个工具允许代理在工具注册表中搜索,通过名称或关键词来发现并加载工具。为了演示工具搜索的实际效果,我们让他获取这个项目的最新提交。这是一个私有项目,所以他需要使用 m c p。 你 可以看到他现在正在触发工具搜索。他找到了一个工具, 就是 list commits 工具,然后他用仓库的信息触发了这个工具。好了,我们得到了提交 id 以及提交内容的信息。 如果我们查看这次工具搜索的响应,你会发现 listcommits 是 一个延迟加载的 mcp 工具,它会把这个工具的完整模式加载到上下文中。 现在这个工具已经被加载到接下来对话的上下文中了。所以如果我再问任何后续问题,就不需要再去搜索这个工具了。比如说给我最后一个提交,我就可以直接使用 listcommits 工具。 如果我们切换到 langfuse, 在 我发送的第一条消息中,你可以看到只有十二个可用工具。然后在它触发工具注册表搜索后, 在下一次调用中,我们有了十三个工具,包括 list commits, 并且它能够对此作出响应。而在我后续的问题中,我们同样有十三个可用工具。 简而言之,这就是工具搜索实际的工作方式。虽然这已经非常有用,但我认为以编程方式调用工具更加令人印象深刻。如果我们开启一个新的聊天,现在我们在 opodder 上使用的是 cloud hikou, 我 一会会切换到 queen 三点五。但我想先给大家展示一下云端模型和开源模型在这里是如何工作的。为此,我们将使用 anthropic 在 其文章中发布的官方示意。 这里他给出了一个预算合规检查的例子。然后问题是哪些团队成员超出了他们第三季度的差旅预算? 这里有三个可用工具,分别是获取团队成员,获取支出和按级别获取预算。他在这里展示了传统的方法,也就是需要大量的工具调用和许多中间响应,这会导致上下文窗口被迅速填满, 所以我已经写好了云端代码来生成这个场景的虚拟数据。首先我们来看一下传统的做法,我已经关闭了沙河,现在我来提问哪些团队成员超出了他们第三季度的差旅预算。 正如我之前提到的,我们现在用的是嗨酷模型,所以他正在执行工具搜索,获取报销数据,获取团队成员。现在他正按照这种传统方式操作,需要为每一位成员逐一获取报销信息, 让我们看看会得到什么答案。所以第三季度差旅预算分析显示,有三个人超出了他们的差旅预算,这是他给出的结果。 根据测试数据,这个答案是正确的,但实际上应该有四个人,所以他似乎漏掉了一个。 marcus johnson 超出了预算一千七百, 所以这种传统方法实际上消耗了大量的工具调用。实际上有五十六次工具调用。正如你在这里看到的, 它处理了七万六千个 tokens, 但实际上并没有给出一个准确或者说全面的答案。这正是程序化工具调用能够解决的问题,因为所有这些其实都可以通过脚本自动完成。 因为一旦你知道了团队成员和预算水平,你就可以用一个负循环来获取每个用户的开销,并计算实际的超支情况。 那么现在让我们起用沙盒,并尝试用程序化工具调用来实现。好的沙盒已经开启,让我们重启后端,打开一个新的聊天窗口。好的哪些团队成员超出了他们第三季度的差旅预算?现在正在进行工具搜索。他找到了所需的三个工具。 现在他进入了编程模式,并创建了一个即将被执行的脚本。他抛出了一个错误。这其实并不奇怪,因为他并不知道这些工具的输出结构。所以本质上,如果没有所有信息,他就无法一次性完成。 现在他正在不断迭代自己的代码,实际上是在尝试得到一个结果。你可以看到他不断抛出错误,并且正在逐步解决。 与 anthropomorphic 的 论文相比,这可能是更贴近现实的程序化工具调用方式。因为我相信在 anthropomorphic 的 论文中,它是一次性完成的,而实际上并不会这样。经过多次迭代后,我们得到了一个准确的答案, 所以二千二百, sarah, chen, marcus, alex, emily。 所以 我们得到了所有正确的答案。 这很好,但这才是程序化工具调用的现实。它的方法相当迭代,就像 cloud code 或 open code 一 样。出于兴趣,我们再运行一次,看看能不能得到正确的答案。它会不会走一条不同的路径。我们假设是的, 很有趣。这一次它实际上是在预算层面获取团队成员的信息,所以它实际上是先获取所需的数据,然后再生成代码。所以这次它可能一次性就能完成。 但实际上他并没有做到,他仍然在自我迭代。不过我们确实得到了正确的答案,所以结果是对的,每一次都是如此,只是到达结果的路径不同。所以我们来看看这两条追踪记录。在我刚才运行的那一次中,总共进行了六轮调用, 总共调用了十二次工具,总提示词数为五万八千。现在如果我继续这个对话,目前只用了一万三千,但这是在与大语言模型进行了六轮来回交互的情况下。而之前那一次是在十一轮中用了十一万六千个 prof tokens, 都是为了得到正确的答案, 所以我确实没有看到 anthrax 所报告的八十五百分之的 token 节省。但这其实非常依赖具体的用力。 比如说这里我是在和二十个团队成员一起工作的,如果你有两千个团队成员,那情况就完全不同了,因为大圆模型需要运行两千次单独的调用,这根本行不通, 所以在那种情况下,就需要程序化的工具调用。或者你就需要一个真正的端点,让实际的数据处理在服务器端完成,而你只是获取信息并将其展示给用户。所以这其实切中了这个话题的核心。 也就是说,你的大圆模型到底应该像这样临时进行数据处理,还是应该仅仅从一个预先创建的脚本中传递信息? 比如说这个脚本可以放在一个技能文件夹里,因为这是我们在上一个视频中搭建的一个完整的技能部分。你可以有一个 python 文件,一旦创建测试并验证后,它就能真正完成这项工作,或者你也可以把它放在工具调用的 m c p 端,这样它就只是简单地传递接收到的信息。 那么我们把 cloud haiku 换成 queen 三点五二十七亿参数,来看看它的实际表现如何。我现在是在网络上运行这个模型,这里用的是欧拉玛,我有一个十万个上下文窗口长度,这里用的是 rtx 五零九零,显卡有三十二 gb 的 显存。 那么我们保存一下,重启服务器,然后问同样的问题,哪些团队成员超出了他们第三季度的差旅预算?现在加载需要一点时间,因为他需要把模型加载到内存中。好了,他已经触发了工具搜索,然后直接开始生成代码。 他实际上在工具调用之间没有输出文本,但你可以看到他正在生成代码本身,而且他正在经历和嗨酷一样的迭代过程,他正在从错误中学习, 并且在不断完善。看看,这就是我们的答案。让我看看二二百十五十七,还有三百,看起来很准确,我觉得这比嗨酷用的 tokens 更少,这很酷,我们来深入看看追踪记录吧。 是的,这次用了四万五千个 tokens 就 得到了准确的回应,这真的很棒,只用了四次工具调用,这已经相当不错了。这是我们 ai builder 系列的第五个视频。在这个系列中,我们正在用云端代码构建一个功能完善的 ai 系统。 本模块的 prd 可以 在我们的公共 github 仓库中获取完整的课程和代码库则在我们的社区中提供 相关链接在下方描述中。那么好吧,这一切到底是如何运作的呢?因为你可以看到我们正在这里的沙箱中触发代码执行,但这实际上意味着什么呢?所以这是一个完全本地化的系统。 我之前用的是嗨酷配合 open router, 但现在用的是 queen 三点五,这里内置了一些文档和 r a g 功能,使用的是 queen 三的嵌入模型。所以你看到的这个代码执行其实是在 docker 中触发了一个沙箱。你可以看到 现在所有这些容器都已经启动了。这里有一些孤立的容器是因为我一直在重启后端。但总体来说,代码执行都是在这里的一个隔离沙箱中进行的。 而这个架构安全性的一个关键部分就是工具桥的概念。所以从头到尾,当用户提出问题时,他会先到 fast api, 然后到 python, 接着再转发到 ai 模型。无论是远程还是本地的, 我们会收到一个工具调用,也就是你需要去执行这段 python 代码,这时后端就会启动一个沙箱容器。 我在上一个视频里已经介绍过这个的设置过程,但本质上我们用的是这个 github 仓库,也就是 llm sandbox。 这是一个非常清亮即可移植的沙箱环境,你可以配合 docker 这样的工具使用。或者如果你不用 docker, 也可以用 portman。 但本质上,这大大简化了启动这些环境的复杂性。 它们支持多种语言,还有许多不同的高级功能。你可以预先启动容器,而不是按需启动。 你也可以使用自定义镜像。这个项目里有很多很棒的功能,所以我会在描述区留下相关链接。我在上一个视频里已经非常详细的讲解过了,所以基本上我们就触发了那个容器的创建, 然后我们会把代码和一个绘画 id 一 起传递进去。所以现在在这个容器里,我们有一个 python 运行器,它会执行那段代码。在我们之前的例子中,有很多不同的工具需要被触发,比如获取预算水平、获取部门、获取团队成员, 而所有这些都可以存在于比如说一个外部系统中,但我们并不希望让沙乡访问外部服务。 相反,我们创建了一个安全的工具桥梁连接回 python 应用程序,然后每当工具或函数在 python 脚本中被触发时,都必须通过这个桥梁。正如你之前看到的,单个脚本中可能会有五十次不同的 api 调用或工具调用, 所以对于每一次工具调用都需要通过这个桥梁,它会使用绘画 id 来进行身份验证, 然后 python 应用程序会将该调用路由到外部系统获取响应后再将其发送回沙乡。因此,除了访问这个 python 应用程序中的 fast api 之外,沙乡没有任何互联网访问权限。从安全角度来看,你可以对这个 fast api 进行严格限制, 这些限制是基于工具本身的精确模式,所以所有这些工具片段、工具定义都是在创建时作为存根发送到沙箱中的。因此,多个工具调用会在 python 代码中,比如说在一个 for 循环内进行, 而且这样做速度非常快,因为此时你完全忽略了 l l m 没有任何中间代码堵塞上下纹。在这里, l l m 完全不参与这个过程,直到 l l m 完成脚本并生成响应。你在之前的演示中已经看到了, 然后这个响应看起来大致是这样的,这就是我们的脚本结果,然后这个结果会被反馈给 l l m。 l l m 接着可以决定下一步该做什么。 如果它已经获得了所有需要的信息,就可以生成综合响应并返回给用户。或者正如你在演示中看到的,它需要对代码本身进行迭代。在很多情况下,它会生成更多的代码,并再次触发沙盒环境。 这就是端到端的流程。我在这里提到了 gviser, 因为 docker 容器并不是你能拥有的最安全的隔离沙盒,因为它们与整个系统共享内核。 所以为了真正保障像 ram, sandbox 这样的安全性,我建议你搭配 gviser 一 起使用。 cloudflair 曾经做过一些有趣的研究,探讨了 ram 在 生成 python 代码或 type script 以及触发工具和 mcp 方面的有效性。他们发现,当工具以 type script api 的 形式呈现,而不是标准的 mcp 时,智能体能够处理更复杂的工具。 我认为这是有道理的,因为他们在训练时接触了大量原生的 python 和 javascript, 所以 在 cloudflared code mode 版本中,也就是我们所做的类似,他们会把 mcp 的 schema 转换成 type script, 因此 l l m 只是生成 type script 代码来触发 m c p。 这和我们正在做的事情非常相似。所以我刚才提到,工具存根被发送到沙盒中。因此,我们在智能体层面定义的 m c p 和工具会被转换成 python 存根 自动生成的 python 函数。这样,当 ai 为沙盒生成代码时,它实际上只是触发 python 函数, 而且因为这是原声 python, 所以 它在这方面会非常擅长。而且重要的是,沙盒永远不会接触到 api 凭证,它永远不会接触到任何机密信息或类似的内容。 我之前提到过需要高效的工具设计,因为在早期,有太多的 mcp 服务器完全塞满了你的上下文窗口,让你根本无法完成任何实际工作。 即使在 anspec 自己的文章中,他们试图解决的挑战也是关于臃肿的 mcp。 在 这里,他们提到 github 的 mcp 有 三十五个工具和两万六千个 tokens。 但即使是在这篇文章发布之后, github 也发布了他们 mcp 的 新版,现在这个数字大约是四千个 tokens。 所以 在 mcp 和工具调用端其实可以做很多工作来确保不会无谓的给你的上下文窗口增加负担。 最后, entropy 在 他们的高级工具调用工具包中还加入了另一个功能,就是关于工具使用视力的这个概念。因为虽然 jason schema 非常擅长定义结构,但它无法表达使用模式。 他们举了一个例子,比如说截止日期,它的数据类型是自复串。日期格式有很多种传递方式, 那么他们到底希望用哪种日期格式呢?除非你真的引导他,否则大圆模型是不会知道的。所以,通过工具使用势力,你可以为每个字段提供一个势力,以便让大圆模型朝着正确的方向前进。比如在这里,日期格式就是年月 日。在他们的测试中,他们发现这能将复杂参数处理的准确率从七十二百分之提升到九十百分之,这很合理,因为本质上这就是多轮提示。你只是给了一个你想要的视力,这绝对会引导模型朝着正确的方向。 实际上,我不确定你是否需要把这个设置成系统中完全独立的功能。我认为,使用技能这个概念意味着你可以在加载技能时提供视力,这样就可以触发你想要实现的任务的执行顺序。 你会发现 cloud 也有点类似,里面有很多功能是重叠的。 antropic 之所以没有取消工具调用,是因为他们认为你应该有策略力对这些功能进行分层。 所以,如果你的上下文因为工具定义工具搜索而变得臃肿,如果你有大量中间结果污染了上下文,那就走沙河路线。或者,如果 ai 总是把错误的值传递给参数,那么使用工具势利就是有意义的。非常感谢你的观看,我们下期再见。

最近用 cloud code 做了一个简历优化器,比如从这里,从这里可以上传简历,然后随便找份简历, 从这可以上传简历,然后找一份简历 好,然后可以去优化,它可以选优化目标, 然后有六个优化的方向,根据目标优化去突出技能,然后精简表达,还有突出成果和职业转型, 然后去优化。优化完了,这还有一个它的评分,这是优化前的原始简历,这是优化后的简历,然后再可以去浏览简历,个人简历,然后还可以去看它的不同的格式, 这是排版,不同排版还可以发送到自己的邮箱,去输入号码就可以去发送了,输入它的什么邮箱号就可以去发送, 还可以下载,下载到本地主要是帮助大家更好地获得到面试机会。有没有小伙伴需要帮忙优化简历的?

就是 ai 开发出来的吧,有一些这个界面吧,太丑了,尤其是扣子叉写的界面太丑了,这种怎么办呢?我之前用过好多的这个 skill, 这个这个技能吧,这,这不是那么太理想,那么今天我看到一个特别好的啊,就是他这一个框架组合呢,是集合了二十一个这技能,而所有的呢,就是为了啥?所有的一个技能就是为了说 把这个 ai 啊,他们用的这种相同模板啊,写出来东西都是大大大差不差的,这种给它改掉,整整理成一个不一样的画风,而且呢就是更漂亮一些,无论是排版的间距啊,色彩啊,它已经全部都含盖了,你可以来看一。看。来,兄弟们, 首先我用到了一个完美无瑕的一个 skill, 它里面结合了二十一条指令,它这个主要的目的是干什么呢?就是于如果说你这个网站单单是排版的问题来,它是以这个用排版,它就给你去 分析优化一下子,如果说响应式手机兼容性啊,或者空间呐,还有颜色,它都集合了二十一条, 这个就相当于它有个整整个系统的流程,就相当于不让 ai 开发出东西,那么太 ai 化。兄弟们,你看原本写出来是这样的,让它优化完以后就变成这样了 啊,那有好多的个这种模式,就是本身出了这样的,它优化完以后啊,就是就是能更更更好一点吧。就是啊, 这个把这个引入以后呢,我用了什么呢?我用了一个啊,技能引入进来了,我用那个克劳德,克劳德,然后根据这些给我出方案, 出方案呢以后呢,我交给扣子叉让他去开发啊。扣子叉呢?为什么要扣子叉呢?他主要是便宜啊。他便宜克劳德属,主要是有点太贵了。兄弟们啊,就这一条命令,刚才我给你看一下子。兄弟们,就这一条命令就花了我一块钱。兄弟们 啊,来吧,干起来。兄弟们啊,有没有更好的办法或更省头肯。兄弟们有没有分享一下子?