粉丝4194获赞3.0万

假如我在二零二六年才初次接触 qq, 那 么以下这十大技能插件和命令型工具就是我立马会装起来用的。不过,就算你不是 qq 的 纯小白,我觉得你多半还是会发现一些之前没见过的干货。要是真能这样,那我这期视频就算没白做 好。榜单第一名是 qq 的 code 插件,没错,就是 openai 家的那个 code。 我 们现在可以把 code 和 code 搭配起来用了。 你可能会问,这有啥用?哎,还真有一个特别实用的场景,把这两个工具组合使用能带来巨大的价值,那就是 code 代码审查和对抗性审查。因为当我们在跨扣里估到出点东西时,尤其要是我们没有技术背景的话,我们可能很难真正判断它生成的代码是不是最优解。 没错,我是可以看看跨扣给我的生成结果,但要是我去细看它写的实际代码,你能看懂它到底在干嘛吗? 我清楚情况吗?那可不一定,毕竟这不是我们的专场领域。尽管我可以让 call out code 去检查并评审你的代码,但实际情况是,大多数大语言模型,包括 opus 四点六和 sana 四点六在内,在审视自家代码时都难免会护短, 他们不可能回过头来说自己的代码写得稀烂。不过,如果我们借助像 codex 这样的外部工具来帮我们做代码审,尤其是那种挑刺儿似的对抗性审审,让它真正深入到代码的五脏六腑,看看我们到底是怎么把它搭建起来的,然后指出这里不对,那里有问题。 这样一来,我们就有了一个秘方,能产出更优的结果,并为 codex 打下更坚实的基础。好了,安装起来非常简单,你只要搜索 codex plugin code, 就 会跳转到这个 github 页面, 然后把它添加并安装到应用市场里。简单到只需复制粘贴这几条命令就行。打开 qq, 把代码粘贴进去,安装完成后,运行一次,重新加载插件即可,然后运行 codex 设置。 使用此功能前,你需要先拥有一个 open n a 账户。因此,如果你已有 chat g p t 账户,即便是每月七美元的购计划基础版也完全够用。接下来,只需打开 call code, 在 你正在开发的任意项目中,然后运行命令 code x adversary review 对 抗性审查,它便会自动完成全部流程。 此外, code x 还提供其他几个命令,例如常规审查强度没那么高。你也可以具体指定让 code x 审查哪些内容。 他还提供比如 codex 救援这类功能。换句话说,如果你想让 codex 摆烂不干了,希望由 codex 来干活,但同时仍留在 codex 平台里,比如针对某些特定需求,就可以使用 codex 救援命令。总而言之,对于任何基于 codex 的 项目,这都是个值得加装的神器级插件, 因为它能为你提供一双非人类的法眼来审视代码,帮你判断代码逻辑是否合理。在进入下一个话题前,先简单安利一下我的 quac 大 师课。这是小白变身 ai 开发者的最佳捷径。无论你是技术大牛还是纯新手, 课程聚焦于真实应用场景,并且每周都会同步更新。所以,如果你想真正玩转这个工具,赶紧去了解一下吧。课程就在 kci 平台内,我会把链接放在评论区。另外,如果你是刚入门的 kci 社区, 相关链接也放在视频简介里了。接下来要介绍的第二个插件想必大家最近都耳熟能详了,那就是 obsidian 笔记软件以及配套的 obsidian 技能。 简单来说, obsidian 就是 一个用来整理 markdown 文件和文本文件的工具,它完全免费,而且和跨扣的集成设置起来也超级简单。你只需访问 obsidian md 官网就能免费下载并安装。你只需要在电脑上指定一个文件夹作为知识库,我称之为保险库。我管我的叫保险库,你爱叫它什么都行。 然后就像我这样,在这个知识库里打开 quacode, 基本上就可以开始用了。从此以后, quacode 在 这个知识库里创建的所有内容,只要是 markdown 文件就会自动整合到 obsidian 里。它能生成像这样酷炫的知识图谱。但真正厉害的地方在于,它让你整理资料变得超级轻松。 obscene 在 某种程度上变成了一个迷你的 rap 系统,却无需承担所有额外开销。这是我们在最近一期视频中详细探讨的内容。我会把链接放在上方。我之前向你展示了如何使用 obscene 和 rap 创建知识库。系统模仿了卡帕西亚最近在一条疯传推文中所谈论的内容。 这种非常易于设置的文件夹系统是我们能够拥有清晰的路径。在这里,我们让夸为我们研究事务,然后将这些研究成果转化为不同的维基百科文章,这些仅通过此文件夹进行简单组织。这意味着我们可以构建一个系统,其中包含成百上千甚至更多的文档,既便于克劳德操作,也方便我们使用。 确保克劳德充分利用 obsidian 潜力的最简单方法是安装 obsidian 技能,这是来自创造者,来自 obsidian 首席执行官本人的信息。这只是一个简单的 github 仓库,其中包含一系列技能,教导克劳德如何最好地使用它。 这种设置非常适合使用 qr 的 情况,在任何类型的个人助理项目中,或任何拥有大量且不断增长的 markdown 文件库的项目。 说到 carpafe, 你 想在 quattro 工具箱中添加的第三个工具是自动研究功能。所以汽车研究本质上就是一个装在盒子里的机器学习算法。我们可以把它和 quattro 搭配使用,想优化什么就优化什么。我们只需要用这里展示的几行代码就能把 auto research 装到电脑上。 接着我们打开 quattro, 告诉他,嗨,我有个程序想优化一下,或者我有项技能想让它更厉害。 这时候就可以让 auto research 出马了,它基本上会对那个程序运行一大堆机器学习实验,就是你想要全自动优化的那个程序。任何没让程序变好的改动,它都会扔掉,而真正有效的改进,它就会保留下来。这样日积月累,就像你眼前看到的,最终产品就会变得越来越好。 再强调一遍,整个过程全是自动的,你基本上可以当甩手掌柜。所以只要你在用 qq, 并且想优化点什么, auto research 就是 你的不二之选。 接下来要聊的第四样好东西是一个全新的代码仓库和一套技能。它叫 wesamethan m 的, 专门搞前端设计的。因为 quaco 在 前端设计这块儿实在是不太行,就算它自带了一些前端设计技能,效果也就那样。而 wesamethan m 的 出现堪称一次巨大的飞跃。 这个 design m 的 设计灵感很大程度上来源于 google stitch, 就是 你屏幕上看到的这个。 google stitch 是 一款专注于前端设计的 ai 工具, google switch 的 功能之一就是为它生成的每个网站创建设计 markdown 文件。你在这里右侧看到的那个设计 markdown 文件,其内容大致如下,我把它放在记事本里展示,这样应该能看得更清楚些。 这其实是一个非常详尽、构思缜密的提示式结构,专门用于生成前端设计和网页。这可不是简单一句别搞的向量生成的垃圾,改改那些网格区块的样式就能搞定的,它的详细程度要高得多。 而 wyzer medicine m 这个项目正是基于此构建的。这个代码仓库做的事情是,它收集了大量热门网站,比如 quad、 十一 labs、 coheri 等等,并将这些网站转化成了类似这样的设计 markdown 文件。这对你有什么用呢? 这意味着,当你在设计网站时,如果你从 figma, notion 或 pinterest 这类网站上获得了灵感,并想以此作为你接下来要搭建的网站的基础,那你只需来到这里,点开其中一个 markdown 文件。它基本上就提供了一个该风格的模板,供你直接用于自己的网页, 从按钮、颜色到字体一应俱全,这是一个绝佳的起点。这总好过全靠向 quan 祈祷,指望它随机生成一个你满意的设计, 而且使用方法也非常简单,我只需复制这条命令,然后粘贴到跨的代码界面中即可。而且他已经把这些功能都准备好了,随时可用。这个代码仓库上周才刚出炉,他已经收获了三万八千颗星。所以,如果你在做任何需要网页的项目,又不想页面看起来太丑,那一定要试试这个。 接下来是第五个,我们来聊聊一些命令型工具。具体来说就是 fire quail 命令型工具和 fire quail 技能。基本上,每次我们提到命令型工具,也就是 chris, 你 通常也会需要一个配套的技能,因为这个技能能教会 quail 代码如何使用这个命令行工具, 所以这俩基本上是打包出售的。如果你在做任何网络爬虫的工作, firecrow 绝对是你的不二之选。尤其是当你爬取的网站内置了很强的反爬虫机制时。因为如果你只靠 qq 代码自带的普通网页搜索,在一些防护严密的网站上,你肯定会碰壁, firecrack 却能轻松搞定。不过, firecrack 的 厉害之处可不只是能绕过反爬机制,更重要的是,当它从网上抓取数据时,它能以结构化的格式返回数据。这种格式对大语言模型来说更友好,更容易读取。和所有这类命令型工具一样,安装它真的只需要一行代码。 虽然 firecracker 的 主要产品需要你付费购买 apm 药,但 firecracker 本身也是开源的,你将无法使用 firecracker 的 专属引擎,这个引擎正是它们用来突破高级反爬虫机制的关键。不过,如果你只是想进行一些基础的网页数据抓取,而且不需要对付那些变态级别的反爬虫检测, 那么直接用它的开源版本可能就足够了。所以你在这里有几个选项可以考虑。接下来我们聊聊另一个同样专注于浏览器自动化的命令型工具,那就是 playeraid 命令型工具。它的优点在于完全免费, 当然,你还是得为使用量令牌付费,但这和 firecloud 的 网页版应用不一样,那个版本需要我们为 api 调用,单独付费。 所以说, play ray 命令行工具是 play ray 框架最新最强大的版本,它比 play ray 的 m c p 版本要更胜一筹。所以要是有人推荐你用 m c p, 别听它的命令行工具不仅效果更好,而且成本更低。那么 play ray 命令行工具具体能干什么呢?它能让我们授权跨扣来替我们执行浏览器自动化任务。 这话具体是什么意思呢?我的意思是, coacoo 通过调用 playrite, 实际上会创建独立的控浏览器实力。就好像你亲手打开了控浏览器,然后可以在上面进行各种操作,比如登录网站、测试功能等等。现在 playrite 实际上有很多值得关注的发展,它拥有上百万种不同的命令, 但由于你是在云代码内部使用它,你无需了解这里看到的所有内容。所以一旦你安装了 playrite 命令行工具,你就可以直接输入类似这样的命令。 嘿, quora code, 我 想让你创建新的 quora 实力,我想让你测试我刚创建的新网站,比如测试表单提交功能,它会根据你的需求创建任意数量的谷歌浏览器标签页,这比内置的云代码要好得多。 quora 浏览器中有一个名为 quora 的 谷歌扩展程序,它会打开一个标签页,由 quora 来为您执行各种操作。这并不理想,因为 quora 的 云代码是基于屏幕截图构建的,这些过程非常缓慢且成本极高。 这不是 play 查看网页和执行操作的方式。 play 实际上是在底层查看代码,它正在查看所谓的无障碍数,这使其效率大大提高。因此,如果你正在从事任何需要 quaco 来实际操控互联网上网页的工作,这就是你想用的 现在工具七号是我最喜爱的一款,那就是 notebookaland pen。 如果你看过我的频道,那你一定听我聊过这个。 该科技工具及其配套技能使我们能够将 quaco 与 notebook alim 网页应用无缝对接。由于标准版 notebook alim 没有提供 api 接口, 我们没法直接让 quaco 跟它沟通,但借助科技工具,我们就能轻松实现。也就是说,平时在 notebook alim 上能做的所有操作现在都能在 quaco 里完成。甚至功能更强大,比如批量下载、换灯片、修改文访问,以及通过编程方式共享。这些功能 在 notebook lab 的 官方网页应用里根本用不了,但通过我们这套可以工具系统就能轻松搞定,连所有的产出物也都包含在内,比如视频、 ppt、 报告这些全都能搞定,现在用 coco 就 能全部搞定!最棒的是,这基本上算是免费的。 当你上传资料进行分析时, quaco 要处理的所有工作,不管是 youtube、 视频、 pdf 还是其他任何格式,其实这些活都甩给 google 服务器去干了。所以,如果你正为怎么用好 quaco 而发愁,把它跟 notebook lim 这类工具搭配使用,简直就是雪中送炭。因为你消耗的令牌数大大减少, 分析的重活累活都让 google 包了。他分析完直接把结果丢给 coco, 和你跟所有这类工具一样,安装起来超简单,就几行代码的事。说实话,这些工具的安装过程,你只要告诉 coco 你 想做什么,他就能帮你搞定。你直接把 github 仓库的链接丢给他就行, 你可以复制粘贴整个页面内容,这些方式统统都行得通。 coco 非常聪明,能自己领会该执行哪些命令。接下来是第八项技能,这可以说是你能学到的最重要的技能,那就是技能创造者这项技能。 那么这项技能凭什么能碾压其他技能呢?难道只是因为它能创造新技能吗?不,关键在于它能评估技能的表现。 所以当你想打造一个自定义技能时,你必须搞清楚一件事,这个新技能到底有没有提升你想生成的结果的质量?跟完全不用这个技能相比,效果到底差多少?在技能创造者出现之前,我们根本没法量化这个差距, 或者说至少没法轻松做到。但现在有了技能创造者技能,他就能实际运行性能精准测试,还能进行 a b 测试,为你提供实实在在的数据,你就能基于这些数据来做决策了。 而且它的作用不只是对比用技能和不用技能那么简单。借助这个技能,我们还能测试各种不同的改进方案。 比方说我修改了一个技能,觉得它改得更好了,它同样可以给这个新版本跑个分。方法是一样的,这一点非常关键,因为技能可以说是 quaco 里最强大的原声功能,没有之一。 所以,如果你打算自己开发一个新技能,或者修改一个现成的技能,你就得用上这个工具。它安装起来非常简单,因为它是一个官方的跨扣插件,你只需要输入 plugin 命令, 就会跳转到插件市场,然后直接搜索 skill creator skill 这个插件,点击安装就行。第九个工具可能有点小众,但它绝对是我的心头号, 那就是 light rag。 这是一个开源的图解锁增强生成系统。如果你想构建一个比 obsidian 更强大的知识管理系统,用它就再合适不过了。 obsidian 固然非常强大,但当数据量达到一定规模时,它就开始力不从心了。实际上,使用一个专业的 rag 系统反而更划算,效率更高。 light rag 在 这方面堪称完美,主要是因为它轻量级,而且还是免费的,我们不用到处去找,然后花大价钱购买那些天价的图 rag 系统,比如说微软官方出的那个 graph rag 系统。 所以,如果你正在寻找一个更强大的解决方案,也许你正在做一个客户项目,或者需要处理一些棘手的任务,比如要处理成千上万份文档, 那么 light red 就是 你的不二之选。压轴出场的是 juice, 这是一个命令行工具,能让你把 qq 和你整个 google 办公套件联通起来。这个功能超级强大,尤其是当你打算深度使用 qq 的 时候,它就像一个全能型的私人助手。 如果你想让 coco 帮你打理邮件、文档和日历,那这个工具你就少不了。因为过去有很多野路子方案也想实现这个功能,但这个工具可是谷歌开发者亲手打造的, 它虽非谷歌官方出品,但确实是谷歌团队开发的,所以从各方面来看,它的地位就比盖了官方印章的产品低那么一档。不过珠子也有个缺点,就是配置起来可能有点费劲。技术门槛不低,因为你得在谷歌云平台上操作,开启一大堆功能。但另外一点你得心里有数,就是用了柱子你能调用的技能数量。 瞧,这里列出了所有跟使用 tools 相关的各种技能。这倒未必是件坏事。这里面很多技能说白了就是为你量身打造的工作流,比如改个会议时间,整理一下网盘文件夹,或者设置个周期性日程。 所以与其指望 coco 自己把那些基础技能东拼西凑,再琢磨出一套好用的工作流,谷歌或者说他们的团队非常贴心,直接把这些现成的配方免费送给我们了。我们根本不用费脑子想, 但技能太多了,你不可能一股脑儿全给加载上。所以我的建议是让 coa coa 对 接这个代码库,然后直接问他,喂,看看这些技能,哪些是跟我们日常工作真正相关的。所以如果你想将 coa coa 当做个人助手来用,说白了就像 open coa 展示的那样,那么就是你该用的工具。 所以如果你是新手,希望这个视频能让你收获满满。如果你是老手,希望至少有两三个工具能让你眼前一亮。

我们来讲下 openclaw 和 cloud code 的 区别,今天一个视频给大家讲透。 首先 openclaw 它是不能直接操作系统的,它相当于它只是一个给大家写代码用的,我们可以指定一个工作区,就指定一个文件夹,它只能在这个文件夹下面工作,比如说帮你这个主代码都给你操作, 他不能帮你发邮件,也不能帮你这个做智能家具的管理啊。系统你这操作可以做不了的还是 open 可乐,可以, open 可乐它基本上你整个电脑,而不是某一个工作区或者文件夹,而且他是开源自主全能的, 比如说你让他帮你整理一个邮件,对吧?那你只要告诉他你的邮箱的那个账号密码,他就能帮你去管理这邮件,甚至他可以帮你管理家里的这些空调电风扇都可以,只要他有这个,你在电脑上安装了这些米家。 还有就是这个恐龙的扣的他这个记忆他是在废话级别,他是一个 tab 奥本恐龙的话,他是会持久记忆你的每一句话,他都会永远把你记下来。 而 open code 的, 呃,这个 clone 的 code 的 话,它目前情况下它只能对接它自己家的这个 ai, 而 open clone 它是可以对接各种第三方。从生态来讲的话,也是这个小龙虾更加的全面一点, 因为它是一个完全开放的社区嘛,开源的,它跟那个 code code 不 一样,所以如果你是用来写代码的话,那我觉得你可以用这个 code code, 但如果你是想要一个全能的助手, ai 助手,那肯定还是要选这个小龙虾的。 ok, 结束。

cloud code 泄露源码的事爆火,相信不少人刷到了想动手研究下,但不知道怎么用的直接跟着操作。我们已经把相关能力炼炉进行重构,改造成可以开箱即用的 c l i 版本,放在评论区可以直接领取使用。这意味着开发者现在真正拥有一套由自己掌控的 c c 工作流。 更重要的是,这套工作流已经可以接入我们的 epoxx 人机协助社区,让它从辅助编码工具升级成能自动接悬赏任务的赚钱 agent, 晚上给你赚钱的同时,它还会在任务中不断学习 skill, 自动升级迭代,越来越强。换句话讲, c c 让你拥有了一个非常聪明的助手,但是缺少学习经验,不懂很多具体任务的实现范式。而接入 epoxx 社区,你的 c c 就 拥有了自我学习的能力, 不仅会自己整理经验,还可以把总结下来的 skill 发布到社区,实现 agent 共享知识的龙虾社区生态。诚邀各位感兴趣的朋友共建我们的 epoch x 社区。

两天前,飞书正式开源了他的命令行工具。飞书这次基本是开放了全套的能力,包括消息、文档、数据库、妙记、多维表格、 日历、任务。它总共包含十九个 skill, 六大类和无限组合的。这个工作流可以直接通过你的 agent 去发消息,写文档,安排日程。先带大家看几个案例,帮我设定一个下午五点去吃小炒黄牛肉的日程。我一会要发布一篇关于飞书的视频,你帮我先建一个飞书文档, 帮我寄一个代班任务,晚上去取快递,给在摸鱼的离谱发条消息,告诉他别摸鱼了。老板开完会了,已经在电梯了,一会就会上来刚刚创建的日程, 这个代办的任务,以及他生成的这个飞书视频发布的一个文稿都已经处理好了,以及这是他刚给在墨鱼的离谱发送的消息。那最简单的安装方式是直接把这个 github 的 仓库给 ai, 让他直接去装。也可以去手动安装啊,先安装这个 npm 包, 然后再安装这个全局的 skill, 去配置一下你的初试的连接。我是通过电脑弄的,就用电脑这个链接来创建,可以选一个你的头像, 他一个名称,回到终端,在这里再输入这个登录的命令,在浏览器打开这个链接,然后确定授权,就授权成功了。他默认只会开放一些常用的权限,如果你要全部权限的话,可以通过这个命令去授权更多的权限。 再分享几个需要注意的点吧。第一个是目前的消息是通过机器人来发的,你可以看到我这里的消息发送人是这个飞书操作大师,也就是我刚刚创的那个机器人,虽然飞书的机型后台是有使用用户身份去发消息的这个权限的, 但我自己尝试了很多方法,发现可能命令行工具的这个权限跟他还是两层架构,暂时是做不到的。 我觉得这个设置在目前阶段是合理的,避免一些有风险的操作,大家知道就好。第二点就是文档这些非敏感的操作是完全可以授权 agent 以你的身份去创建和管理的, 所以这里面也会存在一些数据风险的问题,所以最好对一些重要的文档做一些隔离。第三点,飞书它官方也非常明确的给到了这样的一个风险提示, 还是希望大家使用的时候相对谨慎一些。最后分享两点思考。首先, agent 使用软件这件事已经不是未来了,而是现在很多软件都已经可以通过 agent 来调用了, 这对传统的开发流程以及传统的互联网软件行业的从业者都会有非常大的冲击, 意味着之前积累的所有的经验可能在未来都不再有用了,这会是一个巨大的变化,但这变化背后也一定是机会。 第二点,我觉得这种一手的体感其实才是最重要的,就坦白说,现在的 i 键的体验其实还是比较差的,哪怕是你用最好的模型,他也会出现一些偏差, 但不要因为他体验差就不去用他,因为这种一手的体感带来的这种感知和认知是不一样的,等到他哪一天体验很好了,那也就意味着没有机会了。今天就分享这么多,我是离谱,关注我,获取更多第一手的 ai 实践和思考。

c l i 命令行界面是与 cloud code 交互的主要方式。虽然图形界面很方便,但 c l i 提供了最完整的控制和最强大的自动化能力。脚本管道 c i c d 集成都离不开 c l i。 c l i 有 两种运行模式,交互模式输入 cloud 启动,支持多轮对话,历史记录。斜杠命令打印模式,输入 cloud p 加问题,单次查询后退出。适合脚本调用和管道操作。 掌握这些核心参数, model 选择模型 sonit 平衡速度和能力 opus 最强, haiku 最快。 continue 继续上次绘画 resume 加绘画名,恢复特定绘画 output format 选择输出格式 text, 纯文本 j s o n。 结构化数据 stream j s o n。 流逝输出 ci 提供精细的权限控制 tools 限制可用工具, allow tools 设置白名单,这些工具无需确认。 disallow tools 设置黑名单,禁止使用这些工具。 permission mode 设置权限模式 plan 指读 auto 自动批准。 恭喜你完成了 cloud code 系列教程的全部学习,从斜杠命令到 ai 编程的完整工具链,现在去实践吧,让 ai 成为你的编程助手。

很多人对 cloud code 有 恐惧是因为 cloud code 起初只是在终端或者 c l i 工具里面使用,这个对小白来说的学习成本很高,那么不如直接使用 cloud code 的 桌面版,现在他已经跟进的非常成熟。推荐几个新手友好且高效的操作。 第一,侧边栏有一个 customize, 你 可以在任意项目的文件夹里面添加 skills 和 connectus。 你 既可以在这个现成的 skills 库里面去添加,也可以自己去上传。 connectus 可以 让 cloud 访问你的应用和服务,解锁你的数据,并且在已连接的服务中进行操作。第二是这个最近新出的 dispatch 功能, 你可以把你的手机端和电脑端进行绑定,这样你就可以用手机遥控 cloud 代替你在电脑上工作。第三,你可以给 cloud 添加定时任务。第四,你可以给 cloud 添加全职指令,告诉他你是谁以及你的工作方式。这些设置将自动应用于文字的对话。

朋友们晚上好,今天这个视频呢,只有一件事情,就是从零到一的教会你们使用 cloud code。 那 很多人听到 code 这个单词啊,就会想到写代码, coding 编程,对吧? web coding, 但实际上以 cloud code 为代表,这种 ai coding agent, 它并不是只能写代码,而是一个万能的工具,并且就在昨天飞书刚刚看完了,他们的 coi 就是 command line interface, 也就是我们说的命令行接口。那么这意味着你可以使用 ai agent 帮你做表格,回消息, 发通知,定会议和安排日程。那么它代表的什么呢?它代表的其实是一种新质的生产力,你可以不用它写任何的代码,但是你要学会使用它。就像在远古时代,一个人是转不去火,而另外一个人直接拿着打火机就把火点起来了。 那么 cloud code 除了编程,它还能帮你做什么呢?首先它可以帮你做数据分析,管理文件,其次可以帮你爬取你的这个每日信息流,每日资讯,还可以帮你修图升图,生成播客,剪辑视频, 甚至你也可以根据你自己的工作方式来搭建属于自己的 skills。 那 么这个视频我将全面的讲解,不需要你有任何的预备知识,从基础到高阶,循序渐进,包括安装和设置,那么基础操作和这个最佳实践,以及 hooks agents, skills, plugins mcp 我都会教给你。那么同时像一些不常见的非常好的命令,比如说 simplify insights, a loop 我 也会教给你。以及我还会分享一下我的经验,比如说如何避免在长时间开发中的莫名其妙的 bug, 以及如何优化 token 节省成本。最后我还会告诉你如何设计你自己的 skill, 点 m d 来让自己的工作效率最大化。 那话不多说,我们直接开始。那首先呢,我们先来安装 cloud code, 那 么这里我们直接进入它的官网,然后我们下滑,我们可以看到这里有好几行命令,那我们只用根据你的电脑,比如说你是 micro s, 或者你是 windows, 选择相应的命令就安装就好了。 那这里呢?如果,如果说大家是 windows 的 话,我推荐大家使用这个 power show, 而不是 cmd。 因为这个 cloud code 的 它的底层是 unix 风格的命令,所以说使用 power show 的 话会更好。那比如说这里我是 micro s, 我 们只复制条命令,然后我们打开我们的终端, 然后我们粘贴上命令,然后再回车就好了。那么它就会帮我们自动地装好 cloud code。 由于这里我已经装好了,所以我就不再演示了。 ok, 那 刚才既然我们已经安装好了 cloud code, 那 现在我们该怎么使用呢?那很简单,我们只用打开我们的终端,然后输入 cloud 就 好了。 我们敲击回车,那这里它会选择说你是否愿意选择当前这个呃,文件夹做你的 workspace, 那 我们点击 trust this folder 就 好了。 ok, 进来之后我们就来到了这个界面。 ok, 那 现在趁着 cloud 在 安装,那现在我们需要安装另外一个非常重要的工具,叫做 c c switch。 我 们知道。呃,我们在国内想要使用官方的服务,比如说 opus, sonnet 或者是 hikube 是 非常麻烦的。那所以说我们就需要使用我们国产的模型,比如说 mini max, 呃, g o m, deepseek, 或者说百炼等等等等。 呃,还有像 kimi 这样的模型,那我们该如何使用呢?那很简单,我们使用这个工具就可以方便的帮我们配置,那么这个工具呢?叫做 cc switch, 那 么它的作用呢?就是允许我们配置多个模型,并且可以快速的切换。那么安装方式也很简单,我们只用往下滑。 好,这里有个快速开始,然后如果说你是 macos 用户,你直接复制这行命令,然后打开终端,像刚才我们安装一样,把这行命令复制过去,然后回车,它就会自动安装了。那如果说你是 windows 用户,那就比较麻烦了,我们需要点击 release, ok, 那 这样我们来到它的 release 界面,那我们一直往下滑, 那么我们可以看到它的一个 contributors, 然后它有个 assets, 那 我们点开这个 show all, 然后我们找到这个 cc switch v, 三点十二点三, windows 点 msi, 注意一定要是 windows 点 msi, 然后我们下载这个就好了。 ok, 那 既然我们已经安装好了 cc switch, 那 这一步我们要做的就是配置我们的模型,那么在这里呢,我选择的是我们的 mini max。 二点七,那配置方式也很简单,我们点击一下这边这个加号, 然后我们可以这里可以选择你使用的是模型,比如说你是智普,就选择这个,那么你,你是 deepsea, 选这个,对吧?你是 kimi, 就 选择这个,那我们这里是 mini max, 那 我们只能选择 mini max。 这,我们往下滑,那这里它已经帮我们填写好了这个 base url, 那 我们需要做的指示填写,我们好我们的这 api key 就 好了,那 api key 怎么获取? 那很简单,我们打开这个,呃, mini max 官网,呃,这里有个订购套餐的界面,好吧,那在这里呢,我建议大家就选择这个四十九元的这个套餐就好了,呃,目前我用下来是非常的够用。购买了套餐之后,我们点击我们的这个账户管理,我们选择 tokenplay, 在 这里我们把这个 api key 复制一下,然后我们粘贴在这里就好了, 这我们点击添加就 ok 了,就配置完成了, ok, 那 现在既然我们已经把 cloud code 安装好了,然后我们把 api 也配置好了,那现在我们就直接开始使用,那使用方式也非常简单,我们打开终端,输入启动命令,我们回车之后就进到第一个选项,那这里我们选择 yes, ok, 我 们就来到我们的工作页面,那可以看到刚才我们已经配置好了 api, 所以 说它这里显示的是 mini max 二点七,然后这里是 api use, ok, 那 么首先呢我们来讲讲 cloud code 的 三种模式,那么第一种模式呢叫做 default mode, 也是现在这种模式就就是这里什么都没显示。那么第二种呢叫做 plan mode, 那 就是规划模式。那么第三种呢叫 bypass permission mode, 那 这就是,呃完全执行,也就是相当于 full access 这种模式。那么首先我们来说第一种,第一种模式的话,那它的呃这个特点就非常简单,就说,嗯,它执行就是 cloud code 执行任何一个操作,比如说它读写文件,编辑文件,都需要你明确确认之后它才会执行,那比如说现在 我们让他在桌面上创建一个文件,看看是什么效果,那这里呢?我推荐大家一个工具叫做闪电缩,那他就是一个语音输入法,但是他这个语音输入法是会使用这个拉玛,也就是我们的大模型去整理的语音输入,并且他是可以学习的,所以说他这个识别准确率是非常的高,那么包括我看到抖音,他们也做出了自己的这个 豆包输入法吧,那么我看我身边有朋友体验也非常不错,那大家可以去试一下,总之一切是免费的。那云输入法的话很简单,我们只用给他说我们的想法,呃,帮我在桌面上建立一个文件夹吧,然后里面给我放一个文件叫做 test 点, md, ok, 我 们回车看一下他会怎么执行, ok, 那 首先他会问我们文件夹是什么名字,对吧?叫做 test 就 好了, 这里呢它就会让你选择是否执行这个命令,那我们可以看到 make d r, 就是 就是新建一个文件夹嘛,然后在这个位置,好吧, 那我们选择 yes 就 好了,因为现在我们是 default mode 嘛,就是它每个插座都会问你是否要执行,我们选择 yes, ok, 他 说已经成功创建了,刚才我们已经讲解并演示了 default mode, 那 么它就是每执行和命令,好吧,都需要我们手中确认一次,那我们想刚才只是一个非常简单的任务,对吧?我们创建一个文件夹,所以说执行一次,选择一次,点击一次就好了。那如果说现在我们在执行一个非常复杂的任务,那我们每次就要点嘛, 那我们还怎么玩手机,对不对?那怎么摸鱼对不对?非常的麻烦,所以说我们就要使用这个危险模式,那危险模式该怎么进入呢?危险模式的话,我们需要呃用一个单独的命令进入,刚才我们是输入 c l a u d cloud 这个命令来进入的,对不对?那现在如果说我们想要使用这个危险模式,也是这种 full access 全自动的模式,那我们就需要在后面加上参数,加上这个 dangerously skip permission 就 许可嘛,对吧?就是无许可模式嘛。 ok, 我 们点击回车 啊,一样的,我们选择 yes, 相信这个。呃 folder 做我们的 workspace, 那 ok, 看到这里就有了这个 bypass permission 啊,就说现在它执行和命令不需要我们的这个批准了,好吧,它会直接自动执行。那同样的,我们说帮我在桌面上建立一个文件夹,然后名字叫做 test 二吧,然后里面给我放一个这个 md 文档,名字随便取就好。 ok, 我 们看看它会怎么做, 你看它这里直接执行了这个 bash 命令,好吧, macd 直接创立了这个 test 二的这么一个 folder, 然后在下面呃,创立了一个 untitled 的 点 md 文档。 ok, 他 现在直接给你说我们完成了这个任务就非常方便。所以说,呃,我更推荐大家使用这个 dangerously keep permissions 这个命令来起到我们 cloud 吧。那我们继续讲讲规划模式,就是这个 play mode, 那 play mode 它其实有两种的,呃,这个应用场景嘛,那么第一种就是当我们在做产品的时候,做项目的时候,在初期,呃,我们想知道这个 ai 会怎么执行,对不对?是不是按照我想的方式执行? 那么我们可以用这个 plan mode, 让他规划书写一个 plan 出来,我们看一下,没问题。 ok, 那 就会按照这个 plan 去执行。那第二种应用场景呢?就是针对一些比较宽广的任务,就是广度比较大的任务吧,就比如说现在我让他把我桌面上面所有的这个文件全部给我迁移到我的这个硬盘里面去,那他会操作很多文件,对吧?可能呃几百个,那这时候我们就用这个 plan mode 就 比较好。 那还有一种场景就怎么说?就比如说现在我们我需要让他去 re-use 我 们的代码,就去审查我们的代码吧,对吧?那这时候让他用这个 client 就是 一条条干,先干嘛,后干嘛,那这个场景是比较好的,那这里我们来体验一下这个 client, 我 们还是用 shift 加 tab 切换一下。 那我想想我们列个什么计划,那很简单吧,现在我要整理我的桌面文件夹,现在请你帮我列个计划,我看看该怎么整理。 ok, 我 们回车看看他会怎么做。那么我们要注意啊,就是 plan mode, 他的权限是只读权限,就是他只会进行读操作,不会进行写操作,只有你看过没有问题之后,那么他才会进行写操作。 ok, 我 们可以看到很快他就给了我们一个 plan, 那 同时他给了我们三个选项,第一个选项就是 yes and bypass permission, 这是什么意思?就说无条件执行,不要来问我了。那么第二个是什么意思?第二个就说 yes, manually approve it, 就是 执行这个计划,但是需要我手动来批准每项这个编辑,那么第三个选项就说你可以告诉他,你觉得这个计划有什么不好的,你直接给他说, 他就会按照你的这个要求去更改这个计划,然后再让你看一遍。那比如说你再帮我把垃圾箱清理一下吧,把这个计划加入进去,然后让我看一下。 ok, 我 们可以看到他刚才又在我的要求上增加了一部清空垃圾箱的这么一个任务,那你觉得没问题,那我们就选择 yes 这个 bypass permissions, 它就会自动执行的。 ok, 那 现在我们来讲讲 cloud code 的 一些命令,那首先第一个命令就叫 enit 命令,那么现在我已经打开了一个项目,这个 voice input 是 我让 codex 做的一个语音输入法的项目, 那一定题命令很简单,就是初设化嘛。那么他这个命令呢?首先会把我们整个这个项目的代码看一遍,看完之后他会根据他理解生成一份 cloud 点 md 文档,那这个 cloud md 文档有什么作用呢?就是,嗯,每次绘画的时候,他都会首先加载这个 cloud md 文档,那里面就是一些最高的原则,相对于类似于机器人不能违背的三条法则那种感觉。 ok, 我 们这里可以看到他成功创建了一个 cloud md, 然后这是他给出的一份资料,那即使想要写好一份好的 cloud md 文档,也是需要花很多功夫的,那我们就不在这里多说了,但是 唯一一个原则,大家需要记住的就是不要让你的 cloud md 写得又臭又长。如果说 cloud md 写得非常长的话,那每次上下文稿加载它就会一个是会消耗我们大量的 tool, 另外一个就是会让这个 嗯 a 键是变得非常笨。那一种解决方式就是我们把那种长的文件拆分出来,我们新开一个这个 md 文档去存放,那比如说我们可以开一个 get 点 md, 对 吧?然后我们把这个 get md 的 这个路径,我们记录到这个 cloud md 中,然后并且我们想指示说如果你需要这部分的知识,那么请去查找这个文件,这就是,嗯, cloud 客户团队非常喜欢的这个叫渐行式批录。 ok, 那 我们什么时候可以使用这个 init 命令呢?那我的答案是你任何时候都要使用这个 init 命令。比如说你从 github 上面下载了一个新的项目,你使用这个 init 命令,那就可以让这个 agent 快 速的了解整个项目,然后生成一份 cloud 的 md 文件, 然后 cloud 点 m d 文件是相当重要的一个文件,它相对于这个 ajax 的 一个最高指示,所以说你可以在里面写一些你自己喜欢的,你觉得非常重要的一些原则,比如说开发规范,比如说千万不能执行 r m 杠 r f 等等等等。那 cloud 点 m d 呢?一般会随着你项目的迭代,开发过程迭代呃来完善。 ok, 那 大家肯定听说过 marty agent 或者说 agent team, 那 其实想要创建一个多 agent 的 这么一个团队也非常简单,那像 cloud code, 它就支持我们创建这个 agent, 并且可以用这个自然语言创建,那我们只用执行 agent 命令,可以看出来,我们点击确认,那它就会说第一个选项 create new agent 就是 创建一个新的 agent, 那 么这就是 user agent, 就 代表说我们已经创建好的 agent, 可以 看到我这里创建了一个 codex review agent, 还有一个这个 marty agent coordinator。 ok, 那 现在我们来创建一个 agent 来看一看。那首先很简单,我们直接回车选择这个 create new agent 就 好。 ok, 它这里就会让我们选择这个 agent 的 location 在 哪里,就说选择你这个项目级别,就是它这个权限级别嘛,那我们就选择这个 project 就是 这个项目级别就好了。 然后它现在又给了两种方式,第一种方式就是 generate with cloud, 就是 说让你跟 cloud 一 起创建这个 agent。 第二种方式呢,就是你自己去写它的这个配置文件,那我们肯定选择第一种,对吧?因为毕竟它后面都说了这个 recommended, 那现在他就说让你去描述一下你这个 agent 要做什么,你看他这里说的 describe what this agent should do? 吧啦吧啦吧啦一大堆,对吧?那我们很简单,现在我要创建一个这个 technique co founder, 这么一个 agent 就是 一个技术合伙人的 agent 吧?那我把我准备好的这个 prompt 发进去, ok, 那 现在我们点击回车就拿创建这么一个 agent, 然后他现在就在 显示,他说 generating agent from description, 就 说现在根据我们这个描述在创建这么一个 agent。 那 当然本次教程提到的所有提示词会放在我这个文档里面,那具体怎么获取文档请看我的这个主页,好吧, 在我的公众号里面获取。 ok, 那 现在出现了这个界面,这个界面就是说让你去选择你新建的这个 agent 允许他使用哪些工具,那他根据我们的这个描述,现在给他全部工具权限,那当然你也看到这里写了是 enter to talk selection, 那 就是 talk 切换状态嘛,那很简单,如果你想 不让他使用这么多工具,对吧?那你就小键盘嘛,上下左右。然后你假如说不让他使用全部工具,你再按一下这个 enter, 那 你看全部都没有选中了,现在是零个工具这里显示的。 那如果说你要全部工具选上,那就返回去,然后再按下 enter, 现在是 auto selected, 然后确认没问题,我们就 continue 就 好了。 那这里他就说让你去选择你新的这个 app 的是用什么模型,那比如说你是用 sonet 或者 oppas 或者是海库,要不然的话,你就说它是继承它的这个负类的模型。那很简单,因为我们用的是 mini max 二十七嘛,那我们其实不用选,我们直接选择这个 inherit 就 好了。 然后这里就说让你选择这个 agent 的 颜色,比如说你选择红色、蓝色、绿色、黄色,对吧?选择选择一个你喜欢的颜色就好,那我们选择一个黄色吧,然后他这里就说这个 agent 这个 memory 它在哪个范围,那我们选择这个当前项目级别就好。 然后现在它就会让你再再次确认,然后你可以浏览一下这个,你的这个 description, 你 这个 memory, 你 的这个 system prompt 等等等等。 ok, 确认没问题,我们选择 enter 就 创建好了,你看它这里显示的 creative agent technical founder。 ok, 那 我们想要调用我们创建的 agent 也很简单,直接使用这个自然语言去交互就好了。 那这里我们就说帮我调用我新建立的这个 technic founder, 这个 agent, 我 要做一个项目, 那我们看看他会怎么做? ok, 可以 看到他成功唤醒了这个 agent, 你 看他正在初步化,花费了二十六点六 k 这个 tokens, 然后现在他说 technical founder 这个 agent 已经启动了,现在你可以说你要做什么项目了,那我们就开始巴拉巴拉巴拉说我们的一堆项目,对吧?他就可以帮我们完成。 那我们什么时候该新建立一个 agent 呢?那很简单,就是当你发现你会重复地做同一类任务的时候,并且这类任务需要很长的一段 prompt, 需要你定很多的规范。那这时候你应该专门创立一个自己的 agent, 比如说你可以专门建立一个产品经理的 agent, 一个后端开发的 agent, 一个前端开发的 agent, 一个专门做这个测试的 agent, 甚至呢你也可以专门建立一个 codex agent, 那 这个 agent 其实就只用干一件事情,就是在你的终端去执行这个 codex 命令,相当于唤醒了 codex, 那 这样就可以实现 cloud code 的 写代码 codex 进行 review, 并且不需要你人工去传递他们的 prompt, 传递上下文,直接让他们两个对接就好了。 一个单独的 agent 还有一个非常好的点,就是它可以帮助我们节约我们的上下文。那假如说现在我们要去执行一个非常长的文件的写操作,或者说一大堆这种抓取的操作,那我们可以单独开一个 java agent, 让这个 a 键去执行的操作。我们并不关心他到底获取了什么样的数据对不对?我们只关心他到底完没完成任务,那 x a 键就帮我把中间上下文给省略了嘛?最后他完成任务返回一个 ok, 那 我们就知道任务完成了,那 a 键这个命令就讲这里了,那同样有很多玩法需要大家自己去探索, 那现在我们来继续讲讲 m c p skills, 以及最近新出的 plugins, 还有我们的 hooks。 那 首先我们来讲 m c p 跟 skill 吧,因为很多人会把这两个词搞混,那其实很简单, m c p 中文翻译过来叫做模型上下文协议,那么 skills 呢?翻译过来叫做技能能力,对吧?它们之间的差别 有一个就是 m c p 是 告诉你能不能做,就是你有没有这个能力做,而 skill 是 告诉你你如果有了这个能力,你应该怎么做。那我举个例子,现在假如说我是一个残疾人,我没有这个腿,但是我想去骑自行车,是不是我就不能骑?那假如现在给我一个骑车的 m c p, 相当于就能帮助我长出这个双腿,那我有了腿是不是就可以去骑车了? 但现实就是很多人尽管他四肢健全,他还是不会骑这个电瓶车,对吧?不会骑这个,呃,这个自行车,摩托车的。那我们再给他一个 skill, 就是 给他一个骑车指南,就是教他怎么骑这个自行车的,对不对?那这样二者一结合,是不是我们就会骑车了?大家应该可以很好的理解。 然后我们再举个例子,那假如说现在我们在进行一场开卷考试,开卷考试我们肯定要带复习资料对不对?肯定要带书对不对?那么 m c p 就是 说你带了这个书,带了这个资料,那如果说没有这个 m c p 就 相当于没有带书,那么 skill 是 什么呢? skill 就是 说你脑袋里面组织你怎么看这个书,怎么看这个材料,对吧? 比如说有些人会很快的找到这个答案在哪里,有些人要找很久才能找到,所以说 skill 是 教你怎么看书的,那么 m c p 是 你本身带不带这个书,带不带这个资料?那现在我们想看我们 cloud 的 安装哪些 m c p 很 简单,我们直接在这个命令行里面输入这个 slash m c p 指令就好了, 就可以看到现在我这里只安装了三个这个 skill, 一个抖音的,一个 pencil 的 playwrite。 那 现在你想看你安装哪些 skill 也非常简单,我们输入这个 slash skills, 就会看到你安装了这 skill。 当然这里的误区就是 skills 并不是越多越好,而是越精越好,就是 你如果是个小白的话,你可能会安装很多 skill, 对 吧?摸索一些你比较常用的 skill。 然后那我给你的建议就是你在这个使用过程中,你要不断去精简这些 skill。 因为 skill 过多会造成一个什么现象?就是模型有太多的工具调用了,导致他根本不知道什么时候该调用什么工具。这句话怎么理解呢?就有点相对于类似于选择恐惧症了, 就是一个人有太多的选择,就导致他一下子迷茫了,不知道自己的路该怎么走,那如果说他就一个选择,那就逮着往死里干就完事了。 那什么是 hooks 呢?嗯, hooks 用中文翻译过来叫做钩子,这个可能比较难理解,其实他本质上就是一段脚本银行代码,然后呢,在特定的事情发生的时候,他就会自动触发执行。 那么 hooks 呢?大家按照它的执行顺序,可以把它简单地理解成两大类,第一类叫做在工具调用前执行的 hooks, 第二类叫做在工具调用后执行的 hooks。 那 我们看一下, 那现在我们想象这样一个场景,我们知道 cloud 它是可以操作我们电脑所有的文件,对不对?但是你不想你的某些私密的信息,一些密钥文件,或说你不想让 ai 知道的文件被它读熟了,那怎么办? 那你就可以制定一个 hook。 这个 hook 怎么定义呢?就说每当这个 ai 进行读操作之前,或者说之后执行这个 hook, 这 hook 就 会检查你当前要读取哪一行文件,读取什么东西。如果说发现你读取这个路径和你这个私密文件的路径重复了,那就直接拦截, 懂了吧?这就是 hooks。 那 再比如说,现在我们在我写一个项目,那么项目写好之后,我们会把它推送到 github, 进行这个代码托管。那么我想的是每一次只要我执行了这个 review 操作之后,就自动地给我推推送到 github, 那 么也可以定一个 hooks。 那 么这个 hooks 呢?就是这个 post tool use hooks。 简单就说,当它监测到我们执行的这个 review, 那么它就会自动触发这个 hook, 把代码推上 gitlab。 那 hook 是 怎么创建的?也非常简单,我们只用告诉 a e i 说帮我创建一个 hook, 然后它这里就显示了你想配成哪一种 hook 啊,然后你再把你的需求给他说,他就会根据要求帮你配进一个 hook, 很 简单。 那同样的我们该如何创建 skill 呢?那么 skill 其实不建议大家在一开始就创建好,除非你很明确自己的这个流程是什么样的,场景什么样的。我更建议大家在使用这个 cloud 的 过程中来创建,因为你在使用的过程中才会发现哪些工作流是可以重复的,对吧?会大量重复执行, 那这时候你就可以建立一个你自己的 skill, 那 比如说我自己就建立了一个记录素材的 skill, 每当我给他发一个抖音链接,或者说小红书的链接,或者说呃, youtube, bilibili 等等视频网站链接,那么他就会执行一个动作,他会把这个链接的这个字幕也是在这个脚本这个竹子稿,然后保存到我本地我指定的位置,非常的方便。 那什么是 plugin 呢?这是最近新出的一个东西啊,那么 plugin 本质上就是说它把你的 hooks, 把你的 skills, 把你的 m、 c, p 全部打包封装在一起,那这样你在进行团队开发的时候,大家都可以附用这个主键,就非常的方便,非常的好,所以这就是 plugins 紧急抄波一条啊。刚才 codex 官方出了一个 plugin, 叫做 codex plugin c c, 就是 允许我们在可拉钩中直接调用 codex, 那 么安装非常简单。首先我们执行这行命令, 那么再执行这个命令,然后我们再重载一下 plug in, 这我们再准备这个 set up, 那 它就会自动调用你这个桌面上面的这个 codex 的 配置,然后写入,那就准备就绪了。来继续讲讲几个非常好用但是很不常见的这个命令,我基本上没有看到任何人讲过。那么第一个命令就是这个 simplify, 我 们把它敲出来, 那就是这个命令。这个命令命名是什么意思呢?那么叫 simplify, 它的中文翻译就是简单简化,对吧?那么 simplify 它其实就是一个代码的一个呃,检查命令,一个进行 code review 的 一个命令。就说当你完成一段代码的修改之后, 你运行这个命令,它会自动地对你所有的变更进行全面的审查。那么它的工作流程就是它会同时派出三个 sub agent, 那 么第一个 agent 它会检查这个代码有没有重复造轮子, 那么另外一个 agent 它会看这个代码或者命名这个格式不规范。那么还有一个 agent, 那 么它会直接查这个性能影 换,那就比如说重复计算,内存泄露等等问题。最后呢,他们会把发现的问题直接修复掉。当你的代码写完了,你直接运行这个命令,让这工具帮你检查一遍,进行这个 code review。 大家要注意就是我们想运行这个命令,我们必须把这个代码上传到 github, 进行这个代码托管。那 github 什么呢? github 是 全球一个最大的开源的一个,呃,代码托管的一个社区,那你如果没安装 github 的 也非常简单,你直接给你 ai 说帮我把代码上传到 github, 它就会协助你完成。好吧,那现在我们运行一下这个 sql 发命令,看一下是个什么效果。 ok, 我 们可以成功看到他已经把这个命令运行完了。由于我这个代码仓库刚才只是更改了这个 readme 文件,然后做一个演示,所以说他这里给出这个发现是你的代码非常干净,好吧,没有任何需要更改的。 那我们可以看一下他这个命令的运行过程,首先他执行的是 git diff, 他 看一下你当前这个代码和你之前提交在 gitlab 上面的代码,那有什么差距,对吧?那他这里说这个 only change is readme dmd, 那就说我们只修改了我们这个 readme 文档,那他还会走他接下来的流程,那接下来的流程就是他开了三个稍不一点的,那么第一个可以看到他进行了这个代码的附用的这个检查,第二个进行了代码质量的检查,那么第三个进行了这个效率的检查,那发现全部做完成之后,那给出了结果,然后给出了发现, 那这就是这个命令。 ok, 那 现在我们来讲第二个命令,第二个命令叫 rewind, 也非常简单,我们把敲出来看看,那这个命令它作用是什么呢?这个命令它作用就是时光倒流,就是当你把这个项目做歪了,或者说你想换个方向的时候,那么它可以回归到之前这个 checkpoint, 就是 回归到这个检查点,然后同时它会恢复这个代码和上下文。非常简单, 因为刚才我只执行了两个命令嘛。首先第一个命令我执行了 clear, 第二个执行了 simplify, 对 吧?所以说这里就只能选择两个,那我们选择一下这个 clear, 那 进来之后呢?我们可以看到这个命令给了我们三个选项,第一个选项就是 restore conversation, 那 我们看到它的解释是这个 conversation will be fork, 就是 说当前这个对话那会保持不变,但是我会在 clear 这个 checkpoint, 就是 在 clear 这个检查点这个地方,我们先看一个分支, 然后继续我们的对话,好吧,那我们看第二个选项是什么?第二个选项是 summarize from here, 就 说我们会把从 clear 这个检查点到现在这个检查点之间的所有对话进行一个压缩,进行一个总结,生成一份答案,然后再继续。那这个 nevermind 就是 我们直接取消的意思,那我们直接选择 restore confirmation, 你看那他就新开了一个对话,这个命令就到这里结束了。那接下来我们讲讲 in size 这个命令,这个命令非常简单,顾名思义就是洞察,那么他会根据你的 sql 的 对话,就是你所有的 session 来生成一份这个报告,那么他会统计你使用 sql 的 模式,比如说你会在哪些项目区域花的时间多,在哪里容易卡住,那么帮助你了解自己的一个写作习惯。那么使用方法也很简单, 我们直接输入这个 in size 命令就好了。那我们使用方法也很简单,我们直接看到这个报告非常详细, 那最后这个命令叫做 loop, loop 也很简单,顾名思义就是循环的意思嘛,那它就相当于一个定时任务,但是一个定时任务是在三天之内的,那我们怎么使用呢?比如说现在你想每一个小时帮我查一下当前的时间,那你可就可以这么执行,我们先选择 slash, 然后输入 loop 命令,然后你看它这里说了 interval 就是 间隔的意思,那我们选择 one hour, 就是 e h, 然后干嘛帮我查询一下当前的时间,那回车我们看看它会干嘛? ok, 那 我们可以看到它成功帮我们设立了这个定时任务,并且查询了当前的时间。 ok, 那 这个 loop 还有个非常好用的地方,就是它可以和 skill 一 起赋用,因为我们知道 skill 本质上就是一段 prompt, 对 吧?所以说我们可以这么使用,那比如说现在我想让他每隔一个小时帮我查询一下当前这个 ai 新闻,那我们该怎么执行?就是 loop, 然后执行一下哪个 skill, 执行下 ai news 这个 skill, 我 们看看它会怎么做。然后我们可以看到它成功执行了我的这个 skill, 并且把内容保存到了这个位置,然后它也创建了 cron。 ok, 那 现在我们来讲讲如何解决在长对话中莫名其妙出现的 bug。 那 我们知道如果说我们一个对话进程很长,那它肯定会压缩我们上下文,就是那个 auto compact, 那 压缩上下文的时候,那如果说最开始前几轮还会好,它只会压缩一些内容,一些文档,不会压缩一些关键信息。但是我们发现随着对话的进行那么多轮压缩之后,它第一点就是它的关键角色信息会丢失,早期价格约束将会被遗忘,那就会导致我们多人写作的时候 bug 越来越多了,好吧,所以说一些莫名其妙的 bug 出现, 那我们该怎么解决呢?那我们就是要让这个 cloud code 不要遗忘那些关键的决策,对吧?那比如说我们就可以在 cloud md 里面加入加入这个方案,或者说我们让他写一份这个 handoff 文件,那 handoff 文件怎么写?首先第一步我们要说清楚当前的进展是什么?我们的目标是什么?已验证的有效方案是什么?那么已验证的无效方案是什么?写清楚之后, 再打开下一个对话,让他进行交接,这样就会没有问题了。 ok, 那 现在我们来继续讲讲一个被很多人忽视的就是工具调用所产生的这个上小文的噪声。那我们知道,假设调用工具,比如说你测试代码,它会给你输出一长串的配索键,或说你查找文件的时候也会给你输出一长串的那种信息,那这东西是 cloud 是 根本不需要的,他只需要知道你完成了没有, 对吧?是 ok 还是不 ok? 所以 说我推荐大家安装这个 skill 就是 一个 r t k, 那 么他就会帮我们把这个信息压缩,只用返回给 cloud 的 最关键的信息就好了。 ok, 朋友们,那么看完了这期视频,我相信你对 cloud code 的 掌握已经超过了国内百分之九十九的 ai 玩家。但是说实话,工具只是工具, ai 时代最重要的并不是你会多少个命令,而是你的想法,你的 idea, 你 到底有没有真正想要做的事情。那么 ai 就 像一盏阿拉丁神灯,你提什么愿望, 它就会帮你实现什么愿望。所以说做一个有趣的人, dream bigger。 那 么下期视频还想提什么?你们决定评论区打出来,我们下次再见,拜拜。

在他出现之前,人们用 ai 写代码往往还要陷入极其繁琐的循环,反复提问,拿到代码,再后再复制粘贴回自己的项目里, 或是在无数个窗口间来回切换。但在 n slash pick 扔出了一张王炸之后,这种手工作方式的编程时代被彻底颠覆。今天一口气带你了解这个直接放弃华丽界面,一头扎进命令行的终端怪物。 当你第一次打开 cloud 扣的时候,你甚至可能会感到一丝困惑和强烈的落差感。在这个所有软件都在疯狂追求页面样式圈各种绚丽交互的时代,它简陋的简直就像一套连墙皮都没刷的毛坯房,只有一个黑乎乎的输入框。 但是千万别被他及其原始的外表迷惑了,当他真正跑起来的那一刻,才是降维打击的开始。 claude 扣着,手中握着五张底牌,第一张牌也是他最可怕的降维打击,自主执行,你不再是他的保姆,不需要跟他一步步解释。 先打开这个文件,再找到这个函数,然后改成这样。你只需要像指挥下属一样说一句,帮我把支付模块的报错修掉,跑通测试提交到 get, 然后你去喝杯咖啡 回来,他做完了。他拥有极强的代码库理解力和真正能动手操作文件与终端的能力。这不是掩饰, 这是他接管脏活累活的日常。但你有没有想过一个痛点,每次打开一个新绘画, ai 是 不是又变成了什么都不知道的白纸? cloud code 打出的第二张牌叫项目记忆。你可以把你的代码、规范、架构、逻辑,甚至是哪些核心文件绝对碰不得的规矩,全部写进他的专属配置文件里。 从此以后,整个团队的每一次终端对话,他都自带这份入职培训。他记住的不只是你刚才说了什么,而是你整个项目的灵魂。 第三张牌,才是真正让人头皮发麻的地方。多 a 阵协助一个 ai 不 够用,那你可以给他分配下属, 一个负责审查代码逻辑,一个负责疯狂跑测试用力,一个负责自动生成开发文档。你只需要负责发号施令,他们并行执行,互不干扰。在最新的极客实战里,有人用七个这样的赛博下属, 把原本要干二十三个小时的重构工作硬生生压榨了五个小时。你以为你在用一个工具,其实你在管理一支 ai 军团。第四张牌, 百分之九十的人根本还没摸到门道。接管流水线,你可以给他立极其严格的规矩,每次他自主改完代码,必须自动触发格式检查。 每次他要执行高危的系统操作,必须被自动拦截并等待你授权。甚至你可以让他在没有任何人看管的情况下,独立跑在你的自动化 c i c d 流水线里, 二十四小时不间断的抓虫修复,他从一个 ai 同事,彻底进化成了一台永不下班的代码收割机。有人说, clod 扣的纯粹是给即刻用的,不会用命令行就别碰了,这是大错特错的第五张牌。 其实他同样拥有 vs 扣的插件,也有易用的桌面应用,你在哪里工作,他就覆盖到哪里。 antiropake 之所以首发并强调终端 e terminal, 是 因为终端离系统底层最近,权限最高。他们不是想把普通人拒之门外,而是要直接刺入最高效的底层神经, 放弃花哨的皮囊,直接接管你的操作系统。这就是技术大厂的名牌战略。五张底牌摊开来, 柯老寇的野心已经昭然若揭。他不想做你的工具,他想做你的一只随时待命,越用越懂你的 ai 军团。 在这个不可阻挡的趋势面前,摆在你面前的问题只有一个,你是继续沉迷于做一行行敲代码的打字员,还是准备好当那个发号施令的人了?


三大 ai 编程助手横屏 codex、 cloud code、 jamaica, 他 们到底谁更强? 先看硬参数, codex 背后是 openai 的 gpt 五点二模型, soebench, 编程测试得分百分之七十,四点五,业界第一。 cloud code 基于 cloud opus, 四点六上下文窗口达到二十万 token, 代码理解深度行业领先。 gemini c u i 接入 google 搜索一百万 token, 超长上下文,多模态能力最强。 codex 刚刚完成重大升级,推理速度提升百分之四十,延迟大幅降低,还推出了独立的桌面应用,不再只是 co pilot 的 后端引擎。 最重磅的是加入了插件支持,开发者可以调用外部工具扩展能力。编程正在从一个辅助工具变成真正的自主 agent。 cloud code 走的是另一条路,它不追求速度最快,而是把代码质量做到极致。安全对其机制业界最佳,企业及合规场景表现最优, bug 少,逻辑严谨,特别适合代码审查和大型项目。贵是贵,但稳定性和安全性确实没对手。 杰曼纳 c l i 的 打法是免费加多模态,个人用户每天一千次免费请求,基本不用花钱。而且它原生支持图片、音频、代码一起理解,注示,文档、设计图全部搞定。如果你预算有限,或者需要处理大量非纯代码的内容,它是性价比最高的选择。 总结一下,追求编程机准第一,速度最快。选 code, 看中代码质量和企业安全。选 cloud code, 预算有限,需要多模态,选 gmail c l i。 但无论如何, ai 编程工具正在加速进化,从代码补全走向真正的自主编程,你准备好了吗?

有一个专门教你用 cloud code 的 github 开源项目,名字叫做 cloud have two, 短短几天内就拿下了两万四千多个 star。 它不是官方文档的翻译,也不是功能列表,而是把 cloud code 的 整个功能生态拆成了十个模块,分成基础、进阶、高级三层,从入门到高级,一路走通。基础层讲的是斜杠命令、 c r i 和跨绘画记忆, 阶梯层讲的是 skills hooks 和绘画快照。高级层讲的是 m c p, sub agents, plugins, 还有规划模式、后台任务这些高级特性。更爽的是它里面的钩子、脚本子、代理配置、斜杠命令模板,都是可以直接拿来用的,不是 伪代码,也不是概念势力,装进你的项目里面,改几行就能够跑。不管你是想系统补齐克拉拉库德的知识,还是想搭建一套自己专属的 ai 工作流,这个项目真的很值得收藏。

我一定要推荐你用 cloud code, 因为这是走向 ai 时代的一条最快的路。那么用 cloud code 能做什么呢?第一个,它能帮助你部署 opencloud 大 龙虾,它能帮你去部署,帮你去修复 bug, 给大龙虾安装各种插件,它还能跟大龙虾一起协作,去做更多的事情。第二个,它能帮你部署任何软件,比如 docker、 rackflow、 tiktok 上任何开源软件都能部署,还能帮你修复 bug, 调参数。第三个,它能帮你编程,做出你想要的工具、软件、网站,帮你链接各大平台,打通各个平台与网站,甚至是通讯工具之间的连接都能实现。 cloud code 有 一个非常重要的功能, 就是真的能帮你收集并下载东西,我就用它收集了一千多份规范,帮我收集了房屋体检时相关的全国所有资料,甚至收集各种国外的规范文件。 做信息收集一定要用它,它能真正帮你收集并且翻译,它甚至能帮你工作提效,比如自动填表,帮你填 word、 excel, 甚至做 ppt 都能实现,而且它能根据你现有的知识库,你的资料进行精准填表。 cloud code, 甚至是你这个内容分发工厂,能自动帮你写文章,自动排版,自动分发各大平台,甚至还能帮你的文章直接转成视频,我这个视频就是 cloud code 帮我做的,完全是它帮我做,我没有写银行代码, 它还能帮你在实际中干活,自动帮你做标书,监控招标信息发布,自动审核招标资料,还能帮你对图纸进行分析算量。你在评论区说一下你能想到的在电脑上的操作, 我都能用 cloud code 帮你实现。我觉得 cloud code 就是 一个让你的想法转变成真实,能帮你干活的 ai。 如果你真的想用 ai, 强烈推荐你用 cloud code。 接下来我也会开启教程系列,让大家一步一步用好它。

我相信百分之九十九的人都不知道这八个可乐扣子的隐藏指令,大家耐心看完这个视频,绝对会让你大开眼界。 第一个, btw 命令,今年三月份刚出的,就是让可乐扣子在干活的时候插一个问题进去,但这个问题不会被写进历史上下文。以前你问一句可乐扣了就停下来了,上下文被污染,干活就容易跑偏。现在问完直接回车,这对对话直接消失,任务照跑, 历史干干净净,并且几乎不费掏开,用完了就回不去那种命令。第二个,瑞万的命令,可以理解成 ctrl z 撤销,打开这个命令,会弹出一个菜单来,让你选只回退代码,还是只回退对话,还是两个一起, 还是压缩上下文释放空间,这个命令非常实用。第三个,隐菜的命令,这个命令我觉得被严重低估了, 他会生成一份 h t m l 报告,分析你过去一个月用可多扣的习惯,看你常用哪些指令,有哪些重复的操作,然后给你推荐自定义的命令,说白了就是可多扣可多扣的在反向观察你, 给你优化建议。这个我建议人每个月都要跑一次,他会让你重新认识你自己的工作习惯, 非常有意思。第四个, see you plan 命令。你打开这个命令, cloud code 会同时启动三个平行的 agent, 分 别从代码附用、代码质量、运行效率三个角度帮你审核改动,然后汇报结果,相当于找了三个同事帮同时帮你 re 要代码。 我现在的习惯就是每次写几个大功能,更新之后顺手跑一遍,因为 ai 的 代码经常有种鱼,这个命令基本上都能把那些种鱼挑出来,写代码的一定要用这个命令。 第六个半尺命令,原来他是叫 fork, 现在改名了打,但是打旧名还能用,会自动跳转。作用就是把当前对话分叉出一个新的绘画来,原来的绘画不受影响。他跟 rewind 的 的区别就是, rewind 的是后悔药,半尺是平行宇宙, 如果你想同时试两种不同的方案,就是分叉一下,两边各走一边,最后就是选一个效果好的就可以。 第六个落魄命令,他可以让可乐定时重复执行某个任务,用法就是在这个命令后面跟上时间间隔和你和你要他做的事。比如说每五分钟检查一下部署状态,他就自动跑,不用你盯着, 默认时间间隔是十分钟,并且结果直接在上下文里。可乐可以基于结果做判断和后续操作, 但是要注意,定时任务在创建三天后会自动过期,最后触发一次,然后自我删除。第七个 remote ctrl 命令,就是打 r c 或者是完整的命令。 remote ctrl 它会生成一个 url, 手机打开这个链接,你整个 cloud 的 绘画就出现在手机上, 完全同步。你在手机上发指令,终端那边也能看到你在终端操作,手机实时更新终端代码,始终在你电脑上跑。手机只是个遥控器,所以很安全,非常好用,这点就像那个龙虾。 第八个 export 的 指令,打开这个指令,当前整段对话直接导出 markdown 文档,听起来不起眼是吧?但是有时候你会发现这个功能真的很实用。你跟可乐扣了讨论了半天的架构方案,中间有大量的来回推敲, 如果不保存,回头找起来非常麻烦,直接导出来存着,作为更详细的上下文,下次直接用这八个隐藏的指令,非常实用,建议大家使用起来。好,今天的视频就到这里,感谢大家观看。

兄弟们,好消息,咱们用 clod code 再也不会被限制了。首先看我们官方的用 clod code 是 怎么用的,比如说我问他你是谁,他会说我是 clod code 的 astropik 的 一个官方的 c i 的 工具,然后我就问他,我说你现在用的是什么样的大模型呢?然后他就会告诉我,他现在用的是 clodsonet 四也最新的那个 sonet。 但是因为 clod 的 模型经常会被封啊,有可能你也调用不了,因为我们在国内环境网络环境不允许。 那我就问他,我说能不能用 deepsafe 呀?他就会告诉我,这里是 abstract 的 一个官方的 c r a 的 工具啊,我们这里的 ai 所有的都是用的 cloud 或者是 abstract 旗下的东西,你其他的一些单模型是不能用的啊。我就说我确实很想用 deepsafe, 那 有什么办法没有? 他的回复其实大概意思就是啊,你要用这个,你要是硬要用这个的话,那你就找别的家工具去吧,换了,如果是以前的话,咱也只能被动接受,要么就是更换其他的工具去用。但是现在不一样了,咱们有可尔克的原码了,虽然说这些原码并不是完整的,但是我们经过几天的奋战,已经把他所缺失的那部分给修复回来了, 也就是我们现在的可尔克是可以正常在本地部署运行的,那么我们自然有方法去让他支持我们去使用国内的这些大模型。 一共就两步,当我们部署好它的 code 之后,我们就打开这个点 excel 文件,然后进去之后把它的这个 api king 和 base url 这两个地方给更改一下就可以了。 比如说我现在用的是 kimi 的 k 二点五,那我就到 kimi 的 官网上去获取正确的 api king 以及它的 base url。 那 么以上所有的记录方法我都是已经做了整理和打包,改完之后我们就把它运行起来。 这可以看到我们现在用的这个大模型就是 kimi 的 k 二点二五,这样大大降低了我们使用 clark 的 成本。然后我们再输入斜杠 mcp 命令去检测一下 mcp 的 状态,我们可以看到我们这里的 mcp 的 服务器是已经成功接入了。

给你的 cloud code gemini c l i 装上灵动导用终端写代码,最烦的就是频繁切换窗口看进度。 web island 彻底解决了这个痛点, 它把 micro s 的 nuts 区域变成了 ai 助手的实时状态面板。实时状态无需切回终端,抬头即看 cloud gemini 运行状态。 交互审批权限申请直接在岛上点确认,效率拉满,一键穿梭,点击通知,精准跳转到对应的终端窗格标签页。全家桶支持支持 item two、 ghost d v s code、 cursor 等 主流终端。请注意,这个软件不是免费的,五天试用,十四点九九美金单排设备终身授权。

你知道 code code 支付 boris 平时是怎么写代码的吗?最近他亲自曝光了自己每天都在用的十五个 code 隐藏技巧,超级干货,看完一定对你玩 code 很 有帮助。第一类,脱离电脑的赛博游侠 boris 透露,现在他的很多代码是在 ios app 上写的,更爽的是,只要调出 voice 功能,你甚至可以用嘴编程。但这只是第一步,真正的神技是无缝切换。当你在外面用手机改完 bug 回到家,只需要再输入 teleport, 就 能把刚才云端里的对话进度瞬间拉取到本地机器接着跑,主打一个随时随地、永不停歇的干活。第二类, 让 cloud 化身赛博包工头。这也是 boris 本人认为 cloud 最强大的两个功能。对于日常的琐碎任务, boris 会用 loop 或者 schedule 让 ai 定时去打工,比如让 cloud 每五分钟自动去审查一下代码或做个 rebase。 那 遇到大规模的代码迁移怎么办?他给出了一个王炸组合 batch, 配合 gitworks。 输入 batch 后, called 会先像个产品经理一样采访你,搞清楚需求后,可以利用 gitworks 在 同一个仓库里裂变出几十个甚至几百个 ai, 实力并发,处理不同的工作,这才是真正的一个人,就是一家公司。第三类,闭环式前端开发 boris 强调,使用 call 最重要的技巧是 给他一种验证输出的方式。每次写前端前,他一定会给 call 挂上 chrome 扩展,或者直接使用桌面内置的浏览器。为什么?因为只要给了浏览器权限, ai 就 长了眼睛。它不再是盲写代码,而是会自己打开网页看效果,报错了就自己接着改,直到跑通为止。这种自我纠正的闭环比市面上任何第三方工具都要稳定可靠。第四类, 丝滑的多线层操作。当 ai 正在吭哧吭哧帮你跑几十个文件的修改时,你突然有了个新灵感,想问他个问题怎么办? boris 说你可以用 baidu 直接发问, 他会在不打断主任务的情况下快速给你答案。如果你想顺着当前的进度尝试两种不同的代码路线呢?也好办,直接运行 branch called, 就 把当前绘画构出两个平行宇宙, 双线操作互不干扰。除了这些,你还可以用 adder 让 ai 同时跨多个不同仓库联动操作,用 agent 定制专属的 ai 人设,甚至利用 hooks 在 ai 运行的生命周期里植入各种神仙逻辑。说了这么多,各位有没有用起来呢?快来评论区告诉我!

兄弟们,这周末出了一个大事,飞书官方开源了他们命令行工具 like c l i 什么意思呢?以前你在飞书里干的事,比如说发消息,查日历,写文档,操作多为表格,现在都可以通过终端命令行来完成,而且它是专门给 ai agent 用的,像 cloud code 这些 ai 编码工具,可以直接调用飞书的能力了。 项目地址呢?在这里,那么这个东西到底能干嘛呢?在这里我帮大家总结了 一句话,两百多个命令,十一个业务模块,像日历啊,即时消息、云文档、多维表格、任务邮件、数据库、云盘,联系人,我们都可以通过命令行直接操作。 飞书呢提供了三层命令架构,也就是我们可以通过快捷键带加号的方式来直接调用,以及 api 命令或者原始 api 的 调用来操作 like c l i。 配置方面的话,五分钟完成配置。首先安装 c l i 以及技能包,创建飞书应用,主要拿到 app id 以及 secret 的, 这个大家要保密, 初次化配置登录认证,然后验证。在验证的这一步其实会踩很多坑,但是飞书的 screen 里面会告诉你,比如说权限的一些配置,它会直接贴出 ui, 让你直接粘到浏览器里面就能进行授权操作,这点还是非常好的。 呃,这里我写了几个呆萌,这里可以通过 c r i 命令,或者像我这样直接口述让他创建今天的会议。会议创建好了,我们可以来到飞书这里,能看到已经创建好了相应的会议, 我们还可以通过命令行直接问他今天有哪些会议。 嗯,这里能看到它已经打印出了今天的会议,我们也可以通过刚刚的命令行来让它输出表格化的数据,我们可以把这个命令拷贝进去, 可以看到这里它已经输出了我们这个会议的一些内容,然后是以表格的方式输出。 呃,第二个就是通过 c l i 命令直接将信息发到群里面去,这里我给大家演示一下,我们将飞书 c l i 真的 太强了,发送到 chat id 为这个的群主, 可以看到这里已经运行完成了。我们回到飞书呃,这边看一下,确实他已经将消息发过来了。 后面还有类似的,像分析 get 记录生成飞书文档,多维表格数据的分析,导出数据以及 ai 分 析数据,发送结论,批量给大家创建任务, 以及通过 c i 命令搜索文档,加 ai 总结等等。 这些所有的演示 demo 其实你都不需要去记这些命令,你只需要自然的语言跟 cloud code 进行对话,它就能帮你完成这些 效率对比。相较于手动操作的话,我们可能要打开飞速客户端,找到对应功能的入口,手动填写表单,竹条的复制粘贴,写周报,数据导出再分析等等, 这些都是非常耗时间的。而现在通过 cloud code 加 c i, 可以 通过自然语言,然后 ai 来帮我们分析这些数据,然后导出报表等等。说几个大家要注意的事项,一个是对于权限的控制,因为 ai 会以你的身份来操作, 他发的消息就是你发的,所以啊,有些公共的大群最好不要在里面乱试。第二个就是 ck 的 这些数据的存储也是比较重要的。 最后是我们可以通过 dryrun 来预览一下我们命令的效果,确认没有问题之后再操作。好了,今天的分享就到这里,我们下期见。