对 ai 的 了解分成了两种人,第一种是用过了 cloud code 的 人,第二种就是没有用过的普通人。去学 ai 最好的方式就是你找到 cloud code 安装上,你去安安静静,认认真真的学它两个小时,那么你就会感知到这个地表最强的智能题, 他到底能够为你带来什么?很多人他不想用 cloud code 吗?想,但是困在了不会安装,那今天我就教你如何零基础去安装 cloud code, 你 不需要代码基础,跟着我的操作五分钟就搞定了。 首先第一步是 cloud code 的 安装,其实它需要装很多的环境,你如果不懂代码,一个一个去安装是很麻烦的。我找到一个办法,就是套娃处理 ai 的 这些问题,套娃特别好用,用一个 agent 去帮你解决另一个 agent 的 问题。 这个我们找到的是腾讯的 work buddy, 我 们在这里直接跟他去讲帮我安装 cloud code, 然后他就在这里就安装成功了, 那么他会有使用步骤的。在终端输入 power shell, 怎么去输入呢?点击你电脑的文件,然后再点击 r 啊,然后他就会出来这个界面,然后你输入 power shell, 它就出来了。在这个界面你输入一个 cloud, 你 看就会在这个界面就代表你已经安装上了, 点一下它就进来了,是不是非常的简单?我们进入第二步就是 cac switch 的 安装,它是什么呢? 他是去帮我们可以让可乐的 code 使用到国内大模型的一个软件,怎么做呢?还是用 workbody 告诉他帮我 安装 cc switch, 他 就可以自己去干活了?现在 cc switch 已经安装好了,我们去找到他,我们去打开,打开的话点这个加号, 这个加号所有的主流的大模型都可以配置,比如说我们去配置一个 mini max 的, 我记得我当初注册他的时候,他送了我十六块钱,就是你可以白嫖他的十六块钱。可以先试用,去找到他的 api k 就 可以了。 我们去找到 mini max 的 开放平台,当进入到 mini max 的 开放平台啊,他就会是这个界面,你可以在这个接口密钥上获取你的 k, 比如说获取到我们这个 k 之后,我们就可以复制在我们的 cc switch 上面, 打开 cc switch, 打开 mini max, 把我们这个 k 复制在上面,还可以在这里你测一下这个 k 对 不对,如果 k 对 了,你就可以点一个保存点添加, 你的供应商就已经添加好了,你来点这个启用,再点这个打开终端,就可以正常的跟 cloud code 去对话了啊,你看我这个就改成迷你 max 了。在这里我们就可以问他你是什么模型, 然后我们等他回答我们。当他回答你的时候,恭喜你,你已经开始使用地表最强的智能题了。我给新手朋友们一个使用上的建议哦,当你使用克罗得扣的时候,你不要让他做完这一步,再做下一步。我建议你直接把你所有的需求一股脑的抛给他,反而生成的效果会更好。 好了,现在你开始动手做你自己的小程序吧,你用自然语言把你生活上最想解决的一件事情,一股脑的需求全部都丢给他,看他会给你生成什么样的东西。如果说你想知道更多可乐扣的进阶的技巧,你关注我,下一期我接着分享。
粉丝2.0万获赞9.3万

本期视频来分享如何将 deepseek 的 vs 模型接入 cloud code, 并解锁 em 的 上下文以及 max 思考等级。我目前已经将 deepseek 的 最新模型 vs flash 和 vs pro 通过 ipad 的 方式来接入了 cloud code。 vs pro 模型在降价之后性价比也越来越高了,并且对 a 键的也有做专门的适配, em 的 上下文对于大多数人来说也更加友好。 视频内容主要分为四个部分,第一需要先安装一下 cloud code。 第二,安装开源工具 c c switch。 第三,需要购买一下 deepsafe 的 api 并完成配置。最后再来测试一下 deepsafe。 v 四 pro 加 cloud code 这套组合表现怎么样。废话不多说,我们现在开始 首先来说如何安装 cloud code。 大家常说 cloud code 经常被封号,那其实封的是拥有模型能力的个人账号,但 cloud code 作为一个单独的软件是可以正常下载和安装的。 没有订阅官方的模型,我们依旧可以使用它的框架当成是 opencloud 或者 hermes nint 这种。在他们的项目官方网站这里也有明确的说明。终端 cli 和 vs code 也支持第三方提供商。 本期视频演示的是安装 cio 版本,也就是最通用的版本。这里有一行中的命令,它支持 macos、 linux 和 windows 这几种不同的系统版本。 windows 这里分为 power shell 命令和 cmd 命令,并且 windows 用户需要先下载安装下 get, 如果没有安装的话,可以到 get 的 官方网站下载安装包进行安装。 这里复制这一行命令,然后打开终端 app 或者 power shell, 输入他们提供的命令回车执行就可以了。我这里已经安装过,所以不再演示具体的步骤。安装好之后可能会出现一个提示,大致意思是安装已经完成,但是 control 的 安装位置并没有加入到电脑的环境变量中。 这里直接复制这行他提供的命令,在终端执行一下,搞定之后输入可拷的 code 杠杠微刃来确定当前的版本号。后续使用的话,直接在终端输入可拷的命令就可以打开了, 但是你那里可能会提示不能连接官方服务。接下来我们来安装第二个工具 cc switch。 cc switch 是 一个开源工具,它能够让 cloud code codeys、 opencloud 这类的 a i a 检测,方便地切换模型。累计下载量有三百多万,在 github 上面也有五万多个 star。 它有很多实用的功能,比如一份配置同步到多个应用,支持热切换,不需要退出应用切换模型。还有用量仪表盘,能够查看你的请求数和头克用量等等。 我们在项目的首页这里有一个已发布的安装包链接,点击进去,然后在这个界面直接划到最下面。这里有很多的安装包版本,如果是 mac os 系统就下载这个 mac os 点 dmg 的 版本,如果是 windows 就 下载这个版本。下载好之后直接点击安装包进行安装就可以了。 它这个项目的说明文档也有比较详细的安装教程。第三步,到 deepstack 的 开放平台购买 api。 我们来到 deepsafe 官网,点击 api 开放平台,我这里之前已经充值了一些,在网页和 deepsafe 对 话是完全不收费的,但是想要调用 api 就 需要进行充值。他们目前没有推出类似 tokpline 这样的按月订阅的套餐,好处就是用多少花多少。 目前他们对 v 四 pro 模型打二点五折,每百万 tokens 缓存命中情况下输入是零二五元,未命中是三元,输出是六元, 这个折扣目前是到五月三十一号截止。 v 四 flash 模型和 pro 模型的价格对比可以在官方的 api 文档里查看,这里点击充值按钮,然后选择金额和支付方式。建议先小额买一笔,用完之后根据自己的实际使用情况再进行补充购买。 付款完毕之后,点击左侧的 api case, 点击创建,然后复制这个 key 的 密钥, 注意这个 k 的 密钥只能够在创建的时候查看,关闭这个页面就看不到了,如果丢失的话,就需要重新创建一个 k, 然后打开 cc switch 这个应用。我这里已经添加好一个 deepsea 的 模型了,选中这里的 cloud 的 图标,然后点击添加, 在预设供应商这里找到 deepsea, 在 api k 这里填写 k 的 密钥,然后这里需要修改一下这几个模型,可以直接参考我这个填写 默认模型就是 deepsafe。 v 四 pro 后面加上 em 是 因为之前的公告有说明,这样才能够开启 em 的 上下文,然后点击添加就可以了, 这里就会多一个 deepsafe 的 模型,点击这个按钮来测试当前 api 是 否可用。点击这里可以配置用量查询,查看当前还剩多少余额, 勾选这里,然后点击保存配置,这样的话就能够看到还剩下多少钱了,然后点击起用,就能够正常的使用可绕的扣子了。左上角有一个设置按钮,通用,这里建议打开开机自启使用统计,这里也能够查看 ai 模型的使用情况和成本。 我们打开终端应用,输入可绕的指令,那这个呢?就是 deepsea v 四 pro 的 模型,并且是一百万的上下文, 我们输入指令斜杠 context 能够查看,这里确实是一百万的上下文 tokens。 这里的默认思考等级是 medium, 可以 使用命令斜杠 effort, 然后空格后面的话就会显示哪些等级可选,这里输入 max 回车确认,这样的话思考等级就会调到最高。还有一个命令可以快速的切换模型, 输入斜杠 model, 然后回车。默认模型其实就是 v 四 pro, 我 们之前配置的 apps 和 sonata 都是 v 四 pro, 嗨酷模型是 v 四 flash, 通过键盘的上下按键来选择,选中这个模型,然后回车确认, 这样的话模型就切换到了 v 四 flash, 这里输入命令 context 能够看到它的上下文,显示是两百 k 的 tokens。 最后一部分来测试一下 cloud code 搭配 deepsea v 四 pro 到底贵不贵,干活效果怎么样。 首先说一下,它是基于文件夹的工作模式,所以你需要先通过 cd 命令跳转到你想要它打开的文件夹,比如我的项目文件夹的路径是这个,就需要输入屏幕上完整的指令回车,到了这个文件夹后,输入 cloud 的 命令来启动它, 如果路径很长的话就比较麻烦。有一种方法可以简化一下, windows 用户应该可以直接在文件夹右键从当前文件夹位置打开终端, mac 用户右键的话是没有的,但是可以直接将文件夹拖拽到终端 app, 那 当前终端打开的文件夹就是这个项目文件夹, 输入 cmd 命令,可以查看当前文件夹的路径,然后输入 cmd, 启动 cmd 的 code。 第一次打开的时候需要确认一下这个文件夹,点击 yes, 后续退出的话需要连按两次 ctrl 加 c。 这里安装一个归藏老师最近开研的一个 ppt skill, 设计是比较美观的。 来到他的项目仓库,这是一个电子杂志风的网页 ppt skill, 纯网页形式,适合线下分享,但是不适合培训课件。这个 skill 的 名称叫做归藏 ppt skill, 这里提供了多种的安装方式, 最方便的就是直接复制这一段话,然后发给 ai, 选中这一段话, command 加 c 复制,然后来到 kol 的 对话界面, kol 加微复制,然后直接发送。 kol 在 执行任务过程中会需要一些权限的许可,遇到的时候直接选中 yes 就 可以了,它的框架对于安全保护还是比较好的。 整个的执行过程我就直接跳过了这里提示安装好了触发词,就是帮我做一份杂志封的 ppt。 ok, 我 在这里输入这句话,然后告诉他要做的内容就在当前文件夹中。在当前的项目文件夹中,我放入了一个 mail 文件, 内容是关于 code 的 使用方法论,然后回车执行。他会先查看项目文件夹的内容和 skill 的 使用说明,执行过程中可能会问一些问题,根据个人的需求选择就行。 我这里也跳过过程,大概直行了六分钟左右,一共生成了九页 ppt, 并告诉了我每页的布局和内容,以及怎么操作。 ok, 我 们直接打开浏览器来查看一下这个网页的 ppt。 这是第一页 codex 的 方法论,整体的设计风格确实是比较美观的,如果是个人制作的话,可能要花费比较长的时间,并且效果还不一定有他这个好。 第二页这里的话可能会有一点点问题,下方的文字有一部分被遮挡了,后面的页数大家可以具体去看一下内容觉得怎么样。 最后再来看一下安装这个 skill 以及制作这九页的 ppt 一 共花费了多少钱。 我在做之前是九点八九的余额,刷新一下网页,那现在还有九点三九的余额,一共是花了五毛钱。这里有一个每月用量的图标,展示每个模型花了多少钱。下面也有 token 的 使用详情,包括输入和输出的具体数量。大家觉得 deepsea v 四 pro 的 性价比怎么样?

club 的 桌面端,从此不管是 co 的 模式还是 co work 模式,我们随便可以用了,再也不用担心 club 的 会封我们的号,也不用管它具体怎么认证。接下来啊,我会用这条视频手把手带着朋友们,用简单的三步,把 club 的 桌面端的模型换成其他的任何模型。 这几天体验下来啊, deepsea v 四 pro 真的 几乎和 opus 四点六一样能打。如果朋友们之前已经装过 club 的 桌面端,那我们先要退出登录,每 装过的话呢,安装一下就可以了。然后呢,我们保持未登录状态,点击菜单栏的 help 按钮,再点击这个 troubleshooting 按钮。在弹出的二级菜单中啊,点击这个 enable developer mode 按钮,然后呢,再弹出的菜单点击 enable, 这样我们就打开了它的开发者模式。这个时候啊 cloud 会 重新启动,等它再次启动后,啊,菜单栏就会多出一个 developer 按钮,这个时候呢,我们点击这个按钮,在弹出的菜单中点击这个 configure third part 按钮, 这个时候呢,就会进入到这个页面。这里我们要选择 gety 模式啊,然后我们要填一下 gety 的 best url, 这里其实就是我们要填写的模型的 best url。 那 这里呢,我用 deepsea 的 v 四 pro 给朋友们演示一下。不过 deepsea 有 个遗憾哦,就是图片理解它一直没有,所以呢,我们如果配了 deepsea 模型的话,发截图它是无法识别的。那这个问题呢,我们如果配了 deepsea 模型的话,发截图它是无法识别的。那这个问题呢,我们输入这个就可以了, 因为这个是兼容 astropac 的 best url, 然后下面 getaway apikey, 这里我们就填写我们自己的 deepsea apikey 就 可以了。然后呢下方这里的 modlist, 因为现在 deepsea v 四有对话和推理两种模型,对应 flash 和 pro 这两种模型,所 所以呢,这里我们要填一个 deepsea 微四 flash, 那 下面这个开关我们可以点开啊,点开它呢就是支持一兆上下文了,下面呢我们点这个按的按钮,再添加一行,我们填 deepsea 微四 pro 开关呢,也可以打开啊。最后呢,我们点击这个按钮, 那可乐会再次重启,重启完成,打开后啊,就是那个熟悉又陌生的界面,看四个 deepsea 的 模型,我们现在执行一个任务,看看效果怎么样啊。

ai 帮我们搞定了前后端开发,但是我们要怎么对接起来呢?并且还要部署上线这期视频,带你一步一步搞定。上次我们让 mini max m 二点一模型开发好了前端界面还有后端的接口,但是还没有实现真正的接口对接, 所以我们现在就开始我们的对接流程。上期我们把所有 a p i 接口都实现好了以后,可以在目录找到这个 dux 文件夹,这里存放了一个 c a p i 的 接口文档,我们现在需要把这个文档复制出来,放到我们前端目录下面,交给前端对接就可以了。 对接的话这里还是用我们之前准备好的提示词,不需要额外修改什么内容,直接发给前端的 mini max 就 行了。对接完后,我们回到微信开发者工具,可以先看看有没有问题。像我这里现在控制台爆了很多个错误,但是如果我们分不清是什么错误, 那就把所有的错误复制下来发给后端的 ai 这里你们也可以换个方式想一下,因为我们前端是按照后端给的文档来对接的,但是对接出了问题,那我们是不是应该先问给我们文档的那个人,就像你自己去买商品,商品出问题了你是不是先找老板, 就和这个一个道理,修改好了以后,我们再回到前端的代码,看看什么情况,这里发现报错信息现在是正常了,提示我们微信登录失败,但是就算登录失败也不是一直刷新, 所以我们现在要搞清楚是不是前端有问题导致的,因为所有的前端显示的问题,比如这种一直刷新都是要交给前端来解决的,因为后端只是一个调用接口的情况,就比如这个登录失败,我是调用的后端给的接口, 那么这种情况就需要找后端来解决。页面问题就是找前端来解决,像我们现在又出现了微信登录失败这个问题,那就是显然要让后端了,修复好了以后,我们再回到前端, 现在就可以看到了前端这里登录成功了已经。现在需要对每一个接口进行排查问题,意思就是每个页面检查数据对不对的,上签到功能,绑定功能,这个流程是不是对的, 还有签到完后这个排行榜会不会更新。然后我这里的情况就是刚刚点击签到成功了已经,但是个人中心页面这里还是显示零 接口是返回正常的,没有爆红,所以我们就把接口的相关地址复制出来,还有返回结果这些可以直接发给前端 ai, 因为是前端显示的问题,这里前端 ai 没找到到问题, 但是提示我们加了调试日制,那我们就要学会怎么看日制。首先就是我们这个 cansl 这个控制台,所有的日制都会在这里面,只要我们进入到了这个页面里面, 你可以看到下面多了 ai 说的那些内容,这个时候我们只要把这些日制信息复制出来发给 ai 就 可以了。所以说前端一块,你只要学会看 cansl 和 network 这两个东西, 就基本够你写一些中小型的项目了。 console 可以 看到你所有代码的有没有报错,还有一些调试日期, network 就是 可以看到你所有的网络资源请求, 比如调用 a p i 接口和访问了一些外部的图片,这里都可以看到。修复好了刚刚显示的问题以后,我们再回到小程序页面看看效果,这里用户名称和累计存活是不是就出来了,然后这个排行榜的序号也是应该显示一二三四这种效果,但是它给我们显示了一串英文, 所以这里也要让前端 ai 一 会儿帮我们调整一下。修复好了,那我们这个项目就完成得差不多了,可以考虑部署上线了。 总体来说,这个九点九的 mini max m 二点一这个模型写代码能力还是可以的,如果配上一些最近比较热门的 sales 或者其他的 mcp 来一起的话,效果还可能更好。目前开发起来给我的感觉可以说是可以和 cloud 五五开的一个效果,像这个九点九二我觉得比 cloud 的 便宜太多了, 而且一天调用一百多次,完完全全够用。小程序部署的第一步我们要知道哪些东西,就以当前项目为例子,我们做的是前后端分离的项目,我们需要准备服务器、域名这两个东西就可以了,域名的话几块钱也有,服务器的话看你配置做选择, 便宜的话九九一年的阿里云也能用。小程序首先是要设置好一个主营类目,然后正常走备案流程, 备案流程一般是二十个工作日左右,有的城市会更快。如果你实在不想用脑子的话,那就全部交给 m 二点一,帮你想疑似词就大白话告诉他就可以了,就像你自己问豆包一样一个道理,我发现很多人都是这样,都会觉得开发很复杂, 但是我们都用 ai 开发了,为什么不问 ai 怎么部署上线呢?小程序的话我就不进行演示了,因为都是一些点一点的操作。我们再来说一下后端这个项目应该怎么部署到宝塔面板。首先我们要在服务器也装上宝塔面板 这个东西,之前有说过,可以去看宝塔面板的官网,然后打开你的 m 二点一聊天窗口,直接问,我在服务器已经安装好了宝塔面板, 但是我要怎么部署,你先给我一个流程,他是不是会告诉你每一个步骤,然后你需要怎么操作,需要上传哪些文件,然后怎么绑定域名,怎么运行项目?这些流程 ai 都已经讲得很详细了, 如果你没有找到的话,你就截图告诉他。所以整套的开发流程就是先把小程序相关的信息,该备案的备案好,该设置的设置好,然后提交审核,审核完如果失败了, 那就按要求改,如果不会改,就把失败原因拿下来发给 ai。 后端上线大概流程总之我们除了开发问题能问 ai 上线流程也是可以一步一步问 ai, 不要把开发想象得太复杂,我们可以先写简单的尝试, 先尝试上线一个自己的小程序,后面再去写一些商用级别的东西。这期视频就先到这里了,有什么不懂的评论区留言我有,看到的话都会回复,所有的提示词还是老样子,看我主页粉丝群。


最近半年使用 cologod 安装了近百个 skr, 最后发现真正能提升工作效率的其实只有三个技能,今天免费分享给大家。第一个, superpowers, 这个 skr 改变了我用 cologod 的 方式。以前我是直接把需求交给 cologod 的, 让他来写代码,写出来虽然能跑,但是经常跑偏,改来改去浪费大量时间。 装了 superpowers 之后,我养成了一个新习惯,每次开弓前先跑一遍,不认英斯德尔敏。这个技能能让可洛的反过来问我问题,你打算怎么处理并发数据库选什么 等等等等。问完一圈,他会把讨论结果写成设计文档存到本地。听起来多了一步,但这一步帮我拦住了无数次的反攻。有些问题你自己都想不到,但是可洛替你想到了。 注意, superpowers 包含了二十多个紫技能,千万别全开,我只用 breamstorming, 头脑风暴, 其他的按需加载,要不然会浪费大量上下文。第二个技能, playing with fails, 这个技能解决了我被坑过无数次的问题。 cloud 有 个问题,它做到一半就失忆。不知道你们有没有遇到过 一个复杂的任务,聊了半个小时,可乐突然说,好的,让我们开始吧,然后就把之前做过的事情又重来一遍。根本原因是对话太长了,上下文被压缩,之前的计划全丢了。普莱因维的 flow 的 做法很聪明,就是别把计划写在脑子里,它是存在纸上 克拉的扣的。每次动手前会先建一个计划文件,每完成一步就在这个文件里打勾,就算上下文清空了,重新读一下文件就能接着干。 这个思路跟 minnes 很 像, minnes 做常任务为什么玩?因为它所有的中间状态都存在本地了。第三个技能, roughlop, 我 给这个技能起了个外号,监工 sky, 你一定体验过 cloud 的 摸鱼模式。写到一半突然说基础框架已经搭好了,你可以在此基础上继续完善。 翻译过来就是活我没干完,我先下班了。 raflopp 通过一个或可拦截 cloud 的 退出动作,他退出的时候或可会检查。你说的完成标准达标了吗?没达到,回去继续写。 我用它写过,完成过一个 c r u d 模块,设了条件,所有接口测试通过加 redmi 写完才算结束。 kloth 中间响停了三次,但都被塞回去了,最后确实把活干完了。但要注意的是,完成条件一定要写写具体做完用户模块这种话等于没说, kloth 分 分钟说服自己已经完成了写成。完成登录接口可用 单元测试,覆盖率百分之八十。加 redmi 包含 api 文档,它才没法浑水摸鱼。以上就是我常用的三个技能,今天希望能够对大家有所帮助,感谢观看,拜拜,下期见!

我将为你讲解最核心的知识点,关于 cloud code, 你 需要了解的一切。无论你是新手小白、进阶玩家,还是资深专家,这正是我当初入门 cloud code 时梦寐以求的指南,因为它无疑是当今全球最顶尖的 ai 工具。 但功能越强大,上手时难免会有些迷茫,不知道如何才能最高效地把它用起来。所以本期视频将帮你拨开迷雾,直达核心,只给你最干货、最有用的信息,让你今天就能现学现用。话不多说,我们马上开始。 第一个技巧就从安装说起。过去几个月,官方已经把安装流程优化得非常丝滑了,而且真的只需要一行代码,无论你的系统是 mac、 windows 还是 linux, 你 只需复制对应自己系统的命令,打开终端,粘贴命令,然后回车,安装程序就会自动引导你完成设置,整个过程用不了一分钟。 第二个技巧,我们来聊聊 comcode 的 应用场景,因为你不用一直守在终端界面里,而且如果你是第一次接触直接操作终端,可能会让人望而生畏。 其实我们可以用 ide, 也就是集成开发环境,说白了就是能让我们用上更直观的图形界面,方便我们使用 cloud code。 而且免费的选择一大堆,比如这里展示的 visual studio code, 你 看,我这里依然开着 cloud code 的 终端,但在左侧,我能一目了然地看到所有正在处理的文件夹和文件,点开文件,里面的内容一览无余,操作起来非常直观。 其他选择还有 cursor, 甚至 clunk 桌面板等等,这些工具同样能发挥 clunk 扣的全部威力,只不过操作界面换成了更易上手的图形界面。 接下来是第三个技巧,权限设置。大家注意看忘按 shift 加 tab 的 时候,就能浏览 clunk 扣里的各种权限选项。这些设置决定了 clunk 扣哪些操作可以自行完成,哪些必须经过我的明确允许。 如果这里什么都没选,那就是默认设置。这意味着它只能读取文件。但要是想编辑或修改文件,它就得先征得我的同意。如果我打开了接受编辑开关,它就能自行修改文件,无需再征得我的同意。但如果它想运行霸式命令,也就是要实际操控我的电脑。无论是安装依赖包,还是执行删除文件这类操作, 它都得先征得我的明确许可才行。接下来看这个绕过权限开关。这是一个特殊的权限设置,需要你以特定的方式启动 qq。 如果想起用它,我必须使用 cloud dangerously skip 权限来启动 cloud code。 那 么这个设置允许 cloud code 做什么呢?它允许 cloud code 直接修改我的电脑,例如下载某些依赖包,或者未经我明确许可就删除文件。 这确实有点危险,但它能让你更快速地完成你的工作流程。所以随着你越来越熟练这个功能,你很可能就会用上。不过,刚开始的时候,如果觉得这太冒险,那就先坚持使用接受编辑开关。 接下来是第四个技巧,你可能刚刚已经注意到了,那就是计划模式开关。这是 cloud 最强大的功能之一,也是在设置方面你必须掌握的功能。每当你着手一个新项目,或是想要开发一个全新的功能, 而计划模式。顾名思义,如果我给 cloud 下达一个任务,比如说,嘿,用 react 和基础 ui 组建创建一个简易的任务追踪应用, 他并不会直接接过指令就开干立马动手写代码,而是会先跟我来回沟通几轮,他会问我一些问题,我们一起商量确定最佳的推进方案。接着他会制定出一份完整的计划,让我在他真正动手执行之前,先过目审核一下。这就是他为咱们这个简易应用制定的计划。 计划里详细列出了环境配置、需要修改的文件、应用的整体设计、实施步骤,以及最后的验证环节。然后他会给我们几个选项,比如确认清除上下文、确认绕过权限确认、手动审核修改。 当然,你也可以直接告诉他你的任何要求,比如说,等等,先退回上一步,我想换个方式来坐这里或那里。大多数情况下,你会同意清除上下文,并绕过权限检查。 我们会在终极课程里再深入聊聊这个话题,具体讲讲上下文窗口,以及为什么清除上下文。这个操作直观重要。 现在随着他开始执行,他会逐步分解任务,把所有的功能项基本上都列成一个清单,你可以时时看着他一项项完成。 接下来是给初学者的第五个技巧,斜杠命令,顾名思义,它们就是斜杠开头的命令。如果我在提示窗里输入一个斜杠,你就能看到一堆我可以执行的不同斜杠命令,而且数量还真不少。好在当你输入斜杠时, conoco 会解释每个命令的用途, 不过有几个命令你肯定会想随时调用,并且会频繁使用。首先,你大概想知道的第一个命令是 model, 我 就可以在 infopack 提供的不同模型之间切换。 默认情况下,你使用的是 opus 四六,我可以切换到上下文窗口更大的 opus 四六,或者换成 sanit 嗨客等其他模型。如果你比较在意令牌消耗或者使用成本,这一点就特别重要了。而且你总会想用上最强大的模型, 我还能调整它的用力程度,也就是说,我可以控制 opus 动多少脑子,毕竟不是每个任务都需要它火力全开。 opus 就 好比是解决每个问题的核武器,威力巨大。 另一个好用的斜杠命令是 revine 回退。用了这个命令,我基本上就能时光倒流,回到对话和代码的某个之前的状态。你可以把它理解成游戏里的独档,回到上一个存档点。所以如果你对之前的操作不满意,不用再跟他说嘿,我们退回去也不用费劲解释具体要改哪里,直接输入 revine 就 行了。 另一个非常重要的命令是 contacts 上下文,这个命令能让我们看到当前上下文窗口里到底装了些什么。说到这里,我们就进入了第二部分终极教程,主题是上下文窗口管理,这是你用好 clock 必须掌握的核心技能之 一。下面我们快速过一下上下文窗口和令牌 tokens 的 概念,因为理解它的工作原理直观重要。如果你想充分发挥这个工具的潜力, cloud 的 任何操作都会消耗令牌 tokens。 令牌就是 ai 系统里的硬通货,每次我发送或接收消息,每当 cloud co 调用消耗代币的 m c p 使用工具或查看系统提示时, 现在我们设定了代币预算。 cloud co 的 预算是二十万代币。现在问题不在于我们能用的代币数量有多少,对吧?有些系统的上下文窗口能容纳百万代币,问题在于上下文腐坏这个概念。 上下文腐坏现象表明,当代币使用量达到大约十万时,也就是达到 clock 预算的一半,或者说大约十二万代币时,我们 ai 系统的效能就会急剧下滑,对吧?开始断崖式下跌。所以,既然我们知道了这一点,那就直观重要,必须避开上下文窗口后半段这个危险区。如果我们想处理任何复杂任务, 这意味着我们必须时刻掌握动态,也就是要清楚我们的上下文窗口已经被占用了多少。一旦发现快进入红色警戒区了,我们就得从头来过,需要重置那个上下文窗口, 下面我来演示具体怎么做。就像我刚才演示的,随时输入斜杠 complex 命令就行,就能查看当前上下文窗口的使用情况。目前这个绘画里我们已经用掉了两万一千个令牌,总共有二十万个才用了百分之十一。不过假如我用到了百分之六十到七十,想重置一下的话,那我直接输入科尔命令就行了, 这样就会清空我这个绘画里的所有聊天记录,同时重置令牌使用技术。这听起来可能有点吓人,因为你大概已经习惯了在网页应用里和 ai 系统打交道,一旦清空所有记录, ai 就 没了上下文,你基本上就是在和一个啥也不知道的机器人瞎聊,它完全搞不清状况。 好在对我们来说,在 conq 里面,它始终保有上下文,因为它随时都能查看我们的文件和项目,了解我们到目前为止都做了些什么。所以重启对话其实没什么大不了的, 但老师输入 context 命令查看也挺烦人的。所以我们可以换个法子,让 conco 给我们创建一个状态栏,实时显示上下文的使用量。 看到下面这里了吧,你看,它显示了我所在的文件夹。 cc stuff 用的模型是 oppo 四点六分,还有我的上下文使用百分比,这样我就能随时掌握令牌的使用进度了。这对于真正物尽其用,发挥这个工具的全部价值来说非常棒。不过这个功能并非开箱即用,有两种方法可以搞定它。 第一种,你可以用我教程里提供的代码直接复制粘贴到 clunk 扣里,它就会自动帮你构建好。或者你也可以直接给 clunk 扣一下指令,告诉它给我创建一个状态型,要能一直显示上下文窗口的占用百分比, 然后它就会照办帮你搞定。通过这种方式来管理你的上下文窗口,能让你把竞争对手远远甩在身后。那些压根儿没考虑过这点的对手,他们只会让 clunk 扣自动压缩处理。 这就是如果你从不手动清理直到触达限制时会发生的状况,它就会再次给你重置掉,我们可不想这样。接下来是第七个技巧, git 和 git hub, 我 们之前简单提过倒带功能,记得吧,如果我输入路由呢?我就能让代码时光倒流,回到代码之前的状态,同时对话内容也相当于一个存档点。但这基本上是新手处理代码存档和版本控制的套路。恰恰相反,我们应该使用 git 和 git hub。 你可以把 dchat 看做一个免费的云端仓库,专门用来存放你所有的代码存档点。它的运作方式基本就是这样, 在 dchat 上注册账号完全免费,它能成为行业标准不是没有道理的。而 qq 在 使用 d 和 dchat 方面可是个行价。 dchat 本质上就是一个底层工具,让我们能够创建代码存档点,然后再把它们推送到我们的 dchat 代码仓库。而完成这一系列操作,简单到只需说一句,关联我的 dchat 账户,提交代码,然后推送, 所以它会一步步引导你如何关联 github 账户,非常简单。提交代码这个操作你可以理解为就是保存代码。当有人让你提交代码时,说白了就是让你创建一个存档点,接着就是推送。 推送的意思是我已经用本地保存好了代码,现在我要把它真正推送到 github 上,这样代码就会存放在一个仓库里,我随时都可以访问,基本上就能看到我的代码了。 现在第八个技巧调试,我们该怎么办?该怎么办?当代码出问题时,你该怎么办?就拿咱们的任务追踪应用来说吧,比方说这个按钮有点不对劲,或者整个 u i 设计都不太对劲。 这时候与其费劲地向 clown 描述问题,我其实可以直接截个图,然后直接拖到提示框里就行,就跟在叉 g p t 或者 clown 网页界面里操作一样简单。 第二个排障步骤更简单,直接把报错信息复制粘贴到 cloud code 里。再比如我在部署应用时卡壳了,而且报错不是来自 cloud code 本身,而是外部环境。比方说我用的就是 firsto, 那 处理起来也很简单,直接复制这段错误代码丢给 cloud code, 然后告诉他,嘿,我碰上这个麻烦了。 至于第三个排障步骤,思路就更高级了,直接从源头上避免问题发生。你可以在规划阶段就指示 cloud code, 让它以测试驱动、开发 t d d 的 模式来执行任务。第九个技巧是把 cloud code 当成你的研究小助手, 它的本事可不止写代码,它还能主动上网冲浪,帮你查找资料,然后利用这些实时获取的信息给出更靠谱的答案。 还是拿我们那个简单的任务应用来举例,与其简单地说,嘿优化一下这个应用的外观,不如这样说,优化这个应用的外观,开启网络搜索功能,去查找二零二六年 ui 设计的最佳实践,对吧?这一点直观重要,绝对能带来额外价值,因为别忘了, com 的 知识是有截止日期的,对吧? open 四点六模型的知识我记得大概截止到九个月前,但从那以后, ui 设计领域又有了新的发展,你可能想把这些新方法应用到你的程序里, 只要你指令他使用网络搜索这类工具,他就会上网去查找当前的最佳实践,从而让你的工作流程效率大幅提升。接下来是第十个技巧,也是中级阶段最后一个最为关键的技巧,那就是你使用这个工具时的心态,这一点对于非技术背景的朋友来说尤其尤其重要。 使用 conco 时,最容易让你踩坑的一点就在于,你不知道自己不知道什么,你可能会踏入自己浑然不觉的雷区。如果你不告诉 conco, 你 正在荒野中迷失了方向,并且对前进的最佳路径毫无头绪。不过别担心, conco 能帮上大忙,尤其是在计划模式下,对吧? 如果我们在计划模式下尝试构建一个更复杂的应用,它会通过提问等方式来引导我们。不过你依然在某种程度上扮演着领路人的角色, 要从在黑暗中瞎摸乱撞,指望 client 给你指条明路的状态中走出来。方法其实很简单,就是直接让 client 给你指路,这就像直接问他,我还有什么地方没想到一样简单。这么做是最佳方案吗?在我正在做的这个项目上,专家会怎么做?他们遇到这种情况会怎么处理? 更进一步说,当你需要弄明白 client 为什么那么做的时候,你需要采取主动,在这段人机协助中占据主导地位。 就拿我们眼前这个任务跟踪器来说,它刚刚生成了意外设计,它会告诉我它做了什么。但如果它说了一堆操作,而我完全搞不懂是啥意思,你就得去问 clunk 了,你为啥要这么做?底层到底是怎么运行的? 你不必会写代码,但你必须理解这些功能模块是如何协调工作的,否则除了像个机器人一样不停地点接受接受接受,你在那里的意义何在?现在 clunk 确实非常强大,很多事情它都能做得非常棒, 以至于你就算只当个舞蹈点击的接受员也能混得不错。但到某个阶段,你必须开始消化吸收,积累经验,真正理解背后发生了什么。否则当你开始接手更复杂的项目,比如让他为一个任务跟踪器搭建前端时,你肯定会在跟头,因为你根本不知道该怎么向 clunk 提问。 没错,你不必事事都懂答案,但关键是要懂得在什么时候提出什么样的问题。有时候你确实需要稍微引导他一下,让他走上正轨,而这正是最终能让你从一个只会跟风敲代码的氛围组蜕变为一名真正热爱开发者的关键所在。 当然,你不可能一蹴而就,这需要时间和经验的积累。不过要想快速提升达成目标,最有效的方法其实很简单,就是在这场人机协助中主动出击,扮演好主导者的角色。好了,关于这一点就聊到这里,接下来我们进入第三部分,这部分将为进阶的学习者分享一些高手专用的专业技巧。 那么技巧第十一条,我们来重点聊聊 call 的 技能。 skills。 现在 call 技能可以说是无处不在,你总能听到大家在讨论它,不过其中也夹杂着一些误解。那么技能究竟是什么呢? 说白了,技能就是一种带有特定标记的文件,它本质上就是一个文本文件。说得更直白点,就是一个特制的提示词,专门用来指导 ka 以某种特定的标准化的方式去完成一项特定任务。举个例子,我们现在看到的这个就是前端设计技能, 这是 quad 官方提供的一个技能,它的作用就是帮助我们创建用户界面,这些结果比 quad 的 常规输出出色的多。我们来看看这到底是什么呢?这不就是纯文本吗?它并没有调用什么特殊工具,它的底层逻辑也没有进行什么高级处理,这仅仅是一个提示词而已,但这些提示词的威力可不容小觑。 至于添加技能,尤其是那些官方的 quad 和 plugin 即可,然后就能调出技能市场。 瞧这里,马上就能看到一些技能,比如 contacts、 七、 superpowers, code review, github 等等。在我已安装的技能列表里能看到我有前端设计工具这个技能,我们可以在市场里搜索这些技能。想要调用这些技能并让 core 使用它们,我只需用大白话说就行。比如用前端设计技能优化一下我们的 ui, 然后立马就能看到提示。前端设计技能优化一下我们的 ui, 然后立马就能看到提示。前端设计技能已成功加载技能,比如输入 funendison 就 行。 现在他就会明白,我们要用那个前端设计技能来执行这个命令所要求的任何操作。我可以创建自定义技能。再强调一遍,创建自定义技能很简单,你直接用大白话说就行。我想创建一个能搞定 x、 y、 g 这些事儿的自定义技能, 他就会帮你创建好,你给他起个苗。你可以直接用自然语言来调用它,或者用一个斜杠命令,后面跟上技能名,就这么简单。 现在第十二个技巧是智能体团队,我超爱这个功能!这其实是 call 代码里目前的一个实验性功能,默认是关闭的,但开启它超级简单,而且 call 代码自己就能搞定。如果你去翻看官方的 call 代码文档,直接搜智能体团队,然后把这段提示词给 call 代码,把提示词输进去, 智能体团队就能跑起来了。那智能体团队到底是啥呢?说白了,智能体团队就是 call 代码开的额外绘画,他们在你的主绘画底下干活,能同时处理一堆任务。还是拿我们的任务追踪应用来举例说明?比方说我想优化一下用户界面,还想给他加个泊客功能,我还想加上用户身份验证。 另外,我还想添加一个类似邮件订阅的功能,让用户可以注册,对吧?这么多事情要一下子搞定可不容易。与其让 quail 单打独斗完成所有这些任务,我们可以起用智能体团队模式,让每个团队成员各司其职,每个团队成员就相当于一个独立的 quail 代码实力在运行。 此外,为了和普通的子智能体配置区分开来,普通的配置是让多个 quail 代码实力同时运行。而在智能体团队里,成员之间是可以互相沟通的。 这样一来,负责优化界面的,负责搭建博客的,还有负责身份验证的,这些成员都能互相交流,他们甚至还有一个团队领导来整合协调所有人的工作,这样整个项目就能完美衔接,形成一个整体。 所以说,智能体团队的设计初衷,本质上就是为了模拟一个真实的开发团队。想要使用智能体团队,你只需要明确下达指令就行。 也就是说,你得告诉跨二代码,用智能体团队模式去完成 a、 b、 c、 d 这几项任务。指令一下达,跨二代码就会自动开始分解任务,明确每个智能体团队成员具体负责什么工作,他们的具体任务是什么,以及需要处理哪些文件。在下方你也能看到标注着本地代理的区。 接下来我们看第十三个技巧。 m c p。 服务器 m c p。 服务器能让你与 call 代码进行交流,便让 call 代码与互联网上的其他程序互动,比如 notion、 figma、 slack com 的 等等诸如此类的工具。 实际上,把这些 m c p。 服务器集成到你的项目里相当简单。如果我们打开 call 代码的文档,搜索那些比较流行的 m c p。 服务器, 就能找到一个现成的简单命令供我们运行,然后把这个命令输入提示框,它就会开始执行任务。不过,如果你想用的 m c p 服务器不在那个现成命令列表里,你也可以直接用大白话告诉它,嗨,帮我设置一下某某 m c p。 服务器, 你还可以吩咐它去网上搜一下教程,照着做,这样它就不会像无头苍蝇一样乱撞了,它会自己上网找到相关文档,然后按步骤完成设置。 另外要注意, m c p。 服务器会占用一部分上下文窗口。有些 m c p。 服务器体积很小,但也有一些非常臃肿的,那些臃肿的服务器一上来就可能吞掉你百分之十、百分之十五甚至百分之二十的上下文窗口,就算你根本没用它,只要加载了它就会一直消耗令牌数。 接下来是第十四个技巧, call 代码框架。这些框架,比如 g s d 高效执行或闭麦保持激情都属于这类工具。 你可以把它们看作是跨 code 的 增强模组,底层核心依然是跨 code 在 运作。但如果我在跨 code 的 基础上套用 g s d 这类框架,它就会改变其处理特定问题的方式和逻辑。至于要不要用这些框架,最终还得看你自己,这很大程度上是个人喜好问题。 不过市面上确实有很多非常棒的框架,能帮你更高效地开发复杂项目。我觉得 g s d 就是 这样一个好用的框架, 它处理上下文窗口的能力以及运用子代理的策略。我特别喜欢它的设计思路。总之,你知道有这些东西存在就好,针对某些特定场景,借助这些框架可能会事半功倍。接下来是专业部分的最后一个技巧,也是个比较新的概念,工作树。 这和我们之前提到的智能体团队概念有点类似。当时我们是让不同版本的 quaco 同时处理不同的任务,而工作树也能实现类似的效果。不过它是在不同的 key 分 支上运作。 操作起来很简单,你只需要用这个命令打开独立的终端窗口。命令是 worktree, 后面跟上你要开发的功能名称。以我们的任务应用为例,我们可以在一个终端里运行 quadworktree feature dark mode 来开发黑暗模式功能。第二个功能是云工作树导出功能。比如说我可以把所有任务打包导出成 pdf 文档, 接着我们会同时启动这两个云代码终端,让它们执行相应任务,最后再把功能合并起来,等它们在各自的工作树上都搞定之后,以上就是我使用云代码时最实用的十五个技巧和窍门。

为什么我说现在就是你开始 vaping 的 最佳时机?因为现在开始的成本真的很低。 openai 的 创始人 sam ottoman 在 推向上宣布,他家旗下的 codex 能免费用了,而且免费的不是什么渣渣模型,而是 openai 最新的 gpt 五点三。 codex 速度更快,逻辑更强,完全不输隔壁添加了 cloud ops 四点六,那我已经深度使用一个月了,并且已经手搓上线了自己的产品。那么这期视频我们一起来学习一下如何正确使用 codex, 开启你的 web coding 旅程。 给还不了解 codex 的 同学简单介绍一下, codex 是 open ai 旗下的编程智能体,而隔壁 cloud code 是 同一种产品,有了 codex, 再加上 gpt 五点三的模型,就可以愉快的编程了。 一般人看到黑底白字的命令行界面估计就被劝退了。别担心, codex 不是 硬核的即刻工具,它有正儿八经的图形界面,官网下载、安装、登录一气呵成,没有什么要你做的复杂配置, 接下来的内容很关键,你要搞清楚两个概念,工作区和 thread 工作区。你可以理解为你的项目文件夹,比如你想做一个网站, 先建立好文件夹之后,所有的代码文件都会保存在这里。而 thread 就是 一个个的聊天窗,这些聊天窗就是 一个个的任务线。这里有个黄金法则,大家一定要记住,不同的任务要开不同的 thread, 千万别在一个窗口,一会让它改 bug, 一 会让它写新功能。另外你也不用傻,等任务完成,你可以同时开多个 thread, 同时处理多个任务,效率直接起飞。前段时间爆火的 skills 在 codex 里直接格式化了,内置了几十种的 skills, 鼠标点点就能安装了。这些 skills 能让你的 agent 如虎添翼,关键省去了繁琐的搜索和安装过程。 最后分享一点个人使用心得。上一个视频里我推荐了谷歌的 anti gravity, 其实这两个产品你可以一起用,把 codex 的 插件装在了 anti gravity 里面,这样你可以同 同时要用多个模型,比如让 g p t 五点三改 back, 让 jammer 做前端,让 cloud 出方案,不用切屏,不用复制粘贴,一个界面汇集世界上最好的三种模型帮你干活。这套 web coding 的 形态, 你值得拥有。以上就是本期视频的所有内容,欢迎关注艾伦,二零二六年,我会持续创作更多 web coding 和 ai 工作流的相关内容,我们下期再见。

本地 agent 是 ai 发展现在最重要的领域了,也是普通人跟上这个 ai 时代我觉得最直接的方式。如果你现在仍然每天只是跟那个聊天机器人在问一些问题,还没有正式去接触过本地 agent, 觉得概念太多啊,没有头绪啊,不知道从哪里开始,这个视频呢,就特别适合你,它不是一个简单的这个工具教程,而是会告诉你普通人使用 agent 的 这个方法论,不管你是用哪个 agent, 都 都可以用上这套逻辑。如果让我来给 agent 排名的话,我觉得世界上 t 零级别的应该有四个, cloud code code、 open code 和 pi agent。 如果你有自己用的顺手的 agent 啊,其实大致的逻辑都是一样的, 但我今天呢,想带大家吃点好的。刚才提到的前三个的 agent 啊,主要的作用基本上就是帮你写代码,因为你看到它名字里面都带有一个 code 这样一个单词,你可以在网上收到大量大量的教程,但其中啊,这个 pi agent 是 里面最冷门的一个。 国内啊,我看到网上几乎没有人特别去聊这个主题,但是呢,它也是最特别的一个,因为它不是去专门帮你写代码的,它是帮你去完成日常任务的。大家看啊,在这个 open root 的 排行榜上呢, pad 的 这个每天的 token 消耗量是排在第六名的, 除了前面两个乱消耗的大哥,它仅仅地排在了大名鼎鼎的 cloud code 后面。 open i codex 负责人今天还说啊,它们大概有百分之五的生产流量已经跑在了 pad 哈尼斯出来的这个 agent 上面。别看这百分之五啊,你放在 codex 这个量级的工具里面我觉得已经很夸张了,之后大家会了解到说做同样的事情,其实派的消耗量会小很多,所以他排在第六名呢,我觉得已经很厉害了。最近三个月啊,派呢是我用的最多的 ai 工具, 所以我今天就想用派 agent 来给大家做一个 agent 和 skill 的 入门教学。我会手把手来教大家做三件事情。第一个呢,就是我们一边装 skill, 一 边去演示案例,搜索的,读 pdf 的, 读 office 的, 与 语音生图,做视频,每一步我们现场都去跑一遍。第三部分呢,最后我会让拍 agent 去做一个完整的大的案例调研,并且去自动生成一个很酷的视频。然后呢,再顺便提一句,观看这个视频,我觉得最好的学习方法是你打开你的电脑,一边看我的视频,一边自己去动手,视频呢可能有点长,大家可以先点赞收藏,然后慢慢看。我们现在正式开始, 我们先来说一个很重要的区分啊,就是像 cloud code codex, open code 呢,这些都是代码智能体。这个 agent 的 主要的目的啊,就是去写代码,产出就是代码,你让他去写一个功能,他交付给你的就是整个项目里面的这个一个个文件。比如说我拿 cloud code 的 举例子, 它里面呢就预装了代码的缩影,测试、运行、 get 操作、编码规范,整套呢都是围绕着更好的去交付代码项目去设计的,开箱即用写代码呢,确实是非常方便。 大家平时任务其实都不一样啊,不是每个人都天天坐在那边写代码的,你可能想要去搜资料,读 pdf, 整理表格,写汇报,做 ppt。 如果你预装一套通用的编程的工具,其实没有办法去照顾到所有人的日常办公的需求,派是怎么解决这个问题的呢? 派的设计思路啊,其实跟其他的 agent 都不太一样。其他的 agent 啊,大家知道功能越来越多,派呢,是反过来的,他是一个极简主义者,他把底座做得非常的极简,只保留四个最基础的工具,读文件、写文件、改文件和跑命令。除此之外呢,其他什么都不装了。他为什么这样设计呢?是因为他想让你去搭一个自己的 agent。 如果你是搞研究的,你可以装 pdf, 装搜索的 skill, 如果你是办公的,你可以装表格的这个 skill, 如果你想让他开口说话,你就去装 edge tts skill, 如果你去想做视频,就去装 hyperframes。 你 装一个 skill, agent 就 多一项能力,每个人手中的 pie 啊,最后长的都不太一样。大家看他这官网上的口号也是这个意思, 世界上有很多很多其他不同类型的 agent, 但是这个派 agent 就是 你自己的 agent, 这句话呢,就是最精确的表达了他这个派 agent 设计的这个基本的理念。上面我提到了好几次的这个 skill, 那 skill 具体是什么东西呢?就是一份给 agent 的 说明书,一份给 agent 的 操作手册。 agent 读完之后呢,他就知道怎么来具体的干活了。我们看啊,他 底座保持极简能力呢,就是你可以按需去安装,这就是 pad 的 设计思路。到这里呢,可能有些朋友也会好奇啊,就说你这差别到底能有多大呢?听起来好像也差不多嘛,我给你举一个具体的例子,如果你平时去用 cloud code 发一条,你好发一条 hello, 这个系统提示词呢,就会占到你两万的 token, 像 codex 跟 open code 可能稍微少一点,但也要一万五千字的 token 左右。 pad 是 多少呢? pad 系统提示词啊,不到一千五百字,差出十几倍。这会带来直接的三个好处, 一呢就是快,上下文短模型就会算的快,给出的答案也会快。第二点呢就是省省 token。 我 自己的体感就是做同样规模的任务, token 消耗呢,大概只有 cloud code 的 三分之一左右,甚至更少。第三点呢,就是聪明,模型的注意力是有限的,大家知道,如果你的提示词越长, 模型呢,可能他的注意力就越分散在派里面呢,没有一万字的预设的这种为了编程的提示词在旁边去抢注意力。在同一个日常的任务当中,派就是比 cloud code 的 更 更聪明,更听话,这个体感就会很明显。再回到开头说的这个 openroot 的 排名啊, pad 对 话每次消耗的头壳呢,只有其他 agent 的 几分之一,但总消耗量却能排在第六,我觉得这个含金量就很高了,说明在海外,在这个极客圈里面,也就有一大批人把 pad 当成日常工具在用了。 然后呢,派默认呢,他是跑在这样的这个命令行里面的,你看到有点繁琐,所以呢,我给他包装了一层网页,把它做成一个简单的这个容易使用的应用。这个项目呢,我自己大概已经使用了三个月左右,我跟我的朋友们基本上每天都在用。确实呢,把我很多日常的工作里啊都串了起来, 我觉得非常顺手,所以我现在公开出来了,开源出来了,如果大家有需要的话,也可以直接拿去用。下面的演示呢,其实就是用我自己开发的这个 pad 应用。好,我们先来安装这个 pad。 怎么安装呢?当然首先呢先要来安装 node js, 这个呢几乎是你去装所有的 agent 都要去依赖的这个一个基础的东西,如果你之前安装过,那你就跳过这一步,如果你没有安装过,你就在这边选择自己合适的电脑的环境,然后下载安装包,双击之后呢,一直下一步,它就帮你自动安装好了。 然后呢打开你的终端,在启动之前有一个可选的步骤,就是设置国内的镜像加速,你可以去搜一下 npm 国内的镜像加速,这里我用的是腾讯的镜像加速,就是输入这样一行命令,然后直接回车就可以了。 设置好镜像站之后呢,我们就可以启动派了,如果你是 windows, 你 可以点击菜单,打开你的 power share 应用,如果你是 mac 呢,直接打开终端就可以了,所有的都是这样,同一条命令,然后回车,他会问你是否继续 输入。 y 代表是的,刚刚输入的这条命令的意思是什么呢?就是运行我开发的派 web 的 最新版本,它首次运行呢,需要下载一些项目文件,所以会慢一点,之后更新的时候呢,都是会从缓存里面去加载,会快很多。安装好之后呢,它就会自动弹出这个派的网页应用了,就是大概长这样子的,看到左边呢就是 文件浏览器,你可以选择一个自己的目录,或者用我这里设置的默认的目录,然后下面呢大家可以看到可以设置模型,可以设置添加自己的 skill, 然后中间呢就是我们非常熟悉的这样一个对话框了, pi agent web, 然后你可以在这里输入文字,也可以上传图片, 然后可以选择一些参数啊,模型等等。然后呢,第一步我们就是要先来添加我们的模型,因为你没有模型的话,你这个 agent 做的再好其实也没有用。点击这里的模型,点击添加模型服务商,我们看到派支持很多这个官方的供应商, 然后也支持走这个 gpt 的 订阅,如果列表里面没有呢,你就选这个 custom 自定义接口,这一步呢就跟你配置其他的 agent 的 接口一样,填好 base url, 点好你的 a p i t, 然后点保存就可以了。添加好服务商之后呢,我们在这里选择添加模型,我们填上模型的名字,我们今天用的是 g p t 五点五,而最近用五点五实在太爽了,量又大,然后能力又强。 这里呢勾选上它的推理模式,然后可以允许图片输入,然后把最强的 x high 的 这个思考模式选上。窗口,我们选择二十万,然后这里填个六万四的这个最高的投屏输出保存,然后我们来测试一下,发个你好,我们看到模型已经通了,然后呢我发送我问他一下,说看一下我的桌面上有什么, 你看他已经能读取我电脑上桌面上的这个文件了。其实呢就是我们下载完派之后什么功能都没加的派呢,已经能做不少的事情了, 说整理文件夹,然后批量改文件的名字,执行命令,跑脚本,只要是本地电脑上能通过文件和命令完成的事情,派,他基本上都可以帮你去完成。好了,到这一步为止呢,我们看到我们的 agent 已经调通了,接下来呢,我们开始学习 skills。 多人觉得啊,这个现在 ai 时代概念太多,发展太快,不知道从哪里开始,那就牢牢地记住一个公式, agent 加上 skill, 这样就可以了,这是对于普通人来说现在最基本的框架,最本质的逻辑。下面我演示的啊,不单纯是去装一个 skill, 因为我这里也加了一个很方便的装 skill 的 这样一个按钮,我 会装一个 skill, 然后马上跑一个小任务。你会看到说我的派呢,怎么样?从一个只能读写文件的这样一个本地的 agent, 一 步步地变成一个能搜索、能读资料、能说话、能深图,甚至能做视频的一个工作流的 agent。 点击 skills, 然后我们这里添加 skill, 你 可以去搜索 skill 的 名字,然后选择里面想装的 skill, 点击安装就可以了。这里呢,有两个选项,一个叫做 global, 一个叫做 project。 global 呢,意思就是说你在 global 情况下安装的 skills, 是 所有你的项目都可以去使用的 skills。 如果你在 project 里面去安装的 skill 呢,就是只有这个项目你可以用这个 skill, 其他项目呢,不能去使用这个 skill。 所以呢,我一般就默认就选 global。 今天呢,我会来装几个我平时最常用的 skills, 覆盖基本上百分之九十的日常的场景。 第一个呢就是要安装搜索的 skills, 让我的 pi agent 能够去联网搜索,为智能体提供搜索服务的商家呢有很多,我这里呢推荐两个。 第一个呢就是这个 tivoli search, 它注册很简单,免费账号,每个月有一千次的,这个搜索额度很适合这个新手去使用。第二个呢就是 brave search, 它的搜索结果会更好一点, 但是比较麻烦的就是需要绑定信用卡,免费额度呢也是一千次是一样的。我这里呢先给大家演示 tivoli 怎么来安装,我在这里直接搜索 tivoli search, 点击安装, 安装好了。然后呢,我们去这个 tab 里搜索的官网注册一个免费的账号,然后可以把这个 key 复制过来。我们回到 pad 之后,直接跟他说帮我去设置 tab 里搜索用的 key, 然后 key 是 什么?什么?就是你刚才复制过来的这个 key 直接发送,然后 pad 呢会自己去写入这个配置, 它配置好之后呢,我们马上来试一个小任务,看看能不能搜索。搜一下这周最重要的五条 ai 新闻, 按重要程度排序,每条说明发生了什么,为什么重要?适不适合做短视频?保存到一个 news 点 m d 文件发送。我看到啊,这个派呢,开始调用搜索的 skill, 然后去整理结果, 它不是只给我随便很多的一大堆的链接,你看它这里有个评价搜索结果,它可能会把新闻去去重排序,然后再按照我的这个需求判断哪些更适合去做短视频。 好了,任务帮我们全部做完了,你看最后帮我们生成了一个这个 news 点 m d 文件存在了我们当前这个目录,下面我们来看一下,在右边呢,我还写了个预览的界面,给到这个 拍一进去用,你看五条 ai 新闻非常清楚啊,我觉得很厉害。那除了这个 tiffany search 之外呢,如果你想要得到更好的搜索结果,你可以去安装这个 brief search, 然后也是一样, 就是点击这个添加 skills 按钮,这里有很多搜索结果。我推荐的是这个 bad logic, 他 写的 brave search 的 skill, 因为 bad logic 啊,其实是派的作者,我觉得他写的 skill 会比较好一点,之后的步骤也跟刚刚一样, 这里点击安装。安装好之后呢,我们去 brave search 的 官网去注册一个账号,申请个 api key, 然后把 api key 复制给我们的 pi agent, 让他帮我们去配置就可以了。好,搜索 skill。 我 们安装完之后呢,第二类就是去 去读文件的 skill。 pdf 相关呢,我推荐的是这个 open ai 发布的这个 skill 文字版的 pdf, 它会提取文字来读扫描版 pdf, 你 需要在 pad 模型里面设置里面打开刚刚的那个图像识别能力,让模型能够看到 pdf 里面的图。 安装好了 pdf skill, 我 们安装好之后呢,我用 deepsea v 四的技术报告来测试一下。我把 pdf 啊拖进我的这个工作目录里面,放进去之后呢,刷新一下文件浏览器这边呢,就可以看到这个报告了。我们可以艾特这份报告,然后直接跟他说读取这个 pdf, 总结里面的核心信息。然后我们看到啊,这个派呢,会自己去调用我们刚刚安装的这个 pdf skill, 把十几页的报告都去读完,最后整理成结构化的总结。这里的重点是啊,我不用去复制 pdf 的 内容,也不用自己去提取文字,直接把文件丢给他,剩下的呢,叫他自己去处理,举反桑啊。其实 ppt, 然后 word, excel 其实都能安装 skill。 word 呢是用来读文档的, ppt 呢是用来拆这个演示文稿的, excel 呢,是用来处理表格。 ppt 里面门道是最多的。这个视频里面呢,我就先不展开了,后面有机会再做一个单独的视频跟大家讲解一下。这个视频呢,只跟大家展示这个最基本的这个文件的读取能力,到这一步为止啊,其实你的 pi agent 又能联网去搜索,也能读本地的各种类型的文件资料了。 然后接下来第三步呢,我们想让我们的这个 pi agent 能够开口说话,所以还是用同样的办法去安装这个 i g t s skill。 这个 skill 呢,不需要任何账号的,其实直接安装,然后就能用了。我看刚才这个派呢,已经帮我们生成了这个一份新闻的简报。然后呢,我现在想把这份简报变成语音跟网页的,我们开一个这个 新的绘画窗口,艾特这份文件,把这份文件改成一分钟的口播稿,转成语音做一个 html 界面,里面包含文稿和音频,排版简单直观。然后呢,帮我打开这个网页发送。 大概三分钟左右,这个派就突然帮我们跳出来了一个这个我们刚才要求的这个 html 页面,他刚刚先帮我们写了文稿,然后再调用了 html 生成音频,然后呢,写了 一个这个 html, 把文稿跟音频放进去,最后直接帮我弹出了。打开了这个网页,我们来播放一下一分钟口播稿,本周五条 ai 新闻。大家好,这里是一分钟 ai 快 讯第 一, open ai 的 推理模型,在八十年数学难题上找到新构造, ai 正走进真正的前沿科研。现在呢,这一步大家有没有感觉其实已经有点这个工作流的感觉了。之前呢,搜索 skill 负责找信息,派负责整理 t t s 呢,负责把它变成语音 h t m i。 网页呢,负责把这个结果落地成一个可以打开可以分享的这样一个文件。我们看到它这个步骤的总结啊,先生成了一个口播稿,然后转成了一个 mp 三的音频格式。最后呢,生成一个 h t m i。 的 网页。以前聊天机器人啊,只能把结果输出在你的对话框里面,太呢,却可以把答案变成你电脑上的文件啊,网 页啊,音频。很多人担心 ag 的 跑任务啊,会不会很贵很消耗 token 这么长一段的这个任务是吧,但我的体感是,这种小任务成本完全没有想象中的高。像 当我跑任务啊,这么长一段的,这工具调用跟执行大概花费呢,是零点三美元的额度,但实际支出要低得多,因为订阅一个两百美元的套餐,你就能用一个月五千到一万美元的这样 a p r 的 额度。更关键的是啊,派,其实它的上下文提示词很短头肯消耗呢,比其他代码智能体要低很多很多。 第四个功能,我们给派来增加这个声称图片的功能。接下来呢,我们就来安装这个现在的最强的深度模型 gpt image two 好安装好了,这个 skill 的 原理啊,其实是调用 codex 里面的 gpt image two 来生图,如果你订阅了 gpt plus 或者 pro, 就 可以把生图能力也交给派去使用了。我们来试一下这个 skill, 平摊一个对话窗口,我们还是给刚刚我们生成的这个新闻啊来配图。 根据这个文件的第一条 ai 新闻,用 gpt image two 生成一张适合短视频封面的图片,风格是简洁的三 d 科技感的图片。 好,任务完成了,我们先来看一下第一条新闻是什么,就是 open ai 的 推理模型,在数学难题上找到新的构造,看一下这个图片非常不错啊,就是完全符合了我们的要求,有这个科技感。然后主题也是刚刚那个 ai 新闻的那个主题。 这个 skill 呢,有个小问题给大家说一下,在 mac 上是直接可以用的,在 windows 上呢,如果遇到这个脚本报错啊,其实完全不用慌,就是万事接问 ai, 让你的这个 skill 里面的脚本有哪里有 bug, 然后修复再运行它自己完全能够修好到这一步呢。我们其实看到我们的 pad 已经能搜索了,能读资料,写文稿,生成语音,生成图片了,那最后一步呢,我们就是让它来增加这个做视频的功能,我们直接搜索 ipad frames 安装。这个呢,是我最近特别喜欢用的一个 skill, 它非常适合做这个讲解类的视频产品,介绍科普动画,然后过程演示。它的思路也很巧妙,不是去直接让 ai 生成视频, 还是先让 agent 写一个带动画的 html 网页。 html 因为是用代码组成的,所以它生成的时候非常稳定,又可编辑,可预览,然后呢,再逐帧去渲染成一个完整的视频。而且对你来说啊,你完全不需要去懂 html 里面的代码是什么意思,你只要告诉他你想要什么结果好。 安装好之后呢,我们来先跑一个比较小的 demo, 先开一个对话框,用 hyperframes 做一个二十秒的动画,解释什么是 agent, 只生成 html, 不 需要去渲染视频, 我们来看结果,你看它生成好了,它能做标题,然后转场图形,动画字幕的节奏。这个东西呢,你继续加上一些语音,加上一些图片, 其实就能变成一条完整的视频。我们给 pi agent 配上了这五个功能之后啊,我们最后来验证一下我们现在这个 pi agent 它拥有的能力。比如说,我问他,你现在安装了哪些 skills, 它们的位置在哪里?你看啊, pi 呢,会把它现在所有的技能都给列出来到这里呢, skill 一个一个都解锁了, 搜索的,读资料的,语音的,声图的,视频的,单独看呢,你其实看每一个都不复杂,但如果我们把它串起来啊,就能做很复杂很复杂的任务。最后呢,我们就来把这个整合起来,一起来做一个大的项目。最后这个案例里面,我们想做一份行业的调研汇报,假设呢,我现在想要研究一个问题, 是一台英伟达的 g b 两百 mv link 七十二的 ai 机柜要卖三百万美元左右,那这些钱到底用在了哪里,花在了哪里呢?我直接跟我的 photographer 说,作为一个调研项目,一台英伟达 g b 两百 mv link 七十二的 ai 机柜,钱到底花在了哪里?要求做成中文的 hyperframes 演讲,用 tts 配音, 用 gpt image 生成图片素材。关键数字数据必须有来源不确定地方呢?写清楚,是估算的长度呢,大约是两分钟左右,需要有字幕显示,不需要渲染,视频发送。就这几句话,其实我只要说我需要什么,结果 pad 呢?就开始帮我自动拆解任务了。 第一步呢,他会先调用这个搜索 skill, 去查英伟达官方的资料, g b 两百 n v link 七十二的这个产品信息公开的报导,或者成本的估算。第二步呢,他会帮我去整理这个资料,把关键的数字跟来源都单独记录下来。第三步啊,他开始拆解成本了,比如说包含算力、核心网 络的互联页轮之类的这些成本。第四步呢,他会开始写中文的关键词,翻译成人是 two, 生成图片素材。第六步,他调用 h t t s 生成中文的语音解说。第七步啊,他才会用 hyperframes 把标题页、成本拆解,图片、动画、语音全部组合成一个演讲的界面。我拿到的是这样一个完整的项目,文件夹里 里面有资料的笔记,有成本的拆解,有中文的演讲稿,有语语音的文件,有所有这个图片素材。最重要的是还有一个可以直接打开预览的这个 hyperframes 的 这个页面。大家来看一下这个效果,非常完整的一个介绍英伟达 ai 机柜的这样一份视频的资料。 今天看一笔账,一台英伟达 g b 二百 n v l 七二 ai 机柜三百万美元花在哪?先看规格,英伟达官方说明, n v l 七二在液冷机柜里连接三十六个 grey c p u 和七十二个不恰当 g p u, 组成一个七十二 g p u 的 en v link 浴 整柜 m v link 通信宽带一百三十 tbs hbm 三亿约十三点四 tb 价格没有公开标价。 tom's hardware 二零二六引用业内来源给出二百八十到三百四十万美元。二零二四年 h sbc 估计约三百万。下面按三百万美元中位数算, 第一项,三十六颗 g b 二百 super 值, h sbc 估每颗六到二百五十二万美元,占整柜约七成到八成。 单科 superg 里主要价值来自两科, blackwell、 gpu grey cpu hbm 和先进封装。 epicai 估算单科 b 二百,制造成本约六千四百美元, hbm 接近一半,先进封装约一千一百美元,逻辑规片低于百分之十五。 第二项,互联和网络,机柜里有九个 envlink switch tray, 还有铜栏 connect 网卡 blueview dp 管理网络和本地存储公开资料,没有逐项价格,按三百万总价扣掉 superg 后,这部分和其他系统件合计大约几十万美元。第三项,工程成本, envio 七二公,耗约一百二十千瓦,重量约一点三六吨。你需要夜冷供电机会结构测试和集成 tom's hardware in modern stanley 数据 gb 三百 nbr 七二的冷却部件泵约四点九八六万美元,这个数字只代表冷却部件量级,不含机房侧 cdu 配电合约。结论很简单,最大的钱在 gpu hbm 先进封装和 nvlink 生态。 第二层是液冷和电力工程,在往外是供给稀缺、软件占质保和整柜集成溢价。最不确定的两项是实际成交价和非芯片泵拆分, 他们随客户采购量和合同变化,这就是派 agent 的 价值,相信大家都学到很多了,就我们最后再来回顾一下。 agent 呢,现在大概上可以分为两种, coding agent, 它的产出是代码,帮你写项目 派这种日常的任务的 agent 呢,产出的是结果代码,只是中间的一些手段而已。 coding agent 是 预制菜,内置了一套完整的写代码的流程工具。提示词,派是个性化的,是自己搭的它的底座。极简 能力呢,靠 skill 一个一个往里面加,每个人最后用到的派呢,其实都长得不一样。所以这期视频的重点啊,是看我们怎么一步一步的去解锁这个派的能力。装搜索,它就会联网, 装 pdf 跟 office, 它就会去读资料。装 h t t s 呢,它就会开口说话。装 g p t image two 呢,它就会生成图片素材。装 hyperframes 啊,它就会做带动画的演讲跟视频。 最后啊,当你把这些单一的 skill 串起来的时候,你就突然发现它强大的能力了,它能完成一个真正像工作一样的任务,从一句话开始,交付一份完整的行业调研演讲报告。 coding agent 呢,解决的是开发的效率,它也解决的是工作流的效率。好了,今天视频就到这里了,我是蒂斯种黑金李超,我们下次见。

我真的好久没见过行动这么缓慢的 ai 了,试用差点把我用困了。 clud 最近更新了两个功能引爆评论,有人说呢,他能 get 小龙虾,还有人让他直接操作键, 这种热闹我当然得马上试一下。嗯,那先来说说这次更新为什么有声量,他是不是一个新的方向,新的赛道,再来吐槽一下试用感受。 drop 呢?这次更新了两个功能,第一个叫做 computer use, 就是你可以理解为 ai 有了眼睛和手, aia 是帮你干活呢,要靠接口, 你用的软件得对外开放 api, ai 才能进去操控嘛。但是你电脑上有多少软件有 api 呢?浏览器? office, 我觉得差不多就是这些了, 其他海量软件都没有接口, ai 都触达不到,帮不了忙。 computer use 呢,解决的就是这个问题,他不走接口,他就是盯着你的屏幕看,先截图识别,然后模拟鼠标点击键开 输入,就像有一个人坐在你的电脑前面操作一样,就任何软件,只要他能看见屏幕就能控。第二个叫 dispatch, 能够让你在手机端发一条信息, ai 就在电脑端帮你执行,人不在电脑前也能远程指挥。这两个功能叠加,就让 ai 的操作逻辑变了。 computer use 其实真的很聪明,他就把接入才能用这个逻辑完全绕开了他截图、识别、点击,完全都是模拟人类操作的方式。那个官方原话说,我们教的不是针对某个软件的特定技能,而是通过计算机的操控能力,让 cloud 能够用任何为人类设计的软件。 其实我们分析一下这个差别还是很重要的,就不再是这个软件支不支持 ai, 而是只要人能用 ai 就能用。注意注意注意。最近呢是 publicity, mata 还有 africa 三家顶级 ai 公司都发布了类似的功能,所以你仔细品一品, ok, 再说说 感受。我今天使用了一天呢,首先呢,它的步数是真的比小龙虾方便很多很多,我也试一下。首先呢,是把葡萄桌面端更新到最新的版本,然后在 cowork 的设定里面找到 general, 然后再找到 computer use, 把这个键打开,再按确定打开就好,就是这么简单。第一个任务呢,我指定了一个微信群,让他帮我总结这个群里过去三天都发了什么新闻。他最后呢,倒是给出了一个像模像样的总结,但这个结果几乎是用了一顿饭的时间才给出来。 然后他也没有打开任何的文件或链接去看到底是什么内容,就只看了标题,所以给出的总结就很水。然后呢,我让他在一个指定的微信群里发一条消息,很简单的一条消息,他先是搜索群民,找到之后向我确认是不是真的要发,但是仅仅是找到微信群这一步,就几乎花了五分 中。最后我发出一句很简单的话,然后群里的朋友们并没有理睬我。而且呢,在他操作期间,我的屏幕上其实最好是不要出现其他的页面或任务的,不然他就看不到了吗?那就等于把整台电脑都占着,你其他什么事情都干不了。另外呢,他还有使用条件,必须是 cloud pro 或者 max 会员。 computer use 呢,目前只在 mac 上面可以使用, 就是总体感觉挺新奇的,但是很慢很鸡肋。不过我又在想,就如果说这个新功能一直优化优化,然后他优化的镜头真的就能达到,只要我能用, ai 就能用,那我觉得也算是我想象中 ai 本来的样子吧。你用了吗?评论区交流一下吧。

曾经我对 cloud code 的 终端爱不释手,但现在我只能说一句, codex 真香啊,真香! 大家好,我是布鲁。随着 codex 近期频繁的更新,我自己的工作站也已经全面的切换过来了。今天就来分享一下我自己的完整使用经验,怎么用 codex 打造一套不打断心流的生产力闭环。 本期视频我把它分成了七个章节,每一张都是我自己实际在用的技巧,希望能对你有所帮助。那我们话不多说,直接开始 第一张,先来介绍一下我的工作站是怎么布局的。左上方是 codex 的 对话框,下方是 terminal 终端。 你可能会问,已经有 codex 的, 为什么还要开一个 terminal 跑 c c? 因为我发现对于一些需要探索、需要设计的任务, c c 的 表现要更出色一些。所以我的习惯是用 c c 来做方案设计,配合 planning with files 这个 skill, 把设计思路直接落成文件, 然后再让 codex 读这份计划,接手后续的具体实施。这样一来, cloud code 负责想, codex 负责做,两者可以各司其职。 右上方这个区域我用来做任务完成后的查看和审阅,比如代码的 review, 文件的浏览,还有浏览器都在这里。虽然现在浏览器还不支持多标签页,但对于日常的任务来说完全够用。这边我就分享一个实际的案例, 我让 c c 参考了最近很火的这篇卡巴西提出的知识库的文章,让他借鉴里面的思路,出一份设计稿和完整的实施计划。目的呢是做一套前端的页面,方便我日常的维护文档使用。 接着 c c 就 会调用 planning with file 这个技能啊,将所有的计划落成文档,然后我就会回到 colex 这边,让 colex 去阅读当前项目内的这份计划文件,然后基于这份计划文件让他进行开发。开发完结果之后,我会在这边 内置的浏览器里面去进行结果的 review, 包括代码的一个审查,整个过程从设计到开发再到 review, 全都在这一个工作站里面完成,不需要切换任何的窗口,这就是我前面所说的,心流不会被打破。 第二章,批注功能。这个功能是我觉得 codex 真正强大的原因之一,也是最能体现沉浸式开发的地方。 以前我们改代码的方式是找到文件定位到哪一行,描述问题,让 ai 修改,整个过程中你的注意力是在代码上的,但现在 codex 的 批注功能让这件事情变了,你可以直接在文件上进行批注,告诉他哪里怎么改,需要怎么改。 更厉害的是,现在这个批注功能不止限于代码文件,你可以直接在前端页面上进行批注,看到哪个按钮位置不对,哪块布局不满意,直接在页面上标出来, codex 就 能理解你的意图,并帮你进行调整。这件事的意义在于,正好对应了 webcodd 的 核心理念, 开发者的重心不在于怎么写,而在于写出来的东西对不对。批注功能把这个理念落地了。 第三章,上下文管理 codex 项目里可以同时开多个县城,每个县城对应一个任务,互相独立,不干扰。对比 cloud code 需要开多个对话窗口, codex 把所有县城都收在了一个项目下,管理起来会清晰很多, 然后是项目的记忆核心就是 a 键的点 md, 这个文件你可以类比为 cloud md, 把项目的背景、开发规范都写进去, ai 每次进来都会读取,不用反复的交代。 还有一点, codex 的 上下文管理非常省心,它会自动帮你压缩上下文,它也没有提供像 cloud code 中 compact 的 那样的命令,这种事情让 ai 自己处理就好了,你专注于任务本身就行。 第四张,自动化这块是我觉得 codex 比其他 agent 做得更好的地方,几个原因,第一,用起来非常的方便,直接在 gui 里面新建自动化任务,还内置了很多模板可以选择, 大到项目管理技术、眼镜,小到个人的生活习惯,都可以交给它来定期的处理。第二,自动化可以调用 codex 自身的能力,比如插件、 skill、 mcp、 浏览器操作、电脑操作等全都能用进来,这就是为什么我说 codex 在 逐步形成自己的生态。 第三,我们可以根据不同的场景来灵活的选择模型和推理强度,简单的任务用轻量模型,复杂的任务上强推理,这样的话头肯可以用的更加的合理。第四,稳定性,我实测下来, codex 相较于其他的 agent, 定时任务的准确性已经能达到生产级别,相当的靠谱。 第五张插件和技能, codex 有 相当丰富的官方插件和 skill 生态。先说说两者的区别, skill 就是 纯文档,本质是给一份 ai 的 说明书,告诉他在特定场景下应该怎么做事。比如说我前面提到的 planning with files, 就是 一个 skill 插件的概念会更大一些,你可以把它理解为 codex 打补丁,里面可以包含 skill, 也可以带上 mcp 配置,甚至集成其他的 app。 一个插件装下去, codex 就 多一套能力。 另外, codex 在 插件和 skill 的 管理体验上面要比 cloud code 的 友好太多了。 cloud codex 需要改配置文件,而在 codex 里直接在界面上点击安装,或者自己创建,整个过程非常的直观。 第六章浏览器和电脑操作 codex 可以 直接操控浏览器,你可以让它自动填表,抓取数据,验证 ui 效果。 比如我需要批量收集一些网页上的信息,直接告诉 codex 去哪个页面拿什么数据,它就能自己打开浏览器去完成操作,整个过程中都不需要你的介入。除了浏览器, codex 还能直接操作你的电脑文件的整理,应用的打开都可以交给它来处理,相当于有一个助手在帮你操作桌面。 不过这里要说明一点,随着 ai 自动化越来越普及,现在已经有不少软件开始加强安全控制,对自动化操作做了限制,所以实际能操作的范围会因软件而异,遇到限制情况也很正常,大家用的时候留意一下。 第七章通用功能这些功能不是 codex 独有的,很多 agent 都支持,但作为一个完整的工作站,这些基础能力 codex 当然也不会缺少。先说 play mode, 在 执行一个比较复杂的任务之前,先让 codex 把完整的计划列出来,你过一遍觉得方向对了再让他动手, 这个习惯能帮你省掉很多返工的时间,大任务尤其推荐开 play mode。 再说 m c p, 也就是模型上下文协议,通过 m c p 可以 把各种外部的工具和服务接进来,让 q d x 能力边界大幅扩展,无论是连接数据库,调用第三方的 api, 还是接入自己家的服务,配置好之后, q d x 就 能可以直接调用。 另外还有一点, q d x 相较于 logot code 的, 有一个非常关键但很容易被忽视的小功能,语音识别。目前我的任务几乎都是语音发起的,连打字都很少了。 ok 以上就是我在使用扣袋子过程中总结的一些技巧,如果对你有帮助的话,希望能得到你的点赞和关注。 最后我想说一句, ai 发展太快了,各家 a 键的功能越来越趋同,但工具再多,适合自己的才是最好的。有时候做做加法,找到真正需要的,做做减法,去掉用不上的,慢慢摸索出一套自己的工作范式才是最重要的。我是布鲁,我们就下一期再见。

哈喽,朋友们,之前分享了很多期关于 cloud code codex 的 视频,但我发现评论区讨论最多的就是国内怎么使用,确实天下苦, cloud code codex 就 已 光网络这一关就能劝退一大半人,账号支付节点每一步都在折腾,更别说团队场景下每个人单独搭一套环境的成本要有多高了。后来我自己也折腾过几种办法,中转 api、 进项站、买海外卡,要么不稳定,要么一到团队层面就抓掐。 前段时间试了一个叫 evo ai 的, 但是目前我用着比较顺手的,它里面直接内置了 cloud code 和 codex, 打开就能跑,不用你再去配账号,调整网络。同时它也提供 cloud gpt、 gmail 的 api 中转,自己接到别的工具里也行。 一个平台覆盖了两种方法,但我今天想分享的是他新出的这个团队管理功能。先说第一个,安人分配托客额度,后台能看到团队里的每一个人,然后给他们单独设置额度。核心开发可以多分一点,像做支持、做业务、做产品的可以少分一些,或者按项目走也是可以的, 用完自动停,不会出现一个人把全团队额度刷光的情况。以前的订阅制是什么体感?整个团队共用一个上限,根本不知道是谁在用,用在哪,超了就超了,事后也没法追溯。 现在每个人的成本都能够算到 top 这一级,账算的清清楚楚。第二个,也是我个人最看重的支持数据采集,平台会记录每个成员每天用了多少 top, 问了什么问题, 打开后台你就能看到这个月谁是众多用户,谁压根没用过团队整体的 ai 使用率是涨还是在跌,那这数据拿来做什么?注意,这不是监控,是判断,判断谁可能需要一对一的使用培训,判断哪个岗位的 ai 渗透率还偏低,判断我们在 ai 工具上花的钱有没有真正落地到产出上。 所以 ai 时代的团队管理不能再靠感觉得有数据来支撑。再补充一点,统一入口的额外价值对团队节奏影响其实非常大,新人入职当天就能够开工,不会因为环境还没配好卡上个两三天 团队所有人用的都是同一套工具,沟通和节奏的语言也是统一的。最后我总结一下, vivo ai 比较适合三类人,第一,技术团队负责人或者老板想把 ai 在 团队里推下去,但手里缺一个统一的管理后台。 第二,身在国内,想让团队直接用上 cloud 的 gpt jimmy, 但不想每个人都去折腾环境。第三,想精细化控制成本,按人分配,而不是大锅饭一个十字。 当然了,个人用也行,毕竟谁不会喜欢一个 app 里面直接能用预三加的工具呢? ok, 那 以上就是关于国内使用 cloud code 的 codex 的 分享,希望能对你有所帮助。我是布鲁,我们下一期视频再见。

从零开始,用国内网络把新电脑打造成全能 a a agent 运行平台,解锁 cloud code codex、 hermes agent, open cloud 等等一切 agent 框架,从此搭建环境再也不用求人。本期视频是一个手把手的保姆级教程,我准备了三台刚刚重装完系统的电脑, 分别覆盖 windows, mac os 还有 linux, 使用国内家庭宽带用录屏软件详细记录了全过程,相信大家跟着视频演示,绝大多数问题都能顺利解决。我们先从 windows 开始, note g s 是 一个让你可以在电脑上运行 java script 代码的工具,或者叫做运行环境大量的 aaa 阵的软件,比如说 codex 部分 cloud 等等,都是依赖 node js 才能运行的。我们来到 node js 的 官网,在下面找到 windows 系统的安装程序,下载下来,然后运行安装程序,一路点击下一步完成安装。接下来我们回到桌面,右键开始菜单选, 选择终端管理员,输入这个命令回车。这个命令的意思是允许在控制台运行 power shell 脚本,然后我们输入命令 node 杠位,还有 n p m 杠位,这里都显示了版本号,我们的 node js 就 安装成功了。接下来我们来安装 git。 git 是 全世界最流行的版本控制软件, 比如我们上学写论文的时候,会把论文保存成多个历史版本,如果我们需要某个版本的某个段落,可以很轻松地从历史里面找回来,这就是最原始的版本控制。 get 是 一个帮助我们进行版本控制的软件, 使用 git 对 文件进行版本控制,可以很方便的让 ai 随时回退到某个历史节点重新工作。我们来到 git 的 官网,点击下载 windows 系统的安装包,根据自己的 cpu 架构选择叉八六六十四位还是 am 架构的安装包,一般 windows 电脑的 cpu 架构都是叉八六六十四位的。 下载并且打开这个安装程序,一路点击下一步完成安装。然后我们回到桌面右键,在终端打开,输入命令, git 杠杠 version 回车,这里能够成功地打印版本号,我们的 git 就 安装成功了。接下来我们安装 cloud code, cloud code 是 阶阶段公认的最强的 a a agent 软件。我 我们来到桌面右键,选择使用终端打开,然后输入这个命令来安装 cloud code, 回车,好,安装完成。接下来我们对 cloud code 进行一个基础设置,让它使用国内的模型先跑起来, 等下我再简单介绍怎么获取一个 cloud code 的 官方订阅。这里我们来到 c 盘用户,你的用户名,这个文件夹在顶部菜单点击查看,勾选上显示隐藏文件夹,还有文件扩展名。 接下来我们在这个目录右键新建文文本档,然后把我们新创建的文件的名字改成,点 colog, 点 jason, 双击改名后的文件,选择用记事本打开,然 后把这一大串文本复制进去,内容比较长,你可以暂停视频,截个图发送给 ai 进行文字识别。在这一大串配置里面,大部分内容都是固定的,我们只需要改动两个地方,一个是这里的 token, 也叫做 api k, 第二个是模型厂商的 url, 这个 api k 我 们可以在国内的某家 a i 服务商开通服务后申请创建一个,比如这里。我来到国内的某家 a i 服 务商开通服务后申请创建一个,比如这里,我来到国内某家 a i 服务商,开通服务后申请创建一个。比如这里,我来到国内某家 a i 服务商开通服务后申请创建一个。比如这里,我来到国内某家 a i 服务商。开通服务后申请创建一个。比如这里,我来到国内某家, 便填写个名字,点击新建,把生成出来的这个 a p i k 复制下来,填写到我们的配置里面。接下来第二个需要修改的地方,就是这里的被子 u r l 每家大模型厂商都有自己的对应 a p i 地址这里我们在右上角点击文档,找到最下面的,在第三方中使用。在文档里面有被子 u r l, 我们把这一串复制下来,填写到 cloud code 的 配置里面,按 ctrl 加 s, 保存一下这个配置文件,然后关闭。我们还是来到桌面,右键在终端打开,然后输入命令 cloud 来启动 cloud code, 选择第一个信任这个文件夹,打个招呼,这里给到了回应,我们就配置完成了。 下一步我们来安装 v s code。 v s code 是 一款清亮且功能强大的代码编辑器,几乎支持所有的编程语言, 是我们使用 a a agent 进行代码编辑的必备软件。我们来到 vs code 的 官网,点击下载 windows 系统的安装程序, 然后打开安装程序,一路点击下一步完成安装。接下来我们解锁 github。 刚才我们介绍了 git, 这是一个版本控制软件, hub 的 意思是中心汇聚集合全世界的开发者,会把自己用 git 进行版本控制的仓库, 也就是一个个的文件夹上传到 github 的 网站上面,这个网站就是 git 仓库的集合,也就是 hub, 所以 git 加 hub 就是 github, 它是全球最大的代码仓库托管与协助平台。在国内网络使用 github 经常会因为网络问题导致超时或者打不开。 我们在搜索栏搜索 store, 然后打开 microsoft store, 搜索 word to kite 这款开源免费的软件,然后点击安装,安装完成以后,打开软件,找到网络加速, 勾选上 gitlab, 点击一键启动加速,然后我们就可以顺畅地访问 gitlab 了。如果没有账号的话,可以在右上角点击 sign up, 先注册一个,填写一个用户名,邮箱密码,地区,点击注册,然后去邮箱收一下验证码, 把邮箱里面的验证码填写过来,点击继续,这样就注册完成了,然后点击三印按钮,就登录进了 gitlab。 我们来看一个实战案例,把刚才的几部配置串联起来,首先在桌面新建一个文件夹,然后打开这个文件夹,右键在终端打开,输入命令 cloud, 来启动 cloud code, 这里输入提示词,创建一个 html 的 坦克大战,并且上传到 github 上面,变成一个仓库。 ai 在 执行过程中会申请权限,这里我都选择 yes。 接下来他询问我怎么把项目上传到 github 上面,这里我选择第二个 ai 提示,我先访问这个地址, 创建一个仓库,我点击这个链接,进来以后填写一个仓库的名字,点击创建,然后我把仓库地址复制一下,再粘贴给 cloud code。 接下来 cloud code 继续它的操作,这里会自动打开一个弹窗,让我登录 gitlab, 我 选择使用浏览器登录, 然后再点击授权按钮,回到 cloud code, 我 们看到任务就完成了, ai 编辑的代码也同步上传到了 gitap 上面。接下来我们来安装 python。 python 是 一个非常流行的编程语言,很多 agent skills 附带的脚本都是依赖 python 才能运行的。 我们来到 python 的 官网,在 download 这里点击 python install manager, 下载完成以后运行,点击 install python, 然后会弹出一个终端窗口,我们全部输入外回 车,这样 python 就 安装好了。我们先打开一个终端,输入命令, python 两个横杠 version, 还有 python 三 version 都能打印版本号。 我们使用 p i p install 命令也能安装 python 软件包,这样基础使用就满足了。 agent skills 里面的脚本也都可以运行了,更进阶更推荐的用法是使用 python 的 虚拟环境进行多版本管理,把不同工程的 python 依赖分文件夹存储, 我们可以输入命令 py install 三点一三,这样就可以安装一个指定版本,也就是三点一三版本的 python。 然后我们在桌面新建一个文件夹,右键在终端打开 输入这个命令,它的意思是使用三点一三版本的 python, 在 这个文件夹下面创建一个虚拟环境,接下来使用命令来激活虚拟环境,然后我们再使用 pip 命令来安装 python 包,这样依赖就被安装到了指定版本的指定文件夹下面,相互之间就不会再有冲突。 这里有个注意事项,很多 ai 不 喜欢用虚拟环境,所以我们可以在提示词里面注明,要求 ai 必须使用虚拟环境来进行工作。接下来我们在 windows 电脑上安装 wsl, wsl 的 全称是 windows subsystem for linux, 也就是运行在 windows 上的 linux 子系统。开启了 wsl 以后,你的 windows 电脑就拥有了一个 linux 子系统,很多在 windows 上无法安装或者表现不佳的 agent 软件也都能很好地运行了。 在使用 wsl 之前,我们需要先开启两个 windows 功能,我们来到 windows 的 搜索栏搜索功能,选择起用或关闭 windows 功能,然后勾选上这两个 适用于 linux 的 windows 子系统,还有虚拟机平台,点击确定,然后根据提示重新启动电脑。电脑重启完成以后,我们还是来到桌面 右键,在终端打开,输入这个命令, wsl 两个横杠 install 两个横杠,外部 download, 耐心等待它下载完成。下载完成以后,我们填写一个用户名密码,这样 wsl 就 安装完成了。 然后我们新开一个终端,输入命令 wsl 两个横杠 list。 这里显示的五版图就是我们的 linux 子系统。 乌班图是目前最流行的 linux 发行版,是 wsl 默认安装的版本。我们在顶部点击加号,在下拉列表里面就能找到我们的 linux 子系统,点击乌班图就进入了子系统。 wsl 的 文件系统跟 windows 上是互通的,我们可以在 windows 上打开我的电脑,在左下角可以看到一个 linux 的 图标,我们点击一下,这里显示了一个乌班图的文件夹,我们点击进去,这样就在 windows 里面打开了这个 linux 的 文件系统。 我们可以在 linux 里面用 touch 命令创建一个新的文件,在 windows 这边也可以同步看到。除了在 windows 上查看 linux 的 文件,我们也可以反过来从 linux 上查看 windows 上的文件。我们可以在 linux 这边输入命令, c d 斜杠 m n t 斜杠 c, 这就进入了 windows 电脑的 c 盘。接下来输入 obsidian note, 回车就进入了我在 windows 上存放笔记的文件夹,然后输入 l s 命令,可以查看所有的笔记。 有了 wsl 以后,我们就可以安装运行一些原本 windows 上不支持的 ai 工具,比如这是最近很火的 hermes agent, 它在 windows 上原本是不支持的,但是我们看到这里它支持 wsl。 我 们只需要复制一下这个一键安装命令,来到 wsl 的 窗口粘贴过来直行, 有时候可能会因为网络问题访问这个地址失败,可以多试几次。等待了差不多二十分钟完成了安装,我们看到在国内的网络环境下也可以正常安装。接下来他让我们选择一个模型提供商,这里我选择 openroot, 然后我们根据提示来到 openroot 的 这个地址,创建一个 apikey, 我 把创建的 apikey 分 复制一下, ctrl v 粘贴近 wsl 回车。接下来他让我选择模型,这里我选择这个免费的模型回车。然后我们按照提示启动 hermes agent 的 聊天功能, 这里打个招呼给到了回复。我们的 hermes agent 在 wsl 上也安装成功了。 codex 是 我近期最推荐的 aaa agent 工具,因为 codex 给的额度较高,而且对中国用户比较友好。接下来我们就在电脑上安装一下 codex, 并且配置一下 openai 的 官方套餐。在 openai 的 官网可以看到 codex 至少需要一个 plus 版的订阅套餐才可以使用。我们先来到 chat gpt 的 官网,在这一步需要国外的上网环境才可以访问到这个页面,这里提示一下,在视频的前面我们已经解锁了 github, 在 github 里面可以搜索到一切你需要的知识,在视频里面我就不展开讲了。然后我们点击免费注册,先注册一个账户,使用国内的邮箱就可以注册。 我们在安卓手机上下载一个谷歌 play 商店,登录完成以后,在右上角点击头像,然后点击设置常规设置,找到账号和设备偏好设置,这里把国家跟地区改成美国,注意这一步,你的手机上需要有美国的上网环境。接下来我们回到首页,点击头像点, 点击付款与订阅,这里点击添加卡片,国内的卡片也可以绑定成功。接下来我们还是回到谷歌 play 的 首页,搜索 chat gpt, 下载 chat gpt 的 手机版 app, 打开手机版的 chat gpt, 点 顶部有一个获取 plus, 点击一下订阅方式,选择谷歌 play, 这样我们就获得了 g p t 的 plus 订阅。我们来到桌面右键,在终端打开,这里输入 codex 的 安装命令,然后我们输入 codex 启动起来,在浏览器里会打开一个登录页面,我们登录一下 chad 的 官方订阅,我们来到 codex 官网,注意这里一定要选择 用谷歌账号进行登录,而且这里要注意你的谷歌账号的邮箱必须是机妙的,使用机妙邮箱不会触发手机验证码,那个步骤 接下来跟 chad 的 gpt 很 像,我们还是先下载谷歌 play, 国家跟地区改成美国,然后下载 cloud 的 手机 app, 在 手机 app 里面使用谷歌 play 完成订阅。后面我会单独出一期视频进行详细介绍。 mac 电脑自带的 safari 浏览器被人调侃是新时代的 i e 浏览器,非常的不推荐,我们要做的第一件事就是先把它替换掉。 我们先打开 safari 浏览器,我们在百度搜索 chrome, 第一个就是 chrome 的 官网,然后点击下载 chrome, 下载完成以后双击这个安装包,把 chrome 拖拽进 application 文件夹就完成了安装。安装完成以后,我们在 app 里面找到 chrome, 把它拖拽进程序屋,然 然后把它原来自带的 safari 浏览器在程序屋里面移除掉。下一步我们来安装苹果电脑的命令行开发工具包,内含了很多基础工具,我们在 app 里面往下找有一个终端,打开终端,然后输入这个命令, xcode 杠 select 空格两个横杠 install 进行安装,这里会弹出一个确认窗口,我们点击同意,这样就安装完成了。这里面内含了很多开发工具,比如它就自带了 get, 我 们可以输入命令 get 两个横杠 wash, 我 们看到 get 已经帮我们安装好了。 接下来我们来安装 node js, 注意这里有一个大坑,就是千万不要使用 node js 的 官网安装包,安装包会把 node js 安装到 root 目录,后续会出现很多的权限问题, 这里我们还是来到 note g s 官网,一定要选择使用 nvm 的 安装方式,把下面这几个命令在终端里面依次执行一遍,不过这些命令在国内的网络环境有可能会执行失败,可以替换成我这几个命令。我 我们在 app 里面找到终端,打开终端,输入这个命令,先创建一个 shell 的 配置文件,复制第一个命令粘贴过来,回车执行复制第二个命令,粘贴过来,执行输入,克里尔回车清理一下屏幕。第三个命令,最后一个命令 nv m install 二十四, 这样就把 node js 二十四安装到了电脑上,然后我们输入命令, node js 就 安装完成了。 接下来我们安装 cloud code, cloud code 是 阶阶段公认的最强的 aaa 智能软件,我们在 app 里面找到终端,打开终端,然后输入这个命令来安装 cloud code, 回车好安装完成。然后我们对 cloud code 进行一个基础设置,让它使用国内模型先跑起来。我们在终端里面输入 c d 空格点 jason 创建一个 cloud code 的 配置文件,在访达里面点击用户名, 进入主目录,然后点击 command 加 shift 加点显示隐藏文件,找到我们新创建的文件,右键打开,然后把这一大串文本复制进去。在这一大串配置里面,大部分内容都是固定的,我们只需要改动两个地方,一个是这里的 token, 也叫做 api k, 第二个是模型厂商的 u r l, 这个 api k 我 们可以在国内的某家 ai 服务商开通服务后申请创建一个, 比如这里,我来到国内某家大模型厂商的网站,在右上角点击控制台,然后点击新建 api key, 随便填写个名字,点击新建,把生成出来的这个 api key 复制下来,填写到我们的配置里面。接下来第二个需要修改的地方,就是这里的被子 u r l。 每家大模型厂商都有自己的对应 api 地址,这里我们在右上角点击文档,找到最下面的,在第三方中使用,在文档里面有被子 u r l, 我们把这一串复制下来,填写到 cloud code 的 配置里面,按 command 加 s 保存一下这个配置文件。然后我们还是回到终端,输入命令 cloud 来启动 cloud code, 这里选择第一个信任当前文件夹,然后会弹出一些授权窗口,我们都点击允许, 打个招呼,这里成功给到了回复,我们的 cloud code 就 配置完成了。然后我们来解锁 github。 在 国内网络使用 github 经常会因为网络问题导致超时或者打不开,解决方法是我们来到这个网站下载 what to kit 这个开源免费的工具, 这里我使用的是网盘下载,下载完成以后双击安装包运行,然后把它拖拽进 application。 然后我们打开软件,这里因为安全策略被阻止了,我们可以来到设置 隐私与安全性,点击这里的仍要打开,这样就可以成功进入软件。然后我们找到网络加速,勾选上 gitlab, 点击一键加速,这里又爆了一个权限错误,我们只需要填上自己的 mac 电脑的用户名,然后复制一下下面这条命令,打开终端执行一下,再次尝试加速 gitlab, 这样就成功了, 我们就可以顺畅地使用 github 了。有关怎么注册 github 账号,并且把 cloud code 开发的程序备份上传到 github 上面。在本视频前面的 windows 章节有过详细介绍了,可以去参考一下。接下来我们来安装 homebrew, homebrew 是 mac 上最流行的命令行软件管理器,有了 homebrew 以后,用一行命令就能安装、更新,卸载各种软件和开发工具, 也是 mac os 上的必装软件。我们来到 homebrew 的 官网,这里有一个一键安装命令,我们把命令复制一下,接下来还是打开终端,把命令粘贴过来。我们注意到这个命令它依赖 github 上面的一个执行脚本,所以在前面我们先解决了 github 的 网络问题。接下来我们回车执行一下这个命令,等 等待了一会儿, homebrew 就 安装完成了。有了 homebrew 以后,就可以很方便的安装其他软件,比如可以安装 python, 我 们还是打开终端输入这个命令, blue install python, 艾特三点一二,给我们的电脑安装三点一二版本的 python, 等待了一会儿就安装完成了。我们打开访达,点击用户名,进入主目录, 找到这个点, z s h r c 文件,双击打开,添加这么四行,然后按 command 加 s 保存一下。 以后在命令行里面不论输入的是 python 还是 python 三,都是使用的 python 三点一二版本。这里有个注意事项,使用轰不入安装的 python, 直接在终端执行 p i p 命令,尝试安装 python 依赖会报错,轰不入禁止局安装 python 依赖,也就是说我们必须使用虚拟环境。 使用虚拟环境是 python 最推荐也是最标准的做法。我们先创建一个项目文件夹,然后在终端里面使用 cd 命令进入文件夹, 接下来输入这个命令,在项目文件夹创建虚拟环境,然后下一条命令,激活新创建的虚拟环境。接下来就可以使用 p i p 命令来安装 python 依赖了。使用虚拟环境,让每个项目的依赖都放到自己的文件夹下面,相互之间就不会再有冲突。 这里有个注意事项,很多 a a 不 喜欢用虚拟环境,所以我们可以在提示词里面注明要求 a a 必须使用虚拟环境来进行工作。接下来我们安装使用 codex 还是打开终端输入 codex 的 安装命令,这样就安装完成了。 然后我们可以去 chad 的 gbt 的 官网注册账号获取 plus 订阅。这些内容在前面的 windows 章节已经进行过详细介绍了,大家可以参考一下。同样的方式我们也可以获得 cloud code 的 官方订阅,在前面也已经介绍过了。 这是一台乌班图二十四点零四操作系统的 linux 新电脑,我们来给他配置一下 agent 运行环境。 linux 用户一般动手能力比较强,所以这个章节我讲的就快一些。我们要做的第一件事就是更新 a p t。 锁影。 a p t 是 乌班图系统安装软件的工具, 更新锁影就是让系统知道现在有哪些软件可以装,最新的版本是什么。我们来到桌面,右键在终端打开, 输入这个命令速度 a p t update 更新一下 a p t。 锁影,填写我们电脑的密码,回车,这样就更新完成了。接下来安装两个 linux 系统的必备软件,第一个是 c u r l c u r l 是 一个用命令行访问网址的工具,我们输入命令速度 a p t install c u r l。 接下来我们安装 git, git 是 全世界最流行的版本控制软件, 输入命令速度 a p t install git, 点击 y 回车确认执行,这样两个必备软件就安装完成了。接下来我们安装 node js, 这里还是选择 nvm 的 安装方式,需要依次执行这四个命令。我们复制第一个命令进入终端执行第二个命令,第三个命令, 第四个命令,这样 node js 就 安装完成了。然后我们输入 node 杠位验证一下,这里显示了版本号,我们的 node js 就 安装完成了。接下来我们来安装 cloud code, 还是在终端里面输入 cloud code 的 安装命令,回车,这样就安装完成了。然后我们在终端里面输入命令, c d 斜杠, home 斜杠,你的用户名,进入主目录 touch, 点 cloud, 点 json, 创建一个 cloud code 的 配置文件。然后我们在文件管理器里面来到主文件夹,打开左上角的菜单,点击显示隐藏文件,然后双击打开我们刚才新创建的配置文件, 把这一大段粘贴进去,这里只需要修改两个地方,一个是这里的 api key, 还有一个是模型厂商的 bug 章节,里面我有过详细介绍了, 回去参考一下。然后我们保存一下这个配置文件,输入 cloud 来启动 cloud code, 打个招呼,这里给到了回复,我们的 cloud code 就 配置完成了。我们也可以去 cloud 的 官网获得一个官方订阅, 在视频的前半段我有过详细介绍了,可以回去参考一下。接下来我们来安装 vs code, 这里先来到 vs code 的 官网,它自动识别出了我是 linux 系统 开遍或者无斑图系统,下载左侧的点 d e b 格式的安装包。下载下来以后,我们来到下载目录,右键在终端运行,然后输入这个命令速度 app install, 点斜线,后面是安装包的名字,回车,在左下角的应用程序里面就可以看到 vs code, 点击就可以直接运行了。接下来我们来下载 chrome 浏览器,这里来到 chrome 国内版的官网,点击下载,然后选择点 d、 e、 b 格式的安装包,下载完成以后,我们来到下载目录,右键在终端打开, 输入这个命令速度 app store 点斜线,后面是 chrome 的 安装包的名字,回车,这样 chrome 就 安装完成了。在左下角的 app 里面就可以找到 chrome 浏览器。

你看看,昨天刚说了,美国 ai 三巨头围讲中国 ai。 四月十四号, aston robin 就 突然发布公告, cloud 要搞身份验证,用户需要上传实体身份证件,外加实时的人脸识别, 才能在 cloud 上继续使用相关的功能。那什么样的人会触发验证呢? snoop 官方给出的出发条件包括访问特定的高级功能平台、例行的完整性检查,以及安全与合规的要求。目前已经有实际使用的用户反应啊,在订阅 cloudmax 最高档会员的时候会触发验证。而验证的流程是这个样子的啊, 用户需要准备实体政府颁发的带照片的证件,比如说护照、驾照和身份证,然后用带有摄像头的手机或者电脑拍摄实时自拍,完成人脸的比对,整个过程大概需要几分钟。官方还特意提醒了啊,所有的复印件、截图扫描件、电子证件全都不算, 学生证、工作证、银行卡这些也没有用。这里还有一个非常关键的问题, astropica 早在二零二五年九月就宣布直接或间接由中国实体控制,也就是说,占股比例超过百分之五十的企业 不再被允许使用 astropica 的 服务。这就意味着,如果你是中国身份证或者中国护照去做验证,就等于主动暴露了自己内地的身份,可能直接触发风控。这是一个两难,不验证 功能受限,验证了身份报,而且官方明确说了,从不支持的位置创建账户,是账号被禁用的原因之一。说白了,即便你费尽心思把所有的身份验证全做完,只要你是在国内注册的账号,照样可能 被封,这对于我们中国区的用户来说,这不是麻不麻烦的问题,这可能就意味着 club 的 这条路被彻底的堵死了。那这种情况下还有没有别的路可以走呢?有的, 我在这里整理了几条比较靠谱的替代方案。方案一就是用国内合规服务商的企业级 cloud 中转,你可以直接调用他们的 a p i。 这种方式呢,比较适合开发者企业或者是长期的 cloud 使用者。 第二呢,就是直接替换成国产的平替模型,比如说智普的 g r m 四点七,就原声兼容 cloud a p i 格式,可以无缝迁移代码,这种方式呢,广泛适合,没有什么风险,而且中文知识又显。 第三呢,就是注册海外实体,用海外法人的证件,海外地址,海外的信用卡开通,官方企业的 a p i 成本高,不推荐个人使用, 仅仅适合呢大型企业的合规需求。现在就像上期视频里面说的,国外的 a p i 平台收紧账号管理一定是大趋势。 o p n i 去年就开始对部分的功能要求身份验证, astropica 现在跟上了它,模型越强,平台越需要知道是谁在用。所以啊,现在手里有 cloud 的 老账号,如果没有触发验证的,可以好好养着了,有使用记录, 有订阅记录,没有触发过风控,这些以后可能都会成为隐形资产。最后问你个问题,如果 cloud 彻底封禁了中国用户,你会采用什么样的平替方案呢?我是老林,关注我评论区聊聊。

上期视频我分享了 cloud code 的 安装和常用技巧,但真正用过的小伙伴肯定会遇到一些问题,比如没法联网搜索、没法识别图片、没法阅读网页、没法监控上下文进度和 coding plan 的 使用情况。哈喽大家好,我是专注用动画科普 ai 的 阿 k, 接下来我就为大家一一解决上述困扰。本期依然全程无广走你。 其实想解决联网搜索、图片识别和网页读取这三个问题,只需要用到一个叫 m c p 的 技术。简单来说,以前 ai 的 能力往往局限于自身的知识库,但有了 m c p 以后, ai 就 具备了使用外部软件的能力, 所以从某种意义上来说, m c p 就是 ai 和外部软件之间的一座桥梁。那到底装哪几个 m c p 能够解决上述三个问题呢?这里我给大家推荐目前 github 上最主流而且确实能打的三个免费开源方案。第一种是用来搞定联网搜索的,叫 brief search, 它的强项在于拥有独立的搜索锁影,而且对 ai 的 读取特别友好。第二种是用来解决网页读取的,叫 fetch, 它能过滤掉网页里的杂乱元素,只把最核心的代码和文字扒下来给 ai 看。第三种是搞定图片识别的,强烈推荐 screenshot mcp, 它能自己截取你当前的画面或者指定窗口去分析报错的原因,这种直接让 ai 看图排错的体验妥妥的极品。接下来我就以 brave search 为例,为大家演示一下如何在 cc 里安装 mcp 工具。 首先你需要有一个 brief search 的 api key, 具体获取方法大家可以问问 jimmy, 为了避免被限流,这里实在无法展开了,只有拥有这个 api, 才能安装它的 mcp, 并获得每月两千次的免费搜索次数。放心哈,个人绝对够用了。 然后我们需要打开终端,粘贴这串代码。注意哈,这里要换成你获取的 api key 哈,那敲完回车,等它自动跑完,你的 c c 就 正式通网了。那另外两个工具就没这么复杂,不需要 api, 直接分别执行这两串命令就行。 那这三个外挂都装好了,具体该怎么用呢?简单,比如你直接敲一句,帮我搜一下某某某某,他自己就会去调用 brave search。 又比如直接甩个链接过去,按这个链接里的开源项目说明,帮我搭个环境, 他马上就能又快又准的执行任务。那遇到程序跑不通的情况,也连截图软件都不用打开,直接给他发一句,看一下我现在的屏幕,帮我找找 bug 出在哪,他就会自己咔嚓一下,截取当前的画面去排错。总而言之, m c p 工具的好处就在于清亮和即杀即用,而且 github 里面好用的 m c p 一 抓一大把,大家感兴趣的话可以自行探索哈。 ok, 那 接下来就是解决上下文监控和 callin plan 用量的问题了,大家看这里,这是我安装的一款名叫 cloud hud 的 开源插件,它的优势就是能够挂在在 c c 输入框下方,并且以进度条形式直观显示上下文用量和 callin plan 用量。 那有了刚才安装的 m c p, 我 们只需要把这个项目的仓库地址丢给 c c, 然后让他帮忙安装就行了。但是大家注意,这个插件原本只能监控 cloud 的 订阅套餐的用量,而我用的是国产 callin plan。 所以 接下来我想告诉大家,我是怎么通过使用 c c 来改造这个插件的。 首先我上期视频说过, c c 终端版最大的优势就是自由度高,而且这个插件又是开运项目,这就意味着我们可以用 c c 来修改插件代码。然后我分析 cloud 套餐机制和我使用的国产套餐机制是一样的,都是无小时限制加上周限制, 所以我只要能够获得我的套餐的用量数据,然后把它们替换到插件里就行了。所以我第一步是先让 c c 用 brave search 搜索如何获得我使用的控制 plan 的 数据。第二步就是让 c c 写个脚本,把我的国产套餐的数据替换到插件里面,读取 cloud 套餐数据的代码中,然后设置每五分钟刷新一次,这样我啥也不用干,刷刷手机就完成了。但是这个时候出现了一个问题, 就剩下文监控还是进入一条形式,但套餐监控变成了文本形式了, 按道理来说也能用,但是我有强迫症,我想既然可用的套餐可以用进度条显示,我不过只是换了数据来源样式,应该是不用动的。所以我用自然语言告诉 c c, 我 要插件原本的进度条显示,颜色搭配也必须遵循原来的插件。然后没多久 c c 就 帮我改好了。 当然我说的很简单,它中间其实还有不少细节,受限于篇幅没法展开。但我真正想告诉大家的是,知道原理就自然知道怎么做。比如我不知道什么是前端,什么是后端,就无法修正进度条显示。 所以大家想要玩好 ai, 真的 一定一定一定要多动手多尝试,从而提升自己的知识储备哈。 ok, 那 以上就是本期视频的全部内容了,我是专注动画科普 ai 的 阿 k, 无惊无险又到六点,下了个班。

我用 cloud code 跑通了视频自动剪辑,给大家实操展示一下,现在的 cloud code 太牛了,我深度使用了一个半月了,它能解决电脑上百分之九十的事情,我养过小龙虾一阵子,那 open clock 就是 个智障儿童。 这个剪辑软件已经开源了免费软件,我放在了评论区,给大家看一下。剪辑过程简直是自媒体的福音,从此不用再吭哧吭哧花时间剪视频了,开始实操。 运行了这个免费的开源工具以后,他开始帮我解析视频,看到我的视频有十二秒我的视频一个内容的结构,这是我拍的一个口播的数字人,他分析完我的视频以后,因为我全程没有口气词, 嗯,十秒一进到底,语速偏快但清晰,所以他给出了一个建议,方向,加字幕调色,加动画叠层,想问我往哪个方向走。接下来他就自动开始写脚本,写代码,我全程没有操作。 然后他开始生成三个动画,进行一个渲染,现在到了渲染环节,这是最终的一个产物,这是最终的视频,我们拉到最下面啊,直接直接丢出来了一个这个视频,结果牛不牛?现在 ai 太牛了,卡的酷的,赶紧用起来,点个关注,谢谢!