cloud code 是 什么软件?今天我让 jamal 给我写的一个口播的一个视频文案脚本,我现在让他来阅读一下, 理出来,整理成纯文字版的口播文案,整体语速保持自然坚定,带一点分享干货的死磕精神,非常适合直接看着题词记录制。 cloud code 是 什么纯文字口播文案? 说实话,第一次看到 close code 这个名字,我以为是黑客专用的神秘武器,普通人根本碰不得。但真正跑通之后,我直接被震惊了。他确实是 andropic 官方出的 ai 编程助手, 但如果你只拿它来写代码,那就真的大材小用了。像我这种不是程序员的普通人,现在每天用它来帮我批量写脚本、深度习稿,整理海量数据, 甚至帮我规划 tiktok 的 内容日历。它不是一个被动的工具,而是一个你下命令它自己想办法帮你死磕到底的全能雇员。刚装上它那天, 面对满屏幕的报错,我也完全是一头雾水,但我没放弃,因为我知道搞懂它就是普通人弯道超车的机会。接下来的视频,我会把踩过的坑摸索出的自动化干货毫无保留地掏给你。 关注我下一条,直接带你上手。 cloud code 确实是一个很强大的一个工具,目前我在测试它的阶段,我尝试过用它来帮我自动剪辑视频,但是那个惨不忍睹。我有时间我可以把那个视频整理出来,大家可以看一下那个视频 满满的 ai, 有 可能是我自己培训他,还有喂给他的东西,他还暂时不能了解我的意思。总之, cloud code 是 一个很好的软件,我同时也在去学习给他装一些 skill, 当然这个 skill 是 什么?我们放到下一期,或者是以后再讲这个问题,关注我,下期我们一起讨论如何学习 ai。
粉丝32获赞558

今天这期视频的目标只有一个,就是让零基础的小白学会如何零成本的在全程国内环境无障碍的使用上 cloud code。 所有的资料和文档我也都准备好了, 话不多说,我们马上开始。那首先我们要知道 cloud code 的 安装方式有两种,第一种就是官方文档里面写到的,使用原生的安装方式进行安装,针对不同的系统对应的指令,比如这里的 c m d, 复制一下这里的指令,在电脑这边的搜索栏里面输入 c m d, 这里就会弹出命令提示符,点击打开,打开之后将刚刚的指令鼠标右键即可复制上去,回车就可以进入到下载阶段。 那我相信很多人都会跟我一样,会直接抱怨一个这样的错误,那这是因为你需要有一定的网络环境才能够支持原声方式安装, 所以在这里我更推荐另外一种方式,就是使用 node js 的 方式进行安装。我们首先先准备下 node js 的 环境,第一步就是进入到 node js 的 官网这个地方,选择你当前的系统,选择这里的安装程序即可下载到对应的安装包。 后续的安装过程我就不再赘述了,非常的简单,只要一步步的往下安装即可。为了验证是否安装成功,我们还是可以打开刚刚的终端,我们输入一个 note 杠 b 回车,当这里显示他的版本号的时候,就说明你已经安装成功了。那接下来我们进行第二步就是安装 cloud code, 我 们只需要执行屏幕上的这三行指令 下载,安装完成之后就会有这样的一个提示,接下来只需要在控制台里面输入 cloud 指令,在这个地方选择信任当前文件夹, 你就能进入到 cloud 启动页面。当然你第一次启动的时候,它会提示你无法连接到 cloud 的 服务。不用担心,接下来我们只需要去连接国内的 a p i 服务就可以了。这里就推荐使用一个可适化的工具叫做 cc switch, 你只要进入了它的官网,点击下载最新版本,将其下载安装即可。下载完之后,你打开的页面就是这个样子的,比如这里我就已经添加过一个 mini max 的 api t 了,那当然如果你还没有去购买对应的 api 的 t, 又想体验最新的模型的效果,你可以选择注册一个摩达社区的账号, 进入到这里的模型库,这里就会显示当前最新的国产的开源大模型,包括 deepsea face, 小 米的模型,千万的模型。这里我们就以 v 四为例子, 我们选择好对应的模型,进入之后呢,点击这里的查看代码页,这里有几个比较关键的参数可以记一下,一个是 base url 就是 你的基础地址。第二个就是你对应的 api key 以及最后的 model, 我 们打开 cc switch, 点击右上角的加号进行配置,然后选择这里的 model scope, 当这里的 api key 复制粘贴到这里。接下来我们看到这里的模型,这里主模型默认还是 gm, 我 们将这里的 model 对应的模型名称复制一下,这里的模型全部替换。点击添加之后,我们再点击这里的启动,启动之后我们重新启动一个终端,再输入 cloud, 那 之后这里就已经提示已经切换为 deepsea v 四的模型了,我们简单问一个问题,当他能成功回答的时候,那 cloud code 就 已经安装完成了。 那以上就是本期视频的全部内容,后续我会分享更多的关于 cloud code 的 使用教程和实战案例。如果本期视频对你有所帮助,记得点赞、关注、收藏,我们下期视频再见!拜拜!

如果你也在用 cloud code, 但只会一个 cloud 命令就开干,那这条视频你一定要看完,我把我自己天天在用的命令和插件全部给你打包好了,看完直接上作业。先说说怎么启动,最基础的就是直接敲 cloud 回车就能用,但你要是跑长任务,频繁被全键弹窗打断,有两个金阶姿势。 第一个叫 cloud 杠杆, dangerously skip permissions, 意思是完全禁用所有权限提示 cloud 想干啥就干啥。速度快是真快,但它几乎没有 promote 注入防御,所以最好别用在你自己的主力机上。推荐在 dog 或者一次性虚拟机这种隔离环境里跑。 第二个操作,其实我更推荐叫 cloud 刚刚 permission auto mode 自动模式,它不是躺平,而是后台有个安全分类器,判断哪些操作是安全的,哪些需要提醒你有兜底,有风险低的,特别适合你信任的大方向,但不想中途被打断的长任务。 还有一个很实用的 cloud 刚刚 review 启动的时候,它会让你挑一个历史绘画继续,它可以接着昨天的活继续干,不用从零开始。启动完进入到绘画,里面有几个斜杠命令,你必须学会。第一个是杠 model, 它可以让你去选择模型,但这里我要提醒一下,这里不建议中途换。为什么?因为大模型是有 k v k 缓存机制的,你每一轮对话都是在用上下文 里面去追加消息。命中缓存的话,价格可以直接打一折,而且响应还非常快,但是一旦你切换模型了,缓存就废了,又贵又慢。 然后第二个是 effort, 它可以去设置思考程度,简单任务低一点,复杂任务拉满。加来几个是关于上下文的技巧。第一个杠 clear, 这个是彻底气功,相当于重新开一个全新的绘画,什么都不留。还有一个是杠 compact, 这个是把你之前的上下文做一个压缩,当你的上下文用量比较高的时候,你可以使用这个命令。 对,然后你如果说想打断这个命令,你可以直接按 esc, 这也是一个技巧。 还有个技巧是你可以连续按两下 esc, 这个的话就可以回退到你之前的命令,然后你之后他会有三个选项,第一个是回退到之前命令,第二个是你以你当前的绘画为基础,做一个呃上下文的压缩。第三个是什么也不做。接下来重点来了, 有个命令叫白泽伟,这个一般是用在呃什么场景呢?他一般是我们有一个长任务正在跑着,但是突然有一些无关紧要的事情,或者是有一些问题要问他,比如说刚刚这个文件的配置目录 是什么?那这个时候可以去用白泽位这个东西来问一下他,他是能看到当前绘画的全部上下文的啊,但是他的内容是不污染主上下文的,也不去,不会去打断 claus 正在跑的任务。他缺点是不能用工具。 对,他和 sub a 的 区别就是说啊,白泽位有上下文,但是没有工具, sub a 的 有工具,但是他没有你主绘画的上下文, ok? 最后一个还有一个技巧就是呃打一个感叹号,这感叹号相当于你可以在终端里面直接执行 batch 命令,比如说 b p、 w、 d, 就 可以看到你在幕后是什么 命令。讲完了,再讲几个我正在用的工具还有插件。第一个是查看上下文的,呃, cloud code 插件叫 cloud hub, 你 可以看到效果就是这样,它可以看到你上下文的使用情况,你的 token 的是,呃,还剩余多少?对,然后它的 github 地址是在这边, 它目前是有十八点三 k 和 star。 对, 安装命令也很简单这一行即可。呃。第二工具是豆包输入法,因为我们目前和大圆模型对话最方便的模式肯定是语音输入, 我们在这边直接按住 option 就 可以输入语音,比如说帮我实现一个历史动画效果, 你可以看到他的翻译是非常精准的啊。最后一个就是啊,我非常喜欢的一个功能就是这个灵动导模式,可以看到我这个上面是有一个灵动导模式的。然后这边,呃可以在多个 a 镜头里面去切换,而且它可以实时显示你的一个头款的使用情况 啊。比如说我在格式里面说你好,然后又在口袋里面说你好, 在这边实现类似动画效果,你看这边好了,它都会提示你去切换,这样就非常方便了。 以上就是 clockcode 我 每天都在用的全套命令和工具的使用技巧,如果你觉得有用的话,请点赞、收藏、评论区留言,我会把所有工具的下载地址整理出来发给你们,我们下期再见。

当所有人都在告诉你, cloud code 无敌了,靠,赖主无敌了,程序员要失业了。但是我要告诉你一个有点不一样的事实啊,限阶段的 web coding 根本就做不到真正意义上的脱手。所谓的技术平权,是建立在你至少懂一点技术逻辑的情况下。 如果你连最基础的概念都不懂,人家不是在帮你开发,他是帮帮你随机挖坑。为什么?因为很多人连最基本的两个概念都没有搞懂 啊。 l l m 和 agent。 先说 l l m 即垃圾 language model, 你 可以把它理解为 ai 的 大脑,像豆包,千问、 deepsea, 还有 g p t, 本身上都属于大圆模型, 他们负责思考、理解和深沉,但是他们不会帮你真正干活,他们只会告诉你应该怎么做。真正执行的是第二个东西, agent 翻译过来叫代理,你可以把它理解为 ai 的 双手, 他可以帮你改代码,跑命令,读文件,调项目。像 cloud code, codex 这种都是偏向于编码型的 agent。 但问题在于,其实他们都挺瞎的啊,你以为他们在认真开发?但是如果你不写好的提示词 啊,他经常改着改着就把项目改炸了,修一个 bug 照三个 bug, 还会一本正经的胡说八道。所以现在真实的状态是什么呢? ai 能让懂开发的人效率翻倍,但是远远做不到能让不懂开发的人直接起飞。后面的 mcp, skills, 还有自动化工作流,都是建立在你懂这两个概念的基础上。他说工具怎么选?如果你是 轻度修需求,就是想要写点小工具,做点小网站和小作业。我推荐一个东西叫什么啊通一律嘛啊通一律嘛?不知道有没有人知道的,开箱即用门槛低,而且最重要的是它现在阶段是全完全免费。 但是如果你是高需求想真的做产品或者跑项目的话,我建议你还是上 call 和 calllex 这种,只不过他们都有很多技术门槛,像环境配置, api 啊,费用还有网络这种一个都绕不开。 所以别再信什么一句话做萨斯零零基础月入十万这种鬼话了啊。现在的 web 扣队你更像什么呢?像一个非常牛逼啊但是脾气非常怪的实习生,你以后得会盯着会纠错会提需求, 而不是直接放手不管。 ai 确实在降低门槛,但是他远远没有做到让你什么都不懂就能闭着眼做产品的效果。

想用上 ploco, 体会大家说的帮你把活干了的推背感,但是打开教程就看到命令行终端。不要怕同学们, ploco 的 用户分两种人, 第一种就是已经会写代码的程序员们,他们呢?会用终端或者代码编辑器,终端速度快,代码编辑器可以直接看到 ai 一 行一行在改些什么, 但是他们都有一个共同点,是要碰代码而不会写代码的普通人。比如我推荐大家直接上桌面 app 敲黑板卡扣。桌面版不是低配版, 桌面 app 跟终端是用的同一个引擎,它有的功能桌面 app 都有,只是换了一个皮肤, 但是他的上手门槛超级低,你只要点击下载登录,打开这个 code 的 tab, 指定给他一个文件夹,同学们你就可以开始 write coding 了。这面板还可以直接在窗口里面预览结果, 所有的 session 都一览无余。这些都是终端版里面没有的功能,全程不需要你敲一句命令行, 这才是普通人拥有的 ai 屏存。哪天你想试试终端版的皮肤,随时都可以做切换,那装潢卡扣可以用它来干什么呢?下一条告诉你。

首先呢,我们进入这个 cloud 的 官方网站 cloud 点 com, 然后找到这个 windows 系统的这个下载文件,就是桌面端,我们点击下载, ok, 我 们下载完毕,我们就直接安装 文件,一共大小是两百三十兆左右,耐心等待一下啊。 好,安装完毕了,我们打开开始菜单,找到这个 cloud 的 快捷方式,点击打开, 然后进入这个 cloud for windows 的 这个软件界面以后点击左上角的三横横杠,然后点击后尾帮助,然后选择 drop show button, 然后再选择。 然后呢我们再次进入这个菜单,选择 developer, 就是 开发者的意思,然后选择配置第三方的接口, 然后出现一个新的菜单,然后我们在下面就是网关下面可以看到,呃,你使用的新的第三方大模型的 base url 地址和这个 api, 我 们举个例子,我们填入那个 delete, 那 你要提前准备好啊,然后这里要填入这个 base url 地址, 还有这个 api, 然后这个 er, 这个宾馆,这个相对代理的意思。 好,我们填完以后直接点击提交, 然后现在试一下输入,看能不能使用,比方说我们输入你是谁, ok, 现在看这个状态基本上应该是 ok 的, 没有问题,你看下面就是 flash 和 pro 两个模型,你看现在就出现了,我是 glada 的, 但是实际上我们用的是 gasket 模型。 其他的这些部分菜单的话也非常简单,就是新建任务啊,项目啊,定时器啊,自定义啊,这个是你的日常记录啊,这是你的空间,空间,这是上下文。


很多人以为 cloud code 只是一个会写代码的大模型,但实际上它真正厉害的地方不是模型本身,而是它背后的整套 agent 架构。你可以把它理解成大模型,只是大脑,真正让它能持续写代码、改代码、调代码的是外围这一整套工程化运行系统。 今天我们就来拆一下 cloud code 的 核心架构到底有哪些部分组成。我是小哲,点赞收藏加关注,我们马上开始!更多内可以查看橱窗。 第一层其实是最核心的上下文管理系统,因为真实项目的代码量非常大,模型根本不可能一次性把整个项目全塞进上下文。所以 cloud code 做的第一件事就是动态管理上下文, 它会先扫描项目结构,再决定哪些文件需要读取,哪些函数需要展开,哪些代码需要继续追踪。 很多人以为 ai 编程最难的是生成代码,其实真正难的是在几百万行代码里找到真正相关的那几十行。 第二层是工具调用系统。 cloud code 本质上不是单纯聊天,而是在不断调用工具,比如读取文件、搜索代码、执行命令、运行格式、修改文件、 get diff, 你会发现他的整个工作模式其实更像一个自动化程序员,模型负责思考,工具负责行动,所以现在很多 a 阵的框架本质上都在做一件事,给模型接手和脚的能力。 第三层是任务规划系统。 cloud code 并不是想到一句写一句,它通常会先做任务拆解,比如用户说帮我给支付系统加一个退款功能,它不会直接开始乱改代码,而是会先分析需要哪些模块,涉及哪些接口、数据库要不要改,有没有状态及影响,哪些地方需要测试, 然后再一步一步执行。这一层其实就是 agent 的 planning 能力,因为复杂任务一定不是一次生成完成的,而是规划加执行加反馈的循环。 第四层是记忆与状态管理,因为一个真实开发任务可能持续几十分钟甚至几个小时, 模型必须记住当前做到哪一步了,哪些文件已经改过,哪些图都还没完成,否则它会越改越乱。 所以很多 cloud code 类系统都会维护一个任务状态数,甚至会有短期记忆压缩机制,本质上它已经不是一次对话了,而是一个持续运行的软件工程 agent。 第五层是反馈闭环,这一层特别关键, cloud code 并不是生成完代码就结束,它会运行代码,执行测试、读取、报错,再重新修复,如果测试失败,它会继续迭代。 这其实已经非常接近人类程序员的工作方式了,写代码、运行、报错、修复、再运行。所以现在真正先进的 ai coding 核心已经不是生成能力,而是自我迭代能力。 最后总结一下, cloud code 的 核心架构其实可以拆成五层,上下文管理工具调用、任务规划、状态、记忆、反馈闭环。大模型只是其中的一部分,真正决定它能不能像工程师一样工作的,其实是外围这一整套 agent runtime。 未来 ai 编程的发展方向也一定会越来越像模型加工程系统的结合。这期视频分享到这里,我们下期见,拜了个拜。

如果你现在用 cloud code 只会一句一句发需求,那我建议你先别急着让它写代码,因为你可能不是不会用 ai, 而是根本没把它的隐藏能力打开。这期直接讲六个很多新手没打开的核心能力。开完以后, cloud code 才不是一个临时帮你写代码的聊天框,而是一个能长期配合你的开发搭档。 第一个项目,记忆入口名叫 innit, 很多人每次开新绘画都要重新解释技术栈、目录结构和代码风格。 innit 的 价值 就是让 cloud code 生成 cloud md 这种项目,说明先认识你的项目,再开始干活。第二个, play mode。 新手最容易犯的错就是还没想清楚就让 ai 直接改代码。 play mode 的 意义是先让它读项目,拆方案,判断风险,再进入执行。第三个 compact, 压缩上下文,绘画异常, ai 很 容易被前面的信息冲淡,越聊越散。 compact 就 像给对话做一次整理,把真正重要的方案接口和未完成任务留下来。 第四个,自定义命令,官方叫 custom slash commands。 很多人每天都在重复输入同一类提示词,比如代码审查、提交总结、性能检查。它的价值 是把常用提示词沉淀成自己的自定义命令,命令以后随时赋用成工作流。第五个, sub agents。 复杂项目不要总让一个 ai 绘画硬扛所有事情,它的关键是分工,主绘画统统方向, the agent 分 别负责审查、排错、测试和文档。第六个 hoops, 这个能力很多新手完全没碰过,但它决定了 cloud code 能不能守流程。你可以把它理解成自动质检员,改完代码以后提醒检查 结束任务前提醒验证结果。所以真正拉开差距的不是会不会问一句帮我写代码,而是你有没有把 cloud code 配成稳定工作流,项目记忆解决重复沟通 play mode 解决乱改压缩上下文解决跑偏自定义命令解决重复提示词 sub agents 解决分工 hooks 解决交付质量这六个能力建议收藏起来慢慢吃透。关注我,后面继续把 cloud code 的 高阶玩法拆给你看。

本地 agent 是 ai 发展现在最重要的领域了,也是普通人跟上这个 ai 时代我觉得最直接的方式。如果你现在仍然每天只是跟那个聊天机器人在问一些问题,还没有正式去接触过本地 agent, 觉得概念太多啊,没有头绪啊,不知道从哪里开始,这个视频呢,就特别适合你,它不是一个简单的这个工具教程,而是会告诉你普通人使用 agent 的 这个方法论,不管你是用哪个 agent, 都 都可以用上这套逻辑。如果让我来给 agent 排名的话,我觉得世界上 t 零级别的应该有四个, cloud code code、 open code 和 pi agent。 如果你有自己用的顺手的 agent 啊,其实大致的逻辑都是一样的, 但我今天呢,想带大家吃点好的。刚才提到的前三个的 agent 啊,主要的作用基本上就是帮你写代码,因为你看到它名字里面都带有一个 code 这样一个单词,你可以在网上收到大量大量的教程,但其中啊,这个 pi agent 是 里面最冷门的一个。 国内啊,我看到网上几乎没有人特别去聊这个主题,但是呢,它也是最特别的一个,因为它不是去专门帮你写代码的,它是帮你去完成日常任务的。大家看啊,在这个 open root 的 排行榜上呢, pad 的 这个每天的 token 消耗量是排在第六名的, 除了前面两个乱消耗的大哥,它仅仅地排在了大名鼎鼎的 cloud code 后面。 open i codex 负责人今天还说啊,它们大概有百分之五的生产流量已经跑在了 pad 哈尼斯出来的这个 agent 上面。别看这百分之五啊,你放在 codex 这个量级的工具里面我觉得已经很夸张了,之后大家会了解到说做同样的事情,其实派的消耗量会小很多,所以他排在第六名呢,我觉得已经很厉害了。最近三个月啊,派呢是我用的最多的 ai 工具, 所以我今天就想用派 agent 来给大家做一个 agent 和 skill 的 入门教学。我会手把手来教大家做三件事情。第一个呢,就是我们一边装 skill, 一 边去演示案例,搜索的,读 pdf 的, 读 office 的, 与 语音生图,做视频,每一步我们现场都去跑一遍。第三部分呢,最后我会让拍 agent 去做一个完整的大的案例调研,并且去自动生成一个很酷的视频。然后呢,再顺便提一句,观看这个视频,我觉得最好的学习方法是你打开你的电脑,一边看我的视频,一边自己去动手,视频呢可能有点长,大家可以先点赞收藏,然后慢慢看。我们现在正式开始, 我们先来说一个很重要的区分啊,就是像 cloud code codex, open code 呢,这些都是代码智能体。这个 agent 的 主要的目的啊,就是去写代码,产出就是代码,你让他去写一个功能,他交付给你的就是整个项目里面的这个一个个文件。比如说我拿 cloud code 的 举例子, 它里面呢就预装了代码的缩影,测试、运行、 get 操作、编码规范,整套呢都是围绕着更好的去交付代码项目去设计的,开箱即用写代码呢,确实是非常方便。 大家平时任务其实都不一样啊,不是每个人都天天坐在那边写代码的,你可能想要去搜资料,读 pdf, 整理表格,写汇报,做 ppt。 如果你预装一套通用的编程的工具,其实没有办法去照顾到所有人的日常办公的需求,派是怎么解决这个问题的呢? 派的设计思路啊,其实跟其他的 agent 都不太一样。其他的 agent 啊,大家知道功能越来越多,派呢,是反过来的,他是一个极简主义者,他把底座做得非常的极简,只保留四个最基础的工具,读文件、写文件、改文件和跑命令。除此之外呢,其他什么都不装了。他为什么这样设计呢?是因为他想让你去搭一个自己的 agent。 如果你是搞研究的,你可以装 pdf, 装搜索的 skill, 如果你是办公的,你可以装表格的这个 skill, 如果你想让他开口说话,你就去装 edge tts skill, 如果你去想做视频,就去装 hyperframes。 你 装一个 skill, agent 就 多一项能力,每个人手中的 pie 啊,最后长的都不太一样。大家看他这官网上的口号也是这个意思, 世界上有很多很多其他不同类型的 agent, 但是这个派 agent 就是 你自己的 agent, 这句话呢,就是最精确的表达了他这个派 agent 设计的这个基本的理念。上面我提到了好几次的这个 skill, 那 skill 具体是什么东西呢?就是一份给 agent 的 说明书,一份给 agent 的 操作手册。 agent 读完之后呢,他就知道怎么来具体的干活了。我们看啊,他 底座保持极简能力呢,就是你可以按需去安装,这就是 pad 的 设计思路。到这里呢,可能有些朋友也会好奇啊,就说你这差别到底能有多大呢?听起来好像也差不多嘛,我给你举一个具体的例子,如果你平时去用 cloud code 发一条,你好发一条 hello, 这个系统提示词呢,就会占到你两万的 token, 像 codex 跟 open code 可能稍微少一点,但也要一万五千字的 token 左右。 pad 是 多少呢? pad 系统提示词啊,不到一千五百字,差出十几倍。这会带来直接的三个好处, 一呢就是快,上下文短模型就会算的快,给出的答案也会快。第二点呢就是省省 token。 我 自己的体感就是做同样规模的任务, token 消耗呢,大概只有 cloud code 的 三分之一左右,甚至更少。第三点呢,就是聪明,模型的注意力是有限的,大家知道,如果你的提示词越长, 模型呢,可能他的注意力就越分散在派里面呢,没有一万字的预设的这种为了编程的提示词在旁边去抢注意力。在同一个日常的任务当中,派就是比 cloud code 的 更 更聪明,更听话,这个体感就会很明显。再回到开头说的这个 openroot 的 排名啊, pad 对 话每次消耗的头壳呢,只有其他 agent 的 几分之一,但总消耗量却能排在第六,我觉得这个含金量就很高了,说明在海外,在这个极客圈里面,也就有一大批人把 pad 当成日常工具在用了。 然后呢,派默认呢,他是跑在这样的这个命令行里面的,你看到有点繁琐,所以呢,我给他包装了一层网页,把它做成一个简单的这个容易使用的应用。这个项目呢,我自己大概已经使用了三个月左右,我跟我的朋友们基本上每天都在用。确实呢,把我很多日常的工作里啊都串了起来, 我觉得非常顺手,所以我现在公开出来了,开源出来了,如果大家有需要的话,也可以直接拿去用。下面的演示呢,其实就是用我自己开发的这个 pad 应用。好,我们先来安装这个 pad。 怎么安装呢?当然首先呢先要来安装 node js, 这个呢几乎是你去装所有的 agent 都要去依赖的这个一个基础的东西,如果你之前安装过,那你就跳过这一步,如果你没有安装过,你就在这边选择自己合适的电脑的环境,然后下载安装包,双击之后呢,一直下一步,它就帮你自动安装好了。 然后呢打开你的终端,在启动之前有一个可选的步骤,就是设置国内的镜像加速,你可以去搜一下 npm 国内的镜像加速,这里我用的是腾讯的镜像加速,就是输入这样一行命令,然后直接回车就可以了。 设置好镜像站之后呢,我们就可以启动派了,如果你是 windows, 你 可以点击菜单,打开你的 power share 应用,如果你是 mac 呢,直接打开终端就可以了,所有的都是这样,同一条命令,然后回车,他会问你是否继续 输入。 y 代表是的,刚刚输入的这条命令的意思是什么呢?就是运行我开发的派 web 的 最新版本,它首次运行呢,需要下载一些项目文件,所以会慢一点,之后更新的时候呢,都是会从缓存里面去加载,会快很多。安装好之后呢,它就会自动弹出这个派的网页应用了,就是大概长这样子的,看到左边呢就是 文件浏览器,你可以选择一个自己的目录,或者用我这里设置的默认的目录,然后下面呢大家可以看到可以设置模型,可以设置添加自己的 skill, 然后中间呢就是我们非常熟悉的这样一个对话框了, pi agent web, 然后你可以在这里输入文字,也可以上传图片, 然后可以选择一些参数啊,模型等等。然后呢,第一步我们就是要先来添加我们的模型,因为你没有模型的话,你这个 agent 做的再好其实也没有用。点击这里的模型,点击添加模型服务商,我们看到派支持很多这个官方的供应商, 然后也支持走这个 gpt 的 订阅,如果列表里面没有呢,你就选这个 custom 自定义接口,这一步呢就跟你配置其他的 agent 的 接口一样,填好 base url, 点好你的 a p i t, 然后点保存就可以了。添加好服务商之后呢,我们在这里选择添加模型,我们填上模型的名字,我们今天用的是 g p t 五点五,而最近用五点五实在太爽了,量又大,然后能力又强。 这里呢勾选上它的推理模式,然后可以允许图片输入,然后把最强的 x high 的 这个思考模式选上。窗口,我们选择二十万,然后这里填个六万四的这个最高的投屏输出保存,然后我们来测试一下,发个你好,我们看到模型已经通了,然后呢我发送我问他一下,说看一下我的桌面上有什么, 你看他已经能读取我电脑上桌面上的这个文件了。其实呢就是我们下载完派之后什么功能都没加的派呢,已经能做不少的事情了, 说整理文件夹,然后批量改文件的名字,执行命令,跑脚本,只要是本地电脑上能通过文件和命令完成的事情,派,他基本上都可以帮你去完成。好了,到这一步为止呢,我们看到我们的 agent 已经调通了,接下来呢,我们开始学习 skills。 多人觉得啊,这个现在 ai 时代概念太多,发展太快,不知道从哪里开始,那就牢牢地记住一个公式, agent 加上 skill, 这样就可以了,这是对于普通人来说现在最基本的框架,最本质的逻辑。下面我演示的啊,不单纯是去装一个 skill, 因为我这里也加了一个很方便的装 skill 的 这样一个按钮,我 会装一个 skill, 然后马上跑一个小任务。你会看到说我的派呢,怎么样?从一个只能读写文件的这样一个本地的 agent, 一 步步地变成一个能搜索、能读资料、能说话、能深图,甚至能做视频的一个工作流的 agent。 点击 skills, 然后我们这里添加 skill, 你 可以去搜索 skill 的 名字,然后选择里面想装的 skill, 点击安装就可以了。这里呢,有两个选项,一个叫做 global, 一个叫做 project。 global 呢,意思就是说你在 global 情况下安装的 skills, 是 所有你的项目都可以去使用的 skills。 如果你在 project 里面去安装的 skill 呢,就是只有这个项目你可以用这个 skill, 其他项目呢,不能去使用这个 skill。 所以呢,我一般就默认就选 global。 今天呢,我会来装几个我平时最常用的 skills, 覆盖基本上百分之九十的日常的场景。 第一个呢就是要安装搜索的 skills, 让我的 pi agent 能够去联网搜索,为智能体提供搜索服务的商家呢有很多,我这里呢推荐两个。 第一个呢就是这个 tivoli search, 它注册很简单,免费账号,每个月有一千次的,这个搜索额度很适合这个新手去使用。第二个呢就是 brave search, 它的搜索结果会更好一点, 但是比较麻烦的就是需要绑定信用卡,免费额度呢也是一千次是一样的。我这里呢先给大家演示 tivoli 怎么来安装,我在这里直接搜索 tivoli search, 点击安装, 安装好了。然后呢,我们去这个 tab 里搜索的官网注册一个免费的账号,然后可以把这个 key 复制过来。我们回到 pad 之后,直接跟他说帮我去设置 tab 里搜索用的 key, 然后 key 是 什么?什么?就是你刚才复制过来的这个 key 直接发送,然后 pad 呢会自己去写入这个配置, 它配置好之后呢,我们马上来试一个小任务,看看能不能搜索。搜一下这周最重要的五条 ai 新闻, 按重要程度排序,每条说明发生了什么,为什么重要?适不适合做短视频?保存到一个 news 点 m d 文件发送。我看到啊,这个派呢,开始调用搜索的 skill, 然后去整理结果, 它不是只给我随便很多的一大堆的链接,你看它这里有个评价搜索结果,它可能会把新闻去去重排序,然后再按照我的这个需求判断哪些更适合去做短视频。 好了,任务帮我们全部做完了,你看最后帮我们生成了一个这个 news 点 m d 文件存在了我们当前这个目录,下面我们来看一下,在右边呢,我还写了个预览的界面,给到这个 拍一进去用,你看五条 ai 新闻非常清楚啊,我觉得很厉害。那除了这个 tiffany search 之外呢,如果你想要得到更好的搜索结果,你可以去安装这个 brief search, 然后也是一样, 就是点击这个添加 skills 按钮,这里有很多搜索结果。我推荐的是这个 bad logic, 他 写的 brave search 的 skill, 因为 bad logic 啊,其实是派的作者,我觉得他写的 skill 会比较好一点,之后的步骤也跟刚刚一样, 这里点击安装。安装好之后呢,我们去 brave search 的 官网去注册一个账号,申请个 api key, 然后把 api key 复制给我们的 pi agent, 让他帮我们去配置就可以了。好,搜索 skill。 我 们安装完之后呢,第二类就是去 去读文件的 skill。 pdf 相关呢,我推荐的是这个 open ai 发布的这个 skill 文字版的 pdf, 它会提取文字来读扫描版 pdf, 你 需要在 pad 模型里面设置里面打开刚刚的那个图像识别能力,让模型能够看到 pdf 里面的图。 安装好了 pdf skill, 我 们安装好之后呢,我用 deepsea v 四的技术报告来测试一下。我把 pdf 啊拖进我的这个工作目录里面,放进去之后呢,刷新一下文件浏览器这边呢,就可以看到这个报告了。我们可以艾特这份报告,然后直接跟他说读取这个 pdf, 总结里面的核心信息。然后我们看到啊,这个派呢,会自己去调用我们刚刚安装的这个 pdf skill, 把十几页的报告都去读完,最后整理成结构化的总结。这里的重点是啊,我不用去复制 pdf 的 内容,也不用自己去提取文字,直接把文件丢给他,剩下的呢,叫他自己去处理,举反桑啊。其实 ppt, 然后 word, excel 其实都能安装 skill。 word 呢是用来读文档的, ppt 呢是用来拆这个演示文稿的, excel 呢,是用来处理表格。 ppt 里面门道是最多的。这个视频里面呢,我就先不展开了,后面有机会再做一个单独的视频跟大家讲解一下。这个视频呢,只跟大家展示这个最基本的这个文件的读取能力,到这一步为止啊,其实你的 pi agent 又能联网去搜索,也能读本地的各种类型的文件资料了。 然后接下来第三步呢,我们想让我们的这个 pi agent 能够开口说话,所以还是用同样的办法去安装这个 i g t s skill。 这个 skill 呢,不需要任何账号的,其实直接安装,然后就能用了。我看刚才这个派呢,已经帮我们生成了这个一份新闻的简报。然后呢,我现在想把这份简报变成语音跟网页的,我们开一个这个 新的绘画窗口,艾特这份文件,把这份文件改成一分钟的口播稿,转成语音做一个 html 界面,里面包含文稿和音频,排版简单直观。然后呢,帮我打开这个网页发送。 大概三分钟左右,这个派就突然帮我们跳出来了一个这个我们刚才要求的这个 html 页面,他刚刚先帮我们写了文稿,然后再调用了 html 生成音频,然后呢,写了 一个这个 html, 把文稿跟音频放进去,最后直接帮我弹出了。打开了这个网页,我们来播放一下一分钟口播稿,本周五条 ai 新闻。大家好,这里是一分钟 ai 快 讯第 一, open ai 的 推理模型,在八十年数学难题上找到新构造, ai 正走进真正的前沿科研。现在呢,这一步大家有没有感觉其实已经有点这个工作流的感觉了。之前呢,搜索 skill 负责找信息,派负责整理 t t s 呢,负责把它变成语音 h t m i。 网页呢,负责把这个结果落地成一个可以打开可以分享的这样一个文件。我们看到它这个步骤的总结啊,先生成了一个口播稿,然后转成了一个 mp 三的音频格式。最后呢,生成一个 h t m i。 的 网页。以前聊天机器人啊,只能把结果输出在你的对话框里面,太呢,却可以把答案变成你电脑上的文件啊,网 页啊,音频。很多人担心 ag 的 跑任务啊,会不会很贵很消耗 token 这么长一段的这个任务是吧,但我的体感是,这种小任务成本完全没有想象中的高。像 当我跑任务啊,这么长一段的,这工具调用跟执行大概花费呢,是零点三美元的额度,但实际支出要低得多,因为订阅一个两百美元的套餐,你就能用一个月五千到一万美元的这样 a p r 的 额度。更关键的是啊,派,其实它的上下文提示词很短头肯消耗呢,比其他代码智能体要低很多很多。 第四个功能,我们给派来增加这个声称图片的功能。接下来呢,我们就来安装这个现在的最强的深度模型 gpt image two 好安装好了,这个 skill 的 原理啊,其实是调用 codex 里面的 gpt image two 来生图,如果你订阅了 gpt plus 或者 pro, 就 可以把生图能力也交给派去使用了。我们来试一下这个 skill, 平摊一个对话窗口,我们还是给刚刚我们生成的这个新闻啊来配图。 根据这个文件的第一条 ai 新闻,用 gpt image two 生成一张适合短视频封面的图片,风格是简洁的三 d 科技感的图片。 好,任务完成了,我们先来看一下第一条新闻是什么,就是 open ai 的 推理模型,在数学难题上找到新的构造,看一下这个图片非常不错啊,就是完全符合了我们的要求,有这个科技感。然后主题也是刚刚那个 ai 新闻的那个主题。 这个 skill 呢,有个小问题给大家说一下,在 mac 上是直接可以用的,在 windows 上呢,如果遇到这个脚本报错啊,其实完全不用慌,就是万事接问 ai, 让你的这个 skill 里面的脚本有哪里有 bug, 然后修复再运行它自己完全能够修好到这一步呢。我们其实看到我们的 pad 已经能搜索了,能读资料,写文稿,生成语音,生成图片了,那最后一步呢,我们就是让它来增加这个做视频的功能,我们直接搜索 ipad frames 安装。这个呢,是我最近特别喜欢用的一个 skill, 它非常适合做这个讲解类的视频产品,介绍科普动画,然后过程演示。它的思路也很巧妙,不是去直接让 ai 生成视频, 还是先让 agent 写一个带动画的 html 网页。 html 因为是用代码组成的,所以它生成的时候非常稳定,又可编辑,可预览,然后呢,再逐帧去渲染成一个完整的视频。而且对你来说啊,你完全不需要去懂 html 里面的代码是什么意思,你只要告诉他你想要什么结果好。 安装好之后呢,我们来先跑一个比较小的 demo, 先开一个对话框,用 hyperframes 做一个二十秒的动画,解释什么是 agent, 只生成 html, 不 需要去渲染视频, 我们来看结果,你看它生成好了,它能做标题,然后转场图形,动画字幕的节奏。这个东西呢,你继续加上一些语音,加上一些图片, 其实就能变成一条完整的视频。我们给 pi agent 配上了这五个功能之后啊,我们最后来验证一下我们现在这个 pi agent 它拥有的能力。比如说,我问他,你现在安装了哪些 skills, 它们的位置在哪里?你看啊, pi 呢,会把它现在所有的技能都给列出来到这里呢, skill 一个一个都解锁了, 搜索的,读资料的,语音的,声图的,视频的,单独看呢,你其实看每一个都不复杂,但如果我们把它串起来啊,就能做很复杂很复杂的任务。最后呢,我们就来把这个整合起来,一起来做一个大的项目。最后这个案例里面,我们想做一份行业的调研汇报,假设呢,我现在想要研究一个问题, 是一台英伟达的 g b 两百 mv link 七十二的 ai 机柜要卖三百万美元左右,那这些钱到底用在了哪里,花在了哪里呢?我直接跟我的 photographer 说,作为一个调研项目,一台英伟达 g b 两百 mv link 七十二的 ai 机柜,钱到底花在了哪里?要求做成中文的 hyperframes 演讲,用 tts 配音, 用 gpt image 生成图片素材。关键数字数据必须有来源不确定地方呢?写清楚,是估算的长度呢,大约是两分钟左右,需要有字幕显示,不需要渲染,视频发送。就这几句话,其实我只要说我需要什么,结果 pad 呢?就开始帮我自动拆解任务了。 第一步呢,他会先调用这个搜索 skill, 去查英伟达官方的资料, g b 两百 n v link 七十二的这个产品信息公开的报导,或者成本的估算。第二步呢,他会帮我去整理这个资料,把关键的数字跟来源都单独记录下来。第三步啊,他开始拆解成本了,比如说包含算力、核心网 络的互联页轮之类的这些成本。第四步呢,他会开始写中文的关键词,翻译成人是 two, 生成图片素材。第六步,他调用 h t t s 生成中文的语音解说。第七步啊,他才会用 hyperframes 把标题页、成本拆解,图片、动画、语音全部组合成一个演讲的界面。我拿到的是这样一个完整的项目,文件夹里 里面有资料的笔记,有成本的拆解,有中文的演讲稿,有语语音的文件,有所有这个图片素材。最重要的是还有一个可以直接打开预览的这个 hyperframes 的 这个页面。大家来看一下这个效果,非常完整的一个介绍英伟达 ai 机柜的这样一份视频的资料。 今天看一笔账,一台英伟达 g b 二百 n v l 七二 ai 机柜三百万美元花在哪?先看规格,英伟达官方说明, n v l 七二在液冷机柜里连接三十六个 grey c p u 和七十二个不恰当 g p u, 组成一个七十二 g p u 的 en v link 浴 整柜 m v link 通信宽带一百三十 tbs hbm 三亿约十三点四 tb 价格没有公开标价。 tom's hardware 二零二六引用业内来源给出二百八十到三百四十万美元。二零二四年 h sbc 估计约三百万。下面按三百万美元中位数算, 第一项,三十六颗 g b 二百 super 值, h sbc 估每颗六到二百五十二万美元,占整柜约七成到八成。 单科 superg 里主要价值来自两科, blackwell、 gpu grey cpu hbm 和先进封装。 epicai 估算单科 b 二百,制造成本约六千四百美元, hbm 接近一半,先进封装约一千一百美元,逻辑规片低于百分之十五。 第二项,互联和网络,机柜里有九个 envlink switch tray, 还有铜栏 connect 网卡 blueview dp 管理网络和本地存储公开资料,没有逐项价格,按三百万总价扣掉 superg 后,这部分和其他系统件合计大约几十万美元。第三项,工程成本, envio 七二公,耗约一百二十千瓦,重量约一点三六吨。你需要夜冷供电机会结构测试和集成 tom's hardware in modern stanley 数据 gb 三百 nbr 七二的冷却部件泵约四点九八六万美元,这个数字只代表冷却部件量级,不含机房侧 cdu 配电合约。结论很简单,最大的钱在 gpu hbm 先进封装和 nvlink 生态。 第二层是液冷和电力工程,在往外是供给稀缺、软件占质保和整柜集成溢价。最不确定的两项是实际成交价和非芯片泵拆分, 他们随客户采购量和合同变化,这就是派 agent 的 价值,相信大家都学到很多了,就我们最后再来回顾一下。 agent 呢,现在大概上可以分为两种, coding agent, 它的产出是代码,帮你写项目 派这种日常的任务的 agent 呢,产出的是结果代码,只是中间的一些手段而已。 coding agent 是 预制菜,内置了一套完整的写代码的流程工具。提示词,派是个性化的,是自己搭的它的底座。极简 能力呢,靠 skill 一个一个往里面加,每个人最后用到的派呢,其实都长得不一样。所以这期视频的重点啊,是看我们怎么一步一步的去解锁这个派的能力。装搜索,它就会联网, 装 pdf 跟 office, 它就会去读资料。装 h t t s 呢,它就会开口说话。装 g p t image two 呢,它就会生成图片素材。装 hyperframes 啊,它就会做带动画的演讲跟视频。 最后啊,当你把这些单一的 skill 串起来的时候,你就突然发现它强大的能力了,它能完成一个真正像工作一样的任务,从一句话开始,交付一份完整的行业调研演讲报告。 coding agent 呢,解决的是开发的效率,它也解决的是工作流的效率。好了,今天视频就到这里了,我是蒂斯种黑金李超,我们下次见。

很多小伙伴问怎么让 cloud code 接上 deep seek? 这条流程我从头到尾给你讲一遍,照着走就行。 视频稍微有点长,建议先点个收藏,耐心看完,按步骤动手。先说清楚, cloud 是 anforepic 的 网页和 app 聊天助手,你打开浏览器就能用。而 cloud code 是 跑在你电脑终端里的编程搭子, 它能直接读你的项目代码,改文件、跑命令,相当于把 ar 装进了你的工程目录。更狠的是,凭借社区里那一大批开源 skills, 它还能调度你电脑里的一切浏览器表格、邮件、设计稿,几乎想自动化什么都可以。 为什么要接 deep seek? 两个原因,在国内访问稳定,不挂代理,按 token 计费,也比海外接口便宜不少。而 deep seek v 四 pro 的 能力,应付日常写代码、改 bug、 做重构绰绰有余。 开始之前先准备两样东西,第一, node js 十八以上版本提前装好,长期支持版就行。第二, get for windows, windows 用户必装,不装后面依赖会报错。 第一步,安装 cloud code, 在 开始菜单里搜 power shell, 右键以管理员身份运行。打开窗口后复制官方的 m p m 命令,粘上去回车,等它装完。 装完输入 cloud, 加上版本参数,看到版本号就说明装好了。第二步,获取密钥, 进入 api 开放平台,进入控制台后,在左边的侧边栏找到 api keys 这一项,点进去, 页面下方有一个创建 api key 的 按钮,点一下弹出小窗,给这把密钥起个名字,比如就叫 demo, 然后点创建, 创建成功之后会弹出一个密钥字符串,立刻点复制保存到记事本或者密码管理器里。特别提醒,关掉这个窗口之后,密钥就会变成密文,再也看不见。 如果你不小心丢了,只能删掉,重新创建一把。第三步,配置 cloud code, 打开文件资源管理器,进入 c 盘用户目录,再进入点 cloud 这个文件夹。 如果看不到点 cloud, 要先在查看里把隐藏项目和文件扩展名都打开, 然后新建一个文件,名字叫 settings jason 把这段配置直接复制进去,把 api key 行换成你刚才复制的密钥保存即可。第四步,验证打开终端或者 power shell, 输入 cloud, 回车 看到红色边框的欢迎界面,模型型显示 deep seek v 四 pro, 就 说明已经成功接上 deep seek。 最后再送一个加分项。如果你平时在 vs code 里写代码,配好 antropic 官方的 cloud code 插件, 装完进入侧边栏的 cloud code chat, 它会自动识别你刚才配置好的账号,直接就能在编辑器里聊天和改代码。 整个流程下来,你就拥有了一个本地终端加编辑器,双端可用的用 deep seek 驱动的 cloud coat。 你 学会了吗?欢迎评论区聊聊。

新手用 cloud code 高频翻车的五个点,今天一次性帮你避开!第一个翻车点,不写 cloud 点, md, 它每次开新对话都从零猜你的项目技术栈、目录结构、命名规范全靠瞎蒙,结果就是改风格不一致, 要用错文件反复反攻。新手第一步直接跑匿名,让 cloud code 自动生成专属记忆档案。第二个翻车点,分不清 plan、 edit、 ask 三大模式,全程默认丢需求。 plan 先规划方案, edit 才动代码。 ask 只解答不改文件, 复杂任务一律先 plan 再 edit, 安全又稳。第三个翻车点,盲目开 auto 或优乐模式,他拿到方向盘自己跑,新手还没看清就跨文件改了一堆,等回过神来,关键逻辑早被覆盖,回滚都难。 新手老老实实手动确认每一步,等熟了再放权。第四个翻车点,长对话从来不 compact, 上下文越堆越满,偷啃烧的飞快,他还会被早期的过时信息带偏,回答开始前后矛盾记不住最新决策 对话变长就 compact 一下,关键结论留在记忆档案里。第五个翻车点,不接 git, 就 让它随便改,新手项目连仓库都没出,使化模型改崩了,想退回上一版都做不到。辛辛苦苦写的代码, 一次错误重构就全没了。动手前先 git init 加 commit, 每一步都有快照可回滚。记忆档案模式分清,关掉 auto, 勤用 compact 接好 git, 五个翻车点,一次避开。关注我,带你吃透更多 cloud code 高阶玩法!

今天的目标是手把手教大家在没有魔法、没有 cloud 账号的情况下,如何安装 cloud code, 不 需要任何代码基础。纯小白友好,我从 cloud code 的 内侧就开始用,到现在已经一年多了,每天工作都在用。但我并不是程序员,也没有任何技术背景,所以我想从我的视角做一个系列视频, 结合我实际的工作场景,从安装开始,一步一步带大家上手。先快速回答几个大家在安装前可能有的问题,第一, cloud code 和前段时间很火的小龙虾是一个东西吗?都是顶尖的 ai agent, 但路线不同, 小龙虾走的是广度路线,他活在聊天软件里,覆盖几十个平台,帮你处理跨平台的消息、日常邮件、 qq 了,走的是深度路线,他的规划模式、上下文管理这些设计,都是为了把一件复杂的事从头做到尾。我们在工作中要做的调研分析、小工具、工作流,本质上都是造一个完整的东西, 这是 ko 擅长的。第二,有那么厉害吗?能用来干啥?我是零技术背景的产品经理。举个例子,一份行业调研报告,以前我要花一周,现在跟他说一句话,十分钟出来做一个内部投票工具,以前要找开发排期,现在我自己半小时就做好了。我甚至还自己搭了一套广告物料投放生产的工作流,一天可以做十几组物料图。 第三,没魔法,没 ko 账号,还有必要装吗?市面上大多数 ai 编程产品,本质是 ai 辅助你写代码,前提你得懂代码, code 是 你说目标 ai, 自己从头做到尾,全程不用空代码。对零技术背景的人,这才是真正的用的形态,而且国产扣顶模型这一年做的特别快,接近 qq 里使用,可以满足大部分场景。我用 mac 来演示 windows 的 安装命令,我截图放在视频最后了,大部分步骤是一样的。第一步,装 homebrew, homebrew 是 mac 上的一个软件管理器,可以通过它来安装 qq 的。 打开终端,复制这行命令,粘贴发送。这个时候要输入密码,看到这个提示的时候回车就行。装好之后,这里会提示我们加一个路径,照着他给的命令我们复制粘贴跑一下, 我们可以输入这个命令验证一下。好,这个时候我们可以看到 homebrew 的 版本号了,说明已经安装成功。接下来就是安装 curl code, 同样是复制这一行命令,粘贴到终端里发送。 当我们看到这个 successfully installed, 说明 curl code 已经安装成功了,我们可以复制这一行命令验证一下。 看到最新的版本号是二点一点一四三,说明安装成功。同时我们可以输入 cloud, 当我们看到这个橙色的小螃蟹的时候,就说明已经安装成功,但这个时候还没有接入模型,它只是一个壳,我们可以先退出,连按两下 ctrl 加 c 退出。第三步是安装 cc switch, 我 们把这一行命令复制下来,然后在终端内发送 c c switch 是 一个模型管理工具,装好之后可以一键切换不同的国产模型,不用手动去改配置文件提示 c c switch 已经成功安装了。第四步,拿 api key。 我 今天用的是小米 miimo, 选小米纯粹是我自己用,觉得效果不错,性价比也高。浏览器搜索小米 api, 小米的话,因为我是订阅了它的一个月度套餐,所以 api key 和 base url 都跟 api 这边呢是不一样的。进到 cc switch, 点击右上角的加号,然后选择自定义配置。这里我们需要手动填写相关信息,把小米的 key 填进来,然后把兼容 andropic 接口协议的这一个 base url 复制粘贴过来。 点击获取模型列表,在列表当中选择 mimo v 二点五 pro 默认兜底模型。选择 mimo v 二点五 pro 添加仅用刚刚添加的这个。回到 terminal, 输入 cloud, 可以 选择一个自己喜欢的配色。看到安全提示继续按回车就好。选择使用推荐的设置,确认信任这个文件夹目录。 这里已经出现了 mimo v 二点五 pro 的 模型名,我们尝试对话试试。看到这里,恭喜你在没有魔法且没有 qq 账号的情况下成功安装了 qq, 可以 开始开 coding 了。可以尝试让它做一个小网站试试看。 除了小米, mimo c c switch 里还可以接其他的国产模型, g l m, deepsea, kimi, mini max 都行。配置方式是一样的,在 c c switch 里加一个供应商就行。 qq 很 快就把这个 excel 文件写好了,打开这个看一下效果。 到这里,我们已经成功地用 color code 写了第一个 web coding 的 小应用。 windows 的 同学安装逻辑完全一样,只是命令不同。 第一步用 winget 装 git, 第二步用 winget 装 color code, 第三步到第五步跟 mac 完全一样。装好只是第一步。下一期我会讲安装后的必要设置,不同的模式以及 skill 体系。大家有什么想要了解的,也欢迎评论区留言。这是 color code 从零到实战系列的第一期,如果你觉得这个视频有用的话,可以给我一个一线三连催更,我们下期见。

可拉库的必须要知道的三个命令啊,首先就是编辑,它直接会帮你在项目中生成项目说明、代码规范,技术栈要求,能够让 ai 一下就懂你要做什么。第二个就是瑞众,如果你不小心关掉了可拉库的窗口啊,重新打开选项继续上一轮对话,就可以直接运行这个命令啊。第三个命令就是 compact, 如果你上下文很长的时候运行这个命令会直接帮你压缩上下文,能够节省 token, 也能避免 id 的 因为上下文过长而跑偏。

这是一条 web coding 纯小白入门的保姆级教程,让你从一个什么都不懂的小菜鸡,完成属于你自己的第一个 web coding 作品。 我会基于我这几年 ai 编程的实战经验,用最简单的大白话把整个过程完整演示一遍,没有专业术语,不留任何卡点,确保你跟着做一定能学会,无需魔法,全程干货。 首先我们要用到三个工具, cloud code、 c c switch 和 deepsea。 你 可以这样理解, cloud code 就是 你的 ai 编程,员工听你发号施令。 deepsea 是 员工的脑子,负责思考、推理和生成代码,而 c c switch 就是 让它装上这个脑子,正式入职。 是的,兄弟,你是老板,我们先打开 deepsea 的 开发者后台。为什么推荐它呢?因为它是目前为止国产 ai 大 模型里面性价比最高的,且真的能干活的东西。信我啊,我最近用它做了很多事情, 洋人 ai 不 敢做的东西,比如这种整理题材异动的,他能帮我做。洋人 ai 做不到的东西,比如中文语境的改文案,写小说,他更是断档。第一关键是便宜,真他妈便宜, 用了快一个月了,一点五亿的 token, 十几块一杯奶茶钱,所以普通人充十块钱就可以用很久很久。然后进入这里创建一个你的 api key, 随便取一个名字,比如测试它只显示一次,复制后要妥善保存,并且不要泄露给别人。然后到下面的接口文档选择接入 a 帧的工具。这里就有关于 gala code 的 安装教程, 非常非常简单,一行指令就能搞定。比如你用的 windows 电脑,按下键盘的 win 加 r 键,输入 c m d, 回车会弹出一个命令行窗口,复制这行命令,按下鼠标右键,直接粘贴回车就可以了。 然后你再输入 cloud version, 返回版本号,就说明安装成功了。文档下面关于配置环境变量的步骤。对小白不太友好,所以要用 cc switch 这个工具一键搞定。 这个就是它的开源仓库,如果你没有魔法,也可以飞鸽工具箱。是的,这个整个网站也都是 web coding 做的。打开之后选这个命令行版本的 cloud 图标,点击添加,找到 deepsea, 把你刚才申请的 a p i k 填好。最新版的 city switch 呢,已经把模型名配置好了, 这里建议勾选一百万的上下文,然后添加保存点,这里可以测试,确认成功就行了。现在你可以重新打开一个命令行窗口,输入 cloud 回车。第一次配置呢,需要你选风格默认就好了。然后是确认授权管理这个项目,这里会显示用的是 deepsea v 四 pro 的 模型,你也可以问他一句,靓仔,你用的是什么模型? 看到他的回话了吧,恭喜你,你已经给你的 ai 员工装上了 deepsea 的 脑子。现在我们就可以愉快地 web coding 了。 我们先创建一个文件夹,也叫项目,相当于给你的员工一个临时工位。这里更好的用法是你可以在这个文件夹的路径框选中一下,再输入 cmd 回车。这就相当于你在这个项目下启动了 cloud code。 然后你输入 cloud, 开始写任务要求。比如我们这次演示开发一个个人薄客的网站。作为新手小白,你可以参考这个五步模板,明确身份。我是谁?我是新手,你不要默认我懂技术,明确目标,我要做什么东西?明确功能,这个东西要有什么功能?明确复杂度, 你别搞得太复杂,避免 ai 呢,把很简单的东西复杂化。最后就是明确流程,先整理需求,再写代码,这样能有效减少返工,省拖延,省精力。比如你可以参考这一张截图, 这里呢,我提一个间接技巧,如果后期你的项目变复杂了,就可以让 ai 帮你创建一个 cloud 点 m d 文件,你可以把它理解成写给员工看的工作说明书,就是员工手册。以后他每次进到这个项目都会先看这个文件,知道他是干什么的,用的什么技术,有什么规则,让开发更加高效。指令可以这么写啊,你也可以截图一下, 给到上面的新手提示词。之后呢,他会帮我们梳理需求,很多你没想到的,他就能帮你去丰富和完善。确定好了之后,就可以让他写代码了。 等到他跑完之后呢,我们就可以看到第一版,按照要求呢,他给了我们一个网页文件,我们双击就可以打开,能看到这个界面,做的还是挺不错的。如果哪里有需要优化的地方,你可以继续像聊天一样,告诉他哪里需要改,改成什么样的,直到你满意为止。 好了,到这里你就已经入门了。很多人不是不想尝试,其实就是被这种看似很复杂,但其实非常简单的门槛给拦住了。 我们这个演示全程都没有用到任何魔法墙,你用自己家里的电脑和网络就可以搞定了。后边你有任何的想法,想做哪种提高你工作效率的软件工具,都可以举一反三,让 ai 帮你做到,甚至是可以思维再打开, 不让它开发软件,而是帮你实时解决电脑上的问题。比如设置定时关机,清理大文件,给他文案,让他改写总结,电脑缺组建,让他帮你修好等等,都是可以搞定的。 如果大家感兴趣,我也会在后期慢慢多出一些硬核的干货视频,站在小白的角度上,多讲一些间接学习的思路和技巧。 ai agent 是 时代的潮流,我的好兄弟,不要掉队。

大家好,今天给大家分享 cloud code 的 操控 kimi ceo i 的 原理啊,我最近用的比较多啊,因为确实太省 token 了,能把我的产出的量极大的提升,所以也给大家再做一期深度的拆解 啊。我们先给结论啊,给操作方法怎么用其实比较简单啊,你就把 kimi code c o i 的 官方文档发给 cloud code, 然后他读文档,读完之后他就能理解怎么去操控了,这个就一步就到位了,其他的什么都不要做, c c 其实是非常聪明的 啊。然后我讲一下原理啊,首先做两边的架构对比啊,其实 kimi 跟 carl code 这边的架构是大差不差的啊,可能 kimi 这边参考的会多多一些。然后基本上就是一个 carl code 的 拍摄的翻版, 包括这些代理搜索, mini 行这些都差不太多啊,这就是一个架构的双栏对比啊,这个我呃简单解说一下,就是告诉大家为什么调用这么丝滑。首先有一个 print, 呃, curlcode 通过这个 print 的 调用呢,就会取代我们平时的打字,就不用去打字,跟这个 kimi c y 沟通了,这个 print 就 解决一个是一个管道,把提示是从这个管道喂进去,然后结果就从这个管道吐出来, 然后就 ok 了。然后这个 yolo 呢,是一个全 pass 的 一个一个命令就是呃, curlcode 的 调用, kimi 就 用这个,这个命令之后就不用点什么,批准了它这个就没有了,它全都是自动批准。 那第三个呢,就是中间的过程,这个 card code 也是不读的,它只要 kimi c y 的 结果,所以给个快的,它就不会输出过程了,只反馈最终的结果,所以这三个开关加在一起呢, kimi c y 就 变成一个把文字输进去,然后文字输出来的一个黑盒, 然后 card code 呢,就直接能通过管道去调用它,所以就很方便,非常的丝滑,这是一个调用的流程。就是首先你的 c c 呢,肯定是需要评估这个任务本身的 啊, c c 比较聪明嘛,所以他当时回关是非常合适的,像他就有点相当于你公司的高管。然后他去分析了之后啊,就需要判断什么活交给 timi 合适,什么活他干合适,然后适合 timi 干的,他就开始写提示词, 然后写出高质量的提示词啊,这个提示词绝对比比我们自己写的那个质量高太多了。然后呢,他就通过这个高质量的提示词发给 kimi, kimi 呢?接到了提示词,通过管道收到之后,他就去开始去干活去了啊,而且这个是能多个 kimi 一 起干活的,可以放出多个 kimi 的 a 卷一起干活, 然后 cloud code 可以, 然后接下来就验收结果不合格,然后再返回 kimi 接着干,然后 kimi 同时还能这个承担这个质检跟审查的功能,还可以呃, cloud code 还能放出多个,启动多个 kimi 进行不同维度的一个质检, 所以全程下来 cloud code 的 指向跟判断,然后这些写跟查都给 kimi 在 干,所以非常省头等省了很多。然后这是一个写文章的举例啊,就比如说我们写啊,小说啊,或者写写那个公众号之类的, 就是 kimi 他 会组装这个提示词啊,设定啊,角色前文这些,然后 kimi 来写,然后再验收,初步验收一下,然后最后最后再派 kimi 进行这个文章的连续性 ai 位跟逻辑的这个三路的质检,质检合格了 就过了,质检不合格,然后让 kimi 再返工再改。所以 cloud code 其实就是一个监工的角色,它 top 肯能省很多,百分之百到十五吧。 然后这个是一个翻译网站,嗯,我自己有做英文的网站,做了一个大战,这两天在翻译成 西班牙语。那西班牙语呢?你让 cloud code 全部翻译,那绝对是一个很大的量,也不是说会干很久了,只是说非常费头肯。 但是呢,翻译这个工作其实给 kimi 干就非常的合适啊,就是每个模块啊, color code 就 指挥他翻译,翻译完然后自己检查一下,没问题再接着翻译,基本上就这个链路一直下去就可以了。而且在这个过程中呢,还能让 kimi 自己进行独立的审查, 翻译完之后再审查一下合不合格,然后最终啊 color code 进行一个验收,然后我在做网站的时候还让他进行测试,就是 color code 可以 去 呃让 kimi 的 a 卷进行整个网站的全功能的测试,就是打开每个页面进行个浏览测试,所以这些重活累活都可以交给 kimi 去看,非常省 tokyo。 然后这个是第三个概念,就是你的数据量,如果你要分析很多数据量的话,那其实,呃, cloud code 来分析确实也是很烧 toky 的。 呃,所以还是要用 kimi 去做一些数据清洗啊,然后统计分析,然后分析报告啊,这些都可以让 kimi 干。 kimi 其实智商挺高的,绝对是够用,当个小当 google 的 小弟是没问题的 啊。这个是市场调研的举例啊,就比如说你们要做一些市场调研,无论是电商啊好,还是大家是金融机构的,要写报告也好啊,这种多路的多线路的调研啊,量非常大的调研,你都可以交给这个这个 kimi 去干, 包括行业的规,行业的分析,竞品的分析,然后用户的画像这些都可以放出多录的 kimi 去去分析,然后结果汇总之后,呃 cloud code 再进行一些验证跟排查,就能出报告了。 最后做一个总结就是,呃,这个操作体系呢? send token, send token 就 代表着你的 cloud code 可以 有更多的产出, 相当于如果是五倍的话,那你可能就多了三四倍的产出,而且 kimi 是 能保证质量的,呃,一个 ai, 所以 大家也可以多用一下这个吧,我觉得是挺好用的。好,今天的分享到这里,谢谢大家。

前两天我跟一个朋友聊到了他不用 cloud code 的 原因,他说每次一关窗口,聊天记录就没了,下次打开又得重新开始。我的第一反应是,很多人不是觉得 cc 不好用,而是根本没搞清楚他应该怎么用。所以今天我想聊一下,如果你想真正的用好 cc, 至少要知道哪些东西。 首先, c c 不 只是一个能写代码的聊天框,它更像是一个在你的电脑项目里工作的 ai 助手。当然你不能随便打开一个终端,然后说帮我做个网站,这样也能聊,但是效率非常低。更好的方式是你给他一个明确的工作空间。 就比如说你要做一个测试项目,你应该先建一个文件夹,然后在这个文件夹里面打开终端,接下来的任务就是围绕这个文件夹工作。这其实非常重要, 因为用 ai 编程工具的最核心的是你会不会给 ai 划边界,你要告诉他哪些文件能改,哪些文件不能动,这个项目的目标是什么?这步是先规划还是可以直接执行?什么情况必须停下来问我,不 然他能力再强也可能跑偏。然后说,安装 windows 用户一般需要先准备 node 点, js 和 git 不 会装也没关系。现在最简单的方法其实就是让另一个 agent 帮你装,比如说你 可以用 tree 或者是 cursor 这类工具,直接跟他说帮我检查一下电脑有没有 note 点 gs 和 bit, 没有的话就帮我装。这也是我现在很喜欢的一种思路,要什么都自己学,能让 ai 帮你铺环境,就让 ai 帮你铺 cc 的 安装,我这里就不多讲述了,你们可以去搜教程,或许我也会出视频。 cc 有 几个模式新手一定要知道。第一个是摸着模式,这个模式比较稳,他不会随便乱改,每做一步会停下来问你。缺点是慢,但优点是安全。第二个是全自动模式,这个模式是你授权以后,他可以自己连续执行, 效率很高,但你得确定你给他的任务足够清楚。第三个是 plan 模式,这个我非常推荐新手用,因为他只规划不动文件,他会先帮你分析项目结构,拆任务给方案。我一般的习惯是先让他进入 plan 模式, 先把整个项目想清楚,确认没问题以后再切换成执行模式,这样不容易把项目改崩。切换模式一般是 shift 加 tab。 再说聊天记录的问题, c c 是 可以恢复之前的对话的,你只需要 输出斜杠 resume, 它就会列出之前的聊天记录,你选一个就能接着之前的内容继续。还有一个更实用的操作,如果它刚刚执行了一步,你觉得效果不对,可以按两下 esc, 可以 退回到这一步之前。当然 token 是 肯定不会退回的。还有两个命令, compact 是 压缩上下文, clear 是 清光上下文。 ai 的 上下文越长,他就越容易忘记重点,执行质量会下降。所以一个阶段做完就让他慷慨了一下,一个大方向结束就可以了一下,但是清空之前一定要让他总结当前项目进度,这样你下次打开他也能快速的接上。 这其实就是我现在用 ai 工具最大的感受,也不能把他当成一个无脑的聊天机器人,你要把他当成一个需要管理的员工,你给他的信息越清楚,他越清楚,他越不 浏览度,项目资料整理的越好,他接着干活就越顺。最后再简单说三个进阶方向。第一个是 skills, 你 可以理解成给 ai 的 标准作业流程,比如说你经常做公众号,做网站、做复盘,你就可以给他写一套固定的规划,让他每次都按你的习惯来。 第二个是 m c p, 它更像是让 ai 接入了外部工具,就比如说数据库、文件、网页、支付这些,这个能玩明白以后, ai 就 不只是跟你聊天, 而是真的能接入你的工作流。第三个是 hoggens, 这个是更像自动触发机制,就比如说你保存代码以后自动检查,提交前自动格式化,某些操作前自动提醒。这些东西听起来有点技术,但本质上就是让 ai 更像一个自动化团队。所以总结一下,我觉得 c c 真正厉害的地方不是他会写代码,而是他让 一个不那么懂代码的人开始把想法推进成一个真实的项目。但前提是你不能乱用,你要学会在正确的文件夹启动它, 用一般模式先规划,然后用 reroom 接回历史绘画,用 esc, esc 回退错误操作,用 ctrl 翻 译上下文应用。 c 的 规则,现在它能做什么,不能做什么,这些东西掌握以后,你才会发现, c c 不是 一个聊天工具,它更像是一个能帮你推进项目的执行助手。而我现在越来越确定,未来真正拉开差距的,不是你 会不会问 ai 问题,而是你能不能把 ai 变成自己的工作流,不是让他陪你聊,而是让他真正帮你把事情做出来。

之前呢,我们分享了一期 cloud code 接入 deepseek, 但其实没过多久啊, cloud 就 有过一次版本更新,新版本的模型名称就会出现一些问题, 那这一次就正好我们把桌面版 codex 和 cloud code 都通过 c c switch 来接入 deepseek, 我 们出 three two one。 我 这里啊,把前置环境和 c c switch 都准备好了,同时呢也写了文字版的安装教程。呃,大家可以参考一下,我就不展开了,我们直接开始。 那先说 codex 吧。首先呢,我们需要做一个 cc switch deep seek 的 通道,这个呢,我已经准备好了。呃,文字版里面大家可以自己找一下。首先我们打开这个文件夹,找到这个文件, 复制一下再黏贴。然后呢重命名,文件名是点 env, 注意啊,这个点不能忘记。然后呢,这个文件呢,我已经有了,所以呢我就不确认了,我把这个删掉。 我现在打开这个点 env 给大家看一下,这里面啊就是一条 apikey, 你 们打开的话就把自己的 apikey 写上去就可以了。然后呢,我们双击一下这个 start 点 back 的 文件, 出现这样子的界面,这就算成功了。那如果中间哪里有报错啊,就要重新回去验证一下自己在前面的环境这里有没有什么没有安装好或者遗漏的地方。 好,那我们接着打开安装好的 cc switch, 这个是 codex 的 界面啊,它是 gpt 的 图标。 进来我们看到这个,我们点击右上角的加号,可以看到的是添加供应商,呃,我们下滑,这里填供应商名称, deepseek v 四 pro。 备注呢,我们就随便写写一个 test 官网的链接,这里是可以不填的, api key 就 填自己的 deep seek 的 api key 就 可以。 这里注意啊, api 请求地址填的不是 deep seek 的 接口,因为前面我们已经做过 cc switch 的 转接了,所以填的是本地的地址, 然后下面到模型名称这里就填 deepseek v 四 pro, 然后我们拉到最下面,这里直接就是点添加, 然后它会自动回到上页。这里啊,已经多了一条 v 四 pro。 看一下啊,这里我们直接点一下它就可以切换到使用中了。现在我们来打开 codex 看一下 这里,它其实已经绕开登录环节了,原本打开呢是需要 gpt 的 账号了,现在呢,呃,都是需要验证手机号的。那我们现在通过 cc switch 就 可以直接接入 dbic, 跳过登录直接进到 codex 的 界面了。 这里我们根据他的提示啊,先初步一下,然后这个 set up 好 快速就完成。现在我们发消息来问他一下,你当前使用的是什么模型,有回复了啊,他这里回复呢,他是 deepsea 了。好,我们现在再来验证一下 这里呢啊,使用之前他会向你申请一下电脑的权限。没关系啊,我的 codex 工作区也在桌面上面,我们现在直接打开看一下。 好的,这里呢,他是已经在工作区里面建立文件夹了,速度啊,我觉得是很快的,根本没什么毛病。那其实到这里为止呢, codex 接入 dbic 就 完成了 啊,如果没有账号没法注册或者说登录需要验证的朋友们啊,我们就先把 dbic 可以 这样耍起来了。 然后接下来呢,我们直接再来试一下 cloud code, 这里同时也是一样的啊,我们首先先要打开 cc switch, 我 先把我刚才的配置都删掉, 注意啊,这里是 cloud 的 配置页,也同样啊,直接点击加号进来,直接就是选择 deepsea, 这里的供应商链接,官方名称都已经直接有了备注。我们也先随便写一个测试 a p r key, 这里也同样是写 deep seek 的 key 请求地址,这里也不需要动了。 好,接下来我们就到了模型这里,模型这里呢,我们都填 deep seek v 四,然后这个 e m 呢?呃,之前的视频也说过,其实就是百万上下文使用的意思,如果不加的话呢,不用做大项目的话也是够用的。 然后这里其实还是可以换一个 flash 模式的,也不用全部都是 pro, 然后随便找一个改一下啊,这几个模型名字等会都有用的,是一个对应的关系。然后这里我们就直接先添加, 回到这里就有这个选项了,我们这里就直接点起用。之后呢,我们再开通一下本地路由,在这个设置路由本地路由里面,本地路由打开 cloud 打开, 然后同样这个本地的服务器地址是要记一下,后面要用的。好,我们返回上一集测试一下,看到他是正常运行的。接下来呢,就是打开 qq 的 第一次 打开登录界面,不用登录啊,左上角 help 这里啊,点击这个 troubleshooting, 然后进到这个 enable develop mode, 然后点击 enable, 然后这里其实就是进入它的开发者模式, 然后重启,重启之后你会发现这里多了一个 develop 的 入口,然后我们选择 configure party info, 然后进来。进来之后,首先第一个 provider, 我 们这里直接就选 getaway, 然后 getaway 这里的 base url 就 写刚才我们 cc switch 这里出现复制下来的地址,这一个 key, 这里呢,当然还是 deep seek 的 key, 然后 bear 这里是不用动的。好,到模型 list 这里怎么填啊?这里就是填我们前面在 c c switch 里面配置过的对应模型,前面呢,加一个 cloud。 好, 这里两个模型够了,直接我们拉到最下面 apply locally。 好, 然后直接重启。 看啊,这里就是直接不用登录,我们就进到 cloud 的 界面了,然后 solo party 的 模式到 code 这里试一下。首先呢,我们随便设置一个工作区,然后测试一下,帮我建个文件夹。好,我们看一下它的这个速度还是很快的啊。 ok, 那 到这里呢, codex 和 cloud 都已经接入完成了。我最后补充一点啊, mac 系统呢,相对比较稳定,但是 windows 的 话呢,会经常会出现这样子的报错, 但这种报错啊,其实没有什么关系,通常都是安装有问题。呃,因为网络原因,组建安装可能会有丢失,最好呢是可以调整一下自己的网络环境,重新安装一下就 ok 了。 顶级的 a g 呢,配上我们的国产大模型,就再也不用为无法登录烦恼了。好,那这次的内容就到这里,希望对你有所帮助。我是阿月,我们下期再见。

你以为 cloud 配置文件写得越细, cloud code 就 越听话?但很多项目恰恰是从写太满开始跑偏的。 cloud code 用了几天还挺顺,第四天突然乱写导入语句,绕过调研层改。你明明叮嘱过别动的文件。多数人第一反应是模型抽风, 但真翻一下 cloud 配置文件,问题基本都在这儿。因为 cloud 配置文件不是 readme, 它不是给人看的项目说明,而是给 cloud 看的工作规则。你写在前面的东西会影响它,后面怎么判断,怎么写代码时 会不会跑偏。所以今天这篇我想聊的不是 cloud 配置文件怎么写得更全,而是它为什么会越写越糟?坑一把 cloud 配置文件当 readme 写,这是我见过最多的坑。很多人写 cloud 配置文件,第一反应都是先介绍项目,这个项目用什么框架、什么语言、什么版本,目录结构长什么样? 历史上为什么这么设计某个模块?以前迁移过几次,团队之前有过什么约定,写着写着就把它写成了一份巨大的项目说明书, 看起来很完整。但问题是,对 cloud 来说,这里面每一行都在抢注意力。你真正想让它记住的是,所有接口必须经过校验,不要记录用户原始数据,关键路径不能堵塞。结果这些东西被塞在第幺八七行前面,幺八零型都在讲文件夹结构和历史背景,那它跑偏 真的不能全怪模型。我自己的感受是, cloud 的 配置文件最重要的不是信息量,而是顺序。前面几十行最好只放三类东西,项目到底是什么?哪些事绝对不能做?核心技术战是什么?就这么简单。 比如这个项目是一个高并发交易后端,那你一上来就告诉他,关键路径不允许阻塞 io, 所有接口必须做输入校验,不能记录原始用户数据。 p 九十五,延迟目标要写清楚。这几句话比一整棵目录树有用多了。目录结构有没有用?当然有,但它不应该抢最前面的位置。剪索规则、数据库迁移规则、健全流程,这些更细的内容可以拆出去 放到单独文件里, cloud 配置文件做锁影就够了。这里有个细节也挺坑的, part to file 这种引用不一定是你以为的,用到才读,很多时候它会跟主 cloud 配置文件一起进上下文。 所以如果你真想做案需加载,就别把所有细节又通过引用塞回根目录。更好的做法是把专项规则放到子目录的 cloud 配置文件里,让 cloud 根据当前工作目录读到更具体的规则。 根目录写全局合约,子目录写局部规则。这就像公司制度,不能把财务、法务、研发、行政所有细节都贴在大门口,大门口只贴最重要的几条,进到对应部门再看对应部门的规则。 cloud 配置文件也是一样坑。二,把硬规则和偏号搅在一起。 第二个坑是把 never 和 prefer 写在同一段。这个真的非常常见,比如你写所有 jason 请求都要较验,但请求体很小的时候可以跳过再写,尽量使用 e 部, 但同步也可以。再来一句,关键路径不要跨服务调用,除非确实需要。你看人类读这种话没什么问题,因为人脑子里会自动判断场景,但 cloud 读到这里,就很容易变成一锅概率汤,一会儿严格,一会儿宽松, 一会把偏好当硬规则,一会又把硬规则当建议。你今天问他,他可能很守规矩,明天换一个上下文,他可能又开始自由发挥。我以前一直觉得只要写清楚就行,后来才发现,并不是。你得把规则的力度写清楚。硬规则就是硬规则,偏好就是偏好, 这两种东西不能混在同一个段落里。硬规则区只放 must、 never、 always 这种词,而且句子要干脆,不能代让步。比如所有入口参数必须通过结构校验,比如永远不要绕过全线中间键。比如 禁止在日制里写入用户原始请求,这里不要出现,应该尽量可以考虑。这些词一出现刚性就掉了。偏好区就随意一点,比如优先用 e 部,比如避免引入新的状态管理库,比如更倾向于附用现有工具函数。这类东西可以表达方向, 但不要伪装成硬规则。说真的, cloud 配置文件里最怕的不是规则少,最怕的是规则的口气都一样。硬规则和风格偏好混在一起, cloud 到头来只能取平均。结果就是,你以为自己写了护栏,其实只是写了一堆建议。坑三只说要做什么,不说不要做什么。 第三个坑是 cloud 配置文件里全是正向指令,要做输入校验,要返回某种格式,要遵守某个调用链。这些当然要写, 但只写这些其实不够。因为 cloud 不是 一张白纸,它训练语料里有大量默认写法,有些默认写法挺好,有些就很灾难。比如随手写一个粗糙的文本切分,比如硬编码向量模型版本,比如校验失败的时候返回半截 jason。 比如解锁上下文不够的时候硬编一个,看起来像真的引用。 再比如补货完异常什么都不出力。这些东西你不明说别做,他有时候就会顺手带出来。不是他故意跟你作对,他只是沿着最常见的写法。 所以我现在越来越觉得,写清楚不要做什么比只写要做什么还重要。你项目里踩过什么坑,就把它写成 never。 比如,不要粗暴按字数切分的方式处理代码文档,不要硬编码模型版本必须从环境变量里读, 不要缓存未经验证的模型输出,不要在解锁节点里直接调用外部接口,必须经过限流层,不要在校验失败时返回不完整 json。 这些句子看着很冰冷,但特别有用。它们不是教程,它们是事故记录。每一条背后最好都对应一次你真的被坑过的经历。 这样写出来的 cloud 配置文件才不是空泛的最佳实践。顺着这个,再聊一个更隐蔽的东西,失败路径。很多人会告诉 cloud 成功时要怎么回答,但不会告诉他失败时怎么处理。 查找没找到足够上下文怎么办?相似度很低怎么办?调用顺序不确定怎么办?如果你没写,它就会为了完成任务,硬凑一个看起来完整的答案,这时候最危险,因为硬凑出来的东西往往比直接报错更像真的。所以你要给他一个明确的处理办法。比如上下文不足就返回 instance context, 并列出缺什么。比如最后生成答案时没把握就不要硬给最终答案。 你想想看,这个设计其实跟后端接口一样,正常返回要有格式,错误返回也要有格式,没有结构化,失败就只剩下幻觉。 这个地方我觉得特别重要,因为你不是在要求 cloud 永远正确,你是在要求它不确定的时候别装坑。四不版本化,也不淘汰旧规则。 第四个坑,最隐蔽代码库已经更新了好几轮, cloud 配置文件却还停在几个月前。三个迭代前,你们还在用粗切块器,上个迭代 已经换成羽翼切块儿了,旧模块儿都删了,但 cloud 配置文件里还写着使用 niv chunk 切分文档,然后你开一个新绘画,让 cloud 改解锁逻辑,他非常听话地把 niv chunk 又引回来了。你看到的时候一脸懵,不是哥们儿,这玩意儿不是早删了吗? 但站在 cloud 的 角度,他没做错,他读到的规则就是这么写的。问题就出在这里,给 cloud 的 上下文已经过期了,旧规则不会自动失效, 你不主动删除,它就一直在那儿,像一条过期但仍然生效的公司制度,新人看了会照做, cloud 看了也会照做。所以 cloud 配置文件也需要版本管理。不是说非得搞得多复杂,但至少要有版本号,有更新时间,有简单的变更记录。 比如某条规则什么时候加的,为什么加,什么时候废弃,迁移到哪种新写法。废弃规则可以用 lightdeprecated 标出来,这个标签不是什么官方魔法,它就是一个约定。但约定这东西在团队里很重要,人能看懂, cloud 也能看懂。更稳一点的话,可以配一条自动检查, 只要生成代码里出现已经废弃的旧模块、名旧函数、名旧调用方式就直接失败。别靠记忆,靠记忆维护规则迟早会出问题。我有时候觉得 cloud 配置文件这件事,其实特别像接口设计,你不能只定义成功路径,你还要定义错误返回,你不能只写现在怎么用, 你还要标出什么已经废弃,你也不能把所有东西都塞进一个巨大文件里,该分层就分层,该有边界就有边界,根目录放什么,子目录放什么 都要说清楚。回到最开始那句话, cloud 配置文件不是写得越满就越稳,不是认真有错,而是很多认真到头来会变成堆料。把 readme 的 写法搬进 cloud 配置文件,重点会被丢掉。把硬规则和偏好混在一起,约束力会被稀释。只写要做什么,不写不要做什么 也不给。失败路径模型就会回到那些常见但未必适合你的默认写法。不版本化,不淘汰旧规则,过期上下文就会继续污染新代码。 说到底,一份好用的 cloud 配置文件应该很克制,开头先放项目身份底线和核心技术战,别急着塞背景资料,硬规则和偏号分开写, 不要做什么,失败时怎么兜底也要写清楚。版本号、废弃机制、子目录、规则跟着代码库一起走。做到这些, cloud code 也不是不会犯错,但它犯错的方式会变得更可控。你不用每次都跟模型来回掰扯,问它为什么又绕过校验层, 为什么又改了不该改的文件,为什么又引入一个早就删掉的模块。你可以回到 cloud 配置文件,把对应的规则改清楚,我不确定这套对你有没有用,毕竟每个项目的痛点都不一样。但如果你最近刚好也遇到 cloud code, 越用越飘, 真的可以打开自己的 cloud 配置文件看一眼。先别问模型是不是抽风,先问问你的 cloud 配置文件是不是已经写成了另一份 readme cloud 配置文件这件事就讲到这儿,你那份 cloud 配置文件现在踩在哪个坑上?评论区丢出来,下一期接着拆。