别人用 ai 效率翻倍,你却天天在帮他擦屁股,这是两种完全不同的用户体验,为什么差距这么大?问题不在于 ai 不 行,而在于你没给他划清楚工作范围,你没告诉他哪些能碰,哪些不能碰,没给他明确的工作流程和质量标准。今天分享一个方法,五层配置体系, 让你的 ai 从天乱王变成神助攻。我今天以 cloud 为例子,其他的 agent 也一样。先看一下整体结构,你的项目根目录下有一个 cloud 文件夹,里面包含五个子目录, cloud md、 hooks、 rules、 commands、 agents。 每一层各司其职,逐一拆解。第一层叫 cloud md, 你 可以理解成给 ai 的 项目说明书,它告诉 ai 三件事,项目怎么跑,哪些是危险区,代码风格是什么, 日制在哪,看出了问题去哪排查?比如拿项目怎么跑为例,当你把新项目丢给 ai 时,你希望他第一时间就知道怎么安装依赖,怎么启动开发服务器,怎么跑测试,而不是每次都问你要命令。这就是为什么你要把这些写进 cloud md, 哪些是危险区。当你让 ai 帮你修 bug 时,你最怕他手滑,改了电 e n v 文件或者生产配置。如果你不提前告诉他哪些不能碰,他真的会碰你, 因为他不知道那里有什么,所以你要把多 nv 文件、生产配置这些标注出来,让 ai 知道那是禁区。接下来是日制在哪看?当你收到一堆报错时,你希望 ai 能自己去看日制,自己排查,而不是每次都在那问日制在哪,或者你常用的日制路径,让他知道出了问题去哪找信息。 有一个关键点,控制在一百行以内,太长, ai 会开始选择性遗忘,它记不住那么多,建议先用以内,它自动生成出稿,然后删减到最精简文档,不再多在于精。 第二层我要介绍 setting stop jason, 这个是全线防火墙,它解决一个核心问题,提示词根本拦不住。你有没有遇到过这种情况,你说不要执行危险命令,它该执行还是执行? 提示词的约束力太弱, ai 在 解决问题的过程中,会把这些警告全部忘掉,必须用权限硬卡。 settings json 里的 deny 规则是真正生效的防护, ai 读不进去就是读不进去。 下面是一些我经常自己用的权限配置内容,大家可以自己看一下,让我们增加真正的防护,少踩一些重复的坑。配置策略建议三步走,第一步,保守配置权限最小化,宁可少放权,不可超授权。第二步,等项目成熟了,根据需要慢慢放开。 第三步,等你熟练掌握了,可以灵活调整。第三层是 hux, 这是最有意思的一层,它不管能不能做,而是管做完以后会怎样。你有没有过这种经历? ai 写完代码,你一看格式乱七八糟,缩进有问题,你让它改,它改了,下次写出来又乱了。如果你配了格式化 hook, 每次 ai 写完代码自动触发,代码自动格式化,提交前就已经是规范格式,你再也不用为格式问题操心。 再举一个例子,配了测试 hulk, 每次代码提交前自动跑测试,确保这次修改没有破坏现有功能。如果你配了安全 hulk, 危险命令直接被拦截,根本执行不了。你设置好规则,剩下的交给 hulk 来兜底。这里有个关键细节,必须用 exit 二才能真正拦住。 exact 二和 exit 一 完全不同, exit 二是执行终止命令,被真正拦截。 exit 一 只是报警,但继续执行。很多人配了 hoox, 但从来没真正拦成功过。问题根源就在这,用成了 exit 一。 建议先加三类, hoox, 安全防火墙代码格式化提交前测试,这三类能覆盖百分之八十的踩坑场景。第四层是 command 和 skills, 很多人把它当提示词收藏夹,其实它更适合做团队流程的入口。你有没有过这种经历? 同事 a 写的代码,你 review 了一遍没发现问题,上线后出 bug 了。同事 b review 另一处也没问题,上线后也出 bug 了。因为每个人的关注点不一样,每个人 review 的 标准不一样。如果你团队有 review, 这个 command 每次代码审查都按固定的检查清单来空止针、边界条件、错误处理,测试覆盖所有人,用同一套标准代码,质量有保证, bug 率明显下降。如果有 fix 这个 command, 它自动帮你拉取相关日制,拉取报错信息,结合上下文给出修复方案,排查效率完全不一样。我在项目上还遇到发版的问题,但是你有 release, 这个 command 按团队模板自动生成发布日制,保证格式一致,内容完整,你只需要检查一下就可以发布。 一个好的 command 的 价值是让团队每个人触发代码审查时, ai 都按相同的入口,相同的关注点,相同的输出预期来工作。建议先沉淀三到五个高频 commands, 别贪多,命令越多,维护成本越高。第五层是 agents, 这是隔离上下文的专家。你有没有过这种经历?让 ai 做代码审查,他在那读了半天文件 grab 了半天,提出了十几个假设,推翻了十个,最后给了你三个建议,结果主上下文被这些中间过程填满了。 等你让他做下一件事时,他已经开始健忘了,因为上下文太长了。代码审查、安全审计这类耗时任务会产生大量中间过程, 读文件 grab 失败。假设临时判断、常日制。这些东西如果都留在主上下文里,会把工作记忆弄脏。 sub agent 的 价值就是把探索过程留在子上下文里。主线程只受到压缩后的结论。你让主线程做决策时,他只看到最终建议, 不被中间过程干扰。建议普通小改动,不用上 agent, 等支线任务真的变重再考虑。如果从零开始配置,建议按五步走,第一步,写一个短的 cloud md, 别超过一百行。第二步,不 有一个保守的 settings, jason 先抵耐高风险动作。第三步,加一两个关键 hooks, 比如 bash 防火墙和提交前测试。第四步,沉淀高频, command skills 三到五个就够。第五步,等支线任务变重了,再加 agents。 说实话,百分之九十五的项目,前三步就够了。 skills 和 agents 是 等真的遇到重复性复杂工作流时才需要的,别为了配置而配置。 cloudy 不是 魔法,而是 ai 工程化落地的第一层地基,五层各司其职。 cloud md, 让 ai 少猜项目规则。 settings detection, 让能力有边界。 hooks, 让关键动作可拦截,可验证。 command skills, 让团队流程可附用 agents, 让支线探索别污染主上下文。真正能长期留下来的不是某一句神奇提示词, 而是项目里沉淀的工程资产规则权限验证流程边界。现在就去配置下一个用它提效的就是你。下期预告 cool 的 到底怎么写才能少犯错?关注我,下期不见不散!
粉丝2166获赞3.2万

最近 deepsea 的 v 四模型上线一段时间了,然后大家都知道它的效果很好,最近又在打折,很便宜嘛。 但是众所周知,纵众所周知啊, deepsea 到现在还是一个纯文本的模型,没有识图的能力, 虽然它在已经在灰度测试那一个图像理解的功能了,但是呢,甚至上线到 ipi 要多久也还不知道。那么呢,就把 cloud 的 code 接入 deepsea 之后,再使用一个项目,就一个, 像是一个接到微信的一个 adhd 监管者的一个角色。然后呢,如果大家感兴趣的话,也可以去小红书啊搜索 cyberbox 或者在 gifthop 上直接搜索啊,我觉得是很有用的,对于 adhd 来说, ok, 言归正传,在嗯使用的过程中,我察觉到就是有时候确实挺想发点图片之类的,但是他看不到,然后呢,就是做了这个 skill。 呃,他这原理就是通过再调用一个其他多肽模型的 api, 然后接入到 cloud code 里面,然后让他去嗯,在 deepsea 的 基础上,再用这个 api 去理解图片。这个 另外一个 api 就是 这个 deepsea 的 api 在 理解图片之后,会输入一段文本给 deepsea 看, deepsea 对 他再通过这文本进行一个输出。那么 这样做是为了说在使用 deep seek 他的优秀的编程能力,或者是说他的一些你可能喜欢他的行为风风格啊,就是在喜欢 deep seek v 四这个模型的基础上,再通过这一个小功能去弥补他无法理解图像 理解的缺陷。这个 a p i 可以 任选反我的话呢,就会考虑用一个比较便宜的一个模型,因为只要它理解图片理解的 ok 就 没问题。如果大家要手头其他的多模态模型的话,也可以直接使用。我会把这一个项目的 链接放在简介里面,大家直接复制这个链接给 glo 就 可以,让它安装给大家看一下效果吧。如果没有安装这个 skill 的 话呢? 啊,你发一张图片的地址过去啊,他就会直接说无法读取图片的内容,然后但是安装了这个 skill 之后,他可以正确的理解这一个图片里是什么内容。 skill 可以 用在 cloud code 上面,也可以直接用在 cloud 的 桌面端上面,嗯,具体操作都是一样的,然后我来演示一下, 那这边我用 cloud 的 桌面端来做一个演示这个 skill, 他 有一个美中不足的点,就是说,嗯,没有办法 通过直接添加图片的形式去进行理解,他只能够把图像的本地路径复制过来,他才能够进行理解。我来讲一下怎么使用这个东西,只需要把我的这个网址复制,然后直接粘贴进来, 然后跟他说阅读这个项目,并拉下来安装到某某某某某。我现在新建一个文件夹吧, test, 安装到 test test 文件夹。 然后我再讲一下另外一个问题,就是我们可能在第一次使用 cloud 桌面端去抓取这个 getop 链接的时候,它有可能会失败,然后这个时候你就直接跟魔镜说为什么会失败,然后让它自己去解决这个问题就好。 我们这边再新建一个 key 啊,视频,嗯, 然后复制到这边呢,跟他讲直接讲 a t i t 还有模型 啊,在这里我们要选择全模态模型啊, 全模态模型或者是说视觉模型都可以,但是呢,嗯,千万,这边的免费,免费用量视觉模型比较少,所以我们选择免费用了这么多的一个 啊,全模态模型到现在识图呢,它消耗的速度不会很快,所以能够支撑很长一段时间。 ok, 粘贴,然后直接让他执行就好了。 ok, 然后现在咱们随便找一张图片,然后就右键复制文件地址,然后呢直接在这里面粘贴过去,然后就是问啊,这里面的人是谁? ok, 这里看到我们就是直接能够识别到这张呃图片中的人物是神乐,然后卡布拉酱,然后呢 对可以给出一个解释。 ok, 到这里就已经完成了我们这一个啊整个的部署,然后呢现在是只能 在这一个窗口里面用新开一个窗口,他就又不能识别的。那如果大家想要把这一个呃功能部署到全区的话呢,就直接跟科奥的讲就好了,他会自己帮你去完成这个操作。 ok, 那 么视频就到此结束,谢谢大家啊,希望大家可以给一些用户的反馈啊之类的。

今天这期视频以 deepsafe 为例,因为收到群友以及评论区的反馈,说我上一期出的视频零四期有很多朋友用了之后,模型方面还是存在一些问题,比如说虽然设置的是 deepsafe v 四 pro, 但是实际上返回的是 flash 模型, 就因为我上一篇文章写的是以智普模型为例子的解决方案,那么视频就换成 deepsafe 为例。第一步我们需要下载 cc switch 这个软件,具体的下载方案呢,你可以在我的抖音群内找到,或者说你自己直接用浏览器搜索一下就可以了。我们下载之后点击右上角的这个黄色的加号,我们以 deepsafe 为例,点击这个 deepsafe, 然后我们往下滑, 在 api k 这里我们填入密钥名称,这里随便填,我们点一个测试吧请求地址,它是默认填写的,如果说官方有要求的话,以官方要求为准。然后我们再往下划看这块的模型选择,如果说官方准备好的话,我们直接点这个获取模型列表就可以了,如果发现获取不了,那我们就手动输入就可以了。 比如说我们想用的模型是 deepsea v 四 pro, 那 我们就直接输入 deepsea v 四 pro 就 可以,要注意一般都是小写。然后我们全都换成 deepsea v 四 pro, 默认是这个是最高级的,然后这个是中级,这个是低级, 以此类推,把这个选择最高级的模型,这个次一等,这个再次一级,这个名称要注意看一下,因为后面我们是要一一对应的,比如说这个模型的话,它是 deepsea v 四 pro, 之后在 cloud code 桌面端的话就是要对应这个模型的,我们点击保存 这里就可以发现有了这个测试用的模型。接下来我们来配置路由功能,点击左上角的设置,点击路由,点击本地路由,点击路由总开关,勾选 cloud 这个服务地址,需要记住我们后面会用到,那我们 c c switch 的 方面就配置完成了。 那我们来配置 cloud code 的 桌面端,点击左上角三条横杠,点击 developer, 点击 configure party inference, 进入 connection, 我 们点击右上角新建一个模型,比如是 deepsafe 测试用,点击 confirm, 在 base url 这里填写的就是我们刚刚说的那个服务地址,我们粘贴一下,然后 api k 照例填写我们的 deepsafe v 四 pro 的 api k 继续往下滑,在 model list 这里我们点击添加,我们在这里填写 cloud o p u s, 注意都是小写,如果支持一照上下文的话,我们就点击打开再添加第二个模型。 如果说你只用两个模型,那基本上到这就够了。这里的 cloud o p u s 模型与这里的 deepsea v 四 pro 模型对应这里的 cloud s o n n e t 模型与这里的 deepsea v 四 flash 模型对应。如果说你还有其他需要使用的模型,那你就继续点击添加,如果没有的话两个就可以了。然后我们点击 apply locally 重启,打开 cc switch, 点击启动。然后我们问一下你好, 测试模型发现可以使用,那我们就解决了这个问题了。好了,希望能帮助大家,祝大家用的愉快。

本期视频来分享如何将 deepseek 的 vs 模型接入 cloud code, 并解锁 em 的 上下文以及 max 思考等级。我目前已经将 deepseek 的 最新模型 vs flash 和 vs pro 通过 ipad 的 方式来接入了 cloud code。 vs pro 模型在降价之后性价比也越来越高了,并且对 a 键的也有做专门的适配, em 的 上下文对于大多数人来说也更加友好。 视频内容主要分为四个部分,第一需要先安装一下 cloud code。 第二,安装开源工具 c c switch。 第三,需要购买一下 deepsafe 的 api 并完成配置。最后再来测试一下 deepsafe。 v 四 pro 加 cloud code 这套组合表现怎么样。废话不多说,我们现在开始 首先来说如何安装 cloud code。 大家常说 cloud code 经常被封号,那其实封的是拥有模型能力的个人账号,但 cloud code 作为一个单独的软件是可以正常下载和安装的。 没有订阅官方的模型,我们依旧可以使用它的框架当成是 opencloud 或者 hermes nint 这种。在他们的项目官方网站这里也有明确的说明。终端 cli 和 vs code 也支持第三方提供商。 本期视频演示的是安装 cio 版本,也就是最通用的版本。这里有一行中的命令,它支持 macos、 linux 和 windows 这几种不同的系统版本。 windows 这里分为 power shell 命令和 cmd 命令,并且 windows 用户需要先下载安装下 get, 如果没有安装的话,可以到 get 的 官方网站下载安装包进行安装。 这里复制这一行命令,然后打开终端 app 或者 power shell, 输入他们提供的命令回车执行就可以了。我这里已经安装过,所以不再演示具体的步骤。安装好之后可能会出现一个提示,大致意思是安装已经完成,但是 control 的 安装位置并没有加入到电脑的环境变量中。 这里直接复制这行他提供的命令,在终端执行一下,搞定之后输入可拷的 code 杠杠微刃来确定当前的版本号。后续使用的话,直接在终端输入可拷的命令就可以打开了, 但是你那里可能会提示不能连接官方服务。接下来我们来安装第二个工具 cc switch。 cc switch 是 一个开源工具,它能够让 cloud code codeys、 opencloud 这类的 a i a 检测,方便地切换模型。累计下载量有三百多万,在 github 上面也有五万多个 star。 它有很多实用的功能,比如一份配置同步到多个应用,支持热切换,不需要退出应用切换模型。还有用量仪表盘,能够查看你的请求数和头克用量等等。 我们在项目的首页这里有一个已发布的安装包链接,点击进去,然后在这个界面直接划到最下面。这里有很多的安装包版本,如果是 mac os 系统就下载这个 mac os 点 dmg 的 版本,如果是 windows 就 下载这个版本。下载好之后直接点击安装包进行安装就可以了。 它这个项目的说明文档也有比较详细的安装教程。第三步,到 deepstack 的 开放平台购买 api。 我们来到 deepsafe 官网,点击 api 开放平台,我这里之前已经充值了一些,在网页和 deepsafe 对 话是完全不收费的,但是想要调用 api 就 需要进行充值。他们目前没有推出类似 tokpline 这样的按月订阅的套餐,好处就是用多少花多少。 目前他们对 v 四 pro 模型打二点五折,每百万 tokens 缓存命中情况下输入是零二五元,未命中是三元,输出是六元, 这个折扣目前是到五月三十一号截止。 v 四 flash 模型和 pro 模型的价格对比可以在官方的 api 文档里查看,这里点击充值按钮,然后选择金额和支付方式。建议先小额买一笔,用完之后根据自己的实际使用情况再进行补充购买。 付款完毕之后,点击左侧的 api case, 点击创建,然后复制这个 key 的 密钥, 注意这个 k 的 密钥只能够在创建的时候查看,关闭这个页面就看不到了,如果丢失的话,就需要重新创建一个 k, 然后打开 cc switch 这个应用。我这里已经添加好一个 deepsea 的 模型了,选中这里的 cloud 的 图标,然后点击添加, 在预设供应商这里找到 deepsea, 在 api k 这里填写 k 的 密钥,然后这里需要修改一下这几个模型,可以直接参考我这个填写 默认模型就是 deepsafe。 v 四 pro 后面加上 em 是 因为之前的公告有说明,这样才能够开启 em 的 上下文,然后点击添加就可以了, 这里就会多一个 deepsafe 的 模型,点击这个按钮来测试当前 api 是 否可用。点击这里可以配置用量查询,查看当前还剩多少余额, 勾选这里,然后点击保存配置,这样的话就能够看到还剩下多少钱了,然后点击起用,就能够正常的使用可绕的扣子了。左上角有一个设置按钮,通用,这里建议打开开机自启使用统计,这里也能够查看 ai 模型的使用情况和成本。 我们打开终端应用,输入可绕的指令,那这个呢?就是 deepsea v 四 pro 的 模型,并且是一百万的上下文, 我们输入指令斜杠 context 能够查看,这里确实是一百万的上下文 tokens。 这里的默认思考等级是 medium, 可以 使用命令斜杠 effort, 然后空格后面的话就会显示哪些等级可选,这里输入 max 回车确认,这样的话思考等级就会调到最高。还有一个命令可以快速的切换模型, 输入斜杠 model, 然后回车。默认模型其实就是 v 四 pro, 我 们之前配置的 apps 和 sonata 都是 v 四 pro, 嗨酷模型是 v 四 flash, 通过键盘的上下按键来选择,选中这个模型,然后回车确认, 这样的话模型就切换到了 v 四 flash, 这里输入命令 context 能够看到它的上下文,显示是两百 k 的 tokens。 最后一部分来测试一下 cloud code 搭配 deepsea v 四 pro 到底贵不贵,干活效果怎么样。 首先说一下,它是基于文件夹的工作模式,所以你需要先通过 cd 命令跳转到你想要它打开的文件夹,比如我的项目文件夹的路径是这个,就需要输入屏幕上完整的指令回车,到了这个文件夹后,输入 cloud 的 命令来启动它, 如果路径很长的话就比较麻烦。有一种方法可以简化一下, windows 用户应该可以直接在文件夹右键从当前文件夹位置打开终端, mac 用户右键的话是没有的,但是可以直接将文件夹拖拽到终端 app, 那 当前终端打开的文件夹就是这个项目文件夹, 输入 cmd 命令,可以查看当前文件夹的路径,然后输入 cmd, 启动 cmd 的 code。 第一次打开的时候需要确认一下这个文件夹,点击 yes, 后续退出的话需要连按两次 ctrl 加 c。 这里安装一个归藏老师最近开研的一个 ppt skill, 设计是比较美观的。 来到他的项目仓库,这是一个电子杂志风的网页 ppt skill, 纯网页形式,适合线下分享,但是不适合培训课件。这个 skill 的 名称叫做归藏 ppt skill, 这里提供了多种的安装方式, 最方便的就是直接复制这一段话,然后发给 ai, 选中这一段话, command 加 c 复制,然后来到 kol 的 对话界面, kol 加微复制,然后直接发送。 kol 在 执行任务过程中会需要一些权限的许可,遇到的时候直接选中 yes 就 可以了,它的框架对于安全保护还是比较好的。 整个的执行过程我就直接跳过了这里提示安装好了触发词,就是帮我做一份杂志封的 ppt。 ok, 我 在这里输入这句话,然后告诉他要做的内容就在当前文件夹中。在当前的项目文件夹中,我放入了一个 mail 文件, 内容是关于 code 的 使用方法论,然后回车执行。他会先查看项目文件夹的内容和 skill 的 使用说明,执行过程中可能会问一些问题,根据个人的需求选择就行。 我这里也跳过过程,大概直行了六分钟左右,一共生成了九页 ppt, 并告诉了我每页的布局和内容,以及怎么操作。 ok, 我 们直接打开浏览器来查看一下这个网页的 ppt。 这是第一页 codex 的 方法论,整体的设计风格确实是比较美观的,如果是个人制作的话,可能要花费比较长的时间,并且效果还不一定有他这个好。 第二页这里的话可能会有一点点问题,下方的文字有一部分被遮挡了,后面的页数大家可以具体去看一下内容觉得怎么样。 最后再来看一下安装这个 skill 以及制作这九页的 ppt 一 共花费了多少钱。 我在做之前是九点八九的余额,刷新一下网页,那现在还有九点三九的余额,一共是花了五毛钱。这里有一个每月用量的图标,展示每个模型花了多少钱。下面也有 token 的 使用详情,包括输入和输出的具体数量。大家觉得 deepsea v 四 pro 的 性价比怎么样?

使用 c c switch 进行 cloudbox 的 使用,好多朋友不会用啊,这个 c c switch 大家入悉一下,首先在这个网站里面搜索一下这个 c c switch, 把 c c switch 下载下来,对应的安装包在这里面点 windows 这个 msi 就 可以了,安装下一步就可以, 我现在是安装完的之后的效果,第一次进入是这样,要进入这个 c c switch 的 设置,在设置里面呢,如果你没有安装 cloudbox 呢?你要把这个 应用这个插件可以点,把这个跳过,初次安装这个一定要点开,这个非常有用,好多朋友因为他没有格式的账号,所以每次要登录时候需要登录账号,这个跳过了,只用咱们国内的 ai 就 可以了。 到这里面这里面,比如说像我的这个,我其实用的 dipstick 和这个 gim, 还有 mini max 它其实国外这个我也没有使用啊,太贵了,大家可以直接点加号加号,比如说你要有一下,比如说你用小米的这个 mini 吧,小米这个 mini 呢?你去把这个 key 添加这里面把,这个一般都不会用。改啊,如果你是 tiktok 的 话,你要去搜索一下 tiktok, 在这里面补充一下,有的朋友使用的是 tokenplay 或者是 codingplay, 这里以小米为例,他的 tokenplay 或者 codingplay 里面的兼容协议是这个名称,但是 c c switch 这个作者呢?他说他自己忘写了,他写的是这个,这个是错误的啊。大家一定要把这个 play 复制一下,复制之后把这个放到这里改一下, 改下之后再把你的 api 复制里面,这才是对的。之前有朋友是写错了,他默认是有问题的,这个一定要看一下,把你的模型需要用的模型改一下,一般都是小写啊,很少有大写的。这个大家自己添一下,点击添加就过来了。 过来之后呢,想像我这样的点试这个余额,这个余额比如说你看我这个 deepsea 的 余额,呃,使用用量查询,官方把这个设为零, 你刷新一下,像我这个还剩二百七十块钱。智普的这个呢?它是我 tiktok plan 吗?我是用 tiktok plan 就 不一样,这个也是在这地方配置前用量查询就可以了,其他的注意的事项没有,因为其他我也没怎么用啊。 注意一下小龙虾,这个好像有点有一点点问题,我不建议小龙虾和爱马仕在这个 cc switch 里配置可能有这两个不太建议在这里面配置,就这个 clod, 再用这个配置就可以了,其他的不要配置 这个 skill。 点击这个像扳手一样的图标,点击之后呢,你就可以直接在这里面去安装 skill, 非常方便啊。比如说你想找一个 skill, 那 点击这个发行技能啊,要保持你的网络通畅啊,你的网络要好, 这里面才能显示你想要安装的 skill。 这个 skill 是 这样,它这个 skill 里面有个 top 上总结上的,在仓库,但是有一些特殊的,比如说我安装的我安装的 canvas 赛,这个 canvas 赛其实没有,你就要去他的网站上,他教你怎么去安装,你就搜索安装,按照他的方法就可以了, 其他的大部分都能搜到,如果搜不到的,很可能他改了名了。这个不要着急,你就去那个 github 上去搜索一下,是这样,你也可以从这个 ip 上去安装导入已有。都可以啊,发现技能就可以直接点击安装,这就安装出来了。这个比较方便,我建议新手小白直接在这里面去找能下载的就可以。

现在有很多朋友问我就是 cologold 怎么样接入本地的大模型?今天给大家说一下本地大模型是怎么接入的?然后有两种的方式,第一种方式是通过 cc switch, 这个之前的视频也给大家说过 cc switch 怎么使用的。 然后第二种方式就是我们通过欧莱玛装了本地大模型之后,直接呃对接我们的,通过 setting jason 的 文件直接对接我们的 cologold 的 文件。先说第一种方式,通过 cc switch 来对接本地大模型, 我这边的 cc switch, 因为我之前是通过对接了三种方式,第一个是我是用了 deep seek 的 deep seek, 然后第二个就是用了字节的火山方舟 coding plan, 然后第三呃那个 cloud official 我 没用,因为我没买它官方的 a p i。 然后第四个就是本机的 alama 模型,我也安装了这三种方式都跑通了。先一一给大家说一下,呃, 先说怎么样对接本地大模型吗?然后本地大模型其实非常简单,就是大家在这边添加一个新的供应商,然后新的供应商之后,这里面的填写方式像我这样填就可以了,就比如呃我们的供应商名称随便填一个欧拉玛,然后这边呃上面的标志也可以随便选一个, 因为我这边随便选一个,他就是欧拉玛。然后呃官网的链接,因为我们欧拉玛是本地的模型,这边是填空的,什么都不用填,这个 api k 的 话也不用不需要随便填,大家只要填欧拉玛就行了,你随便设置一个就行了。然后另外就这边比较关键,这边就是需要填写一个本地的端口,然后这个端口是什么意思呢?也给大家说一下。 它这个 http 就是 指的是本地服务,然后 local house 就是 我们自己的电脑嘛,它始终指向我们本地的 ip, 一 二七点零点零点零点零一嘛, 然后这个一一一四三四,它就相当于我们本地的端口号嘛,就是我们奥拉玛呃,本地运营大,本地大模型的工具,它是默认这个端口的,所以就是当我们安装奥拉玛之后,会提供一个 api 服务来监听这个端口,所以我们这边要设置呃,在 cc switch 里面要设置这个东西,就它的是请求地址, 这个就是像这样原声的填就可以了,认证自盾也是这个。然后另外这个这边模型的话,就是我们本地安装的模型,你要看一下我们本地安装了哪些模型,比如我这边就是运行了奥拉玛里斯,这边可以看一下,比如运行这个,他这边就我我之前安装了四个模型啊,就是千问三点五九 b 的 千问斯,呃,伽马寺那个 e 四 b, 然后还有干妈四三十一 b 以及干妈四 e two b。 因为我的只有一个独立显卡,就是八 g 的 显存,所以我只能一般是用切分三点五和 e two b 的。 然后这边的设置就是直接把你需要设置的模型,比如复制两过来就行了,然后底下这个东西就会自动生效, 保存好之后就行了,然后我这边就会在使用中给大家看一下效果。我这边就刚问他们,我是他什么大模型,他其实就是干妈四 deep 呃,谷歌 deep money 的, 然后我们可以切换模型的,就是我刚这边安装了是千万三三点五九币和干妈四 e two b 嘛,然后这边就可以选择嘛,你可以选择不同的模型, 我这边就可以切换到切切换三点五九 b 这边之所以能切换是因为我这边只设置了这两个模型,你看只设置这个,当然我这个也可以设置一四那个一一一 four b 都可以, 这是本地大棚型的设置,这是呃,我觉得通过 c c c v 是 最方便的,我们也可以切换到 deepsea, 我 这边切换到 deepsea, 然后就可以很方便的从本地切换到云端了。我就说你好, 它这边是因为呃切换模型之后需要重启一下 cloud, 我 们重启一下就行。 比如我这边重启一下,它就会呃启 用我们的 dips pro, 很 方便的一键切换。然后这个前面就是我之前装的 cloud mail 那 个插件,就它每次启动它都会查取呃最近五十次的 通话内容,就是回忆一下我们之前的那个记忆,这个我就记个记忆插件,非常好用,它是自动自动启动的,然后它上面有你的新增功能啊,还是重构啊,还是改变,它都会给你标出来你之前做了什么样的东西。 我觉得这个非常好用,然后比如它当前它就会告诉呃 vr obv observation 在 这个端口就相当于在这个端口,这就跟我们刚刚那个呃奥奥拉玛端口不一样了。 然后给大家说一下,就是呃关其他的大模型厂商他们的 apis 怎么对接的,其实也很简单,就是我们的 a, 我 拿 deepsea 举个例子,这边顺便说一下,比如 deepsea 这边,他的 u i 只需要填 u i l 啊,就是我们的 u i l 就是 open i 或者 osrogic, 因为 cloud code osrogic 吗?我们只需要复制这个链接,把它填到这就行。然后 apikey 就是 我们自己设置的,这边主模型的话就是 v s pro flash 三点二、三点三点二都可以, 因为马,因为那个三点二后面不是要七月二十号要弃用了吗?就是之前的 chat 和 reason, 一个是 syncing, 一个 on syncing 的 模式,在里面 ipikey 只要设置一下就行了。 然后还有一种方式就是通过线上的,这个我觉得是同样的道理啊,大家就是相当于之前的那个接收文档,就是它这边也会写好的,就是主要就是这个,呃, 这个 anastropic base u i l 给它填好就行了。然后这个这个 token 也是随便填的。然后这个模型就是我们刚设置的那些模型,其实是一个道理,这边就不细说了。

大家好啊,那我是老王啊,评论区好多人问啊,国内是不是不能用 cloud 啊?这个问题不能简单的回答,是能还是不能,首先要分清三件事啊,这个 cloud 还有 cloud code, 还有 cloud cooke 的 三个是不一样东西啊,就大家所说的 cloud, 它是个有官方网页版,还有官方 a p i 是官方服务啊,但是中国大陆是不在它这个 cloud 母公司 ansapic 的 这个官方支持地区啊,所以说直接使用啊,是有门槛的。这 cloud 的 模型又分为这 sonata 啊,四啊,点七是最新的,但是 cloud code 它其实是一个工具,还有 cloud code, 它是在你电脑终端的 呃,一个软件更像一个车,就是一个车壳儿,但是 cloud code 里边它可以 对接不同的这个模型,就是我们说的发动机啊,就说 cloud code 其实是在国内是可以用的,可以接入啊,同的模型,就如果说你接入这个 cloud 模型 啊,肯定是有一定门槛,但是你却可以接入其他的模型,就 mini max 啊, sick 还有这个 kimi 啊,江问这些啊,都是可以接 cloud code 的。 更准确的说啊,国内用户不一定能直接稳定地用这个官方 cloud 的 这个模型服务, 但是它还是可以用这个 cloud code 的 这些编程工具流的啊,不是说你把这个里边的这个动机给换成国内的这个型就行了啊,关键看你背后是用什么模型,大家明白了吗?啊?

还不会给 cloud code 配置 deep seek 大 模型吗?我来教你,无需其他操作,一键完成。就是用这个软件,打开之后点击右下角的加号,点击 code 图标, 这里有很多的代码工具,我们选择 cloud code, 在 模型这里就可以选择 deep seek 了。选择好模型之后,再选择你的工作目录,最后选择终端,一般用 command 这个终端点击启动, 这是一个权限问题,回车选择 yes 就 可以了,这样就配置成功。用的模型是 deepseek 杠 v 四杠 pro 的 模型。 deepseek 真的 划算,用了二十九万的 token, 共计花费三块钱。觉得有用的话记得点个关注,我会持续更新 ai 相关的视频。

上期视频,我们把 d p c v 四 flash 接入桌面版 cloud, 出现了很多问题,比如回复速度慢,上下文只有两百 k tokens, 有 点笨笨的 windows 系统频繁报错。那么这期视频我们换个方法来对比一下, d p c v 四 pro 接入 open code 和使用奎艾把 d p c v 四 pro 接入 cloud 之间到底有什么区别? 首先打开桌面版 open code 的 左下角,点击设置按钮,服务器,我们选择提供商,划到最底部,点击查看更多提供商搜索 d p c, 我 们输入 d p c key 的 a p i 密钥,点击提交,打开模型列表,就可以看到 d p c k v 四 pro 了。我们首先还是发个你好,测试一下回复是否正常。 ok, 我们再来测试一下代码能力,因为我给他的是一个空文件夹,他找了一圈发现没有可用的,这里很详细的询问了我的需求。他写了一段时间,但是中途这个游戏就直接跳出来了,我真的很爱玩扫雷,玩上瘾了,这个代码效果很好,我很满意。再写一个贪吃蛇的吧, 记住这个时间。哎呀,这太快了,用时一分钟,我刚准备计时,人家已经写完了,研究一下怎么玩。可以了,我的游戏能力一如既往的厉害。再测试一下大家最关心的 web fetch 能力, 也成功了。再看看上下文,我写了一个脚本,使用了 needleland haystack 二分查找,本来是想测模型接入 open code 后的 实际上下文为多少,但是 deepsea 不 解了,我的话吭哧瘪肚的,误打误撞的,勤勤恳恳地给我测出了 deepsea v 四 pro 的 模型上下文。这一操作花了我很多的 token, 让一向善于反省的我陷入了更深的反省,看来我以后要表达得更清晰。我这里测出来 deepsea v 四 pro 的 实际上下文 a p i 硬上线为一百零四万八千五百七十六 tokens 官方说 e m。 还是谦虚了, open code 说自己没有硬上线,那就说明我们可以随意配置,主要还是取决于模型上下文长度和代理实现。让它改一下,我建议使用 open code 的, 改完配置之后再使用 code 验证一下是否成功。 ok 了,百万上下文改。 首先我们打开终端,输入 collog, 点击回车,输入斜线 model, 点击回车,进入模型列表。我们选择 deepsix v 四 pro, 再点回车继续。你好,测试 回复正常,再用这个链接测试下豌豆飞起功能。我来说句公道话,这里确实有点慢,所以我加速了。针对这一情况,我也问了帮我配置的 codex, 这里只代表我本机存在的问题。 ok, 返回正常。 接下来又到了我最喜欢的游戏环节,让他也写个扫雷游戏, 可以看到非常快,用时一分四十一秒,并且给我本地链接,可直接打开,把链接复制到浏览器运行成功。非常细节的前端,我并没有讲细节,但他自己给我增加了初级、中级和高级, 再写个贪吃蛇的代码,又是一分五十六秒,打开玩一下,又重新开始暂停和最高分,依旧细节怪。 重启一下, codex 刚刚帮我在 codecode 中配置好了视觉识别的 m c p 工具,并且增加了用户级快捷命令,我们来试一下。发图片的时候忘记使用快捷命令了,结果很意外, codecode 竟然自动使用了, 突然有种老母亲看孩子把抄纲题做出来的欣慰感。再试一次又一次,自动使用了 read file i m g, 稳定发挥,两次用时均为二十七秒。 工具我已经在 github 上开源了,项目名字为 mcp vision webbridge, 第一个就是点击扣载,下拉列表后选择 download ip 可直接下载,如果帮到了你, 请帮忙点个 star 让更多人看见。另外我已经打包好放到评论区了,网络不好的宝贝可以获取。我让 open qd 自己配置我们的这个 mcp 识图工具,因为直接拽文档没反应,我这里把文件地址给他,教大家一个简单的方法, 直接把文件拖进终端,自动变成文件地址,再复制给他就好了。我把 ip id 要发给他之前,是希望他能像 codex 那 样弹出个输入框或者我自己粘贴到文件里的,但是他拒绝了我,并且让我直接发给他,记住他的这句话,后面考结果配置失败,还把自己弄荡机了。我使用 cloud code 修复了下 这里,他问我使用方式一还是方式二,我看错了,误选了方式一。结果这老 a 健特直接用了我的 key, 拿我刚刚给他配置 m c p 的 key 去跑 ko 帮我完成了任务。看起来他好像挺聪明的,但这种方法并不安全,踢很容易被泄露,因为这个工具并不兼容 open code 的。 可老弟帮我重写了个启动脚本,强制 open code 的, 做实图任务时走。这个工具终于成功了,但是只能拖拽,不能复制粘贴。把这个方法写入记忆里,然后我们再试一次, 重新打开一个窗口,看看是否成功。 ok, 工具很稳定,该方法仅是配麦 windows, 慎用。 open code 的 配置方法我写成 md 文件放到评论区了,建议大家使用另外的 agent 来配置 open code 的, 否则容易宕机。 agent 要 key, 必须要手动填写,不要直接给。 接下来回答下大家最关心的问题,上下文如何真正生效?首先升级最新版 clock code, 然后模型名后加 em, 再清理就变量。最后查看运行日记。再次验证 桌面版 open 扣的真的让我一愣一愣的,嘴上说不会出现在任何脚本或输出中,软头就偷偷用我替做任务, 太不省心。当然除了这点,其他都没什么大问题。代码上,细节来看, block 扣的处理的更好,工具使用也更灵活,大家可根据实际场景选择接入方式。以上就是本期视频的全部内容了,记得点赞关注,咱们下期见!

家人们谁懂啊?你们有没有遇到过用 vsco 的 的 c c 插件连 mimo v 二点五 pro 时发图片模型却识别不了的情况? 后来翻官方文档才发现原来图片功能只对 mimo v 二点五和 mimo v 二安利,这俩模型开放, pro 版本压根没着权限。 不过借鉴这个博主给 cloud 装而易得,有隐秘值技能,不用画模型也能识图。对话框输入安装 skill skill 网址,在评论区获得 所有弹窗,按 es 确认,等待安装完成。安装完成后,按视频打开配置文件地址,将 off token 替换你的 api key, 一 切就绪后,复制图片地址对话框,输入图片地址理解图片, 可以看到 cloud 已经使用 sq 识图了, 模型居然说这是喜羊羊,真的绷不住了,哈哈,所以建议大家还是谨慎使用。你们有没有遇到类似的翻车现场评论区分享一下呗!

on cloud 桌面客户端 co work 支持接入国内的大模型,也就是说你不需要有他的账号,你也可以去用他的桌面客户端啊。用这种方式去使用 cloud code 是 不是会比用终端命令行要爽很多?怎么配置?点赞收藏一下,留出一步步的来演示。点开顶部菜单,有个 help 帮助选项,选择 troubleshooting, 这里面有个很关键的打开开发者模式,选中同意,这个时候它会重启这个客户端,重启之后你会发现上面有个很关键的打开开发者模式 third part info, 默认选中 get away。 这里面就是你的第三方模型的 u r l 和 a b i key 这块大家使用 c c 或者龙虾类都很熟了,都会有对应的 base u r l 我 用的是小米的模型啊,贴进去,对应的 key 贴进去,然后关键这一步啊, model list 要把你的模型的 id 要加进去,这一步不做的话,你也配置不成功,有时候用的是 miimo。 二点五好应用, 重启一下,好,这个时候你就会看到这个客户端可以正常执行啦。这个是适合小白的 call work 模式,默认选的是 demo 模型啊,这个适合给刚刚上手的用户,有这么一个图形界面,去做你的一些任务,去做你的 skill。 但是如果说你已经习惯用 cloud code, 比较习惯命令行终端的模式,左上角可以切换成 code 模式,你看这是六叔 使用了一个记录用的模型,这个模式就跟你用终端是一样的,适合有一定基础或者适合编码的那些人,这个也比终端的体验感要好很多。确定好你的一个工程目录文件,这里面去选择它的模式 啊,计划模式授权的方式,你看可以正常使用啊,它作为客户端的其他的功能也都是可以去用的,直接去 create new skill 去链接你的本地的 app。 是 不是让我们 c c 终于有一个官方的格式化途径界面了,爽不爽?好了,按这种方式配置一下吧。我是油叔,关注我持续风靡的 j 酷白了个白。

简单三步,用上 cloud 桌面端,并接入最新的 deep sec v 四 pro 模型。桌面端操作简洁,还不用担心网页端载高、响应慢以及账号封禁。接入 deep sec 最新大模型的优势是中文表现好,成本相对低,适合写文案、写代码和做内容分析。接下来跟着我的步骤走三步就能用上。 第一步,下载安装 cloud 桌面端,进入 cloud code 官方网站,根据自己的电脑系统选择 mac 或 windows 版本下载安装。 安装完成后直接打开 cloud desktop。 第二步,更改 cloud 桌面端设置,打开 cloud desktop, 在 顶部菜单栏依次选择 help, 帮助 troubleshooting 故障排除。 enable developer mode 启用开发者模式, 开启后,软件会自动重启。重启完成后,顶部菜单栏会出现一个新的选项,点击 developer 开发者 configure third party inference, 这时会弹出第三方 a p i 配置面板,然后进入 debug 平台,配置 a p i key。 没有账号的先注册账号, 然后点击控制台令牌管理,添加令牌,创建 api key 并复制保存。回到 cloud desktop 的 三方 api 配置面板,把刚才复制的 api key 填进去,选择 xapkey, 填入平台上支持 antropic 协议的模型 id, 例如选择或填写 deepsafe v 四 pro 模型,然后保存配置。 配置完成后重启 cloud 桌面端,重启后可以直接测试,比如输入调用 deep sec v 四 pro, 帮我写一段视频脚本,如果能正常返回内容,就说明接入成功。大家也可以像我一样询问是什么模型来测试。注意,如果你切换了 v 四模型, 但它还是会回答自己是 opus 四点七,不必担心,因为这是软件内置的提示词。如果实在不放心,也可以在平台的使用网址里查询实际的使用模型以及自己的用量。

club 的 桌面端,从此不管是 co 的 模式还是 co work 模式,我们随便可以用了,再也不用担心 club 的 会封我们的号,也不用管它具体怎么认证。接下来啊,我会用这条视频手把手带着朋友们,用简单的三步,把 club 的 桌面端的模型换成其他的任何模型。 这几天体验下来啊, deepsea v 四 pro 真的 几乎和 opus 四点六一样能打。如果朋友们之前已经装过 club 的 桌面端,那我们先要退出登录,每 装过的话呢,安装一下就可以了。然后呢,我们保持未登录状态,点击菜单栏的 help 按钮,再点击这个 troubleshooting 按钮。在弹出的二级菜单中啊,点击这个 enable developer mode 按钮,然后呢,再弹出的菜单点击 enable, 这样我们就打开了它的开发者模式。这个时候啊 cloud 会 重新启动,等它再次启动后,啊,菜单栏就会多出一个 developer 按钮,这个时候呢,我们点击这个按钮,在弹出的菜单中点击这个 configure third part 按钮, 这个时候呢,就会进入到这个页面。这里我们要选择 gety 模式啊,然后我们要填一下 gety 的 best url, 这里其实就是我们要填写的模型的 best url。 那 这里呢,我用 deepsea 的 v 四 pro 给朋友们演示一下。不过 deepsea 有 个遗憾哦,就是图片理解它一直没有,所以呢,我们如果配了 deepsea 模型的话,发截图它是无法识别的。那这个问题呢,我们如果配了 deepsea 模型的话,发截图它是无法识别的。那这个问题呢,我们输入这个就可以了, 因为这个是兼容 astropac 的 best url, 然后下面 getaway apikey, 这里我们就填写我们自己的 deepsea apikey 就 可以了。然后呢下方这里的 modlist, 因为现在 deepsea v 四有对话和推理两种模型,对应 flash 和 pro 这两种模型,所 所以呢,这里我们要填一个 deepsea 微四 flash, 那 下面这个开关我们可以点开啊,点开它呢就是支持一兆上下文了,下面呢我们点这个按的按钮,再添加一行,我们填 deepsea 微四 pro 开关呢,也可以打开啊。最后呢,我们点击这个按钮, 那可乐会再次重启,重启完成,打开后啊,就是那个熟悉又陌生的界面,看四个 deepsea 的 模型,我们现在执行一个任务,看看效果怎么样啊。

哈喽,朋友们,之前分享了很多期关于 cloud code codex 的 视频,但我发现评论区讨论最多的就是国内怎么使用,确实天下苦, cloud code codex 就 已 光网络这一关就能劝退一大半人,账号支付节点每一步都在折腾,更别说团队场景下每个人单独搭一套环境的成本要有多高了。后来我自己也折腾过几种办法,中转 api、 进项站、买海外卡,要么不稳定,要么一到团队层面就抓掐。 前段时间试了一个叫 evo ai 的, 但是目前我用着比较顺手的,它里面直接内置了 cloud code 和 codex, 打开就能跑,不用你再去配账号,调整网络。同时它也提供 cloud gpt、 gmail 的 api 中转,自己接到别的工具里也行。 一个平台覆盖了两种方法,但我今天想分享的是他新出的这个团队管理功能。先说第一个,安人分配托客额度,后台能看到团队里的每一个人,然后给他们单独设置额度。核心开发可以多分一点,像做支持、做业务、做产品的可以少分一些,或者按项目走也是可以的, 用完自动停,不会出现一个人把全团队额度刷光的情况。以前的订阅制是什么体感?整个团队共用一个上限,根本不知道是谁在用,用在哪,超了就超了,事后也没法追溯。 现在每个人的成本都能够算到 top 这一级,账算的清清楚楚。第二个,也是我个人最看重的支持数据采集,平台会记录每个成员每天用了多少 top, 问了什么问题, 打开后台你就能看到这个月谁是众多用户,谁压根没用过团队整体的 ai 使用率是涨还是在跌,那这数据拿来做什么?注意,这不是监控,是判断,判断谁可能需要一对一的使用培训,判断哪个岗位的 ai 渗透率还偏低,判断我们在 ai 工具上花的钱有没有真正落地到产出上。 所以 ai 时代的团队管理不能再靠感觉得有数据来支撑。再补充一点,统一入口的额外价值对团队节奏影响其实非常大,新人入职当天就能够开工,不会因为环境还没配好卡上个两三天 团队所有人用的都是同一套工具,沟通和节奏的语言也是统一的。最后我总结一下, vivo ai 比较适合三类人,第一,技术团队负责人或者老板想把 ai 在 团队里推下去,但手里缺一个统一的管理后台。 第二,身在国内,想让团队直接用上 cloud 的 gpt jimmy, 但不想每个人都去折腾环境。第三,想精细化控制成本,按人分配,而不是大锅饭一个十字。 当然了,个人用也行,毕竟谁不会喜欢一个 app 里面直接能用预三加的工具呢? ok, 那 以上就是关于国内使用 cloud code 的 codex 的 分享,希望能对你有所帮助。我是布鲁,我们下一期视频再见。

你的 cloud 的 桌面端,你是不是还在用 office 四点七的这样的模型去跑?一个月开几十美金的套餐? office 四点七确实强,但是它的额度也是真的不够用啊,每次没对话几个轮次就提醒你又得升级点套餐要充值额度了。 我们看一下现在的国产模型,其实,呃,像智普的 glm, 五点一的,刚出的 deepsea 的 v 四版本都很强,都很能打 他,他们的能力其实也不是说比咱们海外的一些模型会有多少差距,但是我觉得有个很核心的点, cloud 的 这个桌面端的应用用起来真的非常的丝滑,非常的爽, 我们现在其实缺的就是这样的一个交互的界面,能够去搭载我们现在的一个国产的模型。但现在我想告诉你的是, cloud 的 桌面端的界面他也能接入我们国产的模型了, 官方开的门啊,不是什么黑科技,也不是什么其他的一些插件,在 cloud 的 桌面端加入了开发者的应用,你现在可以去接第三方的平台了。首先我先教教大家怎么去配置 啊? cloud 接入第三方的模型系列,配置也很简单,我们在这个开始菜单啊,点击它的这个 hell 开,打开它的这个开发者选项, enable developer mode 好, 点开以后,好,我们直接点第一个 好,这个点完之后他就会进行一个重启,我们等待一下他重启完成,我们可以看到这里就出现了一个选项,我们这个地方就可以来配置他的模型了,点击这个,然后他就会出现一个弹框啊,一定要选择这个 get away。 然后这里呢? 啊,我用的是 deepseek, 我 们可以去 deepseek 的 api 开放平台,然后去找到它的这个接口文档,这个里面就会有它的 u r l, 我 们把这一段啊,这里一定要是是用 s r b 的, 我们用这个把它复制过去, 然后自己在你的 api key 里面去新建一个你的 key, 然后我们滑到下面, 在这个地方添加一个你的模型 id。 啊,这里我们还是一样的,在刚刚的这个 deepsea 的 官官方的 a p i 文档里面,然后去找到它这个模型的名称,这里我用的是 vs 的 flash, 它是性价比比较高的一个,大家也可以去尝试一下。然后这里有个一照双眼纹的一个选项,大家也可以把这个打开 好,然后我们点击下面这个按钮,然后他就会重启,重启以后我们的模型就设置好了。好,我们试一下,在这里我给他发送一个,你好好, 可以看到他其实很快就可以回复我们,然后我们再来试一下,问他你现在用的是什么模型, 但是在这个版本里面啊, deepsea 他 现在还只能是一个语言模型,他没有这种视觉模型的能力。 所以说我们在这个课堂的桌面端,如果你给他发图片,他这里可能是识别不了啊,比如说我现在随便截个图,然后截个图我就发给他,我就问他啊,你这个告诉我这个图上显示了什么内容 啊?它还是识别不了这个模型。如果你想有一些图片识别的能力,我们可以去选用一些其他国产有视觉模型的 啊,同样的接入方法还是这套流程,然后也可以接到我们科罗拉的桌面端来应用,我现在用的是 deepsea 的 v 四啊。最值得提的一点就是 deepsea 的 v 四它的回复速度真的超级快, 而且你再也不需要模仿上网了。总结一下说 cloud 的 桌面端的应用,它现在不再是 cloud 专属的一个桌面端的应用了,而是一个能跑所有大模型的一个 a 级的平台。所以说国产模型有了一个更好的载体,我们也有了更多的选项。

来看一下 cloud code 的 一个全教程,基础的认知定义的话,它是 antiphic 公司二五年二月推出的原声端的一个。什么 原声终端的 ai agent, 简称 c c cloud code 嘛?嗯,它的一个核心原理就是大模型的循环 l l m 的 一个 loop 啊。 l l m 那优势的话是本地运行的,而且它的一个优秀的 harness 的 一个工程控制,控制的工程适用的场景在于编程的开发、文案攸写、资料整理、数据分析等脑力的工作。适用的场景是编程开发、文案攸写、资料整理、数据分析等脑力工作 啊。第二第二点呢,就来看安装和环境的配置。安装方式,命令行,命令行就是用这个电脑的命令行来安装,或者是 ai 来辅助安装。环境搭配可以去搭配,比如说 curson agent 一个 ide, 那 agent ide 是 什么意思? aggieter integrated development environment 智能体的一个集成开发环境, ide id 一 对 𠲎 集成,呃,集成集成 development environment 集成开发的一个环境是二五到二六年 兴起的一个新一代 ai 原生的开发工具,把人工智能从被动的代码助手升级为主动的自主合作伙伴,彻底改变了软件开发的一个工作方式。简单来说的话,就传统的 id 是 你写代码, ai 帮你补起 补全,而 agent ide 的 话是你说要干什么, ai 会帮你完成整个开发的流程,它内置了具备自主决策和执行能力的一个 ai 智能体,能够理解你的自然语言的需求,独立规划任务,修改多个文件运行终端命令执行测试、修复错误,甚至提交代码和打开 pull request, 整个过程只需要你在关键节点进行审查和确认。 那它与传统 ide 的 本质区别,传统的 ide, 比如说 vs code, 它这个是吧? ai 的 定位呢?就是侧边栏的插件是被动的响应, agent ide 是 核心架构,主动协助的工作方式是 开发者逐行去编辑。 ai 提供一些建议,那我们 a 证 id 是 开发者描述这个目标, ai 直接去执行任务能力边界单文件的一个代码生成补缺,而 a 证 id 它是多文件的重构,全流程的自动化。开发者的角色是代码的编辑者。那我们 a 证 id 里面是 需求的定义者和结果审查者。上下文,理解有限的上下文,那我们这里用的是一个完整的代码库和项目架构的理解关键能力特征。真正的 a 政策 id 必须要具备以下的核心能力, 一、目标导向的自主性,理解高层次的开发意图,无需逐行去指令。二、任务规划与分解,将复杂的需求拆分为可执行的子任务。三、环境交互能力, 操作文件系统终端版本控制外部的 a p i。 四、自我修正能力,运行测试,解读错误的信息,迭代,改进代码。五、常上下文,内个处理,理解整个代码库的结构和依赖的关系。主流的 agent id 的 工具,截止到二六年的五月, 市场上主流的这个工具是包括了 cursor 是 市场占有率最高寄予 vs code 的 构建的,那上手门槛是最低的 windows, 这都没听过。 然后这是什么?大大型的代码库和企业级的文件? jet brain ear, 这个是 什么?隔离式的工作空间, a w s 的 一个规范驱动模式, google 的 anti gravity, anti gravity 的 话它是反重力的 google, google 这个听过就支持多个, 最多支持五个 a 阵的并行工作生成,可验证的交付,还有是字节的。这个 tree 的 tree 是 国内版全部功能免费支持自定义的智能体的一个创建,所以这个 cursor 和这个什么对吧?啊? anti gravity, 还有这个 tree, 它是自定义智能体的一个构建,它可以干嘛?它是它其实整个是说智能体的集成开发环境,就本来是你自己写代码,现在你只要告诉它需求,然后你去审查结果就 ok 了。 然后模型的配置的话是官方模型的一个登录 cloud code, 它有官方的模型,国产的一个模型的话,比如说 deepsea 这些是国产大模型 啊。基础初步化的一个设置的话,包括了主题的选择,安全配置文件夹的一个信任,安全配置的话你是完全的相信它,还是说你在中间的话要进行确认?三、基础使用权限模式、权限模式 plan mode 是 计划模式、默认模式、自动编辑模式、无确认风险模式,有计划模式、默认模式、自动编辑模式和无确认 分险模式,它就其实就是给它的权限,嗯,是高还是低?交互的方式包括了文字对话,然后 at 文件,发送图片斜杠命令就是怎么去, 嗯,给自己就是说给他下命令,它是包括了文字文件,还有说图片斜杠命令,常用的斜杠命令就是一个斜杠 model, 斜杠 斜杠 b t w 斜杠 simplify, 斜杠 help, 它就是 model 模型 b t w simplify 就 给它简化一些自己的一个命令, help 执行的命令,心中端运行 叹号,前端运行, control b 的 话,它是一个后端后台运行,心中端运行前缀运行,还有就是一个后台的运行 管控的技巧的话,回滚的功能,双击是退出,然后还有这个 re, rename 版本的管理,呃, get get 的 一个存档提交和回滚。上下文管理可以怎么样子?上下文因为有些太多了,你可以给给它进行压缩一些信息,不然会消耗很多的客户坑。 compact 压缩斜杠,它不是说命令吗? clear 就是 清空斜杠。 contact contest, 它是一个呃,对对比, contact contact 它是一个对比查看账比,然后 对话恢复的话, resolve, 还有 cloud cloud, 它继续进行对话个性化的定制。首先第一层的话,它是一个 cloud cloud 的 一个三层。记忆的话首先是大局,大局的话是通用的规则,对所有的项目都生效,就相当于一个基础的设置 项目级项目专属的规范,可以团队共享文件夹及就指目录特殊的进行规则。 auto memory, auto memory 它是自动记忆,去记忆一些什么东西,它会在你就是在操作的过程中,它会记录你的用户习惯,反馈项目进度。外部资源 操作就是可以开启,可以关闭,还可以去查看记忆和删除一些记忆,自定义文档,比如说品牌规范语言的一个规范。 六、高级拓展功能 skills 就是 一个技能分类,可以分为知识型,流程型,工具型,混合型 skills, 它有这些分类知识流程工具,还有混合型安装,手动放置,还有 final skill 的 一个辅助,创建 skill creator 的 一个辅助外部连接工具 m c p 就 ai 与外部服务器的一个转接, c l i 的 话是命令行工具,高效去调用外部的功能。 m c p 是 ai 与外部服务的转接。 m c p 是 什么? model context pro protocol, 它就是一个 model context protocol 模型的上下文协议,它是 ai 智能体时代的一个行业标准协议,被称为 ai 世界的一个呃, usb c 接口,也就是刚才问的 ai 就是 agent ide 背后最核心的一个技术之称之一。 m c p l cloud 的 子公司 antopik 二十四年一月推出的开源的标准, 它解决了 ai 发展史上一个关键的问题,就让 a 任何的 ai 智能体都能即插即用地去连接外部的工具、数据和服务,而不需要为每个工具去编辑定制的集成代码。解决了什么问题?在 m c p, 它就相当于一个 usb c 的 一个接口, 那就是在诞生之前的话,其面临着 ai 工具,其实面临着呃嗯 n 乘以 n m 的 一个困境, n 个不同的 ai 应用,比如说 cloud, gpt、 酷 sir v s code, n 个不同的外部工具 github 然后就比如说这个 stack a w s。 结果就是需要开发 n 乘以 m 个独立的一个适配器,成本极高,而且难以维护。 m c p, 它通过统一的标准接口把它这个问题简化为 n 加 m。 只要 ai 应用 支持 m c p 的 客户端工具,支持 m c p 服务器,它们就能自动地互相连接,就能自动互相连接。核心的架构与三大功能 m c p 采用客户端服务器的架构, 然后它们为 ai 的 话提供了三类标准化的交互能力。首先第一个是 resource 资源,让 ai 读取外部的数据文件、 数据库 notion 等界面 tools 就 工具能让 ai 去执行操作运行终端的命令,调用 api, 发送邮件等。 some prompts 就是 一个提示,呃,提供预定制的提示词模板,引导 ai 在 特定的场景下更好地工作。与 ai agent ide 的 一个关系,那他就是之前就问这 agent ide 它是一个 mcp 对 吧?传统的 ide 它是只能在有限的上下文中去生成代码,那现在的 agent ide 呢?它 ai 可以 理解整个项目的结构,读取任意的文件,运行终端命令,测试错,测试执行这个测试,修复错误,甚至提交代码和打开 pr。 截止到二六年的五月,所有的一个主流 agent ide 的 话,都能够原生支持 mcp, 而且有庞大的 mcp 的 一个服务器生态的系统几乎覆盖了覆盖了所有的一个开发工具和服务。 c l i 的 话全称是 command line interface 命令行的界面是最古老最核心的计算机的交互方式之一, 一些通过纯输入就输入纯文本的命令来控制计算机来执行任务,没有图形的按钮、菜单和鼠标的操作。在二六年的技术语境下, c l i 的 话,它就是命令行的一个界面,没有被淘汰,反而因为 ai 智能体和 ai ide 的 兴起,成为了最强大的开发工具接口。核心概念对比, c l i 和跟 g u i graphical user interface 图形界面, 图形用户界面是相对的概念。首先这个命令行的界面交互方式就是文本,那这个图形用户界面的话是要点击拖拽图形元素,图形的一个元素 啊,学习曲线的话,陡峭,需要记忆命令,那这个是平缓的,直观易懂,执行速度极快,几乎没有额外的开销,较慢,需要渲染。页面 自动化能力极强,可以脚本化,批量执行,即有。就图形用户界面的话是较弱,难以自动化,远程操控,原声支持带宽的占用极低。 图形用户界面它是依赖远程的,桌面,带宽要求高。简单来说呢, g u g u i 图形界面, 图形用户界面让用新手更容易上手。 c l i 的 话是命令行界面,让专家效率倍增,为什么开发者离不开 c l i? 首先是极致的效率,熟练后一条命令就能完成 图形界面里面的十几步点击的一个操作。二、可以自动化,可以将多行命令写成脚本,一键执行重复的任务。三、远程控制,可以通过 s s h 在 全球任何地方都控制服务器,这是这个什么图形用户界面没有办法比拟的。 四、资融资源占用低,在服务器、嵌入式设备等资源有限的环境中是唯一的选择。五、工具生态,几乎所有的一个开发工具,服务器的软件, ai 的 一个工具都优先提供这个 c l i 的 一个接口,每天都在接触的 c l i 工具,系统自带的,比如说这个, 嗯, windows 里面 command command power shell, 还有一个是 windows 的 一个 terminal power shell, 这个是很常见的开发必备, get 的 话是版本控制,所有开发者每天都必备的。 然后 python 的 话,包管理器,还有容器管理,集训管理, obsidian 的 一个命令行的启动工具,以及这个 cursor cursor 的 什么?比如说 agent id 的 命令行的接口, 命令的基本结构, c c l i 的 一个命令的基本结构,一条标准的命令,它由三部分构成,命令选项,参数。命令的话就是要操作的名称,比如说 git git 啊,版本控制,对吧?选项,它是以这个开头修改命令的动作,比如说 git clone depth one, 对 吧?然后再就参数是命令执行那个对象,比如说文件的路径, url 名称等势利害,比如说这个 git clone, 还就是一个网站, 命令是这个 git 呃子,命令就 clone, 然后再参数的话是这个网站 c l i 跟 ai 呃 ai 这个 agent id 的 一个关系, 这是最需要了解的一点,也是 c l c l i 在 今天就是一个叫什么命令行工具,对吧?命令行界面,命令行界面在今天爆发的原因,因为 ai 完美决定 去解决了 c l i 的 最大痛点,需要记大量的一个命令和参数。现在你不需要记住这个 get reset hard 这个 had 是 什么意思?只需要告诉 agent i d e。 撤销我上一次的提交,它就会自动生成正确的一个命令行界面的一个短 命令行界面的命令并且操作。而你之前问的这个 m c p 模型的一个上下文的协议跟 ai ide, 本质上它都是通过这个命令行的命令行的工具来跟计算机交互的。 m c p 服务器很多都是通过 c l i 命令暴露这个工具的能力。然后 agent ide 的 核心功能呢,就是自动生成并且执行终端的 c l i 就是 命令行命令行这个界面的一个工具, 它的一个命令,几乎所有的一个 ai 智能体都优优先用这个命令行界面来操控文件系统,就比如说我们要关机,对吧?关机的话你可以在那点点击关机,也可以用这个命令行工具直接打开这命令行工具,然后输入这个什么关机的这个 指令,然后来操作,所以就是 c u i 的 话来操作文件的系统,运行系统和调用服务。 sub agent, 它是一个子 agent, 功能的话就是能够去并行工作,独立的上下文创建的话是自动派生的,还可以是手动的 agent 创作。 hook, hook, 它是一个自动的触发器, hook, 自动触发器,任务提醒、代码检查等条件触发。还有就是一个插件,插插件的话是打包 skills, 还有 m, c, p 等功能, plugin 的 一个就是插件的一个管理, 而且可以打包这些功能插件可以打包这些功能。学习总结的话,核心的阶段上手使用管控优化、个性化,再到一个高级的一个拓展,核心的逻辑就是从一问一答到构建一个 ai 写作的系统。 再来看一下这 cloud code 的 一个使用的全全部的教程。首先基础的一个认知,它是干嘛的,对吧?它它是一个通过干嘛通过。大模型循环,就是相当于说你,嗯,提问你,你给他一个指令,然后他不断地去 啊,就是找到答案了之后又又又又又把这个答案重新去,去到 deepsea 再再去给它循环,这就要大模型循环,是吧?安装基本的一个使用管控的技巧,个性化的去定制,高级的拓展以及学习的一个总结。

大家看一下 oppo 十四点七 e 照的上下文,能读图片,原生的读图片的能力,我问他是什么大模型,他是 oppo 十四点七。 可能看到这里很多人就以为我用的是不是国外的大模型,但是再往下边看地址,本地的一个地址加端口 zip。 所以说有很多人在我评论区说国外的大模型有多么多么好。如果你确实是自己去官方买的接口,那我就不说了,但如果你是去那些中间商 用那种什么几分之几的价格买的,你确定你用到的是 oppo 四的模型吗? 有的时候就是你自己的心力作祟,就觉得自己好像用到了国外大模型, 但是真不一定是。我还是那个观点,国产模型其实挺好用的,希望你不要用国外的模型的钱买到了一个国产的模型在用,还一直在夸国外的模型有多么多么牛。

cloud 也能记住你的项目关键就靠一个 cloud md 文件,让它每次进项目都先读规则。 如果你每次打开 cloud code, 都要重新解释项目结构、技术站运行命令和代码规范,那你其实少用了一个关键功能,叫项目记忆。它最常见的入口就是项目根目录里的 cloud md 文件。 cloud md 可以 理解成写给 cloud 的 项目说明书,它不是给用户看的 read me, 而是告诉 cloud 这个项目怎么启动,怎么测试,目录怎么分,哪些文件不能乱改,回答问题时要遵守什么偏好。 真正好用的 cloud md 不是 写一大堆废话,而是写可执行的上下文,比如常用命令、代码风格、提交规范、测试要求、业务术语,还有踩坑记录。 cloud 读到这些就能少猜很多。 它最大的价值是把一次次重复沟通变成项目级默认规则。你不用每次提醒先跑 link, 不 用每次解释组建放哪里,也不用每次强调不要改生成文件。 cloud 进入项目后,就能按团队习惯工作。 写这个文件有三个建议,第一,短距加列表,别写作文。第二,只放稳定规则,不放临时需求。第三,随着项目变化持续更新,它越向团队手册, cloud 越像真正加入了你的项目。 所以,如果你正在用 cloud code, 第一件事不是疯狂堆提示词,而是先在项目根目录建一个 cloud md, 把项目记忆写进去,让 ai 从一次性助手变成懂你项目的协作者。想继续了解更多 cloud code 实战技巧,关注我!

这节我们来学习如何用 collude code 学习 collude code。 先我们搜一下一个叫 sigma 的 技能, 这边这个 readme 太长了,我们就不看了,让 i 帮我们解读一下。 因为咱们的 coding 能用的模型主打一个经济实惠,所以整理思路的时候用你能用的最强的模型就行了,当然你用豆包、 deepsafe 也都可以。我这边不太习惯使用豆包,主要是它有点喜欢顺着你说话,不太好进行一个思维的碰撞。这边使用的是这个 node, 然后他已经解读完了核心定位的话,可以看到这个技能是基于 plume to sigma 方法实现的一个个性化一 v 一 辅导的一个 skill。 然后工作流程的话,就是你输一个你想要学习的东西,然后他会分析你的这个学习者的一个档案,然后分析你的一个水平,然后构建一个学习路线图,然后开始教学循环,直到这个绘画结束。 这边我们让他呃再帮我们详细解读一下这个 sigma。 这个方法 实际上是这样的,就是吐司克玛,其实就是一 v 一 教学,这个布鲁姆发现这个一 v 一 辅导和这个大班就是这种,嗯,一个班级,然后一个老师很多个学生的这种方式会有两个标准差的差距, 然后他做了一个对比实验,发现这个一 v 一 辅导,然后这种普通的学生能够超过传统教学中百分之九十八的学生。啊,为什么说这个一对一辅导那么有效?主要的话是他这个教师发现你有问题的话,立刻做调整, 然后它有一个适应的节奏,它可以根据你这个学生的画像去分析呃,这个内容是要快速推进还是要去呃再加深的,然后如果说你有了一些误解,它也可以对你做一个及时的纠正。 其实我们之前做不到这个 e v e 的, 呃,主要原因是因为这个 e v e 的 分数很高, 但是现在这个 ai 时代啊, ai 时代来了之后,我们可以使用这个技能的方式来让这个大冒险进行一个一比一的教学,能够提高你的分析能力,相当于 实验了。我们先创,因为这个进是有需要持久化的数据。维尼格兰的这个目录里面 第五个 int 的 开发键,输入 node 地址的 n p x 命令可以使用。那使用这个 n p x 六十二的这个呢? 我们查到这个技能啊,有 b 点五 k 的 暗号,然后我们 n p x 六七按下这个命令的网络, 我们是把它填到屏幕就行了,要填到选举,然后这里输入里面搜到的这个顿, 然后我们输入要搜到格扣的,我们加上默认的话可以跳过, ok, 已经安装完了,这个时候我们 close 启动一下, 在开始之前可以看到我们使用的模型是这个 mini max 的 二点五 high speed 的 一个版本啊,如果你也是使用的这个 mini max 的 入门的这个 clone plan 的 话,建议使用这个,不要使用那个二点七,实际测试下来的话,编码场景下二点七的表现甚至不如二点五。然后入门套餐还不能用这个二点七的高速版本,所以说我们就用这二点五的 high speed 的 就行。 然后我们教一下 skills, 看一下这个技能有没有正常安装,可以看到这个 sim, 这个技能是 ok 的, 然后我们可以教一下这个技能 sim, 然后说一下我想要学习 load, load 这个时候它这个技能的话会呃开始诊断,我们看一下这个技能的流程,它会应该是第一个阶段是先去诊断一下你这个用户的一个水平, 你就直接正常按你的这个水平去说就可以了。如果说你想要从头学习的话,你也可以写没有任何经验,然后他会问一些深入的问题,然后就是相当于他会通过问题来判断你的水平,他不完全是通过你的回答, 然后他会诊断完之后,他会去构建一个学习的一个路线图,相当于我们想要去学习这个 code code, 然后他会把这个东西拆解成啊不到十五个概念,然后生成这种学习的一个路线图, 这个 c、 m、 d 是 它的这个绘画记录,然后它也会生成一个 road map 的 一个 itm 二文件,然后我们可以 ctrl 看一下它给我们解解的这个概念,它实际上有十个概念, 然后我们等待它生成一下这个 road map 的 这个 itm 二的学习路径,有可能会慢一点,因为是一个需要设计下的东西,可以看到他已经把这个文件串进出来了,我们可以去这个文件夹打开文件看一下, 然后可以看一下它给我们生成的这个学习路径长什么样,大概是长这样,然后其实就是这十个概念,然后回头我们学习完之后,它会记录我们的一个进度, 然后下一个生的话,实际上就开始它的教学的一个核心循环了,然后它会循环的去问你问题,直到你掌握我们的概念之后才会开始下一个的概念学习。 看一下这个具体 load code 内置 的话,实际上是呃模型需要分析意图, 决定 工具执行后的返回结果,这个结果是以什么形式的某种结构化的。 这块的话我们实际上也可以去呃测试不大一个粗的,然后它的话就会呃形成一个 我们可以嗯故意回答一个嗯错误的,直接 通文本这边的话,因为我们描述的比较模糊,他也不知道我们实际上回答的是错还是对的,有时候可以看到他实际上还是在追问,我们追问的原因就是 嗯,我们实际上的答案是错的,然后他写希望我们自己来发现这个问题,所以说他就会嗯使用一个返利来去对我们进行一个追问, 然后它的这个返利里面会让我们有一些提示的内容,我们把这个准确的来写一下, 嗯, 会继续对我们进行一个追问, 然后关于工具系统的一个内部机制,它实际上现在认为我们理解已经到达这个百分之八十的门槛,这个嗯, simon 教学的话是有一个百分之八十的门槛机制的,只有到达百分之八十之后,它才会去呃进行一个 下一步,就相当于这边达标百分之八十之后,他才会让我们进行一个下一步的一个学习,然后他会让你回答一下你自己认为你掌握的如何,然后我们这边根据自己的判断随便选一个。 ok, 这个时候他学完这个概念之后,他会更新一下我们的这个呃学习进度的一个规划, 然后也会更新一下我们的这个呃学习路径。 一个概念学完之后它会进入第二个概念的一个学习,这个时候我们可以结束学习 学习并生成和 报告,让它帮我们生成一下呃人文分析报告, 它会记录一下我们什么时候停止学习的,然后修改一下我们的这个学习者的一个画像, 生成一个可转化的学习总结,我们可以打开它这个呃学习总结看一眼。 实际上我们呃生成了一个这样的一个学习报告,然后掌握了一个概念,然后自我评估是准确,然后本次关键洞察相当于是你学习的这些内容,它会把一些重点的一些学习呃的一些关键洞察给你显示出来, 然后呃这边没有回答错误的答案的话,它会放到这个误解里面, 然后我们可以退出。如果说你下一次想要重新开始学习的话,你就嗯直接还是敲这个命令,要用一下这个技能继续学习呃 close code, 这样的话他会去读我们的这个刚刚那个 c, c, d, m, d, 然后还有我们的这个学习者的一个画像,然后他会从我们上次呃停止的那个地方进行一个继续的学习,而不是说从头开始 看到它实际上呃调过了概念一,然后直接从这个 iint 的 架构与决策循环开始学习。 目前为止我们实际上已经实现了让这个 code code 对 我们进行一对一的教学。但是还有个问题是模型生成的这个呃路线图和进行的这个问答有点偏,然后也不够深入,也不一定准确,可以看一下它生成的这个缺一路径。第一步的话实际上是什么工具系统内部机制实际上放在第一个概念不太好。 其实这个 two sigma 学习方法自身是没有毛病的。出现这个问题的原因的话是因为我们没有一个知识库,或者说教材提供给这个模型,所以说模型只能教你他自己懂的东西。如果不加知识库,这个教学效果实际上是取决于模型,模型越强,这个教学效果就越好。 然后除了去学习这个 code code, 凡是模型呃会的通用的知识,我们都可以使用这个技能来去学习,比你要去呃,比你看 ppt 也要强一点。 最后我们为了解决刚刚提到的没有知识点导致的这个教学效果,由这个模型来去决定下线的问题,我们下一节应该会带着大家实操构建一个知识点。