粉丝42.2万获赞361.6万

不用一行命令也可以安装爱马仕,我们双击打开安装包下滑可以安装 hermes, 或者更新之后点击模型,这里可以配置超多模型, 点击渠道可以配置飞书或者微信,最后点击启动 get, 启动成功后点击打开 v b u i, 之后就可以开始您的养马之旅了。

看啊,兄妹,现在最近是在早在问的这个腾讯刚刚发布的马维斯 a 啊,很多小伙伴都抱着去下载安装的,今天呢,手把手 教会大家,安卓苹果都是可以免费下载。第一步呢,点完视频下角小箭头这里分享链接,然后我们打开用商店,再打开这一个,在这里面搜索小婷的梦,点进来打开掌间注元宝,找到这一个,取消选选勾选保存,再去下载安装就可以了。

今天教你一句话,安装 skill 同时适配三大 ai 编程环境,不用为不同工具重复维护 skill 进入 skill 的 目录核 心。安装逻辑非常简单,执行通用的命令,通过 i 参数指定目标应用名称就能一键安装到对应环境。安装到 open call 参数写 open call 执行完成后,直接就能在龙虾中附用指令和接口安装到如图的内容。 安装后重启终端或工具即可生效。安装到如图内容参数机的修改重启工作环境就能使用。其他支持 skills 的 应用 都可以沿用这个格式,替换对应的应用名称即可。如果安装失败,优先检查三点,是否进入了正确的 skill 目录, skill 名称是否正确,而后面的应用名称有没有拼写错误。 这套安装方式最大的优势就是轻量通用,同一个 skill 只需要维护一份,就能快速部署到所有兼容的 ai 编程工具中。

hello, 这一期我们来安装爱马仕 a 准,这是一个跟 opencloud 小 龙虾差不多的一个 a 准, 嗯,区别最大的我觉得不是功能,功能上我觉得没多大区别,最大的区别就是小龙虾它一轮对话必须要完成了,它才能接受你下一轮的对话,然后爱马仕 a 准呢,它就可以 在对话任务过程中呢,你可以中间打断它,插入消息,然后它继续去任务,觉得这是最大的区别所在。 好,废话不多说,我们安装,因为最近爱马仕它已经放出了那个 windows 的 windows 版本,就咆哮版本的一个安装方式就是体验版,但是功能也基本上也比较完善了。那我们先打开项目地址, 我们搜索爱马仕 a 准 h e r m e s 杠 a g e n t 啊,第一个就是 我们往下拉,拉到项目说明,可以看到这边已经有了 windows 版本的一个测试版, 这是早期的一个测试版,那么我们可以直接复制这一行命令,因为因为我这一台主机已经安装过了,所以我们我就换一台主机去进行安装 好,打开另外另外一台主机,打开咆哮,咆哮,我们可以在开始菜单里右键终端管理员,然后打开咆哮,然后把刚才的那一那一串命令 就是这个项目的那,那这一串 windows 的 这一串,如果你不是 windows, 是 linux 或者或者苹果系统的话,你就复制上面这一段, 那我这个 windows 的 话,直接复制这一段,然后再回到你的那个 pro x 上面,把它复制下来,然后直接回车, 回车它就会进入到一个自动安装的一个 过程,我们不需要管它,任何都不需要管它,你只需要保持你的网络畅通就行。这种 a 准,你只需要有网络,它就能避免百分之九十九的问题。好,我们等待它安装完成。 好,到这一步的话,看到已经是安装完成了,他说检测到我的那个有安装 openclock 小 龙虾,问我需不需要从小龙虾来导入数据? 我个人是不建议去从小龙虾来导入数据的,因为容易造成他们两个之间的混乱。 n 是 no, 然后跳过这一步之后呢?我们来到这里,他说这个配置是快速配置还是全配置,那我们只需要快速配置就可以了,先初步跟他对话,后面的功能可以一步一步去添加,然后回车, 回车的话我们那个这边问是否需要设定那个模型的,那个 这边有很多选项,我们直接输入一二三四五,在这边输那个 number 就 行了,那英伟达的话就是八,那我们直接默认就是八, 然后他应该是有检测到我有,就是我的网络环境,我的环境里面有英伟达的 api, 那他的意思问我是不是使用这个自带环境,因为我前面那个 open core 应该有在配置这个 api 的 环境, 如果没有配置没有那个的话,我们就直接选择八,选择八输入你的 api key 就 行了,那默认的话是保持,然后另外的话我重新输入的话,我们直接输输 r 就 行了。 replay, 然后它就教你输入英伟达的 api key, 那 我们把它复制一个进来。 好,我们直接右键,注意只输一次就可以了,因为它是看不见的,那输完右键之后它就粘贴上去了,直接回车,然后这个默认默认回车, 然后它会跳自动的那个检查模型,那我们输入你想要的模型数字,然后我们选择第一个 stefan, 然后直接回车, 这边就是默认使用的工具,保持默认就可以了, 然后消失。这边就是接入飞速啊什么的,我们先不接入,我们选择二跳过回车,然后他问你是不是现在就对话了? yes, 这样就完成了一个初步的安装和配置, 可以看到已经安装完成了它这里会有一个更新,有更新呢,或者说有需要刷新的项目,它会教你运行这个爱马仕 update to to update, 那 我们可以,其实可以不先不管它,先测试一下,看看它整个运行状况通不通。好,可以看到它已经运行跑起来了。 好,我们按照那个设置一下它的那个初尺属性,就你叫什么我我叫什么,然后初尺画就记,可以直接拷贝给它 回车, 做完之后还要让他做做一次传传测试,没要没有问题的话就基本上 ok 了。 好,这到这一步的话,爱马仕的一个 windows 版本的一个搭建就完成了。啊,到这里我忘了补充一下怎么去退出这个爱马仕 a, 准,那我们直接按住 ctrl 加 c 按两,连续按两下, 连续按两下就可以直接退出一个对话。那么我们重新进入呢,就是可以再次打开 call, 然后我们直接在上面输入爱马仕 h e r m e s 然后回车就重新进入到爱马仕的一个对话对话中。 好,基本上使用的话就是这样使用退出,那如果要更新的话,就是刚刚 h e r m e s 要 update, 它就会自动地帮你更新到最新版本。 ok, 这期就到这里吧。

e v hermit 今天有做更新,好吧?第一个就是图片显示,这个就我之,就我之前那一版就是它,比如说我让它找一下这个文件下的图片,然后它会, 比如直接发那个文件的,直接发图片路径嘛?然后还有第二个就是这个引用的功能,你只要把这个点到这个上面就可以了, 然后你只要点下引用,他就会把这个引用对过来。好,这个常见就是比如我们在开发的改文档的时候,比如我们觉得这一版哪里需要在优化,然后你可以引用某一段,然后直接跟他说,比如说可以语音跟他说,比如说,嗯,这两张图片你是在哪里找的? 然后还有个就是这个语音的自动回复,好吧? 就是你把这个开了之后,它给你的回复默认就是语音的这种回复哈。 在地貌号反斜杠 crobot 反斜杠 avatar 这个路径下找的,然后相关的文档在这边目录找到所有文件,然。

我们平时的话,日常的话装这个 skill 有 三种方式啊,就是第一种方式就是卡号上面对这个 skill 市场这上面的任意 skill, 然后它有一这个有个单漏 啊,登录的这个,然后呢下载下来解压在这个你们安装的目录点 opencloud 下面 workspace skill 啊,解压在这个目录下面就可以了。第二种方式就是你这个 skill 里面有一个这个命令,直接这个复制这个命令,然后到 posture 上面去安装 啊,右键回车就可以了。那第三种命令我们是最常用的啊,就直接把这个 skill 名字复制下来, 然后呢到我们楼下里面,然后直接跟他说啊,请给我安装这个 skill 就 可以了。

今天我们学习怎么在你的安卓手机上安装并运行可乐的扣子。在开始之前,我们要知道手机上跑可乐的扣子和豆包这种有什么区别,你说我们都有豆包了,为什么还要在手机上去装一个可乐的扣子?说白了就是可乐扣子这种挨近的扣杆为大模型加上了手脚,让它能够实际的去为你做事情了,而不只是说呃一个简简单单的聊天科普班。 然后在手机上去装这个呃可乐酷狗。首先我们要去装一个 timex, 呃 timex 是 一个适用于安卓的终端模拟器,呃环境类似于这个 linux 环境,然后重要的是上面能去跑 python, 然后也能去运行我们 node js, node code 就是 node js 写的,所以说它就可以运行在咱们的这个呃 timex 这个环境上面。我们直接点到 win 哈 这边,直接点到它的 releases 里面。正常情况下,目前呃新一点的安卓都是下这个 m 六四呃杠 v 八 a 这个版本,然后如果你确定不了的话,你也可以直接下这个 emulator, 也就是这个通用版本,它会自动去适配你的这个手机啊,就是这个包的体积会比下面这个大一点。 然后如果你自己下载不了,也可以评论区留下你的邮箱,我这边会把所有流程和这个 ipad 直接邮发你啊。这边是我们预先准备的命令,我们要放到手机端去做一个复制使用啊,其实主要是这个,嗯,替换可乐酷的魔性提供商,这个命令有点太长了,如果你在手机上抄会累死。 然后这边这个可复制呃模型应用,它的配置是在咱们的用户目录,然后点可复制杠 settings, 点 jason 这个文件里面,然后下面的配置的话,你可以直接从你的电脑端去呃,做一个复制,也可以说打开你的这个 c switch, 然后拉到你的这个最下面 啊,找到这个配置,这个 jason 你 把它整个复制,然后替换掉我这边这个命令啊,这边其实就是这个 ipadoken 这块的话,我这边是呃是信号,你需要提换成你实际的 ipoken 这节的话,我会带着大家在手机上实际操作一遍。

今天我要用二十分钟时间从零到一,给你讲透 skill, 让你从小白直接进化到 skill 专家。今天会包括什么内容呢?首先就是 skill, 它和提示词、系统提示词以及 mcp 的 区别。 然后我就说一下 skill 的 标准结构,它的底层原理,从哪里可以下载到好用的 skill, 然后判断 skill 好 还是坏的评价标准,以及 skill 的 编写方法,常见的 skill 的 设计模式。最后我会放上我自己经常用的,并且用过以后感觉非常非常大家都一起使用的 skill 进行一个推荐。 那在深入这些概念之前啊,我想先带你看一看一套真正落地的工作流,是我自己平常也在用的,我给它取名叫 map content factory, 它是一个可以从端到端的内容创作的 skill 工作流, 接管了我很多的创作工作,那它会有专门的 skill 像流水线一样接力完成。主要分四个阶段。第一个阶段是 researcher agent, 它主要负责网络搜索调研。 最后调研的成果呢,会按照固定的格式写进一个文件里面,作为给下一个 skill 的 交接。第二阶段会用 slidecraft 捕取调研的文件,把纯文字转换成美观的 html 形式的换登篇,它只负责一个格式的转换。 那第三个阶段,我会用 hyperframe 把 html 渲染成带动态效果转场和配音的视频文件啊。第四个阶段,我会用 content distribute, 相当于一个内容的分发, 把各个平台的规格自动裁切尺寸,然后生成封面,写不同的文案,然后准备推送。 有这样一个 skill 的 生产流水线的好处就在于它接管了你大部分的内容生产的工作,同时你可以在任意一个节点,比如说如果你对文章不满意,你可以随时回退,对 html 不 满意,你还可以把文章再次放到 photoshop 这个 skill 里面去调整。 那这是一个我用的 skill 的 工作流的一个演示,最左边会有一个写文章的 skill, 他 已经把文章写好了,保存下来了,然后中间是我的幻能片的 skill, 他 把文章读起过来以后,然后我们这里已经生成好了一个幻能片,我们打开看一下,大概是这个样子, 它会有不同的风格,然后按照不同的风格把文章渲染成网页端的缓存篇,然后我会把它交给第三个 skill 这个 skill, 它主要是把这样的网页缓存篇,也就是 html 文件生成成呃,带有动态效果的视频。 这三个 skill 都是紧密相扣,互相联系的,最后生成的效果。我们也可以打开这个文件,然后去预览一下, 这个就是一个完整的 skill 工作流,从文调研到文章,到静态画图片,再到最后的教学类的视频,就是很简单,大概二十分钟就可以深度完成 那么一套整个这样的 skill 流水线。它最核心的就是 skill 之间,它不通过对话记忆传递上下文,而是通过文件系统一直在交接成果。 每一个中间的文件都是明确定义的一个接口,那你上面按格式去写,下面他会按格式去读,哪怕你的 ai 服务突然断了,或者你的对话窗口关了,三天后再打开,只要文件夹里面躺着最新的那一个中间的文件,整个流水线就能没有断点的无缝连接上, 对于很多需要几十轮交互的复杂任务来说,这种设计几乎是必须的。中间的文件它就是一个很好很好的进度条。 那接下来我们来聊一聊 skill 它到底是什么?那在二零二五年底啊, ansapic 正式发布了 agent skill 的 开放标准, 到二零二六年五月,已经有超过二十款主流的 ai 产品接入了 skill, 包括说 cloud code, cursor codex, kimi tree 等等。那其实你花一个小时写好的 skill 呢?可以在所有这些平台上直接去附,用不用被某一款工具锁定住。 从文件形态上看呢,其实简单的,最简单的 skill, 它就是一份 markdown 文档,也就是一个文文本档,里面可以是中文,可以是英文,只要是人的语言都可以。那它开头呢,会用一个 yaml 格式的东西存放源信息, 源信息里面会包括一些名称啊,描述啊,版本啊,出发条件啊等等。当然了,一个生产级的 skill, 它包括的东西永远不止一个 skill 点 md, 一 般来说,它会有一个 skill 点 md 作为核心的指令,然后同时也会配着 reference 和 script, 分 别是参考和脚本。那我们现在打开源信息夹来具体看一下, 那这里我们拿 remote 做 hyperframe 这个 skill 来具体看一下,它是一个把 remote 类型的视频转换成 hyperframe 类型的视频的一个 skill。 那 这里我们可以看到它具备 reference, script, script, md, 同时还多一个 asset a reference 文件夹呢,它主要是放一些参考文件,比如说一些输出的案例啊,一些风格对照啊等等,主要是当做一个辅助资料。那 script 在 这里面,它主要是跑放啊, ai 可以 直接去跑的脚本,这个时候 ai 就 不需要有太多思考了,只要想好用哪个脚本, 它直接去执行就可以,这样可以保证百分之百的执行正确率。然后就是 script, 它其实是一个 ai 的 大脑,它决定了什么场景下应该去唤醒 ai, 以及拿到任务后怎么一步一步执行。这一层必须要精练,因为 ai 它的理解成本能力是有限的,核心指令如果太臃肿了,执行进度就会下降,这一步是整个所有的灵魂。 下面我们来比较一下 skill、 系统提示词以及 mcp 它们三个的关系。首先呢,这三者都涉及到给 ai 先打指令,但是它们定位是完全不一样的。系统提示词呢,它是全局的常规设定,也就是说从绘画开始到结束,它一直都在底层的上下文里面。 它的优点是覆盖面广,缺点是只能是一段扁平的文本,也就是说它装不下案例库,装不下脚本,更没有办法按需加载。项目规模上去以后,它会越来越臃肿。 但 skill 呢,它是一个模块化的三层的工具包,也就是说只在触发条件满足的时候,它才会去加载,执行完呢,也不会长期的占用记忆窗口。你可以在一个项目里面装上十几二十个 skill, 但是 ai 一 次只会加载需要那一两个。而 mcp 呢,它解决的是我能连接什么外部资源的问题。 如果把 mcp 比作是硬件驱动的话,那 skill 它就是跑在驱动之上的应用软件,也就是说两者互补。 没有 m c p 呢? skill 光有想法,碰不到边界,没有 skill, m c p 它有性能,但是不知道怎么发挥,一个管能不能,一个管怎么做? system prompt, 它适合放在贯穿所有任务的底层偏好。 而 skill 呢,它适合放特定任务的专业流程, m c p 则适合放一些连接外部世界的具体工具,三者各司其职,合理分工。接下来我们来讲一下 skill 的 底层原理,以及它为什么如此适配大圆模型。 首先就是 skill, 它给大圆模型提供了明确带有约束的指令,而不是模糊的意图。其次, skill 它有一个渐近式批漏的特点, ai 会先扫描是否需要加载,然后会加载中文,中文出发以后加载完整逻辑,然后它会看是不是需要引用 reference。 第三呢, skill 它是可以条件触发的,可以通过直接调用,也可以关键词来匹配。也正是因为这样的特点, skill 它是极其的省 token 的, 一百个 skill, 它大概只占五千个 token。 而一般来说呢,对一个一百万的上下门窗口,一个 skill 大 概也就只占百分之零点二到零点四的一个比例。但这并不是说 skill 就 可以想写多长写多长。一般来说, skill 的 正文控制在五百到两千字是一个最好的甜蜜点,太短的话约束不足,太长的话就会稀释注意力。 那从哪里可以获取高质量的 skill 呢?我推荐三条路径。首先就是去 skill 的 s h 下面下载,它是由 word, excel 出品的, 优点就是标准化程度高,而且支持 npx 一 键安装,非常适合用正规军。第二条就是小红书,因为它上面有大量的中文创作者,沉淀了很多本土场景的 skill, 缺点就是质量会参差不齐,需要你自己甄别。 第三条就是你自己写 skill, 自己用,它其实是最贴合个人实际工作流的,你不需要会编程,只要你能把日复一日的任务用文字表示清楚,你就可以用一个基础的 skill。 那如何去评价一个 skill 的 好坏呢?这里有五条标准,首先就是一个 skill 应该只专注于一项工作。第二 skill 应该有足够的交互性和定制性,关键决策一定是要用户来做主的。然后就是我们刚才提到的 skill 应该控制在五百到两千字之间。 第四就是 skill 他 要有明确的边界条件和注意事项,他应该主动写清楚,这个 skill 应该要比全能 skill 更可靠一些。第五就是可以组合性, 它会把输入接口、输出的格式都定义清楚,你的 skill 应该能像乐高积木一样跟其他 skill 拼接,组成一个 skill 的 工作流,而不只是单打独斗。第八部分我们来讲一下 skill 到底怎么安装。首先 skill 呢?它的安装有三个层级,企业级、用户级以及项目级。 如果你安装在了项目级,这个 skill 它只有在项目里可以用。如果安装在了用户级,它会在每一个项目里面生效。 那一般来说呢,会有三种安装方式,首先就是手动复制到对应的 skill 目录,或者你也可以用 npx 一 键去安装。 还有一种方法就是你把链接直接丢给 ai, 让他去帮你配置,等项目会有一个具体的演示。那如何触发 skill 呢?第一种方法就是打一个斜杠,完整的输入 skill 的 名字,这样就可以强制触发。 第二种方法就是你直接用人话告诉 ai, 我 要用这个这个 skill 去完成什么样的任务。第三种如果你忘了调用 skill, 有 的时候 ai 会判断你这个任务适合用什么样的 skill, 会帮你触发。下面我们来看 skill 的 具体安装方法。这里面是一个 skill, 我 们直接点击 code, 点击 download zip, 这里面展示的是第一种安装方法,也就是我们直接把文件夹创建好,那我们下载完以后呢,我们直接去嗯, 解压缩,然后点开 skill demo, 这是一个你的工作文啊,文件夹在这里面。解压缩以后,我们打开这个文件夹,看到这个 skill 在 这里面了,当然这还不够, 因为呢 skill 它需要在正确的目录结构。什么是正确的目录结构呢?首先我们需要创建一个文件夹,叫做点 cloud, 如果你用 cloud 的 话是点 cloud, 如果你用其他的话就叫点 agent, 那 我们这里面写一个点 cloud, 然后把它移到里面。 玩上这一步还不够,点开脚壳以后,我们还需要再创建一个 skills 的 文件夹, s k i l s, 然后我们把我们的 skill 移到里面, 这样我们的 skill 就 下载完了。现在我们演示第二种下载 skill 的 方式,这是 skill 点 s h 刚刚介绍的下载 skill 的 网站,比如说我们想要这个 skill, 我 们直接复制这个指令, 这个是 npx 的 下载方式,我们点开我们的 vs code 或者其他的,嗯, ai agent 都可以。那我们点开这个终端,然后我们在这里面直接把刚才的指令复制给他, 打一个回车,他就会一步一步引导我们下载,可能会是英文的哈,这里面他已经自动帮我们选好很多了,我们还需要额外的话,可以再勾选额外的你的对应的编程工具, 那我们点 color code, 然后 project 就是 一个是项目层级,一个是个人层级,项目层级是在项目生效,个人层级在所有项目生效。然后我们继续点 yes, yes, 然后他就帮我们安装成功了,这样下载非常非常快。 然后我们就可以看到我们的 skill 已经在对应的文件夹里面了。 skill 下面有 brainstorming 和 slidecraft skill, 那 我们现在看一下第三种安装方式,我们找到这个 skill 的 仓库,然后让 ai 去帮助我们装这个 skill, 这是一个 ppt 的 skill, 我们点击复制,然后同样打开我们的 vs code, 我 们点击右上角的这个克拉的插件,我们直接跟 ai 说话,让他去帮我们安装。 那我们在这个下方把这个链接粘贴过来以后,我们直接跟他说,请你帮我下载一下这个 q, 然后你也可以说清楚,下载在本项目层级的文件夹里面就可以了,不用下载在用户层级。 那我们发给他以后,我们需要一段时间去等待他去下载,这样的方式会稍微慢一些,然后这个时间我们可以正好测试一下刚才的 skill 没有安装成功。我们可以试一下我们的第一种 skill 的 触发的方法,也就是打一个斜杠,我们点击这里面, 然后打一个斜杠。嗯,可以看到 brainstorming 已经在了,再打一个斜杠,输个 s, 可以 看到 photoshop 也在,这两个 skill 就 可以顺利调用了。如果你的 skill 没有顺利调用成功的话,可能是没有发正确文件夹,或者是你需要新开一个窗口,它才能重新加载。 那我们要如何从零到一,自己写一个 skill 呢?这里有一个从零编辑 skill 的 五步法,那好用的 skill 呢?它一定是诞生于一线业务的。那下面这是我的一个编辑路径。第一步,你一定要定位重复率最高的工作, 而不要凭空造一个 skill。 你 可以想想过去一周自己的工作记录,哪件事每天要做,步骤基本不变,而每次都要花费大量的口舌和介绍背景,这就是非常适合 skill 化的任务, 从一个小痛点开始。第二步,你要把隐性的知识显性化,把脑里面的直觉和经验一字一句的写成 ai 可以 理解的步骤,而不是让 ai 自己去猜你在想什么。 第三步,我建议你开 play 模式,携作用优质的案例去做反向裁剪,让 ai 自己读几份你的高质量作品去总结规律。第四步,我建议你跑通实测,写完以后你不要立刻就调整措辞,补充约束,增加负面案例,一般需要三到五轮实测才能稳定。 第五步,就是去测试触发词,确保你的触发词能被准确的识别到。如果你不喜欢这样的方法的话,你也可以每次记住名字,打一个斜杠,但确保不要跟其他 skill 有 冲突。 在你做你自己的 skill 的 时候呢,会给你下面这四个大的原则一定要遵守。首先就是视力的说服力远远大于文字描述, 你可以给多个 ai 一 些参考,让他去反向拆解理解你的意思。然后一个 skill 只专注于干一件事,但你可以把多个 skill 排成一条管道, 这样他们就能实现非常复杂的工作流。然后就是你要让用户成为核心的决策者,而不是 skill 替你决策。最后你要固化真实的工作流,而不是虚功所敌。 最后我想分享六个常见的 skill 的 设计模式。首先就是检查清单型,他会把大任务拆成不可细分的检查点,一个一个核对完成,一个打一个勾。第二就是交互确认型,也让他独立完成分析以后,他会在每个关键的角色点停下来,给出多个备选的方案。比如说像这个 slidecraft skill, 在我完成文章以后调用它,在调用它整个过程中呢,它会在多个关键的节点去询问我的意见,让我深入的参与其中,这样保证它的意思。它的想法跟我的想法是完全对齐的, 而且不仅可以做到和我完全对齐,也可以做到把它放到网上以后,它可以和无数的不同的人完全对齐想法,做出适合每一个人的产品,而不只是只适用于我的 skill。 呃,下一种是文件流水线型,上一个阶段的输出会作为下一个阶段的输入。阶段与阶段之间呢,主要靠一些文件来连接,好处就是它可以防止绘画中断,而且每个阶段其实都是独立的。第四种就是反向拆解型,把高质量产品归给 ai, 那 反向推导出步骤其实永远像那个蒸馏的 skill。 第五个就是模板定制型,他会先定义好输出的框架和章节的结构,再让 ai 去具体填一些内容。第六种就是工作流的固化型, 先手动完整的做一遍任务,等完整做一遍任务,这个流程已经跑通。确定好之后,让 ai 观察你的操作步骤和决策逻辑,再让 ai 它去提炼,抽象成一个 skill。 下面我想说一下 skill 跟 mcp 的 一个配合的关系。如果你把 ai 一 键的整体能力分层的话,最底层的就是模型,层是大脑, 中间就是 mcp, 他 是手脚跟感官,最上面的才是 skill, 他 是经验和肌肉记忆。那你模型再聪明呢?如果没有 mcp, 他 就碰不到外部世界,而没有 skill 呢?他就不知道该怎么去利用,怎么去改造外部世界 未来趋势呢?很可能是 mcp server 跟 skill 成对,出现一个提供标准化的接口,一个提供最佳时间和流程模板。 最后我想分享一下我个人长期在用而且推荐的 skill 的 清单内容。创作方面,你可以用 slidecraft 来生成你的演示文稿,你也可以用 remotion 让你的代码变成视频,或者你也可以用 hyperframe, 这是一个比较新的一个 skill, 它会把 html 变成视频。 开发方面呢,会给你推荐 code review 来检查代码。 skill creator, 它用来创建其他 skill, 房产抵押用来设置美丽的前端界面。 superpower, 它是一个整套的开发效率套件,完全可以试一下。 而当你想用一个 skill 但是不知道在哪的时候,你可以用 find skill 来帮你找到 skill。 其他的包括 grimy, 它可以模拟严苛的问答来检验你的思路。 keepman, 它可以让你的输出 token 直接降百分之五十以上,但是信息无损。 最后我想说,做一个 skill 其实并没有你想象那么难,它其实最适合从最小,最重复,最让你烦那个任务开始,像打磨工具一样,跑一遍,改一版,再跑一遍,再改一版, 一点点积累出来。越早开始积累,最后的复利效果越明显。很多工具也会过时,但沉淀下来的流程不会过时。

哈喽,大家好,我是琪琪。 hermes 官方提供了一个一键安装的脚本,听起来很方便,但是很多小伙伴正正去用的时候却发现它经常会卡在各个环节上,然后没办法执行下去,解决掉一个环境又有下一个。那 ok, 我 们今天来安装一下我们的这个 hermes, 然后给大家看一下怎么样去处理那些卡点。 那正式安装之前的话,我们先来看一下 helmas, 它到底是哪些环境是它必须要安装的,然后我们把这些东西给解决掉以后,然后我们再去执行它的一键安装,会很很快,或者说我们也能够去知道它去卡的时候到底是卡在什么地方。这边的话是 windows 环境, windows 的 话它必须在哦, windows 的 话它就必须是在 wsl 二里面去运行,我们的很多电脑默认是 wsl 一, 然后我这边的话是使用的是 open to 二二点四零四的这样的一个版本去运行的,也就是这个,然后我们是在这个上面去执行的, 就是在在这个虚拟环境里面去安装的我们的 harmas。 呃,在这个之前的话我先说一下,就是首先来说 harmas, 它是运行在 linux 上的,它虽然也能够在 windows 环境下运行,但是它的兼容可能不是那么好,所以的话直接安装在 windows 上的话,它会,嗯,有些问题,所以的话还是建议安装在我们的 w s l 里面去, 然后给它提供一个 linux 的 一个环境,然后我们看一下哈,就是它需要有哪些东西啊?呃,你把这个上上面是它的一个基础环境,然后这下面是我们的一个拍摄环境,你需要去安装一个呃, u v 的 这样子一个包, 然后这是 load 环境,然后这是依赖包。这些的话就是我们现在来看到的哈,这几个系统工具就是我们刚才这提到的。呃, device 呀、 get 呀,这些东西都是必须要安装的,我们经常去一键安装的时候,卡的话,大概率基本上是卡在 uv 还有 load 下下载这两个东西它很容易卡。 然后的话我这边提供了一个检测脚本,就是我们去检测一下我们到底哪些东西没安装,那我这边是因为安装了哈,可以的话他可能检测出来,嗯,都是已安装,所以的话我这边待会你们可能会看到就他呃装的会比较快, 但是这个是因为我提前把一些东西就是已经装过了,所以他会看起来快,但如果说你们把这些东西都装好了的话,他也会很快的,他也不会去像说真的去运行的时候卡,然后这个拍摄上看这里是缺失的,那是因为我这边装的是一一一版本的三点一版本,然后这个去检测这个的话就看起来是是缺失的,然后这个东西我们自己到时候可以自自查一下, 这就是他官方提,官方提提供的一个一键安装的一个脚本,然后我们来运行一下啊。 呃,我们在运行这个的时候一定要注意到,因为它是一个 linux 环境,所以有些提示跟我们的 windows 有 些区别,然后包括有一个点啊,就是它让你去输 password 的 时候, 它是没有任何提示的,就你去输入文字的时候,它全部是空白的啊,我们在运行这个一键安装脚本的时候,它这种反应的话,只要它没给你提示错误或者是怎么样,你就等一下,因为它没有一个进度的,它是没有进度条,所以的话你只能够去等, 然后你超过五分钟或者十分钟他还没反应话,大概率就是有问题。 ok, 我 这边的话他还在安装过程当中啊,然后但是我们可以来看一下他这边跳出来的这些东西,是不是就跟我们刚才说的这些必须要安装的环境,尤其是这里面的技术就很容易被卡的地方。首先的话我把我这之前安装的过程当中遇到的那几个就是容易被卡的地方,然后都有做一些介绍怎么去解决。 比如说这个呃 u v 默认他一键安装的时候,他确实都可以把它安装上,然后但是可能你知道网络的问题,对吧?然后我们是有些他没办法直接让你去安装,那 ok 我 们就怎么干呢?就是自己去把这个给安装上,就这样子他可能会报这些错,然后我们怎么去用?其实就是用国内镜像把它给安装好,就把这个 u v 给安装好, 然后这个安装好以后的时候,我我第二个也是,就是我的拍摄也没办法去装,然后我的解决方案一样是用镜像,嗯,然后包括我们的这个这个 low 的 load 的 话,它是这种情况,就是呃 load 这边是这样子的呀,就是我 load 的 那边是也是卡住了,然后但我直接去下载 load 的 时候,呃,也是没办法去下,后来是用的是呃 nv m, 先去下载了一个 nv m, 然后再用 nv m 去安装的 load, 然后这样子把这一个卡给过去了,这个卡给过了,那 我们比较重要的两个插件啊,一个是 raspberry 和 funpad, 这两个插件完了以后的时候,这两个插件的话,直接去用一键命令的话,它可能也会有点问题。如,但是,但是,但是我有另外台电脑,它装的时候它成功,然后这 这台电脑没成功过,然后也是手动去安装的。其实就其实说到现在的话,这些问题大概率都是镜像的问题就是,嗯,直接用一键安装的话,他可能还是比较兼顾海外的一些用户,对吧?然后我们国内的话可能就要辛苦一点,用一下国内的镜像 基本上就是用这种方式去解决的了。好,我这边已经安装好了,安装好以后的时候我们来看一下,我这边的话提供了 hermes agent 的 一些常用的一些命令,然后我们来把我们的那个向导就是配置向导给打开,也就是我们这一个这个命令直接去运行一下。 ok, 你 看这边这一件进到了说要去配置模型,那, ok, 我 这边的话就是去配置我们的我的一个模型。好,这个时候我们去选我的模型,然后我这边的话用的是 mini max 的, 然后你看这里有后面带 china 的, 这个 china 这个的话其实就是我们国内的一个通道,然后我们就选择它。 呃,这个 mini max 的 话你要注意一点哦,就是我们的 api key 是 分两种,一种是我们的那个 token 计费的,就是我们上面这个 api key, 然后另外一个是那个 token plan 的 一个 key, 然后我们要用如果你买的是那个 token plan 的 话,就要用这个,好把复制直接粘进去。 现在你看到了吗?其实我已经粘贴了,然后但是它没有任何的反应,因为这是一个加密的,所以在 linux 系统上所有加密的东西它都不会显示出来,直接 ctrl v 以后的时候 enter 就 行了。然后这里是看到没 api key saved 就 已经保存了,然后我们就去用它的一个 s 的 一个。呃, u r s l u r l, 然后这个这个是直接默认的,可以直接用的。 好,我们就可以去选择用我们的一个模型。好,这个时候我们的那个已经配置完了。好,我们就重新启动。 那现在你看,我们就开始配通道了。配通道怎么配嘞?来我们这边也是有的。呃,首先的话我们可以配微信通道,也可以配我们的那个飞速通道,他都是很简单,现在都是用二维码扫了,所以的话相当快。然后我这边的话先用个飞速吧, 然后这飞速的话它也可以扫扫二维码,就是如果你没有见飞速机器人,你直接用这个 q r 这 q r 扣的这一个,然后就直接扫码,然后如果说你要去配你已经有的机器人,你要把它换成这个的话,那就直接 a p i a p p id 这样子去配。然后这个的话是在这儿 啊,这个的话就是我自己新之前创好的啊,然后我是现在是重新绑定一下,我这个的创建的话本身就是用二维码扫码然后实现的,然后把这个 app id 粘进去,然后我们来复制我们的 app secret 复制好,你看到没有?现在又是这样子的。 好,现在的话其实就配置完成了。好,这个的话就是让我们说要不要用,然后这个的话就是让我们看一下要不要用配对模式,最好是用一下配对模式了,然后这个是群聊,群聊的那一块要不要把?就是允许群聊后,下面这个是不允许群聊,前面这个允许群聊打开。好,这个可以只字可选,按它就行了。好,现在我们在飞速通道就配完了,然后就让一个重启, 对于我们个人去用的话,用这个 user server 的 话就够,我们直接选择这个。 ok, 然后这就开始起用服务。好,现在我们可以来检查一下我们的。呃, hermes 有 没有,有没有启动成功? ok, 你 看没有飞速通道好了,我们这个的话就那个启动成功了,就是 round 的 状态,然后通道是飞速,然后我们来给他发一个消息,看一下,这个是我们的。这, 这是我之前连接的哈,你看吧,这里就让我们去配对码啊,我们把这个配对码给复制上来, 在这里输入。 ok, 看到没有?这里就配对成功了,然后现在我们可以正式跟它进行规划了。 呃,这个一点要注意到哦, hermes agent, 它跟我们的 opencloud 它不一样,它没有官方的那个 web 的 一个推对话的一个页面。呃,有第三方的话,那个开发出来一些插件可以去用,如果需要的话可以去下一下。 对于 harma 这一块的话,它的安装的问题的话,其实大部分都出在咱们的网络环境上面,因为它的那个一键安装的话,还是比较倾向于海外的一些用户,然后对于咱们国内的话可能稍微不是那么友好一点。那你遇到这种卡点的时候,你就直接问 kimi 啊,或者是,呃,但都包的话 勉强的用吧。呃。你把你的那个卡点在哪,然后复制给他,然后让他告诉你国内镜像是什么,你手动安装一下。呃。基本上这种的话就能够把我们大部分的问题给解决了。那今天分享就到这里喽,拜拜。

这是一条 codex 从零到一完整的新手入门教程。如果你之前完全没用过 codex, 或者只是听说过,但不知道它到底能干什么, 怎么装,怎么用,那这条视频你就可以收藏了。我会按照一个新手真正上手的顺序,带你从 codex 试什么,讲到安装、使用、主界面、怎么操作、基础功能和进阶技巧、 skills 插件、浏览器终端和自动化任务等等,让这个目前全球最顶级的 a 阵的工具真正为你所用,创造价值。 我也会把整个流程整理成文档,打一句 codex, 方便对照,一边看一边选。你可以先把它理解成一个装在电脑里的 ai 工作助手,他不是单纯陪你聊天的工具,而是可以进到一个具体的工作文件夹,帮你读取文件、修改内容、运行命令、调用工具,甚至按步骤完成复杂任务。 举个最简单的例子,像 chat、 gpt、 豆包这一类工具,更像是你问他答,你自己去做。比如你想做一个网页,他通常只会给你一段代码,接下来你还要自己复制代码、创建文件、运行、检查报错等等。而 codex 是 你问他,他理解他还做,他会从零到一帮你创建好这个网页。 目前最适合新手小白的上手方式呢,是桌面端 app, 我 们可以直接在官网开始,根据你的系统选版本, windows 或者 mac os 都可以。安装之后有两种登录方式,一种是官方 chad gpt 账号登录,另一种是用 apikey, 可以 是官方的,也可以用中转站。两种方式各有利弊。综合来看,还是建议第一种,直接官方账号登录, 省心省事。对于 codex 的 界面,新手可以先关注三个核心区域,最左侧是一些常见功能入口和聊天记录管理区,你可以理解为导航栏加历史记录。这里需要重点讲一下对话和项目的区别。对话最好理解就是普通聊天嘛,你甚至可以把它直接理解为 chat、 gpt 或者豆包, 适合随便问一些小问题,帮你写文案、查资料之类的。它不跟具体的文件夹绑定,而项目就涉及到了具体的生成式任务,比如 如飞哥之前开发的工具箱网站,飞剪一触即达这种软件,他们有大量的编程代码文件,就需要一个专用的项目文件夹。你在这里可以新建空白项目,也可以打开现有文件夹,直接选择路径,或者直接把文件夹拖进来也行。鼠标悬停在项目名上,也能看到这个文件夹在电脑中的 底位置。而对于重要的常用的项目和对话,右键就可以置顶,方便快速切换和查看。左侧下方还有设置入口,在设置里你可以修改 codex 的 使用偏好、外观和配置等等。其中个性化需要重点说一下, 如你想给他一个全局指令,就在自定义这里直接写,比如他要怎么称呼你,固定用中文回答问题,设定一些底线原则或者开发习惯,设置完之后对所有项目都会生效,相当于让这个员工摸清楚你这个老板的脾气,投你所好。这里还有一个很有意思的小功能,叫桌面宠物, 他提供了很多默认的宠物形象,你也可以根据自己的喜好让他帮你创建一个,比如我这个就是给了一张参考图,让他自己做出来的,他会实时显示当前任务的一些简单状态,还是挺好玩的。 在首页设置这里还能看到剩余用量,你可以清晰的看到五小时用量和一周用量,做到心中有数。中间这块就是你和 codex 的 主要沟通区域。首先是这个加号里面有两个非常重要的功能,一个是计划模式, 比如你让他开发一个个人博客网站,不要上来就直接让他干,而是让他先列出计划。相当于你给员工一个项目,得先让他出方案,看看他打算怎么做,这样能有效减少返工,既省精力又省 tokyo。 看啊,他会主动问我们这些具体细节,我们按选项敲定,不满意的或者他没提到的就补充一下,让他重新规划, 这才是一个合格的领导该干的事。而目标模式就更厉害了,刚上线的新功能就是你给他设定一个目标,越具体越好,他会自己拆解分析。执行审查,有一种不达目的不罢休的意思,这样就避免了一个很烦的问题,执行一个任务的时候,他每完成一步就要停下来问你。 比如我正在跑的一个很复杂的大项目,目前已经连续跑了三十多个小时,如果正常一步一步改的话,我可能要好几天才能做完这些进度。右边这个权限设置呢,分成三档,默认是最保守的,像是联网修改文件都需要你的授权,自动审查会开放一部分权限,关键节点还需要你把控。 而完全访问就是最激进的,它几乎可以完全操控你的电脑,创建文件、删文件、跑命令,全都自己干。新手,我不建议一上来就开完全访问,刚开始用默认或者自动审查更稳,等你确认这个项目没问题,也知道它要做什么,再考虑给更高权限。我自己是在非常熟悉项目和流程的情况下才会开完全访问。 右边这里还可以切换模型,选模型版本、智能程度和推理速度。如果不是特别复杂的任务呢?不建议开超高,因为它有可能会出现过度思考,而导致你花了更多的 token, 反而干的不好。 这是血淋淋的实战经验教训,一般来说默认高就可以了。这个麦克风是语音输入,但是体验目前并不是很丝滑,我们可以直接用语音输入法。 codex 还有一个和普通聊天很不一样的地方,任务可以排队,他正在执行的时候,你可以继续补充,要求这些新消息会一个一个排在后面,等他处理完当前步骤之后继续执行。比如他正在做网页,你可以接着说,页面再简洁一些,按钮换成黑色,先不要做登录功能等等。 而如果你忽然发现他理解错了你的意思,或者做了一半有点跑偏了,可以直接选择引导,强行把方向盘掰回来。所以用 codex 的 时候不一定要追求第一条提示词写的特别完美,你可以边看他做边补 充,边纠正边引导。真正好用的方式是把他当成一个正在干活的助手,而不是一个只负责回答问题的聊天框。这个思维一定要转变过来。 最右侧的区域目前包括三个功能,侧边聊天就是当前任务的一个临时讨论区。因为有时候 codex 正在执行一个主任务,但你中途想问点小问题,或者单独讨论某 个细节,就可以用它,它不会打断主对话的节奏。浏览器主要是 codex 打开网页查资料测试页面,比如你做了一个网站,可以让他直接打开本地页面,帮你检查布局按钮、交互有没有问题。如果你对某个地方不满意,还可以让他直接打开本地页面,帮你检查布局按钮、交互有没有问题。如果你对某个地方不满意,还可以让他直接打哪的感觉, 口头描述半天要精准的多。终端的话呢,其实你不需要了解太多,因为它主要是给 codex 执行命令用的。到这里,其实你已经看到了 codex 最核心的几种能力,它可以进入项目,读取和修改本地文件,可以用计划模式先想清楚怎么做,可以通过浏览器查资料测试网页,也可以通过终端运行命令检查结果。 所以 codex 真正厉害的地方不是某一个单独按钮,而是它能把这些能力组合起来,帮你完成一个完整任务。理解了这一点,后面的 skill 插件和自动化任务就很好懂了。 因为前面这些能力呢,解决的是 codex 自己怎么干活的问题。但如果你想让他干的更稳定,更像一个熟悉你习惯的助手,就需要用到 skill。 如果你想让他连接更多外部工具,就要用到插件。 这里很多新手分不清 skill 和插件,其实用一句话就能记住, skill 是 方法,插件是工具。 skill 可以 理解成一套可以附用的工作流,或者说给 codex 的 一份工作方法说明书。比如一家公司做项目,通常都有一套标准流程,第一步做什么,第二步做什么,输出格式是什么,有哪些注意事项,哪些地方不能乱改。 这些东西如果每次都重新告诉 ai 一 遍就很麻烦,而且 ai 它还可能每次理解的不一样。所以更好的方式是把这套工作流程固定沉淀成一个 skill。 这样 codex 下次遇到同类任务时,就不用像一个新员工一样重新摸索,而是直接按照你写的流程和标准来做。 比如我自己的飞鸽工具箱里就有很多专属 skill。 比如把好用的软件保存入库到本地,同步到我正在做商单推广的几个云盘,生成下载链接,再同步到正式站,这些流程全都是固定的。 我把它们写成 skill 之后, codex 就 可以按这套流程稳定执行,不会每次都跑偏。再比如,你经常写短视频文案,也可以让 codex 帮你做一个短视频文案 skill, 把你之前写过的大量文案喂给他,让他总结你的开头风格、结构、习惯语言表达、结尾方式,然后形成一个专属文案助手 后,再写类似内容的时候, codex 就 会优先按照这套方法来。插件就不一样了,插件更像是给 codex 装上外部工具,解决的是它能不能操作某个平台,处理某种文件,连接某个服务。 比如浏览器插件,可以让 codex 打开网页查资料、测试页面表格插件可以让它处理 excel、 ppt 插件可以让它生成演示文稿。 gmail 插件可以让它整理游戏, camera 插件可以把生成的内容导入到设计工具里继续编辑,所以不要把他们想的太复杂。 skill 解决,怎么做插件解决用什么工具做?一个是工作流程,一个是工具能力。 codex 目前已经集成了很多实用的插件和 skill, 我 也整理了几个比较常用的,大家可以截图保存,后面自己试试看。 最后我们再来看一个比较进阶但非常有想象力的功能,自动化任务。你可以先理解成让 codex 在 固定的时间、固定的项目里自动帮你做一件事,但它和普通题型软件不一样,它们最多告诉你该干什么了。 而 codex 的 自动化任务是真的可以帮你执行一整套流程。比如你是做内容创作的,你可以让他定期帮你收集某个领域的热门选择题,整理成标题、角度、参考链接和可以拍摄的脚本。而飞哥最常用的就是每天固定时间设置一个今日任务清单,划掉昨天已经做完的,生成当天新的任务, 就像一个机器人一样按清单执行。这也是为啥有人说我效率那么高,一个人干八个人的事情。除了 ai 的 强大助力之外,任务规划本身也非常重要。所以自动化任务真正厉害的地方不是定时提醒,而是定时让 ai 按你的要求去干活。 最后再补充一个很多人会关心的问题, codex 能不能在手机上用?据我所知有三种方式,最早大家都是用 happy 这种开源项目,它可以连接 codex cloud code, 电脑上开个任务就能通过手机和 agent 的 沟通,但始终不太方便,相当于只是给你安排了一个传话筒。 而 codex 的 mac 版本最近更新了手机端的入口, chat gpt app 里面就有 codex 可以 完整读取你的聊天记录。在手机里聊天和电脑端的消息是完全同步的,本质上是远程链接,相当于把你的电脑版正在跑的 codex 搬到了手机里。而最近我发现了一种非常爽的方式,就是网易的优优远程, 出门的时候手机直接远程连电脑,操作起来很方便,最关键的是你能同时测试它的改动,这就相当于把你整个电脑都装进了手机,所以功能最完整。 好,最后我们来个回顾,总结一下你都学了什么。如果你是第一次接触 codex, 其实今天不用记住所有按钮,也不用一上来就研究特别复杂的自动化和插件,你只要先记住这条主线就够了。第一, codex 不是 普通聊天工具,它更像是一个能进入你电脑工作区的 ai 助手。第二,临时问问题,用普 对话,真正要处理文件、项目代码、文档就用项目。第三,复杂任务不要直接让它开干,先用计划模式让它列方案,如果是一个长期目标,再考虑用目标模式让它持续推进。第四, skill 是 方法,插件是工具。 skill 负责告诉 codex 怎么做事儿,插件负责让 codex 连接浏览器、表格、 ppt 邮箱这些外部工具。第五,自动化任务不是简单提醒,而是让 codex 在 固定时间按照你设定好的流程自动干活儿。 所以新手今天先做三件事就够了。第一,安装并登录 codex 桌面端。第二,建立你的第一个项目,找一个真实的小任务试一下,比如整理一个文件夹,总结几篇文案,或者生成一个简单网页。第三,让 codex 帮你写一份自己的 agents, 点 m d 就是 我们刚才提到的个性化。现在你让他自己干,把你的 称呼、语言、习惯、输出格式、工作偏好都写进去。当你把这三件事跑通之后,你就不只是会用一个 ai 工具了,而是开始拥有一个真正属于你自己的 ai 工作站。祝你越来越牛逼!

欢迎大家今天我们一起继续闯 ai。 上一期我们搞了一场赛搏斗蛐蛐,本期我们换个话题,让两位选手休息一下。大家可能都见过这个与 hermes 聊天的界面,说不上好看, 更谈不上好用。也可能见过 hermes 带 check 功能的 dashboard 界面,而 opencloud 的 dashboard 在 拉跟 hermes 的 一比,竟然眉清目秀了许多。 hermes 自然不愿意被小龙虾比下去,所以 hermes desktop 它来了。今天我们就来介绍一下如何安装和出场配置这个工具,帮大家避避坑。 hermes desktop 在 github 上目前接近八 k 星标的太原工具,可以从 github 页面上点击下载按钮或跳转到 hermes agent 四 cc 来下载,也可以免魔法直接到这个网站来下载,双击即可安装,然后自动进入欢迎界面。如果选择 get started, 则程序会问你是自动安装一套 全新的 windows 原声版 hermes, 还是选择使用在 windows 中已安装好的原声版 hermes? 它是无法直接识别在 wsl 中安装的 hermes 的。 因此,如果你的 hermes 是 已经在 wsl 中安装好并运行的,那么大坑就已挖好。一、 wsl 上没有 ssh 服务。 二、 windows 没有配置免密码 ssh 登录 wsl。 三、 hermes 一 般不会自行开启 api server, 那 么 开始动手填坑吧。先去 wsl 中把 api server 打开,方法是 hermes 服务器文件中设置四个参数,然后重启 gateway 端口被检测,说明 api server 已开启。再去 windows 中生成密钥对比,复制 idezer tag 到 wsl 的 指定目录中。 在 wsl 中先安装试服务检查状态,并设置开机自启动,然后把 windows 上传的 id the pop 文件内容写入 authorized keys, 这样 windows 就 能免密码 s s h 登录 wsl 了。 此时再回到 hermes desktop, 点击 connect y s s h 并填入信息,即可全功能连接到 wsl 中的 hermes。 为什么强调这个选项可以全功能连接?因为选择 connect to remote hermes 的 话,就只能聊天、查看 skills 等功能都会提示在远程模式下不可用。现在可以把每个功能都查看一下是不是完整,然后安装 call 三 d, 这个能帮我们给 hermes 安排个办公室的功能。点击 install 按钮后,由于是从 github 上下载代码,所以有概率失败。按照前几期我们提到的办法,可以手动从 github 上下载代码,放入指定目录,然 然后再次点击 install 按钮,程序会自动探测到以克隆的代码,并自动安装依赖。等待一段时间后, hermes 的 卡通办公室就出现了。 hermes desktop 的 安装和出场配置也基本完成,需要视频力命令和文档的朋友可以点个赞和关注,然后私信我。 下一期 hermes 选手将再次登场,但交给他的将是一个不一样的挑战。如果你也在用 ai 搞事情,点个关注,欢迎交流,我们下期见!

看好了宝子们,今天是五月二十八号,这个最新的和平密钥透已经给你们安装完成了,全程工艺安全稳定,不会使用的小伙伴快来看一看这一期详细教程。首先我们先返回 将这两个软件安装完成,然后我们再点击这个小飞鸟,点击上方搜索框,输入飞侠美化, 点击搜全网,再点击这个飞侠美化,点击这个密钥透保存去查看,点击这个布丁,然后我们可以点击这里安装,安装完之后返回,再点击这个获取口令距离加载 开始阅读,然后我们会长按这个文本并复制,复制完之后返回打开 u c 等待一下,它会弹出一个链接,立即查看保存至网盘, 点击这个和平密钥透,再点击密钥透工具全部解压,解压完成之后再点击这里工具, 选中这个微分身安装弄桌面,不用管进另外一个就点击这里这里,然后我们就点击这里这个卡密, 进入之后我们可以看到这里有一串英文文本,你就长按它就可以复制,复制完之后返回就打开这个软件, 我们就会重新进入游戏,重新进入游戏后,我们点击这里的立即查看,点击授权登录就可以和我现在这个是一样的了。

今天的目标是手把手教大家安装 skills, 零基础小白友好,同样的 agent, 搭配同样的模型,为什么人家做出来的效果就是不一样?差距其实就在一个东西上, 人家装了 skills 做行业调研报告,没有安装 skill 的 时候, agent 无法搜索网络上的公开信息,只能依靠过时的训练数据来写报告。而安装了 skills, agent 不 仅能举出近期的真实案例,还能列举出来所有的真实信息来源。再比如,做 ppt, 没有安装 skill 的 时候, agent 的 配色一如既往的蓝紫色渐变,而安装了 之后, agent 的 设计的 ppt 瞬间变得更高级了,切换的动效也很丝滑。那 skill 到底是什么?为什么能让 agent 一下子变得这么强? 我用一个类比讲清楚,先想象我们的 agent 是 一个特别能干,什么都愿意帮我做的通才助理。通才的优点是什么都能做,缺点是每一件事都不够专业。而 skill 就是 我给这个助理喊来的一个领域专家,可能是一个 ppt 设计师,也可能是一个调研分析师。这个专家手里揣的那本书,是他在这个领域多年经验沉淀的 s o p, 踩过哪些坑,什么做法好,什么 细节不能漏,全都写在里面。我交代任务的时候, agent 会先翻这本书,再照着专家的方法去做。这就是为什么有的人做出来的东西就是不一样,表面看是同一个 agent, 背后其实站着一整排的领域专家。今天第一个要给大家推荐的 skill 就是 这个叫 agent reach, 它在开元社区上已经有超过两万的 star。 简单来说,这个 skill 就是 能够给 ai agent 们一键装上互联网的能力,有了这个 skill, agent 们就可以去解锁最新的网络上的一些公开信息。我们尝试用 npx 的 命令去安装这个 skill。 skill 已经安装成功了,我们需要重启让它生效。斜杠输入 agent, 用上下箭头去找到要用的 skill, 找到了之后不要急着按回车,因为回车会直接把消息发送出去,这个时候应该要直接按 tab 键, tab 键是把这个 skill 的 名称补充到输入框,复制作调研报告的 prompt 发送给 agent, 它已经在读取 agent reach 这个 skill 的 文件了。这里提示 agent reach 安装完成, excel 搜索已可用。现在开始正式的调研了。 pdf 文件已经保存成功了,我们可以打开看一下。但是这样的一个 pdf 文档还不是很利于阅读,那我下一步我想要把它转成一个 ppt 文档。今天要给大家推荐的第二个 是归藏老师的一个 ppt skill。 这个 skill 在 开源社区上已经有超过一万的 star 了,它主要是能够让 agent 们去做出来非常好看的 ppt。 这里有电子杂志风,瑞士国际主义风。我们同样是通过这个 n p 叉的命令去安装 skill, 复制 n p 叉命令可以新开一个终端 发送出去。这里中间有一个问题是你希望安装给哪一些 agent? 然后有一些通用的 agent 都在这边已经默认勾选上了,还可以去选择一些其他的 agent。 空格键是选择回车就是确认。这里是问我们 安装的范围是仅在当前这一个项目内可用还是全区可用,那我这里选择的是 global 全区可用上下切换,然后回车,推荐 simlink 的 方式回车是否确认安装? yes, 这里是问我们是否要安装这个,帮你查找 skill skill 强烈建议大家去安装上这个的,这样的话以后 agent 就 可以自动帮你去查找 skill 了。到这一步的时候,我们已经把这个 skill 给安装好了,这时候我们可以启动 agent, 斜杠 ppt 就 已经可以找到我们刚刚安装的规范 ppt, 然后 tab 键输入这个 skill, 再把我们之前准备好的这一段做 ppt 的 prompt 同样的复制过来。 因为有 skill 的 缘故,这里 agent 呢会先问我视觉的风格,他推荐我选择瑞士国际主义,那我们就 follow 他的推荐选哪套主题色克拉英兰。 agent 呢?开始读 skill 文档了, agent 呢,已经写好了一个 ppt 的 html 文件。哇,这个背景居然是会动的耶!这是没有 skill 的 时候,这是有 skill 的 时候。 不多说了,赶紧去安装这个 skill。 第三个要推荐的 skill 是 花书的这个 design skill, 很多人在 webcoding 的 时候会觉得 agent 做出来的网站前端设计太丑了,花书的设计 skill 就是 来解决这个问题。这是 webcoding 从零到实战系列的第三期,我们下期见。

我嘞个逗,我兄们大得了,现在你腾讯刚刚发布了这个马维师,恩,很多小朋友还抱着去下载安装,听着我吹起详细的视频教程,一步一步教会大家安装苹果都是可以免费下载。 第一步呢,点右视频右下角小箭头这里分享链接,我们打开右上键,再打开这一个,在这里我们搜索小婷的梦,点进来打开转键捐元宝,找到这一个,取消全选勾选保存,再去下载安装就可以了。

前两集呢,我们讲了 cloud code 的 安装,还有使用 web coding 来开发应用程序。那今天是我们从零学习 ai 的 第三集,我们今天要讲三个东西,第一个就是 skill 的 安装,第二个是 api 中转站,第三个是 用 ai 自己来生成想要的一个视频。可以首先我们来讲什么是 skill skill 在 第一集的时候我提过一嘴,简单来说的话,它可以理解成给我们的 ai agent 去增加一个技能,比如说我装的这个 skill 叫做 superpower 啊,这个 skill 呢,在网上是一个比较火的 skill, 它是一个 skill 的 组合包,里面包含了很多不种啊不同的 skill, 那 其中我用的比较多的是一个叫做 brainstorm 的 一个啊头脑风暴这样一个 skill。 我 每次在跟我的 cc 聊需求的时候呢,我都会对用调用这个 skill 来让我的 cc 跟我进行主动和深入的讨论,让我的这个需求变得更加明确,更加细化。 skill 装在哪里呢?局都能调用的 skill 就 装在局的点 cloud 下面的 skill 文件夹里面, 如果是单个项目的,你就装在单个项目单个项目下面的 skill 文件夹里面。那具体我们去哪里找这个 skill? 我 把两个找 skill 的 方式 放在了评论区。第二个东西, api 中转站,这个名词听起来非常基础,对吧?其实你就把它理解成一个加油站就 ok。 我们开车需要加油,但我们不会去炼油厂直接买油,我们去的都是路边的加油站,那么 ai 也一样,如果说我们直接去官方 买 api 的 话,又贵又要海外的信用卡比较麻烦,那中转站就是加油站的角色,他们把价格打下来,而且不用让我们自己去劳腾信用卡注册就能用。 那么经过这两周的一个找寻呢,我终于找到了一个 ai 的 聚合网站,里面不仅包括了中转服务,还包括了咱们市面上所有的 ai, 它就像一个 ai 超市一样,用不同的 ai 再也不用来回导了。 在这个 ai 聚合网站里面呢,我使用了两种不同的视频生成 ai, 快 乐马和马斯克旗下的 group video, 我 给他们两个同样的一段视频生成的提示词啊,大家可以看一下他们两个生成的视频,对比一下哪种风格你更喜欢呢? 其实总的来看,他们两个把我的提示词完成的都差不多,只不过呢, groc video 它的视频的风格可能会更卡通化一些,而快乐马的话呢,对比起来还会更显实一些。 那我个人而言的话,是更喜欢快乐马的这种风格,因为它最大程度的还原了我们家的猫咪。 ok, 这就是我们丛林学习 ai 第三集的全部内容,大家如果有什么疑问的话呢,欢迎在评论区扣出来,来一起讨论一下。

你是不是还在手动写代码?一个 bug 调半天,改一行崩一片。今天带你从零开始,彻底掌握 cloud code 这个能让编码效率起飞的 ai 编程助手。它是 antropic 出品的命令行工具,直接在终端里帮你写代码,调 bug、 做重构、搞自动化。跟那些只会补全代码的插件不一样, cloud code 能理解整个项目的上下文,帮你完成从分析到实现的完整链路。这一期内容非常多,从安装配置到高级玩法,总共分成七个大板块,全部给你讲透。先说第一板块安装,安装过程特别简单,跟着做就行。 前置条件只有一个,你的电脑需要有 node js 一 八以上版本。如果你不确定自己有没有装 node js, 打开终端,输入 node version, 看一下版本号,如果是十八以下,或者提示命令不存在,就去 node js 官网下载最新版安装。 如果你是 windows 用户,还需要提前装好 git for windows, 这个在 git 官网就能下载。准备好之后打开终端, mac 用户用 terminal, windows 用户用 powershell, 输入这行命令,回车之后等它跑完就装好了,整个过程大概十秒钟,不过 windows 用户可能会踩一个坑。 解决办法很简单,打开 power shell, 以管理员身份运行,执行 set execution policy unrestricted scope user。 搞定之后,重新打开终端,输入 cloud version, 看到版本号就说明安装成功了。 第一次运行 cloud 会要求你登录,支持邮箱登录和 s s o 企业登录。如果你的公司用的 okata 或者 azure a d, 直接选 s s o 登录就行, 到这里安装就搞定了。但很多人的痛点是 antropica 的 a p i 额度不够用,或者网络访问不稳定。第二板块我们来解决这个痛点,讲讲第三方模型接入。好消息是 cloud code 支持接入第三方模型,最推荐的是 deep seek。 deep seek 的 推理能力很强,而且价格只有 antropica 的 几分之一。接入方式很简单,只需要设置三个环境变量。 第一个是 antropic b 四下划线 u r l 设为 h t t ps 冒号斜杠, a p i 点 d e e p s e e k 点 com。 斜杠 a n t h r o p i c 这个地址是 deep sea 提供的, antropic 兼容接口,协议完全一样,不需要改任何代码。第二个是 antropic offset token, 填你的 deepsea api key, 去 deep seek 开放平台注册账号,创建 api key 复制过来填上就行。第三个是 anastropic model, 设为 deep seek 杠 v 四 pro。 如果你需要更长的上下文窗口,可以用 deep seek 杠 v 四 pro。 杠 e m。 支持百万投肯。 这三个变量可以直接写在终端里 export, 也可以加到你的点 z s h r c 或者 bash r c 配置文件里,让它永久生效。加完之后记得 sos 一下配置文件,然后直接运行 cloud 就 能用了。 如果你觉得手动配置环境变量太麻烦,或者你想在不同服务商之间快速切换,推荐用 c c 杠 switch 这个开源桌面工具, 它是基于 torry 二构建的图形界面,应用界面干净,操作直观。内置支持五十多个 ai 服务商的配置,包括 open ai、 google mister 等主流厂商。安装也很方便, mac 用户直接 pro install c c switch, windows 和 linux 也可以从 github 下载安装,包 装好之后在界面里一键切换,服务商还能管理 m c p 配置 skills prompts, 它甚至有费用统计功能,可以清楚地看到每天花了多少钱在 api 调用上。另外一个选择是 cloud core router, 简称 c c 二,它的特点是智能路由,可以根据任务类型自动选择最合适的模型。 比如简单的文本编辑,用便宜快速的模型,复杂的架构分析,用最强的模型,还支持在对话中用斜杠 model 命令动态切换模型,非常灵活。 除了这三个方案,你还可以用 openroute 作为统一代理,它聚合了几十种模型,按需付费。配置方式和 deep seek 类似。 第三方模型接入,说完了选哪个,看你的需求和预算。接下来第三板块配置体系。 cloud code 的 配置体系设计的挺讲究,分五层优先级,从高到低,最高是托管策略,这是企业 it 管理员设置的,普通开发者不用管。 然后是命令行参数,比如 model permission 杠 mode 这些。第三是本地设置,存在 box cloud settings 到 local 到 j s o n 里不会被 get 提交。 第四是项目设置,存在,点 cloud 斜杠 s e t t i n g s, 点 j c 里,跟着项目走,可以提交到 get, 让团队共享。 最低是用户设置,存在用户主目录的 cloud cloud settings, 点 j 森里只影响你自己,上面的层级会覆盖下面的,这个很好理解,对大多数开发者来说,日常只需要关注项目设置和用户设置这两个文件。推荐把常用的权限规则配好,比如自动允许 npm run 开头的命令,还有 git status, git diff 这些,只读命令, 这样 cloud code 干活的时候就不会每一步都跑来问你同不同意了。你还可以配置忽略列表,让 cloud code 不要碰某些敏感目录,比如密钥文件、日制目录。再说几个特别有用的环境变量都可以加到你的,是要配置文件里。 第一个, enable prompt catching e h 设为 e, 开启一小时的提示缓存。 cloud code 每次调用 a p i 都会发送大量上下文,包括系统提示、你的对话历史、 cloud 点 m d 的 内容。开启缓存后,这些相同的前缀内容会在 a p i 侧缓存下来,后续请求可以直接附用。 对于长时间编码绘画,这个功能能帮你省下百分之三十到百分之五十的费用。第二个, cloud underscore code, underscore attribute underscore header 设为零。关闭归音投信息,这个投信息会在每次 api 调用里附带来源标记,告诉 on topic 这个请求来自 cloud 的 code。 关闭,它可以减少不必要的 token 消耗, 虽然每次省的不多,但积少成多也是一笔不小的节省。还有一个特别实用的功能叫 cloud 点 md, 你 可以在项目根目录放一个 cloud 点 md 文件,每次启动 cloud code 都会自动读取它,在里面写上项目的基础站、编码、规范、架构、决策,甚至常见的坑和注意事项, 相当于给 ai 一个持久的上下文记忆,它每次对话都会参考这些信息。你还可以在子目录里放局部的 cloud 点 md, 比如在 s r c components 目录下放一个, 当你在那个目录下工作时,它会自动叠加加载,既有全区规范,又有局部细节。 cloud 点 m d 支持 markdown 格式,可以写标题列表,代码块非常灵活,建议把以下内容都写进去,项目架构概览,依赖版本要求、测试命令部署流程、已知问题和临时解决方案配置。说完了第四板块命令详解。 先说启动方式,最基本的就是直接输入 cloud, 进入交互式对话模式。你也可以在后面跟一句话,比如 cloud 解释一下这个项目,它会直接回答,然后进入对话。 加 p 参数是管道模式,只输出结果,然后退出,不会进入交互界面。这个特别适合写自动化脚本,比如把 cloud p 签到你的 c i 流水线里做代码审查, 或者用管道组合,比如 get diff, 管道传给 cloud p 生成变更摘样。 c 参数可以继续上一次的对话,很适合中断后恢复工作。 r 参数可以从历史记录里恢复之前的某个绘画。 输入 cloud 杠 r 会列出最近的绘画列表,让你选 model 参数,可以切换模型,比如 model opus, 用最聪明的模型处理复杂架构问题。 model sonata, 用最快的模型处理日常编码。 w 参数是 walk tree 模式,会在隔离的 get 工作目录里干活,完全不影响你主分支的代码。这个后面讲高级功能的时候会详细说。 b g 参数,让 cloud 在 后台运行,你可以继续在终端做别的事。用 cloud agents 查看所有后台任务的状态。用 cloud attach 加任务 id, 切入某个绘画。进入交互模式之后,斜杠命令才是你的日常武器。斜杠 help, 查看所有可用命令,这个在你忘记某个命令的时候随时查。 斜杠 clear, 清空当前对话,重新开始,相当于刷新了一页。斜杠 compact 是 我用的最多的命令,聊太久,上下文窗口不够用了,就靠它。它会把之前的对话压缩成摘样,释放空间让你继续聊。你还可以在后面加指令,比如斜杠 compact, 保留所有错误信息和当前的调试,假设 这样压缩后重要的信息不会丢,只有废话被清掉了。斜杠以内会在项目里自动生成 cloud 点 m d 模板,它会扫描你的项目结构,自动填充基本信息,一键搞定项目配置。新手特别推荐用这个 斜杠 model 替换模型,不用退出当前对话就能换模型。斜杠 effort 调整努力程度,设为 low, 它会更快更省 token。 设为 high, 它会更仔细更全面。日常编码用 low 就 够了。架构设计和复杂 bug 用 high 斜杠 code review 做代码审查,加 fix 参数,它不光找问题,还能自动帮你修好, 审查结果会按严重程度分类,安全漏洞、性能问题、代码风格一目了然。斜杠 plan 进入规划模式,只分析不动手,特别适合做架构设计的时候用。它会输出详细的方案让你审阅,确认没问题再让它执行。 斜杠 b t w 是 旁路提问,你在重构代码的时候突然想到一个问题,用斜杠 b t w 问一下它回答完不会偏离主线任务。第五板块高级功能。 先说 permission system 权限系统,这是 cloud code 安全体系的核心理解,它很重要。它有六种权限模式,第一种是默认模式,每次涉及文件修改或命令执行,都要你确认,适合新手。第二种是 accept edits 模式,自动接受文件编辑,但执行命令还是要确认。 这个模式适合你信任他的代码修改能力,但想控制命令执行的场景。第三种是 plan 模式,只允许分析和规划,不能修改任何文件。做架构设计的时候用这个,不用担心他偷偷改你的代码。 第四种是 auto 模式,自动接受所有操作,适合你信任它的场景,或者在你已经把 allow list 配好的情况下使用。第五种是 don task 模式,跳过所有提示,配合白名单使用。 c i 环境下常用这个,因为没人能手动确认。第六种是 bypass permissions, 完全跳过全线检查,只建议在全自动化的 c i 环境用。 接下来讲 tools 系统。 cloud code 内置了一套强大的工具集,是它操作代码和系统的能力基础。 read 工具,读取文件,可以指定行号范围,对大文件很友好。 edit 工具,精确替换文件内容, 它不是覆盖整个文件,而是指替换匹配的部分。 write 工具,写入新文件,或者完全重写已有文件。 bash 工具,执行终端命令,这是最强大的工具,也是全线控制的重点。 glob 工具,按模式搜索文件内容,支持正则表达式。 agent 工具,可以派生子 agent 去独立完成子任务,这是多 agent 的 写作的基础。 web search 工具,搜索互联网,获取最新信息。 web fetch 工具,抓取网页内容。你还可以在 custom agent 里限制或扩展每个 agent 可以 使用的工具集合。比如让一个 agent 只能用 read 和 grab 做成只读分析 agent, 安全性更高。 或者给他加上 wifi 工具,让他能联网查资料。现在说 skills 技能系统,这是 cloud code 最灵活的扩展机制之一。 skills 本质上是 s k l l 点 m d 文件, 放在用户目录的 cloud skills 或者项目目录的 cloud skills 下,每个 skill 文件就是一个 markdown 文档,里面有 y a m l 前置信息,定义、出发条件和使用说明。当用户输入匹配的内容时, cloud code 会自动加载对应的 skill。 比如你可以创建一个 deploy 点 md 技能文件,里面写好部署流程 以后,只要说部署,它就会按照技能文件里的步骤执行。 skills 还支持动态上下文用繁引号、感叹号加命令的语法。比如在 skill 里写上繁引号、感叹号, p i t branch show current。 加载时,它就会自动执行这个命令,把当前分之名注入到上下文里。这意味着你的 skill 每次使用时都能拿到最新的环境信息。你甚至可以在 skill 里引用其他 skill 实现技能的组合和附用。比如一个部署技能,可以引用一个构建技能,先构建再部署。再来说 m c p model context protocol 模型上下文协议 m c p 是 让 cloud code 连接外部服务的桥梁,极大扩展了它的能力。边界配置方式有两种, 在 settings 点 jason 的 m c p servers 字段里全区配置,或者在项目跟目录的点 m c p, 点 jason 文件里局部配置,跟着项目走。目前社区已经有上百个 m c p。 服务器,实现, 覆盖了各种场景。数据库方面有 postgraduate sql, my sql, s q l t 的 m c p。 服务器,接上之后, cloud code 都能直接查询你的数据库结构且更准确的 c p。 云服务方面有 a w s g c p s u r 的 m c p。 服务器, 让它能直接操作你的云资源查看。日制管理配置开发工具方面,有 gitlab jira 的 mcp 服务器,让 cloud code 直接操作仓库创建 issue 管理 pr。 还有 slack, notion, linear 等办公工具的 mcp 服务器。配置一个 mcp 服务器通常只需要几行, jason 指定 command 和 aux 就 行, 比如配一个 get up m c p 只需要写好命令和 token, 然后是 hooks 钩子系统,这是 cloud code 的 自动化利器,能帮你省掉大量重复操作。 hooks 可以 在三十多个生命周期事件上触发,比如工具调用前后的 pre two use 和 post two use, 文件编辑后的 post edit, 对 话开始时的 session start, 对 话结束时的 session end, agent 启动和停止时的 agent stop 和 agent stop。 支持五种类型的钩子, 很慢的类型执行 shell 命令。最常用 h t p 类型发送 http 请求,适合通知外部系统。 m c p to 类型,要用 m c p 工具实现跨系统联动。 prompt 类型,注入提示信息,动态修改 cloud 的 行为。 agent 类型,触发子 agent, 实现自动化工作流。举几个实用例子, 可以在每次文件编辑后自动运行 e s lund 检查代码质量,在对话结束时自动生成变更摘样发送到 slack 通知团队。在八十命令执行前检查是否包含危险操作,比如 r m 杠 r f, 防止误删。 在 agent 完成任务后自动运行测试套件验证结果。这些 hoops 配置在 settings 点 jason 的 hoops 字段里,格式清晰,维护方便。接下来讲 custom agent, 自定义 agent, 这是 cloud code 高级玩法中的核心功能,你可以在 on cloud agent 目录下创建 markdown 文件来定义自己的 agent。 每个 agent 文件支持丰富的 frontmatter 配置。 name 定义 agent 的 名称, description 描述用途和出发条件。 course 指定可用的工具列表,精确控制 agent 的 能力范围。 model, 可以 指定使用的模型,比如让简单任务用嗨控省钱。还可以设置 temperature 控制创造性 max tokens 限制输出长度。举个例子,你可以定义一个 security reviewer agent, 只给他 read 和 grab 工具,让他专注做安全审查,不能修改任何代码。或者定义一个 front 10 dev agent, 专门写 react 组建,只能操作 s r c 目录。再定义一个 back 10 dev agent, 只能操作 api 目录和数据库相关的文件。 custom agent 让你能把复杂工作流拆分成专业化的子任务,每个 agent 各司其职。现在说说 custom commands 自定义命令,这个功能让团队写作效率翻倍。你可以在 cloud commands 私密目录下创建 markdown 文件,文件名就是命令名。 比如创建 review md 文件,就可以用斜杠 review 来出发,文件内容就是发给 cloud 的 提示词,支持用美元 increments 电量接收命令参数。比如你可以定义一个斜杠 deploy 命令,自动执行部署流程参数,指定环境 或者斜杠 test 命令,自动运行,测试并分析结果参数指定测试文件。还可以定义斜杠 d b 杠 migrate 命令,自动生成数据库迁移文件。这些自定义命令可以提交到 git 团队所有人共享,保证大家的工作流一致。 第六,板块性能优化和省钱技巧第一个技巧是 prompt catching 提示缓存 cloud code, 每次对话都会发送大量上下文,包括系统提示、 cloud 点 m d 历史对话等。开启缓存后,相同的前缀内容会在 api 侧缓存五分钟,后续请求可以直接附用我们前面提到的 enable prompt catching 下划线 e h 环境变量, 把这个缓存时间延长到一小时。这意味着你在多轮对话中,系统提示和项目上下文部分几乎不花钱。对于长时间编码绘画,这个功能能帮你省下百分之三十到百分之五十的 api 费用。第二个技巧是合理使用斜杠 effort 命令。异常编码任务设为 low, 它会更简洁高效,减少不必要的推理和解释,复杂架构分析和 bug 调试设为 high, 让它更深入思考。第三个技巧是擅用斜杠 compact 命令,上下文窗口满了之后, api 调用会越来越贵,因为每轮都要发送全部历史 compaq 压缩历史后,后续调用发送的数据量大幅减少,直接省钱。第四个技巧是选择合适的模型,简单任务用嗨哭,它是最便宜的,速度也最快,日常编码用 sony, 性价比最高。复杂架构问题,采用 opus 虽然贵,但质量最好。用第三方模型如 deepsea, 可以 进一步降低成本。第七板块, memory 系统, root tree 和 background agents 先说 memory 系统记忆系统,这是一个容易被忽视但非常实用的功能。 cloud code 记忆存储在点 cloud 斜杠目录下的 markdown 文件里,分为用户级记忆和项目级记忆。用户级记忆存在用户主目录的点 cloud 斜杠下,跟着你走,所有项目共享项目级记忆存在项目的点 cloud 下跟着项目走,团队可以共享。你可以在对话中直接让 cloud 记住某些信息, 比如记住我篇号,用微 test 做测试,记住这个项目用的是 p n p m, 不是 n p m。 也可以用斜杠 memory 命令查看和编辑已有的记忆。记忆系统让 cloud code 能在跨绘画中保持对项目和偏好的理解。比 cloud 点 md 更灵活, 因为它可以在对话中动态更新,不需要手动编辑文件。 cloud 点 md 是 静态的配置, memory 是 动态的积累,两者互补。 walk tree 模式前面提到过,这里展开说一下。当你用斜杠 walk tree 或杠 w 参数启动时, cloud code 会创建一个独立的 getwalk tree, 它有自己的工作目录和分支,完全隔离于你的主分支。这意味着你可以让 cloud code 在 walk tree 里放心大胆的重构,不用担心搞坏现有代码。如果结果满意,合并回来就行, 如果不满意,直接丢弃这个 work tree, 主分支完全不受影响,特别是合作实验性的修改,大规模重构,或者同时处理多个不相关的任务。 background agents 是 多任务并行的关键。用 b g 参数可以启动后台 agent, 或者用斜杠钩和斜杠 look 命令管理它们。 斜杠钩让 agent 自主追求一个目标,它会自己规划步骤并执行。比如斜杠钩把所有 class 组建改成 hux 组建,它会自动扫描,逐个修改跑测试。斜杠 look 让 agent 循环执行某类任务,比如持续监控测试结果。你可以同时启动多个后台 agent, 一个写前端页面,一个写后端 a p i, 一个写单元测试,三条线并行推进。用 cloud agents 查看所有后台任务状态。用 cloud attach 加任务 id, 可以 随时切入某个后台会话,看看它干得怎么样。这种多 agent 并行的模式特别适合模块之间藕合度低的大任务 id。 一、 集成方面, cloud code 支持 vs code 和 jet brains 全家桶在 vs code 里安装 cloud code, 选中代码右键发送给 cloud, 或者在终端面板里直接对话。 jet brains 系列同样支持在 terminal 工具窗口里启动 cloud code 就 行。 i d e。 集成的好处是不需要在编辑器和终端之间来回切换,工作流更顺畅。 remote node 远程模式通过配置远程连接,你可以让 cloud code 操作远程服务器,这在团队协助和 c i 环境下特别有用。 比如,你可以在远程开发机上启动 cloud code, 让它处理代码、审查、运行、测试甚至部署。结合前面说的 bypass permissions 模式,可以实现完全自动化的 c i 流水线。好,接下来我们进入实战环节,把这些高级功能串起来。先看一个 m c p。 服务器的完整配置案例, 假设你是一个全站开发者项目,用了 postgraduate 数据库和 github 做代码托管,你需要配置两个 m c p。 服务器。第一个是 postgraduate m c p, 在 settings 检测中的 m c p service 里添加一个 post grace 条目, command 写 npx, 二 x 里指定 atentropic post grace 杠 m c p 包名和数据库连接字串配好之后, cloud code 就 能直接查询你的数据库结构、理解表关系和字段类型。写 c code 的 时候再也不用手动告诉它表明和字段名了。 第二个是 github mcp, 同样在 mcp servers 里添加 github 条目 command 写 npx。 例子里指定 github mcp 包名和你的 github token 配好之后, cloud code 能直接创建 a 树,管理 pr, 查看 ci 状态。 你可以直接跟他说,帮我创建一个 pr, 描述这段变更,它就能自动生成并提交。再来看一个 hux 自动化工作流的完整案例。假设你的团队要求每次代码检查和单元测试,你可以在 settings 点 jason 的 hux 字段里配置两个钩子。 第一个是 pre to use 钩子,在 cloud 执行 right 或 edit 工具修改文件之前出发,运行 npx isslant 检查目标文件,如果 eslant 报错,就阻止修改。第二个是 post to use 钩子,在文件修改之后出发,自动运行相关文件的单元测试,确保修改没有破坏现有功能。 这样 cloud code 每次修改代码都会自动检查质量,你的代码库始终保持干净。再配一个 section and 钩子,在对话结束时自动生成变更摘要,用 git diff 把本次绘画的所有改动格式化成一份报告,发送到你的通知渠道,这样团队成员能实时知道 cloud code 帮你做了什么修改。再看一个自定义 agent 的 进阶玩法。 假设你是一个前端团队的技术负责人,你想让 cloud code 帮你做代码审查,你可以创建一个专门的 code reviewer agent, 在 cloud 的 一根词目录下创建 code reviewer。 点 md 文件 frontmatter 里 name 设为 code reviewer tools, 只给 rate 和 graph, 不 允许修改任何代码。确保审查的安全性和客观性,确保审查的安全性。 model 设为 opus, 用最强的模型做最深入的分析。在文件中文里写详细的审查标准,包括性能优化建议、 安全漏洞检测、无障碍访问和归性检查。还可以要求它按严重程度分级,输出 critical、 warning、 info 三个等级。这样每次需要审查代码的时候直接说让 code reviewer 审查这个 pr, 它会按照你定义的标准自动完成审查,输出专业级别的审查报告。再来一个多 agent 写作的实战案例。 假设你要做一个新功能,涉及前端组建、后端 a p i 和数据库迁移。你可以同时启动三个后台 agent。 第一个是 frontend agent, 在 worktree 里工作,只操作前端目录,让它根据设计稿实现 ui 组建, 配好只能用 right edit 和 rate 工具。第二个是 backend agent, 也在独立的 worktree 里,只操作 a p i 目录,让它实现后端接口逻辑, 最好可以执行 npm test 跑后端测试。第三个是 test agent, 在 前两个的基础上写集成测试,等前两个 agent 完成后,自动启动验证接口的端到端行为。三个 agent 并行工作,原本可能需要一天的工作量,可能几个小时就搞定了。最后说说 extend thinking 扩展思考,这个功能值得单独提一下, 当你遇到特别复杂的问题时,普通的推理可能不够深入。 extended thinking 会让 cloud 在 回答之前先花时间进行链式推理,就像人类先在草稿纸上推导一遍再写最终答案一样,特别适合这些场景。 复杂的架构设计需要权衡多个方案,涉及多个系统的 bug, 需要追踪调用链大规模重构需要理解代码的隐含依赖关系,你可以用斜杠 effort high 配合斜杠 plan 来触发深度思考模式,它会在输出中展示思考过程。 你可以看到它的推理链条,如果发现它的思考方向不对,可以随时用 esc 中断,然后给更精确的引导。 extended thinking 会消耗更多 token, 成本大概是普通的两到三倍, 但对于真正复杂的问题,它能给出比普通模式质量高得多的回答。最后一个技巧是关于 memory 的 最佳实践。建议把以下类型的信息存到 memory 里。你的编码偏好,比如喜欢用 tabs 还是 space, 单引号还是双引号。项目的关键决策,比如为什么选了这个数据库,为什么没用那个框架 踩过的坑和临时解决方案。比如某个依赖的版本有 bug, 只能用特定版本团队协助信息。比如谁负责哪个模块代码审查的流程, 这些信息会在每次对话中自动加载,让 cloud code 越用越懂。你好,所有内容都讲完了,做一个总结。 cloud code 不 只是一个代码补全工具,它是一个完整的 ai 编程助手平台。 从安装配置、第三方模型接入,到详细的命令使用,再到 skills、 m c p, hooks、 custom agents 这些高级功能, 以及多 a 证的协助工作流自动化、性能优化的实战技巧。这一期全部讲透了,建议收藏反复观看,每个功能都可以跟着实操一遍。配置好你自己的 skills、 hooks 和 agents 之后, cloud code 会真正变成你的定制化编程伙伴。关注我,第一时间了解最新 ai 动态,我们下期见!