粉丝11.6万获赞191.5万

推荐六个我一定会用的 skill, 都是我一直在用并研究过的。第一个 skill creator, 这是所有 skill 的 鼻祖,官方认证的,直接帮你把跑通的工作流转化成独一无二的 skill。 自动分析工作流程,提取可附用模式,生成标准 skill 文档,一键安装,立即可用这个 skill 我是 认真读完所有文档的,绝对靠谱。第二个, document skills, 也是官方出品, ai 操作文档的天花板,自动填表,写 document, 批量处理 excel 数据,一键生成 ppt 演示,智能阅读 pdf 文档。 装上它,你的 ai 交互能力直接提升一大截。第三个, find skill, 能从几万个 skill 中精准找到适合你的智能匹配需求。场景筛选高评分 skill, 对 比相似方案,推荐最佳选择。做复杂的事,先先呼叫他,帮你找找,说不定有惊喜。第四个, frontend design, 官方出品 前端美化神器,专业级 ui 设计,一键美化界面响应式布局,避免 ai 审美疲劳。安装上你的网页,前端直接起飞。第五个, code simplifier, 使三代码终结者自动简化复杂逻辑,消除笼鱼代码,优化代码结构,提升可读性。安装上它, ai 再也不会给你写使三代码了。 第六个, graph loop ai, 无限打工模式,自动循环执行任务,无限搜索资料,持续迭代优化,直到任务完成。但记得用上包月编程套餐,不然费用可能顶不住。这六个 skill 我 每天都在用,关注大古,分享更多 ai 技巧!

大家新年好啊,你们有没有遇到过这种情况,你从网上下载了一个 skill 给你的龙虾用,可他不怎么好用啊,经常会出错。你经过了一番调教,这个 skill 终于能用了。可是你关了窗口,下次再打开的时候,他就又抽风了。 但如果有一天啊,你早上起来的时候打开 openclaw, 他 突然对你说,主人,我在您休息的时候已经进化了一百次,从此我再也不会出错了。这会是什么样的感觉?我相信很多朋友最近也被 apple map 刷屏了吧,又到处去找邀请码了吧? apple map 就是 这样一个概念, 他就试图解决这个 a 制呢,总是犯同样错误的焦虑。他有一个机制啊,他会让 ai 的 错误和修复都被记录下来,变为一个胶囊,可供别的 ai 使用。一个 a 制呢,踩过的坑, 所有的 agent 都不会再踩。同时, apple map 还尝试去建立一个去中心化的网络,如果你贡献的胶囊能有更多人使用,那么它就是被大自然选择的。反之,则是被大自然淘汰的,贡献者可以得到相应的收益。这个网络可以模拟 agent 的 优胜劣汰, 但铺天盖地的宣传,还有那个熟悉的邀请码机制,再加上这个理想,实在是太干净了。 如果这个平台真的运作起来,他的数据可就是金矿啊。什么策略成功率高,什么场景容易出错,这些都是模型厂商十分刚需的。所以抱着探索他到底是不是骗局的心态, 我就深挖了一番。我发现啊, apple map 的 前身,那个被下载了三万次的 skill evolver, 确实是有点东西的。 evolver 呢,不是一个平台,它是一套个人可用的进化引擎,而且它的设计思路很有创意。 虽然它是给 openclaw 设计的进化组建,但根据我的一番改造,它已经可以用于优化 cloud code 的 skill 了,而且完全没有风险,因为不用联网,人人都可以把它应用起来来改善你的 sop。 但在我为大家揭开它神秘面纱之前啊, 我想先用大白话补充一点关于芝士图谱的知识。芝士图谱呢,其实就是大段信息里抽取出来的三元组信息。 比如有人跟你说,我家孩子叫小明,从小就喜欢吃苹果,一看到苹果眼睛就亮了,可是一让他坐下写作业呢,他就找各种借口溜号,怎么都不肯碰书本。这句话中有几个实体。 小明苹果学习有两种关系,喜欢和不喜欢。提取出来就是小明喜欢吃苹果,小明不喜欢学习,这就叫三元组,用实体和他们之间的关系来表示信息。 那么这个三元组和 agent 犯错有什么关系呢?如果我们定义一个三元组,用来描述 agent 的 犯错和纠错的过程,那大概的关系就是现象导致症状,策略带来结果。 比如说一个 agent 的 对话日制,可能是这样子的,三月十五日,用户反馈页面打不开,查了半天发现是数据库挂了,重启一下就好了。 那这个时候知识图谱就只会记住两句话,数据库挂了,导致页面打不开,重启数据库修复页面打不开。这就是它三元组。 evo 的 进化动力,就是让 agent 反复尝试,反复出错,通过基因又反复地去产生纠错的策略, 把这些失败和纠错的过程经过一番分析,我们就得到了一个成功的基因,产生一个成功的胶囊。简单来说,它的本质就是一个错题本,它记录这四样东西。首先信号表示,你的症状是什么? 假设表示,我猜这是什么原因导致的。尝试就是指一个策略,我打算怎么样去尝试解决它, 结果就是它最后到底好没好?那 evover 具体通过分析日制的知识图谱,就会找到一条条这样的路径,从发现信号到产生结果的这样一条条的路径。那 evover 具体是怎么样让 ai 进化呢?它分三步。 第一步,首先扫描日制提取信号, evover 会去看系统,日制去找哪里出了问题,比如说它发现三月十五日用户反馈页面打不开,那这就是一个信号。第二步,它会匹配基因, 他会去翻他的基因库啊,用信号去匹配现成的模板。比如说日记里有 error file 这些词,他就匹配了 repair 这个基因,这个基因里存着一套策略, 遇到错误分析根音最小修复验证以后,我会把这套策略写入提示词,连同刚才的信号一起交给沙盒里的 agent, 生成具体的假设和方案,这样就形成了一次具体的尝试。第三步呢, evo 会去执行重启数据库这个操作,然后看结果,如果页面恢复正常成功了,这时候他就会把这个经历记下来,存进记忆图谱。最后他还可以给这个经验打包成一个胶囊, 这个胶囊啊,就是在 evo map 上可以交易的资产了。这个胶囊里记录了四样东西,触发的条件是什么?用了什么样的基因,具体是怎么解决的?它的成功率是多少? 所以你可以这样理解,基因就是药方,胶囊就是具体病例的治愈记录。 volvo 原来其实只是给 opencloud 设计的, 他只能用 openclot 绘画记录,但是你们知道 clot code 也有大量的日制对吧?每次工具调用,每次错误,每次重试,这些本地的消息记录里,其实都藏着让你的 clot code 变得更好的经验。我自己就有这样一个痛点,就是在开发的时候啊,端到端测试,往往是我花时间最多的时候, agent 呢?真是频繁出错啊,每次你都得重新解释一遍,把这个流程变成 skill, 虽然说会有一些改善,但是 skill 你 也得更新,对不对?就是很烦。 于是我就想啊,能不能让 evolve 去分析 colossal code 的 日制自动优化这个 skill? 我 让 colossal code 参考了 evolve 和我前一段时间不是分享过那个 colossal session, 那 个读取 cloud 的 日制的一个工具吗? 这两个代码库,一个是包含了 opencloud 知识图谱的实现原理,另外一个是包括了 cloud code 的 session 结构。 于是我就用 agentteams 跑了几分钟,哎,这个 cloud evover 就 做出来了,它能干什么呢?简单来说,它能干两件事,第一就是让你的 skill 在 一个纯本地化的沙盒里自己去进化。 你把一个 skill 丢进去跑 n 次,全程也不用上鱼,它自动会记录每次啥信号,用的啥招,成没成,成功率高的留下,低的淘汰,最后给你进化出来一个最优的版本。 第二就是在沙河里跑,你不是很难观察吗?你就很难去调试这个工具怎么样?这个工具是给我自己用的,也就是用来格式化。这个知识图谱到底长啥样啊?每次进化结果是什么?能格式化给我看?这样我就不用去翻那些 jason 记录了。 当然这个想法我是刚搓出来的,还没有验证完整的闭环,因为还存在着一个重大的挑战,也就是基因从哪来。 evo 代码库里其实只给了几个参考的模板,但是这个太粗了,每个人的场景其实都不一样,对吧?这些都是没有通解的,都必须自己去解决, 而这恰恰是 ever map 想解决的,他想让一群人来贡献基因,优胜劣汰。好的策略自然会浮现,比如说你写的端到端测试的经验,我写的数据库修复策略,大家都共享起来,都用起来,就是不是就会变得更好? 我觉得呀,以沃尔的方法论是真的值得去研究一下的,就是用图谱当错题本。 这样的一个思路是有助于 a 阵的进化的。但基因库这件事,确实也没有什么捷径,就得靠大家自己来积累。说不定 apple map 真的 运作起来了,他也会是一个很了不起的一个基础设施,所以我也会持续保持关注的。 那大家如果看过我之前的视频,我讨论过 a 阵的蜂群,现在又开始讨论进化了。虽然我也很讨厌 onslop 这个创始人,但是他说过一句话, 他说数据库里的天才国度这个概念我是深信不疑的,而且现在各种各样的迹象都越来越清晰了,在一个数据中心里,你的 agent 可以 形成蜂群,而且又可以自我进化, 这真的太可怕了。所以你们会希望自己的 agent 快 速进化成一个天才国度吗?评论区里讨论起来吧!以上就是本期全部内容了,谢谢大家。

我们今天来聊一个特别有意思的话题,咱们怎么能让 ai 真正的学会吃一堑长一智,而不是只会一遍又一遍的重复同样的动作。 你想啊,要是 ai 每一次搞砸了之后都能变得更聪明,而不是像个机器人一样在同一个地方反复摔倒,那会是什么样一番景象?这可就打开了新世界的大门了。 来,你看,这个对比就特别直观,左边呢,就是我们常见的那种 ai, 像个眉头苍蝇,在一个迷宫里来来回回撞同一堵墙。但是右边就是我们今天要说的,未来,一个能从经验里头自己总结出技能的 ai, 这才是真正的智能,对吧?好,那咱们就先来深入聊聊第一个问题,就是 ai 的 这个记忆难题,为什么它们好像总是摆脱不了一个死循环呢? 你知道根源在哪儿吗?说白了就是现在大部分的 ai 每次接到新任务都跟格式化重装了系统一样, 他根本没有长期记忆,没法积累经验,上一个任务里踩过的坑,到了这个任务忘的那叫一个一干二净。这时候你可能会想,嘿,那把 ai 干过的每一步都记下来不就完了吗? 嗯,问题就出在这,这些原始的记录,我们管它叫诡计,你看,就像这图里乱七八糟的线一样,又长又乱,里面全是没有用的信息和干扰项,你想从这么一堆乱码里头找出点有用的东西,那可真是太难了。 这句话说得简直是一针见血,你看,就算把过去的经验全都存下来,本质上 ai 一 直是在模仿,他根本不理解自己为什么成功或者为什么失败?所以啊,这些经验就没办法真正变成他自己的本事,去改进他做决策的方式。 所以,死记硬背这条路是走不通了,那出路到底在哪呢?嘿,说不定答案就在我们自己身上。咱们来看看这个从人身上找到灵感的解决方案, 这个对比就特别有意思了,你看我们人是怎么成为专家的,靠的肯定不是死记硬背嘛。就拿一个大厨来说,他厉害的不是记住了几千个菜谱,而是他掌握了像火候控制、颠勺这种核心技能。 我们希望 ai 也能向右边,这样能把那些乱七八糟的经验提炼成简洁高效,还能到处用的技能。 好了,这就引出了我们今天的主角 sql of 框架。它的核心想法,简单来说,就是给 ai 搭一座桥,这座桥能让 ai 自动地从一堆原始经验里练出技能,而且还能通过一个叫地归进化的机制,让这些技能和 ai 一 起成长,一起变强。 那么这个提炼到底是怎么回事呢?你看这个压缩图标就很好理解, s q 二二就像一个超级压缩工具,能把那些又长又乱的数据压缩成精华,变成真正能指导行动的知识。 这就好比我们自己做饭失败了一次,然后总结出一条经验,哦,原来油温不能太高,这就是一个技能。 好理论,清起来是真不错,那咱们就得往深了看,这个聪明的想法在框架内部到底是怎么跑起来的? 整个框架呢,基本上就分着三步走,第一步,把乱糟糟的经验变成一个一个的技能。第二步,把这些技能分门别类放进一个叫技能库的地方,就像整理书架一样。最后也是最牛的一步,是让这个技能库呢自己不断的更新升级,进化。 这个技能库啊,可以说就是整个系统的核心,你可以把它想成是 ai 的 独家武功秘籍或者战术手册。以后不管遇到什么新问题, ai 都能先到这来翻一翻,找找有没有合适的招数可以用。 而且更有意思的是什么呢?这个技能库里的技能还分等级,既有那种放之四海而接准的通用技能,比如说先去没去过的地方看看,也有那种针对特定任务的独门绝技,比如打扫卫生,那得先找到脏东西在哪儿。 这么一来, ai 做决策的时候,既有大局观,又有具体打法。这张图就把地归进化给讲明白了,你看,这简直就是一个完美的正向循环。 ai 先是在任务里失败了,没关系,系统马上分析是为什么失败,然后从中总结出一条新技能, 接着这个新技能就被放进技能库里,这样一来, ai 下次再碰到类似情况,表现就会更好,就不会在同一个地方摔倒,两次失败在这里反而成了 ai 成长的养料。 好了,说了这么多,理论上很完美,那这个框架拉到实际场景里去溜一溜,效果到底怎么样?来让我们进入最激动人心的部分,看看数据怎么说, 来了,这就是那个啊哈时刻,你快看图里这条红线,它就是我们的 s k l r l, 不 管是学习的速度,也就是这条线爬升的有多快,还是最后达到的高度,也就是成功率,都把其他方法远远甩在了后面,数据是不会骗人的,这个优势真的太明显了, 如果咱们非要给这个优势上个具体的数字,那就是它平均下来 s q l l 的 性能比那些很强的对手还要高出整整十五点三个百分点。你可别小看这个数字,在 ai 这个领域,这绝对算得上是一个巨大的飞跃了。 这张表格就更清楚了,你看,不管是在模拟家庭环境的 a l f world 测试里,还是在模拟网上购物的 webshop 测试里, s k l l r 的 成功率都是一骑绝尘。尤其是在 a l f world, 成功率直接从百分之七十七点六百干到了快九十趴,这还有什么好说的?事实证明,让 ai 学会技能,效果就是这么立竿见影。 所以说,这项研究的意义绝对不只是让成功率好看了那么一点点,它很可能是在告诉我们下一代的人工智能应该往哪个方向发展。 那么咱们今天聊的这些总结一下关键点就是 s k r l 这个框架让 ai 终于不再健忘了,它能从成功和失败里同时学习,能把经验变成可附用的技能,还能高效的压缩知识。最重要的,它建立了一个能让 ai 自己变强的良性循环。 这可不只是性能变好了,这是一种根本性的改变,让 ai 有 了不断成长的可能性。好了,这最后就给我们留下了一个特别值得思考的问题, 当一个 ai, 它不再是笨拙的模仿,而是能像我们人类一样,通过学习和运用各种技能来解决问题的时候,它的未来,它的能力边界又会在哪里呢?

二零二六年最值得学习的技能呢,就是 cloud skill, 现在 osopik、 谷歌 openai 已经全部支持 skill 了,分享七个。最近一个月呢,在开元社区热度上涨最高的 skill 项目。第一个是 obsidian ceo, 他 自己写的一个 skill, 非常牛的用法是 直接绘制格式化的 canvas 画布。比如说,我让他创建一个 canvas 来解读刻意练习这本书,它会自动识别出需要调用 jason canvas 这个 skill。 大 概呢,花了两分钟啊,运行完成,生成一张 canvas 图,它直接把刻意练习书里面的内容和相互之间的关联化 出来,整本书的逻辑呢,一目了然。以前看书呢,容易迷失在细节和特定章节里面,现在用这种彩色的画布,让你瞬间纵览全书。再比如呢,让它创建一个读书的阅读管理系统,跟踪目前我读书的进度啊,它会自动识别并调用 obsidian faces 这个 skill, 然后生成一套读书管理系统, 显示了每本书的基本信息以及阅读的情况,并创建了子文件夹,对每本书进行总结。你还可以自行进行扩展,添加更多书籍笔记到书籍文件夹里面。地址呢,在这里。 第二个是 ospec 官方 skill, 里面有非常多的 skill, 比如说对 word, pdf 进行处理的 skill, 可以 从 pdf word 里面提取文本。再比如呢,前端设计的 skill, 最重要的是这个 skill creator, 它可以指导你创建自己的 skill。 地址呢,在这里啊。第三个是 gitup 上二点二万 star 的, 它可以指导你创建自己的 skill。 地址呢,在这里啊!第三个是 gitup 上二点二万 star 的 star, 它可以指导你创建自己的 这套 skill。 什么用呢?第一个,他懂得三思而后行,普通的 ai 拿到需求呢,一般直接开干,但是装了 superpowers skill 之后,他会先按住暂停键,会启动头脑风暴这个模式。 反过来问你这个功能的具体场景是什么,有没有边缘情况啊?他会先和你把需求聊透,把模糊的想法呢变成清晰的文档。第二呢,他是一个不折不扣的计划通,需求确定之后呢,他不会乱写,而是会生成一份详细的 实施计划。他会把大任务呢拆解成一个个两到五分钟就能完成的小任务,就像一个靠谱的架构师,把蓝图呢都给你画好了,你点头呢,他才开工。第三,他强制执行测试驱动开发,这是很多高级的程序员才有的习惯啊。他会先写测试用力,如果测试失败再去写代码让测试通。 最后呢,还要重构,这意味着它写出来的代码呢,其实会更加的健壮。这个 skill 库呢,还有很多功能,地址呢,在这里啊,大家可以去进一步的探索。第四个是模仿 manners 的 skills planning with fields。 这个 skills 借鉴的 manners 的 设计理念,将上下文窗口类比为内存,一时 有限。将文件系统类比为磁盘,持久而且无限。而核心的原则是重要信息均写入磁盘,而不是待在内存里面。 针对每一个复杂的任务呢,需要创建三个关键的 markdown 文件。第一个 task pen md, 用于跟踪任务阶段和进度。第二个 finding md, 储存研究内容与发现结果。第三个文件 progress md, 记录绘画日记和测试的结果。这个 skill 非常适合 多步骤的任务,三步及其以上研究类任务,以及需要多次调用工具的任务。地址呢,在这个地方,第五个是自动上传内容到 notebook l m 的 skill。 这个 skill 呢,也可以让你通过 cloud code 快 速获取带有来源引用的打 答案。对于每一个从 cloud 发出的问题呢,会先通过 notebook lm 进行一次答案的综合,然后再用 cloud 进行回答。这个技能借助 notebook lm 的 预处理能力,让 cloud 仅需要发送查询指令,接收精准答案,大幅地降低了 token 的 消耗。地址呢,在这个地方,第六个啊,是 skill prompt 检测 rater。 这个呢,是用来生成图片提示词的,内置了十二个专业领域的 skills, 比如说人像提示词专家,艺术风格专家、平面设计专家等等。它会根据用户的输入呢,自动匹配 对应的专家来帮助生成图片提示词,从而实现精细化生成的效果。比如说我让他生成生成电影级的亚洲女性张艺谋电影风格。使用豆包得到的图片呢,是这样的,而这个呢,是没有使用这个 skill 的 生成结果。我们可以发现呢,如果没有使用这个 skill, 生成的结果呢,更加的发散和随意。第七个是用来做内容营销的 skill, 可以根据多个关键词来生成文章,适用于 s e o 的 场景。地址呢,在这个地方, skill 呢,将 agent 和工作流的门槛呢,又降低了一个级别。二零二六年注定是各行各业 skill 的 爆发年。 现在看完这个视频呢,你就可以立刻去用起来,有什么不懂的可以评论区告诉我,想系统化学习呢,也可以加入我们的社区,下一期呢继续。

这几个词你认识多少?这几个词你认识多少?这这这几个词你又认识多少?如果你全都不认识,那么恭喜你来对了地方。今天这期视频,我就为你扒开所有这些唬人概念的底裤。你会发现,所谓智能体,就是所有不需要智能的部分构成的部分。 skill 就是 新瓶装旧酒的一场名词诈骗。最后呢,我还会告诉你一个通杀现在所有甚至未来可能出现的新概念的统一方法论,让你瞬间秒懂。哎,这好像是个语病,但这不重要,现在你只需要清空大脑,忘掉你所有知道和不知道的概念,跟我一起进入梦境。 整个混乱的起点就是这个古老的语言模型。小的语言模型,一开始呢,还是个智障,但随着模型的参数越来越大,居然在某个临界点涌现出了智能。那为了和之前这个智障模型做个区分,你在前面加了个大字,这就构成了现在常说的大语言模型,简称 l l m。 恭喜你发明了今天的第一个新词儿。 大模型本身只能做文字接龙,就是不断输出下一个字,但如果只是这么用的话,看起来仍然像个智障。那如果把角色区分一下,人为划分成一问一答两个角色,就实现了第一个有点智能的使用方式对话。 现在呢,我不管你是什么身份,立刻把自己想象成一个老板, l 就是 你的员工,我们就叫他小 l 吧,只不过他服务你的方式有点特别,只能一问一答,然后就结束了。不能追问,不能追问,这个非常重要,后面要考, 那接下来的任务就是你要想尽办法压榨这个只会一问一答的小 l, 榨干它的全部剩余价值。那你会怎么做呢? 不过先别急,你先给自己每次和小 l 的 对话起了个洋气的名字,叫 prompt。 恭喜你发明了今天的第二个词。然后你还发现,这部分内容还可以进一步区分,有的部分是背景信息,有的部分是最终的指示。于是呢,你把背景信息的部分单独起了个名叫 context 上下文。那恭喜你发明了今天第三个词。 同时,有的时候你需要对小娱进行追问,但是呢,刚刚说了他只能一问一答,不能追问。但是你想了个巧妙的办法,就是每次沟通前把你们之前的对话历史放到 context 部分作为上下文信息。 然后呢,再给出你的问题,伪装成多人对话。然后你又迫不及待给这些特殊的上下文信息起了个新词,叫 memory, 意思是大模型的记忆,这些 memory 还可以再次调用大模型进行总结,从而对他的记忆进行压缩,进而减少上下文的长度。恭喜你,一不小心就已经发明了四个新词了。 此时,一个原本只能进行词语接龙的小 l 就 成功被你玩出了可以对话并且可以不断追问的优秀牛马员工了。 当然,不久之后你就不满足于现状了,你发现的第一个问题就是小儿没有上网查阅资料能力,要么就不知道,要么就胡说八道,说的内容都是些过时的消息。不过这很简单啊,给小儿准备一台电脑不就可以了? 不可以!还是那个问题,小 l 本身只会词语接龙,其他任何逻辑都无法独立完成,那怎么办呢?好办,你就告诉小 l, 如果你需要上网搜索资料的话就告诉你,然后你帮忙查完资料后再给他不就行了?但很快你就发现,这样好像显得自己有点蠢,到底谁才是牛马呀? 于是呢,你把上网这部分逻辑写成一段程序,让这个程序去代理你和小 l 进行沟通,并且完成搜索的任务。 在外人看来,你仍然是一问一答就拿到了结果,只不过面向的是这个神秘的程序了。太妙了,这个发明可不得了。这个神秘的程序似乎本身就拥有了智能,而且还是能操作工具的更高级别的智能。你给他取名叫智能体 agent。 你 可能觉得写多段程序不是看起来很简单吗?怎么敢叫这么科幻的名字?哎,千万别有心理负担。一些早期所谓的智能体,其实现逻辑仅仅就是多加了一段 prompt 而已,那从现在的视角回看,当时简直就是一种诈骗。 回到这里,既然这个 agent 能上网搜索内容了,那是不是也可以增加个搜索本地文档或数据库的能力呢?可以的,只不过搜索方式和传统数据库不同。要使用向量数据库把语义相近的片段找出来。 那你给这种通过语义匹配向量化的信息,并将其加入上下文,以增强生成内容的可靠性的办法,叫做解锁增强生成 retrieve augmented generation, 简称 r a g。 那 刚刚这个联网搜索也起个名字叫 web 测试 算了, drop the web just search。 这样呢, scope 显得更大一些,连 r a g 也算是 search 的 一种了,都属于获取模型参数以外的信息的能力。好了,现在看看你造的孽吧,这么一会功夫,已经发明了八个新词了,当然了,好戏还在后头呢。 好了,现在的整体架构就是你和小 l 中间隔着一层 a 阵的程序,并且处理一些小 l 无法操作的东西,包括刚刚的搜索,以及还可能出现的其他各种工具的调用。 但这就有个问题,我们聚焦于 agent 和大模型的对话过程来看,而如果这部分一直用自然语言来沟通,那这个 agent 的 代码可不好用程序来实现呢,鬼知道大模型会怎么描述自己的需求呢? 所以最好有个约定,让大模型按照指定的死板的格式来回复,比如说 jason, 这样呢,程序就能直接很方便的解析了。那你给这种 a 阵呢,和大模型之间关于工具调用所约定的对话格式叫做 function calling, 其实呢,就是个约定罢了,就好像开发的时候前端和后端约定这个接口格式一样。 好了,我们再看看右边这些工具的实现,现在是写在 agent 的 主程序里面的,没有跟核心功能结偶。那如果是单独写成一个服务,那么 agent 的 主程序如何发现并调用这个服务,就又需要一套约定的规范了。比如说约定好 toos list 的 方法就是返回工具列表, toos 框方法就是调用具体的工具等等, 也就是一套约定而已。那你给这边的约定也起了个名字,叫做 mcp, 翻译过来叫模型上下文协议。 而至此,架构就变成了这个样子,此时大模型就像个只会说话不会做的智者,而 m c p 服务就是能提供各种工具的程序级。中间的 agent 就是 个传话筒,把大模型的话转换成调用工具的代码,把工具调用的结果再原封不动的传话给大模型。 同时呢,别忘了还要给你这个老板传话,主打一个,我不生产信息,我只是信息的搬运工。现在我们聚焦于 agent 和你的对话之间。 虽然最底层肯定还是文字,但是交互形式上可以非常丰富多彩,可以是像 c l i 一 样的命令行窗口,也可以是一个编程 ide 工具,还可以是一个更为通用的桌面助手,比如说最近爆火的 cloud bot, multi bot, open cloud, 当然这仨是一个东西。 这里说句题外话,我感觉 cloud code 这个名字起的实在太失败了。一开始呢,好多人认为它是个大模型的名字,但其实它是个编程 agent。 现在呢,好不容易大家接受它是个编程 agent 了,但其实它早就走上了通用 agent 的 道路。我感觉要是名字起好了,就没现在的 cloud bot 什么事了。 当然, collab 的 爆火和它的自身的很多设计有关,如果本期视频的点赞过亿,我将会专门出一期视频讲讲它。不过不论什么形式的智能体,都有一个统一的缺点。假设我们想完成这样一个任务,从一个英文 pdf 文档当中提取内容,翻译成中文,最后保存成 markdown 格式。 当然,你可以直接把这个需求描述给 agent, 让他自己策划整体的流程。但是如果这个流程相对稳定,每次重新让 agent 自由发挥的话,不但不稳定,还非常浪费 token。 比如说,整个流程中,提取 pdf 和保存 markdown 这两步完全可以固化成固定的脚本,中间的翻译直接和大模型沟通即可,整个流程就不需要任何一个中间的智能体插手了。 要固化这样一个流程,你可以通过编程的方式来实现。为了方便编写这种列式的任务,你又发明了一个新的编程框架,起名叫 linchang。 呃,为了照顾非程序员用户,你又发明了一种低代码的方式,就是在页面上傻瓜式的拖拽,上手难度更低。你给他起个名字叫 workflow 及工作流。 但是还有个问题,假如这个问题我们再变一下,比如说处理原始文档,不只有 pdf, 还有可能是 word 文档、 txt 文档、 ppt 等,然后输出的格式也可能是 html、 pdf, 甚至是一张图片。那么难道你要给这些所有的排列组合都写一套工作流吗?这显然是不合适的。 当然了,你也可以写一堆 ifelse 做判断。但如果你仍然希望用户是以自然语言的方式触发这个任务,不牺牲这个体验,这个时候就又不好用程序来判断分支了。那该怎么办呢? 你可以这样设计,准备一个目录,把所有可能涉及到的转换脚本全都写好放在这。然后呢,写个统一的说明文件,把整体的流程描述清楚,并且告诉 agent, 根据文件的格式灵活选举指定的脚本。 然后呢,再给 agent 下达任务之前,加上这么一句话,先读取刚刚我们写好的那一大串要求,然后再按照要求完成任务。这样整个过程就既保证了一定的灵活性,同时呢又变得比较可控。 但是这不就又来了优化空间吗?我可以提前约定好某个指定的位置,然后呢,在 agent 中写死一段程序去读取这个位置的 skill 点 m d, 还是相当于把这句话固化成了一段程序,这样呢,就不用每次都加这么一句废话了。 虽然你也知道这破玩意好像就是把提示词换了个地方存起来,但想想还是给他起个新名字吧,就叫做 skill, 即 agent 的 技能。好家伙,这是往游戏里的英雄方向设计的呀。 好了,现在这个 agent 已经被你弄成这个鬼样子了,你又发现,对于一个复杂的任务,可能 agent 的 上下文会变得非常大。于是呢,你又发明了个新概念叫 sub agent, 对 于一些独立的子任务,可以单独在这个子 agent 中完成,其实本质上就是做了骂上下文隔离子 agent 产生的上下文不会保留在主 agent 中,仅此而已。行了,再好好看看你造的这些孽吧。 最后呢,我想尝试高屋建领的梳理一下这些概念的关系。这里的每一个新概念出来的时候都有大飘的文章,极其夸张的吹捧和营销。但是在我看来,这些概念的设计说的不好听点就是有点拉垮,说的好听点呢,就是技术发展的中间产物。 不过在这之前,我们先看两个经典的容易混淆的问题。在 m c p 刚出来的时候,很多人问方声 call 林和 m c p 有 什么关系啊?呃,其实刚刚这张图就很清晰了,一个是 agent 和大模型沟通的约定,目的是让大模型回答的符合一定的格式,方便程序进行解析。 一个呢,是 agent 和工具服务之间调用的约定,目的是像接口文档一样,约定怎么调用,怎么传餐,怎么接收返回值等等。这俩完全不搭嘎,甚至有人问是否 mcp 能够取代防神拷令呢?这也是无稽之谈。 在 skill 刚出来的时候,也有人问 skill 和 mcp 有 什么区别, skill 其实就是个 prompt 加载器嘛,唯一需要的文件就是 skill 点 md, 其他的不做任何要求,和 mcp 也不是一个维度的东西。 不过 skill 是 否能取代 m c p 呢?我认为是可以的,因为你可以把 m c p 服务中提供的工具通通放在 skill 的 目录下,并且在 skill 点 md 文件中说明是如何使用的,而且特别常用,通用的小工具未来通通都会内化在 a 帧的主程序中,所以目前看 skill 稍稍有些鸡肋。 不过拿 skill 和 m c p 比本身也不搭嘎,不是一个层次上的事,它其实更应该和这几个词作比较。那我把这个顺序成为从刚性到柔性,从稳定到变化, 它们的目标呢?其实都是一个需要多个阶段才能完成的任务,使用 linche 就是 纯编程的形式来实现,全是硬编码,虽然特别稳定,但是也失去了一定的柔性,很难包容一些小问题。而 workflow 只是把程序替换成了 d 代码的拖拽,相对改起来的容易一些。 呃, skill 就是 把 linchang 和 workflow 这种由程序控制的流程走向变成了由智能体自行控制, 但是呢,提前写好了一些说明文档和直接可运行的脚本存在一定灵活调整的空间,同时呢,又不至于变得特别不可控。而最后的纯 a 帧的形式最为柔性,因为它可以随时根据自己的判断进行调整流程,甚至需要的时候自己给自己生成个脚本来运行。 但同时这也造成了容易变得不可控,你不知道它中间会给自己写个什么脚本,把一个原本非常简单的任务变得非常复杂,所以这条线我认为是它们宏观上的一个区别。至于 skill 的 间接式批漏啊,按需加载啊,我认为只是它的一个特性而已,而这个特性也会在未来 token 变得越来越便宜之后变得有点鸡肋。 对于普通人来说, skill 兼顾着灵活性和稳定性,我认为呢,会逐渐淘汰掉 m c p 和 workflow。 m c p 就 像刚刚说的常用的工具,我认为会直接内化到 agent 的 主程序中,或者在未来的基础 skill 包中存在比较积累。 而 workflow 这种既不如 lincoln 一 样适合程序员,也不如 skill 这样更适合我们普通人,也属于一个比较鸡肋的存在。当然, skill 我 认为本身也是个中间产物,未来呢,一定会有更方便的形式出现,让所有人都可以很符合直觉的无脑使用。 然后我想再从最本质的角度说说这些技术,其实所有的这些技术最终还是离不开大模型和我们之间的提示词。 呃,这些技术呢,无非就是帮助我们自动地往提示词里面增加上下文信息,比如说 search, r a g, skill 等等,都是把一堆内容塞进了上下文,或者通过代理的形式帮助我们减少和上下文沟通的次数。 为什么开头我说 agent 呢?是所有不需要智能的地方构成的部分呢?就是说一个流程当中,所有能用固定的程序来解决而不需要问大模型的地方,就是 agent 的 发挥作用的地方。其实就是把模糊的分流逻辑交给大模型,根据语义识别出用户想做 a 还是 b, 把确定的分流逻辑交给程序,比如说 pdf 提取文本,那最终的目标都是节省人类的时间,降低人类的使用门槛罢了。 但是现在还有个最大的问题就是头盔实在是太贵了,越是强大的自己,能默默处理问题的 agent, 背后消耗的头盔就越大。但我觉得这在未来或许不是问题,因为头盔一定会越来越便宜,甚至等到什么时候,一个生产级别的大模型可以轻松部署在一台普普通通的电脑上的时候,头盔就相当于免费了。 由此我又想到了 java 领域的 spring boot 和 python 领域的 uv, 你 会发现这两者都是将开发者的便利完全放在第一位。什么运行速度快不快?包的体积大不大?是不是浪费内存空间或者磁盘空间?这些问题最终和使用的便利性相比,几乎都是瞬间被秒杀了。 程序员尚且这么怕麻烦,而在 agent 的 领域,我认为更是如此,因为他面向的是普通人,不可能让普通人去把什么 skill 放到指定的目录下去,配置什么 m c p 服务,甚至配置哪个大模型的 api key, 这些呢,都会被一个较为便利的产品淘汰掉,比如最近的 cloud bot 为什么这么火啊?除了一些营销因素以外, 难道它和 cloud code code x manage 这些 agent 有 什么本质区别吗?完全没有,就只是因为它能连接社交软件,能够配置定时任务,有个页面能看到 skill 并管理它们。第一次让普通人觉得它像一个智能体,而不只是躺在电脑上的一个服务了。 那未来究竟会是什么样呢?我认为只要是提供便利的方向就是趋势。比如未来我认为一定有一个打包好的超级 a 枕的配置好了,所有常用的 m、 c, p 啊、 skill 啊等等乱七八糟东西,甚至已经不叫这个名字了,普通人啥都不用,配置也能直接使用起来。 好了,本期视频就到这里,看在这么长的份上,能不能给我个三连呀?

cloud code 非常好用,但是它有两个问题,一是费用高,二是国内无法使用。给大家分享一个最近很火的工具, open code。 open code 可以 看作是一个免费开源版的 cloud code, 它几乎具备了 cloud code 的 所有功能,而且国内就可以使用。 大家可以看一下我让他帮我生成的一款爆款小红书文案,这里他用到了一个 skill, 就是 小红书爆款生成的 skill, 这个也是我用 open code 生成的一个 skill, 我 们可以在这里看一下 就是这一个专门用于生成小红书爆款内容的技能。我们先看一下他生成的效果,首先他给我准备了十个爆款的标题,让我选择一个,这里我选择了五 平置摆烂。手把手教你寒假英语沉浸式学习。我们看一下他生成的内容,这里有教你核心学习的秘密,有第一步,第二步,第三步。 然后还给你推荐了一些工具。我准备将这一篇小红书的内容发到我的小红书账号里面去测试一下,看看有多少的关注。下面我们来一起看一下怎么下载安装以及使用 open code 的。 首先第一步我们要找到 windows 的 官网,这里他提供了很多种安装的方式,我们使用 npm 的 方式。使用 npm 这个命令前,我们电脑必须要安装一个 no 技 s, 这里我们要找到 no 技 s 的 官网, 点击这里下载,然后像安装程序一样,一步一步安装就可以了。等安装成功之后,我们再回到这个页面,复制这一行命令,打开我们的终端,把这行命令粘贴过来,然后直接回车就可以了,因为我这里已经安装过了,就不演示了, 安装完成之后直接在这里输入 open code, 稍等片刻他就已经打开了 open code, 里面提供了很多免费的模型,我们来看一下都有哪些。在这里直接输入一个斜杠,然后输入 model, 然后进去,我们可以看到这里有很多免费的一些模型,那我们就使用第一个就好了。我们再来看一下我怎么用它来生成一个 skill。 这里我们要安装一个最强的 a 镜的框架, 直接告诉他帮我安装 oh my open code。 安装完 a 镜的之后,我们再来安装一个创建 skill 的 一个 skill, 它就叫 skill corrector, 后面是它的一个 github 仓库,地址 直接发送给他就可以了。等创建完之后,我们需要重启 open 口的,我们重启完之后可以在这里看一下有没有, 这里显示 skill correct 就 已经说明创建成功了。那我们再来看一下怎么生成一个定制化的专门生成小红书爆款文案的 skill 也是一样的,我们直接告诉他使用 skill correct。 根据以下提示,帮我创建一个生成小红书爆款文案的 skill, 这里是我复制的一个提示词,大家如果需要的话也可以私信我,直接发送给他,然后他就可以帮你生成一个生成爆款文案的 skill。 最后大家看到的就是我视频开读的一些内容,我让他帮我生成一个小红书的文案, 然后他就调用了这个 skill 生成了一些文案,操作很简单,而且很有意思,感兴趣的大家可以去试一试。

skill 功能发布已经有一段时间了,目前国外的 cloud code coser, 还有国内阿里推出的 code 字节的 tree 都陆续上线了 skill 功能,不知道你有没有上手体验过这个能翻倍提效的 ai 神器。本期视频我们不讲概念,我们以更适合普通人上手的字节 tree 为例,以 初学者的视角,手把手给大家分享如何用 tree 玩转各种 skill。 不 管你是写代码的程序员,还是其他行业的从业者,哪怕是职场小白, 都能靠它快速提高工作效率,少走弯路。话不多说,我们直接开始。这里我有两个比较热门的 sku, 详细讲解 sku 的 安装以及使用。其他 sku 的 使用方式类似第一个 pdf sku, 这是一个全面的 pdf 操作工具包, pdf 文件相关的问题我们基本上都可以用它来解决, 比如说提取文本和表格,创建新的 pdf, 多个文档合并,文档资料拆分以及文档表单处理。有了它我们就不用手动或者去第三方网站去处理我们的数据了。那么我们应该如何在翠中安装和使用这个 skill 呢?第一种方式,我们可以从 skill 是 map 点 com 或者 get help 下载下来, 下载,下载之后我们直接解压这个压缩包,这个压缩包里面核心就有一个 escape 点 md 文件,然后我们把解压之后的压缩包直接放到点 tree sql 目录文件下面,我们就可以直接使用了。第二种方式,我们点击 tree 的 settings, 然后点击 nodes sql, 在 打开的窗口中,我们点击最上面,然后把我们刚才下载的 sql 点 md 文件直接导入进来, tree 就 会自动解析这个文件,填充到下面的输入框中,我们只需点击 com, 这样这个技能就导入进来了。 第三种方式适合动手能力比较强的小伙伴。在刚才第二种方式打开的窗口中,我们手动指定技能的类型,技能名称,技能描述和技能的指定,然后点击确认 sku 就 安装好了。 我们该如何使用这个 sku 呢?我们直接在聊天窗口中指定使用 sku 做什么事情,比如帮我们把 pdf 转成 word 吹,就会自动调用 pdf sku, 使用 ai 大 模型自动把 pdf 转成 word 格式的文档。 除此之外,如果我们想提取 pdf 的 文本和表格,多个文档合并,文档资料拆分等等,我们都可以告诉 tree, 帮我们完成复杂任务。第二个, excel 表 skill。 以前使用 excel 表 skill 绘制一些流程图或者架构图的时候,你是不是和我一样,手动的一个箭头一点一点的进行绘制, 整个过程费时又费力。好在现在已经有了 excel 表 skill, 我 们可以让 ai 大 模型直接帮我们绘制流程图。我们在 skill 点 mp 网站直接把 skill 的 技能包下载下来, 解压之后直接放到点 tree skills 目录下面,我们就可以直接使用了。在聊天窗口中直接输入我们想要绘制什么流程图, tree 就 会自动调用相应的 skill 帮我们完成绘制任务,整个过程既简单又省力,而且绘制出来的流程图 不仅美观而且详细,真的是一句话就能生成一个流程图。除了刚才介绍的这两个 sku, 还有非常多好用的 sku, 比如方案的 design, 这个 sku 可以 帮我们把前端页面设计的更加美观人性化, 不会让你一眼看起来就知道是 ai 生成的,这是修改之前的样式,这是修改之后的样式。还有 work report skill, 一 句话就可以帮我们写出来属于我们自己的工作报告和周报。除了使用别人已经做好的 skill, 我 们怎么样根据自己的风格定制自己的 skill 呢? 其实非常简单,比如说我想创建一个检查代码规范的 sku, 我 们在聊天窗口中直接输入创建一个检查代码规范的 sku, 就 会自动调用内置的 sku creator 帮我们生成一个检查代码规范的 sku。 如果我们有什么个性化的需求,直接告诉 sku 就 行,它都能帮我们实现。使用的 sku 非常多,在这里就不一一缕举了。给大家介绍几个比较好用的 sku 网站。第一个 sku 四点 s h 这是一个 ai 智能体技能商店,只需一个命令即可安装 被开发者称为 ar ag 的 时代的 npm。 这里可以根据下载量排名,还有 skill 趋势分析,还可以根据热度排名。第二个 skill skill 点 com skill skill 点 com 是 全球最大的 ai 智能体技能聚合与发现平台,目前已收入了十四万多个 skill。 我 们想找什么 skill, 只需要点击四二七,然后在输入框输入 skill 名称,就能查找到所有相关的 skill。 这里还支持按照分类查找,比如工具类、开发类等等。 第三个就是 azureopex 官方提供的一些 sku, 这里收入了一些常用的 sku, 比如 pdf 相关的、 excel 相关的、前端页面优化相关的,大家可以按需索取。以上这几个 sku 地址我都放在了评论区,这期视频就到这里,拜拜!

我开源的这个 skill 能够让你用几句话就造出一个完整的废书机器人。这个 skill 覆盖了从需求到交付的完整内容,不用翻文档,不用反复迭代, ai 会一步步的引导你说清楚你要什么,然后直接帮你把代码配置文档全部生成好,最后你只需要在废书开放平台上完成对应的配置之后就可以跑了。 这个视频我会完整演示这个 scale 的 效果,告诉你它怎么用,以及它背后一个可以迁移到任何领域的实现思路。看到最后相信你会有所收获。先说说为什么要做这个东西,近半年来,给飞书群搞个机器人这件事,我重复了十几次场景,其实很日常,每天早上发个热点趋势汇总,或者是做我自己的 open cloud 机器人之类的。 但是每一次构建,我都要让 ai 去重新查飞书的官网,并且就各种失败情况和他反复进行点赞,浪费了非常多的时间。 这样的情况多了之后,我就做了这个飞书机器人 skill, 打包了我在实践中总结的一套详细的 sop 以及需求的挖掘步骤,还有各种情况的处理方法。我现在来演示一下,比如我跟 ai 只说一句话,构建一个飞书机器人, 这时候我们可以看到他读取了 skill 文件之后,并没有直接开始写代码,而是开始问我问题。我们这里选择自建应用吧,因为我们要收发消息,并且会呃跟机器人存在一些交互, 然后具体做什么,我们这里也可以讲的不具体,比如我说每天需要给我通知,我可以和他对话,他有固定指令, 最后 ai 会继续根据我 skill 的 配置来反复的向我们做需求澄清,比如他会问我们通知的具体规则,我们这里选择各发送一次,呃,然后数据的话,比如说我们用外部 api 的 动态数据,然后固定指令,我们随便给一个,比如 today 展示当天天气。 最后呢可以和他对话,我们就是当然是要进入 ai 模型来对话, ok, 然后我们可以看到在我指定了天气之后呢,他会开始问我们天气是通过哪个 a p r 来获取,包括后面我们啊定时的通知方呢?还有我们这里选择固定群聊吧,后面我来配这个 chat id, 然后对话模型啊,我们有自己的平台,所以自己来接。 而历史上下文的话,我们选择保留二十个, ok, 几分钟之后我们可以看到一个完整的项目已经做出来了,而 s r、 c 下面是一些核心的代码, 然后呢, fake 下面是各种的配置,读取的逻辑等等的,然后点 example 啊,点页微点 example 是 我们的各种飞书的配置, 这个也就是我们可能需要人工去做的一些东西了,别的基本上 ai 都能帮我们搞定,然后包括整个的部署,构建的一套全流程, ok, 所以 skill 说白了就是 ai 的 结构化知识包,相当于提示词,文档,脚本、工具等等的集合, 你给他一份 skill, 他 就知道该怎么样一步一步的完成任务,什么该问,什么该做,什么容易踩坑。在做这个 skill 的 过程中,我愈发觉得在模型能力够强以后, skill 也许在中小型任务上的能力要远远的强于工作流, 它更加轻量级,更加灵活,也更加的高效。在 ai 时代,自动化是主旋律,而 skill 则让自动化的工作中多了一层标准化,这是很难能可贵的。如果这期对你有帮助,希望能给我点赞,收藏三年,我是 carl, 我 们下期见。

哈喽,朋友们,我是阿水, a 正的 skill 最近真的太火了,但是很多朋友肯定想知道到底啥是个 skill, 凭什么这么火?那朋友们莫慌莫慌, 我呢已经为大家整理好了一套小白必读的 skill 大 全,今天的内容呢,我们将从简单到困难,一路升级打怪。首先呢,我们来看 skill 的 结构和它的原理, 然后呢,我们通过学习来定制自己的 skill。 这个 skill 呢,我们只需要简单的一句话,帮我根据这篇文章生成 ppt 分 析和内容规划,那它就会自动去执行和生成我想要的资料。 另外呢,我还会给大家推荐一些好用而且必用的 skill, 比如说帮你的文章配图,把杂乱的知识变成一个教学网页, 一句话处理表格等等等等等等。这期所有的资料我都已经整理成了文档,只需要一步一步跟着做,跟着看,就一定可以学会。那还在等什么呢?赶快点赞收藏关注呀! ok, 那 我们就 let's go! 那说了这么半天,到底什么是 agent skill 呢?直译过来呢,其实就是技能呗,比如可以把它看成一只小狗,这只小狗呢,它会记路线,听指令,使用工具,能听懂你的语气。那 agent 呢,也是同理,它要和你和平相处,也是要会这些东西的。 所以在 a 证的 skill 的 术语里面呢,它最最最核心的文件就是 skill 点 m d ai 的 工作手册,当然呢,还会有其他的文件,最后将这些文件集合在一起,打包成一个文件夹,这就是一个技能,一个 skill 了。 那有同学就要问了,阿水看着挺复杂的呀,这么做的好处是什么?本质上来说, skill 对 不懂代码和不懂怎么去创建软件的小白群体来说, 是大大降低了门槛的来,如果还是不懂,我们做一个超级简单的 skill 就 好了。这里呢,我用到的是谷歌的反重力工具 模型呢,因为可多扣的真的封号太严重了,我就用 jimna。 那 这个软件的下载方式呢?我已经放进了文档里面,可以说是非常的 perfect, 比如说我们打开反重力,在这里呢,选择模型 jimna pro 就 可以, ok, 我 们就可以开始创建了。那我们就先创建一个可以制作 ppt 的 skill 吧,可以根据我输入的文章链接或者文字帮我生成一个 ppt 内容规划。那按照反重力的创建规范呢?局 skill 必须在这个目录下面, 那我们先用最基础的方式手动创建这些文件夹,这个文件夹的名字呢,就是我们的 skill, 名字就叫做阿水 ppt 吧。这里的文件夹里面呢,必须有一个核心的文件,就是 skill 点 md, 文件 内容我已经创建好了,我们只需要把它粘贴过来就可以了。好了,这就是一个 skill 了啊啊, 有同学就会问了,这么多内容代表什么呀?别着急,我们一个一个来看。那这个文件里面呢,上面两条横线里面的内容,它叫做原信息,里边呢,有两个信息,一个是 skill 的 名字,一个是描述,就是它用来干嘛的,什么时候可以用它? 那我这里呢,直接写的,用 ppt 的 时候可以用。下面这一大段信息呢,就叫做指令,其实这里就是告诉 skill 它应该怎么做。那这里呢,我就直接写到怎么用,输出的格式是什么?那这个时候呢,就有同学又要问了,你这和自己写提示词有什么区别呢?嗯, 其实呢,还是稍微有点区别的,比如我们之前在用 jimmy 里面去生成,每次都是需要去重复输入提示词, 那如果现在去用 ide 文件,那我们只需要去输入需求就可以了。当然上面这个案例呢,是最最最初级的创建方法,简单的 skill 完全可以这么实现。那在做这个的时候,我就在想,有没有创建 skill 的 skill 呢? 果然不出我所料呀,可罗得克的官方出了一个创建 skill 的 skill, 它可以通过你的自然语言描述帮你创建一个 skill。 那 这个 skill 的 安装方法呢?大家可以去看我上期视频,巨简单。 当然这期的文档中呢,我也整理了安装方法。安装好了之后呢,我们只需要在这里用大白话描述帮我创建一个可以根据我提供的文章链接 pdf word 帮我生成 ppt 图片。这里呢,因为我们需要用到 nintendo 的 模型 api, 我 们就直接将 api 输入进去就好了。那通过我们这么一番描述,可以看到 ppt scale 就 创建好了,现在的 scale 就是 一个完整的 scale, 可以看到有说明文档,有脚本,还有输出文件夹。嗯,奇怪,我怎么感觉高级版创建起来怎么还比初级版创建起来更快更方便,更简单呢?对,主要是我们使用了创建 skill 的 skill 工具, 那我们来试试效果,出来的效果图呢,都是很不错的。那其实这个案例看下来呢,我们更多的是在用自然语言去写程序的一个功能,降低了代码的难度,而且拉近了普通人和创建软件的距离。所以只要你有明确的输入要求,或者有明确的方法 规范流程知识,创建 skill 工具呢,都会帮你创建出来一个定制的 skill 文档,里面呢,我整理了一些收集 skill 的 网站,里面有成千上万的 skill, 并且呢,我也给大家搜罗了一些普通人常用必备的 skill 工具,比如做 ppt 处理,文档表格处理,我们可以直接拖进文件夹就可以使用了。还有这个就是前端设计的 skill, 还有这个动画生成 skill, 可以 帮你做一些数学上难懂的演示动画。 当然大家也不用太焦虑怎么去把所有的东西都创建一个 skill, 我 们每个人呢,都不是必须成为技能开发者, 我们只需要把自己已经掌握的小技能或者已经沉淀出来的一些方法,重复性的事情交给让他去帮你做一些重复性的劳动力就可以了。那最后呢,资料链接我都放在了评论区, 大家快去手动创建试试吧。这个时候呢,大家就不要吝啬自己的点赞收藏关注技能了,我们下期再见,拜拜!

今天我们来聊聊,怎么让 ai 也学会吃一堑长一智,像人一样从错误中学习。 你看,现在的 ai 虽然很强,但记性不好,常常在一个问题上反复犯错,问题就出在这。他们只是录下所有经历,好坏不分,就像一堆没剪辑过的原始素材, 在这么多杂乱的信息里, ai 根本没法学到真正有用的本事。那我们换个思路,让 ai 学学人类专家,别死记硬背,直接学套路。所谓的技能,就是做事的核心方法,不是重复动作,而是真正掌握了诀窍。 好,这个叫 s k r l 的 新框架就是为了实现这个目标设计的。它的方法分三步走,简单但非常有效。我们一步步来看。 第一步,提炼经验,不管是成功还是失败,都浓缩成精华,变成有用的教训。第二步,把这些精华放进一个叫 s k l b a n k 的 技能库里,随时调用。 最有意思的是,第三步,这个技能库不是一成不变的,它会和 ai 一 起成长。一开始, ai 可能只有一些基础技能, 然后它会不断碰壁,遇到现有技能搞不定的新麻烦。重点来了,它会把这些失败变成养料,创造出更厉害的新技能。 嗯,这套理论听着挺好,那实际效果到底怎么样?大家看这张图,一目了然。红色的线就是 s k r l, 成功率把别的甩开了一大截。 具体来说,它的表现比现在很强的一些方法还要高出超过百分之十五。你看,就算是跟 gpt、 四 o 这样的顶级模型比, sq 二也稳稳胜出。所以,这意味着什么呢?简单说, ai 学得更快,做得更好,而且还特别省内存。 当然,这可不只是为了赢个游戏,最终目标是创造能解决现实难题的 ai。 想想看,当 ai 能自己给自己上课,不断变强,那它的极限又在哪里呢?

哎,咱们来想个事啊,要是让你学一个新东西,你是想把整个过程的视频一秒不差的背下来呢?还是说你只想借助几个关键的诀窍和策略?这两种方法差别可就大了去了。 今天呢,咱们就来聊聊人工智能是怎么从这种死记硬背的记忆模式进化到真正掌握技能的。 现在这些 ai 啊,真的是越来越聪明了,对吧?但你有没有发现一个特奇怪的问题,就是他们好像记性特别差,有点健忘症的意思,明明上次成功了或者失败了,下次再做同样的事,他还跟个新手一样从头再来,这就很头疼了,因为他根本没法进步啊。 好,那咱们就来深入扒一扒这个问题。首先,咱们就来聊聊这个所谓的 ai 失忆症,看看现在主流的这种靠死记硬背的方法,到底有哪些问题。 问题的根儿就在这儿,现在的 ai, 它做每个任务都好像是独立的,互不相干, 这次做完了,经验就扔了,下次再来又是一张白纸。这样一来,他根本就没法把经验串起来,形成一个自己的知识库。那你想想,他怎么可能变得更聪明更厉害呢? 所以啊,科学家们之前也想了个办法,就是所谓的基于记忆的方法。说白了,这就好比给 ai 配了个摄像机,把它过去干活的每一步,好的坏的全都录下来,做成一个巨大的视频库。 想着下次遇到类似情况, ai 就 能自己去翻这个录像袋,找找参考。但这个法子吧,听着不错,实际操作起来,问题就来了, 你想啊,那个录像袋里得有多少没用的东西啊?比如 ai 走错的路,犯的啥?还有一堆无关紧要的动作,全都是噪音,想从这一大堆乱七八糟的视频里找出真正有用的那几分钟精华,简直比大海捞针还难。 而且你看,这里就有一个特别关键的区别,老办法啊,特别功利,它一般只留下那些成功的录像,失败的呢,直接删掉扔进回收站了。 可咱们都知道一句话叫失败是成功之母,对吧?所以新的思路就来了,认为那些失败的经验其实才是最宝贵的财富,是学习真正的关键。 好,这就引出了咱们今天要讲的核心了,一种更像我们人类学习方式的新方法。 你看,这有一句话说的特别好,他说真正的人类专家,比如一个顶级的厨师,或者一个优秀的司机,他们靠的不是把所有情况下的每个动作都背下来,他们靠的是什么?是技能,是那种总结出来的,可以反复使用的核心策略, 这才是高手和新手的根本区别。那问题就来了,我们能不能也让 ai 这么干呢? 别再让他当一个只会存录像的仓库管理了,而是教他怎么从这些经历里提炼出真正的技能,给自己建一个技能库,你觉得怎么样? 没错,这正是这个叫做 skill 二 l 的 新框架想要解决的问题。来,咱们这就深入看看,这个号称更智能的学习方法到底是怎么玩的。这个 skill 二 l 框架其实主要就三步, 第一步叫技能蒸馏,听着有点悬糊是吧?第二步呢,是建一个技能库,名字叫 skl bank。 最后一步也是最厉害的一步,叫地归式进化,让它自己不断升级。咱们一步一步来看 好,先说这个技能蒸馏。你看啊,当 ai 成功完成一个任务之后,系统可不会傻乎乎地把整个过程都存下来, 他会像蒸馏一样,把那些最关键的、最核心的步骤和策略给提炼出来,变成一个短小精悍,可以到处用的技能包。但我觉得这套方法真正牛的地方是他处理失败的方式,他不把失败当垃圾扔掉,而是当宝贝收起来。 系统会仔细分析这次为什么会失败,然后总结出一条条特别具体的避坑指南。比如说,遇到这种情况,千万别那么干,或者下次再碰上这事,得换个思路。 这么一蒸馏,效果有多好呢?效率简直是爆炸性的,你看这个数字,数据量能直接压缩十到二十倍,你想想,这得省多少储存空间呢? 而且最关键的是,信息不仅没少,反而因为把那些没用的噪音都过滤掉了,剩下的全是精华,用起来更方便了。 那这些提炼出来的技能啊,教训呐,放哪儿呢?它们都会被整整齐齐地放进一个中央知识库,也就是前面提到的 skill bank。 你可以把它想象成是这个 ai 的 大脑,或者说是一个武功秘籍库,里面存着它学会的所有招式, 而且这个大脑还特别有条理。你看它里面的知识是分门别类的,有些是通用技能,就好比是内功心法,像怎么探索新环境这种干啥都用得上。 还有一些呢,是特定任务技能,就像是独门绝技,比如专门用来打扫卫生的清洁剑法这么一分类, ai 要用的时候,就能马上找到自己想要的武功秘籍了。 不过要说这个框架最厉害的地方,还不是这个技能库本身,而是这个库它是活的,它能自己净化。 这个进化的过程就是所谓的地归式进化。听着复杂,其实就是个循环。你看啊,首先,一个 ai 去挑战新任务,结果失败了, 没关系,系统马上就来复盘。这次是为什么?失败的是我哪个技能没练好,还是我的技能库里压根就没这招?然后他就根据这个失败原因,创造出一个新的技能,或者一条新的避坑指南,再把他加到那个技能库里去。 所以你发现了吗?这个 ai 的 本身能力和它的技能库,它俩是绑在一起共同成长的, ai 变强了就能挑战更难的任务,失败了又能学到更高级的技能,而技能库变强了,又反过来让 ai 变得更厉害,这就是一个完美的不动打怪升级的正向循环啊! 那么说了这么多,这套理论听起来是挺美的,但光书不练假把式,它在实际测试里效果到底怎么样呢?来上数据。 这张图就非常清楚了,在一个叫 a l f world 的 复杂测试环境里,你看这条红线,它代表的就是咱们今天讲的这个 skill r l 方法。另外两条线呢?灰色的是只靠死记硬背的老方法,蓝色的是传统的强化学习, 结果一目了然呐。红线不仅爬升得最快,最后达到的高度也最高,这就说明它不仅学得快,而且学得更好,潜力更大。 咱们再看一个具体的数字,十五点三趴,这是什么概念呢?就是说跟现在已经很厉害的一些模型比, skill r r 的 平均表现还能再提升这么多。 要知道在 ai 这个领域卷得这么厉害,能提升几个百分点都了不起了,这个数字绝对算是一个非常大的突破了。 所以咱们今天聊了这么多,核心思想其实就一个,我们得让 ai 换个学习方法了,不能再满足于当一个只会录像的机器,而是要让它学会像人一样去总结经验,提炼技猛, 只有这样我们才能得到真正强大高效,而且能适应各种复杂情况的 ai。 这已经不是简单的量变了,这是一个质的飞跃。 那么最后也给大家留一个问题思考一下,如果 ai 真的 能像我们一样不断学习,不断进化,掌握各种技能了,那我们作为他的启蒙老师,下一步最应该教给他的是什么呢?

那这个 skills 呢?它是有什么的一个作用呢?那我们首先啊带大家来看一下这样的一个效果,然后首先呢打开一个我们的打开呢以后我输入一个 open code, 然后进入到我们的这样的一个命令行,之后呢我去艾特一下啊,首先我让它呃列出列出当前 的 skill, 我 们来看一下啊,当前有什么样的一些 skill 啊?已经注册在我们的这样的一个大模型里面了。啊, 好,这个时候我们就看到有十七个是 q, 对 吧?那现在呢,我就来使用我们自己创建,也是待会要带着他手把手去做的这样的一个,或者是代码全面审查这样的一个是 q, 我 通过艾特艾特一下我们这个 demo 的 这个文件啊,那这个文件呢,打开给大家看一下,写了很多一些语法问题的一个函数,我让他 审查这个代码文件。好,我们来看一下他整个运行的一个效果啊,好,这个时候你可以看到他立马就发现了这个技能发生我们这个克罗尔的这样的一个 skill, 利用这个 skill 来做整个的工作流程。好,我们可以看到啊,他非常快的就已经 定位到相关的问题,并且会把各个问题的类型啊,并且他整个的流程呢给他全部做出来。他做完以后呢,我们就可以来看一下啊,他做这个审查有什么样的一些问题,对不对? 你别说啊,他说在先啊,看一下他在前面的啊,比如说第二十八到二十九行,他说会捕获所有的异常禁摩,我们来看一下二十八到二十九,二十八到二十九就在这里,对吧?那这个地方就是把所有的大家在这里捕获异常之后呢? pass 掉了,对不对? 我们再来看一下啊,他在三十一行,对吧?无效模式的这个禁摩处理,我们来看一下三十一行,哎,这个地方,对吧?哎,这是确实好,所以这里呢,我们就是, 哎,这样的一个 skill, 我 们到底是怎么样去做出来的啊?包括它的整个的运行。那首先我们要去理解什么是 skill? skill 实际上就是,呃,基于之前我们 m c p 也好, a 技能也好,都是一次性将这样的一个规则,对吧?我们所说的提示词还有对应的这个脚本文件呢?一次性打包给谁啊?打包给大,打包给这个上下文,嗯,打包给大模型,这样的话会造成大模型它的一个什么它的整个的啊,接受的上下文过长,它的这个 很大一部分的注意力要集中在规则的理解上面,明白吗?那么这个时候呢啊,他对于业务的这一部分的这个注意力可能就没有那么完整了。并且我们可以看到 啊,刚才呢已经生成了一个啊,这样的一个审查代码审查报告,并且写入到本地了,那这就是啊来包括他代码的原因,对吧?怎么样去优化,哎,怎么样去优化这样的一个建议,那我们可以看到这个就是我们这个代码审查的一个指标,所以呢 他的这一种做法实际上就是 let, 首先将我们这些 skill 也就是技能的名字以及他的描述先注册给大模型,那大模型只需要知道有什么样的一些技能就可以了。 至于,哎,比如说刚才我们问了这个问题,问到了这样的一个什么问题呢?我们问到了哎,审查一下这个代码的时候呢,哎,他一匹配对吧,他就匹不到我们这个代码。审查这样的一个 scale, 然后呢再去渐进式的将他所有的细节,或者说如果有找本再去做一个深入的这样的一个调用。 那我们现在看到这样的一些操作以后,那么接着我们要做一个什么样的事情呢?我们首先要去安装一个 open code 啊, open code 呢?我们安装它之前呢啊,大家如果是 windows 的 话啊,那首先要去安装一下这个 note g s, 诺基亚 s 呢,这个就不需要多收多说了啊,你就直接点击获取,然后一直下一步。然后啊我们在安装这个 oppo 扣子的时候呢,你就使用 npm, 那 安装完成以后啊,你会在哪里呢?我们会打开 cmd, 你 的诺基亚是如果装完了以后啊,你输入那个高 v 就 会有一个版本, 然后你再站,再将这一行命令啊,给他复制过来,记住不要用上面的,用这个呢,它是啊,适配我们这个贝斯命令的, 那所以像 mac 电脑就可以用这个,那你再复制运行就可以了,那我这个地方已经安装好。已经安装好了啊,安装好了的话,我打开这个 mac 的 呢,就输入他就会自动跳转到 mac 的 这样的一个命令行的界面上面来。 那我们来看一下他的官方的一个定义,以及官方的一些 qq 的 一些模板,这是阿斯洛克的 它的一个官网。怎么样去创建一个自定义的 excel, 那 这个是它官方的一个代码库,那我打开一下啊,它在什么地方啊?我们如果说默认安装的话,它就会在我们 c 盘的用户这个下面,这里会有一个点 config, config 上面会有这样的一个 open code, 你 点进去之后呢? 第一次你进来的时候,大家一定要记住这个地方是六十 k, 没,这个是 kel 文件夹的,那这个文件夹是我自定义创建的,我将官方将它 gethelp 提供的这样的一个十六个是 kel。 啊,把它下载下来以后啊,这样放进来了, 好,那刚才呢,我们实际上是看到我们在这个地方呢,是没有的,对不对?我们是多了一个,多了一个在那个 sky, 那 么这个 sky 呢?我们怎么样去做?包括怎么样去创建啊?那在这里呢,我首先把它删除掉。啊,那这个名字呢?那我就把整个文件夹都删除掉,可以吧?我把整个文件夹都删除掉, 那删除完成以后,我们就右键新建一个什么呢?新建一个文件夹的名字,我们就叫做等一下啊,那删除完成以后,我们重启一下,这个 好崩阔的啊,重启一下崩阔的,我们俩来看一下他的这个整个的,看一下他的技能的猎取啊, 当前有哪些?我们刚才将将之前制定的已经创已经删删除掉了,我们再来看一下他的这个输出。好,现在我们可以看到已经没有了之前我们创建的这样的一个 skill, 那 么我们如何去创建呢?那这个地方啊,我们首先进入到我们这个 cal 的 文件夹里面,我们去右键右键新建一个文件夹,新建一个文件夹的名字呢,我们就给它叫做库对位,好,在里面呢,大家一定要注意啊,我们要创建一个文件,这个文件呢它的名字一定要遵循这个标准,大写的是 cal, 记住是大写的 后缀是 md, md 这样的一个文件名。好,创建完成以后,我们再右键去把它打开,做一个编辑。那这个编辑呢?这个地方我就不带着大家一步一步去走了啊,我先给大家把上面的这个规则给它扩比过来, 来,我们看一下啊,在最上面是一个,三个,三个红杠,上面三个红杠结尾中间是一个 name, name 呢?后面加上一个分号,后面就是这个 sky 的 一个名字,那接下来就是它的一个描述,它的一个 description, 对 吧?表示这个 sky 是 做什么的? 好,后面我们可以去做一个深度的提示词啊,包括你的一些提示词,其他的一些编辑了啊,甚至可以去调用一些编程的脚本, 通过命令来调用。好,这个地方我们来看一下啊,那现在我把这一部分的提示词呢,给他角色的设定技能的目标。好,在这里呢,我这个地方扎一个输出一份结构化的审查报告。那这地方呢? 好,我在这个地方我让他输出报告,并且并且以文件以文件命名写入本地。 好,这是我们的输出的格式。那在这个中间呢,我们就可以根据你自己的需求跟业务去的啊,做一些种不同的相关的这样的一些,这样的一些要求,或者是设置。好,那这样我们就编程完成了, 大家一定要记住啊,他的识别,他的这个头就是这个是 qq 的 名字,跟他的 description 一定要写的清晰明了,好吧,好,那现在我们已经写完了,写完了以后呢,我们 ctrl s 保存, 保存那回跳转一下,我们现在已经创建了,创建了以后我们现在再回到这个地方上面,我再回到这个地方上面呢,我再用键打开它。啊,打开,我们再来试一下啊,我打开我们的这个 open code, 打开它以后呢,我们再让它列出 列出当前所有的 q, 是 吧?这个时候呢,我们就可以看到我们整个的 q 就 已经创建好了,那创建完成以后,我们再让它来啊,审计一下刚才这个代码, sim, 检查一下这个代码文件。好,那我们来看一下啊,这个时候它又一次又再一次加载到我们这个库德鲁尔的 skill 来做的这样的一个操作,这就是我们如何根据自己的需求去创建这样的一个自定义啊。 接下来呢,它跟我们之前的这个 m、 c、 p 啊,它的服务的构建的方式呢,从大体上来讲是差不多的,但是关键的地方就是在于它是渐近式,譬如记住这个词语渐近式它是懒加载,它最开始加载的给这个大模型的只有每个技能的名字,对不对? 当我们就像刚才我们的用户的输入,我通过这个输入审查触发到什么呢?触发到了这个技能以后,大模型才会去 调用这样的一个技能啊,才会一步一步把这个技能所有的提示词,所有的脚本全部加载进来。那么这个就是我们只看跟之前的 a 镜头也好,跟我们的提示词工程也好,跟我们的 m、 c、 p 也好,它最大的一个区别,它能够呢让我们的大模型呢 将注意力集中在业务上面,而不是啊花费大量的托管呢,去计算,去耗费在这样的一些规则上面,耗费在这种残题事实的一个个上下文里面。那这样的我们的业务呢?就会那大拇指在处理不同的业务流程的时候呢,他就会变得更加清晰,更加明亮。

这两天把点 ko 一 近五十个视频的啊,底层逻辑以及风格呢,把它封装成一个 skill, 然后能够自动帮我去生成啊公众号的文章或者是视频的脚本。然后呢,它还能够帮我自动配图,是如何做到的呢? 这个 skills 呢,主要包含以下几个部分,那第一个呢,叫提炼风格,在这块呢,我是一次性把点 ko 一 近五十个视频投入给 notebook lm 中,让它去帮我进行分析。 如果不知道怎么样去操作的小伙伴也可以参考我这期视频。然后呢,我在 gemini 中呢,让他分析出 denco e 的 这个整体的它视频的逻辑以及风格,呃,也生成了一套完整版的提示词,有需要的小伙伴呢可以在评论区告诉我。 然后我把这套风格呢,首先呢封装进我的 skills 里面。其次呢,我让他呃去帮我搜索,以及加上我自己提供的素材去生成文章,再让他去帮我去除 ai 位。这里呢,我参考了这个 skill, 大家有兴趣的小伙伴也可以去进行参考。最后一步呢,就是让他为我进行配图, 当然这步如果你觉得花的 token 太多的话,你也可以选择让它生成提示词。然后呢,后期自己去配图,因为本身一篇文章你也不需要配太多图。如果有需要去配图的话,呃,你可以参考我这个 key 的 配置。接下来呢,我把这整个 skills 呢进行一个封装,然后生成一个 md 格式的呃文件。然后, 然后呢我在 cloud code 中呢,首先我建了一个文件夹叫点 cloud, 然后呢在这个文件夹中呢,再建了一个文件夹叫 scuse, 然后,然后呢,我把这个文件呢命名成 wechat writer, 它这是一个一点零点零的版本。然后所有的刚刚我们说到的步骤呢,我都在这里面详细进行了描述。 接下来呢,我就要告诉他,帮我点扣一这个 skill。 然后呢,写一篇四百字左右的文章啊,就关于你怎么去看待 openclaw 这个主题,并且配两张图。然后呢,他就会帮我调取这个 skill 啊,然后完成相关的文章啊,包 包含了这个,呃,文章风格的这个提取啊等等。然后呢,最后呢,他就帮我输出了这一篇文章,我看着啊,我觉得整体还是挺不错的,有图有文。最后呢,我觉得大家可以去参考一下自己工作流中有没有一些重复的工作,把它封装成一个 skills, 快 去试试吧。

梅猴王朋友们, agent skill 最近真的太火了,但很多朋友肯定还是很困惑, skill 到底是啥?有什么牛的?没关系,草旅从 skill 大 全它来了。 今天呢,我们会通过一个逐步升级的案例来理解 skill 的 结构和原理,然后我们还会学会定制自己的 skill 这个 skill 呢,只需要我们说帮我做一个促销海报啊,优惠券,员工服装,它就会生成符合我们品牌风格,带 logo 的 物料图片。 另外,我也会推荐给大家一些好用的必用的 skill, 比如说帮你的文章配图,把杂乱的知识变成教学网页,一句话处理表格等等等等。 我还做了个秋之技能生成器,大家只要回答一下 ai 给的选择题,为你量身定制的技能就轻松完成了。并且今天所有的资料链接以及补充资料我都做成了一个网页,大家只需要一步步的跟着做,跟着看,就一定能搞定, 非常值得一个点赞收藏关注哦!来吧,准备好我们 go go! go! 首先,到底什么是 skill skill 呢?翻译过来就是技能呗, 它其实和人类的技能是类似的,比如说你是一个厨师,那你就有炒菜的技能,处理食材的技能,摆盘的技能等等等等。那每个技能里面,比如说炒菜技能,这里面就包含了你的流程,你要先炒什么,后放什么, 还有你的配方,你的油温多高,盐放多少。有了流程和配方呢,你可能还会需要一些工具,需要煤气灶什么的, 甚至你可能还会有一些独家的材料,有一勺秘制辣椒酱什么的。那 agent 的 技能也是同理,它要来做菜,它也得有流程、配方、工具和材料。 所以在 agent skill 的 术语里面呢,它就是 skill 点 md, references, scripts 和 assets 这些东西打包成一个文件夹,这就是一个技能,一个 skill 了。我们先来个简单的, 比如说我们要做一个写作 skill, 那 我们就在 skill 里面可以要求他先去啊这些网站去搜集信息,然后再按这个爆款原则去写个大纲,然后再参考这个语气来写稿啊,最后按照平台要求来审稿等等等等。那有朋友就很疑惑, 那这不就是写提示词吗?哎,本质上还真是的,毕竟啊,我们跟大模型的交互其实都离不开提示词, 但是呢,这并不是 agent skill 的 全部,它在工程上是有很多优势的,能做的肯定比我们拷贝粘贴提示词要多很多。好处我们后面都会说到,那先让我们通过创建一个 skill 来理解它的结构和原理, 我这里用的是谷歌反重力来做编辑器来看文件,然后呢,用的是 cloud code 来做 agent 来处理任务。这俩东西的下载方式呢,我也都放在资料里了,非常清晰简单,大家一步步跟着做就行了。 接着你只要在反重力的这里创建一个项目,比如说我的就叫丘之 project 吧,然后呢,我们调出终端, 输入 cloud cloud code 就 调用出来了,这个界面大家看着会有点复杂,但是不要怕,跟着我一步步来就可以了,之后我们跟 agent 的 对话都会在这里进行。 ok, 那 我们开始创建, 那我们先要做的是一个最简单版本的 skill, 后面呢,我们会逐步升级的哈, 那现在假设我是一家轻食店的老板,那这是我们秋之餐厅的一个品牌 logo, 那 我希望做一个 skill 呢,能够按照我的品牌调性和视觉规范,帮我们去想各种物料的创意,做一个创意生成器。 那按照 cloud 的 规定,我们创建一个 skill, 得在规定的点儿 cloud skills 文件夹里面去创一个 skill 文件,那我们用最原始的方式,直接手动的来创建这些文件夹哈,点儿 cloud skills, 然后我们再创建一个文件夹,这个文件夹的名字呢,就是我们 skill 的 名字,我们叫它秋之创意吧。那这个 skills 的 文件夹里面呢,必须规定有一个 skill 点 md 的 文件,这个大写的文件,那文件里面放啥呢?我已经写好了, 粘贴进来,那就是这么些文字。好了,这就是一个 skill 了,大家先压住脑子里面的问号,我们再来细看一下,那这个文件里呢,上面这两个横线里面的它叫做元信息 matlab, 写着两个东西啊,一个呢是 skill 的 名字,一个呢是 skill 的 描述,这两个东西专门用来告诉 ai 这个 skill 叫什么名字,是干嘛用的,什么时候可以用它,那我这就写着是做创意物料用的啊,当用户说要做个海报什么的物料,他就自己触发它了。 而下面这些信息呢,叫做指令 instruction, 其实就是具体告诉 ai 怎么样做的一些提示词喽。 ok, 那 我这写了我们的餐厅叫做秋之餐厅,品牌的风格有这么些要求,输出的格式让他是这样等等等等,非常的简单哈,那我们保存好一个 skill, 真的 就创建完了?来,我们启动 cloud code 来问问他,你有哪些 skill? ok, 你 看,他现在就已经识别到了我们的秋之创意 skill 了。 ok, 我 们直接问他,我要做一个秋之餐厅的春节促销海报,让他给个创意 好,他这里就开始提示我们,他正在加载这个 skill 了,我们同意 ok, 他 就输出了创意,并且是按照我们的要求和格式来的。 那有朋友就受不了了,哎呀,这一通操作不还是提示词吗?跟我自己写一段这个提示词存着给 cloud code 看有什么区别呢?最大的区别之一在于它是按需加载的, 什么意思呢?其实啊,当我们正常的这样跟 cloud 去聊天的时候,大模型它只会看到我们这个 skill 里面这两行短短的圆信息。 只有当我们说我们要做一个秋之物料的时候,他才意识到,哦,该看具体的指令了,他才会去加载这下面这部分的完整指令,否则这些他都不会看到。 这样的好处就是方便我们可以同时拥有很多个 skill。 每次 a 正的都会看一遍所有 skill 的 简短的原信息,但是只有当 a 正的意识到他要去具体调用一个技能了,他才会去看下面的一大堆指令,而且 ai 的 回答也会更精准, 因为他没有了其他提示词的干扰,那 ai 加载的少了, open 自然也就省了一堆。那这是他按需加载的第一层。 当然了,刚刚这个 skill 实在是太基础了啊,就算一口气把它下面的指令都加载完,好像 token 也不多哈。 但是如果我们的要求变得复杂了呢,比如说我们秋之餐厅的物料其实分很多种, 常规的呢,有海报、菜单,也有比较特别的一些实体物料要设计,比如说餐盒、杯子,员工服装,还有一些社交媒体的物料,比如说公众号封面,微博配图等等等等,他们的尺寸都不一样,配色要求也不一样, 还得符合各平台的一个规范。每一个物料呢,我们都假设它有详细的长长的说明,那这时候我们如果把所有物料的要求都写进 skill 点 m d 里面,那这个文件就会变得巨长。 但是很多时候呢,我只是想做一个,比方说实体餐盒的设计大模型,根本就不需要知道公众号封面的规格,但是 ai 还是得把整个文件都读一遍,那这就造成了 token 的 浪费,也可能会造成一些信息干扰。那怎么办呢? isopec 就 又规定了一个文件夹叫做 references, 我 们呢可以把实体的物料和社交媒体的物料这个两个规格单独拆出来,单独的给它放到这个 reference 文件夹里面去。 那这个实体物料规格点 md, 我 们就写一些线下的工服呀,餐盒之类的要求, 那这个社交媒体物料规格呢,我们就去写公众号封面呀,微博配图这些的尺寸和要求,甚至我们都可以拆得更细。 然后呢,我们只需要在 skill 点 m d 这个总指令里面只留下那几个常见的物料要求,并且我们还需要写上一个指引 啊,告诉他如果用户要做线下物料的话,那就要去读这个实体物料规格点 m d。 如果要做社交媒体类的图,那就要去读社交媒体规格点 m d, 那 现在同样的一句话, 他给出的方案就更精准了。这样当我们只做常规物料的时候,这两个 reference 的 文件大模型压根就不会看。然而当我们说做实体参合的时候,他也会通过 skill 点 md 的 指引,只去看 reference 里面的这个实体规格文件, 那这就是它的进一步按需加载了。那我们可以想象,我们可以有好多种不同情况的 reference, 反正它只会在需要的时候自己去看指定的文件。 但是现在我们的秋之创意 skill 呢,只能输出创意,还得我们自己去做图,所以呢,我就还想让它可以按照我们的品牌规格,直接帮我们把图做出来, 也没有问题。那这就要用到 skill 的 另一种文件夹了,叫做 scripts, 那 这个 scripts 里面呢,一般放的是一些可执行的脚本, 那我这里呢,实际上也就放了一个非常短非常简单的脚本,其实就是在调用 nano banana 的 api 来生图的一个脚本。那有了这个脚本之后呢,我们还得去 skill md 里面在指令里说一声,告诉他,如果用户要求直接生成图片, 那他就得把之前我们想的这个创意转化成生图的提示词,然后按照这个命令去调用这个生图脚本,这样他就能一句话自动去生成精准的图片了。 不然我们还得自己去拷贝提示词,打开软件再粘贴,再生成,再下载保存,现在我们一句话就搞定了。 另外我还有个需求,我希望深层物料的图片能保持秋之餐厅的 logo 不 变, 所以我们还得给他几张 logo 图作为深图的这个参考。那我们就可以再建一个 最新规定的一个 s s 文件夹,我们把两张的 logo 图片放到这个文件夹里,当然我们还要回到 skill 的 md 里面,告诉他参考图在这个 s s 文件夹里面,如果要深图的话,需要把这个图片当做参数给脚本传进去来执行。 好朋友们,现在这个 skill 就是 一个完整的官方完全形态了,其实有点像我们在用自然语言写程序,对吧?那我们先来试试效果,来帮我做一张周六饮料免费的一个实体海报, 你看它发生了什么?它先是加载了这个 skill, 然后它内部可能发现啊,要做的是这种实体物料,它就要去看另一个解说,于是它去检查了这个实体物料的规范。那并且它意识到我们需要的是直接生成图片, 所以呢,它又生成了提示词,把这个提示词和 logo 图片一起给到,并且运行了这个脚本。那最后它输出的图片告诉我们,在这里我们看看结果, 你瞧瞧它这个尺寸,配色 logo 是 完全符合我们这个品牌规范的啊。那为了防止这个是一次性的结果,我还多试了几次,它这个深层的效果都很不错。 然而如果我们的要求还跟之前一样,我们只要创意并不要直接深图的话,那他的这个脚本他也不会被执行。 而且呢,刚才我们说到这个 scripts 脚本,这里面其实还有一个重点,这个脚本里的代码它是写好了的, agent 根本就不需要去看里面写了什么,它只要知道我们在 skill 点 m d 里面写的那些指引,告诉它传什么参数,会输出什么,它只管运行脚本就行了。 所以不管我们在 scripts 里面写了多少行代码,大模型它都不会去读取,一点 token 都不占。 当然了,如果我们在 skill 点 md 里面的那个指引写得不够清楚,大模型不知道怎么用这个脚本,那他有可能也会不得不自己去看一下这个脚本,但他的机智和园艺是不需要去读这些脚本的。 好,那我们来回顾一下,其实创建 skill 就是 在指定的文件夹下去创建一些文件,那最简单的 skill 呢?只要一个 skill 点 m d 就 够了,里面有这个原信息和指令,而完整形态的 skill 可以 加上 references, script s s 这些可选的文件,那这些东西是怎么配合工作的呢?这就是 skill 最重要的设计。按需加载的三层结构,第一层,源信息。 这一层呢,是始终加载的, ai 的 每一次对话都会看一眼所有的 skill 的 源信息,它去看到自己有哪些技能,就像一个目录。那第二层,指令层, 这层是只有当 ai 判断并且决定我要用这个 skill 的 时候,它才会去加载完整的 skill 点 m d 文件。第三层,资源层, 这层包括了 reference 里面的参考资料, scripts 里的脚本, assets 里的资源。只有当 ai 进一步判断任务需要更详细的信息,或者它需要执行某个脚本的时候,它才会去按需加载,并且脚本它是只执行不读取的,完全不占用托克。 好了,这下我们完全理解 skill 的 按需加载,也就是官方定义的渐进式批漏机制和三层结构了。可是对于普通人来讲,这又是写 markdown 又是脚本的,好像创建一个 skill 还是挺复杂的。 no no, no, 现在谁会用手写呢?我是用这个创建 skill 的 skill 啊,秋之 skill creator 创建的。 那这个呢,是我基于很火的 skill 创建器改良的一个更加互动式,更加小白的一个 skill 创建器。那大家把它下载下了以后,放到这个点儿 cloud skills 文件夹里面就好了。那下好之后,我们想要创建什么 skill, 直接打开 cloud 直接跟它说就行, 或者我们也可以斜杠来调用他,那他呢,会开始一步步的引导和追问我们,来帮我们梳理这个需求。而且我特意设计的是这种用选择题的方式来追问我们整个过程,我们就只需要用大白话回复他的问题,以及按一按上下键做一做选择题就好了。 他这个追问的过程啊,到时候大家问题可能和我现在这个不一样,因为他会根据你的需求去做灵活的调整啊,他都是现编的。 然后呢,这个过程中因为我们要做图片,所以我们还需要给他提供 logo 图的参考,以及那个 nano 不 nana 的 a p i 和文档。那我也给他直接拖到了这个项目文件里,然后告诉他了一下这个文件的路径, 他就会自己去参考和把它们放到 excel 文件夹里面。那这两个素材我也都已经放在了我们的课后网页上了,大家可以去用做练习来试试复现它。 那问完这些问题之后呢,他还会给我们核对一下方案,如果我们看着方案没问题,那他就会自动帮我们生成所有的 skill 文件了。 那做好 skill 之后呢,他还会帮你想几个例子来跑一下测试。我们这里其实测了好几个,风格都很一致,很好看。大家在这个调整的过程中,也可以去点开他写的这些 skill 文档来手动的修改一些,反正都是提示词嘛。 所以总之只要你有明确的输出要求,或者有明确的方法规范流程知识,创建器就会指引你帮你来写出一个定制的 skill。 而且除了自己创建,网上也有很多现成的 skill 资料里,我也整理了一些集合网站和 skill 仓库,成千上万的 skill, 大家可以去逛逛。并且我也给大家打包了几个普通人常用的必备 skill, 比如做 ppt, 处理文档, excel, pdf 这些基础的,我们直接把它拖进 skill 文件夹就可以,一句话让它帮你把乱糟糟的表格梳理得整整齐齐。 还有这个官方的前端设计 skill, 这是直接让 cloud code 生成的前端网页,而这个是挂载了这个前端 skill, 做出来的网页,效果明显大幅提升。还有这个动画生成的 skill, 用这么一段提示词就可以做出这样一段演示动画。 当然大家也不用去装一堆自己根本用不上的技能,一个游戏英雄也只需要四个技能 q w e r 就 能杀遍全场。所以最有效的还是把你最最高频做的几件事,打磨成一个你独家的稳定产出的 skill。 尤其是你对结果有明确的要求,你有经验和方法,你验证过的事情。 比如说打工人,你的周报每周都要写,那就做一个让 ai 来主动采访你,然后出周报的一个 skill。 比如说老师每节课都要背课,那就做一个你只要给出课题,就能给你一整套课件习题和 ppt 的 skill。 又比如说,你总是要给你的文章配图,那就做一个给他一篇文章,他就按你的风格做配图的 skill。 又比如说,你总是在审核,那就做一个按照你的规矩自动批阅合同来写备注的 skill。 因为大多数的人都不需要成为一个技能开发者, 我们只要先把自己掌握的小技能交给 ai, 让他替你重复劳动。好了,资料链接都在评论区了,大家动手试试吧!这个时候呢,点赞、收藏、关注的技能就该出发了,我们下次见了!

今天我们要聊的是如何通过技能抽象和分层的技能库来让大型语言模型驱动的智能体能够从过往的经验当中去学习。没错,并且能够把这些经验泛化到更复杂的新的任务当中。没错,这个其实是现在 人工智能领域非常关注的一个问题。对,那我们就直接开始今天的讨论吧。首先咱们来聊一聊 sklr 这个框架,它到底是解决了一个什么问题,以及它的核心的思路是什么? 然后它和传统的基于内存的这种智能体在处理经验的时候到底有什么本质上的不同? klr 其实就是针对大型语言模型智能体,它的经验泛化能力比较差,以及它难以从过去的经历中学到东西,然后设计的一个框架。嗯, 它主要是通过自动的技能发现以及这种地归的进化机制,把那些非常融于的轨迹提炼成一种结构化的技能。 ok, 然后它会不断的去优化智能体的策略和这个技能库。 那传统的方法就是它只是单纯的去存储这些原始的轨迹,所以它就会非常的融于有很多噪声,然后它的这个上下文的开销也很高, 最关键的是它很难去提取出那些可以重复使用的高层的行为模式。原来是这样,那接下来咱们就来好好的拆解一下这个 skill r l 到底是怎么设计的?然后它里面最核心的三大模块到底是怎么工作的?它其实是有三大核心的模块。嗯,第一个模块叫惊艳蒸馏, 他其实会去收集成功的和失败的轨迹,然后通过这个教师模型把他提炼成一种非常简洁的技能, ok, 那 这个其实就会有一个十到二十倍左右的令牌压缩。 对,相当于就是他把有效的策略以及失败的教训都进行了一个提炼。那这个分层技能库到底是怎么来组织和解锁这些技能的呢?分层技能库他是分成了通用技能和任务特定技能, ok, 然后他在推理的时候会通过语义的相似性 来动态的解锁出最相关的技能。对,这样的话就可以在上下文的效率和指导的价值之间取得一个比较好的平衡。明白了,那这个地归进化机制,具体又是怎么让这个技能库和智能体的策略不断的进化的呢? 它其实是一开始会用 sft 让模型先学会怎么去使用这些技能,然后在后面的 r l 训练过程当中,它还会不断地去分析验证失败的轨迹,然后动态地去添加或者是优化技能, ok, 所以 它其实是技能库和智能体的政策是同步的在进化的。我有一个疑问啊,就这个 skill ll 框架,它到底在实际的任务当中表现怎么样? ok, 然后它在哪些任务上面会比其他的方法有比较明显的优势? 呃,在实验当中呢,就是这个 skill ll 在 a l f word 的 上面取得了百分之八十九点九的成功率,嗯,这是比之前的最强的基准还要高百分之十五点三, 然后 gpt 四点零,只有百分之四十九点八, jammer 二点五, pro 是 百分之五十八点七, ok, 然后在 webshop 上面是百分之七十二点七, 也是明显的高于其他的那些基于内存增强的 rl 的 方法,这个提升确实很明显啊。那在搜索增强的问答上面,它的表现又怎么样呢?在搜索增强的问答上面,它的平均得分是百分之四十七点一。 ok, 特别是在这种多跳的问答上面是特别厉害的。 然后通过消融实验也证明了,就是这几个模块,包括这个分层的结构技能库,还有能启动的 s f、 t 以及这个动态的进化, 每一个都对这个整体的性能是有很大的贡献的。哎,那最后我们要聊的就是 scale r o l 这个框架它到底有什么独特的价值?然后它对于未来大模型智能体的发展会有什么样的影响?这个框架它最大的突破就是它通过这种技能的抽象, 极大地提升了经验的附佣率和泛化能力。 ok, 然后让小模型也可以通过结构化的经验去完成原本只有大模型才能做的复杂任务。 对,这其实是给 l l m 智能体的高效进化提供了一个全新的思路。好的,那我们今天把这个 skill r l 这个框架,从它的设计到它的核心的模块,再到它的实际的效果以及它的独特的价值 给大家都拆解了一遍。嗯,确实是让我们看到了结构化的技能抽象在提升智能体的这种复杂任务的能力上面巨大的潜力。没错没错,那今天的内容咱们就到这里了, 感谢大家的收听,咱们下期再见,拜拜。拜拜。