oppo pro 逼近二十万星,正式超越 longchain autopod 登顶高清,成为名副其实的史上最热门 a 阵开点项目。而从 oppo pro 发布到现在,也就仅仅过去了一个半月的时间啊! 本期视频带你一站式深入了解当下爆火的 oppo pro 底层架构与核心原理,并借助外扣顶从零到一手搓衣板寄予 longchain 的 更适合企业内部高病发环境下。拥有 oppo pro 全部核心功能的 mini oppo pro, 不仅能够一比一复刻 oppo pro 的 最核心的功能,而且和 oppo pro 一 样拥有网络操作工具、沙雕、环境命令行工具、浏览器、动画工具等各项内置工具, 同时也能自由装载 skills, 支持标准格式的 agent skills 灵活载入,支持在对话过程中自主调用工作流和永久修改记忆,实现自主进化,越用越聪明。此外还支持一键绘画、压缩长期记忆剪索等各项 oppo pro 的 记忆管理功能。 并且作为教学项目,迷你 oppo pro 还支持实时文档的具内容,当前加载的 skills 具内容等等, 相信这也是目前全网最深入、最完整的 oppo pro 核心技术拆解,用狼人手搓的 oppo pro 也是全网独此一份,如此高价值的课程质量,还望大家多多三连支持国外科完整的资料, oppo pro 核心的功能、价格图、复现 oppo pro 的 完整提示词、 web 编辑、发流程等等都已经上线着复范大模型进入社区最开始给他提供的需求文档,也就是大家现在看到这样的可以文档, 这文档大家是可以直接找我们的制作老师来进行领取的哈,那么这个文档哈上就是一个非常完整的啊,围绕我们的让我们的 top 呢来进行开发的这个需求文档, 需要注意的时候,我们再进行一些核心功能的开发跟附件的时候,其实你自己是需要有完整的这个理解,包括它的功能理解和它底层的技术架构这样的理解,然后呢才可能才能够去编写好一篇完整的需求文档啊。那么由于这个项目是 webcody 来进开发,所以呢,我们就会我会从一个 webcody 这个思路跟大家来介绍关于如果你要首推这个项目的话,怎么样去引导 code 来完成开发, 比如说这里面我们就需要介绍啊,项目的个定位啊,啊,项目的这个功能啊,它呢是一个基于 python 重构的这个轻量且高度透明的 ai agent 系统,对不对?只在复刻并优化 open club 啊,原名 boat, 呃,原名 motboat 啊, club boat 的 核心体验啊,大概就这样的这个这样的一些功能,那么其中呢,我们来进行这轮的这个 顾客的时候去重点是需要去实现他的文件及记忆技能,记插件啊,还有透明可透明可控啊这三方面的核心的功能特性。这功能特性是我跟他讲啊,要来进行这番这三方面的这个复现,所以你会发现哪怕我们使用 webco 这样的工具去完成项目开发,你也得对这项目有非常深刻的这个理解,要不然的话你都没法去指挥他 哈,然后紧接着啊,核心架构啊,核心架构后端呢?主要是 python 啊这个,然后外部呢是使用这个 fast api, 对 不对啊?后端给提供呃,给来给前端提供这个接口,然后呢 agent 的 编排引擎是最新版的 rogram 一 点啊,这个二,还一点二这样的这个版本,然后呢,统一是使用 create agent 的 api 来进行开发, 然后这里面为什么会有核心说明说严禁使用旧版啊?就是因为对于很多大冒险来说,他们会默认这个 log, 呃,默认这个 log chain 呢?它在进行 agent 开发,还是用这个早期的 create react agent 的, 这其实是个非常重大的一个 api 的, 这个,呃,信息没有对齐的啊,这样的问题啊,所以这里会有一个相关的这说明,然后 reg 引擎啊,是使用 zelma index, 然后来进行混合键锁, 那么浪漫 in 混合解锁的话,其实这里面最好你也是给它提供,可以给它提供一个代码,好让它能够更好的去知道啊,这个混合解锁怎么样来进行实现,然后紧接着,对不对啊?第一部分呢,是它的基本架构跟项目介绍,那么紧接着第二部分啊,就是内置工具,那内置工具就这么几项啊,需要跟它讲得非常清楚,包括 微银行工具,包括 pet 代码检测器啊,包括文件读取的这样的工具啊,还有这个 rap 解锁工具等等等等,你是需要跟它讲的非常清楚的。然后同时接下来 第三部分就是关于它的这个 agent skills 这样的一个系统,因为一般来说哈,对于一个啊,这样的一个项目开发来说,肯定是从最基础的功能啊,到更加复杂的功能,那么上面我们所列出的一个功能相当于一个功能,相当来说还是 较独立的这样的功能啊,那么再往下啊,比如说像 agent skills 啊,甚至是再往下啊,它的对话记忆管理系统啊,这些,其实就属于相对来说比较综合的一些这功能啊,所以一般来说综合的功能呢,会往后放啊,大概是这样的情况。当然其实这里面具体的 agent skills 的 这样的系统,它里面的这些文字回答大家大家可以自己去看一下哈, 但基本上啊,就和我们刚刚所介绍的其实没有太大的这个区别啊。 agent 的 skills 是 什么?然后呢,它需要有哪一些东西,对不对?它本质上是一个一个文件夹,然后里面呢需要有 markdown 文档, markdown 文档呢,是当前的你的一个又一个 skill 的 这样的一个能力的介绍,然后它需要有原数据, 方便后面来进行系统消息的这样的一个拼接啊,它通过原数据的方式呢,去提取你当前的这个 skills 里面的核心的这个内容,那原数据差不多长这样,对不对?然后最后呢,提取到的这个 skills 杠啊, snapshots 啊,差不多长这样啊,它就这样的一些功能,然后它调流程是什么? 首先第一步啊, system prompt 先感知到你的 skills 列表,然后呢再再通过 function calling 来进行决策,然后实际它读取你的这个 markdown 文档的过程,是一个 function calling 这样的流程,然后读取完了之后,接下来啊,这个大 agent 就 会根据它读取到这个文档去考虑接下来该怎么样进行运行啊,这个呢,是它的一个完整的调用流程, 那么再往下啊,就是关于记忆管理系统的这样的设计啊,记忆管理设计系统的这个设计其实相对来说会更加的完善一些哈,上面这个 skill 的 这个系统设计,我们之后还会有节公开课,专门去从零到一,跟他去跟大家去讲啊,这个 skills 到底是如何来进行的这个实现。那么现在这个版本的这个 skill 其实主要是能跑通功能为准啊,但是 skill 的 这样的一个 啊,技能体系呢,相对来说会比较庞大啊,也会比较复杂,我们下场课会到会到时候再来讲。那么首先呢,那么接下来就是关于记忆管理系统这样的设计,那么记忆管理系统设计呢,我们跟大家说啊,所有的记忆都是本地文件对不对?然后呢这个 prompt 啊,是由这六部分构成,然后呢 这六部分啊,包含哪些基本的这个指令啊,也跟大家讲清楚,然后接下来绘画存储存出来哪大概这样的情况。然后紧接着第五部分啊,就是关于后端 api 的 这个接口规范, 这个的话,其实我觉得如果大家懂啊, fast api 的 话,你可以写啊,如果不懂的话,可以让大源模型自己去写,问题也不大啊,因为对大源模型来说,如果你没有办法 把这从一个技术开发这个思维,把它转换成是一个产品设计的这个思维,包括后端工程师,后端工程师对于后端功能的接口的这规划的这个思维的话,那么让大源模型做也是一样的,也是没有任何关系的啊,因为其实其实你整体的项目功能确定了之后,后端接口应该怎么样进行设计?大源模型其实是非常清楚的啊, 这个前面什么问题?最后呢前端前端的这开发,前端开发的话也是一样的啊,现在其实有很多前端的一些开发的一些工具啊,包括 u i u x pro max 那 样的个项目啊,包括 pencil 那 个项目,都是可以所看及所得的来完成前端的开发啊,包括最新版的 cursor, 包括这个 figma 啊,都是可以 所看即所得啊。你看的这样前端,然后跟他说怎么样进行修改,然后他就会自动来进行修改,修改完之后呢,会给你生成对应的前端代码啊,这也有很多项目都可以来进行实现。那我们这其实是采用了一个比较古早的这种开发方式哈,就是把他跟他讲清楚前端的项目的基本的开发的这个站啊,和他基本的风格规范, 然后比较重要的项目开发结构,这个呢是你需要最好提前确定的啊,因为呃,如果你没有确定的话,到时候开发的这个很多乱七八糟这个结构你可能就不太可控了, 那么这个呢是它完整的开发需求的这个文档。那么实际上当我们去使用 webcoding 来进行开发的时候哈,那么其实我们在使用 cloud code 里面有很多技巧啊,就比如说你最开始是需要这个把开发需求文档给它放到空的文件夹里边的, 然后呢给它输入杠 init 这样的一个命令,那么输入完成之后呢,那么 cloud code 实际上它就会促使化当前这样的项目,不要小看 cloud code 的 促使化项目这样的过程哈,在它促使化的过程当中,它会去读关于你现在的这个项目里面的所有的文件, 当他读到只有一个开发需求文档的时候,他就知道,哎,我现在呢,是需要从零到一帮你去完成这个项目的开发啊,然后他就会去仔细的去读你开发开发需求文档, 然后同时他也会自动去提炼你当前的这个开发需求文档里面的核心内容,然后呢去生成一个叫 cloud 点 md 的 这样的这个文件,那么这个文件就是他未来在进行编程过程当中的他自己本次运行的最 高准折啊,然后这个文件它是会自主生成的啊,这个文件是它自个儿保障自个儿能够很好的完成编程开发项目所生成的这样的个 system prompt 啊,这个过程其实非常的智能啊,这就是 cloud code 会生成的很好用的一个方面原因吧。 那么紧接着啊,最后呢啊,当然我们实际提示过程会呃提示的这个呃流程会比较长哈,最后开发得到这个结果就是我们现在大家看到的啊,完整的啊,现在我们只给大家展示后端哈,完整的,后端的。 接下来的公开课,我还将围绕更多的技术细节展开介绍,同时将借助 web coding 带大家重领手搓迷你 oppo colore web coding 完整的需求跟题目的过程也都包含在本期公开课的课题中和课题代码等一集都已经上传至反大模型进入社区。
粉丝1.0万获赞2.6万

以前为了让 ai 写个符合格式的周报,我们恨不得要手写五百字的提示词,结果它还能给你瞎编。现在呢,你只需要挂载一个封装好的 agent skill, 效率直接提升十倍不止。 很多人还在傻傻地跟 ai 聊天,但真正的高手早就开始配置 ai 了,从聊天的伴侣到干活的牛马,中间到底差了什么呢?其实就是我们今天要讲的核心, agent skills。 我 把视频内容分为了四个部分。首先第一部分,我们会过一遍交互方式的眼镜, 搞懂了这个源头,你对 ai 的 理解就不只是停留在表面了。接着第二部分,我们就直奔主题, agent skills 到底是什么,我会把它拆开给你看,就跟我们平时用一个万能工具包差不多。 然后第三部分,顺理成章的我们看看 skills 的 工作流程。也就是说,当 ai 真正接到你的任务时,他脑子里是怎么思考怎么挑工具,最后怎么把活干完的。 这个流程你看懂了以后,你调 bug 或者是看系统日制,一眼就能够看出问题出在哪里。最后这一部分绝对是面试和实战中最容易被问到,也是最容易踩坑的地方。我会把 m c p, workflow 这些词拿出来对比一下, 理清了这些啊,以后,再看到外面出了什么新的框架或者是什么协议啊,我们都能一眼看透本质,做到心里有底。好话不多说,我们直接进入第一部分。其实呢,要搞懂 age 呢,为什么能干那么多复杂的活?我们得先往回看一眼,理一理我们是怎么一步一步把大模型调教成现在这样的 这个交互方式的眼镜啊,其实就是一个从结果经常失控到效率高度固化的过程。你看,最开始也就是 level 一 的时候,大家都在研究 prompt 提示词最左边这个图啊,普通的 prompt, 就 像是你随口跟 ai 说了一句,帮我写个简历,结果呢,它可能洋洋洒洒的给你写了一堆的废话,排版也是乱七八糟,重点很明显就是结果根本不可控,对吧? 为了解决这个呢,我们摸索出了右边这种结构化 prompt, 给它设定具体的 role 角色, task 任务,还有 rules 规则。那就像是你平时点外卖,以前你只说弄点吃的,现在备注上写得清清楚楚,扫蜡不放香菜,加个煎蛋, 加上这种结构化的约束之后啊, ai 给出的东西就规矩多了,那马上我们就发现了新的问题,于是进化到了 level 二 come on 的 命令。你看,结构化的提示词虽然好用,但是什么呢?但是它太长了对吧? 我们平时干活总不能每次写需要写简历的时候都去复制粘贴,或者是手敲几百字的要求进去,那也太反人类了。所以我们解决方案是什么? 就是把那些长篇大论的好用的提置词直接封装成一个文件以后再用的时候啊,只需要敲一个快捷指令,比如说图上的,嗯,反斜杠 resume, 瞬间就能调出那一整套复杂的规则。其实呢,这一步就是把我们摸索出来的最佳实践,变成了可以随时调用的快捷键,把效率给固化下来了。不过啊,指令虽然快捷,但如果是长篇大论的聊呢, 这就碰到了 level 三的痛点,所以呢,就引出了 system prompt, 也就是系统提示词。你看平时聊天聊得一长,上下文一多, ai 就 特别容易断篇,把你一开始提的规则全给忘了。 这时候怎么办?我们就得用点 cursor rules, 或者是嗯 cloud, 点 md 这样的文件。你看右边有个架构图, system prompt 永远在最上面,它享有一票否决的最高优先级。不管下面这个灰色的那个用户输入框里怎么瞎聊, ai 脑子里那根弦总是绷紧的,因为它知道头上总有一个系统级的规则在压制着它。 然后我们顺着往下走,等业务再复杂一点呢,我们就来到了 level 四 mate data 原数据阶段。 大家想象一个场景,如果我们的 ai 助手要处理一百种不同的任务,有简历,有周报,有邮件,我们总不能把这一百个场景的背景资料全都塞进他的脑子里吧?那不仅模型上下文称报了,每天消耗 token 的 钱我们也烧不起啊,对吧? 所以你看中间这一个像安检门一样的闸机。我们的做法是啊,给每个文件贴上一个智能标签,贴上一个 tag, 我们只把少量的 mate data 发给模型模型一看,哦,你现在要写简历是吧?行,那我就只把那个简历那个文件给拽过来看看。这就实现了万虚加载。对于我们做这一行的人来说,意味着你系统的扩展能力一下子就被彻底打开了,再也不用抠抠搜搜的去算 toon 上线了。 最后就到了现在的 level 五, references and scripts 参考资料与脚本在这个阶段, ai 的 能力不再是一把抓,而是通过渐进式批录来扩展的。什么意思呢?就是他知道怎么去一步步找答案。 你看图上这个结构,一边是 references 或遇到不懂的,他可以去按需加载产品手册啦,还可以读工程文档。另一边就更厉害了,是 scripts。 ai 现在不但知道你要干什么,它还能直接调用右边这些 python 脚本去帮你生成 pdf, 去跑数据分析。它不仅能动嘴,还能真刀真枪地动手了。 说到这里,你可能发现了,从最开始的一句闲聊,到现在能挂载标签,能跑代码大模型,越来越像一个带着万能工具箱的资深员工了。但是这个工具箱里到底装的是什么呢?它是怎么运转的?这就来到我们第二章节, agent skills 的 本质与构成。 首先,什么是 agent skills? 官方定义叫它被封装的动态能力单元,听着有点绕,对吧?其实说白了,一个 skill 就 像是你手机里的一个独立 app, 或者是一个打包好的标准工作包。 你看,这里有个蓝色的文件夹,比如我们管它叫 resume writer, 简历代写员,它不是一个光秃秃的一句提示词,把它拆开看,里面其实装了四样东西。第一样是最左边的 skill 点 md, 也就是入口,或者是系统提示词。 这就像是技能的岗位说明书,它提前规定好了你现在的角色啊,是一个资深 hr, 你 要按照 star 法则来写,语气要专业。 第二个呢,是 mate data 路由标签,这个特别关键,你可以把它当成这个技能包的门牌号,或者是自我介绍的标签。你想啊,系统里面如果有几十个技能, ai 怎么知道什么时候该掉哪个呢?掉的就是这个。 比如说标签上写着简历、求职排版,那用户一提到找工作,系统立刻就能把它揪出来。第三个是 references 数据素材,这就相当于发给 ai 的 参考资料,比如说你们公司的业务白皮书,或者是标准的简历模板文件。 ai 干活之前,可以先翻一翻这些资料,心里就会有数了,不会胡编乱造。最后一个最右边这个 script 执行工具,这就是发给 ai 的 干活工具箱。比如说给他配一个 python 脚本, 他能上网搜一下最新的行业动态,或者是能直接把写好的文本转成一个漂亮的 pdf。 所以你看最底下这个公式就很直观了, bill 就 等于岗位说明书,加上门牌号标签,加上参考资料库,再加一个干活工具箱, 把它们给打包在一起,就成了一个能够随时能用的独立技能。对于我们平时做业务开发来说,这意味着你系统的能力可以高度附用。你想加一个新功能,不用去改底层的核心代码,直接塞个新的技能文件夹进去就可以了,非常清爽。 好,那么既然技能包已经打包好了,真正用起来的时候,系统是怎么运转的呢?这就到了我们第三部分 skills 的 工作流程, 我们来看一下这个流程图,其实弄懂了这五个步骤以后,不管你是用什么炫酷的 agent 的 框架,你脑子里的主线都是清晰的,排查 bug 也特别快。你看最左边第一步,用户发了一句话帮我写简历, 这时候呢,你看第二步,这个框,我们的客户端 clients 其实并没有把用户的这一句大白话,连同那一堆复杂的工具啊,长篇大论的提示词,一股脑的全扔给大模型,没那么傻,全扔过去,太费 token 了吧,太费钱了。 他其实只是把所有 scale 的 matter data, 也就是我们刚才说的门牌号标签收集起来,发给模型去挑。那就好比老板拿到一个新项目,他不会把你们公司几百号人的详细简历全都看一遍吧,他只会看大家挂在脑门上的技能标签。 接着呢,到第三步, model, 也就是大模型,一看这些标签,秒懂,哦,你是要写简历是吧?这个活呢,得归那个叫做 resume writer 的 技能包来管。于是模型就把这个决定告诉了客户端。 然后第四步,客户端一听好,马上去把 resume 这个文件夹给翻出来,把里面详细的 skill 点 md, 也就是岗位说明书给加载进来。直到这一步,这个简历代写员的这个角色啊,才被真正的激活。 最后一步, execute ai 开始真正干活了,遇到不懂的,去读取刚才说的那个参考资料 references, 遇到需要动手操作的, 去运行代码脚本 script, 一 道行云流水的动作搞完,最后把一份排版精美的简历结果 result 拍在用户面前。所以你看整个流程,其实特别符合我们的直觉。先看标签分发任务, 备上号了,再去加载详细说明书,最后拿工具干活。这是一个非常优雅的按需加载的过程。好,我们趁热打铁,直接进入最关键的第四部分,核心概念变期。 刚才我们看完了技能是怎么一步步被调用的,这时候你可能要问了,他现在外面满天飞的新词,什么 m c p 啦, workflow 啦,那么跟我们今天讲的 skill 到底是个什么关系,是不是一回事儿?其实真不是,这一部分我们必须要理清,不然以后看技术文档或者是做技术选型的时候特别容易蒙。 我们先来看第一组对比 deal 和 mcp, 这两最近经常被放在一起讨论,我给他们的比喻是大脑与手的区别。你看左边这个 mcp 听得很多,对吧? 本质上是什么呢?它就是一套标准化的工具接口,相当于你给大模型配了一双特别灵活的手,或者是丢给他一个极其全面的工具箱。 first, 有 了它,模型能去查数据,能去读本地文件了。 但是这里有个什么问题呢?他手里有工具,但是他未必有经验。这就好比你给我发了一套米其林大厨的定制的刀具,但是我本人根本就不会做饭啊,那我肯定是做不出法式大餐的呀。这时候呢,就需要右边的 agent skill 了。 skill 相当于什么呢?相当于这一本厚厚的操作指南和行业经验,它规定了遇到什么情况该用拿把刀切多厚,也就是何时使用工具以及如何组合工具。 所以你看 m c p 解决了能不能干的连接问题,而 skill 解决的是干得好不好的经验问题。大脑和手,它们是配合的关系,不是替代的关系。 好,那我们再来看第二组容易混淆的 skill 和 workflow 工作流。很多人都喜欢拿 n 八 n define 或者是扣子里面那种连线工作流来做 agent。 你 看左边这个图, block flow 就 像是铺好的铁轨,它是固定编排的,也就是说第一步干什么,第二步干什么,遇到 a 走上面,遇到 b 走下面,这全是你在这个系统设计的时候啊,人为把它锁死的,哪怕跑的过程中呢,遇到点没见过的新情况,它也只能死板的按着这个轨道走, 很容易卡壳报错。但是右边这个 agent skill 就 不一样了,它完全是由模型驱动的,你看它像不像一个神经元的网络?它的执行路径啊,不是写死的,而是 ai 每走一步,看看周围的情况, 及时决定下一步该干嘛。打个比方, walk flow 就 像是你坐地铁,路线早就定好了,到哪站停都是定好的。而用 skill agent 就 像是你打了个网约车,司机知道你的终点,但是前面如果遇到堵车了,它自己会灵活地绕路。 对于我们做架构设计的人来说,这意味着你的系统真正具备了处理复杂、未知异常的能力,不再是那种一碰就碎的流水线了。聊到这里,其实最让人迷糊的概念我们就拆解完了。现在我们把视角拉高,来看一看这个金字塔。这就是我们今天讲的整个架构眼镜的浓缩, 从最底下的 level 一 三八八的提示词,到 level 二用快捷命令固化效率,再到 level 三拿系统提示词去压制聊天的遗忘。接着往上走 level 四,我们引入了原数据 mate data, 实现了给各种文件贴上标签,按需加载。 最后终于到了金字塔间的 level 五,也就是带着参考资料和执行脚本的完整的 agent skill。 你看右边这个箭头,随着我们一步步往上搭,大模型的智能化程度啊,还有它能够处理业务的复杂度是直线上升的。所以最后我们来总结一下, 其实呢,今天我们见证的是人机交互方式的一个根本性的质变。以前我们总觉得用 ai 嘛,不就是在那个聊天框,也就是左边这个气泡里面跟他聊天说话吗? 其实到了 agent skills 这一步啊,对于我们做这一行的人来说,意味着我们不再仅仅是向 ai 发送文字,而是在配置 ai 的 专业能力。你看,我们把提示词,公司的业务数据还有执行代码,像拼乐高一样封装成了一个一个的 skill, 就是 右边这个齿轮。 通过这种配置,我们硬生生的把一个通用的只会讲车轱辘话的聊天伴侣,变成了一个具备你们公司特定领域经验的专家代理,这才是真正的 agent 时代的做事方式。好,那今天关于 agent skill 的 深度拆解就先聊到这里,我们下期再见。

别再瞎找了,这是你唯一需要的一个 skill。 find skills 就是 帮你找 skills 的 skill。 比方如我想找一个 ios 开发的 skill, 那 就跟 ai 说,用找 skill 的 skill 帮我找一个开发 ios app 的 skill, 它就会自动调用 find skill 找到符合你描述的 skill。 当然,描述的越精确,找的就越精确。安装方法也非常简单,只需要官方的这行命令就可以。 这里需要注意的两个点是,第一是最好选择全局安装,第二个选择复制到所有的 a 阵,否则可能找不到这个 skill。 好 了,如果不会安装,可以在评论区留言关注我,了解更多 ai 干货,感谢大家观看!

六百,这是现在市面上 ai, ai 产品的数量,这么多 ai, ai 到底应该用哪一个?下面我挑选了几个比较热门的项目,看完之后你就知道应该选哪个了。首先是 cloud code, 功能强大,可以创建多个 sub agent 并行处理工作。作为 agent skills 的 发明人,他有内置 skills, 也可以自己做,也可以用别人的 skills, 还可以连接 mcp 服务。如果你开通了 co work, 你 甚至还可以操纵电脑本地文件。 下面就是缺点了,第一个是有点贵,一个月最低费用也要十七刀,而且它没有图形处理界面,都是用命令行去操作。 刚刚提到的 cover, 它也只发布了 mac os 版本,现在暂时还没有 windows 版本,它还是比较适合有编程基础的朋友。下面是扣子,国产通用型 ai agent, 无代码环境,不需要编程基础,想要什么功能直接跟 ai 说就好。功能也很丰富,可以做工作流, 还支持各种插件,也有插件市场,也可以外界 mcb 服务,不过 mcb 服务要额外收费,就算是小白也可以轻松上手。缺点是定制化程度不高,如果要做稍微复杂的功能,就可能会力不从心了。然后就是 cloud bot, 最近在外网很火的一个项目, cloud 给他上了点压力之后,就把名字改成了 open cloud。 这个是真正意义上的私人管家,可以帮你操作本地文件,甚至还可以帮你部署网络。 而这一切都可以通过通讯软件给他下指令,你可以出去玩,然后让他在家里帮你干活。但是自由的代价就是安全问题,你给他的权限越多,你面临的威胁也就越多,如果没有把握做好安全防护的话,我感觉还是谨慎使用 n 八 n 八 n 八 n 对 我来说,其实它不是一个 a 阵的,它主打的是工作流,它是需要你对整个任务流程有个很明确的规划的。如果你有一定的电脑知识,而且你不需要 a 阵的帮你去做规划,那 n 八 n 应该能给你很大的帮助。 最后一个就是 minos。 minos 的 缺点对我来说一个就是贵,它的本质是协调多个模型去帮你处理工作,所以它注定是高成本的,一个月最低要二十美元,使用之前要评估一下它的价值值不值得这样的投入。 最后,总而言之,没有编程基础的小白首选扣子,扣子没法满足你的要求,而且你不需要别人做规划,就选 cut code, 有 钱人选 minos, 就 这样。

这是你朋友给你发的神秘工具,有的能生成好看的照片,有的能让 ai 越狱,还有的能一键复活。老大,离谱的 ai 用法总是离不开离谱的提示词和工具,渴望学习的你是在评论区找大佬分享,还是晚上偷偷来我家让我教你呢?其实这些都不用,因为这个 game 上爆火的 skills 项目可以解决一切问题。 不过在说它之前,我们首先要知道,最近全网吹爆的 skills 真的 那么万能吗?它背后的原理又是什么呢?小白又要如何用它?本期视频将带你一探究竟,同时也会分享几种离谱的玩法,建议各位在父母的陪同下使用。在使用之前,我们先来诉通一下 skills 究竟是什么。 二零二五年十月份的时候,一家叫 ansopik 的 公司先提出了名为 cloud skill 的 技术,然后基于这个技术又推出了 agent skill 开放标准,让起初只能在自家软件上使用的 skill 也可以在其他软件上使用。不 过即便这么良心,这个标准制作完成后,它还是不温不火。但是随着时间的流逝,它的好处也在慢慢显现,因为 skill 可以 很方便地分享给别人使用。于是有不少人自发的将自制的 skill 上传到 github 上,吸引网友下载, 结果好评如潮。有人夸他的功能非常离谱,有人夸他非常节省偷啃。这是因为他用了一种叫做渐进式批漏的技术, 也就像洋葱一样,一层一层一层的把提示词给 ai 看。例如,这是一个 pdf 处理技能,可以分为三层,第一层叫做原数据,包含技能的名字和描述。第二层叫做指令,这里写着给 ai 看的工作流,比如让他用什么工具从 pdf 中提取文本。 第三层是参考资料和代码,让 ai 在 执行工作流的时候按需阅读。所以相较于传统提示词按需加载的特性,让它不仅能实现复杂的功能,而且占用上下文的长度会更小,也就更节省。头等, 如果你没有听懂的话也没有关系,会用就可以,除非你对 skos 的 底层细节非常感兴趣。那么你可以看看这篇官方文档和架构图, 我在这里只讲它最核心的几点。那么接下来呢?我们讲讲 skills 有 哪些离谱的用法和技巧。我们先来看几个案例,例如你想做一个产品动画,只需要像这样抒你的需求,完全不需要你懂剪辑就可以达到很好的效果,还可以拿来做软件宣传片, 或者那种高大上的数据动态演示,是不是非常香?再看这个剪辑技能,它能帮你下载播客这类长视频,再剪辑出其中的精华,然后生成带双语字幕的短视频,还能配上发布文案,非常适合做切片。另外还有这个漫画技能,想要批量生成漫画,只需要输入一个编好的故事, skill 就 会将 ai 加载特定的提示词,让 ai 一 连串的执行操作,生成这样的效果,看起来是不是画面非常精美,还有分镜和对白。 最后再推荐一个去 ai 味的技能,要比我之前推荐的提示词会智能不少。这里还有一个技能,下载的排行,热门的 skill 都可以在这里找到。以上提到的技能链接以及安装教程我也都整理好了,放在了视频的下方,你可以自取。 看到这里,想必你对 skyo 有 了一定的了解,但我还想提醒的一点是, skyo 并非适用于任何场景,因为简单的任务提示词就够了,复杂的系统需要写代码才行。而 skyo 适合处理中等难度的任务, 当流程繁琐但又不值得为它开发一个 app, 使用它就好了。好了,以上就是本期视频的全部内容了,如果你觉得有所收获的话,不要忘记点赞收藏。最后,我是元宝,一台 ai 和黑科技的挖掘机,我们下期见!

梅猴王朋友们, agent skill 最近真的太火了,但很多朋友肯定还是很困惑, skill 到底是啥?有什么牛的?没关系,草旅从 skill 大 全它来了。 今天呢,我们会通过一个逐步升级的案例来理解 skill 的 结构和原理,然后我们还会学会定制自己的 skill 这个 skill 呢,只需要我们说帮我做一个促销海报啊,优惠券,员工服装,它就会生成符合我们品牌风格,带 logo 的 物料图片。 另外,我也会推荐给大家一些好用的必用的 skill, 比如说帮你的文章配图,把杂乱的知识变成教学网页,一句话处理表格等等等等。 我还做了个秋之技能生成器,大家只要回答一下 ai 给的选择题,为你量身定制的技能就轻松完成了。并且今天所有的资料链接以及补充资料我都做成了一个网页,大家只需要一步步的跟着做,跟着看,就一定能搞定, 非常值得一个点赞收藏关注哦!来吧,准备好我们 go go! go! 首先,到底什么是 skill skill 呢?翻译过来就是技能呗, 它其实和人类的技能是类似的,比如说你是一个厨师,那你就有炒菜的技能,处理食材的技能,摆盘的技能等等等等。那每个技能里面,比如说炒菜技能,这里面就包含了你的流程,你要先炒什么,后放什么, 还有你的配方,你的油温多高,盐放多少。有了流程和配方呢,你可能还会需要一些工具,需要煤气灶什么的, 甚至你可能还会有一些独家的材料,有一勺秘制辣椒酱什么的。那 agent 的 技能也是同理,它要来做菜,它也得有流程、配方、工具和材料。 所以在 agent skill 的 术语里面呢,它就是 skill 点 md, references, scripts 和 assets 这些东西打包成一个文件夹,这就是一个技能,一个 skill 了。我们先来个简单的, 比如说我们要做一个写作 skill, 那 我们就在 skill 里面可以要求他先去啊这些网站去搜集信息,然后再按这个爆款原则去写个大纲,然后再参考这个语气来写稿啊,最后按照平台要求来审稿等等等等。那有朋友就很疑惑, 那这不就是写提示词吗?哎,本质上还真是的,毕竟啊,我们跟大模型的交互其实都离不开提示词, 但是呢,这并不是 agent skill 的 全部,它在工程上是有很多优势的,能做的肯定比我们拷贝粘贴提示词要多很多。好处我们后面都会说到,那先让我们通过创建一个 skill 来理解它的结构和原理, 我这里用的是谷歌反重力来做编辑器来看文件,然后呢,用的是 cloud code 来做 agent 来处理任务。这俩东西的下载方式呢,我也都放在资料里了,非常清晰简单,大家一步步跟着做就行了。 接着你只要在反重力的这里创建一个项目,比如说我的就叫丘之 project 吧,然后呢,我们调出终端, 输入 cloud cloud code 就 调用出来了,这个界面大家看着会有点复杂,但是不要怕,跟着我一步步来就可以了,之后我们跟 agent 的 对话都会在这里进行。 ok, 那 我们开始创建, 那我们先要做的是一个最简单版本的 skill, 后面呢,我们会逐步升级的哈, 那现在假设我是一家轻食店的老板,那这是我们秋之餐厅的一个品牌 logo, 那 我希望做一个 skill 呢,能够按照我的品牌调性和视觉规范,帮我们去想各种物料的创意,做一个创意生成器。 那按照 cloud 的 规定,我们创建一个 skill, 得在规定的点儿 cloud skills 文件夹里面去创一个 skill 文件,那我们用最原始的方式,直接手动的来创建这些文件夹哈,点儿 cloud skills, 然后我们再创建一个文件夹,这个文件夹的名字呢,就是我们 skill 的 名字,我们叫它秋之创意吧。那这个 skills 的 文件夹里面呢,必须规定有一个 skill 点 md 的 文件,这个大写的文件,那文件里面放啥呢?我已经写好了, 粘贴进来,那就是这么些文字。好了,这就是一个 skill 了,大家先压住脑子里面的问号,我们再来细看一下,那这个文件里呢,上面这两个横线里面的它叫做元信息 matlab, 写着两个东西啊,一个呢是 skill 的 名字,一个呢是 skill 的 描述,这两个东西专门用来告诉 ai 这个 skill 叫什么名字,是干嘛用的,什么时候可以用它,那我这就写着是做创意物料用的啊,当用户说要做个海报什么的物料,他就自己触发它了。 而下面这些信息呢,叫做指令 instruction, 其实就是具体告诉 ai 怎么样做的一些提示词喽。 ok, 那 我这写了我们的餐厅叫做秋之餐厅,品牌的风格有这么些要求,输出的格式让他是这样等等等等,非常的简单哈,那我们保存好一个 skill, 真的 就创建完了?来,我们启动 cloud code 来问问他,你有哪些 skill? ok, 你 看,他现在就已经识别到了我们的秋之创意 skill 了。 ok, 我 们直接问他,我要做一个秋之餐厅的春节促销海报,让他给个创意 好,他这里就开始提示我们,他正在加载这个 skill 了,我们同意 ok, 他 就输出了创意,并且是按照我们的要求和格式来的。 那有朋友就受不了了,哎呀,这一通操作不还是提示词吗?跟我自己写一段这个提示词存着给 cloud code 看有什么区别呢?最大的区别之一在于它是按需加载的, 什么意思呢?其实啊,当我们正常的这样跟 cloud 去聊天的时候,大模型它只会看到我们这个 skill 里面这两行短短的圆信息。 只有当我们说我们要做一个秋之物料的时候,他才意识到,哦,该看具体的指令了,他才会去加载这下面这部分的完整指令,否则这些他都不会看到。 这样的好处就是方便我们可以同时拥有很多个 skill。 每次 a 正的都会看一遍所有 skill 的 简短的原信息,但是只有当 a 正的意识到他要去具体调用一个技能了,他才会去看下面的一大堆指令,而且 ai 的 回答也会更精准, 因为他没有了其他提示词的干扰,那 ai 加载的少了, open 自然也就省了一堆。那这是他按需加载的第一层。 当然了,刚刚这个 skill 实在是太基础了啊,就算一口气把它下面的指令都加载完,好像 token 也不多哈。 但是如果我们的要求变得复杂了呢,比如说我们秋之餐厅的物料其实分很多种, 常规的呢,有海报、菜单,也有比较特别的一些实体物料要设计,比如说餐盒、杯子,员工服装,还有一些社交媒体的物料,比如说公众号封面,微博配图等等等等,他们的尺寸都不一样,配色要求也不一样, 还得符合各平台的一个规范。每一个物料呢,我们都假设它有详细的长长的说明,那这时候我们如果把所有物料的要求都写进 skill 点 m d 里面,那这个文件就会变得巨长。 但是很多时候呢,我只是想做一个,比方说实体餐盒的设计大模型,根本就不需要知道公众号封面的规格,但是 ai 还是得把整个文件都读一遍,那这就造成了 token 的 浪费,也可能会造成一些信息干扰。那怎么办呢? isopec 就 又规定了一个文件夹叫做 references, 我 们呢可以把实体的物料和社交媒体的物料这个两个规格单独拆出来,单独的给它放到这个 reference 文件夹里面去。 那这个实体物料规格点 md, 我 们就写一些线下的工服呀,餐盒之类的要求, 那这个社交媒体物料规格呢,我们就去写公众号封面呀,微博配图这些的尺寸和要求,甚至我们都可以拆得更细。 然后呢,我们只需要在 skill 点 m d 这个总指令里面只留下那几个常见的物料要求,并且我们还需要写上一个指引 啊,告诉他如果用户要做线下物料的话,那就要去读这个实体物料规格点 m d。 如果要做社交媒体类的图,那就要去读社交媒体规格点 m d, 那 现在同样的一句话, 他给出的方案就更精准了。这样当我们只做常规物料的时候,这两个 reference 的 文件大模型压根就不会看。然而当我们说做实体参合的时候,他也会通过 skill 点 md 的 指引,只去看 reference 里面的这个实体规格文件, 那这就是它的进一步按需加载了。那我们可以想象,我们可以有好多种不同情况的 reference, 反正它只会在需要的时候自己去看指定的文件。 但是现在我们的秋之创意 skill 呢,只能输出创意,还得我们自己去做图,所以呢,我就还想让它可以按照我们的品牌规格,直接帮我们把图做出来, 也没有问题。那这就要用到 skill 的 另一种文件夹了,叫做 scripts, 那 这个 scripts 里面呢,一般放的是一些可执行的脚本, 那我这里呢,实际上也就放了一个非常短非常简单的脚本,其实就是在调用 nano banana 的 api 来生图的一个脚本。那有了这个脚本之后呢,我们还得去 skill md 里面在指令里说一声,告诉他,如果用户要求直接生成图片, 那他就得把之前我们想的这个创意转化成生图的提示词,然后按照这个命令去调用这个生图脚本,这样他就能一句话自动去生成精准的图片了。 不然我们还得自己去拷贝提示词,打开软件再粘贴,再生成,再下载保存,现在我们一句话就搞定了。 另外我还有个需求,我希望深层物料的图片能保持秋之餐厅的 logo 不 变, 所以我们还得给他几张 logo 图作为深图的这个参考。那我们就可以再建一个 最新规定的一个 s s 文件夹,我们把两张的 logo 图片放到这个文件夹里,当然我们还要回到 skill 的 md 里面,告诉他参考图在这个 s s 文件夹里面,如果要深图的话,需要把这个图片当做参数给脚本传进去来执行。 好朋友们,现在这个 skill 就是 一个完整的官方完全形态了,其实有点像我们在用自然语言写程序,对吧?那我们先来试试效果,来帮我做一张周六饮料免费的一个实体海报, 你看它发生了什么?它先是加载了这个 skill, 然后它内部可能发现啊,要做的是这种实体物料,它就要去看另一个解说,于是它去检查了这个实体物料的规范。那并且它意识到我们需要的是直接生成图片, 所以呢,它又生成了提示词,把这个提示词和 logo 图片一起给到,并且运行了这个脚本。那最后它输出的图片告诉我们,在这里我们看看结果, 你瞧瞧它这个尺寸,配色 logo 是 完全符合我们这个品牌规范的啊。那为了防止这个是一次性的结果,我还多试了几次,它这个深层的效果都很不错。 然而如果我们的要求还跟之前一样,我们只要创意并不要直接深图的话,那他的这个脚本他也不会被执行。 而且呢,刚才我们说到这个 scripts 脚本,这里面其实还有一个重点,这个脚本里的代码它是写好了的, agent 根本就不需要去看里面写了什么,它只要知道我们在 skill 点 m d 里面写的那些指引,告诉它传什么参数,会输出什么,它只管运行脚本就行了。 所以不管我们在 scripts 里面写了多少行代码,大模型它都不会去读取,一点 token 都不占。 当然了,如果我们在 skill 点 md 里面的那个指引写得不够清楚,大模型不知道怎么用这个脚本,那他有可能也会不得不自己去看一下这个脚本,但他的机智和园艺是不需要去读这些脚本的。 好,那我们来回顾一下,其实创建 skill 就是 在指定的文件夹下去创建一些文件,那最简单的 skill 呢?只要一个 skill 点 m d 就 够了,里面有这个原信息和指令,而完整形态的 skill 可以 加上 references, script s s 这些可选的文件,那这些东西是怎么配合工作的呢?这就是 skill 最重要的设计。按需加载的三层结构,第一层,源信息。 这一层呢,是始终加载的, ai 的 每一次对话都会看一眼所有的 skill 的 源信息,它去看到自己有哪些技能,就像一个目录。那第二层,指令层, 这层是只有当 ai 判断并且决定我要用这个 skill 的 时候,它才会去加载完整的 skill 点 m d 文件。第三层,资源层, 这层包括了 reference 里面的参考资料, scripts 里的脚本, assets 里的资源。只有当 ai 进一步判断任务需要更详细的信息,或者它需要执行某个脚本的时候,它才会去按需加载,并且脚本它是只执行不读取的,完全不占用托克。 好了,这下我们完全理解 skill 的 按需加载,也就是官方定义的渐进式批漏机制和三层结构了。可是对于普通人来讲,这又是写 markdown 又是脚本的,好像创建一个 skill 还是挺复杂的。 no no, no, 现在谁会用手写呢?我是用这个创建 skill 的 skill 啊,秋之 skill creator 创建的。 那这个呢,是我基于很火的 skill 创建器改良的一个更加互动式,更加小白的一个 skill 创建器。那大家把它下载下了以后,放到这个点儿 cloud skills 文件夹里面就好了。那下好之后,我们想要创建什么 skill, 直接打开 cloud 直接跟它说就行, 或者我们也可以斜杠来调用他,那他呢,会开始一步步的引导和追问我们,来帮我们梳理这个需求。而且我特意设计的是这种用选择题的方式来追问我们整个过程,我们就只需要用大白话回复他的问题,以及按一按上下键做一做选择题就好了。 他这个追问的过程啊,到时候大家问题可能和我现在这个不一样,因为他会根据你的需求去做灵活的调整啊,他都是现编的。 然后呢,这个过程中因为我们要做图片,所以我们还需要给他提供 logo 图的参考,以及那个 nano 不 nana 的 a p i 和文档。那我也给他直接拖到了这个项目文件里,然后告诉他了一下这个文件的路径, 他就会自己去参考和把它们放到 excel 文件夹里面。那这两个素材我也都已经放在了我们的课后网页上了,大家可以去用做练习来试试复现它。 那问完这些问题之后呢,他还会给我们核对一下方案,如果我们看着方案没问题,那他就会自动帮我们生成所有的 skill 文件了。 那做好 skill 之后呢,他还会帮你想几个例子来跑一下测试。我们这里其实测了好几个,风格都很一致,很好看。大家在这个调整的过程中,也可以去点开他写的这些 skill 文档来手动的修改一些,反正都是提示词嘛。 所以总之只要你有明确的输出要求,或者有明确的方法规范流程知识,创建器就会指引你帮你来写出一个定制的 skill。 而且除了自己创建,网上也有很多现成的 skill 资料里,我也整理了一些集合网站和 skill 仓库,成千上万的 skill, 大家可以去逛逛。并且我也给大家打包了几个普通人常用的必备 skill, 比如做 ppt, 处理文档, excel, pdf 这些基础的,我们直接把它拖进 skill 文件夹就可以,一句话让它帮你把乱糟糟的表格梳理得整整齐齐。 还有这个官方的前端设计 skill, 这是直接让 cloud code 生成的前端网页,而这个是挂载了这个前端 skill, 做出来的网页,效果明显大幅提升。还有这个动画生成的 skill, 用这么一段提示词就可以做出这样一段演示动画。 当然大家也不用去装一堆自己根本用不上的技能,一个游戏英雄也只需要四个技能 q w e r 就 能杀遍全场。所以最有效的还是把你最最高频做的几件事,打磨成一个你独家的稳定产出的 skill。 尤其是你对结果有明确的要求,你有经验和方法,你验证过的事情。 比如说打工人,你的周报每周都要写,那就做一个让 ai 来主动采访你,然后出周报的一个 skill。 比如说老师每节课都要背课,那就做一个你只要给出课题,就能给你一整套课件习题和 ppt 的 skill。 又比如说,你总是要给你的文章配图,那就做一个给他一篇文章,他就按你的风格做配图的 skill。 又比如说,你总是在审核,那就做一个按照你的规矩自动批阅合同来写备注的 skill。 因为大多数的人都不需要成为一个技能开发者, 我们只要先把自己掌握的小技能交给 ai, 让他替你重复劳动。好了,资料链接都在评论区了,大家动手试试吧!这个时候呢,点赞、收藏、关注的技能就该出发了,我们下次见了!

oppo pro 逼近二十万星,正式超越 longchain autopod 登顶高清,成为名副其实的史上最热门 a 阵开点项目。而从 oppo pro 发布到现在,也就仅仅过去了一个半月的时间啊! 本期视频带你一站式深入了解当下爆火的 oppo pro 底层架构与核心原理,并借助外扣顶从零到一手搓衣板寄予 longchain 的 更适合企业内部高病发环境下。拥有 oppo pro 全部核心功能的 mini oppo pro, 不仅能够一比一复刻 oppo pro 的 最核心的功能,而且和 oppo pro 一 样,拥有网络操作工具、沙雕、环境命令行工具、浏览器、动画工具等各项内置工具, 同时也能自由装载 skills, 支持标准格式的 agent skills 灵活载入,支持在对话过程中自主调用工作流和永久修改记忆,实现自主进化,越用越聪明。此外还支持一键绘画、压缩长期记忆剪索等各项 oppo pro 的 记忆管理功能。 并且作为教学项目,迷你 oppo pro 还支持实时文档的具内容,当前加载的 skills 具内容等等, 相信这也是目前全网最深入、最完整的 oppo pro 核心技术拆解。用狼人手搓的 oppo pro 也是全网独此一份。如此高价值的课程资料,还望大家多多三连支持国外科完整的资料, oppo pro 核心的功能、价格图、复现 oppo pro 的 完整题、日词、 rap、 编发流程等等都已经上线至复范大模型进入社区。首先啊,大家现在看到的呢,是 这个项目完整的项目的这个代码啊,当然我们主要是来展示这个后端的这个代码。然后呢,这个项目的这个整体的这个架构啊,迷你呃,那个迷你 open cloud 这样的项目的价格相对来说相比于原版的项目来说,其实会要 呃简变一些,也会要轻量很多啊,主要呢是因为没有像原版的这个 getaway 这样的一些这个设定啊,就是它没有这个网关方面这样的这个设定。 然后同时呢啊,之前同学提到过啊,说这个项目是不是啊 web coding 来进行的开发,没错啊,这个这个项目呢,是完完全全啊,是由 cloud code 式来进行的这开发啊,但是这个项目的开发呢,并不是啊,传统意义上呢,就比如说 ok, 我 们现在拿到 open cloud 啊,然后呢 对着 openclouds 来进行一个二次开发,不是这样的,而是通过跟呃 cloud code 完整描述关于我们项目这样的需求,然后呢引导啊这个 cloud code, 一 步一步去完成这个迷你版 open cloud 这样的这个开发啊。当然在开发过程当中呢,呃,其实它并不是啊,这个 web coding 就 对开发人员没有任何的要求啊,其实还是对开发人员会有些要求的,我们需要不断的去提示它的 功能啊,去修正它的一些这个问题啊,包括啊去提醒它的这个项目的这个架构啊,不断跟它一起去完善这样架构啊。只不过呢,去 借助像 cloud code 这样的 web coding 这样的工具啊,我们在进行开发的过程当中,是一个跟这个 ai 工具来进行协助的这样的一个状态啊。当然其实有了 a web coding 这样的开发工具之后呢,其实在绝大多数场景下,对开发者来说肯定都是一个效率的这样的个提升啊,因为毕竟大家能想象到啊,如果像我们现在啊这样的迷你 呃呃, open cloud 这样的项目,如果纯手动自己一个一个模块来进行开发的话啊,其实相对来说还是需要比较长的这样的时间的啊,但如果去使用 web coding 这个项目, web coding 这工具跟它来进行协助的开发的话,相对来说其实就会简单很多。那然后当然对于整个项目的这个基本架构和项目的核心需求啊,当然是我们需要去和 扣子啊,或者任何的任意的编程模型需要讲清楚的。然后最后我们看到了这个项目的一个基本架构啊,我们这里这个字可能有点小哈啊,但是这个,嗯,他好像没法放大啊,我们大概能看到啊,他这个基本架构长什么样啊?首先呢,我们可以先看一下啊,他有一个这个 啊, config 点 p y 啊,然后呢有这个 requirements 点 t, x, d 啊,这些呢,都属于通用的每个项目可能都会有的啊,这样的一些基本的这个设定啊,所谓这 config 点 p y 呢,它呢其实指的是啊,去加载一些 基本的一些这个变量,对不对?然后呢 requirements and tx 啊,它呢主要就是相关那些这个依赖等等等等,那么整个的这个项目的这个架构里面首先哈有一个叫 workspace 的 这样的一个这个文件夹,这个文件夹呢,其实里面就包含了啊,著名的这四个 markdown 文档啊,分别是 agent 点 m d, identity 点 m d, 合作点 m d 和还有 user 点 m d 啊,这四个 啊,非常著名的这个文档啊,这四个文档呢,其实就是最后构成我们 system prompt 里面的一些文档,我们只是要求把它全部都放在这个 workspace 里边儿了, 然后同时呢 tour 四这个模块啊,呃,这个,呃,文件夹这个命名应该还是非常清晰的哈,无非就是一系列的啊,这个基础的内部的工具,包括这个 fetch url 啊,对吧?啊,这个 fetch 这样的工具啊,去获取网络信息的这样的工具。然后呢这个 python r e p l tour 啊,它呢就是呃这个 luncheon 里边的内 自带的一个工具啊,它呢是可以是使用这个 python 的 代码调试器啊,来完成一下 python 代码的编程运行的。然后下面还有这个 file tool 啊, file tool 其实就是非常单纯的啊,这个,呃来进行这个文件夹的这个操作啊,包括这文件夹的打开呀,文件的读取呀,文件的这个增删改查啊相关的一些这个工作,那 再往下啊,还有这个 search knowledge function, search knowledge function 其实它是一个非常单纯的一个这个 re 系统,然后它呢是使用 lab index 啊,去完成 这个混合解锁啊,就是 bm 二点五的关键词解锁,加着 vector 磁强量的这个,呃,像磁强速度匹配的这样的这个解锁啊的这样的一个功能啊,它呢是也是一个内置的一个工具。 当然关于像蜡马 index 怎么样去进行混合解锁,这个其实就比较复杂啊,我们呃之前十二月底公开课曾经有一场公开课曾曾经讲到过哈,这蜡马 index 的 一个入门使用和怎么样使用蜡马 index 来进行混合解锁啊,那我们今天肯定是没有时间 来讲啊,那总之大家需要知道的是啊,在这个解锁的过程当中呢,它呢实际上是关键词啊,和这个呃文本之间的字腔量相似度啊,两者加权来进行匹配啊,大概是这样的这个情况, 那么再往下啊,还有这个 skills scanner 哈,这个 skill scanner 呢,实际上它不算是一个内置的一个 tour 哈,它呢实际上算是一个这个呃我们每次在启动绘画之前它需要必须要运行的一个脚本啊, scanner 嘛,啊是就是我们去扫描所有的啊 skill 这个文件夹里边到底有多少个 skill 对 不对?然后给它拼接成是一个 system message 啊, 就这样的一个这个啊这样的一个功能。当然我们的这个 skill scan 它在扫描的时候呢,其实,呃是扫描这个 skill 文件夹里边的啊所有这些 skill, 然后它最后呢是会把它 ok, 我 们来给大家看一下,最后呢是会把它拼接到这个地方啊,就是会给它拼接到 system message 里边这一段啊,也就是这一段啊,或者是我们看到的这里边儿 呃下面这个 memory 里边儿的啊 skill snapshot 这里面啊的这个呃内容的生成都是通过那个 scanner 啊来进行的创建啊,你可以这么来进行呃理解就 ok 了啊, scanner 大 概就是干这样的这个事情的, 那再往下啊,还有这个 terminal tour 啊, terminal tour 就 没啥好说,对吧?这个命令行操作的这个啊操作的这样的这个工具,然后它呢其实也是浪炫里面自带的啊一个这个工具啊,那这个工具也是非常好用的啊,专门用来去操 做命令行的,实际上相对于像这个现在目前来说比较通用的这个 agent 来说,只要它呃接入了命令行的操作工具啊,一般来说它就相当于是呃顶半顶上半个 computer use 了啊,就是它可以呃自由的操作啊,对你电脑来进行各式各样的这个操作啊,上面是问题啊,这个呢是 tools 这个模块 再往下啊, storage 啊, storage 的 话,它实际上是呃 memory index 的 一个这个拷锁,但现在其实还没有啊,就是还没有这个拷锁的这个内容出来啊,所以它目前呢是空的啊,就为什么会有这个 memory index 的 这个拷锁这个东西呢?是因为之后我们需要 we are memory 来进行拷锁嘛, we are we are 长期记忆 来进行拷锁啊,所以它就会有对应的这个呃 index 拷锁出来的这个呃片段在里边来进行一个保存。 那么在网上啊,就 get weather 啊,这就不用说它就是一个这个 message 啊,它就是一个 skill 啊, skill 里面就这就是 m d markdown 文档啊,然后 markdown 文档详细的跟我们说了啊,你要怎么去查询各个地方天气对不对啊?非常清晰。 再往下啊,这个 session session 的 话,一般来说啊,现在一个比较标准的啊,对大别模型来说,它的一个对话文档存储格式就是使用 json 格式,对不对啊?然后呢,还有一个这个 default 点 json 它呢?实际上呃这个 default 点也是最开始的一个这个绘画的这样的内容, 在网上啊,就 memory memory 的 话里面呢,会包含它的历史系统的这样的个记忆啊,这跨县城的长期记忆,然后同时呢,这还有个 log log 文件目前是空的,它呢就是未来因为专门用于记录记录大别模型是怎么样啊?去修改你的这个 memory 文件的啊?大概是这样的一个这个啊,这样的一个设置, 那在网上啊, knowledge 啊, knowledge 目前也是空的啊,它呢,实际上也是这个之后在进行解锁过程当中,会深层相关的一些这个文件, 然后呢,这个 knowledge 它的这个创建,其实它这个文件夹名字取得稍微有点问题啊,但 knowledge 它不应该叫这个知识,而是我们在后期哈围绕绘画来进行这个 summary 的 时候啊,它这个 summary 的 这个结果是保存在 knowledge 这个文件夹里面啊,就是你的绘画,比如说历史绘画太长了啊,它就会围绕着比较早些时候的历史绘画来进行 summary 啊,是这样的这个情况, 那么在网上啊,就是 graph 和这个 api 了,那么当然啊,从系统架构上来说, api 应该是靠前的啊,包括怎么样来进行这个对话呀?啊?对不对?然后呢?呃, 怎么样读取相关的这个设置啊?然后呢?这个,呃, a p i, 然后相关的这个文档的这个路径,如何来进行加载啊? session 如何来进行加载啊? tokins 如何来进?如何来进行计算呐?这里有很多的相关的一些这个 a p i 啊,底层的一些脚本啊,这么来进行理解。 然后呢, graph 就是 核心的,我们当成 agent 来进行构建的啊,核心的这个代码了,然后这部分代码呢?其实呃都是呃一个,都是一些比较标准的使用 longchain 来进行 agent 开发这样的代码,那么 longchain 实际上在一点零版本之后,实际上是全面是呃更新到了这个使用 create agent api 啊,对吧?来进行开发,然后呢我们本期的这个 agent 呢,也是使用 create agent agent 来进行开发啊,那么它它里边呢 会有内置的一些这个工具,然后同时呢它也会啊实时的去读取对应的这个 memory。 然后呢还有这个 prompt builder, 实际上就是去构建那个 system prompt 啊,大家就这样的一个这个这, 呃构建 system prompt 这样的一个这个基础的这个脚本啊,还有这个 session manager 啊,是专门去读册 session 里面的原始的文档内容的,然后这里面这个它这里面这个代码为什么,为什么这么复杂哈,因为它在读取你的每一个 session 的 时候呢,可能还会涉及到关于说就要去计算你 session session 的 这个 tokens。 然后呢 呃还需要提供啊,围绕这个 session 呢,还需要提供一些特定的啊,比如说可以给你的 session 来进行这个呃来来进行 summary 的 相关的功能等等等等啊,这个呢是所谓的这个 session manager 啊,所以它里面会有很多代码啊,差不多这样的一些这个功能规划。 但实际上在我们在使用 webcoding 的 过程当中啊,像所有这些代码的这个架构的规划,应该都是基于我们接下来的课程,我还将围绕更多的技术细节展开介绍,同时将借助 webcoding 带大家重塑迷你 oppo klo web coding 完整的需求跟题目的过程也都包含在本期公开课的科建中和科建代码等一集都已经上传至复反大模型进入社区。

别人的 ai 直接上手干活,而你还在一问一答,实在是学不完了,已经二零二六年了,如果你还没用上 agent, skill 就 真的落后了。 那今天这期,我们来把 skill 一 次讲透点好收藏关注赞!普文版的安装教程和技能市场链接我都给你放在评论区了,来吧,我们先搞清楚 skill 到底是个什么东西。 skill 是 entropic 去年十月发布的,功能作用正如名字一样,是 agent 的 扩展技能包。 我打个比方你就懂了,假如你现在要给新同事交接一个项目,想一次搞定,让他快速上手,那你会准备什么? 一、执行流程和背景信息,教会他这件事怎么做。二、工具的使用说明,告诉他用什么和怎么用。三、模板和素材给他参考的规范。四、常见问题和解决办法,帮助他快速的 bug。 哎。 skill 包里面的内容其实就是这套离职交接大礼包的数字版本。 agent 运行 skill 的 时候,会先看这个主文档,了解怎么干活, 然后根据任务的情况自己去判断什么时候该调用代码脚本,翻阅参考文档,使用素材和模板等等。 那这样一来呢,同一个 ai 整就能够完成一些很复杂的任务,那比如说把零散的素材整理成规范的 ppt, 那 过去啊,就得好几个工具一起写作,那现在 a 整装上技能包,自己就能一条龙给你办了,这才叫真正的技多不压身。 ok? 说了半天,怎样才能用上呢?如果你已经是 cloud 的 订阅用户,网页端和 app 端都能够直接用,但如果你想白嫖,接着往下看。 目前最热门的方式是本地部署 cloud code, 那 接下来的安装教程呢?根据你的设备和网络环境不同,时间也会不一样,如果你想跳过教程,直接看效果,可以跳转到这个位置, 那整体的流程就这五步,我会用麦克来演示。 windows 的 流程其实也大同小异,首先确认网络能够正常访问国外网站,然后打开这个链接,下载运行环境,一路点确认。装好之后呢?键盘按 command 加空格搜索,打开终端,输入这项指令,看到版本号了,就说明可以进入下一步了, 还是在终端里啊?输入这项指令,如果你网络没问题的话,很快就能看到安装完成的提示。 然后关闭终端,重新打开,输入 cloud c l a u d e。 好, 正式打开 cloud code 的 档位了,先设置系统主题,那注意这里不能用鼠标,只能靠键盘的方向键去选择。回车确认, 那接着就会进入 a p i 设置的环节,一共有三个选项,但无论选择哪个都要你登录,所以我们先关掉终端,把 a p i 搞定再说。 那好消息是国产的大冒险几乎都已经支持 cloud code 了,包括千问、 mini max、 kimi、 智谱等等都有专门的接入文档。那我就拿正在免费送 token 的 智谱来举例,打开这个链接,按照步骤新建 api 密钥, 那接着打开终端,输入这串指令,根据网页里的指导把内容改好保存,记得把 api 密钥改成你自己的, 然后再输入这个指令,在文档里面新增一段这个之后保存搞定,那现在重新打开终端窗口,输入 cloud, 你 的 cloud code 就 正式启动了。 ok, 装好了能干啥呢?最简单的就是通过聊天来让他帮你干活,比如我扔给他一个 youtube 视频链接,让他下载,很快他自己就开始装酷了。 y t d l p 用来下载视频, f f m pack 用来处理视频这些东西我们本地耀哥没装,他自己就给装好了。那这就是他厉害的地方, 那接下来才是重头戏啊!用 skills 去解放生产力。在 cloud code 里面装 skills 特别简单,一句指令就能搞定。比如在这个技能市场网站里面,随便搜一个 skill, 只需要把这一行复制粘贴到你的窗口里面,就能让它熟练掌握 entropix 的 品牌规范, 配合其他 skill, 就 能一键把本地文档改造成符合规范的 ppt 视频,甚至是个网页。那参考这个思路,做一个符合你自己公司品牌规范的 skill 年终数值 ppt, 那 不是手拿把掐? 现在网上已经出现了超级多 skill 集市,可以直接搜索你需要的技能,也能随便刷刷,获取很多灵感,让通用的 a 整熟练调用好几个不同的技能,这才是二零二六年最流行的 ai 使用方式 安装教程。 a p i 文档技能市场链接我都整理好放在评论区了,欢迎来评论区提问或者分享你的经验,我们下期视频再见!

oppo pro 逼近二十万星,正式超越 longchain autopod 登顶高清,成为名副其实的史上最热门 a 阵开点项目。而从 oppo pro 发布到现在,也就仅仅过去了一个半月的时间啊! 本期视频带你一站式深入了解当下爆火的 oppo pro 底层架构与核心原理,并借助外扣顶从零到一手搓衣板,基于 longchain 的 更适合企业内部高病发环境下拥有 oppo pro 全部核心功能的 mini oppo pro 不仅能够一比一复刻 oppo pro 的 最核心的功能,而且和 oppo pro 一 样,拥有网络操作工具、沙雕、环境、命令行工具、浏览器、动画工具等各项内置工具, 同时也能自由装载 skills, 支持标准格式的 agent skills 灵活载入,支持在对话过程中自主调用工作流和永久修改记忆,实现自主进化,越用越聪明。此外,还支持一键绘画、压缩长期记忆剪索等各项 oppo pro 的 记忆管理功能。 并且作为教学项目,迷你 oppo pro 还支持实时文档的具内容,当前加载的 skills 具内容等等, 相信这也是目前全网最深入、最完整的 oppo pro 核心技术拆解。用狼神手搓的 oppo pro 也是全网独此一份,如此高价值的课程质量,还望大家多多三连支持国外科完整的资料, oppo pro 核心的功能价格图 出现, opencloud 的 完整提示词、 web coding 流程等等都已经上线着复范大模型进入社区。呃,说实话啊,在 opencloud 推出来之前啊,其实我们也畅想过很多关于通用智能体,它可能出现这样的个形式啊,但是确实没有想到啊,它通过这个 agent 的 skills 啊,和一套本地维护的这个记忆系统啊,就能够解决所有问题啊,这个确实是 非常惊艳的一个这个地方哈,好啊,那么接下来啊,我们啊,就一点点来看哈,关于它的这个架构到底是如何进行实现的。首先哈,我们刚有说过啊,它呢,其实是本地优先啊,跟文件及数据库啊这样的一个设计哲学啊,什么叫本地优先,就指的是它所有这些啊,记忆系统啊,这个内容其实全部都存储在这个本地的。 关于这一点哈,其实我们上一场课外课的时候是给大家看到过啊,那么如果大家不记得的话,我们这也可以再给大家打开这个系统来看一下啊,就是比如说啊,我们现在看到其实就是 openclaw 啊,它的这个系统, 它的这个系统里边呢,其实,呃,在它的这个文件夹里边有什么 sessions 啊,然后 sessions 呢?就是啊,这里面所有的这些对话的这些数据啊,对不对啊?然后呢啊,它对话数据很多哈,很多很多这种对话数据,然后呢,它还有啊,就比如说这个 workspace 里边啊,还有很多的一些 markdown 这个文档啊,什么 agents 点 md 啊,什么 bootstrap 点 md 啊,还有这 identity 点 md 啊,还有 so 点 md 啊,由此点 md 啊,等等等等。那么这一系列 md 文档啊,总管看起来比较复杂,我们一会会说它分别代表什么样的含义,但基本上这些 md 文档就是构成它每次绘画的过程当中这个 system message, 然后这个 system message 就是 会在后续的运行过程当中持续不断的啊,它可以自我来进行修正啊,这个 a 证的自己运行的时候可以自己去修改自己的这个系统这样的自己,并且呢由于它也考虑到啊,这个用户对话可能时间会比较长,对不对啊?所以它还有一套关于这个混合解锁跟消息压缩的 一个这个机制,以避免啊说之后对话内容无限长啊,然后呢这个呃呃可能会损失一些这个信息的这样的一个问题,然后他的这个混合解锁和绘画压缩这样的机制呢,实际上也还是这个非常通用的啊,或者非常好用的一套这个流程啊,一会我们会看到 它所谓的这个混合剪辑哈,基本上指的是这个使用关键词啊,和这个 embedding 的 词向量这个匹配啊,来进行剪辑。然后同时呢它所谓的啊这个上下文的这个压缩呢,其实指的是如果我的 user message 跟 assistant message 啊这个消息数量太大的话,那么它其实会选取比较古老的一部分内容,然后来进行 summary 啊,来进行总结,然后呢通 过 summary 这个内容代替原来的这一问一答的这个对话这个内容啊,从而行,从而这个来实现完整的上下文能够来进行压缩的啊,一整个这个功能等等等等。 这个的话我们一会会看到哈,因为,呃我们一会还会结合着对于 openclaw 啊,它的这个系统架构,它整个的这个 memory 里面的各个不同类型的文件在展开来进行讲解啊,现在大家听的话可能还会还会有点晕啊,主要还是因为,呃这个不够具体,不 过没关系啊,大家需要知道的是呢,对于它的这个记忆系统来说啊,首先一个呢都是本地的啊,所有的内容啊,都存在本地啊,并且都是以这个 macdong 或者 jason 文档这样的格式呢来进行存储,然后同时呢它也是有啊这个 rek 解锁这样的流程和啊 来进行一些信息压缩啊,主要是通过这个 summer 的 方式来进行压缩的这样的一个方法就可以了,然后同时呢,哎,基于我们刚刚所说的啊这样的一系列这个啊,对不对啊?他有内部的这个工具啊,自己内部有些工具,然后同时呢自己又可以修改自己的这个记忆,那立马左脚踩右脚就起飞了,哈哈,对不对?他就可以来 进行自我认知的叠带了啊,只要用户觉得说,哎,你这方面表现不好啊,记得啊,我现在哪个地方表现不好,哪里有问题,然后把它写到 未来的这个持久记忆里边儿,对不对?下一次只要我启动对话啊,当然这次也可以啊,直接来进行一个,直接来进行一个刷新,那么对 openclaw 来说,哎,它就这样的一个对不对?有一组内置工具啊,然后呢有一组这个 skills 啊,然后还允许啊自己去修改自己啊,然后呢它的这个, 呃所有记忆文件啊,全部都保存在本地,然后还允许自己的这个,呃 agent 啊,调用自己内置公内置的工具去修改自己记忆的,这样的能力啊,就能够形成我们刚刚所看啊,它这个 线,他这个左脚踩右脚就直接起飞了,对不对啊?自己修改自己啊,自己让自己进化的这样的一个非常核心的功能特性啊,所以呢,这个架构实际上是一个非常前沿的一个理念哈,是值得我们开发者 来进行的这个学习啊。然后呢,我们接下来其实也会围绕他的这个架构来进行呢,来进行这个复线,当然在整个的我们刚刚所说这样的一个呃呃呃, open club 这个架构里边其最为核心的啊,其实他的就是他的底层的这个技术。大家要想啊,其实 所有的它的运行过程当中,什么时候知道该干什么样的这个事情,其实都是由它的这个底层的这个记忆系统所去设定的。所以呢,其实呃,当我们去看 openclaw 它这个项目的这个 message 列表的时候,就它销列消息列表的时候,你会发现非常非常的复杂 啊,正常的这个 agent 的 消息列表无非就是 system message, 对 不对啊?这个 user message 啊, system message 啊,还有这个 tour message 啊,差不多就这么几种类型啊。然后呢,如果你去看 opencloud 的 消息消息列表的话,你会发现非常的复杂啊,它光是这个 system message 里边就分了好多好多好多种啊,就比如说我们现在这里面看到的啊,其实就这个项目里面给大家展示 展示的这么些种啊,什么 memory 点 md 啊, so 点 md、 user 点 md、 agent 点 md, 还有这个 skills 点 md, 还有这个 skill 点 md 啊,有非常非常非常多的一整套的啊,这样的一些维护的不同类别的这 mac 文档构成它的这个 system message 啊,这是这么回事儿, 然后同时它在实际进行对话的过程当中呢,由于考虑到它可能还需要进行一些啊,这个比如说 skill 的 一些这个 啊,热插拔的一些这个事项啊,所以呢,它它的这个,呃内部的所维护的 user message 跟 assistant message 这个消息列表啊,其实也非常复杂,而且呢,有的时候啊,它会随着你对话的过程当中呢,不断来进行修改啊,但这个我们一会看到它是怎么样去进行的这个操作, 然后再加上它还需要啊实时地接入些 skills。 而 skills 的 本质呢,我们刚刚已经说了啊,它其实也是一些提示啊,所以呢,怎么样把这个 skills 的 核心信息给它拼接到 system message 里面去啊?也是 啊,这个 opencl 啊,需要考虑这样的这个事情,但是呢,有了这套机器系统之后,哎,你会发现啊,它的这个适用面一下就广了,而且整个 a 智能性能也是拔上也是提高到新的这个 level。 那 首先啊,对于 opencl 来说对不对啊?它呢是能够多场景来进行适配, 由于它记忆系统非常复杂,而且非常灵活啊,它允许用户从各个角度去修改它这个记忆啊,所以呢,你希望它成为什么样的 agent, 你 完全可以通过去修改它这个记忆系统啊,然后呢,给他一个这个身份,告诉他你应该做什么样的这个事情,哎啊,它很快就会成为就会扮演好它特定场景下的这样的 agent 啊,这是其一,那么其二也可以啊,这个从 从此彻底解决啊,关于我们之前所说的关于这个上下文的这个啊,卡脖子这样的问题,那么其实哈,关于去修改上下文的这个啊,关于去修改大模型的 agent 的 记忆系统,然后呢?然后,然后让他去完成无限上下文这样的功能。很早啊,其实就有这样的技术概念,我们当时在二零二三年推出第一个我们团队做的这个 agent 叫 mate 盾的时候,当时其实就 啊实现了关于无线上下文的这样的功能啊,但是相比现在的啊,这个记忆系统来说,当时的无线上下文其实相对来说还是比较潦草啊,现在这个无线上下文其实要好很多。那么具体来说,对于这个呃欧呃,对于呃 open call 来说,他的无 线上下文的这个实现的思路呢,实际上是通过这个一次的压缩和啊通过一层的这个解锁来进行实现的。所谓一次压缩呢,就指的是他如果用户跟大模型他们俩对话下去太长了,那么他会把 比较古早的消息来进行一些 summary 啊,这个呢,其实是比较一个,一个是比较通常的这样的操作。那么第二个呢,是它还会维护一个 跨县城的一个 message, 跨县城的一个这个记忆的系统啊,所谓跨县城的这个记忆系统指的是,哎,现在用户啊,跟这个 agent 聊天的时候有一些东西啊,它是长期存在的哈,就比如说,那我比较喜欢 agent 什么样的风格来回复我啊?或者是 我跟他沟通过程当中,他可能反复在执行某些工作时候都会出错啊,这个时候呢,我可能就会给他一些非常严肃的这样的提示,跟他说啊,你在这个点上有重大的认识偏差。好,那这样的一个对于当前这个 a 政策来说非常重要的这样的一个消息, 它的作用范围肯定不止是当前这样的县城啊,不是说我新开个对话,我之前咱们强调过很多次的问题,我就忘了哈,这是不行的,所以呢,它会还会维护一个所谓跨县城的这样的一个啊, memory 的 这样的这个系统啊,当然它也是 markdown 哈,对于 openclaw 来说,所有的这个记忆都是一个又一个 markdown 文档啊,它也是个 markdown 文档, 那么这个 markdown 文档,同样啊,它也是会不断不断不断往里面去追加内容的,但是大家可想而知,伴随着我 a 阵的运行的时间比较长哎,我这个 markdown 内容肯定会越来越多,越来越多,越来越多啊。最后呢,如果超出了 啊这个限制,没有办法作为系统消息带入到下一次开始对话的这个里边去的话,那么未来你对于我现在维护的一个跨线城的非常重要的持久记忆的这个列表来说,那你肯定是需要使用 red 方法来进行剪辑,对不对? 所以呢,它的关于无限差量文的这个实现的这个思路非常简单。首先,对于单个对话来说,它呢,实际上是会不断地压缩啊,或者通不断的这个 summary 比较古老的一些时间的这个对话啊,从而呢去压缩你当前这一次对话的这个长度啊,这是其。其二,它还会,它还会有一个跨县城的一个持久记忆的一个 markdown 文档哎,这个 markdown 文档呢?它呢就,呃,没办法啊,它其实会越来越多,越来越多,但是 这个 markdown 文档,它里面往往是记录着我当前 agent 需要遵循那些指令原则,或者我的运行过程上一些缺陷。很重要,这个信息它是没有办法来进行压缩的,所以它只能够通过非常高精度的方式来进行解锁。那就下次遇到类似这样的问题,哎,我就会主动地去围绕着我跨县城的 markdown 的 记忆呢,来进行一轮这个解锁,解锁完了之后 啊,检,检测完了之后啊,那么接下来他就可以啊来进行这个,呃呃,持久的就是围绕着这,我这个哪怕啊文档那有很多的啊,这个 memory 点 md 这个文件呢,来进行一个指令的跟随啊,差不多是这样的功能的定位好,这个呢是它的一些 核心的啊,一些这个功能的这个实现啊,然后呢,上面还有啊,什么这个跨县城的深度理解,就是我们刚刚所说的 rock 这个流程啊,还有呢,自主进化与技能沉淀 啊,这个也是我们刚刚其实反复强调过很多次了啊,它其实是能够自我净化的啊,因为它能自己修改自己的记忆文件,尤其是能够自修自己修改自己的这个操作手册啊。这个呢是没有什么问题的啊,这个呢是现在我们能看到的啊, open cloud, 它这它的这样的一个系统里边非常核心的啊,很多的 一些功能的这个特性,当然啊,如果具体来展开的话啊,下面这个可能也是一些理论啊,这个理论可能就会比较多了,那么它还有啊,如下五大方面的功能这个优势啊,这个我们先不先放在这啊,我们一会去看到我们实际的这个 agent 的 运行之后呢,我们再回来讨论这部分内容啊,因为如果一次性这个理论讲理论,理论讲太多的话,大家可能会比较晕, 好,那这个呢,是关于 open club 啊,它比较先进的一整个技术啊,工具的这样的体系。 那么,呃,在我们正式去复现 openclaw 之前哈啊,这个还是有一个小的点啊,需要跟大家来进行强调,那就是很多同学可能会觉得说啊,那 openclaw 其实也就这么回事啊,我们难道不能够用一些 a 证的开发框架去实现类似 openclaw 这样的架构吗?可能会比较困难啊,就比如说像对于 longchang 来说啊, longchang 的 话,它其实是完全没有 我们所说这一些的这个功能的啊,大家都 sorry, 它只有其中一个功能啊,就是它能够去压缩历史绘画啊,这个呢是浪圈里面自带的这功能,但除此之外呢,浪圈其实是没有我们刚刚所说的啊,所有的,呃, 我们刚才想要的这样的一些这功能的啊,它其实是做不到的。其实哈浪对于浪圈来说,它的记忆管理的这功能相对来说是不是它的成像啊,是一个 较薄的一个这个环节啊,因为 longchain 其实它更多的还是去维护每一次 agent 在 进行运行的过程当中,它的一个运行的这个状态啊,以及考虑一下啊,它可能出现的不同的这样的情况啊,这个报错呀,什么工具调用啊等等等等相关在这方面来进行优化啊。所以 longchain 它 对于一个 a 证的记忆管理方面的功能其实是非常薄弱的啊,总的说它其实总共也就只有这四个方面,它这功能啊,比如说它允许啊,这什么高并发症啊,允许啊,滑动窗口的这个遗忘,或者滑动窗口的这个这个呃压缩呀,以及能够来进行向量剪辑啊,其实也就是这样的基础的功能啊,但是现在从 open clock 的 这个角度来说,这些基础基础的功能可能没有办法很好的满足 啊,接下来的开发这样的需求,对不对?那么除此之外,我们说如果你是使用国内的像 agent scoop 来进行开发的话,哎,这个还不错啊,它的这个记忆系统其实设计的相对来说还比较可以啊,它呢是分成这个短期记忆跟长期记忆 两种不同的模式啊,来进行运行。那么 a 阵的 scoop 我 们简单看一下哈,他的这个短期记忆呢,其实,呃主要就是啊,他可以进行一些这个过滤和压缩啊,他对于短期记忆就当前绘画的这样的内容,这压缩主要是比如说删除一些什么工具调用的这个内容啊,或者删除一些这个呃,我们呃能够非常 明显的感受到啊,历史的话消消息里面一些不重要的一些这个信息啊,比如说现在说长的这个连接啊,等等等等啊,他可以去做这样的一个历史消息的这样的个压缩和删除。那 同时呢他的这个长期记忆呢,就是如果他的这个记忆太长了的话啊,他就会基于这个 rek 来进行解锁啊,他其实内部是有一套完整的这个 rek 流程的啊,就直接就可以完成长短期记忆的这样的这个切换,但是他的这种长短期记忆呢,尽管功能支持的是更好,但是也还是一样的,对不对啊?大家一听就能感受到,这还是上一代的这个思路, 非常死板啊,哈哈,就是,呃,你短期记忆只能这么这样来进行处理啊,长期记忆只能这么来进行处理啊,其总的来看还是,呃,非常的这个死板啊,但是呢,这比浪转其实要好一些啊。那么唯一呢,现在就是我们能看到的关于这个记忆的这个开源项目啊,功能实现程度比较复杂的其实是这个麦瑞玲, 然后这个 m e m 零这个项目呢,呃,它其实效果其实还是非常好哈,但是呢,这个项目,其实,呵呵,和这个 openclaw 其实走的是完全不一样的这个套路啊, openclaw 呢,其实它更多的强调是清亮,便捷可控啊,然后透明,差不多是这样的一个这个思路,但是 memory 零呢,正好相反, 呃,别人清亮啊,他就不清亮,哈哈。呃,别人透明啊,他就这个不透明啊,这个,呃,别人便捷,他就不便捷啊,差不多这样的一个这个定位,那么 oh memory 零它其实追求的是关于长期记忆和剪辑这样的一个高精度, 这个问题就有点像,就比如说我们使用像啊 graph rag, 对 不对啊?基于制图的这个剪辑,那当然它剪辑性能会更好,但是呢, 嗯,它需要的这个开销就更大,它的响应时间也就更长,而且并不是所有场景下都比普通的这个 rock 效果更好啊。所以呢,其实曼莫瑞林也会陷入到类似这样的这个情况,那曼莫瑞林的这个长短期架构期,呃,长短期的这个记忆管理,其实呃精度是非常高的,然后它呢同时还做了一个很好的这个结偶。所谓这个结偶指的是你 不管是用什么样的 agent, 甚至是普通的这个,甚至是普通的一些这个呃 api, 比如说 open a iphone 的 api 都是可以接入麦百瑞零的啊,都是没有什么问题的,它呢实际上所有的这个长短机器管理全部都在它项目内部来进行解决,但是它问题也是再也别说啊,它太重了啊,然后呢响应时间太慢了啊,尽管它可以做到比较高精度的这样的这个 解锁,但是呢,你看看啊,它其实呃一整个流程啊,到大模型的这个对于记忆的这样的提取, 然后呢到对记忆的这个压缩啊,然后呢夏令裤的这个存存储和这个读取,包括有的时候还需要来进行一些这个知识图谱的这构建,然后再进行匹配,再进行剪辑啊,它的这个过程呢, 其实非常非常长啊,然后呢,呃适配性也会比较弱啊,所以这个可能是麦麦瑞林的这个比较大的这个问题啊,对吧?价格比较臃肿,然后延迟比较大,然后呢它也是个完全的这个黑盒啊,这个是麦麦瑞林的这样的情况啊,所以呢,基本上我们说如果你想去复现 opencloud 的 这样的这样的情况啊,包括它后面的这个 agent skill 这个系统的话, 呃,大概率欸可能只能手写,哈哈哈,你可能是没有办法这个通过既有这个 agent 开发框架来进行实现的,但是啊,这个基本的 agent 的 这个响应哈,和它这个运行时的这样的一个 look 啊,这个是使用 long chain 或者使用 agent 是 不是没有什么问题的啊,因为本来这些 agent 的 开发框架就是为了更好的去完成一次又一次 agent 的 响应的啊,只不过啊,我们说你的这个呃记忆系统啊,可能需要单独来进行开发。好啊,那么 前边我们差不多是给大家大概入了一个门啊,主要是个理论方面。这个讲解啊,可能同学听懂了,可能同学听不太懂啊,主要还是个理论方面。这样的讲解让他大概大概。接下来的公开课,我还将围绕更多的技术细节展开介绍,同时将借助 web coding 带大家重领手搓迷你 oppo colo web coding 完整的需求跟题目的过程也都包含在本期公开课的课程中,和课程代码等一起都已经上传至复旦大模型进入社区。

兄弟们,上一期视频给大家演示如何安装配置大龙虾 openclaw, 从这期视频开始,教大家如何把 openclaw 变成真正的生产力。每天我的 ai 一 阵,会自动去全网搜 ai 编程 独立开发的热门主题,写好一篇三千字的公众号长文,直接推到草稿箱,我只需要审核一下点发布就行。今天教你怎么用 openclaw 搭一个这样的全自动内容创作 ai agent。 先看下这个 agent, 这是我的 telegram, 这个机器人就是我的内容创作 agent。 我 只需要给他下达非常简单的命令, openclaw 就 会全自动地调用内容采集、内容创作、内容发布、内容转换等多个 skills 去完成工作,整个过程完全自动 生成的内容热度高,专业性强,图文并茂,排版优美。为什么选择 openclaw? 因为 openclaw 的 多 agent 架构太适合构建一人公司了。 我可以跑一个日常助手 agent, 帮我处理邮件日程。再跑一个专门内容创作的 agent, 它们完全隔离,互不干扰。每个 agent 有 自己的人格记忆技能。写作 agent 只专注写文章,不会被其他事情分心。而且它跑在我自己的服务器上,数据完全可控。整个系统最上面是 open call 的 给腿, 二十四小时运行在服务器上,随时待命。目前里面跑着两个 agent, 一个是日常助手,一个是内容创作。它们拥有独立的工作空间、人格记忆能力等。日常助手 agent 负责处理日常事务。内容创作 agent 专注内容采集、创作、发布,与日常助手完全隔离。 核心是我们为内容创作 agent 定制化了三个专有 skills。 第一个是 content research, 它会采集全网主流科技媒体关于 ai 编程 独立开发出海应用领域的热门内容,根据信息量、时效、热度、写作价值、受众等评分筛选后输出结构化报告。第二个是 content writer, 基于内容采集报告创作三千到五千字长文,包含标题、正文、结构、排版样式、质量自检清单等。看看这个内容质量检查清单,非常的专业。 最后一个 content publisher, 把 markdown 转换成平台需要的 html 格式,通过 api 自动推送到草稿箱,通知用户审核并发布。让 agent 以定时任务的方式,每天就能全自动地帮我们获取内容、创作内容、发布内容啦。 本期视频先介绍一下原理和效果,下一条视频我会手把手教你从零搭建这个 ai agent 包括创建独立 a 阵的配置、人格与记忆、创建三个定制化的 skills, 配置多 a 阵的消息、路由、定时任务等。点赞关注不迷路,如果你也需要或者有其他个性化需求,请在评论区打出来。

live coding 的 时候 bug 超多,所以我就引用了这个 skill, 这个 skill 叫 superpowers, 在 github 上已经有四万星了,使用的方法非常简单,我就直接把这个链接丢给了 cloud code, 让他帮我安装一下这个 skill。 安装好了之后呢,我就让这个 skill 直接来读取我的这个项目文件夹,让他帮我去看里面有哪些 bug, 有 哪些问题,他马上就能给我扫描所有的文件,然后给我 检测出来的结果。这个结果看起来就很专业啊,反正起码比我这个文科生要专业很多。然后再让 cloud code 继续按照他帮我们列出来的这样的一些问题,逐个进行修复就可以了, 这样就能帮助我们这些文科生不懂代码的人超级快的把 back coding 的 代码质量做的更高,真的推荐大家可以尝试一下。 那今天就分享到这了,这周还会分享更多跟 webcoding 有 关的一些教程和视频,因为近期正在做很多 webcoding 的 项目,而且我们在本周五晚上也会有一场专门的闭门直播分享,有兴趣的朋友们欢迎直接评论区报名,记得一键三连,下期见!

每天一个 open class q, 今天是 ai agent tools、 catalog, 八十多个即插即用的 ai agent 工具包, python 和 tax script 都能直接用。这条讲清有哪些工具,怎么集成,怎么配置。 开发 ai agent 的 时候,最头疼的就是找工具,搜索要写集成代码,数据库要写连接器、浏览器自动化,又要找新的库,每个工具都要自己封装,开发周期动辄几周,还容易出 bug。 现在有了 ai agent tools catalog, 一 切都不一样了。这是一个开源工具目录,收入了六大类八十多个即插即用的工具包,支持 lan、 chain、 file、 data q、 ai 等主流框架。 比如你想给 agent 加搜索能力,直接引入 table 里或 excel 工具包,一行代码就能调用 agent 自动联网搜索,返回结构化结果,不需要自己写爬虫,在 open cloud 里把工具包配置到 cloud skills 目录,填写 a p i t, 就 能用。 工具集成时间从几周缩短到几分钟,开发效率提升十倍以上。从自己封装每个工具,到直接引入现成的工具包,八十多个工具覆盖搜索数据库、浏览器、 co interpreter 代码执行、 productivity 生产力集成 web browsing、 网页浏览、 database 操作、 file operations 文件处理。 适用于构建 ai 搜索助手、自动化办公流程、数据分析 agent 网页信息,抓取多元数据,整合客户服务、机器人等场景。 传统方式需要自己找库封装接口处理错误。 ai agent tools catalog 提供统一接口,开箱即用,支持多框架兼容。 三步配置,一、从 catalog 选择需要的工具包。二、安装对应依赖。三、配置 a p i t, 即可在 agent 中调用。点赞、收藏、关注我,每天一个 open class, 明天见!

最近 agent skill 这个词真的火得一塌糊涂,但说实在话,真正懂它本质的人是少之又少。上周末我参加四三 college 的 活动,当时一位分享者终于让我把 skills 的 本质用大白话理解了。他说,这三年 ai 圈变化那么快,但是有一件事情从来没变,本质上都是 prompt。 当时全场都懵了,就明明从这个 prompt engineer 提示词工程,到上下文工程、 context engineer, 再到最近很火的 agent skills 概念换了一轮又一轮,怎么还是 prompt? 然后他笑了笑说,太多人把 prompt 狭隘的理解为用户提示词就是你跟大模型聊的对话,但其实无论概念再怎么包装,其实在模型的眼里,这些概念都从来没有变过本质。这句话让我整个人都清醒了。 然后他就开始拆解 agent skills 的 本质。他说,本质上, agent skills 就是 一个 markdown 文件,是对大模型窗口的一种工程学的改造。 这是什么意思呢?就是你知道现在大模型的上下文窗口能做到多大吗?两百万头肯听起来很厉害对吧?但是这时候问题来了,就是资源是昂贵的,而且注意力是分散的, 就像你同时打开一百个网页,那你的电脑即使再好也会卡顿,对吧?所以怎么精心地呃设计、裁剪跟拼接,未给模型的文字去列,就成了非常关键的事情。这时候他开始拆解 agent skills, 他 画了三个框,然后他说, agent skills 本质上就是由这三个部分组成。 第一个框叫做原数据,有点类似于你通讯录里面的花名册,他可以告诉模型说,哎,这里有一百个技能,那么谁是做算力的,谁是做餐饮的,而且只会消耗几百个头肯,所以非常的省钱。第二个框叫做指令,也就是我们熟悉的提示词, 这里的提示词不是用来聊天的,而是用来塑造一个工作环境。第三个框叫做资源,这里面装的是代码文档和数据库,只有当你举手说,哎,我要买算力,那那个做算力的技能才会激活,他的指令,才会开始加载,然后他背后的团队工程师、供应商,也就是他的资源 会被暗区调取出来。那如果你不触发呢,那些庞大的资源就会静静的待在那里,完全不会消耗你的头肯,费用,也不会占用模型的注意力。你看,这就是 agent skills 渐进式疲劳的魅力。 然后那个老师说了一句话,他说过去的 prompt 是 你问,大模型答是一个聊天,但是现在的 agent skills 是 给了大模型手和脚,这什么意思?就是 agent skills 可以 访问你的电脑文件系统,它可以调用你的代码解释器, 甚至可以在你电脑的 bash, 就是 那个黑框框里面直接执行命令。你现在可以跟大模型说,欸,遇到你不懂的,你可以打开我电脑第一盘里面的某个文件夹的文件,欸,那大模型它真的能做到, 所以它不再是一个聊天工具了,而是你的数字员工。所以你可以看到,其实这三年 ai 圈的概念满天飞,但其中始终不变的就是那个 prompt 提示词,从 prompt 到 context engineer, 再到呃, agent skills, 名字在变,但其实它的本质是不变的,我们现在做的所有努力都是在抢占,还有精心装修那个非常宝贵的模型上下文窗口。 那现在很多 ai 圈人还在追新概念啊,今天学 gbt, 明天学 cloud, 后天又学一个什么新出的新工具。但真正懂行的人早就看透了,在模型眼里,众生皆为头肯, 仔细输了一点的 no 号,然后把它提炼为简练的提示词,这才是 ai 圈里不变的道理。听懂了这个逻辑,你才算真正拿到了 ai 下半场的入场券。那么周末的呃,关于 agent skills 的 小笔记我也整理好了,需要的跟我说。

二点五小时啃完这二十五页,你的 agent skills 就 很牛了!最近 agent skills 可谓是一场火爆,起初它还只是 code 中一个小功能模块,就在最近两个月,越来越多的人觉得 skills 非常好用,所以 codex、 cooser 或 open code 等编程工具 陆续加入了对 agent skills 的 支持。这份资料包含概念、技术原理、多场景实战以及 m c p 的 对比和协同工作等内容。感兴趣的宝子抱走上手学习。

最近这个 a 证 skills 真的 太火了,它可以把 ai 变成自动化生产线,交代任务就可以不管了,让 ai 自己完成。那么在旧改项目上, skills 又能做什么呢? 我花了两天时间做出了这个建筑立面改造 skills, 按照发散到收拢再到落地三步走的工作流来输出从概念到施工的完整方案。第一步,发散。先是用一张外立面实拍图,快速出了多个不同风格效果, 选择技能后,上传实拍图后告诉他这是现状图就行了。要注意的是,他输出的是提示词,随便找一个图片生成工具,输入提示词和实拍图才能够得到效果图。这一步是用多方案短时间内摸清甲方的意向。除了这个标准模式,还可以上传一张参考图进行风格适配。 第二步,收拢。假设甲方选择了这个新中式风格,我们接着需要输入甲方选择了 c, 这个 skill 就 能在既定的风格里进一步细化,比如更侧重于食材质感,更强调金属线条与玻璃的现代的风格等等, 进一步锁定收拢甲方的意向效果。第三步,落地,选择好最终的方案,输出现状问题、改造方案、造价、工艺流程、施工建议等等,大家要是感兴趣的话可以试一下哦!

二零二六年,每一个用 ai 的 人都应该学会 agent 加 skill 来给自己提升效率。 agent, 我 使用免费开源的 open code, 在 官网下载桌面客户端就可以使用。这个中文站点有完善的文档和最佳实践供我们参考。 skill, 我 们从可能是全球最大的技能市场 skill mp 中获取。搜索 frontend design, 下载到电脑备用。建好项目文件夹, 放入 skill 和我们要创作的内容,用 open code 打开,输入这段提示词来驱动,静候片刻,这个制作精美的内容展示网页就完成了。 你可以用来部署站点或者是分享到社交网络。这就是 agent 加 skill 最基本的用法,轻量好感,易分发,零代码。这就是获得十倍生产力的秘籍。关注我,带你玩转 agent 加 skill!

你一不小心在 skus 后面输入 s h, 你 发现这是一个全网最全的 agent skills 的 宝藏库,它收入了超五万的 agent skills, 并且完全开源免费,想要什么直接就能部署。不管你想找的是竞品分析、 ui 设计、营销创意,还是写文案、做 ppt、 代码审查等等,覆盖生活服务的方方面面就非常好使。