小白也能看懂的 skill creator 教程来了,厉害!哈喽,大家好,我是姚路行。之前我给大家详细介绍了什么是 skills, 以及在哪找好用的 skills, 其中提到了一个神器, skill creator。 先简单说一下什么是 skill creator? skill creator, 其实一个 cloud 官方推出一个创造技能的技能,听起来有点绕哦,简单说,你想让 ai 有 什么新本事,直接告诉他,他就能自己给自己装上技能包。是不是听起来很牛? 那咱今天就来实操一把,手把手教大家如何用这玩意创建一个自己专属的 skill。 可能有同学要问了,我自己手动创建 skill 不 行吗?当然行,但问题是手动创建得懂目录结构, skill markdown 怎么写对新手不太友好。标准目录结构如下, 而 skill creator 就 不一样了,你只管说需求,剩下的全交给 ai。 接下来我们直接上手,以 cloud code 为例,来创建一个专门创作 ppt 的 skill。 第一步,安装 skill creator, 拿到上面提到的 skill creator 的 文件,放在你自己的目录下。 第二步,直接跟 ai 提需求,打开 cloud code, 直接对 ai 说,我要创建一个 ppt 的 助手的一个 skill, 你 帮我看一下如何创建,就这么简单。 ai 一 看就懂,会自动调用 skill creator, 开始帮你分析。第三步,跟着 ai 的 引导走, 接下来 ai 就 会变身需求调研员了,会开始问你各种细节,这个时候你就别客气,把你的想法都说出来。 第四步,坐等 ai 干活。细节都确定好了, ai 就 开始自动创建了,这个过程大概十分钟左右,具体要看 skill 的 一个复杂程度。 第五步,检查成果创建完成后, close skills 文件夹里就可以看到你新的 skill 了。如果有什么不满意的地方直接改就行,要么手动编辑文档,要么直接跟 ai 说,这里改成叉叉叉,让他帮你优化。 第六步,测试使用。你可以直接说用 ppt 助手帮我写一个关于 ai 编程的 ppt, 不 一会儿就写完了。这里我为了演示 skill 提示词描述的比较简单,你在写 skill 提示词的时候一定要尽量描述清楚, 而且我没有加 ppt 模板,所以说 ppt 没有样式,只有内容。后面我也会继续迭代这个 skill。 总结一下,今天教大家用 skill creator 创建自定义的 skill, 整体流程就是提需求,回答 ai 细节追问、 ai 自动创建,测试使用,随时迭代优化,新手也能分分钟上手。 好了,今天就到这,赶紧去试试创建自己的一个专属 skill 吧!感谢大家,三连谢谢大家,记得关注再走!
粉丝9923获赞3.1万

梅猴王朋友们, agent skill 最近真的太火了,但很多朋友肯定还是很困惑, skill 到底是啥?有什么牛的?没关系,草旅从 skill 大 全它来了。 今天呢,我们会通过一个逐步升级的案例来理解 skill 的 结构和原理,然后我们还会学会定制自己的 skill 这个 skill 呢,只需要我们说帮我做一个促销海报啊,优惠券,员工服装,它就会生成符合我们品牌风格,带 logo 的 物料图片。 另外,我也会推荐给大家一些好用的必用的 skill, 比如说帮你的文章配图,把杂乱的知识变成教学网页,一句话处理表格等等等等。 我还做了个秋之技能生成器,大家只要回答一下 ai 给的选择题,为你量身定制的技能就轻松完成了。并且今天所有的资料链接以及补充资料我都做成了一个网页,大家只需要一步步的跟着做,跟着看,就一定能搞定, 非常值得一个点赞收藏关注哦!来吧,准备好我们 go go! go! 首先,到底什么是 skill skill 呢?翻译过来就是技能呗, 它其实和人类的技能是类似的,比如说你是一个厨师,那你就有炒菜的技能,处理食材的技能,摆盘的技能等等等等。那每个技能里面,比如说炒菜技能,这里面就包含了你的流程,你要先炒什么,后放什么, 还有你的配方,你的油温多高,盐放多少。有了流程和配方呢,你可能还会需要一些工具,需要煤气灶什么的, 甚至你可能还会有一些独家的材料,有一勺秘制辣椒酱什么的。那 agent 的 技能也是同理,它要来做菜,它也得有流程、配方、工具和材料。 所以在 agent skill 的 术语里面呢,它就是 skill 点 md, references, scripts 和 assets 这些东西打包成一个文件夹,这就是一个技能,一个 skill 了。我们先来个简单的, 比如说我们要做一个写作 skill, 那 我们就在 skill 里面可以要求他先去啊这些网站去搜集信息,然后再按这个爆款原则去写个大纲,然后再参考这个语气来写稿啊,最后按照平台要求来审稿等等等等。那有朋友就很疑惑, 那这不就是写提示词吗?哎,本质上还真是的,毕竟啊,我们跟大模型的交互其实都离不开提示词, 但是呢,这并不是 agent skill 的 全部,它在工程上是有很多优势的,能做的肯定比我们拷贝粘贴提示词要多很多。好处我们后面都会说到,那先让我们通过创建一个 skill 来理解它的结构和原理, 我这里用的是谷歌反重力来做编辑器来看文件,然后呢,用的是 cloud code 来做 agent 来处理任务。这俩东西的下载方式呢,我也都放在资料里了,非常清晰简单,大家一步步跟着做就行了。 接着你只要在反重力的这里创建一个项目,比如说我的就叫丘之 project 吧,然后呢,我们调出终端, 输入 cloud cloud code 就 调用出来了,这个界面大家看着会有点复杂,但是不要怕,跟着我一步步来就可以了,之后我们跟 agent 的 对话都会在这里进行。 ok, 那 我们开始创建, 那我们先要做的是一个最简单版本的 skill, 后面呢,我们会逐步升级的哈, 那现在假设我是一家轻食店的老板,那这是我们秋之餐厅的一个品牌 logo, 那 我希望做一个 skill 呢,能够按照我的品牌调性和视觉规范,帮我们去想各种物料的创意,做一个创意生成器。 那按照 cloud 的 规定,我们创建一个 skill, 得在规定的点儿 cloud skills 文件夹里面去创一个 skill 文件,那我们用最原始的方式,直接手动的来创建这些文件夹哈,点儿 cloud skills, 然后我们再创建一个文件夹,这个文件夹的名字呢,就是我们 skill 的 名字,我们叫它秋之创意吧。那这个 skills 的 文件夹里面呢,必须规定有一个 skill 点 md 的 文件,这个大写的文件,那文件里面放啥呢?我已经写好了, 粘贴进来,那就是这么些文字。好了,这就是一个 skill 了,大家先压住脑子里面的问号,我们再来细看一下,那这个文件里呢,上面这两个横线里面的它叫做元信息 matlab, 写着两个东西啊,一个呢是 skill 的 名字,一个呢是 skill 的 描述,这两个东西专门用来告诉 ai 这个 skill 叫什么名字,是干嘛用的,什么时候可以用它,那我这就写着是做创意物料用的啊,当用户说要做个海报什么的物料,他就自己触发它了。 而下面这些信息呢,叫做指令 instruction, 其实就是具体告诉 ai 怎么样做的一些提示词喽。 ok, 那 我这写了我们的餐厅叫做秋之餐厅,品牌的风格有这么些要求,输出的格式让他是这样等等等等,非常的简单哈,那我们保存好一个 skill, 真的 就创建完了?来,我们启动 cloud code 来问问他,你有哪些 skill? ok, 你 看,他现在就已经识别到了我们的秋之创意 skill 了。 ok, 我 们直接问他,我要做一个秋之餐厅的春节促销海报,让他给个创意 好,他这里就开始提示我们,他正在加载这个 skill 了,我们同意 ok, 他 就输出了创意,并且是按照我们的要求和格式来的。 那有朋友就受不了了,哎呀,这一通操作不还是提示词吗?跟我自己写一段这个提示词存着给 cloud code 看有什么区别呢?最大的区别之一在于它是按需加载的, 什么意思呢?其实啊,当我们正常的这样跟 cloud 去聊天的时候,大模型它只会看到我们这个 skill 里面这两行短短的圆信息。 只有当我们说我们要做一个秋之物料的时候,他才意识到,哦,该看具体的指令了,他才会去加载这下面这部分的完整指令,否则这些他都不会看到。 这样的好处就是方便我们可以同时拥有很多个 skill。 每次 a 正的都会看一遍所有 skill 的 简短的原信息,但是只有当 a 正的意识到他要去具体调用一个技能了,他才会去看下面的一大堆指令,而且 ai 的 回答也会更精准, 因为他没有了其他提示词的干扰,那 ai 加载的少了, open 自然也就省了一堆。那这是他按需加载的第一层。 当然了,刚刚这个 skill 实在是太基础了啊,就算一口气把它下面的指令都加载完,好像 token 也不多哈。 但是如果我们的要求变得复杂了呢,比如说我们秋之餐厅的物料其实分很多种, 常规的呢,有海报、菜单,也有比较特别的一些实体物料要设计,比如说餐盒、杯子,员工服装,还有一些社交媒体的物料,比如说公众号封面,微博配图等等等等,他们的尺寸都不一样,配色要求也不一样, 还得符合各平台的一个规范。每一个物料呢,我们都假设它有详细的长长的说明,那这时候我们如果把所有物料的要求都写进 skill 点 m d 里面,那这个文件就会变得巨长。 但是很多时候呢,我只是想做一个,比方说实体餐盒的设计大模型,根本就不需要知道公众号封面的规格,但是 ai 还是得把整个文件都读一遍,那这就造成了 token 的 浪费,也可能会造成一些信息干扰。那怎么办呢? isopec 就 又规定了一个文件夹叫做 references, 我 们呢可以把实体的物料和社交媒体的物料这个两个规格单独拆出来,单独的给它放到这个 reference 文件夹里面去。 那这个实体物料规格点 md, 我 们就写一些线下的工服呀,餐盒之类的要求, 那这个社交媒体物料规格呢,我们就去写公众号封面呀,微博配图这些的尺寸和要求,甚至我们都可以拆得更细。 然后呢,我们只需要在 skill 点 m d 这个总指令里面只留下那几个常见的物料要求,并且我们还需要写上一个指引 啊,告诉他如果用户要做线下物料的话,那就要去读这个实体物料规格点 m d。 如果要做社交媒体类的图,那就要去读社交媒体规格点 m d, 那 现在同样的一句话, 他给出的方案就更精准了。这样当我们只做常规物料的时候,这两个 reference 的 文件大模型压根就不会看。然而当我们说做实体参合的时候,他也会通过 skill 点 md 的 指引,只去看 reference 里面的这个实体规格文件, 那这就是它的进一步按需加载了。那我们可以想象,我们可以有好多种不同情况的 reference, 反正它只会在需要的时候自己去看指定的文件。 但是现在我们的秋之创意 skill 呢,只能输出创意,还得我们自己去做图,所以呢,我就还想让它可以按照我们的品牌规格,直接帮我们把图做出来, 也没有问题。那这就要用到 skill 的 另一种文件夹了,叫做 scripts, 那 这个 scripts 里面呢,一般放的是一些可执行的脚本, 那我这里呢,实际上也就放了一个非常短非常简单的脚本,其实就是在调用 nano banana 的 api 来生图的一个脚本。那有了这个脚本之后呢,我们还得去 skill md 里面在指令里说一声,告诉他,如果用户要求直接生成图片, 那他就得把之前我们想的这个创意转化成生图的提示词,然后按照这个命令去调用这个生图脚本,这样他就能一句话自动去生成精准的图片了。 不然我们还得自己去拷贝提示词,打开软件再粘贴,再生成,再下载保存,现在我们一句话就搞定了。 另外我还有个需求,我希望深层物料的图片能保持秋之餐厅的 logo 不 变, 所以我们还得给他几张 logo 图作为深图的这个参考。那我们就可以再建一个 最新规定的一个 s s 文件夹,我们把两张的 logo 图片放到这个文件夹里,当然我们还要回到 skill 的 md 里面,告诉他参考图在这个 s s 文件夹里面,如果要深图的话,需要把这个图片当做参数给脚本传进去来执行。 好朋友们,现在这个 skill 就是 一个完整的官方完全形态了,其实有点像我们在用自然语言写程序,对吧?那我们先来试试效果,来帮我做一张周六饮料免费的一个实体海报, 你看它发生了什么?它先是加载了这个 skill, 然后它内部可能发现啊,要做的是这种实体物料,它就要去看另一个解说,于是它去检查了这个实体物料的规范。那并且它意识到我们需要的是直接生成图片, 所以呢,它又生成了提示词,把这个提示词和 logo 图片一起给到,并且运行了这个脚本。那最后它输出的图片告诉我们,在这里我们看看结果, 你瞧瞧它这个尺寸,配色 logo 是 完全符合我们这个品牌规范的啊。那为了防止这个是一次性的结果,我还多试了几次,它这个深层的效果都很不错。 然而如果我们的要求还跟之前一样,我们只要创意并不要直接深图的话,那他的这个脚本他也不会被执行。 而且呢,刚才我们说到这个 scripts 脚本,这里面其实还有一个重点,这个脚本里的代码它是写好了的, agent 根本就不需要去看里面写了什么,它只要知道我们在 skill 点 m d 里面写的那些指引,告诉它传什么参数,会输出什么,它只管运行脚本就行了。 所以不管我们在 scripts 里面写了多少行代码,大模型它都不会去读取,一点 token 都不占。 当然了,如果我们在 skill 点 md 里面的那个指引写得不够清楚,大模型不知道怎么用这个脚本,那他有可能也会不得不自己去看一下这个脚本,但他的机智和园艺是不需要去读这些脚本的。 好,那我们来回顾一下,其实创建 skill 就是 在指定的文件夹下去创建一些文件,那最简单的 skill 呢?只要一个 skill 点 m d 就 够了,里面有这个原信息和指令,而完整形态的 skill 可以 加上 references, script s s 这些可选的文件,那这些东西是怎么配合工作的呢?这就是 skill 最重要的设计。按需加载的三层结构,第一层,源信息。 这一层呢,是始终加载的, ai 的 每一次对话都会看一眼所有的 skill 的 源信息,它去看到自己有哪些技能,就像一个目录。那第二层,指令层, 这层是只有当 ai 判断并且决定我要用这个 skill 的 时候,它才会去加载完整的 skill 点 m d 文件。第三层,资源层, 这层包括了 reference 里面的参考资料, scripts 里的脚本, assets 里的资源。只有当 ai 进一步判断任务需要更详细的信息,或者它需要执行某个脚本的时候,它才会去按需加载,并且脚本它是只执行不读取的,完全不占用托克。 好了,这下我们完全理解 skill 的 按需加载,也就是官方定义的渐进式批漏机制和三层结构了。可是对于普通人来讲,这又是写 markdown 又是脚本的,好像创建一个 skill 还是挺复杂的。 no no, no, 现在谁会用手写呢?我是用这个创建 skill 的 skill 啊,秋之 skill creator 创建的。 那这个呢,是我基于很火的 skill 创建器改良的一个更加互动式,更加小白的一个 skill 创建器。那大家把它下载下了以后,放到这个点儿 cloud skills 文件夹里面就好了。那下好之后,我们想要创建什么 skill, 直接打开 cloud 直接跟它说就行, 或者我们也可以斜杠来调用他,那他呢,会开始一步步的引导和追问我们,来帮我们梳理这个需求。而且我特意设计的是这种用选择题的方式来追问我们整个过程,我们就只需要用大白话回复他的问题,以及按一按上下键做一做选择题就好了。 他这个追问的过程啊,到时候大家问题可能和我现在这个不一样,因为他会根据你的需求去做灵活的调整啊,他都是现编的。 然后呢,这个过程中因为我们要做图片,所以我们还需要给他提供 logo 图的参考,以及那个 nano 不 nana 的 a p i 和文档。那我也给他直接拖到了这个项目文件里,然后告诉他了一下这个文件的路径, 他就会自己去参考和把它们放到 excel 文件夹里面。那这两个素材我也都已经放在了我们的课后网页上了,大家可以去用做练习来试试复现它。 那问完这些问题之后呢,他还会给我们核对一下方案,如果我们看着方案没问题,那他就会自动帮我们生成所有的 skill 文件了。 那做好 skill 之后呢,他还会帮你想几个例子来跑一下测试。我们这里其实测了好几个,风格都很一致,很好看。大家在这个调整的过程中,也可以去点开他写的这些 skill 文档来手动的修改一些,反正都是提示词嘛。 所以总之只要你有明确的输出要求,或者有明确的方法规范流程知识,创建器就会指引你帮你来写出一个定制的 skill。 而且除了自己创建,网上也有很多现成的 skill 资料里,我也整理了一些集合网站和 skill 仓库,成千上万的 skill, 大家可以去逛逛。并且我也给大家打包了几个普通人常用的必备 skill, 比如做 ppt, 处理文档, excel, pdf 这些基础的,我们直接把它拖进 skill 文件夹就可以,一句话让它帮你把乱糟糟的表格梳理得整整齐齐。 还有这个官方的前端设计 skill, 这是直接让 cloud code 生成的前端网页,而这个是挂载了这个前端 skill, 做出来的网页,效果明显大幅提升。还有这个动画生成的 skill, 用这么一段提示词就可以做出这样一段演示动画。 当然大家也不用去装一堆自己根本用不上的技能,一个游戏英雄也只需要四个技能 q w e r 就 能杀遍全场。所以最有效的还是把你最最高频做的几件事,打磨成一个你独家的稳定产出的 skill。 尤其是你对结果有明确的要求,你有经验和方法,你验证过的事情。 比如说打工人,你的周报每周都要写,那就做一个让 ai 来主动采访你,然后出周报的一个 skill。 比如说老师每节课都要背课,那就做一个你只要给出课题,就能给你一整套课件习题和 ppt 的 skill。 又比如说,你总是要给你的文章配图,那就做一个给他一篇文章,他就按你的风格做配图的 skill。 又比如说,你总是在审核,那就做一个按照你的规矩自动批阅合同来写备注的 skill。 因为大多数的人都不需要成为一个技能开发者, 我们只要先把自己掌握的小技能交给 ai, 让他替你重复劳动。好了,资料链接都在评论区了,大家动手试试吧!这个时候呢,点赞、收藏、关注的技能就该出发了,我们下次见了!

目前全网最火的 skill 你 还不会用吗?今天我教你一个最简单最直观的方法,看完你还不会用,你来打我!这个方法就是使用扣子,扣子前段时间做了一次重磅的升级,推出了 agent skills、 agent plan、 agent office 和 agent coding 等等重磅功能, 其中让我觉得最有趣的无疑是对目前全网最火的 skills 的 支持。我体验了一下,我觉得对于没有技术背景的朋友来说,如果你想要用上 skill, 这个应该是我目前找到的最简单最直接的方法。不过在开始之前呢,我想要先简单的介绍一下什么是 skill, 因为我发现很多朋友还不知道 skill 到底是个什么东西, 在这里呢,我觉得最重要的是要从概念和定位上面去理解它,而不是去纠结说它到底是由什么组成的。那么在概念上呢,其实也很简单,那就是 skills 这个英文单词的中文意思,技能,就跟我们平时说一个人有弹钢琴的技能,有游泳的技能,有说服别人的技能,对吧, 其实就是这里的技能的意思。只不过我们今天要聊的这个 skill 呢,它不是人的技能,而是 ai 工具的技能。 当目前来说,并不是所有的 ai 工具都有技能这个东西啊,但是对于这些有这个东西的这些 ai 工具,你就可以给它们来增加一些技能啊,比如说增加一个做 ppt 的 技能,增加一个数据分析的技能,对吧? 那什么样的事情适合用 skill 来做呢?在这里就说到为什么要用 skill 这个东西了,那么简单说呢, skill 的 意义就在于它们能够让我们刚刚提到的这些 ai 工具能够更好地去完成一些任务, 比如说数据分析,对吧?你可以把一堆数据直接扔给 ar, 让他来给你做一个数据分析,那么大概率他也能做。但是呢,如果你给这个 ar 工具安装了一个专门的做数据分析的 skill, 那 么大概率他做出来的数据分析会更加的专业,同时更加符合你自己想要的一个结果。 其实跟我们日常生活中也是差不多的啊,比如说一个没有做饭技能,比如说我,对吧?我去做一餐饭,跟一个有多年经验的大厨,他做出来的一顿饭,味道应该是完全不一样的啊。这个就是因为有技能的这个差别,所以什么样事情适合用 skill 来做,那其实答案就很明显了, 基本上就是所有的这种技术活就是有一定技术成分的,这些工作以及一些流程化的事情,都适合用 skill 来让这些 ai 工具能够更好的去完成。当然每种 ai 工具它创建和使用 skill 的 方法是不一样的,像 coco 的 这种可能就需要一定的技术背景,对于不懂编程的朋友来说,可能会有一定的上手难度。 所以接下来我就介绍一下如何在扣子里面来轻松方便的创建和使用一个 skill。 ok, 我 们打开扣子首页,然后点击这里的扣子编程,再点击这里的技能,在这里我们就可以通过对话的方式来生成一个 skill 了。 这里呢,结合我自己的需要,我们让它来生成一个小红书爆款标题的 skill, 我 们直接跟他说帮我开发一个 skill, 根据我提供的视频脚本或主题生成十个小红书爆款标题。好, enter, ok, 可以 看到它这边就开始在帮我创建这个 skill 了。 ok, 它现在就帮我们生成了这个 skill 啊,然后可以看到它这边有一些简单的介绍。好,我们来试一下。这边我们上传一个脚本文件,然后跟他说生成十个标题。 enter, 可以看到他这边在读取我的脚本文件,然后根据这些内容来生成小红书爆款标题。好,这边就已经生成好了。然后这边呢还有一些简单的解析,他到底是怎么生成的?那对于标题的生成呢?我其实是有一些自己的一些方法论的,所以在这里我们也可以让他来根据这些方法论来帮我们生成标题, 那我们就可以继续完善这个 skill, 我 们跟他说这里有一些起标题的方法论,你参考一下。那下面这些就是我比较喜欢的一些起标题的方法论。我们提交 ok, 可以 看到现在蔻子就在根据我们的要求来更新这个技能了。好,很快蔻子就帮我们升级好了这个技能, 可以看到它这边增加了这样的一些起标题的一些理论。那为了更加清楚地看到它生成的这些标题有没有按照我们这些理论来生成,我们可以进一步升级这个 skill, 让它在输出这些标题的时候呢,简单地解释一下这个标题是怎么生成的。好,我们跟他说对于每一个标题简单解释一下它的原理,为什么这样设计 好。提交 ok, 扣字,又在帮我们升级这个 skill 了, ok, 升级完毕,然后我们再来试一下上传脚本,然后跟他说生成标题。 ok, 我 们再来看一下这一次它生成的这些标题。好,可以看到这一边每个标题后面都有一些简单的解释啊,它设置的原理是什么? 所以它的输出结果还是符合我们刚刚给它这些要求的。然后整体来说,我觉得这些标题的效果还是蛮不错的啊,像这个标题我觉得是可以直接拿来用的, 那到这里这个技能就差不多已经做好了,当然你可以根据你的要求去进一步的对他进行一些优化。比如说我之前在 dunk 上面学到的一个点,就是你可以把你之前 表现最好的一些作品的标题喂给他,让他来去参考,这样的话他取出来的标题会更加符合你自己的这个风格。再比如说你可以让他同时生成封面文字和标题这样的一个组合,因为像我这样的话,封面文字跟标题之间其实是一起思考的,然后他们俩之间会有一个相互配合的关系。 ok, 这个技能创建好了以后呢,我们需要部署一下啊,点击右上角的这里的部署,再点击下方的这个开始部署。 ok, 很 快它就部署好了,然后我们点击这里的立即体验, 就可以在扣子的这个对话框里面来使用这个技能了啊,在这边可以看到由我们刚刚生成的这个爆款标题生成技能啊,选中,然后呢上传一个脚本,我们选一个别的,然后跟它说生成标题。 enter。 好,可以看到这边就在开始利用这个技能来帮助我们生成标题了,那输出的这个格式可以看到跟刚刚呢也是差不多的。 ok, 以上就是在 code 里面创建和使用一个 skill 的 方法,整个过程直接对话就行啊,简单到不能再简单,呵呵。 而且除此之外呢,在这里的 code 技能商店里面还有大量的现成的 skill, 都是一些经验丰富的专家和开发者创建的 skill, 你 可以直接拿来用的,使用这些 skill 基本上做任何事情都能够得到一个更好的结果, 所以如果你还不会用 skill 去试试扣子 skill 的 功能,相信你会有完全不一样的感觉。 ok, 这个视频就到这里,大家想要创业什么样的 skill 呢?欢迎在评论区留言,最后别忘了点赞关注我是昌哥,我们下期见,拜拜!

m c p scale 到底是什么?你一定听过很多关于它们的理论,但你的理解一定是正确的吗?比如 m c p 的 解析是大模型上下文协议,它可以和各种外部系统连接,请问大模型是直接调用外部的服务吗? 如果你所在公司的内网搭建了 m c p 的 服务,外部的大模型它怎么能够调用呢?再比如 skill 的 解释是技能,它是有具体的功能吗?要不为啥叫技能呢?它和 m c p 又有什么区别? 上面的问题你要是不能够准确的回答,不用怀疑,你一定没有真正理解。这不是你的问题,而是大部分视频都是基于局部的理论知识,缺乏局的视角和实战的经验。 今天这几个视频我会结合我的实战经验,循序渐进的帮你们弄清楚这些技术的本质,请一键三连给予鼓励,让我们开始。 首先你要明白这些 ai 的 概念,它不是突然一起出现的,而是先有 l m 大 模型,再有 n g t, 随后是 m c p, 最后才是 skill。 每一个新概念都是为了解决特定的问题,我们必须搞清楚 ai 在 发展的每个阶段到底遇到了哪些问题,我们才能够真正的去理解这些概念背后设计的初衷是什么。让我们先从 l m 开始, l i m 的 本质是基于概率去预测下一个字母,就像成语接龙一样,二零二二年恰的 g p t 三点五刚问世的时候,我们对它的使用就是对话式的向 ai 提问,写作文生成代码也不需要什么,而且的但是有一个问题就是说 你当时是不能够问 ai 最近发生的事情的,比如说今天是星期几,因为它是基于二零二一年九月份之前所训练的数据。那聪明的你肯定想到了,我们用大模型自己去网上搜索,然后给个结果告诉你,但大模型不具备这个能力,就好比你用大脑一年去操控电脑, 这个时候你要么自己去搜,要么你就写个爬虫去搜,然后再把这个结果发给这个大模型进行整理。 勤奋的你肯定是选择爬虫,而这个爬虫就是最古老的 ngram。 当然了, ngram 它感召智能体,它肯定不是爬虫这么简单。像现在顶级的 ngram, 比如说像 manasa cloud code, 它既能写程序,又能做报告,智能的程度让人不可思议,甚至会让人感到恐惧。 但是它本质上就是在循环的干以下三件事情,第一件事情,收集好信息之后发送给大模型。第二件事情,解析大模型的结果,然后获取这个执行的指令。 第三件事情就是执行指令操作,把执行的结果再次发给这个大模型,整个的操作都是循环进行的。然后接下来我们就来看一个具体的关于 code code 的 一个事例。 假设我们现在有两个文件,其中一个 hello 点加法是存在错误的,这个 user 的 格式函数我们把它写错了。现在我们用 color code 这个 n 的 智能体来帮我们找到这个问题的原因。请注意,用户提示词里面明确指明了这个文件的绝对路径,那么请问 color code 他会直接读取这个 hello 点加文件,然后发给大模型吗?大家暂停思考三秒钟,认为会的刷一,认为不会的刷二,答案是不会 ng 的。 他不会去解析这个提示词,更不知道如何去读取这个文件,他只会把结果发给大模型, 然后让他大模型来告诉他怎么读,去哪里读具体的流程,就像在线看病一样,用户提出问题了,然后再是 n g 的 把用户的问题封装成系统提示词,包括对应的工具,一起全部发给这个大模型,进行这种远程问诊。 这里的系统提示词就是告诉大模型你是一个编码专家,你要解决用户的是编码问题,你不要去解决用户的心理问题,或者是他的单身的问题。 然后工具的列表就是告诉大模型你在解决用户的问题的时候,你可以去开哪些检查,你去看病,如果不开检查,那么他怎么看病?这里面所谓的检查以及所谓的工具,其实就是去搜索提取 文件,大模型就会返回一个提取文件的检查指令,详细的告诉 n g 的 怎么去提取。 好,接下来的话, n g 的 就会乖乖听话去读取这个 hello 点加号文件,连同他的历史记录一起发给大墨琴。这里的历史记录就相当于是一个病历本,因为每次看病都不是同一个医生, 他得知道你是什么问题,你之前做了哪些检查,他只能通过宾利本来来获取这些信息,然后大模型看了 hello 点 java 的 内容之后,他还是不能断定这个问题在哪里,他继续就会开出这种搜索系统文件的指令,用来搜索这个 u 字点 java, 然后摁记着把搜索的结果发给大模型,大模型继续返回这个 u 字点, java 这个指令读完之后,再连同记历史记录一起发给大模型。 好,大模型终于拿到了 user 点加号的内容,也拿到了 hello, 点加号的内容,终于可以制定解决方案了。 ok, 然后把解决方案返回给用户,整个任务结束, 我们总共是经历了四次 http 请求的操作,前面讲的都是理论,接下来让我们来抓包实战的演示一下给大家。我们可以看到这里面有两个类,一个 hello, 一个 user, 然后在这里我们是错误了,引用了 user 的 过载函数。接下来我们把这个问题发给这个 code, 这里面我们采用的是绝对路径啊, 接下来我们来看一下啊,这里面我们用到了一个抓包工具叫做 proxima 啊,这是它的第一条请求,已经发送了。 第一条请求其实跟我们的这个问题的解决关系不大,它主要是让大模型来判断它当前是不是一个新的规划。接下来的话啊,我们来看一下。好,这里的话结果已经出来了,他已经给了我们解决方案,就是要给这个 u 的 构造函数添加对应的参数。 接下来的话,我们来看一下它到底发生了多少个请求,以及它整个的一个处理过程。 这里面总共是发送了一二三四五条请求,但实际上第一条请求的话应该是不算的,为什么呢?因为它这里面它只是让这个大模型去分析一下这个问题是不是一个新的问题,如果是的话,那你就返回一个 new topic, 然后它拷了扣的,在扣端里面添加个历史记录而已,跟我们解决问题的关系并不大啊,包括它对应的提示词也是非常的简单,这一个才是真正的去开始解决问题。这里面就发送了非常长的一段提示词,总共是有七十多 kb。 好, 那么大家想一下这里面包含哪些内容呢?哎,就是我们刚说过的,第一个是什么?第一个是用户的问题,对吧?第二个是系统提示词,第三个是 工具列表。哎,我们可以,你是一个医生,你可以开哪些检查啊?这就是我们的工具列表。 ok, 我 们来看一下是不是这些。好,来看啊,这一段提示词的话是告诉这个大模型用户,他之前执行了一个 kleil mini。 好, 这个跟我们的问题没关系啊,你不要去管他,这个才是真正的啊用户的问题。 接下来的话就是对应的系统提示词,这个系统提示词第一段就是告诉大模型你是 cloud code 的 这个大模型,你解决的是编码的问题,你不能够说去,你去解决什么心理医生之类的问题啊。好,接下来才是具体的告诉这个大模型你应该怎么去解决问题 啊?这一段提示词的话,大家可以把它复制下来,好好的研究一下。好,接下来第三个就是工具列表,就是,哎,你去解决这个问题的话,你可以采用哪些工具啊?那么我们来看一下,在下面啊,很长很长。第一个是啊,它支持哪些工具?有这个定义任务,然后任务输出啊, 然后这个也非常的长,看起来不是特别方便,我专门是做了一个解析器啊,然后我们把它复制到这里来,看起来就相当的方便了啊,你看啊,前面就是用户的提示词啊,这个是系统提示词啊,第一段,第二段,好,这个是工具列表,这里面的话总共是十七个工具,定义任务、任务输出啊, 那然后这里面有几个比较关键的工具啊,读取文件,第二个编辑文件,写入文件,还包括这一个啊,去网上进行搜索, ok, 好, 那么这些的话都会一股脑的全部发送给这个大模型,大模型拿到这些信息之后,他应该怎么做呢?他能够直接断定问题到哪里吗?他当然不会断定问题在哪里了,但是他会开检查呀,来,我们来看一下啊, 他这里面返回的是一堆的这个 s s 一 的内容啊。呃,这个内容的话看起来也不是特别方便,所以说我们还是得要把它复制过来,然后粘贴到我们的工具里面去。 好,你看大模型非常的简单和干脆啊,他就直接给你开了个检查,啥都不跟你说。 这个检查就是读这个 read, 这个 read 就是 我们刚刚所说的这个十七个列表当中的其中一个,它连参数都告诉你了, feel pass。 那 么 color code 接收到这个工具指令之后,接下来干嘛?肯定是读取这个文件,然后再把这个文件一起发送给这个大模型,我们来看一下它的第二次请求, 这一次请求里面的话要包含哪些信息啊?大家想一下,第一个是第一个应该是历史记录,就是我之前用过的问题,以及大模型返回的结果, 又要重新再发一遍。第二个就是读取的内容,我们来看一下,看这个还是原来的内容,一模一样没有变,对吧?包括用的问题,包括这个大模型返回的这个结果,结果就是要去读取这个文件,然后接下来就是,哎,我读取到了这个文件, ok, 然后再往下大家猜一下是什么,就跟之前发出的是一样的,还是对应的系统的提示词,以及对应的工具列表,一起全部发送给他。然后我们在看他返回的内容之前,我们先来猜一下大模型这个时候他应该怎么做 啊?假如是你,你应该怎么做?其实我已经读取到了这个加哇的对的这个代码,接下来的话,我们是不是要去搜索一下这个优优的这个列表,是不是大模型的话,接下来应该是要返回的是搜索, 搜索这个文件,搜索这个 user 这个文件肯定了你没有看过 user 文件之前,你不能够断定到底是哪里写错了,对不对啊?那么到底是不是这样的呢?我们把它复制过来,然后粘贴到这里来,我们来看一下啊,好大拇指说代码的语法没有问题, 但是我们要检查一下这个 user 类是不是存在,但是我又不知道 user 类去哪里读取,所以说他就给用户返回一个搜索的命令, 这就是我们的第二次请求,第三次请求想也想得到,直接就去搜索,然后把搜索的结果一起返回给他,连同历史记录一起返回给他。我们来看一下第三次请求, 第一步肯定是历史记录全部的所有的历史内容,接下来最后一个内容是他的搜索的结果, to a result, 搜索结果就搜索到的是这个文件,是这个路径,同样的还是系统提示时和对应的工具列表 发给他之后的话,他的返回的结果。想也想得到,肯定就是要你去读取这个文件了吗?让我们来看一下,你看啊,简单干脆你去读一下这个结果。好,最后一步的话,大家想也想得到,肯定是之前的历史记录,然后就是这个 user 的 读取的结果。好,我们也一起来看一下 一堆的历史记录,这一步就是这个 user 类的读取结果。好,读取完之后的话,你看大模型基于现在的这一次请求, 包括这个 hello 的 内容, hello 加 hello 点 java 的 内容,以及这个 user 点 java 的 内容。那么它是不是就能够断定是这个 user 的 构造函数 没写对,因为这里面只有一个构造函数,而且这个构造函数要传两个参数,而你在这里一个参数都没传好,这样它就能够基于现有的信息能够进行判案了,能够判断这个病情到底是在哪里了,这个时候它就会给我们返回实际的问题的解决结果。 讲道理来说应该就是这样的,我们来看一下它最终的返回结果。好,我们复制粘贴进来,你看已经找到问题了,问题是什么?怎么怎么解决?这就是这一二三四条请求,就是完整的 color code 和大模型的一个交互的过程。 ok, ok, 如果说你接下来你就可以继续说帮我修复,这样子你就可以进一步的观察到这个 color code 是 怎么去修复这个问题的。 ok, 那 么感兴趣同学可以自己去试一下,我这里面只是告诉大家它整个的一个 基础逻辑, ok, 另外如果说大家需要这个工具的话,也可以直接私信我,我会把对应的这个工具和源码一起发给大家。那么从刚刚的实战可以推断,我们无论执行多少次 h d d p 请求,但是 n g 的 本质上就是在不断的在执行, 一、收集信息,二、解析结果。三、执行操作。无论他执行多少次,都是在循环的干这三件事情,直到问题解决。那么接下来我们新的问题是,关于这个执行操作,他到底可以执行哪些操作呢? 除了 color code 自带的这十七个工具列表以外,我们还能不能够有更多的操作呢?这个时候就该 m c p 出场了,请看下集内容,点赞越多更新越快,让我们下期再见!

这几个词你认识多少?这几个词你认识多少?这这这几个词你又认识多少?如果你全都不认识,那么恭喜你来对了地方。今天这期视频,我就为你扒开所有这些唬人概念的底裤。你会发现,所谓智能体,就是所有不需要智能的部分构成的部分。 skill 就是 新瓶装旧酒的一场名词诈骗。最后呢,我还会告诉你一个通杀现在所有甚至未来可能出现的新概念的统一方法论,让你瞬间秒懂。哎,这好像是个语病,但这不重要,现在你只需要清空大脑,忘掉你所有知道和不知道的概念,跟我一起进入梦境。 整个混乱的起点就是这个古老的语言模型。小的语言模型,一开始呢,还是个智障,但随着模型的参数越来越大,居然在某个临界点涌现出了智能。那为了和之前这个智障模型做个区分,你在前面加了个大字,这就构成了现在常说的大语言模型,简称 l l m。 恭喜你发明了今天的第一个新词儿。 大模型本身只能做文字接龙,就是不断输出下一个字,但如果只是这么用的话,看起来仍然像个智障。那如果把角色区分一下,人为划分成一问一答两个角色,就实现了第一个有点智能的使用方式对话。 现在呢,我不管你是什么身份,立刻把自己想象成一个老板, l 就是 你的员工,我们就叫他小 l 吧,只不过他服务你的方式有点特别,只能一问一答,然后就结束了。不能追问,不能追问,这个非常重要,后面要考, 那接下来的任务就是你要想尽办法压榨这个只会一问一答的小 l, 榨干它的全部剩余价值。那你会怎么做呢? 不过先别急,你先给自己每次和小 l 的 对话起了个洋气的名字,叫 prompt。 恭喜你发明了今天的第二个词。然后你还发现,这部分内容还可以进一步区分,有的部分是背景信息,有的部分是最终的指示。于是呢,你把背景信息的部分单独起了个名叫 context 上下文。那恭喜你发明了今天第三个词。 同时,有的时候你需要对小娱进行追问,但是呢,刚刚说了他只能一问一答,不能追问。但是你想了个巧妙的办法,就是每次沟通前把你们之前的对话历史放到 context 部分作为上下文信息。 然后呢,再给出你的问题,伪装成多人对话。然后你又迫不及待给这些特殊的上下文信息起了个新词,叫 memory, 意思是大模型的记忆,这些 memory 还可以再次调用大模型进行总结,从而对他的记忆进行压缩,进而减少上下文的长度。恭喜你,一不小心就已经发明了四个新词了。 此时,一个原本只能进行词语接龙的小 l 就 成功被你玩出了可以对话并且可以不断追问的优秀牛马员工了。 当然,不久之后你就不满足于现状了,你发现的第一个问题就是小儿没有上网查阅资料能力,要么就不知道,要么就胡说八道,说的内容都是些过时的消息。不过这很简单啊,给小儿准备一台电脑不就可以了? 不可以!还是那个问题,小 l 本身只会词语接龙,其他任何逻辑都无法独立完成,那怎么办呢?好办,你就告诉小 l, 如果你需要上网搜索资料的话就告诉你,然后你帮忙查完资料后再给他不就行了?但很快你就发现,这样好像显得自己有点蠢,到底谁才是牛马呀? 于是呢,你把上网这部分逻辑写成一段程序,让这个程序去代理你和小 l 进行沟通,并且完成搜索的任务。 在外人看来,你仍然是一问一答就拿到了结果,只不过面向的是这个神秘的程序了。太妙了,这个发明可不得了。这个神秘的程序似乎本身就拥有了智能,而且还是能操作工具的更高级别的智能。你给他取名叫智能体 agent。 你 可能觉得写多段程序不是看起来很简单吗?怎么敢叫这么科幻的名字?哎,千万别有心理负担。一些早期所谓的智能体,其实现逻辑仅仅就是多加了一段 prompt 而已,那从现在的视角回看,当时简直就是一种诈骗。 回到这里,既然这个 agent 能上网搜索内容了,那是不是也可以增加个搜索本地文档或数据库的能力呢?可以的,只不过搜索方式和传统数据库不同。要使用向量数据库把语义相近的片段找出来。 那你给这种通过语义匹配向量化的信息,并将其加入上下文,以增强生成内容的可靠性的办法,叫做解锁增强生成 retrieve augmented generation, 简称 r a g。 那 刚刚这个联网搜索也起个名字叫 web 测试 算了, drop the web just search。 这样呢, scope 显得更大一些,连 r a g 也算是 search 的 一种了,都属于获取模型参数以外的信息的能力。好了,现在看看你造的孽吧,这么一会功夫,已经发明了八个新词了,当然了,好戏还在后头呢。 好了,现在的整体架构就是你和小 l 中间隔着一层 a 阵的程序,并且处理一些小 l 无法操作的东西,包括刚刚的搜索,以及还可能出现的其他各种工具的调用。 但这就有个问题,我们聚焦于 agent 和大模型的对话过程来看,而如果这部分一直用自然语言来沟通,那这个 agent 的 代码可不好用程序来实现呢,鬼知道大模型会怎么描述自己的需求呢? 所以最好有个约定,让大模型按照指定的死板的格式来回复,比如说 jason, 这样呢,程序就能直接很方便的解析了。那你给这种 a 阵呢,和大模型之间关于工具调用所约定的对话格式叫做 function calling, 其实呢,就是个约定罢了,就好像开发的时候前端和后端约定这个接口格式一样。 好了,我们再看看右边这些工具的实现,现在是写在 agent 的 主程序里面的,没有跟核心功能结偶。那如果是单独写成一个服务,那么 agent 的 主程序如何发现并调用这个服务,就又需要一套约定的规范了。比如说约定好 toos list 的 方法就是返回工具列表, toos 框方法就是调用具体的工具等等, 也就是一套约定而已。那你给这边的约定也起了个名字,叫做 mcp, 翻译过来叫模型上下文协议。 而至此,架构就变成了这个样子,此时大模型就像个只会说话不会做的智者,而 m c p 服务就是能提供各种工具的程序级。中间的 agent 就是 个传话筒,把大模型的话转换成调用工具的代码,把工具调用的结果再原封不动的传话给大模型。 同时呢,别忘了还要给你这个老板传话,主打一个,我不生产信息,我只是信息的搬运工。现在我们聚焦于 agent 和你的对话之间。 虽然最底层肯定还是文字,但是交互形式上可以非常丰富多彩,可以是像 c l i 一 样的命令行窗口,也可以是一个编程 ide 工具,还可以是一个更为通用的桌面助手,比如说最近爆火的 cloud bot, multi bot, open cloud, 当然这仨是一个东西。 这里说句题外话,我感觉 cloud code 这个名字起的实在太失败了。一开始呢,好多人认为它是个大模型的名字,但其实它是个编程 agent。 现在呢,好不容易大家接受它是个编程 agent 了,但其实它早就走上了通用 agent 的 道路。我感觉要是名字起好了,就没现在的 cloud bot 什么事了。 当然, collab 的 爆火和它的自身的很多设计有关,如果本期视频的点赞过亿,我将会专门出一期视频讲讲它。不过不论什么形式的智能体,都有一个统一的缺点。假设我们想完成这样一个任务,从一个英文 pdf 文档当中提取内容,翻译成中文,最后保存成 markdown 格式。 当然,你可以直接把这个需求描述给 agent, 让他自己策划整体的流程。但是如果这个流程相对稳定,每次重新让 agent 自由发挥的话,不但不稳定,还非常浪费 token。 比如说,整个流程中,提取 pdf 和保存 markdown 这两步完全可以固化成固定的脚本,中间的翻译直接和大模型沟通即可,整个流程就不需要任何一个中间的智能体插手了。 要固化这样一个流程,你可以通过编程的方式来实现。为了方便编写这种列式的任务,你又发明了一个新的编程框架,起名叫 linchang。 呃,为了照顾非程序员用户,你又发明了一种低代码的方式,就是在页面上傻瓜式的拖拽,上手难度更低。你给他起个名字叫 workflow 及工作流。 但是还有个问题,假如这个问题我们再变一下,比如说处理原始文档,不只有 pdf, 还有可能是 word 文档、 txt 文档、 ppt 等,然后输出的格式也可能是 html、 pdf, 甚至是一张图片。那么难道你要给这些所有的排列组合都写一套工作流吗?这显然是不合适的。 当然了,你也可以写一堆 ifelse 做判断。但如果你仍然希望用户是以自然语言的方式触发这个任务,不牺牲这个体验,这个时候就又不好用程序来判断分支了。那该怎么办呢? 你可以这样设计,准备一个目录,把所有可能涉及到的转换脚本全都写好放在这。然后呢,写个统一的说明文件,把整体的流程描述清楚,并且告诉 agent, 根据文件的格式灵活选举指定的脚本。 然后呢,再给 agent 下达任务之前,加上这么一句话,先读取刚刚我们写好的那一大串要求,然后再按照要求完成任务。这样整个过程就既保证了一定的灵活性,同时呢又变得比较可控。 但是这不就又来了优化空间吗?我可以提前约定好某个指定的位置,然后呢,在 agent 中写死一段程序去读取这个位置的 skill 点 m d, 还是相当于把这句话固化成了一段程序,这样呢,就不用每次都加这么一句废话了。 虽然你也知道这破玩意好像就是把提示词换了个地方存起来,但想想还是给他起个新名字吧,就叫做 skill, 即 agent 的 技能。好家伙,这是往游戏里的英雄方向设计的呀。 好了,现在这个 agent 已经被你弄成这个鬼样子了,你又发现,对于一个复杂的任务,可能 agent 的 上下文会变得非常大。于是呢,你又发明了个新概念叫 sub agent, 对 于一些独立的子任务,可以单独在这个子 agent 中完成,其实本质上就是做了骂上下文隔离子 agent 产生的上下文不会保留在主 agent 中,仅此而已。行了,再好好看看你造的这些孽吧。 最后呢,我想尝试高屋建领的梳理一下这些概念的关系。这里的每一个新概念出来的时候都有大飘的文章,极其夸张的吹捧和营销。但是在我看来,这些概念的设计说的不好听点就是有点拉垮,说的好听点呢,就是技术发展的中间产物。 不过在这之前,我们先看两个经典的容易混淆的问题。在 m c p 刚出来的时候,很多人问方声 call 林和 m c p 有 什么关系啊?呃,其实刚刚这张图就很清晰了,一个是 agent 和大模型沟通的约定,目的是让大模型回答的符合一定的格式,方便程序进行解析。 一个呢,是 agent 和工具服务之间调用的约定,目的是像接口文档一样,约定怎么调用,怎么传餐,怎么接收返回值等等。这俩完全不搭嘎,甚至有人问是否 mcp 能够取代防神拷令呢?这也是无稽之谈。 在 skill 刚出来的时候,也有人问 skill 和 mcp 有 什么区别, skill 其实就是个 prompt 加载器嘛,唯一需要的文件就是 skill 点 md, 其他的不做任何要求,和 mcp 也不是一个维度的东西。 不过 skill 是 否能取代 m c p 呢?我认为是可以的,因为你可以把 m c p 服务中提供的工具通通放在 skill 的 目录下,并且在 skill 点 md 文件中说明是如何使用的,而且特别常用,通用的小工具未来通通都会内化在 a 帧的主程序中,所以目前看 skill 稍稍有些鸡肋。 不过拿 skill 和 m c p 比本身也不搭嘎,不是一个层次上的事,它其实更应该和这几个词作比较。那我把这个顺序成为从刚性到柔性,从稳定到变化, 它们的目标呢?其实都是一个需要多个阶段才能完成的任务,使用 linche 就是 纯编程的形式来实现,全是硬编码,虽然特别稳定,但是也失去了一定的柔性,很难包容一些小问题。而 workflow 只是把程序替换成了 d 代码的拖拽,相对改起来的容易一些。 呃, skill 就是 把 linchang 和 workflow 这种由程序控制的流程走向变成了由智能体自行控制, 但是呢,提前写好了一些说明文档和直接可运行的脚本存在一定灵活调整的空间,同时呢,又不至于变得特别不可控。而最后的纯 a 帧的形式最为柔性,因为它可以随时根据自己的判断进行调整流程,甚至需要的时候自己给自己生成个脚本来运行。 但同时这也造成了容易变得不可控,你不知道它中间会给自己写个什么脚本,把一个原本非常简单的任务变得非常复杂,所以这条线我认为是它们宏观上的一个区别。至于 skill 的 间接式批漏啊,按需加载啊,我认为只是它的一个特性而已,而这个特性也会在未来 token 变得越来越便宜之后变得有点鸡肋。 对于普通人来说, skill 兼顾着灵活性和稳定性,我认为呢,会逐渐淘汰掉 m c p 和 workflow。 m c p 就 像刚刚说的常用的工具,我认为会直接内化到 agent 的 主程序中,或者在未来的基础 skill 包中存在比较积累。 而 workflow 这种既不如 lincoln 一 样适合程序员,也不如 skill 这样更适合我们普通人,也属于一个比较鸡肋的存在。当然, skill 我 认为本身也是个中间产物,未来呢,一定会有更方便的形式出现,让所有人都可以很符合直觉的无脑使用。 然后我想再从最本质的角度说说这些技术,其实所有的这些技术最终还是离不开大模型和我们之间的提示词。 呃,这些技术呢,无非就是帮助我们自动地往提示词里面增加上下文信息,比如说 search, r a g, skill 等等,都是把一堆内容塞进了上下文,或者通过代理的形式帮助我们减少和上下文沟通的次数。 为什么开头我说 agent 呢?是所有不需要智能的地方构成的部分呢?就是说一个流程当中,所有能用固定的程序来解决而不需要问大模型的地方,就是 agent 的 发挥作用的地方。其实就是把模糊的分流逻辑交给大模型,根据语义识别出用户想做 a 还是 b, 把确定的分流逻辑交给程序,比如说 pdf 提取文本,那最终的目标都是节省人类的时间,降低人类的使用门槛罢了。 但是现在还有个最大的问题就是头盔实在是太贵了,越是强大的自己,能默默处理问题的 agent, 背后消耗的头盔就越大。但我觉得这在未来或许不是问题,因为头盔一定会越来越便宜,甚至等到什么时候,一个生产级别的大模型可以轻松部署在一台普普通通的电脑上的时候,头盔就相当于免费了。 由此我又想到了 java 领域的 spring boot 和 python 领域的 uv, 你 会发现这两者都是将开发者的便利完全放在第一位。什么运行速度快不快?包的体积大不大?是不是浪费内存空间或者磁盘空间?这些问题最终和使用的便利性相比,几乎都是瞬间被秒杀了。 程序员尚且这么怕麻烦,而在 agent 的 领域,我认为更是如此,因为他面向的是普通人,不可能让普通人去把什么 skill 放到指定的目录下去,配置什么 m c p 服务,甚至配置哪个大模型的 api key, 这些呢,都会被一个较为便利的产品淘汰掉,比如最近的 cloud bot 为什么这么火啊?除了一些营销因素以外, 难道它和 cloud code code x manage 这些 agent 有 什么本质区别吗?完全没有,就只是因为它能连接社交软件,能够配置定时任务,有个页面能看到 skill 并管理它们。第一次让普通人觉得它像一个智能体,而不只是躺在电脑上的一个服务了。 那未来究竟会是什么样呢?我认为只要是提供便利的方向就是趋势。比如未来我认为一定有一个打包好的超级 a 枕的配置好了,所有常用的 m、 c, p 啊、 skill 啊等等乱七八糟东西,甚至已经不叫这个名字了,普通人啥都不用,配置也能直接使用起来。 好了,本期视频就到这里,看在这么长的份上,能不能给我个三连呀?

live coding 的 时候 bug 超多,所以我就引用了这个 skill, 这个 skill 叫 superpowers, 在 github 上已经有四万星了,使用的方法非常简单,我就直接把这个链接丢给了 cloud code, 让他帮我安装一下这个 skill。 安装好了之后呢,我就让这个 skill 直接来读取我的这个项目文件夹,让他帮我去看里面有哪些 bug, 有 哪些问题,他马上就能给我扫描所有的文件,然后给我 检测出来的结果。这个结果看起来就很专业啊,反正起码比我这个文科生要专业很多。然后再让 cloud code 继续按照他帮我们列出来的这样的一些问题,逐个进行修复就可以了, 这样就能帮助我们这些文科生不懂代码的人超级快的把 back coding 的 代码质量做的更高,真的推荐大家可以尝试一下。 那今天就分享到这了,这周还会分享更多跟 webcoding 有 关的一些教程和视频,因为近期正在做很多 webcoding 的 项目,而且我们在本周五晚上也会有一场专门的闭门直播分享,有兴趣的朋友们欢迎直接评论区报名,记得一键三连,下期见!


阿斯顿马二零二六年一定会考来。同学们,考试大纲、考试题型,单选、双选和多选。这个知识点这么复杂吗?对,没错,那他因为里边包含了一些存在,哪些哪些可显示,哪些不可显示这些内容呢?是容易考单选,其中比较难的点是计算题。 怎么去计算呢?哎,已知某大写,让你求什么小写?同学们,记住老师上课讲的作弊法,只要让求大写字母,我们就从 a 六十五开始数。只要让求小写字母,我们直接从小 a 九十七开始数。同学们,这个方法掌握了吗?


improve cooking, scale improve 是改善提高的意思,就是把什么事呢做的更好。 cooking 是烹饪的意思啊,在这里他当做一个名词。 cook 是烹饪做饭的意思,他是动词。 cooking 就变成了名词。 skill 是技巧技能的意思。 improve cooking skill 就是提高自己的烹饪技能,简称,提高厨艺啊字母 i 的发音,发短音一一一字母 m 呢发嗯,字母 p 的发音,啪啪啪字母 i 呢发 这里的字母 o 呢啊,发的是长元音。呜啊发这个音。字母 v 呢发呜啊 字母 e 在这里不发音。为什么字母 e 在这不发音呢?因为,因为字母 v 啊,不能作为结尾的字母,所以这个字母 e 是来帮助字母 v 的,使得他能够结尾啊。 improve improve 啊!重读在第二个音节处。 improve! improve cooking! 字母 k 的发音字母 c 的发音咳咳咳。 两个字母 o 呢发短音呜呜呜字母 k 呢发咳咳咳。字母 i 发短音一一一这个 n g 呢? n g 呢?发的是后鼻音。嗯嗯嗯。 cooking cooking! 重读在在第一个音节处。 cooking! cooking skill 是技巧技能的意思, 发音,嘶字母 k 的发音。但是在读这个单词的时候呢,声音要浊化,浊化成了咯咯咯字母 i 呢发短音一一一两个字母 l 呢?它的发音,舌侧音,舌头上顶哦哦哦 scale scale scale! 来跟我读两遍。 improve improve cooking cooking! scale! scale!
