哈喽,大家好,我是 cooper, 今天依旧在学 ai, 不知道有没有谁跟我一样还搞不清楚,就是 ai 天天冒出来一些新的概念。对,今天其实我想搞明白的是 ai、 mcp 跟 skill 之间的区别。身为一个没有代码基础的文科生,那些小白其实我也看了很多那种科普博主的图解图啊,视频什么, 但就例如这种,但我觉得还是没有很清晰。今天精油跟那个 jimmy 对 话,我觉得做了一个大家绝对能理解的一个比喻啊,我觉得大家一次性就能搞懂。先说结论啊,我觉得 ai、 mcp 跟 skill 三者的比例相当于, agent 是 人, m c p 是 外语, skill 是, 其实是一个个那种外国的专家。对,我觉得 an agent 是 人这点很好理解,大家在于去利用大语言模型去把它当一个人去对待。对,也想把它当一个 ai 智能助手。 为什么需要外语跟外国专家呢?其实我们现在觉得 ai 很 厉害,但其实 ai 并不是万能的,他只是说看起来他进入一些模型,还进入一些这种大学训练,那大家觉得他什么都懂,但其实他有很多那种专业的东西,他只明白语言,或者他只是明白这个意思,他并不知道要去执行一些复杂专业的任务,所以他需要用 mcp 作为外语去跟其他软件 这样的外国专家去沟通。对,首先第一个可能比较反,我之前直觉的一个事情就是其实 ai 跟其他软件并不说一种语言, 就为什么会有一个外语的概念。就我在这里画一张图啊,可能 ai 是 中, ai 是 中间这个小男孩四个,这个框可能代表四个种专家,有的专家比如说是厨师,有的可能是工程师,有的是医生,有的可能甚至就比 ai 更专业的写代码,我们看起来也都是程序,他们可能都是一跟零那种东西组成,但其实他们之间的语言、语言、人类概念、元歧是不同的。 比如说 ai, 它是以程序化为基础,它里面讲的是相当于概率。对我们一般认知这种软件,例如什么 ppt 啊这种,它其实里面这个都是结构化代码,它们有行有列有指令。其实如果说你要去形容的话, ai 算是一个什么都略懂一点的人, 他最会的就是跟你对话,去理解你的需求,理解你的意思。但真的到执行非常复杂、专业跟锤炼的任务的时候,他真的也需要其他专家来去帮忙。就所以说我们经常在应用微软的,或者是一个表格、一个 ppt 等等, 你需要可能是调给他,你需要把整个文字都贴给他,这个就会很麻烦。但其实我们最终的目的是让他变成一个 agent 嘛, agent 就是 说他能自己完成这一些东西,所以才需要中间的 m c p 跟 skill 去去配合,一是说他不懂其他软件说的语言,二他需要跟其他软件去写作,去完成这个复杂的任务,就相当你要去跟一个外国人去写作。 所以这也是为什么 m c p 会诞生的原因。我们刚刚其实讲了, ai 跟 skill 之间,他一个可能相当于你,你可能什么都略懂一点,你知道要做饭了要去找厨师,你知道了家里可能水管坏了,要去找维修工,你知道生病了要去看医生, 或你知道电脑出问题了,你去找那个维修工,但他如果不懂,你没法跟他们沟通,所以说才会出现像 m c p 这样的东西,他的全称是一个中国人,你要跟一个德国的工程师去对话, 你们平时他也不会拒绝你需求,但因为你们俩其实说的不是一个语言,所以其实你们之间的沟通就会有隔阂,他不知道你要干什么,你也不知道怎么跟他下达指令,但由于你们俩可能从小在学校里学过一点英语,你们俩就能通过英语去沟通,所以其实 mcp 就是 这个计算机世界里的这种国际通用语,这英语你通过这样的 交流方式能够去找到这个专家,让他完成专业比较复杂的任务,所以这大概 agent mcp 跟 skill 一 些关系,我的理解,谢谢大家。
粉丝430获赞3286

大家好,今天聊一个 ai 圈最近特别火,但是百分之九十人还没有特别搞懂的话题, m c p 和 skills 到底有什么区别?这里是顽皮的程序员,我们先来一句话,定一个 m c p 就是 ai 的 手,负责摸外面的世界。 skills 就是 ai 的 技能书,教他怎么去干活。 你听起来像绕口令对吧?别急啊,咱们用人话一点点去拆解。 m c p 全名叫做 model context protocol, 翻译过来呢,就叫做模型上下文协议。 它是由 astronic 在 二零二四年底搞出来的一个开放标准,后来被 openai、 google, deepmind 都跟进了。它是干嘛用的?一句话就是说,能够让大模型连接到外部世界。你想,大模型本质上是一个闭门造车的学霸, 他只知道训练数据里边有什么,训练完一结束,他知识就冻住了。你问他今天上海天气是什么样,他只能说,我不知道,我只是个语言模型。 那有了 m c p 以后,大模型就像装上了一双手,或者说装上了眼镜,它完全可以干嘛?可以查一下数据库,可以调个 api, 可以 多部文件,甚至说给你发个邮件。那举个例子说,你帮我查一下最新的销售报告,帮我发给老板。 没有 m c p 的 模型会一脸懵,你为什么要让我干这个活呢?我也没有手,我也不会发邮件,对吧?当你有了 m c p, 它就会先调一个查询报告的工具, 拿到数据以后再调一个发邮件的工具搞定。所以 m c p 的 结构其实非常简单,你记住三个角色就可以了。第一个就是 m c p 的 主机 host, 也就是你平常用的这些 ai 应用,比如说 cloud, 比如说 chat、 gpt, 或者说 coser 这样的 ai 代码编辑器,用户在这提问模型在这思考。 第二个就是 m c p, 客户端 client, 那 藏在主机里边的翻译官负责把模型请求翻译成 m c p 格式,再把 m c p 的 回复翻译回来。 那第三个就是 mcp 的 服务端 server, 真正干活的那个工具仓库连着数据库,连着 api, 连着文件系统之类的。 那客户端要工具列表,他就把我能查天气,我能读 excel, 我 能发邮件,这些能力报上来,就像报菜名一样。那整个流程就变成 用户提问模型判断要不要调工具,要调就通过客户端问一下服务端你有啥工具,如果说找到这个工具的定义,然后就开始生成这个调用的指令,客户端负责执行完了就返回给模型,模型一下回答给你。 最奇妙的是什么呢?模型完全不知道 m c p 的 存在,他看到的就是一个工具名加参数,然后决定去用那个底层的那套客户端和服务端的复杂通讯,其实对模型来说是完全透明的 好, m c p 解决了连接的问题,但是光能摸,光能看外表还不够,比如说你让 ai 帮你分析一份财务报表,他只能说通过 m c p 连上数据库,把数据拉下来之后,看完,我们先看哪一列,我们怎么算利润,格式怎么写。这个时候你就想到了,是不是我们在招一些新员工进入公司的时候, 往往会给他一份员工手册,你在这个岗位上要做什么,怎么做,题都写在里边了,那这个时候这份手册就相当于 skills。 那 skills 本质上就是一段规则说明文档,或者说是流程知识,它并不是一个独立运行的程序,对吧?它是在教 ai 做事,遇到这种任务,按照这个步骤来的。这样的说明书, 那我们怎么来区分 m c p u 的 skills 呢?那我给你一张这个表,我帮你举个例子,可能你就记住了, 假设任务是帮我们分析公司上季度的销售数据,生成一份报告。 m c p 的 角色呢,是连接 e r p 系统,把销售数据拉回来。 那 scales 的 角色呢?是告诉 ai 先按地区分组,然后再横比分析它的增长率。最后呢,再用 swf 框架写一个总结,没有 m c p, ai 就 拿不到这个数据,没有 scales, ai 就 拿到了数据,也不知道怎么样了,是吧?当然,为什么要单独去做一个 scales? scales 有 两个杀手锏,第一个就是渐进式批录, ai 不 需要一次性的把所有知识都加载进来,用什么时候加载什么。比如说一个财务分析的 skill, 可能有一百页规则,但是用户只问了利率,那么 ai 就 只加载利率计算的那几段,节省 token, 节省成本。 第二个就是脚本执行, skills 可以 包含可执行代码。哇,这个是不是很爽?对于那些语言模型算的不准,但是程序可以算的准的任务,比如说你需要精确的数学计算,或者复杂的数据处理,或者说一些需要通过调接口才能完成的任务,比如说控制某一个硬件去做一个动作, 那么 skills 可以 直接去跑代码,不需要靠 token 去生成,这就超越了纯粹的大模型瞎猜的模式,它的结果将更稳定、更可靠,也更加地扩展了模型对外界的触达。 当然了,我们完全可以做一个实战对比。下边是之前宝玉老师他们做的一个实战对比,他们使用了 playright mcp 和 skill 加 cdp 脚本去做了一个测试,还会发现他们的总消耗大概从五万多 tokens 降到了几百 tokens, 那具体的差距一目了然。用 m c p 硬扛 ai, 需要一步步看,一步步想,一步步调用 skills, 这就是一把锁哈,效率完全差了几十倍,因为 skills 它更像一个 s o p。 当然了,最后我们一定会想问, m c p 和 skills 我 们到底怎么去用?或者说它俩应该怎么切磋?其实答案是两个都有用啊,它们需要各司其职。 skills 负责编码领域的知识,你们公司有一套特定的六个标准, z o p, 先查哪个系统,再查哪个系统,按什么顺序处理。这些就是 skills 写出来的,它让 ai 理解这个流程到底是什么。 那么 m c p 呢?提供的是连接能力,具体连接哪些系统能力,靠 m c p 服务端可以去提供这些能力。那么 打个比方, skills 是 菜谱告诉厨师需要先放葱姜蒜再下入,对吧?最后我们再勾芡一下,那么 m c p 就是 厨房里的燃气灶、冰箱、调味架,提供能开火、能取食材的能力。 光有菜谱没厨房,你完全做不了菜。光有厨房没有菜谱,厨师也不知道做什么,两层配合他们才能够轻松拿捏。 当然了,经过上年我们的介绍,大家一定已经知道了 skills 和 mcp 的 区别了,所以说以后看到 ai 产品说支持 mcp, 支持 skills 就 会一脸懵逼了。好,今天的奇怪的知识咱们就讲到这,大家欢迎在我的评论区多多交流。好,拜拜。

ai 领域的新名词,更新的比手机型号还快,前两天刚搞明白 m c p, 最近又出来一个 skills, 到底区别是什么? 一个例子你就能明白,比如你的任务是 ai 先帮你总结热点,再最终输出一个总结的 pdf。 那 么 skills 呢,就是一个完整的 sop, 它会告诉 ai 先需要做什么,再需要做什么。比如第一步是收集哪些平台的数据, 第二步呢,是按什么样的风格去进行汇总?第三步是整理为一个 pdf。 skills 会把整个流程都给写清楚, ai 会照着这个流程执行。 而 mcp 是 一个单点的技能的工具,比如收集 a 平台的数据是一个 mcp, 收集 b 平台的数据又是一个 mcp, 最后还需要一个 m c p 来实现总结 pdf。 所以 m c p 是 单点的,是一个一个的工具,是螺丝刀,是锤子,是扳手。而 skills 是 一个组合包,它会告诉 ai 这次任务需要依次使用哪些工具,就这么简单,还不懂的话,等我的保姆级实操教程。

最近, ai 工具调用领域正在上演一场特别有意思的权力交接。你可能会觉得 ai 不是 已经很强大了吗?但让 ai 真正动手干活而不是停留在聊天,一直是个大难题。过去被寄予厚望的一种叫做 m c p 的 解决方案,现在基本上已经被宣判死亡了。今天 我们就来聊聊,为什么那些大而全的工具平台会失败,而一种更轻更聪明的新玩法,又是如何成为 ai 调用工具的未来。咱们先说说这个已经过气的 m c p, 全称是多模态能力平台,听着很高大上,但你可以把它想象成一个臃肿的软件全家桶,一旦启动, 它就像一个永远在后台运行的插件,不管你用不用,它都在那站着你的电脑资源。它只解决了 ai 能不能调用工具的有无问题, 却完全没考虑好不好用和效率。相比之下,一个叫 skills 的 新概念就聪明多了。它本质上是把 ai 的 执行流程和用户的具体需求给拆开了。我们不再需要 ai 凭空发挥,我们需要它像个老员工一样, 拿着我们给的操作手册精准干活。你写好一份指导文档,告诉 ai 一 步一步该干嘛, ai 就 照着做。这种方式据说能把用户对提示词,也就是 prompt 的 依赖度降低一半以上,大大提高了任务的成功率。说到这,你可能会问,那是不是以后我们只要给 ai 写技能手册就行了?嗯, 理想很丰满,但现实很快就给 skills 泼了一盆冷水,它撞上了一堵叫生态碎片化的墙。现在的 skills 就 像一堆散落在各地的武功秘籍,虽然数量很多,但没有统一的新法。 最要命的是环境依赖。如果一个技能的实现绑定了开发者自己电脑上的某个特定文件路径,或者依赖某个特殊的运行脚本, 那换到你的电脑上大概率就跑不起来了。有数据显示,在非标准环境下,超过百分之六十的开源 skill 都没法第一时间跨平台运行。这就好比你拿到一份爵士食谱, 结果发现里面用的厨具全世界只有一套,就在作者自己家里。如果一个技能无法被附用,那它就只是开发者一个人的自嗨。面对 m c p 的 臃肿和 skills 的 混乱, 一家叫 infinity synapse 的 公司拿出了一个试图终结这场乱局的方案,叫做 command tool。 这个东西很有意思,它把工具、调用、规范和 skill 这三样东西打包成了一个新物种,你可以把它理解成是对我们传统电脑命令行的一次 ai 化大升级。 我们以前查命令怎么用,会输入 help 看帮助。现在它增加了一个 skill 参数,并且重新开发了一大批能被大模型高效识别和调用的新工具。最关键的是,它解决了资源消耗问题, 能渐进式加载,占用内存极低,而且完美兼容 windows、 mac 和 linux。 在 实际场景里, 你可以直接让 ai 改好它刚导出的 excel 文件,或者把一份报告一键转成 mp 三语音。这种端到端的自动化,彻底摆脱了对复杂环境的依赖。说白了, command two 的 思路不再是让 ai 去费劲地学习怎么用人类的旧工具, 而是为 ai 量身打造了一套它天生就能理解的新工具,这标志着 ai 正在从一个只会聊天的副驾驶 进化成一个自带工具箱的专业技工。 m c p 已死, command two 正在定义 ai 动手的正确姿势。那么, 在这一波工具调用浪潮的洗礼下,我们最应该记住什么呢?首先,笨重的 m c p 平台因为资源占用过高,正在被更灵活的方案取代。其次, skills 这个概念的核心是通过把专业知识文档化,大大降低了我们写 prompt 的 门槛, 提升了 ai 干活的稳定性。但是标准化是目前最大的瓶颈,各种环境依赖问题导致大量的 ai skills 成了难以分享的孤岛。最后,像 command two 这样的新趋势正在出现,它通过把工具规范和 skill 整合在一起, 实现了跨平台、低功耗的高效调用,标志着 ai 工具调用开始进入一个全新的标准化执行阶段。好了,今天的内容就聊到这里了,如果你觉得有帮助,记得点赞关注,我们下期再见!

想用 m c p 和 skills, 但是又被 cloud code 和 code x 的 命令行全退,今天介绍一个让小白也能玩转 ai 的 神器。 cherry studio, 免费开源,中文 下载就能用,不用配置任何环境,一个软件接入三百多个大模型, deepsea、 cloud gpt 随便切换,并且给你配置好了两个免费的大模型。现在 ai 圈里最火的 m c p 和 skills, 它也读知识,我们现在体验一下它的 m c p 功能。比如说装上这个内置的 m c p file system, ai 就 能读取和操作你的电脑上的文件。这里需要配置你要读取文件的目录,不过也可以不配置。但是后面在绘画中,你要说出文件的全部路径,保存安装 m c p。 比如我这里有一个 c s v 表格, 我就用这个 mcp 捕取文件,分析每个交易方共花了多少钱。设置 mcp 和要使用的模型,然后输入指令。从控制台看到它是调用 mcp 捕取文件内容,然后来计算结果,最后完美输出想要的结果。除了 mcp, 最近大火的 skills, terry studio 同样支持添加助手,添加 aint, 选择模型和工作目录。但是这里需要注意的是,目前 aint 功能只有支持 azure rapid 端点的模型可用。我使用的是月之暗面,现在各大模型厂商对于新人都有免费额度设置。完成 show skills, 这里会先去检查 cloud code 下面的 skills, 然后再去查找切尔斯基自己安装的 skills。 我 们这里声明, pdf artefact skills 创建一个内容随意的 pdf 文件,这里不知道是我使用的问题还是设计如此,需要你再输入一遍。 经过一系列操作输出的一个 pdf 文件,但是显然模型不太给力,居然是乱的。当然,大家可以使用内置 skill, skill creator 去创建一个属于自己的 skills。

ai 相关的概念层出不穷,比如说 r, e, g, m, c, p, prompt, scales, rolls, tools, 这些概念大家看起来都很像,自己知道它们是有区别的,但是又不明白区别到底在哪里,所以导致我们在使用 ai 或者说进行 a 准的开发的过程中,不知道自己应该加强哪一点的侧重的优化。 那今天这期视频就带你区分这几个概念,以及这几个概念具体都应该是侧重哪方面。首先我们先了解一下 prompt, 这个是最简单的了,就是我们在使用大模型进行对话的过程中,我们给他的提示词,这个提示词呢会给到大模型,也就是 l l m l l m 就是 large language model, 它就相当于是一个大脑,然后它会经过模型的一些思考给你返回出答案。第二个呢就是 rules, 这个呢就是一个大的规章,比如说我们在写代码的过程中需要定一个大的原则,比如说你不能随意删我的文件,在删之前你必须要经过我的确认,或者说哪些配置文件你是不能够修改的。 这些大的规章呢,作为它的一个总体的框架的约束,必须是在这个框架内进行,这就是一个 rules, 相当于你在一家公司,你要守这家公司的规章制度。 然后就是 toos, 我 们知道大模型呢,其实就是一个大脑,他只能够思考,但是他没有手脚,也就是说他不能够做一些事情,比如说你问他,我现在想点一份外卖,能不能帮我推荐一下并且下单,他能够给你推荐,但是呢大模型他不能帮你下单, 那这个 toos 就 相当于大脑之外的手和脚,大脑下达指令给这些 toos, 也就是让这些手脚帮你去做具体的事情,比如说帮你下单,比如说操作手机的相关的接口,然后录制屏幕 啊,并且呢接受你的确认,然后最终完成下单的这样一个过程。这就是 tos。 比如说稍后开发的朋友用到 ai 相关的模型呢,就是 spring ai 和 spring ai, 阿里巴巴还有 longchain four g, 这里边呢都有对应的。如何声明一个 tos 的 方法?比如说在一个方法上面加一个注解,然后给这个方法加上一些描述,这个方法具体功能的一些描述。那你在发起大模型调用的时候,把这些工具都调用到你的这个绘画中,他就会去思考,根据你提供的这些工具可以选择性的调用哪些方法。比如说 大模型它是不会计算的,它是只能够思考。如果说你给他定义了一个加法的这样一个函数,把它升为了一个 tos, 那 这样的话大模型就认识到你提供给我的有这样一个工具,那我就可以调用你的这个工具,其实就调用你的这个方法完成加法,并且给用户展示。那这个呢就是 tos, 你可以把它理解为一个人的手和脚,它是完成具体事情的最小的一个单元。然后就是 functions, 这个就是函数定义,比如说你想给当心提供一个工具,那你得告诉他这个工具应该怎么使用,也就是这个函数的一些定义信息。然后第三个呢就是 scales, 这是最近特别火的一个概念, 这个呢就是说把一系列的复杂的业务流程,把它整合成为一个功能包。我们如果说做一些简单的问答,直接问大冒险就可以了,或者说做一些简单的操作,用一些单一的工具就能够完成了。但是有一些复杂的业务流程,它是固化的,我们就可以把它抽象为一个功能的包,也就是技能包, 把这个技能包给到大模型,大模型会根据这个 scales 中的 markdown 文件,然后判断什么时候去加载这个 scales 包中的相关的 reference, 还有 size, 还有 scripts, 也就是资产引用和脚本,这些资产也好,这些脚本也好,是能够让大模型去调用的。大模型会根据你的要求,然后使用这个技能包中的指定的脚本。 比如说你封装了一系列图像处理相关的 python 脚本,那大模型知道你本次需求是要用到这样一个 scales, 那 他就会去这个 scales 的 包里找到对应的脚本,调用这些脚本完成你所交代的图像处理的任务。 所以说 skills 呢,它就是一个一整套的标准的工作流程。然后就是 mcp, 这个就相当于是一个协议。举个比较行的例子,比如说普通厂商生产的手机的接口都是不一样的,那如果说我买了一个手机,你买了一个手机,我们想要充电,我只能用我的充电口,我不能用你的充电口,因为两个手机的充电口协议不一样。现在安卓呢,就是统一了都用 type c 的 这个接口,就相当于统一了一个协议。 那在大模型里面呢? mcp 就是 这样一个身份,它是 iso 提出的一个通用协议,大家都按照这个协议开发自己的工具, 这样大家互相调用的时候就能够实现一个适配。原来可能是十个厂商分别提供了自己的一个工具,这些工具呢需要互相的调用,那十个厂商分别要和另外的九个厂商分别都要建立这种协议的适配,那这样的话就会很复杂,对于各个厂商来讲都是成本和负担很大的。 但是如果说现在有了这 m、 c、 p, 那 十个厂商都按照这个标准来开发,那标准是一样的,大家在开发和调用的过程中就能够实现完全的一致。再有就是 r a g 解锁增强生成, 你看他的名字就体现了他是用来解锁相关的数据,并且增强生成文本的能力的这样一个工具。我们知道大模型他在训练的过程中是需要一些数据的,但是这些数据他不可能实时更新。 比如说训练好了一个大模型,然后你要用这个大模型去解锁你自己公司的一些业务信息,或者说内部文件信息,那大模型在训练的时候其实是没有拿到你这部分私有的数据的。那这个时候怎么办? 我们就可以通过这个 r、 e、 g 把我们内部的资料,内部的数据,我们私有的这些数据,把它通过项链化的形式存储到数据库里。然后用户在向大部行提问的时候,首先会把用户的问题先转化成为项链,然后去项链库中和你保存的那些公司内部的文件,他们对应的项链进行一个相似度的解锁, 比如说用户的问题是什么最好吃,然后在此之前呢,你往数据库中插入的数据呢?包含了什么最美味这样一个问题,以及对应的答案。 用户的问题和数据库中这段话,他俩的向量的相似度就会很高,这样的话就会通过解锁的方式,把相关的文本从向量数据库中解锁出来,然后把用户的问题和从数据库中解锁出来,相关度最高的这些数据一并给到大模型,然后大模型再给予这些数据给出回复, 这样的话就能够实现实时的查询你给他提供的这些数据,根据这些数据回答你的问题。然后就是几个概念在几个维度上的对比,算是一个总结吧。 prompt, 它就是一段指令,你告诉 ai 当下做什么,它就给你对应的回复。 rose 呢,就是规定一个边界,你做什么事情都不要超过这个大的框架,大的限制,就像公司的规章制度一样。 toast 呢,就是我们大脑之外的手和脚,大脑发出指令,让这些手脚去做具体的事情,比如说帮我们点外卖方式呢,就是帮助大模型理解 toast 是 在什么时候被调用,它就是对于函数的这样一个定义。 再一个就 scales 就是 封装了一系列复杂的业务流程,这些业务流程是被固化了的,也可能是提供了一些比较针对性的技能包,可能是一些脚本,可能是一些引用,可能是一些资产,比如说一些前端开发的相关的 scale, 它里面会封装一些前端优化的技巧,或者说提示词,或者说图片,或者说一些脚本, 然后用这个 skills 呢,就能极大地增强你的大语言模型处理你具体的这个 scale 对 应的问题的能力。然后就是 m c p, 这个解决的就是大模型的工具之间互相调用,或者 a 阵的之间互相调用,它们要遵守一个相同的协议,这样的话就能够统一标准,极大地降低了调用方和被调用方之间沟通和开发的成本。 再就是二 a j 解决私有领域知识不能够被大模型了解的这样一个问题,你可以把你私有领域的知识向量化存储到向量化数据库中,然后在向大模型提问之前,先去这个数据库中查找和问题相关的数据,然后把相关的数据和你 用户提出的问题一并交给大元模型,然后让他给出你回复。下面是这几个概念之间的关系图,大家可以了解一下。比如说这个 scale, 它就是一个整个的流程,这工具呢就是最小的执行单元, scale 呢就封装了这个流程,并且在里面写好了在什么情况会调用什么工具的这样的提示词。再就是刚才提到的 m c p, 它解决的就是接口一致的这样一个问题。我是不吃辣的 chris, 关注我,带你了解更多 ai 相关的开源项目和知识。

m c p 让 ai 能拿到数据, skills 让 ai 知道拿到数据以后该怎么做。 skills 直接把 ai 的 用法从会聊天推到了会,照章办事。二零二五年十月十六日, anastropy 发了一个东西,叫 agent skills。 二零二五年十二月十八日,又把它做成了开放标准,可以跨平台赋用,一分钟搞清楚。 skills 最早的 ai 像个聪明大脑,但没手没脚。你问他今天星期几,他不知道你要他做跟现实相关的事,只能狂塞提示词,把前因后果全讲一遍。然后到了二零二三年前后,大家给 ai 装手, 也就是工具调用。 ai 可以 去掉天气、调日历、调数据库。问题是工具越来越多,几千上万种怎么管?于是 m c p 来了。只要按 m c p 标准接入 ai, 就 能更顺地拿数据。 但注意,拿到数据不等于会干活,你给他订单数据,他可能不会按你公司规则写周报,你给他会议录音,他可能总结得像小学生作文。这就是 skills 出场的理由。他不是知识库, 它更像员工手册。 s o p 关键机制只有五个字,渐进式批录。什么意思?就像新员工入职,先看目录,再翻对应章节,不用一上来就从头到尾看完。 skills 的 结构就三层,第一层,目录层, 只有名称和描述,永远清亮可见。第二层,指令层,真正的 skill 点 m d 只有被选中才加载。第三层,资源层,要么按条件加载参考资料,要么直接跑脚本。 比如你做会议总结, skill 规则写好,必须输出参会人员议题决定。这时候 ai 就 不需要你每次复制那一长串格式,要求它自己会照章办事。 比如财务合规,你单独放一个集团财务手册,里面写住宿补贴每晚五百元,餐饮人均三百元。 skill 里规定,只有当会议提到预算采购费用,才允许加载这份手册。 于是当有人说定六百元一晚的酒店, ai 会自动提醒超标该找谁审批。如果不提钱,这份手册就安静躺着,连一个 tock 都不浪费。 还有第三层里的脚本,你可以放一个脚本,让 ai 把总结同步到服务器。脚本只是执行,不是阅读,哪怕你脚本写一万行,复杂逻辑对上下文占用也接近零。这就叫既专业又稳定,还省资源。 所以 skills 让 ai 从会说变成按规矩做,它把经验从你脑子里抽出来,变成可以复制,可以组合、可以交付的能力模块。那我们普通人机会在哪儿?第一,把你的工作方法封装成 skills, 合同审核清单、报价、话术投放、复盘框架、客服安抚流程等等都可以打包成 skills。 第二,用 skills 拼一个专家团,报表分析 skill、 爆款文案 skill、 健康管理 skill 等等,下载即用。你一个人就是一个团队。你回想一下你工作里有没有那种每次都要重复讲一遍的规则,这就是最适合做成 skill 的 东西。

你好,我是陈博士。 ai 能力其实分三层,你用对了吗?你知道吗?百分之七十的企业 ai 项目失败,根本不是模型不行,而是工具太乱,集成太复杂,光靠调一个函数,根本扛不住真实业务的千变万化。方身靠,就像 ai 的 手指,能执行具体动作, 比如把摄氏度转成华氏度,或者解析一段 json, 但它只会动手不会动脑,更别说规划复杂任务了。而 skills 就 聪明多了,它属于认知层,你可以把它理解成一套 ai 教程,比如写个 sales analysis 技能, 就能让 ai 自动完成客户分层、趋势判断这些专业活,而且还能复用。说到连接外部系统,就得提 mcp 了, 这是 antropic 在 二零二四年开源的新标准,相当于 ai 世界的 usb c 接口。不管是数据库、 crm 还是内部 api, mcp 都能统一接入,省得你到处写适配器。举个真实例子, 生成一份销售报告, mcp 先连上 salesforce 和 postgrads q。 skills 定义好分析逻辑,比如找出上季度高流失风险客户,然后方生靠再去执行具体的查询和格式转换,各司其职,配合得天衣无缝。 别小看 skills dot m, 它可不是普通文档,而是代言数据的智能说明书。比如 code review, 这个技能会明确写清楚,先做安全扫描,再查性能瓶颈,最后只允许调用 read file 工具读代码, 既规范又安全。有意思的是,正确用 m c p 反而能省头肯。传统做法是把整张数据库表塞进提示词,现在 m c p 只传个 ui, ai 按需加载数据, 实测下来, token 消耗直接降了百分之四十到百分之七十,省钱又高效。这三层不是谁替代谁,而是互补协助。 function call 负责动手, skills 提供思考框架, m c p 搞定连接世界,三者合起来,才能搭出真正靠谱的企业级 ai 底座。总结一下, function call, skills 和 mcp 分 别对应执行认知和连接,建议你从一个高频重复任务开始,比如周报生成,先用 skills 封装流程,再通过 mcp 连上真实数据源,让 ai 真正为你打工而不是添乱。

欢迎收听我们的节目。今天呢,咱们来深入聊聊 ai 领域里三个你可能经常听到,但又觉得有点绕的词, r a、 g、 m c p 和 skills。 嗯,你可能在各种技术文章里看到过这些缩写, 感觉他们好像都在解决 ai 的 问题,但具体谁是谁,谁干什么,哎,很容易就混了。对,所以我们今天的任务很简单,就是帮你把这三者彻底捋清楚, 他们各自是什么,解决了什么核心痛点,以及那个最重要的,他们怎么像乐高积木一样组合起来,搭建出更强大的智能体,也就是 agent。 嗯, 没错,咱们的目标就是在接下来的十几分钟里,让你从听过这几个词变成能跟别人讲明白这几个词。太好了,我们会基于你提供的这些技术文档和行业分析,帮你搞清楚它们各自的原理、 最适合的使用场景,以及它们协同作战时能爆发出多大的能量。咱们不讲空话,只聊干货。好,那就把这些资料想象成一张地图,我们现在就出发,看看这几条技术路线到底通向哪里。 嗯,咱们先从最出名的 r a g 开始吧。全称是解说增强生成, 听起来特别学术,但都说它像是给 ai 办了张开卷考试的准考证。这个比喻我觉得非常贴切。你想想啊,大模型本身像个学识渊博,但记忆停留在几年前的学生。嗯, 而且他还有个毛病,喜欢脑补,也就是我们经常说的那个幻觉。对,一本正经的胡说八道。对, r a g 的 核心就是不让他硬背了,而是在他旁边放了一个巨大的实时更新的绝对权威的参考资料, 这就是开卷考试的精髓。别自己瞎猜,去查资料有意思,但这个开卷具体是怎么操作的? 总不能是把几百个 pdf 直接扔给模型让他自己看吧?那不得看于我?当然不是, 它背后有一套很精密的流程。简单说,分五步,第一步叫缩影构建,嗯,就是把你的资料库,比如公司所有的产品手册、规章制度全部分解,切成一个小段落,先拆解对,然后第二步,向量转化。这一步很关键, 他用一个模型把这些文本段落翻译成机器能懂的数学语言,也就是向量,等一下,我打断一下。 所以向量转化的本质就是把人类的语言变成像地图坐标一样的东西,这样机器才能计算。那两段话在意思上离得更近呢。你总结的太到位了,完全正确。 有了坐标才能进行第三步,检测。发现明白了,当你的问题寄来后,系统也把它变成一个坐标,然后在数据库里用雷达扫一下,找到和它意思上最接近的几个文本段落的坐标哦。第四步,上下文注入, 就是把检测到的这几段参考资料和你最初的问题一起打包围给大模型。我明白了, 最后一步就是让大模型拿着这份小抄来回答我的问题。对,这就是第五步,生成响应。因为有了这些真实准确的参考信息,模型胡说八道的概率就大大降低了,他被铆定在了事实之上。等一下, 这里有个问题,如果 a r g 只是从资料库里检测,那它会不会抄错书?嗯,比如我的问题有点模糊,它检测到了一个不那么相关的短路,然后基于这个错误的上下文,一本正经的胡说八道。 这个检测的准确率有多高,这是个非常好的问题,也正是 a 二 g 在 实践中核心难点之一。你说的没错,检测的质量直接决定了最终答案的质量是吧?如果小抄抄错了,那考试肯定得不了高分。 现在业界的解决方案呢,一方面是优化文档切分和向量化的模型,让坐标打得更准。嗯, 另一方面也会用一些重排,就是 re ranking 模型,在检测出的结果里再做一轮筛选,确保提供给大模型的都是最相关的材料。 它不是完美的,但已经比让模型凭空想象要可靠得多。了解了,那除了减少幻觉,它对于企业来说还有什么特别吸引人的地方吗?当然,这也是它为什么这么火的原因。 首先是时效性,知识库,可以随时更新模型,就能知道昨天宣纸上一秒发生的事儿,这个很关键。其次是成本,更新文档比花几百万美元重新训练一个大模型,那简直是便宜到家了。嗯,还有就是安全和溯源, 你可以做精细的权限控制,说白了,销售部门的人就查不到财务部门的敏感数据。 而且 ai 给出的每个答案后面都能附上来缘连接告诉你,这话是根据这份文档第五页说的,你可以自己点回去看。哦。这个好对, 这在医疗、法律这些严肃的领域尤其重要。所以 r a g 像是给 ai 配备了一个超级外接硬盘,里面装满了实时随时能查资料, 但这好像只解决了读和知的问题。没错,如果我想让 ai 做点什么,比如帮我定个会议室,或者查一下最新的库存,这个外界硬盘就不够用了吧?这就引出了 m c p 吗?完全正确,你的思路非常清晰。 r a g。 解决了博学的问题,但 ai 还是个书呆子,没法跟现实世界互动。 m c p, 也就是魔情上下文件协议,就是要解决这个能干的问题, 他要做的就是给 ai 装上标准化的手和脚。这就是那个被称为 ai 界的 usb c 的 协议。对,你可以想象,在 mcp 出现之前,你想让 ai 连接你的日历,得写一个专门的连接器。想连接公司的数据库,又得写一个。 想连接天气, a p i。 还得写一个。哦,我懂了,每个模型和每个工具之间都要单独适配,这就是个 n 叉叉的异梦。我懂了,像我家那个抽屉,二零零五年的时候装满了诺基亚、莫陀罗拉各种奇形怪状的充电器, 简直是灾难。对对对,就是那个感觉。 m c p。 也就是要统一这个标准,那它是怎么运作的? 它定义了一个很聪明的架构,有三个决策。 host, 就是 你用的 ai 应用。嗯, server 代表外部的工具,比如你的文件系统,或者一个 api。 最关键的是中间的 client, 它像个翻译官, 把 ai 的 想法翻译成标准的 mcp 指令发给 server。 哦,这样一来,工具开发者只要开发一个标准的 server 接口,就能接入所有支持 mcp 的 ai, 不用再为每个 ai 单独开发了,彻底解放了生反利。这个架构很清晰,那通过这个 usb c 接口, ai 到底能获得哪些具体的能力呢? m c p。 定义了三种基本能力,或者叫源语。第一种叫资源, 这是只读的数据,比如提取一个文件的内容,获取数据库的结构。好的。第二种叫工具, 这是改变世界的关键,它是可执行的动作,比如 send email, create calendar, event, delete file。 啊,这个厉害。对,这让 ai 第一次有了对物理世界或数字世界产生影响的能力。 第三种叫提示词,就是一些预设好的模板,引导模型在特定场景下更好地使用工具,比如一个专门用来写 s q l 查询的模板。好的,现在我们有 r a g 提供知识, m c p 提供了连接世界的插座和可以操作的工具。 但我感觉还缺了点什么。嗯,就好像我给了你一个装满顶级厨具的厨房,也告诉了你所有食材在哪,但如果你不会做菜,还是只能干瞪眼, skills 是 不是就是那本菜谱?这个比喻不能更精准了。正是如此, skills 可以 被理解为智能皮的大脑皮层,或者行动预案。大脑皮层对 m c p 解决了如何够得着外部世界的问题,给了 ai 手和脚。 而 skills 解决的是在特定场景下如何聪明地、有步骤地使用这些工具。它给了 ai 一个专业的大脑,能不能用一个具体的例子来说,这个大脑是怎么指挥手脚的?当然,我们想象一个嫉妒财报分析的 skill, 这个 skill 内部可不只是简单调用一个数据库查询工具。嗯,它封装了一整套专家的工作流程。 比如他会告诉 ai, 第一步通过 m c p 调用 query database 工具获取过去三个月的销售额和成本数据。好的第二步,拿到数据后不是直接展示,而是要计算毛利率和同比上升率。 第三步,如果发现毛利率低于某个余值,就要自动触发另一个 m c p 工具,去查询具体是哪个产品的成本出了问题, wow 最后把所有分析结果用一个预设好的模板生成一份报告。我明白了, skill 本身不是工具,而是使用工具的智慧和流程。它把连接性,也就是 connectivity 和能力 capability 分 开了。对,但这里有个很实际的问题,我马上就想到了, 你说一个大棋列里可能有成百上千个工具对应着上百个 skill。 难道每次我问 ai 一个问题,它都要把这几百本菜谱的说明书都读一遍吗?那上下文窗口肯定当场就爆炸了。这正是 skill 结构最巧妙的设计, 它引入了一个叫渐近式加载 progressive disclosure 的 概念。渐近式加载?你说得没错,把所有东西都塞进提示词是行不通的。 所以 ai 一 开始只会看到一个非常轻量级的技能,情感可能就是一行村的描述,比如财务分析、小手预测,代码重构。嗯, 当你的问题是分析一下上个月的业绩, ai 通过语义米配识别出。哦,这事归财务分析这个 skill 管,然后也只有在这时,它才会动态地去加载财务分析这个 skill 背后所有的详细信息, 比如它能调用哪些数据库,具体的业务规则、代码事例等等。哦,明白了,按需加载。对,这样就极大地节省了宝贵的上下文空间。好了,这三个概念我们都拆开看过了, 现在我们把它们并排放在一起,做一个正面的比较。如果我现在就要开发一个 ai 应用,我该怎么判断在哪个环节,用哪个技术? 我们可以画一张简单的对比表,从核心目的上看, r a g 是 为了知识补充,让 ai 言之有物。不瞎说。对, m c p 是 为了标准化交互,让 ai 能连接万物,能动手。 而 skill 呢,是为了封装领域逻辑,让 ai 做事儿专业有章法。它们处理的数据类型也完全不同吧。没错,数据类型上, r a g。 最擅长的是非结构化的文档,比如 pdf, word。 m c p 针对的是实时结构化的动态数据,比如 api 返回的 jason 数据库里的一行行记录。嗯, 而 skill 呢,它处理的不是数据,而是流程和规则,更像是一段代码或者一个决策树。那交互的性质上呢?交互性质上, r a g。 是 被动的,只读鉴错啊,它只负责查资料、 查资料。 m c p 是 双向的读写、交互和执行,既能读数据,也能发邮件、下订单。而 skill 则是更高维度的逻辑编排,它是指挥官, 指挥着 m c p。 的 工具们去完成一个复杂的任务。这么说我就清楚了,说白了, r a g。 是 查手册, m c p 是 用工具, skill 是 按图纸施工。这个比喻好,那在实际的复杂应用里,它们肯定不是三选一,而是要协通作战。 我们来走一个真实世界的场景吧,比如一个企业的智能客服,我作为用户,一步步跟他互动,看看这三者是怎么配合的好,这个例子能把他们的关系展现的淋漓尽致。你来扮演用户, ok, 我 先问一个简单的问题,你们公司的退货政策是什么? 这时系统后台会立刻启动 r a g, 它会在知识库里查找包含退货政策的官方文档,找到最相关的段落,然后用大模型生成一段通顺准确的回答,甚至在最后附上政策原文的联结 了解。这是典型的静态知识查询。对,好的,我问,帮我查一下我的订单幺二三四五的物流状态。 这个问题知识库里肯定没有完全正确。这时系统会识别出这是一个需要实时数据的请求, 它会通过 m c p 协议调用一个已经封装好的 get logistic status 工具。嗯,这个工具会带着订单号幺二三四五去请求物流公司的 api, 拿到实时数据后返回给你。您的报果已于今天上午十点到达 x x 中转中心, 这是动态数据的交互。明白了,现在情况升级了。我说我收到的商品是坏的,我要投诉并且申请补偿。这就复杂了,不是简单查一下或者调用一个 api 就 能搞定的。对,这正是 skill 登场的时候,系统会激活一个叫售后争议处理的 skill。 一个 skill? 对, 这个 skill 就 像一个内置的 sop, 就是 标准作业程序,它会引导 ai 按照预设的公司流程一步步地往下走。首先,它可能会调用一个 mcp 工具,要求你上传商品破损的照片。 嗯,然后它会调用另一个 mcp 工具去后台查询你的客户等级。最后,根据照片和客户等级,它会计算出一个补偿方案, 并在征得你同意后,再调用一个 m c p 工具去执行退款操作。哇!整个过程, skill 就 像一个总导演,确保了所有操作既高效又完全符合公司的业务规定。这个例子太棒了! rag 是 客服的知识库, m c p 是 客服的操作系统和各种软件, skill 则是金牌客服的工作手册和应急预案。总结得很好, 而且还有一个更高级的玩法啊。对于那些有成百上千个工具的大企业,你可以把所有 m c p 工具的功能描述。比如这个工具可以查询销售数据, 全部存入 m c p 的 向量数据库。嗯,当用户提出一个模糊请求,比如看看上个月卖得怎么样。系统,先用 reg 在 海量的工具啊,先用 reg 找工具。对, 然后他只把这几个被选中的工具的详细信息放入提示词。这种 reg over mcp 的 混合架构,让智能体在拥有海量能力的同时又保持了高效。这种能力组合听起来非常强大,但反过来说,也可能很危险。 一个 ai 不 小心把 m c p 工具把公司数据库给删了怎么办?这些技术的安全问题是怎么考虑的?这是决定这些技术能否真正落地的关键。问得非常好,它们的风险点各不同。 reg 的 风险主要是数据越全,访问越全。对,也就是不该看的人看到了。 解决方案,就是在解锁层面就做好严格的权限过滤,确保 ai 的 眼睛也被权限系统管着。明白了,从源头上就卡住。那 m c p 呢? 他可是能直接动手的。 m c p 的 风险更直接在于执行破坏性操作。所以 m c p 规范里有几条红线, 第一,任何有副作用的工具,比如删除数据,花钱,都必须得到用户的显示同意,必须人来确认。对,比如弹出一个确认框,让你点确定。第二,必须遵循最小特权原则,一个只需要读数据的工具,就绝不能给他写入的权限。好的, 那作为总导演的 skill 呢?它的风险在哪里? skill 的 风险在于业务逻辑错误,这个可能会造成巨大的经济损失。嗯, 有道理,比如退款,逻辑写错了,给所有用户都退了双倍的钱。所以对 skill 的 治理更像是传统的软件工程, 你需要有版本控制,需要有严格的测试,需要有确定性的校验,以及当它出错时能有人工介入的反馈和修正极致。所以, r a g m c p 和 skills 根本不是竞争关系, 而是一个层层递进、协同工作的架构,共同构建出一个更强大也更安全的智能体。完全正确。 最后,我们可以用一个汽车的比喻来总结这一切。我基础大模型是那台马力强劲的引擎,引擎 r a g 是 装满了全球知识的油箱。嗯,知识储备。 m c p 就 像是转动轴和车轮,让引擎的动力能真正传递到地面,与世界发生交互。这个比喻好。而 skill 就是 最关键的方向盘和哪导航系统, 他指导着这辆车到底要去哪里,以及如何安全高效地到达目的地。好,用汽车,这个比喻就清楚多了。 那对于正在开发 ai 应用的你来说,就意味着不能只降着把引擎马力做大,而是要考虑如何设计好拿导航系统和车轮,让它真的能开起来,开对路就是这个道理。好了, 今天的探讨信息量很大,但希望你现在已经对 r a g, m c p 和 skills 有 了一个全新的体系化的认识。 在结束之前,我们想留给你一个值得思考的问题。嗯,我们今天讨论的都是如何让人工智能去使用我们预先定义好的工具和知识。对,都是我们给他的。那请你想象一下未来, 当一个智能体在执行任务时,发现他的 r a g。 知识库里缺少某个关键信息, 比如,他不知道一款新产品的最新技术参数。嗯,他有没有可能自主地决定启动一个基于 m c p。 的 网络爬床工具,自己去官方网站上抓取最新的信息,然后自动处理向量化并更新到他自己的 r a g。 知识库里,以便下次使用。这意味着 我们正在从构建被动响应的模式走向设计能够主动学习和自我扩展的智能体。一个能自己决定去学什么以及怎么学的系统会给我们的世界带来怎样的变化?这个问题留给你慢慢思。

哎呀,我发现啊,最近 mcp 不 火了啊, sux 啊,现在越来越火了。然后呢,就是赶紧研究研究吧。我最近呢就在研究 sux 啊,就是你在用大模型这个编程工具在写代码的时候, 里面啊,就是有些重复的事情,有些这个 api 接口调用的方式,对吧?你如果不写点例子或者给他说清楚,他可能就乱写了。 然后 scuse 呢,就是能够把这些技能给它封装起来,做成一个个文档啊,放到一个个文件夹里面。当这个编程工具在写代码的过程中,他会扫一眼这个目录里面啊,有什么技能,有的话拿来直接用, 大概就是这意思。然后呢,我正在尝试用 ai 去写四 q 啊,就是你在做项目的过程中,重复能用到的这些功能技能,都把它封装成四 q, 你 可以把这段代码这些文件 扔给 ai, 让它把它封装成四 q, 它就会自动生成一个这个技能的文件夹啊,把文档呀,代码啊,粒子啊全都生成完,我觉得挺不错,可以尝试一下。

agent skill 能替代 mcp 吗?一个视频给大家说明白啊。咱们先说什么是 mcp, 我 举个例子啊,比如我现在开发了一个旅游出行智能体啊,我要实现查询路线,查询天气的功能,怎么做呢 啊?传统的方法就是我可以调百度地图,高德地图的接口啊,然后把这些接口呢封装成一个我的智能体的工具,那这样功能就实现了 啊。但是问题又来了,我这一个系统我得调很多的接口,比如获取新闻的接口,自然灾害预警、景区关门停业信息啊等等啊,每一个接口我都要开发一个工具,这太麻烦, 而且市面上也不止我这一个系统啊,每个系统都用这些功能,都需要开发自己的工具,那这样大家都麻烦,这时候 m c p 出现了啊, m c p 呢,叫模型上下文协议 功能,简单说就是就以前我获取这个天气信息,我需要调接口,以后呢,我就用高德百度的 m c p 就 行了啊。 m c p 和这个传统调接口的方式对比呢,就是配置简单了,代码减少了,甚至不用代码也能用了啊, m c p 就 这么简单啊,所以朋友们, 你要是扣字眼的话,什么模型啊,上下文啊,什么协议啊,那就容易蒙啊。但是你只要记住一句话, m c p 就是 让智能体更方便的调用第三方工具就完事了,就这么简单。好,那大家知道什么是 m c p 了,然后咱们再说 agent skill 啊,还是用这个旅游出行智能体这个例子。那我现在开发这个智能体一段时间之后呢,我发现系统功能越来越多,工具也越来越多, 那介绍工具的文档就越来越多呀啊,文档它是占用大模型上下文的,上下文太多,它就影响智能体的智商,就甚至有的时候这个智能体都蒙了,我说该掉哪个工具啊,他自己都不知道了。那这个时候 a j 的 skill 又出现了 啊,用户呢,就不用写那么多的工具来完成任务,而是把这些任务放到一个个 skill 的 目录里面啊。那这个 skill 呢,可以自己写,也可以复制第三方的,拿过来就能用,特别简单。 那我前两期视频讲了这个 agent skill 的 基本概念和用法,大家感兴趣可以上我前两期视频看看啊。总之就是 agent skill 和传统的智能体工具对比,上下文也减少了,性能也提升了,准确度也高了,功能也扩展了啊,反正就是厉害 啊。那这个 agent skill 能替代 mcp 吗?那刚才咱也说了, mcp 是 为了更方便地调用第三方的工具,而 agent skill 它目前主要优化的是本地的工具, 所以它俩现在干的不是一个活啊,就没法替代,最多也就是互补。第三方的工具呢,交给 m c p, 本地的工具呢,交给 agent skill 来调用啊,或者说是直接把工具写到这个 agent skill 里面。所以现在呢,就二零二六年一月份, agent skill 还不能替代 m c p, 但是未来 不好说。如果大家都觉得这个 skill 太好用了啊,改成提供 skill 的 服务了, 那就可能替代啊,就比如高德地图啊,百度地图啊,他们在自己的官网上发了一个打包好的 skill 目录啊,大家只要拷贝到自己的项目里啊,复制粘贴啊就能用,那这样 skill 不 就把 mcp 给替代了吗? 啊,所以能不能替代它其实不是一个技术问题,主要还是看第三方应用支不支持,支持就能替代啊,不知道大家感觉以后这个 skill 能不能替代 mcp 呢?啊,我感觉有一些希望啊。 那这个就是 m c p 和 skill 的 关系。那今天咱们就聊到这,下期视频我再说说 ai 编程啊, web coding 的 内容,大家感兴趣的话可以关注一下啊,我是小周,咱们下期再见。

今天用三分钟彻底给你讲明白 ai 圈最火的四个词, agent、 tools、 m c p、 skills。 它们到底啥关系?解决了啥问题?先说 agent 这词儿,在大模型火之前就有了,那时候它就是个自动化执行器,比如数据爬虫,人把规则想好、写好,他去执行。再比如股票挂单,设好二十三块买 二十五块麦,它自动操作,核心就是人思考 a 整执行。但大模型出现后,情况变了,大模型擅长啥?擅长思考、理解语意、拆解问题,但它不擅长啥, 不擅长计算和具体执行。于是,一个大胆的想法就来了,能不能让大模型自己思考,自己定规则,自己执行,这就是自主智能体的愿景。但问题来了,思考和执行之间有道红沟,怎么跨过去? 这就引出了 tools, 也叫 function call, 你 可以把它理解成大模型,调用外部工具的标准 api 接口。比如让大模型去搜索、查天气、写代码,都通过这个接口。 但新问题又来了,现在大模型太多了, gpt 文心一言通一千,问豆包工具也一大堆,搜索、日历、翻译。如果每个工具都要为每个大模型单独适配一次,那得适配到猴年马月,太乱了。 于是,救星来了, m c p, 你 可以把它想象成一个万能转换插头,或者叫大模型的 usb 减 c 接口。它站在中间,跟所有工具说,你们都按我的格式来输出。再跟所有大模型说,你们都按我的规则来调用。 这样一来,一个工具只要适配一次 m c p, 所有兼容 m c p 的 大模型就都能用了,极大简化了生态。最后说 skills 这玩意儿最像新人培训手册,大模型就像个啥都懂点儿但没具体经验的实习生。 skills 就是 教他具体怎么干活的操作指南, 比如如何砍树。这个 skill 里面会写,第一步用斧头锯,第三步用绳子拉倒 大模型看了简介觉得对,就是我要干的活才会深入去看第一步,然后通过 m c p 调用斧头工具看完第一步,再看第二步,调用句子。 这就是渐进式批录,需要哪部看哪部,不用一股脑把所有步骤和工具都塞进上下文,避免信息爆炸。所以一个完整的智能体就是大模型大脑 通过 m c p 万能接口调用各种工具手脚,并参考 skills 说明书来一步步完成任务。这下彻底明白了吧,记得点赞关注哦!

m c p、 skills、 sub agents、 cloud、 ai 的 这些新概念有没有把你绕晕?别急,一个视频带你理顺它们的核心用途和区别,让你使用 ai 更高效更省 tool。 我 们先来看一张图, 如上图所示, m c p 负责发工具,它让 ai 能碰到外部系统。比如读数据库叫 api, 这是给 ai 发工具。 skills 负责用工具,它告诉 ai 拿到数据后该怎么用,比如怎么算增长率,怎么生成报告,这是教 ai 怎么用工具。 skills 和 m c p 这两者是配合关系,那三百 h 原子又是什么?简单说就是派人干活, 遇到审查整个代码库这种耗时的大活,别占用当前对话,派克萨姆 a 剪子去新绘画里跑,跑完只把结果带回来。那重点来了,为什么 skills 比 mcp 更火呢?关键原因在于 touke。 mcp 就 像把工具全挂在身上,比如一个 github 的 mcp 预加载就要吃掉几万, touke 太贵了。 而 skills 是 按需加载,平时只记个目录,用的时候才读取详细内容,门槛极低。 最后送大家一张选型心法,一次性任务用 prompts, 重复工作流用 skills 要连外部数据加 m c p 复杂独立任务派 sub agents 关注我,解锁更多实战技术干货!