好,咱们来聊聊 m c p 和 agent skill, 它俩听着挺像,那到底有啥不一样呢?很多人可能都有点搞不太清,其实啊,有一个特别简单的比喻就能说明白,你就记住这个核心概念,一个呢是管道,另一个是操作手册。 行,咱们先看管道,也就是 m c p, 它本质上就是个标准协议,保证 ai 能安全地连上外部工具。说白了,它就像是 ai 界的 usb c 接口,想做个啥都能插的万能插头。 那 mcp 里头都有啥呢?主要是三样能用的工具,数据之类的资源,还有一些现成的模板。所以 mcp 的 核心任务就一个,解决怎么连的问题。好,管道明白了,再来看操作手册。 agent skill 这东西就像个能力扩展包, 它其实就是一份超显细的菜谱,一步步教 ai 具体该怎么干活。它很聪明,需要食材加载,特别省资源,而且它是用代码执行,结果绝对准确。 你看,这就分清楚了,一个管连接,另一个呢?管具体怎么操作?在技术层面, m c p 就是 那个集成层,负责打通,而 agent skill 呢,就是知识层。这么一看,它俩的取舍就很清楚了, m c p 更灵活,但资源消耗和风险也大一些。 但最关键的一点是,它俩根本不是对手,而是互相补充的好搭档,它俩能完美配合。你看手册负责给指令,管道就负责去连接去执行。所以说,咱们又回到了最初那个比喻,管道加上操作手册。 那你想想,当管道和手册强强联手,一个能力更强、连接更广的 ai, 未来会是什么样?
粉丝1.4万获赞7.6万

面试官问你, m c p 和目前 skill 有 什么区别?很多人在这个问题上就开始含糊了,什么都往上堆,说了一堆听起来都对,但其实没抓住重点,其实一句话就能说清楚。 skill 定义的是能力, m c p 定义的是连接 skill, 告诉 ai 怎么做事, m c p 告诉 ai 去哪拿东西。展开来说的话, skill 本质上是一组预定义好的指令和处理逻辑,你可以理解为一本操作手册。 比如你写了一个 skill, 教 agent 按照公司的规范去做数据分析报告,先按区域拆分,再算同比还比,最后按模板输出, 这就是一种能力,跟数据从哪来没有半毛钱关系。 m c p 呢?它是一个标准化的开放协议,解决的是 agent 和外部系统之间怎么通信的问题。你的数据库,你的网盘,你的代码仓库,这些东西都在 agent 的 外部, m c p 负责把这些通道打通,让 agent 能实时的去读取和操作这些外部资源,而且它是持续在线的,不是调一次就断了。 打个比方,你是一个厨师, skill 就是 你脑子里的菜谱,记录着每道菜怎么做, m c p 就是 你厨房里通向冰箱,通向菜市场的那条路,菜谱再好,没有食材通道你也做不出菜。食材通道再畅通,你不会做也只能干瞪眼。 这个时候,面试官大概率会追问一句,既然这样,为什么不在 skill 中加入数据获取的 a p i 呢?那不就能取代 m c p 了吗?这个问题其实是个陷阱,听起来很合理, 但经不起推敲。首先你要承认一件事,在 skill 里面写 api 调用技术上是可以跑通的,目前构建 skill 也需要放一些实际的代码,比如数据清洗的代码,格式转换的代码,这些都是 skill 里面很正常的组成部分。所以有人说,那我顺手把调 api 拿数据的脚本也放进去不就完了吗?逻辑上好像很通顺, 如果你只是偶尔调一个简单的接口,确实能用,但问题是能跑和能用好是两回事。第一个问题是认证,真实业务场景下,你对接的系统基本都有健全 off token 刷新,密钥轮换,这些事情你全得自己在 skill 里面处理,写一个还好,写十个你就疯了。而 m c p 在 协议层统一处理了这些事情,接进来就能用, 不用每个数据员单独搞一套认证逻辑。第二个问题是连接模式完全不同, skill 里面的脚本是被触发一次执行一次的,跑完就结束了,它本质上是一个无状态的东西, 但很多真实场景需要的是持续连接,比如监听数据库的变更,比如实时同步文件的更新。 m c p 建立的是一条常驻的通道, agent 可以 随时去查、去写、去监听,这是 skill 里面一段脚本做不到的事情。 第三个问题是扩展性。今天你要接一个 google drive, 在 skill 里面写一套请求逻辑,明天要接 github, 再写一套后, 后天街公司内部数据库又是一套,每一套都要单独处理分页错误,重试、数据格式转换,你会发现你的 skill 越写越臃肿,最后百分之八十的代码都在处理数据获取,真正的业务逻辑反而被埋没了。 m c p 的 意义就在于,它是一个标准协议,数据源那边实现一个 m c p server, 你这边直接连所有数据员,用同一套交互方式,不用重复造轮子。第四个问题也是架构层面最根本的问题就是职责混乱。软件工程里有一个基本原则叫关注点分离。 skill 的 职责是定义处理方法, m c p 的 职责是打通数据通路, 你把数据获取的逻辑塞进 skill 里面,就好比你在一份菜谱里面同时写了怎么养鸡,怎么种菜,怎么搭建冷链物流,能写吗?能,但这本菜谱会变得无法维护。 哪天 a p i。 改了一个字段,你得翻遍所有 skill, 去找哪些地方受影响。但如果数据层和能力层是分开的, a p i 变了,你只用改 m c p 那 一层,所有 skill 完全不用动。 所以结论是什么呢?在 skill 里面写 a p i 调用,本质上是在能力层里面硬塞了一个连接层的活,短期看能跑,长期看一定会疯。 m c p 和 skill 不是 谁取代谁的关系,而是各管一层,组合在一起才是一个完整的架构。 m c p 打通数据 skill, 提供方法通路加能力,这才是一个真正能在生产环境里跑起来的 agent。

agent skill 和 m c p 呢?从简单的角度讲一下啊, agent skill 本质上它更偏知识实体,就是一个又一个的工具,或者一个又一个的知识库,就是它更偏实的概念。而这个 m c p 呢,它本质来讲是个协议上下边协议更 偏虚的概念,我怎么去调用,怎么跟外部进行连接?举一个比较形象化的例子,比如说餐饮行业, agent skill 是 做西餐的牛排,做西餐的烤箱实体,它怎么去把这个菜烹饪出来?大龙虾呀,鱼呀,怎么给它摆到一起?这是 agent skill 的 概念,我一个一个的技能。 mcp 呢,它倾向于供应链上这个菜市场能买到我需要的牛排,上那个菜市场能买到我的海鲜,就是这么一个概念。那么现实中是什么呢? agent skill 和 mcp, 它是互不 五的,它俩同时起作用,最后厨子就能把一道精美的大餐做出来,整体而言是一个非一不可的一个状态。 当然了,不管是 m c p 的 协议也好,还是 age skill 也好,它是工业界里边的新兴概念,当前是属于一个快速更新,快速迭代。所以说大家呢,就本着一个 open 的 心态,随时跟上工业界前沿的一个进展。

最近 openclaw 这头龙虾呢,活得一塌糊涂,但是很多文科生朋友提起来里面的这种专业术语哈,一个个都很萌,别慌,今天呢,我们就来拆解一下这些龙虾术语到底在说些什么。 很多人呢,一听 openclaw 就 以为是新出的,拆的 gpt, 打开就能聊,大错特错。 openclaw 他 不会自己说话,也不会思考,他其实就是一个 ai 身体,他并不是大脑。那什么才是大脑呢?就是大模型, 像 gpt 四, deepsafe, 豆包、 kimi 这些就是真正思考的大脑。 openclaw 它不绑定任何的模型,今天你可以用 gpt 四,明天可以换豆包都可以。那对比一下模型呢?它就像是发动机, openclaw 就是 整辆车发动机的品牌,你可以随意更换,不影响整车的结构。 那既然说到开车了,油钱怎么算呢?这个就是 token, token 呢,可以约等于一个中文汉字,或者是零点七五个英文单词。你发的消息和 ai 回的消息,它都是按 token 来收费的。 但有个关键点哈,你发的字和 ai 回的字,它是分开计算的,而且通常 ai 回的比你问的会贵出二到五倍,也就是 ai 说的越多,花的也就越多。如果你用的还是一些高端的模型的话,差距会更大。像 gbt 四 o 是 gbt 四 o mini 的 十五倍的价格。 你明明感觉就聊了几句嘛,但是一个月下来,账单一出来就吓了一跳。原因就很简单,因为每句话都在花钱,一天呢,聊个几十条,一个月就积累起来了。所以当你问钱花哪了,大部分都是 talking 的 费用。这笔钱呢,也不是 openclaw 收的,它是模型公司按用量来收的。 我们再说说 agent 是 什么哈,普通的聊天机器人呢,你是问一句,他答一句,你不问呢?他就不回答, agent 就 不一样了,你给他一个目标,他会自己的想步骤自己做,做完以后再告诉你结果,中间哪怕出错了,他还会自己调整再试。你不用全程盯着, 这个就是作为 agent 的 open call, 他 能够在后台一直跑的原因,你不用守着电脑,他还可以帮你工作,是不是就很省心了? 但 agent 他 会思考,会规划还不够,他还得有技能才行,你让他发邮件,他首先得会发邮件才行。这个就是 skill 技能 skill 呢,是 openclaw 装的技能插件,像读邮件啊,运营写代码,你没有装 skill 的 话, ai 他 就不会。打个比方,你雇了一个聪明人来上班儿,但是他没有公司的门禁卡,你再能干也进不了这个门儿。装 skill 就是 给他配门禁卡,配了哪张卡,他就能够进门干哪件事儿。

用 ai 写代码,你至少得搞懂这四个东西, agent、 skill、 mcp 和 rules 分 不清,它们效率永远上不去。第一个 agent 就是 你的 ai 程序员本身,你给他需求,他自己拆任务去想方案,写代码,跑测试,出了错还能自己改。它是整个系统的大脑,统筹大局的指挥官。 第二个 skill, 相当于给 agent 发一本岗前培训手册。装上之后, agent 就 拥有了特定领域的专家知识和标准化工作流,零配置加载就生效,直接提升输出质量。第三个 mcp, 全称 model context protocol, 相当于万能插头。装上之后, agent 就 能操控浏览器 查数据库、调 api, 从只会聊天变成真的能干活。第四个 rules 相当于公司的编码规范,写在项目里, a 阵的每次干活都自动遵守命名规则。代码风格。技术站约定团队十个人写出来的代码像一个人。

大家好,今天聊一个 ai 圈最近特别火,但是百分之九十人还没有特别搞懂的话题, m c p 和 skills 到底有什么区别?这里是顽皮的程序员,我们先来一句话,定一个 m c p 就是 ai 的 手,负责摸外面的世界。 skills 就是 ai 的 技能书,教他怎么去干活。 你听起来像绕口令对吧?别急啊,咱们用人话一点点去拆解。 m c p 全名叫做 model context protocol, 翻译过来呢,就叫做模型上下文协议。 它是由 astronic 在 二零二四年底搞出来的一个开放标准,后来被 openai、 google, deepmind 都跟进了。它是干嘛用的?一句话就是说,能够让大模型连接到外部世界。你想,大模型本质上是一个闭门造车的学霸, 他只知道训练数据里边有什么,训练完一结束,他知识就冻住了。你问他今天上海天气是什么样,他只能说,我不知道,我只是个语言模型。 那有了 m c p 以后,大模型就像装上了一双手,或者说装上了眼镜,它完全可以干嘛?可以查一下数据库,可以调个 api, 可以 多部文件,甚至说给你发个邮件。那举个例子说,你帮我查一下最新的销售报告,帮我发给老板。 没有 m c p 的 模型会一脸懵,你为什么要让我干这个活呢?我也没有手,我也不会发邮件,对吧?当你有了 m c p, 它就会先调一个查询报告的工具, 拿到数据以后再调一个发邮件的工具搞定。所以 m c p 的 结构其实非常简单,你记住三个角色就可以了。第一个就是 m c p 的 主机 host, 也就是你平常用的这些 ai 应用,比如说 cloud, 比如说 chat、 gpt, 或者说 coser 这样的 ai 代码编辑器,用户在这提问模型在这思考。 第二个就是 m c p, 客户端 client, 那 藏在主机里边的翻译官负责把模型请求翻译成 m c p 格式,再把 m c p 的 回复翻译回来。 那第三个就是 mcp 的 服务端 server, 真正干活的那个工具仓库连着数据库,连着 api, 连着文件系统之类的。 那客户端要工具列表,他就把我能查天气,我能读 excel, 我 能发邮件,这些能力报上来,就像报菜名一样。那整个流程就变成 用户提问模型判断要不要调工具,要调就通过客户端问一下服务端你有啥工具,如果说找到这个工具的定义,然后就开始生成这个调用的指令,客户端负责执行完了就返回给模型,模型一下回答给你。 最奇妙的是什么呢?模型完全不知道 m c p 的 存在,他看到的就是一个工具名加参数,然后决定去用那个底层的那套客户端和服务端的复杂通讯,其实对模型来说是完全透明的 好, m c p 解决了连接的问题,但是光能摸,光能看外表还不够,比如说你让 ai 帮你分析一份财务报表,他只能说通过 m c p 连上数据库,把数据拉下来之后,看完,我们先看哪一列,我们怎么算利润,格式怎么写。这个时候你就想到了,是不是我们在招一些新员工进入公司的时候, 往往会给他一份员工手册,你在这个岗位上要做什么,怎么做,题都写在里边了,那这个时候这份手册就相当于 skills。 那 skills 本质上就是一段规则说明文档,或者说是流程知识,它并不是一个独立运行的程序,对吧?它是在教 ai 做事,遇到这种任务,按照这个步骤来的。这样的说明书, 那我们怎么来区分 m c p u 的 skills 呢?那我给你一张这个表,我帮你举个例子,可能你就记住了, 假设任务是帮我们分析公司上季度的销售数据,生成一份报告。 m c p 的 角色呢,是连接 e r p 系统,把销售数据拉回来。 那 scales 的 角色呢?是告诉 ai 先按地区分组,然后再横比分析它的增长率。最后呢,再用 swf 框架写一个总结,没有 m c p, ai 就 拿不到这个数据,没有 scales, ai 就 拿到了数据,也不知道怎么样了,是吧?当然,为什么要单独去做一个 scales? scales 有 两个杀手锏,第一个就是渐进式批录, ai 不 需要一次性的把所有知识都加载进来,用什么时候加载什么。比如说一个财务分析的 skill, 可能有一百页规则,但是用户只问了利率,那么 ai 就 只加载利率计算的那几段,节省 token, 节省成本。 第二个就是脚本执行, skills 可以 包含可执行代码。哇,这个是不是很爽?对于那些语言模型算的不准,但是程序可以算的准的任务,比如说你需要精确的数学计算,或者复杂的数据处理,或者说一些需要通过调接口才能完成的任务,比如说控制某一个硬件去做一个动作, 那么 skills 可以 直接去跑代码,不需要靠 token 去生成,这就超越了纯粹的大模型瞎猜的模式,它的结果将更稳定、更可靠,也更加地扩展了模型对外界的触达。 当然了,我们完全可以做一个实战对比。下边是之前宝玉老师他们做的一个实战对比,他们使用了 playright mcp 和 skill 加 cdp 脚本去做了一个测试,还会发现他们的总消耗大概从五万多 tokens 降到了几百 tokens, 那具体的差距一目了然。用 m c p 硬扛 ai, 需要一步步看,一步步想,一步步调用 skills, 这就是一把锁哈,效率完全差了几十倍,因为 skills 它更像一个 s o p。 当然了,最后我们一定会想问, m c p 和 skills 我 们到底怎么去用?或者说它俩应该怎么切磋?其实答案是两个都有用啊,它们需要各司其职。 skills 负责编码领域的知识,你们公司有一套特定的六个标准, z o p, 先查哪个系统,再查哪个系统,按什么顺序处理。这些就是 skills 写出来的,它让 ai 理解这个流程到底是什么。 那么 m c p 呢?提供的是连接能力,具体连接哪些系统能力,靠 m c p 服务端可以去提供这些能力。那么 打个比方, skills 是 菜谱告诉厨师需要先放葱姜蒜再下入,对吧?最后我们再勾芡一下,那么 m c p 就是 厨房里的燃气灶、冰箱、调味架,提供能开火、能取食材的能力。 光有菜谱没厨房,你完全做不了菜。光有厨房没有菜谱,厨师也不知道做什么,两层配合他们才能够轻松拿捏。 当然了,经过上年我们的介绍,大家一定已经知道了 skills 和 mcp 的 区别了,所以说以后看到 ai 产品说支持 mcp, 支持 skills 就 会一脸懵逼了。好,今天的奇怪的知识咱们就讲到这,大家欢迎在我的评论区多多交流。好,拜拜。

q, 到底会不会取代 m c p? 很多人在问这个问题啊,答案呢,非常明确,我不会。 m c p 呢,有成千上万种,到底怎么来选?我本人呢,用了几十个 m c p, 沉淀下来最常用,并且呢,使用的效果又很好的有四个 m c p, 少而精。在视频后面呢,我 会给大家详细分享这四个常用的 m c p。 先回答,为什么 q 它不会取代 m c p 啊?这两个呢,看起来它是都跟上下文相关,但其实呢,有很大的不同。举个例子呢,你就明白, 我们现在这个任务呢,是要搜索技术文档。 m c p 的 作用呢,是让大模型能够连接到搜索引擎,这其实是提供了一种能 力啊,那 skill 的 作用呢?它规定了搜索的策略以及最后处理的方法,也就是怎么搜,始终优先查找官方的 api 文档,而不是网上的一些驳客文章,以及怎么总结将搜索结果呢,总结为带有引用链接的简报的这种格式。所以在这个例子里面, m c p 呢,它提供了一种搜索的工具或者说能力。 skill 呢,则提供了关于如何搜索知识以及搜索结果如何进行处理的方案。这点呢,在 osapi 最近的工作簿刻里面,其实已经明确指出了它们之间的这种区别啊,官方的表达是 m c p 呢,它用于连接,那 skill 呢,是用于 程序化的知识,所以从这个表述来看, skill 呢,更像是轻量级的工作流。下面跟大家分享四个我常用的用起来的工作流,下面呢,叫做 context seven m c p。 那 这个呢,绝对是编程的利器,它会自动去寻找你这个编程项目相关的库的最新的文档,比如说 python 呢,很多库呢,它都是不断更新的,但是大模型本身呢,往往会滞后于这些库的更新。比如说最近的库呢,它是 v 五版本的,但是呢,大模型训练的时候呢,它只看过 v 三的库, 如果不用这个 m c p 啊,大模型就会按照 v 三的版本来写这个代码。但是呢, v 三里面的请求参数啊,还说名称这些呢,在最新版本里面已经是弃用了,或者说已经有变化了,因此呢,写出来的代码呢,往往就会报错。那 context seven 这个 m c p 呢,就是用来解决这个问题的。 在写代码前,它会把相关的库的最新的 introduction, fake, start 以及 api 的 reference 呢全部读一遍,从而获得最新的这个上下文的信息。第二个呢是 markdown m c p, 这个是在开源社区下载量最高的一个 m c p 啊,它的核心功能是把一个网页变成 markdown 的 文本,那这个为什么这么有用呢?它的核心就在于它减少了 token 的 消耗,因为大家都知道,网页本身它是带有大量的这种 html 的 标签,以及 c s s 的 内联样式,这些标签样式呢,它其实占据了不少的这个上下文,而大模型需要的其实只是文本本身,那这个工具呢,把这些无效的这种信息呢给去掉,转为层次清晰的 markdown 格式,保留文本本身。从我个人的经验来看呢,同样一个网页, 用了这个工具呢,能够减少大概三分之一的上下文。当网页内容很多的时候,如果你不做处理的话,这些内容其实会把上下文给爆掉,导致模型变笨。所以说如果你经常要处理网页,那必须要用这个 m c p。 第三个呢是 exa mcp, 这是目前口碑很好的一款搜索 mcp 大 冒险,本身呢,它是没有搜索功能的, 那这个工具呢,具有语义搜索的能力,它不仅是匹配关键词,而且呢可以理解你要表达的这个含义啊,它可以根据任务的需要呢,自动地去搜索最新的讨论,业界的动态以及博客文章。第四个呢,叫做 payride mcp, 这个工具呢非常强大啊,它 可以操作浏览器,有头和无头这两种模式,区别呢,就是说他是否在电脑上呈现操作浏览器的这个过程。既然是操作浏览器,大家应该立刻能意识到这个用处呢,就非常的大。因为我们日常的办公工作,其实大部分跟浏览器相关的, 比如说写完前端的页面之后,可以让 paywrite 截图, ai 通过分析截图呢,来调整 c s s 样式,比如说你的居中啊,颜色重叠这些问题,这笔只看代码来干想呢,强一百倍,这是通过 paywrite 来做视觉的反馈。再比如有些动态的网页的内容呢,你靠一般的 http 请求 呢,一般是拿不到的。那这个时候呢,模拟操作浏览器就有大的用处了,这个 m c p 呢,它会打开这个网址,执行网页里面的 js 代码。最后呢,拿到一个结构完整的,包含网页所有文字和图片的这样一个 dom 数,那以上四个呢,都是用途很广。 m c p, 如果你是用的像 cherry studio 这样的 a i 客户端,那还应该需要一个 build system 这种 m c p, 它能够让你从 ai 客户端里面直接创建文件,修改文件的内容以及重构文件夹的结构。好了,如果本期内容呢?有收获可以点赞收藏。下期我们继续讲四 q 和 m c p 的 这个系列。

你还在被 l l m agent、 m c p skill 这些 ai 新名词搞晕吗?没错,这些概念就像 ai 界的黑化,让人摸不着头脑。别担心,今天我们用三分钟帮你彻底搞懂,让你在 ai 圈不再迷茫。 首先来说说 l l m, 也就是大语言模型,你可以把它想象成 ai 的 超级大脑,它能思考,能理解,就像我们人类的大脑一样。对,比如说,你让 l l m 帮你写一篇文章,它可以轻松完成,但你让它帮你打开电脑上的某个文件,它就做不到了。 这时候就需要 agent 出场了。 agent 可以 理解为 ai 的 执行小助手,是连接 l l m 与外部世界的中间层,它就像我们人类的手脚,负责执行大脑下达的指令。 那 m c p 又是什么呢? m c p 的 全称是 model context protocol, 也就是模型上下文协议,你可以把它想象成 ai 的 通用接口标准,它解决了模型与外部系统连接的碎片化问题。 打个比方,以前不同的模型和外部系统之间,就像不同品牌的充电器和充电接口一样,无法通用。而 mcp 就 像是统一的 usb 接口标准,让不同的模型和外部系统都能通过这个标准接口进行连接和通信。 最后再来说说 skill。 skill 可以 理解为 ai 的 专业知识包,它封装了特定任务的 sop 方法论和最佳实践,就像我们人类的专业技能一样,比如医生的诊断技能、律师的辩护技能。 总结一下, l l m 是 ai 的 大脑,负责思考和决策。 agent 是 ai 的 手脚,负责执行指令。 m c p 是 ai 的 通用接口标准,负责连接外部资源。 skill 是 ai 的 专业知识包,负责提供专业的执行方法。 没错,这四个概念共同构成了现代 ai 应用的完整技术战,从底层的模型能力到上层的业务落地,形成了一套协同互补的生态系统。 希望通过今天的讲解,大家对 l l m agent m c p skill 有 了更清晰的认识。如果大家还有其他关于 ai 的 问题,欢迎在评论区留言,我们会在后续的节目中为大家解答。

最近 open globe 这头龙虾呢,活得一塌糊涂,但是很多文科生朋友提起这个,里面的术语一个个都很懵。别慌,今天呢,我们继续来拆解 上期呢,说到技能工具,那我们就得提到 m c p 了。在 m c p 出现以前,每个 ai 接入外部的工具,像查天气啊,翻数据表调软件,你都得写专门的对接代码工具换了你得重写。 ai 换了呢也得重写,麻烦不说,还互相不兼容。 m c p 出现以后的做法就是大家都按照同一套格式来用,就像 usb 接口统一以后,你买了新手机,新设备,就不用配专用线了吗? 而我们可唠呢,支持 m c p, 也就意味着别人做好的工具,你是可以直接用的,不用一个个去配了。那你看,大脑有了,技能也装好了,工具也接上了,那消息怎么传呢?三个词,你需要记住, channel, getaway、 session。 channel 呢,就是你发消息的软件,像叮叮飞书,微信,每个 app 就是 一个 channel, 你 在哪发, ai 就 会在哪回。 getaway 呢,是消息中转站,所有的消息呢,都会先到 getaway, 它判断是谁发的,然后该转给哪个对话,只负责转发。 session 呢,是 ai 技术聊天内容的单位,每个 session 呢,向对话的档案,它去保存你所有的对话。所以总结来说哈,就是一个能二十四小时干活,记住你说话,用你选的模型,连你常用的软件都能够了解的私人助手。这个就是 openclo, 它和拆了 gpt 豆包的区别不是谁更聪明,而是工作方式彻彻底底的不同。我问 coco 能够设定任务去定时做数据呢?在你的电脑上,代码是公开的,谁都能查,它还可以接入任何的模型,像豆包、 dipstick、 kimi, 你 喜欢用哪个大脑都可以自己选。 那聊到这儿,这些名词呢,你就不应该陌生了,下一次呢,再有人提到这些话题,你就可以好好给他们讲一讲什么是 ai 的 身体,什么是 ai 的 大脑了。

什么是 agent? 什么是 m c p, 什么是 skill? 还有再再说说什么是 open club, 把这个东西讲完,大家应该就能对这个知识点有一个更深的了解了。首先第一个 什么是大模型,咱们得先说大模型,它就是一个可以对话的一个大脑,你跟他说话,他就能回复消息。但是有一个问题,他没有记忆,你跟大模型说一句话,你说你好,再跟他说我是谁,他不知道, 但也就是大漠星,他没有记忆,你说一个消息,他其实底层是一个 transom 架构,他经过神经网络一层一层的去计算,最终通过概率给你算出来他要回复什么东西,所以说他那个东西是有幻觉的,通过概率给你算出来一个东西给你回复了,你说我是小周,你再问我是谁,他不知道,你这 ai 没有记忆可不行了。 所以说大家为了让 ai 有 记忆可以聊天,大家就制造了一个聊天机器人,就叫 bot, 那 这个 bot 能干什么呢?就是我跟他说,我说我是小周, bot 接到我是小周,然后他会跟大模型去交流,他作为一个中间人跟大模型交流, 然后他告诉大模型这个人叫小周,然后我再说我是谁,我跟那个 bot 说我是谁的时候,这个 bot 他 会把我是小周,然后大模型的回复,然后这我是谁一起发给 大模型,也就说大模型拿到不是我是谁,而是之前的所有聊天记录,大模型都看到了,然后他再回,那这个聊天机器人他的作用呢?就是让这个大模型看上去有记忆了,这是聊天机器人,那聊天机器人的功能还是很弱,对吧?就比如说我想让他帮我关电脑, 帮我执行一段程序,帮我查询今天的天气,它也不行。所以说这个时候就聊天机器人的基础上,又扩展出了一个东西,叫 agent, 叫智能体。智能体可以干什么呢?智能体,大家记住啊,智,一句话就知道智能体可以调用工具,这东西就是智能体。 那什么是工具呢?就比如说这里有一个函数,有一行代码,这行代码可以 get weather, 可以 获取天气信息,获取获取日历信息。今天是几号?这个大模型是不知道的,大模型他知道的东西就是基于他训练的结果。 我二零二五年五月一号训练,这个大模型结束。那大模型二零二五年五月一号之前的东西,他训练过的,知道五月一号之后的事,他啥也不知道,他没训练,所以你问他,你说今天天气怎么样?他不知道今天是几号,大模型他不知道,但是 agent 他 知道。 a 针呢?可以调一个工具 get 外的,我获取到今天的天气,然后我再告诉大模型,大模型再分析,然后再给我回复,也就说这个 a 针呢?是什么呢? a 针它是可以调用工具的一个程序,它可以通过调用工具让大模型知道更多的事,这个就是 a 针的。 然后大家发现 a 针不知道天气,我得怎么办呢?我得调用一些接口,比如说高德有天气信息的接口, 我得调这个接口啊,然后还有什么饭店的接口,旅游景区的接口,什么时候卖票的接口,他得调很多接口。那这个这样的话, 所有的互联网服务平台,比如说天气的呀,景区的呀,卖票的呀,全得开放接口,然后这个 a 证他得调所有接口才能实现这个功能,那 a 证他也麻烦,那个第三方平台,那个天气的第三方平台也麻烦,然后这个接口怎么调参数都很麻烦。其中有一个执行方案,就是说我定义一个协议, 就说你这个 agent 调这个第三方平台的接口数据的时候,你别像以前那么调接口,你你咱谈个协议,你只要两边都遵守这个协议,我就可以去拿你的数据了,我就可以拿天气数据,拿时间数据,拿各种景区的数据都能拿了。 那这个协议叫什么的呢?就叫模型上下文协议,所以这个协议就叫 mcp, 所以 大家知道什么是 mcp 了吧?它就是协议,对吧?我调接口为了更方便的调接口,开发了一个协议,叫 mcp, 所以 大家知道什么是 mcp 了? mcp 就是 让 agent 可以 更方便的调用工具, 简单吗? mcp 就是 为了让 agent 调用工具,然后把调用工具的信息给大模型,让大模型可以回复,懂了吧?这是 mcp。 什么叫 skill 呢? 没点关注,点个关注,我讲的很细,跟大家说没点关注,点个关注。然后我这边有个 ai 学习专栏,大家可以加一下,我这边还有 ai 交流群,感兴趣的小伙伴可以加一下。然后我接着说什么是 skill? skill 最早就是咱先说这个调用工具, 等于说调用工具有什么弊端吧,如果你想让这个 agent 调用工具的话,你得先把这个工具的所有的说明书什么的参数配置全都给这个 agent 告诉他,然后他比如说你跟他说我,我,我跟那个 agent 说,我说你好,他收到的就是你好吗?不是 他,除了这他,他给这个大媒体人发的,除了这个你好,他还会把我这个 a 帧呢,可以调什么工具,什么乱七八糟的呀,这各种各种这个工具的参数啊,这些信息全都给大媒体人发过去,这就很麻烦, 东西很多,所以呢,为了让这个提升这个性能吧,当然也不只是为了提升这个性能,咱就说性能,为了提升这个性能吧, hlp 公司就发布了一个叫 a n 的 skill 的 东西, a n 的 skill 的 话,他可以定义一个工作流,定一个文档,一个 markdown 文件, 然后这样的话它只要在文件上面写一个原数据,写两行,对吧?当用户在干什么的时候调用这个 skill, 那 下面细节就不用不用给大模型了, 那这样我一个 a 针呢,就可以接很多的 skill, 我 只要看它那个原数据,它能干啥,我需要的时候我再调它里面的东西,这样呢性能就能得到一定的提升。而且用这个 skill 的 时候会大家发现更好的一点,就是 skill 可以 写很多很多东西, 比如说你想做一个知识库,你可以放在 skill 里面,你可以有定一个工作流,你可以放在 skill 里面,很多事都可以放在 skill 里面,这样 skill 就 火出圈了。 也就说 skill 它是一套文档,文档规定了这个事怎么干,然后大模型就会按照这个流程去干事,做事就就就完事了。 所以刚才说的 m c p 是 什么?是调用工具更方便,工具是什么呢?就是查询天气这些工具。然后呢? skill 呢? skill 是 可以让规定 你做这件事,调用哪些工具,执行哪些标准,它是做了一个更更广的一个规范,也就说一个 skill 可以 调很多 m c p 可以 调很多的工具,这是 skill 的 作用, 也就是说大家会发现 skill 能力强了,是吧? skill 可以 作为文档,它可以做知识库。 skill 可以 定义工作流,它可以做很多事, skill 可以 调很多的工具, skill 也可以调 m c p, 这是 skill 的 能力。 然后大家就会发现,那 sku 是 不是太强大了呀?对吧?它是不是可以操作浏览器啊,可以写代码啊,做简历啊,所有的工作流,甚至取代什么扣子,以前那种传统的工作人形式全都取代了,那所以这 sku 实在是太好用了吧? 确实好用,确实好用,它太好用了。然后呢,就出现了很多的工具全都接入了这个 skill, 包括浏览器, tree products, 所有的 ai 工具, ai 开发工具都接入了这个 skill, 就 大家都能用 skill 了。然后又出现了一个东西也接入了这个 skill, 就是 open claw, 也就是说因为 skill 可以 做很多事, open claw 它不需要做这些事, open claw 只需要可以调 skill, 它就可以做所有 skill 的 事。也就是 open klo 是 什么呢?它就是一个智能体,智能体的能力不依赖于它智能体本身,而依赖于它接入了哪些 skill。 这也就是说,为什么大家用 不用担心 open klo 以后能力会不会变强变弱什么的,你不需要关注它有什么能力, open klo 也没什么能力,它的能力全部一托于 skill 生态。 所以有个网站叫 cloud 号吧,里面有很多 skill 嘛。大家如果想扩展自己 opencloud 的 能力的话,你就直接下载 skill 就 ok 了,你就可以让你的 opencloud 去做各种各样的事了。因为 skill 可以 做,所以 opencloud 就 可以做, 这就是大模型 agent skill mcp 和 opencloud 的 关系。我不知道我讲的透不透彻。讲的透彻,点个赞支持一下。

大家好,今天我们来聊聊两个听起来很专业,但其实很好懂的概念, skill 和 m c p。 先说 skill, 它就像是一本武功秘籍, 它专注于知识的分享和经验的传递,教你如何处理特定的问题。 而 m c p 更像是一个万能插座,它的核心是功能扩展和系统集成,把不同的工具连接在一起,协同工作。那它们有什么区别呢?让我们来一场大 pk。 首先是使用门槛, skill 就 像滑滑梯,简单易用,上手快。而 m c p 像操作精密,仪器部署要求高,需要一定的技术背景。 在加载效率上, skill 清亮快捷, m c p 虽然稍重,但能承载更复杂的系统任务。至于跨平台性, m c p 在 系统集成上表现更优,能打通不同设备的壁垒。 所以,如果你需要快速传授知识,选 skill。 如果你要搞定复杂的系统连接, m c p 是 首选。未来两者将结合得更紧密, 既懂知识,又能连接万物。希望今天的科普能帮你分清它们,我们下期再见。

很多人以为 m c p 和 skill 看着差不多,是不是在重复造轮子呢?一句话先说清楚,他们不在同一层,也不是相互替代。 m c p 只关心一件事情,就是模型该拿到什么样的上下文,数据从哪来,结构长什么样,怎么保证给的是对的? m c p 解决的是上下文怎么传的问题。 skill 关心的是另一件事,事情是怎么被执行的,哪些步骤必须跑脚本,哪些结果要校验,失败了是重试还是直接停? skill 解决的?是啊,事情怎么被做成。 所以关键差别在这儿,就是 m c p 不 负责把事情做成,而 skill 才负责执行和兜底。一个是输入和协议层,一个是任务和执行层。所以不是多造一个 skill, 而是把不同的问题放回它该在的层里。

什么是智能体大模型? m c p、 skill、 rack、 cool、 提示词等,越听越乱,今天我用一个最通俗的比喻,把这些概念的本质一次性说清楚,带您快速入门 ai 世界。我们把整个 ai 系统直接理解成一位专门为您服务的全能私人助理。 第一个智人体,智人体就是这位助理本人,钢铁侠的贾维斯。目前市面上最火爆的 open claw 小 龙虾就是这种典型的 ai 智人体, 他不是一个只会聊天的对话框,而是能听、能想、能规划、能动手干活的完整主体。第二个大模型,大模型就是这位助理的大脑,所有的思考、理解、判断、认知全靠他。 市面上有很多成熟的大模型,比如豆包、千问,还有其他的行业大模型,大脑越强大,助理就越聪明。 第三个提日词,提日词就是你给助理下达的指令,你说的越清楚、越具体,身体执行的就越精准、越到位。第四个 skill, 也就是技能, 他本质上是封装好的,内部提示词是固定的,流程也是过往的经验总结。系统把一套成熟可敷用的工作方法打包好,存储在助理的智能库里,你不需要每次都从头教他,他直接调用这套经验包,就能够 按照标准流程稳定高效的把事情做完。现在所谓的养龙虾,实际上就是教会 opencloud 这类智能体,按照你指定的工作流程执行任务,然后把流程打包成技能的过程。 第五个 m c p。 通过 m c p 智能体可以借助外部系统的能力,而不只是靠自己。什么意思呢?就是外部系统其他的软件或者 ai, 它们通过 m c p 把自己的能力开放给你的智能体。 你的智能体本身不一定具备这些能力,但它可以通过 m c p 调用别的系统开放出来的能力。第六个, rock cool。 rock cool 就是 助理的专属私人资料库,里面存放着你的业务文件、公司资料、行业知识、历史经验等。有了它, ai 不 会胡说,不会瞎编,回答的更准确,更贴合你的真实需求。 我帮大家总结一下,整体是助理本人,大模型是助理的大脑,题词是你交给 ai 的 指令。 skill 是 智能体掌握的技能, mcp 是 助理使用的外部能力, rag 是 助理使用的资料库。关注我,用大白话讲透 ai!

这些词是不是看着眼熟?这些呢?是不是也眼熟?对 ai 有 一些了解的朋友,应该或多或少都听过这其中的一些英文单词,今天我们来一起探讨下这些单词的概念。 这些单词的概念大家只要了解就可以了,没必要深究他为什么要叫这个。我的理解是在 ai 发展的过程中,有一些产物他需要一个称呼,无论叫什么,总得有一个名字称呼他。 就像西红柿,你只要知道别人说西红柿就是再说一个红红的果子能吃就行,没必要深究它为什么叫西红柿。 大圆模型这个称呼很多人已经听说过了,翻译成英文就是 large landscape model, 即今天的第一个概念 lmo 大 圆模型其实指的就是我们经常听到叉 tpt, 今年阿里刚发布的同一千问三点五减 plus, 这些讲的都是大语言模型。当我们在和大语言模型进行交互的时候,所写提问的问题就是提示词,即 prompt。 我 们需要告诉大模型我们需要它做什么。 大语言模型是通过消耗 token 树来回答我们的问题,大语言模型的收费方式正是按照调用的 token 树来收费的。 token 我 更喜欢理解为它为语言文字的 一个单位,他和个跟这些单位有一些不同的地方,比如我要买一根香蕉,所有人都能理解我要付的是一根香蕉的钱。 但是 token 这个单位的大小在每个大语言模型都有自己的字典定义。以我爱我家为例,在某些大语言模型中,可能会把这四个字拆分成我爱我家。四个 token 也有可能拆分为我爱我加两个 token, 所以 不同的大语言模型在回答我们同一个问题时,消耗的 token 数是不同的。同一个问题使用不同模型的话费 也是不同的。因为 token 字典定义的不同,所以同一个推理类的问题提交给不同的大语言模型,得出来的结论也是不同的。 随着 ai 的 发展,透视术我个人感觉一定会优化到所有人都能用的起的地步,否则使用大数据模型的成本太高, 就像十几年前的手机数据流量一样,以前按照照,现在都开始按照记来计量。 扯远了。我们在使用大语言模型过程中和大语言模型交互,一开始没有上下文记忆,你只能提问一个问题,他回答一个问题,不能追问,这个时候就出现了 context 上下文记忆功能。 如果把之前的每轮对话都比作 context, 那 大模型就有了记忆功能 memory。 这个时候我们就获得了一个可以参考多轮对话的大元模型了。但是受限于模型训练的数据集大小影响,他只能回答他已经训练过的内容,无法更新信息, 这个时候就需要它具有联网搜索的功能,我们需要给他引入一些上网工具,让大语言模型可以使用这些工具。这个过程给他起了个名字,就是智能体 agent。 既然可以上网搜索外界信息,那就也可以搜索本地和数据库, 只是数据库使用的是向量数据库,向量数据库和传统数据库不同,他会把与 易匹配向量化信息增强生成内容的办法叫做解锁增强生成 reig。 好 了,现在我们其实说到这已经不再是你在和大数据模型直接对话了, 而是你和大语言模型之间出现了一个智能体 agent 概念。因为我们提问的时候使用的是自然语言,如果让大模型按照指定的格式来回答, 那我们就需要给 a 帧,它与大模型之间关于工具调用做一个格式约束,方便 a 帧它程序解析大模型的需求,我们称之为方身拷领。 我们之前说的智能体的那些应用功能单独拆分出来,这个时候的 a 帧,它其实更像一段代码程序,而这整个部分其实更像是一个智能体, 那么这段代码程序在调用这些应用的时候,也会有一个定好的格式约束,我们称之为 m c p, 即模型上下文协议。那么现在这个大模型其实就变成了我们用自然语言给这个智能体。智能体中的大模型把我们的语言翻译成能调用工具的代码, 把工具查询的结果再返回给大模型,大模型再返回给我们,这就很像我们使用的某包某 c 了。 而在大模型运转过程中,你会发现有一些重复工作其实并不需要使用大模型来完成,而是使用一段固定的代码就可以完成,于是发明了一个新的编程框架 longchain, 为了照顾不会代码的用户,又发明了一个低代码的方式 work flow 工作流。这只是我们固定处理一种固定的流程,但是现实中会有大量的不同的固定工作流程, 如果出现一种就写一套工作流并不现实。这时候我们创建一个目录 skill md, 将所有可能涉及的固定流程代码全部放在这个目录里,智能体里写一些提示词,让智能体优先读 skill md 中的要求。这个过程就是今年 openclaw 大 龙虾中直观重要的组建 skill, 即 agent 的 技能。 说到现在,我们的智能体 agent 已经变成了这样了。好了,今天就和大家探讨到这,如果有说的不清楚,欢迎在评论下补充。

嗯,你觉得 agent 的 skill 和 mcp 有 什么具体的区别?简单来说就是 skill, 管怎么想, mcp 就 管怎么连, 它就是互补协助的关系。 agent skill, 它关注的是认知层,就把领域知识,操作流程,还有最佳实践分装层可以附用的模块,就让 ai 知道该怎么思考和输出。 mcp 关注的就是连接层,提供标准化的协议, 就让 ai 能够安全调用外部工具或者系统,解决能够访问什么的问题。从落地的角度上面来看,他们的技术实现和使用门槛有没有不一样。我这里也整理了一份十一万字大模型高频的面试题,感兴趣的小伙伴可以带回家学习。嗯,差异还是很明显的, 就 skill 通常由 y m l 原数据,还有 markdown 知识文档,还有少量的脚本组成 啊,就业务专家或者产品经理就能编辑或者维护,门槛比较低,适合快速迭代。 但是 m c p 就 需要开发团队搭建服务端,然后实现接口的规范权限控制。还有日式的手机属于基础设施及投入技术门槛比较高,但是能够支撑跨模型跨平台的工具附用。嗯, 那在实际的项目当中,你是怎么样去判断该用 scare 还是用 mcp 呢?嗯,就看它的需求本质。如果目标是统一输出格式,固化专业流程,沉淀团队知识, 呃,故障排查指南等,就可以用 scare。 但是假如目标是让用户执行真实操作,访问企业的系统啊,实现自动化,呃,更新 crm 或者是调用数据库啊,就会用 mcp 啊。简单来说就是 skill 解决怎么做?对,但是 m c p 就是 解决能不能做复杂场景,下面就可以协调使用。

我们就可以利用 agent skill, 把呃我们人类可能积累之前的工作的经验或是工作的技巧全部通通的都可以把它打包成为这个工作或者职位。 sop 的 一个手册,给到 ai 帮我们去做事情, 而且是符合我们心心心里面的一个需求的。然后最后一个就是 m c p, 那 m c p 呢?其实我们可以想象它就是一个呃权限来的,比如说 我们给了一个 m c p, 给到 ai, 它才可以去到我们公司的 cloud server, 就是 云端上面,它才可以去我们的 clm 系统,或者它才可以去 notion 上面帮我们去做事情。所以 m c p 它就是一个调用工具的一个权限卡, 然后呃 skill, 它就是一个工作手册,其实它们这两个它们是一个互补的一个关系的。 我们可以在一个 skill 里面,然后告诉 ai 当他做到什么样的工作的时候,他需要调用什么样的 m c p, 继续地帮我们自动完成工作。

m c p scale 到底是什么?你一定听过很多关于它们的理论,但你的理解一定是正确的吗?比如 m c p 的 解析是大模型上下文协议,它可以和各种外部系统连接,请问大模型是直接调用外部的服务吗? 如果你所在公司的内网搭建了 m c p 的 服务,外部的大模型它怎么能够调用呢?再比如 skill 的 解释是技能,它是有具体的功能吗?要不为啥叫技能呢?它和 m c p 又有什么区别? 上面的问题你要是不能够准确的回答,不用怀疑,你一定没有真正理解。这不是你的问题,而是大部分视频都是基于局部的理论知识,缺乏局的视角和实战的经验。 今天这几个视频我会结合我的实战经验,循序渐进的帮你们弄清楚这些技术的本质,请一键三连给予鼓励,让我们开始。 首先你要明白这些 ai 的 概念,它不是突然一起出现的,而是先有 l m 大 模型,再有 n g t, 随后是 m c p, 最后才是 skill。 每一个新概念都是为了解决特定的问题,我们必须搞清楚 ai 在 发展的每个阶段到底遇到了哪些问题,我们才能够真正的去理解这些概念背后设计的初衷是什么。让我们先从 l m 开始, l i m 的 本质是基于概率去预测下一个字母,就像成语接龙一样,二零二二年恰的 g p t 三点五刚问世的时候,我们对它的使用就是对话式的向 ai 提问,写作文生成代码也不需要什么,而且的但是有一个问题就是说 你当时是不能够问 ai 最近发生的事情的,比如说今天是星期几,因为它是基于二零二一年九月份之前所训练的数据。那聪明的你肯定想到了,我们用大模型自己去网上搜索,然后给个结果告诉你,但大模型不具备这个能力,就好比你用大脑一年去操控电脑, 这个时候你要么自己去搜,要么你就写个爬虫去搜,然后再把这个结果发给这个大模型进行整理。 勤奋的你肯定是选择爬虫,而这个爬虫就是最古老的 ngram。 当然了, ngram 它感召智能体,它肯定不是爬虫这么简单。像现在顶级的 ngram, 比如说像 manasa cloud code, 它既能写程序,又能做报告,智能的程度让人不可思议,甚至会让人感到恐惧。 但是它本质上就是在循环的干以下三件事情,第一件事情,收集好信息之后发送给大模型。第二件事情,解析大模型的结果,然后获取这个执行的指令。 第三件事情就是执行指令操作,把执行的结果再次发给这个大模型,整个的操作都是循环进行的。然后接下来我们就来看一个具体的关于 code code 的 一个事例。 假设我们现在有两个文件,其中一个 hello 点加法是存在错误的,这个 user 的 格式函数我们把它写错了。现在我们用 color code 这个 n 的 智能体来帮我们找到这个问题的原因。请注意,用户提示词里面明确指明了这个文件的绝对路径,那么请问 color code 他会直接读取这个 hello 点加文件,然后发给大模型吗?大家暂停思考三秒钟,认为会的刷一,认为不会的刷二,答案是不会 ng 的。 他不会去解析这个提示词,更不知道如何去读取这个文件,他只会把结果发给大模型, 然后让他大模型来告诉他怎么读,去哪里读具体的流程,就像在线看病一样,用户提出问题了,然后再是 n g 的 把用户的问题封装成系统提示词,包括对应的工具,一起全部发给这个大模型,进行这种远程问诊。 这里的系统提示词就是告诉大模型你是一个编码专家,你要解决用户的是编码问题,你不要去解决用户的心理问题,或者是他的单身的问题。 然后工具的列表就是告诉大模型你在解决用户的问题的时候,你可以去开哪些检查,你去看病,如果不开检查,那么他怎么看病?这里面所谓的检查以及所谓的工具,其实就是去搜索提取 文件,大模型就会返回一个提取文件的检查指令,详细的告诉 n g 的 怎么去提取。 好,接下来的话, n g 的 就会乖乖听话去读取这个 hello 点加号文件,连同他的历史记录一起发给大墨琴。这里的历史记录就相当于是一个病历本,因为每次看病都不是同一个医生, 他得知道你是什么问题,你之前做了哪些检查,他只能通过宾利本来来获取这些信息,然后大模型看了 hello 点 java 的 内容之后,他还是不能断定这个问题在哪里,他继续就会开出这种搜索系统文件的指令,用来搜索这个 u 字点 java, 然后摁记着把搜索的结果发给大模型,大模型继续返回这个 u 字点, java 这个指令读完之后,再连同记历史记录一起发给大模型。 好,大模型终于拿到了 user 点加号的内容,也拿到了 hello, 点加号的内容,终于可以制定解决方案了。 ok, 然后把解决方案返回给用户,整个任务结束, 我们总共是经历了四次 http 请求的操作,前面讲的都是理论,接下来让我们来抓包实战的演示一下给大家。我们可以看到这里面有两个类,一个 hello, 一个 user, 然后在这里我们是错误了,引用了 user 的 过载函数。接下来我们把这个问题发给这个 code, 这里面我们采用的是绝对路径啊, 接下来我们来看一下啊,这里面我们用到了一个抓包工具叫做 proxima 啊,这是它的第一条请求,已经发送了。 第一条请求其实跟我们的这个问题的解决关系不大,它主要是让大模型来判断它当前是不是一个新的规划。接下来的话啊,我们来看一下。好,这里的话结果已经出来了,他已经给了我们解决方案,就是要给这个 u 的 构造函数添加对应的参数。 接下来的话,我们来看一下它到底发生了多少个请求,以及它整个的一个处理过程。 这里面总共是发送了一二三四五条请求,但实际上第一条请求的话应该是不算的,为什么呢?因为它这里面它只是让这个大模型去分析一下这个问题是不是一个新的问题,如果是的话,那你就返回一个 new topic, 然后它拷了扣的,在扣端里面添加个历史记录而已,跟我们解决问题的关系并不大啊,包括它对应的提示词也是非常的简单,这一个才是真正的去开始解决问题。这里面就发送了非常长的一段提示词,总共是有七十多 kb。 好, 那么大家想一下这里面包含哪些内容呢?哎,就是我们刚说过的,第一个是什么?第一个是用户的问题,对吧?第二个是系统提示词,第三个是 工具列表。哎,我们可以,你是一个医生,你可以开哪些检查啊?这就是我们的工具列表。 ok, 我 们来看一下是不是这些。好,来看啊,这一段提示词的话是告诉这个大模型用户,他之前执行了一个 kleil mini。 好, 这个跟我们的问题没关系啊,你不要去管他,这个才是真正的啊用户的问题。 接下来的话就是对应的系统提示词,这个系统提示词第一段就是告诉大模型你是 cloud code 的 这个大模型,你解决的是编码的问题,你不能够说去,你去解决什么心理医生之类的问题啊。好,接下来才是具体的告诉这个大模型你应该怎么去解决问题 啊?这一段提示词的话,大家可以把它复制下来,好好的研究一下。好,接下来第三个就是工具列表,就是,哎,你去解决这个问题的话,你可以采用哪些工具啊?那么我们来看一下,在下面啊,很长很长。第一个是啊,它支持哪些工具?有这个定义任务,然后任务输出啊, 然后这个也非常的长,看起来不是特别方便,我专门是做了一个解析器啊,然后我们把它复制到这里来,看起来就相当的方便了啊,你看啊,前面就是用户的提示词啊,这个是系统提示词啊,第一段,第二段,好,这个是工具列表,这里面的话总共是十七个工具,定义任务、任务输出啊, 那然后这里面有几个比较关键的工具啊,读取文件,第二个编辑文件,写入文件,还包括这一个啊,去网上进行搜索, ok, 好, 那么这些的话都会一股脑的全部发送给这个大模型,大模型拿到这些信息之后,他应该怎么做呢?他能够直接断定问题到哪里吗?他当然不会断定问题在哪里了,但是他会开检查呀,来,我们来看一下啊, 他这里面返回的是一堆的这个 s s 一 的内容啊。呃,这个内容的话看起来也不是特别方便,所以说我们还是得要把它复制过来,然后粘贴到我们的工具里面去。 好,你看大模型非常的简单和干脆啊,他就直接给你开了个检查,啥都不跟你说。 这个检查就是读这个 read, 这个 read 就是 我们刚刚所说的这个十七个列表当中的其中一个,它连参数都告诉你了, feel pass。 那 么 color code 接收到这个工具指令之后,接下来干嘛?肯定是读取这个文件,然后再把这个文件一起发送给这个大模型,我们来看一下它的第二次请求, 这一次请求里面的话要包含哪些信息啊?大家想一下,第一个是第一个应该是历史记录,就是我之前用过的问题,以及大模型返回的结果, 又要重新再发一遍。第二个就是读取的内容,我们来看一下,看这个还是原来的内容,一模一样没有变,对吧?包括用的问题,包括这个大模型返回的这个结果,结果就是要去读取这个文件,然后接下来就是,哎,我读取到了这个文件, ok, 然后再往下大家猜一下是什么,就跟之前发出的是一样的,还是对应的系统的提示词,以及对应的工具列表,一起全部发送给他。然后我们在看他返回的内容之前,我们先来猜一下大模型这个时候他应该怎么做 啊?假如是你,你应该怎么做?其实我已经读取到了这个加哇的对的这个代码,接下来的话,我们是不是要去搜索一下这个优优的这个列表,是不是大模型的话,接下来应该是要返回的是搜索, 搜索这个文件,搜索这个 user 这个文件肯定了你没有看过 user 文件之前,你不能够断定到底是哪里写错了,对不对啊?那么到底是不是这样的呢?我们把它复制过来,然后粘贴到这里来,我们来看一下啊,好大拇指说代码的语法没有问题, 但是我们要检查一下这个 user 类是不是存在,但是我又不知道 user 类去哪里读取,所以说他就给用户返回一个搜索的命令, 这就是我们的第二次请求,第三次请求想也想得到,直接就去搜索,然后把搜索的结果一起返回给他,连同历史记录一起返回给他。我们来看一下第三次请求, 第一步肯定是历史记录全部的所有的历史内容,接下来最后一个内容是他的搜索的结果, to a result, 搜索结果就搜索到的是这个文件,是这个路径,同样的还是系统提示时和对应的工具列表 发给他之后的话,他的返回的结果。想也想得到,肯定就是要你去读取这个文件了吗?让我们来看一下,你看啊,简单干脆你去读一下这个结果。好,最后一步的话,大家想也想得到,肯定是之前的历史记录,然后就是这个 user 的 读取的结果。好,我们也一起来看一下 一堆的历史记录,这一步就是这个 user 类的读取结果。好,读取完之后的话,你看大模型基于现在的这一次请求, 包括这个 hello 的 内容, hello 加 hello 点 java 的 内容,以及这个 user 点 java 的 内容。那么它是不是就能够断定是这个 user 的 构造函数 没写对,因为这里面只有一个构造函数,而且这个构造函数要传两个参数,而你在这里一个参数都没传好,这样它就能够基于现有的信息能够进行判案了,能够判断这个病情到底是在哪里了,这个时候它就会给我们返回实际的问题的解决结果。 讲道理来说应该就是这样的,我们来看一下它最终的返回结果。好,我们复制粘贴进来,你看已经找到问题了,问题是什么?怎么怎么解决?这就是这一二三四条请求,就是完整的 color code 和大模型的一个交互的过程。 ok, ok, 如果说你接下来你就可以继续说帮我修复,这样子你就可以进一步的观察到这个 color code 是 怎么去修复这个问题的。 ok, 那 么感兴趣同学可以自己去试一下,我这里面只是告诉大家它整个的一个 基础逻辑, ok, 另外如果说大家需要这个工具的话,也可以直接私信我,我会把对应的这个工具和源码一起发给大家。那么从刚刚的实战可以推断,我们无论执行多少次 h d d p 请求,但是 n g 的 本质上就是在不断的在执行, 一、收集信息,二、解析结果。三、执行操作。无论他执行多少次,都是在循环的干这三件事情,直到问题解决。那么接下来我们新的问题是,关于这个执行操作,他到底可以执行哪些操作呢? 除了 color code 自带的这十七个工具列表以外,我们还能不能够有更多的操作呢?这个时候就该 m c p 出场了,请看下集内容,点赞越多更新越快,让我们下期再见!

嗨,大家好,我是西西,后台有姐妹问我,那 mcp 和 skill 又有什么区别呢?今天我们就来聊一下 mcp, 那 mcp 是 什么呢? mcp 是 ai 连接外部数据和工具的一个通用接口,说人话就是它是 ai 连接外部的一个插线板。没有 mcp 的 时候, ai 每接一个工具,它都有单独写一个接口。 今天 ai 要连数据库,我要写一遍,明天连文件系统要写一遍。可以,但多了的话很乱很麻烦。有了 m c p, 大家就都用同一个插头, ai 呢,也只认这一套标准,这样呢,更方便的去调工具,读数据调用能力。 所以它解决的不是 ai 怎么思考,而是 ai 怎么和外界交互,怎么样规范的连接上外面的东西。说直白点, m c p 不 帮 ai 变聪明, 他负责让 ai 更顺手的接上手和脚。如果你把 ai 看做一个大脑,那 m c p 呢,就类似于神经接口, 它让 ai 能去处理文件,调工具,看数据,查系统,它本质上不是一个新模型,也不是一个 agent, 它更像是一套连接标准。总结一下, skill 解决 ai 会什么? m c p 解决 ai 怎么连?我是西西,记得点赞收藏关注哦,拜拜。