公司以后会越来越多的 agent, 所以 openai 的 ceo sam altman 说过的,以后会有一个人的独角兽,就是一个 ceo 管着很多 agent, 当然还有很多人,但是人会越来越少,越来越精英,而 agent 会越来越高效, 但是这绝对不只是一个降本增效的作用, agent 可以 一天二十四小时工作,它可以秒级复制,当我有一个超级员工,我不可能复制十个、一百个,一千个出来,但是当你开发了一个超级 agent, 你 可以有无限多的,而且你可以过国际的扩张, 而且这些 agent 一 年会比一年便宜,因为推理成本在快速的下降。还有公司的组织架构呢,随着 agent 变多,会越来越少,沟通的瓶颈 就不再有,信息不对称就不再有,不了解其他的技术就不再有啊,为己不为公司的存在,因为大家的目标都是为公司好,而每一个 agent 无论是做市场的还是产品的,都有它独特的业务指标。 那么搭这样的一个公司就像搭积木一样的,是一个非常高效,非常快速的。所以以后企业的竞争力呢,就是第一个要最早用上 agent, 第二要用最聪明的 agent, 第三要用你的闭环数据,让你的 agent 强于别的同样使用同样技术的公司,所以要早,要快,要有闭环数据。
粉丝19.7万获赞43.8万

哈喽,大家好,我是你们的小伙伴,是波图。那今天呢,我们就来做一下这个 cloudboard 的 一个正式的安装教程啊,那我们会在这个 linux 和虚拟机下面实现。那这个 cloudboard 就是 之前很火的一个 ai agent 呢,它可以自动的完成我们在这个电脑上的一些这个工作,它可以自动编程,然后自动完成一些任务,然后可以循环 进行这个操作。同时呢他还可以通过像一些微信啊, whatsapp 飞书啊之类的,让我们通过这样的一个对话软件直接远程操作。那大家有兴趣的话呢,可以看一下我们之前那个体验视频啊,但那个视频里面呢,我并没有很详细的做这个安装教程。那现在呢,我就把它整理了一下,希望能够帮到一些想体验的这个用户。 那反正现在有一些新闻非常夸张啊,说有些人专门为了运行这个 cloudboard 去买这个 mac mini, 其实完全没有必要,它在这个 linux 下或者说这个虚拟机下用都是非常合适的,完全不需要非常强的一个性能。 呃,甚至它在这个 windows 下用这个 wsl 也是可以使用的,我之前也用过,但是可能会有一些这个配置上的不一样。那今天呢,我们就会介绍怎么在这个 linux 和这个虚拟机下 实现,那这也更加符合我们粉丝群体的这个 nars 属性,对吧?那其实我个人觉得他在这个虚拟机下使用可能是更加安全的,因为他这个权限真的是放的非常宽啊,万一有什么这个误删呢,或者说把这个环境给搞坏了话,其实得不偿失。那我们可以在这个虚拟机下先体验一下,那废话不多说,我们就赶紧开始这个教程了。 那现在画面上呢,是我们在这个 ppt 里面装的一台这个二五点幺零版的乌本土桌面版呐,那现在是什么都没有配置的一个状态,那我们下面就直接开始具体安装,这一部分我们就不多说了,在我们频道也有很多的一个 教程,在我们主频道啊,我们主频道是这个 sport 图,不是 sport 图 classic。 那 现在画面上呢,是我们要用到的一些这个命令,那未来呢,我也会把它整理到这个记号上面,做一些这个解释,大家不用担心,不会是这么乱的一个状态。那 可能这里的安装方法呢,会融入我对它的一些理解啊,不会完全按这个官方来走,同时我也会教大家用这个 open code 来进行一些这个小问题的修复,那我们就 开始吧,那由于我们是在一个虚拟机里面啊,那第一步操作呢,我建议大家把你这个用户给获取一个速度的一个免输密码的这个啊权限,那我们先在这个 o 版图上面点击这个终端 terminal 啊,大家找到终端就可以了,打开终端之后,我们输入速度,然后 v 速度, 然后输入我们这个用户的一个密码,在你装这个系统的时候是有设这个密码的,是一个权限密码。好,进入之后呢,我们要找到最后一行,然后我们把 这样的一个命令给复制进去。大家注意在这个弯头的这个终端里面呢,你的这个啊,终端的黏贴是不是 ctrl 加 v 啊?是这个 shift 加 insert, 那这样就输进去了,但是呢,前面这一段这个 spoto 你 要换成你自己的这个呃用户的一个名称,如果说你是呃其他名字的话,你要在在这里改一下,那我这里用户是 spoto, 所以 就改成 spoto 了, 然后我们按 ctrl 加 x, 然后按 y 确认修改,然后按回车。那现在呢,我们这个度的这个 啊命令就不需要再输入密码了,因为你用这个 open call 啊,或者是用这个 call bot, 很多时候会用到这个度的一个命令,如果说你要输入密码的话,其实你是没有办法跟这个命令来互动的,所以这个还挺关键的一步,那如果说你这个系统是运行在你自己的 os 啊,或者是 linux 系统上,你就要斟酌考虑这个操作是不是 安全了。那我现在反正已经做了,对吧?那接下来呢,我们要装几个基本要用的这个工具啊,一个是这个括,那这个是呃运行网络脚本要用的一个命令。然后接下来是这个 openss server, 那 这个可以让我们远程的这个终端来登录啊,我们的服务器,因为毕竟我们现在是嵌套在这个 pve 的 一个界面下面的嘛,一些黏贴啊,这样的操作并不太好操作,我们希望有多个终端来进行控制。那这样 开了这个服务器之后呢,我们就可以在 windows 上,或者说你自己控制的电脑上来对它进行一个操作了。那我们把这两个给安装进去,那首先安装之前,当我们还要执行这个 app update 了,那我们就整一段给复制进去,好好,然后我们 shift insert, 然后回车 这里要用按 y, 然后来让它继续安装,好,趁他在安装。我们来看一下本地的这个网络啊,我们等下要通过远程的这个 s 来登录,我们找到这个有线设置, 然后我们找到这台机的本机 ip 是 这个零点幺四七,等下我们通过这个零点幺四七来登录就好了。啊,那这边已经执行完成 啊,那现在暂时呢,我们就不在这个虚拟机上面操作了,我这边演示是用这个 windows 啊,大家可以用自己的这个终端来键登录,那我这边用这个啖啖 啖啖的一个登录,输入 s s h, 然后输入这个幺九二点幺八点幺四七,那这个是默认端口的情况下,你如果修改了这端口的话,你自己去加一些这个 port 的 一个指令。 好,那登录之前呢,你要确认这个指纹的一个匹配,我们输入 yes, 然后接下来输入这个乌班图的一个密码。 好,那现在呢,我们就通过远程的这个电脑,那这是 p v e 以外的电脑,然后我们登录了这个虚拟机,然后接下来我们再做一个比较不太常规的这个操作。啊,那我会建议大家先用这个 open code 先安装一个 open code, 那为什么要用到这个 open call 呢?首先 open call 它有啊更多的 api 的 一个服务商的支持,因为你用这个 call call 的 话,你肯定是需要一个大圆模型的这个服务商的这个 api 的, 你肯定要有一个,你不管是啊, 付费也好,免费也好,你要有一个这个大脑给你来调用嘛。所以说我这里会建议大家用 open call, 因为 call call 呢,它有一个问题,就是默认它是暂时没有这个国内的服务商可以选择的,你需要用这个命令来替换。 那当我们有了一个 open 扣之后呢?我们有一个后手啊,可以让这个软件来智能的修复我们的这个 clock 扣。如果说我们调配错了这些参数的话,那简单逻辑我们就介绍到这里啊,然后这个用的过程中,大家会 理解为什么要用这个 open 扣的?好,那我们用 open 扣的一个安装命令啊,这个是官网的安装命令,大家可以去官网去拿,然后我们等待它安装完成。 好,那现在已经安装完成之后呢,我们要用这个 sauce 命令啊, sauce 命令把这个路径上的这个啊 bashrc 给重载一下,那这样呢?刚刚这个温控录的这个默认路径才会生效,不然你说这个温控是没有这个指令的。我们先 输入一下大家这个画面上来复制一下就好了,然后我们输入这个 open code, 那 这样呢,我们这个 open code 的 一个 ai agent, 或者说编程的一个 agent 就 已经安装好了,大家有兴趣的话也也可以详细去学一下这个 open code 啊。那我觉得 open code 暂时是比这个 cloudboard 好 用一些的,这个逻辑会稳定很多。 那如果说你没有这个 api 的 话,你其实也可以用它这个默认这个 big pic 啊,但是你既然都想用这个 curl code 了,那我觉得你肯定是会有一个 api, 对 吧?那我们就用这个斜杠 connect, 然后我们找到自己这个呃, provide 的 就是这个提供商,这里有这个轨迹流动啊,还有一些像 啊, mini max 啊, g l m 都是有的,像这个智普的这个 coding plan, 然后 mini max。 但是呢,这里大家一定要注意啊,你要选这个呃国内的这个服务商,例如我是用这个 mini max 的 话呢,它会有一个 呃国际版,还有一个国内版,那国内版呢?是这个 mini max 点 com, 还有一个你用的是这个 coding plan 的 话,你要用这个编程计划,那 g l m 其实也是有啊, z a i 还是智普 ai? 对, z ai 和智普 ai 还不一样,一个是国内的,一个是国外的,所以说你一定要选清楚这个国内还是国际的,那我这里用 mini max, 然后我们选这个国内版,然后输入一个 api, 那 这里啊,这个 api 我 会打码的啦。 好,然后回车。那现在他会有一些报错,但没关系,我们继续回车,这里要选模型,我们选这个 m。 二点一,如果你看这个报错难受的话,你可以 ctrl 加 c 退出,然后再进入啊,这个就没有了。 ok, 那 现在这个啊, open code 就 可以用了,那我们有时候可以用它来恢复环境,我们先试一下它这个 api 通不通啊,如果不通的话,你还得 调试一下。那现在已经通了,那我们暂时回到这个命令行, ctrl 加 c。 好, 那现在左边这个呢,就是呃 motbot, 也就是 cloud bot 的 一个官网。然后右边呢,是我们这台机器的一个命令行,已经回到了这个 open call 以外了,然后这里呢,我们用它官方所提供的这个 linux 的 一个呃,命令行安装方式,大家看这里啊,有个点 change, 然后点到这个 os 是 同一条命令,我们把这个复制进去,然后呢,就可以安装 motbot, 然后等他安装完毕,那他会自动帮我们配置好这些 note 啊,还有一些其他的一个环境的东西,但是需要等待一些时间。安装完成之后他会进入一个这个向导啊,但这个向导里面很多设置是需要注意的,等一下我会跟大家讲。 那实际上现在这个安装呢,大家要理解的都是在这个我们的虚拟机上进行的,只是我们通过远程的一个客户端来连到那个里面,这样方便我们来复制这些命令。 然后当这个 cloudboard 装好之后呢,其实它对浏览器的一些调用啊,都是在这个虚拟机上面发生的,然后运行一些程序也是在这个虚拟机上发生,我们只是这里正在了一个控制台。那图形界面的话,大家可以通过这个 rio vnc 啊, pve 的 vnc 啊,或者是啊它本地的这个虚拟桌面来进行。这个我们就暂时不说了,我们今天只用这个网页上的这个虚拟桌面来给大家做一个演示。 那到了这个界面之后呢,其实我们就开始这个啊, cloudboard 或者是 modbot 里它有一个配置向导了,看这个名字还没有改,那第一步它就会问你这是一个什么 powerful, 还有什么的一个 risky 的 一个这个程序,对吧?有风险的程序,你同不同意继续,那我们这里只能 yes 了,对吧? 然后接下来这个啊向导的一个模式,我们用这个 quickstart 快 速模式,接下来呢它就让你选择这个模型的一个快速模式,接下来呢它就让你选择这个 minimax 和这个 智普,其实都是这个国外的一个服务啊,你选它的话,你就要用国外的一个 api, 其实是没有什么太大意义的。然后 open ai 呢,还有这个 n stop, 其实国内的非专业用户其实用的比较少,那我个人可能建议大家是用国内的智普或者 mini max 啊,暂时不做广告了,我们先 skip for now, 我 们这里可以跳过, 接下来它会让你选这个 mini max, c n 啊这些东西啊,但实际上你这也是设不了 api 的, 你虽然说选了这个 mini max, c n 或者是啊这模型之后都是选不了的,那我们就默认设一下就好了,不用管它, 接下来他会让你选择这个 channel, 那 这个呢,就是你通过什么样的一个手机 app 跟这个 probot 进行一个通讯,但是呢,暂时这里还没有国内的一些服务,所以说今天呢,我也暂时不给大家来演示,未来我把这些啊各种模式给调清楚之后呢,我再给大家做一个介绍。我们这里还是跳过 啊,接下来是一个 skill, 你 不需要在这里设置,其实没所谓的。然后这个是户口,是一个他的记忆保存呢,还有出错的一些解决方式,我建议大家把这三个都给勾上,然后回车,然后 他就会安装这个 get 位的一个收费社,就是一个后端的一个服务。那我们等它安装完毕 啊,其实他这个网页就已经可以打开了,那我们现在回到这个虚拟机的一个界面,打开一个浏览器啊,那我们说这个幺二七点零点零点幺,这个是本地的,这个机器幺八七八九就是我们这个 cloudboard 他的一个网页服务了,但是这样你进去呢?虽然说你可以进到这个 cloudboard 里面,但是由于你没有这个 token, 所以 说 你还是没有办法访问这个服务的。那其实这里最简单的方法其实就是用这个 cloudboard onboard 在 这里再进行一次出手话,我们可以 这样输一次,然后他就会把 token 给输入到这个网页,那这里呢,我们可以直接 yes, 然后 quick, 然后这里呃用现有的这个值,然后这些我们就跳过, 然后呃也是再做一遍,然后这样的话他就可以在本地打开这个控制页面。当然等一下我会教大家怎么样在这个局域网里面打开它的一个服务啊?我们这都 keep current, 就是 保持现有,然后我们这些还是一样的一个设置。 好,接下来我们可以跳过它这边显示已经啊有这个服务了嘛?我们跳过,然后这里呢,它可以直接打开 open web ui, 那 当然应该有这个命令可以直接打开这个 web ui, 但是我暂时还不知道好, 那现在呢,他就直接在我们这里打开了一个有 token 的 这个页面,大家可以看现在这个服务是没有报错了,在这个 overview 里面呢,他这个 token 也已经输了进去。那你如果要在其他浏览器上打开这个网页的话,你可以把这个 token 给啊备份下来, 在这个命令行里面呢,你也可以输出它的这个啊配置文件,它里面也有记录这个 token, 它并不是一个强加密的一个东西吧。那你现在是已经可以访问这个服务了,那这里呢,你可以跟他说句话,但是呢实际上你现在是没有这个 模型的,那怎么样来配置呢?那就到我们下一个环节,我们来给他配置国内的这个模型。好, 那下面我们就来开始配置这个模型啊,大家可以看到左边呢是我针对这个 colorboard 做了几个基础设备的这个教程,那当然这个教程也是 ai 生成的,当然也是给这个 ai 看的,所以啊,我会用这个 open code, 然后引用这个教程来帮你进行这个配置,那我们就打开这个,呃, open code, 右边是连接到我们这个虚拟机的一个 s s 曲啊,然后我们打开,嗯,这里报错,不管它, 那现在我们这个页面里面,在这里下面有一个国内 a p i 替换的这个配置指南,那当然你要是人能看得懂的话呢,也可以用这样的一个方法来配置啊,那我们这里呢就用这个 plan 模式, 那我们客户有一个 build 模式和 plan 模式,通过这个 tab 来进行切换,那 plan 模式呢?它不会直接修改,而是会给你先做计划,你可以看下它这个计划合适呢,才来做这个修改。我们可以先说我们我希望替换本机 国内的 api 地址,那如果说你是其他的一些这个 api 提供商,例如你是这个归机流动,那你也可以告诉他我用的是归机流动,然后你把你的 base a u r i o 还有你的这个 key 都给他呢,其实他就会帮你配置了。由于我这个视力里面其实是他配置了这个智普 和 mini max 的 这个 api 的 这个地址的,所以说你只要告诉他你要把它配置为 mini max 的 国内 api 就 可以了。然后,呃,可以告诉他,请根据 这一份引导操作。你如果不给他引导呢?其实他也是会去尝试各种各样的一个操作方法的,但是呢, 他的有时候一些骚操作,他会把你整个 club 给破坏掉,所以说你需要把他限制在一定的这个框架以内。像我这个教程,其实就是给他做一定的限制,给他做一定引导,告诉他在哪里修改会比较好,不然的话他可能真的很骚的,他直接帮你去把整个程序都改掉了。好,那我们现在给个 plan 给他, 或者说让他做一个 plan, 然后他会在这个计划过程中呢,会问你一些可能需要你提供的一些这个信息。 我们先看看他回复什么啊?那根据这个指南,你的配置,他说啊,以设置的模行为这个啊, mini max c n, 然后 mini max, 然后没有这个 provide 的 一个设置,缺乏 base, url 和 api key。 那当前使用的是国际 a p i, 然后若替换为国内版呢,它要替换成这样的一个地址,然后它会告诉你它的一个计划。呃,我觉得这样的一个计划是符合我们现在的这个教程的,那我觉得没有什么太大的问题,它需要我们确认的是呢,你有没有国内版的这个 a p i k 然后你需要希望直接在配置文件填写 api key 还是环境变量的一个方式来提供,那你是否需要执行这个命令,那这三个问题呢?首先我先给他 key, 对 吧?啊?那这里我就给他三个东西,一个是这是我的 key, 反正这个时代了,其实大家要习惯跟这个啊,一些 ai 助理啊,来让他来帮助你来配置这些东西,完全靠人去读这些教程的话呢,虽然说精纯或者说你对自己负责任,但是其实有点花精力的,你要慢慢的习惯要去信任他来做这个事情。 那第二个是直接在我希望他直接帮我配置好,然后呃以后就不会有这个失效的一个情况吧。第三是直接执行,然后你要按这个 type 把这个呃换成 build 模式,它才会自动那个,然后我会有一个额外的需求啊,配置完成后,请验证 api 正常生效,可使用,那这样的话呢,我就可以让它来进行执行了, 那当然这个 key 我 会换掉,大家不用担心了,这个 key 都是一次性的,我们要演示的,它对这个配置文件进行了一个修改,加入了一个模型,然后它重启了这个 get 位,我们的后端的程序 好,然后它验证的这个模型是有的。 ok, 那 现在呢,它就完成了这样的一个配置, 其实这样的配置方式呢,他比起你人手根据正确的方式来配置是有一定的不确定性的,但是我会更加倾向于这种,因为他如果配置错的话,他会进行一个修复,而你配置错的话呢,你要去找各种各样的一个参数的话,会更加辛苦一点,我希望推广这样的一种使用方式啊。 好了,那现在我们就回到这个虚拟机页面,回到这个页面了,我们再来。哈喽,好, 看到有回复了。之后呢,其实就是我们这个 mini max 的 一个端口, api 接口呢,就已经啊对接完毕了。那现在呢,其实我们在这个虚拟机上可以正常使用这个 cloudboard, 但是呢,实际上我们在这个虚拟机上使用呢,它是有很多不方便的,例如这个中文输入法就是一个很大的问题,对吧?那我们可能会更加希望在本地的这个操作电脑上,通过浏览器来控制这台虚拟机,在后台给我们执行任务。 那这里呢,默认情况下,你是没有办法直接通过这个 ip 来进行访问的,它这个端口是不开放的,那我就给大家演示一下吧,这个六它是幺九二点幺六八点零点幺四七,然后端口是幺八七八九, 那由于它并没有开这个呃外网的一个访问权限,所以说它需要另外一个设置。那这里呢,我也给大家准备了一份这个文档。 那在我们这同一个项目里面,我也给大家准备了一个这个局域网访问配置的指南,那我们就可以直接丢给他,那我可以告诉他,我希望请参考以下指南。 那如果你对它这个呃比较有信心呢?对我这个教程比较有信心的话,你可以直接用这个 build 模式啊。那我建议大家还是用这个 plan 模式,我自己就呃搏一搏吧,我们用这个 build 模式看看它能不能直接设置好。那我们也可以看一下这个指南,它其实就是修改了一个 啊访问的这个 buy 的 绑定的一个 ip, 它本来是一个本地的一个啊访问的一个限制,现在它 buy 的 改成 live 之后呢,就可以外网访问了,其实很简单的一个配置啊,你自己配置也是可以的,这个教程呢,也完全可以让人看,没有什么太大问题,我觉得 那它现在就配置完毕了,然后它同时呢还输出了这个 token 啊,如果没有 token 的 话是访问不了的。同时这里还有一个问题啊,就是说它把一个参数呢改成了这个处,它如果说你不设置这个的话,你在这个内网访问,它会限制你在 h t t p s 的 一个方式来访问,你要把这个参数改为处 啊,非安全访问啊,改成这个处之后,你才能使用的这个脚本已经帮你改了,因为我之前遇到过,所以让他写在这个说明里面啊,那现在我们就直接进入。好,那现在呢,他提示是这个 device 验证失败,那应该是这个啊,头肯的一个问题吧,看一下是不是头肯的问题。 好,那我们把这个 token 输入到这个 getway token 里面,它就可以正常访问了。那现在是什么样的状态呢?就是我们可以在呃异地的这个电脑里面 对这个虚拟机里面的这个 cloud bot 进行一个控制,同时呢我们也可以让它控制浏览器。那具体这个 cloud bot 怎么样用?我们就啊暂时不在这个视频里面说了,其实我们前面那个视频已经有演示,只是说你在本地执行命令,然后在异地来实现这样的一个编程啊, skill 的 一个制作,它会在你的虚拟机里面。 那接下来呢,我们就给大家来介绍一下它怎么样控制你虚拟机里面这个浏览器来执行一些这个任务吧。好,那我们回到这个虚拟机的页面呢,第一步呢,我会觉得 你应该是要修改这个虚拟机的一个分辨率的,因为它这个分辨率决定你这个浏览器的一个大小吗?我觉得起码要是一个幺零八零 p 的 一个分辨率才比较好执行一些任务。那我这里点击设置幺零八零 p, 当然这个并不是一个必须的这个选项,你可以根据自己的一个需求来选择。然后接下来呢,其实我们是可以让这个 clubball 帮我们来进行设置的,例如说我希望你为我操控浏览器,我需要怎么设置, 但是我觉得它的一个啊,这个说明并不是很全面,所以说等一下我还是可能会用手动设置的一个方法来进行设置啊,它会需要我们安装这个 chrome h 浏览器的这个 chroma browser relay, 它是一个扩展。 那其实我们现在这个虚拟机上它并没有这个 chrome, 那 我们先可以让这个 chroma 帮我们装 chrome。 那 你先帮我装一个 chrome 吧, 那我们这里等它安装好。那大家也知道这个 clubbot 它的一个对话,它是一次过反馈所有的一个这个过程的,它不会说每次执行到哪里它反馈一定的这个信息。 那这里呢?其实在这个模型设置里面是可以调整的,但是我现在暂时还没有很明确的这样的一个配置还没有尝试过。大家先这样用着吧,大家或者说你自己去给问一下这个 clubbot, 它帮了你来解决。好,那我们现在 它这里已经帮我们在这个 chromebook 上面安装好了。为什么说 linux 它对它这个 chromebook 兼容性比较好,就是它很多东西都可以直接在这个命令行里面执行,它是不需要你那个有呃这个图形界面的,你看这里这个 chrome 呢就已经安装好了,那我们可以打开 chrome, 然后我们不登录了,这里就接下来呢,我们要把这个 chrome 给装上,那它这里提示我们要去这个 chrome 的 这个 网上应用商店来进一个搜索添加,但实际上他这个信息已经是过时了,因为这个插件已经在这个 浏览器里面下架了,所以说我们要自己手动安装,什么安装的方法你也可以问他,但是我这里就直接给你们展示了,在这个右上角有一个这个扩展程序,然后管理扩展程序,然后点开这个开发者模式, 然后接下来呢我们就可以找到这个安装包。那我们在安装这个 cloudboard 的 时候呢,其实呢它已经一并把这个扩展呢给复制到了我们电脑里面,但是怎么样去找呢?我们要用到这个命令行 输入一个这样的命令啊,这个 cloud bot browser extension, 然后 install, 然后它会显示它的一个路径啊,它会告诉你在这个 cloud bot browser, 然后这样的一个路径之下,那我们来看一下是不是在里面啊? 然后点 cloudbox, 哎,我们看到了,那其实是你要输入完这个命令之后,它才会在这个文件夹里面啊,如果说你没有输这个命令的话,它里面是找不到的。 好,我们找到这个 browser, 那 这个呢就是我们这个扩展文件夹,那确认完这个路径之后呢?我回到这个 chrome 的 这个扩展程序的安装呃页面,我们点开左上角这个加载未打包的 换程序,然后我们找到刚刚那个目录 cloudboard, 然后 browser, 然后找到这个 extension, 我 们选择, 那现在呢他就把浏览器控制的这个功能给放在这里,然后右上角有一个扩展,然后我们点开 pin 把它钉在这里,然后接下来呢我们就可以打开它的一个控制,那现在这个浏览器呢,其实就扣受到我们这个 cloudboard 的 一个控制了, 那这里呢,我们再回到我们这个啊自己在使用的一个电脑啊,那我们就可以打开一个网站来试一下,我现在搜索识拨图,大家可以看呢,其实现在我们就用本地的这个浏览器控制了一台虚拟机上面这个浏览器, 哎,其实我们可以看到这里在操作了,但是由于你去看它的话,它会打断,所以说我们现在再来看了这个识拨图,它已经搜索出来了, 然后其实啊,那现在我们这酷豹大部分的一个功能就已经配置完毕了,接下来呢就是你个人的一个发挥了,对吧?那下一步的话,大家有兴趣我们也会给大家来介绍一下它的一些这个深入使用的一些方案, 还有一些啊其他配置的一些这个东西吧,例如说微信控制啊,或者是什么飞速控制啊,或者是其他一些东西,大家如果有兴趣的话就点赞投币催更了,如果点赞超过两千的话,那说不定我就快点出这个教程,对吧?这种方式也希望大家喜欢。 好了,那我是你们小伙伴说图呢,欢迎关注我们这个说图卡斯频道啊,那他会有更多的像类似这样的一个信息,那我们就下期再见喽,拜。

一天学一个变态的大模型知识点,今天讲的是框架的作用和能解决的问题。然后呢我们还要说一说啊,就是现在我们要用这些 agent, 是 不是咱们得去准备一些跟框架相关的东西啊?那框架这个东西 该怎么去理解呢?其实啊,就是大家咱们自己做事的时候啊,就是更多的时候我们是用人家的现成的,那我给他举个例子啊,就人家现成这些框架啊,比如说奥拓 gpt 啊,什么什么各种 gpts 之类的啊,现在框架 我跟大家这么说吧,就现在这个框架我我先简单多啰嗦两句啊,就框架好像用的比较多,给我整体的感觉就是大同小异,就是都是你说他好吧, 反正这块儿缺点东西,你说那个好吧,那块儿缺点东西还真没有一个,就是完全意义上我觉得非常好的,但是现在大家用的最多的就还是这个 auto gbt, 或者是这个呃, mate gbt 之类的这些就 get up 的 star 数是比较比较多的,而且就是大家用起来相对来说也是比较容易的,后续我们也会给大家去讲啊, 然后再但是我给大家说一说感受,就是你不要觉得现在这些个开源项目这些框架哇,他就无敌了,他就是个 a 阵,能解决的问题是很多的,即便现在啊,就是最强的,做的最好这些框架我跟大家说一句实话,就是他能解决问题非常局限,他能把这件事做出来的可能性非常低, 就是说 a 阵这个东西他还是持续的迭代和更新的,他现在想让你去真的就是自动化的,完成个东西 大概率得到的结果是不那么尽如人意的,这点我希望大家清楚。大家能说是不是因为他是你讲的不行,这玩意跟我讲也没关系,这东西就是现在啊,人家做着什么东西,我们没能力自己去开发 你的基作模型,也没能力去设计一些底层的架构,底层的工具去调用啊,就要用这些动作,然后怎么去处理这些记忆,这东西其实都不是我们去做的,我们是作为一个使用者,怎么在人家的框架基础上啊?比如说新创建一个角色,新创建一种动作,添加一个 api 调用方式, 我们是在这些基础上做一些增删改查的,但是现在说心里话没有一个框架我觉得真的是能满意的,真是能用起来的,无论是就是付费的也有啊,付费的那玩意 我用了,我选了几家,我本来想讲的,但是我不说哪不说哪些家了,就是用起来跟这个免费的,就是跟这个开源的,我觉着没啥太大的区别,所以说框架啊,嗯,咱们就这么说吧, 对我们来说就是个学习理解他们任务当中的一个流程,熟悉他,哎,是怎么定义的,逻辑上怎么去做的,好让我们知道 a 人的整体的框架,咱们从一个输入到我一个输出,他具体流程怎么走啊?咱们理解这些个事,我觉得在这就足够了。为什么?因为我觉得工具这个东西啊, ai 这里面现在更新换代的非常非常快,你现在就是即便你把这个什么 auto gbt 没改, gbt 你 熟练掌握了,可能用不了半年,一个新的框架又出来了,一个新的框架可能又是一个颠覆性的超越,又完全碾压了前面这些框架。 这些事是都有可能的,因为我每天都在看新闻,每天有都有同学问我老师新出的框架,我要学新出的东西我要看, 我给我的感觉我都快麻木了,就是框架实在太多了,咱们去理解去用就行啊。但是我估计后续啊,肯定这玩意早晚都会被更新换代,早晚都会被替代掉的啊。然后 我们来说一说框架当中啊,他其实这些东西啊,他帮我们实现了什么,这些东西啊,就是无论你用哪个框架,咱们都少不了一个东西,就是你得有这个 key, 咱们都得有这个 key 才是可以的。什么叫做一个 key 呢?我给大家举个例子,就是我们要调一些基座模型,是不是啊?就是你要调基座模型,这都不用想了,一般情况下就是 g、 b、 d 四啊,这个是最好的,基本上现在所有的这些框架都是要不三点五,要不就是四,反正就是 token 的 价格有点区别 啊。那这边大可能说我换别的行不行,换别的还真不行,就是我我自己没尝试啊,但是我问了几个哥们,他们搞这些本地化的一些私有 agent 啊,他们他们他们给我的反馈就是这件事真不行,你本地自己去研究,即便是在自己专业领域当中, 他的这些能力其实是本身具备的。你可以这么理解,就是我是让啊,这个大模型做,我专门的一个医疗领域,做专门的一个什么法律,什么金融领域啊,就是个领域,我这个数据都问给他了,但是他还是做不好,为什么?因为感知、思考、动作还有记忆这些个能力,是在这个大模型训练的时候 他的一些基础能力,而不是说他下游应用的一些能力。他如果说你的模型都不具备这些个基础能力,你怎么去做微调,怎么去做下游任务是都不行的。 对这条路我估计大家可以把这条心死了,不要想着我自己去训练一个私有化场景,然后我用这个 a 神怎么样的?我问过好多人,这条路是都行不通的,都是比较差的,所以说业界通用解决方案是什么?就是花钱, 最佳解决方案就是花钱,而且而且咱们也说这个,这个价格啊,这个价格你可想而知是非常非常昂贵的一件事。 但这些框架当中它都帮我们去做了什么呢?其实就是这里边啊,我觉得这些框架当中啊,它都帮我们实现这些东西,就是啊角色,然后交互,然后还有这个 api 调用。我觉得就这几点, 一个框架当中,比如说凹凸或者媒体 ppt 里边,它会给你预定一些角色啊,比如说你现在是一个程序员,你的角色是什么?你现在是一个医生,你的角色是什么?你要做什么事?根据你不同指令,它会给你写很多例子的啊,在这个例子当中角色该怎么去定义 好?那就是交互,交互,就比如说你为了完成这件事啊,你应该跟谁做交互?程序员跟产品经理之间做交互,程序员啊,程序员就只跟他交互啊,产品经理跟谁交互?你的角色可以跟谁交互?然后最关键的就是我用这个框架啊,最大的一个核心,最大优势是什么?就是工具是现成的, 就比如这里边现在所有的工具给我的感觉都是这样哇,都是一个,就像个百宝箱一样,就是反正啥 ip 都能用,我让他问天气也能,然后浏览网页就不用说了,用各种浏览器,浏览网页,用各种缩显器,他都能的。 所以说就用这些框架啊,是用人家给我们设计好的这些个 api。 这 api 有 多少种呢?嗯,咱不夸张的说啊,就上百种,肯定是打不住的。因为你要,比如说你要访问一个公众号, 访问一些微信上的接口,那这个微信,这个公众号,那 a p i。 有 多少个了?海了去了,是不是你要你要再去查一些什么企业的信息啊?什么个人的信息,那这每个地方都有 a p i 这些框架,就帮我们写好了很多这样的例子,怎么去掉这 api? 说白了他再去执行这些个动作,就这里边啊,就是他把角色定义好了,然后角色教会定义好了,然后 api 调用给你了。那其实对我们来说就是现成的模板,咱可以直接用了,但是更多的,其实我觉着啊,还是希望大家怎么样,就是要这样 熟悉流程,然后我们肯定要做自己的事,你做的事你不一定是开软件公司的吧?你肯定是有你的一系列人员,然后你们这些人他们做什么, 我们可以去模仿他们角色定义的方式,他们怎么交互的,以及人家这块涉及到这些 a p i。 那 在我的任务当中我可能会涉及到哪些个 a p i 呢?就要把这些 a p i 的 一些调用方式我们给它加进来。其实这些东西啊,我觉着你觉得这个框架当中啊,咱们在理解时候特别难吗? 我,我讲的课比较多,我讲算法、讲论文、讲项目、讲原码,其实我都会觉着难度挺大的。但是这个框架吧, 他这个难度还真不大,因为就是整体逻辑是比较简单的,所有东西都是到调大模型生成的,他可能并没有太多跟算法、跟数学啊,跟概概念相关的东西,其实都是什么,都是流程, 第一步干什么,第二步干什么,第三步干什么啊,都是流程怎么调 api, 然后反正调 api 也是现成的。反正对我们来说,我,我就觉着啊,如果说我要用这些框架, 我无外乎就是对应好我的角色啊,然后我把我需要用的 api 给它加入进来,就相当于我可能不仅仅执行这些动作,我可能执行点特殊的动作啊,我要执行什么动作? 把这些整理好,其实它的流程我觉得来说是非常类似的,所有里边核心操作都是把啊,就是通过你的角色获取到你这个人基础的一些啊,就就基础的一些命令和基础的属性。 然后呢去啊,根据你的命令当做提示调大模型,然后调完 api 之后呢,把 api 返回结果啊交给大模型,然后生成一些记忆,然后再根据记忆再决定下一步怎么去走。这地方来说,我觉着就这几点吧,框架来说,嗯,就是特别多啊,这个这个到时候大家任选,你想要什么框架都行,我, 我给大家列出来是我觉得 k 二 pro 当中死大叔比较高的,也是现在大家呼声比较高的,用的比较多的,我用了一下,我真觉着就是区别不是特别大,而且这东西安装起来比较简单,但是大家会发现一件事,就现在这些框架啊, 都是极简的,他不像是你,几年前啊,你想跑个看人像不?哎,我天呐,几年前要跑个看人像不?你配个环境,你没个没个两三天你配不出来,还得编一,这整这贼麻烦。 但是现在呢,这里边啊,你的配置极简单,就是我估计用不了半个小时的一个时间,你就可以把它给它配置起来,只要你有这个 key, 你 就可以很快上手,很快去理解它的流程啊,它的任务是怎么做的啊?反正这个框架我觉得用起来都不难啊, a 阵当中都帮我们把这件事做了一个简化,极简,你就可以把这个东西用起来。

今天为大家介绍 deepclos 项目中一个非常硬核的工具, agent vm。 简单来说, agent vm 是 一个轻量级的 node 点 g s 库,它能在 work 县城中运行一个基于 wism 的 linux 虚拟机, 这让它成为了 ai agent 理想杀核环境。这个虚拟机核心运行的是 app, linux 是 利用 container to wsm 项目创建的。 值得一提的是,整个项目包括网络站和实现主机目录挂载的复杂功能都是由 opps 四点五便携完成的。 a j b m 的 功能非常全面。第一,它支持全功能的网络连接,内置 d, h, c, p 和 nat, 这意味着你的 ai 代理可以直接访问互联网。 第二,它支持主机文件系统挂载,你可以轻松实现数主机和虚拟机之间的文件读写。 第三,你可以直接执行 sell 命令并捕获输出,而且因为它运行在独立的沃克线层中, 完全不会阻设主程序的运行,使用起来也非常简单。通过 npm 安装 deepclaws agent vm 后,只需几行代码就能启动 vm 执行命令。 如果你在使用 vesilai sdk, 仓库中也提供了相应的集成私立,让 ai 调用工具变得更安全。 最后,必须提醒大家,这是一个高度实验性的项目,为了保持依赖最小化,他使用了 note w a s i 可能存在一些安全隐患,因此请谨在实验环境中使用,不建议用于生产环境。 如果你对构建 ai 代理沙盒感兴趣,欢迎访问 github, 关注 agent 微 m, 我 们下期见!

今天给大家分享一下关于 ai 的 一些相关的一些名词及行为,具体有什么作用?主要是像 agent, skill, 沃克弗洛跟 m c p。 当然 prompt 简单过一下就好了, 它们之间的一个具体的一个区别是什么?即我们怎么去用。 skill 是 arabic, 它十二月,去年十二月的时候去推出的一个东西啊,这个东西其实有点像 loser, 嗯, 话不多说,第一步啊,第一个就是那个 prompt。 prompt 大家应该是比较简单,用的比较多了,相当于说我们经常性会, 它主要是就是一个关键词,或者说是预设的一个人设,给到 ai, 让 ai 以这个人设的一个形式去突出你的一个角色型的一个内容。例如我们做一个番茄炒蛋嘛,我们这边动统一用番茄炒蛋这个例子来讲解,我们不会讲的比较技术性的。 如果说你要炒个番茄炒蛋,你预设一个 promise, 相当于说如果说你是个川菜的师傅,那么他自然就吐出一个加辣的一个番茄炒蛋,如果说你做粤菜,那他默认可能就不给你加辣,就相当于他就会代表一个 你回答的一个人的一个个性角色及背景的一个信息。所以说这 promise 是 用的比较多。那个前段时间那 ai 刚出来的时候不是还有经常性有 promise 工程师这么一个东西吗? 这么个角色嘛,说这一块应该大家用的比较熟了,不过 prompt 现在也经常性用于我们做一些约束或像 root 这么一个东西去约束我们的一些程序,它不要跑偏,所以这一块也是非常非常重要的,这个怎么写的话,这个文案怎么写啊?这个就不说了。 然后第二个就是 agent, 就是 agent 这一块,像前段时间被梅塔说过的 minus 也够牛了吧。其实 agent 这一块呢,底层都是用调模调大模型,但是它其实是将用户的问题拿到之后,去 通过大模型,然后去分析要具体要怎么去调 m c p, 或者说是调工作流,或者说调 skill, 相当于说由 agent 统一去分配去执行。我们的一个 智能题,就相当于说我们这一块如果是番茄炒蛋,你告诉他我要做个番茄炒蛋,那么他会思考,那我先点火,下一步我们思考去用油,那用油的话去哪里去用呢?那去 m c p 呢?去去那个 workflow 里面去拿油,或者说 scale 里面去拿油, 再把这下一步的这两步的结果再发送给智能体,然后智能体再去思考下一步再干什么,把油放到锅里,然后再去放土豆,相当于说这么一个流程,一个流程的去衔接上, 总总结来说就是这一句话,用执行结果作为下一次决策的输出,形成那个 price, 呃, price, action, observer 及 replay 的 一个闭环,相当于它不断不断的循环这么的一个过程, 它每次过程呢,相当于说就把你的问题、思考动作跟观察的结果拼成全新的 prompts, 再给到一个大模型,那么大模型再撸出来,但是它同样也会出现一个问题, 大家可以看到它会无找不到答案的时候会无限循环,大家有用 i d e 去问问题的时候,经常性会无限的循环,那个问循环的那个问题,我也经常性遇到,因为就像你找土豆,你去说你做一个土豆丝,你它就在冰箱里没有找到土豆丝,它就一直找,一直找,一直找,导致 导致挂掉了,所以说经常性要人工把它停掉。所以说我们需要设立一个最大的步数,相当于说你找两次没找到,那就返回用户,那 你你需要的主动没找到,那你可能提供一些其他线索,去冰箱找,去冻冷冻箱里面去找,这样的话它就解决了这个问题,最终返回 answer, final answer 的 一个形,那个结果去终止掉这个行为,所以它就是一个智能助理,相当于说我们的 行政总厨,相当于总行政总厨的形式,去掉我们各类的那个形式啊。 第三个就是我们的 m c p。 这 m c p 其实大家不用理解的那个复杂,其实它就是一个协议,就是通过智能助理去 用 m c p。 协议的形式去掉我们的一个工作流,或者是是接口,或者说是 tour, 相当于经常性 m c p client, m c p server 的 一个东西啊。其实大家不用关注,只要关注它 m c p, 它只是通过这个协议去调,相当于你告诉任正助理,通过自然语言的形式去告诉助理,这个 是我要做个番茄炒蛋,那么 m c p 的 m c p, 他 会去掉,那这人助理去用,用 m c p。 去掉冰箱,那冰箱找到了土豆,返回土豆,那去那个那个那个储藏箱去找油,那么他就去找油。 这么一个它仅仅是作为一个协议去通讯的一个形式,让各个流程连接上各个协议,但是它只是连接上,但是不是具有一个能力啊,这是大家那个需要注意的点。但是那个我这边也简单写了一个东西,做了一个例子,相当于说 你通过 agent 去统一身份,相对来说我这边是一个行政总厨,我行政总厨去告诉所有的厨房,我是一个,我那个大厨在做饭了,那大家都知道了,那把这个对应的状态去告诉所有人,所及所有的工具已经开始做饭了,那 告诉告诉所有人之后,那我要告诉那个例如配菜的也要知道吧,跑堂的也要知道,切墩的都要知道,相当于说下面有十个人,我都得要通过 m c p 自然语言,或者说是一种加密形式的语言,告诉他们 菜好了,或者说需要什么东西。还有最终就是一个设备的一个管理,相当于说人知道了,设备也知道了,相当于说通通由 m c p 去协调,它只是个神经网,嗯,它这是一个协议而已,所以说就是这样一个东西, 所以说我们现在也更多用 m c p 去做一个认证,相当于说带上对应的 token 去认证, 然后第三第四个了吧,第一二三四,第四个就是我们的一个工作流,工作流其实就比较简单了,相当于说大家有没有用到扣子的时候,他其实就是一个简单的工作流,他工作流其实他 更多是一个固定,将多个 scale 按固定顺序串起来自动运行的。例如你行政的厨要炒一百份炒饭,那我肯定不能说每次都执行去,去掉油,去掉土豆,去掉什么东西,重新再执行一次编码,这样的话就比较麻烦, 所以说我们经常会用 workflow 的 形式,就是那个连连看,去连出点火、加油、放土豆、抡铲子、放盐、出锅等等的一些流程。这样的话那我抄一百分,抄单我只要执行一百次,那我这样就能得出结果了,而不用去消耗那个 ai 的 token, 或者说是这么多的复杂的代码去执行了。常见的那个像大家那个小红书自动发帖,大家也应该知道,还有自动化画漫画,然后自动化的那个 banner, 然后自动化的那个, 那个动画最近那个很比较火的叫 ai 漫展漫画吧,好像是,这个就是用工作流,主要是像主要是按固定那个顺序串联起来的一个执行任务吧,所以说这一块那个应该比较好理解。 然后最后一个就是 skill, skill 就是 今年去年十二月十六发布的一个 astropica 发布的一个 skill, 这个东西有点像 root, 给大家去做简单的一个理解, 嗯,怎么说呢,相当于说我们刚才是做番茄炒蛋,告诉 ai, 告诉 ai 去调调调各类的东西,但是我们用如果用 skill 的 话,可能就不需要这么麻烦。 我把那个番茄炒蛋的一系列行为去把它打散掉,相当于说第一步去打散食材,第二步去切食材,就相当于他把每个步骤都切掉,切成一个个技能。 为什么他这样的话,他其实有点像工作流这么一个切开切开啊?但是他只是由一个 那个描述,相当于说是一个名称加描述,相当于说一个目录,它会给 ai 看一个目录,它目录里面就告诉我这里面有什么什么技能,而不会说是把它所有的一个能力说那个告诉 ai, 相当于说 token 减少了嘛?那我只要告诉它的一个作用, 打散石材跟作用,打散石那个切配石材跟作用相当于这里有十个,十个技能。那么 ai 读到的时候,它如果说 能读到这个前面两个,基本上 ai 读的话都会读这个名称描述,然后读到这个里面的一个描述之后,然后它才会去读 scale md 里面的文件,判断你的一个描述是否跟我里面技能进行一个重合,如果重合,那它就会相当于说去进行一个 代码的一个那代码或者说是执行文件的一个调用,相当于给你一份手册,那我手册到手册上搜到它里面有切菜,里面有切堆这么一个能力,那我就是把这个能力去进行一个调用这么一个过程。 当然它能力调用除了那个可以执行代码,还有对应的参考资源,也可以说是一个 promont, 相当于说把 promont 写到这里其实也是可以的, 它里面还可以执行对应的一个代码,所以说它里面总总结它就是一个渐进式,譬如相当于说它是按需去加载它每一个技能的能力,然后提供一个操作手册,怎么用工具, 从而从而去节约 talk 这么一个小目标。但是总体来说,我觉得真正用下来的一个感觉啊,其实它能 能更加简单的去方便的去大家去用这个 ai。 因为正常来讲,我们可以把所有的能力切用自然语言的形式去进行一个描述,然后去理解这样的一个形式很容易去我们把整个的一个自己的工作,去把它 能力打伞,然后去调用,这个是很方便的。当然大家可以看到我这里面的下面的一些内容,其实那个用 jason 的 方式其实是更好,因为那个 jason 其实它更好理解嘛,用自然语言的话,其实它那个还是要去 ai 去进行一个理解,去对话,所以说这一块 skill, 其实这一块我倒觉得有点像我们的一个 root, 相当于说我们这个是那个 goodbody 里面的 root, 相当于说它我每次执行代码的时候,它需要去做一些相关联的事情,但是它每次它都会读完这里面的东西,所以说是比较麻烦。而 那个 skill 它我它只要把里面的功能有的话它就会读,没有的话它就不读,相当于说这里面是非常非常好的,相当于只有一个目录,所以说主要是这几个 总体来说相当于说 agent, 他 去统一的去指挥,通过 m c p 去指挥那个工作流或者 skill, 或者是其他的一些执行的那个 m c p 的 一些托, m c p 最终执行的都是一些工具啊,相当于说去浏览本地的文件夹,或者是调用其他的一些接口,所以说总体来说就是这样。嗯,不知道大家有没有理解啊?主要是就是通过番茄炒蛋的一个功能。

想学大模型,但 ai 技术那么多,到底该从哪开始呢?你是不是也卡在这了呢?别急,今天我用一个视频给你彻底讲明白,其实大模型要学的,总结下来就这十五个模块,覆盖从底层算法到应用开发的所有技术栈。哪怕你只是一个普通的本科生,或是学习能力强的大专生,能 也完全能跟得上第一步。咱们得先掌握一门编程语言,那必须是 python 出场了,不仅语法友好,还能在 windows、 mac、 linux 各个系统上反复横跳,就连你家那台二零一二年旧电脑说不定也能跑起来。 不过选它可不只是因为简单,更因为在数据分析、深度学习和机器学习这些 ai 核心领域, python 的 热度简直就是断层。第一。 接下来如果你学历不是特别亮眼,那下面这些你可要好好记笔记了,它是能够帮助你跨越门槛的关键。以前是工具框架类, linux 和 linux, 你 可以把 linux 想象成一个工具强大的 ai 应用工具箱。 刚入门 ai 开发的你就像一个新手厨师,而 linux 就是 给你备好厨房和全套厨具的工具间。之后的开发,你都可以用它提供的工具像搭积木一样组装起来。 是不是有点像 ai 界的乐高呢?像 melvis 这样的向量数据库,就像一本精准的数据菜谱,专门给模型做数据缩影,帮大模型准确连接上你自己的私有数据。听到这,你可能会问,为什么非得先学这些框架呢?因为它们都是为后面两样最重要的技术站服务的。 ig 解锁、增强生成和 age 的 智能体开发。 ig 和 age 可以 说是目前把通用大模型变成真正可用的产品,最高效也最经济的技术路径,你可以轻松用它搭建智能客服 ai 咨询助手,那淘宝客服来说,能实现二十四小时自动回复 清楚掌握店铺上新和活动,还不用发工资,是不是实实在在的教你通宵呢?把大模型的推力、能力和你手上的私有数据结合起来,这才是企业真正把 ai 落地的方法,而掌握这些技术的人,也正是现在企业最缺的 ai 人才。 那我也是整理了一份某些大厂内部推荐的大模型进阶学习路线,里面就包含刚才说的十五个系统模块、大模型未来发展方向解读,以及完整的视频教程,如果你真心想学,不妨可以去看一看。

今天我们来聊一个更深的话题,通用的 ai 的 agent 和垂直类的 ai agent 到底谁更有商业价值?这个问题是不是很二手?就像去年大家争论大模型还是小模型一样,现在技术变了,但逻辑没有变。 那先说结论,单纯的做垂直的 ai 的 agent, 死路一条,因为从技术本质上看, agent 没有任何秘密,它就是一个会调用各种工具的大模型。这就好比操作系统, 你用 windows 还是 linux, 大家都能用。那如果你只是基于开源的模型,微调了一个所谓的垂直的 agent, 那 么你根本没有护城河, 那今天你能做,明天别人比你做得更好,那真正的护城河在哪里呢?在于你围绕 agent 构建的那些数据啊,工具啊,还有行业理解。举个例子啊, 做一个制造业的质量控制的 agent, 你 的核心的竞争力不是这个 ai 有 多聪明, 而是你有没有独家的质量标准的知识库,能不能对接集成到企业内部的各种系统,懂不懂整个质量控制的流程。这些东西不是通用大模型,不管是 open ai 还是 deepsea 都搞不定的。 所以,呃,未来的 ai 的 agent 就 像操作系统底座大家都差不多。 不要试图去造一个垂直的 agent, 而是要用通用的能力去解决垂直的问题,这才是普通创业者的机会。 你是更看好通用派还是垂直派?欢迎在评论区留言,我看看谁的眼睛更毒辣!

通过一种更简单的调整,把 circle 的 准确率呢从百分之八十提升到百分之百。这是来自于 worso 的 一篇文章,这篇文章呢是发表在二零二五年的十二月二十二号,那我们看他做了什么呢?他在做一个 text to circle 的 一个 agent, 他 叫 d 零啊,我们知道他的网站呢是叫 v 零。 文章说他们花了很长的一部分时间呢,做 text to circle, 用特定的一些工具啊,还有一些上下文工程的一些手段,整个设计完效果并不好,然 然后他们就尝试了其他种办法,然后把所有的这些该砍掉的都砍掉,最后呢就留下单一的一个公式,就是 bash, 也就是说 commands 命令。呃,里边呢,只用到 grab cat, 还有 l l s 这种基础 linux 命令。 然后呢,再去做 text to circle 的 时候,它的准确率呢就从以前的百分之八十呢变到了百分之百。这是他们做的第一版 agent 的 程序啊。第一版 agent 的 程序的时候,他们给这个 agent 呢, 会有好几十个工具,那我们能看到啊,这些工具的话,有 i t t 的 查找啊,有 scanma 的 查找啊,然后还有一些后验证,还有包括执行语句的一些方式,都是跟 circle 相关的,因为它要完成 text to circle 的 一个方法嘛,他们在设计这个过程中呢,发现越设计越脆弱,越设计越需要人工去维护,然后效果呢并不是很好。后 来呢,他们就想出了一种新的办法,说如果我把这些都砍掉呢,会怎么样呢?他们的 v 二版本呢,就非常简单了,说只用了 unix 这几个命令,然后查询文件,去 读取文件,还有 find, 还有 l、 s 这些基础的这些命令,这些命令呢主要用于去读寻 sql 语句的语域层。语域层之前我们在讲过啊,这是数据库层做 cube 非常重要的一款,因为它会把你数据层的底下的数据和上层的业务呢进行一个对齐, 也就是你可以理解成它是一个业务指标,对 sql 底层数据的一个描述信息就可以了,那它后边的所有这些描述信息呢,就成为文件型的这些信息,通过这几个命令去进行文件系统的读取和操作,让模型自己去思考我什么时候应该做哪些动作,我什么时候应该执行什么。最终测试下来的效果呢?它的速度呢?提升了三点五倍, 然后百分之三十七的更少的 top 看,然后百分之百的一个准确度,我们在这啊能看到他基本的一个测试的一个效果,就是他效果变强了。那这里面呢,最重要的跟我们启发是什么呢?第一点呢,是我们构建这些工具呢,也许 unix 早就已经解决了,我们就不要去重复造轮子了。 第二点呢,就是如果我们替模型写了很多提示词,告诉他一个推理的方向,有可能我们限制住了,限制住了模型更好的选择。 第三点呢,就是我们的语域层做的是非常好的,就我们非常有一个非常好的一个文档,也就是上下文的一个描述,让模型呢可以理解这些描述,去执行相关的命令。还有一点,最佳的 agent 是 使用那些最少工具的 agent。 接下来是构建 agent 的 一些指导,我们一定要从最简单的架构开始,就是模型加操作系统, 然后加上我们的目标,我们从这个阶段开始去构建我们的 agent。 真的, 如果你需要更复杂的东西去做的时候,我们才引入复杂的提示词,复杂的流程和描述,还有就是简单的一个架构呢,并不是全部, 最主要呢,你需要去投入时间去花在你的文档的修正和清晰的这些描述,还有很好的结构,因为这些结构和这些描述呢,是你能给到模型最佳的内容呢,完成更好的一些任务。 当然简单架构呢是远远不够的,我们需要花大量的时间去投资在文档啊,清晰的命名,还有一些更好的组织,完善的一些数据的结构上,让模型以更高效,更准确的能力完成我们的任务。如果你觉得今天内容对你有收获,给我点一个小心心。关注雷哥,关注 ai 工程化落地。

今天我们讲一下智能企 agent 的 通信与协助的技术, 那么也是从六个方面来讲这个智能企 agent 的 通信学则。 首先还是先把这个智能企,嗯,简单这个介绍一下,然后下来我想讲一下智能企的通信技术,然后还有它的这个智能企的这个啊写作机制, 还有这个智能企呢?他们怎么样进行通讯和写作的一个关键技术。另外再举一些案例,最后再讲一下它的这个未来的发展趋势和挑战。 嗯,先普及一下什么是智能企啊?什么是智能企? a 整 智能企呢,它是具有这个自主的决策能力,也说它能够感知这个环境信息,然后它可以独立的做出一个决策, 不需要人的干预,而且它具备了这个自学习,还有这个优自优化的这个策略。 另外一个呢,这个智能起呢,它可以与这个环境进行这个交互啊,也就说我们可以通过这个传感器 来感知这个环境的变化,利用一些执行器,比如说用这个机械臂或者是这个软件的接口呢,它主动的作用于这个环境,这样话就形成了智能起和环境的一个 闭环的反馈的系统。然后呢智能企呢,它是具有目标导向,也说它可以通过这个通过这个规划, 然后呢还能推理,而且智能企它可以用一些工具呢来实现一些预设的这个目标。呃,它的行动呢,具有明确的任务指向,比如说在物流系统里面, 我们要做这个物流的分拣,那么分拣的这个智能起呢,他就可以对货物呢进行分类。 哎,比如说还有这种,呃,货物的搬运啊,搬运的智能起呢,他就可以搬运啊,那么他们之间其实也是有围绕一个目标进行一个协助。 再比如说像我们的客服系统,客服系统呢,我们的客服应答的智能体呢,它可以解决呃这个消费者或者是顾客的一些问题啊,这就带有目标导向性。 智能起呢,分类呢,大的来说呢,分成四个类,一种是反应型的智能起,也就是说它可以对环境变化做出一个响应,比如说像我们的温度的控制的这种系统, 他的这个智能机,哎,温度发生变化了,这个这就是这个智能起,就可以对环境这个温度呢做出一个硬。那么他也有一些缺点, 他缺少这个长期规划的能力,哎呀,他适用于这种,就说我们给他一个很明确的规则,按照这个规则进行执行, 所以这就是这种叫做反应型的智能企。那么还有一种叫做认知型的智能企, 认知型的智能企呢,它相比反应型的智能企呢,它就具有一个对 复杂的这个推理啊,他能够推理啊,推理我前面也讲,比如说他可以进行一些确定性的推理,还有一些不确定性的推理,确定性的,你比如说 我们可以通一些谓词逻辑啊,或者是一些比如最简最常见的像这种假言推理,假言三段论,还有像这种语音网络产生式的表达不确定性的推理呢, 他就很多了,比如说像核心度啊,他带有概率,或者是贝耶斯的推理啊,主观贝耶斯的推理,还有贝耶斯网络啊,另外还有一些模糊推理啊,然后还有这个我们的一些 其他类型的,像证据理论这种推理,所以这种推理呢,它具有复杂推理,这种智能起呢,它是认知型的智能起,它就具有这种复杂推理和记忆的这个能力, 而且他能结合历史的数据来预测未来啊,也就说我们基于一些,比如说金融,金融系统,他可以对这种,呃金融的这种,比如说贷款,贷款的这种历史的数据呢, 呃,可以进行这个预测出这个贷款的金融风险,所以对风险进行管控。当然这里面我们也要依据一些大圆模型来作为这个决策的核心。 第三种呢叫社会型的智能企,还支持这个多智能企的通信协作,比如说最经典的就是供应链供应链的协作型,比如说一个手机的供应链,哎,手机的生产厂家, 它是一个核心企业,他作为一个智能企,他与他上游的这种一些供应商呢, 相互协助,他与他下游的这个销售商、客户协助,所以这就是一种多智能企的通讯社社会型,当然他们要遵循一些 约定的一些协商的这个协议啊,还有一些资源的分配的规则。那么还有一种就是把这几种智能企呢融合到一起, 这个我们称之为叫混合型的智能,它这个融合了一些反应的智能机和认知的智能机,而且能响应实时的事件, 能执行一些长期的这个策略。比如说像这个自动驾驶啊,我们自动驾驶的这个汽车, 像这样的一个智能企呢,它就是一种有反应、有认知,而且要协调感知,要规划啊,它其实是一种多智能企的多模块的协助,而这是智能企的分类。 那么智能企的应用场景呢,是非常广泛,比如说在工业自动化里面,智能企它通过这种视觉,我们那个机器视觉,你比如说我们在这个生产厂家生产车间啊, 啊,养上一些摄像头,这样的一个摄像头的这样一个数据视频图像,通过这种我们的图像的这样一个识别 图像的分析,视觉分析这样进行视觉感知,还有我们通过机械控制 来实现这个生产线的质检啊,但质检呢,我们也有一些质检的流程,比如说我们的 确定一些质检的标准,然后呢我们进行送样,然后呢进行这个质量的这样的一个检验,按照质检标准进行检验生成质检报告,包括像我们的这个车间里面的这种 质检这个机器人,所以它这其实就是多个智能企在协助工业智能化。 那么智能企呢?它还有在我们的一些虚拟助手里面,比如说 我们的客服的智能企,我,我们在做一个智能客服,哎,我们可以和客服呢进行这个基于自然语言的对话, 然后呢呃,我们问一些客户客服的一些问题,他可以去处理用户的查询,而且他结合了一些记忆的组建,能够实现一些个性。 那么往大的来说啊,智能起用的还是非常广的。嗯,本来二零二五年呢,就是智能起的元年啊,然后到二零二六年,现在正式发展的 非常好。任应该说现在是一个人工智能的一个很大的一个风口啊, 然后呢往大的来说呢智慧城市啊,就是像我们最常见的智慧交通, 这个交通的调度的智能器,它可以通过实时的路况的感知来优化这个信号灯的这个配对, 而且它可以与这个边缘计算的这个设备呢截同来降低它的这个延迟啊,这是智慧城市。然后呢 现在我讲一下重点,就是,呃,第二部分重点讲一下智能企的怎么样进行通信啊?智能企的通信的这个, 那么他和我们这种网络的通讯其实大同小异,要通信的时候呢,网络的两个这个网络节点或者多个网络节点要通信, 他们要遵循的是一些一些标准,或者是一些通信的协议,比如说像我们的呃最经典的七层协议,国际互联组织的这个七层协议, 然后呢还有一些互联网的这个协议,四层协议。那么智能企的通信呢,它也是要遵循一些通信协议和标准, 首先要确保它的这个能够多个智能企,它们能够进行互相的这个操作, 所以这时候他们就要有统一的通信协议,比如说像这个 a、 c、 p, 那么这样的一个协议呢,他就为一些不同的智能企的厂家给他开发的这个智能企呢提供一些标准化的进行一个交互,进行一个标准化的,这样的话他就避免了 这个因协议的这个出现不同而导致的一些功能的割裂。比如说在工业生产里面,经常出现一些生产的这个 呃货要和这个物流对接,那生产货物呢,可以用一些工业机器人,工业机器人的智能企,他就和物流的调度的智能企呢进行一个无缝的写作, 这样的话他们就按照 e、 c、 p 的 这样一个协议呢,确保了它的互操作性。然后呢第二个呢就是要这个提升它的它们之间的这种协助的这个效率。 那么这个时候呢,智能起的它这个协议呢要通,要定一些他们通信的这个消息的格式,嗯, 包括这个传输的规则,包括如何进行错误的处理,比如说传错了怎么办?同心传吗?对吧?同传的策略还有减少这个通信的延迟,包括拥余的一些数据, 比如说在那个智能交通系统里面,这个车辆啊,我们不同车辆的这个智能起 a 阵,他们就可以进行 实施的路径协商啊。哎,你走这一条路,我走这一条路,哎,他们不避免了这样出现这个拥堵,对吧?那么 保障安全性,这个也是他们通信协议里面要求的,对吧?在智能企的协议里面他就内置了一些身份的认证,就像我们的人的这个身份证号一样。 所以智能企里面它也有,它叫 a、 i、 d 啊,另外也有加密,也有加密机制, 那么它就防止了这个恶意的智能企呢伪造一些数据,或者篡改或者窃取一些数据。呃,这个在我们医疗或者是金融领域呢,呃,用的非常多, 比如说我们确保医疗诊断的智能企业对患者隐私数据进行一个保护,而且在传输的时候呢是一个合规的传输啊,这是我讲的这个智能企业之间的通信协议和标准。 那么智能企之间呢,他们要有一些消息的传递的机制,有哪些机制呢?嗯,主要包括了以下三个方面。第一个呢 就是同步或者异步的这样一个模式,同步模式呢,它适用于这个需要及时响应的任务, 比如说我们在做无人机的编队,哎,一个无人机其实就是一个智能机,他们遇到障碍物了,那么大家这个编队是不是要统一的要躲开这个障碍物,这就是一种同步的啊,即时响应的。 那么异步的这个模式呢,它支持高延迟的环境,比如说还是我们举这个供应链,我刚才举了这个手机的供应链,比如说服装的供应链, 服装的生产厂家呢,它的这个供应链呢,也是非常长的啊,就是它上游有一些面料呀,一些其他的这个服装的一些其他的 材料的一些供应商,他的这个下游呢,有他的各种的不同层级的分销商,而且不在不同的地方地域,所以他们之间呢进行一个订单, 怎么样进行这个订单的分配,订单的完成啊,然后呢实现一个订单的协调,这就是一种多个智能企之间的这种异步模式。也就说我们把服装的生产厂家呢,可以当成一个智能企, 然后把他的上游的供应商,各种供应商也当成多个智能企,然后他不同层级、不同地方的分销商,也形成多个智能企,这就是多个智能企之间的这样的一个 接头,这其实来解决跨地域的分布式这样一个供应链的协调问题。 那么第二种呢,就是消息队列的这个优化,就是说我们智能起呢,它可以优先级的队列啊,就是 呃, burst in, burst out, 先啊,先进先出啊,先来后到,有一个顺序,对吧?然后通过消息的过滤,当然我们也可以给它定一些这个优先的级别 啊,可以基于这个主题的这个订阅来确保他的这个关键的任务。比如说在我们的应急灾害的救援里面, 像这样一个智能企呢,我们发出了应急指令,那么他在这个消息队列里面肯定处于非常优先的级别,所以要优先处,这样就减少了网络的拥塞。 那么第三个呢,就是容错与恢复,也就是说智这个智能棋呢,还要通过 ack 这种确认机制,包括这个断点的 呃续传机制来应对这个网络的波动,也就是说如果出现网络拥塞了,这个时候它是不是先缓存,然后确认一下,然后呢网络又恢复了,又再继续传。 像这样的一个智能企呢,像我们在这个自动化仓储中,我们对这个仓储的货物进行搬运,这个时候呢,我们对这个搬运的这样一个智能企,他的任务状态可以进行一个持久化的这个存储, 这就是通过融错与恢复的形式进行这个消息传递。那么智能企之间呢?它的消息传递呢?它是智能企这个他们之间合作的核心,需要兼顾实时 可靠,而且能扩展,而且能适应像工业互联网,像分布式的人工智能的系统的多样化的这个场景需求。 那么既然智能企之间能够进行通信,而且遵循了标准有消息传递,到底它们怎么样通信 就像人和人之间说话一样,是不是得需要有一个语言,对吧?所以我们智能企之间呢,它的通讯语言,比如说 acl, acl 的 意思就是 agent communication language, 智能企的通讯 它是通过了一个标准的语法哎,比如说 f i g a 的 这样的一个 acl 来定义一些这个请求,包括承诺的呃言语的这样一个行为。比如说像我们的金融风险,金融风险管控这样一个智能企呢,它能精准的理解 监管政策的更新指令啊,所以它就是基于 acl 这个语言进行信。 还有一种就是我们做一个本起论的映射,本起论这个概念呢,是本起,这个最早其实在哲学里, 但是呢本起在计算机的里面也用的比较多啊,我们其实就是呃通过对一个事物的一个理解,建立他的事物的本质啊。举个最简单的例子,比如说 我们的这个医疗的 a 证,他们进行协助,哎,医生这时候给给患者 拍了一个呃,检查的这个,做一个呃 ct 的 这个呃一个单子,哎,这个患者就拿这个单子呢到这个 ct 室去做这个 ct。 那 么这个时候呢,其实就是我们把这样一个过程 给他描述出来啊,通过这种变膜或者画图的这种形式描述出来。这个很简单,其实就是一个医生的这样一个智能起的 agent 和我们的嗯, 做这个警察的这个 agent 和患者的 agent 之间的这样的一个基于这个我们建立好的这个本企模型,与模型进行这样一个协助。 那么还有一种就是智能企呢,它是要有上下文的感知的这样一个能力, 那么它可以动态的上下文的嵌入技术,允许这个消息携带这个环境参数。 比如说我们的这个 time stamp, 就是 时间戳啊,就是其实就是时间,包括这个位置,地理位置,嗯,像我们的智慧交通啊,它肯定是实时的, 所以它有时间戳,而且有这个定位,对吧?它可以进行智慧交通的智能起呢,它可以根据交通的这个流量的策略来调整这个信号灯的策略。 那么智能企呢?它还具有这个呃情感的呃计算的这个扩展,也说有情绪标签来增强,比如像社交的这个智能企,它的这种交互自然度啊,这就让我想到了 在这个跨年的时候,这个老罗和这个豆包与锤子手机进行吵架, 那么越来越感觉到豆包呢,他好像是在不同的这样一个语义环境下,他带有了一种情绪标签,所以这其实也是智能企的在和大模型结合的一个应用。再比如说教育辅导的智能企, 那么我们呃有孩子的这个家长呢?就是这个,基本上这个都面临着对孩子作业辅导的问题。那么我们如果人和孩子交流作业辅导,有时候难免会出现一些 呃这个控制不了情绪,或者是出现一些那个呃情绪的状态,那么我们如果把这个作业辅导呢,交给这个 智能起来完成。我们有个教育辅导的智能,他可以根据这个学生的情绪状态进行调整沟通策略。 你比如说现在其实豆包呢本身就可以啊,充当一个学习监督的作用啊,他可以和进行交流,但是除了豆包,我们现在这些呃已有的大模型,呃其实和智能起结合也是具备了这样一个情绪状态的这样一个调整。 呃,这也是人工智能的发展的一个方向,就是逆人化啊,具备了人的这个情感啊。呃,然后呢和这这这个现在也是一个人工智能的这个发展的一个前沿。 那么讲个智能企之间的这种通信,我再讲一下。第三部分,就智能企之间怎么样进行协作,那么智能企之间呢?它们的这个协作呢, 要遵循一些协作的模型或者框架,最常见的像合同网协议啊, contract network, 它是一种经典的这个 任务分配的呃模型,呃,就像我们这个做一个项目的时候,我们先呃这个,这个呃发布一个招标的这个通知, 哎,这有人就要应标了,投标了,那么中标以后呢,是要签合同了,要做一个任务的协商。所以这样的一个合同网的协议呢,其实就是基于招投标中标的这个机制呢,它适用一种动态环境的 这样的一个分布式的任务分配。那么还有一种叫做联合意图的理论叫 joint extension theory 这个写作模型呢, 它强调智凝智能企可以通过一些共享的目标或者承诺一些实现的这个写作, 确保团队行为的一致。比如说我们最常见的就是无人机的这种编队表演,其实我们现在想一想啊,一个无人机其实就是一个机器人,或者甚至认为他就是一个智能企, 那么无人机的编队来完成一些表演任务,他们其实都是有共同的目标的,要进行相互协助。再比如说机器人,多个机器人,两个踢足球也是一种协。再比如说看最近前一阵子这个, 呃,王力宏在成都开演唱会啊,和机器人伴舞啊,他们要完成这样一场演唱会的这个伴舞的杰作,这也是一种联合意图的这样一个杰作。 那么第三种呢?智能起的杰作呢?就是一种黑板模型,叫 blankboard model, 他通过这个共享的数据空间啊,就是一种黑板,然后呢实现了信息交换, 智能起呢,他一步的读写这个黑板的内容,他这种适用一些复杂问题的这个求解,比如说医疗的这个诊断啊,也就说他可以先把这个 这个信息先写到黑板上,然后呢另外一个智能机去读这个黑板来获取这个信息啊,那么还有一种基于角色的这样一个写作,叫 robert collaboration 啊,啊? collaboration, 那么智能企呢?它可以根据预设的角色,比如说有人是这个 leader 啊,领导者,还有有人是 execute 执行者,他们进行一个分工协助。像工业自动化,因为它工业自动化的这种 流水化的作业呢,它其实就是多个这个作业任务之间的这种写作。那么我们有发布指令的,有这个并行执行指令,有串行指令,所以这样的一个智能器,它就是基于角色的一个协助的模型框架。 那么智能企之间合作以后呢,这就面临着来了一个任务,哎,这个多个智能企呢,到底你干 什么任务,他又干什么任务?这就牵扯到智能企的任务的,呃,这个分配与协调的问题,那么智能企的任务分配与协调呢? 还有一些常用的这个机制和算法,比如说最常见的就是这个拍卖算叫 auction auction 这种就像我们的定价的机制啊,通过这种呃 vickery 的 拍卖来确保高校的资源分配。 这个最常见的像我们的物流,物流的这样一个,呃运输资源,包括我们的生呃这个订单啊,供应链的这个订单分配啊,这样一个,我们要基于这个竞价机制来来来计算这个资源的调度,进行分配资源。 第二种呢,呃智能企他们任务分配可以采取这种分布式的约束优化,叫 d c o p 啊, 他可以讲这个任务呢,呃可以分解为约束满足这个问这个问题,也就是说最简单的其实就是把一个复杂问题给他简单化,复杂问题给他分解成多个任务, 那么智能企他可以通过局部的通信来优化这个大局的目标。比如说像我们的 智能电、智能电网啊,这样的一个,它其实就是一个把一个多问题分解成一个,呃,把一个复杂的问题分解成多个简单的问题。 那么第三种呢,就是叫做动态的重分配机制,那么智能起呢,它可以实时的监测任务进度,并且调整这个分配。比如说在我们的应急的, 在海救援里面,我们智能企可以根据环境变化呢,重新分配无人机的搜索区域啊,这个也是一个动态的这样一个调整啊,这是我讲的这个智能企的任务分配与协调,那么 这个时候就面临着分完任务了,他们要完成这个任务,完成这个任务呢,是不是有时候也会出现一些冲突啊?那个利益冲突了怎么办? 总不能说都不干了嘛,对吧?所以这个时候我们就考虑智能企之间遇到一些冲突,以后呢,说智能企他们怎么样进行协商的, 那么最常见的这样一个模型和机制呢?有这些。第一种就是博弈论啊,叫 game theory, 呃, protestant。 那 么博弈论这个已经由来已久了啊,我们呃前些年呢,很多诺贝尔经济学奖都颁给了博弈论。博弈论最经典的就是求出困境,其实就是纳时均衡, 然后呢,它是一种完全信息的静态博弈,那么慢慢演变成一个 完全信息的动态博弈,但这都是较为理想的状态。现实情况下呢,可能大量的是一种不完全信息,比如说博弈的双方或者多方呢,它是信息不对称的,然后呢,而且是动态调整, 所以就不完全信息的这个动态博弈啊,还有我们一些动态的这个群体演化的博弈,还有一些像这个呃,组成的这样一个博弈,但博格博弈啊,等等啊,这个很多, 所以通过博弈论呢,来解决智能企的这个协商,实现他的纳税均衡,或者是为托最优。 比如说像我们的嗯,车辆,自动的驾驶的车辆,到底你要谁占有了这个漏权,他们的协商就可以通过博弈论。 再比如说电网的这种调度啊,电网的这种调度呢,其实也可以通过博弈论来解决 定价策略,电网的电价的这个定价啊,就是通过这个还有高峰时的价,还有一些低谷时的价定价策略也可以通过博弈论来实现多智能企的协商。 那么除了博弈论以外,我们还有论据的协商啊,还有维维持 based negotiation 啊,这个智能企业通过这个逻辑论据来来说服对方,常见于比如说像我们呃商业谈判的这个系统 啊,它就可以是通过这种论据协商。那么还有一种在智能企里面应用较为广泛的就是强化学习啊,智能企呢,它可以基于强化学习进行协商啊。 然后呢就是我们的 ross 的 learning based location, 它可以通过历史的学习呢,学习到一些最优策略, 比如说电商平台的这些自动定价,它就是一个智能企的强化学习协商。 那么还有一种就是多边协议的啊,没有特龙二口口支持三个以上的智能企的复杂协商,比如说像供应链里面啊,他这多方的采购协议,他们就可以协商 好基于这四个啊,这样这个模型或者机制呢,它能实现了当多个智能企遇到冲突的时候,进行这个协商来解决这个冲突的问题。 好,第四部分我想讲一下智能企通讯与协助的一些关键技术。第一个呢就是这个分布式的决策技术。那么首先呢,智能企它有一些局部信息的这个处理, 它可以基于自身的这个传感器获取一些局部的信息,进行一个独立的这个决策。比如说它可以通过分布式的计算框架实现一些病形化的处理,来降低这个中心节点的这个计算的。 第二种就是智能企呢,它可以通过这个呃协同的优化机制,就让我刚才给大家讲的,他们可以采用多个智能企,采用博弈论或者群企智能,比如说以群优化的这种算法 来协调这个智能企的行为。比如说在我们的这个自动驾驶的多个智能企进行漏权的这个分配,包括漏镜的规划, 比如说在我们的这个物流的订单分配,物流的运输的运力分配,还有这个我们的这样的一个供应链的这个订单分配、资源分配的场景,都可以实现全局的追优减。 那么第三种呢,叫做动态的角色切换,这个是智能企,他是根据这个任务需求呢,来实时的调整他的这个决策的权重, 可以通过主从式的或者是对等网络的这个架构可以混合的使用,它适用一些突发的这种环境的这个变化,比如说像我刚才讲的应急的灾害救援的这种情况,它就是一种突发的要进行动态的调整。 那么智能企呢?他们之间进行通讯的技术,其实还有一个叫共识算啊,共识算法,共识算法这个概念呢,其实,嗯,在区块链里面也有啊,因为区块链里面它要有一个智能合约啊,然后呢有一个超级账本, 哎,这个智能企里面它也有个共识,共识算法呢,主要包括了四个方面,一个就是 通过败战情的容错机制啊,通过呃 p、 b、 f、 t 的 这种算法来解决分布式这样一个系统中节点故障或者恶意行为, 来确保至少有三分之二的这个智能体呢,要达到一致,这样才能执行这样一个决策,就像我们投票一样啊,大家投票票数要超过三分之二,这样才能算数,对吧? 第二种就是基于区块链的这样一个验证,哎,我刚才也讲了,就是可以利用一些智能的合约 来自动的执行一些规则,比如说我们建立一些哈西表,因为哈西表是基于这种电子。对啊,推弯柳的形式呢,来建立哈西链的这个结构,来保证通讯记录呢不被篡改。 比如说像我们的供应链金融啊,我们要做一些融资贷款,这个时候呢,我们就可以基于区块链的这个验证这样一个共识算法。 那么第三种的,我们叫做这个联邦学习的框架,就说不同的智能体呢,他在本地的这样一个训练模型,呃后呢上传参数,把这个上传到这个聚合的服务器上, 通过这个七度加权平均呢可以实现这样一个知识共享,而且共享的知识还不暴露他的这个原始数据,所以他肯定是有加密加密。第四个呢,就事件驱动的同步,可以采用这个 发布订阅的模式进行异步通讯,当特定环境状态触发通讯时,能自动激活智能企的这样一个 嗯,协同的响应的流程,这是智能企的遵循的共识算法这方面,那么智能企之间他们也要产生相互的信任,而且也有相互的激励, 所以这个时候我们要考虑一下智能企的信任和激励机制。那么第一个呢,就是信任是建立到什么的基础上?是建立到有信誉的基础上,所以这个时候呢,我们要做智能企的信誉度的建模,通过这个智能企的 意识协助的维度来构建他的量化的评估的模型 动态,来调整智能体之间的信任的这个权重啊,这其实就是还有这个,呃,基于这个建立了前面的这样一个协助,成功了,这就有信任度了,有信任度以后呢就相互信任了,加权重, 所以这就是信信誉度的建模。还有一种叫做代币的,代币的这个奖励体系, 所以他对这个呃贡献的计算资源呢,可以这个或者有效的这个信息的这个智能机来发放一些数字的这个代币, 而且可以兑换一些优先的任务分配权,然后或者是对这个系统的升级的这个资源,所以这就是代币的奖励体系。 那么第三种呢,叫做奖惩性的,呃,这个惩,呃惩罚性的这个约束,呃,对一些恶意节点的这个智能企,哎,我们可以实施降低它的权重,或者把它隔离了, 然后呢采用一些知识证明的这样一个技术来验证他是否违规了,而且不泄露隐私的数据,所以这就是智能企之间的这样一个信任和激励机制。 好,第五部分我再讲一下典型的应用案例,智能企的通讯写作的应用案例。 呃,第一个呢,最常见的就是自动驾驶啊,多个车就是多个智能企进行协助, 那么它们可以通过这种车联网啊,就车与车进行相连通信,通过 v to v 啊 v to 呃 a 的 这样一个技术呢,实现车辆的实时的位置,而且有速度,有路况信息,而且可以提升这个车队的协助的行驶的效率,减少交通拥塞或者事故的风险,这就是一种呃多个车之间的这种智能起的。 还有一种就是群体路径规划,多个智能起系统呢,它可以基于局的路况状态来调整这个单车的路径, 避免了局部的拥堵,可以通过分布式算法实现一些高效的这个任务分配,比如说我们可以对这个货运车队呢编编队行驶多个智能企呢?还有一个群体的路径规划。 第三种就是像紧急的避障协同,如果说这个车辆在行驶的时候呢,遇到了这个障碍物,突然遇到了,那么临近的车辆通过协同的这个决策快速生成避障的策略, 有着同步变道或者减速来确保整体交通的油的稳定,所以这就是多个车辆智能起的这样一个多一些。 那么在工业生产里面呢,工业机器人的这样一个多个智能体的协同作业,那么第一个呢就是他们之间可以进行一些分布式的任务调度。多个机器人呢, 它可以通过协商机制动态分配这个呃一些这个装备,然后呢搬运一些任务,然后呢实时的呃覆盖均衡的算法,这样的话可以提高这个生产线的整体的吞吐率。 第二种呢就是多个机器人的智能体呢,它可以高精度的写,因为这里面呢我们可能牵扯到还要有与传传感器的价值,就说通过视觉或者力觉的传感器的数据共享,多个机器人协助可以完成这个精密的装配,比如说 他们进行一个协助来焊接汽车的焊接,这样的误差补偿精度呢可达到这个亚毫米。 第三种就是故障的容错机制,比如说这一个智能解除故障了,一个机器人故障系统呢,它能自动重重新分配任务到其他节点,保证这个生产的连续性,降低了这个情机的损失。 第四个呢就是人机协助安全,就说我们在工业生产里面呢,经常会出现呃人工人和机器和机器人之间要进行实时动作的这个协助,所以我们要对它实时动作进行预测,而且 出现冲突了,我们还有一些这个碰撞的检测算法,来确保这个机器人与人类这个操作员跟共享这个工作空间,来确保它的这样一个安全性啊,这是工业机器人的这个, 那么还有一种是智能家居系统的联动,那么智能家居呢,它是一种场景化的这个联动,比如说我们,呃,我们要这个多个设备,比如说要把这个灯调亮, 要把这个空调打开,要把窗帘要这个关掉,那么这时候呢,这就是我们的自主的处罚这个联动策略,那么比如说我们要睡觉的啊,这时候我们就要调调暗灯光,调节室温,这就是一个多智能起的这种联动机制。 那么还有一种就是能在能源的这个消耗能耗的这个协调优化,在这个智能家居的能源管理系统里面,智能起它可以分析用电的峰值动态,这个调整这样的一个 呃家电的运行时段,比如说我们洗衣机,哎,这一阵子这个用电量非常大,是不是我们就可以错峰的去启动这个洗衣机,降低了整体的能耗的这个成本。 那么还有一种就是跨品牌的协议这个兼容,就说我们智能企呢,它可以通过一些标准化的通讯接口,比如说 micro 协议间整合不同厂家的设备, 然后来消除他的生态壁垒,实现一些无缝的这个协助,这能使这都是智能企之间在智能家居的这个联动中的应用。好 讲了应用,最后我们再展望一下未来,看一下智能企的通信协坐在未来的发展趋势和挑战是什么,这就是我讲的最后一部分。 那么首先呢智能企之间的这个通讯的这个效率的优化,这个通讯效率呢?它是一个协议的这个轻量,轻量化的这个设计, 可以通过这个优化这个通讯的协议的这个数据结构啊,优化这个通讯协议的数据结构,包括这个传输的机制来减少智能起的通讯的这样一个延迟,还有一个贷款占用, 那么可以提高它的实时交互,比如说我们可以用这个 i 禁止的编码来这个代替这个接生串的这种文本协议,所以这就是通过轻量级的这样一个协议的这样一个优化,可以提高通讯的效率。 那么第二种就是通过异步通信的机制,他可以支持非阻塞式的这个消息传递,允许这个智能企呢在未收到响应的时候能继续执行其他任务,避免系统整体性的受到单个节点的这个拖累。 第三种呢就是上下文的这样一个感知的这个漏油啊,他可以智能启达,他可以根据任务的场景动态选择最优的通信的这个路径,比如说我们 按照这个最临最临近的节点优先,比如说像我们的 k n k 近邻的这个算法啊,还有我们的低负荷的这个通讯优先,可以降低网络的拥塞的这个概率。 第四种呢就可以队形进行语义的压缩,可以利用这个知识图谱 呃或者是共享的语义模型对通信的内容进行压缩,比如说我们仅传输一些必要的信息,比如说我们说会议室的 a 的 温度是二十八摄氏度,那么这时候把它 变量化一下,这样进行语义压缩,这样他的智能起的通讯效率就提高了。那么智能起在通讯的时候非一个非常重要的就是他的安全和隐私的保护。 那么如何对智能起通信的时候的安全隐私保护呢?我们可以采取端对端的加密, 比如说我们采用量子呃这个抗性的加密算法啊,比如说我们的格密码来保证智能企业的数据传输安全,防止中间人呃攻击或者数据的篡改。 第二种就是这个差分的隐私的机制,我们智能企在协助学习的时候,对这个共享的数据呢,可以添加一颗可控的噪声,确保了单个智能企的原始数据无法被逆向的这个推导。 第三种呢就是叫做零信任架构,我们可以基于持续的身份验证和行为哎,这是持续的动态的调整智能企的访问权限,防止越权或者是恶意的节点渗透 啊,这是智能企的安全和隐私的保护。那么第三个呢,就是大规模智能企系统的扩展, 这里面呢我们有一些,呃分层的联邦的架构,可以将这个系统划分为多个自治域,这个域内呢,可以采取集中的协调,域间可以通过标准化的接口通信,降低局管理的复杂度。 那么还有一种叫资源的动态分配,这里面我们可以利用这个容器化的技术,比如说 bt 啊,采取计算资源的弹性的调度,根据智能起的赋税自动进行扩容。 第三种呢,叫做冲突消减,可以用我们刚才讲的这个博弈论或者拍卖机制来解决资源的竞争,比如说微克的 problem 模型,实现最优的任务分配。 呃,第四种呢,我们可以采取自愈式的拓普管理,当我们的部分节点失效时候,系统能自动重构通信网络,比如说基于 hold 协议的这个 重漏油,保证了整体的可用性。所以这就是通过这个大规模的智能企系统扩展,也是一个发展趋势。好了,今天我我从这个大规模的智能企系统扩展也是一个 发展趋势。好了,今天我我从这个六个方面给大家讲了智能企的通信与合作, 那么呃,谢谢大家的这个聆听和观看,我们后面要讲一下这个智能企的协助啊,智能企的这个协助与学习 啊,学习和推理,这里面就可能用到了我们的机器学习,呃,把智能企和大语言模型和深度神经网络结合到一起,好期待着我们下期再见啊,谢谢大家,谢谢大家。

众所周知,像 discord 这样的 electron 应用,本质上就是网页程序。这类软件采用多进程架构,意味着当你打开应用时,多个进程已在后台启动并相互通信。 用户通常感知不到这点,因为我们交互的只是负责图形界面的主进程。经常有人问我,为什么这些进程不需要我们手动启动?如果 discord 本质上就是个嵌在精美浏览器试图里的网页, 为何我们不用先手动启动本地服务器托管网页文件,再打开浏览器输入本地地址才能使用?今天,我们将探索进程如何创建新进程,以及这个看似简单的操作在不同操作系统中的底层差异。 大家好,我是乔治,这里是 core dumped。 许多应用程序的设计师的用户启动后,程序可在运行期间任意时刻自动生成新进程,无需用户额外操作。 我们首先思考一个问题,假设有个进程 p 一, 它要如何创建一个新进程 p 二? 首先, p 一 需要将 p 二的可执行代码载入内存,这样 cpu 才能开始执行。 但就在这一步,我们已遇到关键难题。现代操作系统中,普通用户进程无权执行这类操作。 每个用户进程被限制在操作系统分配的内存区域及地址空间内。进程完全无法访问该区域外的内存,即便该内存未被其他进程占用。 虽然进程 p 一 可以将 p 二的可执行文件从硬盘读取到自己的内存中,但无法将这些代码放置到自身地址空间之外的其他内存区域。换言之,进程 p 一 完全无法独立创建一个全新的进程。 这正是进程创建不能完全在用户空间处理的诸多原因之一。当需要此功能时,必须通过系统调用委托给操作系统处理。 简单来说,系统调用是操作系统提供的 api 接口,允许用户进城请求执行他们无权直接操作的功能。 这些操作既包括硬件访问,如从磁盘读取文件或向屏幕写出字母,也包含操作系统提供的服务,比如获取系统信息,建立进城间通信通道,或者我们当前最关注的进城管理功能。 该 a p i 通常以一组 c 或 c 加加函数的形式公开。程序员在需要这些服务时可以调用它们。 我喜欢这样理解,系统调用。它们是从用户空间调用的函数,但却在内核空间执行。操作系统执行请求的任务完成后会将执行权返回用户模式。 问题在于,每个操作系统都有自己的设计理念,这常常导致 api 不 兼容。 windows 和类 unix 系统都专门提供了用于创建新进程的系统调用。乍看之下,这里的兼容性问题似乎并不严重。 看起来我们只需要根据程序运行的平台调用对应的函数即可。但如果我们比较这些系统调用的定义,立即就能发现一个明显的问题。 我知道你们大多数人在想什么。 windows 系统特有的操作方式虽然我承认 windows 版本看起来确实过于复杂,但 unix linux 版本其实更奇怪。 为了理解 windows 的 做法,我将其简化为一个名为 create process 的 概念函数,它只需要两个参数。 image 就是 我们要运行的程序的可执行文件完整路径,操作系统据此在磁盘上定位文件,并将其加载到内存中。 command line 顾名思义就是包含调用程序所用完整命令行参数的字母串,这包括传给新进程的所有参数。进程由此得知自己是否通过启动标志或选项被调用。 简而言之,这个系统调用是告诉操作系统用这个可执行文件创建新进程。 操作系统会在磁盘上找到这个文件,为新进程找到一块空闲内存区域。将可执行代码加载到该内存中,并执行所有必要步骤,以便将进程插入调度器。 系统还会传递命令行字符串,使得新进程在运行任何用户代码前能解析其参数并不复杂,对吧? 而 unix 系统的实现方式则更有趣。在类 unix 系统中,用户进程可通过调用 fork 系统调用来创建新进程。有趣之处在于, fork 不 需要参数,这意味着无法指定要运行哪个可执行文件。 实际上,当操作系统收到 fork 请求时,它会克隆调用进程附近程的整个地址空间,包括代码段、数据段、栈河堆都会被复制。 不仅如此,几乎整个进程上下文也会被克隆,只有少数与管理相关的小例外。 正如我们在之前的视频中讨论过的,进程上下文还包括其 cpu 状态。我来举个例子说明。 这里有一个声明,变量 a 的 程序随后进入一个五次迭代的循环,每次迭代时递增该变量,打印其数值,然后休眠一秒。 当第一个循环结束后,程序调用 fork 函数,接着进入几乎完全相同的第二个循环,它会持续每秒递增 i 的 值并打印输出。 运行该程序时,你会发现在调用 fork 之前,一切运行正常,但只要 fork 被调用,输出内容就会翻倍。 这是因为当 fork 创建紫禁城时,紫禁城会继承紫禁城的 cpu 状态,其中包括调用 fork 瞬间的程序计数器状态。因此,附近城和紫禁城都会从 fork 调用之后的下一条指令继续执行, 因此紫禁城不会从程序开头开始执行。需要注意的是, fork 如果使用不当会非常危险,尤其是在循环中调用时。让我们尝试多次调用 fork, 看看会发生什么。 在这个例子中,我连续调用了三次 fork, 但信息被打印了八次。 原始进程先执行第一部分内容,然后调用 fork 创建了一个子进程。现在父子进程都会执行下一行代码,即再次调用 fork。 当这四个进程都执行到下一个 fork 时,每个进程会再次复制自身,最终得到八个进程。这就是为什么信息会显示八次。总共有八个进程,每秒各打印一次信息。 我确信,正在观看视频的观众中约有一半已经明白接下要讲的内容。但如果你还不明白,可能会疑惑,如果只是重复相同操作,克隆进程的意义何在?难道没有更好的方式来加载并运行可执行文件吗?比如 windows 那 种方式 确实有,不过这种方式同样透着古怪异感。现在登场的是 exact 系统调用。如你所见,与 fork 不 同,这个 unix linux 系统调用确实需要参数。 同样,为了避免过度复杂化,我们将使用其简化版本 exec。 这个系统调用的参数正如字面意思所示, pass 参数指向我们要运行的可执行文件路径, a, r, g, v, e 是 由 c 字母串整数组成的数组。它定义了作为命令行参数传递给新程序的参数向量。比如说终端里的这个命令,如果用系统调用来编程执行的话,会是这样的。 看起来可能和 windows 的 方式很相似。表面区别只是参数传递方式不同, windows 用单个命令行字母串,而 unix linux 用以解析的参数数组。但这个区别其实是最无关紧要的。 正如前面所说,类 unix 系统创建新进程的唯一方式就是克隆现有进程,那 exact 究竟做了什么?它根本不会创建新进程。相反, exact v 会替换调用进程中当前运行的程序。 当用户进程调用 exec 时,操作系统会定位词盘上指定的可执行文件。它并非创建新进程,而是完全重置。调用进程本身。 战区被重置,堆区被清空,文本段和数据段的内容均被舍弃, c、 p、 u 状态也会被重置。随后,操作系统将新的可执行文件载入内存 程序计数器重置后,会指向新程序的第一条指令从头开始执行,参数列表也会被载入特定内存段供新程序调用。换言之, exact 的 作用是将进程严格定义为执行中的程序,转变成另一个程序,而非创建新进程。 虽然听起来奇怪,但机制就是如此。我来示范个例子, 这个程序启动时会先打印一条消息,接着程序会调用 exact 传入 google chrome 可执行文件的路径和几个参数之后,它会打印另一条信息。 如果翻译运行这个程序,你会先看到第一条信息,然后程序就变成了 google chrome, 但最后那条信息永远不会被打印出来。这很合理,一旦 exec 调用成功,当前程序会被完全替换,因此执行流程永远不会到达调用之后的代码。 很有趣对吧?但经历了这么多,我们仍未解答核心问题。我的意思是, fork 能克隆进城, exec 能转换进城。但这些都不是我们真正需要的 解决办法。其实有点滑稽。如果进程先调用 fork, 让操作系统克隆自己,然后只有克隆出的进程调用 exec 替换成目标程序,而原进程继续运行会怎样? 信不信由你? unix 和 linux 系统就是这样创建进程的,几乎所有用户进程都遵循这个模式创建。现在只剩一个问题,如何确保只有子进程会调用 exec? 因为如果在 fork 后立即调用 exec, 父子进程都会执行该操作,导致两者都被替换。 我们需要在源代码中区分它们,确保只有紫禁城调用 exact, 所以 必须找到实现方法。 答案就是进程 id。 系统中每个运行的进程都有唯一 id, 调用 fork 时会复制几乎所有内容,但进程 id 必须保持唯一性,因此不会被复制。 从技术上讲,每个进程通过查看自身的 id 即可判断自己是父进程还是子进程。 unix 和 linux 系统为此提供了另一个系统,调用 get p id, 该函数无需参数,直接返回调用进程的 id。 关键操作如下,在调用 fork 之前,进程先调用该 p id, 并将结果存入变量,接着调用 fork。 由于内存会被复制,附近城和紫禁城此时都存有原始附近城 id。 之后,两个进程再次调用 get p id。 若新获得的 id 与先前存储的一致,则该进程可确定自身是负进程。如果 id 不 同,该进程便可判定自己是子进程。 其逻辑实现如下,执行 fork 后,两个进程会从相同位置继续运行下一条相同的代码,但由于它们是拥有不同 id 的 独立进程,该 p id 会返回不同的值。 这导致条件检查在一个进程中成立,在另一个进程中失败,从而分叉它们的执行路径。 因此,该函数被命名为 fork 分 叉。它并非简单地复制进程并保持所有内容相同,其核心目的是让执行流产生分叉。 实际上,如果细看 fork 的 定义,会发现它其实会返回一个值。与该 pid 类似, fork 也会返回一个进程 id。 该系统调用的实现方式为,在紫禁城中始终返回零,在附近城中则返回刚创建的紫禁城 id。 这种方式非常实用,因为无需额外系统调用就能区分附近城和紫禁城。我们在翻译时无法预知操作系统会为紫禁城分配哪个禁城 id。 但有一条重要规则是明确的,在紫禁城中 fork 调用永远返回零。 仅凭这一保证就足以决定哪些代码应在紫禁城运行,哪些应在附近城运行。 当我们运行这段代码时, fork 调用会创建克隆进程,之后父紫进程都会接收并存储 fork 的 返回值,该值在各自进程中不同,然后进行比对。 若返回值非零,说明代码正在附近城中运行。若返回值为零,则说明代码正在紫禁城中运行。这就是 fork 函数的用法,不仅能克隆进程,还能指令各进程的执行任务。 若要创建不干扰调用进程的新进程生成函数,其实现大致如此。当然,系统调用可能失败,完善处理错误情况总是必要的。 最后,可能有些观众已熟悉 posix spawn 函数,该函数由符合 posix 标准的系统提供,用于生成新进程。但需注意,它并非系统调用,其概念模型如下图所示。 查看其实现会发现,内部机制与我们之前的操作完全一致,先创建紫禁城,再让紫禁城调用 x x v e。 至此,我们已清晰展示 windows 与 linux 系统的进程创建机制。简而言之,在 windows 系统中,进程可以通过系统调用来请求操作系统创建新进程,而 windows 正是这样执行的。 在 linux 和类 unix 系统中,进程必须先请求操作系统复制自身,随后克隆出的进程会请求操作系统替换其程序。 值得注意的是,在 linux 系统中,所有用户进程都由其他用户进程创建,这意味着副进程也是由另一个进程创建的,这自然形成了进程树结构。由此引出一个有趣的问题, 既然所有用户进程都源自其他用户进程,那么最终必然存在一个最初启动这一切的进程,对吗? 如果你运行的是 linux 系统,实际执行这个命令就能看到输出结果。以文本形式展示进程数。如你所见,树根处确实存在一个独立进程, 这个进程又是从何而来的呢?如果所有用户进程都有其他用户进程创建,那么最初的进程又是如何存在的呢? 实际上,这个独立进程正是理解内核与操作系统界限的关键。顺便一提,这也是我被问的最多的问题之一。不过这话题我们留到其他视频在探讨。 我向各位展示这个案例,因为它完美证明单个进程能衍生出完整子系统,最终成就更宏大的目标。 回到视频开头的核心问题,当你启动 discord 这类应用时,实质是运行一个可执行文件,它成为进程后的首要任务就是孵化多个协同工作的紫禁城,从而构建出我们熟悉的应用程序形态。 今天的内容就先到这里,如果喜欢本期视频或有所收获,记得点赞支持。 想了解更多内容,订阅频道完全免费,我们下期再见!

如果你在二六年一月二十一号开始学 ai agent, 需要多久才能学会?这是我总结的 agent 学习路线,最快三个月就能掌握, 四十五岁以下愿意坚持的朋友,三个月足以让你从入门到实战。第一周,先理解 agent 的 核心架构,掌握其关键,组建深入理解大语言模型 l l m 在 其中的作用,搞懂规划模块、记忆模块、工具调用的基本原理。 第二周,学习 agent 的 主流工作框架,如 react 思维链 caught, 理解不同设计范式的适用场景,并掌握实际落地中的常见问题与解决方案。第三周,了解多智能体协助机制,学习 prompt 工程的核心技巧,让你的 agent 输出更稳定、更精准。第四周,结合前三周的知识, 亲手完成两到三个企业级项目实操编下来这一套,你就能真正把 agent 技术融入业务配套的学习路线。视频教程和项目原码都已打包好,需要可回复学习,直接分享给你。

今天我们来讲 linux 能用到退休的核心命令,从基础到实战,掌握这几个就够了。老话常说,真传一句话,假传万卷书,几百个命令你死记硬背, 转头就望,那有什么用呢?到服务器面前的时候还找不到对应的命令,紧急故障耽误处理,花大量的时间学冷门的命令,实际工作一次没用 linux 不 用全学,只要抓住核心就够了。今天我们就从三个维度由浅入深的去给大家讲解,包括基础的必备命令,故障排查的命令 和提升效率的命令。首先是基础命令,这也是运维的基本功,一直命令一定要知道它的作用,主要是查找文件,然后看文件的权限大小和显示修改时间。常用的参数有杠 l 显示详情,杠 a 显示隐藏文件,杠 h 直观单位显示。然后是 c d 加 c p w 命令,它主要是解决 服务器迷路的问题,就是找不清路径,常见的用法有 cd 点点返回上级。然后是我们的 cp 加 mv 命令,它的主要作用是日常文件的操作,主要是复制啊,粘贴,重命名等等。然后 r m 命令删除文件, 但是删除前一定要确认是否是你要删除的文件。必备参数是杠 a, 然后删除前一定要确认。然后是四个故障排查命令,一个是 tail 命令,它主要功能是排查服务异常,用户反馈问题的核心工具。常见参数记住杠 f, 实时跟踪日历,然后杠 n 指定显示行数。然后是 graph 命令,它是文本搜索,主要功能是日制排查的搭档,能精准筛查关键信息。然后是 top 命令, 这个一定要背的滚瓜乱熟,它主要是给服务器把脉,找到高占用的命令,然后也能查看进程和资源占用的情况。主要处理场景是服务卡顿,响应变慢。然后是 nestat 命令,它主要是查看网络连接,能帮助你排查端口占用 连接线路等网络问题。然后是四个核心的提升效率的命令,一个是 slow 命令,它主要是切换权限,不需要反复切换用户,安全执行。高权限操作 优势在于减少繁琐的操作,降低误操作的风险。然后是 s c p 命令,它是远程复制文件的命令,它的正常工作不需要使用第三方的工具。使用场景主要是数据的备份和文件的同步。然后是 tab 命令, 它主要是负责打包、压缩和解压,主要的作用就是减小文件的体积,方便你的传输。然后是 print 命令,它主要是查找文件,它可以按文件的名 内别大小精准的查找。老话常说,一招鲜吃遍天,运维这条路讲究的是少而精,与其用大量的时间学一堆没用的的命令,不如把这些核心命令练到极致。 我把我当年从零到一学习 linux 的 笔记整理出来了,还有几百节内部视频,从基础命令卸掉脚本,到多会儿部署故障排查,都手把手教学,学会之后独立搞定企业运维完全没有问题,只要是我粉丝,扣三个一,我分享给你。

二零二六年来临之际,我们需要怎样的 agent memory 分 类学?这篇最新的综述文章给出了答案。综述联合了包括 news、 人大、复旦、北大、 to oxford x 等在内的多所顶级研究机构,系统梳理 agent 时代 memory 这一核心能力。文章从 form 视角出发,可以对记忆在内体进行统一结构分类,总结出 token、 level、 paramedic 与 latent 三类主流记忆形态,并分析其在可解释性、 可控性、泛化能力与工程成本上的权衡。进一步地,从 function 视角重新审视记忆作用。可以跳出传统长短期划分,提出 factual、 experiential 与 working memory 三类功能导向的区分方式。在此基础上,通过 dynamic 视角能够系统刻画 agent memory 的 生命周期,将记忆视为持续运行的系统,分析其形成、演化与解锁机制。同时,为支持相关研究与工程实践,还需对 agent memory 相关的 benchmark 与开源框架进行系统整理, 覆盖长对话、长城任务与终身学习等典型场景。最后,面向未来发展的 position 展望,可围绕自动化记忆管理、 memory 加 r l 多模态与多智能体记忆、 memory 加沃尔沃 model 以及记忆系统的可信性等前沿方向展开深入讨论,并提出相应的思考与见解。除了综述地址,我还为大家准备了一份多模态融合必看的二十八篇优秀论文,代码已附全,整理在这。