粉丝5098获赞3.9万

openclaw 系统构架底层原理好?大家好啊,这节课是咱们这个 openclaw 的 这个公开课,之前听过我课的同学在这个 vvip 课上听过我课的同学啊,知道我是主要做科研的啊,简单自我介绍一下吧,我是硕博毕业于海外某高校的人工智能专业,师从海外工程院硕士。 呃,国内的大长江团队啊,现在是博士两年毕业,现在是该领域上最年轻的全职助理教授啊。据我了解,反正是这样的啊,大概就是些这样的发文情况, 现在呢,也是主要做大模型 opencloud 它现在特别火嘛,那咱们也是趁着这股东风,那我们一起来看一下这个 opencloud 到底是个什么玩意儿? 好,咱们这堂课呢,主要会分三节来讲。第一个,我们会详细的去讲一下这个 ai agent 是 什么啊?我们都知道 openclaw 它很火, 但是 openclaw 它其实也只是 ai agent 的 一种而已啊,那它在这个普通的 agent agent 上,它有什么样的改进啊?或者说它到底是做了什么样的操作, 可以让他这么出圈,可以让他摆脱大大众对这个 ai agent 的 这个认知啊,可以进入到我们普通人的视野里面啊。第二部分呢,我们会讲一下这个 open code 的 底层架构啊,咱们既然来了这个课嘛,那就是知其然,我们更希望知其所以然啊, 现在网上有很多的教程啊,路客啊,大家应该都刷到过啊,大概就只会讲一下这个 openclaw 怎么用啊,大概是个什么玩意儿啊,但是它底层工作是怎么进行的,它怎么运行的?它用了哪些框架,用了什么样的技术 啊?这个可能一般涉猎的会比较少一点啊,这样,了解了底层之后,对咱们这种不管是做开发的同学,或者说做科研想用到这个 open code 的 同学,我相信都是会有点帮助的。最后呢,可能也是大家比较关心一点,我们做一下本地部署啊,链接一下推书。 好,因为咱们这个是个直播课啊,大家如果有问题可以发在这个弹幕上,我这边看到的话,会跟大家解答的。好,话不多说,咱们发车吧。好,我们先讲一下什么叫 a i a 阵的啊, 大家也知道,大概呢,在年前开始啊,就选选起了一个全民养虾热潮啊,左边是腾讯大楼, 腾讯大楼下面免费装虾啊,大家都看过新闻哈,说一代人有一代人的鸡蛋要领啊,那我们这一代人的鸡蛋是什么?去领一个小龙虾过来啊。那右边呢,是抛开我们这个现象不谈啊, openclaw 在 这个 github 上,它的新数啊,从二月一月底二月初开始就一路飙升啊,可能大多数原因呢,是得益于咱们国内的宣发能力啊,还有一些比较出圈的操作啊。那在这个这么火的一个现象后面, 我们不禁要思考一个问题啊,大家为什么非要来养虾啊?你拿到这个虾的时候,你知道他是干嘛的吗?或者说你能知道他能对你创造一个什么样的价值吗?你就去领啊,你鸡蛋囤多了还会放坏呢, 对不对啊,我,我个人觉得呢,现在大多数人啊,养龙虾主要还是以猎奇心为主啊,更多的呢,我觉得可能是我们家的哎, f o m o 在 作祟啊,就是 fear of missing out, 你 是怕错过这个技术啊,可能觉得哎呀,这是是不是一个像 g p t 一 样出来的技术,我如果不提早入局的话,我就要被淘汰啊,大多数人可能都是情心理对不对啊, 那也因为这个给他蒙上了一个非常神秘的一个面纱,那他到底是不是这么厉害,是不是这么神秘啊?我们其实只要理清这里面的结构原理就会发现啊,他其实还是一个很好懂的一个东西啊,对于我们个人来说, 要不要去部署这个 open klo, 或者说我们学这个 open klo, 我 们需要学到一个什么地步啊?我觉得要从它部署难度还有成本啊,还有一个呢,就是它安全性这三个方向来考虑一下啊。好,这个是前话。 好,那我们正式进入今天的课啊,讲一下这个 ai a n 的 以及到这个 open klo 的 这个发展历程啊,实际上已经落地的阴影,感觉没有那么强大,哈哈,这个我们到后面说啊,好, 我们说这个 agent 啊,其实在 agent 之前啊,它的前身其实还是大模型,就是我们最早熟知的这个 gpt 啊,以切的 gpt 为首的是一个传统的大语言模型啊, 说早不早啊,那个时候呢,大家其实对这个大模型最主要的概念呢,就还停留在问答上,就跟大家现在用用豆包一样啊,打开一个手机问个问题,他告诉你一个答案啊,那个时候还是以这个叫什么,以问答为主的大大语言模型时代啊, 但是呢,发展到 g p d 四的时候啊,三到四它其实是一个很大的跨越啊,那个时候呢,就已经出现了早期的这个大模型 agent 的 框架雏形了啊,大家那个时候可以发现,这个大模型好像不光只是简单的问答那么简单了 啊,他会用上一些。我们听过我之前的课的同学都知道,有个叫 react 的 框架啊,他会推理了啊,并且会做一些相应的操作啊,这个是早期的大模型 agent 的 啊,但是呢,那个时候他叫什么?他还是主要停留在类似于在大模型上做一个拓展能 力部部署的地方呢?还是服务器?还是云端?还是大模型厂商,我们的可操控性还是非常低的啊。后来呢, 再往后发展,大概有个半年到一年左右啊,这个时候呢,就有类似的推理模型框架出现了,我们在之前的 vip 课上也讲过啊,这个 v i m 啊,它的作用是什么呢?简单一句话就是可以搞了个框架出来呢, 帮你非常简单的可以把这个大模型给部署到本地啊,并且呢,他不光是一个问答,他还有操作的属性在里面啊。 那当然呢,你既然部署到本地了,那你就只能用一些开源的模型了,比如我们的拉玛,还有谦问以这个为首的代表模型啊,这个是本地大模型 agent 的 时代啊。那从这个之后呢,其实也没有过多久,大家就看到了现在的突然有一夜爆火的这个要 opencloud 的 东西啊, 这个东西他到底是个啥啊?大家可能了解的知道啊,他是一个欧美一个退休的程序员啊,他闲着没事一个小时搓出来的一个东西,目的就是为了让他在外面的时候也可以用手机操控他的电脑,电脑黑奴来帮他干活 啊,就是一个这么简单的东西啊,但是他突然就火起来了啊,他为什么火起来啊?他相比于之前的本地大模型啊,他做的无非第一就增强了这个 g u i 的 控制能力啊。之前这个本地的大模型,大家可能需要用到一下命令行或什么样的东西,会需要稍微有一点点的基础 才可以去完成这个东西啊。那个时候大家觉得搞大模型,用大模型这些可能还是稍微专业一点的基础才可以去完成这个东西啊。那个时候大家觉得搞大模型用大模型这些可能还是稍微专业一点的就可以了啊。 open cologne 呢,在我看来它是走了最后一公里的路的啊,就把它给带到了大众的视野里面,用一个相对于比较傻瓜式的操作就可以去干到某些之前我们想不到的事情啊。再来一点呢,它有一个非常关键的改进呢,就是它 大胆的开放了权限啊。刚刚有个弹幕同学问这个 open klo 为什么没有被认定为病毒啊,很简单啊,还没到时候啊,哈哈,他如果一直这样发展下去的话,肯定是会有相应的限制措施出来的 啊。现在大家从新闻上已已已经能看到啊,可以有很多的学校已经开始明令禁止在这个学校的电脑里面按 open klo 了, 并且呢,有些国家啊,比如说我现在在日本,他们对这种对这种数据安全是非常的在在乎的啊,所以在这个实验室的电脑上去部署这种 opencloud 也是不太现实的啊。 好啊,我这里放了两两张图啊,大家一看这个画风就知道 ai 生成的啊,但是我发现啊,它生成的非常好啊, 这个我们先看看一下左边那个图,从左边那个图我们可以看成三部分,第一部分就是 ai 是 怎么工作的,这里我们啊先不细讲, 左下角呢,是这个 ai agent 的 现在有哪些类型啊?这个我们也先放在这不讲啊,右下角这个 ai 系统在部署的时候啊, 我们知道大家可能看新闻也看到了有人说什么一人团队一个人养了一群龙虾啊,养了一个池塘的龙虾,什么意思呢?就是一个 multi agent, 就是 一个做代理的一个过程而已啊,它其实就是一个二个这种 ai agent 的 实力 啊,这就是所谓的多个 agent。 好, 那我们再回到上面再看啊,上面这个 ai 是 怎么 walk 的? 我们现在先不讲它的流程是什么样的啊,我们先主要理解一下这个 ai agent 它有哪些东西啊? 首先右边啊,它啊有一个工具,比如说什么我如何去访问互联网,对不对?我怎么样可以写代码呀?我怎么样去调用这个 api 的 接口啊,对不对啊? 还有一个很关键的 memory, 这个是大模型就有的啊,那 agent 里面的 memory 跟大语言模型里面的 memory 有 什么不一样? a i agent memory 跟我们 openclaw 的 memory 又有什么不一样?大家先留一个小小的疑问啊,它其实是这个是 openclaw 比较创新的一点改进啊,在它的 memory 上面。好,这里我们先不讲,我们下一页会讲到,我们先再看一下右边这个,右边这个 中间这些组件啊,大家可以先不管啊,可以先看这两个标识啊,第一个我们一个 wifi 画了一个叉,还有一个就是锁了啊,什么意思呢? 没有 skills 吗?有 skills, 这里 ai 没画出来。我们后面会讲啊,这里意思呢,第一就是在本地,你可以部署到本地啊, 部署到本地之后呢,你的数据就非常安全了啊,那这两个属性叠加在一起会产生一个什么效应呢?首先在本地之后啊,你就可以自我玩的很花嘛,我们常说的 可以随心所欲的去改它呀,去操控它呀,你的数据全部都在你的本地。我们之前讲那个 v l l m 框架的时候,我们就提到了,这个框架对于公司或者企业来说 是非常友好的啊,因为很多公司和企业,它的数据不可能说我放到我调用的这个 api 的 云端上,不可能放到 openai 那 里,我不可能放到 google 那 里啊,这是我公司的私有数据,所以在很多业务场景下呢, opencloud 它是 叫什么?是一个非常好的选择的啊。好,那我们具体来看一下这个 ai agent 是 个啥玩意儿?我们说到 ai agent 啊, 其实可以拆成两块来看,第一叫 agent, 第二才是 ai。 有 同学如果了解过,强化学习啊, 应该知道啊,这个 agent 呢,是里面的一个概念,一个最基最基础的概念。它的定义呢,就是说一个实力啊,可以通过观察环境啊,做出行动 啊,为什么做出行动呢?为了达到某一个目的啊,这样的一个实力呢,就把它定义为 agent, 在 强化学习里面,那 ai agent 无非就是说可以用 ai 来提升自己的性能,这就是 ai agent 啊, 这就是它最基础的定义,没有什么太难的地方啊,我们看框框架这里啊,先看左左边,我这里写了三个模块啊,第一个是输入模块啊,输入模块的作用呢,就是从外部环境中来获取信息啊,它可以是多模态的, 在传输系统当中呢,这个输入的可能只是文本数据而已啊,但是呢,在我们今天这个 ai agent 呢,包括 open code 现在用的这个环境里啊,它其实已经是多模态的啊, 也就是说不光包括文本,还可能包括图片啊,语音啊,还有视频啊,或者说是来自于各种 api 的 结构化的数据,都是有可能的啊。 那我们如果想把它应用到科研领域,或者说应用到一些比较专业化的垂直领域的时候,可能就会需要这种 api 的 结构化数据了 啊。我讲的尽量稍微概念浅一点啊,因为咱们直播间里会有很多对这个 ai 基础会稍微薄弱一点的同学啊,希望大家都是可以听懂的。 蛋白质结构能不能详细介绍一下?那行,我们最后会有十分钟的答疑,如果你感兴趣的话,我跟你讲一下。好啊,我们继续回到这里啊,我们说第二个模块呢,叫思维模块啊,这也是 ag 的 系统中最核心的部分 啊,也就是这个大模型发挥作用的地方啊,这个模块呢,通常是由这个大模型来驱动的啊,他负责对我们前面说的这个输入模块获取到的多模态的输入进行理解推理啊,以及决策 啊。具体来说呢,大模型可以根据当前任务啊,先对问题做一下分析啊,对任务做一下分解,去规划一个策略来解决这个问题啊。 所以我们说这个大模型在 agent 系统中呢,其实就扮演的是一个大脑的一个角色啊,用来负责思考和决策啊。那我们现在获取了输入,有了小龙虾的钳子了 啊,有了思维模块,小龙虾有了大脑之后啊,我们需要进行交互啊,这就是我们的交互模块,当 agent 完成思考之后呢,我们就需要采取行动。 什么东西?左下角有个小窗口遮挡,是否关掉?我这里看不到哎,这个很影响吗?同学们,我这里啥也没有啊,哈哈,问问题不大啊,那我先讲了,因为咱们咱们时间比较紧啊,我准备的内容可能一个半小时讲不完啊,有个思维导图啊, 好, ok, 这个让我们助教老师去解决一下吧,我这里控制不了。好,我们接着讲。刚刚这个思维模块讲哪来着啊?对,我们这个小龙虾就需要采取行动了 啊,这些行动呢,其实没什么高大上的,他就是通过一些现有的工具啊,你看我们这里画的图里面啊,工具啊,其实你比如说 我们这个小龙虾遇到一个需要计算的任务了,他干嘛呢?他又去调用一个 calculator 啊,他可以根据他的角色,他自己去写一个小小的这样的方法去计算一下。可以啊,他如果觉得累的话,他也可以去调用一下。你这个计算机里面自带计算机的程序啊,小程序他来去计算一下都可以 啊,具体怎么做就看它自己来判断了啊。再有像 search 啊,其实呢,我们一般把它叫 websearch 啊,但是呢,因为 search 比较高大上嘛,所以现在都是把它叫 search 的。 大家看到这个其实就是一个搜索网页的过程,但是相比于搜索网页来说的话,它还有一个 就是综合和整理的过程啊,如果单纯只是搜索网页的话,他其实就像爬虫嘛,你爬虫下来的数据啊,那全部喂给这个小小的龙虾里面,当然也不合适,所以呢,需要有一个稍微一个整理的一个工作在里面的, 用什么代码写的可以有这么高的权限?是这样的,他有这么高的权限不是因为什么什么代码,而是因为他的端口啊,他在端口开放的这个过程当中啊,是给予了他一个非常高的权限的,再来就是很多端口他本身就是具有很高的权限啊, 超级用户对当前里面讲的 agent 的 比较像,对,当前这个其实叫什么,也是大模型的一个框架嘛,其实 agent 所有的东西,不管是什么,最终就是一个 基于大模型作出的拓展而已。大家记住这一点啊,现在你们看到的所有东西啊,它的底子啊,都是切了 gpt 一 手的这种大模型,只不过呢,我们因为受到这个 scanning log 啊,尺度规模 法则的这个限制,大家在堆叠基础能力上,大模型本身的基础能力上,目前是现金陷入了一定的瓶颈啊,所以呢,之后从 g b t 四开始,现在所有的大模型厂商开始把这个大模型从这种堆参数砸钱,把它往大了去搞, 从这个思路慢慢去转向了一些工程化的一些改进和落地,就比如 ag 的 就是其中的产物之一啊。 好啊,我们再看一下右边这个模块图啊,我们刚刚讲了有输入模块、思维模块和交互模块分别对应的。哪输入模块没有啊?我们这里 工具 pos 刚刚讲的有这么多我们这个智能题啊,他可以直接去执行操作,也可以调用这个工具来执行操作,这个取决于你给他的任务难不难啊,如果你只是简单的问答,他本身的大脑就可以告诉你了啊,他就不用去拿计算器了 啊。右边是他一个决策的过程啊,如果你的给他的任务非常难啊,他首先会触发他的这个决策过程,去判断一下他需要通过什么样的操作才可以去完成你指定给他的任务啊。这里面会有一个思维链, 这个也是一个说老不老,说新不新的概念啊,在大模型里当然老,但是按年份来算的话,还是一个比较新的概念啊。我们这个 vip 课里面也是之前详详细的讲过两节关于这个 c o t 的 内容啊,它也是当前这个 a j 的 能出现的最主要原因之一 啊,让那个大模型可以像人类一样进行思考啊。当然呢,它现在变成小,变成小龙虾了。好,那我们看完这三个模块会发现我们还有一个什么模块没有讲呢? 这个 memory 啊,刚刚我也说了,这个 agent 里面的 memory 跟这个大模型里面的 memory 有 什么不一样的啊?我们知道大模型里的这个 memory, 我 们通常指这个上下文窗口,对不对啊?上下文窗口? 那在 agent 里,它分成一个 short term and long term 的 memory, 有 有一个长期和一个短期的 memory 的 区别啊,那它到底是个什么东西?好,我们仔细看一下这个记忆模块儿啊,前面可能稍微会枯燥一点,因为给大家讲的是从发展历史开始啊,去讲这个 open code 出现的这个原理 啊。但是希望大家还是可以好好理解一下这一块的内容啊,因为现在网上 openclaw 的 视频这么多,你看了他们也会看,大家都会看,你的同事也会看,那你跟他们相比,你的特性在哪里啊?对吧?你的特性就在于你可以跟他讲出这些底层的架构上的不同啊,对不对? 他的决策和能力是通过调用的大模型能力决定的吗?对,根本来讲就是大模型进行思考的啊,包括你要不要用工具,怎么用工具这个东西也是大模型里面的思维链来进行决定的,是不是和 lstm 相似啊?不是,完全不是一个东西啊,我们仔细看一下。 好,我们说一下这个最关键的记忆模块啊,我们在理解这个 agent 的 时候,很多人会觉得你的大模型怎么这么厉害,好像那啥都记得啊,我昨天跟你说的话,你怎么今天还记得呀?我明明都关机了,对不对啊?但实际上呢,并不是这样的, 大模型本身呢,他并不具备真正意义上的持续记忆的能力啊,大模型是没这个玩意的,他的本质还是代码啊,那他如何去获得这种能力的呢啊?他的工作主要是依赖于这个, 大家都知道叫这个上下文窗口啊,因此呢,我们可以把这个大模型的上下文窗口理解为一块儿面积有限的一块儿黑板理论啊。所谓的黑板理论, 他的核心思想就是大模型,在每一次推理的时候,你只能看到当前上下文理的内容,也就是说,推理的时候,这个模型会把所有输入的信息全部写在这块黑板上, 基于他黑板上写的这些版书啊,去进行思考啊,进行推理来产生结果啊。但是有个问题,什么这块黑板它的面积大小是有限的啊,比如几千 tok, 几万 tok 啊,甚至在一些大的模型里面会有几十万的 tok 啊, 无,不管多大,他始终都是一个有限的资源啊。一旦信息容量版书的内容超过了个黑板的大小, 那新的内容就必须要覆盖旧的内容啊。我板书写不下了,大家上学的时候都看过,老老师一开始从左边写板书写到右边写满之后啊,再跑到左边,问大家这边抄完没抄完,我擦了啊,大模型也是一样的,如果内容太多的话,就会导致信息丢失啊。 因此呢,在这个 ai 智能的系统中,就需要专门设计这个叫什么一个记忆管理机制来解决这个问题啊,弹幕啊,主持人的屏幕,哈哈哈,这个我没有办法,看看那个助教老师他们那边有,有没有办法解决啊? 没事,人类是一个适应性的动物啊,你多看一会就适应了。好,我们刚刚说这个大模型需要专门设计一个记忆管理机制来解解决我们刚刚说的黑板理论的问题啊,我们没有办法把所有的历史信息都无限制的堆在这个上下文窗口里, 而是呢,要有策略地去管理哪些信息应该保留,哪些信息呢?应该压缩或者删除啊。这里就涉及到两个非常重要的机制了。第一个机制叫这个 system prompt 啊,叫系统提示词, 它是什么呢?我们可以把它理解为啊,就固定在黑板顶部的一段指令啊,这段指令呢,通常用来定义我们这个 ai agent 的 它的人设, 给他一个身份啊,给他一个角色以及一个行为轨,一个行为规则啊,比如我们可以规定在 a 证呢,它是一个金融分析助手 啊,或者说你是一个科研助理啊,甚至呢,你是一个超级牛的一个 p 十级别的这个代码生成专家啊。由于这个 system prompt 它的是位于这个整个上下文的最前面啊,所以,并且它在整个对话过程当中,它通常是保持不变的, 因此呢,它可以持续地影响这个模型的行为啊,不会发生改变啊,相当于给我们这个 ai agent 锁定了一个叫什么稳定的人设和任务目标啊,这个是 system prompt 啊。第二个呢, 叫 contact 呃, contact management 啊,一个上下文管理在真实的这个 ai agent 的 系统中啊, 这个对话往往会持续很长时间啊,如果你把所有的历史对话都保留在这个上下文当中,那很快就会超出这个上下文窗口的限制了。但因此呢,系统常常会针对这种大量的历史信息进行压缩摘要或者筛选啊, 什么意思啊?就比如说我们可以定期的对我们之前聊过的内容历历史对话进行一个总结 啊,因为大家很多时候用大模型上来来来一句你好对不对?像这种就属于废话,在大模型看来,而且也额外消耗你的 talk 啊,也占用你这个上下文窗口的这个限制大家以后用的时候可以不写了啊, 没有必要跟 ai 那 么礼貌啊,谢谢也不用说你好跟谢谢都是废话啊,那我们说了,把历史对话压缩成一短一段简短的这这种摘药,或者说只保留与当前这个任务相关的重要信息啊,把不重要的内容删除啊,这样就 能够在有限的上下文空间中来保留最关键的信息啊,从而保证模型在推理的时候既可以看到前面的知识啊,也有空间来理解当前的这个任务啊。 这个是他的一个记忆模块,主要有两个关键的机制啊,第一个我们回回顾一下,就是固定在那整个黑板的最顶端啊,就比如说这这堂课的内容, 他通常会定义了你一个大模型的一个角色行为和准则啊。第二个我们会对历史的大量的这种记忆进行一个记录、优化、结论总结,把那些废话全部什么 ok 剔除掉,我会感觉到正在进行社交互动,哈哈。啊,这倒是啊,这是一个叫什么?这个是一个情绪价,情绪价值的体现啊。我那小侄女啊,天天我, 我问她你懂不懂 ai 啊,她说我懂,我说你懂 ai 什么?她说我每天都会跟豆包讲话。哈哈,谢谢可以作为奖励算法的关键词啊。 那不一定啊,比如说你没有得到答案,你也有可能会跟他说谢谢嘛,对不对?那只是出于你礼貌的一种表现。你在淘宝问这个商家的时候,他没有货了,你不会跟他说一句谢谢吗? memory 点 md 啊,这个同学了解的比较多啊,这个我们在这个 opencloud 里面会讲。好, 那我们刚刚了解的这个记忆模块,基本的 agent 的 记忆模块是什么东西啊?我,我们看一下它具体实现方式是怎么样的啊?我们上页说到大模型本身的上下文窗口,它是有限的啊,因此这个系统必须通过一些机制来拓展这个记忆能力。 那么在实际的 ai agent 的 系统当中呢?最常见的一种实现方式呢?就是这个东西,我们说叫 rap 啊,外部记忆系统,或者说知识库或向量向量数据库啊,是 rap 的 一部分啊, 大家如果之前上过这个大模型的课啊,应该会了解这个 r a g 啊, rap 解锁增强生成记忆机制啊,它其实分为两块啊,它既有解锁和增强生成记忆机制啊,它同时它也是一个记忆模块 啊,整个流程就可以拆分为这几步。首先用户提问,用户向这个 a g 呢输入一个问题,那这个时候大模型就会把你输入的问问题 embedding 之后进行解锁啊, 跟什么东西解锁呢?你给他的一个知识库啊,这个知识库是什么?你自己来定义啊,他会把你给他输入的问题啊,和这个知识库里,他觉得在向量空间中最相似的那个东西做一个 match 啊,把知识库里给的答案 做一个增强跟这个大模型它本身的能力生成的这个回答,去做一个 enhance 的 一个操作啊,这个就是你最终的答案啊,简单来说就是让你在考试的时候让你啊带一本参考书, 你做一道题,你可以翻一下那本书,你看跟哪道题比较相似的,你就去抄吧啊,当然也不能全抄对不对?因为他毕竟只是例题,跟你这个题跟你考试的题可能不太一样啊,所以就要把这个参考书里的内容和你自己本身的 题目的内容去做一个修改也好,改进也好,拼接也好,反正就是一种以 hands 的 操作,这个才是你的最终答案啊, 这个就是我们常说的这个 reag, 它现在是一个主流的 agent 的 记忆,一个记忆模块 啊,这种机制机制的核心优势在哪呢?就是它可以突破大模型参数知识的限制啊,能够有效的解决这种上下文窗口有限的问题啊,为什么?因为知识库在外部的。

你有没有想过,一个真正可控的 ai 智能体框架应该是什么样的架构?今天我们来深度解析 opencloud, 一个不走寻常路的 ai 智能体框架。 opencloud 的 核心思想是以 getwave 为中心的本地优先 ai 控制平面,它不是那种传统的微服务聊天机器人,而是单机控制平面,加上内嵌智能体运行时的架构。整个系统分五层,第一层,接入层, 负责连接 whatsapp、 telegram、 slack、 discord 等消息平台以及 c、 l i 和各种客户端, 这些入口统一接到 getaway, 而不是各自直接驱动模型。第二层,控制平面层,也就是 getaway, 是 系统的唯一真相来源,负责绘画列表、路由状态管理, 默认监听本地的一万八千七百八十九端口。第三层,执行层,也叫 a 帧、 run time u p 杠、 aint 杠,括号视线, 完成上下文组装模型推理、工具执行和流逝输出,默认超时六百秒。第四层,能力层,内置工具调用能力 skills 按需加载系统提示词里指注入技能的名称和描述,真正的技能文件,用到时才读取。 第五层,状态层,包括工作区文件、绘画记录和记忆缩影,绘画历史以 j s o n l 格式存储在本地磁盘。那么一条消息是如何在这五层里流转的呢? 消息先进入通道 gateway, 根据规则选择对应的 session 和 agent, 然后 runtime 动态组装系统提示词, 把工具列表、技能列表、当前时区、工作区文件和历史记忆一起注入上下文,接着调用模型,模型如果需要使用工具就执行工具, 把结果回填给模型指导完成最后流逝输出回复,同时把绘画记录和更新的记忆写回磁盘和缩影。这条练物的设计重点 是同一条绘画内的状态一致,而不是单纯追求并发量。系统提示词每次运行都是动态重建的,每个文件截断上线是两万字符,所有 bootstrap 文件总上线是十五万字符。 open cloud 的 绘画设计是一个核心亮点。默认情况下,每个 agent 的 私信共用一个主绘画,也就是 dm scope 等于 main 绘画键,由 git 统一管理, 格式是 agent 冒号 agent id 冒号 main key, 这是实现多通道统一人格的基础。绘画每天凌晨四点在 getway 主机本地时间自动重置,但这里有一个重要的安全警告,默认的 me 模式会让所有用户共享同一个绘画上下文, 不同用户的信息可能互相泄露。如果你的 a 诊托接收多个用户的消息,必须把 d m scope 改为 p r 杠 channel 杠 peer 按渠道和发送者隔离,或者 poor 杠 account 杠 channel 杠 peer 按账号加渠道加发送者三层隔离。 群聊则始终有独立的绘画模型,是按 size 串行,按通道限流的队列设计。 同一个 session 内,同一时刻只有一个活动运行,避免工具调用和绘画状态互相冲突。但不同 session 可以 并发, main 通道默认并发四 safetent 通道默认并发八默认防抖一千毫秒,每绘画排队上线二十条。记忆系统是另一个亮点。 open cloud 的 记忆本质是工作区里的纯 markdown 文件,文件是唯一的真相来源。 记忆分两类,一是 markdown 文件,包括每日记忆和长期记忆。二是向量剪索缩影默认使用 memory call, 如果 x r o t v 可用,就在 sq lite 内加速,否则回退到 javascript 内加速,否则回退到 javascript 用于语义剪索。 memory 下划线 get 用于安路径精确读取。当绘画接近上下文窗口上线时, openclaw 会先执行静默记忆刷新提醒模型,把重要内容写到词盘,然后再触发自动压缩。 openclaw 提供了两套 hook 机制,让开发者在关键节点扩展行为。内部 hook 主要有 agent boostrap, 可以 在系统提示词最终确定前增减 boostrap 文件以及各种命令 hook 响应 new reset, stop 等指令。 插件库更加丰富,运行在 agent loop 或 gateway pipeline, 比如 before 下划线 model 下划线 resolve 可以 在模型解析前覆盖 provider 和 model。 before 下划线 to 下划线 call 和 after 下划线 to 下划线 call 可以 拦截工具的参数和结果。 message 下滑线 received 和 message 下滑线 send 覆盖消息的入站和出站生命周期。 gateway 下滑线 start 和 gateway 下滑线 stop 则对应 gateway 的 整个生命周期。 这套 hook 机制让 openclaw 具备了很强的二次开发能力,可以在不修改核心代码的前提下灵活扩展各种能力。总结一下 opencloud 的 架构,亮点有四个,一、 gateway 单点控制 local first 部署,默认不暴露公网。二、动态上下文组装 scales, 按需加载, 兼顾性能与灵活性。三、按 size 串形的并发模型,保证状态一致性。四、 markdown 文件为唯一真相来源的记忆系统,透明可调试,可持久化。如果你在评估 ai 智能体框架, opencloud, 这套架构设计非常值得深入研究。 本期视频内容整理自 open core 官方文档和架构设计文档,感谢观看。如果觉得有帮助,点赞投币收藏,支持一下关注我,下期再见!

哈喽,大家好,今天来更新一下 openflow 这个项目的一些进度吧。 openflow 这个项目的话,目前呢做了比较多的一些更新,第一个更新支持了三三个端,就是 macos、 linux 还有那个 windows。 这三个平台的话,像 macos 的 话,它是有一些界面的,并且是支持那个命令行的。 linux 和 windows 整体上来讲还是支持那个命令行的 c l i 这种形式。 这三个平台的话,因为我本身没有这两个,没有 linux 和那个 windows 平台,我没法做测试,我电脑的空间也不是特别大,所以大家如果有问题的可以提 pr, 我 到时候就给合并过去。 另外增加了一些功能,这个是有一个大神贡献的,它贡献了一个设置面板,在这个设置面板上确实非常方便的,就可以去实现这些公嗯按钮的切换配置。比如说你想把这个键改成 f n 或者是右键,你都可以在这配置。 并且它有两种模式,有这个 build 模式和这个正常的按住,再再一次这种模式可以自己去做切换。它还增加了一个 简化体转换的功能,我觉得可能是对于台湾的或者是香港的朋友是非常友好的。另外呢,还展示出了 mac os 的 这个权限的配置的一个实际情况。简单来说,因为我们没有开发者的签名,所以说你每次更新这个软件或者是重新下载的话,它其实都需要重新授权的。 而且这种授权呢,他可能给你一种假象,你以为他授权了,实际上呢,他还是没有授权的。所以说你必须把原来的这些权限的设置呢,你都要点那个简号给它删除掉,并且重新授权, 这里是体现出的是实际的授权情况,如果有问题的,你就可以去点到对应的设置当中呢,把他之前的那个 open flow 删掉,再重新添加这个地方只要都显示成绿色的,那么就代表这个产品是可以实际使用。有这么一个问题, 这个后面除非我充钱充苹果开发者会员,大家就不会有这种问题了,否则一直可能会有这个问题。 还增加了一个远程的模型,因为我没太用过这个远程的模型啊。这个模型的话你可以添加这个 k, 我 自己也注册了一下,也用了一下,是可以可以用的。如果是大家对远程远程服务的这种啊,语音转文本有需求的话,大家可以配置这个模型。本地呢,我自己是提供了, 又增加了一种精度稍微高一些的,比之前两百兆版本多一点的四百兆的版本,这个版本的话是我自己从原原始的非量化版本通过代码给它转换成的这个版本。不过目前看哈,我觉得这俩差效果没有差异特别大,所以我推荐大家还是用这两百兆的版本,我觉得也够用了。 后面的话我再考虑说如何用大模型把这个输出的结果或者是历史对话做一些关键词提取或者是修正,还得考虑,因为我觉得他这个会影响速度,主要是,所以我暂时可能还是想再看一看,比如说有的用户可能有这个需求,那我给他加上,如果要是一般的话,我觉得正常来讲也够用了。 你就看大家的这个需求吧,我感觉不算特别强烈,我自己用的时候其实我觉得还好,还有一个因为给大模型 a 扣顶啊,它其实你只要说了一堆东西之后,你只要是没有什么特别明显错误发给他,他都能理解啊, 不是那种严肃编辑场合的话,其实还是可以的。另外 model 的 这个模型的话,它是现在是有一个路径的显示,实际模型被放到哪个位置的话,这有个显示。 另外这有个测试热键的功能,还有些日制的记录,比如说你现在这个日制的情况,它会实时的显示在这里,这样的话大家有什么问题的话可以看这个日制。那非常感谢这位,这位这个贡献者开发者其实还是挺不错的给这个项目啊。第二个它还有一个比较大的一个贡献,它是有一个功能,我先按住 command 键之后呢,会显示一个 显示一个录音的状态啊,这个我觉得也挺好,比如说我现在松开它就会这个就会这样,比如说这样,我现在是显示这个状态,我觉得还不错,你看这样还挺好用的。 另外呢,我增加了一个自动更新的功能,你点击打开更新之后的话,会自动去找最新的 release 版本,会自动进行更新啊,就省着你每次去那个。但是还是存在那个问题啊,你每次更新完之后还是要把权限重新手动设置一下,确实是没啥办法, 这两个平台的确实是啊,我听说是 linux 这个平台的人还是提出了一些想法,说他们觉得是这个平台上其实现在目前特别缺类似的产品, 这个我在想怎么才能测试一下,或者说我把这个平台啊,怎么才能自己安一下,或者怎么样才在平台上能够充分的去把这个产品功能开发出来哈, 觉得这个可能对这个平台可能也是比较有帮助的。或者是啊,这种下面如果大家有在平台开发的,可以 tpr 把这个,咱们把这个功能给它建设起来啊,这也是挺好的。我觉得 这个产品其实相对来讲,对于我之前的 iq 顶来讲的话,这个是比较完整的。原来的那些产品的话,很多都是开发一些相对比较简单的一些功能,这个产品还是稍微复杂一点。对于我来讲啊,我觉得还是稍微复杂一点,涉及到模型,包括涉及到性能的问题,包括它是用 ras 的 语言去写,虽然我不懂这个语言, 但是的话它在调试的过程当中的话,它这个 bug 会相对多一些。另外它就多个端,多个端涉及到测试的问题, 以及这个怎么说它的综合性还是比较强,大家东西还是相对多一些。这个产品确实全部都是通过 ai 构建来完成的,我没有写一行代码 啊,能感受到现在 ai 的 这个能力确实很强啊。但是要提一下,目前这个产品之之前从零到一开发的时候,还是用 cloud 模型多一些啊,就 cursor 里面的 cloud, 因为我是用了买的 cursor 拷出来的会员, 所以说的话,其实用 cursor cursor 里面的这个 cloud 的 话,相对来讲成本还是好一些的,比便宜一些。如果直接去买的话,那个 key 我 看是特别贵的, 如果你用那个 codex 的 话可能也行,但是我我这我在 cursor 里面试了试,我觉得它的它的报错都特别多,还是 cloud 模型好用很多啊这么一个情况。行,先汇报这些吧,然后一会要上班去了, 大家有什么新的问题的话也欢迎给我提这个一说啊。然后或者那个再贡献点 p r 也可以, 因为我发现这个会代码的人还是还是厉害很多。这个写的东西确实是更稳定一些啊。我自己要是写的话,就是发现这个 bug 的 时间其实还是比较多的。行,今天先唠这些吧,拜拜。

微信揭露龙虾成功了,他真的能干活呀!如果你的微信也想揭露龙虾 open curl 呢?可以看我接下来的操作。这期的干货有点长,建议先赞后看。 这是微信的设置啊,我们在设置里往下滑,找到这个插件,然后这里有个微信扩展的插件,如果你没有这个插件呢,也不用着急,你要把手机重启一下,然后就有了。如果你是苹果手机呢,可以用 siri 语音命令来帮你重启 iphone siri 重启手机。 然后我们点这个详情啊,这里有那个具体的安装方法,我现在安装一下。我这个 mac studio 已经早就安装好小龙虾了,然后我们准备在终端里复制刚才那个指令,安装一下微信和小龙虾的插件。好回车, 哎,出问题了。好,它是显示我这个 note 格式的版本有问题。 ok, 我 们现在安装一下。 好,我们已经安装这个 notares 的 插件了,我们再复制一下刚才这条指令, 哎,这里显示正在安装插件, 然后它最后出现了,就会出现这个二维码。微信扫一下这个二维码,扫了刚才那个二维码之后呢,就会出现这个连接页面,我们点连接。 ok, 微信的小龙虾已经连接成功了,我们试一下。 把我桌面一个叫龙虾的 ppt 发给我,我看一下,他们 反应稍微有点慢,它显示对方正在输入, 哎,这个就是我在桌面的那个龙虾的 ppt, 我 们看一下,我们先预览一下。 对,这是我电脑桌面的 ppt, 然后他会自己去找,在桌面上找了发给我。 这等于是什么呢?这等于就是你的电脑旁一直坐着一个初中生,你发一条消息,他就能在电脑上执行你的指令,帮你干活。不用怀疑我电脑桌面上的 ppt 和微信龙虾发给我的是同一个文件。我是千里一个懂点 ai 的 数码博主。关注我,下次咱再看点不一样的。

呃,好,我现在呢,在这个呃我的这个 mac mini 上面,我现在开始重新再部署一下这个 open globe, 因为我之前是在我的这个啊 macbook 上面部署的,现在我的我可以将它这个转移到我的这个呃 mac mini 上,你可以把它认认成为像,是 啊,把它的这个大脑转移到了这个 mac mini 上面,但是前提是我先要给它安装好这个 open globe 的 环境。那么还是一样啊,我们在这个 mac 上安装的时候,首先要给它安装 homebrew, 装好之后等它会提示有三个这一个啊 命令,然后给它原封不动复制进去,然后就可以用 open globe 的 啊 clear meaning, 然后去安装,然后它就会有一个安装的过程。 好,我现在呢已经将这个呃 macbook 上面的这个相关的一些有关 open globe 的 一些设置呢,已经全部打包,并且通过 air drop 传到我的这个 mac mini 上面。那么我在 mac mini 上面呢, 我又通过运行这个读取命令,然后把这个呃在 macbook 上面部署 open globe 的 时候设置的一些 agent 啊,包括它的一些 skills 设置啊,它的任务设置,全部都转移到了我的这个啊 mac mini 上面,相当于我现在将 macbook 的 这个 open globe 的 大脑已经转移到了这个 mac mini 上面了。 呃,也不是转移就是复制啊,就完全的复制,然后我的这个 macbook 就 可以呃,卸载掉啊,就可以不用让它一直运行在我的 macbook 上面,只需要运行在我的这个啊 mac mini 上面就可以了。 然后在这个 mac mini 上面,我们重启了它的这个 open globe 的 getaway 啊,就是它的这个运行轨道,我们重启了以后,可以看到 open globe 已经进入,正式进入它的视界面,但是在上面写 getaway service, 啊已经这个啊完全的启动了。嗯, 现在我们显示啊,现在从这个 macbook 到 mac mini 上面的这个整个的这个 open cut 的 迁移已经完成了,我们可以看到上面显示啊 getaway 已经在运行中,并且飞书已经连接啊 telegram 就是 我配置的两个 channel, 啊,两个 channel 它都已经成功的这个转移,并且没有影响到它的这个两个 channel 的 连接,那么呃它现在相当于它的灵魂就它大脑已经转移到了我的这个 mac mini 上面了,那我的 mac mini 就 可以二四小时的运行了,就不会受到我这个 macbook 的 影响。 然后我们就可以看到他说啊,如果想用 mac mini 作为主力机器的话,可以在这边继续对话原 mac mac 的 open globe 可以 选择呃关闭或者保留,就是呃就是我这个电脑上的 mac, 呃, open globe 就是 我这个 macbook 笔记本电脑上面的这个呃 open globe 可以 选择关闭或者保留,如果保留的话,呃它也会受到两个会同步,相当于我现在是有两个两个 open globe, 那 如果是关闭的话,那就是完全用在这个 mac mini 上面了。 ok, 那 么今天的这个呃 open globe 从 macbook 迁移到 mac mini 上面的整个流程就给大家说清楚喽,如果有需要的,呃了解的还可以继续向我咨询。

大家好,我是麦冬,今天我们接着来聊聊 open class 接入非书后可以帮你做的一些事情。我们分五个场景给大家来介绍,分别是群聊助手、会议机要助手、日程助手、文档助手以及消息助手、 视频教程,欢迎大家点赞收藏,慢慢观看。我们首先来看第一个群聊助手,群聊助手的使用需要将飞猪机器人拉到群聊中,比如我这边的日常工作群,我们点击右上角的更多点击设置 点击群,机器人选择添加机器人,这边选择我们已经创建好的机器人小麦, 点击添加机器人,小麦就已经成功加入日常工作群了。下面我们可以在群聊里面直接艾特小麦,让他总结一下今天的群聊内容。 机器人很快就已经整理好了当天的群聊内容,接下来我们可以更进一步,让机器人协助我们创建好会议日程。 好,机器人回复,日程已经创建好了,下面我们切换到日历,看一下日程的创建情况, 可以看到三月十六号上午十点半到十一点半的日程已经成功创建了,你甚至还可以继续跟机器人对话,让他将工作群里面的其他人添加到该日程里。 好了,机器人回复,整个群的其他人都已经加入了该会议的参会人了,我们同样可以回到日神这边看一下,可以看到参与人里面已经将日常工作群加入进来了。 好,接下来我们来看第二个场景,会议记要助手。当我们使用飞书视频会议开会后,飞书会自动生成智能记要,而飞书机器人可以直接读取该会议记要,并且对其进行提炼总结。下面我们就来演示一下会议记要助手的功能, 我们点开机器人的对话框,让他提炼一下市场部会议的核心内容, 可以看到市场部会议的核心内容已经提炼出来了,我们可以点开视频会议,点击市场部会议的智能机要查看,对比一下 智能机器人的总结跟会议机要里看到的内容几乎是一致的。接下来我们还可以让智能机器人根据会议内容直接生成代办, 机器人很快就帮我把代办日程整理出来了,接下来我们只需要回复它,确认创建这三个日程,它就会自动帮我们在日历里面把日程创建好。 日程已经成功建好了, ai 甚至自动帮我加了一个进度同步的日程,我们点击日历看一下。 ok, 没有问题,日程都已经创建成功了。 接下来我们来看第三个场景,日程助手在前面的演示中其实也跟大家展现过了它的部分功能创建日程,那么我们再来给大家做一次进一步的演示。首先是日程的查询,我会让机器人帮我查一下下周五的所有日程。 好了,机器人已经把我下周所有的日程全部罗列出来了,接下来我会让他帮我在下周二上午十点到十点半创建一个市场部会议的日程。 ok, 日程已经创建好了,我们来看一下上午十点到十点半市场部会议 参与人,我跟小张没有任何问题,我们其实还可以通过机器人的绘画,让他帮我们修改或者删除日程,这个我们就不在本次视频里演示了,大家可以自行去体验一下。 接下来我们来看下一个场景,文档助手,我们可以直接将本地的 excel 表格或者是 word 文档直接发给机器人,让他将其转成多维表格或者是云文档,并且对文档里面的内容做一些总结。 下面我们先来试一下 excel 表格,我们先来看一下这份表格,这是一份模拟的用户转化数据表。好,我们回到飞书,将这份 excel 表格发给机器人, 可以看到当我们将 excel 表格发给机器人后,它已经自动读取了 excel 表格里面的内容,并且做了一些基础的总结。接下来我们可以让它将该 excel 表格 转化成多维表格,并且给我们生成一些数据格式化的图表。 好,已经可以了,接下来我们来看一下。首先看用户转化数据分析的多维表格, 可以看到相关的数据已经被写入转化明细了。下面我们再来看一下用户转化数据格式化报表, 可以看到它也给我们生成了一份格式化报表,但是由于兼容性的原因,部分报表没有办法正常展示。 我们也可以继续跟机器人对话,让他尝试修复一下当前文档里的图标显示,或者是本地生成一张 pdf 图标直接发给我,这两个功能就留给大家自行地去探索了。 excel 表格已经给大家演示完成了,下面我们再来看一下 word 文档,我这边同样准备了一个测试的 word 文档,里面是三月第三周的运营工作周报,下面我们回到飞书,将这份工作周报发给机器人, 可以看到机器人已经收到我们的文档了,他同样会先读取一下该文档,然后对其做一份简单的提炼,可以看到周报的核心内容已经被其提炼出来了。接下来我们可以让他将这份周报存到我们的云文档里面, 可以看到文档已经成功转换为云文档了,点击即可在线查看。 同样他也是对于我们的原始文档做了一份总结,便于我们更好的查看该文档的核心内容。好,接下来我们来看最后一个场景,消息助手, 我们回到飞书,可以看到当前小张给我发了一份消息,询问我明天下午三点我是否有空,有个问题想跟我聊一聊。这时候我可以让机器人去读取一下小张的信息,并且结合我的日程给小张一个回复。 可以看到机器人读取了小张的信息,读取了我明天下午三点的日程,并且给了我对小张的建议回复,接下来我只需要告诉他确认给小张发送这条消息即可。 我们可以看到机器人给我们提示,需要申请权限才能继续。当我们想以自己的身份给其他人发送消息的时候,都需要开通这个 send as user 的 权限,直接点击去申请即可。 勾选该权限,点击确认开通。权限开通好了之后,点击版本发布与管理,点击创建版本,填写版本号,这边任意填写一个即可填写更新说明, 点击保存确认。发布 好,发布完成,我们回到飞书给机器人再次发送一个消息, 根据提示点击前往授权,点击授权,授权成功了, 可以看到机器人已经自动将我的消息发送给了小张,我们点开看一下,完全没有任何问题。好消息助手到这边就演示完成了。飞书的 open cloud 生态目前个人觉得还是比较完善的,并且基于此可以实现的场景也非常的丰富。 后续我还会继续分享狐朋狗友接入非书后的一些高阶场景。工具会变,但方法更重要。我是麦冬,下条继续。

给大家分享一个使用 open cloud 结合推特提供的 pro 点 x 做你产品逾期分新的方法,非常的实用简单。那我这边呢,是在 pro 点 x 创建一个工作区,这个工作区叫做一个 deck, 并在同一个 deck 里面放置多列的内容。你看每一列都可以设置一个不同的主题,不同的关键词,或者针对某个人的 一个监控,都是可以集中查看的,而且它的内容是实时同步的。那我的第一列呢,设置的就是我的产品 make anime 的 一个监控,我让 openclaw 呢写了一个 skill, 这个 skill 的 逻辑很简单,就是让它每隔半小时打开刚才的工作区域,进入 make anime 这一列,然后过滤掉我官方账号的内容,然后对新增的一个推文 就是做一定的内容分析,判断余情是正面的还是负面的,并且把推文的原链接一并整理发送给我。这样呢,我就能够实时的去监控余情,正面的反馈呢,我能秒 回抓住潜在的用户,那负面的余情呢,我也能第一时间去私信跟进。当然目前 macenemy 的 营销主要是在 x 上,之后呢,我可以用同样的方法把这个监控呢扩展到其他的渠道,我只需要提供一个包含这个产品关键词搜索的链接,那这样的话就可以建立一个类似的自动化的余情监控流程。 需要说明的是, pro 点 x 呢,是针对推特会员提供的服务,你得是 x 的 会员才能够使用。但是 pro 点 x 其实有很多非常实用的用法,特别是在 marketing 和我的早期需求调研上。如果大家感兴趣呢,欢迎也在评论区留言,我可以单独再做一期详细的一个讲解。

我终于把 open club 部署到我的亚马逊里面了,其实我真的没有想过他真的有一天会释放我的双手,我觉得这还是处于那种 科幻级的一个状态,但是实际上他真的做到了,现在基本上可以帮我做一些上品修改、详情页、投流设置、预算等等,所有都是他来操作。我待会会给大家放一下操作流程,所有他在操作的我都可以展现给到大家。

哈喽大家好,欢迎回到今天的节目之前,咱们几期节目把欧本可的一件部署国家超算的千万免费 tokins 福利都给大家讲透了,结果后台又被大家的私信炸了,百分之九十的问题都集中在一件事上,我装好了欧本可,但是很多功能用不了,大家说的自动干活的能力到底怎么开? 网上的 skys 插件到底能不能装?安不安全?哪些是真的好用的?今天这期节目,咱们就用大白话把 opencloud skys 这件事给大家劳的明明白白,先给小白讲清楚 skys 到底是啥, 再给大家讲新手零门槛的安装方法,然后重点盘点四款官方平台新标,最高普通人能直接上手的神仙 skills。 最后也是最重要的给大家讲透核心安全风险和避坑指南,全是干货,没有废话,听完就能直接上手。首先先给所有小白朋友补个最基础的科普, 这个 skills 到底是个啥?大白话?翻译一下,如果说 opencloud 本身是一部新手机,那 skills 就是 手机里的 app, 你 刚买的新手机只有基础的打电话、发短信功能,装了微信就能聊天,装了外卖 app 就 能点餐。 opencloud 的 skills 也是一模一样的道理, 刚装好的 opencloud, 只有最基础的对话功能,你装了对应的 skills, 它才能解锁对应的干活能力。说白了, opencloud 能有多好用,百分之九十都取决于你装了什么 skills, 这也是它和普通聊天 ai 最大的区别,普通 ai 只能给你出主意,装了 skys 的 open klo 能直接上手帮你干活。讲完了是什么?接下来就是大家最关心的到底怎么装?我给大家提炼了两种新手零门槛的方法,全程不用写代码,点点嘴,点点鼠标就能搞定。 第一种也是我最推荐新手,尤其是用国家超算平台的朋友,用的 web 格式化一键安装,操作特别简单。你登录国家超算互联网官网,进入你不熟好的欧本壳界面,左侧菜单栏找到技能管理,点进去就是官方的技能市场,想装什么技能,直接点一下安装, 系统就会自动帮你完成下载配置,全程不用你管,装完刷新一下就能用,比手机装 app 还简单。第二种更省事的一句话,对话式安装,你连鼠标都不用点,直接在对话框里跟它说,帮我安装自我改进代理技能,它就会自动匹配对应的技能,自己完成下载安装,装完还会告诉你怎么用, 全程零门槛,会说话就能用。至于命令行安装,自定义本地安装,适合有一定基础的专业玩家,新手不用碰,上面两种方法完全够用了。接下来就是大家最期待的环节,给大家盘点四款官方平台新标最高,我和身边朋友亲测好用,普通人能直接上手的神仙 skills, 每一款都能解决大家的真实痛点,按需安装就行。第一款也是所有朋友必装的新标,最高的基础技能自我改进代理两千新标三点三万加的安装量,是平台最火的全民基础款。它解决的最大痛点就是原生 ai, 屡教不改, 毛病很多朋友应该都遇到过,你交了 ai 周报要按公式模板写数据要保留两位小数,结果下次他还是写错,犯过的错转头就忘。装了这个技能之后,就相当于给欧本可欧装上了一个专属错题本,只要他操作失败,或者你手动纠正了他的错误, 他就会自动记录下来,永久沉淀成执行规则。下次遇到一模一样的场景,自动规避同类错误,越用越贴合你的习惯。比如你让他整理 excel 表格, 它公式写错了,下次它就会自动避开这个错误,不用你反复提醒,不管你是上班族还是个人用,这都是第一个要装的必装款,没有之一。第二款,重度用户必备的进阶款,自我提升加主动代理三百四十三星标, windows、 mac、 linux 全系统兼容。 它是上一款的主动进阶版,如果说上一款是犯错了才改,那这款就是干完活主动优化。它每次完成你给的任务之后,会主动做全流程复盘,自己评估任务完成得好不好,哪里有优化空间。 主动修正执行逻辑,不用你提要求,自己就会越做越好。比如你让它生成了短视频脚本,它完成后会主动复盘脚本节奏卖点够不够突出。主动优化版本还会把优化逻辑记下来, 后续写脚本会越来越贴合你的流量需求。除此之外,它还能基于你的习惯主动干活。比如知道你每周五要写周报,会主动提前抓取本周工作数据生成出稿,特别适合重度依赖 欧本 klo 做自动化的自媒体电商商家项目经理。第三款,解决 ai 记忆混乱的核心款,文体论两百七十星标,纯本地运行,隐私型拉满很多朋友用 ai 都会遇到一个问题既东西,东一榔头西一棒子。客户的需求、项目的进度、对接的人经常记昏漏记。这款技能就是给欧本 klo 装上了一个结构化的私人知识库,他会把所有信息按人物、项目、任务、文档、分类规当,还能自动关联相关信息,形成专属知识图谱。比如他会把客户张三的对接、项目 需求、沟通记录、截止时间全部关联起来。你问一句张三的项目进度,他能精准调出所有相关信息,绝对不会记混,而且所有数据都存在本地,不上传到云端。隐私新拉满特别适合需要管理多项目、多客户的销售、运营、项目经理,所有用户都推荐安装第四款全流程自动化的核心款, a p i 网管二幺三新标想玩进阶自动化逼装?很多朋友想让欧奔克奥跨工具干活,比如收到客户消息,自动在 no 神建档案,在表格里更新订单,再给你发提醒,但是不知道怎么对接这些工具,这款技能就是解决这个问题的, 它预制了一百家主流办公工具的一键对接,不用你写代码,不用研究接口文档,一键授权就能打通一次授权,所有功能都能调用。装了它之后,你就能实现跨工具的全流程自动化,彻底解放双手,特别适合企业运营、行政、电商、商家是进阶玩法的核心技能。 讲完了,好用的技能必须给大家敲个警钟。 skills 虽然好用,但安全风险不能忽视。我给大家提炼了三个核心风险 和对应的避坑指南,照着做就能避开百分之九十的坑。首先是核心风险,第一,也是最致命的第三方社区技能的恶意投毒,不少来路不明的技能里藏着恶意代码,轻则偷你的 a p m, 要刷你的 tokins, 重则直接接管你的设备。第二,权限滥用。很多技能要的权限远超自身功能需求,就像一个天期 app 要你通讯录权限,一旦授权,风险极高。第三,自动化审核有边界,不是所有上架的技能都绝对安全, 有不少恶意技能能绕过静态扫描。对应的避坑指南,大家一定要记好!第一,渠道管控优先装官方认证高新标,知名开发者发布的技能, 绝对不要装来路不明的第三方安装包。第二,最小权限原则,永远只给技能完成功能所需的最小权限,关键操作必须加人工二次审批。第三,安装前必看安全报告,只有官方标记为良性,通过安全扫描的技能才能装,有异常的直接 pass。 最后给大家总结一下, skills 是 open code 的 灵魂,能让它从一个只会聊天的 ai, 变成一个能帮你实打实干活的智能助理,用好它,真的能帮你省下大把的时间和精力。 之前咱们领的国家超算互联网的千万免费 tokens, 刚好够大家把这些好用的技能都试一遍,一分钱不用花,就能体验到 ai 帮你干活的快乐。大家只要照着我上面说的规规矩矩装,按安全全用就完全没问题。 好了,今天的节目就到这里,你有什么好用的神仙 skills, 或者踩过什么坑,都可以在评论区留言,咱们一起交流避坑,咱们下期再见!

仅一插播一条微信,刚刚更新了支持小龙虾 open cloud 的 这个插件,我们一起来试一下。来,我们打开微信看一下,我们点击设置,然后拉到最下面,然后看一下这个微信版本要更新到八点 零点七这个版本,最新的这个版本,呃,确定好了之后呢?然后点击插件,插件里面我们就可以看到这个微信 cloud 这个插件。 ok, 这里只需要复制,只需要复制这个命令行就可以了,然后回到我们电脑,打开我们的终端,然后复制上去这个命令行。 嗯,好像有些问题呀。我们这我们换一种思路,我们直接去对,直接把这个命令行截图,然后直接丢给我们的这个录像,让他,让他去安装。 嗯,没错,这也需要我们手动输入两个命令行, 然后拷贝了之后,然后进到这个,进到终端,然后输入,然后输入密码,这里需要输入密码。好,回车,然后第二条命令行复制一下。好,回车。好,已经开始安装了, 等它安装完就可以了。哦哦, ok, 这里是微信二维码,我们这个时候打开我们的微信,然后直接扫一下, 哎,可以了,然后, ok, 我 问一下他,你运行在什么设备上面? 他已经恢复了,他是运行在这个我的这个 macos 上面,我的苹果电脑上面,然后让他传一个东西吧,传一个,传一个图片到我的 电脑桌面上传一个图片到我的电脑桌面上, 哎,好像成功了, 嗯,没错,成功了让他再传回来呢。 嗯,好像有点问题。 a few minutes later, 嗯,这问题好像解决不了,有点解决不了啊,这个问题。嗯,传回来,嗯,还是有点小 bug, 不 过我刚刚上线嘛。呃,问题总会解决的。

各位老师好,本课我们将讲解如何利用扣子编程部署 openclaw。 首先来分享一下什么是 openclaw。 openclaw 本质上和我们常见的扣子豆包最大的区别,它不仅仅是聊天机器人,而且能够授权控制终端执行操作。 它是海外最近特别火的开源项目,是完全免费而且能够灵活的部署和定制的。什么叫授权终端执行操作?比如说今天我们在电脑上安装 open cloud 以后,它能够在接收你的指令以后, 自动地识别意图,执行对应动作。比如说帮你整理桌面文件夹,创建文件,或者在不同的网站和应用之间跨端处理任务。比如说今天你想要在一个 excel 里面把学生的数据录入到我们学校的 o a 网站系统上, 然后把这个学生数据在微信上和家长做一些信息的同步。过去可能需要涉及到多个网站和工具, 你要手动地复制粘贴,那今天 opencloud 它能够自动化地完成与同时能够执行本地的电脑以后也能有很多好玩的场景,比如说可以通过及时地 通讯工具,比如飞书钉钉像。如果你在出差或者旅游期间电脑不在身边,你也可以通过你手机里的飞书远程给他下达指令,他在你的本地电脑上完成对应的任务操作,相对来说能够帮助我们用 ai 提升工作的效率。 当然这个产品先提醒大家,目前还非常不成熟,有很多的信息安全漏洞,包括日常做内容的生成、信息处理、余情解锁,这些本质上和 用豆包、用扣子没有任何的区别,所以大家也要看看自己是否有真的应用场景。那为什么推荐老师们用扣子来部署 open cloud 呢?对比本地运行, 在扣子上部署,它是一个云端的虚拟机,可以理解为在服务器上建立了一个虚拟的电脑,它能操作便捷的同时保护数据和 api k 隐私。因为当你在本地部署了 open cloud 以后,它有可能会修改你的文件 或者了解一些敏感的信息,同时在云端也可以二十四小时稳定运行。那当前在扣子里部署仅限个人高阶旗舰,包括企业版本去创建和部署,每个用户最多可以部署一个 open cloud。 相对应的, open cloud 有 一个特点是对于 token 的 消耗非常大, 反映到费用上,就是相对执行一些任务,比起免费的 ai 来说会花更多的钱, 这是它的技术特点所决定的,所以我们日常使用的时候也要有成本的意识。那接下来怎么去使用 openclaw 呢?我们就一步一步为大家讲解。首先我们登录扣子编程的首页,在左下角可以看到直接可以领取 openclaw, 在 领取 openclaw 过程中,它会自动化的帮你部署和安装,安装完了以后就可以在左右分别进行调试和对话。 当然我们一般要想更方便的使用,一般是配置到飞书等外部渠道上,这个时候它就会出来几个选项,模型的选择,版本选择和渠道配置。 关于模型的选择,默认为自动模式,也可以选择豆包二点零等热门模型。不同的模型机座可以理解为版本越新,比如说豆包二点零,它就会越智能效果越好, 但是有些模型它的擅长点是响应速度更快,或者 token 消耗,也就是费用消耗较低,大家可以按需选择。 同时现在有两种版本,一个是满血版,也就是原版默认配置, token 消耗相对较多。省流版呢是调整了上下文和心跳的配置,消耗相对较低,可能会带来一些性能的损失,同时也可以配置不同的对话渠道。 那接下来我们就以飞书为例,看一看怎么去配。 完成了配对以后,你就可以和他正常的对话了, 如果想要让他本地操作或者跨不同的应用执行,还是需要本地安装,我们也会把对应的介绍放在文档里面。同时 open cloud 还有一个非常好的特点,就是非常的灵活,也就是我们可以安装不同的技能,增强他的能力。 举个例子,比如我们在之前课里讲到过,可以利用 code 编程 ai 开发技能,或者是在技能商店找到一些锤类技能,比如说像教员的生成,信息的制作等等。 那在这个时候,我们可以选择在扣子编程项目区找到我们想要为 pos 里面的 open cloud 安装的技能。打开这个技能,我们首先选择上方的文件夹按钮,然后有一个下载的页面,我们可以把这个技能直接下载到本地。 当然现在网上出现了大量开源免费的 skill, 我 们可以按需去把这些技能下载下来以后,你就可以回到扣子编程对话页面里, 在左下角有一个加号,它支持读取技能的 z i p 格式文件和 skill 格式的文件,也就是当你把这个压缩包传给它以后,它能够自动地去分析这个压缩包,并且把对应的技能给它安装上。比如说像今天我在 安装包下载下来以后,他就能够给我一个回复说这个技能包已经部署成功了,这样你就可以在对话里面直接使用垂类技能。当然这些应用的场景有很多,但是还是坦诚的说,目前 openclaw 还是一个不太成熟的产品,要想把它用好还是需要一些门槛的。 所以我们也建议各位老师未来可以重点把实际的应用放在豆包或者扣子这种成熟的 ai 产品上。 opencloud 当前虽然很热门,但是主要用于测试或者试点,后续它可能会逐步的完善,所以我们也列了一个表。 目前 opencloud 它的能力能读写本地的任意文件,扫描文件夹,包括有本地的数据库,数据不出本地。 它更好的结合是和你电脑里现有的文档资料。但如果你从隐私或者说实际工作流程考虑,用在线的形式去做生成,或者用智能体做一些分发和交流,那你可以完全使用豆包或者扣子等 ai。 所以 我们今天在了解了如何部署 open cloud 以后,大家也可以看看在教育领域未来怎么样能够和这样的一个自主化机器人去做一些交互和配合。 当然我们建议是 openclaw 这个产品当前不成熟,在今年一定会有很多更加成熟简单免费的产品涌现出来,所以说我们也可以保持耐心。在当下我们可以聚焦在本地化的教学资源、智能工厂、 第二大脑的贝壳知识库以及学生的数据分析等系统里面,把我们当前的一些本地操作和数据流程相结合好。以上就是关于 openclaw 的 介绍。