openclo 多智能体架构?今天来聊聊一个很多人都会遇到的问题,有 ai 助手的时候,到底该用子智能体,独立智能体还是 skill? 今天一期视频给你讲清楚,主要内容分三个部分,第一,多智能体的核心原理。 第二,子智能体和独立智能体怎么学?第三,智能体和 skill 的 判断决策术。三种模式对比,先建立基本概念, open call 里 ai 助手有三种工作模式,第一种教子智能体,临时任务用完就消失。 第二种叫独立智能体,有固定身份和长期记忆。第三种叫 skill 工具模块,专门被调用的能力。子智能体还是独立智能体?子智能体最适合这几种情况,单次复杂任务需要隔离执行需要并行处理。多个独立任务 临时性探索不需要记忆积累。简单说,临时任务找子智能体。独立智能体呢?适合这几种情况,固定角色长期服务。比如客服顾问需要独立记忆,不和其他任务混淆, 需要绑定不同群不同账号,定时任务周期性运行,用户需要一对一私聊。简单说,长期服务找独立智能体。
粉丝138获赞690

这期视频,我们聊聊怎么用 cloud 控制智能设备。控制智能设备,最关键的一步是拿到设备的控制权限。以小米温湿度计为例, 你想获取它的毒素,但小米并没有开放这类的接口,你很难获取。那怎么解决?这个时候, home assistant 就 派上了用场。 ha 是 一个开源的智能家居平台,它专门做了各大平台的设备集成,支持米家、苹果、 homekit、 涂鸦等一系列的主流设备。 它帮你把各个设备的协议进行的统一,你只需要授权给 ha, 就 能通过 ha 的 接口访问和控制所有设备。所以,而 oppo cloud 的 对接, ha 理论上就能通过 ha 控制所有的设备。但实际跑起来,问题很快就来了。我发现 oppo cloud 的 经常会遗忘我们对接的 ha 什么意思? 假如我问他房间的温度是多少,他不是去温湿度计去读取数据,而是走天气接口,甚至连地理位置都不对,这很离谱,对吧?在 open log 的 架构里, agent 采用的是 react 模式,先推理再行动。 当用户问温度是多少时,模型会先思考我该用什么工具。但问题来了,他并不知道自己有哪些设备可以用。 你说使用 home assistant 查看房间的温度,它能正确获取,但不加 h a 的 这个条件,它就开始自由发挥了。所以,当用户问温度的时候,模型一推理温度,我可以通过天气的 api 来获取,这并不是我们想要的结果。 而且在 h a 里面,一个设备往往会被分为多个实体,不同实体可能有类似的功能,这就更加容易造成查询的混乱。 那怎么解决?我想到了一个思路是,与其让 opcode 记住设备,不如让设备自己生命能力。 具体的做法是把每个设备分装成一个独立的 skill。 每个 skill 其实是有两部分核心内容的,第一部分是描述用自然语言告诉 agent 这个 skill 能做什么。第二部分是实现具体的调用逻辑,比如调用哪个 api, 跑什么脚本, 都不可傲的知道温湿度计是一个 skill, 并且他描述是读取温湿度的数据,他就明白用户问房间温度时,我就应该调用这个 skill。 而且根据 astropic 对 skill 的 设计, skill 的 使用是渐进式频读的。传统的其实是做法是把所有的信息一次性塞给大模型, 几十个设备偷看很浪费不说, aint 也容易被批量的信息搞晕。渐进式频读的好处时不主动加载所有 skill, 先用 skill 的 描述信息进行筛选,在需要时才动态加载 用户用温度才加载温湿度计的 skill。 问 pm 二点五才加载空气净化器的 skill, 这不仅节省 token, 还 a 技能的决策更加精准快速。 但如果我有十个二十个设备,难道手动一个个注册 skill 吗?这也太不优雅了。于是我又把这部分逻辑封装成了一个 h a manage skill, 由它来控制管理所有的子设备。 h a manage 的 核心能力有两点,第一个是自动发现设备, h a manager 会调用 homeworks 的 a p i 拉取所有的实体,然后根据设备的 id 将多个实体合并为一个设备,自动解析每个设备的能力。 第二,它自动生成 skill, 它会根据各个实体的功能自动生成对应的 skill 描述文件。这样的设计好处是不需要为每个设备写 skill, h a manager 根据规则和设备信息自动生成对应的 skill。 为了方便管理和共享,我为设备的 skill 单独建立了一个仓库, 这里有一个优先匹配的设计精确匹配模式,比如小米温湿度计。仓库里有这么一个 skill 模板,就用匹配的专用模板直接下载 skill, 后续 skill 有 优化迭代,就可以直接同步更新。 第二是动态生成兜底。假如没有匹配到的模板, h a manager 会根据实体的功能,结合预设的规则模板动态生成 skill 描述。说了这么多,那我们一起来实战一下吧。 安装过程呢,很简单,直接把 github 的 仓库地址发给 opencloud, 跟他说安装 opencloud 会自动根据引导完成配置,它会让你先输入 h a 的 访问地址和长令牌的 token。 整个过程呢,不需要手动配置任何设备,完全是自动化的。 我们来测试一下它的效果,现在房间的温度是多少,可以看到它能准确地找到设备并获取读数。 测试一下它的控制能力,把空气净化器开大一点,它很智能的将风扇调到了更快的转速。这就是我一点零版的 opencloud 的 设备控制方案。 核心逻辑其实很简单,设备不是被管理的对象,而是被声明的能力。把设备封装成 skill, 解决了一进的遗忘设备的问题,从而 h a manage 的 自动发现加动态生成,降低了多设备的管理成本。 当然,这个方案也可能有不少的问题,有不少的优化空间,权当抛砖引玉,期待和大家一起探讨更多的可能性。项目的具体地址呢?我已经放在了我的主页,如果你对 ai 自控感兴趣,欢迎关注我,我是习特胡,我们下期见。

你知道怎么配置多智能体吗?也就是在你的飞书的客户端里,有多个机器人可以陪你聊天,而且呢他们还可以在一个群里边互聊。 同时呢,你的那个默认的机器人,也就是你最初配置的那个机器人,可以指挥其他的机器人干活。 这里边有三种写作模式,第一种呢就是点对点的直接通讯, 也就是说两个智能体可以在后台相互沟通,他们不依赖于非书的这个群主。然后第二种呢,就是非书群主内的写作,也就是你建了一个群主,把他们都拽进去,然后呢就可以在群里边沟通工作,分工写作。 这一切的前提条件是你的电脑上已经正常的运行了 openclaw, 不 管是乌班图系统,还是 windows 系统,还是 mac 系统,还是独立的 linux 系统都可以。 然后呢,你就要到飞书的开放平台去注册账号,然后呢申请到它的 app id 和密钥, 然后呢再给他添加权限,做一些回调。上一期视频我们已经聊过这个话题了,这里就不再赘述了, 这呢你就要根据公司或者你的业务诉求给他们划分岗位,每个智能体叫什么名字,然后呢他们的角色是什么,以及他们的核心职责对应的非输应用的账号。 再接着呢,就是要给它们创建独立的工作区域,但是不管你怎么创造,创建它们都在 核心的这个 openclaw 文件目录下。如果是 windows 系统呢,就是在 c 盘的管理账户下面有一个点 openclaw 这么一个目录,然后把所有的这个文件夹都建好。 接着呢就是最重要的一步来了,给他们每一个智能体都配上一个灵魂文件,也就是给他们定义性格,那这个性格文件呢,也就是对他们的一个约束了,他叫啥?职责是什么啊?甚至你看我还给他起了一个英文名字和工号, 包括他的核心职责啊,专业技能啊,同时呢一定要告诉他他的同事有谁,不然的话他会混乱,他会记不住。然后呢 还要告诉他一个写作的一个方法,就是当你需要把一个工作分配给他的机器人同事的时候,要用到这样一个工具,那这个工具是什么呢?就是下面的一个描述,就是他 要通过这么一个工具联系到那另外一个机器人的 id, 然后呢告诉他你需要做什么, 等到他的工作完成,并且呢收集到了其他智能体的工作结果,他就可以进行交付,所以整个的智能体协助的一个过程,这个 session 的 这个工具非常重要,一定要写清楚。 这里呢有一个解释啊,就是塞声散散的一个作用,就是找到目标的智能体 id, 然后给他发一条信息, 这个发回信息之后呢,还要得到他的返回信息,所以这个过程是所有通讯的核心逻辑。 后面我又给他定义了他的一些工作风格,就是不同岗位,你要给他一些职业习惯性的一些性格特点,这样他的工作的效率才会变高,才不会啰嗦。 汇总一下,就是每一个智能体的性格,也就是灵魂文件都要包括以下的这几点,从他的基本信息到他的核心职责,还有他的专业技能, 以及呢向他介绍其他的团队成员,包括他们的写作流程的说明,还有这个工具的使用说明,以及消息响应的一个规则。 当你给每一个智能体配置完成它的灵魂文件之后,我们就要进行 opencloud injection 这个文件的配置。 如果是 windows 系统呢,它是在 c 盘管理账号下面有一个文件夹叫点 openclaw, 有 这么一个 openclaw 点 jason 的 一个文件。 然后呢,除了定义它的主模型之外,还要给每一个智能体都定义它使用的模型。比如说 你用的是阿里的百炼,那么申请到一个密钥之后,你就可以选择阿里百炼里的不同能力的模型,对应不同能力的岗位的智能体, 或者说你在火山引擎也是一样的,申请了一个密钥之后,火山引擎里边有很多的模型, 我们一定要知道每种模型的能力都是不一样的,同样的你定义的这些智能体数字员工, 他们的工作岗位对智能体的对大模型的要求也是不同的,因此我们需要给它们配置不同的模型,让它们更高效的工作。 配置完它们各自的模型之后,我们还要解决啊智能体之间的一个通讯问题,就是这里边有一些开关要打开, 再接着呢,我们就要和飞书插件进行对接,也就是说这里要特别注明我们的所有智能体跟飞书的 一对应关系,就是这里要写上飞书的 id, 然后我们在系统里配置的飞书这个智能体的一个名称,包括它的中文名称等等。 到这里呢就有一些配置像也非常关键,他呢是一个是私信的一个策略,一个是群主的策略,然后决定了说他们在一个群里通讯的时候,需不需要被艾特, 那有的时候呢,你可能没有艾特,发了一条信息,这个时候谁来回复?是通过名字提及来回复,还是说你根本名字都没有提,这个时候应该是谁回复这个规则的问题。还有就是当你艾特他的时候,他会不会回复。 再接着呢,就是群主内的一个绑定关系了,这里特别说明一下啊,一个呢是叫群主绑定,一个呢叫账户绑定, 大家看一下这里的区别啊,有看的 group, 然后到下面的时候呢,这里就有一个 channel, 一个飞书,然后呢会有区别啊,这里就是 account id, 你 看这个跟群主是不同的,一定要注意这个, 这里的提示特别重要啊,就是每个智能体需要有两个绑定,一个叫群主绑定,一个叫私信绑定,也就是我说的账户绑定。那么还这里边呢,群主绑定主要是接收群主的消息,私信绑定呢,主要是私聊的消息, 这里边特别要注意这个东西的参数,千万不要去设置,否则容易出错。我已经试了无数次, 等到这些配置全部完成之后,你就可以重启小龙虾的服务了。那重启之后呢,可能会遇到各种各样的问题报错,比如说我遇到的问题就是 艾特了 a 智能体,结果是 b 智能体回答我,等到我艾特 b 智能体的时候呢,他又不吭声了,所以各种问题。那这些问题的话呢,我在视频里很难讲清楚, 也讲起来比较复杂,如果有需要的小伙伴请关注我,我通过私信的方式把文档发给你。

挑战从零基础小白自创 ai agent 智能体。我们依旧按照 openclaw 制定的步骤。首先我们在 a 键的目录下创建一个名为 tools 的 文件夹,再创建 i n p y 文件,用来注册我们所需文件的访问接口,并注册我们本次所需的六个工具 分别为, bash, red, right, edit, glob, g rap。 之后我们创建 bash p i 文件,主要用于获取和传递工具。接着创建 bash p i 文件,用于执行效命令并返回秀出 edit p i 文件,用于精确匹配替换文件的某一型 高 b p i 用于查找文件模式匹配 g r s edit p i 用于搜索文本内容。 red p i 用于读起文件内容、文件路径和编码并返回文件内容字符串。 red p i 用于写入或追加文件内容。在此之后,我们再修改 s 零一版本的 loop p i 文件,删除并修改有关工具调用的函数。 一切完成之后,我们打开 cloud code, 让它帮我们检查 bug 并修复,然后抛弃大脑一起按回车就行。 最后打开 powershell, 输入一下命令。行,这系我们随意粘贴一个文件路径到终端里面测试一下,可以看到也是成功。调用工具,查看下期视频,将实现 ai 能计划执行任务。

大家好,今天给大家介绍一下,如果通过 autoclaw 搭建多 agent 智囊团,首先需要建立多个群聊,根据我们需要多少个 agent 来创建,这里我们创建了三个群聊,分别是创意助理、分镜生成助理脚本拷写助理 之后告诉我们的 autoclaw 我 们要创建多个群聊,助理等待片刻 可以看到 autoclave 已经帮我们把配置认证都处理了,我们只需在飞书创建三个群聊,把机器人拉入群聊即可,现在开始操作,群聊已经创建好了,把机器人拉入, 拉入后 at 机器人发一条测试信息,后续两个群聊同前面一样操作。 接下来把这几个群聊的 id 给复制到机器人对话框中, 这样就部署好了,我们重启一下 autoclaw 测试, 重启完成后我们来测试一下,当出现这段 autoclaw 说自己是创意助理,多智囊团就已经搭建成功了。

我是大厂研发工程师张飞,欢迎来到张飞 ai 开发实验室。本次我们讲一下这个我根据 coco 阿里的 coco 去开发的一些功能,大家比较关注的一些多角色智能体,就像 open class 一 样的功能,我已经放到我的一个个人的 github 的 一个网址 link 就是 我的一个网址, coco 就是 这个项目名。大家点击到这个切换这个 z g l branch, 最后点击这个 code, 下边有个 down load 的 这个包,就可以把这个包下载下来。下载下来之后啊,大家可以用这个字节的 tree 去把它打开,打开项目之后就可以打开这个终端,终端在这里头新建终端,新建终端时候建下来之后 就可以去安装这个包,安装的时候应该大家都知道在这一侧是可以提些问题,比如说去问我该怎么去安装,那我可以简单的去看一下子,它这里有一个 readme 文件,告诉我们哪里怎么去安装开发版主要是这两个开发测试 就是用这个命令,当然大家提前需要进入 python 这个环境当中,进 python 环境当中,我建议大家可以安装 python, 安装 python 之后要输入一个 python 杠, m v e n v m e n v 输入这个命令,那输入这个命令之后呢,就可以在当前的 q pad 的 一个目录下去创建一个 python 的 虚拟环境,这样子它不会影响你整体电脑的一个 排序环境,再输入一个命令就可以进入命令,我新建一个终端演示一下, ok, 这里是已经进入了,那我出去之后再重新进来 e n v scripts 脚本 active 就是 激活虚拟环境, 对,我们就这条命令就可以进入了虚拟环境,激活到虚拟环境之后,就可以用行运行下面的一个 p i p install 这个命令,安装开发版的一个各种个性化的包,然后再进行大家已经知道的抽象,最后再运行那最后这个结果,像这么一个结果运行之后,这样子就开启了一个 后端,我们在等待它打开,打开之后我们点击前端,在前端这种点击智能体管理,点击这里创建一个智能体,你们按照下面提示就可以创建你们所需要的智能体,这里有一个模板,你可以选择自己的模板,也可以选择 自己随意建其他的一个信息就可以创建,创建之后要选择相应的一个激活,激活之后就可以在这里和去聊天或者展示一下子。现在这里我就激活了一个产品经理,我给他激活了个产品经理, 启动的是一个 old strap, 都可以告诉产品经理我的需求是什么,我给他定位是什么,下面就输入给他,他都会保存在独立的一个产品经理这个 workspace 当中。 同时我这里又建了一个市场营销推广,在这里我也给了一些定位,他自己就会建立进去,也是市场营销推广 agent 和这个 安敏经理 agent 两个是独立的工作空间,并且都可以把它配置到这个非输应用当中,这也是开发功能。在非输应用当中,大家知道 上节视频当中给大家讲过有个 app id, 还有一个 app 的 一个 secret, 把这些都配好之后,并且绑定到相应的一个智能体,比如这里绑定到一个是产品经理,一个是绑定到市场营销推广经理, 两个都点击保存,并且两个都去启动,它就可以去使用了。 ok, 这个是绑定到产品经理了,这个应该绑错了,绑这个市场营销推广 a 人的绑。对,我们再点击启动,两种 都启动之后,这样就通过飞书可以和他们分别交流,在飞书当中去拉一个群,你自己加上产品经理,再加上市场推广营销的一个经理,你们三个人可以去讨论,给他们分配不同的任务,并且让他们去讨论。今天讲到这,谢谢大家。

大家用 open curl 的 时候有没有发现一个问题,就是它只能操纵你的浏览器,只能给你的飞出这些发消息,它没办法进行这种 ui 界面的操作。 今天给大家分享这个项目 torx, 它可以进行 ui 界面操作,甚至可以直接打开你的微信给你发消息,也可以进行其他的操作。因为我们很多操作,特别是在国内,它是不那么 open 的, 所以说你很多东西其实联通不了 这个项目就能让你连通,它可以直接给你放在你的这个 torx 里面当成 skills, 或者当叫做是一个小的子智能体,你可以把任务下发给这个子智能体,让它去完成一些你之前只能在浏览器和 api 无法完成的一个任务。 我们来详细看一下这个项目哈,其实这个项目出来已经很久了,只不过最近他们发了这样一个技能,可以通过 open curl 去调用它。这个其实是一个紫智能体,我们来看一下它的一些操作,比如说预定酒店、机票、 uber 还有查东西,这些都是通过这种 ui 界面进行操作的,它并不是像它自带的这个浏览器,它是使用 api 或者说使用 playwrite 这种方式来操作的,这个是纯的这个 ui 界面操作, 我也找过这个 windows 呃的一个呃 skills, 但是它非常的不准,我还是用的是 g p t 的 这个模型,都非常的不准,其实很大的原因是它的 m c p 有 问题,或者那个 skills 有 问题, 所以说你直接用这个就是可以的。我下一个视频给大家评测一下吧,它的效果都还是蛮不错的,比如说这个是最初的,它也有一个模型,可以在它的官网去申请,当然你用在 g p t g p t 的 模型估计比它这个还要好一点。 就 kimi、 kimi 这些模型,它的多模态能力都还是非常不错的,而且它有这种 coding plan 的 呃,套餐,它还是很划算的,可能比它的这个还要划算一点,但是它这个模型可能比较小,这个速度会稍微高一点。

大家用小龙虾用 open curl 的 时候,有没有发现一个问题,它没有办法进行桌面 ui 的 操作,只能在这种浏览器界面进行操作或者收集信息。但是在国内跟国外不一样,比如说各个平台,它的操作都是非常闭塞的,比如说微信,你是没有办法进行操作或者执行的,但是我们的很多工作或者生活都是在微信上面, 你要做的话就完全没办法能够实用下来。所以说今天给大家分享两个项目,一个项目是这个 torx, 也是昨天我已经分享过的,今天给大家实测一下,它这个速度会比较慢啊,直接进行 u u i 操作, 我们直接让它,比如说之前我已经执行过一次,我直接再让它执行一次,它这个速度会非常的慢,因为它是 u i 界面操作的,后面我可能也会做一个开源的项目,看能不能解决这个问题, 把它有些固化的东西,能不能把它做成 r p a 的 方式,它的速度就会快很多。进行录屏操作,然后加 r p a, 加这种 ui agent 的 方式来解决这个问题。 今天就给大家演示一下怎么样能做这样一个,呃,能做 ui 界面操作就行了。再就是还有一个 agent, 我是 用的这个 agent s 啊,它是第三个版本,它在这种 ui 界面操作上面, os word 这个排行榜单,它是定义的水平,所以说我直接用的这个框架来使用的,我刚才用的就是这个框架,因为这个没办法支持这个 windows 的 操作,它是默认使用的这个 mac mac os 的 电脑, 所以说我没有用这个,这个跟这个是没有本质区别的,甚至这个它的商业或者说齐全度会更高,但是它会非常的轻便哈,它就是一个 c o i 的 方式,你可以让 cloud code 把它扒下来,然后写一个脚本,让它能正常执行。然后你再告诉 open curl 五,或者你直接让 open curl 五去先测试一下这个项目能跑通了之后,你再让 open curl 五把这个项目给它打包成一个 skills。 但是它有一些问题,就是我是用的这个 kimi k 二和这个通信千问三点五, 它这个东西还有点 bug, 就是 kimi k 二它是零到一的,这个做了缩放的一个定位,比如说它这个幺零八零乘幺九二这个呃幺九二零的像素,但是它输出的不是具体的像素点,而是一个压缩了的,所以说这里还是有一些坑,大家可以稍微微改一下, 会更加准确啊。这个用 open curl 或者说 cloud code 改可能会更加好一点,然后 给大家看一下,然后你让它打包成 skills, 加载到你的 open curl 里面就可以了。 ok, 我 们来看一下它执行的过程。 ok, 它已经点到这了,还正在输入了已经。它的速度确实是很慢,因为它要有非常多操作,首先它要 去截图了之后点哪一个他也去,点了之后又要截图,又要上传,上传了之后又要看一下是否下一步应该做什么操作。而且他的这个框架或者这两个框架他都是两个模型,一个规划模型,一个执行模型,所以说他速度会慢到离谱。而且我们这个是云端的模型, 一个这样的截图下来大概是一兆多,所以说你上传云端也需要时间,他理解又需要时间,所以说就非常的久。 但是我想了一个这个解决方案啊,用的 r p a 的 方式,后面如果成功的话给大家做开源,大家也可以关注一下。可以关注一下我啊,可以看到他已经发出去了,下面应该他会有回复了,等一会他应该就可以回复了。 其实本质上就是你先把这个骑起来,可以跑了,这个脚本可以跑了之后你就把它放在这个 open curl 里面,然后你让 open curl 去配一下就行了。 那你用 cloud code 去配 open curl 也好,还是用这个 open curl 去配 open curl 也好,两个都是可以的,但是最好有两个把它分开,一个坏了,你还能用另外一个去修复一下。所以说这个东西还是有点问题,可以看到结果已经执行完成,约二点五分钟就发了一个, 呃,给我女朋友发了一个,爱你哦,呵呵,就大概是这样的操作,其实他的这个能力还是非常强哈,他 kimi k 二的这个能力都非常强。在 osword, 他 kimi k 二是拿到了 soata 的 水平的,我们可以看一下他这个评测的能力,他用这个基准 是能达到人类的平均水平的。七十二,如果用现在更好的模型的话,应该是比七十二差不多吧,应该还要少一点,因为他这个是多次实验的,他是另外一个版本,但是是要高于这些其他的一些版本模型的。 但是它是用了两个模型啊,一个是呃规划模型,一个是执行模型。但是像现在 kimi k 二它的性能非常好的情况下,你可以让 cloud code 给你改一下,把它改成统一用一个模型,它就没有办,没有必要去两个模型再错切换了。 还有就是它那个模小的执行模型,它默认使用的本地模型,你统一让它用一个模型就可以了。 ok, 这个就是今天的一个分享。

openclaw 保姆级安装教程,搭配免费大模型,让你唱完龙虾,十分钟搞定 openclaw openclaw 最近实在太火了,但是自己搭建的时候难免会出现各种问题,比如这样的这样的, 所以很多人已经开始做起了上门安装五百一次的生意。这里教你小白安装法, 包括环境配置、权限问题、下载速度等等,看完不仅立省安装费,你熟练后甚至都可以接上门安装的单了。我们直接开始第一步,安装 no js, 虽然 opencon 官方文档并不要求我们提前安装 node js, 但先把这一步做完,可以避开很多坑。首先来到 node js 的 官方下载页面中,点击 windows 安装程序按钮开始下载。但是由于 node js 的 服务器在国外,所以下载速度会很慢, 也可以通过 node js 中文网来下载,下载速度会有明显提升。下载完成后,你打开安装包, 安装位置可以保持默认,也可以选择你想要安装的文件夹。接下来呢,我们就一路无脑点击下一步, 然后点击 insert 开始安装,这里要稍等片刻,完成后点击 finish 按钮, note g s 就 安装好啦。第二步,安装 get get 并不是必备安装项,但很多人后面遇到的一些报错,本质上都和 get 的 配置有关, 所以安装了 get 可以 提前避坑。来到 get 的 官方下载页面,根据电脑的架构选择对应的下载链接开始下载。下载完成后,打开安装包,点击下一步, 这里同样可以保持默认,也可以选择你想要安装的位置。再往后,如果你不是专业的开发者,不必纠结这些配置,一路点击 install 开始安装, 等待一小会儿。安装完成后,我们可以把这个对勾给取消掉,它会打开 git 的 更新说明网站,对安装没有影响,然后点击 finish git 就 安装完成啦。第三步,安装 openclaw, 在菜单栏搜索 powershell, 这里要注意以管理员身份运行,然后会打开一个大黑窗口。为了避免 powershell 默认策略太严格,等着安装报错,我们要先输入一下这个命令,然后回车运行。 运行后, powershell 可能会出现一个提示,问我们是否确认修改执行策略, 这里输入 y, 然后回车表示同意这一次修改。为了避免 npm 源导致的下载失败问题,我们需要切换 npm 镜像的下载源,输入一下这个命令,然后回车运行。 很多人安装的时候都会出现这个报错,这个错误的本质是 npm 在 执行 get 操作时拉取仓库或者依赖失败导致的国内访问 get help 困难。先把 get 协议强制切换为 https, 输入一下这个命令,回车运行。上面三条命令能避开很多坑,确保我们一次性安装成功。然后我们再输入这个 open cloud 的 官方安装命令,并回车执行。 这个命令可能会运行一段时间,如果中途出现弹窗,问是否允许公共网络或专业网络访问此应用?点击允许。当你看到一句来自 open club 的 欢迎信息,就说明 open club 已经安装成功啦, 不过这还没完。第四步,配置 open club。 open club 会展示一段话,提醒您使用它可能存在风险。问是否继续? 这里可以按键盘上的左方向键选择 yes, 然后回车确认继续回车。 下一步需要选择 open class 背后的大模型服务商有很多选择,比如 open api、 千问等很多。这里教大家使用免费的大模型。我们先选择 v l l m。 第五步,配置免费大模型。

如果你现在还在通过死抠 ai 的 提示词来学习 ai, 那 么就好像一个厨师从自研开始学习怎么做菜,也许从一开始方向就错了。 要知道穷尽一生你也无法学完文字的所有组合,你真正应该学会的是搭建一个个 agent 智能体,而你 就像个老板,让你的 ai 像员工一样自主的思考并且去行动。接下来我将用两个给客户搭建的自动化视觉超级智能体实际应用的例子来告诉你搭建 agent 的 基本逻辑,并且底层都是使用的满血版的 gmail 三加 nano banana。 二来实现的功能, 只需要上传一张你的产品图,那就能够制作这样精美的亚马逊产品的详情图,并且还能够自动分析营销和视觉策略, 全程无需繁琐的多人对话,并且每个 ai 都按照我事先给他预设好的目的来行动,从分析到出图全程也就五到十分钟, 或者我都不需要上传图片,只告诉了他一句话,帮我设计一个名为叫小茶太的奶茶店的 v i 视觉,那么他就帮我自动地生成了 logo 和全套的 v i 视觉标识系统,甚至包括电招和视觉延伸以及应用场景。 要知道这些智能体在某些 ai 平台上是动辄几百几十会员才能使用的功能,但实际上也就是几部工作流就可以完全搭建出来的,因此你完全可以自己动手搭建并且调教这样一套智能体,打造出属于自己的设计风格, 根据不同的业务方向让多个 ai 替你去打工,而你只需要像老板一样坐在电脑面前盯着他们干活就可以了。 接下来开始我们的智能体搭建教程,你看完后就会觉得其实真的非常的简单,那智能体呢,是在 comui 平台上搭建的,并且需要用到的节点是这个摩羯 api party 的 节点,用于链接 gmail 三和 nano 二, 大家可以看我往期的教程来安装 api 节点,那这里呢,就不再追溯了,我们直接开始教程。目前 api party 呢,目前已经更新到了三点零的版本,在节点中你可以找到 number 分 组下面的 gmail 三拉玛和 gmail 三 nano 节点, 一个用于理解,一个用于深图,那现在都已经加入了 gmail 三点一具体用哪个模型,大家可以根据自己的实际需求, 如果你是第一次接触康复 u i, 那 也没有关系,这个应用本身和康复 u i 其实关系不大,那 ag 智能体的搭建呢,其实都是大同小异,原理相通的。 这里呢,我以这个水杯为例,创建我们的第一个 ai 员工,他负责理解商品,并且呢给出营销策略,因此需要在 prada 这里给他输入基础的提示词。 smart 有 两种,一个是 system smart, 一个是正常的 smart。 system smart 呢是叫做系统提示词,这里用于给他一个身份,让他知道自己的主要责任。那 smart 呢,就是我们正常的和 ai 交互的提示词。 我在这里给第一个员工设定的是电商专家,并且呢对跨境电商非常的熟悉,并且负责制定策略。然后在参数这里把 web search 给它打开, 让它能够自主的去网络搜索内容,那还可以把图像理解等级开到最高,这样呢对复杂商品的细节理解力会更好。 这些参数如果你是直接使用 gmail 三通用版是看不到的,一般只存在于 api 调用中。在 autopod 这里接一个显示任意用于保存内容的输出。 那现在我们可以正常的提问,让他给这个水杯出一个亚马逊销售的策略,看看第一个员工的工作是否顺畅。当然我这里只是作为基础的演示,所以提示词呢,相对比较简单。那在实际的智能体搭建过程中, 大家可以在两个不马特中给他更多的要求和限定,让他更符合你的风格。那目前我们的第一个员工工作正常,他负责生成总策略, 接下来我们的主要工作是出详情页,对吧?那我们现在就需要一个设计总监,他负责对图片做总的规划。我们把刚才那个拉玛节点复制一份,然后这里呢把他们的 contacts 节点相连,那 contacts 呢,就是上下文, 这个相连了之后,下一个拉玛呢,就清楚上一个拉玛做的什么,相当于总策划呢?他做了一份文档,设计总监一看,哦,明白了我要做什么。 之后的普马特,这里我们给到他的任务就是根据该策略规划一个六页的出图方案。那这里具体多少页呢?你可以自己设置 好的。同样的,我们把第二个员工的 output 输出线接上,看看输出呢,是否正确。好的,那么现在可以看到我们的设计总监已经按照要求给出了每张图的设计方案。 那接下来是什么?是直接就开始出图的吗?并不是哈,我们是不是要给设计师配一个翻译啊?就好像这个老板,他一定是要求好看,但是需要有一个人跟设计师说具体每个东西该怎么放,对吧? 所以呢,我们需要在 nano 前面再加一个拉玛的节点,把每张图的设计要求翻译成提示词, 所以我们把设计总监给到的方案发给每一个翻译,然后跟他说,哎,你就负责生成第几张的提示词啊,同时呢,给到他一定的规则,那这个规则呢,是一定要遵守 nano 的 图片编辑的规则,不是让你说随便整一个水杯就可以,而是要使用 输入图片当中给你的水杯来进行操作。这个规则呢是我已经写好的,那工作流呢,我也会共享在我的文档中,那需要的朋友拿到之后呢,仔细看就可以了哈。 然后这几个翻译之间呢,他是互相隔离的,所以不需要连接上下文啊,你只需要负责你的那部分就可以了。我们这里呢,先出第一张图来进行测试这个流程, 然后呢,我们在这个翻译后面直接接 gmail nano 节点,也就是 nano, 最后只需要按照提示词出图就可以了啊,像不像大厂里面的这个设计师啊,只需要对接需求,不需要太多思考。那 nano 呢?这里选择 nano 二啊,第一张图是商品白底图,所以我们这里选择 比例一比一就可以了。好的,那么我们现在来测试一下,看看这里面每一个员工,他是否能够正确理解我的工作流程。 ok, 三号员工正确的输出了提示词,那设计师呢,也正确的输出了这个水杯的白底图,并且呢他们都是符合我们的设计要求的。 那接下来呢,我们把三号四号员工再复制一份啊,复制出第二张图啊,后面剩下的需要几张图就复制几个就可以了, 不过呢,我们在这里先进行测试一下,注意要把设计总监的方案和最原始的输入图给到每一个员工,同时呢,设计师之间他们也是需要沟通的, 以免上面的设计和下面的设计风格上相差太远啊,所以把设计师之间的上下文相连,让他们之间可以沟通。好的,现在前两张图都按照要求生成正常了,那么接下来我们直接复制更多的 ai 员工就可以了。前面我们的要求是总共六张图组成详情图对吧, 那么我们 这里呢,要给每个员工都安排好,你负责生成第几张图, 按照设计总监的要求去生成就行了,别的甭管了啊,不知道看到这里各位呢,有没有生出要当老板的这种快感。最后呢,我们使用 ctrl y 自带的图片连接工具,把每个人生成的图片拼合在一起,成为一个整张的图片 啊,所有这些做完之后,这个智能体就算是完成了,是不是非常的简单,那么现在身为老板的你, 开始发动你的全体员工为你干活吧, a p i token 的 这点花销相比于你付给员工的工资,那简直是不值一提。本期视频用到的所有的工作流我都会附在摩羯 a p i party 里面, 老用户呢可以升级到最新版本,新用户下载之后就可以看到了,除了详情页的,还有一套 v i 设计的,大家呢可以自行调试修改。那么本期视频就到这里,我是摩羯 ai, 感谢大家观看。

挑战从零基础小白自创 ai agent 智能体。首先来到 github, 找到这个开源项目作为参考,告诉 openclaw 我 们的需求。 openclaw 会自己制定计划,首先创建一个 ev 文件, 输入大模型的 a b, i k 和 u i l 以及模型。第二步,创建一个 loop pi 文件,这里可以选择让 openclaw 直接生成文件,也可以按他说的自己手动操作拷包这里直接复制到记事本。然后选择所有文件保存到项目文件夹里, 将刚刚的整个文件夹压缩机后发给 openclaw, openclaw 会自动帮你检查 bug 并修复。 openclaw 修复机后会将完整文件发送到非修的硬盘。我们测试一下, 依次输入命令,如果弹出这个页面说明成功了,目前可以实现基本的对话交流。最后感谢大家观看支持,下一期视频将会实现 ai 工具调用。

别再在 openclo 的 使用上瞎摸索了,高达百分之九十的人都用错了方法。今天咱们就通过错误与正确用法的对比,用一分钟时间教你掌握 openclo 的 正确打开方式。四到十五秒错误打开方式 错误用法大揭秘很多人把 oppo 科二单纯当成普通的聊天 ai, 只知道提问却不利用他执行任务。还有人一上手就盲目安装各种插件,结果软件越用越卡顿。更有甚者将权限全部开放,随意修改系统设置、删除文件。还有些人只会机械的复制命 令,根本不理解本地部署的逻辑。最终的结果就是软件卡顿,频繁报错、偷啃、疯狂消耗,却什么事情都做不成。 正确用法来了,首先要明确 opencloud 的 定位,它是能实实在在动手干活的 ai 代理,而不是单纯的聊天机器人。启动时先运行官方提供的一键命令,以最简方式启动,避免复杂的配置。 权限方面,只开启必要的权限,重要操作一定要先确认再执行。使用时,一个任务对应一个绘画,不要混淆,避免程序乱跑。部署时优先选择本地部署,这样既能保障数据安全,响应速度也更快。 错误示范,同时给 openclaw 安排写脚本、剪视频、搜资料等多项任务,软件直接崩溃。正确做法,让它专注于单一任务, 比如自动整理文件、发送邮件、填写表单、控制浏览器等。错误示范,全程在云端运行,不仅容易导致隐私泄露,成本还很高。正确做法,采用本地部署,在按需连接模型,既安全又省钱。总结加行动指令, 记住关键的一句话,欧芬科奥不是用来闲聊的,而是用来干活的。先进行极简部署,接着专注于单一任务,最后再按需扩展功能。结尾勾子, 要是你还不会部署 open club, 就 在评论区打出 open club, 我 给你发一键安装包和避坑指南。

今天来配置 do ajax 智能体加多模型,确认之前的飞书机器人正常连接。 mate 在 飞书新建引用新建一个机器人, 在 openclaw 中添加新建的机器人, 让 openclaw 进行 do ajax 智能体自动配置, 完成后让 openclaw 为这个 agents 配置新模型。我正好有一个 deepseek api 配齐了它, 在代理列表中看到 agents 配置,随时可进行修改。

来,今天有很多粉丝啊,问到我关于这个 do a 准的一个搭建方式和方法, 然后主播今天也也来进行一个挑战,虽然之前也搭了很多这个 do a 准的一个系统啊,但是今天主播做了个挑战,是什么挑战呢?就是 做了一个直播啊,多一卷系统,就是既在本地做一个软件直播软件,然后用 open cloud 的 多一卷系统去管理这个直播软件啊。现在已经来到凌晨的三点四十五分了,但主播还没有把这个事情搞定呢, 来,一直一直在研究啊,怎么去做啊?一开始我是把它分成了两个部分的,一个部分是, 呃,本地的 app 中有一个多云系统去进行管理,然后另外一套是在 open cloud 里面做了一个多云系统,进行这个直播信息的一个啊管理啊。来,大家可以看一下 现在,现在主播把它统一到一个什么呢?就是直接用通过这个 open cloud 的 一个多云系统去管理啊, 这个本地的 app, 本地的直播 app, 你 看也是非常复杂的。呃,包括可以看到主播这个 agent 打了几个, 打了有九个,十个了,都是一个 agent 了。好吧,好,我们来继续完成这个挑战,看一下明天能不能把这个系统这套多云系统搭建起来。

很多朋友想知道如何创建智能体团队,那我今天就手把手的来教你如何通过 oppo 可乐自己去创建智能体团队。 那么首先呢,我们打开飞书上的机器人,在这个里边呢,跟他说一下,嗯,我们到底想创建一个什么样的机器人?具体的要求,那我们今天呢来创建一个写小说的这样的一个智能体,那很快呢他就把这个写小说的智能体给创建好了, 那这个时候回到我们的首页上,打开创建群组这里边呢我们先建一个群,建完群之后呢,我们打开先把这个名字给改一下,改成刚才我们创建的智能体的名字叫文学家。 呃,创建完名字之后呢,我们把设置往下拉,在设置的最后一行呢,会有一行叫绘画 id, 那 我们点击右下角的两个小方块,然后把这个给复制下来,我们把这个群 id 呢发给刚才我们的这个 opencloud 的 机器人,让他呢把我们刚才创建的文学家的这个智能体呢绑定到这个群里面去。然后我们继续回到我们的群里,把我们的机器人加上,再添加群机器人里把我们的 opencloud 机器人添加上去, 添加完之后呢,这个时候他就已经在这个群里边了,然后我们返回来看到这个机器人已经把我们的文学家绑定到这个群 id 上了,那我们来试一试他到底怎么样?那在这个群里边呢,我们可以跟他说一个我们的需求,看看他有没有反馈。那这个时候呢,我们让他写一篇小说,他现在很快呢就写好了这篇小说。 呃,然后呢我们再让他去给我们导出一个文件来,那他这个呢文档也导出来了,而且呢我们可以打开,并且呢点击就可以下载到本地,这样的一个智能体呢就创建好了, 那我们再看看我之前创建的一个智能体叫财经小能手呢,这里边呢我们也同样他执行一个任务,那这样呢他就开始执行了,很快呢他也把他的结果反馈出来了,那呃他的这个 方面还是很全的,那这里边呢我们不让他去呃修正和展开,好,看看他能不能再进一步的生成一个文件,那我让他帮我做成一个 ppt 的 文件,并且呢要把这个文件发给我,那看看他做的怎么样。那很快呢他也反馈了一个结果, 那这个 ppt 文件呢就这样做好了,是一个风格比较简约的,当然这个呢如果不满意我们还可以继续让他修改,那我们今天呢就不让他再继续修改了,那这样他的一个文件呢就做好了,那这两个智能体呢都能执行任务了,都开始运作了,没有问题。那接下来呢,我们就让我们的机器人去指挥刚刚创建的智能体,让他自己去配置。 终于经过了漫长的等待之后,他已经配置好了,这个时候呢你的智能体就已经开始干活了,你的机器人就可以指挥他们去协同作战了。

最近 open cloud 不是 特别火吗?我今天花了一下午到一晚上的时间才在本地的电脑上面部署成功,然后我操作体验了一下,我现在整个人都是属于亢奋的啊,我给大家发一段我的操作演示的视频给普通小白看一下什么叫颠覆人的认知。 手机上面操作啊,操作我的电脑上面的部署的 open curl, 然后我让它打开浏览器,我把默认两个字删掉,并让它打开百度网站, 然后你看到后面的电脑屏幕上面鼠标在这停着是没动的啊,我只是手操作手机通过 qq 对 话,然后看电脑屏幕上面的反应啊, 你看它启动了浏览器并打开了百度,然后我接下来我操作 qq 对 话框,让它启动日历, 帮我打开日历,然后注意看电脑屏幕上面的浏览器上面的新的窗口, 然后看日历窗口打开了,真的太牛逼,太牛逼了啊!

嘿,大家好啊,如果你正琢磨着怎么给自己搭一个 ai 代理,那今天这个内容你可千万别错过了。为什么呢?因为我敢说,现在大多数人,甚至包括一些经验丰富的开发者,其实从第一步就走错了,犯的还是那种致命的错误。 所以,今天呢,咱们就来聊聊,怎么才能用正确姿势搭一个真正好用的 open cloud ai 代理,避开那些大家常踩的坑,他知道的越多,反而变得越笨。 哎,你听听这话,是不是听着特矛盾,完全不符合逻辑吗?但就是这么一句话,他特别精准地戳中了几乎所有人在搞 ai 代理时都会掉进去的那个大坑,而这个核心问题,也正是咱们今天要解决的。 那到底该怎么办呢?怎么才能搭一个真正聪明、真正有用的 ai 代理?别担心,答案马上揭晓,接下来的几分钟,我会给你一套特别清晰的蓝图,保证你从第一天开始,就能让你一个 ai 代理聪明又高效。 好,第一部分,咱们先来聊聊那个无所不知的 ai 梦想。就是说,在咱们动手之前啊,得先把目标搞清楚,我们到底想要一个什么样的 ai 伙伴。它可不只是个聊天的机器人,我们想要的是一个能跟我们无缝协做的第二大脑, 你想象一下你这个理想的伙伴,它应该有什么样的超能力?首先,它得有独立的项目,分得清清楚楚,绝对不能搞混。 其次呢,它还能学习各种可重复的技能,帮你把那些烦人的琐事都自动化了。更厉害的是,它可以通过所谓的连接器,把你所有的工具都串联起来,还能通过自定义指令,真正理解你的工作风格和个人偏好。 所以你看,咱们的终极目标其实非常明确,我们不是要造一个玩具,而是要创造一个真正的伙伴,一个能融入我们工作流,像一个生活操作系统一样的东西。这个梦想听起来很棒,对吧?但为什么绝大多数人都失败,我呢? 哎,往往就是这个美好的梦想,把我们直接带到了一堵现实的墙面前。所以,欢迎来到第二部分,步入变笨区。这里就是梦想和现实产生巨大鸿沟的地方,也是绝大多数 ai 代理项目最后不了了之的原因。 当我们有了这么个 ai, 我 们的第一反应通常是什么?那肯定是我想让他更等我,那我就得把我的所有东西都给他,邮件、日历、笔记。这想法听起来是不是天经地义,但非常可惜,这恰恰是通往失败的第一步,而且是最致命的一步。 你看这张图,把这个诱惑和现实的对比展现的淋漓尽致。左边就是我们美好的想象,对吧?哎呀,我要把我的所有东西都喂给他,让他变成最懂我的那个伙伴。但右边呢,就是血淋淋的现实。 当你真的这么做了,他的上下文,或者说他的工作记忆一下子就被塞满了,结果呢,他就彻底蒙了,变得一团糟,试着开始做一些你压根没让他干的事。咱们可以给这种灾难性的状态起个名字,就叫变笨驱。 说白了,就是当 ai 的 大脑里塞了太多乱七八糟的无关的噪音之后,他的性能就会直线下降,变得特别不靠谱,相信我,这绝对是一个超级普遍的问题。 好了,问题咱们找到了,那现在就进入最关键的第三部分,正确的构建蓝图。这里我给你一套已经被验证过,行之有效的方法,教你怎么从一开始就绕开那个变笨区,搭一个真正能打的 ai 代理。 这套蓝图啊,就三个核心步骤,第一,给他建个沙盒,什么意思呢?就是把他单独隔离开,让他在一个干净可控的环境里成长,不受外界干扰。第二,给他定义一个单一的使命, 就是要有一个极其简单专注的目标,让他所有的思考都围绕这个目标来进行。第三呢,就是逐步培养,就像带一个新员工,你得从最简单的活干起,一步一步来,你总不能指望他第一天就把你管理整个公司吧? 那有人可能要问了,搞这么个沙盒是不是很贵啊?哎,你绝对想不到,一个月只要两美金,对,你没听错,就两块钱这价格,你就能租到一个独立的服务器, 这意味着什么呢?意味着你可以随便折腾,大胆去试就算。哎,一不小心给搞砸了,那也没关系啊,删掉重来呗,一点都不心疼。 行,蓝图咱们有了,现在进入第四部分,咱们再往深挖一挖,看看代理的核心组建, 我们来看看具体要用什么工具,怎么去实现刚才说的那三个步骤,咱们来看一下这个表格,它把咱们的核心思想说的特别清楚,我们完全可以用一些非常简单的方法来实现那些商业级 ai 吹得天花乱坠的功能。 在 openclory 所谓的项目工作区,说白了就是一个独立的沙河斯武器,那些花哨的自定义整令呢,其实就是一个高度浓缩的灵魂文件。 而所谓的纪文,就是一个你给他定义的特别明确的使命。这个灵魂文件到底是个啥? 你就把他想象成是这个代理的人生信条或者最高指令,他规定了这个代理是谁,他存在的终极意义是什么。但是记住他强大的秘诀恰恰在于两个字,精简。 一个只有三行字的灵魂文件,绝对比一个写满三页纸的要强大的多。任何多余的信息都是把他往变笨区里推的毒药。这句话简直是说到了点子上, 重要的不是你给机器人配置了多少技能,而是你为他设定的那个非常清晰的意图。 一个明确的目标远比一大堆花里胡哨的功能要重要的多。你的代理必须清楚的知道他的核心使命是什么,这才是成功的关键。 ok, 理论都铺垫的差不多了,现在咱们进入最后一步,启动你的第一个使命是时候了,让你的代理开始指征他的第一个也是最重要的一个任务了。 这里我得再强调一遍,千万千万不要想着一步到位,让他帮你把所有事都干了,这正是我们前面反复说的那个最大的坑。你的第一步应该是给他分配一个非常非常具体,而且是单一的工作。 这句话虽然听着有点粗暴,但他完美的全释了什么才是一个理想的初识使命。 你不要对他说帮我处理工作太模糊了,你要说就给我做一份完美的演示文稿,你看这个任务就非常具体,目标明确,而且价值很高。再举个例子,让他每天早上九点自动去搜集行业新闻,然后升上一份市场分析简报,这就是一个绝佳的起点。 那么聊到这儿,我想把这个问题留给你,你准备交给你的代理的第一个也是唯一的任务会是什么呢? 我建议你花点时间好好想清楚问题,一旦你有了答案。恭喜你,你已经成功地避开了九十九的人会踩的坑,走上了一条正确的路。好,这次的分享就到这里,咱们下次再见。