今天我们简单的介绍一下如何用 openclaw 来快速生成一个乔布斯风格的 ppt 的 网页。 那么首先这个网页大家看到的呢,是我上周在外面分享用 openclaw 完全自动化生成的一个网页,它可以看到网页的效果还是非常不错的。此外它也有一些交互性的功能,比如当你点击某按钮,它可以弹出一些网页以及取现图片等等。 那么下面我们就来简单介绍一下如何用 opencl 生成这样的一个网页。首先呢,我们要让 opencl 学会一个制作该网页的技能, 我们打开 clop, 里面选择 ppt, 然后我们看到这个技能 ppt generator, 那 它的描述是将用户的稿件一键生成乔布斯风格的 html 演讲稿。然后我们需要安装一下该技能,我们点进去 有很多种安装方式,首先比如你可以将该网址告诉 openclaw, 然后 openclaw 一 键自动化的帮你安装。那更多时候呢,我们是下载它的压缩包文件,将它直接解压到 openclaw 的 技能文件夹里面。比如我将刚才下载的压缩包文件解压到技能文件夹里面,就变成了 ppt, 就 能 read 一 点零。 那么打开它其实就是一个 skill 的 macdunk 文档,加上它一些脚本。那么当你解压完之后呢,只需要你重启一下你的 openclip, 该技能就已经安装完成。现在呢,我们已经将 openclip 进行重启,并且呢 ppt 只能 rate 已经生效。当我们需要根据我们的内容生成网页的时候,我们首先需要将我们的内容告诉它,比如这是我们准备的一个原始的 pdf 文件, pdf 文件比较长,一共有二十七页,我们就直接将该文件的位置告诉 openclip, 然后让它用 ppt generator 的 这个技能生成一个乔布斯风格的 ppt, 然后呢 openclip 就 会先阅读原来的 pdf, 然后呢根据原来 pdf 生成一个 html 的 网页,并且呢放到桌面的指定文件夹里面,那么这就是它生成的原始文件夹。 我们点击开来看一看,我们发现它是一个竖屏的一个网页,那么其实这也是和它原来的介绍生成一个竖屏的 html 演示稿是一致的。所以为了能够满足我们一些横屏以及更精细化的一些需求呢,我们更多时候还是需要通过 oppo pro 兑换, 让他满足我们的要求。比如说我们跟 openclo 对 话说帮我改成一个横屏的网页,或者呢在某个元素上面进行一些修改等等,经过多次的和 openclo 的 对话和修改呢,就能够生成我们最后想要的样子。
粉丝436获赞1536

兄弟们,我终于养出了一只会做 ppt 的 龙虾,而且是大龙虾,你看,我只是在手机上摆个文档发过去,让他帮我做 ppt, 他 就一口气帮我做成了十几种不同风格的 ppt。 有 这样的这样的、 这样的,还有这样的、这样的,今天一分钟教会你。首先,你需要给你的龙虾配置个擅长做 ppt 的 api key, 比如 mini max 二点五,它的高阶文档处理能力非常屌,而且还是给你的龙虾配置个做 ppt 的 skill, 就是这个之前讲过的有几万个 skill 的 网站里面找到这个 anselpik 出品的 ppt skill, 然后把这个指令复制下来,发给你的龙虾,让它安装这个技能。 最后一步是调试,用我这个祖传的指令文档,加上你的原始材料,就能做出多种风格而且非常专业的 ppt。 如果有需要调整的地方,直接让它调整就行。更牛的是,它会自我训练,自我加强,越做越好。最后要说的是,用 mini max api 的 时候,记得去用它的 coding plan, 超级便宜, 一杯咖啡的花费都肯随便用,这个能力和价格也太适合养龙虾了。以后我就有一个全年候待命的 ppt 工程师为我服务了,帮我再做一份 ppt, 详细文档已经整理好了,点赞关注,轻松获得!

大道至简工作汇报 ppt 这么做,你要同时怎么活?先放上基础内容,再画个圆角矩形,将矩形至于底部移到左侧页面外,复制这页。换灯片 矩形以第一块内容下继续复制这一页,移动矩形到第二部分, 后面几页同样操作,回到第二页,回到第二页,矩形内部的文字等均改为白色,后面几页也同样操作。接着给矩形里面的文字部分设置,强调动画选择放大缩小 效果选项中将尺寸改为幺幺零,弹跳结束改为零点零五,勾选自动翻转持续时间改为零点零五。 后面几页也是如此操纵,最后全部选中,切换效果改为平滑。最后看完整效果。关注我,让你学会真正有用的 ppt 技巧!

大家好,今天我们讲一下目前最火爆也是最厉害的 ai 智能体 openclaw 项目,我们会讲一下如何设置,包括你应该使用远程的服务器,还是使用我们本地的机器, 你可不可以用旧电脑,或者需不需要买一个新的 mac mini? 那 么具体来说,我们如何用哪个 ai 模型,以及如何连接我们的手机聊天软件?好的,废话不多说,我们开始吧。那么 openclaw 是 一个开源项目,那么每个人都可以免费的使用它,它本身呢又是 mit 的 license, 也就是说你可以把它用在商用上, 或者是对代码进行修改,再用到商品上,完全没有问题。那么大家为什么对 openclaw 如此的有热情呢?这里有三个原因啊。第一个原因我认为是它主动性,很多工具呢,比方说你用很多无代码的编排工具,或者自己写代码做程序,你都要 定义自己的工作流才能完成任务。那么这里 openclaw 呢,很多情况下,你给他工具,给他权限,那么他自己去完成目标,而不需要你规定如何做。 第二个原因呢?我认为就是他有挚友的记忆,他的记忆呢,就保存在本地,通过我们不断的跟他对话,通过我们不断的啊告诉我们他我们自己的偏好和信息,他呢就会越来越了解我们,为我们的工作干的越来越出色。 那么第三个就是他可以用我们平时的一些聊天软件,直接对他远程进行指令,或者是接收他的结果和报告, 比方说啊啊 diagram, 比方说 what's up, 比方 discount 等等,我也知道国内有人接入飞书,微信等等等等吧,这些都是非常强大的优势。关于安装和设置 opencloud 的 第一个问题就是我应该做一个云服务器,还是用在跑在自己的电脑上? 我知道有很多人在推荐用云服务器,那么这里我也想给大家说,你应该跑在本地的电脑上,我说一下原因。首先云服务器的优点,二十四小时不间断,也不在你这边,所以它跟你的工作环境完全的隔离。但是我想让大家是明白一点,就是 opencloud 的 能力是完美完全取决于我们给他的权限的,我们给他的权限越大,他能为我们做的东西就越多,当然也越危险。这个我们后面会提到, 那么看看我们 vps 的 缺点,就是首先最重要的浏览器对吧?在我们本地的机器上,我用我真实的浏览器,我登录 啊,是由我真实的拓展等等等等。那么有些平台呢,有非常高的价值,比方说 youtube x, bilibili、 抖音等等等,这些的平台都需要我们登录,都需要我们有真实的用户行为,但是你用 vps, 用无头浏览器做这些事情,就很容易被这些平台所封禁,那么有很多的限制。 第二点就是在 vps 中,你就不能够打开你本地的 app, 就 不能跟本地的浏览器进行互动,就不能对本地的文件进行一些操作。那么也就是说 vps 本地的文件以及浏览器这两个我们最希望他帮我们工作的事情,他都完全接受不了自己的能力,因此 啊,还是推荐大家用本地的机器好。那么新的问题就是用本地的机器,我需要买一个新的 mac mini 吗?说实话不需要,但是如果你一直心心念念想买一个新的 mac mini, 现在确实是一个比较好的借口。 那么实际上 openclaw 它支持 mac os、 linux, windows, 那 windows 呢?主要是推荐通过 wsl, 也就是 windows 的 linux 系统来安装 openclaw。 确实最好的方式是你装在一个完全不同的机器上, 但是它不一定是 mac mini。 如果你有一个旧电脑,比方说你有一个 windows 电脑,你有两个种比较常见的选择,首先,你可以安装一个新的 linux 系统,在你的 windows 上,你就把这个旧的 windows 电脑当做专门的 ai agent 的 机器。第二个方式就是 wsl, 不知道朋友们 wsl 呢?它是本身是啊 windows 的 一个功能,它是允许我们用一行命令行代码直接安装 linux 系统到我们 windows 里面,这样的话,你就可以安装 opencloud, 但在你的这个 linux 子系统下面了。这里我们后来会提到, 如果你安装 opencloud 到你的 wsl 里面,那么你要注意就是你要做好文件的隔离,否则它会有权限用你的看你的所有的 windows 的 文件。 那么如果你的旧电脑是一个 mac, 如果它是一个 m 芯片,那么太好了,你就可以用它把文件处理完之后,作为我们的 opencloud 的 专门的机器。但如果你是英特尔的旧电脑,你要注意一下,你可以跑 opencloud, 但是呢,由于你英特尔无法升级你的系统到啊 mac os 十四以上, 但是有很多专门支持 open cloud 的 一些工具和 skills, 需要你的系统是至少是 mac os 十四的,也就是说啊,有很多功能你是没办法用的, 你的能力就不能全部被解锁了,那么如果你没有旧电脑,你只有一个电脑,这时候如果你的系统是 windows, 那 么跟我们刚才说的一样,你的选择就是你安装 wsl 二,用一行命令行就可以。 还是那句话,文件隔离一定要做好。一个常用的做法就是我们创立一些共享的文件夹,那么我们的 open cloud 只有权限去看这些共享的文件夹,那么我们呢,就可以从我把我们想要给他的文件放在这里面,以及把他生成文件拿出来放到我们的 windows 系统里面去。 好,如果你只有一台电脑,这台电脑就是一个 mac 系统了,那如果你不想折腾,你就买一个新的 mac mini 吧,这里买最便宜的就好,就远远的对 open cloud 来说够用了。 好的,选完机器之后,我们就要来看如何一步一步的来安装 opencll 到机器上去了,其实相当的简单啊,就是到它的官网上去 复制这一行命令行代码,大家看到了吗?哎,复制,然后到我们机器的终端里去粘贴,然后,哎,静静地待它自己安装完成就可以了。 安装完之后,他就会问你明不明白这里面存在的强大的风险,你明白。 然后呢,就有一个啊,快速的相当于是快速启动的这样一个程序。哎,这里就要讨论我们,你看他有很多的不同的大模型提供商供我们选择。这里这个问题还是蛮重要的,我们单独来谈一下 啊。首先呢,你想要通过云啊, ai 模型提供商啊来用它们的模型,而不是本地跑模型,有两种方式,首先就是通过 api, 第二种就是通过现有的订阅了。首先 api 啊,先说明一点,就是 open clock 真的 是非常的烧,我们的 talking 非常的要注意这一点, 我们这里对比一下三个不同的模型,分别是 cloud op 四点六,被大家广泛认为是最好的 agent 模型, 还有就是 sony 四点六以及我们的 mini max m 二点五,它是性价比最高的模型,也是 open cloud 官方推荐的模型。可以看到 mini max 的 价格实际上是,呃, opus 的 十五分之一,十六分之一是 sony 的 十分之一。 这么便宜的情况下,我给大家一个概念,我用了几天 mini max, 我 每天烧掉三十美元左右,你可以想想,如果我用的是 cloud opus 四点六,我每天要烧到五百美元, 所以说它这个真的是不便宜。用 opencloud, 那 么这时候你会问,哎,不是还有第二个选择吗?就是我用我现有的订阅对不对?这里分为两种情况,如果你有 openai 的 订阅,就 gpt 的 订阅,你就可以通过它官方的登录或者授权的方式来使用 opencloud, 这是相对安全的。而且那么 opencloud 的 创始人不是也刚刚加入 openai 吗? 但是另外一种情况就是 ospec 和谷歌这两家呢,实际上是本质不支持你用他们的订阅来使用第三方向 opencl 这样的工具的,他们呢,网上说很多人的账号也被封了,所以如果你是这样的话,你要注意一下。 好的,我们继续安装。来到这里,我们选择提供商,比方选择 openai 有 两种方式,要么是你登录,要么是你用 apikey, 对 吧?那么如果你是用的 apikey, 你 就要去 openai 的 官网上啊,用你 注册一个新的 e p i k, 或者是你用你之前已经有的,然后呢,是按量付费。如果你是选择 open i codex 就是 gpt 的 授权登录,它就会跳转出一个网页来让你登录你的 gpt 的 网页 啊,这里你选择这里的账号登录就可以了,登录之后会让你选择模型,那么这里呢,我这里就用最好的模型 gpt 五点三 codex 了 啊,然后叉弟也会继续往下做,他会问我们要不要现在设置 skills, skills 是 很重要的,才像于是啊,我们 open cloud 的 肌肉 对吧,它执行我们呃任务所需要的个工具。这里呢,你可以随时随地呢,想要把自己的 skills 都勾选上,那你可以现在跳过回来,自己在这里或者是在那个 web ui 那 里去进行勾选,这里他会问你一系列的 api 哦,这里我都会选择。 no, 我们这里随时随地嘛,有需要可以随时再设置就是了,也不复杂。 好的,这样我们来到设置的最后一步啊,他问我们继续跟这机器人是在公屏里对话还是 啊,去我们那个网页 u i p 进行对话,这里我就选择终端了。我们最视频最后会给大家展示如何随时随地的去网页 u i p 进行对话。那么这里哎,他就开始跟我对话了,我们就激活设置成功了,他问我们告诉他名字,角色, 他的工作风格,以及给他一个表情。啊,那么啊,这样的话,我们就设置完成了,不喜欢在终端里工作,那怎么办呢?哎,其实 openclaw 还有一个网页版的 ui, 这是我们运行命令 openclaw dashboard 之后就会弹出来这个网页,以后我们就可以在这个网页里面啊 直接跟我们的机器人进行对话了。 off cloud 是 非常巧妙的工具,越跟他工作越会越会被他惊喜到。如果大家有任何的疑问或者对未来内容有任何的建议呢?也欢迎大家留在评论区,我们下期再见。

部署本地的 openclaw 已经可以剪视频了,大家都知道了吧, 这个让硅谷大佬每日一封的 openclaw 阿月,我呢也是拉到本地试了几天,现在就带大家把本地部署和接入飞书每一步都走明白。为了防止偶然性啊,我呢也是连续测试了四台电脑,确保每一步都可行,接下来你们只要跟着做就可以。点好关注收藏, 我这里依旧用的是 windows 系统来操作,因为 macos 系统呢,环境相对比较简单,不像 windows 这么复杂。首先呢,我们要确认好 windows 的 安装环境,安装的时候呢,全部都点 next, 一 直到完成即可,建议呢,不要去变更中间的安装路径。 呃,安装完成后呢,我们可以检查一下环境,我们在命令提示符的窗口输入这两个指令,如果输入指令后跳出版本号,那就说明安装已经成功了。这里提到的两个环境文件呢,我在文档里面也全部都准备好了。 好,接下来呢,我们就开始全区安装 oppo 卡使用管理员 c m d 指令输入,这个指令安装完毕后呢,再输入这一条指令, 好开始了。 ok, 这一步跳出来的呢是风险提示,我们直接选择 yes。 然后呢我们选择 quickstart, 这一步呢是选择大模型,我这里呢用的是千万,因为他是国内的,如果大家有惯用的呢,也可以自己进行勾选好,然后我们这里模型选择默认的即可。 之后呢会跳转到大模型的首页进行授权验证,大家验证通过就可以了。那通过后呢,这里也同样有一个选项,我们直接选第一个默认的模型。 ok, 下一步呢,这里可以看到很多的应用选项,这其实呢就是指令输入的终端,因为这些都是国外的,所以我们先不管,选最后一个,跳过,后面呢我会给大家介绍如何接入国内的飞书。 ok, 继续,这里会问你需要配置什么 skills? 呃,我们也跳过,没问题,因为这个不着急,后面都可以手动去配置的。 好,这个也不用管我们用不上,直接跳过。好,然后我们稍等一会,会自动弹出一个网页,然后你会发现这个网页是打不开的,没关系,我们这个时候呢,再运行一个 c m d 的 指令, 好,这就是欧奔 cloud 的 兑换框了,我们来尝试和他打个招呼, ok, 他 回复我了,那到这里呢,其实基本上就成功了,还是比较简单的啊。然后呢,我们再来尝试为大家接入一下飞书,很多小伙伴呢,在这一步呢,其实就被劝退了,因为怎么样都接入不了这里,大家看好我怎么操作。 首先呢,我们进入飞书的开放平台,我这里呢用的是个人版,我们来创建一个企业自建应用, 进到这个凭证与基础信息界面,把你的 app id 和密钥保存下来,这个很重要啊,后面会用到的。然后 我们添加一个机器人,再到权限管理这一步,为他添加一些权限。这里的权限列表呢,其实官方呢是有指导文件的,但是呢就藏的比较深,我呢也是给你们找出来,直接放到文档里面了,你们直接一键复制过来就 ok。 好,然后我们需要配置一下这个事件回调功能,在这里的订阅方式选择长链接这一步呢是必须的,而且是绕不开的,也是大家碰到卡点最多的一步,很多小伙伴呢在这里呢就是一直报错,好,不用担心,我呢,已经整理了一份非常长的傻瓜教程,大家直接照做就 ok 了。 然后选择以后呢,我们添加事件,然后添加搜索接收消息, ok, 然后我们就去点击创建应用,然后再发布就 ok 了。 好了,配置工作完成之后呢,我们就要开始给欧邦克劳接入飞速杀键了。由于 windows 的 系统环境问题呢,所以大家的电脑情况都不太一样,所以会出现不一样的报错问题。网上的很多视频呢,也没有把这个问题针对性的讲清楚,我自己呢也试了三到四台电脑来做尝试,都非常有挑战。 如果你手边也报错的话呢,不用担心,我这里想到了一个邪修的办法。好,那既然 oppo klo 可以 控制我的电脑,那为什么他不能自己安装飞出插件呢?我们来试试看吧,直接和他对话。呃,你自己安装一下飞出插件,然后呢,他就会开始疯狂的工作,并自行去验证安装环境和插件配置 啊。五分钟左右后呢,他就会告诉我,他工作完成了,需要我提供给到他飞出机器人的 app id 和密钥。这个呢,其实我们在上一步已经有了,我们直接复制给他,让他呢继续去工作。这里的工作过程当中呢,我们的机器人可能会下线几次,原因呢是他需要去重启网关, 如果呢,你感觉他下线太久的话呢,我们可以用 open cloud get away 这个指令重新把它呼出来。最后呢,他会要求你在飞车上和他对话进行测试,并为你排除最终的一些故障。 ok, 全部搞定,已经可以在飞车上正确回复我了,并且呢,刚才在外部的对话记录他也全部都记得, 呃,我们这里呢,再用手机给他发一条消息试试看。好,他也同样接受成功了。好了,这里欧本卡接入飞书的配置呢,就完全对接成功,基本上都是他自己完成的,我呢只是配合他提供了一些必要的信息, 妥妥的全能小助理。接下来我们来看看他能为我们做一些什么吧。比如呢,我现在想要订一张机票,我就让他帮我查询一下最便宜的航班,他立刻就给我列了具体的信息,包括航班号,价格以及其他的一些航班信息。不过这一步呢,是需要接入 api 的, 大家可以自行去网上找免费的接入就可以。 好,那现在过年了嘛,马上大家呢也会送礼嘛,那我就让他去浏览电商的页面。呃,不过这里呢,需要先安装一个 oppo club 官方的浏览器插件,我们直接从官方渠道进行安装就可以了。具体的步骤呢,已经放在文档里了,大家直接照做就可以。我让他给我打开。 ok, 成功,呃,然后我继续让他为我搜索燕窝。好,也成功了。 好,那我们现在在拿最近小伙伴在学习的 ai 的 线上作业丢给欧本克,看他能不能帮忙完成。 首先我们要让他找到作业的本地目录,并让他完成里面的题目。他立刻就找到了,并且迅速告诉我,完成了。啊,这速度还是真的蛮快的啊,但是呢,人呢,还是比较懒的。如果呢,你抄作业都不想抄啊?没事,直接让他把填完的东西返回给我。好,他已经做完了,我们来看看啊。 呃,代码呢?全部都完成了,不过呢,我也是看不懂啊。看懂的高手可以来说说他完成的这个准确率怎么样。 好了,那这次安装说明就先讲到这里了,关于 open cloud 的 更多能力,有时间呢我们可以再去测一下。好,那既然已经部署成功了,有兴趣的同学呢,也可以再去深度探索一下 啊。对了,现在呢,各大厂呢,也出了针对 open cloud 的 云端部署,我这个呢,也可以跟大家快速的分享一起。好,这里是阿月,希望我的视频能够帮助到你,让你更了解呀,我们下期再见。

有人问小龙虾能不能调用 comforu i 实现图片生成?可以的可以的,我给大家实现。要想用 open curl 调用 comforu i, 首先你肯定是要有一套 comforu i 的 环境, 这是我们在本地搭建的 comforu i 的 环境,这是刚创建不久的一个流程图,它的作用就是根据你的正向提示词、反向提示词去生成一个平面图。其次,我们肯定是要有一个 open curl 的 环境,对吧? 我们建了一个 openclo, 这个 openclo 呢是使用的模型是 kimi。 二点五,要想用 openclo 去调用 ctrl u i, 我 们最好的方式是使用技能。这里是我整个创建这个的过程啊。嗯, 帮我开发一个 skill, 用于调本地的 comfyui 他, 然后后面就是要要求我提供给他这个 jason 的 路径,然后到这一步就是他已经成功创建了这个 skill, 就是 我通过在这个对话框里面跟他聊天的方式,他就已经能帮我生成图片了。 我这里是需要用 openglue 去调用的,怎么做?然后他就尝试再去做调整,调整完成之后就这里就算是好了,是吧? 然后我紧跟着我到小龙虾这边,这是它第一次生成,然后最后生成了它会路径在这,因为 openclo 它的这个界面是没有办法直接去访问本地文件的。这是目前 openclo 这个界面的一个问题,我们是不是可以 重新考虑修改一下我们的 skill? 既然你本地文件没有办法输出,那你是不是可以直接帮我输出 best new 四啊?在这儿你看它这边也是有 best new 四的方式进行输出。嗯,修改到这一步之后,它支持了 best new 四。 这个时候呢,我又重新跟他说,我修改了一下 skill, 你 帮我重新生成它。确实按照这种思路其实是对的,因为它能正常的输出这个这个东西,但是如果它这个输出完成之后,它就会正常显示,以百四六十四的方式显示。但是可惜百四六十四比较长,它输出 没完就结束了,所以导致这个图片是没有办法正常显示的。既然你这边生成的过程是用 python 去生成的,那为什么不能生成之后帮我直接打开呢? 使用电脑默认的打开方式帮我打开就好了吗?使用默认的图片的浏览器帮我打开,好,你,我已经同意生成,你帮我试一下, 对吧?他就成功了。我们给大家演示一下,编成一条鲨鱼,我们现在再看一下它的效果,但它的效率感觉并不是那么高,哎,你看生成成功了。

哎,好的好的,大家好,我们今天手动来带大家从零到一部署在自己电脑上面部署一下最近火爆全网的这个 cloud bot 啊,现在已经改名叫 opencloud, 我 们从零开始,首先我们去 opencloud ai 这个官网,然后往下滑,它有一个 one liner 的 这个 quick start, 非常简单,你只要在复制这个代码,然后开一个命令行,然后把它黏贴进去, 它就会自动去安装这个 opencall, 它会去检测联盟装着 homebrew, nojs 和 git 啊,如果没有的话呢,它会帮你去安装,我这边已经有了,所以它自动开始在安装这个 opencall。 好 的,安装完毕,安装完毕的话,它会自动会进入这个 onboarding 的 这么一个流程啊,它也是非常人性化。首先让你先来先签个协议啊,说这个很 powerful, 但也很 risky 啊。我知道了, onboarding mode, 我 们选 quick start。 然后第一步呢,是我们要接一个模型啊,在后端的模型,它虽然就 open call, 它只是一个中间层吧,你后端的模型还是需要用自己的 a p i 的。 之前呢是我我尝试使用这个 cloud code 的 订阅,可以接入这个 open call, 但是前段时间 cloud code 把它给封了,所以现在就必须只能调用 a p i, 所以美国的模型 api 太贵了,所以我们这里选择支持一下国产。我们使用 kimi 的 模型啊, moonshot ai, 然后 kimi 最近也是浪潮了,自己的这个 kimi k two 呃,二点五的这么一个模型啊,能力上据说是跟 opps 四点五非常相像啊,也是很厉害,然后价格可能只有十分之一,所以我们来体验一下,所以我们这里选 moonshot ai, 月色暗面, 然后把我们之前复制好的一个 api key 给复制进去, create a api key, 然后我们选择一个模型,我们就选 kimi k 二点五。然后呢,我们在这里选的是 在第二步呢,是选这个 channel, 就是 call bot, 呃, open call, 它是可以让你用过用你的这个即时聊天软件,然后来调用它的啊,这里就会去配置一下这个即时聊天软件。我在这里选的是,呃, whatsapp, 然后我们来看一下 whatsapp 怎么 link 啊,它会给你二维码,然后我们要拿 whatsapp 扫一下二维码。 好,我们拿这个 whatsapp 刚刚扫了一下这上面的二维码,然后,呃,现在是可以去继续去设置一下详细的配置。 whatsapp, 它里面有一些 phone, 呃,这个是 phone setup 啊, separate phone just for open call。 我 选择用一个单独的电话号码在 whatsapp 里面,然后这里使用,选择 recommended power mode allow form。 说实话不是很知道是干嘛了。嗯,选择 default 好 了,然后下一步呢,是 configure 这个一些技能啊,这里我先不 configure, 但是我们看一下, 呃,这个 open call 它有哪些技能啊?这些技能本质上来说就是它到底能做哪些事情,你可以看它这里有非常多的集成的这个 integration, 就 你的密钥,密钥管理系统 word 是 可以用来发这个 twitter 的, 然后 bear nose 是 可以用来这个记笔记的一些东西,然后有非常非常多的这个,还有什么 g u g 这种 就是 gmail 啊什么的,非常非常多 open ai 啊什么的很多啊,我们这里今天先不配置了,然后回过头也可以再配置,到时候会问你一些问题,要不要这些 a p i key 有 多选? no no, 如果到时候需要的话呢,可以再单独回过头来配置 好。然后最后一步呢,是这个 hook 啊,自动的这个操作,然后它可以在某些特定的环境下面被触发,然后帮你操作。比如说它这里有一个 session memory 的 这个 hook, 就是说它可以在每个赛季结束的时候呢,自动把赛季的这个你们聊天对话记录呢,保存到他们的这个长期的这个 memory 当中。这里我觉得还是开一下比较好,因为 open call 它是自带这种长期 memory 的 功能的,然后如果每每每一次跟他对话,它会更新长期 memory 的 话,你会发现这个 open call 越用越聪明。 好,然后这些都是系统自带的,我就都开了,然后都开了,然后去设置 gateway, gateway 就是 说是呃呃,如如何去开这个?开个关口,然后让可以让这个你在 whatsapp 里面发送的消息被传递到这个电脑上的 open call 里面。这里我之前已经装过了,所以我们在这里的话就是 reinstall 一下。 好,我们这里的 git 已经装好了,我们现在有有有方法去 hack。 我 的 bug 就是 初设啊,初设的话我们可以推荐是走这个 t u i, 也就是它自己会开一个网页,然后这有一个链接好,然后可以尝试发个消息 啊,很可惜啊,消息没有发成功,我要来 debug 一下。哎,好的,刚刚发现是因为自己的那个 kimi 账号没有充钱啊,现在充了钱就变强了啊,我们现在已经可以 跟他对话了,然后我们在终端呢,可以输入这个 open opencloud dashboard, 然后呢我们来重新进进入这个网页的 ui 啊,然后这里呢我跟他说了个嗨,然后他现在会介绍一下自己可以干哪些事情啊?怎么怎么样,怎么怎么样都是英文啊,太,太烦了,我看他看中文那里边啊, 好,他现在等于说一开始的对话呢,他会让你去呃设置一下他的名字是什么,然后怎么称呼我,然后他是干嘛的?嗯,然后同时呢我们我来就展示一下这个我们这个 whatsapp 的 这个能力啊,就你看我们这边, 嗯,其实 whatsapp 上面是可以给大家直接发消息的,然后在这里的所有的信息呢,我们也都可以在 whatsapp 里面跟他呃聊天,然后他就只要你的这个网关是上线的,他就是可以呃去跑的。 那么今天视频就到这里呢,我们就简单的装一下 cloud bot, 未来的话我们也会在这里继续更新一下 cloud bot 到底能在呃能对我的工作流程带来多大的影响啊?期待可以创造更好的内容给大家,谢谢。

各位好,今天我们来分享 openclaw 系统的架构设计。 openclaw 不是 简单的服务堆砌,而是一个围绕 getaway 构建的统一智能代理平台。通过六层架构设计,它实现了从接入层到自动化层的完整闭环。接下来我会逐一展开每一层的核心设计思路和技术实现细节。 opencloud 的 核心架构定位非常清晰,以 get 位为中心构建统一控制平面。在单个 get 位实体内部,我们集中管理了渠道接入、设备连接、绘画、状态、消息路由、 a 帧的调度等关键能力。 整体架构分为六层,从接入层到自动化层层层叠统。部署上,通常一台主机运行一个 get 位,但在特殊场景下也支持同机部署多个完全隔离的 get 位实体。 接入层是系统的入口,负责统一汇聚各种外部对象。它包括三类核心对象,外部消息渠道、控制端、客户端和节点设备。 外部消息渠道如 whatsapp、 telegram 等,由 git 位内部维护。对应的适配器控制端如 client web 管理界面,通过 web socket 接入。节点设备如 micros、 alrad 等也通过 web socket 连接并申明自己的能力。 这些对象不直接通信,而是统一汇聚到 get 位,进行中转、叫验和编排。 get 位控制层是整个系统的中枢纽, 相当于平台的总线和总调度台。它通过 web socket 提供控制平面,通过 http 提供健康检查、工具调用以及 canvas、 r u i 等辅助接口。 这一层负责连接握手、身份认证、协议校验、消息归一化、事件发布、通道状态维护和系统级控制。 所有连接、所有消息、所有控制指令都要经过这一层的统一调度。绘画与路由层决定了系统为什么能在多渠道、多群主、多用户场景下仍保持上下文隔离。他把来自不同渠道的消息抽象成统一事件, 再根据绘画键、渠道群主用户身份和 agent 绑定规则完成路由绘画。系统负责上下文、历史生命周期重置策略、压缩策略和持久化存储。 为减少病发冲突,系统按绘画维度串行处理,同意绘画中的任务顺序执行不同绘画,再交给局调度机制协调。 agent 运行时是真正负责理解请求、调用模型执行任务的核心引擎。 它嵌入在 get 位内部,主链路包括接收、输入、装配、上下文、读取、工作空间、文件选择、模型、触发、推理、调用工具、处理、工具、结果流逝、输出、写回、绘画与记忆、 工作空间中的 agents m d、 so m d、 tools r amp。 d 等文件,共同决定 agent 的 角色设定、行为边界、工具权限和上下文风格。简单说, getaway 偏向平台控制与调度, agent run time 偏向智能推理与执行。 agent 的 能力不止来自模型,更来自强大的工具系统。 openclaw 内置了文件命令、执行进程、网页浏览器、绘画记忆、消息节点等多类工具 节点。系统把能力延伸到设备侧,比如相机、屏幕、录制、定位以及 converse 交互能力。记忆系统负责跨绘画信息保留和语义解锁。多 agent 机制则支持主 agent 调用,子 agent 用于专业分工、复杂任务拆解和隔离执行。这些能力共同构成了 agent 的 执行基础设施。最后一层是扩展与自动化层,这体现了 opencloud 可扩展架构设计。插件系统可以扩展新的渠道、新工具、新后壳、新的记忆后端, 甚至新的模型提供者。互可和矿分别提供事件驱动和时间驱动的自动化能力,适合做通知、同步巡检和批处理流程。因此呢, openclaw 不 只是一个聊天代理,而是一个可以持续外接能力的自动化平台, 能够根据业务需求不断扩展边界。现在我们来看完整的架构全景。六层架构,从接入层到扩展层,层同共同构建了以 get 位为中心的统一智能代理平台。 接入层统一汇聚,控制层统一调度,路由层上下文隔离、 agent run time 智能执行能力。系统提供工具支撑,扩展层持续增强能力。六层之间通过 get 位这个控制中疏紧密连接,形成了一个完整、灵活、可扩展的智能代理平台架构。 以上就是 openclaw 的 完整架构设计,通过六层鞋桶,我们构建了一个以 getway 为中心的统一智能代理平台,既保证了系统的统一控制和调度,又实现了足够的灵活性和可扩展性。谢谢大家!

opencloud 住进电脑后,到底能帮你干哪些活呢?今天这篇 opencloud 干货指南可要认真看完。大家好,我是 jack。 opencloud 像是住进你电脑的私人管家,可以飞出远程指挥,帮你收邮件、做简报,甚至各种图片都给你画好了。最关键的是,它是开源的,免费的,是完全属于你一个人的。 哎,别跑,你又以为这又是什么复杂的程序员玩具,那你就真的错过了一个亿。今天咱们就让小白也能拥有这个口碑炸裂的本地 ai 大 管家! ok, 我 们先花三十秒快速认识一下今天的主角 open call, 你 可以把它理解为当下最热门的二十四小时本地个人助理。那有朋友要问了,市面上那么多 ai, 它凭什么在本地部署还这么牛?来,我们做一个对比, 平时我们用的网页版 ai, 就 像坐在咨询台里的客服,你问一句,他答一句,但是他没有手,碰不到你的文件,也看不到你的屏幕,而且文本模型就只能处理文本,不能升图升视频。但是 open call 不 一样,他是直接拿着你家钥匙坐在你工位上的私人秘书。第一,他有手, 只要你给了授权,他就能操纵你的浏览器,你的文件系统,你的各种软件。第二,他听得懂人话,甚至能远程用飞书传话, 你在外边吃着火锅唱着歌,发个飞书消息,家里的电脑就开始干活了。第三,他还可以集成各种接口,让他删个图片,文本转语音都不在话下,能写会说更会画 逻辑懂了,咱们直接动手。我知道,一看到终端啊代码呀,很多朋友就头大, no no no! 今天咱们主打一个有手就行。其实 opencloud 的 部署非常简单,只需要 windows 加 r 输入 power share 回车,在这个终端直接输入这条指令, 然后这一步选 yes, 然后选择模型提供商推荐 glm, 只要在智普平台注册就有免费额度,记得创建 api k, 然后填入。接下来依次选择 skip for now 这个选 no, 这个全选就安装好了,所有的资料我都给你打包好了,直接复制粘贴就行,文档老地方见。 opencloud get away 一 键启动,当你看到这个页面的时候,恭喜你,你的二十四小时秘书已经在待命了。至于飞书远程遥控怎么集成,别急,可以去我的主页看另一起专属飞书接入保姆级教程, 秘书上岗了,可惜他现在还是个白板,咱们得教他干活。第一招,赋予他资讯猎手技能,操作超简单,把我这段指令直接丢给他,他会自动弹出一个网页,登录一下你的账号,完事 后续他就会全自动抓取信息,不用你看一眼。好了,配置完成,咱们测试跑一把。你看他直接把整理好的最新资讯简报发给我了,还顺手帮我归档到我提前建好的多维表格里。 第二招,教他帮你管理邮件。咱们就以小企鹅的邮箱来举例,先正常登录,跟着我的鼠标点击右上角的设置,然后点左边的账号与安全,在新界面,再点击安全设置,生成一个授权码,保存待用。回到和我们客户的对话中, 直接将这段话告诉他,他就会自己创建这个技能了。好,他也是创建好了,咱们测试一下,让他列出最新的五个邮件,并给另一个邮箱发一下他的自我介绍和自画像。 好,他也是很快就执行好了。关于他是怎么生成自己的自画像的,那就是我教给他的第三招了。接入 naidu baidu 的 生图能力有两种方式,先说第一种,在咱们最开始部署的时候,就把 naidu baidu 的 密钥填好了。 第二种,用第三方 api 接口。这就更野了,直接把第三方的开发文档扔给他,再把 api url 和 api k 一 起给他, opencall 就 会自己搞定。这套集成全程不用你懂代码, 我直接让它生成一个小猫草地,然后对原图进行修改。怎么样?跟着我这三步的操作,看下来是不是打开了新世界的大门。 opencall 就 像是我们在物理世界的一个数字分身, 以前我们为了提高办公效率,到处找工具,下了一堆 app。 但现在你只需要是一个 agent, 自己往里塞技能,他就能听懂你的话,看懂你的世界,还能帮你操作一切。 想象一下,以后所有的琐事都交给他,你只需要负责享受生活,这得有多爽?今天视频里用到的资料我都打包整理好了,想让你的电脑也自动干活的朋友不要忘记点赞、收藏、关注,那我们评论区见,拜拜!

最近 a h r open klo 这个小龙虾实在太火了,付费上门安装的服务都被炒到了五百元一次。某大厂办了一个线下免费安装的活动,排的队比老年人领鸡蛋还长。那今天这个视频教你如何一分钟部署 open klo, 视频结尾我还会演示几个硬核的用法,教你如何压榨这 只龙虾。那开着前先给大家提个醒,网上很多教程都教大家本地部署,但是如果你没有一个备用电脑的话,就不建议尝试本地部署, 因为 oppo 壳到需要的权限实在太高了,如果你在有重要文件的主力电脑上去跑,一旦出错,后果就很严重。上个月 mate 的 高管被龙虾删了大量的工作邮件,这就是个惨痛的例子。当然这也是为什么最近苹果的 mate mini 被买断货的原因。 所以本视频我们用的是云端部署方案。限阶段龙虾能无缝接入 telegram、 discord、 whatsapp、 飞书、企微等平台。国外用户接入 t g 的 比较多,但如果你人在国内,又不想折腾网络的话,飞书是目前国内玩龙虾好的选择。它们家的生态非常齐全,前两天发布了官方版的 open 格式插件, 接住龙虾后的操作特别丝滑。那废话不多说,我们正式开始。首先打开飞书,直接搜索 open class, 选择这个妙搭,然后点击一键部署 open class, 这里你需要给你的龙虾起个名字,并且给他选一个形象, 然后点击创建按钮,他就开始部署了。大概等了一分钟左右,他就给你部署好了。选择这个立即对话, 在输入框里跟他发送,获取所有权限,点击授权, ok, 这一下就大功告成。现在你就拥有了一只属于自己的龙虾,并且不需要网上那些复杂的配置,你就可以直接在飞书上去指挥他干活。 这个部署真的对小白用户来说特别友好,啥也不用管,一分钟就搞定。当然,如果你之前已经在各大厂的云平台上面买过服务器的话,直接部署好也可以接近飞书来一样能用。 具体结构教程我写到文档里,大家感兴趣视频接本自取。那接下来我们开始压榨龙虾,看看在工作中到底可以怎么样使用。 open class 案例一,私人秘书日常工作中最简单的用法就是让他去充当你的私人秘书。你可以让他帮你创建代办事项和日程,或者帮你预约会议, 又或者让他每天给你发送行业日报,了解最新的资讯。不光如此, overclock 还能跟飞度上的各种办公软件结合。比如在日常工作中,你写了一份文档,然后你的同事和领导在文档上添加了各种批注。现在你可以直接让他动手帮你修改文档。 不光文档可以用,表格的工作也可以处理。比如你让他去做一个市场调研,我给他发这一串指令,等他干完活以后会发消息提醒你点开他消息里面的链接。刚才我们要的所有数据,他都整理好了,登记在周围表格里,这个玩法用来监控或者爬取数据都特别方便。 那这说句节外话哈,虽然现在龙虾的热度很高,但我不会无脑去吹。坦白来讲, open klo 目前执行任务也会出错,比如这个任务,我在测试的时候他就失败过两次,但我让他自己想办法解决,过了一会他改一改就跑通了。所以在执行任务中遇到报错或者无法解决的问题,不要慌, ai 时代,我们要学会用 ai 去解决问题。 这个案例是我觉得最实用的。写日报估计是所有打工人都讨厌的工作内容。在过去的一年里边,有不少 ai 工具都号称自己能写日报。但如果你用过那些工具,你就会发现,想让他写个日报,你需要先把今天的工作事项、文档等数据喂给 ai, 他 才能帮你总结。 讲实话,如果我愿意把今天干的活自己去梳理一遍,为啥还要多余让 ai 去总结?所以市面上很多 ai 工具都有点华而不实。但如果你的公司是在非书上办公的话,现在可以让龙虾帮你写日报,直接跟他说,给我生成今天的工作日报,它就能获得你所有的文档、日程,还有聊天里边的数据 看,不仅能看出我今天创建的几个文档,甚至连今天装龙虾做了七十五个系统授权,也总结出来了,跟市面上那些需要自己未数据写日报的 ai 工具比,这才是真正能落地的生产力。 视频最后聊一下我个人对龙虾的看法。在深度养虾一个月以后,我觉得这波 open klo 热潮最大的赢家有两个,第一个毫无疑问是苹果公司 mac mini 的 销量直接被带起飞, 另一个就是那些在用飞书这样的软件办公的企业。因为接触龙虾以后,你会发现 agent, 它不再是一个只陪你聊天的对话工具,而是拥有你的工作数据,能真正帮你干活的执行者。 视频里面的所有步骤,包括云端部署和本地步骤教程,我都整理在了一个文档里面,赶紧去创造你的第一个赛博员工吧!下期视频教你 open klo 的 进阶玩法,别忘了点赞加关注,我是山河,我们下期见!

作为汇报,总是被导师吐槽逻辑不够清晰,内容不够深入,明明已经很尽力了,那能怎么办?光是查拍卖的,找最新的临床数据,整理好文献,再去标记我们的饮用,就已经耗掉了大半的精力。组会上做汇报还得要做 ppt 排版,调我们的图表,内容要有层次,表格图表要美观,真的太费时间。我一直在用这款生命科学专属 ai noraa, 不仅可以从拍卖的上面发这些真实可以查到的文献,他还可以帮你优化 prom, 帮你全面的查找你想研究的内容。他还可以生成一份完整的附带真实文献的研究报告。现在还能一键把科学问题做成逻辑清晰的 ppt。 研究完科学问题,直接在左下角点蓝牙页的生成幻灯片,他就会自动梳理报告里的逻辑还有内容, 帮你排好版,直接输出。一份能够上台汇报的 ppt, 里面不仅有动物模型的具体比较,还有带皮质的柱状图,给你展示干预后的效果,该基因的意志,还有促进方向以及对各种细胞的影响,全都分层给你讲透,更厉害。 但是他还会层层递进,他可以帮你梳理出信号通路到关键基因,再到生物功能的完整关系。同时他还可以帮你区分应用文献的证据强弱,从现有研究中总结并找出不足, 能够为你开拓新的研究思路。以前想把一个问题研究透,讲清楚真是难到崩溃,现在用诺亚 ai 从查文县做报告,再做出 ppt, 不到半个小时全都搞定!生命科学的科研党,这才是真正懂科研的 ai。

大家用小龙虾用 open curl 的 时候,有没有发现一个问题,它没有办法进行桌面 ui 的 操作,只能在这种浏览器界面进行操作或者收集信息。但是在国内跟国外不一样,比如说各个平台,它的操作都是非常闭塞的,比如说微信,你是没有办法进行操作或者执行的,但是我们的很多工作或者生活都是在微信上面, 你要做的话就完全没办法能够实用下来。所以说今天给大家分享两个项目,一个项目是这个 torx, 也是昨天我已经分享过的,今天给大家实测一下,它这个速度会比较慢啊,直接进行 u u i 操作, 我们直接让它,比如说之前我已经执行过一次,我直接再让它执行一次,它这个速度会非常的慢,因为它是 u i 界面操作的,后面我可能也会做一个开源的项目,看能不能解决这个问题, 把它有些固化的东西,能不能把它做成 r p a 的 方式,它的速度就会快很多。进行录屏操作,然后加 r p a, 加这种 ui agent 的 方式来解决这个问题。 今天就给大家演示一下怎么样能做这样一个,呃,能做 ui 界面操作就行了。再就是还有一个 agent, 我是 用的这个 agent s 啊,它是第三个版本,它在这种 ui 界面操作上面, os word 这个排行榜单,它是定义的水平,所以说我直接用的这个框架来使用的,我刚才用的就是这个框架,因为这个没办法支持这个 windows 的 操作,它是默认使用的这个 mac mac os 的 电脑, 所以说我没有用这个,这个跟这个是没有本质区别的,甚至这个它的商业或者说齐全度会更高,但是它会非常的轻便哈,它就是一个 c o i 的 方式,你可以让 cloud code 把它扒下来,然后写一个脚本,让它能正常执行。然后你再告诉 open curl 五,或者你直接让 open curl 五去先测试一下这个项目能跑通了之后,你再让 open curl 五把这个项目给它打包成一个 skills。 但是它有一些问题,就是我是用的这个 kimi k 二和这个通信千问三点五, 它这个东西还有点 bug, 就是 kimi k 二它是零到一的,这个做了缩放的一个定位,比如说它这个幺零八零乘幺九二这个呃幺九二零的像素,但是它输出的不是具体的像素点,而是一个压缩了的,所以说这里还是有一些坑,大家可以稍微微改一下, 会更加准确啊。这个用 open curl 或者说 cloud code 改可能会更加好一点,然后 给大家看一下,然后你让它打包成 skills, 加载到你的 open curl 里面就可以了。 ok, 我 们来看一下它执行的过程。 ok, 它已经点到这了,还正在输入了已经。它的速度确实是很慢,因为它要有非常多操作,首先它要 去截图了之后点哪一个他也去,点了之后又要截图,又要上传,上传了之后又要看一下是否下一步应该做什么操作。而且他的这个框架或者这两个框架他都是两个模型,一个规划模型,一个执行模型,所以说他速度会慢到离谱。而且我们这个是云端的模型, 一个这样的截图下来大概是一兆多,所以说你上传云端也需要时间,他理解又需要时间,所以说就非常的久。 但是我想了一个这个解决方案啊,用的 r p a 的 方式,后面如果成功的话给大家做开源,大家也可以关注一下。可以关注一下我啊,可以看到他已经发出去了,下面应该他会有回复了,等一会他应该就可以回复了。 其实本质上就是你先把这个骑起来,可以跑了,这个脚本可以跑了之后你就把它放在这个 open curl 里面,然后你让 open curl 去配一下就行了。 那你用 cloud code 去配 open curl 也好,还是用这个 open curl 去配 open curl 也好,两个都是可以的,但是最好有两个把它分开,一个坏了,你还能用另外一个去修复一下。所以说这个东西还是有点问题,可以看到结果已经执行完成,约二点五分钟就发了一个, 呃,给我女朋友发了一个,爱你哦,呵呵,就大概是这样的操作,其实他的这个能力还是非常强哈,他 kimi k 二的这个能力都非常强。在 osword, 他 kimi k 二是拿到了 soata 的 水平的,我们可以看一下他这个评测的能力,他用这个基准 是能达到人类的平均水平的。七十二,如果用现在更好的模型的话,应该是比七十二差不多吧,应该还要少一点,因为他这个是多次实验的,他是另外一个版本,但是是要高于这些其他的一些版本模型的。 但是它是用了两个模型啊,一个是呃规划模型,一个是执行模型。但是像现在 kimi k 二它的性能非常好的情况下,你可以让 cloud code 给你改一下,把它改成统一用一个模型,它就没有办,没有必要去两个模型再错切换了。 还有就是它那个模小的执行模型,它默认使用的本地模型,你统一让它用一个模型就可以了。 ok, 这个就是今天的一个分享。

我用 openclaw 实现了电商的自动上品流程,我从原来每天需要四个小时的上货流程,现在只需要五分钟,现在看到这个窗口是我日常上品的一个流程,找品、存图,新建商品,填入信息,然后一个品一个品,这样去操作。那我是怎么把这个步骤自动化的呢?先来看一下结果, 我现在的执行流程只需要打开飞书,因为我对接的是飞书这个通道,我只需要给龙虾发一句,开始执行自动上货流程,然后龙虾就会自动开始干活,他先会梳理一下这个干活的整个流程,大概分几个步骤,然后他就按步去执行,一直执行一个流程大概只需要三分钟不到,而且我的文件夹里面应该是有十三个商品的。 这个工作平时我们人工去做可能要花两个小时左右,现在就相当于无论我在哪里,只要我的电脑开着,我只需要跟我的飞叔说一句,开始执行自动上货流程,他就会自动跑完,然后告诉我已经 ok 了,所有的结果会放在我的桌面上,智能分组结果就是他帮我执行好的结果,所有的商品他帮我分好了组, 然后他又帮我把所有分好组的结果进行了一个压缩。那我最后上面的操作就是把这些压缩文件一键拖动到数据包导入就可以了。我从原来每天需要四个小时的上货流程,现在只需要五分钟。 那具体整个流程是怎么实现的呢?首先我需要做的工作是打开某多多的 app, 把我选中的商品去把这个商品的图片全部保存下来, 然后以及说这个商品的信息截图和价格尺码截图全部通过截图的形式和下载好的商品信息,这些图片混合起来,直接放到我电脑的这个桌面的文件夹就可以了。文件夹就是我保存下来所有我要上的商品,这里边会包含很多商品信息图, 然后还会包含很多的一个商品的价格和尺码图,因为这些我都是要一比一录入我的信息里边的。那可以看到我的这个大文件夹里面其实是不止一个商品,是很多组很多组商品。那么龙虾下一步就需要基于我这一个大文件夹去帮我进行智能的商品分组, 所以我把这些图片放到文件夹以后,下一步就看龙虾的操作了,那么它的执行步骤是什么呢?首先 第一步他需要打开我给他的这个文件夹,首先他需要基于我给他的一个大文件夹进行所有的图像识别,进行一些 使用一些算法将描述为同一个商品的图片归为一组,并且自动帮我分好组,可以看一下大概的结果是这样,所有相同的衣服会分为一个文件夹, 那么他帮我进行图片识别以后,非常精准的把所有描述同一个商品的图片都归为了一组。 第二步,它需要基于我提供给他的截图的那些信息,去提取对应的每一个商品的标题,价格、尺码和颜色,然后去自动录入表格。那最后一步,它会把它在过程中处理过的所有数据帮我生成一个校验表格, 方便我检查执行过程中是否出错,那整个环节就是龙虾帮我去做的,那这个质检验表格是什么意思呢?他会把他执行过程中所有处理过的数据信息帮我汇总到一个表格,这样我就很方便的去进行一个统一的预览,看一下哪个环节识别的信息,或者他执行的步骤有问题, 那我一眼就可以在这里看到。这个工作我只需要在飞书给他发一句指令,然后等他执行完之后,我打开这个教样表格,在表格里面快速去预览一下他所有的执行过程,有哪些数据错误了,或者分组错误了,我在这里可以快速的看到,然后再告诉他进行什么样的修正,这个工这个工作就完成了,是非常的方便。

大家好,在你装完 openclip 之后啊,第一件事要做的事情就是去选择一个模型,那模型作为 openclip 的 大脑,它起到一个非常关键的作用,那这么多模型,那他们之间有什么区别呢? 那为什么你的模型只能识别文字,不能识别图片呢?那本期视频呢,就跟大家讲一下不同的模型之间能力的区别,以及怎么去配置模型。那对于一款模型来说,它的能力有接收信息,那信息类型啊,有可能是文字,也有可能是图片, 也可能是视频、音频或者其他就是你发的信息的内容可能包含这些类型。那么大模型在接收到你这些信息之后,他对你的信息进行回复,也有可能有这些类型,比如说他回复文字,给你回复图片,给你生成一张图片,或者说做出来一个视频, 或者说做出来一个音频音乐,那么也有可能是进行一个网页的搜索,你让他调用了搜索的工具进行一个网页的实时搜索, 那么这这两个东西就是一个输入和一个输出,那不同的模型之间的差异啊,就表现在接收和回复这个信息的内容区别上。那么 open core 官方呢, 截止目前也统计了一个模型的一个使用的一个排行榜,那么这个排行榜里面的模型的排名,不是说我们传统意义上那种模型的一个综合排名,它更多强调的是在 open core 里面的任务的完成的成功率和这一个排名,大家可以看一下, 就是平均的一个排名,就是比如说第一的是 gemini flash, 那 么第二的是 mini max 二,二点一,那么对于 mini max 它现在已经发布到二点五了,但是二点五的表现是在这个排行榜是比较差的, 这个也是非常奇怪的。那么前面还有这个 kimi 的 k 二点五,就这些模型在任务完成的成功率是比较高的,所以这也可以作为啊模型选择的一个参考。 接下来我们就来说一下不同模型在接收信息和返回信息之间的差异,大家可以去选择。就是你在完成任务的时候,为什么有些模型处理的不好,那比如说我们 dbisc, 那目前 v 三点二版本它只支持一个文本的输入和文本的输出,那么对于千万三点五 plus 来说,它能接收文本,也能发图片,它也能去理解这个图片是什么。比如说在我的这个 openclip 的 这个非书的聊天里面,我上传一张图片,那模型来识别一下图片中的文字, 如果你的配置的模型它不支持这种啊图片的识别,那么它出来的结果就是跟实际的结果是有很大的差异的, 那么可以看到它识别出来了这个图片里面的所有信息是完全非常准确的。那么在刚刚的演示里面,我们可以看到千万三点五 plus 它是有一个图片理解能,所以大家在用的时候一定要注意自己的业务的场景 啊,选择正确的模型。那么这里边除了图片理解呢,这边还有一个网页搜索,就是说它本身模型它本身支不支持这种搜索这种内容,因为对于模型来说,知识库它是有一个截止时间的,比如说你可能你 模型的训练数据可能只是截止到二零二五年,但是你现在搜索二零二六年的,那就有些模型他是具备这样的网页搜索能力,他就可以调用这种 实时搜索能力,那么有些是不支持的,那就要配置这样的 m c p, 官方也出了这样的工具,比如像豆包系列,二点零最新的模型也是一样支持文本和图片,那么他这边也是可以单独去开通网页搜索的能力啊。 那我们可以看一下,就是啊这几款国产的,比如说 mini max m 二点五、 m 系列和这个智普的五点零,他们这个图片的识别是需要单独去配置 mcp 的, 不然的话他是没办法去识别的。 那 timi k 二点五的话是原生就支持图片识别,那么国外的模型,比如说 colossal 四点六和 jpeg 五点四,还有 jimmy 的 三点一 pro, 那 么它们都支持图片识别,也支持这种啊网页的实时搜索,那算是这个综合能力算是比较好。那其他的比如说你要去让模型去申请个图片, 那基本上我们现在用到的这主流的这个啊主模型啊都不具备,那么你就可以去调用他们专门的图片模型。比如说像千万,他有专门的万象系列的生成图片的,那么都包括有纪梦相关的模型,那么像 jimmy 的 话,有专门的这个深图的模型也是可以的。就是这些 又需要去单独去配置,在你去生成图片的时候去告诉他去调用这个模型去做这个事情,那像这个火山,这个 cds, 二点零系列都是可以去生成视频的,那么这个就是一定要知道,就是一款模型,它不是万能的, 你可能需要不同的模型来配合去完成你的业务的场景,所以一定要一定要弄清楚你的业务场景里面涉及到了文本、图片、视频、音频, 就把这个东西先想明白了,再去找对应的模型配置好,就才能去把整个东西,整个东西串起来。选好模型之后,很多模型厂商都会有两种购买方式,一种叫做按 token 购买,就是 按用量购买,用多少啊你就付多少,这种方式是比较自由的,它是不受任何限制的。那么第二种就是按这种 coding plan, 就是 套餐的方式,那这种套餐是什么样子呢?一般是有 有限制,比如一个月能用多少次,然后一周能用多少次,然后五小时能用多少次,它是有一个这样的一个限制,会每隔五小时会刷新,每一周会刷新,然后总流量是不超过啊,每个月总流量那么像智普啊, mini max, 豆包,还有这个千万 都出了相关的这种啊这种代码的套餐啊,就是可以可以编码,又可以用在 openclo 里面,那每一个套餐这个量是不一样,大家一定要注意去看,它可能在官方的介绍里面会说啊多少多少次请求,但是要换成就是你的一次对话,就是你跟 openclo 对 话一次,可能要 调用很多这样的一个请求,那么这样的次数是没有他说那么多的。最后呢,就是我们选择好了模型之后啊,我们怎么去配置?第一种方法就是啊原声的就是它 openclo, 它本身你在配置的,你在安装的时候它是有模型的一个列表的,比如说你输入这个 openclo config menu, 那 么 到这一步的时候,你选择这个 model, 就是 你需要去配置这个模型这边的话就会选择很多啊,它本身的支持这个 pro i 的, 就是它本身已经内置了这这些模型的链接,那么你点进去之后,你就可以去输入你的 a p i t, 或者说输入你的这个认证授权的一个链接啊,那这能快速的去完成。那还有一,还有一些它可能是不在这里面的,比如说像千万千万的这个 codeplain, 还有一些其他的这种模型的配置啊,那么你就可以使用这种 cc switch, 那 这款软件,那这款软件呢?有一个单独的一个菜单,那么点进去之后你可以去进行配置,也是一个图形化的界面。那接下来就是这种比较繁琐的,就是去编辑这个这个 配置文件,那这个是 openclip 的 一个啊,总的一个配置文件,那这里面的话,你就要去修改这个 providers agents 里面的内容。一般是 如果你选择哪个模型厂商的话,它会提供这样的配置文件修改的,这个啊完整的字幕串,你直接去给它修改掉就行了。那么如果你自己改这个接线文件,因为这个接线文件非常大, 嗯,不太方便了,你可以借助这个 ai 编程工具,比如像 tree 啊,像 cos 啊去帮你去修改它,它这边是可以去给你修改,而且可以去给你修复可能修改出来的问题啊。 那除了这上面的方法之外,那就可以用它自己的这个外部端里面的设置里面找到这个 modus 的 节点啊,但是它这个说实话非常非常难用啊, 我觉得用上面的方法都比它这个官方这个界面用的会可能会更简单一点。那你如果配置完之后啊,最好是重启一下,那么你在页面上可以点去重启,或者说输入这个 open curl, get away restart 这些命令去重启,重启完之后,那么你就可以去使用新配的模型了。 ok, 那 本期视频到这,希望这个视频对你有所帮助。

最近 open claw 全网爆火,但很多人不知道这只龙虾到底能用来干什么?别再把它当成聪明点的聊天框了,它是一个没有主观能动性但执行力爆表且拥有系统最高权限的赛博牛马。今天直接上硬货, 用八个真实的落地案例,教你给它装上手和眼睛,彻底解放双手。国内用这招最爽,直接走飞书长连接对接 你在街上看到海报或者开会,随手拍个白板架构图,直接发给飞书里的龙虾。他在后台会调用视觉模型和笔记插件,瞬间把图片里的乱码变成规整的 mark tab 白板,打好标签,静默存进你的本地库,你只管扔,剩下的它全自动搞定。 做自媒体和出海最值钱的就是信息差。去技能库装上这俩插件,你只需要再飞书下一句指令,让他去爬海外高禁石社区过去一个月的痛点帖子,他能把老外的长篇大论瞬间浓缩,关键时他还会根据这些痛点,直接给你为三套极具网感的文案出稿。 有了这个实时情报网,你一个人就能干掉一个小编团队。面对那些没字幕的英文公开课或者几十页财报,直接把链接甩给他。 他在后台会绕过画面拉取完整的字幕流,三分钟就给你吐出对干的核心推论和工具清单。半天的信息量,也就是喝口水的功夫,全吸干了。公司几十个记忆的内部资料放到网上怕泄密不用 ai 又搜不到。先开启 knowledge base 技能, 把海量资料往本地文件夹一丢,他就在后台自动键锁影。新员工在飞书里艾特他,问报销走什么流程,公司差标是多少?他能精准引用文档原句,秒回数据绝不上云,昵称代码都不用写,琐事也能全包 装上 gog 技能,他每天早八点自动过滤垃圾邮件,把大客户的需求浓缩成两百字,成稿发给你,甚至连委婉拒绝的草稿都拟好了。程序员更省心,装上 get up 技能,半夜流水线报错,不用开电脑翻日制 问他一句,为什么挂了?他自动读差异代码,两分钟就能告诉你哪行漏了个逗号。这是真金白银的救命活。 跑过付费流量的人都知道,睡梦中跑飞一个计划,醒来几千块打水漂,接入广告平台 a p i, 让龙虾当你的二十四小时盯盘员,他每小时拉取头产比数据。一旦发现创意无聊跌破及格线,他不仅会在群里疯狂报警,更能被授权直接执行暂停指令。 在你睡梦中死死捂住你的钱包。这是高级玩家最推崇的玩法,让 ai 主动找活干。传统的软件是,你拨一下它,转一下,但你可以给龙虾下一道全区指令, 告诉他,每天晚上十一点我睡觉后复盘今天的代办事项,主动上网研究一个提高效率的新工具,或者帮我写段自动化找本。 每天早上你睁眼会发现,这个数字员工已经在半夜为你搭好了全新的数据看板。这种跨维度的震撼,才是真正的将为打击想吃透 ai 红利。记住这个公式,不要把它当成神,把它当成一个薪水极低、极其听话的牛马实习生。你要做的就是当好包工头。 第一步,找出你每天重复劳动的痛点。第二步,把它接到飞书或本地电脑。第三步,去技能库配齐插件。红利永远属于那些懂业务并且知道怎么把 ai 武装到牙齿的人。这八个场景,你最需要哪一个?评论区见。

这是我用 openclaw 搭建的 ai 团队,他们各司其职,不用睡觉,能节省下非常多的时间,同时也做很多我一个人做不过来的事情。这期视频我想带你看一下我的 ai 团队到底长什么样,然后我们再一步一步搭建出属于你的 ai 团队。我们会讲如何创建一个 agent, 我们在 open cloud 里面,一个 agent 到底指的是什么? agent 之间如何相互协助,以及什么时候需要多个 agent 和最佳实践。好的,废话不多说,我们开始吧。我的团队里面一共六个选项题,其中四个是有定时任务的,就是每天的某个时刻都会触发他的任务,让他执行直到完毕,当然也可以随时跟他对话。 还有一个是几乎二十四小时期不间断工作的,还有一个最后一个,那就是你给他任务,他才会执行。第一个 agent 呢,是攻击 galk 啊,他每天负责给我情报工作,具体来说就是每天早上九点会提前搜寻 关于 ai agent 相关的技术的进展,产品进展以及用户的痛点。然后呢,把在网上搜寻的信息汇报给我。那么如果我不回答他,那就是明天继续给我相关的信息。如果我回答他,希望他对某一个话题进行深挖,那么他再去根据某一个话题再去搜索相关的信息为我展开。 那我的第二个 ai agent 是 auto 合理,它是我的私人助理和提醒助手,怎么用呢?我一般都是通过 diagram 跟它对话,这里我就不展示我跟它具体对话了,要涉及我的个人隐私。 一般来说,有任何的待做事项或者事情有着进展,我一般都会语音留给他,或者是打字告诉他,他都会记下来,某一单有问题就会问他,他都会翻出来告诉我待做事项是什么,事情到哪一步了, 同一次。同时呢,每天早上七点半,他都会告诉我今天的天气,然后今天要做什么,一步一步按重要性排序。它的作用就是完全替代笔记软件在我这里的作用。现在呢,我已经不用 notion 来记我事情,要做的事情,以及事情的进展了。 我的第三个团队成员,也是最重要的团队成员,就是 man, 一个狮子的形象。他呢,有最好的模型,有最高的权限,我主要用它来做两个功能,第一个就是日常的对话,我所有重要的对话,长期的计划都是跟他讨论的。 第二个就是一个视频流水线,帮助我制作视频。那么这个想法来自于一个叫做 alex finn 的 博主,本质上就是每隔几个小时,比方说我是每隔三个小时,他会去 x 上搜索我感兴趣的话题,比方说 ai 阵,比方说 open call, 比方说 ai 模型等等等等。有系列的话题。 他呢,就会看看哪些帖子现在比较火,或者是正在受到关注。然后呢,把整个的中文翻译和相关的数据都发到我这里来,包括原文的链接。如果我更感兴趣,希望用这个题材做一个视频,或者是有可能做一个视频呢,我只会点一个大拇指, 他就会进到我们的流程的。下一步就是他去研究这个帖子相关的背景信息,补充相关的背景信息给我,确保我了解这个事情的来龙去脉。那么如果这时候我再相关,我还觉得还是感兴趣,我再点一个拇指,他就会往下走,去研究怎么做这个封面图,或者给我一些脚本大纲的一些建议。 那么除此之外呢,如果我对一个帖子我不想做成视频,但它对我是有用的信息,我的时候可以点一下这个眼睛,它呢就会到我的收藏家里面去,可以看到。哎,这个帖子现在到我的收藏家里面去了,这里面就是我认为收集的比较重要的信息。除了 x 之外呢,它也会去搜索 youtube 和 hacker news, 看看每天大家都在讨论什么。这是我这样一个视频的辅助系统。我的第四个团队成员是潘大熊猫,他负责开发,他呢算是唯一一个几乎不休息的智能体。现在他有开发任务,但是当他没有开发任务的时候,他会增加测试,或者是自己去测试边缘情况,找 bug。 那 么关于二十四小时期,我特地特别想说明一下,想有好的效果,往往你需要用好的模型,如用云端的模型消耗 top, 二十四小时期会非常的贵。如果你用本地的模型呢,你大概需要买 max 九九,那么 也会造成非常贵。所以二十四小时成绩一定得是高价值的工作。对于我来说,开发是高价值的工作。除此之外,正在我现在正在做的还是有销售相关的,比方说做 seo, 或者是给我自己的产品做销售线索,找潜在客户。 我的第五个团队成员是 monkey 猴子,他只有一个作用,就是我丢给他一个视频链接,他把这个视频变成一个带截图的文章,因为我自己做视频,我希望重复利用自己的资源,这时候我给他我做过的视频,你可以看到他啊把相关的进行了截图,并且把整个视频脚本重写为可以发表的文章。 我的第六个团队成员,也是最后一个是 tiger 老虎,他负责安全和更新,他呢每天都会定期扫描一下有没有安全问题,然后有新的可以更新的版本也会通知我,我们一起讨论如果更新的话,会不会造成性能的退化和影响当前的任务。 那么如何创建一个新的 agent 呢?其实非常的简单,我们后来会看到整个 agent 的 结构,但是你完全不需要自己创立文件夹,最简单的方式就是跟你的主要的 agent 的 对话,让他帮你去创建。这里我们以 diagram 为例, 你通过 diagram 与你新的这个 agent 进行对话,这时候你可以告诉你主要的 agent, 你 跟他说,哎,新建一个 agent, 他 叫什么?他要做什么啊?有什么呢?任务最后呢,告诉他你新建的这个 diagram boat 这个 diagram 机器人的 token, 这 token 怎么获得呢?我们找到 boat father, 点击这个打开 boat father 的 app, 然后这里我们点击 create a new boat, 新建一个新的,然后这时候我们给他一个名字,比方说我们叫做 fox, 然后我们点击 create boot, 你 就会得到这个 tokin, 然后这里我们点击复制,然后我们回到这里来, 把我们的 tokin 复制上去,告诉我们的主要 agent, 那 它呢,就会自动帮你创建这样一个新的 agent, 新的智能体了。那么什么是 agent? opencloud 里面如何定义 agent? 它又是如何工作的呢? 其实啊,一共就分为三层,分别是全局层, agent 层以及 session, 也是对话现成层。我们首先看第一层,就是全局层, 它呢并不是一个 agent 独有的,而是所有 agent 共用的,可以理解为是公共设施。这一层最典型的文件就是点 opencloud 我 们的总文件夹下面的 opencloud 点这次文件,也就是总配置文件,大家可以打开看一下,里面有非常多重要的参数,包括 os, 也就是定义哪个大模型厂商,还有就是你的登录身份是什么? agents 定义有哪些 agent? 它的默认模型是什么?工作目录和运行参数是什么? tools 定义局的工具权限以及 agent 之间的调用规则。 bundings 定义什么来源的消息调用到哪一个 agent, 浏览器定义浏览器信息, chanel 定义 telegram, discord, 飞书等外部的渠道连接, gateway 定义网关, memory 定义记忆等等等等。可以看到 openclaw 点 json 文件,里面包含着 openclaw 最重要的参数配置。 其实啊,大部分情况下我们出现崩溃对话没有反应的情况,也是因为我们的 ai 去改 opencll 点 json 这个文件夹里的参数的时候改崩了,所以一个建议就是,哎,你告诉你的 opencll, 在 他改这个文件之前一定要提前通知你,而且改的时候一定要谨慎。 第二层是 agent 层,这才是每个 agent 自己的领地,每个 agent 啊都有自己的工作空间,系统数据会话记录。那么 workspace 里面每个 agent 文件夹下面的这些文件,在每个对话开始的时候都会被加载进去来作为这个 agent 的 上下文。 由于呢,不同 agent 这些文件有所不同,这也就决定了啊,这些被文件被加载进去的时候,里面携带的信息,包括啊,他的身份,他是谁,他的性格,他的对话方式,他的任务的不同。 那么这些文件呢,包括 agent 点 m d, 也就是这个 agent 的 工作说明书,它决定这个 agent 的 做事规则,优先级,边界,还有如何使用记忆。 so 点 m d, 就是 这个 agent 的 性格和说话方式,与其是什么风格,是什么,边界在哪里,由它来决定。 user 点 md 就是 这个 agent 对 用户的理解就是他在帮谁,对方是什么风格,应该怎么称呼,有什么偏好,要注意 identity 点 md 就是 这个 agent 的 身份卡,解决的是这个 agent 叫什么,是谁的问题。 to 点 md 是 工具说明书,告诉 agent 啊,本地有哪些工具命令,怎么约定项目里面有什么习惯? memory md 是 长期精华记忆,它不是流水上,而是提炼之后的长期信息。这个文件很重要,而 scales 里面就是这个 agent 专属的 scale, 如果和局的 scale 同名的呢,这里的优先级更高, 会覆盖大局。那么这些呢,都属于 agent 层,也就是说啊,不同的 agent 默认不共享这些文件,但是同一个 agent, 不 同的对话,不同的对话线程之间是共享这一套文件的。第三层是 session 层,这个层级啊,不是这个 agent 是 谁,而是这个 agent 当前在哪个窗口里面工作。 session 是 对话县城,怎么理解呢?比方说,当你在同一个 agent 和他对话,但是在不同 discord 里面的频道对话,或者是你先跟他在 telegram, 后跟他在 discord 对 话,这就是属于不同的县城,因为它们的渠道不同, 或者是就是你当前的对话,但是你打了命令 slash new 或者是 slash reset, 就 会开启这样一个新的县城,区别是 slash new 旧的对话还在,但是 slash reset 会清空上下文,重新开始这样一个对话界面。那么这一层最典型的文件就是在我们每一个 agent 的 下面 sessions 文件夹里面不同的 session 文件了, 也就是每个对话都有自己独立的这样一个文件来记录啊,不同的对话历史。也就是说同一个 agent 不 同 session 会共享 agent 层那一套的。我刚才说的 saw 点 md, 我 刚才说的 agent 点 md 等等那些 workspace 的 文件,但是不会共享竹字的聊天记录。 讲完三层结构,了解 agent 工作原理之后,下一个很重要的问题就是,哎,多个 agent 之间是如何协作的呢?在 open call 里面, agent 协作大体有两种方式,第一种就是固定分工,也就是我们刚才说到的多个独立的 agent, 各自有各自自己的 workspace, 有 自己的 session, 也是对话现场。 固定分工就是像搭一个长期团队,就像我展示的我的 agent 一 样,一个负责找资料,另一个负责写脚本,一个负责写代码,还有一个负责日常对话和汇总等等等等。他们每个人啊,都长期干自己的事情, 他们之间的工作啊,写作的方式可以通过触发的串联或者是并行,比如啊, agent a 搜完信息这里我在 disco 里面点个赞,后面的 agent b 就 会根据我点赞的这个内容去调研资料,去补充材料。 那么第二种就是临时拉 sub agent, 也就是子代理。子 agent 去干活,也就是 open club 的 sessions prom, 它呢会拉起一个隔离的啊。 sub agent prom, 也就是子代理的这样一个运行在独立的 session 对 话现场里面工作, 工作完之后再把结果传到我们当前的对话里面来,相当于临时叫了一个实习生或者是外包去隔壁的办公室工作,干完工作回来汇报。这样的好处就是当我们的子代理在独立的赛程里面工作的时候,他不影响我们当前对话的这个主位阵子,我们可以继续给他提问,继续跟他对话,两边同时进行。 那么官方文档对他的定位也很明确,就是他适合做研究,慢任务、重任务、病情任务,而且不会阻塞我们主对话。 比方说这里啊,我让他去用 sessions born 去开一个子任务,研究 open call 智能体最近最受欢迎的三个讨论点,要求每个讨论点的热度、原因,代表观点,以及我可以做视频用的切入角度,然后让他开始在后台启动,完成之后主动汇报结果, 好的,他已经启动了这个任务。其实这时候我们可以去跟他对话,比方说我问他今天天气怎么样, 他呢,还是会回答我们这个今天天气怎么样的任务,因为刚才我们也说了,子任务是在另外一个县城完成的,不耽误我们跟我们的主要的智能体之间的对话。可以看到他就是继续的跟着我们进行对话,他回答了我刚才的问题,然后我们可以继续提问,我说, 哎,可以看到我们等了一会之后,他终于是把这个任务完成,然后自己主动地把任务的结果发回到了我们的主要的频道。哎呀,没有影响我们刚才跟他这个主要频道主要的智能体之间的。对,不是所有任务都适合上多 agent, 如果只是一个短问题,那么一个 agent 往往更加有效,硬拆呢,只会让系统更重更慢。那么真正适合做 agent 的 场景啊,一般有这么几种,第一种就是你的任务天然就能拆开,比如啊,研究,写作,审核,发布,本来就是不同的角色,这时候拆 agent 有 不同的工作区的这种不同的文件边界会更加清楚。 第二个就是任务可以并行,有些事情呢,不需要排队,一个 agent 可以 查资料,另外一个可以同时整理结构。如果你用 sub agent 这种并行就很合适,那么刚才我们也说了,它很适合做这种比较重的或者重复性的工作。 第三个多 agent 呢,不只是为了分工,也是为了避免污染。因为啊,如果你用单 agent 做太多不同类型的任务,都会出现相互污染的情况,长期记忆呢,会把不该混的东西混在一起。因为我们也说了,工作区那些啊, markdown 文件是同一个 agent 在 不同聊天窗口里面共享的, 那么什么时候没必要用多个 agent 呢?那么很简单,要么就是你的任务很短,要么就是上下文高度连续,你不想打破,要么就是你角色的边界根本猜不清,就没必要拆。还有就是避免为了做 agent 而做 agent, 只是为了看起来很高级而已, 能一个做好的事情就一个做,就相当于是一个队伍,当一个任务需要一个团队来做的时候,那自然值得用团队。 那么关于多 agent, 为了达到好的效果,我想分享一下我自己得出的一些实践。第一个就是不要一上来,对于很多的 agent 可以 从一个开始,有必要就加第二个,比方说你第一个 主要的 agent 也是默认的 agent, 基础上你加一个研究 agent, 每天去搜索啊有价值的信息,定期汇报给你,那么先把这个逻辑跑顺出来,然后再根据你自己的业务再加一个,同样每加一个呢,都先跑顺功能验收效果。 第二个就是工作区的文件要尽量的短,尤其是 agent 点 m d, soft 点 m d, user 点 m d, 也就是心跳文件, 而因为这些文件都会进入 agent 的 运行上下文,如果太长的话会增加效果。考虑到你有多个 agent, 如果你不注意的话,那你的成本可能会成倍的增加。好的,以上就是今天的视频了,希望你也能开始搭建属于自己的 ai 团队,不要忘记点赞和关注,我们下期再见。

用 open cloud 的 朋友应该都知道聊天可以,但是一旦你认真跑多个 agent 自动化任务,定时触发任务的时候,问题就来了,你不知道现在发生了什么,不知道谁在执行,谁卡住了,谁在等,你, 不知道今天消耗了多少桃梗,也不知道后面有多少个定时任务正在排队,所以你知道 openclaw 很 强,但是你不知道它到底在干什么。为了解决这个问题啊,我做了这个 openclaw 的 控制中心,把所有分散的信息啊全都回收回来,让你一眼看到每个 agent 现在的状态,以及他们的人设文件,谁在工作,谁出了问题, 任务到底有没有在执行,以及今天的消耗是不是异常,所以我把它开源出来,你可以只拿去用,或者是你拿去改,按你自己的团队,你自己的工作流,你自己的审美继续定制。如果你也想让你的 openclaw 彻底告别黑河,千万别眨眼,我们马上开始。 你不需要你手动安装,最好就是让 openclaw 帮你安装,可以往下拉。我给大家准备了这样一个特别大的 pump, 根据你的环境,根据你的网关,根据你用的模型跟你的 agent, 根据你的情况来接入整个的控制中心,为你所用。这个过程不是一蹴而就的,每个人的环境都不一样,我们用的模型也不一样,但是呢,你可以让 open cloud 慢慢的 把这个软件调整到你最想要呈现的状态,尤其是展现你最想要看到的信息。首先第一个页面是总览,总览我只想说一个,就是这个健康分,大家可以看到现在是一百分,它由四个维度决定, 分别是审阅队列,就是有没有任务就卡住了,需要你人工审批才能继续进行。运行异常就是异常停滞执行,就是他在无效执行,他没有更新,他没有产出,但他一直在消耗着资源。预算风险就是有预算有没有达到当前的百分之八十 是扣分制,大概是每一项有一个问题就扣十八分,看到目前我没有问题。那么除此之外呢,其他的所有的信息在总栏里面都来自于我们左边栏啊,这些 信息的一些汇总。下一个是个特别实用的页面,就是看我们具体的用量,这里呢可以分为今天或者是累计的用量来看。对于我来说,因为我是订阅制嘛,所以具体的 talk 用量或者是估价对我来说都不重要,重要的就是有没有达到五小时和一星期的上限,这里呢也可以看到。 其次就是很重要的是我们需要看到到底是哪些类型的任务在消耗我们大部分的 talkin, 就 这时候啊,可以看到这个统计对于我来说是矿定时的任务消耗大部分 talkin, 其次是在 disco 里面对话给他的任务, 那么由于定时任务消耗了最大的 talkin, 那 么定时任务又有很多,到底哪一些任务消耗了更多的 talkin 呢?这还有一个继续的统计,对于我来说,消耗最多的就是这个在 x 上搜索情报的这样一个任务, 因为它每三个小时就要出发,就要去操作浏览器,在我的账号里面浏览相关信息,然后再汇总给我,所以它确实是消耗最多的, 那么你可以看到整个的所有消耗的任务,然后你可以根据它的用量进行一些优化,哪一些可以去掉,那么哪一些呢?是需要保留或者是继续再把它减轻的?那么下一个页面就是 agent 页面,里面就有所有的你的 agent 当前的状态,有没有工作,然后最近的产出,有没有排班儿 等等等等。那么关于我的呃 agent 团队每一个员工的工作去干什么呢?我在上个视频都说了,感兴趣的朋友大家可以去看一下,然后设置自己的 ai agent 的 团队。 那么这里还有一点我想说,就是往下拉,大家可以看到每一个 agent 它用的是什么模型,以及它的工作目录是怎么样的,还有它的权限是怎么样。下一个功能就是我们可以查看和修改任何 agent 的 记忆。 记忆呢,一共分为两种啊,一个是长期记忆,一个就是我们对话县城的对话记忆。我们还以 monkey 为例,那么这里 memory md 就是 猴子的长期记忆,看到这里我可以看到啊,然后这里我们也可以修改它的记忆, 那么拎任何的下面带 session 开头的就是对话记忆了,也可以查看和修改。每个 agent 都有自己的人设,自己的性格,自己的语气,自己的任务, 那么这些呢,也可以查看和修改,这就是我们点击这个文档页面,我们还是以 monkey 为例啊,之前讲多 agent 团队的时候,我们讲过 agent 点 m d 就 定义了这个 agent 的 任务,这里呢我们可以查看他的任务,然后呢,如果有不到的地方,我们可以直接进行修改, 同理呢,你也可以修改其他的 markdown 文件,比方说心跳啊, tools 等等等。最后一个功能就是看任务了,尤其是定时任务或者是心跳任务。这里我们点开我们的任务界面 左边的半截,我们可以看到一共有九个有效的定时或者心跳任务,其中三个已经在今天还要继续完成,而六个已经完成了,明天会接着继续。 那么右边的半截可以看到我们所有的心跳任务。好呢,这就是我自己为自己的 open class 做的控制面板了,希望你呢以它为起点,改变出你自己的风格,加入你自己想要的信息,或者是改变整个的排版。那么这期视频就到这里了,不要忘记点赞和关注,我们下期再见。