如何去看一个人达到什么样的段位?你就看以下这三点,第一,他敢做的事,如果说换做你,你敢不敢?如果你不敢,那就说明他比你有魄力,比你有能力,比你强。 第二,他思考的问题,你有没有同样的深度和广度,如果你没有,那他看问题的深度就值得你学习。第三,永远不要怀疑一个财富比你多的人,他的智商会比你低, 无论当时他的想法有多么的荒谬,一个维度比你高的人啊,他各个的方面都超越了你,在你眼里可能办的的事,那在别人的眼里可能就是小菜一碟。
粉丝84获赞1430

这期视频,我们聊聊怎么用 cloud 控制智能设备。控制智能设备,最关键的一步是拿到设备的控制权限。以小米温湿度计为例, 你想获取它的毒素,但小米并没有开放这类的接口,你很难获取。那怎么解决?这个时候, home assistant 就 派上了用场。 ha 是 一个开源的智能家居平台,它专门做了各大平台的设备集成,支持米家、苹果、 homekit、 涂鸦等一系列的主流设备。 它帮你把各个设备的协议进行的统一,你只需要授权给 ha, 就 能通过 ha 的 接口访问和控制所有设备。所以,而 oppo cloud 的 对接, ha 理论上就能通过 ha 控制所有的设备。但实际跑起来,问题很快就来了。我发现 oppo cloud 的 经常会遗忘我们对接的 ha 什么意思? 假如我问他房间的温度是多少,他不是去温湿度计去读取数据,而是走天气接口,甚至连地理位置都不对,这很离谱,对吧?在 open log 的 架构里, agent 采用的是 react 模式,先推理再行动。 当用户问温度是多少时,模型会先思考我该用什么工具。但问题来了,他并不知道自己有哪些设备可以用。 你说使用 home assistant 查看房间的温度,它能正确获取,但不加 h a 的 这个条件,它就开始自由发挥了。所以,当用户问温度的时候,模型一推理温度,我可以通过天气的 api 来获取,这并不是我们想要的结果。 而且在 h a 里面,一个设备往往会被分为多个实体,不同实体可能有类似的功能,这就更加容易造成查询的混乱。 那怎么解决?我想到了一个思路是,与其让 opcode 记住设备,不如让设备自己生命能力。 具体的做法是把每个设备分装成一个独立的 skill。 每个 skill 其实是有两部分核心内容的,第一部分是描述用自然语言告诉 agent 这个 skill 能做什么。第二部分是实现具体的调用逻辑,比如调用哪个 api, 跑什么脚本, 都不可傲的知道温湿度计是一个 skill, 并且他描述是读取温湿度的数据,他就明白用户问房间温度时,我就应该调用这个 skill。 而且根据 astropic 对 skill 的 设计, skill 的 使用是渐进式频读的。传统的其实是做法是把所有的信息一次性塞给大模型, 几十个设备偷看很浪费不说, aint 也容易被批量的信息搞晕。渐进式频读的好处时不主动加载所有 skill, 先用 skill 的 描述信息进行筛选,在需要时才动态加载 用户用温度才加载温湿度计的 skill。 问 pm 二点五才加载空气净化器的 skill, 这不仅节省 token, 还 a 技能的决策更加精准快速。 但如果我有十个二十个设备,难道手动一个个注册 skill 吗?这也太不优雅了。于是我又把这部分逻辑封装成了一个 h a manage skill, 由它来控制管理所有的子设备。 h a manage 的 核心能力有两点,第一个是自动发现设备, h a manager 会调用 homeworks 的 a p i 拉取所有的实体,然后根据设备的 id 将多个实体合并为一个设备,自动解析每个设备的能力。 第二,它自动生成 skill, 它会根据各个实体的功能自动生成对应的 skill 描述文件。这样的设计好处是不需要为每个设备写 skill, h a manager 根据规则和设备信息自动生成对应的 skill。 为了方便管理和共享,我为设备的 skill 单独建立了一个仓库, 这里有一个优先匹配的设计精确匹配模式,比如小米温湿度计。仓库里有这么一个 skill 模板,就用匹配的专用模板直接下载 skill, 后续 skill 有 优化迭代,就可以直接同步更新。 第二是动态生成兜底。假如没有匹配到的模板, h a manager 会根据实体的功能,结合预设的规则模板动态生成 skill 描述。说了这么多,那我们一起来实战一下吧。 安装过程呢,很简单,直接把 github 的 仓库地址发给 opencloud, 跟他说安装 opencloud 会自动根据引导完成配置,它会让你先输入 h a 的 访问地址和长令牌的 token。 整个过程呢,不需要手动配置任何设备,完全是自动化的。 我们来测试一下它的效果,现在房间的温度是多少,可以看到它能准确地找到设备并获取读数。 测试一下它的控制能力,把空气净化器开大一点,它很智能的将风扇调到了更快的转速。这就是我一点零版的 opencloud 的 设备控制方案。 核心逻辑其实很简单,设备不是被管理的对象,而是被声明的能力。把设备封装成 skill, 解决了一进的遗忘设备的问题,从而 h a manage 的 自动发现加动态生成,降低了多设备的管理成本。 当然,这个方案也可能有不少的问题,有不少的优化空间,权当抛砖引玉,期待和大家一起探讨更多的可能性。项目的具体地址呢?我已经放在了我的主页,如果你对 ai 自控感兴趣,欢迎关注我,我是习特胡,我们下期见。

我用 openclaw 实现了电商的自动上品流程,我从原来每天需要四个小时的上货流程,现在只需要五分钟,现在看到这个窗口是我日常上品的一个流程,找品、存图,新建商品,填入信息,然后一个品一个品,这样去操作。那我是怎么把这个步骤自动化的呢?先来看一下结果, 我现在的执行流程只需要打开飞书,因为我对接的是飞书这个通道,我只需要给龙虾发一句,开始执行自动上货流程,然后龙虾就会自动开始干活,他先会梳理一下这个干活的整个流程,大概分几个步骤,然后他就按步去执行,一直执行一个流程大概只需要三分钟不到,而且我的文件夹里面应该是有十三个商品的。 这个工作平时我们人工去做可能要花两个小时左右,现在就相当于无论我在哪里,只要我的电脑开着,我只需要跟我的飞叔说一句,开始执行自动上货流程,他就会自动跑完,然后告诉我已经 ok 了,所有的结果会放在我的桌面上,智能分组结果就是他帮我执行好的结果,所有的商品他帮我分好了组, 然后他又帮我把所有分好组的结果进行了一个压缩。那我最后上面的操作就是把这些压缩文件一键拖动到数据包导入就可以了。我从原来每天需要四个小时的上货流程,现在只需要五分钟。 那具体整个流程是怎么实现的呢?首先我需要做的工作是打开某多多的 app, 把我选中的商品去把这个商品的图片全部保存下来, 然后以及说这个商品的信息截图和价格尺码截图全部通过截图的形式和下载好的商品信息,这些图片混合起来,直接放到我电脑的这个桌面的文件夹就可以了。文件夹就是我保存下来所有我要上的商品,这里边会包含很多商品信息图, 然后还会包含很多的一个商品的价格和尺码图,因为这些我都是要一比一录入我的信息里边的。那可以看到我的这个大文件夹里面其实是不止一个商品,是很多组很多组商品。那么龙虾下一步就需要基于我这一个大文件夹去帮我进行智能的商品分组, 所以我把这些图片放到文件夹以后,下一步就看龙虾的操作了,那么它的执行步骤是什么呢?首先 第一步他需要打开我给他的这个文件夹,首先他需要基于我给他的一个大文件夹进行所有的图像识别,进行一些 使用一些算法将描述为同一个商品的图片归为一组,并且自动帮我分好组,可以看一下大概的结果是这样,所有相同的衣服会分为一个文件夹, 那么他帮我进行图片识别以后,非常精准的把所有描述同一个商品的图片都归为了一组。 第二步,它需要基于我提供给他的截图的那些信息,去提取对应的每一个商品的标题,价格、尺码和颜色,然后去自动录入表格。那最后一步,它会把它在过程中处理过的所有数据帮我生成一个校验表格, 方便我检查执行过程中是否出错,那整个环节就是龙虾帮我去做的,那这个质检验表格是什么意思呢?他会把他执行过程中所有处理过的数据信息帮我汇总到一个表格,这样我就很方便的去进行一个统一的预览,看一下哪个环节识别的信息,或者他执行的步骤有问题, 那我一眼就可以在这里看到。这个工作我只需要在飞书给他发一句指令,然后等他执行完之后,我打开这个教样表格,在表格里面快速去预览一下他所有的执行过程,有哪些数据错误了,或者分组错误了,我在这里可以快速的看到,然后再告诉他进行什么样的修正,这个工这个工作就完成了,是非常的方便。

二零二六年最火的 ai 工具是什么?是 open core, 一个二十四小时能帮大家干活的智能体。今天呢,迪姐就用最简单的方式和大家分享一下如何养一只属于自己的龙虾,让他成为我们的 ai 专属数字员工,从部署到训练到具体的场景应用, 全程干货,建议码住收藏不迷路哦。第一部分是我们使用前的准备,首先呢,开始养虾之前,我们需要准备三样东西,第一个呢是运行环境, 一台普通的电脑就可以了, windows, mac, linux 都可以,或者是租一台云服务器,但也非常建议大家可以用自己平常闲置的电脑去进行一些运行,因为还涉及到一些数据权限的问题。那第二个呢,就是 ai 模型的 api key, 这个是龙虾的大脑,新手比较推荐国内的模型,比如说像 mini max, kimi, 智普 ai, 免费额度多,而且访问速度也会比较的快,如果大家预算充足呢,也可以用 cloud 或者是 gpt, 能力会更强一些。 第三个就是打通的通信渠道,就是大家平时用的聊天工具,像 facebook 啊, telegram, discord 都可以,这个可以用来给龙虾去下具体的指令。准备好这三样,我们就可以准备开始了。 第二部分是三种的部署方案,大家可以根据自己的这个过去的呃,这个技术的一些基础和目前自身的一些需求去进行选择。 那第一种方式呢?是桌面一键安装最适合小白上手的客户端,呃,去进行网页的交互式的这个安装, 然后填入 api key, 绑定飞书或者是 telegram, 五分钟就可以搞定,而且零成本,然后上手都是交互型的界面,复杂度极低。那第二种方案就是云端的托管服务,这个呢是最省心的,比如说像 kimi claw 或者是 max claw, 直接在网页上点击部署,按月订阅,大概是呃一百九十九一个月不用管服务器, 七成二十四小时在线。那第三种方案呢,就是云服务部署,它是呃最灵活的一种方式,比较适合开发者和企业用户。租一台云服务器,然后用 docker 一 键启动 opencloud, 完全是自主控制的,数据的私密性高,成本大概是每个月两美刀起, 新手呢就建议从方案一开始熟悉之后再慢慢的去升级。那第三部分就是核心的配置了,部署呢是完成了第一步,接下来的配置是关键,这步决定了我们的龙虾员工是不是好用。第一步是身份录入,那这个是养的核心,我们需要通过对话去告诉龙虾,你是谁啊?你的身份是什么?你需要什么? 比如说我们会跟他讲,我是自媒体的内容创作者,日常需要你帮我整理资料,拷写出稿,管理日程,我习惯简洁直接回复,每一天上午九点向我汇报代办事项。以上内容请永远记住,这样龙虾就会有永久的记忆,越用就会越懂你,越知道你的诉求。 那第二步就是安装一些 skill 技能,就是龙虾的手脚决定它能干什么。那新手建议四个必备的安装技能。第一个呢就是 capability involver, 这个能让龙虾自己进行优化,越用越聪明。第二个就是 agent browser, 它能够操作浏览器,自动查信息,填表格。 第三个就是 summarize, 快 速总结 pdf 网页长文档。第四个就是 find skill, 需要新功能时让它自己去找, 在 clawhub 市场搜索这些技能的名字,一键安装就可以。第三步就是对接工作渠道,把龙虾接入到我们的飞书或者是 telegram。 以飞书为例,直接在飞书的开放平台创建企业自建应用, 开启机器人的权限,获取 app id 或者是 secret, 填入 open claw 配置页,就能够在飞书当中直接艾特你的小龙虾了。第四部分就是具体的使用场景示意, 配置完成之后呢,我们就可以像指挥员工一样去下达自然的语言指令了。第一个场景呢,就是办公的自动化,把我的邮箱里所有来自客户的未读邮件摘要整理成表格发到非书群里。第二个场景,信息处理 监控 abc 三个竞品和官网的社交媒体,每天下午五点给我一份动态摘要。第三个场景就是内容创作,根据我昨天整理的会议纪要,生成一份公众号推文的大纲,要求风格活泼。第四个场景就是定时任务了, 每周一早九点提醒我更新项目的周报。这些重复性的任务我们都可以交给龙虾,我们只需要专注创造性的工作。当然我们也需要注意一些事情,就是安全哈,务必设置以操作权限的白名单,避免执行一些特别危险的指令。就是还所以还是推荐比较用 docker 的 杀虾模式去去运行。 第二个就是控一下成本,其实因为如果按照 token 去计费的话,这个消耗还是挺大的,呃,或者是呃建议大家可以选择 maxclaw 这种固定式的订阅服务,也可以节省一些成本。第三个就是从简单开始,就是一次性,我们不需要装太多,从一个核心的需求,比如说像整理文件啊,然后 去解决一个子场景的一个小问题,一步一步去构建自己的这套体系。好啦,这就是二零二零年 openclaw 的 完整使用指南。 养虾呢,其实是一个持续部署和调优的过程,那后续迪姐也会在频道当中持续去更新 opencloud 安装部署,具体的呃使用场景等等相关的内容。如果大家感兴趣可以关注订阅迪姐的频道,我们就下一期视频,再见!拜拜!

你有没有想过,几十块钱就能拥有一个真正属于你自己的 ai 管家?不是那种挂在云端,每个月还要交订阅费的玩意,而是数据跑在你本地七层二十四小时永不下班重启啊,也不会失忆的那种。 你只需要通过这块 t 五 ai 开发板,配合 mini clock, 就 能快速拥有一个 ai 超级管家。为什么需要这样一个东西呢?因为你现在用的切来切去等各种的 ai 工具啊,它们都有一个共同问题,你问他一句话,他回你一句话就完了,他是被动的。今天我要介绍的这个方案完全不一样,叫 mini clock, 配合涂鸦 t 五 ai 开发板,拇指大小的芯片,几十块钱,插上 usb 供电,连上 wifi, 你 就有了一个部署在你自己硬件上的 ai 管家。 数据啊,全部存储在你自己的硬件上,没有月费,没有订阅,没有人能把它关掉。但更关键的是啊,不只是便宜和本地。首先啊,它是主动的传统 ai 工具啊,你不问它,它不动。 mini clock 不 一样,它内置的定时调度系统, 可以让 ai 自己设任务,每天早上八点钟给你发天气和代办,每隔三十分钟自动检查传感器数据,自己醒来自己执行,自己汇报, 你不催它,它自己会动,这才叫 ai 管家,不叫 ai 问答机。然后是常记咪咪可拉的所有对话内容啊,你的偏好,你的习惯,全部以纯文本存在本地芯片里, 断电重启照样记得清清楚楚,越用越懂。你这不是噱头啊,是真的在跑硬件控制啊,也是传统 ai 工具完全做不到的。咪咪可拉加上涂鸦 t 五 ai 开发板能读板载传感器能控 gpi 口, 你可以把它塞进 ai 台灯,根据你的指令啊,自动调光,塞进斗宠机前能感知宠物活动就自动触发互动。 塞进 ai 玩具,让原本死气沉沉的玩具啊,有记忆,有个性,真正开口说话,这背后啊是一个很重要的趋势。 ai 正在从大厂专利变成普通人都能拥有的东西,现在一颗拇指大小芯片变成普通人都能拥有的东西,不被平台留存,主动替你干活的 ai 管家。 好了,关于用涂鸦 t 五 ai 开发版跑 mini cloud 打造专属 ai 管家,今天就讲到这里,这里是智利家居情报局,关注我可以分享更多好玩有趣的 ai 硬件。

这是我用 openclaw 搭建的 ai 团队,他们各司其职,不用睡觉,能节省下非常多的时间,同时也做很多我一个人做不过来的事情。这期视频我想带你看一下我的 ai 团队到底长什么样,然后我们再一步一步搭建出属于你的 ai 团队。我们会讲如何创建一个 agent, 我们在 open cloud 里面,一个 agent 到底指的是什么? agent 之间如何相互协助,以及什么时候需要多个 agent 和最佳实践。好的,废话不多说,我们开始吧。我的团队里面一共六个选项题,其中四个是有定时任务的,就是每天的某个时刻都会触发他的任务,让他执行直到完毕,当然也可以随时跟他对话。 还有一个是几乎二十四小时期不间断工作的,还有一个最后一个,那就是你给他任务,他才会执行。第一个 agent 呢,是攻击 galk 啊,他每天负责给我情报工作,具体来说就是每天早上九点会提前搜寻 关于 ai agent 相关的技术的进展,产品进展以及用户的痛点。然后呢,把在网上搜寻的信息汇报给我。那么如果我不回答他,那就是明天继续给我相关的信息。如果我回答他,希望他对某一个话题进行深挖,那么他再去根据某一个话题再去搜索相关的信息为我展开。 那我的第二个 ai agent 是 auto 合理,它是我的私人助理和提醒助手,怎么用呢?我一般都是通过 diagram 跟它对话,这里我就不展示我跟它具体对话了,要涉及我的个人隐私。 一般来说,有任何的待做事项或者事情有着进展,我一般都会语音留给他,或者是打字告诉他,他都会记下来,某一单有问题就会问他,他都会翻出来告诉我待做事项是什么,事情到哪一步了, 同一次。同时呢,每天早上七点半,他都会告诉我今天的天气,然后今天要做什么,一步一步按重要性排序。它的作用就是完全替代笔记软件在我这里的作用。现在呢,我已经不用 notion 来记我事情,要做的事情,以及事情的进展了。 我的第三个团队成员,也是最重要的团队成员,就是 man, 一个狮子的形象。他呢,有最好的模型,有最高的权限,我主要用它来做两个功能,第一个就是日常的对话,我所有重要的对话,长期的计划都是跟他讨论的。 第二个就是一个视频流水线,帮助我制作视频。那么这个想法来自于一个叫做 alex finn 的 博主,本质上就是每隔几个小时,比方说我是每隔三个小时,他会去 x 上搜索我感兴趣的话题,比方说 ai 阵,比方说 open call, 比方说 ai 模型等等等等。有系列的话题。 他呢,就会看看哪些帖子现在比较火,或者是正在受到关注。然后呢,把整个的中文翻译和相关的数据都发到我这里来,包括原文的链接。如果我更感兴趣,希望用这个题材做一个视频,或者是有可能做一个视频呢,我只会点一个大拇指, 他就会进到我们的流程的。下一步就是他去研究这个帖子相关的背景信息,补充相关的背景信息给我,确保我了解这个事情的来龙去脉。那么如果这时候我再相关,我还觉得还是感兴趣,我再点一个拇指,他就会往下走,去研究怎么做这个封面图,或者给我一些脚本大纲的一些建议。 那么除此之外呢,如果我对一个帖子我不想做成视频,但它对我是有用的信息,我的时候可以点一下这个眼睛,它呢就会到我的收藏家里面去,可以看到。哎,这个帖子现在到我的收藏家里面去了,这里面就是我认为收集的比较重要的信息。除了 x 之外呢,它也会去搜索 youtube 和 hacker news, 看看每天大家都在讨论什么。这是我这样一个视频的辅助系统。我的第四个团队成员是潘大熊猫,他负责开发,他呢算是唯一一个几乎不休息的智能体。现在他有开发任务,但是当他没有开发任务的时候,他会增加测试,或者是自己去测试边缘情况,找 bug。 那 么关于二十四小时期,我特地特别想说明一下,想有好的效果,往往你需要用好的模型,如用云端的模型消耗 top, 二十四小时期会非常的贵。如果你用本地的模型呢,你大概需要买 max 九九,那么 也会造成非常贵。所以二十四小时成绩一定得是高价值的工作。对于我来说,开发是高价值的工作。除此之外,正在我现在正在做的还是有销售相关的,比方说做 seo, 或者是给我自己的产品做销售线索,找潜在客户。 我的第五个团队成员是 monkey 猴子,他只有一个作用,就是我丢给他一个视频链接,他把这个视频变成一个带截图的文章,因为我自己做视频,我希望重复利用自己的资源,这时候我给他我做过的视频,你可以看到他啊把相关的进行了截图,并且把整个视频脚本重写为可以发表的文章。 我的第六个团队成员,也是最后一个是 tiger 老虎,他负责安全和更新,他呢每天都会定期扫描一下有没有安全问题,然后有新的可以更新的版本也会通知我,我们一起讨论如果更新的话,会不会造成性能的退化和影响当前的任务。 那么如何创建一个新的 agent 呢?其实非常的简单,我们后来会看到整个 agent 的 结构,但是你完全不需要自己创立文件夹,最简单的方式就是跟你的主要的 agent 的 对话,让他帮你去创建。这里我们以 diagram 为例, 你通过 diagram 与你新的这个 agent 进行对话,这时候你可以告诉你主要的 agent, 你 跟他说,哎,新建一个 agent, 他 叫什么?他要做什么啊?有什么呢?任务最后呢,告诉他你新建的这个 diagram boat 这个 diagram 机器人的 token, 这 token 怎么获得呢?我们找到 boat father, 点击这个打开 boat father 的 app, 然后这里我们点击 create a new boat, 新建一个新的,然后这时候我们给他一个名字,比方说我们叫做 fox, 然后我们点击 create boot, 你 就会得到这个 tokin, 然后这里我们点击复制,然后我们回到这里来, 把我们的 tokin 复制上去,告诉我们的主要 agent, 那 它呢,就会自动帮你创建这样一个新的 agent, 新的智能体了。那么什么是 agent? opencloud 里面如何定义 agent? 它又是如何工作的呢? 其实啊,一共就分为三层,分别是全局层, agent 层以及 session, 也是对话现成层。我们首先看第一层,就是全局层, 它呢并不是一个 agent 独有的,而是所有 agent 共用的,可以理解为是公共设施。这一层最典型的文件就是点 opencloud 我 们的总文件夹下面的 opencloud 点这次文件,也就是总配置文件,大家可以打开看一下,里面有非常多重要的参数,包括 os, 也就是定义哪个大模型厂商,还有就是你的登录身份是什么? agents 定义有哪些 agent? 它的默认模型是什么?工作目录和运行参数是什么? tools 定义局的工具权限以及 agent 之间的调用规则。 bundings 定义什么来源的消息调用到哪一个 agent, 浏览器定义浏览器信息, chanel 定义 telegram, discord, 飞书等外部的渠道连接, gateway 定义网关, memory 定义记忆等等等等。可以看到 openclaw 点 json 文件,里面包含着 openclaw 最重要的参数配置。 其实啊,大部分情况下我们出现崩溃对话没有反应的情况,也是因为我们的 ai 去改 opencll 点 json 这个文件夹里的参数的时候改崩了,所以一个建议就是,哎,你告诉你的 opencll, 在 他改这个文件之前一定要提前通知你,而且改的时候一定要谨慎。 第二层是 agent 层,这才是每个 agent 自己的领地,每个 agent 啊都有自己的工作空间,系统数据会话记录。那么 workspace 里面每个 agent 文件夹下面的这些文件,在每个对话开始的时候都会被加载进去来作为这个 agent 的 上下文。 由于呢,不同 agent 这些文件有所不同,这也就决定了啊,这些被文件被加载进去的时候,里面携带的信息,包括啊,他的身份,他是谁,他的性格,他的对话方式,他的任务的不同。 那么这些文件呢,包括 agent 点 m d, 也就是这个 agent 的 工作说明书,它决定这个 agent 的 做事规则,优先级,边界,还有如何使用记忆。 so 点 m d, 就是 这个 agent 的 性格和说话方式,与其是什么风格,是什么,边界在哪里,由它来决定。 user 点 md 就是 这个 agent 对 用户的理解就是他在帮谁,对方是什么风格,应该怎么称呼,有什么偏好,要注意 identity 点 md 就是 这个 agent 的 身份卡,解决的是这个 agent 叫什么,是谁的问题。 to 点 md 是 工具说明书,告诉 agent 啊,本地有哪些工具命令,怎么约定项目里面有什么习惯? memory md 是 长期精华记忆,它不是流水上,而是提炼之后的长期信息。这个文件很重要,而 scales 里面就是这个 agent 专属的 scale, 如果和局的 scale 同名的呢,这里的优先级更高, 会覆盖大局。那么这些呢,都属于 agent 层,也就是说啊,不同的 agent 默认不共享这些文件,但是同一个 agent, 不 同的对话,不同的对话线程之间是共享这一套文件的。第三层是 session 层,这个层级啊,不是这个 agent 是 谁,而是这个 agent 当前在哪个窗口里面工作。 session 是 对话县城,怎么理解呢?比方说,当你在同一个 agent 和他对话,但是在不同 discord 里面的频道对话,或者是你先跟他在 telegram, 后跟他在 discord 对 话,这就是属于不同的县城,因为它们的渠道不同, 或者是就是你当前的对话,但是你打了命令 slash new 或者是 slash reset, 就 会开启这样一个新的县城,区别是 slash new 旧的对话还在,但是 slash reset 会清空上下文,重新开始这样一个对话界面。那么这一层最典型的文件就是在我们每一个 agent 的 下面 sessions 文件夹里面不同的 session 文件了, 也就是每个对话都有自己独立的这样一个文件来记录啊,不同的对话历史。也就是说同一个 agent 不 同 session 会共享 agent 层那一套的。我刚才说的 saw 点 md, 我 刚才说的 agent 点 md 等等那些 workspace 的 文件,但是不会共享竹字的聊天记录。 讲完三层结构,了解 agent 工作原理之后,下一个很重要的问题就是,哎,多个 agent 之间是如何协作的呢?在 open call 里面, agent 协作大体有两种方式,第一种就是固定分工,也就是我们刚才说到的多个独立的 agent, 各自有各自自己的 workspace, 有 自己的 session, 也是对话现场。 固定分工就是像搭一个长期团队,就像我展示的我的 agent 一 样,一个负责找资料,另一个负责写脚本,一个负责写代码,还有一个负责日常对话和汇总等等等等。他们每个人啊,都长期干自己的事情, 他们之间的工作啊,写作的方式可以通过触发的串联或者是并行,比如啊, agent a 搜完信息这里我在 disco 里面点个赞,后面的 agent b 就 会根据我点赞的这个内容去调研资料,去补充材料。 那么第二种就是临时拉 sub agent, 也就是子代理。子 agent 去干活,也就是 open club 的 sessions prom, 它呢会拉起一个隔离的啊。 sub agent prom, 也就是子代理的这样一个运行在独立的 session 对 话现场里面工作, 工作完之后再把结果传到我们当前的对话里面来,相当于临时叫了一个实习生或者是外包去隔壁的办公室工作,干完工作回来汇报。这样的好处就是当我们的子代理在独立的赛程里面工作的时候,他不影响我们当前对话的这个主位阵子,我们可以继续给他提问,继续跟他对话,两边同时进行。 那么官方文档对他的定位也很明确,就是他适合做研究,慢任务、重任务、病情任务,而且不会阻塞我们主对话。 比方说这里啊,我让他去用 sessions born 去开一个子任务,研究 open call 智能体最近最受欢迎的三个讨论点,要求每个讨论点的热度、原因,代表观点,以及我可以做视频用的切入角度,然后让他开始在后台启动,完成之后主动汇报结果, 好的,他已经启动了这个任务。其实这时候我们可以去跟他对话,比方说我问他今天天气怎么样, 他呢,还是会回答我们这个今天天气怎么样的任务,因为刚才我们也说了,子任务是在另外一个县城完成的,不耽误我们跟我们的主要的智能体之间的对话。可以看到他就是继续的跟着我们进行对话,他回答了我刚才的问题,然后我们可以继续提问,我说, 哎,可以看到我们等了一会之后,他终于是把这个任务完成,然后自己主动地把任务的结果发回到了我们的主要的频道。哎呀,没有影响我们刚才跟他这个主要频道主要的智能体之间的。对,不是所有任务都适合上多 agent, 如果只是一个短问题,那么一个 agent 往往更加有效,硬拆呢,只会让系统更重更慢。那么真正适合做 agent 的 场景啊,一般有这么几种,第一种就是你的任务天然就能拆开,比如啊,研究,写作,审核,发布,本来就是不同的角色,这时候拆 agent 有 不同的工作区的这种不同的文件边界会更加清楚。 第二个就是任务可以并行,有些事情呢,不需要排队,一个 agent 可以 查资料,另外一个可以同时整理结构。如果你用 sub agent 这种并行就很合适,那么刚才我们也说了,它很适合做这种比较重的或者重复性的工作。 第三个多 agent 呢,不只是为了分工,也是为了避免污染。因为啊,如果你用单 agent 做太多不同类型的任务,都会出现相互污染的情况,长期记忆呢,会把不该混的东西混在一起。因为我们也说了,工作区那些啊, markdown 文件是同一个 agent 在 不同聊天窗口里面共享的, 那么什么时候没必要用多个 agent 呢?那么很简单,要么就是你的任务很短,要么就是上下文高度连续,你不想打破,要么就是你角色的边界根本猜不清,就没必要拆。还有就是避免为了做 agent 而做 agent, 只是为了看起来很高级而已, 能一个做好的事情就一个做,就相当于是一个队伍,当一个任务需要一个团队来做的时候,那自然值得用团队。 那么关于多 agent, 为了达到好的效果,我想分享一下我自己得出的一些实践。第一个就是不要一上来,对于很多的 agent 可以 从一个开始,有必要就加第二个,比方说你第一个 主要的 agent 也是默认的 agent, 基础上你加一个研究 agent, 每天去搜索啊有价值的信息,定期汇报给你,那么先把这个逻辑跑顺出来,然后再根据你自己的业务再加一个,同样每加一个呢,都先跑顺功能验收效果。 第二个就是工作区的文件要尽量的短,尤其是 agent 点 m d, soft 点 m d, user 点 m d, 也就是心跳文件, 而因为这些文件都会进入 agent 的 运行上下文,如果太长的话会增加效果。考虑到你有多个 agent, 如果你不注意的话,那你的成本可能会成倍的增加。好的,以上就是今天的视频了,希望你也能开始搭建属于自己的 ai 团队,不要忘记点赞和关注,我们下期再见。

千万别一上来就给你的 openclaw 大 龙虾街上最顶级的 ai 模型!我们群里有个朋友刚装好 openclaw, 兴奋的跑了一晚上定时任务, 早上一看 api 账单直接扣了五百多块钱,心痛的差点把电脑砸了。为什么会这么烧钱呢?你要知道,大龙虾和普通的聊天 ai 完全不一样, 大龙虾在你睡觉的时候也在持续的吃粮食,吃蒜粒,你的精肺在不断的燃烧,原因是他的心跳机制,每隔几十分钟,他就要在后台自我思考一下我现在该干嘛。如果你连他发个呆,查个日程都用 colo 的 opus 或者 gmp 五这种顶级的大脑的话, 那简直就是在用高射炮打蚊子,钱全烧在无效的运转上面。今天教你一招我独家的穷鬼配置套餐,能够把大龙虾一天的运行成本压缩到十块钱以内。秘诀就四个字, 高低搭配。大龙虾日常的巡逻、收发消息、整理文件,这些低端的工作的智能体验,你就给他配置国产模型,比如 deep sea, 或者节约行程,速度极快,几百万托克呢,也就一瓶水的钱,这样子大龙虾连续工作七天,也就一个外卖的钱啊,非常划算。 只有当大龙虾遇到复杂任务或者做深度决策的时候,通过配置路由,让它自动去调用 cloud 四点五这种顶尖的模型。这样子搞下来,你的 ai 既有顶级架构师的脑子,又有廉价打工人的执行力。 这套大龙虾高低配路由配置文件我已经写好给测试跑通了,你拿过去直接复制替换掉原来的设置就行。老规矩,在评论区留下一句大龙虾,我后台直接发给你,关注江无为,带你花最少的钱,养最强的黑员工。

最近这个 openclock 非常的火,然后我也是安装来玩了一下,然后我用它来控制呃,我家里面的这个 home assistant 的 智能家居系统, 然后除了可以控制我家的智能家居,然后例如,呃,开关灯呐,播报啊,就是控制我家小爱音响播报或者控制其他的开关之外,呃,我这里给他一个任务,就是统计我今天的这个房间的温湿度变化,还有用电情况。他完成之后就给了我一个这样的表格,感觉还是挺厉害的。挺好玩的 啊,完全是他自己完成的这样的一个表格,感觉做的也是挺好看的。然后面我也在想啊,有没有其他好玩的项目,我想到的话也可以做出来的。