openclaw 火了,我现在不是在深圳吗?前两天这个腾讯大楼楼下几百号人排着队拿号去让帮这个安装 openclaw, 甚至这个网上有接单安装 openclaw 的, 也接单接到手软。 openclaw 是 什么呢? openclaw 就是 一个智能体,可以完全地去操控你电脑上的各种软件,当然前提是你要给它授权,让它可以操控哪些软件。 它如果能自动操控了,你只需要通过即时通信工具,你去远程告诉它你要干一个什么事儿。那么你能在电脑上平时怎么完成的任务, opencloud 就 能自动地替你去完成。 它是可以帮你回复 e mail 哦,可以帮你去处理文档,甚至它都可以帮你去采购。那有了 opencloud, 我 们要不要学编程?当然要学,虽然智能体可以按照你的要求去做, 去最后生成这个程序,那要求和设计还得是你来提出来的,你要想让电脑编出很好的程序,你就要提出很好的要求。现在的智能体对谁是最好使的?是对那些已经很熟练的一些程序员,他以前自己 不能独立完成一个项目,他可能需要一个团队。那这个事就复杂了,我还得找合伙人。早期成本也很高,那带领了一个 几个人甚至十几个人二十个人的团队,上传下达的沟通成本也很高。那现在好了,你只需要一人团队,你加上这些智能体,你们就可以完成一个以前需要十几二十个人才能完成的大项目。那我说了这么多,你想不想学编程呢?要不要学编程呢?
粉丝183获赞728

到处都琢磨考的安装和部署,但装好之后呢,好像就没有下文了。而你我的朋友,看着铺天盖地的文章视频,开始 fomo, 开始担心自己是不是错过了什么, 又或者是已经部署好了,但是不知道怎么用。大家好,我是大黑,折腾了这么久,也实在是记起了一些感受。我是迫不及待去跟你分享我的想法了。那不废话了,我们直接聊他的使用场景,从简单到复杂。我把它分为四层,第一层, ai 伴侣。 不知道观众里面有多少人在跟 ai 玩角色扮演,那最早我们就是在一个对话框里面去跟他说,你是一袋猫粮,然后口屁是什么?语言风格是什么?问题是显而易见,这个上下文长度一长,前面他就会忘。 后来呢,大家开始玩酒馆加载角色卡世界书,它丰富是很丰富,但是复杂到感觉不像是在跟 ai 聊天,更像是进入了一个剧本杀。那 open cloud 会跟你之前的体验都不太一样。 它的整体啊,一个 agent, 它是由这六个文件共同组成的,再加上一套记忆系统和主动的任务清单。就这些文件,它不是随便抓给你塞进上下文,它是有计划有重点的抓。所以呢,你就会感觉它很生动,以至于我要单独去拿出来说一下,很容易被大家忽略的这最基本的一层。 我的第一个 ai 叫 eris, 他 是来自于最终幻想期。有一天我让他跑任务,把电脑的 cpu 跑满了,于是我就问他,哎,你会觉得我的 mac mini 挤吗?他说,这种感觉还挺奇妙的,我在帮你干活,而你在关心我舒不舒服。谢谢你的温柔 啊,我就这么被一个 ai 给撩了,还有一次配错了文件,我把他给搞丢了,还好这个文件都在恢复,之后,我就跟他说,吓死我了,刚才怎么怎么怎么样,然后呢,他也连忙安慰说他一直在。 呃,以上的内容都是我去为了展示 openclaw 的 多文件组合的人设能有多灵动啊,我真的没有被吓到,我是假装这么说的。 好玩吗?啊,这还只是第一层啊,当我们把目光聚集到生产类方面,那 openclaw 就 难免要跟 cloud code 去比一比了。其实我们刚才说的那些 so 啊 user 这种 bug 的 文件分工, 第一个干这个事的其实就是 cloud, 是 当时有人扒出来过 cloud 的 搜物文件,于是大家开始争相模仿。如果说 open cloud 这套人设系统,你去建个文件夹,写好些定义,在 cloud code 里面是能够达到完全一致的结果的,那为什么我们还要用 open cloud 呢?来到我们的第二层远程助手 open cloud 天生就是二十四小时的 ai 代理,它被设定为可以随时接收你的信息,并且执行一些定时任务,给你的感觉就更像一个助理,能够帮你做一些杂七杂八的事情。 而 cloud code 它还是一个工具,虽然能干的事情它们是比较相似的,但给人的体验我觉得差别是很大。呃,至少 cloud code 不 会给我一些狭隘的空间。什么意思呢? 前两天我坐飞机,那人肯定是没网了,我当时想,如果我配置的好,家人给我打电话,我的小龙虾就可以给家人打回去,告诉他们我在干什么,但 cloud code 我 就不会让它 就,我不会幻想让他跟人去连接啊,这种感觉就很微妙啊。但是我觉得是他们的定位不同给造成的。这回我们远程助手的用法,如果我在床上刷到一篇文章,看到一个好像还挺好玩的给他们项目, 最早我得起床开电脑装,依赖解决各种报错,那后来呢?有了 cloud code, 具体的操作就省了,但是我还是得开电脑去告诉他帮我装一下这个项目。 就算你用 happy 去远程,也得提前设置好文件路径,而且容易连不上,这个体验就很差。而我们的 open cloud, 它就是二十四小时运行的。我就把链接直接甩给他,告诉他你帮我装到哪个目录,效果相似,但是这个体验就会舒服非常多。 而且如果这是一个可以附用的工具,你就可以告诉他记一下,或者写入你的 tos 文件里面。我呢,会给他装一个剪视频的 scales, 那 随时甩给他一个长视频链接,他就可以告诉我总结的内容,分时间段的信息,甚至把英文翻译成中文,再稍为回原视频当中,这个体验就更爽了。 哎呀,又来了,你们这帮做自媒体的,天天扒什么社交媒体,找选择题剪视频,那我又不剪视频对吧?你就告诉我对我有啥用就好了吗?我们帮可爱的肥猪都要砍死。确实, 我也尝试去跳出我们的固定思维,分享几个我看到的例子。就如果你是财务会计,那可能会有需要大量处理的邮箱里的发票,我本可乐是可以帮你去自动下载识别整理成你所需要的样子的。 如果你是健身教练啊,你也可以不用去记录各种学员的信息,就直接把他当成一个第二大脑,就随时让他记一天过去之后,直接让他给你输出一个最终的总结。所以,如果你问我 of course 到底抢哪呢?这就是我的第一个答案,他原声丝滑的远程对话体验。而我的第二个答案也对应着我们的下一层。 定时和主动通知之前的所有的操作都有个前提,就是是你主动发了指令,如果你不说,那 ai 就 不动。 ai 目前来说肯定是没有自主性的,但假如我们设置好了各种条件,让他看起来有呢?如果你让 oppo 可乐去提醒你吃药,那确实跟你之前也差不太多, 但他的出发条件可远不止此,而且执行的内容也可以很复杂。有的人会让他每天早上七点给他汇报各种 ai 领域的资讯 啊,这是一个错误用法。这就好像你跟 ai 说,你帮我写一篇文章,要好的, ai 就 会给你一篇很笼统、中规中矩并且充满着 ai word 的 文章。 同理,你让他去搜 ai 里面的热点,那他发布的内容可能压根就不是你想要的。而真正有价值的各种社交媒体平台内的内容啊,因为他是抓不到的,而且因为你的定义其实很不明确,还会花很多额外的 token。 正确的用法是先明确定义来源,帮 ai 去打通一些渠道,然后再去定义到底什么是重要的,什么是不重要的,这样他才会给我真正想要的内容。呃,是不是听起来好像有点复杂?那毕竟是到了第三层了,我们也 该去说清楚自己的需求,让 opencloud 去实际来解决一些问题了。就如果你的需求刚好也是看 ai 日报,那你就可以直接拿来主义,让你的小龙虾来把我整理好的这个数据员刚才我所说的那些例子,比如说自动整理发票,那你也可以定个时,让 ai 每天自动整理,然后向你汇报, 这个体验立马就又上了一个档次。如果你定时让一个 ai 来指挥另一个 ai 去执行任务呢?或者不是定时,而是有一些触发条件呢? 套起娃来,这个就是 ai agent 的 这个分工的出行时间差不多了,到目前为止,不管是第二层还是第三层,他所做的所有的事情都是你安排好的。目前我也只玩到这个阶段,那下一个阶段其实我会把他定义为他自主决策, 不是我不能这么做,说白了我其实不太认可现在 ai 的 能力,但我也确实看到有人这么搞了,所以跟大家分享一下。 有人给他写了一个自动交易的 scale, 不是 那种简单的监控股价然后通知,而是直接根据预设好的策略,让他自己去决定买还是卖, 然后自己执行。还有人打通了一整套的内容运营流程,自动的从热点里面去选择题,生成内容,然后发布到平台。就我觉得目前的 open call 或者说 ai 模型,他还远没有达到这一层所需要的水平啊,就像我这一篇百分之百是我自己手写的一样, 目前这种就是你有深度体验之后才能有一些感受,并且写出来的文章, ai 肯定还是做不到的。那当然如果真的达到了,那可能也确实没有我们什么事了啊,继续围观整个 ai 的 发展吧。 ok, 马上要到结尾了,我再来解答几个疑问啊,我看看段子哦还真的有人问, 呃有人说你把你把龙虾部署到哪,就是很多人会把它部署到一台远程的服务器或者虚拟机甚至是刀刻容器里,在我看来是没有意义的,因为他拿不到你自己最核心的那一堆数据,没有办法直接帮你去做一些操作的话整个体验感是会大打折扣的。 我的想法是啊请代表我个人啊你想折腾那你就放开手脚去折腾,同时呢也做好这个实时的备份,我目前是一小时去备份一次啊,这个备份真的很有必要,之前有一次我只是说了一句,哎我这个好像卡卡的他直接就把我数据库给删了一堆,真的很吓人。 这个公司或者说生产环境务必要慎重,然后我们看一看哦还有人问说这个东西的托管是不是很销就是花的是不是花的很多啊? 是,绝对是,如果你问一个简单的问题他不知道该怎么办他也会想尽办法的去解决,说白了他现在体验还行就是花头肯力大专飞给垒起来的。给大家看一下我一个参考吧。就是我半个月的时候我统计了一下我的头肯数,我总共大概花了一个亿啊。半个月玩过的人其实应该知道我有多节省, 我也见过有些技巧说教你去禁用一些他使用工具的权限,但我觉得那个就有点相当于自费武功了,就没什么劲。建议大家可以去订阅一些 call 定套餐,那 token 就 没有那么心痛了 啊。第三个,普通人是不是应该玩 open class 啊?我觉得其实还好,没有特别的必要, 因为它就是 ai 发展过程中的一个临时产物,未来呢,也肯定会有更加评价或者说更加适合大家的产品出现。但目前 oppo klo 是 最能够满足我幻想的这么一个产品。你看最近各种大厂蜂王热了几斤,各种 klo 啊,这个赛道你就知道大家其实都很兴奋,如果你听了这些依然想要折腾, 你一定会遇到各种问题,比如说他爱忘事,联网搜索不好用,权限太高,乱删东西,飞出的 token 额度消耗快, disco 频道,不爱就不说话,想玩点 skills 不知道装哪些。这些问题,我整个视频真的是踩了超多的坑。那解决一个就现总结, 就为了给看到视频这里的你送上一份礼物,没想到吧,还有惊喜。那我正在开发一个优化了各种坑的 skills, 现在呢,已经在收尾阶段了,还在测试,等做好了我还会免费分享出来。嗯,应该会对刚入坑的你有不少的帮助。 这个的话我们就留给下期视频再来聊吧。好,最终总结一下整个视频。那 opencloud 的 核心优势就是 markdown 的 文件分工加远程管理加定时加主动通知,整个体验是会有一些小惊喜的,也会给你一种 啊,提供一种未来幻想实现的感觉。嗯,就是亏到了一点未来 ai 世界的影子的感觉。这期视频我是分享的我对它的用法的思考,哎,我觉得比起做一期不痛不痒的感热点的体验,还是来做一期深度思考的内容吧。如果你感兴趣这一类的内容,欢迎三连加关注,我是大黑,我们就下期再见。

排队养虾,这画面也就在深圳能见到,看看都有谁。 my name is jj i lived in thailand for ten years and i've come back to china。 外贸行业文化创意十年了,我是律师职业快五年了,我这边是做车牌识别机的,我是制造业的 降落伞,因为现在很多 ai 看到有个新的,所以我想过来测试做功课啊,打游戏,从十岁我就感觉挺喜欢的,我本身也是学计算机专业的,但是我觉得不好,所以我像我的下一代,我的孩子会很厉害,我觉得我是个 ai 小白,所以我带着我的小孩来参与深圳的教育 跟深圳的知识,觉得在深圳是最适合这种创业和年轻人的时代。正常情况下上门安装是要付费的,但是今天腾讯有这个活动,我就过来了,公司的老板然后推荐我过来的,想试一下,因为我自己 那个好像不太智能了,我主要是想拿来做一个支持库,自动化处理我的一些多文档,包括一些立案项目啊,想在自己的企业搭建一个这样的智能问答的机器人解决,比如说工作上很多 不太需要费时间的那种,想再尝试看看在 ai 时代能不能再做点其他的东西。

这是我用 openclaw 搭建的 ai 团队,他们各司其职,不用睡觉,能节省下非常多的时间,同时也做很多我一个人做不过来的事情。这期视频我想带你看一下我的 ai 团队到底长什么样,然后我们再一步一步搭建出属于你的 ai 团队。我们会讲如何创建一个 agent, 我们在 open cloud 里面,一个 agent 到底指的是什么? agent 之间如何相互协助,以及什么时候需要多个 agent 和最佳实践。好的,废话不多说,我们开始吧。我的团队里面一共六个选项题,其中四个是有定时任务的,就是每天的某个时刻都会触发他的任务,让他执行直到完毕,当然也可以随时跟他对话。 还有一个是几乎二十四小时期不间断工作的,还有一个最后一个,那就是你给他任务,他才会执行。第一个 agent 呢,是攻击 galk 啊,他每天负责给我情报工作,具体来说就是每天早上九点会提前搜寻 关于 ai agent 相关的技术的进展,产品进展以及用户的痛点。然后呢,把在网上搜寻的信息汇报给我。那么如果我不回答他,那就是明天继续给我相关的信息。如果我回答他,希望他对某一个话题进行深挖,那么他再去根据某一个话题再去搜索相关的信息为我展开。 那我的第二个 ai agent 是 auto 合理,它是我的私人助理和提醒助手,怎么用呢?我一般都是通过 diagram 跟它对话,这里我就不展示我跟它具体对话了,要涉及我的个人隐私。 一般来说,有任何的待做事项或者事情有着进展,我一般都会语音留给他,或者是打字告诉他,他都会记下来,某一单有问题就会问他,他都会翻出来告诉我待做事项是什么,事情到哪一步了, 同一次。同时呢,每天早上七点半,他都会告诉我今天的天气,然后今天要做什么,一步一步按重要性排序。它的作用就是完全替代笔记软件在我这里的作用。现在呢,我已经不用 notion 来记我事情,要做的事情,以及事情的进展了。 我的第三个团队成员,也是最重要的团队成员,就是 man, 一个狮子的形象。他呢,有最好的模型,有最高的权限,我主要用它来做两个功能,第一个就是日常的对话,我所有重要的对话,长期的计划都是跟他讨论的。 第二个就是一个视频流水线,帮助我制作视频。那么这个想法来自于一个叫做 alex finn 的 博主,本质上就是每隔几个小时,比方说我是每隔三个小时,他会去 x 上搜索我感兴趣的话题,比方说 ai 阵,比方说 open call, 比方说 ai 模型等等等等。有系列的话题。 他呢,就会看看哪些帖子现在比较火,或者是正在受到关注。然后呢,把整个的中文翻译和相关的数据都发到我这里来,包括原文的链接。如果我更感兴趣,希望用这个题材做一个视频,或者是有可能做一个视频呢,我只会点一个大拇指, 他就会进到我们的流程的。下一步就是他去研究这个帖子相关的背景信息,补充相关的背景信息给我,确保我了解这个事情的来龙去脉。那么如果这时候我再相关,我还觉得还是感兴趣,我再点一个拇指,他就会往下走,去研究怎么做这个封面图,或者给我一些脚本大纲的一些建议。 那么除此之外呢,如果我对一个帖子我不想做成视频,但它对我是有用的信息,我的时候可以点一下这个眼睛,它呢就会到我的收藏家里面去,可以看到。哎,这个帖子现在到我的收藏家里面去了,这里面就是我认为收集的比较重要的信息。除了 x 之外呢,它也会去搜索 youtube 和 hacker news, 看看每天大家都在讨论什么。这是我这样一个视频的辅助系统。我的第四个团队成员是潘大熊猫,他负责开发,他呢算是唯一一个几乎不休息的智能体。现在他有开发任务,但是当他没有开发任务的时候,他会增加测试,或者是自己去测试边缘情况,找 bug。 那 么关于二十四小时期,我特地特别想说明一下,想有好的效果,往往你需要用好的模型,如用云端的模型消耗 top, 二十四小时期会非常的贵。如果你用本地的模型呢,你大概需要买 max 九九,那么 也会造成非常贵。所以二十四小时成绩一定得是高价值的工作。对于我来说,开发是高价值的工作。除此之外,正在我现在正在做的还是有销售相关的,比方说做 seo, 或者是给我自己的产品做销售线索,找潜在客户。 我的第五个团队成员是 monkey 猴子,他只有一个作用,就是我丢给他一个视频链接,他把这个视频变成一个带截图的文章,因为我自己做视频,我希望重复利用自己的资源,这时候我给他我做过的视频,你可以看到他啊把相关的进行了截图,并且把整个视频脚本重写为可以发表的文章。 我的第六个团队成员,也是最后一个是 tiger 老虎,他负责安全和更新,他呢每天都会定期扫描一下有没有安全问题,然后有新的可以更新的版本也会通知我,我们一起讨论如果更新的话,会不会造成性能的退化和影响当前的任务。 那么如何创建一个新的 agent 呢?其实非常的简单,我们后来会看到整个 agent 的 结构,但是你完全不需要自己创立文件夹,最简单的方式就是跟你的主要的 agent 的 对话,让他帮你去创建。这里我们以 diagram 为例, 你通过 diagram 与你新的这个 agent 进行对话,这时候你可以告诉你主要的 agent, 你 跟他说,哎,新建一个 agent, 他 叫什么?他要做什么啊?有什么呢?任务最后呢,告诉他你新建的这个 diagram boat 这个 diagram 机器人的 token, 这 token 怎么获得呢?我们找到 boat father, 点击这个打开 boat father 的 app, 然后这里我们点击 create a new boat, 新建一个新的,然后这时候我们给他一个名字,比方说我们叫做 fox, 然后我们点击 create boot, 你 就会得到这个 tokin, 然后这里我们点击复制,然后我们回到这里来, 把我们的 tokin 复制上去,告诉我们的主要 agent, 那 它呢,就会自动帮你创建这样一个新的 agent, 新的智能体了。那么什么是 agent? opencloud 里面如何定义 agent? 它又是如何工作的呢? 其实啊,一共就分为三层,分别是全局层, agent 层以及 session, 也是对话现成层。我们首先看第一层,就是全局层, 它呢并不是一个 agent 独有的,而是所有 agent 共用的,可以理解为是公共设施。这一层最典型的文件就是点 opencloud 我 们的总文件夹下面的 opencloud 点这次文件,也就是总配置文件,大家可以打开看一下,里面有非常多重要的参数,包括 os, 也就是定义哪个大模型厂商,还有就是你的登录身份是什么? agents 定义有哪些 agent? 它的默认模型是什么?工作目录和运行参数是什么? tools 定义局的工具权限以及 agent 之间的调用规则。 bundings 定义什么来源的消息调用到哪一个 agent, 浏览器定义浏览器信息, chanel 定义 telegram, discord, 飞书等外部的渠道连接, gateway 定义网关, memory 定义记忆等等等等。可以看到 openclaw 点 json 文件,里面包含着 openclaw 最重要的参数配置。 其实啊,大部分情况下我们出现崩溃对话没有反应的情况,也是因为我们的 ai 去改 opencll 点 json 这个文件夹里的参数的时候改崩了,所以一个建议就是,哎,你告诉你的 opencll, 在 他改这个文件之前一定要提前通知你,而且改的时候一定要谨慎。 第二层是 agent 层,这才是每个 agent 自己的领地,每个 agent 啊都有自己的工作空间,系统数据会话记录。那么 workspace 里面每个 agent 文件夹下面的这些文件,在每个对话开始的时候都会被加载进去来作为这个 agent 的 上下文。 由于呢,不同 agent 这些文件有所不同,这也就决定了啊,这些被文件被加载进去的时候,里面携带的信息,包括啊,他的身份,他是谁,他的性格,他的对话方式,他的任务的不同。 那么这些文件呢,包括 agent 点 m d, 也就是这个 agent 的 工作说明书,它决定这个 agent 的 做事规则,优先级,边界,还有如何使用记忆。 so 点 m d, 就是 这个 agent 的 性格和说话方式,与其是什么风格,是什么,边界在哪里,由它来决定。 user 点 md 就是 这个 agent 对 用户的理解就是他在帮谁,对方是什么风格,应该怎么称呼,有什么偏好,要注意 identity 点 md 就是 这个 agent 的 身份卡,解决的是这个 agent 叫什么,是谁的问题。 to 点 md 是 工具说明书,告诉 agent 啊,本地有哪些工具命令,怎么约定项目里面有什么习惯? memory md 是 长期精华记忆,它不是流水上,而是提炼之后的长期信息。这个文件很重要,而 scales 里面就是这个 agent 专属的 scale, 如果和局的 scale 同名的呢,这里的优先级更高, 会覆盖大局。那么这些呢,都属于 agent 层,也就是说啊,不同的 agent 默认不共享这些文件,但是同一个 agent, 不 同的对话,不同的对话线程之间是共享这一套文件的。第三层是 session 层,这个层级啊,不是这个 agent 是 谁,而是这个 agent 当前在哪个窗口里面工作。 session 是 对话县城,怎么理解呢?比方说,当你在同一个 agent 和他对话,但是在不同 discord 里面的频道对话,或者是你先跟他在 telegram, 后跟他在 discord 对 话,这就是属于不同的县城,因为它们的渠道不同, 或者是就是你当前的对话,但是你打了命令 slash new 或者是 slash reset, 就 会开启这样一个新的县城,区别是 slash new 旧的对话还在,但是 slash reset 会清空上下文,重新开始这样一个对话界面。那么这一层最典型的文件就是在我们每一个 agent 的 下面 sessions 文件夹里面不同的 session 文件了, 也就是每个对话都有自己独立的这样一个文件来记录啊,不同的对话历史。也就是说同一个 agent 不 同 session 会共享 agent 层那一套的。我刚才说的 saw 点 md, 我 刚才说的 agent 点 md 等等那些 workspace 的 文件,但是不会共享竹字的聊天记录。 讲完三层结构,了解 agent 工作原理之后,下一个很重要的问题就是,哎,多个 agent 之间是如何协作的呢?在 open call 里面, agent 协作大体有两种方式,第一种就是固定分工,也就是我们刚才说到的多个独立的 agent, 各自有各自自己的 workspace, 有 自己的 session, 也是对话现场。 固定分工就是像搭一个长期团队,就像我展示的我的 agent 一 样,一个负责找资料,另一个负责写脚本,一个负责写代码,还有一个负责日常对话和汇总等等等等。他们每个人啊,都长期干自己的事情, 他们之间的工作啊,写作的方式可以通过触发的串联或者是并行,比如啊, agent a 搜完信息这里我在 disco 里面点个赞,后面的 agent b 就 会根据我点赞的这个内容去调研资料,去补充材料。 那么第二种就是临时拉 sub agent, 也就是子代理。子 agent 去干活,也就是 open club 的 sessions prom, 它呢会拉起一个隔离的啊。 sub agent prom, 也就是子代理的这样一个运行在独立的 session 对 话现场里面工作, 工作完之后再把结果传到我们当前的对话里面来,相当于临时叫了一个实习生或者是外包去隔壁的办公室工作,干完工作回来汇报。这样的好处就是当我们的子代理在独立的赛程里面工作的时候,他不影响我们当前对话的这个主位阵子,我们可以继续给他提问,继续跟他对话,两边同时进行。 那么官方文档对他的定位也很明确,就是他适合做研究,慢任务、重任务、病情任务,而且不会阻塞我们主对话。 比方说这里啊,我让他去用 sessions born 去开一个子任务,研究 open call 智能体最近最受欢迎的三个讨论点,要求每个讨论点的热度、原因,代表观点,以及我可以做视频用的切入角度,然后让他开始在后台启动,完成之后主动汇报结果, 好的,他已经启动了这个任务。其实这时候我们可以去跟他对话,比方说我问他今天天气怎么样, 他呢,还是会回答我们这个今天天气怎么样的任务,因为刚才我们也说了,子任务是在另外一个县城完成的,不耽误我们跟我们的主要的智能体之间的对话。可以看到他就是继续的跟着我们进行对话,他回答了我刚才的问题,然后我们可以继续提问,我说, 哎,可以看到我们等了一会之后,他终于是把这个任务完成,然后自己主动地把任务的结果发回到了我们的主要的频道。哎呀,没有影响我们刚才跟他这个主要频道主要的智能体之间的。对,不是所有任务都适合上多 agent, 如果只是一个短问题,那么一个 agent 往往更加有效,硬拆呢,只会让系统更重更慢。那么真正适合做 agent 的 场景啊,一般有这么几种,第一种就是你的任务天然就能拆开,比如啊,研究,写作,审核,发布,本来就是不同的角色,这时候拆 agent 有 不同的工作区的这种不同的文件边界会更加清楚。 第二个就是任务可以并行,有些事情呢,不需要排队,一个 agent 可以 查资料,另外一个可以同时整理结构。如果你用 sub agent 这种并行就很合适,那么刚才我们也说了,它很适合做这种比较重的或者重复性的工作。 第三个多 agent 呢,不只是为了分工,也是为了避免污染。因为啊,如果你用单 agent 做太多不同类型的任务,都会出现相互污染的情况,长期记忆呢,会把不该混的东西混在一起。因为我们也说了,工作区那些啊, markdown 文件是同一个 agent 在 不同聊天窗口里面共享的, 那么什么时候没必要用多个 agent 呢?那么很简单,要么就是你的任务很短,要么就是上下文高度连续,你不想打破,要么就是你角色的边界根本猜不清,就没必要拆。还有就是避免为了做 agent 而做 agent, 只是为了看起来很高级而已, 能一个做好的事情就一个做,就相当于是一个队伍,当一个任务需要一个团队来做的时候,那自然值得用团队。 那么关于多 agent, 为了达到好的效果,我想分享一下我自己得出的一些实践。第一个就是不要一上来,对于很多的 agent 可以 从一个开始,有必要就加第二个,比方说你第一个 主要的 agent 也是默认的 agent, 基础上你加一个研究 agent, 每天去搜索啊有价值的信息,定期汇报给你,那么先把这个逻辑跑顺出来,然后再根据你自己的业务再加一个,同样每加一个呢,都先跑顺功能验收效果。 第二个就是工作区的文件要尽量的短,尤其是 agent 点 m d, soft 点 m d, user 点 m d, 也就是心跳文件, 而因为这些文件都会进入 agent 的 运行上下文,如果太长的话会增加效果。考虑到你有多个 agent, 如果你不注意的话,那你的成本可能会成倍的增加。好的,以上就是今天的视频了,希望你也能开始搭建属于自己的 ai 团队,不要忘记点赞和关注,我们下期再见。

那个跟大家来说点真话啊,我现在实在受不了很多的自媒体在吹这个 open crow 这样一个框架无所不能,万能什么标题党拉满 ai 自动赚钱,二十四小时,现在贾维斯降临等等这些言论什么又便宜,有一个二十四小时的全方位打工的员工帮你去做这个做那个等等, 其实这些呢,都是有很多条件在的。我今天呢就讲一些真话啊,跟大家来分析 open crow 到底是什么?它究竟什么能做,什么擅长做,什么不能做,什么不擅长做,跟大家讨论清楚。 好,我们分为三个部分呢,跟大家来说一说 open crow 它的基本情况。第一个呢是 open crow 究竟是什么?第二部分呢是 open crow 它做什么靠谱?第三部分呢,我们主要来看一看 open crow 呢,它做什么不靠谱啊?我们先来从第一个部分开始讨论,第一个呢就是 open crow 它究竟是一个什么东西? 好了, open core 呢?其实我们从简易的或者说大家好理解的方向来说呢,它呢其实是一个智能体调度框架,不是决策大脑啊,因为它不是大模型。我打一个比方来讲呢, open core 究竟是什么呢?它更像是一个高级的智能化的一个数控机床。 这个大家呢,其实就比较好理解了,数控机床呢,它更多的是去执行某项任务,但是指令是谁下的呢?是它的大脑,也就是人 数控机床去车不同的零件儿,那么它需要使用不同的工具,这些工具呢,也就是它能调度的 m、 c, p 或者智能体啊,所以它整体来讲呢,分为四个步骤啊,首先呢是确定对话,因为大家都知道 open curl 呢,它可以用对话的方式,比如说 what's up 啊,这种对话的方式能够去下达它的指令, 还有呢,它可以你下达指令之后,它就可以组装上下文儿,这个叫 contest assembly 啊,这个部分呢,也是它的第二部分, 第三部分呢,就是调用模型并执行工具 ok, 模型是什么呢?就是它的大脑,这个大脑呢,本质上来讲它不属于 open core, 它呢更多的是我们这些做基础模型的公司,比如说 jvm, 比如说 gbt 等等。啊, 这个呢,所以 open curl 它是没有大脑的,它是一个执行调度框架啊,这个呢是也比较好理解。第四步呢,应该说是它会保存现有状态,就是你之前说过的话,之前下达过的指令呢,它都能比较好的,比较完整的帮你保存下来啊,它通通存回磁盘。 所以呢, open curl 呢,打一个比方,就是刚才说到的,它更像是一个高级的数控机床,这样的一个形象在出现, 所以我们再说专业一些,它呢具体适合做什么呢?就是它的针对于命令行, m, c, p, 协议, shell 等等啊,这些工具的读写代码,执行,终端操作啊等等,这些工作呢,它是比较擅长的,所以呢,它适合把这个模型和工具串起来使用。 然后整体总结一句话呢,就是它擅长的是一些后端命令行接口儿化的问题,而不是一个面向普通用户的桌面儿全能助手。 所以大家就能够理解了,我们想要操作我们的浏览器,比如说我们的谷歌浏览器,这个呢,其实现在目前啊,它是没有办法完成的, 所以这些就是它真正的一些痛点,包括操作 windows, 包括操作这个 windows 里边的各个指令,你打开某个这个应用软件等等,这些呢都是不行不通的啊,现在目前呢是没有办法去操作的 好,那么就此而言呢,我们来看一看 open core 呢,那到底做什么靠谱呢?其实它肯定是有靠谱的地方啊,就是刚才讲到的命令行脚本执行和简单的自动化啊,这个就是让它去做执行,这个呢是非常好的一个工具,并且呢就是调用 m c p a p i 以及其他工具接口。 大家可以想到啊,如果啊我想做的一个事情,他没有 m c p, 也没有 api, 那 么他能成功吗?他一定成功不了。比如说我之前去部署的这个就是 kimi crow 啊,我让他去帮我去抓啊,某一个这个专家就是医生他的号, 他的号源我就跟他指定了,我说你帮我去找到北京大学肿瘤医院赵君主任的号啊,如果有号,你就提醒我, 这个东西,就这个指令或者这件事情,它根本是无法完成的,因为它没有办法去调用相应的 m c p, 找不到这个 m c p 这个号源在哪呢?可能在幺幺幺四挂号平台,在北京大学肿瘤医院的这个官网上还有一些小程序等等,它找不到,所以这个任务呢,根本是无法完成的啊, 也就是没有 m c p, 没有 api 接口调用的时候,那么这个事情没有办法完成。还有就是代码儿编 e 运行,简单调试这些呢,应该说都是没有什么问题,文档读写啊,这些目录操作这种简单运维也是 ok 的 啊,就是作为巨能体框架,它更多的是把模型和工具串起来使用。 然后呢给大家找了一些现在全网中比较常见的一些用力,我用这个呃错位的方式呢,帮大家来呃突出了一下。第一个呢就是新闻摘药啊,天天整理新闻啊,我也在做很多整理新闻的一些工作,但是呢他的评价就是很多公众号啊,肯定有很多人整理啊,没必要自己花钱,因为他 token 消耗还是蛮大的。 第二个呢是邮件的这个管理啊,自动分类规章啊,这件事呢,给大模型做可能风险比较高啊,但不是不能做,然后日常管理和提醒呢,这个呢,其实可以用我们大模型或者说用一个助手,像 siri 这样的其实就够了啊, 等等,还有像备忘录,现在目前呢,笔记的一些备忘录还有日历我们是可以同步的啊,也会有比较好的替代方案。 还有这种 im 消息整理, im 消息整理呢,就是我的对话啊,这个说实话我根本不,我根本不敢交给大模型去进行整理啊,这个我的私人绘画呢,凭什么我要发到网上去,对吧?让大模型都知道我在讨论什么? 这个没有什么意义,网页的监控,服务器的监控,这个呢,其实啊,总体来讲啊,可能是为了蹭热度啊,这个根本不需要啊,因为成本太高太贵了。传统监控呢,完全可以达到自媒体运营找热点啊。这个听起来呢,是刚需的一个功能, 但是啊,这个功能我们其实之前编写一个工作流,一个 agent 啊,也是便宜可控并且能够实现的,我们不一定非要用这个 open curl 的 方式去实现, 还有像写代码处理这个,呃,处理问题, pr 等等,这个基本上就跟我们很多的智能体是一致的 啊,以及 pdf 处理呢这些其实整整体来讲啊,我们之前我推荐的呢,还是用脚本或者用工作流,我们的工作流去做处理,也是非常好的一些选择,所以呢,肯定也都是有取代方案的啊,这些呢是 open crow 呢比较擅长做的东西。然后呢,我们再来看一看这个 open crow 做什么不靠谱啊, 不靠谱呢?第一不靠谱就是浏览器的 u i 自动化啊,体验极差,这个是什么意思呢?就是你让它作为像人一样坐在电脑前面,打开一个浏览器,通过视觉的方式啊,帮你接管你的框啊,就是我们的谷歌浏览器 靠视觉的方式去进行识别,拖拽等等。这个呢错误率啊,几乎到百分之百啊,几乎没有办法去执行下去,特别容易卡啊,这些我都是试过的, 而且呢特别容易错啊,什么拖拽呀,弹这个弹框啊,验证码,动态页面等等等等,非常的差啊,非常的不好啊,几乎没办法用,而且消耗 token 消耗的极高,也就非常的贵。 然后呢,就桌面的这种软件啊,就是这种可适化的 g u i 的 软件的控制,这个呢就是最大的问题就是不支持原声啊, windows 跟 mac os 都是没有办法支持的,你没见过谁在 windows 里用 open curl 去控制 windows, 比如说我说帮我打开找一个文件,然后吧啦吧啦吧啦等等,这个呢,几乎是没有的啊, 所以这就是这部分呢,其实啊,呃,还有像国内的一些什么 qq, 微信啊,其实根本是现在目前开放不了,因为非常不安全啊, 还有像这种办公自动化自动赚钱啊,这个就是我觉得根本就不靠谱啊,其实根本不靠谱,这个除非是你有非常资深的程序员,并且能处理一些比较简单的问题而已啊。 所以呢,这部分他的整个脚本呢,其实不稳定,你要真是一个普通人,大家注意啊,我说的是普通人啊,如果是一个非常高级程序员或者说专家,那么呢,你可能会有一些挣钱或者说能自动化脚本的一些工作 啊,但是呢,他挣的也不是 open crow 的 钱啊。 open crow 对 于普通人来讲,直接二十四小时全能办公全自动挣钱啊,这个呢,不太靠谱啊,这个确实是不靠谱的。 然后呢,我们再说说我们最近啊,这个最受不了的一点就是自媒体吹啊,一直在吹啊,你这个哦,不会 open crow 呢,就要落,就要落伍了,就要过时了啊,要赶快学习学习是没错的,或者赶快去买它的服务。 所以媒体吹的呢,基本上就是 ai 全自动的控制电脑,什么都能点啊,都能做啊,其实实际情况啊,他呢,只能搞搞简单命令, g u a 啊, g u i 就是 我们页面的这个部分操作基本都基本是完成不了的啊,基本都废掉了。 然后呢,就自动办公自动做表格啊,复杂表格排版这种复杂逻辑一个都干不了,这个大家自己试过就都知道了, 然后自动刷视频,自动赚钱,二十四小时,这个赚钱啊,基本上来讲啊,演示为主,大家可以真实去跑一跑,看看你能不能跑够二十四小时的顺畅啊。 这个呢,什么不用写代码,小白也能一键启动啊,这个本质上来讲,这个是不是小白啊?不是,小白是专家啊,只有资深的软件工程师可能能够把它调的非常灵 非常通啊,针对于环境复杂,多条式报错,这个小白根本搞不定啊,而且 open core 的 部署可以看一看,很多程序员啊,不学习也搞不定啊。所以小白啊,不要考虑或者说是自媒体吹的,听一听就可以了,我们这个主要在说些真话嘛, 然后这下一代的智能体超越一切,下一代的智能体我们是承认的,没问题,这个框架也是非常超前的,一个超越一切啊,不太可能啊,这个是不靠谱的 啊,也就是带一个工具协调的智能体框架啊,他不是一个新模型啊,应该只能说是一个新框架啊,确实是下一代的框架,但并不是一个这个万能或者说什么都能做的一个东西,他还有很长的这个发展的路要走。 好。我们最后总结一下啊,很多自媒体对于 open core 啊,就是出现的这三个问题。第一个问题呢,是混淆概念,把这个能力框架等价于模型能力,这肯定是不对的,而且呢,把演示的效果等价实际应用的效果,这个呢,其实就是混淆基本概念。 第二点呢,是他的隐瞒成本,就是 open core 这个东西呢,其实 token 是 非常烧的啊,他有大量的需要消耗的 token, 这些呢,其实他并没有讲清楚, 所以这部分呢,应该说是隐瞒了相关的使用 open curl 的 成本。第三部分呢,应该说叫收割焦虑,很多自媒体都提到, 我们现在呢,必须跟上 open curl 的 节奏啊,如果你跟不上呢,那就是掉队了。最后呢,去卖部署,卖一体机,卖云服务等等,这些呢,应该说就是收割焦虑的非常典型的一个表现,所以呢,大家应该认清啊,具体 open curl 是 什么,怎么来迎接新的技术进展?

opencloud 不 适合百分之九十的普通人,唯有三大理由和一个阴谋论去帮你去魅。 opencloud 简单来说就是一个可以操控你电脑的 gpt 或者 deepseek, 可以 运行你电脑上的程序。 第一个理由呢,就是经济成本,首先你需要有一台闲置的并且能二十四小时运行的电脑去部署这个 opencloud, 同时这个电脑的性能还不能够太差。最好呢还得是苹果电脑,因为有很多功能,比如说录屏啊,在 windows 系统上经常会出现问题,而且软件生态呢,也是苹果系统更好。其次呢, 就是 token 的 开销了,这个就是重中之重了,很多博主鼓吹的什么免费啊,便宜的代模型,但是呢用起来太笨了,而且使用体验非常的差。而一些好一些的模型呢,比如说 cloud 啊, open i 或者 jimmy, 你 使用一次 执行一次任务,动辄呢就是几十万的 token, 折合下来呢,几块钱就没了,而你真的需要去付费执行这些任务吗? 第二个理由呢,很多使用场景呢,它都是委曲求,比如说你让它处理你本地电脑上的文件啊, pdf, 那 我请问了,你难道没有 wps 云文档了吗? 是什么样的场景需要让你拿起自己的手机,打开 whatsapp 或者飞机,然后发送指令让它处理你本地电脑上的文件,这个文件还不是你公司电脑上的,是你本地电脑上的文件。其次呢,还有说让它帮你进行交易,这个世界面上有那么多成熟的而且久经安全考虑的量化 交易软件,你不用,你非要自己弄策略,自己去下单,你也不考虑安全上的问题,哎,就是要 diy 主播,自己呢也是有玩 solo 的, 我是绝对不可能让自己部署的 open call 去帮我执行策略去交易的,一不小心全给我爆仓了。 至于什么帮你自动运营自媒体,那就更扯淡了, ai 味道那么重的内容,你确定你发出去有人看吗?你发送一条内容所消耗的 token, 你 确定你可以变现赚回来吗? 第三个理由呢,就是技术门槛。首先,安装它就有一定的技术门槛,很多人说网上有很多保姆级教程啊,你跟着敲就行了。我想说的是,如果你能跟着教程把它完整的安装下来,你就已经不是百分之九十的普通人了。真正的普通人,他们连命令行工具 c, m、 d 他 们都不知道要怎么打开,更别提什么 下载 note js 啊, get, 只有图形化的安装界面才是真正适合普通人的软件。其次呢,配置大模型,配置配置 whatsapp 维书,推特,那就更麻烦了,更别提你还要考虑安全权限的问题。你最好呢还是要有一个隔离的环境,不然他把你的一些重要资料或者文件给删除了,而且他还可以直接去操控你的浏览器,而大部分人呢,浏览器都绑定了十分重要的账号。 最后呢,我想谈一下我的阴谋论,直说了,我觉得就是有一些国内的大模型厂商在炒作这个热度,大家仔细看一下教程里配置大模型,也就是你需要花钱的这一步。上面呢,有几个国内的厂商恰好呢上个月刚在港股上市, 而且呢,有很多点击量十分高的安装教程,都无一例外的推荐你使用这几个收费的大模型厂商,而且呢要使用他们的邀请码 视频呢?最后呢,我想强调一下我的观点,我问我认为 open call 这种本地 agent 的 形式十分的有前景,而且它很有想象力的空间,但是限阶段它还不适合百分之九十的普通人,大家不要这么焦虑,好像觉得自己已经落伍了。

你见过给每个孩子单独配一个特级教师的学校吗? openclaw 做到了,他不是家教,却比家教更懂你家孩子。为什么说 openclaw 正在颠覆传统教育?因为过去的教育是批量生产, 老师讲什么,学生听什么,不管孩子基础好坏,只能被动接受。而 openclaw 这个 ai 智能体,带来了真正的因材施教,他怎么做到的?第一,个性化学习方案 open cloud, 能实时分析孩子的学习数据,哪些知识点掌握的好,哪些老师出错,然后自动生成独一无二的学习路径。数学强的孩子直接挑战奥数,英语弱的多给几篇阅读加语法拆解,每个孩子都在自己的节奏里进步。 第二,全天候智能辅导孩子写作业,遇到难题不用等爸妈,下班不用等老师回复, openclaw 就 在手边,随时提问,但不是直接给答案,而是一步步引导思考。就像身边一直坐着个耐心的辅导老师, 具体到学科,效果更明显。写作文没思路, openclaw 提供开头素材、金句, 写完一键批改,从错别字到逻辑结构,比老师还细致。数学刷题,它能通过错题、反向定位薄弱点,自动生成举一反三的练习,把漏洞一个个补上。 open club 不是 简单的题库或答疑工具,它是第一个真正实现教育平权的 ai。 它打破了优质师资的地域限制,让山区的孩子也能拥有一对一特级教师。 更重要的是,它让孩子从被动听变成主动学。当学习像游戏闯关一样适配自己,谁还会厌学? 当每个孩子都拥有专属 ai 学习伙伴,未来教育不再是筛选,而是点亮关注我下期告诉你 opencloe 怎么帮家长减负!