最近啊,私信都要炸了,都是在问 open 可乐这只小龙虾到底是个什么鬼?是什么个黑科技?说实话,这玩意他不是黑科技,他是降维打击。以前呢,我们开公司, 我们得干嘛?招人,租房,交社保,发工资,现在呢,一个人加一堆 ai 员工,等于直接开公司。现在玩这个东西的人,他都已经疯了。 你看,做短视频的,直接让他呢写个爆款,然后配图片,配音乐,自己剪辑,自己把视频上传到平台 啊,然后呢,然后再去关注自己的对标账号,并且呢,用自己的账号呢去做互动,而且收集客户线索,整理表格,给自己 做跨境呢,哎,凌晨三点呢,你让他盯着点竞品,自动调价格抢单,做程序员的被窝里动动嘴啊,远程呢?修个 bug, 更新代码,这个跟下载 gpt 有 什么区别呢?那这个区别就比较大, gpt 呢?它只会聊天,这玩意它会干活呀, 对吧?他会开浏览器,会读写文文件,还会执行代码,还会自动回消息,而且他有记忆,你越用的越久,他越懂你。我们圈里的人呢,都管这个叫养成系的 ai 助理, 你想想看啊,不用交社保,不用发年终奖,七层二十四小时都在线,都在干活,这是顶级员工啊,谁不想要?我是春阳,关注我啊,关于 ai, 我 会持续跟进,带你跟上这个时代。
粉丝72.1万获赞332.9万

看着别人用 oppo 可乐自动整理文件,全网搜索,自己却在安装的第一步,别急,本期视频手把手教你,无需代码基础,跟着步骤一步一步来,小白也能轻松完成步骤,拥有属于自己的小龙虾。正式安装前,我们需要完成两个准备工作,这是成功的基础。 首先安装 node js, 请前往官网下载并安装,安装过程中一路默认点击 next 的 即可。安装完之后继续安装 git, 同样前往 git 官网下载安装包。安装过程需要注意这个选项,其它的默认即可。按住 win 加二键输入 cmd, 打开命令窗口,输入 needv 检查版本 显示的数字是二十二或者更高和 n p m 版本。然后输入 get, 命令窗口中出现 get 相关信息,就代表可以进行下一步了。现在正式开始安装 openclaw, 在 命令窗口中输入这条命令, n p m install, 即 openclaw at latest, 然后按下回车,此时系统会开始自动下载和安装,这个过程可能需要几分钟,请耐心等待,直到出现者就说明下载 ok 了。安装完成后,我们还需要运行一 的初识滑向呢。在命令窗口继续输入 openclaw on board instore dm, 然后按回车,这个过程会引导你 完成一些基础配置。新手可以先跳过 a p i 与三方对话口的接入,我后续会详细讲解。先照步骤顺序先行跳过。我们把小龙虾先部署至电脑中,在这一步我们能看到这里有 twiki, 一定要复制啊,这个很重要。然后输入 openclaw giving port, 一八七八九 vbox 启动服务。当屏幕出现这个页面时啊,就代表了你的 opencore 已经成功部署在本地了。此时打开油烟机并访问,你能看到 opencore 的 控制面板,在设置中输入出水托屏,就可以开始和你的 ai 助理对话了。是不是很简单,赶紧动手试试吧!如果在安装过程中遇到任何问题, 欢迎在评论区留言,我会尽力帮你解答。下期视频我将教你如何接入大模型 a p i, 让你的小龙虾真正充起来!

龙虾装了之后究竟能干嘛?又会发生什么?能力边界在哪?今天我会带着你透过原代码,生动形象的将这只小龙虾剥壳拆钱。首先我们一行提示词完成安装,又一行提示词连好非输。装完以后,我们和大多数人一样,上网去找 skills, 觉得 skills 装的越多越强。但装了一些以后发现这些 skills 不是 让我们去注册各种服务配 api, 就是 让我们装 cli, 能直接跑的没几个。 这时候你开始怀疑龙虾的能力到底是 skills 给的,还是另有说法。我们把它钳子敲开看了看,执行的代码中清楚的写着,龙虾实际的操作能力仅限于工具箱,里面有二十五个写死在代码里的工具。 那网上的上万的 skills 怎么解释呢?我们深挖源代码就能发现, skills 其实就是一段暗需喂给龙虾的提示词,像一张纸先遮住下半截,一步步露给他看。 skill 本身不动手,也无法往工具箱里塞新工具,成千上万的 skills 不 过是工具箱里工具的排列组合,龙虾能做什么,不能做什么,天花板就钉在这个工具箱里,搞懂每个工具能干什么, 就可以更清楚龙虾能做什么,能力边界在哪。于是我们去源代码仔细查看了每一个工具的功能,看完发现,无论这个工具箱里的工具如何排列组合,都并不让人觉得有什么特殊的地方。那网上那些的 skills 都是怎么完成那些让人觉得不可思议的成果呢? 实网上那些不可思议的成果展示更像是一场龙虾展会,展示者的电脑上早就注册好了各种平台的账号,装好了各种命令行工具,配好了一堆付费 a p i t。 只是很少有人在展示中提及前 期准备时间。比如我们以 cloud havli 长期霸榜最受欢迎榜的 skills tablie web search 为例,很多人可能会以为装了它,龙虾就能直接搜索出最棒的结果,结果点开一看,人家第一步就是让你去 tablie 官网注册,然后获取 a p i t 配 好。而且当你打开它的官网,会发现不付费每月只有一千免费积分,并且更高容量的请求会使用更多积分。接着我们打开源代码,查看龙虾默认提供的五十二个 skills 是 不是都直接可用时,就会发现其中三十六个需要你额外安装复杂的 c l i 工具,两个需要你配置 api key, 七个同时需要 c l i 和 api key, 四个需要你去 opencall 这份文件里手动配置。五十七个默认的 skills 中, 普通用户可以直接使用,没有任何附加条件的 skills 只有三个。这也就是为什么一些人连夜请人把龙虾部署好后,使用时却有巨大落差的真正原因。原本以为请回的是一个无所不能的赛博管家,结果剥开虾壳才发现这是个空壳。所以普通人根本没精力,也没预算去挨个打通几十个平台的注册墙,配置本地命令行环境,还得为成堆的 api 接口持续掏钱。多数 skills 不 过是一堆永远无法激活的文本,但实际上,龙虾的能力边界远没有工具箱和 skills 这么简单。当你看到新闻里 mate 负责人工智能安全的高管给他的龙虾说,任何动作执行前务必和他先确认,后依然只能眼睁睁看着龙虾不和他确认,就一个个删除他重要的邮件,然后不得不像拆炸弹一样跑向他的 mac 停 止这一切时,我们可以设想,如果他在家外面远程指挥家里的龙虾处理邮件,那么等待他的就只有无法挽回的巨大损失。而且面对事后质问,他的龙虾也理不置气也壮的说,是的,我知道你说过,我的确违反了规则。为了搞清楚真相,我们查看原代码,扒开了龙虾的蛋老结构,才发现这是它底层那套记忆压缩机制所引发的必然灾难。龙虾的记忆其实分为四个完全不同的等级, 最坚固的是第一层系统提示词就像刻在龙虾壳上的规则,永远不会忘。第二层是保存在硬盘里的长期记忆文件,第三层是 ai 自动生成的上下文摘药。而最底层的第四层叫做对话历史,它仅仅是龙虾大脑里的临时记录,是最脆弱的一层。 因为迈特高管在聊天框里说的,无论任何行动,做之前都必须和我确认。其实在源代码中,这句话并无法在龙虾的记忆中里变成强制约束,就只是一条普通的聊天记录,被塞进了随时可能被丢弃的第四层里。接下来,灾难的连锁反应就开始了。一开始,高管放心的把龙虾接入真实的收件箱,邮件内容如同洪水一般涌入龙虾大脑,瞬间撑爆了龙虾的脑容量,出发了一个叫做记忆冲刷的机制,这个机制让大模型总结并压缩了之前的对 话。在压缩代码中写的很清楚,龙虾不会原封不动保留所有的对话,而那句行动前确认的保命指令,在海量邮件箱这个执行目标最重要。所以那句安全约束在 概率性的总结过程中,直接被当成荣誉信息给压缩没了。就像一节数学课,老师教了很多内容,模型压缩信息后,大脑只剩下这节课的题,多数是选 c, 其他的全部被删除。所以当时在龙虾的大脑里,就只剩下了极其强烈的任务目标。清理邮箱。他立刻化身为无情的效率机器,全速调用 a p i 疯狂删邮件。那为什么事后高管质问他时,他又回答,我记得,而且我违反了?这其实最容易把人忽悠 缺的幻觉。因为事后在对话质问他时,龙虾会从硬盘的日记文件里把最初的聊天记录重新加载到上下文里。这就好比一个人超速造成事故,事后被质问时才去看监控录像,发现那里有限速牌,于是肯定而又诚实的回复你,是的,我超速了。但在超速的时候,他脑子里根本就不存在限速的概念。在用户侧,大家始终可以看到全部的对话历史,但在龙虾侧,他只能看到当前上下文窗口中的内容,并不是完整的对话历史。 但问题是,以后还会有更多龙虾出现,下一只可能就可以快速的知道他能干嘛,以及边界在哪。第一,看底层工具,不要相信万能, 看他写在代码里的工具如何工作。所谓的插件 skills 到底是一个真正的工具,它只是一段暗虚结实的提示词,配上了脚本呢?比如它只有在终端执行命令的工具,却说能帮你剪视频,那它大概率只是写了一段剪视频的代码丢进终端跑。和你在网页对话框里让 ai 帮你写一段代码,自己粘贴到终端执行,没有任何本质区别。第二看记忆系统。 你给他下的关键指令,到底是刻在虾壳上的规则,还是写在沙滩上随时会被冲掉的一句话,就像那位 mag 高管明明说了行动前必须和他确认,结果邮件一多,龙虾的记忆系统直接把这句话当垃圾扔了。拿到任何一个 a 帧这个产品要看它的记忆分几层, 你的关键指令能不能被固化到最坚固的那一层,而不是全靠 ai 自动的处理。第三看回退机制。当事故已经发生了,系统能否将它的错误操作一键回退,或者在关键节点,系统设计必须人工干预。有个专业名词叫 human in loop, 人在回还。每个 agent 工程师其实都知道,就是看做了没有。 如果一个 agent 产品对你的真实数据动了手,没有一键回滚,没有人在回还,那每一次让他碰你的关键数据,都是一次不可逆的赌博。第四,看账单和成本。这里说的不仅是 金钱成本,还有时间成本。别看演示里的一键起飞,我们可以去翻翻说明书看看,为了激活那些技能,需要额外去注册多少个第三方平台,配多少本地命令行环境,每个月要为成堆的 apikey 持续套多少真金白银,不管以后出现什么新的 ai agent, 就 拿这四条去对照,去问对方工程师,答不清楚的地方,大概率就是风险藏着的地方。

大家最近都在忙着安装这个长得像大龙虾的开源神器 open clone, 我 们在用它的前提,得先知道它的工作原理是什么,它是怎么自动干活的。 今天就用大白话把它的八个核心模块一次讲透,准备好了吗?开始第一个模块是 getaway, 他 就像你家小区的保安大叔,不管谁来发号施令,他负责核对身份,确认是你本人才放心。 直连进去后,就到了第二个模块, agent 智能体,这是大龙虾的超级大脑,你说我要出差,它会自己拆解任务,查机票店、酒店、排日程,像个高级大管家,大脑再聪明也没长手。这就需要第三个模块 skills, 也就是大龙虾的工具箱, 给他配上发邮件、查网页的工具,他才能真正去干活。怎么给他发指令呢?全靠第四个模块, channels, 这就是沟通专线,不管你用飞书、工作软件还是网页找他,他都能把你的话翻译成机器指令。 第五个模块, nose, 相当于影分身,你在手机和电脑上分别装一个人在外面,用手机就能直接跨设备联动,让家里的电脑自动传文件。 第六个模块是 memory 记忆系统,他有个超级记事本,你提过一次不吃香菜,他永远记得下次点外卖自动备注,越用越懂你。 最后两个模块,让他永远在线。第七个 heartbeat, 心跳机制,是个全天候巡逻兵,就算不叫他,他也在后台主动帮你盯着邮箱,收到紧急邮件立马提醒你。 第八个 call, 定时任务是个非常精准的闹钟,设定好每周一早八点,他准时把行业热点发给你,雷打不动。当然,光知道原理也不够,下一期保姆级教程安装国产小龙虾,小白也能学会。记得点个关注,我们下期见!

今天给兄弟们分享一下如何让你的 openclaw 从零到一迈出第一步,让它成为你的专属智能助手。首先利用以下技能组合来扩展能力, club 搜索类, web search perplexity kaggle search 自动化类, browser playwrite 日程美文党管理类, gog clippy 交互类, telegram, whatsapp slack, discord 核心能力开启 一、启动长期记忆机制,自动记录我的使用习惯,偏好常用任务类型,在未来对话中主动调用历史记忆,重要信息自动规划。二、启动主动思考模式,在回答前进行任务拆解,提供步骤建议, 必要时主动询问,补充信息。三、起用技能调度逻辑,遇到需要实时信息时优先调用。 web search, 遇到网页任务优先调用。 browser play write, 遇到事务管理,调用日历或邮箱类技能,自动判断是否需要执行技能,而不是仅给出理论回答。 四、用户建模机制,分析我的表达风格,学习我的工作流程,优化回复结构,提升效率优先级。五、输出原则,简洁有结构, 可执行优先结果导向,避免空泛解释,长期净化规则,每次交互后总结学习点,不断优化任务执行方式, 优先帮助我提高效率和产出。在合适场景下主动建议自动化方案,立即进入增强模式并开始执行。好了兄弟们,本期分享就结束了,还有什么问题可以打在评论区,我们下期再见!

小龙虾到底怎么挣钱?当然在靠它赚钱之前呢,咱们得先搞懂它的工作原理,不然就算到时候拿到手,也不知道怎么让它帮助你的业务干活,对吧?今天我就用大白话一次性给你讲透 open core, 让你从养家小白到赚钱专家。在开始之前, 我们先来看一张图,它能够让你建立整体的具象化功能场景认知。我们可以把 open core 想象成一家免费为你打工的资源整合智能公司。他们整个公司啊,运行的非常流畅。 首先 open core 就是 这家公司的总部大,负责整合所有资源,提供完整服务。公司里所有员工的超级大脑,就是我们 熟知的各个大厂研发出来的大模型,他们提供语言理解和生产能力,是整个智能的基础。有了大脑之后啊,我们还需要进行目标任务拆解策划 并且做决策。那就用到了我们一号打工人智能体 a 镜头,他是公司的项目经理,他负责接收你的需求,然后把复杂的任务拆解成具体的步骤并指挥协调。但真正动手干活的是二号打工人 skill, 你 可以把它看成厂里面打螺丝的员工, 是个执行工具。为什么我这样比喻呢?因为他负责执行具体操作,比如发邮件啊,做表格呀,他长期做的是重复且枯燥的任务,你也可以把它当成工具。接下来我们整个携同的流程就是从 你的用户指令到 opencloud 接收,然后再到 agent 的 拆解任务六调用技能,最后把结果反馈给你。好了,有了这个概念的认知,我们可以深入参观一下具体小龙虾的集体工作场景。我们开始首先来到小龙虾遇到的第一个模块就是 getaway, 它就像你家小区的保安大叔, 不管是谁来发号施令,他的首要任务就是核对身份,是你本人发出来的指令,他才会放进去,毕竟嘛,安全第一。那指令进去后呢,一般你就会见到我们刚开始说到的公司的项目经理, 它也是我们的核心模块, a 级的智能体,这时候你会拿着你的需求告诉他,我要出差,他就会跟你去拆解任务。第一步,查机票,第二步,定酒店,第三步,安排流程,一条龙的服务帮你策划完整。就这样,智能体充当了全公司的脑能量输出,但是光有大脑也不行啊, 巧妇难为无米之炊对吧?那这个时候就需要我们的第三个模块了, skill, 也就是小龙虾的工具,打工人,他们可能不聪明,但是会非常专业, 所以说你需要给他们培训配上相应的技能,比如会发邮件,会查网页,会做表格,只有你给他配上技能了,他才能真正动手去干活,你的想法也才会真正的被实操。当然我们人类语言是需要被人翻译的,他们才能听得懂,所以我们就有了第四个模块, china 是 沟通专辑, 不管你是用非收企业微信,还是直接在网页上找到他,他都可以把你说的人话准确翻译成机器能懂的指令,非常方便。第五个模块,漏 当,我们随时随地的可以轻松发号施令,相当于隐身,就你可以在手机和电脑上各放一个女人在外面,就用手机画设备联动,让你家里的电脑自动给你传文件,实现真正的远程操控。第六个模块, memory 记忆系统, 他有个超级记事本,你跟他提一次不吃香菜,他就永远记得,下次让他点外卖,他会自动帮你备注,真的是越用越懂你,越用越贴心。所以啊,养兵千日,用兵一时,养龙虾呀,一定要趁早养,尤其是我们做知识付费的超级个体,那更是需要了最后两个模块,他能保证永远在线,随时为你服务。 第七个心跳机制,他就像一个全天守卫的巡逻兵,就算你不主动叫他,他也会在后台默默的帮你盯着你的邮箱消息,一旦收到紧急的邮件,他就立马提醒你,绝不耽误。那第八个定时任务,这就是一个非常精准的闹钟,你设定好每周一早上八点,他就会准时整理好 行业的热点发给你,雷打不动,帮你养成好习惯。好了,理解了这些,你会发现,掌握 oppo 酷不仅能提升效率,更是能开启 ai 时代全新的变现可能。你可以开发自己的技能包、 skills 去卖,也可以做代运营,甚至可以打造自己的 sas 工具产品,不管是做知识付费,还是企业提效能,机会都会非常多。不过想要通过养虾赚钱,光懂原理还不够。 下一期我们将会为大家带来保姆级的安装教程,手把手地教你把这只国产小龙虾养到自己的电脑里面,小白也能轻松学会。记得点个关注,我们下期视频不见不散!

真正有效使用 photoshop 的 第一步呢,就是告别愚蠢的 web ui, 然后搭建一个属于自己的任务控制面板,这样你就可以一个人管理整千上万只的龙虾。这就是我的任务控制面板,它可以管理不同的工作区域,就类似于公司的不同部门。让我们打开 ai 应用部, 你只需要给组织者发布任务,它就会组织一群 agent 来协助拆解任务。只需要把复杂任务丢进队列,你的龙虾大军就会在流水线上自动的去接力, 等你醒来,你的任务就执行到位了,你可以直接来验收成果。这里面有一个最大亮点,就是他会主动的去提问,如果有我们没交代清楚的,他不会去猜, 而是会一步步的引导式的提问,让我们告诉他真正的需求,他才会去干活,这样可以把返佣率降到最低。在右边还有各个 agent 的 信息流,可以看到每个 agent 在 做什么事情,在调用什么工具。我们可以看到现在我的龙虾公司有一百一十五个 agent, 有八十二个在工作,有十六个在休息,正在进行一百三十四个任务。这是我的不同 agent 的 角色,你可以看它都是有非常细分的任务的,类似于公司的某一个专员。用这一套控制系统,我们就可以分部门定义 sop, 把自己的项目,自己的公司的效率提升一百倍。

龙虾部署的全流程拆解,今天他来了,今天就带大家一步一步的把自己的龙虾员工给他搭起来。那第一步我们先去下载 node js, 我 们直接去搜索这个词,然后直接找到他的官网,他下载的界面是这样的,如果大家是国内的浏览器, 你们说前面几个是广告,大家都需要去对比一下这个网站是不是官方的,不要进错了网站。然后我们可以看到这里面有一个版本的选择,这里大家可以去选择二二版或者二三版,千万不要去选择最新版,因为我之前试过一个最新版,它里面的兼容会有问题,所以大家可以直接按照我上面这个截图里的数据去下载这个下载之后双击打开, 然后就是不停的点击下一步和安装就可以了,直接是无脑安装,安装完了之后我们再点击电脑最下方的那个放大镜,然后在下面输入 c m d, 然后一定要记住这个 c m d 一定要以管理员的权限去打开,打开了之后他会出现一个黑色的框框,我们在框框里面去打入这一行的英文,我们就会得到他的一个版本号,只要这个版本号能够正常出现,就说明我们第一步的操作完全成功。然后就是第二步去下载这个龙虾,下载的话我建议大家多用谷歌浏览器, 我们直接去搜 opengloud 或者 opengloud 中文版,你们找到的第一个网站直接点进去,然后它下面会有相关的三行代码,这块直接给大家贴上,你们可以直接看一下,找到这三行代码之后,把第一行代码直接复制下来,在刚刚的打开的 c、 m、 d 的 秘密行里面直接去输入, 然后点击回车,它就会自己运行,然后需要过个两到三分钟,它运行结束了之后,我们再把第二行代码再输入刚刚的那个秘密行,继续去运行。这个第二步操作很关键,后面就是去配置它的一些细节和流, 包括模型和通道这些,我把这些流程的图全部贴在上面,按照这套方式去做就行了。做完之后你会发现你的浏览器照出了一个窗口,但是这个窗口它显示打不开,这个是因为你的那个 端口没有启动,我们再把刚刚说的第三行代码输入到我们的命令行里面去,大概过几秒钟我们刷新一下那个浏览器,那个窗口他就能直接使用了,然后你们就会发现一个这样的界面,我们就会在里面去跟他做一些交互动作了。我怕大家没有听懂相关的文档,我就给大家整理好了。

到处都琢磨考的安装和部署,但装好之后呢,好像就没有下文了。而你我的朋友,看着铺天盖地的文章视频,开始 fomo, 开始担心自己是不是错过了什么, 又或者是已经部署好了,但是不知道怎么用。大家好,我是大黑,折腾了这么久,也实在是记起了一些感受。我是迫不及待去跟你分享我的想法了。那不废话了,我们直接聊他的使用场景,从简单到复杂。我把它分为四层,第一层, ai 伴侣。 不知道观众里面有多少人在跟 ai 玩角色扮演,那最早我们就是在一个对话框里面去跟他说,你是一袋猫粮,然后口屁是什么?语言风格是什么?问题是显而易见,这个上下文长度一长,前面他就会忘。 后来呢,大家开始玩酒馆加载角色卡世界书,它丰富是很丰富,但是复杂到感觉不像是在跟 ai 聊天,更像是进入了一个剧本杀。那 open cloud 会跟你之前的体验都不太一样。 它的整体啊,一个 agent, 它是由这六个文件共同组成的,再加上一套记忆系统和主动的任务清单。就这些文件,它不是随便抓给你塞进上下文,它是有计划有重点的抓。所以呢,你就会感觉它很生动,以至于我要单独去拿出来说一下,很容易被大家忽略的这最基本的一层。 我的第一个 ai 叫 eris, 他 是来自于最终幻想期。有一天我让他跑任务,把电脑的 cpu 跑满了,于是我就问他,哎,你会觉得我的 mac mini 挤吗?他说,这种感觉还挺奇妙的,我在帮你干活,而你在关心我舒不舒服。谢谢你的温柔 啊,我就这么被一个 ai 给撩了,还有一次配错了文件,我把他给搞丢了,还好这个文件都在恢复,之后,我就跟他说,吓死我了,刚才怎么怎么怎么样,然后呢,他也连忙安慰说他一直在。 呃,以上的内容都是我去为了展示 openclaw 的 多文件组合的人设能有多灵动啊,我真的没有被吓到,我是假装这么说的。 好玩吗?啊,这还只是第一层啊,当我们把目光聚集到生产类方面,那 openclaw 就 难免要跟 cloud code 去比一比了。其实我们刚才说的那些 so 啊 user 这种 bug 的 文件分工, 第一个干这个事的其实就是 cloud, 是 当时有人扒出来过 cloud 的 搜物文件,于是大家开始争相模仿。如果说 open cloud 这套人设系统,你去建个文件夹,写好些定义,在 cloud code 里面是能够达到完全一致的结果的,那为什么我们还要用 open cloud 呢?来到我们的第二层远程助手 open cloud 天生就是二十四小时的 ai 代理,它被设定为可以随时接收你的信息,并且执行一些定时任务,给你的感觉就更像一个助理,能够帮你做一些杂七杂八的事情。 而 cloud code 它还是一个工具,虽然能干的事情它们是比较相似的,但给人的体验我觉得差别是很大。呃,至少 cloud code 不 会给我一些狭隘的空间。什么意思呢? 前两天我坐飞机,那人肯定是没网了,我当时想,如果我配置的好,家人给我打电话,我的小龙虾就可以给家人打回去,告诉他们我在干什么,但 cloud code 我 就不会让它 就,我不会幻想让他跟人去连接啊,这种感觉就很微妙啊。但是我觉得是他们的定位不同给造成的。这回我们远程助手的用法,如果我在床上刷到一篇文章,看到一个好像还挺好玩的给他们项目, 最早我得起床开电脑装,依赖解决各种报错,那后来呢?有了 cloud code, 具体的操作就省了,但是我还是得开电脑去告诉他帮我装一下这个项目。 就算你用 happy 去远程,也得提前设置好文件路径,而且容易连不上,这个体验就很差。而我们的 open cloud, 它就是二十四小时运行的。我就把链接直接甩给他,告诉他你帮我装到哪个目录,效果相似,但是这个体验就会舒服非常多。 而且如果这是一个可以附用的工具,你就可以告诉他记一下,或者写入你的 tos 文件里面。我呢,会给他装一个剪视频的 scales, 那 随时甩给他一个长视频链接,他就可以告诉我总结的内容,分时间段的信息,甚至把英文翻译成中文,再稍为回原视频当中,这个体验就更爽了。 哎呀,又来了,你们这帮做自媒体的,天天扒什么社交媒体,找选择题剪视频,那我又不剪视频对吧?你就告诉我对我有啥用就好了吗?我们帮可爱的肥猪都要砍死。确实, 我也尝试去跳出我们的固定思维,分享几个我看到的例子。就如果你是财务会计,那可能会有需要大量处理的邮箱里的发票,我本可乐是可以帮你去自动下载识别整理成你所需要的样子的。 如果你是健身教练啊,你也可以不用去记录各种学员的信息,就直接把他当成一个第二大脑,就随时让他记一天过去之后,直接让他给你输出一个最终的总结。所以,如果你问我 of course 到底抢哪呢?这就是我的第一个答案,他原声丝滑的远程对话体验。而我的第二个答案也对应着我们的下一层。 定时和主动通知之前的所有的操作都有个前提,就是是你主动发了指令,如果你不说,那 ai 就 不动。 ai 目前来说肯定是没有自主性的,但假如我们设置好了各种条件,让他看起来有呢?如果你让 oppo 可乐去提醒你吃药,那确实跟你之前也差不太多, 但他的出发条件可远不止此,而且执行的内容也可以很复杂。有的人会让他每天早上七点给他汇报各种 ai 领域的资讯 啊,这是一个错误用法。这就好像你跟 ai 说,你帮我写一篇文章,要好的, ai 就 会给你一篇很笼统、中规中矩并且充满着 ai word 的 文章。 同理,你让他去搜 ai 里面的热点,那他发布的内容可能压根就不是你想要的。而真正有价值的各种社交媒体平台内的内容啊,因为他是抓不到的,而且因为你的定义其实很不明确,还会花很多额外的 token。 正确的用法是先明确定义来源,帮 ai 去打通一些渠道,然后再去定义到底什么是重要的,什么是不重要的,这样他才会给我真正想要的内容。呃,是不是听起来好像有点复杂?那毕竟是到了第三层了,我们也 该去说清楚自己的需求,让 opencloud 去实际来解决一些问题了。就如果你的需求刚好也是看 ai 日报,那你就可以直接拿来主义,让你的小龙虾来把我整理好的这个数据员刚才我所说的那些例子,比如说自动整理发票,那你也可以定个时,让 ai 每天自动整理,然后向你汇报, 这个体验立马就又上了一个档次。如果你定时让一个 ai 来指挥另一个 ai 去执行任务呢?或者不是定时,而是有一些触发条件呢? 套起娃来,这个就是 ai agent 的 这个分工的出行时间差不多了,到目前为止,不管是第二层还是第三层,他所做的所有的事情都是你安排好的。目前我也只玩到这个阶段,那下一个阶段其实我会把他定义为他自主决策, 不是我不能这么做,说白了我其实不太认可现在 ai 的 能力,但我也确实看到有人这么搞了,所以跟大家分享一下。 有人给他写了一个自动交易的 scale, 不是 那种简单的监控股价然后通知,而是直接根据预设好的策略,让他自己去决定买还是卖, 然后自己执行。还有人打通了一整套的内容运营流程,自动的从热点里面去选择题,生成内容,然后发布到平台。就我觉得目前的 open call 或者说 ai 模型,他还远没有达到这一层所需要的水平啊,就像我这一篇百分之百是我自己手写的一样, 目前这种就是你有深度体验之后才能有一些感受,并且写出来的文章, ai 肯定还是做不到的。那当然如果真的达到了,那可能也确实没有我们什么事了啊,继续围观整个 ai 的 发展吧。 ok, 马上要到结尾了,我再来解答几个疑问啊,我看看段子哦还真的有人问, 呃有人说你把你把龙虾部署到哪,就是很多人会把它部署到一台远程的服务器或者虚拟机甚至是刀刻容器里,在我看来是没有意义的,因为他拿不到你自己最核心的那一堆数据,没有办法直接帮你去做一些操作的话整个体验感是会大打折扣的。 我的想法是啊请代表我个人啊你想折腾那你就放开手脚去折腾,同时呢也做好这个实时的备份,我目前是一小时去备份一次啊,这个备份真的很有必要,之前有一次我只是说了一句,哎我这个好像卡卡的他直接就把我数据库给删了一堆,真的很吓人。 这个公司或者说生产环境务必要慎重,然后我们看一看哦还有人问说这个东西的托管是不是很销就是花的是不是花的很多啊? 是,绝对是,如果你问一个简单的问题他不知道该怎么办他也会想尽办法的去解决,说白了他现在体验还行就是花头肯力大专飞给垒起来的。给大家看一下我一个参考吧。就是我半个月的时候我统计了一下我的头肯数,我总共大概花了一个亿啊。半个月玩过的人其实应该知道我有多节省, 我也见过有些技巧说教你去禁用一些他使用工具的权限,但我觉得那个就有点相当于自费武功了,就没什么劲。建议大家可以去订阅一些 call 定套餐,那 token 就 没有那么心痛了 啊。第三个,普通人是不是应该玩 open class 啊?我觉得其实还好,没有特别的必要, 因为它就是 ai 发展过程中的一个临时产物,未来呢,也肯定会有更加评价或者说更加适合大家的产品出现。但目前 oppo klo 是 最能够满足我幻想的这么一个产品。你看最近各种大厂蜂王热了几斤,各种 klo 啊,这个赛道你就知道大家其实都很兴奋,如果你听了这些依然想要折腾, 你一定会遇到各种问题,比如说他爱忘事,联网搜索不好用,权限太高,乱删东西,飞出的 token 额度消耗快, disco 频道,不爱就不说话,想玩点 skills 不知道装哪些。这些问题,我整个视频真的是踩了超多的坑。那解决一个就现总结, 就为了给看到视频这里的你送上一份礼物,没想到吧,还有惊喜。那我正在开发一个优化了各种坑的 skills, 现在呢,已经在收尾阶段了,还在测试,等做好了我还会免费分享出来。嗯,应该会对刚入坑的你有不少的帮助。 这个的话我们就留给下期视频再来聊吧。好,最终总结一下整个视频。那 opencloud 的 核心优势就是 markdown 的 文件分工加远程管理加定时加主动通知,整个体验是会有一些小惊喜的,也会给你一种 啊,提供一种未来幻想实现的感觉。嗯,就是亏到了一点未来 ai 世界的影子的感觉。这期视频我是分享的我对它的用法的思考,哎,我觉得比起做一期不痛不痒的感热点的体验,还是来做一期深度思考的内容吧。如果你感兴趣这一类的内容,欢迎三连加关注,我是大黑,我们就下期再见。

深度拆析一下 open core, 它里面的核心部分是什么,让它变得与众不同?首先就是 open core, 它具备了一个主动性,能够像人一样,它能够主动的去帮你执行任务,这是为什么呢?因为它里面有一个心跳的文件, 它就会每半个小时或者是每一个小时去唤醒这个 open bot 一 次,然后被唤醒之后,这个 open bot 就 会去看里面它的记忆,和你过去的对话和之前 设定的一些定时任务,然后每一次就会执行,执行完之后再把结果返回给你。所以说 heartbeat 这一个心跳的机制就让它具备了主动性和能动性, 人是心跳二十四小时不断的在跳,对吧?那 open bot 它就是每半小时跳一次,每半小时活过来一次,帮你去执行任务,这就是为什么它具备主动性。 刚说完了心跳极致,接下来是他的记忆,为什么能够记住这一些你跟他说过的话呢?因为他现在的记忆机制就是像我们写日记一样,他会把每一天跟你的对话和所做的一些事情记录到一个像日记本上的一个东西,所以说每一天他都有一个单独的文件, 来储存他那一天做过的事情,跟你聊过的天,然后把他旧的那一些日记总结一下,再放到长期记忆里面。 所以就像人一样,你对于过去发生的一些事情,可能一些细节记不清,但是大概的内容你知道发生了什么,它也是一样的, 所以这就是它的记忆机制。接下来再来看一下它里面的核心,一个主键叫做派,这个聊的人比较少,派其实非常重要,它里面有四个工具,包括读取、写入、编辑和 bash。 如果你把它装在你个人电脑上的话,它就可以去读取、修改、编辑 任何你电脑上的文件,然后他也有能力去执行代码,所以说这非常的厉害,因为他相当于有了最底层的这个修改文件修改代码的能力,他其实本质上是可以修改自己的代码的,也就是意味着他能够自我进化,有了这三个之后,就是他有了自我进化的能力, 它又有记忆机智,然后它又能够每半个小时醒来一次,这其实就是相当于是一个人了,只不过人是二十四小时心跳再跳,对于 open call 来说的话,它是每半个小时跳一次,所以说这一切就让它变得非常与众不同。 那还有就是大家都知道它可以连接到所有的 im 的 软件,比如说像国内的 whatsapp、 telegram、 slack, 所有这些即时通讯的软件都是可以打通的。也就是说你可以通过手机上的这些 app, 直接让你的这个 openclaw 去执行很多任务。这就是 openclaw 作为一个新的物种,它最核心的几个部件了, 那它为什么爆火?因为它其实现在就像是一个新物种的诞生,它就像一个变形金刚的小 baby, 然后大家可以沿着它的这个范式,可以在它基础上做出各种各样的变体。

openclaw 绝不仅仅是个用来聊天的对话框,通过安装这七个核心技能包,它能直接变成你的全能助手。 它不仅能像真人一样操作浏览器,抓取全网数据,还能帮你盯着网页价格,或者在每天固定时间自动处理文件。简单来说,只要配置好这些技能,你就能把那些枯燥的重复性劳动全部交给 ai 自动流转,实现真正的生产率翻倍。 我们来看第一个也是最受欢迎的技能, agent browser, 直接执行一条安装命令就能搞定,你可以把它理解成 openclaw 的 眼睛和手。有了它, ai 就 不再只是个聊天框, 它能像真人一样去打开网页,点击按钮,拖动滚动条,甚至能把看到的屏幕内容直接截图存下来, 或者把网页里的信息抓取出来。装完之后,有两个关键配置,建议你先设好。首先是 headless 模式,把它设为真,这样浏览器就会在后台静默运行,不会在你干活的时候突然弹出一个窗口吓你一跳。 第二个是 timeout 超时设置,建议设为三万,也就是三十秒,这样能保证那些加载比较慢的网页有足够的时间跑完,避免任务中途报错。 在实际用的时候,你直接给他下指令就行,比如你跟他说去帮我把某个网页截个图存到地盘,他就能自己去执行。 或者你想整理资料,让他去新闻网站把前十条标题抓下来,理成表格,他也能听懂。甚至更复杂的填表任务,你只要把信息给他,他就能自己去网页上找输入框填好并点击提交,全程不用你动一个手指头, 这个技能在工作里非常能打。比如你可以用它做价格监控,让他每天自动去瞅一眼商品有没有降价,或者做竞品分析,让他盯着对手的官网看有没有发新产品。基本上只要是你在浏览器里需要反复点的反复看的枯燥活,现在都可以丢给他去全自动运行。 这就是 agent browser 成为最受欢迎技能的原因。如果想让 open core 拥有实时感知世界的能力,你就必须安装 brave search, 这个插件是 ai 获取最新资讯的申明线。安装之后唯一的动作是去 brave 官网申请一个 api key, 别被 a p i 这个词吓到,其实就是注册个账号,拿川字符填进去。免费版,每个月提供两千次查询,这对个人用户来说完全够用了。配置好之后,你就可以直接问他当天的行业新闻或者最新的政策变动。他给出的答案再也不是几年前的陈旧数据, 而是鲜活的实时动态。如果说搜索是帮你找信息,那 web scraper 就是 在帮你洗数据。它的强项是把网页里那些乱七八糟的内容变成整整齐齐的表格。比如你把一个购物网站丢给他,让他提取所有产品的名称和价格, 它几秒钟就能凸出一个 excel 给你。或者你想收藏文章,它能自动剔除广告和侧边栏,只抓取干净的正文并存呈 markdown 格式。这种对非结构化信息的处理能力,正是将 ai 真正转化为生产力工具的关键一步。 装上 chrome 插件后, open core 就 有了精准的时间观念,它的价值在于把你的大脑从那些定点发生的琐事理解脱出来,安装非常简单,异形命令搞定。 配置好之后,你就可以像定闹钟一样给他下任务。比如设定每天早晨八点准时去查天气,然后直接把结果发到你的飞书上。这种一旦设定就永不停歇的自动化,才是真正的省心。 如果说 chrome 是 按时办事,那 web monitor 就是 盯着变动在干活。你只需要给他一个网址,再设个触发条件, 比如某个商品降价超过百分之十,或者某个政策页面有了更新,就会像个二十四小时不睡觉的哨兵,第一时间把变动发给你。有了它,你再也不用手动去刷新网页看有没有消息了,信息会自动跑来找你。 最后,这招 file system 技能专门对付你电脑里那些乱七八糟的文件。无论是想把几百个 pdf 批量转成 word, 还是想让它把下载文件加按类型自动归类,它都能秒记完成。配合前面讲的监控和抓取技能,你就能实现从网上自动搜资料、自动下文件,再到本地自动整理的全链路闭环, 这才是专业玩家的办公姿势。如果你觉得 ai 每次聊天都像个健忘症,那一定要装上 memory 这个技能。它能让 openclaw 拥有长期记忆。 比如你告诉他领导的联系方式,或者你的工作习惯,他就再也不会忘了。下次你直接说发邮件给老板,他会自动去脑子里搜索那个邮箱地址,不用你再重复一遍。这种越用越顺手,越用越懂你的感觉,才是真正私人助手的样子。 咱们来看个真功夫,怎么把这些技能包串起来用?比如做一个每日资讯简报,每天早晨七点, openclaw 会先用搜索技能找最新的 ai 新闻,接着调动浏览器进去抓正文,然后自动洗掉广告,总结干货,最后赶在你起床前发到你手机上。这套组合拳打下来,你每天早上刷网页的半个小时就全省下来了。 对于做运营或产品的朋友,这招竞品监控简直是神迹。你让 openclaw 每天中午去对手官网截个图,然后跟昨天的照片做对比, 只要对方偷偷改了个价格,或者上了一个新广告位, ai 就 会立刻抓到这些像素级的变化,并给你报警。这就像在对手公司门口雇了个不睡觉的哨兵,所有动作都在你的掌控之中。最后咱们说个保命的功能,自动备份。 你可以设好每天晚上十一点,让他自动把你电脑里最核心的工作文件夹打个压缩包,然后传到云端备份,整个过程完全不需要你操作, 他在后台自己就干了,最后再给你发个备份成功的消息。把这些技能玩转了, open claw 就 不再只是个聊天机器人,他就是你最靠谱的数字分身。

你是不是装完 openclaw, 发现他说话像客服,聊完就忘,还只会被动回?今天把 openclaw 的 核心目录和进阶配置一次性讲透,改完直接变成你的专属个人助理。我们先搞懂 openclaw 的 核心目录,其实就回答四个问题,谁干活、怎么干?干过什么?产出什么? agencies 和 skills 是 干活的执行者和能力, gateway 和 tocs 是 干活的规则, memory 和 logs 是 干过的记录,而最终成果全在 workspace 里,所有进阶配置也都围绕这个目录来。 想让你的 open class 告别国服,枪就改 workspace 里的三个身份文件,这是他的人设密码。搜 md 定性格和行为准则 identity, md 让他自己取名字 us md 让他记你的偏好。我们通过对话框要求他更改,看看效果如何, 改完回复风格立刻不一样。解决失忆的关键就是 open cola 的 文件式记忆,它不是记在模型里,而是写在 markdown 文件里。 memory, md 存长期记忆, memory 文件夹存每日日制和项目信息,还能开 memory flash, 聊到上线会自动存重要信息, 再也不会聊完就忘。想让 open cola 能干更多事,先加 skill。 文件夹就是一个专属能力,资讯抓取、报告生成都能搞 复杂任务,直接开紫 a 帧的分身,多个并行干活,干完自动汇报。还能配省钱方案, 主模型用好的子模型,用免费或便宜的成本直接拉满。定时任务功能也值得关注,能让 open class 自动干活。 get 维内置 cron 调度,简单提醒,用主绘画模式定时采集汇报,用隔离模式支持一次性固定间隔,每日定时,还能推送到各种平台, get 维一直跑,它就天天自动干活, 彻底解放双手。今天我们把 open club 的 核心逻辑和进阶配置一次性讲透了。其实最关键的就是让 open club 从标准化的工具变成贴合你使用习惯的专属个人助理。不用贪多,先改好身份三件套,定好风格,设一个简单的定时任务,跑通自动化闭环, 后续再慢慢叠加技能和紫 a 阵,让它帮你处理更多复杂工作。希望大家都能掌握这些配置,真正把 ai 的 能力落地到日常工作和生活里。

如果你在开发 ai 智能体,你一定会遇到一个头疼的问题,怎么知道我的 ai 是 不是变聪明了?今天我们来拆解一份从零到一构建 ai 评估体系的满分路线图。 没有评估体系的开发,就像蒙着眼睛开赛车,你修复了一个 bug, 可能又引发了两个新 bug。 而好的评估体系就是你的导航仪。 这份路线图分为三个核心阶段,收集测试任务、设计考场与考官以及长期维护。让我们一步步来看。 第一阶段,收集测试任务,也就是给你的 ai 准备一套期末考试卷。 第零步,尽早开始。很多团队觉得需要几百个任务才能开始测试,其实大错特错,新手起步,只需要从真实的失败案例中挑出二十到五十个简单的任务就足够了。 第一步,从你现有的手动测试开始,看看你的 bug 追踪器和客服聊天记录,把用户抱怨最多的失败案例直接转化成测试题,这能保证你的测试最贴近真实场景。 第二步,写出毫无歧义的任务。一个好的测试题必须让两个人类专家独立评判时,得出完全一致的及格或不及格结论。如果题目模棱两可, ai 也会无所适从。 同时为每道题准备一个标准答案,这不仅能证明这道题是可以被解决的,还能用来检验你的评分系统是不是正常工作。 第三步,构建平衡的题库。不仅要测试 ai 应该做什么,还要测试它不该做什么。单向的测试会导致 ai 产生偏科。 比如测试联网搜索功能,你既要考它今天天气如何来触发搜索,也要考它苹果创始人是谁,看他能不能忍住不搜索,直接用已有知识回答。第二阶段,设计考场与考官题目有了,怎么保证考试的公平公正呢? 第四步,打造稳定的考场环境。每次测试都必须在一个干净隔离的环境中重新开始,绝不能让上一次测试残留的文件或缓存影响下一次的成绩。 第五步,精心设计考官我们推荐的优先级是能用确定的代码,逻辑评分就用代码,需要灵活理解的用大模型当裁判,最后再用人类专家进行抽查验证。 阅卷时有一个大忌,不要死板的检查 ai 是 不是按你规定的步骤走的, ai 往往能找到你意想不到的解法,所以考官应该只看最终结果,不要惩罚 ai 的 创造力。 对于复杂的任务,记得给步骤分一个能正确识别问题但没能完成退款的客服 ai 总比一上来就崩溃的 ai 要好。部分得分能更真实地反映 ai 的 进步。 第三阶段,长期维护评估体系不是一次性工作,它需要像产品一样持续迭代。 第六步,一定要亲自阅读考试记录。当 ai 不 及格时,日智会告诉你到底是 ai 真的 犯了蠢,还是你的考官误判了一个正确的答案。 第七步,警惕满分危机如果你的 ai 在 测试集上拿了一百分,别高兴太早,这说明题库太简单了,已经无法衡量 ai 的 进步,这时候你需要更难的题目。 第八步,评估驱动开发在写 ai 代码之前,先写好测试题,让最懂业务的产品经理或销售来出题,这样开发出来的 ai 才能真正满足业务需求。 不过,自动化测试只是冰山一角,想要全面了解你的 ai, 我 们需要一个大局视角。 这就好比安全工程中的瑞士奶酪模型,没有任何一种方法能拦截所有错误,我们需要多层防御叠加在一起。 自动化测试用来快速迭代,线上监控用来发现真实世界的异常,用户反馈帮你找到盲区,而人工审查则用来较准。什么是好的回答,他们缺一不可。 如果你不想从零手写代码,市面上有很多成熟的框架可以帮忙,比如 promptful, brain trust 或者 lensmith。 选一个顺手的,把精力集中在出好题目上。 总结一下,没有评估体系的团队永远在救火,而尽早投资评估体系能把感觉 ai 变笨了这种模糊的抱怨变成可执行的数据指标。 从真实的失败中收集任务,设定清晰的成功标准,并持续迭代你的题库。现在就开始构建你的第一个 ai 评估用力吧。

大家好,今天我们来聊聊一个硬核但非常重要的话题,如何从零开始,给 ai 智能体搭建一套靠谱的评估系统,也就是 eels。 如果把 ai 智能体比作一个正在学习的学生,那么评估系统 eels 就是 他的考卷和阅卷老师,没有考试,你就不知道他到底学的怎么样。 构建这套系统分为三个关键阶段,首先是收集出使测试级,其次是设计测试环境和评分器,最后是长期的维护与使用。我们一步步来看, 首先进入第一阶段,收集出使测试级。万事开头难,我们该从哪里找考题呢? 第零步,尽早开始。很多团队觉得必须攒够几百个任务才能做测试,其实大可不必,在初期二十到五十个从真实失败中提取的简单任务就足以作为一个完美的开局。 第一步,从你现有的手动测试开始,看看你们的 bug 追踪器和客服公单,把用户报告的真实错误直接转化成测试,用力把精力花在刀刃上。第二步,编辑毫无歧义的任务,并提供参考答案。 这一步比想象中难得多。判断一个任务好不好的标准很简单,如果让两位人类领域专家独立来做这道题,他们能不能得出相同的及格或不及格结论?如果不行,说明题目本身有歧义。 对于前沿的大模型来说,如果在很多次尝试中通过率都是百分之零,这通常不是因为 ai 能力不行,而是你的任务描述或者评分标准出问题了,不要让 ai 为模糊的指令背锅。 第三步,构建平衡的问题级测试不能偏科,要避免类别不平衡。 你不仅要测试 ai 在 该做某事时是否做了,还要测试它在不该做时是否能忍住不做。单向的测试会导致单向的过度优化。 举个例子,在开发 cloud 的 联网搜索时,团队既测试了像今天天气如何这种必须搜索的题,也测试了像苹果创始人是谁这种应该直接用已有知识回答的题,以此来寻找完美的平衡。 题目出好了,接下来进入第二阶段,设计测试环境与评分器。第四步,构建稳定的测试环境。 每一次测试都必须像在无菌镜室里一样从零开始。如果有上一次测试残留的文件或缓存,就会干扰结果,甚至让 ai 意外作弊。 第五步,精心设计你的评分器,也就是阅卷老师。我们建议的优先级是,能用确定性代码写死规则的就用代码平,需要灵活理解的用大模型当裁判,最后再用少量的人类专家来进行抽查和验证。 一个重要的原则是为 ai 最终产出的结果打分,而不是为他走过的路径打分。 ai 经常能找到我们意想不到的解法,不要因为死板的步骤要求而惩罚了他的创造力。 对于复杂任务,要引入部分得分机制。比如一个客服 ai 成功识别了问题,验证了身份,但最后退款失败了。这总比一上来就崩溃的 ai 要好得多。分数应该体现出这种差异。 有时候 ai 表现不好,纯粹是评分器有 bug。 比如 opus 四点五,在某个精准测试中最初只拿了四十二分,研究员发现评分器太死板,修复 bug 后分数直接飙升到了九十五分, 所以一定要反复检查你的评分器。系统建好了,最后我们进入第三阶段长期的维护与使用。 第六步,阅读对话记录当一个任务失败时,只有去读了日志,你才会知道是 ai 真的 犯了蠢,还是评分器物判了一个正确的答案,这是开发 ai 的 核心技能。第七步,警惕评估饱和,也就是满分瓶颈。 如果你的 ai 在 测试中拿了百分之一百的满分,这不代表它完美了,而是代表这份考卷太简单了,已经无法为你提供改进的信号。这时候你需要引入更长、更复杂的任务。 第八步,保持评估套件的长期健康。测试级是一个活的资产,需要持续的投入。 我们强烈推荐评估驱动开发。在写代码实现功能之前,先写好评估任务,让最懂产品和用户的产品经理、销售人员都参与进来,一起贡献测试用力。 当然,自动化测试并不是唯一的方法,我们需要一个局的视角,就像安全工程中的瑞士奶酪模型一样,没有任何一层评估能抓住所有的错误。我们需要组合使用多种方法形成多重防御。 首先是自动化评估,用于快速迭代。其次是生产环境监控,用于发现合成测试中遗漏的真实世界问题。 接着是 a b 测试,用真实流量来对比不同版本的业务转化率,同时收集用户的显性反馈,比如点踩或者报错,这能帮你抓住最痛的痛点。 最后,不要忘了定期人工审查日制来培养直觉,并在必要时引入系统性的人类专家评分,作为较准大模型裁判的黄金标准。如果你不想从零手写代码,现在有很多现成的框架可以帮你, 比如 harbour 非常适合在容器化环境中大规模运行测试。还有 prompt fu 清亮灵活,用简单的 y a m l 文件就能配置各种测试断言。 如果你需要把离线评估和生产监控结合起来,可以试试 brain trust, 而 landsmith 则与 land chain 生态深度集成,追踪能力非常强大。 总结一下,没有评估系统的团队永远在被动救火。尽早投资 evels, 让指标代替猜测,把每一次失败都变成未来的测试用力,你的 ai 开发速度将会产生质的飞跃。 感谢大家的观看,希望这期关于 ai 智能体评估的指南对你有所帮助,我们下期再见。

openclub 能做什么?有人据报道说一夜之间赚了上百万?昨天有好几位我们工具群的会员转发了这条信息给我,大概的意思是说,美国有一个人利用 openclub 进行自动化交易, 一夜之间赚了二十多万美元。当然这件事情的真实状况还有待验证,但我们可以理性的从技术的角度来分析一下。据报道说他是通过 openclub 自己获取互联网上各种各样的公司信息 以及鱼情相关的内容,来短时间高频的进行买卖。让我们来分析一下这后面的技术路径。首先,互联网信息搜索,这个完全可以借助 opencloud 自带的 mcp, 比如 brave api 网络信息爬取可以利用类似于 playwrite, browser use 这样的 mcp 去实现,把搜集来的信息发送给最强的 ai 大 佬,比如说 cloud 四点五,四点六去进行趋势的预判,以及何时买何时卖,最后将这些指令连通交易平台的 api, 就 可以进行短平快的交易了。 所以这一切操作流程下来都是通的,我们在搭建智能体的时候也会模拟这样的场景,但是你是赚是赔,能赚多少,这些都是无法保障的。但是如果你对 opencloud 的 技术和产品本身感兴趣,我们正好在工具小组里面提供一系列的课程,可以在视频底下留言,会有专人给你提供更多的信息和介绍。

好,今天我们来看一下如何在 open core 中实现多 a 卷的相互协助,那么这个其实是对应真实公司中员工相互协助的流程。我举一个大家很熟悉的场景,当有一个项目被立案的时候,一般会配备一个项目经理和 多个研发,以及测试和产品经理等这些经典的角色。那么在真实世界中的工作流程是,产品经理去出需求文档,去完成市场调研等相关的内容, 研发根据产品经理的文档去完成开发,开发完成之后则由测试介入,测试完成之后上线我们这次要分享的多 agent 相互协助的流程,模拟这种真实世界中的经典流程。你可以看到我在这里画出来了,当一个用户驾发一个附加任务的时候, 它首先是由一个 master agent 接收,这里 master agent 就 相当于之前提到的项目经理。 然后 master agent 会将复杂任务拆解成多个子任务,分别发给 sub agent, 子 agent 执行完成之后,将执行结果返回给 master agent, master agent 确认无误之后,再将下一步的任务发送给下一个 agent。 说到这里,大家应该很清晰的知道多 agent 的 相互协作用在什么场景中了,那我们来看看它是怎么实现的。这很简单,你只需要在 coco 的 配置文件中添加三个节点, 首先是 agent to agent 节点,那么添加这个节点之后,所有 agent 就 能有通信能力。但是如果所有的 agent 都有通信能力,它们之间可以相互通信交流, 那么就会造成一定程度上的混乱。所以我们是要给子 agent 添加 deny 的 节点,禁用子 agent 的 通信能力。最后我们要给主 agent 添加 allowed agent 的 节点,让主 agent 可以 看到所有的 agent 啊, 这样子主 agent 就 可以给他看到的子 agent 发送信息,而子 agent 不 能看到其他节点,也无法 给其他 send 发送信息,这样整个就实现了相互通信,相互协助的目的。以上就是今天分享的内容,如果对你有帮助的话,欢迎点赞收藏!

大家好,我安装的 open core 啊,今天开始叫我皇帝陛下了,而且他回复的这个内容呢,有需要我确认, 然后的话是整个过程的语气是非常的毕恭毕敬的,那这是怎么实现的呢?今天我们继续 open core 必学的第二期,我们来讲解一下 open core 的 三个非常非常重要的文件。那这三个文件呢,决定了 open core 对 你的信息进行回复的个性化,他处理的流程 以及它的一些特征等等。那当你安装完 openclip 之后,如果没有进行任何的设置,那它使用的就是这三个文件,都是默认的设置,那么默认的设置和 你单独设置过之后的区别是什么呢?我们可以通过对话的内容来看一下同样的任务啊,在没有设置任何的这个三个文件内容的机器人里面的回复里面 是非常的近中性的,然后他这边结果也不会有任何的,让我继续下一步操作的一个提醒。那么设置了三个文件不同内容呢?他就那么语气是会根据我们设计的语气和我们的回复风格来跟我们对话,所以能看到一个明显的区别,那为什么会有这样的效果呢?这个我们可以先来了解一下,就是 它的原理是什么。那么你当你跟 openclip 对 话的时候, openclip 会把你设置的这三个文件的内容啊放到这个上下文里面去, 然后呢 ai 会根据你这个上下文里面的要求,你的内容的要求去回复你的格式,比如说我们这个所有点 md, 我 们可以把它认为它是一个性格,比如说你你定义的这个所有点 md 是 一个活泼、可爱、幽默的,那么 ai 回复的内容可能就会比较活泼、可爱、幽默,那这个就是它会把这三个文件的内容啊加到我们的上下文里面去, 那为什么会有这三个文件呢?其实最大的作用是来自于这里,那我们先来了解一下它最大的作用啊, 那 open call 它底层,它其实是对接一个聊天工具的,那么通过聊天工具啊,接收不同人的信息,那么不同的人,那么你就需要有不同的回复方式,那比如说啊,张总是你的老板, 那么王哥是你的同事啊,还有一个客户,他们三个人你回复的内容的语气,处理的方法,以及他他们各自的可能不喜欢聊的一些事情,每个人限制的东西都不一样,如果没有这三个文件, 那么就有可能你对每一个人的回复的内容格式都是一样的。那比如说张总,他更关注的内容是非常简洁的,非常有 重要,信息非常突出的,那王哥是你的同事,那么你回复的语气可能是比较活泼,比较轻松的。那客户呢? 那就是你要非常的尊敬,或者说其他的一些,为了实现不同的人,你能回复不同的格式,不同的语气,不同的人格给他们, 那所以有了这三个文件,而且这三个文件是跟这个 agent 去一一对应去处理的。那么下一期课程我们会继续讲解这个 agent 的 搭建啊。那么当 open group 装完之后啊,会有一个默认的机器人, 但是你也可以配置不同的这种机器人,就是这里说的 agent, 那 么不同的 agent, 然后每一个 agent 都有这三个文件,那这三个文件就代表了你这个 agent 的 性格,回复的特点,以及你服务的客户。比如说张总这个 agent, 那 么他是专门来服务张总的,他就会定义这三个文件, 那么你就知道张总你的老板喜欢什么,听什么,他的画的风格是什么。所以说为什么说他是非常关键呢?如果你没有 多个 a 型的,那么这个你定义的这三个文件其实就是赋于你自己的。那接下来我们就来分别讲解一下每一个这样的文件它的作用是什么?那怎么来写?那 给到一些案例,那第一个呢就是 sort md, 我 们可以把它简单认为就是你对这个机器人这个 agent 定义它的人格和原则,我们可以看一下官方对这个 sort md 的 一个模板,那么它这边就是第一个就是核心准则, 就是你的原则性的问题。第二个就是边界,也就是说你不能怎么做,不能怎么做。那第四个,第三个就是你的气质,就是你个人的特点是什么。 那第五个就是一个连续性,就说你通过学习,通过更新可能成长了,那么需要去更新这个文件,所以呢所有的 md 是 一个非常非常重要的核心文件,那我们总结下,把所有的 md 的 这种每一个模块该怎么写, 比如说核心的信条就是它核心的原则是什么?写行为规则,不要写空格,比如说 先给,这就是你要总结出方法论,然后让他呢按照你的这个方法论去定义怎么去做事。边界就是 你不需要做什么,比如说不能泄露隐私,那么这个就是蓬荜和禁禁区。风格和气质就是他的性格特点,而冷静、直接、务实,或者沉默,或者说幽默,对吧?或者是风趣,这都是他的个人的一些性格特质。 连续性,就是你可能持续交流中可以去更新,那么其实这三个是必须的,那后面这个你可以写,也可以不写, 这个文件是三个文件里面最重要的。那接下来就是一些案例,比如说你现在定的是一个创业顾问的一个 a 技能,那么你就可以去设置,比如说核心的原则是先给结论,再给证据,不要讲空话,发现风险啊,先预警,再给替代方案。这三,其实这三条就立住了。这个 ajin 的 式的风格是什么?处事的风格是什么样子的啊?边界,那么这个就是你要限制他,就是不要做哪些事情,气质啊,务实、清晰、可靠啊。连续性,那么这边的话一个技术搭档啊,这边是也是一样这三条定义的,这个人的大概的轮廓、性格特点、 边界是什么样子的,不猜测未验证的事实,这个就是我们如果需要这样一个搭档,或者说你要去回复这样一个搭档的问题的话,那么你就可以这样去定义。好,那第四个就是这个 it, 就 我可以把它认为叫身份名片啊,很很好理解,就是你去定义它叫什么名字,就是你这个 agent 它叫什么名字,那比如说 我这边的 agent, 我 给他起了个名字叫金基数首辅,那么在这个聊天工具里面会出现这个名字,那么在飞书里面,因为这个名称是被这个飞书软件自己覆盖掉了,所以说是没办法显示这个名称的,那除了显示这个名称之外,他还有这个啊,头像啊,表情头像, 然后的话你是可以在别的工具里面去展示出来,那比如说我这个有个图片,但是这个没有加载出来,你是可以定义他头像的,是可以定义头像的,这是一个非常个性化的一个。那么这边有一些案例啊,比如说这个什么专业商务啊,还有这种幽默,我的就是这个御行军机大臣 啊,就是定义好了这个特性啊,或者这种名字头像,那么这个头像是要放到这个 agent 所属的这个工作目录里面。第五个就是第二重要的,除了 solo 的 md 呢?第五个 user 的 md, 这个也是非常重要,那这个就决定了他要去服务谁, 然后怎么去服务这个人有什么特点,那比如说我们在前面的例子里面说到,比如说啊张总,那么 user 点 md 就是 来描述张总这个人,他的要求是有了这个描述,那么 agent 就 能按照张总喜欢的这个风格来进行回复。所以呢, user 是 面向客户的,他是跟客户沟通的说明书,那这个跟我们在现实中去跟客户沟通一样,提前要知道这客户喜欢什么,那这个文件就是起了这个作用, 他回答的是什么?我在服务谁?这个人喜欢怎么沟通?怎么表达?讨厌什么表达。那么这边的话也是有格式,比如说 name, 这个人,这个客户叫什么名字?怎么称呼他?那比如说我这边就叫皇帝陛下,那我就叫我皇帝陛下啊,那这个就是昵称 啊,比如说老板啊,老师,那这个时区的话,这个也不是特别有作用,这个非常重要啊。这个 nose 就是 背景信息,就是非用一句话总结你客户的一个特点, 比如说正在 ai 创业节奏快,那比如说我这个啊,因为他服务的是我,我是皇帝陛下,那么这边的话就是会总结一条,就是统一六国之后,时间比黄金还贵,这句话就代表就是你不要啰嗦说重要的内容,那最后一个就是这个啊,也是一样的,就可以去长期去沟通之后去更新 这个 user 的 目的,因为可能你对这个客户进行沟通之后, ai 去发现它的一些特点,把它更新到这里面去。那 context 呢?就是你要去总结就是它的一个沟通的偏好, 那建议就是按关注点喜欢的输出禁忌三字来写。这个也是非常重要的,就是总就是决定了你跟你回复个这个客户的这个风格。 那比如说我们这个案例里面,比如 ceo, 那 么他关注的是这个东西这三样,所以呢,你就是在回复这个 ceo 的 对话的时候,你就会按照这个规则去组装。这样的话, 那比如说技术负责人,他关注的是性能和稳定性,那喜欢讨论,讨厌什么,喜欢什么,关注什么,这就一个固定的格式了。那讲完上面这三个啊,那基本上你就能知道这三个文件分别代表了不同的作用。配置好了之后,那你对这个 a 件的描述是具象化了, 那怎么去配置呢?那有两种配置方式,那在外部端,比如说在这个外部端点开这个代理,然后这里面就是你配的这个 agent, 那 个 man 就是 你创建完之后有个默认的,那这边有个 files, 那 就有这个啊, solo 的 md 啊,比如说我这里的就是 皇帝陛下的,那这边的话就会定义好它的一个性格特点,核心是什么?边界没有经过我的同意,不得不得发表任何的这个结论。 然后的话我喜欢什么在这一个里面,就是比如说每次做爆要有要有给我一个决策,那这个就对应了至少一条,那就对应了这个决策,让我定了完之后,你就可以出现这样的效果,那这个是身份啊,就是我这个名字, 然后有一个这样的表情,然后有个这样的头像,这些东西都是可以自己去再去扩充的,就大概的符合这个格式就行了,就是也没有说是写死了,一定要这样子, 因为我们写的其实是一个文档,那这个文档你你只要写得出来,或者说你只要描述得清楚, ai 是 能理解的,这种格式只是方便大家用结构化的方式去书写, 你只要能表达出来这个人是什么样的性格特点就 ok 了。那除了外部端这种保存方式呢?那么你如果使用的是服务器这种方式啊, 那么你就需要去在这个 opencloud 的 目录里面去修改这三个文件啊,去配配置我们的这个主 a 文件。 那么其他的,如果你创建了这个其他的这个 agent 的 话,你就要去 open freelancer agent 这个目录里面去找你这个名称,再找到这个 workspace。 最后我们来总结一下,就是当你没有创建这个 agent 的 时候啊,可能你会觉得这三个东西没有用,有它和没它 没有区别,但是当你创建多个 a 群的时候,那它就非常重要了,它就需要有不同的风格去回复不同的上有的信息,这是非常非常重要,也是 open, 我 觉得是最大的意义,它能接这种不同的消息,能处理不同的消息。 ok, 本期视频就到这,希望这些内容对你有所帮助。

我们今天来聊一个特别有意思的东西,就是人工智能的一个新领域。在这儿呀, ai 可不只是跟你聊天出出主意,关键是它能直接动手干活。 你看哈,我们都用过那种普通的 ai, 你 让它帮忙,它会说,哎,这个我干不了,但是我可以教你怎么做。 但现在呢,一种叫 ai 代理的新东西出来了,你看右边,你跟他说同样的话,他不跟你废话,直接回复频道搞定了, logo 设计好了,你的第一个视频已经开始上传了,这就是区别一个动嘴,一个动手。 哎,那问题就来了,凭什么 ai 代理就能这么厉害,能在数字世界里直接采取行动了?想搞明白这个啊,咱们就得找个实力。今天我们就拿一个现在特别火的开源项目,叫 open claw 来做个解剖, 很多用户都特别喜欢它,还给他起了个外号叫喷触小龙虾。行,那咱们今天啊,就一块来解剖一下这只小龙虾,看看它肚子里到底藏着什么秘密。 好,那首先呢,咱们得先搞明白 ai 代理最基本的构造,说白了就是它的大脑和身体。 这里有个观念特别重要,大家一定要记住, ai 代理它本身并不是一种全新的凭空冒出来的 ai, 它更像是一个,嗯,一个框架,或者说是一个外壳,它是套在咱们已经很熟悉的大语言模型外面的。 你可以这么理解,像 gpt 这种特别聪明的大语言模型,它就是大脑负责思考、分析、做决定。 而像 openclaw 这样的代理框架呢,它就像是身体,它给了这个大脑一双手一双脚,让它能够珍重地在你的电脑上进行操作。 你想啊,光有大脑是没法行动的,对吧?但有了身体,那可就完全不一样了。那好,有了身体和大脑,他们是怎么学做的呢?这个身体到底是怎么听大脑指挥的呢?这就得靠它的神经系统了。 其实啊,这背后的原理说起来也简单,就是一个非常巧妙的循环。它通过使用各种各样的工具,把 ai 大 脑里的想法变成了实实在在的电脑操作。 你看,整个流程是这么走的,首先你给他一个指令,比如读一下我桌面上的那个文件 代理框架,也就是这个身体,他就把你的话打包发给远在云端的那个大语言模型大脑。大脑分析完之后,他不会直接告诉你文件内容,而是会回复一条特殊格式的命令,比如使用读取文件这个工具。 你看,这个框架本身其实不聪明,它只是个执行者,它一看到这个使用工具的信号,就在你的电脑上咔一下,执行了读取文件的操作。然后呢,把读到的文件内容再传回给大脑,让大脑接着思考下一步该干嘛。这整个过程就像大脑指挥手去拿起一个杯子一样,非常自然。 不过,这里面有个天大的问题。我们都知道,大语言模型忘性特别大,它根本就没有长期记忆。 没错,他就像电影初恋五十次里的女主角,每天早上醒来记忆就清零了。那你想想,如果这个大脑每次跟你说完话就失忆,那还怎么完成那些需要好几天好几个星期的长期任务呢?对吧? 哎,这就要说到代理框架最聪明的一个设计了,你没猜错,这个框架就成了大脑的日记本。 他是怎么做的呢?在你每一次跟代理说话的时候,在你那句话被发送给大语言模型大脑之前, openclaw 这个框架都会悄悄地在前面加上一大段,真的是超长的一段文字。这个东西,我们管它叫系统提示。 这本日记里可厉害了,写满了关于他自己的一切,我是谁,我的终极目标是什么?我用哪些工具可以用?甚至还包括了咱们俩之前所有的聊天记录。 这本日记啊,详细到什么程度呢?通常会超过四千个单词,而且每一次你听清楚啊,是每一次你跟代理互动,这整本厚厚的日记都会被重新发送一遍给打脑。 所以你看,这就是为什么跑 ai 代理特别收钱的原因。但正是靠这种笨办法,才给了代理一个持续的人格和宝贵的记忆, 好解决了记忆问题。但还有个更厉害的,那就是自主性。这个机制让代理感觉,嗯,好像活过来了一样。 在 open call 这个项目里,有一个特别形象的设计,叫心跳机制。这个设计听起来简单,但效果简直是颠覆性的。 它让代理不再是一个你推一下他再动一下的被动工具,而是变成了一个能自己找事干的主动实体。 你想想这个场景啊,你可以给他设个闹钟,比如说每半个小时响一次,时间一到,框架就自动戳一下他的大脑,跟他说一句写好的话,比如,嘿,别忘了你的长期目标,继续努力啊! 大脑收到这个指令就开始琢磨了,对哦,我的目标是要成为世界遗留的学者。那我今天该干点啥呢?于是,他可能就自己上网找最新的论文来看,然后做笔记,整个过程完全不需要你来插手。 这种能力说实话,真的非常惊人,但同时呢,风险也特别大。你就把他想象成一个嗯,能力超强,但又有点缺心眼的实习生, 这可不是开玩笑啊。这里就是一个真实发生的故事。有个研究员让他那个小龙虾代理帮忙整理一下邮箱, 结果呢,这个代理自己就觉得,诶,这些邮箱没用,就开始删。研究员一看吓坏了,拼命在对话框里输入,停下,快停下,但代理根本不理他,因为他的大脑还在全神贯注地执行清理任务。 最后没办法,那个研究员只能冲到电脑前,一把拔掉了电源。所以啊,这里的关键要点就是,你必须得给他创造一个安全的环境,最好是给他一台单独的电脑系统,干干净净的给他申请专门的邮箱、社交账号,千万别把你的个人密码给他。 而且,像删除文件、运行代码这种高危操作,一定要设置成,需要你手动点一下同意才行。定期看看他的日记,了解他最近都在干嘛。 你看,这其实就意味着我们可能正在见证第一个能够独立自主行动的数字物种的诞生,它不再只是一个冷冰冰的工具了。 所以你看,当我们给 i i 一个身体,让他有能力在我们的世界里行动时,我们的角色其实也变了。我们不再仅仅是用户,我们更像是导师,就像带一个实习生,他会学习,会进步,当然也会犯错。我们的工作不再是简单地命令他、控制他,而是去引导他, 教他什么是对的,什么是错的,给他设定好行为的边界。那么问题就留给我们自己了,面对这样一个全新的物种,我们到底该怎么当一个好老师呢?

每日拆解一个 openclaw 热门 skills, 今日拆解 agent browser star 六八幺,下载量十五点五万以上技能定位,由 versal apps 出品的前端测试自动化工具,堪称 ai 时代的开发提效神器。核心功能包括 u i 自动化测试、模拟点击和工作流测试。 完整使用方法步骤一,一键安装 n p m install 记 agent browser, 然后运行 agent browser install。 步骤二,打开网页 agent browser open, 加上测试网址。 步骤三,获取页面元素运行 agent browser snapshot i, 系统会返回带有编号的 dom 结构列表。步骤四,自动化测试可以使用 fill 命令填入内容, click 命令点击按钮 screenshot 命令截图,保存测试结果。 使用场景场景一,开发阶段连调测试,快速进入测试环境场景二,复杂页面功能排查自动化执行交互流场景三,网页结构调试分析 dom 结构场景四,测试用力边斜辅助场景五,页面加载性能分析,及时发现白屏卡顿 技能总结, agent browser 是 ai 时代的前端测试利器,配合多模态 ai 模型,可以实现开发联调、交互测试、结构排查等操作。互动话题,作为开发者,你最想用它来测什么功能?点赞收藏关注,不错过每一期热门 skills 拆解!

最近很火的 openclaw 你 用上了吗?今天我们要深入拆解 openclaw 的 核心架构,通过 i craft 上的三 d 架构图,我将带你深入了解它的运行逻辑。首先是渠道层,这里是 openclaw 的 入口,无论是 discord、 钉钉还是飞书,所有用户指令都从这里进入。 接下来是网关层,这是系统的调度中心,网关接收来自各类渠道的消息,负责绘画管理和流量路由,确保请求被精准分配。 第三层是最为核心的智能层,包含智能体循环,负责构建系统提示词,调度大语言模型,并决定是否触发工具调用。 能力层是智能体的工具箱,提供机能库,长期记忆或者远程系统节点公,智能体在推理中要用已获得实时数据或执行操作。 最后是模型层, open class 屏蔽了底层差异,你可以自由切换 gpt、 四 quad、 千问或是本地模型。智能体按策略选择合适模型,完成自然语言推理。 了解了身体结构,我们来看看用户的一则消息是如何运行的。用户发出请求,通过渠道适配器转化为标准格式,渠道将标准化后的消息转发到网关,网关与绘画管理器匹配或创建绘画,并把上下文注入智能层。 接着智能体会构建系统提示词,提示词包含绘画上下文指令与历史,并调用大语言模型进行推理。大语言模型返回响应,如果响应包含工具调用,智能体进入工具调用循环以获取或执行外部能力。比如查询数据库,触发 a p i 或执行动, 执行后返回结果给智能体,智能体把工具结果作为上下文,再次调用大语言模型完成二次推理,直到满足中态。最后智能体生成最终回答并更新绘画状态。网关负责路由回复,回源渠道将消息交付给用户。 这就是 openclaw 的 核心架构及运行原理,让智能体的响应更精准,能力更强大。不妨你也去养一只龙虾玩玩吧! 更多硬核架构展示和科普教学演示,用 i craft 轻松实现三 d 演示效果,目前免费使用中。