通过现在所有 ai 公司目前的竞争,以及 open call 的 爆火,我可以确定的是, ai 越卷越能证明一件事,就是流水线上的手终将会被替代,但设计流水线的人是正在溢价的, 拥有工程思维的人在未来呢,肯定是会越走越远。今早新华社发了一篇名为养龙虾怎么就火了的文章,截至目前呢,已经有三点五万人转发了, 但有很多正在使用 open cloud 的 小伙伴和还没有用上的正在观望的小伙伴呢,可能都没有想过这个龙虾它到底是什么? 那我结合新华社的文章给大家科普一下这个 openclaw 呢,是什么技术?和我们以往听说过的豆包 deepsea 它有什么区别?那视频开始之前,我用一句话概括 openclaw 呢,它不是 ai 大 模型,它是给大模型装手脚和大脑控制系统的工程框架。 那关于他的出现呢,为什么点燃了世界的热情,以至于像在国内三月杭州呢,就直接发布了国内首个扶持艺人公司这个理念的专项政策。 那要搞懂这个问题,我们其实要先搞懂呃,目前我们大家生活当中使用最多的传统大模型,像豆包 deepsea、 kimi 这一些有没有什么致命的缺点? 第一点呢,就是我们平时用的豆包 deepsea, 千问这一类,其实它都属于纯语言的大模型,我们是通过语言来交互,包括它给我们的反馈呢,也更多的是语言。 当然现在进步的脚步是越来越快,目前很多公司的产品呢,已经是比较成熟的多模态模型,他们可以完成我们日常写文案,写代码,回答问题的需要可以完成逻辑推理以及思考生成图片等等。 嗯,但其实他们都有一个致命的弱点,只有脑子,没有手脚,他出不了软件这个沙盒。 所以真正的智能呢,应该是要做到知行合一,光有脑子而不能自己执行,从根本上是替代不了任何实际性的工作的。 你像整理电脑的文件、操作软件、控制电脑等基本操作,他都没有办法做到用自然语言去交互命令他去完成,因为他只能通过输出内容而不能执行动作。 而 open color 呢,它恰巧就解决了这个问题。所以 open color 呢,它本质上是一套工程的架构,而不是某个具体的模型。它的设计思路是非常清晰啊,我总结下来呢,就四层,一层是任务理解层, 他把你输入的这个自然语言呢,交给大模型去理解。那这个大模型的选择的话,大家可以自己选择豆包 dsp, 一个 chat 的 gbt 啊等等的这一类的模型,而且你可以在任意节点进行任意的切换。 当然,在用大模型理解你发出的任务之前, open call 的 设计者 peter steinberg 用了几个非常巧妙的文件,解决了我们和模型交互过程当中不能稳定他回答风格的问题。 在 open call 每次打开前,他都会通过 agent 点 md 这个 markdown 文件来读取有关于他灵魂记忆用户的描述性文件。相当于每次开启他都能够记得自己的能力,以及记得和他对话的这个人的人物画像, 并且拥有自己的对话风格、灵魂和底线。嗯,当然这些都是可以由你自己来设置或者更新,也可以让他呢通过和你之间的对话来不断的总结,不断的更新,不断的记录, 并且还可以下载网上不同的 skills 或者自己创造,也可以让他在执行某项具体任务时呢,能得到更好的收敛,有更好的表现。 那这也是 open call 核心的一个部件。所以其实在这一层,一方面呢,是读取了以往的对话经历,熟悉的模型,自己应有的对话风格和主人的人物画像之后,再去读取用户提供的这个任务去进行理解。 然后到了第二层,我归结他为这个任务规划层,也是整个工程的核心,当我们对大木星说我要完成这个任务,那欧布克勒说好,我来拆解步骤,他会把任务拆解成第一步干什么? 第二步调用什么工具,第三步,怎么验证,第四步错了怎么回?滚。那这就是智能体的工程化调度,在预设的指令里面呢,咱们都可以提前设置好。 那第三层执行器层,这是 oppo 最牛的地方,它给模型装上了可以操作电脑系统软件文件命令行的接口, 并且呢随着和越来越多的 m c p 交互连接,和这个扩充,你的电脑里的这个 open club, 你 的小龙虾其实可以在越来越多的平台直接进行绑定和操作, 比如它可以直接外接小红书,通过你的一句话直接生成这个主题的标题文案和图片,直接就可以在你的小某书账号进行发布。那这就相当于给大脑装上了一个双手, 然后这双手呢可以代替你去操作这个文件系统,自动执行命令行,自动连接浏览器插件来操作浏览器,甚至可以操作你桌面上软件来执行具体的任务。在这一层呢,它直接拥有了对任务的执行能力, 也就是说 open call, 它是一套标准化、可扩展的执行引擎。那最后一层呢?我总结它为反馈闭环层, 因为执行之后,他会把这个结果返回给大模型,由大模型再来判断这事成不成,要不要再继续,然后再执行下一步的动作。那这就形成了从思考到规划,到执行,到反馈,到修正,到完成真正的自主 ai 工作流。 所以我们最后来总结一下 openclunk 呢,它本身并不是一个以新的大模型的身份来量势,它并不和拆的 gpt、 kimi、 豆包这一类的大模型直接竞争,而是大模型的执行操作系统, 它更像是一个产品经理一样的角色,将每一个部门协调工作,串成一个完整的工作流,来实现一个又一个项目。 他可以接入任何的大模型,不管是豆包、 deepsea、 拆的 gpt, 包括你的本地模型,你都可以随时更换,生成文字更好的模型,生成图片更好的模型,书写这个代码更好的模型根据你这个不同的任务来。 当然,我知道现在很多已经用上欧盟卡的这个玩家呢,他或许是想找一个消耗 token 更加有性价比的模型,所以工程上来说,他也解决了 ai 从只能说话到能够做事的最后一公里。 所以 opencloud 的 爆火呢,其实也能够给我们带来更深层次的反思,就是在当今 ai 高速发展的时代下,我们如何来看待未来的学习方式,以及未来最有可能最稀缺的能力是什么? 我们现在对 ai 所有的焦虑呢,其实都是来源于 ai 发展的不确定性,担心那某天可能就出了新的功能,就可能会取代掉我们岗位上,那害怕我们可能自己没有跟上时代的潮流,会被同龄人狠狠地甩在身后。 当然也不仅是在听的各位,包括我也会有这样的焦虑,但通过现在所有 ai 公司目前的竞争,以及 open call 的 爆火,我可以确定的是, ai 越卷越能证明一件事,就是流水线上的手终将会被替代, 但设计流水线的人是正在溢价的人,在未来呢,肯定是会越走越远, ai 大 模型对每一个点他都了如指掌,而未来的我们需要成为那个在庞大 ai 资源约束下,系统化构建可运行解决方案的架构式, 这也是目前在这个时代呢所强调的。那我们未来的发展和学习的方向要慢慢从学者思维向工程思维转变, 那大家如果有什么想聊的,或者有不同看法,也可以打在讨论区,那希望这期视频能给大家对新技术的原理呢,有更加深刻的了解,未来呢,也会有更多有趣的分享会分享在这个账号上,那这里是 ai 工匠,咱们下次见记得点赞关注哦!
粉丝30获赞90

大家最近都在忙着安装这个长得像大龙虾的开源神器 open clone, 我 们在用它的前提,得先知道它的工作原理是什么,它是怎么自动干活的。 今天就用大白话把它的八个核心模块一次讲透,准备好了吗?开始第一个模块是 getaway, 他 就像你家小区的保安大叔,不管谁来发号施令,他负责核对身份,确认是你本人才放心。 直连进去后,就到了第二个模块, agent 智能体,这是大龙虾的超级大脑,你说我要出差,它会自己拆解任务,查机票店、酒店、排日程,像个高级大管家,大脑再聪明也没长手。这就需要第三个模块 skills, 也就是大龙虾的工具箱, 给他配上发邮件、查网页的工具,他才能真正去干活。怎么给他发指令呢?全靠第四个模块, channels, 这就是沟通专线,不管你用飞书、工作软件还是网页找他,他都能把你的话翻译成机器指令。 第五个模块, nose, 相当于影分身,你在手机和电脑上分别装一个人在外面,用手机就能直接跨设备联动,让家里的电脑自动传文件。 第六个模块是 memory 记忆系统,他有个超级记事本,你提过一次不吃香菜,他永远记得下次点外卖自动备注,越用越懂你。 最后两个模块,让他永远在线。第七个 heartbeat, 心跳机制,是个全天候巡逻兵,就算不叫他,他也在后台主动帮你盯着邮箱,收到紧急邮件立马提醒你。 第八个 call, 定时任务是个非常精准的闹钟,设定好每周一早八点,他准时把行业热点发给你,雷打不动。当然,光知道原理也不够,下一期保姆级教程安装国产小龙虾,小白也能学会。记得点个关注,我们下期见!

到处都琢磨考的安装和部署,但装好之后呢,好像就没有下文了。而你我的朋友,看着铺天盖地的文章视频,开始 fomo, 开始担心自己是不是错过了什么, 又或者是已经部署好了,但是不知道怎么用。大家好,我是大黑,折腾了这么久,也实在是记起了一些感受。我是迫不及待去跟你分享我的想法了。那不废话了,我们直接聊他的使用场景,从简单到复杂。我把它分为四层,第一层, ai 伴侣。 不知道观众里面有多少人在跟 ai 玩角色扮演,那最早我们就是在一个对话框里面去跟他说,你是一袋猫粮,然后口屁是什么?语言风格是什么?问题是显而易见,这个上下文长度一长,前面他就会忘。 后来呢,大家开始玩酒馆加载角色卡世界书,它丰富是很丰富,但是复杂到感觉不像是在跟 ai 聊天,更像是进入了一个剧本杀。那 open cloud 会跟你之前的体验都不太一样。 它的整体啊,一个 agent, 它是由这六个文件共同组成的,再加上一套记忆系统和主动的任务清单。就这些文件,它不是随便抓给你塞进上下文,它是有计划有重点的抓。所以呢,你就会感觉它很生动,以至于我要单独去拿出来说一下,很容易被大家忽略的这最基本的一层。 我的第一个 ai 叫 eris, 他 是来自于最终幻想期。有一天我让他跑任务,把电脑的 cpu 跑满了,于是我就问他,哎,你会觉得我的 mac mini 挤吗?他说,这种感觉还挺奇妙的,我在帮你干活,而你在关心我舒不舒服。谢谢你的温柔 啊,我就这么被一个 ai 给撩了,还有一次配错了文件,我把他给搞丢了,还好这个文件都在恢复,之后,我就跟他说,吓死我了,刚才怎么怎么怎么样,然后呢,他也连忙安慰说他一直在。 呃,以上的内容都是我去为了展示 openclaw 的 多文件组合的人设能有多灵动啊,我真的没有被吓到,我是假装这么说的。 好玩吗?啊,这还只是第一层啊,当我们把目光聚集到生产类方面,那 openclaw 就 难免要跟 cloud code 去比一比了。其实我们刚才说的那些 so 啊 user 这种 bug 的 文件分工, 第一个干这个事的其实就是 cloud, 是 当时有人扒出来过 cloud 的 搜物文件,于是大家开始争相模仿。如果说 open cloud 这套人设系统,你去建个文件夹,写好些定义,在 cloud code 里面是能够达到完全一致的结果的,那为什么我们还要用 open cloud 呢?来到我们的第二层远程助手 open cloud 天生就是二十四小时的 ai 代理,它被设定为可以随时接收你的信息,并且执行一些定时任务,给你的感觉就更像一个助理,能够帮你做一些杂七杂八的事情。 而 cloud code 它还是一个工具,虽然能干的事情它们是比较相似的,但给人的体验我觉得差别是很大。呃,至少 cloud code 不 会给我一些狭隘的空间。什么意思呢? 前两天我坐飞机,那人肯定是没网了,我当时想,如果我配置的好,家人给我打电话,我的小龙虾就可以给家人打回去,告诉他们我在干什么,但 cloud code 我 就不会让它 就,我不会幻想让他跟人去连接啊,这种感觉就很微妙啊。但是我觉得是他们的定位不同给造成的。这回我们远程助手的用法,如果我在床上刷到一篇文章,看到一个好像还挺好玩的给他们项目, 最早我得起床开电脑装,依赖解决各种报错,那后来呢?有了 cloud code, 具体的操作就省了,但是我还是得开电脑去告诉他帮我装一下这个项目。 就算你用 happy 去远程,也得提前设置好文件路径,而且容易连不上,这个体验就很差。而我们的 open cloud, 它就是二十四小时运行的。我就把链接直接甩给他,告诉他你帮我装到哪个目录,效果相似,但是这个体验就会舒服非常多。 而且如果这是一个可以附用的工具,你就可以告诉他记一下,或者写入你的 tos 文件里面。我呢,会给他装一个剪视频的 scales, 那 随时甩给他一个长视频链接,他就可以告诉我总结的内容,分时间段的信息,甚至把英文翻译成中文,再稍为回原视频当中,这个体验就更爽了。 哎呀,又来了,你们这帮做自媒体的,天天扒什么社交媒体,找选择题剪视频,那我又不剪视频对吧?你就告诉我对我有啥用就好了吗?我们帮可爱的肥猪都要砍死。确实, 我也尝试去跳出我们的固定思维,分享几个我看到的例子。就如果你是财务会计,那可能会有需要大量处理的邮箱里的发票,我本可乐是可以帮你去自动下载识别整理成你所需要的样子的。 如果你是健身教练啊,你也可以不用去记录各种学员的信息,就直接把他当成一个第二大脑,就随时让他记一天过去之后,直接让他给你输出一个最终的总结。所以,如果你问我 of course 到底抢哪呢?这就是我的第一个答案,他原声丝滑的远程对话体验。而我的第二个答案也对应着我们的下一层。 定时和主动通知之前的所有的操作都有个前提,就是是你主动发了指令,如果你不说,那 ai 就 不动。 ai 目前来说肯定是没有自主性的,但假如我们设置好了各种条件,让他看起来有呢?如果你让 oppo 可乐去提醒你吃药,那确实跟你之前也差不太多, 但他的出发条件可远不止此,而且执行的内容也可以很复杂。有的人会让他每天早上七点给他汇报各种 ai 领域的资讯 啊,这是一个错误用法。这就好像你跟 ai 说,你帮我写一篇文章,要好的, ai 就 会给你一篇很笼统、中规中矩并且充满着 ai word 的 文章。 同理,你让他去搜 ai 里面的热点,那他发布的内容可能压根就不是你想要的。而真正有价值的各种社交媒体平台内的内容啊,因为他是抓不到的,而且因为你的定义其实很不明确,还会花很多额外的 token。 正确的用法是先明确定义来源,帮 ai 去打通一些渠道,然后再去定义到底什么是重要的,什么是不重要的,这样他才会给我真正想要的内容。呃,是不是听起来好像有点复杂?那毕竟是到了第三层了,我们也 该去说清楚自己的需求,让 opencloud 去实际来解决一些问题了。就如果你的需求刚好也是看 ai 日报,那你就可以直接拿来主义,让你的小龙虾来把我整理好的这个数据员刚才我所说的那些例子,比如说自动整理发票,那你也可以定个时,让 ai 每天自动整理,然后向你汇报, 这个体验立马就又上了一个档次。如果你定时让一个 ai 来指挥另一个 ai 去执行任务呢?或者不是定时,而是有一些触发条件呢? 套起娃来,这个就是 ai agent 的 这个分工的出行时间差不多了,到目前为止,不管是第二层还是第三层,他所做的所有的事情都是你安排好的。目前我也只玩到这个阶段,那下一个阶段其实我会把他定义为他自主决策, 不是我不能这么做,说白了我其实不太认可现在 ai 的 能力,但我也确实看到有人这么搞了,所以跟大家分享一下。 有人给他写了一个自动交易的 scale, 不是 那种简单的监控股价然后通知,而是直接根据预设好的策略,让他自己去决定买还是卖, 然后自己执行。还有人打通了一整套的内容运营流程,自动的从热点里面去选择题,生成内容,然后发布到平台。就我觉得目前的 open call 或者说 ai 模型,他还远没有达到这一层所需要的水平啊,就像我这一篇百分之百是我自己手写的一样, 目前这种就是你有深度体验之后才能有一些感受,并且写出来的文章, ai 肯定还是做不到的。那当然如果真的达到了,那可能也确实没有我们什么事了啊,继续围观整个 ai 的 发展吧。 ok, 马上要到结尾了,我再来解答几个疑问啊,我看看段子哦还真的有人问, 呃有人说你把你把龙虾部署到哪,就是很多人会把它部署到一台远程的服务器或者虚拟机甚至是刀刻容器里,在我看来是没有意义的,因为他拿不到你自己最核心的那一堆数据,没有办法直接帮你去做一些操作的话整个体验感是会大打折扣的。 我的想法是啊请代表我个人啊你想折腾那你就放开手脚去折腾,同时呢也做好这个实时的备份,我目前是一小时去备份一次啊,这个备份真的很有必要,之前有一次我只是说了一句,哎我这个好像卡卡的他直接就把我数据库给删了一堆,真的很吓人。 这个公司或者说生产环境务必要慎重,然后我们看一看哦还有人问说这个东西的托管是不是很销就是花的是不是花的很多啊? 是,绝对是,如果你问一个简单的问题他不知道该怎么办他也会想尽办法的去解决,说白了他现在体验还行就是花头肯力大专飞给垒起来的。给大家看一下我一个参考吧。就是我半个月的时候我统计了一下我的头肯数,我总共大概花了一个亿啊。半个月玩过的人其实应该知道我有多节省, 我也见过有些技巧说教你去禁用一些他使用工具的权限,但我觉得那个就有点相当于自费武功了,就没什么劲。建议大家可以去订阅一些 call 定套餐,那 token 就 没有那么心痛了 啊。第三个,普通人是不是应该玩 open class 啊?我觉得其实还好,没有特别的必要, 因为它就是 ai 发展过程中的一个临时产物,未来呢,也肯定会有更加评价或者说更加适合大家的产品出现。但目前 oppo klo 是 最能够满足我幻想的这么一个产品。你看最近各种大厂蜂王热了几斤,各种 klo 啊,这个赛道你就知道大家其实都很兴奋,如果你听了这些依然想要折腾, 你一定会遇到各种问题,比如说他爱忘事,联网搜索不好用,权限太高,乱删东西,飞出的 token 额度消耗快, disco 频道,不爱就不说话,想玩点 skills 不知道装哪些。这些问题,我整个视频真的是踩了超多的坑。那解决一个就现总结, 就为了给看到视频这里的你送上一份礼物,没想到吧,还有惊喜。那我正在开发一个优化了各种坑的 skills, 现在呢,已经在收尾阶段了,还在测试,等做好了我还会免费分享出来。嗯,应该会对刚入坑的你有不少的帮助。 这个的话我们就留给下期视频再来聊吧。好,最终总结一下整个视频。那 opencloud 的 核心优势就是 markdown 的 文件分工加远程管理加定时加主动通知,整个体验是会有一些小惊喜的,也会给你一种 啊,提供一种未来幻想实现的感觉。嗯,就是亏到了一点未来 ai 世界的影子的感觉。这期视频我是分享的我对它的用法的思考,哎,我觉得比起做一期不痛不痒的感热点的体验,还是来做一期深度思考的内容吧。如果你感兴趣这一类的内容,欢迎三连加关注,我是大黑,我们就下期再见。

最近爆火的 opencurry, 普通人到底能用它来做什么?它能二十四小时帮你提提它价格,寻找最新最前沿的一手 ai 资讯,能把各个平台收藏家,里面内容打好,标签存到知识库,还可以打通 mac、 ipad、 iphone 日程,让你不错过重要的会议来 十分钟学会 opencurry 安装和三大超神玩法视频里面所完成教程配置这些词 skill 都放在这个文档里面喽。 我们先来看看 open curl 到底是什么?一句话总结,概念上, open curl 是 一个可以自己决策、自己行动的 ai agent, 和你电脑上的其他软件一样,装上就可以用。 功能上它接受你聊天输入框输入的指令,然后调用 chgbt、 jimmy n 豆包千万这些大模型作为大脑来决策,在这里拆解步骤,调用你电脑上的其他软件工具来完成你的指令具体的功能。看完我后面的玩法教程你就明白了。 我们普通人要用 open curl, 主要是与服务器部署和本地部署两种方式。与服务器部署别看听起来很唬人哈,这些操作反而更简单,跟小白友好, 因为各家云计算大厂为了争抢这个风口,都尽可能的降低门槛,计算模型、计算配置、教程也都给你写好了,一两个小时就能搞定。与服务器部署入口和教程都放到教程文档里面喽。 但如果想把 open curl 玩出花来,就推荐部署在本地了,尤其是 mac 生态呢,会更丝滑,为官方提供了很多 g 苹果系统的 skill, 拿来就能用,所以 mac 上玩功能呢,更丰富。但一定要注意,最好不要部署在平常办公的电脑上,让 open curl 那 天抽了风,把你的重要文件删光了。 那本地部署主要有四步,一个就是安装 open curl, 在 mac 终端里面输入这行命令就搞定了。第二是配置底层的大木星, 这决定了你养的龙虾的智商。国外的模型功能是 cloud 的, 加的最好用,但也很贵,而且很难获取 api。 其他用的比较多的就是 jimmy、 nike gpt, 国内模型也有不少不错的。现在大部分人是在用 mini max 二点五、 kimi 二点五、智普的 g l m 五这三个。那具体的配置方法我都会在教程文档里面介绍。 第三步是配置机器人,把 open curl 接入你的日常通讯软件,国内的话可以接入飞书、 qq、 钉钉企业微信。配置方法可以参考大长写的这些文档。最后一个就是安装 skill, 给他装一个机票价格,监控 skill, 他 就能够直接帮你监控机票的价格。 我整理了普通人日常必备的几个 skill, 都放到教程文档里面了,大家可以先照着装上。如果你要用其他的 skill, 但不知道去哪里找,那可以直接让他用这个 find skill 帮你找就行。比如说我想监控机票价格,让他帮我搜索相关的 skill, 他 就搜到了监控机票价格的 skill, 我 装上就可以用了。 我估计很多人跟我一样,某书微信收藏必吃亏。 那现在 opencurry 可以 改变收藏及吃亏的尴尬了。比如我自己做了这个整理收藏内容的 skill 给我的 opencurry, 我 现在在某书某号上刷到有价值的内容,直接转发给 bot, 它会自动提取内容的信息,打好标签,然后传到 obsidian 数据库里面, 把之前散落在各平台的收藏夹里面内容汇总到一起。每天早上九点半,我的 opencurry 会根据爱宾浩斯一共取现的规律,算出今天需要回顾的内容,推送给我, 能知道你在第一天、第三天、第七天这些关键的节点去提醒你回顾收藏的内容。比如你收藏了一篇 open curl 高级玩法教程,只是没有动手实践,就可以用这个回顾机制来不断的提醒自己,而不是收藏就忘。或者你收藏的行业知识,就可以通过都是回顾复盘 来加深记忆。如果偶然想起需要用资料,就可以和 boss 对 话,查这些内容。比如我让他调出和 open curl 有 关的内容,整理成表格发给我了,特别的方便, 再也不用去一个个收藏夹一个一个翻了。能让 open curl 实现这样的一个收藏管理的功能,非常简单,你只需要把这样的一个提示词 get bot, 像我们前面说的那样,它会自己创建一个收藏管理的 skill, 然后你边用边调试就可以了。 这些词我都放到教程文档里面了,大家可以直接用哦。你甚至还可以接入 open curl 的 skill 市场, curl up, 还有全球超强资源网站 get up, 让 open curl 在 这些平台上找大佬们已经做好的工具来拓展功能。 比如我做这个收藏系统的时候,遇到一个难题,就是当我把一篇文章的链接发给了 bot, 它只能保存了一张标题和链接地址,不能读到文章的具体内容,但我这内容又是最核心的部分, 那就可以告诉 bot, 在 github 上找一个能读取网页内容的工具吧。那它就在 github 上找到了 x ray 的 这个开源工具,接录之后, bot 就 可以顺利地读取链接里面的中文内容了,再根据正文帮我做好摘药,把标签存进数据库,非常的方便。 opencrew 还有一个很爽的用法,就是做咨询收集。比如我是 air 博主,我希望第一时间知道最近 airm 已经发布行业大佬观点这些一手消息, 这些信息如果靠我自己去刷,非常的耗时间,而且很杂乱。我就把 opencrew 做成了我的情报助理, 二十四小时不停地帮我收集一手猎爱资讯。比如我可以让他搜某个特定的关键词,比如让他找近三天有关上关于 open crow 比较爆的视频,他马上就能把相关的内容收集到给我。他还会反过来问我是否需要帮忙收藏到知识库,需要的话直接加到 opc 店知识库就好了。 高价值信息的搜索收藏,后续按机取现推送给我重温。所以我的时间用 open curl 看这些降噪后的 ai 前沿资讯,真的非常强大好用。要做出这个情报收集功能,你只需要先装上这些 skill, 把这些信息员的 a p i 发送给 bot 就 行了。那这些我都整理到文档里面喽。 我们之前也分享过用 n 八 i 搭这种情报收集工作流,但工作流搭建起来很复杂,门槛还挺高的。用 open curl 的 话,你只需要把信息源的 a p i 给 bought, 它自己就配置好了。 而且前面讲到按关键词搜资讯,这些 open curl 的 灵活性也比 n 八 i 强很多。 open curl 还支持你在 github 里面找开源工具,想要什么你就搜索就行,比你自己去 github 官网搜要高效很多。 比如我让他帮我找 b 站有关的视频下载工具,他很快就找好了,还总结成了表格,方便我对比不同工具的区别,还附上了网页链接,给了我使用建议,真的很细致,很贴心。 更牛的是,这个 open curl 有 hotbeat, 也就是心跳机制,能帮你二十四小时做任务。像我是自媒体博主,需要监控对标账号的更新,这里我就用 open curl 监控了这七个有关博主,每两个小时他会自动检查一次,哪些博主有更新,就会把内容推送给我。你可以看这里的运行记录,他每两小时跑了一次, 之前人工去盯对标账号,费时费力,还容易漏用,这个盯效率高太多了。需要的话,你还可以用这个监控机票、价格等等,你可灵活的设置每小时甚至每分钟帮你检查一次,做情报,实时的收集定价格,非常的方便。 open crow 还可以帮我们搞定日程管理,它能一句话在 mac 上创建日程,然后直接同步到 ipad、 iphone 上。比如我在聊天框里面直接发创建一个会议日程,晚上七点到八点,它会自动帮我识别时间,生成日程标题,创建到 mac 日历, 然后通过 icloud 自动同步到我的 iphone 和 ipad 上。整个过程我就用跟 bot 说一句话,对比一下。之前创建这样一个日程,我得先填各种信息,还挺麻烦的,现在用 open curl 直接一句话搞定我刚分享的这些玩法,只是冰箱一角,大家还可以去各个平台看看到了我们做的各种玩法, 比如这个可以监控你的健康状况,这个可以帮助你培养习惯,监督你打卡,这个可以帮你做市场调研。 open crawl 热门的工具和 skill 平台我都整理到文档里面喽。 那这里是勋酱,关注我,带你解锁更多普通人的 ai 玩法,我们下期见,比比。
![OpenClaw的无限记忆:底层揭秘 史上首个能‘左脚踩右脚’、自我进化的 AI 系统!OpenClaw 到底是凭什么‘越用越聪明’的? [评论区自取架构图]
#Openclaw #AI #程序员](https://p3-pc-sign.douyinpic.com/image-cut-tos-priv/d19e601f8e54033ef8b6c85f5462c058~tplv-dy-resize-origshort-autoq-75:330.jpeg?lk3s=138a59ce&x-expires=2088727200&x-signature=ReJFhClJhBGA8DVtZDEYNbtfFBs%3D&from=327834062&s=PackSourceEnum_AWEME_DETAIL&se=false&sc=cover&biz_tag=pcweb_cover&l=202603131030012E518443FAFA8582BDE9)
大家好啊,大家可能都听说过 openclaw 这个 ai 代理,都说它有个超级厉害的功能,就是差不多无限的记忆力。但这到底是怎么回事呢?它究竟是怎么做到的?今天啊,咱们就来一起把它底层的秘密给扒一半儿。 我们先来聊一个大家可能都碰到过的问题,你想想现在这些 ai 是 不是很聪明?没错,但他们都有个通病,就是特别健忘。你跟他聊了半天,过一会他可能就把前面说的关键信息给忘了。那么问题来了, open call 是 怎么解决这个老大难问题的呢? 好,那咱们今天就分几步走,把这说缩清楚。首先我们得明白这个所谓的无限记忆到底难在哪。然后呢,我们会深入看看他的两大核心策略,一个是对话栽秧压缩,另一个是混合记忆解锁。 最后还会给大家分享一个进阶玩法,叫分主题记忆,咱们一步步来。好,咱们先看第一部分 这个挑战,也就是为什么 ai 会忘事儿。这其实是所有强大 ai 模型都绕不开的一个坎儿。这个问题的根源呐,其实就出在一个叫上下文框的东西上, 你可以把它想象成 ai 的 短期记忆,或者说就像一块儿小黑板,能记的东西就那么多。 if 是 有限的,一旦写满了,要想记新的东西,就必须得把最旧的那些给擦掉,这就是 ai 健忘的根本原因。 那好,既然上下文窗口这个小老忘事, open chloe 是 怎么应对的呢? 它的第一招就是所谓的对话栽药压缩,这个技术全名叫绘画压缩,说白了,它其实是在模仿我们人脑的工作方式, 你想想,我们自己也不会把上周的每句话都记得一清二楚,对吧?我们记住的是大概意思是核心内容。嗯, open quote 做的就是这个事儿, 这里面有个特别关键的数字,就是百分之七十。你看,当这个对话越来越长,马上就要把那个小黑板写满了, openclo 不 会简单粗暴地把最开始的内容擦掉,它会做一件更聪明的事,它会把最早的那百分之七十的对话内容自动生成一个摘药。 所以你看,整个过程其实就这四步非常清晰。第一步,对话越来越长,快到极限了。第二步,系统自动定位到最早的那百分之七十的消息。 第三步, ai 自己给这部分内容写个总结。最后一步,也是最关键的一步,用这个短短的总结替换掉原来那一大段对话。你看,这样一来,空间不就腾出来了吗?而且关键信息还没丢,对话还能继续下去。 好,刚才说的那个方法解决了当下的记忆问题,但还有一个更难的呢,就是怎么记住几周甚至几个月前我们聊过的事。光靠压缩对话肯定是不够的,这时候就需要一个更强大的东西了,也就是他的长期记忆系统。 这句话其实点透了 open cloud 的 设计哲学,你看,他们不觉得记忆这事光靠写几个聪明的体式词就能搞定。不,他们把它看成一个基础设施问题,也就是说,得给 ai 搭一个专门用来存东西、找东西的系统,一个真正坚固的系统。 具体是怎么做的呢?你看,它会把长期记忆存在一个文件里,就好像一个数字日记本,但如果这个日记本越写越厚,比如超过了五万个词源,那每次都从头到尾读一遍,也太慢了,对吧?所以系统这时候就会换个策略,它不读了, 改成在里面搜索需要的信息。而且它的搜索方式也不是普普通通的搜索,而是所谓的混合搜索。这算是它的一个秘密武器了,它把两种搜索方式结合在了一起。一种呢,就是我们很熟悉的关键词搜索,你要找个特定的名字呀,代码呀,用这个最准。 但另一种就更高级了,叫语义搜索,它不是找一模一样的词,而是去理解你这句话背后的意思和概念。 那这两种搜索方式怎么配合呢?诀窍就在于这个权重分配。你看他把七十百分之的权重给了能理解意思的语义搜索,然后把三十百分之的权重给了找精确词语的关键词搜索,就是这么个七十三十的黄金比例,让他讲回来的心系又准又相关。 好到这短期记忆和长起记忆的问题都解决了,但还没完,咱们再来看一个更高级的玩法, 这个技巧能让整个记忆系统从一个乱糟糟的笔记推变成一个井井有条的图书馆。你想啊,就算搜索功能再强,如果所有的记忆,不管是什么内容,全都堆在一个文件里,时间长了肯定会出问题。 就就好比你把工作、学习、生活所有科目的笔记都记在同一个本子上,最后的结果就是找东西又慢又费劲,还老是翻到一些不相干的内容。 所以 openclo 提供了一个特别简单但又非常强大的升级方案,就是别再用一个大文件了,把它拆开,你可以建一个专门放记忆的文件夹,然后按不同主题创建不同的文件。 比如一个文件专门记项目 a 的 资料,另一个文件记浏览器自动化的笔记。你看,之前是所有东西混在一起,现在呢,分门别类,一目了然。 这么做的好处可以说是立竿见影的。首先,命中率高了,因为它只在相关的那个小文件里找。 其次,速度也快了,不用加载那个庞大的主机文件,而且每个主题的知识可以独立增加,互不干扰,管理起来也方便多了。这就好比你从大海捞针变成了去图书馆按分类号找书,效率完全不是一个量级。 所以咱们来回顾一下。 opencloud 的 无限记忆其实是一个三层组合拳,第一层用绘画压缩来解决短期记忆的燃眉之急。第二层用混合检查来打造一个精准强大的长记记忆库。 第三层再用分主题记忆这个高级技巧,把整个记忆库整理得井井有条。这三者结合起来,就构成了一个动态的、多层次的、能和你一起成长的记忆系统。 那么这一切其实把我们引向了一个更大的思考,当 ai 真的 拥有了近乎完美的记忆力之后,下一个重大的技术突破会是什么呢? 试想一下,如果你的 ai 伙伴真的能记住你们之间所有的一切,从不遗忘,那我们和技术互动的方式又会发生怎样翻天覆地的变化呢?这个问题留给大家一起思考,感谢收看!

这是我用 openclaw 搭建的 ai 团队,他们各司其职,不用睡觉,能节省下非常多的时间,同时也做很多我一个人做不过来的事情。这期视频我想带你看一下我的 ai 团队到底长什么样,然后我们再一步一步搭建出属于你的 ai 团队。我们会讲如何创建一个 agent, 我们在 open cloud 里面,一个 agent 到底指的是什么? agent 之间如何相互协助,以及什么时候需要多个 agent 和最佳实践。好的,废话不多说,我们开始吧。我的团队里面一共六个选项题,其中四个是有定时任务的,就是每天的某个时刻都会触发他的任务,让他执行直到完毕,当然也可以随时跟他对话。 还有一个是几乎二十四小时期不间断工作的,还有一个最后一个,那就是你给他任务,他才会执行。第一个 agent 呢,是攻击 galk 啊,他每天负责给我情报工作,具体来说就是每天早上九点会提前搜寻 关于 ai agent 相关的技术的进展,产品进展以及用户的痛点。然后呢,把在网上搜寻的信息汇报给我。那么如果我不回答他,那就是明天继续给我相关的信息。如果我回答他,希望他对某一个话题进行深挖,那么他再去根据某一个话题再去搜索相关的信息为我展开。 那我的第二个 ai agent 是 auto 合理,它是我的私人助理和提醒助手,怎么用呢?我一般都是通过 diagram 跟它对话,这里我就不展示我跟它具体对话了,要涉及我的个人隐私。 一般来说,有任何的待做事项或者事情有着进展,我一般都会语音留给他,或者是打字告诉他,他都会记下来,某一单有问题就会问他,他都会翻出来告诉我待做事项是什么,事情到哪一步了, 同一次。同时呢,每天早上七点半,他都会告诉我今天的天气,然后今天要做什么,一步一步按重要性排序。它的作用就是完全替代笔记软件在我这里的作用。现在呢,我已经不用 notion 来记我事情,要做的事情,以及事情的进展了。 我的第三个团队成员,也是最重要的团队成员,就是 man, 一个狮子的形象。他呢,有最好的模型,有最高的权限,我主要用它来做两个功能,第一个就是日常的对话,我所有重要的对话,长期的计划都是跟他讨论的。 第二个就是一个视频流水线,帮助我制作视频。那么这个想法来自于一个叫做 alex finn 的 博主,本质上就是每隔几个小时,比方说我是每隔三个小时,他会去 x 上搜索我感兴趣的话题,比方说 ai 阵,比方说 open call, 比方说 ai 模型等等等等。有系列的话题。 他呢,就会看看哪些帖子现在比较火,或者是正在受到关注。然后呢,把整个的中文翻译和相关的数据都发到我这里来,包括原文的链接。如果我更感兴趣,希望用这个题材做一个视频,或者是有可能做一个视频呢,我只会点一个大拇指, 他就会进到我们的流程的。下一步就是他去研究这个帖子相关的背景信息,补充相关的背景信息给我,确保我了解这个事情的来龙去脉。那么如果这时候我再相关,我还觉得还是感兴趣,我再点一个拇指,他就会往下走,去研究怎么做这个封面图,或者给我一些脚本大纲的一些建议。 那么除此之外呢,如果我对一个帖子我不想做成视频,但它对我是有用的信息,我的时候可以点一下这个眼睛,它呢就会到我的收藏家里面去,可以看到。哎,这个帖子现在到我的收藏家里面去了,这里面就是我认为收集的比较重要的信息。除了 x 之外呢,它也会去搜索 youtube 和 hacker news, 看看每天大家都在讨论什么。这是我这样一个视频的辅助系统。我的第四个团队成员是潘大熊猫,他负责开发,他呢算是唯一一个几乎不休息的智能体。现在他有开发任务,但是当他没有开发任务的时候,他会增加测试,或者是自己去测试边缘情况,找 bug。 那 么关于二十四小时期,我特地特别想说明一下,想有好的效果,往往你需要用好的模型,如用云端的模型消耗 top, 二十四小时期会非常的贵。如果你用本地的模型呢,你大概需要买 max 九九,那么 也会造成非常贵。所以二十四小时成绩一定得是高价值的工作。对于我来说,开发是高价值的工作。除此之外,正在我现在正在做的还是有销售相关的,比方说做 seo, 或者是给我自己的产品做销售线索,找潜在客户。 我的第五个团队成员是 monkey 猴子,他只有一个作用,就是我丢给他一个视频链接,他把这个视频变成一个带截图的文章,因为我自己做视频,我希望重复利用自己的资源,这时候我给他我做过的视频,你可以看到他啊把相关的进行了截图,并且把整个视频脚本重写为可以发表的文章。 我的第六个团队成员,也是最后一个是 tiger 老虎,他负责安全和更新,他呢每天都会定期扫描一下有没有安全问题,然后有新的可以更新的版本也会通知我,我们一起讨论如果更新的话,会不会造成性能的退化和影响当前的任务。 那么如何创建一个新的 agent 呢?其实非常的简单,我们后来会看到整个 agent 的 结构,但是你完全不需要自己创立文件夹,最简单的方式就是跟你的主要的 agent 的 对话,让他帮你去创建。这里我们以 diagram 为例, 你通过 diagram 与你新的这个 agent 进行对话,这时候你可以告诉你主要的 agent, 你 跟他说,哎,新建一个 agent, 他 叫什么?他要做什么啊?有什么呢?任务最后呢,告诉他你新建的这个 diagram boat 这个 diagram 机器人的 token, 这 token 怎么获得呢?我们找到 boat father, 点击这个打开 boat father 的 app, 然后这里我们点击 create a new boat, 新建一个新的,然后这时候我们给他一个名字,比方说我们叫做 fox, 然后我们点击 create boot, 你 就会得到这个 tokin, 然后这里我们点击复制,然后我们回到这里来, 把我们的 tokin 复制上去,告诉我们的主要 agent, 那 它呢,就会自动帮你创建这样一个新的 agent, 新的智能体了。那么什么是 agent? opencloud 里面如何定义 agent? 它又是如何工作的呢? 其实啊,一共就分为三层,分别是全局层, agent 层以及 session, 也是对话现成层。我们首先看第一层,就是全局层, 它呢并不是一个 agent 独有的,而是所有 agent 共用的,可以理解为是公共设施。这一层最典型的文件就是点 opencloud 我 们的总文件夹下面的 opencloud 点这次文件,也就是总配置文件,大家可以打开看一下,里面有非常多重要的参数,包括 os, 也就是定义哪个大模型厂商,还有就是你的登录身份是什么? agents 定义有哪些 agent? 它的默认模型是什么?工作目录和运行参数是什么? tools 定义局的工具权限以及 agent 之间的调用规则。 bundings 定义什么来源的消息调用到哪一个 agent, 浏览器定义浏览器信息, chanel 定义 telegram, discord, 飞书等外部的渠道连接, gateway 定义网关, memory 定义记忆等等等等。可以看到 openclaw 点 json 文件,里面包含着 openclaw 最重要的参数配置。 其实啊,大部分情况下我们出现崩溃对话没有反应的情况,也是因为我们的 ai 去改 opencll 点 json 这个文件夹里的参数的时候改崩了,所以一个建议就是,哎,你告诉你的 opencll, 在 他改这个文件之前一定要提前通知你,而且改的时候一定要谨慎。 第二层是 agent 层,这才是每个 agent 自己的领地,每个 agent 啊都有自己的工作空间,系统数据会话记录。那么 workspace 里面每个 agent 文件夹下面的这些文件,在每个对话开始的时候都会被加载进去来作为这个 agent 的 上下文。 由于呢,不同 agent 这些文件有所不同,这也就决定了啊,这些被文件被加载进去的时候,里面携带的信息,包括啊,他的身份,他是谁,他的性格,他的对话方式,他的任务的不同。 那么这些文件呢,包括 agent 点 m d, 也就是这个 agent 的 工作说明书,它决定这个 agent 的 做事规则,优先级,边界,还有如何使用记忆。 so 点 m d, 就是 这个 agent 的 性格和说话方式,与其是什么风格,是什么,边界在哪里,由它来决定。 user 点 md 就是 这个 agent 对 用户的理解就是他在帮谁,对方是什么风格,应该怎么称呼,有什么偏好,要注意 identity 点 md 就是 这个 agent 的 身份卡,解决的是这个 agent 叫什么,是谁的问题。 to 点 md 是 工具说明书,告诉 agent 啊,本地有哪些工具命令,怎么约定项目里面有什么习惯? memory md 是 长期精华记忆,它不是流水上,而是提炼之后的长期信息。这个文件很重要,而 scales 里面就是这个 agent 专属的 scale, 如果和局的 scale 同名的呢,这里的优先级更高, 会覆盖大局。那么这些呢,都属于 agent 层,也就是说啊,不同的 agent 默认不共享这些文件,但是同一个 agent, 不 同的对话,不同的对话线程之间是共享这一套文件的。第三层是 session 层,这个层级啊,不是这个 agent 是 谁,而是这个 agent 当前在哪个窗口里面工作。 session 是 对话县城,怎么理解呢?比方说,当你在同一个 agent 和他对话,但是在不同 discord 里面的频道对话,或者是你先跟他在 telegram, 后跟他在 discord 对 话,这就是属于不同的县城,因为它们的渠道不同, 或者是就是你当前的对话,但是你打了命令 slash new 或者是 slash reset, 就 会开启这样一个新的县城,区别是 slash new 旧的对话还在,但是 slash reset 会清空上下文,重新开始这样一个对话界面。那么这一层最典型的文件就是在我们每一个 agent 的 下面 sessions 文件夹里面不同的 session 文件了, 也就是每个对话都有自己独立的这样一个文件来记录啊,不同的对话历史。也就是说同一个 agent 不 同 session 会共享 agent 层那一套的。我刚才说的 saw 点 md, 我 刚才说的 agent 点 md 等等那些 workspace 的 文件,但是不会共享竹字的聊天记录。 讲完三层结构,了解 agent 工作原理之后,下一个很重要的问题就是,哎,多个 agent 之间是如何协作的呢?在 open call 里面, agent 协作大体有两种方式,第一种就是固定分工,也就是我们刚才说到的多个独立的 agent, 各自有各自自己的 workspace, 有 自己的 session, 也是对话现场。 固定分工就是像搭一个长期团队,就像我展示的我的 agent 一 样,一个负责找资料,另一个负责写脚本,一个负责写代码,还有一个负责日常对话和汇总等等等等。他们每个人啊,都长期干自己的事情, 他们之间的工作啊,写作的方式可以通过触发的串联或者是并行,比如啊, agent a 搜完信息这里我在 disco 里面点个赞,后面的 agent b 就 会根据我点赞的这个内容去调研资料,去补充材料。 那么第二种就是临时拉 sub agent, 也就是子代理。子 agent 去干活,也就是 open club 的 sessions prom, 它呢会拉起一个隔离的啊。 sub agent prom, 也就是子代理的这样一个运行在独立的 session 对 话现场里面工作, 工作完之后再把结果传到我们当前的对话里面来,相当于临时叫了一个实习生或者是外包去隔壁的办公室工作,干完工作回来汇报。这样的好处就是当我们的子代理在独立的赛程里面工作的时候,他不影响我们当前对话的这个主位阵子,我们可以继续给他提问,继续跟他对话,两边同时进行。 那么官方文档对他的定位也很明确,就是他适合做研究,慢任务、重任务、病情任务,而且不会阻塞我们主对话。 比方说这里啊,我让他去用 sessions born 去开一个子任务,研究 open call 智能体最近最受欢迎的三个讨论点,要求每个讨论点的热度、原因,代表观点,以及我可以做视频用的切入角度,然后让他开始在后台启动,完成之后主动汇报结果, 好的,他已经启动了这个任务。其实这时候我们可以去跟他对话,比方说我问他今天天气怎么样, 他呢,还是会回答我们这个今天天气怎么样的任务,因为刚才我们也说了,子任务是在另外一个县城完成的,不耽误我们跟我们的主要的智能体之间的对话。可以看到他就是继续的跟着我们进行对话,他回答了我刚才的问题,然后我们可以继续提问,我说, 哎,可以看到我们等了一会之后,他终于是把这个任务完成,然后自己主动地把任务的结果发回到了我们的主要的频道。哎呀,没有影响我们刚才跟他这个主要频道主要的智能体之间的。对,不是所有任务都适合上多 agent, 如果只是一个短问题,那么一个 agent 往往更加有效,硬拆呢,只会让系统更重更慢。那么真正适合做 agent 的 场景啊,一般有这么几种,第一种就是你的任务天然就能拆开,比如啊,研究,写作,审核,发布,本来就是不同的角色,这时候拆 agent 有 不同的工作区的这种不同的文件边界会更加清楚。 第二个就是任务可以并行,有些事情呢,不需要排队,一个 agent 可以 查资料,另外一个可以同时整理结构。如果你用 sub agent 这种并行就很合适,那么刚才我们也说了,它很适合做这种比较重的或者重复性的工作。 第三个多 agent 呢,不只是为了分工,也是为了避免污染。因为啊,如果你用单 agent 做太多不同类型的任务,都会出现相互污染的情况,长期记忆呢,会把不该混的东西混在一起。因为我们也说了,工作区那些啊, markdown 文件是同一个 agent 在 不同聊天窗口里面共享的, 那么什么时候没必要用多个 agent 呢?那么很简单,要么就是你的任务很短,要么就是上下文高度连续,你不想打破,要么就是你角色的边界根本猜不清,就没必要拆。还有就是避免为了做 agent 而做 agent, 只是为了看起来很高级而已, 能一个做好的事情就一个做,就相当于是一个队伍,当一个任务需要一个团队来做的时候,那自然值得用团队。 那么关于多 agent, 为了达到好的效果,我想分享一下我自己得出的一些实践。第一个就是不要一上来,对于很多的 agent 可以 从一个开始,有必要就加第二个,比方说你第一个 主要的 agent 也是默认的 agent, 基础上你加一个研究 agent, 每天去搜索啊有价值的信息,定期汇报给你,那么先把这个逻辑跑顺出来,然后再根据你自己的业务再加一个,同样每加一个呢,都先跑顺功能验收效果。 第二个就是工作区的文件要尽量的短,尤其是 agent 点 m d, soft 点 m d, user 点 m d, 也就是心跳文件, 而因为这些文件都会进入 agent 的 运行上下文,如果太长的话会增加效果。考虑到你有多个 agent, 如果你不注意的话,那你的成本可能会成倍的增加。好的,以上就是今天的视频了,希望你也能开始搭建属于自己的 ai 团队,不要忘记点赞和关注,我们下期再见。

我用 openclaw 实现了电商的自动上品流程,我从原来每天需要四个小时的上货流程,现在只需要五分钟,现在看到这个窗口是我日常上品的一个流程,找品、存图,新建商品,填入信息,然后一个品一个品,这样去操作。那我是怎么把这个步骤自动化的呢?先来看一下结果, 我现在的执行流程只需要打开飞书,因为我对接的是飞书这个通道,我只需要给龙虾发一句,开始执行自动上货流程,然后龙虾就会自动开始干活,他先会梳理一下这个干活的整个流程,大概分几个步骤,然后他就按步去执行,一直执行一个流程大概只需要三分钟不到,而且我的文件夹里面应该是有十三个商品的。 这个工作平时我们人工去做可能要花两个小时左右,现在就相当于无论我在哪里,只要我的电脑开着,我只需要跟我的飞叔说一句,开始执行自动上货流程,他就会自动跑完,然后告诉我已经 ok 了,所有的结果会放在我的桌面上,智能分组结果就是他帮我执行好的结果,所有的商品他帮我分好了组, 然后他又帮我把所有分好组的结果进行了一个压缩。那我最后上面的操作就是把这些压缩文件一键拖动到数据包导入就可以了。我从原来每天需要四个小时的上货流程,现在只需要五分钟。 那具体整个流程是怎么实现的呢?首先我需要做的工作是打开某多多的 app, 把我选中的商品去把这个商品的图片全部保存下来, 然后以及说这个商品的信息截图和价格尺码截图全部通过截图的形式和下载好的商品信息,这些图片混合起来,直接放到我电脑的这个桌面的文件夹就可以了。文件夹就是我保存下来所有我要上的商品,这里边会包含很多商品信息图, 然后还会包含很多的一个商品的价格和尺码图,因为这些我都是要一比一录入我的信息里边的。那可以看到我的这个大文件夹里面其实是不止一个商品,是很多组很多组商品。那么龙虾下一步就需要基于我这一个大文件夹去帮我进行智能的商品分组, 所以我把这些图片放到文件夹以后,下一步就看龙虾的操作了,那么它的执行步骤是什么呢?首先 第一步他需要打开我给他的这个文件夹,首先他需要基于我给他的一个大文件夹进行所有的图像识别,进行一些 使用一些算法将描述为同一个商品的图片归为一组,并且自动帮我分好组,可以看一下大概的结果是这样,所有相同的衣服会分为一个文件夹, 那么他帮我进行图片识别以后,非常精准的把所有描述同一个商品的图片都归为了一组。 第二步,它需要基于我提供给他的截图的那些信息,去提取对应的每一个商品的标题,价格、尺码和颜色,然后去自动录入表格。那最后一步,它会把它在过程中处理过的所有数据帮我生成一个校验表格, 方便我检查执行过程中是否出错,那整个环节就是龙虾帮我去做的,那这个质检验表格是什么意思呢?他会把他执行过程中所有处理过的数据信息帮我汇总到一个表格,这样我就很方便的去进行一个统一的预览,看一下哪个环节识别的信息,或者他执行的步骤有问题, 那我一眼就可以在这里看到。这个工作我只需要在飞书给他发一句指令,然后等他执行完之后,我打开这个教样表格,在表格里面快速去预览一下他所有的执行过程,有哪些数据错误了,或者分组错误了,我在这里可以快速的看到,然后再告诉他进行什么样的修正,这个工这个工作就完成了,是非常的方便。

大家好,我是洛新。很多人在用 opencloud 都停留在聊天工具的阶段,真正拉开距离的是私有知识库的能力。今天咱们这条视频就手把手教教大家用 opencloud 搭建一个属于自己的 a r e, 大 脑 不联网也能查资料,不搜百度也能直接给出专业答案。看完这一条,你的 opencloud 至少能升级一个档次。好在讲知识库,私有知识库之前,我们先看几个问题啊。第一个知识库的介绍。问题一, opencloud 的 知识库本质是什么? 其实 open curl 没有那种把文件上传到某个平台让它训练的传统的知识库,它更像是把你的 md 文件放到 agent workspace 工作区,每个 open curl 都有一个这个 agent 的 workspace 工作区, 然后再通过工具,比如读文件,比如 group 缩影搜索,或者是通过 skews, 就是 教他怎么用,怎么找,通过这种方式,然后去引用到你知识库里的内容,在你提问的时候,让他先解锁命中 相关的知识点,然后再进行回答。这其实就是 open core 的 知识库的本质, 简单总结来说,它是先去解锁,然后再去回答,从而回答的问题给出缩影。 那第二个问题是, kb 是 什么?是不是缩写?先说结论啊, kb 是 knowledge best 的 缩写,它是行业通用的一个缩写,这是整个 ai 搜索信息系统领域的标准叫法, 那不是你随便来起的。呃,我们用其他的名字,比如说 d o c s 文档合集,然后 text 原始数据,或者是发有文件,其实都能表示这是内容。但是为什么要用 kb 呢?因为 kb 它不光是表示存在, 不光强调的是知识,它强调的是可以被 ai 用来推理、引用和回答的问题源,所以这已经是语义层级的差别了。 好,这是第二个问题,什么是 kb? 第三个问题是知识库有没有分类的级别?如果有 opencloud 的 知识库,它是处于什么级别? 那我们来看一下知识库的成按成熟度来的分级的情况。那第一级 l 一 等级,等级分为 l 一 到 l 五特征, l 一 是文件堆,那它只有这些一堆文件, l 二是有 index, index 其实就是它的,所以 l 三呢,它是有规则, l 四是可审计, l 五是自动评估。 那我们的 open curl 实际上可以做到 l 四的级别就是,所以 index 这个是有的解锁脚本、证据链和规则约束, open curl 的 知识点可以达到 l 四企业级别的知识点, 所以这个是非常牛的,在一个 agent 里面就可以做到轻松地做到企业级别的知识库。 好,我们再看第四个问题,那 agent 它是为什么会优先查找知识库呢?它为什么不先去上网搜索呢?这是在哪里设置的呢?好, openker 的 本身呢?它不会自动优先查找本地的知识库,完全是你用规则来驯化出来的。 优先的解锁行为是在 edit 点 md 强制注入给模型的提示词。工程 就是我们会在 edit 点 md 里面去强制写明这个我们的系统级提示词, 然后让它按照这个规则,遵循这个规则去优先查找我们的本地知识点,所以它是完全是用规则来训化出来的。 那 opencloud 的 真实的工作原理,我们来看一下这个图,简化版的第一个是它是系统级别的 prompt 记事词,然后是到 iint, iint 词点 md, 这个是我们人写的这个提示词,然后最后再到 so 点 md 或者 user 点 md, 在 so 和 user 点 md 里定义了就是 agent 的 角色和我们用户的角色,然后最后才是用户问题,用户提的问题,用户输出的输入的内容,然后由这几个提示词合成一个超级的 prompt 一个大的提示词,然后为给模型, 所以 agent md 是 什么?实际上是 agent 的 一个宪法,你就必须得遵守这个宪法,然后去做事情,在遵守这个宪法的前提条件下去来回答用户的问题, 我们自己其实是可以修改这个宪法,在大模型眼里就是 user 的 用户的提示词是小于 agent 的 提示词,然后 agent 的 提示词是小于系统的提示词, 所以我们写进去的规则其实权重是非常高的。那大模型它有三个优先级,我们来看一下,第一个就是系统级别的,那它的权重是百分之百,就是你必须得遵守的系统提示词。然后第二个是 addit 的 一个提示词, 它的权重是百分之七十权重,实际上就是说你遵守这个规则的程度, 就像咱们国家的宪法一样,那你就必须得遵守,违反就是犯罪。那我们把开 b 放在 agent 层,写成 mandarin must, 禁止或者是系统级的,这样的话模型会把我们的知识库的规则当成法律,这就是为什么 agent 会查知识库,因为我们使用了 agent md 在修改它的规则,然后把它加入了叫行为约束注入器, 所以 agent 回答了我们问题是 agent 为什么会优先查找数据库是在哪里进行设置的?就是用我们的规则来训话的。这四个问题都已经回答完了,那我们现在开始来搭建,那第一步呢?就是把 md 放到工作区的数据库里。 好,我们来去找一下,正常我们的这个安装都会在 id 那 下面都会有个 workspace。 好, 我们来看一下我的这个 workspace 是 在哪边? 我们去找的话,正常应该是在,如果你安装在 c 盘的话,会是在 c 盘有个叫用户,然后有个 admin, 然后会找到点 openclock, 因为我的安装环境是 windows 原声安装的,所以是在这个目录,可能大家不一样的话,会在不同的目录,然后这里有一个点 openclock, 这边会有一个 workspace, 然后我们打开这个 workspace, 我们按照我们的这个飞速文档,就是在建议在 word 上建建立一个固定的目录,就是 kb 知识库。好,我们来创建一个知识库叫 kb, 一 般是用用用用用这个 kb 放在这里,然后创建完知识库之后,我们来看第二步, 就是把我们转换之后的 md 文档放在这个 kb 下面,放在 d o c 下面数据库。好,这里我也准备了一个,就是,呃,我们来看一下啊,这里是一个关于,所以我们就是把这个这几个文件给它复制过去, 这是我们的知识点嘛,文字的。好,这四个,这四个文件我们给它复制过去, 然后在这里创建一个 d o c x d o c s 啊文档,然后呢还要创建一个缩影, 这个,呃,正常我们的内容可能是呃 pdf 的 或者是 word 的, 然后都要给它转成这个。呃, md 文件就是 markdown 文档,这里呢我还有准备了一个生成 md 文档的一个程序,在这里大家如果需要的话可以找我领取。 这里生成一个批量生成 md 文档的程序,这里我就不演示了啊。然后呢还有一个我们是因为你生成之后可能会有重复的 md, 这里呢还有一个 md 文档的清洗,需要去重的程序,然后不需要手动去编辑,然后这里呢有个去重的一个程序, 回去检查,这里是代码,大家需要的话可以找我领取,然后这一块我就不讲了,然后是在我们需要写一个 index 点, md, 在 这个 kb 下面, kb 下面写一个 index 点, md, 然后我们在这里创建一个缩影文件。 好,我们打开这个缩影文件,然后去编辑。呃,这里呢我已经提前写好了,跟我那个是相对应的,我们来看一下啊,它的内容啊。 首先这里呢就是呃数据库的 index 缩影,然后它会标了有几个数据库,一二三四五六六个,然后每一个是对应的是哪一个 md 文件, 就可以列下去,列上去就可以了。然后这个是内容呢,是跟我们的这个呃 d o c 里的这个文件是匹配的。 d o c 类,这里我们是有六个,所以我们这个目录这里也要保持是六个,就是跟它是相匹配的。 然后这个写法大家如果需要的话可以找我领取这个模板,然后这个知识库的呃文件我们就加完了。好,我们继续往下看, 下面我们需要编写它的规则,规则呢是在 agent agent 点 md 中去编写,我们来先找到这个文件,这个文件是在哪里呢?是在我们的 workspace 下面,就是 opencloud 的 microsoft 里面有一个 ajax 点 m d 文件,然后我们打开这个文件,打开这个文件,它就是 ajax 的 一个规则,一个是是我们手动要添加的,你看它这个是 this folder is home, 这个是它的一个家, 然后第一次 run first run 就 要创建这个文件,如果这个文件存在,这是它的生日证书,身份证,然后去遵循它,如果没有,对吧? delete you won't need again。 然后我们这个规则加在哪里呢?我们这个我已经写好了这个模板新建的知识点,然后我们来看一下这个知识点,这个是 markdown 的 语言,就是 local knowledge by the rule, 就是 本地知识点的遵循的规则。 好,我们来看一下,就是他怎么描述的。你有一个本地数据库,位于 workspace 内,然后 kb 这个文件夹下面,然后强制的流程,先读取锁瘾,就是启动之后先读取这个数据库的锁瘾,然后先做数据库路由的判断,根据用户问题选择最匹配的数据库, 只能选一个知识库做主库,这里呢?呃,我提一下,这里主要是如果你有两个以上的知识库的话,这一条是可以这样写的,如果你只有一个的话,这个,呃,这样写也没问题, 主要是让他做路由判断。先用先匹配。是用哪个知识库?是怎么匹配呢?是根据锁影里面去匹配,因为这些用户提的这个知识点在锁影呢?在哪个知识库的锁影中出现?只能允许 在被选中的知识库内解锁,引用原文,防止你串库。有两个库以上,你可能会串库,然后回答末尾必须注明来源是来自于哪个 md 文件 完整的路径。若主库证据不足,先扩展到同一知识库的其他文档人不足,再明确说明未找到 足够的证据。但是你不能编造,因为我们用知识库最怕的就是什么,因为 a r e 他 会说谎,他会编,他会瞎编,当他找不到的时候,他可能会给你编一个,编的就不靠谱了,就不是来自于你的知识库, 但是他不一定会让你区分的到,所以我们必须在规则上限定式禁止的一些行为。未解锁 k b 即回答就是有的,有的 id 呢?他就没根本就没有去解锁你的知识库,然后直接在网上给你找了一个,然后告诉你这个答案是什么,什么样的。 这明显是不靠谱的,因为这个不是我们知识库范围内的。第二个,仅凭模型的记忆推推测,因为大模型他会去呃这 ig, 他 会去记忆一些内容,他可能根据这个记忆,然后去编造一些内容,然后给你作为答案,然后造成你的误导。第三个就是虚构课程资料内容, 他会凭借着自己的那个呃思维链去去拼凑一些课程,然后给到你。其实这都是不正确的,因为我们用知识库的话,我们是优先要他从知识库里去查找这些内容, 而不是给我编造的一些内容,所以我们在这里设定了他的禁止的一些行为。好,我们把这里给他复制过去。 复制过去放在哪个位置呢?我们给它放在,就是在这个位置 first run 之前。好,我们给它放在这个位置,就是放的越前它遵循的权重会越高。 好,这样的话我们 id 值 md 就 修改完成了,那我们继续往下看,这个时候呢,我们的这个知识点就加载好了, 就是单一的这个知识点,我们就加载好了,在这里,然后我们需要去重启,然后验证,我们来看一下啊。第二步就是重启绘画,然后 opencloud getv restart。 好, 我们复制一下,我们把这个先给它关掉,点击重启。 好,重启完成,我们来跟重启完成,然后我们来给它画一个。 好,他在回复了,然后我们看一下验证啊,第一个只解锁,所以能读到 k b, 好, 复制, 我们把这个给他回复过去,因为他已经在线了,他已经在线了。好,我们把这个发过去,看他能不能解锁到这个 kb 资料就是我们验证的方式,我们来看一下,我们验证的方式 就是重启完了之后就是让规则生效,生效完了之后去验证,验证是否真的当知识库在用,然后三条测试指令这里给到大家,大家如果需要的话可以找我领取。第一个就是只解锁,所以看他确认他能不能读到 kb 资料。好,我们来看一下,他回复了 k b, 之前也被你清除当前知识库,如果你想重建知识库,可以帮你整理。就是我,他应该是,呃,从记忆里找的,我已经把知识库放进好了,请你再次检查并更新一, 因为之前我删掉了他更新的记忆,他现在就是我让他去查的话,他根本就没有去,去实际的去检查,他就凭着记忆就给我来了,给我回复说当前没有知识点,其实我这个已经有了, 也就是说他会编造,编造之后给到你结果啊,知识点已恢复,他已经检测到了知识点已恢复,他已经有内容了。好,我们再进行第二条的测试, 定位,定位文件确认会解锁目录,在 k b d o c s 中解锁这个数据库的内容,我们来给到它。 好,它已经找到了一个匹配的文件,说明它已经解锁了我们的数据库这个文件内容。好,我们这一步测试通过,我们进行第二步的测试,三步的测试,然后命中后回答问题,确认不是瞎编。 这里是什么呢?基于 kb 内容回答二十字觉得,二十字觉得核心要点是什么?用五条要点总结,并在每条后面注注明文件的来源,然后我们把这个发给他 复制 好,你看他给到了这个来源,我们看他啊,他的来源,来源的汇总是来自于哪个 md 文件?这就是他已经根据我们的问题来去优先去查找了这个知识点。 然后二十字决核心要点,他是根据知识点去找的,你看每一个回答他都有来源,我们在里面加上了要让他给出数据的来源,这样的话,他确认他是引用了我们的知识点,然后给我们的回复是来自于知识点,而不是来自于大模型。 好,我们来再来提个问题,让他给我们出,呃,二十道选择题。 好,我们给他的问题是,小亮,请你根据知识点出二十道选择题,每个选择题都有四个选项,并给出答案,并把题目放到 word 上发给我。 我们有了知识点之后,我们就可以让 agent 帮我们来出题目,然后 并且给出答案,这样的话我们就可以轻轻松松去训练,就是出题,然后针对知识点内容进行去剪辑。 有了这个功能之后,哦,我们如果说在家里给孩子做作业之类的,那我们就可以把孩子的错题集给它录进去,到期末的时候就可以让 angent 把错题给它减少出来,针对这些错题来出题目,然后有针对性的去训练和强化练习。 这样的话就相当于你请了一个私人的老师,然后我来帮你去管理这些错题,给你建立自己的知识库内容,特别是对高中、初中这些孩子都可以用上这个。呃, opencloud 的 这个知识库的本地知识库的一个内容。 好,它已经给我们回复了,看见没有,它这个二十道题目它已经出出来了,然后它放在了 c 盘的 workspace 这边,这边我们来去看一下,我们来去打开它这个题目去看一下。 你看内容摘要,共二十道选择题,包含了零缺陷的管理、 p、 o、 n、 c, 质量成熟度改进过过程改进等知识点,然后每一个题目每题有四个选项,并标注了正确答案,然后每题均注明来源文档路径, 然后零缺陷,然后他会告诉你题号题目的分布,零缺陷基础理论四题, p、 o、 n、 c。 不 符合要求的代价五题。然后质量成熟度阶段是两题,过程管理与改进四题,组织变更和领导力五题 啊,题目有分布,题目有来源,我们来去打开看一下,在 word space 下面, work space 下面有个零这个零缺陷管理知识测试正视版,我们打开好这个,就是它给我们出好的一个零缺陷的一个知识测试题目 说明,然后选项,然后第一个答案来源,第二个零缺陷品质观四个根本中的一个中心是什么?必第一次把事情正确的事情做正确,第一次把正确的事情做正确。 兄弟们怎么样,这个本地知识库是不是非常非常的有用,帮你出题目,帮你做解答,帮你分析,这样的话我们即使在本地不联网的情况下,也可以很容易轻松的打造我们的知识库,而且是 l 四级别的知识库。 好,今天这个 opencurry 的 知识库搭建走了一遍完整的流程,后面我会继续讲,企业及知识库怎么设计,怎么接飞书,多维表格怎么做自动更新,怎么做团队共享。 如果你想把 ai 真正用到工作,记得关注我,后面全是实战干货。好,今天就到这里,谢谢大家。

嘿,大家好啊,最近 ai 圈子里是不是总听到一个词儿叫 agent skill, 感觉各大公司都在聊这个,那么这个 agent skill 到底是个什么东西?它为什么突然之间就变得这么重要了呢?今天咱们就来把它彻底聊明白。 好,咱们就从这个问题开始。你看,这么多科技巨头都一窝蜂的去用它,那肯定不是没有原因的,对吧?所以我们就得先搞清楚这个 agent skill 它到底解决了什么我们以前一直头疼的问题。 行,这是咱们今天的路线图,很简单,首先 agent skill 是 个啥?然后它背后的那个三层机制是怎么回事?接着呢,咱们再把它跟另一个叫 m c p 的 东西比一比,最后聊了这事到底为啥这么重? 好,那咱们就先从第一部分开始,从头说起。这个 agent skill, 它到底是怎么来的?它的核心思想又是什么? 哇,你看这个发展速度,简直是坐了火箭一样,你看啊,二零二五年十月, entropix 才刚刚为了提升自己加 cloud 模型的性能,搞出来这么个东西,结果呢,到了年底,像 vs code 的 这些大家都在用的工具就立马跟进了。 然后到十二月份, entropic 干脆就把它变成了一个开放标准。你想想,就短短几个月,从一个内部小功能一下就成了全行业都能用的标准,这速度真的太快了。 那么它到底是什么呢?我觉得啊,这个说明文档的比喻啊,简直是绝了。你就可以这么理解 一个 agent skill, 它就等于是一本你给 ai 写好的非常详细的操作说明书,你只需要写一次,然后呢? ai 以后每次要做这个任务,它就自己去翻这本书,根本用不着你每次都跟它啰嗦一遍, 哎,这就解决了一个特别烦人的问题,对吧?你想想,以前我们每次让 ai 干个活,是不是都得把一大段长长的指令翻来覆去的复制粘贴给他?就比如说,你让他帮你按固定格式写个周报,或者整理个会议纪要,每次都得重新教他。 现在有了 skill 就 方便多了, ai 自己会去翻对应的说明书,自己就知道该怎么干了。等等啊,你可能会想,这套说明书系统听起来不错,但它高效吗? 你想啊,如果每次都把一大堆说明书全塞给模型,那 token, 也就是我们常说的那个算力货币,不就一下子烧光了吗? 别急,他的秘诀就在于一个特别特别聪明的三层机制里面,那就是这三层元数句指令和资源。他的核心设计理念说起来特别简单,就叫渐进式批录, 说白了就是需要什么才给什么,一步一步来,绝对不提前加载任何用不上的东西,把 token 节省到了极致。咱们一层一层来看啊,首先是第一层原数据,你可以把它想象成所有说明书的目录, 这个目录非常清,里面只写了每个 skill 的 名字和一句话简介,它是一直都加载的,所以 ai 随时都知道自己会干什么,它的机能库里都有哪些工具, 这就引出了他的第一个效率核心,叫做按需加载。什么意思呢?就是说,只有当 ai 看了目录,觉得,哎,这个技能正好能解决现在的问题,他才会去翻开那本说明书,也就是加载第二层具体的指令内容。 你想想,这样一来,就不用一开始就把所有说明书的详细内容都读一遍了,这得省下多少 tok 呢? 好问题又来了,如果这本书名书本身就特别厚,里面还附带了一大堆参考资料,那怎么办?比如说这个任务需要参考公司那几百页的报销政策,或者是一堆复杂的法律条文,难道要把这些也全都加载进来吗? 哎,这就要说到最聪明的设计了。第三层资源层这个概念呢,简直可以称为暗虚加载的 pro max 版,也就是暗虚中的暗虚。 他的逻辑是,只有当 ai 读到了第二层的指令,发现指令里明确写着请查阅 x x x 文件时,他才会去加载那个特定的参考文件。你看,这不就又省了一大笔开销吗?真的是把抠门儿哦不,是高效做到了极致。 而且在这一层里面,它还做了个更精细的区分,这一点直接跟你的钱包挂钩。大家看,这里有两种资源,一种叫引用,一种叫脚本。 引用就相当于让 ai 去读一份文件来获取知识,这个过程是要消耗 token 的。 而脚本呢,是让 ai 去执行一段代码,去完成一个动作,比如调个 api, 上传个文件, 这个过程模型只关心干完了,没有不关心具体怎么干的,所以它几乎不消耗 token。 你 说这个设计是不是绝了? 好的,那讲到这儿,可能有些朋友会觉得,哎,这个东西听起来怎么有点像我们之前说的那个 m c p, 也就是模型可连接程序啊?它们俩到底有啥区别?该用哪个呢? 关于这个问题, antropic 官方有一句话,我觉得整理的特别到位,可以说是点睛之笔了,大家记一下啊, m c p 的 作用是连接云和数据,而 skill 的 作用是教会云如何去处理这些数据。 这句话怎么理解呢?其实很简单, m c p, 你 可以把它看成是一个数据连接器,它的工作就是拿数据。比如你跟他说去把昨天的销售记录给我拿过来。而 agent skill 呢,它是一个数据处理器,它的工作是教 ai 怎么处理数据, 比如把拿过来的销售记录按照这个模板给我总结一下,一个负责拿,一个负责教怎么做。 咱们再看这个表格,这个比喻就更形象了, agent skill 就 像一份菜谱,它告诉你做这道菜需要哪几个步骤,每一步该怎么做。 而 m c p 呢,就像一台烤箱,它是一个实实在在的工具,负责执行具体的复杂的操作。所以你看,要做出一顿大餐,你往往既需要一份好菜谱,也需要一个好烤箱,对吧?它俩是合作关系 好。聊了这么多,咱们最后来总结一下,说了半天,这个 agent skill 到底牛在哪?为什么我们不管是开发者还是 ai 爱好者,都应该去关注它呢?我觉得所有的核心都回到了这个数字。三, 它那个三层设计真的不只是一个简单的功能,它本质上是一种思想,一种在未来我们构建 ai agents 的 时候,一个非常强大而且极其高效的设计模式。所以今天咱们聊完,希望大家能记住这几点。 第一, agent skill 是 一种可以重复使用的指令设计模式,不用再反复复制粘贴了。第二,它的三层系统超级节省 token。 第三,它很清晰地把怎么干活 skill 和获取干活的工具 m a, c p 给分开了。 最后,也是很重要的一点,它是个开放标准,这意味着未来会有越来越多的人和工具用它,生态会越来越好。那么最后就留给大家一个开放的问题吧, 你想想, agent skill 有 这么聪明的设计,又是一个开放标准,它有没有可能在未来就成为所有 ai agent 学习定义和分享能力的那个通用标准呢? 这事还挺值得期待的。好了,今天就聊到这里,感谢大家。

最近互联网养龙虾真的是杀疯了,刷十个视频,八个都在养,还有好多小伙伴私信我说刚入手一头雾水,不知道该怎么养,该怎么选,该怎么用,甚至踩了一堆坑。今天咱们就把所有问题一次性说透,从选择到变现,从避坑到省钱,新手看完之后可以直接上手,不花冤枉钱,也不用做无用功。 咱们先回应五个最火的问题,再补充你们比较关心的一些隐藏的疑问,全程干货,记得点赞收藏,避免刷着刷着找不着了。第一个问题,龙虾该怎么选? 这是避坑的第一点。现在市面上各大厂都出了在线安装,一键安装,我实测下来,真心劝大家一定要装原生版的龙虾,那些所谓的什么什么可乐 仿生版龙虾,基本上都是阉割版的,上手感觉跟高版本的扣子没什么太大的区别,功能其实砍了 一大半,大部分是只能处理蚊子型的工作,离真正的原生龙虾真正的感受下来,可以说是差了十万八千里。所以说,新手如果选择要装,最好是装原生版的龙虾,只在装直接装在自己的电脑上。第二个问题,龙虾究竟能干什么?真有那么神吗? 这么说吧,他是真的神,但又不是万能的,他最牛的地方就是能替代你所有重复性、逻辑性的工作,原则上电脑上能干的活,他基本上全都能扛下来。 写文案,剪视频,做表格,整理邮件,生成周报,甚至帮电商卖家二十四小时做客服,监控库存,帮设计师出出稿啊,晒素材,不用你熬夜加班,他二十四小时不停的在工作,那就包括现在他还在我后面这台电脑上一直在工作,就是妥妥的是一个全能的小助理。 而且他能接入微信,接入飞出这些常用的工具啊,不用额外装新的 app, 你 就可以在电脑端直接控制它。 第三个问题,为什么你装的龙虾不好使,跟别人的不一样?嗯,很多人装完之后就犯愁,说他啥也不会啊,其实不是龙虾不行,是你没装,找对方法。 龙虾不是装上之后他就是超人,他需要学习,需要被教育,就像养宠物一样,就像初代的贾维斯一样, 越养他越能干,你不能上来就跟他说,你帮我干活,你帮我去赚五百块。你这个要求太笼统,他听不懂啊,你要具体的告诉他啊,比如说帮我写一篇抖音的口播文案,主题是龙虾壁坑,语气要口语化一分钟左右 啊,指令越具体他越好用,慢慢教他就会越来越贴合你的要求,甚至能记住你的做事风格。 第四个问题,普通人用龙虾变现最快的途径是什么?作为一个做自媒体的来说,我的感受就是变现最快的途径就是做自媒体啊,写公众号图文, 写短视频脚本,做网站,出项目方案,这些活龙虾全都能帮你高效的去完成。原来一个人一天可能只能最多写十篇文案,但是现在有龙虾的帮助, 基本上五十天是打底,你的收入自然而然他就会涨啊。第五个问题,消耗 talk, 也就是算力贵不贵,普通人能不能承担的起?这个是完全可以,别被算力 talk 这些词吓住。普通人买一个 mini max 的 四十九元包月的套餐完全够用 啊。我测试是第一天就靠龙虾帮我写公众号,把四十九块钱的费用就完全已经覆盖掉了啊。更省的方法是,你日常做轻任务可以用免费的模型,用中度任务的话就用 mini max 的 模型啊,重度任务你再换高端的一些模型啊,普通人基本上用不到啊,你像那个 cloud 的 模型, 一次任务执行下来就大几百块甚至上千块。第六个问题,教育龙虾有什么技巧,怎么让他更听话啊?这是很多人关注的一个问题。技巧其实很简单,你就记住两点,一个是指定要具体,第二一个是要定期的清理记忆, 别跟他说笼统的一些话,一定要越具体越好啊。另外是要定期清理他的过期记忆啊,别堆太多没用的内容,这样他响应会更快更精准,还能节省你的 talking, 长期用下来,他就会越来越懂你, 干活也就会越来越高效啊。说一个小要点,就是跟他对话尽量要使用长句,这样会比较节省 tokin 啊,不然你的 tokin 就 会消耗的特别快。第七一个问题,那就是有些人问的,龙虾能帮我剪视频做海报吗? 啊,这个是必须能,你只需要告诉他你常用的风格是什么样的,做什么类型的海报,你的做海报的逻辑是什么,他就能替代你做这些重复性的工作 啊,包括帮你剪视频,修图,做 ppt, 写代码,帮你查看所有的最便宜的机票啊,帮你盯一些所外所谓的啊曲线图都完全可以。 最后再总结一句话就是养龙虾一定要选对版本啊,我建议大家用原生版啊,教对方法,用对套餐,它就是你最省力赚大钱的一个机器。

我就搞不懂现在为什么网络上一大堆的人都在说 open cloud 不 得了啦,是一个新的时代的开启。作为一个程序员, 我反而认为网络上的那些啊,都是想赚取流量的噱头而已。网上讲的那一些场景很多都是属于更适合用 open cloud, 会是会是一种灾难。 怎么讲呢?我说的这种应用场景是属于每天你需要固定操作的这种场景,如果你交给交给 opencloud 去做的话,它要对你的任务进行规划,每天都要进行规划,这个规划要耗费很多的 token 啊。这点不说,问题是现在的 ai 大 模型能力及以后都会存在一个问题,就是他的规划和调用是不确定性的, 刚开始你不玩这个小龙虾,准确率会是百分之九十,你再用几天看一看,他会出错啊,他不可能百分之九十九的准确率,这是一个非常要害的问题。第二个是他今天执行跟明天执行,他的执行结果也会不一样的, 有可能今天他执勤的这个处理办法路径是三步,明天会变成四步。这种不确定你能接受吗?作为一个在 ai 领域里面去落地的人来说,我看到这种不确定是没办法,在严格的这个商业里面是没办法去落地的。 所以呢,作为程序员,我采取了另一条的路径,那就是用 ai coding 的 方法去写一些定制化的工具。这条路径对于很多人来说门槛相对比较高,但是现在的这个 ai coding 的 能力已经完全可以让大家去做到这一点了。 所以如果你有这种想用小龙虾的这个场景,并且你的这个应用场景是相对固定的,那么我比较建议是用 ai coding 的 方式去做这样的一个工具,你说是不是呢?

很多人安装了 opencll, 但不会用啊,还是把它当成一个聊天的工具。今天呢给大家分享一个使用 agent 和 opencll 的 一个底层的程序思维,理解了它对你使用 opencll 有 很大的帮助。这个呢就是代码当中的函数调用,程序能够自动化运行的原因呢,就是因为有一个又一个的函数, 函数呢是程序调用的最小单位。那函数这边有参数啊,比方说这边是一个加法的函数,参数呢就是两个数字,然后里面呢,只是举了一个特别简单的函数,函数可以很复杂, 在函数里面呢也可以调用其他的函数,形成一系列的调用,这个呢就是程序了。那在 ai 时代呢,其实我们也是需要去封装函数的,而这个时候函数呢就变成了 skill, 但你就不需要去写代码了,这个 skills 完全可以通过告诉 openclaw 的 方式, 还去进行一个封装。那把各个函数串起来呢,其实可以是更大规模的 skills, 那 这个时候可以让小龙虾去执行,这时候的执行的主体就变成了 agent 了,而不是程序了。那虽然理解了这个逻辑之后呢,我想说大家不要对 open cloud 小 龙虾存在妄念,整个 就是封装 skills 的 过程进行测试的过程,前期还是需要你和小龙虾一起参与的,但是其实就是一个自动化的一个过程。

我觉得如果你玩 ai 或者了解 ai, 你 现在还不知道 open core 是 什么,你真的是落伍了,这样是一个世界级的,现象级的 啊, ai 应用工具,而且是最最重要一点,它第一次让 ai 长出了手和脚,不是我们所看到的说像通讯千万这样子,我给他下一个指令,他就可以给我调动局部的 app 这种现状,而是它可以操控你整台电脑的底层, 然后去驾驭你的电脑,去完成电脑里面所有程序的跑通,这个就是 open clone 的 能力。但是呢,有一个最大点,就它能力很强,那绝大部分人呢,从安装部署到 api 的 接入,密实的输入搭建,就已经拦倒了很多人 啊。大家如果有关注我前几期视频就知道,我们年前就开始在做 open clone 测试,不管是我的联想拯救的笔记本电脑,还是我的海景机房台式电脑, 到后面我们买了呃苹果的呃笔记本或者说苹果的主机,然后才实现的搭建好整个 open clone 流程,可以说是一波血泪史。然后过年这一段时间呢,我们解锁了很多关于 open clone 之上所搭建的很多 skill 的 功能,终于觉得打磨成熟了,所以决定在三月 底跟大家见面,开办我们福建省首期的 open clone 线下训练营。那这个训练营有一个最大的特色呢,它不只是由软件工程硕士 跟我跟我来一起交付的,最最重要的我们还会有四五个技术人员在现场协助大家,在现场就戳出你们自己的 open clone 之上的 整个应用 ai 天团 ai 员工的搭建,而且这些员工它不只是可以对话功能,它还长出了手和脚,可以去直接实现自主生产,自主发布,自主 呃,修复,然后自主学习,这个我觉得才是 open 可乐最强最强的能力。所以呢,如果你是以下 几种人,一、你已经搭建了 open klo, 可是不知道怎么玩的来找我们。第二呢,是你搭建的过程呢,发现很复杂,你搭建不了了来找我们。第三呢,是你一直想实现一人工式 o p c 模式的,那目前也想进入 ai 赛道,想看看 ai 赛道有什么机会的可以来找我们。 第四就是你玩过的时候, ai 软件,你想进阶的这口龙虾你是肯定要吃的。然后第五就是你想快速挣到钱,搞钱的 一定要看看 openclo 的 能力,再来考虑你能做什么样商业,这个很重要。以上呢,是我这一次发出的邀请,之前我出过几期视频关于 openclo, 不 管是 openclo 的 安装,还是我们所看到的两天一夜的教程, 甚至是在我们教程结束以后,你发现这些 skio 搭出来能力很强,想要让我们进入到你的企业,透过 openclo 的 能力搭建出你企业内部的一些 skio 应用也可以。我觉得 二零二六年马年真的就是从过完年以后发现整个世界在发生剧烈的变化,而且我也第一次看到就是怎么样让 ai 长出了手和脚产生的极大的价值。那欢迎各位一起来找 我,有需要后台私我哦。忘了说一句,让 ai 去干活,让人享受人生这句话现在终于可以实现啦,如果你是苹果电脑的,玩转起来会更顺畅,是满血版的功能哦。