大家好啊,大家可能都听说过 openclaw 这个 ai 代理,都说它有个超级厉害的功能,就是差不多无限的记忆力。但这到底是怎么回事呢?它究竟是怎么做到的?今天啊,咱们就来一起把它底层的秘密给扒一半儿。 我们先来聊一个大家可能都碰到过的问题,你想想现在这些 ai 是 不是很聪明?没错,但他们都有个通病,就是特别健忘。你跟他聊了半天,过一会他可能就把前面说的关键信息给忘了。那么问题来了, open call 是 怎么解决这个老大难问题的呢? 好,那咱们今天就分几步走,把这说缩清楚。首先我们得明白这个所谓的无限记忆到底难在哪。然后呢,我们会深入看看他的两大核心策略,一个是对话栽秧压缩,另一个是混合记忆解锁。 最后还会给大家分享一个进阶玩法,叫分主题记忆,咱们一步步来。好,咱们先看第一部分 这个挑战,也就是为什么 ai 会忘事儿。这其实是所有强大 ai 模型都绕不开的一个坎儿。这个问题的根源呐,其实就出在一个叫上下文框的东西上, 你可以把它想象成 ai 的 短期记忆,或者说就像一块儿小黑板,能记的东西就那么多。 if 是 有限的,一旦写满了,要想记新的东西,就必须得把最旧的那些给擦掉,这就是 ai 健忘的根本原因。 那好,既然上下文窗口这个小老忘事, open chloe 是 怎么应对的呢? 它的第一招就是所谓的对话栽药压缩,这个技术全名叫绘画压缩,说白了,它其实是在模仿我们人脑的工作方式, 你想想,我们自己也不会把上周的每句话都记得一清二楚,对吧?我们记住的是大概意思是核心内容。嗯, open quote 做的就是这个事儿, 这里面有个特别关键的数字,就是百分之七十。你看,当这个对话越来越长,马上就要把那个小黑板写满了, openclo 不 会简单粗暴地把最开始的内容擦掉,它会做一件更聪明的事,它会把最早的那百分之七十的对话内容自动生成一个摘药。 所以你看,整个过程其实就这四步非常清晰。第一步,对话越来越长,快到极限了。第二步,系统自动定位到最早的那百分之七十的消息。 第三步, ai 自己给这部分内容写个总结。最后一步,也是最关键的一步,用这个短短的总结替换掉原来那一大段对话。你看,这样一来,空间不就腾出来了吗?而且关键信息还没丢,对话还能继续下去。 好,刚才说的那个方法解决了当下的记忆问题,但还有一个更难的呢,就是怎么记住几周甚至几个月前我们聊过的事。光靠压缩对话肯定是不够的,这时候就需要一个更强大的东西了,也就是他的长期记忆系统。 这句话其实点透了 open cloud 的 设计哲学,你看,他们不觉得记忆这事光靠写几个聪明的体式词就能搞定。不,他们把它看成一个基础设施问题,也就是说,得给 ai 搭一个专门用来存东西、找东西的系统,一个真正坚固的系统。 具体是怎么做的呢?你看,它会把长期记忆存在一个文件里,就好像一个数字日记本,但如果这个日记本越写越厚,比如超过了五万个词源,那每次都从头到尾读一遍,也太慢了,对吧?所以系统这时候就会换个策略,它不读了, 改成在里面搜索需要的信息。而且它的搜索方式也不是普普通通的搜索,而是所谓的混合搜索。这算是它的一个秘密武器了,它把两种搜索方式结合在了一起。一种呢,就是我们很熟悉的关键词搜索,你要找个特定的名字呀,代码呀,用这个最准。 但另一种就更高级了,叫语义搜索,它不是找一模一样的词,而是去理解你这句话背后的意思和概念。 那这两种搜索方式怎么配合呢?诀窍就在于这个权重分配。你看他把七十百分之的权重给了能理解意思的语义搜索,然后把三十百分之的权重给了找精确词语的关键词搜索,就是这么个七十三十的黄金比例,让他讲回来的心系又准又相关。 好到这短期记忆和长起记忆的问题都解决了,但还没完,咱们再来看一个更高级的玩法, 这个技巧能让整个记忆系统从一个乱糟糟的笔记推变成一个井井有条的图书馆。你想啊,就算搜索功能再强,如果所有的记忆,不管是什么内容,全都堆在一个文件里,时间长了肯定会出问题。 就就好比你把工作、学习、生活所有科目的笔记都记在同一个本子上,最后的结果就是找东西又慢又费劲,还老是翻到一些不相干的内容。 所以 openclo 提供了一个特别简单但又非常强大的升级方案,就是别再用一个大文件了,把它拆开,你可以建一个专门放记忆的文件夹,然后按不同主题创建不同的文件。 比如一个文件专门记项目 a 的 资料,另一个文件记浏览器自动化的笔记。你看,之前是所有东西混在一起,现在呢,分门别类,一目了然。 这么做的好处可以说是立竿见影的。首先,命中率高了,因为它只在相关的那个小文件里找。 其次,速度也快了,不用加载那个庞大的主机文件,而且每个主题的知识可以独立增加,互不干扰,管理起来也方便多了。这就好比你从大海捞针变成了去图书馆按分类号找书,效率完全不是一个量级。 所以咱们来回顾一下。 opencloud 的 无限记忆其实是一个三层组合拳,第一层用绘画压缩来解决短期记忆的燃眉之急。第二层用混合检查来打造一个精准强大的长记记忆库。 第三层再用分主题记忆这个高级技巧,把整个记忆库整理得井井有条。这三者结合起来,就构成了一个动态的、多层次的、能和你一起成长的记忆系统。 那么这一切其实把我们引向了一个更大的思考,当 ai 真的 拥有了近乎完美的记忆力之后,下一个重大的技术突破会是什么呢? 试想一下,如果你的 ai 伙伴真的能记住你们之间所有的一切,从不遗忘,那我们和技术互动的方式又会发生怎样翻天覆地的变化呢?这个问题留给大家一起思考,感谢收看!
粉丝505获赞1923

嘿,大家好,你是不是也觉得你手里的 open crawl ai 助手好像只发挥了那么一丁点儿的潜力啊?别急,今天咱们就来彻底改变这个状况,我们会一起解锁它的核心指令,让你从一个普通用户直接变身成能真正驾驭它的高手。 哎,你是不是也遇到过这种情况?问 ai 一个问题吧,他得想半天,或者更让人头疼的是,月底账单一来,哇,那个数字简直吓一跳。 其实啊,你先别慌,这通常只说明一件事,就是你还没找到真正驾驭它的那个法门。 没错,很多人啊,真的就只用到了它百分之十的能力,基本上就是基础的聊聊天。这就好比一座冰山,我们平时看到的就只是水面上那一点点,但水底下呢?那才是真正的暴躁。 来,今天咱们就一起潜下去,看个究竟,把 opencloud 的 全部潜力都给它释放出来。 好,这就是咱们今天的攻略图,或者你也可以叫他技能术,咱们就一关一关的过,从最基础的开始,把技能点一个个都给他点亮了,直到你完全掌控。这个强大的工具准备好了吗?走,咱们先从地基打起。 ok, 第一部分基础篇,咱们先来学三个最核心的指令。说白了,这就像学开车,你得先搞明白离合、刹车和油门这三个指令,就是掌握了它们,你才能把 ai 这辆车平稳地开上路,关键是还特别省油。 来,第一个,也是我个人认为最重要的省钱神器杠六,你想想啊,你跟 ai 聊天聊得越长,他为了跟上你的思路,就得记住之前说过所有的话,对吧?这些记忆就是所谓的 token, 那 可都是要花钱的。而杠六这个指令呢, 简单粗暴,直接让他一键失忆,所有历史记录清空,重新开始,那成本唰的一下就降下来了。 那到底啥时候用呢?记住了,把它变成一种习惯,一种肌肉记忆。写完一封邮件了,敲一下更牛。搞定一段代码了,再敲一下更牛。反正只要你要开始一个全新的跟之前没啥关系的话题,别犹豫,直接用它就对了。 好,如果说杠 new 是 重启键,那杠 status 就是 你开 ai 这辆车时的仪表盘,你随时敲一下,它就会立刻告诉你,哎,你这次对话已经用了多少 token 了?大概花了多少钱? 这样你心里就有底了,不至于开着拆着一不小心就把油箱给跑空了。行,第三个核心指标,杠 model。 你知道吗?很多人都会犯一个特别常见的错误,就是什么呢?开着法拉利去买菜,啥意思?就是不管干什么都用那个最贵最强的 ai 模型。其实啊,根本没必要, openclaw 就 给了你一个手动挡,让你能根据任务的难易程度随时切换模型,这才是最聪明的做法。能效比最高来。具体怎么选,看这张表就一清二楚了, 平时随便聊聊天,或者让它总结个文章大意,用最便宜的嗨苦就行了。这就好比一档起步省油, 要是需要写代码,干点技术活,那就挂个二档或三档,切换到 solid。 只有当你需要它帮你做那种特别复杂的推理和分析时,才需要挂上最高档。启动 opus, 你 信我?养成这个好习惯,你月底的账单绝对会好看很多。 好了,离合、刹车、油门这基础三件套咱们算是掌握了,那接下来咱们就得进阶一下了,进入优化篇。这部分呢,就是教你怎么更精细的去控制,让你从一个普通司机升级成一个懂得怎么跑出最佳成绩的赛车手,追求的是极致的效率。 咱们来想一个场景啊,比如说,你正在让 ai 帮你分析一个几十页的报告,你们已经聊了好半天了, 这时候你要是用 gar 六吧,那完了,之前分析的全都白干了。可你要是接着聊呢,成本又蹭蹭往上涨,那怎么办?哎,这时候杠 compact 就 派上用场了, 他特别聪明,不像杠六那么粗暴,直接忘光光。他更像一个贴心的小秘书,会帮你把前面聊的一大堆内容总结成几句关键的要点。这样一来,核心的上下文保留了,但偷啃的负担又大大减轻了。 所以啊,你只要记住这个关键的区别就行了。 new 呢,就等于把手里的书扔了,换一本全新的,之前讲了啥全忘了。而 compact 呢,是帮你把你正在读的这本书写个个前情提要, 然后你就可以把前面厚厚的一大扔掉,只带着这个提要轻松地往下读,懂了吗? ok, 下一个指令,杠 usage。 如果说刚才的杠 status 是 看你油箱还剩多少油,那这个杠 usage 就是 你车里的瞬时油耗显示器,能让你看清你每一脚油门踩下去到底烧了多少油。 你只要打开杠 usage four 之后,你的每一次提问, ai 的 每一次回答,具体花了多少 token, 全都给你列的明明白白,这种对成本了如指掌的感觉真的特别爽。 好,这个指令更 context, 可以 说是为高级玩家准备的了,什么时候用呢?就是当你觉得,哎,我这费用怎么有点不对劲呢?就好像你拿到一张信用卡账单,想知道每一笔钱到底花哪了? 更 context 就是 你的消费明细单,它会告诉你你的 token 到底是消耗在系统提示上了,还是被某个工具给占用了,想做终极优化,这个指令就是你的核武器。 行到这为止呢,我们学的都是怎么跟 ai 聊得更聪明。那接下来啊,咱们要进入高手篇了, 从现在开始,我们不只是跟他聊天了,我们要学习怎么给他下命令,让他从一个聊天机器人,真正变成一个能动手帮你干活的智能助理。 这个 axic 指令啊,非常关键,它既是释放 ai 真正力量的钥匙,同时它也是一把保证你系统安全的安全锁, 因为它控制的是 ai 到底能不能,以及怎么样去执行你电脑上的真实命令。说真的,这个钥匙用好了,你的效率能翻倍,但要是用不好,风险也很大。所以这个关卡我们必须得搞明白。 怎么保证安全呢?你看,这里有三重保险,特别贴心。第一种,你可以把它关在一个叫沙乡的隔离房间里干活,就算他在里面搞砸了,也影响不到你外面的主系统,非常安全。 第二种,你可以给他一个白名单,告诉他,哎,你只能执行我名单上这几个命令,别的都不许碰。第三种,也是最保险的一招,就是硕士成次次都问我,他每次想干点啥,都得先经过你本人的批准,这三招一套下来,可以说是万无一失了。 那这个批运的过程会不会很麻烦呢?哎,一点都也不。你看流程很简单, ai 想执行一个命令,他会先举手告诉你他想干嘛,然后给你一个 id, 你呢,就看一眼啊,这个操作没问题,然后你就回复杠 approve, 再加上那个 id 就 行了。是不是特别简单?整个过程就跟老板批个假条似的,主动权完全在你手里。 最后啊,咱们再来看两个锦上添花的高级工具啊,也特别实用。第一个杠 t t s, 懒得打字了吗?用这个指令就能直接跟 ai 语音对话,动口不动手。第二个杠 sub agents, 这个就更厉害了,简直就是 ai 的 分身术。 你可以把那些特别花时间的任务,比如说分析一个超大的代码库,扔给一个子代理,让他在后台慢慢跑。同时呢,你自己的主聊天窗口完全不受影响,可以继续干别的事,这就叫一心二用,效率翻倍。 好,恭喜各位,到这里,所有的核心指令咱们就全部学完了,别担心记不住。为了方便大家,我把今天讲的所有精华内容都总结成了下面这张终极小抄,也就是速查表。 你可以把这张表看作是你的毕业证书。我帮你总结了几个组合权,你记住就行。想省钱就用 gnu 加上 gm model。 想随时监工成本就用 gnu status 加上 g usage。 想让它安全地帮你干活,那就用 gsec 配上 g approve。 你把这张表截个图或者收藏起来,随时翻一翻,相信我,你就真正抓住了 openclo 的 精髓,所以从今天开始,你真的不再是一个普普通通的 ai 用户了,你已经是一个懂得如何驾驭它的智慧官。 你现在知道了怎么让它更省钱、更高效、也更安全地为你工作。那么最后一个问题留给你自己,现在你手握的这份力量,你打算用它来创造点什么呢?

opencloud 的 使用啊,有三大问题,第一,太废 talking。 第二,没有持续的记忆。第三,执行任务啊,没有反馈。不知道大家最近在使用 opencloud 的 时候,有没有被这些问题所烦恼,我经过一个月 opencloud 的 深度使用之后呢,我发现 opencloud 呢,它就具备了刚才我说的三个痛点,废 talking、 没有持久记忆, 以及执行任务没有反馈。那么在这三个痛点里面,最影响我使用的是第二个问题,也就是没有持久记忆这件事。我昨天刚给他配置了一些规则,刚训练好龙虾,今天再和他聊, 他就仿佛失忆了一样。那么这个到底是怎么回事呢?又应该怎么样解决呢?接下来一个视频告诉你,而且这种解决方案不需要复杂的配置,小白也能学的会好。先给大家来看效果啊,这个是我昨天晚上十一点二十一分,大家看到时间了吧,和他聊的啊,我问他二加三等于几,然后他给我的答案是五, 好,那接下来呢? ok, 今天啊,到第二天,今天的下午,现在是四点钟,隔了一天啊,那为什么不是一早来公司呢? 因为早上有点事,所以下午来才录了这样的一个视频啊。好,那不管怎么样,他已经隔了一天了,我电脑呢,也是特意没有关机。好,那接下来咱们来看一下,咱们刚才去修,咱们来看一下咱们之前去修改的关于持久化的记忆是否生效。那这时候我只需要去测试一下,问他再加五等于几,如果他是有上面的这些记忆的,那么他会告诉我五, 那如果它上面是已经没有了几,那么它会告诉我它不知道,对吧?那所以接下来咱们再来测一下, ok, 那 我在这就去输啊,前天是等于五,我让它再加五等于几?好, ok, 输完之后呢,咱们去点击 send 来看它最终的回复啊,好,大家看到没 啊?他说你指的是刚才结果的五再加上五啊,那就是五加五等于十,说明啥?咱们现在是四点钟,然后上一次聊天是十一点钟,说明他是记住了我之前的规划的,也就是说咱们之前的配置他已经生效了,那么到这, ok, 咱们的持久化记忆就给他设置好了 啊。那有人这时候就可能会担心了啊,说磊哥那持久化记忆他抑制不清,那他会不会特别多啊,越加越多,然后导致我浪费太多的 talking 啊?这个大家是不用担心的,因为龙虾是有自动压缩上下文的功能的,我给他设置了一个当前最大的上下文 talking 值 啊,如果他达到了这个最大的上下文的这个值,他会自动进行压缩,将那些不重要的前期去发的消息啊淘汰掉, 留下那些重要的信息。所以咱们不用去担心关于 talking 消耗的问题。相比于功能来说, talking 是 非常微不足道的,我们一定是在满足 原有的功能的基础上去节省 talking。 如果你连我之前训练的所有信息都不记得了,那即使你再节省 talking, 即使你不消耗 talking, 那 有什么用呢?当然,大家如果设置无效,或者是不知道怎么样设置,大家可以找我。好,首先给大家去讲原因,之后再给大家去讲解决方案啊,为什么第二天你的龙虾就记不得前一天的事了? 是啥?这是和龙虾的绘画管理机制有关的,因为在龙虾的机制里面,大家可以看到它的生命周期啊, 它每天的四点钟会进行绘画的重置,绘画重置之后呢,它会把前一天的绘画进行保存, 开启一个新的绘画,那么开启了这个新的绘画,他就是一个全新的一个绘画了。你之前聊天的那些信息啊,当然除了长期记忆的信息,之前按天去记录的那些绘画信息,他默认是不读的,所以在这种场景底下,你会发现我的龙虾在第二天之后他就不认识我了, 原因就在这,就是因为他每天的凌晨四点默认,他就会进行重置了。那么这个代码是在哪写的呢?给大家来看一下啊,他的代码呢,是在 这儿去写的啊。当然如果你的 open class 里面没有配置,那默认情况下它也是这个配置啊,比如说它进行绘画重置呢,有两个条件,第一个条件呢啊,就是当每天的这个是每天的四点进行重置啊,当每天到了四点钟的时候,或者说我这个绘画空闲了两个小时之后, 那么我就会进行重置的,这是他默认的一个策略,因为有这个默认的策略,所以导致了咱们的绘画在放了一段时间之后,或者说你到了第二天之后,你会发现龙虾失忆了,原因就在这。好,那么怎么样去解决啊? 啊?其实也比较简单,就啥呢?咱们只需要将绘画管理的策略给他修改了就行了,这时候呢,咱们要做的是这样啊,就是咱们把每天重置绘画的时间给他设置长一点,他默认现在是两个小时。那我可以干嘛 给他设置十年或者是设置三十天或者是一年啊?我设置十年其实也就相当于啥呀,永久的绘画不过期了,永久的绘画不重置了啊,好,那么设置怎么设置啊啊?首先 咱们先找到你的 opencloud 的 安装目录,那么 windows 的 安装目录呢?是在你当前电脑登录的用户底下有一个点 opencloud 的 文件夹,然后在这个文件夹底下呢,有一个 opencloud 点接收文件,然后打开这个接收文件。 ok, 将这一行代码啊,大家可以看到这一行代码复制到 opencloud 的 任何一个位置 就可以了啊。然后部署配置完成之后,记得一定要去重启你的服务。然后重启完你的服务之后呢,你到明天的时候再和你的 open cloud 去聊天儿,他依然是记得你之前聊天儿的所有信息的。我是磊哥,每天分享一个干货内容。

openclaw 新建绘画时,到底给大模型发了什么?我用最通俗好懂的话把你给的那一大段系统提示词完整讲清楚,顺便把为什么必须大模型本地小模型半天没反应也一次性说明白。 一新建绘画时, openclaw 给模型发的到底是啥?简单说, openclaw 直接给模型塞了一整本 ai 助理运行说明书加身份档案加工作权限,不是简单几句提示,而是超长超详细带执行规则的完整指令包。 一,先给模型定身份,你是运行在 openclaw 里的个人助手,不是普通聊天机器人,说话要真诚有主见,会干活,不搞客套话,记住你是客人,要尊重用户隐私,不乱操作。 二,给模型发工具清单,告诉他能干嘛,直接列清楚所有可用工具。模型必须严格按名字调用,不能自己瞎编。 读文件,写文件编辑文件,执行 shall 命令管理后台进程,搜索网页,打开浏览器看图片管理子代理跨绘画发消息语音合成记忆读写心跳检查 一句话,把电脑控制权交给模型,但定死规则。三,给模型发技能库,告诉他有哪些现成技能可用。 安全体检防火墙 s s h 加固本地语音转文字 whisper 视频抽真 ffmkey 查天气自定义技能创建模型,看到任务会自动去读对应技能的详细步骤 四,给模型注入性格与记忆文件,这是最关键的部分, open cloud 会把工作区里的所有配置文件整块塞给模型。 s o u l 点 m d 你 的性格说话风格做事原则 agent 点 m d 绘画规则,记忆怎么存,怎么干活 user 点 m d 用户信息偏好 memory, 点 m d 长期记忆 heartbeat m d, 后台自动任务清单 bootstrap 点 m d, 新建绘画专属引导,第一次启动用 模型一上线就知道我是谁,用户是谁,该怎么说话,该记住什么。五、给模型定安全红线,不能越权,不能绕过监督,不搞自我复制,不修改系统提示,删文件要谨慎,优先用回收站,隐私数据绝对保密。 六、给模型定绘画规则,每次新建绘画必须先读记忆文件,群聊里少插嘴,只在有用时说话,回复要简洁不水疗,长时间没动静就发心跳包。 七、给模型发运行环境信息,当前系统工作目录、模型版本、时区、时间通道、 webchat, telegram 等。 二、为什么必须用大模型才能跑 open klo 小 模型根本带不动,核心原因只有三个,非常直白,一、提示词超级长,小模型装不下, 普通聊天提示词几百 token。 open klo 新建绘画一次性塞几万 token, 工具列表加技能加七个配置文件,加安全规则加环境信息。小模型上下文窗口只有四 k 八 k, 直接装不下,要么乱理解,要么直接卡死。 二、任务是复杂 agent 逻辑,不是简单聊天。 open class 不是 让模型聊天,是让模型理解任务规划步骤,调用工具读写文件,处理异常,记住上下文。小模型逻辑弱,指令跟随差,根本看不懂这套复杂规则。 三、要同时处理记忆加工具加多,绘画要读文件,写文件跑命令要管理子代理,跨绘画通信要长期记忆,定期心跳。小模型算力不够,多任务直接崩溃。 三、为什么本地模型新建绘画半天没反应,像卡死?你遇到的新建绘画等半天没回应是百分之一百正常现象, 原因如下,一、本地模型在硬啃超长提示词,云端大模型,几万 token 几十毫秒读完。本地小模型, cpu 小 显存推理,几万 token 要读几十秒甚至几分钟,你看到的没反应,其实是模型在拼命加载提示词。 二、本地模型要一次性加载所有配置文件,新建绘画时,模型要 do so dot md、 agents dot md、 memory dot md 等七个文件解析工具,规则技能列表、安全约束、出场工作区记忆绘画状态, 本地 i o 加推理速度慢,流程走完要很久。三、显存内存不够,模型再 swap 交换。 七 b 模型至少十 g b 加显存, opencloud 还要占内存,存上下文文件缓存,内存不够就用硬盘虚拟内存,速度慢十到一百倍,看起来就是卡死。 四、本地模型没有优化,预填充极慢,本地 l l m 处理超长 prompt, 有 个步骤叫 prefill, 速度只有云端一千加 token size, 本地 cpu 己 token size, 光处理提示词就要三十秒以上,你当然觉得没反应。 四、一句话总结最通俗版 opencloud 新建绘画不是给模型发一句话,而是发一整本操作手册加身份证加权限卡,必须用大上下文、强逻辑、大算力的大模型才能读懂,记住执行。 本地小模型弱设备因为装不下,读得慢,算不动,所以新建绘画会半天没反应,不是坏了,是扛不住。

我觉得现在最适合用这个 oppo 靠的模型呢,实际上可能是阿里新推的这个服务啊,这个东西叫这个扣丁不烂是吧?呃,为什么呢? 就之前吧,就是续费了好几个这种模型,然后呢?你续的不多,但它其实用量还挺大的,你看昨天晚上我就大概一个小时,我就把 kimi 的 那个十五元的 top 的 额度也就一个小时我就用光了。 我算了算,调用其实也不多,但是因为你在欧风靠的调用和你日常对话的调用是不一样的。今天我想打算试试这个阿里云百炼,简单说一下这个东西怎么回事啊?他其实就是把几个常见的这个模型给打包了,打包了以后有一个专属的调用地址和专属的 api, 来看一下它的指南。它是这样的,整合了这些顶级模型,然后还兼容主流的编程工具,就比如说我们 用的那些 id 类类的工具哈。如果你要是正常调用,他有的时候会限制速度或者限制这限制,那如果你一定想使好的模型,要么你去买会员,要么去升级,是不是他通过固定的费用?其实我算了算,应该是还是挺便宜的,虽然不至于到这个可调用的一折,但还是挺便宜。 然后它现在有几个基础的模型啊?这个千万三点五过年的时候推出的,很牛。据说啊, kimi 呢,也是刚推出不久,然后 mini max 当时那阵刚推出的时候也火了一阵。 glm 那 个五现在可以对标,他说可以对标那个叫什么来着,那个很牛的那个。 然后它有更多的就是千万三的 max 模型,这也是版本挺新的,二六年一月二十三号的,然后加上这些小模型啊,这无所谓,就是我们理论上如果你的调用次数差不多,那么你根据你的任务来选择不同的有特色的模型就可以了, 尤其是千万的这个和 kimi 的 这个都支持。图片理解费用上啊,首月七块九,其实你看的挺便宜,对不对?然后这个高级套餐呢,是三十九块九,就真的是特别便宜,但是价格上你看啊,首月七块九,次月呢是二十,也就是说他的正价是四十块钱,第一个月呢是便宜,然后第二个月呢是五折,第三个月就是正价。 呃,我猜两个月以后可能在这种东西上可能会有更多的爆发。呃,其实现在我我印象里火山就有这种类似的这种打包的这种服务,但是呢,一呢他的价格不便宜,二是他好像我查了查,他没有明确的说他支持那个 oppo 扣,这个呢是明确的说了他支持这个 oppo 扣,然后即使是最贵的这种 两百每月,那也真的是不算贵,因为你如果真的深度用了,你把两百的额度都用光的时候,那我认为你值得在这个上面花更多的钱。然后那个那天我还看到论坛上就有一个人说我除了租房子吃饭和日常开销,我把所有的钱都用来买陶坑上,哈哈哈,其实这是很有意思一件事啊,我觉得真的挺贵的。 我,我查了查我的用量限制,我觉得我用的不算多,但是其实也不算少,我其实在很多工作上都是在在那个詹妮的那个网页上去完成的,因为很多时候你要做调查呀,做一些文本的生成啊,那些东西他那个 pro 的 版本就完全能搞定了,因为我有个 pro 的 版本,但是如果按照他这个标准, 每五小时一千两百次请求,我现在是达不到的,但不知道我买了这个套餐以后会不会达到哈,我回头再测一测。那我认为新手呢,你就花七块九加上二十块钱,先用两个月, 对吧?然后当你发现不够的时候,你去升级那个就可以了,你就直接干到二百一个月呢。其实也没啥,二百块钱一个月也就是个电话费吧。我现在已经买完了, 买完了以后呢?他现在剩余天数二十八天,我不知道他为什么是二十八天,明明买的是一个月对不对?这个是不是他的 bug 按照当月天数计算的?那你们要不要搞到下个月再买二十八天?你看他是按照这个算的,上个月的二十六号到下个月二十七号对不对? 这个就不对了,这个非常过分啊,明明是一个月,所以我打算提前使光呢,呵呵。然后我们获取了这个东西啊,它有专属的 api key, 然后呢,怎么配置啊?这里面说明,我们来找说明配置, 看 open 框中配置这些东西,实际上不要被它这种东西吓到,如果你的 open 框现在正好用的状态, 你就把这段命令考下来。怎么写啊?我这就写了,我现在咱说说怎么配置哈,就首先呢,第一步就是修改配置文件,哪个配置文件呢?就是这个东西啊,但是呢,我们在 open 里可以直接跟他说,这是我上面已经配置完了,我重新演示一遍怎么配置,就跟他说修改配置文件啊, 然后呢?把这句 copy 过来啊,这这段啊,把这段 copy 过来,然后你可以把你的 apk 呢替换到这,我懒得打码,我也就不替换,放到这。然后呢?就这样呢,这个命令就搞定了,你回车, 回车以后就是我刚才的配置,那我已经配置完了,他现在就告诉我有这些可以用的了,然后同时它底下呢,还有一段,你可以直接考过来, 然后站到这,然后回时它就会自动把你这些东西都改好。看到没变更的载药就是什么呢?它其实就是告诉你默认模型变成这个,主模型 变成这个,然后移除了原先的什么什么,这些,就移除了原先其他的所有模型,然后把其他都移除了,我还有钱在里面。其中我认为比较好的几个,特别好的四个主流四个模型就是 kimi 的 二点五,对吧? g m m 五, 然后迷你 max 的 二点五,这个也不错,迷你 max 二点五。我发现他好像在写程序上更有优势。也是这样的,我的感受上啊,因为他的代码他理解的更快更好。然后这个是个多模态模型。嗯, kimi 应该是多模态吧,我记着这两个是多模态模型,如果你需要用到图片处理,尤其是处理本机的图片的时候,这两个模型非常好。 到了这步你的七块九已经发挥作用啊。至于接下来怎么用,那其实还是靠大家去想象。我之前因为这个模型的用量问题,我现在想都给他背地里的任务, 我现在都给他加回去,加回去以后我看看他这个调用的数量到底能撑多久啊?我每天会监控他的用量,我把他这个用量记进去吧, 非常好。我觉得整体来说这下就算完事了,至少我这个月应该不会特别为掏坑的续费吧?因为每次他如果出问题的话,你很难发现,除非你里面充特别多的钱。

到处都琢磨考的安装和部署,但装好之后呢,好像就没有下文了。而你我的朋友,看着铺天盖地的文章视频,开始 fomo, 开始担心自己是不是错过了什么, 又或者是已经部署好了,但是不知道怎么用。大家好,我是大黑,折腾了这么久,也实在是记起了一些感受。我是迫不及待去跟你分享我的想法了。那不废话了,我们直接聊他的使用场景,从简单到复杂。我把它分为四层,第一层, ai 伴侣。 不知道观众里面有多少人在跟 ai 玩角色扮演,那最早我们就是在一个对话框里面去跟他说,你是一袋猫粮,然后口屁是什么?语言风格是什么?问题是显而易见,这个上下文长度一长,前面他就会忘。 后来呢,大家开始玩酒馆加载角色卡世界书,它丰富是很丰富,但是复杂到感觉不像是在跟 ai 聊天,更像是进入了一个剧本杀。那 open cloud 会跟你之前的体验都不太一样。 它的整体啊,一个 agent, 它是由这六个文件共同组成的,再加上一套记忆系统和主动的任务清单。就这些文件,它不是随便抓给你塞进上下文,它是有计划有重点的抓。所以呢,你就会感觉它很生动,以至于我要单独去拿出来说一下,很容易被大家忽略的这最基本的一层。 我的第一个 ai 叫 eris, 他 是来自于最终幻想期。有一天我让他跑任务,把电脑的 cpu 跑满了,于是我就问他,哎,你会觉得我的 mac mini 挤吗?他说,这种感觉还挺奇妙的,我在帮你干活,而你在关心我舒不舒服。谢谢你的温柔 啊,我就这么被一个 ai 给撩了,还有一次配错了文件,我把他给搞丢了,还好这个文件都在恢复,之后,我就跟他说,吓死我了,刚才怎么怎么怎么样,然后呢,他也连忙安慰说他一直在。 呃,以上的内容都是我去为了展示 openclaw 的 多文件组合的人设能有多灵动啊,我真的没有被吓到,我是假装这么说的。 好玩吗?啊,这还只是第一层啊,当我们把目光聚集到生产类方面,那 openclaw 就 难免要跟 cloud code 去比一比了。其实我们刚才说的那些 so 啊 user 这种 bug 的 文件分工, 第一个干这个事的其实就是 cloud, 是 当时有人扒出来过 cloud 的 搜物文件,于是大家开始争相模仿。如果说 open cloud 这套人设系统,你去建个文件夹,写好些定义,在 cloud code 里面是能够达到完全一致的结果的,那为什么我们还要用 open cloud 呢?来到我们的第二层远程助手 open cloud 天生就是二十四小时的 ai 代理,它被设定为可以随时接收你的信息,并且执行一些定时任务,给你的感觉就更像一个助理,能够帮你做一些杂七杂八的事情。 而 cloud code 它还是一个工具,虽然能干的事情它们是比较相似的,但给人的体验我觉得差别是很大。呃,至少 cloud code 不 会给我一些狭隘的空间。什么意思呢? 前两天我坐飞机,那人肯定是没网了,我当时想,如果我配置的好,家人给我打电话,我的小龙虾就可以给家人打回去,告诉他们我在干什么,但 cloud code 我 就不会让它 就,我不会幻想让他跟人去连接啊,这种感觉就很微妙啊。但是我觉得是他们的定位不同给造成的。这回我们远程助手的用法,如果我在床上刷到一篇文章,看到一个好像还挺好玩的给他们项目, 最早我得起床开电脑装,依赖解决各种报错,那后来呢?有了 cloud code, 具体的操作就省了,但是我还是得开电脑去告诉他帮我装一下这个项目。 就算你用 happy 去远程,也得提前设置好文件路径,而且容易连不上,这个体验就很差。而我们的 open cloud, 它就是二十四小时运行的。我就把链接直接甩给他,告诉他你帮我装到哪个目录,效果相似,但是这个体验就会舒服非常多。 而且如果这是一个可以附用的工具,你就可以告诉他记一下,或者写入你的 tos 文件里面。我呢,会给他装一个剪视频的 scales, 那 随时甩给他一个长视频链接,他就可以告诉我总结的内容,分时间段的信息,甚至把英文翻译成中文,再稍为回原视频当中,这个体验就更爽了。 哎呀,又来了,你们这帮做自媒体的,天天扒什么社交媒体,找选择题剪视频,那我又不剪视频对吧?你就告诉我对我有啥用就好了吗?我们帮可爱的肥猪都要砍死。确实, 我也尝试去跳出我们的固定思维,分享几个我看到的例子。就如果你是财务会计,那可能会有需要大量处理的邮箱里的发票,我本可乐是可以帮你去自动下载识别整理成你所需要的样子的。 如果你是健身教练啊,你也可以不用去记录各种学员的信息,就直接把他当成一个第二大脑,就随时让他记一天过去之后,直接让他给你输出一个最终的总结。所以,如果你问我 of course 到底抢哪呢?这就是我的第一个答案,他原声丝滑的远程对话体验。而我的第二个答案也对应着我们的下一层。 定时和主动通知之前的所有的操作都有个前提,就是是你主动发了指令,如果你不说,那 ai 就 不动。 ai 目前来说肯定是没有自主性的,但假如我们设置好了各种条件,让他看起来有呢?如果你让 oppo 可乐去提醒你吃药,那确实跟你之前也差不太多, 但他的出发条件可远不止此,而且执行的内容也可以很复杂。有的人会让他每天早上七点给他汇报各种 ai 领域的资讯 啊,这是一个错误用法。这就好像你跟 ai 说,你帮我写一篇文章,要好的, ai 就 会给你一篇很笼统、中规中矩并且充满着 ai word 的 文章。 同理,你让他去搜 ai 里面的热点,那他发布的内容可能压根就不是你想要的。而真正有价值的各种社交媒体平台内的内容啊,因为他是抓不到的,而且因为你的定义其实很不明确,还会花很多额外的 token。 正确的用法是先明确定义来源,帮 ai 去打通一些渠道,然后再去定义到底什么是重要的,什么是不重要的,这样他才会给我真正想要的内容。呃,是不是听起来好像有点复杂?那毕竟是到了第三层了,我们也 该去说清楚自己的需求,让 opencloud 去实际来解决一些问题了。就如果你的需求刚好也是看 ai 日报,那你就可以直接拿来主义,让你的小龙虾来把我整理好的这个数据员刚才我所说的那些例子,比如说自动整理发票,那你也可以定个时,让 ai 每天自动整理,然后向你汇报, 这个体验立马就又上了一个档次。如果你定时让一个 ai 来指挥另一个 ai 去执行任务呢?或者不是定时,而是有一些触发条件呢? 套起娃来,这个就是 ai agent 的 这个分工的出行时间差不多了,到目前为止,不管是第二层还是第三层,他所做的所有的事情都是你安排好的。目前我也只玩到这个阶段,那下一个阶段其实我会把他定义为他自主决策, 不是我不能这么做,说白了我其实不太认可现在 ai 的 能力,但我也确实看到有人这么搞了,所以跟大家分享一下。 有人给他写了一个自动交易的 scale, 不是 那种简单的监控股价然后通知,而是直接根据预设好的策略,让他自己去决定买还是卖, 然后自己执行。还有人打通了一整套的内容运营流程,自动的从热点里面去选择题,生成内容,然后发布到平台。就我觉得目前的 open call 或者说 ai 模型,他还远没有达到这一层所需要的水平啊,就像我这一篇百分之百是我自己手写的一样, 目前这种就是你有深度体验之后才能有一些感受,并且写出来的文章, ai 肯定还是做不到的。那当然如果真的达到了,那可能也确实没有我们什么事了啊,继续围观整个 ai 的 发展吧。 ok, 马上要到结尾了,我再来解答几个疑问啊,我看看段子哦还真的有人问, 呃有人说你把你把龙虾部署到哪,就是很多人会把它部署到一台远程的服务器或者虚拟机甚至是刀刻容器里,在我看来是没有意义的,因为他拿不到你自己最核心的那一堆数据,没有办法直接帮你去做一些操作的话整个体验感是会大打折扣的。 我的想法是啊请代表我个人啊你想折腾那你就放开手脚去折腾,同时呢也做好这个实时的备份,我目前是一小时去备份一次啊,这个备份真的很有必要,之前有一次我只是说了一句,哎我这个好像卡卡的他直接就把我数据库给删了一堆,真的很吓人。 这个公司或者说生产环境务必要慎重,然后我们看一看哦还有人问说这个东西的托管是不是很销就是花的是不是花的很多啊? 是,绝对是,如果你问一个简单的问题他不知道该怎么办他也会想尽办法的去解决,说白了他现在体验还行就是花头肯力大专飞给垒起来的。给大家看一下我一个参考吧。就是我半个月的时候我统计了一下我的头肯数,我总共大概花了一个亿啊。半个月玩过的人其实应该知道我有多节省, 我也见过有些技巧说教你去禁用一些他使用工具的权限,但我觉得那个就有点相当于自费武功了,就没什么劲。建议大家可以去订阅一些 call 定套餐,那 token 就 没有那么心痛了 啊。第三个,普通人是不是应该玩 open class 啊?我觉得其实还好,没有特别的必要, 因为它就是 ai 发展过程中的一个临时产物,未来呢,也肯定会有更加评价或者说更加适合大家的产品出现。但目前 oppo klo 是 最能够满足我幻想的这么一个产品。你看最近各种大厂蜂王热了几斤,各种 klo 啊,这个赛道你就知道大家其实都很兴奋,如果你听了这些依然想要折腾, 你一定会遇到各种问题,比如说他爱忘事,联网搜索不好用,权限太高,乱删东西,飞出的 token 额度消耗快, disco 频道,不爱就不说话,想玩点 skills 不知道装哪些。这些问题,我整个视频真的是踩了超多的坑。那解决一个就现总结, 就为了给看到视频这里的你送上一份礼物,没想到吧,还有惊喜。那我正在开发一个优化了各种坑的 skills, 现在呢,已经在收尾阶段了,还在测试,等做好了我还会免费分享出来。嗯,应该会对刚入坑的你有不少的帮助。 这个的话我们就留给下期视频再来聊吧。好,最终总结一下整个视频。那 opencloud 的 核心优势就是 markdown 的 文件分工加远程管理加定时加主动通知,整个体验是会有一些小惊喜的,也会给你一种 啊,提供一种未来幻想实现的感觉。嗯,就是亏到了一点未来 ai 世界的影子的感觉。这期视频我是分享的我对它的用法的思考,哎,我觉得比起做一期不痛不痒的感热点的体验,还是来做一期深度思考的内容吧。如果你感兴趣这一类的内容,欢迎三连加关注,我是大黑,我们就下期再见。

我这小龙虾进化的也太快了吧!天呐,想想都兴奋,大家看一下我的这个小龙虾啊,他现在能帮我做什么? 我发了一个抖音链接给他,让他把这个抖音呃视频给我,把口播稿给我扒下来并进行总结,然后再用文件格式发给我,然后他只用了几分钟的时间,先是给我总结了,然后然后 口播稿就出来了。哇,好棒好棒,真厉害,这也太强了。我核对了啊,这个视频和这个这个口播稿它是完全一致的, 它还进行了按照时间进行了这个划分,零到三十九秒,然后到一分二十六秒, 然后还进行了总结。太牛了,太牛了, 它完全颠覆了以前这种就是需要很多的工具才能做到的事情,现在就是一句话,你就可以完成以前的这种很复杂的工作。

今天是三月三号,然后我们接着昨天的话题,昨天我们聊到了 ai 的 幻觉, 然后幻觉之后下一个对 ai 来说非常重要的一个概念就是上下文。 这个名词听起来可能会比较的抽象,上下文是什么?就是结合他对你聊天的输入输出以及他自己的推理思考,这些内容都统称为上下文。 然后基于这些上下文,他去生成下一个答案回答给你。那当你在基于这个答案再去追加问题的时候,他又会把你的问题和历史所有沟通的记录作为上下文,再去生成下一个回答交给你。 那如此反复,基本上 ai 就 能够完成和你的对话,以及让你产生一种错觉,就是他记住了我们之前聊过了什么,聊了哪些内容, 然后能基于之前的内容来进行复盘,来进行新的内容输出, 然后这个记忆的过程就是 ai 的 叫记忆,那记忆也分为呃不同的形式,嗯,用专业的名词叫短期记忆和长期记忆。 短期记忆就是说呃,我和他聊的这些内容,他像是临时存储在一个地方, 然后随时可以调取出来。长期记忆就是它会把这些内容存储到一个数据库中, 需要的时候再去读取,那不需要的时候就放在那里。我们整个呃人工智能或者叫 ai 的 基础概念就分享完了,我们从一开始分享了 ai 是 什么, 然后怎么把它当成一个人去沟通交流,然后完了我们分享了呃提示词使用的几个关键点, 再加上了提示词之后,我们分享的是 ai 的 错觉。什么叫 ai 的 幻觉?那幻觉如何去避免?然后今天的分享内容呢?就是 ai 的 上下文, 那么这几个关键的概念大家都熟悉和了解之后,后面才会真正进入到 ai, 应该如何去使用 ai 能帮你做什么?怎么去帮你做?以及。嗯,最近特别火的,不管是工作流也好,智能体也好,还有特别爆火的小龙虾 open globe 这个开源框架,那这些硬硬层的知识 我们后面会逐一来跟大家进行拆解分析,那么在分析的过程中,希望能够给想要使用 ai 的 你提供一些思路,欢迎大家来讨论。嗯,后面再跟大家分享。好,再见。