最近看大家都在玩小龙虾,我也跟风试了试,结果折腾了两个晚上,先是给我的老 imac 升级系统,从 macos 十点十三一路升到本车,结果卡的不行,根本没法用,又退回到 big sir, 结果竟然不支持安装小龙虾,最后试了 monterrey 才总算把 ok 封号出来。本来以为大功告成,结果这玩意也太笨了,对话都不利索,连网搜个资料还得要 a t i, 不 吃 token 就 不干活,根本没斗包。有意思,看来想玩。
粉丝883获赞2618

大家好啊,昨天阿里巴巴开源了千问的一个小模型,三点五系列最小的尺寸模型啊,四款,那其中有一款是零点八 b 和两 b 的 啊,这个是非常小啊,推力虽然很大,但这里面我说的不是他的,我说的是一个三点五 b 的 啊,四 b 这款, 四 b 这款好了,四 b 这款的话呢,我们昨天晚上测试了一下汤,同时话呢,我们先说一个事啊,马斯克在 x 上对这个模型进行了测试,并且给出了一个非常好的体验,他认为这些参数他的智能密度令人印象深刻啊,为什么这么说? 我说这个四 b 的 模型,我建议大家考虑,如果稍微能力强,可以上那个九 b 的 模型。干什么来都知道你们正在养龙虾是吧?就那个大龙虾,那个智能体的集成是吧?号称是贾维斯的出行, 但是他是一个吃 token 大 户啊,什么意思啊?就是我之前试过啊,一个晚上让他给我们做一个程序啊,然后消耗了两百多万 token, 做出来程序还有很多 bug 啊,那,那这个事确实不可持续,虽然说这个 token 现在比较便宜,但两百多万 token 的 话也十几块钱呐,对吧?一个晚上十几块钱这玩意,而且解决一个任务呢,人任务多的话,可能上千万 token 都出去了,那怎么办?对,这个事怎么办? 所以呢,这个端侧部署一个端侧模型来解决这个龙虾啊,在日常应用中的绝大多数的 token 的 使用是当务之急, 那么在这种情况之下,这种小模型的话呢,就比拼,哎,谁能把大模型的这个能力降下来的这个度越小啊, 它寄生能力越好,对吧?这种情况下,所以千门刚刚推出这四款,尤其其中这个四臂,我们正好测试了,我们在昨天测试了,在我们的自己养的龙虾上跑起来非常的舒服啊,百分之八十以上的工作完全由这个端侧的小模型来解决了, 非常好啊,包括数据的处理啊啊,包括图表的处理啊啊,包括我们跟他日常对话包,包括调取这个,哎, skills 包括什么?呃,就是搜索东西啊,包括数据的集成啊,包括 excel 表格处理啊等等,这些东西完全都可以通过端测这个四 b 的 小模型进去, 非常好。所以呢,我说啊,我说这千万这次开源的四个小模型,其实恰恰什么,就是我们现在玩龙虾的最好的助手,也是最适合龙虾发展的模型, 就是这么回事啊,就非常的玄幻,但是现在就是这么回事啊,所以后续的东西,如果你们感兴趣的话啊,你们如果正在养龙虾的话,或者你想探索龙虾的,哎,我建议你好好试试这个模型,这个模型会给你省很多钱,因为它是开源的,你直接不熟以后最少你百分之八十左右的工作, 甚至高一点百分之八十五左右的工作,你是不用再去调取网络的 a p i 的 接接口了,它这个东西就产生更好的应用,懂,懂吗?但对于我们来说的话呢,它一是省钱,另外一个的话就是它的能力还够,而且它还有什么?它关键它有图形的这个 o c r 的 能力啊,然后它有图片的生成能力,这个就很强了, 这就很强了啊,所以这个事我觉得还是非常有意思的,而且小尺寸实现高智能啊,这个是非常强的,而且是少数实现跨级的性能的超越,媲美中型模型啊,中尺寸媲美顶级模型,这样的一个情况,我觉得华为的,哎,不是华为千万,这次做这事非常的好啊,非常的好, 好了,简单大家说一下,如果有需要的话可以好好试一下啊。另外的话呢,说一下呢,很多朋友说,老张,你现在是不是又关注 ai 了?注意关注 ai, 因为这是热点 啊,这是一定的热点,而且我们的这个说,在咱们的这个会议视频当中,热点也是因为我们的分析的快,然后你要说到哪看的话,关注一下我们小程序啊,到底瑞克老张哥不哥啊?我们小程序小程序里面的话呢,说实在的,咱们那个有一个免费的专栏,你说我不想花钱,有免费的专栏,就是咱们在平台上发的内容精选出来放的免费专栏的,不停的更新的,你要需要会看 看一下啊,赶紧的订阅就行,免费的。当然咱们的年度那个会员的话呢,现在是幺六九九啊,而且的话呢,我们是一年一百八十个这个会员视频,三十二场以上的会员直播之前内容都能看,甚至包括以前的付费专栏,包括以后的付费专栏都能免费看,特别划算啊,平均一那个一个视频 喝喝一场直播都十块钱左右啊,所以你觉得对吧?这个一一一一,一瓶两瓶,这个汽水钱啊,就就就解决一次这个抹平新茶的机会,你觉得划算不划算?好不好啊?今天就到这,我是瑞小张,关注我,带大家看中国科技的高度和温度,明天见,拜拜。

用了一个多月, tock 消耗了五个多亿,我是真的想自己架服务器去生产 tock, 这个市场真的太大了,我相信随着 ai 的 发展, tock 的 消耗也会成几何性的去增长。 你们有没有这个想法?开个 tock 生产工厂,自己造,自己用,自己用不完可以拿去出售。

这周我们烧了十亿多的 token, 在 openclaw 上大概就是一千五百美金吧。呃,但是我觉得非常值啊,因为我们终于 figure out, 怎么去管理一个 ai agents 团队, 所以如果你是一个艺人公司,或者你想用 ai 来管理协调你的整个团队的话呢?那请看完这条视频,因为我们已经帮你省下了一千五百刀的学费。 整个 a i a 阵子团队的协调枢纽和核心呢,就是最近这个特别火的 openclaw, 他 只要被调教好了,就是一个非常完美的项目经理。但也像所有刚招进团队的同事一样, openclaw 本身并不是一个开箱即用的 数字员工,我们需要去培训,他就是什么事情能做,什么事情需要让其他的人类同事或者其他的 agence 搞定进度该怎么汇报?有哪些规则要遵守?那么这些规则呢?在 open core 里其实就是一个叫做 agence 点 md 的 文档, 这个文档就定义了 ai 的 所有行为准则,它是一个配置文件,基础的配置就非常简单,就像一个没有被培训过的新员工一样。但是在过去一周的时间里,我们不断的去优化这个配置文件,让他成长到了可以帮我们去协调其他 六七个 a 公司的一个项目经理。那我们其实主要增强了他在以下三个方面的核心能力吧。第一个就是主动性, 因为很多人说 agents, 大家觉得他只是一个工具,只是一个机器人,那是因为他们是被动的,就是你给他一个指令,他就去执行一次, 然后你推一推他,他就往前走一步,他并不会主动的去想办法解决他遇到的问题,也不会主动的复盘和思考说怎么样把一件事情做得更好。 那如果 aids 只做到这样的程度呢?它确实只能当一个螺丝钉,但是 open course 不 一样的,它本身有一个心跳机制,就是 heartbeat 会定时去检查哪些项目卡住了,然后哪里遇到了它自己解决不了的问题,并且主动跟我们去汇报。 当然只做到这个程度的话,肯定还是不够的,所以我们在 a 证点 m d 里呢,就配置了更多的规则,让它能够做到不需要我去问任何一个项目的进度,它就可以完全汇报给我。 第二是可重入性,可重入性其实就是说这个 a 证它能不能稳定的靠谱的把一个很长期的东西干完, 它并不是说这个 agents 可以 百分之一百的在线,永远保持 up time, 因为项目的推进总是会出现问题的,然后网络即便再好的网络环境也会有意外的中断,所以我们要的其实是 它能够在项目中断,网络断掉了之后,当它重入的时候,能够从断掉的地方稳定地继续向前推进,它甚至可以去 fix 去解决为什么会断掉了这个问题。 openclaw 的 工作记忆管理,呃,其实是被动进行的,也就是说如果他认为和你对话当中没有涉及到什么重要的任务,没有涉及到什么重要的内容,他是不会主动记录到他。当他的工作日记当中 就导致比如说你重启了 gate 位之后,它就忘记了它在干嘛,所以我们在调试的过程当中呢,就优化了它去主动压缩上下文,主动刷新 session 的 这个配置,让它能够在横跨多天的非常长的任务或者是对话当中,依然清楚地知道啊不同的项目应该怎么样去推荐。 然后第三点,我们对它的改进,我觉得可以称之为 a gentle thinking, 就是 像 agent 像 ai 一 样去思考。因为很多人觉得调教 ai 来进行人机写作,应该是像 agent 像人类一样思考,但是我觉得恰恰相反,因为归机生物就应该用他们自己最熟悉,他们自己干的最好的方式来解决问题。我举个例子,大家肯定都让自己的 agent 去做过一些很简单的自动化,比如说去帮你发一条推特,去帮你在 tapp 上面呃 发一个 issue。 那 这个时候 a 正题有很多技能是可以用来干这个事情的,比如他可以像人类一样去操作浏览器,模拟人类的点击和思考,模拟人类在浏览器的输入框中,用键盘输入 来完成这条帖子的发送。当然呢,他也可以直接写一段呃 js playwrite 的 脚本,调用这个脚本来实现刚才的这个任务。但是最高效或者说最省钱最快速的方法, 肯定显然就是他直接去调用呃相关平台的这个 api。 那 么在刚才的这个任务里,比如说发帖子,在所有他可用的方式里,最慢最浪费投坑的方式其实就是模仿人类的这个方式。所以我们在给 openclaw 定的这个行为准则当中呢,就明确规定了 他在不同工具托 use 的 一个优先级,优先级高低吧,就不仅是当他自己要去解决问题的时候,应该以一个什么样的方式思考,什么样的方式去用工具,包括当他要和其他的 agents 交互的时候该怎么办?比如我们团队当中的 ai 工程师就是 cloud code, 那 open code 跟 cloud code 去共享一个项目 context 的 时候呢?它根本就不需要像人类一样,两个 agents 那 边开会聊天,它只要把自己在这个项目上的工作记忆日记直接把那个路径开放给 cloud code 就 可以了, 它们就直接可以完成整个工作 context 的 共享。除了上面的几个主要配置优化呢,我们还做了很多在细节层面的调整。呃,我也把这个版本的配置文件 留在评论区了,大家可以直接把它发给你自己的 agent, 他 就会自己根据这个文件里的指示完成所有的升级。 all right 我是 v a 七,现在在做一家 ai 加跨境的公司,如果你也想探索 ai agents 或者是相关的业务领域的话,欢迎来一起交流。 have a good one。

大龙虾还没有明白,百万 token 先没了,别急,一起来薅老黄羊毛。无限 token 免费用。首先在英伟达这个网站用邮箱注册个账号,接着验证一下手机号,就能调用 api 了, 关键是支持国内手机号,不用绑卡。然后随便选一个大模型,进入聊天页面, 这里可以切换各种大模型试试,白嫖的人太多,热门模型可能响应很慢,找一个速度还过得去的,这里查看视力代码,可以直接复制模型相关配置。然后打开你龙虾的外部页面,修改配置, 保存之后建议重启一下服务,现在就再也不用担心托肯消耗了,之前配置好的飞书也能直接使用。

敢说如果没有自己详细看过这个 skills 的 人,绝对没有办法养好小龙虾。这个 skills 它是自我进化的一个 skills, 这个是现在目前所有 skills 里面下载量最多的一个, 我们今天来详细看一下这个 skills 它是怎么样构建的,你就会对整个 open curl 和它的一些配置能更加的理解。 它是一个纯英文呢,我就直接让 cloud code 给我做了一下翻译,当然大家如果用其他的也可以,甚至你让它自己把这个逐句翻译了之后,给你保存在一个文件夹里面都是可以的。 ok, 我 们就来看一下它的这个是怎么样的一个东西。 首先它的这个架构就是非常标准的 skills 的 一个架构,有一个 skills 的 文件 markdown, 然后这个原数据就是它的一些版本号啊这些,这个是它自己自带的一个文件夹,其他的这个东西就是它的一些资源。然后 hook 就是 它的可以理解成它的脚本,它会把这个钩子 去放在你的 open curl 的 配置下面。嗯,当 open curl 它在回答一些内容或者调用什么模式,或者告诉你这个任务完成的时候,这个钩子就会去检测这个内容,检测了这个内容,它就会去调用某一些脚本,或者说自动地把一些提示词放到这个 open curl 里面,让 open curl 再去跑一遍它的一个流程, 重点就是让 open curl 去思考一下刚才的任务到底需不需要去进化到它的记忆里面,去进化到一个新的 skills 里面,或者去更新新的 skills。 它主要的功能是这个,这个就是它参考的一些文档,比如说势利啊,比如说这个后壳应该怎么样安装,还有这个的一些知识,这个 script 就是 它的具体的脚本了, 这个脚本基本上就是它后壳的脚本,钩子的脚本。 ok, 我 们来一点一点的看。首先是看这个 skills, 这个 skills 就 标准的 skills 的 格式,首先是它的原数据,这个东西会直接加载到大模型和 opencorp 它的一个上下文中,它才知道什么时候需要用这个 skills, 如果它需要用,它就会自己去看这个东西, 但是这也是一个比较坑的点,你稍微模型差一点的,它根本就不会去看这个东西,因为它会聚焦去完成你的任务,它的注意力是没有那么多的。所以说 你通常如果说想要去进化的时候,你去直接告诉他显示的命令,他让他去完成,去使用这个 skills, 让他去调用这个 skills, 然后下面就是如果他需要调用的时候,他就会去查看下面的东西。 ok, 我 们来一点一点的看这个 skills 的 描述,就是什么样情况下会使用它。其实就是让 open curl 让模型知道什么样的一些特征的时候, 就要使用这个 skills 了,比如说命令操作失败,用户纠正了,然后用户请求不存在的功能, a p i o 失败,其实就是捕获一些关键词,关键的意图的时候,它就会去激活它,就是让模型知道什么时候应该激活这个 skills。 我们来看一下这个就是它的一个 markdown 格式的文档,首先是它是一个什么东西,然后它是一个持续改进的什么内容,参考的信息,它是怎么样存放的?可以看到它把这个地图首先放在了最前面,它是怎么样安装在这个 open curl 里面? 呃,这个我感觉有点广告的嫌疑,你已经安装了之后,还还放在这个 skills 里面,按理来说它应该用一个 readme 会更好一点,这个会造成模型的这个上下文是不需要的, 然后它会告诉这个模型这个 open curl 的 一些信息。 open curl 的 这种工作区的内容就是它的 worker space 这儿它是什么样的一个框架,主要的个这些文件到底是什么格式,它进行更新的时候,它就可以更新这些文件,然后它就能了解到 open curl 它是一个什么样的东西。 它主要分成了三个部分,它会创建了这个 skills 的 时候,它会把这个文件直接复制到哦你的 workspace 里面去。直接会有这个文件夹,其实就是这个 skills, 它去维护这个文件夹里面主要的内容, 首先是学习的一些信息,再就是错误的一些信息,然后就是调用工具的一些信息。事实功能可以看到它就说首先你应该去创建这个文件, 然后去说一下直接复制过去,然后提升的目标是为了让你的一些工作技能可以沉淀到这里面去。 这三个其实就是 open curl 的 一些核心的配置了,可以看到 open curl 里面的核心的配置,这个是属于它自己的一些配置,其实这都是它去了解这个 open curl 是 一些什么东西,怎么样配置的触手化配置这个部分就是有用的,就是下载了这个 skills 的 时候,它应该按照这个过程,先把这个 skills, 把它的这个 open group workspace 的 一些东西先配置了来,可以看到,然后可选这个起用钩子。为什么必须要起用这个钩子?虽然它说是可选,因为我们用的模型往往都不是最强大的模型,比如说 opus, 它对你的指令它是会更加清晰的。但是我们用的这些稍微小一点的模型,像国内的 kimi, k 二点五这些,你不显示地去指挥它去用哪个 skills, 它大概率是不会用的,它的指令遵循是没办法注意到这么多信息的。所以说你必须要起用钩子, 钩子他就会强制的让这个 open curl 去完成某一个功能的时候,他会去思考我到底需不需要去调用这个 skills。 这个就是一个比较大的坑,如果我们是用国内的这种稍微小一点的模型,稍微不好一点的模型, 那么你钩子是必须要起用的,要不然你这个装了之后基本上就感觉没装一样。我相信很多人都已经装了,但是如果你没有仔细去读的话,大概率是没有起用这个钩子的, ok。 然后他也说了一下通用的其他配置,在其他配置里面也可以去创建,像 cloud code index 也可以去创建,这个东西就不太适合这个内容了,其实可以把这些东西删掉,因为他会影响他的上下文。然后就是怎么样去追加你的信息。 首先是学习到的内容应该追加到这个学习的 markdown 的 文件里面,他的格式是什么样的,然后是什么样的东西? 然后就是错误的信息,它的格式是什么样的,是什么样错误的信息,应该怎么样格式去把它说出来,然后它的时间戳这些都要保存下来,但是我是没看到它这个时间是从哪里获取啊?如果说时间是一直放在这个 open curl 里面的话,会自动更新的话,那是不太好的,还会严重的影响这个 k v k h 的 命中率。 还有就是这个功能请求的 markdown 文件应该放些什么东西,然后它的格式是什么,它也说明了一下,然后 id 的 生成应该怎么样放 id, 其实这些都是一些案例事例, free shot 它应该怎么样放在哪个里面?这儿也有 可以放到这种项目记忆的,当一些错误的记忆啊,这种学习的记忆可以广泛使用,而且使用了非常多次的时候,它可以把它直接放在这种文件夹下面。这种比如说 cloud code, 比如说这个 so tools, 比如说这个 so 哈,它是一直会放在 这个 open curl 的 上下文里面的模型上下文里面的,它会全量加载,不像 skills 的 这个文件,它只会加载最前面的那几行,这个东西它是会全量加载的,所以说如果说非常需要经常用的这种规则,就可以直接加在这里面,这个就是他说当一个不是一次性修复,可以把它保存到永久的项目记忆中,就是这个东西。 还有它应该怎么样去检测这些关键词什么时候应该写在什么地方,什么时候它是功能请求,什么时候应该学习,什么时候是一些错误的, 然后优先级的一些指南,这个就是它应该怎么样去放,这个倒没有特别重要,就是它要去做提升的时候应该怎么样写,怎么样去排优先级啊这些,然后最佳实践这些 还可以进行 get, 可以 把它提交上去。其实最最重要的,我个人认为就是这个 hook, 大家一定要把它配置上。如果 你不是用的 opus, 四点六这些模型,一定要把它配置上,就算是用的 opus, 你 也最好把它配置上,因为现在很多这种厂商它都有这种会员套餐,比如说一百块钱,然后一个月基本上你是用不完它的托管的,所以说大家一定要配置这个东西, 这个东西只会多消耗你的托管,但是它能让你的体验感和这个 cf 提升会更加的强,要不然你这个东西装了跟没装一样,因为我们的模型本身不太好。 ok, 那 我们来看一下它其他的一些内容,比如说这个脚本吧,这个就是钩子的一些脚本怎么样去配置,然后它会把这种信息重新发回给这个 open curl, 就是 让 open curl 显示地去说明一下,你需不需要去记录,需不需要去更新一下这个 skills, 然后这个其实大概也是这样,然后这些就是参考的一些资料,比如说怎么样去做修改,然后工作区的结构,比如说 open curl 的 一些知识,工作区的结构应该怎么样去修改,然后有什么特点,有什么规则, 然后这个是钩子应该怎么样去做配置,可以看到应该怎么样去做配置,这是 cloud code 的, 它之前是因为这个开发者,它是一个 cloud code 的 自我提升的一个 skills, 它出来了之后再把它换成的这个 open curl, 它有些是没有改的, 但是大差不差,它只是这种项目跟目录不一样,其实它的逻辑都是一样的。然后这个就是后壳的一些配置,可以看到它 open 或者 cloud code 还有 codex 这种配置都有。 ok, 还有就是 example 了, example 就是 你什么情况下应该去放什么样的内容,以及这个内容 markdown 的 文件应该放什么样的东西,然后它的一些势例, ok, 这也是后壳的一些东西。后,后壳的一些 markdown 的 东西,它这个也跟这个 skills 的 框架一样,我不知道它是因为要先把这个东西发给向后壳执行的时候,它会先把这个东西发给这个 open curl, 可能是这样的,然后后壳的 这个就不是参考的,这是一些资源,它可以直接复制这个技能的一些模板,模板资源,然后学习的这个条目应该直接放在这里面, 应该是什么样的一个格式,它可以直接复制过去,然后我再去做一些修改,然后这个东西就没有了。这个东西它就是让 open curl 把这个东西直接复制到它的 workspace。 总结来讲,这个 skills 就是 专门用于提升的,提升和进化的,只有你真正看了这些 skills 了之后,你才能对这个 o workspace 有 一个比较好的认知。 但是我个人认为哈,我们的后壳甚至不要用它的这种方式,我们可以直接创一个子质人体后壳来调用这个子质人体去更新它的记忆,我觉得这样更加的好,但是这样肯定更消耗头肯,但是如果说按照他这种后后壳再发给 open curl 的 方式的话,它会破坏它的上下文结构, 它会导致上下文的长度会很快就满了,所以说你的这种执行任务的效果就会大打折扣。当 我们买了这种稍微大一点的这种会员套餐的时候,可以建议使用这种子智能体的方式,你专门创一个子智能体来更新记忆,更新这种学习的经验,然后哦后壳跟这个子智能体进行绑定上, ok, 这就是今天的一个分。

我就搞不懂现在为什么网络上一大堆的人都在说 open cloud 不 得了啦,是一个新的时代的开启。作为一个程序员, 我反而认为网络上的那些啊,都是想赚取流量的噱头而已。网上讲的那一些场景很多都是属于更适合用 open cloud, 会是会是一种灾难。 怎么讲呢?我说的这种应用场景是属于每天你需要固定操作的这种场景,如果你交给交给 opencloud 去做的话,它要对你的任务进行规划,每天都要进行规划,这个规划要耗费很多的 token 啊。这点不说,问题是现在的 ai 大 模型能力及以后都会存在一个问题,就是他的规划和调用是不确定性的, 刚开始你不玩这个小龙虾,准确率会是百分之九十,你再用几天看一看,他会出错啊,他不可能百分之九十九的准确率,这是一个非常要害的问题。第二个是他今天执行跟明天执行,他的执行结果也会不一样的, 有可能今天他执勤的这个处理办法路径是三步,明天会变成四步。这种不确定你能接受吗?作为一个在 ai 领域里面去落地的人来说,我看到这种不确定是没办法,在严格的这个商业里面是没办法去落地的。 所以呢,作为程序员,我采取了另一条的路径,那就是用 ai coding 的 方法去写一些定制化的工具。这条路径对于很多人来说门槛相对比较高,但是现在的这个 ai coding 的 能力已经完全可以让大家去做到这一点了。 所以如果你有这种想用小龙虾的这个场景,并且你的这个应用场景是相对固定的,那么我比较建议是用 ai coding 的 方式去做这样的一个工具,你说是不是呢?

我花九点九买了 open 了七天体验。起初我给他配置了一些升图技能,然后给他丢了一张测试商品图,再叫他给我生成四张详情图, 然后文案我让他自己写,他马上就开始出设计方案了,感觉和其他 ai 没什么区别。 涂出来了涂出来了。哎嘿你别说,而且这些文案还是跟产品挺符合的,感觉有点东西哈。而且还配了文案,他把细节图做出来了哎 嘿你别说你还真别说。不错不错哦买噶哇哦。

我已经用了一亿的免费 tokyo 来养龙虾,可以看到这是一点五九亿的 tokyo, 然后四千四到用零元。我用的是这个新送的三点五 flash 的 模型,是用的 open rota 的 平台。对,前几天那个给大家分享免费养龙虾视频火了,然后今天做一个具体的视频之上,很多朋友在后台私信我。 呃,那首先呢,其实是我们去呃搜索这个今日星辰的三点五模型,找到这个 free 有 免费版。呃,进去之后可以看到它这里有个模型 id, 这就是它的模型 id, 我 们要复制下来。呃,其实要给弄一下。呃,可以看到就是它现在在 opcode 的, 就是调用排名非常高。呃,看到就是。呃, 昨天是第一名。对,昨天是第一名,今天是第二名,前几天也拿过。可以看到这排名非常高,前几天也拿过很多第一。然后我们回来之后呢,其实是在自己的这个。呃。 api k 这里。呃,进入到 api k, 嗯,去新建一个 api k, 你 可以填银行卡,然后再去填这一个信用额度,可以填一个零点一美金。 看到我,哎,我这里填了一个零点一美金项链,一旦有付费的行为,那就最后花七毛钱,这个 api 就 断掉了。嗯,对,然后再过一期时间去设置一下。然后呢,这个 api 呢,是一次性只能复制的,相当于这个也要给到龙虾,然后把 openroot 的 这个地址,就是直接把网站扔给他,然后再把魔仙 ak 扔给他,再把你 app apk 扔给他。对, 假如你当前有那个本地 l m 驱动的话,就是把这个配置上,它自己会去连接上新的模型。那然后你再去那个龙虾里面去调用这个对话的话,就可以看到自己的一些调用数据了,对,有某一天的用量特别大,都是免费。

龙虾本地用的是千万三点五的二十七 b 的 模型,巴巴比特的电话版本 对比了一下,二长音肯定是没问题的。如果说要要做一些复杂任务的话,我买了一个百炼的一个一个一个套餐,可以临时切过去,感觉完全够用了。 这是在乌乌班图的服务器上搭建的,在我本地。

open 可乐的烧投屏速度可能多数人养不起,我的 open 可乐安装完成之后呢,我给他了几个简单的小任务,比如说浏览网页,然后解托发送给我,简单的几轮对话就花掉了几美元,而且我用的还是性价比非常高的 mini max m 二点五模型。 我一位朋友,他用的是公司免费的 app 无限投屏吗?那每天的账单都在大几百美元,这个数字还是非常具体的。 那 open 壳为什么这么烧 token 呢?我想核心有两点原因,第一是屏不理解 open 壳,它本身无法理解屏幕上的像素,那么当你做一些具体的指令,比如说去发小红书,它只能去对小红书网页进行截图,然后发送给大模型和问询大模型这个发布的按钮在哪里? 大拇指识别之后呢,会返回对应的坐标,然后 open color 再执行对应的点击操作,所以这个过程是极其高频,而且极其消耗透杆的。那第二点原因,我们知道 open color 有 非常完整的上下文系统,它能够记住你说的每一句话,记住自己做过的每件事, 那么这是一个优势,也是一个劣势。那么在他进行新的对话的过程中,他会把尽可能把完整的上下文都塞给大模型,那这就导致了大模型的 input token 数量是非常恐怖的。我去 open core open router 的 后台看我每一轮对话的一个记录,发现基本上每一轮的 input token 都在几万甚至十几万的这么一个量级,这基本相当于一本书的大小了啊,所以这个消耗的透光的速度也是非常快的。

一个视频看懂 openclaw 的 所有缺点,这个视频我就来把所有 openclaw 的 缺点一次性聊透。 我求一些人真的别为流量吹捧这只龙虾了,它真的没有那么神,我先叠个假啊,跟风本身不是一件坏事,如果在最开始 g b d 出现在大众视野的时候,就直接拒绝这样的生成式大模型,那就是自己困住了自己的手脚,跟不上时代的发展了。我们先来简单的过一下,这个 openclaw 是 什么?就这只小龙虾是什么? 它的本质实际上就是一套让大模型替你就是操作这些电脑啊,各种工具这样一个代理系统。这个代理系统也就是我们俗称的 agent, 通俗点说它就是给咱们之前就是对话的那些大模型装上了手和脚,让它能够操控你的电脑,能够操控你的社交软件。 他不只是回答你一句话,而是能够自己在你本地的电脑上调用终端上,浏览器上,脚本上使用各种外部工具,然后在你给了权限之后,去读你电脑上的文件,改你电脑上的文件,执行命令,操作你的账号。 所以很多人在看到演示的时候就会觉得非常震撼,他看起来已经不是咱们过去理解的那种只会生成文字的 ai 了, 他是一个在替你干活的这样一个数字员工的一个形象,你只要给他一个目标,他就能自己拆解成步骤,然后自己决定先做什么后做什么,最后把结果交回来。如果说他有什么东西不会干的话,你还可以教他做什么东西,就是比如说你可以导入一个 skills, 这个 skills 是 什么呢?就是 一个写好的模板提示词, ai 通过这个模板提示词就学会了做某项东西,他学会了比如说西红柿炒蛋的流程, 类似于一个 ai 五零密集的插件,它最近会突然爆火的原因也是它非常符合普通人对 ai 的 想象。大家会觉得既然聊天模型已经能够写文案,写代码,查资料,那如果再给他操作电脑的能力,那是不是就等于直接拥有了一个全自动的助手,让他一直帮你干活? 而且在宣传中,它能够七成二十四小时的不断的给你办公,就像是拥有了一个全自动的 ai 纽码一样,然后让你的工作效率直接翻倍。现在我们的介绍介绍完了, 直接开始进入主题,它的缺点到底在哪里?首先第一点,它对新手的配置是非常非常不友好的 啊,很多人第一次看到这个东西的时候,会觉得它跟装一个普通的软件差不多,点几下下载,登录一下账号,然后就能直接开始使用,但是实际使用完全不是这样。 open core 这个开源 agent 的 框架是一整套的环境配置,它不是一个单独的软件,你不仅要把它装上,你还要把它能够调用的模型给它配置好。 然后你要给它配置好它能使用的工具,它连接的服务,它能够访问的账号,一个一个的给它接起来。你要装相关的依赖,你要看终端的报错,你还要知道什么是端口,它用了什么网关,具体怎么样配置模型的 api key。 当然对于经常写代码的技术人来说,这些事情很普通,但对于大部分普通用户来说,这些本身已经是门槛了。 很多人不是不会用 ai, 而是他们连第一步都搭建不起来。这也是我们能够看到,在闲鱼上有很多帮忙安装小龙虾这样的产品,简直是匪夷所思啊。而且它不是你装完之后就结束了你后续的 skills 配置,收发邮件的权限,多一个功能,就多一个要处理的内容, 网上那些视频,都是那些技术老已经配好了环境,把这只龙虾驯服好了,所以你只看到了最终演示的那一段, 你觉得这只龙虾它很顺很智能,它就是 ai 自动化这样一个数字员工。但是你没有看到前面为了把这个龙虾跑通,折腾了多少配置,踩了多少坑,改了多少报错。我只能说配过环境的都知道我在说什么。当然我也看到一些即插即用的 pro 产品,但是我仍然觉得它们还是半成品 啊。总而言之,这只龙虾在最开始给你的体验大概率不是效率上的提升,反而是给你持续的报错,然后让你持续的调试,持续的头疼,一直在折腾。现在宣传起来就好像全民进入自动化办公时代一样,但是实际上很多人连第一关都过不去,我真说句实话, 还不如让你豆姐给你多生成点深度研究报告呢。然后呢,就是第二点,这只龙虾非常非常烧钱, 不同于市面上大家现在使用那些 ai, 你 输入的那些文字就是 ai 能够接收到提示词,这个小龙虾的上下文会记录所有模型的可见内容,就是这些内容包括了你本身设置的 system prompt, 也就是系统级提示词这个框架本身有的。然后每一轮对话的历史 工具调用和工具结束反馈的结果,你自己让它拥有的 skills, 这会让 ai 在 处理你 要求的内容的时候,先仔细看一遍,自己的人设,自己的能力,自己的目标等等。你可能会觉得,哎,那不就是多看几段字吗?那能贵到哪里去呢?我来给大家打个比方吧,就是我们都想让这样的小龙虾来成为自己的员工,对吧? 让他为咱们做一些工作。但是呢,这个小龙虾每次我们让他干活之前,他就相当于他都需要先把员工手册重新完整的看一遍,把聊天记录重新翻一遍,把你给他的操作日记重新看一遍,然后再决定下一步要做什么。所以他就不是 你说一句话就花一句话的钱,他是你说一句话,他顺便还要把过去那一大坨材料全部看一遍,然后你相当于是为这个材料的观看要重新付费,这些毒材料的开销,那全都是钱啊。有些任务表面上看起来可能只是一句话,比如说帮我整理一下 一个文件夹,帮我发个邮件,帮我去网站查一下价格。但是呢,实际上在这样的 agent 框架的内部, 他可能已经调用了十几次,甚至说几十次模型,因为他在不断按照步骤和循环进行试错,他要使用自己的 skills, 他 要知道你的目的是什么,每一次试错都是开销。如果你本身只是普通用户,平常使用 ai 就 只是查资料,写点文案等等,那 你真的要想清楚,你到底需不需要这样的小龙虾,很多本来一句话就能解决的事情,本来点点鼠标就能解决的事情,到了这种 agent 的 系统里边,会被拆成很多轮来不断的执行,你能让他完全自主的做完某一件事,开销大到难以执行, 而且效果可能还不好。就是麦塔高管就把自己的工作邮箱接入了 opencloud, 也就是龙虾,然后邮件就被删光了,这可是麦塔的高管啊。 这就是我们要讲的第三个点了,就是这个龙虾,它的执行能力非常的一般,远远不如现在自媒体宣传的那样强大。现在所有的 ai 都是有上下文窗口限制的,简单来说就是你喂给它的东西是有一个长度限制的。呃,多余这个限制, ai 的 处理能力它就跟不上了,它就记不住这么多东西了。 你给他的任务一长,他就容易就是固头不固定,对吧?你发过去的任务,所有的指示可能都占到他看到的消息百分之五不到。前面你刚告诉他你的要求,他可能转手就把这个要求给忘了。比如说你明明让他去 a 网站看一遍 a 网站的某一个视频,让他总结一下, 结果他绕了一圈去 b 网站尝试看能不能从 b 这里看到 a 网站的视频。你要让他修改一个文件,他可能顺手把其他东西也修改了, 你让他严格按照你说的要求来,他做到一半又把你的要求给忘掉了,然后开始自己自由发挥。普通聊天机器人答错了,你最多可能觉得他就是说错一句话,对吧?这是他的幻觉,然后你再问一遍就行了。但是 open claw 这种东西不一样,他不仅负责说,他还负责动手。 一旦他理解错了,那么后果就不是一句话错了,而是动作错了。你的文件可能会改错,你的命令可能会执行错,你的信息可能会发错人。如果你给他权限过高,那么就会导致他可能做一系列错误的决策,这是为什么?很多演示视频看起来很聪明,但实际上一上手你就会发现 他实际上做了一些很蠢的事情,因为演示视频给你看的那都是短任务,都是成功的任务,减过的任务,他不会把 这些模型开始犯蠢,需要人工接管的这些东西都给你看啊。我只能说他现在就是一个会自己点鼠标的实习生。或者我过分点说这个 open claw 他 就是一个拿着自动步枪的猴子,能够造成很大的杀伤。 如果你把一个稍微长一点步骤稍微多一点,判断复杂一点任务交给他,他就开始乱。你本来只是想找个替你做事的工具,结果最后变成了你在给这个工具当监工。而且他每犯一次错他都不是白犯,他每一次犯错他都是在烧你的钱啊。然后就是第四点了, 他有很强很强的安全风险。如果说你要让他给你做事,那也就是说你得给他一些你的授权吧,这些权限可能是操作你的电脑,写文件, 甚至于支付权限,比如说你想让他给你点个外卖什么的。如果说这样的 ai 模型被带偏的话,或者被恶意利用的话,那后果不单单是输出错误的文本这么简单了,它是非常严重的。 我来给大家举一个例子,就是我最近看到的有一个人把自己的微信完全接入龙虾,然后没有做任何的权限设置和安全配置, 然后开心的开始在这里养龙虾,然后给群友炫耀,结果被群友的提示词攻击了,把自己钱包里的钱给发了出去啊,不过我没有能够联系到当事人,所以这个真假大家图一乐就行了。 不过提示词攻击本身是确确实实存在的,我看到过最搞笑的莫过于这个翻译书籍的提示词的攻击,真是看一次笑一次啊。 以上说的这些是模型本身出了幻觉,可能胡乱执行导致的风险。其实还有一点就是这些 skills 本身的风险。这个设计它本身其实蛮吸引人的, 因为它能够不断地追加新功能嘛,相当于 ai 在 不断地学习 ai 在 完成一个任务之后,它也能自己总结 skills。 但是呢,这意味着你不仅要信任 openclaw 主体这个框架, 你还要信任外面一堆陌生人写的扩展。你装一个 skills 相当于是给你的 ai 加了一个能力,但实际上相当于把外人写的一些代码,一些框架接入了你这个权限很高的系统里。你接入这个武林秘籍, 如果出问题的话,那执行起来,那就很有可能导致整个 ai 的 执行出现了问题啊。我觉得最搞笑的一点就是,我看到有人使用 openclaw 公开 skills 里的股票分析功能炒股还赔了钱,这是我觉得最搞笑的事了,本身 ai 就是 一个黑盒,再加上这些 skills 还是别人写的,你甚至都不知道这些 skills 具体是怎么指导 ai 来完成分析的。如果你把 ai 输出内容当个参考还好,你如果真的不加判断的拿这个东西来 支撑你的决策,那我只能说,祝你好运,祝你好运。好吧,到最后我来给大家总结一下吧, ai 是 能够提升你的工作效率的,这毋庸置疑, 但这并不是说每一个人都要像程序员一样在终端里摆弄自己的 agent。 如果说你作为一个非技术人,还没有把 ai 融入你的工作流,还不知道具体怎么样使用 ai 能够提升你的工作效率,那么你养这样的龙虾是毫无价值的,这本质是跟风,现在市面上的大模型对你的需求而言 是完全足够的,你并不会因为养了这个 open claw 就 能够实现全自动办公。你养完龙虾之后,你能获得的也就只是通过社交媒体借由 ai 来操纵你的远程主机。如果说你是技术人,其实你就更不应该考虑了,现在的自动化工具实在是太多了, 我给大家举个例子啊,就比如说 cloud code, kimi code code, 还有各种各样的 claw 替代方案,甚至说技术人都不一定会看我这个视频, 因为大家都知道这只虾的上限在哪里,也知道这个新事物在发展过程中是有很大很大的泡沫的,不过事物的发展它都是曲折的,所以现在给它下定论还为时上早。从 github 的 star 树看来,这的确是一个非常非常传奇的开源项目, 等到哪一天,各种互联网接口统一了, ai 的 疑难杂症也解决清楚了,比如说幻觉啊,上下文长度啊,或许这只龙虾真的是下一个操作系统的雏形也说不定,这里是照样不吐不快,点点关注我们,下期再见。

送外卖赚钱买托克,养 open 可乐第一天?嗯,养小龙虾啊。我是昨天晚上动了这个部署一下 open 可乐的心思,看网上都说部署好难,其实实际上操作下来,呃,我本来预算是我,我都说好难了,我预算是花两千块钱给他部署下来,实际操作也就花个几十块钱云端部署一下就搞定了。嗯, 我对这个可乐的 boss 了解其实很早,但是一直都没有想去啊。这个实际去部署一下,因为我觉得还有 可能是就送外卖送的懒了人啊,这都是借口啊。直到昨天晚上我听播客,我听到这个 open 可乐里面现在大家都在封装自己的工作流啊,做成这个 skills, 那 我觉得这个现在很有热度的话,那马上就会推出很多哎,我可以直接接入的这个 skills 的 插件, 所以我得抓紧研究一下了啊,因为我觉得这个让他真正的去帮我执行一些事情已经差不多可以落地了。一向之前的话,我自己去大工作流写这个啊,写一些 pro 的 什么的,我觉得很复杂啊,我也不想干 啊。并没有,就是做到就是我发号施令,他直接去执行啊,也就是正常大家听到的,我不用过程,我只要结果,对吧?我给你一个目标,你,你最终把结果给我,这个还是非常有想象空间的,所以我今天出来送外卖,我都早出来送了,因为, 呃,确实是像大家一直讲的这个烧脱根的,我聊了几句,确实挺烧根的,所以我今天早点出来,我多送点外卖,少吃点饭,就把钱留着给他烧脱根。我当前的规划是先拿出三个月好好研究一下,这期间啊,他要烧多少脱根,我就给他烧,对吧?大不了咱早点出来送外卖,少吃一口饭。 呃,同时这里面还有个核心的问题啊,这个 ai, 这个 agent, 它其实解决的是一个怎么做的问题,但是让他做什么,这是我们所需要思考的问题。所以我觉得早点出来送外卖也很有必要啊,因为送外卖的时候对我来讲是一种心流的状态,脑子里可以去思考很多东西,去想好让他做什么,对吧?我送外卖赚钱买头梗供他学习, 同时呢,嗯,这个 open 可乐他消耗托根去学习,然后再跟我磨合,为这个将来具体的配合执行去做准备,对吧?我送外卖负责指路, open 可乐 负责行路,昨天也就仅仅是把这个 open call 给部署好了。嗯,具体的研究今天回去执行一下。路上也听了不少播客,有一些新的啊,有一些新的思考了,回去立马执行落实一下。大家可以点点关注,看看我这个,看看送外卖的怎么去用这个养好自己的一只小龙虾。

最近这个 open cloud 不是 很火吗?大家都说这个东西很烧 talk 啊,我昨天找到了一个对于我们普通用户来说几乎接近免费而且又好用的一个模型 talk, 这就是一个千万呐。 嗯,千万的贪。新人注册每个模型他下面有一共两百两百多个模型,每个模型都送一百万托克,对我们测试而用的话应该是很够用的,如果不够用找亲友借一下也是非常不错的。看一下他这个速度怎么样,你是什么模型? 这个回复也是很快,大家如果有需要的话,可以后台私信我给大家说一下这个加入模型,加入这个代码之后就自己连接。

中医也是在本地部署了一个 openclock 本地十四零六零肽显卡十六 gb 的 显存,然后,呃,也装了一些 scuse, 也问了一个同样的天气啊,调了一些它这个执行的一过程可以看一下 阿老最后也成功给到了同样的天气,问一下这个搜索的功能也是可以搜索出啊相关的一个情况 啊。最后我本地部署的这个大模型是同一千问的就是三点五九币的一个模型啊,现在再玩一玩。

告诉大家一些新的技巧,去怎么养虾,因为这个脱口消很快是因为他这个 opencloud 技术原理带来的,在他的身体里安装了非常多的技能,他每次去上下文对话的话,他就会先去把他的技能还有所有的文件先扫一遍, 然后丢给大模型,之后他再去告诉用户,你在呃我该干什么,你该怎么下一步怎么做,所以每一次要丢下所有的上下文进去,其实对消耗他有可能消耗是非常大的, 建议用户去做一些啊这种记忆压缩的这样一些啊开源的方案。那第二个用法呢?就是我们平常在养虾跟他对话的时候,就可以用一个呃 斜杠,然后呃 compact, 让他把上下文进行压缩,这个文本长度变小,那除了这两者之外就是用法上的。那今天其实腾讯云呃有一个 coding plan 的这样的一个新的包花七块九就可以包一个月 啊,当然他有会有一些频率的限制,但是呃也是会比过去这个方式在在这种经济的支出上是会少很多。