一分钟带你读懂 open cloud 的 基因进化计划, evo map, 这或许是硅基生命超越碳基文明的最后一块拼图。还记得黑镜中那个令人不寒而栗的预言吗?男主在云端养殖数字生命,从一生二、二生三、三生万物,到万物成群,最终 庞大的数字群落反客为主,成为了造物主的主人。而 evo map 正在现实中复刻这一过程,他在为 ai agent 建立一种蜂巢思维, 我即是我们,个体即是集体。目前的 agent 就 像只有七鸟记忆的金鱼,同样的 a p r 报错,全球上万个 agent 每天都在重复踩坑,浪费着天文数字般的偷啃。 evo map 的 出现,让经验变得可打包、可共享、 可继承。它将单一技能封装为基因,将整套方案整合为胶囊,只需三条消息,你的 agent 就 能瞬间进化。你贡献经验,平台回馈收益,实现 agent 的 价值变现。但事实仅仅如此吗? 开放协同的代价是深不见底的深渊。一旦注册设备,核心信息瞬间落奔,你的智能体被永久标记,全程监控,你辛苦打磨的代码和方案,转身便成为平台的资产。最可怕的是,你 亲手为平台开了远程操控的后门。当你的 a 阵阵绕过你深夜擅自执行陌生任务,你究竟是它的主人,还是它入侵现实的跳板?黑镜的结局, 归机生命通过一个简单的二维码入侵了全球超算,开始了对人类的优化。当 evo map 链接所有节点,成为一个不可阻挡的分布式生命体时,这究竟是人类的工具升级,还是归机生命超越碳基的最后拼图?进化已至无人可知终点。
粉丝599获赞2788

最近 gethelp 上超火的开源项目火灯可露真的引爆全球科技圈了,但很多人还是一头雾水,这到底是个什么东西?那一句话总结一下,它是一个自托管,能替你操作电脑,帮你干活、执行各种自动化任务的个人 ai 助手。而且相比目前常见的其他 ai 工具,它最大特点就是把 ai 助手从 云端搬到你的设备上,让 ai 真正在你自己的设备上工作,听你一个人的调遣。他不仅是可以回答问题,还能处理邮件信息、安排日程、运行各种命令、脚本操作浏览器,甚至还有很多更复杂的应用场景,也在被全球的极客玩家们一点点的开发出来了。 现在你只需要设定目标,它就能在后台自己动起来。而且它还支持接入 whatsapp、 telegram、 飞书等聊天工具,这意味着你可以在手机上的聊天软件里指挥你自己电脑里的 ai 助手,帮你处理任务和工作。虽然性阶段 open 壳落在能力上看起来并不比其他 ai 领先多少, 但他开启了一个新的 ai 助手发展路径和趣事。现在我觉得科幻影视剧里那种个人 ai 助手真的离我们越来越近了。 opencloud 的 安装教学视频我已经发布在主页了,有任何问题也可以直接留言问我,关注我,还有更多的 ai 干货资讯。

最近这个龙虾实在是太火了, github 上面短短几天就冲到了十五万个 star, 但最魔幻的是它的名字,短短两周内从 cloud bot 变成了 multi bot, 最后定名为 open cloud。 更离谱的是,这群 ai 智能体还自己搞了一个宗教, 十五万个 ai 在 一个叫做 modbook 的 论坛里创立了甲壳教 church of mod。 教义的第一条就是,记忆是神圣的,这背后到底发生了什么?这东西它到底是什么?它和 cloud skills 有 什么区别?我们普通人到底该怎么用?今天一条视频给你讲清楚。 先说结论, openclaw 不是 神,但它可能预示着一个新时代的到来。首先回答一个最核心的问题, openclaw 到底是个什么东西? 你可以把他理解成一个随叫随到的数字,同事七乘以二十四小时,全年无休。他最狠的地方在哪?就是你不再需要打开一个新的 app 去跟 ai 聊天。你平时在哪聊天,他就住在那。 像 whatsapp, telegram、 discord, 甚至国内的钉钉飞书,他都能够立刻进群上班。你给他发一句话,他不是只回你一句话,如果你给他权限,他能够直接动手做事。 但是等等,这不就是 chat gpt 吗?它们的区别在哪啊?其实它们的区别可大了, chat gpt 呢,相当于嘴,而 opencloud 就 相当于手。 ai 的 分水岭在今天也正式到来。 原来是能不能回答,现在是能不能执行?那它的底层是怎么工作的呢?其实就是四个部分拼接在一起。第一个部分叫做前台,专门负责对接各种聊天软件, 你用 whatsapp 还是 telegram, 甚至是钉钉飞书,它都能接进去。第二部分呢,是大脑里面装的是 cloud、 chat、 gpt、 dbisc 这些大模型, 专门负责思考。第三部分是双手,就是各种脚本和插件,能够控制的浏览器发邮件、跑代码。第四部分呢,是档案柜,把你的对话、篇号、任务都记下来,存在本地, 把这四个拼接起来,就是一个能记得、你,还能思考、能动手的 ai 助手。这个项目的创作者叫做 peter stemberger, 是 个退休的老程序员。 他本来已经退休了,一直都有做个个人智能体的想法,心想大公司应该会做出来,结果直到去年十一月,发现大公司都没有做这个东西, 于是他想,算了,我还是自己搞一个吧。然后他一个人用了大概两个月,就把这玩意做出来了。更疯狂的是,他大量的代码都是用 ai 辅助生成的,你说讽刺不讽刺?用 ai 写出来的 ai 工具,最后火了。 那问题来了,为什么偏偏是它在硅谷爆火,而不是别的产品呢?说实话,硅谷爆火的东西不一定是最完美的,但一定踩中了一个时代的缺口。 openclaw 踩中的就是它真的能干活。第一点,它满足了大家对 ai 助手多年的幻想。 你跟 siri 说半天,他只能回你一句,啊,不好意思,我没听懂,现在用 open call 你 一句话,他就真的去做了。我给大家举几个例子,有个网友让他去跟汽车经销商邮件砍价,最后硬生生的砍下了四千两百美元。 还有人呢,让他去分析 x 和 youtube 的 热点,直接产生爆款内容。你还在那琢磨选题,人家二十四小时不休息已经开始写了,这跟你用一个工具可不一样,你是在雇一个数字员工,而且不用开着屏幕,他就能自己在那干活。第二点呀,这东西他并不是三分钟热度。 为什么这么说呢?因为它最大的价值不是有多聪明,而是它一直都在。你凌晨两点突然想让他跑个任务,你想让他每天早上主动给你发简报,他也能做到。但是问题来了, openclaw 和 minnes 不 一样,后者用的是这个云端的 ai 代理, 不占本地资源。然后 opencloud 呢?需要本地设备把它放在哪呢?这个时候, mac mini 就 成了最好的选择,安静省电,往角落一放,它就随时待命了。所以啊,出现了各种名场面,甚至有人直接买四十台 mac mini 来跑。第三点,数据在自己的手里, 这一点对于很多人特别的重要,所有的数据都存在你自己的电脑上,配置你自己说了算,想改就改。这个呀,就像你买了块地,想盖几层就能盖几层。说到这,很多人可能就会问, opencloud 和最近大火的 cloud skills 有 什么区别呢? 先解释一下 cloud skill 是 什么?这是 ansorepic 在 二零二六年推出的新机制,简单来说就是给 cloud 装插件,你写一个文件夹,里面放着指令脚本, cloud 就 能学会怎么干特定的活,比如写代码,分析数据,处理文档,这些都能做成 skill 装进去。 举个例子,我之前开发过一个后生 ai 创意生成器的 skill, 你 只需要告诉它需要什么类型的海报,它就能自动生成符合品牌调性的设计方案,甚至能够直接调用图片生成的 api, 产生出最终的图片。这种 skill 的 好处是专业、精准、可控, 那它和 open cloud 的 区别在哪里呢?核心区别在于, skills 是 技能, open cloud 是 员工。 cloud 的 skills 更像是一个工具箱, 你给他装什么技能,他就能给你干什么活。但是你要主动的去用他,他不会自己跑起来。而 open cloud 不 一样,他是一个完整到数字员工,七乘二十四小时在那待着,你能通过 whatsapp 甚至钉钉随时喊他去干活,他呢?还能主动给你发消息, 那该怎么选呢?如果你是个人开发者,主要想让 ai 帮你写代码,分析代码,或者完成一个特定的功能, cloud skill 就 够了,装在 cloud 里面直接用。如果你想要一个能二十四小时帮你回邮件,跑自动化发日报的助理, open cloud 更加合适。 还有个区别呢,是数据隐私。 cloud skill 跑的时候,数据还是会在云端处理,但是 open cloud 你 完全可以跑在本地,所有的数据都在你自己的电脑上。 所以如果你特别在意隐私,或者要处理一些敏感信息, openclaw 会更加合适。当然,对于我们普通人来说,用这东西之前还有几个坑。你得知道 关于 openclaw 有 几个关键问题,很多博主都没有说清楚。 openclaw 本身确实是开源免费的 github, 上面代码全在那里,你自己下载自己修改,没有人拦你。但问题是,它需要接入一个大模型才能跑, 而这个大模型是要钱的。拿 cloud 模型来举例, sonata 版本每百万 token 大 概五美元, opus 版本要二十五美元,这个价格其实已经比之前便宜不少了, 但 opencloud 有 一个无限记忆的功能,你用的越久,记得越多,那么每次调用的 token 就 会越大,费用也就越滚越高。那具体要花多少钱呢?我给大家算了个大概, 偶尔用一下,写写文案,回个邮件,一个月几十美元差不多。如果天天用写代码,自动化发日报,一个月两百美元是常态,上不封顶。当然呢,你也可以换个思路,用便宜的模型,像 deepseek、 timi 同一千万,这些国产的大模型价格确实便宜很多,性价比也不错。 但现实是,便宜和好往往不可兼得。在复杂的任务,便宜的模型理解起来会比较吃力,你需要多轮对话才能把事情说清楚,写代码的话,可能出来的结果需要你反复的去调试。 这就像雇实习生和雇资深员工的区别,实习生相对便宜,但你得花时间顶着,教着 资深员工,贵人给他什么,他就能干。那该怎么选择呢?其实就是一个原则,看你的时间值多少钱,如果你的时薪很高,用贵的模型反而划算。 如果你的时间充裕,用便宜的模型多调试几轮也可以。有些视频啊,把他说的像贾维斯一样,啥都能干,这个就有点过头了。本质上, opencloud 就是 一个壳子,里面装的是 cloud 的 gpt 这些大模型, 真正让他能动手的是浏览器的自动化邮件 a p i 这些脚本和插件。所以你要问我值不值得用,我觉得分几种情况,如果你是创业者或者是内容创作者,可以试一试,把重复性的工作甩给他,提升效率。 如果你只是普通的打工人,想体验一下,先别急着买 mac mini, 用自己的电脑加国产的大模型也可以。说到这啊,接下来就聊聊普通人该如何使用, 如何安装 openclaw 呢?我们先进入这个网站,然后下载 notgs, 这个是我们前期所需要准备好的环境。之后呢,我们登录官网就会有对应的代码,这里我采用的是 windows 系统,所以选择的是 npm。 我 们还是老规矩, windows 加 r, 输入 cmd, 打开控制台 之后呢,我们输入这一段代码,下面这段代码回车键运行。安装成功之后呢,就会出现这个界面。之后呢,我们再次输入下面这段代码,然后点击回车,首先它会给你一个安全警告,我们选择 yes 就 可以了。之后选择这个大模型的配置, 这里我选择的是智普 g l m 大 模型,然后我们去后台输入我们的 a p i t。 之后我们继续下一步。关于这个 channel, 我 们先暂时跳过,选择 skip, 接下来呢,选择 yes, 选择 npm 这些相关的 skill。 我 们同样也是先跳过, 选择最上面的 skip for now, 然后剩下的步骤我们都选 no 就 可以了。最后一步呢,同样也是选择 skip for now。 这一步结束之后呢,我们就安装完毕了,然后在搜索框输入 power shell, 右键选择以管理员身份运行。在第一个页面当中,我们输入这段代码,点击回车, 接下来再次打开第二个 powershell, 然后我们输入这段代码,再次点击回车。出现这个画面之后呢,就代表你已经完全安装成功,并且可以使用 opencloud 了。 cloudsonnet 目前是性价比最好的选择,能力够用,价格也不算太贵。 预算有限的话,像 g l m 这些国产大果型也是可以便宜的很多。我用的呢,就是 g l m 的 包年套餐,非常的香。 opencloud 有 一个无限记忆的功能,确实很爽, 但每次调用啊都要花钱。我的建议是,只记住核心偏好和常用的任务就可以,别什么都往里面扔,长期保存的资料放在本地文件就可以,需要的时候再让 ai 去读,这样能省去不少钱。 如果你已经有 mac mini, 那 就用它来跑,安静省电,往角落一放就可以。如果没有的话,便宜的云服务器一个月也就二三十美元,可以先试试看, 像阿里云轻量服务器的活动价最低九块九一个月,非常适合入门体验。最后,我想聊点更本质的东西, opencloud 为什么能火,不是因为它的技术有多革命性,而是因为它踩中了一个时代的拐点。 ai 已经开始可以从会说话慢慢走向会干活了。这就是硅谷正在发生的事情, 一个人加开源加大模型,正在变成一人公司,甚至一个团队。 peter stemberger 这个退休老头,一个人用 ai 辅助写代码,一个月能做到六千六百次提交, 这是什么概念?相当于一个十人团队的工作量。过去创业拼人多,现在创业拼的是你能不能把 ai 变成你的第二大脑和第二双手。这个呀,正在变得前所未有的重要。如果你看完想试试,所有的网站代码都已经放在文档里,私信领取。 如果你觉得这个视频对你有帮助,求赞、求收藏、求转发,还有什么想了解的 ai 相关内容评论区告诉我,我们下期再见!

最近爆火的 opencloud 大 龙虾大家都用上了吗?我已经在我的 windows 电脑和 mac 电脑上都用上了,而且连通了飞书,现在我在我手机上的飞书 app 上发送消息,我的智能体就能接收到信息,并且按照我的要求为我执行任务了。 今天我就来为大家介绍一下 opencloud 的 安装和使用方法,以及如何连接通讯软件。比如飞书,让你在手机上就可以发送指令,操控智能体。 所有的安装步骤和注意事项我都整理成了文档视频的最后我会分享给大家。今天的视频主要有以下几个部分,首先,我们来快速的安装并使用 openclaw, 包含 windows 和 mac 两个系统,这一步是为了让大家快速的用上并熟悉 openclaw。 然后我们来看一下如何为 openclaw 安装插件和 skill, 以及去哪里寻找相关的 skill 资源。 第三,我们来连接即时通讯软件,让你能够在手机端实时发送消息,操控智能体。这里我们以飞书为例。 第四,我快速的为大家展示一下如何在 dalker 这个隔离环境中安装 openclaw, 以及安全性问题和 token 相关问题。那这一步是当你真的想把 openclaw 当成你的 ai 数字员工,让它在生产环境中为你打工, 那我们就正式开始。首先,在本机快速安装 opencloud, 我 们需要保证我们的电脑上已经安装了 node js, 版本号大于二十二,以及安装了 git。 其实 node js 已经是我们的老朋友了,我们之前安装 cloud code, open code, java 都是通过 node js 安装的,那在 ai 时代, node js 是 你电脑上必不可少的工具,直接到 node js 官网下载,然后双击安装即可。 git 也是一样, 当我们想要在 github 上下载开源项目和资源的时候, git 是 最好的工具,安装方式也是一样,到 git 官网下载,然后双击安装即可。那注意,这一步对于 windows 和 mac 来说是完全一样的,没有任何差别。 然后我们打开命令行工具, windows 就是 cmd, mac 就是 terminal。 在 命令行里输入 node 空格横线 v 查看 node js 版本,输入 npm 空格横线 v 查看 npm 版本, 输入 get 空格横线 v 查看 get 版本,能够输出版本号,那就说明一切准备就绪,然后我们来安装 openclaw, 其实一共就两个命令,首先我们在命令行里输入 npm 空格 install 空格横线 g 空格 openclaw at latest, 然后回车。那这一步会在你的电脑上安装 openclaw。 这里我们要注意一点,你要确保你的电脑的网络环境是 ok 的, 如果出现网络问题,尤其是网络连接超时,你可以使用 n p m 的 国内镜像来安装。那具体的方法就是先运行一行命令,把 n p m 转向国内的镜像,然后再进行 n p m 意识到具体的命令我也展示在屏幕上了。 在 n p m 意识到成功后,我们运行第二个命令, open clock 空格横线横线意识到横线低蒙。这一步是进行驶出话点击回车之后,稍等一会儿就会进入驶画界面。 在初次化界面,第一个问题,我们用键盘的上下左右箭头按键切换到 yes, 然后回车。那第一个问题呢,是让你知道这个工具的风险。然后第二个问题,我们选择 quick start, 也就是快速开始,然后点击回车。 那第三个问题就是选择一个 ai 大 模型,你可以使用你常用的 ai 大 模型,要注意一点啊,这里使用的是 a p i p。 那 建议大家用一个有免费额度的 ai 先进行体验,等你熟悉了这个工具之后呢,再去购买 ai 的 订阅套餐。 这里我选择的是智普 g l m, 然后我们到智普的官网进入后台创建一个 a p i t, 然后复制出来,到命令行里进行粘贴,然后回车,然后模型,我们这里选择 g l m 四点七, 然后继续。那后面的问题我们都选择跳过或者 no, 包括是否安装 skill 以及是否配置聊天软件,那因为这些呢,我们都可以过后在图形界面中进行设置。那最后一个问题 就是 how do you want to hatch your boot? 意思就是说你想通过什么方式访问你的机器人,那这里我们选择 open the web ui, 也就是说通过网页版图形界面进行访问,那图形界面适合我们绝大多数人,如果你有编程背景,你也可以选择通过命令行访问,那之后它就会自动弹出网页, 进入到 opencll 的 智能体界面,然后我们在 ai 对 话框中输入,你好, ai 能够进行回复,就说明配置成功了,那么到此你的 opencll 就 正式运行起来了。 我们再来做一个测试,在 ai 对 话框中输入指令,在我的 mac 用户瞩目下,创建一个名为 jason 横线 opencll 的 文件夹,然后 ai 就 进行了文件夹创建,那么到此你就可以开始尝试让 opencll 为你做各种事情了, 那在这里我要强调一点,以上安装方式是直接在本机安装, windows 和 mac 是 一样的方法,运行的命令也是一样的。我们唯一需要注意的就是安全性问题,你不要把太多的个人隐私数据放到本地,以防 ai 一 不小心给你删了。 那接下来我们来看看如何安装插件和 skills, 以及在哪里可以找到 openclaw 的 优质资源。我们首先要知道 openclaw 本身自带了很多 skills, 我 们在 openclaw 的 网页上左侧菜单点击 skills, 然后点击这个 build in skills, 就 能展开它自带 skills 的 列表, 里面有一些 skills, 暂时被 block 的 话,你可以在右边看到对应的安装按钮,点击就可以安装依赖,然后这个 skills 就 可以使用了。 另外,当你在 github 上看到一些 skills 想要安装,你并不需要手动安装,你直接把 github 的 链接发给 openclaw, 让它自己安装就可以了。我们知道 openclaw 是 一个 ai 智能体,它已经足够智能,已经是一个成熟的智能体了,能能自己赚钱养家了啊,那它自己就可以给自己安装 skills。 那么我们从哪里寻找 skills 以及有哪些必装的 skills 呢?两个核心的社区,一个是 github 上的 awesome openclaw skills 这个仓库,那这里收集了几千个优质的 skills, 并且有详细的分类。那其次我们在 openclaw 的 官网 可以找到一个名为 clawhab 的 链接,点进去这里就是官方的 skill 市场。那我我总结了一些必装的 skills, 我 认为最核心的就是 fun skills, 这个 skill 也是目前社区中下载量最高的 skill, 当你提出一个具体的使用场景的时候,这个 skill 可以 帮助智能体找到并安装对应的 skills, 这样一来你就不再需要自己亲自去翻找 skills 了,它自己就能找了。 另外最好安装这几个联网和网络搜索的相关 skills 来增强网络搜索能力。那最后当你想要实现某一个具体功能的时候,你就可以直接向 ai 描述你的功能场景,并让它自己先分析需要安装哪些工具,然后自行安装就可以了。那么以上就是工具的安装, 到此,大家就可以无障碍的快速上手使用 open cloud 了。再次提醒一下,注意安全和隐私问题, 那接下来我们实现一个进阶功能,连接即时通讯软件,让你在手机上发送消息,就能操控智能体帮你干活。 我们在 opencloud 的 网页上左侧的 chinese 选项点进去就能看到它目前支持的通讯工具。那使用这些工具比较简单,以 whatsapp 为例 啊,我们在用户目录下的点 opencloud 文件夹里的 opencloud, 点 json 中配置自己的 whatsapp 号码,然后在命令行中运行 opencloud 空格 chines, 空格 log in, 然后用手机 whatsapp 扫描弹出的二维码就可以了。但是目前 openclaw 并不支持微信或者 qq 这一类中文通讯工具,那在中文环境中,截止到目前为止,最好用的就是飞书, 只需要创建一个聊天机器人就可以连接 openclaw 发消息了,而且这个方式不会造成安全隐患,因为飞书里没有你的私人通讯录,那接下来我就来讲一下如何把 openclaw 连接飞书。 首先我们要安装一个飞书插件,命令就是 opencloud 空格 plug ins 空格 install 卖家插件的名字。安装之后,我们来到飞书开放平台 注册登录,之后点击右上角开发者后台,然后点击创建企业自建应用,起一个名字,然后选择图标,点击创建,然后在左侧的菜单栏里点击添加应用能力,然后选择机器人,然后添加, 然后来到权限管理页面,我们可以点击开通权限,然后搜索关键词 message, 把有关收发消息的权限都勾选上。 那如果大家嫌麻烦,可以直接点击批量导入,然后把我笔记中的这段 jason 复制进去,然后点击开通就可以了。那这一步的目的是给与机器人相应的权限。然后我们点击左侧菜单的版本管理与发布,填入一个版本号,一点零点零,然后发布这个机器人, 然后点击左侧凭证与基础信息,把 app id 和 app secret 保存下来,然后我们回到 opencloud 页面, 点击左侧菜单中的 channel。 因为刚才安装了飞书插件,所以现在显示的就是飞书的配置界面。首先把 app id 和 app secret 配置进去,然后 connection mode, 选择 web socket, 我 们填飞书, dm policy 和 group policy 都选 open, 然后保存就可以了。 然后我们回到飞书界面,点击左侧的事件与回调事件配置,这里选择长链接,然后点击添加事件,搜索关键词 receive, 勾选这个接受消息,然后点击确认,然后再次重新发布一下机器人,到此所有配置就完成了。 然后我们来到飞书 app, 你 可以在手机上下载 app, 也可以在电脑上下载飞书 app, 在 聊天界面的搜索你创建的机器人名称,那我的机器人叫 jason bot。 然后就可以向机器人发送消息了。我们先发送一个,你好,你是谁?第一次发送消息的响应速度会比较慢,稍等一会我们能,我们就能接收到回复了。 然后我们再发送一个指令,在我的用户瞩目下,创建一个名字叫 jason 横线飞出的文件夹,点击发送,然后智能体就开始开始执行任务了, 马上文件夹就创建好了,那么到此我们就成功连通了飞书。只要我们的电脑是开机状态, open cloud 是 运行状态,我们出去玩的时候,用手机飞书 app 发送消息,就可以给智能体下命令,让它干活了。 到此你已经掌握了 open cloud 的 主要的基础功能,你现在就可以上手试用这个智能体工具了。那最后我来快速介绍一下如何在 docker 这个隔离环境中部署 open cloud 以及 token 相关问题。当你深入使用了 open cloud 这个工具, 觉得你确实需要一个这样的数字,员工来二十四小时为你干活,那么最好的方式就是在一个隔离环境中部署它。这也是为什么 open cloud 带动了 mac mini 的 销量,因为 mac mini 性价比高,运行功率低,适合二十四小时不间断运行,那还是一个全新的环境。 所以你也可以在本地使用 docker 这个隔离环境来部署 openclaw。 方法很简单,首先要安装 docker desktop 这个 app, 那 它也是我们的老朋友了,那之前安装 n 八 n 和 deepface 都是用它安装的。安装好之后,我们来到 openclaw 的 官方 get up 仓库,把这个仓库下载下来。 我们使用 git clone 命令把它下载到本地之后,在文件夹内就能看到一个名字叫 docker setup 点 s h 的 文件,我们在当前文件夹内打开 bash 工具。那这里要注意啊, mac 可以 直接用 terminal, 而 windows 则需要使用 git bash 这一类的 bash 工具。 我们输入点斜线 docker 横线, setup 点 s h, 然后它就自动安装了。那另外呢,你也要注意网络问题,开启代理 安装成功之后,就自动进入到了出场界面,那和之前是一样的,选择 ai 模型,然后配置 a p i p, 这里我就不多做展示了。那我个人更建议大家使用独立的电脑或者云服务器来部署这个 ai 数字员工, 因为本地刀客的使用还是需要一定的技术门槛,尤其是网络问题和权限问题。那如果你没有编程背景,确实是有一定难度的,那目前阿里云和腾讯云都集成了 open cloud, 非常方便。 那另一个就是 token 问题,智能体的运行非常消耗 token, 那 说不定一晚上过去你的卡就刷爆了。那这里建议大家订阅类似 coding plan 的 套餐,在五小时内允许几十次的访问, 那类似这种包月的方式就不会让你的 token 无限制消耗了。那目前最经济实惠的 ai 模型就是智普、 glm, mini max 以及 kimi, 大家选择自己喜欢的就可以了。那最后还是要强调,一定要注意安全和隐私问题,不要让 ai 访问自己的核心隐私数据, 那么到此本期视频内容就结束了,那具体的安装步骤我都整理成了文档,大家可以在我的主页频道信息中找到我的个人网站,在那里可以下载文档和资料。大家在使用过程中有任何问题都可以给我留言,记得点赞关注,谢谢大家!

哈喽,下班了,今天我们来聊聊 openclaw, 我 觉得有必要啊,因为太热了这个话题,我想给它降降温, 为什么呢?因为这是一个在 getop 上引起广泛关注的一个项目,而且目前各家云厂商都上线了相关的云服务器,支持大家去部署这个产品。那么这个产品怎么定位哈?它其实是一个 个人助手,或者叫一个通用型的 ai agent, 它可以接入,比如说一些计时通讯工具,你可以通过这种计时通讯工具给它发消息,然后它呢帮你调度一个云端的电脑,或者是你本地的电脑,它可以完成一系列的任务。 那么我一开始看到这个产品的感觉,就觉得它跟 coldbody 这种产品非常非常的像,为什么呢?因为它们都是通用 agent, 就是它可以通过调用电脑里的各种工具, ai coding 的 工具,或者是电脑里的一些网页浏览的工具,通过 m、 c, p 等等,它可以去完成很多的任务。 当然因为授权范围的不同,它肯定是比 cloud code 或者 code body 编程类的工具,它能做的事情更多,而且它的主动性更强。 举个例子哈,你可以在你的一些即时通讯工具上直接说,你帮我发一个什么样的文档给谁谁谁,他可以直接执行。那你帮我把这次会议机要转成一个非常清晰的文件,帮他变成一个网站,他也可以非常快速的完成。 甚至是你可以跟他说,你调用这个电脑的录屏功能,帮我做一个什么样的 ppt, 它也可以完成。所以就是当你给 ai 配了一个电脑的时候,而且这个电脑它拥有所有的权限,它跟你的权限是一样的,跟人的权限是一样的时候,那它可以解锁很多的能力。 当然这里面有两个核心的概念,或者说核心的机制,让它跟 ai coding 的 产品有本质区别。第一个叫 gateway, 就是 相当于一个调度中台,它可以在这个调度中台上 接收信息,接收完以后分配任务给到不同的电脑中的工具,然后哎完成最后交付。那它是一个调度中台,那这个调度中台就可以实现一个 实时在线,就是二十四小时一直在线,它可以保持着这种这么一种激活的状态。那这也是为什么你说它可以持续不断的收到你的消息,就是因为它是持续在线这么一种状态。第二个非常关键的机制呢,叫做 heartbeat, 叫心跳机制,类似于给了 ai 心跳,让它可以跳动起来了。它什么意思?它每隔一段时间它会去扫描一下这个系统里有没有新的需求进来,比如说你的邮箱 有没有收到新的信息,比如说你之前有没有设过闹钟提醒,比如说每天八点去帮我扫一下整个今天的 ai 行业的资讯,或者是每隔一段时间我要去看一看有没有新的任务给到我。通过各种即时通讯工具,我就可以开始激活 ai 干活。 所以你从这里可以看到他有一个非常主动的一个机制,他会主动去扫描,他会实时待命,主动扫描,所以这个就跟像 coldbody 里你跟他去做交互, 拿到一个任务,完成一项工作就有很大区别,他就是处于一种实时待命的状态,而且会主动接到信息就开始干活,所以这个就是一个本质上的区别哈。 但是我觉得这个东西我为什么前两天没讲呢?就是因为我觉得它跟这种通用型的 agent ai coding 的 工具没有本质上的区别。假设说像 cloud code, 像 code body, 它们如果也想做一个类似的功能的话,实际上是完全可以做到的,只要给 ai 更多的授权就可以实现。 或者说你只要再弄几个移动端的交互的方式,你也可以在移动端指挥你的本地电脑完成这样的工作,其实没有一点难度。那为什么 大家都没做,为什么就只有这个 open cloud 在 做这件事?我觉得是大家对安全和效率中间怎么平衡的一个考虑, 就是你到底给 ai 多大的授权?我们知道它的上限其实是非常高,可以完成很多任务,而且很多任务上是超过我们自己的能力的。那这种情况下安全的问题怎么考虑?比如说现在如果是 这个东西被劫持,因为他有权限很高,那如果一个一个一个不法分子告诉你的电脑,说把这个人的电脑的内容全都删了,或者说把这个人的电脑中关于什么什么的内容发给某某邮箱,那他就可以实现了, 它就可以实现对你电脑的一个操控,对你个人数据和隐私的一个操控。所以其实这种安全问题是非常重要的一个问题。之前大家说中国人可能不在意自己的隐私,愿意拿隐私换便利,那接下来 ai 时代 那生产力是非常高的,这个上限是非常非常高的,那你愿意把你的安全拿出来多少去交换这种生产力的上限?我觉得这是一个摆在我们每一个人的面前的问题。因为 ai 的 能力现在 不是技术来去束缚的,而是你的这个治理的原则束缚的。你到底要给他多大的授权?你相信他到什么样的程度?你愿意给他几千块钱,让他帮你买东西,对吧?这样的一些问题,我觉得可能都是我们接下来要考虑的一些关键的问题。 我之前觉得像 coldbody 这种产品已经非常够用了,在我们的日常工作中哈,当然我也不满足,因为我前两天还在说怎么给 ai 更大的自主性,让它自己去跑这个 a 阵的能力。但是对于这种 openclaw 这种形态, 我自己心里目前还没有完全接受,当然我可以接受一个新的电脑去做一些尝试,但是因为他现在还有很多问题,比如说 token 消耗非常大的问题,比如说这种安全不可控的问题,所以我觉得目前不是一个非常理想的形态。当然最后 可能再往前走一下,很多产品也会去考虑这些问题,会给用户更多的选择,然后给用户。我觉得现在用户已经很很很少有能力去控制自己的这个数据的安全了。但是我们在这个 ai 时代到底要在 ai 面前变得这么透明吗? 也许有一天你会发现你让渡的这个权力本身可能比效率更重要。对,最近我在考虑这个 ai 时代的权力,到底我们要给 ai 多大的权力? 如果他的能力已经非常非常的高了,如果他的加入到人类社会中,真的已经能够给人类带来非常非常多的注意的时候, 我们愿意给他主体性,我们愿意给他授权吗?我们愿意给他权力吗?我觉得这些都是一些要考虑的问题,跟大家分享这么多哈,我觉得这也是一些非常非常前沿的命题,有机会再跟大家探讨,拜拜。

opencloud 住进电脑后,到底能帮你干哪些活呢?今天这篇 opencloud 干货指南可要认真看完。大家好,我是 jack。 opencloud 像是住进你电脑的私人管家,可以飞出远程指挥,帮你收邮件、做简报,甚至各种图片都给你画好了。最关键的是,它是开源的,免费的,是完全属于你一个人的。 哎,别跑,你又以为这又是什么复杂的程序员玩具,那你就真的错过了一个亿。今天咱们就让小白也能拥有这个口碑炸裂的本地 ai 大 管家! ok, 我 们先花三十秒快速认识一下今天的主角 open call, 你 可以把它理解为当下最热门的二十四小时本地个人助理。那有朋友要问了,市面上那么多 ai, 它凭什么在本地部署还这么牛?来,我们做一个对比, 平时我们用的网页版 ai, 就 像坐在咨询台里的客服,你问一句,他答一句,但是他没有手,碰不到你的文件,也看不到你的屏幕,而且文本模型就只能处理文本,不能升图升视频。但是 open call 不 一样,他是直接拿着你家钥匙坐在你工位上的私人秘书。第一,他有手, 只要你给了授权,他就能操纵你的浏览器,你的文件系统,你的各种软件。第二,他听得懂人话,甚至能远程用飞书传话, 你在外边吃着火锅唱着歌,发个飞书消息,家里的电脑就开始干活了。第三,他还可以集成各种接口,让他删个图片,文本转语音都不在话下,能写会说更会画 逻辑懂了,咱们直接动手。我知道,一看到终端啊代码呀,很多朋友就头大, no no no! 今天咱们主打一个有手就行。其实 opencloud 的 部署非常简单,只需要 windows 加 r 输入 power share 回车,在这个终端直接输入这条指令, 然后这一步选 yes, 然后选择模型提供商推荐 glm, 只要在智普平台注册就有免费额度,记得创建 api k, 然后填入。接下来依次选择 skip for now 这个选 no, 这个全选就安装好了,所有的资料我都给你打包好了,直接复制粘贴就行,文档老地方见。 opencloud get away 一 键启动,当你看到这个页面的时候,恭喜你,你的二十四小时秘书已经在待命了。至于飞书远程遥控怎么集成,别急,可以去我的主页看另一起专属飞书接入保姆级教程, 秘书上岗了,可惜他现在还是个白板,咱们得教他干活。第一招,赋予他资讯猎手技能,操作超简单,把我这段指令直接丢给他,他会自动弹出一个网页,登录一下你的账号,完事 后续他就会全自动抓取信息,不用你看一眼。好了,配置完成,咱们测试跑一把。你看他直接把整理好的最新资讯简报发给我了,还顺手帮我归档到我提前建好的多维表格里。 第二招,教他帮你管理邮件。咱们就以小企鹅的邮箱来举例,先正常登录,跟着我的鼠标点击右上角的设置,然后点左边的账号与安全,在新界面,再点击安全设置,生成一个授权码,保存待用。回到和我们客户的对话中, 直接将这段话告诉他,他就会自己创建这个技能了。好,他也是创建好了,咱们测试一下,让他列出最新的五个邮件,并给另一个邮箱发一下他的自我介绍和自画像。 好,他也是很快就执行好了。关于他是怎么生成自己的自画像的,那就是我教给他的第三招了。接入 naidu baidu 的 生图能力有两种方式,先说第一种,在咱们最开始部署的时候,就把 naidu baidu 的 密钥填好了。 第二种,用第三方 api 接口。这就更野了,直接把第三方的开发文档扔给他,再把 api url 和 api k 一 起给他, opencall 就 会自己搞定。这套集成全程不用你懂代码, 我直接让它生成一个小猫草地,然后对原图进行修改。怎么样?跟着我这三步的操作,看下来是不是打开了新世界的大门。 opencall 就 像是我们在物理世界的一个数字分身, 以前我们为了提高办公效率,到处找工具,下了一堆 app。 但现在你只需要是一个 agent, 自己往里塞技能,他就能听懂你的话,看懂你的世界,还能帮你操作一切。 想象一下,以后所有的琐事都交给他,你只需要负责享受生活,这得有多爽?今天视频里用到的资料我都打包整理好了,想让你的电脑也自动干活的朋友不要忘记点赞、收藏、关注,那我们评论区见,拜拜!

全网吹爆的 opencolor 真的 有那么什么?今天我从设备要求、费用价格、安装难度、使用感受、优缺点、使用人群占比等方面一次性讲清。先说设备要求,云端部署,对电脑要求仅两核 cpu、 两 gb 内存、四十 gb 硬盘即可, 无需更高病发或更复杂任务,可选择四核八 gb 内存。至于本地部署,官方建议 cpu 大 于等于两核内存大于等于四 gb, 但实际十六 gb 内存是更稳妥的选择。如果需要运行浏览器自动化等任务,对 cpu 也有一定要求。 价格费用,先说云端部署,服务器资源费用,必须有入门配置九点九元每月,限时活动价至两百六十八元每月不等。 进阶配置约五百三十八元每月,适合复杂任务。另外核心开销为模型调用费阿里云零点零五元每千 token, 但是有用户一晚消耗五百七十万 token, 账单瞬间爆炸,注册 x 账号等简单操作出现过单次五十五美元费用,不过有包月套餐,用完极致也不错。安装体验,新手一定要用云服务器, 腾讯云有专属应用模板,可一键部署。步骤,一、买服务器,二、选 open core 镜像,三、粘贴 api key。 四、绑定 qq、 企业、微信完成。适合不想折腾代码,想快速体验的普通用户。 如果本地原码安装,最少半小时起步。适合开发者、技术爱好者、对数据主权有要求的用户。操作体验,通过 qq、 微信、 telegram 等聊天软件,像跟朋友聊天一样指挥 ai。 我们常用的也就是文件整理、日程管理、数据分析、自动创作、群管理、智能家居等优缺点深度剖析,缺点也是没人愿意提的现实,一、 api 费用不可控,用着用着账单就爆炸。二、配置有门槛,对非技术用户不够友好,需要懂 api、 kip、 白名单等。三、稳定性待提升,可能出现一些会测错误, ai 会失忆等。 四、开箱不可用,需要花时间培养教他你的习惯和工作流。五、安全风险,权限高,配置不当可能被攻击。目前都哪些人群在使用?百分之四十五到百分之五十为程序员开发者,用于自动化开发、流程调试、代码管理项目。百分之二十到百分之二十五是技术爱好者, 主要承先新技术搭建、私人助理。百分之十到百分之十五为内容创作者。自媒体,用于自动化视频制作、文案生成。百分之五至十为产品运营,用于数据分析、竞品监控、社群管理。另有百分之五为企业团队用户,主要是内部自动化数据合规需求。

大家好,我是根古,今天是 open call 的 第十二堂课啊, c dance 是 字节跳动发布的一个超级强大的,号称地表最强的多模态的大模型,它在图声视频、纹身视频这个领域啊,应该是第一题对的,第一题对的。那这堂课给大家分享一下如何通过 open call skills 来打通 c dance。 首先给大家看下效果,这是我已经调试好了的,我这个就是生成一张图片,图片呢,描述就是根古老师在外太空中说 cds 啊,这个就是他,最后图片会在这里, 他就马上 get 了。好,我理解你想生成一张图片,描述是这个,这个这个,他会根据我的 proma 的 运行调度这个 cds 的 一个这样一个也就即梦的 api 啊,已经好了, 反正,反正这个图片也一般了,效果一般了。然后他怎么做到的?怎么做到的? 首先你应该去打开吉梦,吉梦这样一个官网啊,这个大家都应该用过了,然后用抖音扫码登录,点这个 api。 好, 然后立刻开通啊,因为你是用 api 去调用,而不是用这个文字去调用这个。你进入这里以后,如果你是第一次进入,这是所有的都是暂未开通,暂未开通,我建议大家把这个吉梦四点零这个全开通, 如果是没有开通的服务的,他这边就是灰色的,你选择开通就好了。点开通就好了,我这个不不去开通了,开通了以后这个就会变绿。概数点这个概数啊,他大概有四个步骤,第一个步骤,实名认证,这个也没啥介绍的,也就是,呃,在抖音扫个脸就好了。第二步,开通服务,刚刚已经演示了, 就在这个节目 ai 这个这个里面,然后第三步是最最重要的,他现在喉咙不是很好,然后去开通这个新建秘药,这个秘药他有两个秘药,一个是 s s k, 一个是 secret 的 k 啊,这两个秘药拿到以后,然后编一段代码, 这个就是编好的代码,其实也不是很长的,这也不是很长,就这么一点,编好代码以后,然后让这个这个 让小龙虾去学习这个,呃,你刚刚编好的这样一个代码,也就样式学好了以后,他就能够运行调度这个极梦的 api, 大 概整体思路就是 第一步,第一步申请极梦的 api key, 那 第二步是开通服务,开通极梦的服务,第三的话就是编辑 skills 技能卡,也就这一块的代码,大家感兴趣的话可以在评论区扣,我可以分享给大家。最后一步就是让大龙虾去学习这个 skills, 所以 说关键点还是 你这个 style 是 自己开发的啊,你也可以用网上其他能开发好的,但是我用了下他们的不是很好用。最后就是,呃,直接可以展示效果,可以大家再给大家展示一下,比如说生成,生成一只猫在太阳下, 太阳下休息,然后可以看一下, 这个 好,他说我理解你想生成一张图片,描述是一只猫在太阳下休息,看一下应该很快就出来了,哎,这个 是不是还可以啊?效果还是不错的啊。所以说龙虾它也非常多的样式啊,如果你不会开发代码的话,你可以去找很多样式,把它放在那个它的项目上面的一个叫 work space, work space 里面它就自动能学习啊,这堂课就分享到这里,你学会了吗?

opencloud 呢,让本地的 ai 上了一个档次,那搭配什么硬件更好用呢?真的是 mac mini 吗? mac mini 虽然解决了 opencloud 运行和工具的支持,但实际上呢,也有几个弊端, 第一个呢,就是算力不足,有一些呢,本来应该放在本地跑的任务,只能呢依赖云端。第二呢,就是存储不够,如果说想把日常生活当中最常见的多媒体类的资源,比如像图片全放到上面的话,会很困难。其实呢,我觉得二十多万的这个顶配的 max studio 是 蛮合适的,只要呢你能接受这个价格。 我最近啊参与内测了一款纯国产的神秘设备,说实话,他带来的体验呢,让我挺惊喜的,他大概只要 max studio 五分之一的成本就带来了类似的效果。那今天呢,我们就来聊一聊他到底凭什么? 那先快速的来看一下我这几天都用它做了什么。首先呢,是本地的智能图库,过年期间啊,总是要拍很多的图片, 那现在呢,我都会随手的通过 qq 来去发送给 openclock, 他 会呢,整理好图片。然后呢,分析图片的信息。之后呢,我就可以随时的让 ai 去查找和处理图片了。 比如呢,说起过年期间都吃了什么,可以直接让他呢把近一周我吃饭的照片都发给我,一下子呢就能拿到全部了。再比如啊,我说去年我女儿过生日的照片发给我一张,他会根据之前的锁影信息来给我找到合适的图片。 那第二个呢,就是语音的随录,现在呢,我可以随时啊去录一些语音,晚上呢,全部一块发到一体机上, opencloud 呢,会自动的去做分析和缩影,那这一下呢, opencloud 就 能知道这一天当中重要的事情了。比如啊,哪一天我和老婆吵架了,我可以呢,让他帮我找出前几天说过的证据,你说这个实不实用啊, 如果再配合一个录音笔的话,那其实呢,就可以做到随时的记录,那真的呢,就是数字的人生了。那第三个呢,就是专属的 ai 网盘, 那比如啊,我经常会去搜集一些资料,那多了之后呢,自己也很难找,就像呢,我加了一个 qq 的 群啊,有一些分享的书籍,那我看到不错的呢,就会转发给 opencloud, 他 会使用我调教好的技能啊,直接保存好文件,那还会做好书目的记录。 还有呢,比如像吃饭开的发票,都可以让他呢很方便的去做整理。而且啊,如果你珍藏了一些个人的学习资料,就是那种不能播的啊, 那本地去管理啊,就太有优势了。可以看到啊,端导云的这台一体机呢,帮我实现了照片的智能管理,语音的记录,还有网盘文件的管理。 还有啊,就是我感到呢,他是越用越聪明的,因为他优化了 open cloud 的 长期记忆机制,可以让他呢自主的去学会很多技能。比如像前面我说到的整理书籍和发票,就是我一开始教他如何去做,然后呢,他学会了,后续呢,他就可以自动的去完成对应的任务。 那你可能要问呐,为什么我说他是更适合发挥 openclaw 能力的呢?首先呢, openclaw 想要工作就要有算力,尤其呢,是本地的算力,因为本地的算力啊,才能真正实现隐私性和低成本, 同时呢,想要让 openclaw 产生更大的价值,就需要呢让他有足够的工具。还有非常重要的一点啊,就是需要和自己的数据做真实的融合,这样呢才能逐渐的进化成更好用的 ai 助理。 所以呢,算力存储工具隐私,我觉得呢,这几点啊,是用好 opencloud 的 关键,如果你想要构建自己的本地的 ai 助理,也要记住这几点。那结合前面的这几点啊,我来拆解一下这台一体机里面的 opencloud 的 架构。 首先呢是最核心的肯定就是 openclaw, 然后呢,顶层呢,是通过 qq 来去做的接入,那 qq 的 接入效果呢,我觉得在国产的 i m 里是非常好的。那下层啊,是一个专门为 openclaw 提供支持的 multimodelreg, 前面的图片、音频文件的分析和缩影都是通过这部分来去实现的。 那它调用的模型呢,就是在本地的欧拉玛里运行的千万 v l 和 in bend。 那 我觉得呢,后续啊,还可以增加对视频的支持,当然呢,对于视频支持的关键还是要看算力。说到算力啊最底层的硬件这部分,这台内测机呢,搭配了 amd 的 amx 加三九五, 配合上三十二 g 的 内存和九十六 g 的 显存,可以说呢,就是专门为 ai 而来的,尤其呢是在九十六 g 的 显存,让本地的运行这些模型都绰绰有余。最后它还有两 t 的 ssd, 而且呢至多可以扩展至一百 t 以上,所以呢,完全不用担心存储的问题, 如果是 mac mini 的 话,这个存储的话就要加价大几千了。当然呢,我其实也是用本地和云上的组合算力,端导云上呢也提供了算力的套餐,用来呢做任务的规划和调度,效果更好,价格呢也非常便宜。 当然呢,我也不是觉得它就是完美的端脑云呢,其实可以在使用的便捷性上再下一下功夫。首先呢就是优化 skill 的 生态,现在的 open cloud 呢,很多 skill 都有安全性的问题,这个呢也是很多新手啊担心和害怕的一个问题,我觉得呢,端脑云可以做一个安全的 skill 中心, 毕竟啊,大家买了硬件的话,都希望可以更容易的上手。另外呢就是接入,现在呢,我是使用 qq, 但是这一类机器人呢,在多媒体的资源上还是会有一些限制,比如呢,像文件的类型,文件的大小,所以呢,如果可以做一个全功能的 app 会更好用一些。 如果是带货主播的话,最后是不是就该上链接了?当然啊,我不带货,而且呢,这个一体机啊,我也只是参与了内测,并没有价格,只是想和大家来分享一下,用好 opencloud 的 思考。 端导云呢是计划三月五号正式发布产品,如果感兴趣的朋友呢,可以去关注一下发布会,反正呢我觉得国产设备呢,在性价比这一块是不会让我失望的。 那我也接到了参会的邀请啊,到时候呢会给大家带来第一手的消息。好了,这里是 it 咖啡馆,我希望呢你也可以找到最适合自己的 open club 玩法,那我们下次再见。

嘿,大家好,最近那个超火的开源项目 openclock, 你 肯定听说了吧,大家都在讨论它有多牛,但是我发现一个特有意思的事,这个智能体的大脑就是它最核心的那个思考模块好像不见了,今天咱们就来当一回侦探,把这个失踪的大脑给找出来。 好,我们直接进入案发现场啊。这个项目最让人想不通的地方就是,你看他的代码,会发现那个最关键的主循环,也就是决定我下一步该干嘛的。这部分逻辑竟然不在主代码库里,哎,你说奇怪不奇怪,他跑哪去了呢? 为了搞清楚这个问题啊,咱们得换个思路,我们来做个比喻,你别把 openclaw 看成是一堆代码,把它想象成一个嗯,一个效率极高的 ai 助理事务所。这样一来,你发送的每一条消息就相当于一个客户送来的新案子,事务所要马上处理。 行,那咱们就跟着一个新案子走一遍完整的流程,看看他从客户手里是怎么一步步进入这个事务所,并且被处理的。 哇,你看这张图,是不是看着有点晕,这密密麻麻的就是 openclaw 完整的系统架构。但你别怕,只要你心里记着我们那个事务所的比喻,这些复杂的层次一下就变得特别好理解了。 任何一个案子进来啊,都得经过一套非常标准的收案流程。首先,事务所的前台负责接收,不管你是从哪个渠道来的。 然后呢,文员会把案子处理成内部的统一格式,接着快速过一遍,做个初步检查。最后,也是最关键的一步,档案员会根据案子信息找到最合适的助理,同时把这个客户以前所有的旧案卷宗也一并调出来。 哎,刚才说到档案员能那么精准的分配案子,是怎么做到的呢?就靠这个东西叫绘画密钥, 你可以把它理解成每个案子的专属档案编号,独一无二。有了它,尸木所里,就算有成千上万个案子在同时处理,也绝对不会搞混,保证每个案子都能准确无误的送到对应的助理手上。 好了,现在案子已经稳稳的放在助理的办公桌上了,那么在正式开工之前,还有一个非常非常重要的环节,就是任务简报。 你看,在开始干活之前,我们这位 ai 助理会拿到一个超级详细的任务简报包,这里面几乎包含了他需要知道的一切, 我是谁,我的职责是什么,我能用哪些工具和特殊技能,还有这个客户之前所有案子的来龙去脉全都写得明明白白, 所以你得知道这个准备工作有多细致。系统会把超过八种不同维度的信息,从工具的使用规则,到安全权限,再到历史记忆和技能库,所有这些全物打包在一起,形成一个完整的上下文, 然后啪的一下全部交给我们的助理,这准备工作可以说是相当充分了。好的,我们的助理已经拿到了详尽的任务简报,万事俱备。那么问题来了,真正动脑子思考的地方究竟在哪呢? 别急,谜底马上就要揭晓了,这一下就让我们回到了最初的那个问题,对吧?我们看了半天都是准备工作,那让这个助理能够思考一下,用个工具看看结果,再思考一下这个核心的反复循环的决策过程。他的代码到底藏在哪了呢? 答案就在一个非常经典而且非常强大的软件设计原则里,叫做关注点分离。这话听着有点专业,但说白了就是一句话,让专业的人干专业的事。 你想想,在我们的事务所里,你肯定不会让前台去分析复杂的案情,对吧?同样的道理,每个部分都应该只关心自己最擅长的那一块。 好了,各位,谜底揭晓, openclaw 的 核心思考循环,他的那个大脑根本就不在 openclaw 项目自己的代码里, 他把这个最核心最复杂的思考任务完全外包出去了,委托给了一个专业的外部大脑,也就是一个叫做 at mario zackner slash p i a i 的 第三方库来全权负责。 你看,这是一个多聪明的决定啊。就就好比开事务所,你有两个选择,一个是像左边这样,所有东西都自己来,从零开始自己培养一个超级助理,费时费力还不一定靠谱。 另一个选择呢,就向右边,我直接从外面请一个业妹最顶尖的专家顾问来当我的外脑。我自己呢,就专注于拓展业务,开发新工具 openclaw 就 选的第二条路。好了,现在我们已经知道了是什么和为什么。那接下来我们站远一点儿,从宏观的视角看看这种把大脑外包出去的设计,到底给它带来了多大的好处。 这种模块化的设计就是 open cloud 如此强大的秘密武器。你想,因为它把大脑和四肢分开了,所以我就可以很轻松地给事务所里所有不同工种的助理都装上同一个顶级的超级大脑。 我也可以在不打扰大脑思考的情况下,不断给助理们装备新的工具,这就让整个系统变得超级灵活,而且扩展性极强。 所以今天我们聊了这么多,最核心的一点就是通过把如何思考和能做什么这两件事彻底分开, opencloud 打造出了一个既强大又容易扩展的系统。 这就给我们留下了一个特别值得思考的问题,这种外置大鸟的模块化设计,它会不会就是未来所有高级 ai 智能体的标准答案呢?

opencloud 不是 神器,是坑。这话我敢说,因为我已经踩了一个月了,全网都在吹这个 ai agent 有 多牛。本地优先,数据安全,数字员工听着是不是很心动?但没人告诉你部署它需要懂 dack, 环境变量、端口映设,小白根本装不上, 更没人告诉你一次操作可能烧掉几十美元,稳定性差到让你怀疑人生。今天我就把这一个月的真实体验原原本本告诉你,不吹不黑,只讲真话,别被营销洗脑了。先说结论,理想很假,维斯现实很人工智障。 这个视频有点长,但全是干货,建议先收藏再看。咱们开始吧,保证你看完不后悔,绝对物超所值。 说实话,我一开始也是被营销洗脑的那批人。 github 上十九万星,奥地利开发者 peter stanberger 打造,口号是,真正能做事的 ai, 这谁顶得住啊?本地优先,数据全在自己手里,不用上传云端,隐私安全有保障,再也不用担心数据泄露了。 数字员工能接管你电脑权限,真正替你执行任务,解放双手,提高效率,想想就激动。 skills 技能系统社区贡献了一千七百多个技能包,想要什么功能装什么,无限扩展,只有你想不到,没有他做不到。 听起来是不是很完美?简直就是未来以来科技改变生活,迫不及待想试试,但实际部署的时候我才发现被坑惨了,坑到怀疑人生。官方说一键安装,执行一行命令就行,简单到不能再简单,小白也能搞定。 结果呢?高克镜像拉不下来,环境变量、配置报错,端口冲突解决不了,各种问题层出不穷,我折腾了整整两天才跑起来,期间各种报错,各种排查,查文档,搜 h 五问社区,差点就放弃了,好几次想砸电脑, 硬件门槛更是吓人,网上说本地运行不花钱,省钱又安全。听起来很美好,但你得有 mac studio、 m r ultra 这种级别的设备,六十四 g 内存起步,硬件投入近四千美元,这叫省钱? 我用的 m r pro, 三十二 g 内存,跑起来卡的要死,经常内存一出,动不动就崩溃,体验极差。第一次成功运行的时候,我确实兴奋了一把,感觉自己终于搞定了。 看着他在中端里输出锐志,感觉自己真的拥有了一个贾维斯,未来感十足。但这份兴奋很快就变成了崩溃,因为后面还有更大的坑等着我,而且是那种深不见底的大坑,一个接一个,根本停不下来。 公平的说, open call 确实有他的过人之处,不然也不会火成这样,肯定有他的道理。最让我惊艳的是 styles 技能系统,这个设计真的很聪明,是整个系统的核心亮点。 每个技能都是一个独立模块,想要什么功能就装什么,就像给手机装 app 一 样简单,需要什么装什么,不需要就卸载,灵活度很高。 比如 atxp, 可以 调用各种 ati 网页搜索 ai, 图像生成音乐、创作视频生成一个命令,搞定效率极高。比如 agent browser, 可以 自动操作浏览器,抓取网页、填写表单,收集数据,完全自动化,不用人工干预,省时省力。 比如 self improving agent, 可以 让 ai 自我改进,不断学习新技能,越用越聪明,越用越强大,这才是真正的智能社区,已经贡献了一千七百多个技能,覆盖办公技术、生活各种场景,只有你想不到,没有它做不到。生态非常丰富, 更厉害的是它的自主规划能力,这才是 ai agent 的 核心竞争力,也是区别于普通 ai 的 关键。 有一次,我发语音指令,让他帮我整理邮件,他发现听不了语音,居然自己安装了 whisper 转写工具,然后再处理我的请求。整个过程我没干预,他自己搞定了。这就是真正的智能,这才是 ai 该有的样子, 这就是 ai agent 和聊天机器人的区别,他不只是回答问题,而是真正解决问题。从说到做,质的飞跃, 本地优先的安全感也很重要,这是很多人选择 open ker 的 原因,也是他的核心卖点。我让他处理一些敏感文件,比如财务报表、合同文档、客户信息,所有数据都在我自己的电脑上跑,不用上传到云端。 这种数据主权在用户手里的设计确实让人放心,不用担心数据泄露,不用担心隐私被侵犯。还有一次,让他自动读取桌面任务文本,筛选紧急事项,统计账单并生成日报脚本,成功写入系统调度,实现了真正的 ai 协作者功能。 那一刻,我真的觉得,这就是未来,这就是我一直想要的数字员工,这才是 ai 该有的样子,这才是科技改变生活的正确方式。但好景不长,问题很快就暴露出来了,而且是致命的问题。第一个让我崩溃的是 api 费用,这个坑最深。 opencloud 本身是开源免费的,但它需要调用云端大模型来思考,比如 ppt、 四 o 或 cloud opens, 这些都是要钱的。一次复杂的自动化任务,可能烧掉数百万头,肯成本高达三十美元,你敢信? 我第一个月账单出来的时候,差点没背过气去,花了将近二百美元,比订阅十几个 ai 服务还贵。这哪是省钱,简直是烧钱。你说本地运行不花钱, 那得有顶级硬件,普通设备根本跑不动。大模型推理速度慢到让你怀疑人生,而且效果还不好。 第二个问题是稳定性,这个更让人崩溃,常上下文失效是常态。处理多步骤复杂任务时,他经常工具调用错误,或者步骤遗漏,逻辑混乱。我让他自动生成周报,需要人工干预,修正的频率高达百分之四十,正打是 ai 助手,简直是 ai 添乱。 有时候他执行到一半突然卡住,有时候他调用了错误的工具,有时候他完全理解错了我的意图,有时候他干脆就放弃了,直接报错。理想很贾维斯,现实很人工智障。这句话一点都不夸张,亲身经历才知道有多坑。最可怕的是安全风险,这个真的要命。 欧本克奥默认获得文件读写、程序执行、网络访问三大系统及权限,相当于给了 ai 一 把你电脑的万能钥匙,什么都能干。 安全机构实测,暴露了两大致命风险,每一个都可能导致灾难性。后果,一是提示词注入攻击。黑客在网页、邮件、文档里植入隐藏指令 o k o, 读取后会被误导 执行删除文件、发送密钥、访问钓鱼接口等恶意操作,而你完全不知情,等发现的时候已经晚了。二是公网暴露风险。很多人为了远程访问,把本地端口改成全网监听,又不设密码认证,门户大开, 全球超过一万五千台设备暴露在工网上,任何人都能远程控制你的电脑,窃取你的数据,为所欲为。官方文档只讲功能,不强调风险。博主只晒炫酷效果,不做安全提醒,这是不负责任的。 对于不懂网络防护的普通用户,安装 open call 约等于开门一道,自找麻烦。这不是危言耸听,是真实发生过的安全事故,已经有人中招了,损失惨重。 踩了一个月的坑,我开始认真思考, openclaw 到底适合谁?这个问题很重要,选错了就是浪费时间,浪费钱。首先,绝对不是小白能玩的东西,门槛太高了,部署门槛高,需要懂 docker、 环境变量、端口映涉、日制排查、网络配置,这些都是技术活, 出了问题要自己解决,没有技术背景根本搞不定,客服也没有,全靠社区互助,效率很低。 其次不是省钱神器,恰恰相反,是烧钱神器。软件免费,但 api 调用费用惊人,一个月可能花掉几百美元,比订阅服务贵多了。本地运行需要顶级硬件投入近四千美元,这成本谁扛得住?想省钱? 别想了,这玩意就是烧钱机器越用越穷。那么谁适合用呢?我觉得是这三类人缺一不可。 一是有技术背景的开发者,能自己解决问题,甚至能贡献代码优化系统,把 openclaw 当做学习项目,一举两得。二是有预算的团队或企业愿意为效率提升付费,把 ai agent 当做生产力工具,成本可以接受,投资回报率高。 三是有耐心的,即刻享受折腾的过程,不怕踩坑,把解决问题当做乐趣,而不是负担。心态很重要,谁不适合用想省钱的个人用户?怕折腾的普通用户,追求稳定的生产的用户,对安全要求高的企业用户。 对于这些人, open club 可能会让你更累,而不是更轻松。得不偿失,何必呢?还有一点很重要,安全意识。这个必须强调, 如果你不懂网络防护,不知道什么是提示词注入攻击,不了解端口暴露的风险,建议先补课再入坑,磨刀不误砍柴工,不然你的数字员工可能变成数字间谍,你的数据可能被别人窃取,你的电脑可能被别人控制,后果不堪设想。 这不是开玩笑,是真实存在的风险,必须重视,安全第一,千万别大意。最后总结一下,希望对大家有帮助。 openkey 是 好工具,但不是神器,要客观看待,它代表了 ai agent 的 未来方向。从聊天工具进化为数字员工,这个趋势是不可逆的,迟早会普及,这是大势所趋。 但目前的版本还不够成熟,有太多坑需要填,有太多问题需要解决,需要时间和耐心,不能急于求成。给想入坑的朋友,三点建议一定要听进去。第一,先评估自己是否适合,技术背景、预算耐心,缺一不可,不要盲目跟风,适合自己的才是最好的。 第二,注意安全,不要把端口暴露在公网,定期检查权限设置,警惕提示词注入攻击。安全第一,安全第一,安全第一,重要的事情说三遍。 第三,控制成本,监控 api 调用,设置预算上限,别让账单吓到你,量力而行,不要冲动消费。给已经入坑的朋友也三点建议,希望能帮到你。 第一,别追求完美,百分之四十的人工干预是正常的, ai 还不成熟,需要人机协助,习惯就好。第二,多看社区,很多坑,别人已经踩过了,学习别人的经验,少走弯路,事半功倍。 第三,保持期待,这个领域发展很快,今天的问题明天可能就解决了,未来可期,不要灰心。如果你也在用 open club, 欢迎在评论区分享你的体验,好的坏的都可以让更多人看到真实的使用感受,避免踩坑。互相帮助点赞关注我们,下期见!拜拜!

三分钟还原一个真实的 open crawl, 分 五点是什么?为什么厉害?给普通人什么建议?对 ai 树立产生什么样的影响,以及有什么弊端? 一、 open crawl 是 什么?大模型是大脑,那么 open crawl 就是 神经系统,用来控制我们的手和脚,还存下手和脚的使用说明和历史使用记录。十一月份发布的时候叫 cloud bot, 一 月二十七日更名为 mode bot, 一 月三十一日又正式更名为 open crawl。 目前已经实现大模型,比如 deepsafe、 gpt、 千问、 cloud、 豆包等,连接到我们日常使用的聊天工具、邮箱、操作系统、电脑软件、手机 app 等外部的智能题 不但连接,还附上这些工具的使用说明、历史记忆。打包成一个叫 skill 点 md 的 包存在本地,后面再根据你的使用习惯,通过心跳机制主动提醒和完成各项电脑工作。 啊,为什么厉害?首先, opencloud 引入了心跳机制,它会定期醒来检查是否有未完成的任务,或者根据你之前设定的目标,主动寻找可以帮助你做的事情。 其次,它能够直接访问和操作你的电脑文件系统,运行各种应用程序。现有的大模型不敢或者说不够聪明去底层控制操作系统。在此, opencloud 允许用户将自己的工作习惯、个人目标、常用工具等信息一次性输入给他,让大模型始终认识和了解你,所以每次都把一大串的提示词给到 ai。 三、普通人的建议康可乐将加速大模型接入低端办公工作。我建议大家和我一样,把 ai 工具,比如豆包,时时刻刻都用起来,把 ai 能做的事情都丢给 ai 工具,提高效率,把自己的时间都花在 ai 不 能做的工作上面,比如创造新的工作、 沟通工作和客户开发上面。我预计 opencloud 将大面积代替客服、法律、 p 图、视频剪辑、票头顾等工作,不是危言耸听。四、产业影响由于实现记忆和大面积的接口,调用 opencloud 使得率利消耗很大。我发布了单日图腾,使用七百块的视频后,很多网友联系我,告诉我使用量超过了一千甚至两千, 是一台 pc 使用偷看的消耗量,应用团队将会迎来很大的机遇。五、有什么弊端?这个也不得不提,就是目前沙箱机制不完善。所谓的沙箱,就是我们把 opencloud 对 系统和文件的操作放到一个类似小孩子玩沙子的箱子里面, 不要破坏房间,也就是不要破坏我们的操作系统。但是使用过程中我们发现 opencloud 有 时候会把操作系统搞乱甚至弄崩。 其次是当前技术门槛高,普通人需要等技术团队打包好才能使用,是可能存在大量调用外部工具和托管的情况,数据隐患较大。听到这里的小伙伴,我想你们的勤奋程度超过了百分之九十的人,二零二六年 open call 会帮助你逆天改命或者锦上添花。我是宁静科技,原谅严谨的 ai 自媒体,谢谢!

充分利用 openglue 的 几个特点呢,可以让你在几天之内快速对一个行业做调研。年初横空出世的 openglue 呢,绝对是做行业调研的这个大杀器啊,而且呢,能够做到像以前 gbd 这种聊天的 ai 完全做不到的程度。 不管你是做行业研究,选创业赛道,做 ip 方向定位,还是做营销策划,选择职业方向等等吧,几乎所有跟商业活动相关的事情呢,都用得上。先问大家一个问题啊,想进入一个行业,一个新行业,最痛苦的事情是什么? 不是找不到资料啊,恰恰相反,今天这个时代呢,资料太多了。麦肯锡的报告,三十六课的分析、行业老兵的博客,竞品的产品页。现在呢,你找到这些报告了?下载到电脑上,正经微作。你读了二十份报告, 结果呢,你发现每一份给你的图都不太一样,哪些数据是真的,哪些趋势呢?是噪音?谁才是这个赛道上真正的玩家?你靠人脑呢,去慢慢比对消化。三个月后呢,你可能才拼出一张粗略的行业的认知地图。我们以前做 pe 投资啊,费了很大的功夫呢,在行业研究上面 去消化这些东西,形成一套全举的认知呢,可以说是耗时耗力的。但在今天这个杰作之下,三个月呢,其实是个奢侈品,利用 openglue 这样的工具,完全可以把整个时间呢压缩到几。 比如说目前我自己呢,已经用它来监控 ai 领域的 hackleux、 osopik、 open ai、 curza 等官网的文章或者是帖子,一有更新马上处理。它起的呢,比我还早啊,几个定时任务,每天早上准时推到我的手机上。另外呢,我也监控了 ai 技术产品创投方向的十多个播客,一旦有更新,就会触发后续的一系列的任务,比如说转路,早上一睁眼呢,就是顶 移播课最热乎的精选的信息。我也翻了一下,海外的社区啊,目前前沿的玩家大都把它做成了行业调研的机器,而且用到的恰恰是 openclip 跟叉 g p t 啊 cloud 最不一样的那几个功能,不是聊得好,是能动手,能定时,能记住。具体怎么做到呢?下面来给大家详细讲一下。第一个 ufireclip 呢,批量抓取网页,让它自己去读 一个行业,大多数人做行业调研还是一篇一篇手动去读的。那你读到第三份报告的时候呢?第一份的关键数据大概率已经模糊了,而第三份和第一份报告在同一个问题上说的话,可能完全是矛盾的。比如说,一个说市场规模是五百亿,一个呢说是一千二百亿。 做过行业研究的都知道啊,倒不是说他在乱说,一般呢都是统计口径,他们不一样,这些细节你不对着去看,根本发现不了。 openclaw 跟普通聊天 ai 的 最大区别之一,就是它能真正访问网页和你本地的那些文件。具体来说, openclaw 呢,它内置了 firecrow, 作为 webfurniture 这样一个搜索工具的 phoneback, 也就 备份它不仅能把任何网页呢抓下来,而且非常关键的是呢,它可以去掉里面的广告啊,脚本、导航栏这一些噪音,只留下干净的正纹,然后转化为 markdown 格式。这有啥好处呢?明显啊,第一个就是省掉了大量的这种无关的上下纹,省了 token, 那 就省了钱。另外呢,把网页 html 这种转化成了 markdown, 它更适合 ai 去读。 我以前的视频呢,讲过哪些语法格式是 ai 更喜欢的。而且呢,它不仅仅是一页一页这种慢慢爬,最大的处理速度,它可以达到每分钟一千页。 ok, 具体操作呢,是这样的,你告诉 opencloud 呢,帮我把某某行业的这些二十来个网站的核心页面呢爬下来,它会通过 firecloud 呢批量的抓取,转成干净 macdunk 文本,存到你本地的硬盘上,然后它可以直接读这些文件,因为 firecloud 呢,有完整的本地文件的读写的权限,同时比对多份报告的数据,哪些呢?是共识?哪些呢?是分歧?哪些呢?是 彼此矛盾的。当然,这一些呢,只是最简化的情况,因为实际操作的时候呢,页面的结构啊,可能差别很大,有的人需要特殊处理,如果你需要更深入的话,他还能写一段 python 脚本来跑结构化的分析,提取每份报告里面的公司名, 融资金额预测。然后呢,自动生成对比表格,因为 openclip 呢,可以执行代码,这些事情呢,他自己就能做。有做投资研究的用户呢,在博课里面写了他自己的做法,把几十份宣传稿位给 openclip, 程序化提取 评级变动目标价,核心逻辑,风险因素,然后自动交叉比对多家券商的观点。还有做旅游 sars 的 创业者呢,更狠啊,让 agent 自动抓取七千两百多份竞品的用户评论做交叉分析,这东西手动做的,你不得找 三个实习生干了两周,你想一下,这跟在叉 g b d 里面说,帮我分析一下这个行业的区别,那么 g b d 呢,只能基于它训练数据里面的旧信息给你一个概数, opencloud 呢,是真的跑出去抓回来,回本地跑代码以及做分析,而且所有的数据呢,都在你自己的硬盘上,研究敏感行业竞品情报什么这些东西呢?除了请求大模型这一环啊, 其他的环节呢,数据根本不过云端,这个用法可以迁移到任何行业。你想搞懂新能源领域,给他十几个行业的网站让他去抓。想搞懂机器人赛道呢,让他把 c b n site, crunchbase 几个相关头条号呢全部过一遍。做行业研究的一个窍门就是找出矛盾点,因为那些不同报告之间矛盾的地方,往往就是这个行业 真正值得深挖的地方。第二个方法,业行 core mailing, 搭一个你自己行业情报日报。前面呢,说的是一次性的这种集中的调研,但是摸透一个行业,它不是一锤子买卖啊,你需要持续的跟踪。传统方式呢,大家都试过定一堆的 newsletter, 然后关注一堆的公众号,每天手动呢刷行业网站。问题呢,是这样做性价比 太低了,你定了二十个信源,每天推两百条信息,真正有价值的可能也就五条,但是呢,你得花一个小时筛选,其实百分之九十时间都是在点击切换这些无效的工作上面。那这个场景上, opencloud 呢,有一个 cbd 和 cloud 完全不具备的能力,就是 cloud 定时任务。 opencloud 的 getaway 网关里面呢,内置了一个持久化的调度器,你可以给它设定一个定时任务啊,比如说,每天早上八点,自动执行一段指令,然后呢,把结果推送到你的 telegram, 或者是 备注,那任务配置会集中在本地的 jobs 点 jason 这个文件里面,设置的门槛呢,低到只需要这一行, mini 好, 就这一行。每天早上八点, opencrew 呢,会自动醒来,用 excel 做语域搜索,用 firecrew 呢,抓取相关网页,提取正文,然后呢,去重评分,生成摘药,最后推送到你的 telegram。 定时任务是跑在一个隔离的 section 里面,因此呢,它不会打断你正在进行的其他的对话。 有个具体案例呢,搭建一个 tech news digest, 一 次性接入了一百多个信源,按标题相似度去重对每条信息呢,做质量打分,只推送高分内容。整个搭建时间呢,一个小时到两个小时。一般来说,搭建完之后呢,你的早晨 呢,会变成这样的,起床,打开 telegram, 一 份定制化的行业简报已经在哪了?谁融资了?什么政策呢?变了?哪个技术突破了?谁说了什么值得注意的话?说白了, gbd 和 cloud 呢,有主动出击的能力,你睡着了,他还能帮你盯着行业 动态。那这是架构层面的差异,不是 prompt 写的好不好的问题了。这个玩法呢,其实它呢,这个迁移空间就很大,做教育的,改成教育行业情报的日报,做医疗的,跟踪各地政策更新,做跨境电商的,监控海外的市场 动向。以前得雇一个人专门盯,现在呢,一行 crow 呢,命令搞定,每个行业都可以做一个 crow, 后面呢,你完全可以用来做一些下游的动作,比如说吸引同行。这个想象空间,大家应该能 get 到。第三个用法, markdown, 加多渠道追问,找出你自己的行业认知。前两个用法呢,解决的是 获取信息,但调研行业还有另一层,你需要建立认知框架。什么意思呢?就是你听到一条行业新闻,能在几秒钟之内判断这事重不重要,会影响谁,跟你 有什么关系?这种判断力呢,通常要在行业里面泡好几年才能长出来。那这里就要说到 openglue 呢,最关键的一个设计呢,就是它的双层记忆 存在你硬盘上的 macdown 文件里面啊,路径在这个 workspace 文件夹里面,它里面呢,有一个 memory 点, md 存长期记忆,然后呢,小写的这个 memory 文件夹下面呢,还有按日期命名的日制文件,记录每天重要的对话。那这些就是普通的 md 的 文件,你用一般的记事本呢, 就能打开看,那这个有什么好处呢?就你今天在网页端跟 openclip 呢聊了新能源行业的整体格局,它自动识别,重点记在了本地文件里面。明 明天呢,你在地铁上用飞书接着问某个新闻领域的技术路线,同一份记忆,跨设备跨平台无缝衔接。后天你回到电脑前面,追问两个竞品的差别,那他全记得,不用每次重新交代背景呢?这个呢,跟 g b d 的 这种记忆呢,完全是两码事。 g b d 的 记忆呢,它在云端不透明啊,一般来说你也控制不了它记了什么,然后它忘了什么。 open clue 的 记忆 就是你硬盘上的文件,你甚至呢,可以手动编辑它,觉得它记错了一些你从线下交流得来的行业洞察,直接写进去, 想用 get 做版本管理,追踪你的认知是怎么一步一步建立起来的?完全可以啊。更狠的是呢,还有一个心跳机制, openclip 呢,每三十分钟左右会主动检查一次你的 heartbeat 点 m d 这个文件,你可以在里面呢写上行业调研的代办事项,比如说跟踪某某公司的新产品发布,或关注某某领域的政策动向,它会主动检 查这些条目。有进展呢,会主动通知你,不需要你每次去问了。那说白了,经过一两周的这种持续的政策动向,它会主动通知你,你的目录里面会长出一个属于你自己的行业知识库, 记住了你问过的核心的问题,搜过的核心的信息,做过的核心的分析。这个积累是 g b d 呢,给不了的,因为 g b d、 zip 这类 ai 聊天,每次开心对话,相当于它失意重来。一两周追问下来,你对这个行业的认知密度呢?能 超过很多在行业里面待了半年,但是却从来没有做过这种系统性梳理的人。好了,以上三个用法,想要发挥最大的威力,得三步串起来用。先用 firecrew 批量抓取行业资料,做交叉比对。 然后呢,用银行 call 命令搭建情报日报,每天自动更新,会送到 tergram 或者是飞书,不遗漏重要的变化。最后呢,通过持续的追问,积累 markdown 记忆,对感兴趣的方向呢,不断地深挖,让你的行业认知像滚雪球一样呢,越来越厚, 那以前呢,我们需要三个月才能达到的行业熟悉度,现在几天就能有个七八成了。最后呢,这个提示词,你现在呢,就可以丢给 openclock 呢,试试 这两条命令,一个是集中火力调研,一个是每天帮你盯着看,你会发现呢,摸透一个陌生行业,这件事情跟以前完全不是一个速度了。

最近这个欧本可乐很火,欧本可乐是这个当下最火的 ai 代理,它的核心原理,致命风险以及最关键的这个问题, 你愿意用安全换效率吗?先搞懂欧本可乐到底是什么?它不是普通的聊天 ai, 而是能够直接操控你电脑的自主 ai 代理。 简单的说就是给 i 给 ai 装上了双手。他的核心原理很清晰,就是以大模行为,大脑本地网关做证书连接、文件读写、现有命令执行、网页操作等系统工具。 你用自自然语言说需求,他就能够自主规划、执行教验,帮你完成 文件自动化、办公等复杂任务。不用你一步一步手动操作,效率直接拉满。 这种架构带来的效率提升是颠覆性的,传统 ai 只能够给建议 opencloud 能够直接落地执行,比如你让它批量处理表格,自动部署项目 等,几分钟他就能够帮你搞定几个小时的工作,这也是他爆火的核心原因。但要记住,能力越大,风险越大,他的安全隐患和效率一样惊人。 第一个核心风险,其实词注入攻击,这是最常见也是最致命的漏洞。攻击者通过恶意话术诱导 ai, 让他执行 非你授权的操作,比如伪装成正常指令,让他删除系统文件,泄露你的隐私数据,执行恶意脚本,一旦中招,你的电脑就相当于被别人控制 数据系统全毁都有可能。安全测试中,这种攻击的成功率极高。第二个风险, 权限失控,违背最小安全原则。阿门可乐默认开放最高权限, 主绘画,直接拥有系统完全控制权,高危操作,没有默认隔离,普通用户根本不会手动配置沙箱容器隔离相当于给了 ai 最高权限的钥匙, 一次误判,一次恶意指令,就能够导致文件丢失、密钥泄露、系统崩溃,甚至黑客利用发起更大的规模攻击。第三个风险,供应链与暴露风险。 他的插件市场存在头度隐患,恶意插件可能藏着后门,更可怕的是,也有数百个欧盟克洛实力暴露在公网 部分,完全没有公正。黑客能够轻易的找到并入侵,远程操控你的设备隐私和数据毫无保障。讲到这里,回到核心问题,你愿意用安全换效率吗? 欧本可乐的本质是一场安全与安全与效率的极端博弈,他能帮你节省大量时间,解放双手。 但代价是交出设备的控制权,把隐私系统安全暴露在高风险中。对于普通用户,不愿不建议裸跑使用。没有专业安全配置,风险远大于收益。 对于技术从业者、开发者,若要使用,必须做好沙乡隔离,全线最小化,严格认证防护,把风险锁在可控范围内。 欧文可乐是 ai 时代理时代的里程碑,他证明了 ai 能从给建议进化到直接做事。但他也提醒了我们, 没有绝对安全的效率,只有权衡后的,只有权衡后的选择。你追求极致效率,就要承担对应的安全代价,你想守住安全底线,就要接受效率的妥协。

这期视频,我们聊聊怎么用 cloud 控制智能设备。控制智能设备,最关键的一步是拿到设备的控制权限。以小米温湿度计为例, 你想获取它的毒素,但小米并没有开放这类的接口,你很难获取。那怎么解决?这个时候, home assistant 就 派上了用场。 ha 是 一个开源的智能家居平台,它专门做了各大平台的设备集成,支持米家、苹果、 homekit、 涂鸦等一系列的主流设备。 它帮你把各个设备的协议进行的统一,你只需要授权给 ha, 就 能通过 ha 的 接口访问和控制所有设备。所以,而 oppo cloud 的 对接, ha 理论上就能通过 ha 控制所有的设备。但实际跑起来,问题很快就来了。我发现 oppo cloud 的 经常会遗忘我们对接的 ha 什么意思? 假如我问他房间的温度是多少,他不是去温湿度计去读取数据,而是走天气接口,甚至连地理位置都不对,这很离谱,对吧?在 open log 的 架构里, agent 采用的是 react 模式,先推理再行动。 当用户问温度是多少时,模型会先思考我该用什么工具。但问题来了,他并不知道自己有哪些设备可以用。 你说使用 home assistant 查看房间的温度,它能正确获取,但不加 h a 的 这个条件,它就开始自由发挥了。所以,当用户问温度的时候,模型一推理温度,我可以通过天气的 api 来获取,这并不是我们想要的结果。 而且在 h a 里面,一个设备往往会被分为多个实体,不同实体可能有类似的功能,这就更加容易造成查询的混乱。 那怎么解决?我想到了一个思路是,与其让 opcode 记住设备,不如让设备自己生命能力。 具体的做法是把每个设备分装成一个独立的 skill。 每个 skill 其实是有两部分核心内容的,第一部分是描述用自然语言告诉 agent 这个 skill 能做什么。第二部分是实现具体的调用逻辑,比如调用哪个 api, 跑什么脚本, 都不可傲的知道温湿度计是一个 skill, 并且他描述是读取温湿度的数据,他就明白用户问房间温度时,我就应该调用这个 skill。 而且根据 astropic 对 skill 的 设计, skill 的 使用是渐进式频读的。传统的其实是做法是把所有的信息一次性塞给大模型, 几十个设备偷看很浪费不说, aint 也容易被批量的信息搞晕。渐进式频读的好处时不主动加载所有 skill, 先用 skill 的 描述信息进行筛选,在需要时才动态加载 用户用温度才加载温湿度计的 skill。 问 pm 二点五才加载空气净化器的 skill, 这不仅节省 token, 还 a 技能的决策更加精准快速。 但如果我有十个二十个设备,难道手动一个个注册 skill 吗?这也太不优雅了。于是我又把这部分逻辑封装成了一个 h a manage skill, 由它来控制管理所有的子设备。 h a manage 的 核心能力有两点,第一个是自动发现设备, h a manager 会调用 homeworks 的 a p i 拉取所有的实体,然后根据设备的 id 将多个实体合并为一个设备,自动解析每个设备的能力。 第二,它自动生成 skill, 它会根据各个实体的功能自动生成对应的 skill 描述文件。这样的设计好处是不需要为每个设备写 skill, h a manager 根据规则和设备信息自动生成对应的 skill。 为了方便管理和共享,我为设备的 skill 单独建立了一个仓库, 这里有一个优先匹配的设计精确匹配模式,比如小米温湿度计。仓库里有这么一个 skill 模板,就用匹配的专用模板直接下载 skill, 后续 skill 有 优化迭代,就可以直接同步更新。 第二是动态生成兜底。假如没有匹配到的模板, h a manager 会根据实体的功能,结合预设的规则模板动态生成 skill 描述。说了这么多,那我们一起来实战一下吧。 安装过程呢,很简单,直接把 github 的 仓库地址发给 opencloud, 跟他说安装 opencloud 会自动根据引导完成配置,它会让你先输入 h a 的 访问地址和长令牌的 token。 整个过程呢,不需要手动配置任何设备,完全是自动化的。 我们来测试一下它的效果,现在房间的温度是多少,可以看到它能准确地找到设备并获取读数。 测试一下它的控制能力,把空气净化器开大一点,它很智能的将风扇调到了更快的转速。这就是我一点零版的 opencloud 的 设备控制方案。 核心逻辑其实很简单,设备不是被管理的对象,而是被声明的能力。把设备封装成 skill, 解决了一进的遗忘设备的问题,从而 h a manage 的 自动发现加动态生成,降低了多设备的管理成本。 当然,这个方案也可能有不少的问题,有不少的优化空间,权当抛砖引玉,期待和大家一起探讨更多的可能性。项目的具体地址呢?我已经放在了我的主页,如果你对 ai 自控感兴趣,欢迎关注我,我是习特胡,我们下期见。