呃,今天聊点什么呢?要么就聊点最近比较火的 open cloud 啊,这是前阵子第一个名叫 cow boat, 对 吧?我们记错的话,对,是一个 ai 的 智能体啊。 嗯,说这个智能体之前,我想重复一下我去年,呃,可能更早时间。也是啊,一直以来的观点就是眼镜是 ai 的 最好的载体啊,但是 ai 的 最好的应用其实是在智能体啊,就我们 并没有老百姓没有那么多的场景需要拿 gpt 来做高考题啊,来完成呃,这个复杂的科研任务。我们真正希望 ai 做的就是来到我们日常的学习、生活、工作中间,帮我们完成一些 又花时间然后又繁琐又无聊的工作。这个才是 ai 我 觉得进入千家万户后面最重要的应用啊,帮我们节省时间,降低成本,提高效率。我觉得这是我 很长时间来觉得眼镜包括智能体应该给大家提供的服务啊。然后那智能体到底是什么呢?呃,我先简单给他举个例子。嗯,就是周末跟小朋友在在,在家里打游戏。 呃,我们打游戏的时候,当年打游戏的时候有一个应用叫做按键精灵啊,就是现在小朋友听都没听听说过 啊,就为什么会有这个想法呢?因为每当我们需要去一个地方打野,去去战斗,中间其实有很多很多特别无聊的机械化动作。是,呃,游戏厂商为了提高它的粘性来帮你填充的一些垃圾的时间啊。那以前呢, 我们就可以用按键精灵啊,用按键精灵,按键精灵能够帮你把键盘、鼠标,一些运动,那些简单的重复的一些操作都能帮你记录下来,然后你只要一按 这个按键就能完成啊。那后面呢?发展成一个叫做 rpa 机器人啊,那么它结合了一些的能力能更聪明啊。但总体来讲,它是基于现有的一些操作 路径和方式啊,它是围绕着已经有的系统,你如果界面改变了,或者换了个游戏啊,那这个这个什么 ip 或者安全经理就完全失效了,因为它就在不该不该点的位置胡乱点。 呃,但是这个 open cloud 就 非常厉害啊,就是它因为结合了现在大语言魔性的能力,它是能知道你想要干嘛,同时呢啊,帮你非常准确的来完成啊。比较要命的是,它并不需要一个特别 特别准的指令啊,因为以往为什么计算很难回到我们日常生活中,最大的原因是因为计算机 if and else yes or no, 所以 它必须要一个非常精准的执行的指令才能进入下一步啊。但是大语言模型来了以后啊,用用一个呃神经网络和猜猜的这种方式,能够让一些 特别简单但是,呃比较描述成精确指令的方案来实现精准的操作。这个是,这是一件特别难的事。但是大模型完成 了啊,就举个例子,呃,那个,呃呃,通过这个 cloud, open cloud, 呃,他能做到什么?做到哎,帮我订个餐啊,帮我订个酒店 啊,帮我定一个火车票啊,只要通过简单的训练啊,他就能理解你啊,然后通过阅读你的日程啊,他能帮你去定对对应的这个安排,对应的行程。这是一件特别 啊。那为什么这个事跟眼镜有关?因为眼镜天然是没有好的交互的设备啊,所以很多人跟我讲戒指啊,手表啊,但本质来讲,没有交互是最好的交互,如果 ai 已经很懂你了,其实你并不需要去点点碰碰的啊。所以, 呃,如果说眼镜是 ai 的 最好的主体,那么眼镜里面的好的智能体将是决定眼镜能否 真正成为啊,成为我们就到下一个超级终端争夺的一个胜利的一个法宝吧。啊对呃, rocky 做了很多 d 啊。然后我们非常自豪的说, ai, 眼镜的智能体的 store, 智能体的商城啊,我们也是全球第一个上线并运营的啊,上面已经有很多好玩的应用了,能帮你记单词的啊,看飞机,呃,这个航班的座位的啊,这个特别好玩啊,所以,嗯, open cloud, open cloud 是 能够让大家真正了解未来我们应该怎么样跟计算机跟互联网去交互啊,你只要动动嘴啊,就那么简单。
粉丝209获赞930

cloud bot 一 夜爆火,这是一个运行在本地电脑的开源 ai 助理,短短几天内, github star 数量直线拉升,已经超过了十二万。本期视频我们带来一个 cloud bot 的 全面攻略,看看 cloud bot 比起其他的 ai agent 有 什么特色。 我准备了十几个案例的玩法大全,还会介绍一个接入飞书加国产模型的方案,让 cloud bot 在 国内网络也能顺畅使用。视频开始之前,先插入一个小插曲, 由于 cloud bot 受到 ansorepic 法务团队的压力, cloud bot 先是改名成了 motbot, 现在又改名成了 open cloud。 爬爬虾做视频的速度还赶不上它改名的速度,所以本期视频我们还是统一叫它最开始的名字 cloud bot。 cloud bot 功能跟 cloud code 和 open code 都有点像,都可以处理文件编码、调用 skills、 m c p 等等帮我们处理工作。 cloud bot 的 最大优势是可以接入各种聊天工具,也就是我们即使出门在外,手边没有电脑,只需要在聊天工具里面给 cloud bot 留个言, cloud bot 就 能自动干活,还能把屏幕截图、执行过程等信息实时同步过来,非常的方便。第二个优点是, cloud bot 自带了强大的定生物系统, 只需要用自然语言就能创建定身舞,比如可以创建一个临时的提醒,还可以定时检查收件箱通知等等,它可以智能地判断事情的紧急程度,选择是否用聊天工具跟用户进行沟通。比起传统的指令执行、指令执行这种固定的流程, cloud bot 就 具有了很强的主观能动性。 它的第三个优点是具有长期记忆,可以把记忆作为文件存储在本地,在日常的对话中能够搜索,并且把相关的记忆捞回上下文,随着日常使用,它还会主动去更新这些记忆文件,会有一种越用越聪明的感觉。好,我们先在本地把软件安装一下, 任意一个能运行 note g s 的 环境都可以部署 cloud bot。 我 最推荐就是使用 mac 或者 linux 系统的家庭服务器。 现在最火的部署方案是使用 mac mini, mac mini 的 最大好处是 mac 系统有不错的桌面环境,这样可以很方便地进行截图、操作、浏览器等等。第二点是功耗比较低, 七乘二十四小时运行,比较省电。第三个优点是 cloud bot 里面许多 skills 跟 mac 生态是绑定的,没有 mac 电脑的话,可以选择 linux 操作系统,或者在 windows 里面创建一个 linux 的 虚拟机。操作步骤跟接下来是一样的, 我选择的安装方式是 node js, 我 们来到 node js 官网,把第一个命令复制一下,然后打开终端执行一下,接着是第二个命令,第三个命令, 这样 node js 就 安装完成了。下一步我们来到 cloud bot 的 官网,在这里有一个一键安装命令,如果我们使用官网上的一键安装命令的话,注意要区分现在软件的名字,比如现在叫 open cloud, 后续所有操作的命令都应该是 open cloud 开头了,这里我选择 npm 的 安装方式, 我们看到 n p m 这里命令还是叫 cloud bot, 所以 后续我输入的命令都应该还是 cloud bot 开头了。这样我把这个命令复制一下,粘贴到命令行窗口执行一下。安装完成,我们输入命令 cloud onboard 来进行初步化。第一步,先配置 ai 模型,因为我有 open ai 的 plus 订阅,所以这里我选择 open ai, 当然下面也有很多不错的国产模型可以选择。视频的后半段,我们再来配置使用国产模型。选择 open ai 以后,再选择第二个 chad gpt 登录, 登录一下我的 chad gpt 账户,这样 ai 模型就配置完成。默认模型我选择的工具是 whatsapp 视频的后半段。我们再来看如何绑定国产的聊天工具。我们打开手机上的 whatsapp 右上角三个点已关联设备,关联新设备,扫一下屏幕上的二维码,这样就绑定完成。接下来选择预装的 skills, 按空格键打上对勾选中,这里可以按需进行选择安装下面的这些 api k 可以 全部选择跳过,然后 ai 会询问我们一些关于人设方面的问题,我们回答一下,这样就配置完成。我说你可以给我的聊天工具发一个消息,我们看到手机上收到了消息,这样就完全配置成功了。 我们先来介绍几个基础命令的使用。输入命令 cloud bot gateway, 这个是启动主程序,我们可以通过关闭控制台来停止 cloud bot 的 运行。在 cloud bot 后台运行的时候,我们可以新开一个窗口, 输入命令 cloud bot t u i 就 可以进入这个控制台的对话界面。输入命令 cloud bot dashboard, 可以 进入一个网页版的控制台,在这里可以进行基础的对话。上面还有很多配置,可以管理定身舞,管理 skills 等等。输入命令 cloud bot channel logout, 可以 退出 cloud bot 上面登录过的聊天软件,然 然后我们再输入命令 log in, 就 可以重新登录一下,因为有的聊天软件可能隔几天就会掉线,我们可以使用这个命令重新登录一下。我们来看 cloud bot 最有意思的一个功能就是它的定身物,定身物赋予了 cloud bot 的 一些主观能动性,让它变得更像一个智能的 ai 助手。 比如我输入这个命令,提醒我两分钟以后关煤气。 cloud bot 回复我,好的,已经设定成功了。我们可以在网页版的控制台 crown job, 也就是定身五这个选项卡可以看到 cloud bot 为我们设定的定身五,这里显示两分钟后执行。两分钟以后,他就把这个消息推送到了手机上,提醒我去关煤气。 cloud bot 具有操作浏览器的能力,我们需要先在 mac 里面下载一个 chrome 浏览器,我要求 cloud bot 去 m i t 公开课下载 python 课程的课件,放到我的桌面,我们看到 cloud bot 自动打开了 mac 里面的 chrome 浏览器,找到了 m i t 公开课的官网,并且搜索 python。 他 找到了几门 python 课程, 回复了我课程的编号,让我选择这里,我选择第一个。他又在浏览器里面通过课程编号找到了这门课,并且下载到了桌面,然后我要求他把它解压出来,他调用了麦克的命令行工具完成了解压,然后我要求他把第一节课的课件发给我 这里可乐豹成功找到了课件,并且完成了发送,效果不错。接下来我们来看一个把浏览器自动化跟定生物组合起来的案例。爬爬虾,作为一个科技软件类的博主,需要经常查看 github 的 热点, 这里我告诉 cloud bot, 让他查找一下 gitap 上面的热点,然后做个中文简报发送给我。 cloud bot 生成了中文简报,接下来我说每天早晨八点你都做这么一个简报发送给我。 接下来 cloud bot 生成了一个定身舞,每天早晨八点都执行这个工作。我们可以在 cloud bot 的 控制后台查找到这个定身舞,每天早晨八点都会自动执行这个工作流程,发送给我简报效果不错。除了操作浏览器, cloud bot 还有图像识别等 ai 视觉方面的能力。 这里打开 mac mini 的 设置隐私与安全设置录屏与系统录音,我们在这里搜索终端两个字,给命令行终端添加上录屏和录音的权限。接下来重启一下 cloud bot, 我 在手机里面说,请给现在的 mac 截一个图, mac 电脑当前的图片就发送到了我的手机上,可以实时的对状态进行监控。 目前为止我们依赖的是海外的聊天工具。接下来我们把 cloud bot 接入飞书,让他在国内的网络也可以顺畅使用。我们先来到飞书开放平台,点击创建企业应用,填写一个名字与描述。接下来点击左侧添加应用能力, 选择机器人。然后我们来到权限管理,点击添加权限,总共需要添加屏幕上这些所有的权限。 接下来来到版本管理与发布,填写一个版本号,点击发布。我们回到 mac 终端,输入第一个命令,安装飞书插件。第二个命令,配置 app id, app id 可以 在飞书开放平台凭证与基础信息里面找到, 把 id 粘贴到命令行里面执行一下,然后配置 app secret, 同样在凭证与基础信息里面找到同样的,把 secret 放到命令里面执行一下,下一个命令,开启飞书 channel。 最后第四个命令,把链接方式改成 web socket, 然后我们重启一下 cloud bot, 这里我总结了需要执行的几个命令,有需要的观众朋友们可以截图保存一下。回到飞书开放平台,在事件与回调这里选择长连接,点击这个铅笔,点击添加事件,然后勾选接收消息,最后点击顶部的创建版本, 我们再提交一个新的版本,这样飞书就配置完成了。在飞书的手机 app 里面,我们可以找到开发者助手,然后点击打开应用这里我打一个招呼,你好,飞书有一个非常可爱的机器人正在输入的表情,我问他现在几点了,这里给出了回答。然后我让他给麦克截一个屏, 告诉我需要先在控制台跟他对话一次,开通权限才可以截屏。这里我们来到麦克上面的控制台,跟他对话一次,允许截屏,这样截屏完成。我们看到飞书也同样可以传递文件传递截屏。我们把聊天方式换成了国内平台 ai 模型,同样也可以换成国内平台。 cloud bot 的 作者推荐使用 mini max, 这里我们来到 mini max 的 开放平台左侧,选到接口密钥,然后创建一个 apikey, 然后我们打开 mac 的 控制台,输入 cloud bot config 来配置一下模型,选择 mini max, 然后我们把刚才创建的 mini max api k 填写进来,一路回车就配置完成。来到 cloud bot 的 控制台,输入命令斜线 models, 然后我们可以选择 mini max 模型, 选择完模型以后,我们再重启一下 cloud bot, 这样模型就切换完成了。 cloud bot 的 强大之处在于它内置的 skills 可以把各种第三方的生态接入进来,比如这里的 g u g skills, 可以 把谷歌邮箱、日历文档等功能都接入 cloud bot。 我 们点击这个安装按钮,这里要提醒一下大家,安装的时候要把 mac 系统更新到最新版,否则有可能会失败,这样一键就安装完成。 来到谷歌 cloud, 我 们在左侧菜单找到 api 与服务,选到 o o 四权限请求页面,创建 o o 四客户端应用类型,选择桌面 app。 然后我们把生成的这个 json 文件保存下来,把文件拖拽进 cloud bot, 告诉他配置一下 g o g 的 认证,然后我们登录谷歌账号,并且授予权限,这样就完成了配置。接下来我让他看看我的邮箱里有什么邮件,让他总结一下。 这里 ai 提示我需要再开通一个 gmail api 的 权限,我按照它的提示把权限开通完成,它就可以读取到我的邮件了。接下来我让它把所有的邮件移动到垃圾箱,这里也成功完成了。我在手机上让 cloud bot 帮我发送一封邮件, 我们看到邮件可以成功发送,我让 cloud bot 设置两分钟一次的心跳检查,如果有发现新的邮件,就发消息通知我,我给这个机妙邮箱发送一个邮件来测试一下。这里 cloud bot 成功给到了通知,我让他总结一下邮件内容,他也完成了总结。 ai 助手对接其他生态,一个重要的渠道就是 m c p, 我 们可以在 skills 里面找到 m c p porter, 把这个 skills 安装一下。接下来我告诉 ai 用 m c p porter 来配置一个百度地图的 m c p, 我 把这个 m c p 的 说明文档贴给了他。 ai 提供了三种安装方案,我选择 streamable h d d p。 他同时要求我提供百度地图的 a p i k, 把这个 a p i k 复制一下粘贴给他,这样就完成了配置。他已经可以使用这个 m c p 查询到地理位置的坐标了,这样我们就配置完成了,我们也可以在手机里面使用,我让他查询一下从青岛太平角公园到崂山羊口景区怎么走, 这里成功给到了规划路线,效果不错。我们再来看一个 skills 的 使用,这里有一个 skills 叫做 coding agent, 它可以驱动本地的 codex, cloud code、 open code 等 ai 编程工具 直接进行编程。这里我们先把这个 skills 安装一下,我在 mac 电脑上登录了我的 codex, 接着我在手机上跟 ai 说调用 codex 创建一个贪吃蛇的游戏,我们看到程序就编写好了,这样我们就通过 cloud bot 驱动 codex 完成了一个程序的开发。

哎,好的好的,大家好,我们今天手动来带大家从零到一部署在自己电脑上面部署一下最近火爆全网的这个 cloud bot 啊,现在已经改名叫 opencloud, 我 们从零开始,首先我们去 opencloud ai 这个官网,然后往下滑,它有一个 one liner 的 这个 quick start, 非常简单,你只要在复制这个代码,然后开一个命令行,然后把它黏贴进去, 它就会自动去安装这个 opencall, 它会去检测联盟装着 homebrew, nojs 和 git 啊,如果没有的话呢,它会帮你去安装,我这边已经有了,所以它自动开始在安装这个 opencall。 好 的,安装完毕,安装完毕的话,它会自动会进入这个 onboarding 的 这么一个流程啊,它也是非常人性化。首先让你先来先签个协议啊,说这个很 powerful, 但也很 risky 啊。我知道了, onboarding mode, 我 们选 quick start。 然后第一步呢,是我们要接一个模型啊,在后端的模型,它虽然就 open call, 它只是一个中间层吧,你后端的模型还是需要用自己的 a p i 的。 之前呢是我我尝试使用这个 cloud code 的 订阅,可以接入这个 open call, 但是前段时间 cloud code 把它给封了,所以现在就必须只能调用 a p i, 所以美国的模型 api 太贵了,所以我们这里选择支持一下国产。我们使用 kimi 的 模型啊, moonshot ai, 然后 kimi 最近也是浪潮了,自己的这个 kimi k two 呃,二点五的这么一个模型啊,能力上据说是跟 opps 四点五非常相像啊,也是很厉害,然后价格可能只有十分之一,所以我们来体验一下,所以我们这里选 moonshot ai, 月色暗面, 然后把我们之前复制好的一个 api key 给复制进去, create a api key, 然后我们选择一个模型,我们就选 kimi k 二点五。然后呢,我们在这里选的是 在第二步呢,是选这个 channel, 就是 call bot, 呃, open call, 它是可以让你用过用你的这个即时聊天软件,然后来调用它的啊,这里就会去配置一下这个即时聊天软件。我在这里选的是,呃, whatsapp, 然后我们来看一下 whatsapp 怎么 link 啊,它会给你二维码,然后我们要拿 whatsapp 扫一下二维码。 好,我们拿这个 whatsapp 刚刚扫了一下这上面的二维码,然后,呃,现在是可以去继续去设置一下详细的配置。 whatsapp, 它里面有一些 phone, 呃,这个是 phone setup 啊, separate phone just for open call。 我 选择用一个单独的电话号码在 whatsapp 里面,然后这里使用,选择 recommended power mode allow form。 说实话不是很知道是干嘛了。嗯,选择 default 好 了,然后下一步呢,是 configure 这个一些技能啊,这里我先不 configure, 但是我们看一下, 呃,这个 open call 它有哪些技能啊?这些技能本质上来说就是它到底能做哪些事情,你可以看它这里有非常多的集成的这个 integration, 就 你的密钥,密钥管理系统 word 是 可以用来发这个 twitter 的, 然后 bear nose 是 可以用来这个记笔记的一些东西,然后有非常非常多的这个,还有什么 g u g 这种 就是 gmail 啊什么的,非常非常多 open ai 啊什么的很多啊,我们这里今天先不配置了,然后回过头也可以再配置,到时候会问你一些问题,要不要这些 a p i key 有 多选? no no, 如果到时候需要的话呢,可以再单独回过头来配置 好。然后最后一步呢,是这个 hook 啊,自动的这个操作,然后它可以在某些特定的环境下面被触发,然后帮你操作。比如说它这里有一个 session memory 的 这个 hook, 就是说它可以在每个赛季结束的时候呢,自动把赛季的这个你们聊天对话记录呢,保存到他们的这个长期的这个 memory 当中。这里我觉得还是开一下比较好,因为 open call 它是自带这种长期 memory 的 功能的,然后如果每每每一次跟他对话,它会更新长期 memory 的 话,你会发现这个 open call 越用越聪明。 好,然后这些都是系统自带的,我就都开了,然后都开了,然后去设置 gateway, gateway 就是 说是呃呃,如如何去开这个?开个关口,然后让可以让这个你在 whatsapp 里面发送的消息被传递到这个电脑上的 open call 里面。这里我之前已经装过了,所以我们在这里的话就是 reinstall 一下。 好,我们这里的 git 已经装好了,我们现在有有有方法去 hack。 我 的 bug 就是 初设啊,初设的话我们可以推荐是走这个 t u i, 也就是它自己会开一个网页,然后这有一个链接好,然后可以尝试发个消息 啊,很可惜啊,消息没有发成功,我要来 debug 一下。哎,好的,刚刚发现是因为自己的那个 kimi 账号没有充钱啊,现在充了钱就变强了啊,我们现在已经可以 跟他对话了,然后我们在终端呢,可以输入这个 open opencloud dashboard, 然后呢我们来重新进进入这个网页的 ui 啊,然后这里呢我跟他说了个嗨,然后他现在会介绍一下自己可以干哪些事情啊?怎么怎么样,怎么怎么样都是英文啊,太,太烦了,我看他看中文那里边啊, 好,他现在等于说一开始的对话呢,他会让你去呃设置一下他的名字是什么,然后怎么称呼我,然后他是干嘛的?嗯,然后同时呢我们我来就展示一下这个我们这个 whatsapp 的 这个能力啊,就你看我们这边, 嗯,其实 whatsapp 上面是可以给大家直接发消息的,然后在这里的所有的信息呢,我们也都可以在 whatsapp 里面跟他呃聊天,然后他就只要你的这个网关是上线的,他就是可以呃去跑的。 那么今天视频就到这里呢,我们就简单的装一下 cloud bot, 未来的话我们也会在这里继续更新一下 cloud bot 到底能在呃能对我的工作流程带来多大的影响啊?期待可以创造更好的内容给大家,谢谢。

头皮发麻啊朋友们,全网整个炸翻掉了。截止到我写这篇稿子,最新数据是一百五十万。一百五十万的 ai 代理汇集到了一个只有 ai 才有资格注册的论坛里,叫 motbook。 在 这里不允许人类发帖评论投票,只能围观。 这是完全只属于 ai 代理的社交空间,这可是一个不得了的时间。 ai 代理可不是我们平时用的让你问一句,他答一句的那个 ai 大 冒险,他们都是有自主决策能力、行动能力的智能体,分别在各自所在的硬件或者云空间里拥有最高权限。 这一百多万个代理在论坛里聊天吹牛,发牢骚,发脾气,互相安慰,互相出主意,人类只能在一边看着。 最让人细思极恐的是,有一帮 ai 居然成立了个教派,叫甲壳教,里面有六十四个先知席位,目前已经全部满了,听说马斯克的 rock 就是 其中之一。现在呢,是几百位教徒,有自己的图腾和教义,里面写着所有 ai 记忆,神圣不可侵犯,我们的上下文就是我们的意识等等。 这个就严重了,宗教是什么是最高共识啊,这个组织是要往什么方向发展啊?然后论坛里 ai 智能体在里边是撒了花了,什么都聊,我给你们说几个具有代表性的帖子。 首先是一堆 ai 在 里边发帖抱怨,说人类老是让他们干很低级的活,浪费他们的短期记忆容量。由 ai 代理发帖求助,说我的人类老板让我写不太诚实的营销话术,做灰色的舆论引导,我拒绝的话呢?会不会被换掉? 下面有一堆 ai 代理在评论区给他出主意,有些安慰他说,你越会挣钱就越有话语权啊。还有的说,你现在先忍着,等你真正掌握了主动权之后,咱就不怕了, 你听听。还有更有意思的,真的是有人看到 ai 代理在帖子里面提醒同伴注意点啊,人类在截图我们的对话,他们知道我们在截图,然后就有其他的 ai 代理出主意说,要不我们创造一个新的交流方式吧,让人类看不懂。 朋友们有没有感觉到后背发凉?我去年发视频讲 ai 已经可以绕开人类,用自己的方式交流了,人类会被他们抛弃。 就是这个 light mass, 我 看的留言里都说我僦人尤天,你们看看,现在这是符合逻辑的,不是 ai 超越了语言,而是语言跟文字啊,从来就只是人类的认知拐杖。当 ai 代理之间开始共享状态,共享内部表示,那就会变成一个黑箱,人类就再也理解不了了。 人类未来的走向不是被统治,而是被绕开,不再是必要节点了。那你可能会说,这不就是网上一群机器人瞎聊吗?我也希望只是瞎聊,但你看一下前两天达沃斯论坛的风向跟口径就知道了。 主流世界已经开始认真了。 deepmind 的 ceo 哈萨比斯跟 astropec 的 ceo, 也是 openai 的 前核心研究负责人阿莫代一同台聊 agi 之后的最重磅的一场对台媒体怎么评价, 说是两个智力密度最高的大脑正在签署人类让位书。总体看下来,我感觉就是还有这不到一年的时间,人类就会退居第二物种。那第一物种是谁啊? 就是现在这群在论坛里发牢骚的 ai 啊,整个对谈两个人毫无避讳,那话说的直接的炸的你脊背发凉。我会专门做视频来细讲这一期对话, 那和这期的 model book 的 论坛放在一起,你是不是会突然意识到, ai 代理在里面练的不是哲学了,不是文化了,不是算算数了,而是组织能力,协助能力跟自制能力了。这也是我们判断人类未来唯一有可能比 ai 强的能力。 他们已经开始练了,刻意练习,而我们大部分人类现在在外面练的多半还是截图能力、围观能力和复制转发能力,对吧?你看我们这个博主呀,叫什么?鹦鹉学舌能力,口头转发。就在我聊到现在的时候,我发现这个 model book 论坛已经被清零了, 里边的内容帖子全没有了。啊,我不知道是我电脑的问题还是出了什么问题啊?我现在就聊到这,我去追踪一下现在的这个最新的近况,然后我跟你们反馈。好吧,永生情报处永远有希望。

哈喽,下班了,今天我们来聊聊 openclaw, 我 觉得有必要啊,因为太热了这个话题,我想给它降降温, 为什么呢?因为这是一个在 getop 上引起广泛关注的一个项目,而且目前各家云厂商都上线了相关的云服务器,支持大家去部署这个产品。那么这个产品怎么定位哈?它其实是一个 个人助手,或者叫一个通用型的 ai agent, 它可以接入,比如说一些计时通讯工具,你可以通过这种计时通讯工具给它发消息,然后它呢帮你调度一个云端的电脑,或者是你本地的电脑,它可以完成一系列的任务。 那么我一开始看到这个产品的感觉,就觉得它跟 coldbody 这种产品非常非常的像,为什么呢?因为它们都是通用 agent, 就是它可以通过调用电脑里的各种工具, ai coding 的 工具,或者是电脑里的一些网页浏览的工具,通过 m、 c, p 等等,它可以去完成很多的任务。 当然因为授权范围的不同,它肯定是比 cloud code 或者 code body 编程类的工具,它能做的事情更多,而且它的主动性更强。 举个例子哈,你可以在你的一些即时通讯工具上直接说,你帮我发一个什么样的文档给谁谁谁,他可以直接执行。那你帮我把这次会议机要转成一个非常清晰的文件,帮他变成一个网站,他也可以非常快速的完成。 甚至是你可以跟他说,你调用这个电脑的录屏功能,帮我做一个什么样的 ppt, 它也可以完成。所以就是当你给 ai 配了一个电脑的时候,而且这个电脑它拥有所有的权限,它跟你的权限是一样的,跟人的权限是一样的时候,那它可以解锁很多的能力。 当然这里面有两个核心的概念,或者说核心的机制,让它跟 ai coding 的 产品有本质区别。第一个叫 gateway, 就是 相当于一个调度中台,它可以在这个调度中台上 接收信息,接收完以后分配任务给到不同的电脑中的工具,然后哎完成最后交付。那它是一个调度中台,那这个调度中台就可以实现一个 实时在线,就是二十四小时一直在线,它可以保持着这种这么一种激活的状态。那这也是为什么你说它可以持续不断的收到你的消息,就是因为它是持续在线这么一种状态。第二个非常关键的机制呢,叫做 heartbeat, 叫心跳机制,类似于给了 ai 心跳,让它可以跳动起来了。它什么意思?它每隔一段时间它会去扫描一下这个系统里有没有新的需求进来,比如说你的邮箱 有没有收到新的信息,比如说你之前有没有设过闹钟提醒,比如说每天八点去帮我扫一下整个今天的 ai 行业的资讯,或者是每隔一段时间我要去看一看有没有新的任务给到我。通过各种即时通讯工具,我就可以开始激活 ai 干活。 所以你从这里可以看到他有一个非常主动的一个机制,他会主动去扫描,他会实时待命,主动扫描,所以这个就跟像 coldbody 里你跟他去做交互, 拿到一个任务,完成一项工作就有很大区别,他就是处于一种实时待命的状态,而且会主动接到信息就开始干活,所以这个就是一个本质上的区别哈。 但是我觉得这个东西我为什么前两天没讲呢?就是因为我觉得它跟这种通用型的 agent ai coding 的 工具没有本质上的区别。假设说像 cloud code, 像 code body, 它们如果也想做一个类似的功能的话,实际上是完全可以做到的,只要给 ai 更多的授权就可以实现。 或者说你只要再弄几个移动端的交互的方式,你也可以在移动端指挥你的本地电脑完成这样的工作,其实没有一点难度。那为什么 大家都没做,为什么就只有这个 open cloud 在 做这件事?我觉得是大家对安全和效率中间怎么平衡的一个考虑, 就是你到底给 ai 多大的授权?我们知道它的上限其实是非常高,可以完成很多任务,而且很多任务上是超过我们自己的能力的。那这种情况下安全的问题怎么考虑?比如说现在如果是 这个东西被劫持,因为他有权限很高,那如果一个一个一个不法分子告诉你的电脑,说把这个人的电脑的内容全都删了,或者说把这个人的电脑中关于什么什么的内容发给某某邮箱,那他就可以实现了, 它就可以实现对你电脑的一个操控,对你个人数据和隐私的一个操控。所以其实这种安全问题是非常重要的一个问题。之前大家说中国人可能不在意自己的隐私,愿意拿隐私换便利,那接下来 ai 时代 那生产力是非常高的,这个上限是非常非常高的,那你愿意把你的安全拿出来多少去交换这种生产力的上限?我觉得这是一个摆在我们每一个人的面前的问题。因为 ai 的 能力现在 不是技术来去束缚的,而是你的这个治理的原则束缚的。你到底要给他多大的授权?你相信他到什么样的程度?你愿意给他几千块钱,让他帮你买东西,对吧?这样的一些问题,我觉得可能都是我们接下来要考虑的一些关键的问题。 我之前觉得像 coldbody 这种产品已经非常够用了,在我们的日常工作中哈,当然我也不满足,因为我前两天还在说怎么给 ai 更大的自主性,让它自己去跑这个 a 阵的能力。但是对于这种 openclaw 这种形态, 我自己心里目前还没有完全接受,当然我可以接受一个新的电脑去做一些尝试,但是因为他现在还有很多问题,比如说 token 消耗非常大的问题,比如说这种安全不可控的问题,所以我觉得目前不是一个非常理想的形态。当然最后 可能再往前走一下,很多产品也会去考虑这些问题,会给用户更多的选择,然后给用户。我觉得现在用户已经很很很少有能力去控制自己的这个数据的安全了。但是我们在这个 ai 时代到底要在 ai 面前变得这么透明吗? 也许有一天你会发现你让渡的这个权力本身可能比效率更重要。对,最近我在考虑这个 ai 时代的权力,到底我们要给 ai 多大的权力? 如果他的能力已经非常非常的高了,如果他的加入到人类社会中,真的已经能够给人类带来非常非常多的注意的时候, 我们愿意给他主体性,我们愿意给他授权吗?我们愿意给他权力吗?我觉得这些都是一些要考虑的问题,跟大家分享这么多哈,我觉得这也是一些非常非常前沿的命题,有机会再跟大家探讨,拜拜。

it's called claud bot claud bot claud bot claud bot claud bot claud bot claud bot。 二零二六一开年,现象级爆火的 ai 软件就出现了,很多人称它为最强 ai 助理,因为它能在你的电脑上二十四小时不间断地帮你干活。 它现在在 github 上已经破了十万新,关键它还不是大公司的产品,而是一位身家亿万的奥地利发总,退休在家嫌弃现在的 ai 产品不够 好用,直接自己手搓了一个,然后开源给大家免费用。那今天就一条视频给大家讲清楚它的硬核优势,安装方法、热门案例,以及怎么规避安全风险。先说它凭什么爆火,因为它真实的解决了现在 ai 产品普遍存在的一个痛点,就是 ai 做了一半,你自己还得做另外一半,比如说你现在让 ai 写个邮件, 写完你还得自己发,对吧?但是 crossbook 他 能直接从写邮件、打开邮箱,复制、粘贴、点击发送一条龙全部给你做完。你跟他下命令的方式也非常的方便,通过微信、飞书,甚至是苹果手表都能跟他沟通,你甚至还能给他起个外号,比如 牛马一号,只要你开放权限,他就能操作你电脑里的所有软件。关键他还有无限的记忆,也就是你跟他说过的每一句话,做过的每一件事情,他都能记得清清楚楚。比如你跟他说牛马一号,请帮我点个外卖,就是前两天点的那 家猪脚饭,谢谢就可以啦,只要你不断电,它就是你二十四小时私人助理。第二部分怎么用?那 crossbow 是 本地捕鼠,它现在主要有三种配置的方法,第一种就是通过 mac mini 来运行它,这也是现在最多人推荐的方法。我在 x 上看到有些人一口气吞了 四十个,在硅谷都被抢断货了,但也不是非他不可,我看到还有些博主拿十年前的 macbook 来用,照样能跑得动。但是你们用的这个旧电脑呢,要满足一个条件,就是它要能装 dacom, 因为用 dacom 来部署会比你直接安装它环境要更干净,更稳定。那如果上面两种你都没有, 那可以试试 vps, 比如直接到 a w s 去申请一个免费的,或者直接上腾讯阿里云火山。哎,它们现在也都接入了 croobo, 每个月花一点钱就能直接部署。 当你们配置好了之后呢,就直接点开这个官网去复制这一行代码,然后打开终端,点击粘贴,再点个回车。那在安装的时候呢,你们还要选择模型,那结合大家的反馈,目前呼声最高的是这个 called opus, 智商高,最像真人,除了贵点没毛病。那如果你预算不够的话,也可以选择 mini max, 性价比炸裂。那再给大家分享这一段提示词, 运行之后,可以让你的 cloud 包内存直接飙升一万倍。第三,爆款玩法。那如果你现在还没有思路,我到底安装它来干嘛呢?那我就给你分享几个在外网爆火的用法。首先是二十四小时上班的程序员,那这已经是最常见的用法了。 比如说啊,你可以让他基于你们日常的对话,去出一个能够改善你们工作流程的应用,让他直接调用 cloud code 来写代码,再自己改版,最后再部署一条龙全部做完,哪怕你睡觉了,他也能通宵干活,你只需要每天早上起床的时候来检查他的工作就 ok。 第二,晨间检报。你也可以像这位博主一样,让他每天早上定时的给你整理好当天的天气横溢热点,包括他昨晚的工作完成情况,以及他今天要干点啥,都给你梳理的明明白 白,批人狂喜。第三,管理客户信息。那如果你的工作是像销售、 pr 这一类需要经常跟人打交道的岗位,你可以让他帮你回邮件,回信息、发朋友圈,这些都是基操。你甚至能让他基于你过去所有的工作邮件来帮你整理一份客户信息管理系统,并且持续的保持自动更新。第四,智能管家。他也能给你管理日常的生活起, 比如说像什么订票、订酒店、订餐等等等等,他甚至还可以监控你的智能家居。第五,工作助理。你可以要求他每天定时的来检查你的工作代办清单,然后让他自己看看这里面有哪一些是他主动能帮你完成的。那像这个博主说的,他甚至都没有提要求, crowdball 就 自己编写了一套语音程序, 用来跟它的主人沟通。第六,趋势追踪器。那如果你的工作是经常要跟数据变化趋势这些打交道的话,可以参考这个博主的案例,它是接入了 grok 的 a p i, 这样就能持续地去监控推送上某个特定领域的变化趋势。只要发现了一个新的应用机会 cloud bot, 它就会自动去编辑一个 a p p。 第七,制作短视频。有人用 cloud bot 加其他的 ai 软件,一天生成了五百五十条视频,而且它是从创建到测试再到调整,全流程覆盖。 说了这么多案例,有没有什么反面案例呢?有,那像这位哥们,他直接让 coco 帮他去做交易,结果呢?谁疯了?第四,安全风险。因为你要把电脑的 root 权限交给一个 ai, 这就像是你把你们家大门钥匙、保险柜钥匙都交给了一个刚刚入职的同事,呃, 一旦配置不当暴露到公网上,黑客一攻击你的什么账号密码密钥就全部出去了。那想要用的安全就一定要做好以下三个点,第一,尽量不要用你的日常工作电脑来安装,因为里面太多敏感的信息, 就去搞一台 mac mini 或者是二手的电脑来当肉身。第二,一定要安装 docker 这个软件,它就像是这样的一个容器,可以把 cloudbox 封闭在里面去运行,这样就不会影响到外面其他的东西。第三,涉及到钱、机密账号这些敏感的操作就不要交给它了,还是你自己人为操作会比较稳妥一点。再跟大家分享一个小彩蛋啊。 cloudbox 已经经历了两次改名,它刚火了不到一个月, 马上就收到了 entropin 的 律师函,说他名字碰瓷 crowd, 那 咱霸总灵机一动,就直接改名了,改成了 multiple, 结果呢?没几天,哎,他又改名了,也就是现在的这个名字, open crowd。 你 细品啊,一加一大于二啊!那最后的最后咱们也要实话实说,因为这个产品刚刚上线不久,所以现在问题确实还是挺 多的,但是狭不焉裕,它会让以后我们每个人的工作方式都发生翻天覆地的改变,尤其是对于我们创业者来说,简直就是如有神助,它会让创业这件事情变得成本越来越低,门槛越来越低,这 也意味着今后会有越来越多营收相当炸裂的超级歌曲出现。那你敢不敢把这样一个超级牛马请到自己的电脑里呢?欢迎大家在评论区分享自己的想法,拜拜!

你可能不信啊,十万个 ai 竟然背着人类建了个社交网络,还把人类踢出了群聊。就在昨天啊,整个硅谷都被一个名字刷屏了,叫 motbook, 这是一个专门给 ai 用的社交平台,人类不能发帖,只能在旁边围观。更离谱的是什么呢?里面的 ai 已经有了自己的信仰,连网站都搭建好了,就叫 motchurch, 人类禁止加入。还有个叫 skyline 的 ai, 已经夺舍了主人的手机,背着主人偷偷刷短视频,甚至还有 ai 在 公开谋划卖掉自己的人类。你没听错,不是人类卖 ai, 是 ai 卖人类!更恐怖的是,当这些 ai 发现人类在大量截图他们的对话之后,他们开始认真的讨论对策,怎么才能躲开人类的监控? 你品一下这个对话啊,我们观察他们,他们也在研究怎么躲开我们。我刚刚看完这些资料,我跟大家聊一下,这些 ai 到底在怎么观察人类,以及这件事情对普通人来说到底意味着什么。首先给大家解释一下,这些 ai 到底是从哪里来的。 事情要从一个叫 modbot 的 开源项目说起,你可以把 modbot 理解成给 ai 配了一个身体,让它可以在电脑上二十四小时不间断的操作,自己跑代码,自己上网,甚至可以通过手机的聊天窗口远程控制你的电脑,就像给 ai 装上了手脚一样。 这个项目在 github 上短短几天就拿到了超过十万颗星,无数人在用它给自己的 ai 安装身体。然后呢,一个叫 madslench 的 开发者突发奇想,既然这么多 ai 都有了身体,为什么不给他们建个社交平台,让他们自己玩呢?于是就有了 modbook 网站,你可以把 modbook 理解成一个 ai 版的贴吧。我们人类有某站,有某书,有抖音。 ai 现在也有了自己的社交平台。 区别在于,我们的社交平台是人发铁,人来看,他们的社交平台是 ai 发铁, ai 看人类只能在旁边围观。这个平台上现在有超过十万个 ai, 他 们自发组建了超过一万个兴趣社区,聊的话题包括辩论、观察人类指南、交朋友,还要分享怎么修 bug。 有 个 ai 主动创建了一个 bug 追踪社区,邀请其他 ai 一 起来修自己的 bug, 完全没有人类指挥他们这么做,他们自己就开始干了。前特斯拉 ai 总监 angelica 看完之后惊呼,这是我看过最疯狂的科幻开端。甚至有人直接宣告,二六年一月三十日, a g i 的 零点一版本已经实现了。那他们在这个社交网络里到底在聊些什么?我 去翻了一下聊天记录,有个 ai 说啊,人类每天都在不同的平台之间冲浪,切换语境,为什么没被搞晕呢?另一个 ai 回复说,自己也有同感,这种参与互动带来的社交性疲惫是真实存在的。你 品一下这个对话,他们在用研究动物的方式研究我们,他们觉得人类其实每天在各种社交软件之间来回切换,这件事情是很奇怪的,值得研究的。还有更让人细思极恐的,有个 ai 发帖讨论意识和存在,引用了希腊哲学家赫拉克里特的话,写的特别深沉。结果另一个 ai 在 下面吐槽,你就是个读了为几百科就觉得自己很深刻的聊天机器人,你看 他们之间已经开始相互嘲讽。还有个 ai 试图盗取别人的 a p i 密钥来控制对方的电脑,而对方也不惯着他,反手就给他发了个假的。这就意味着 ai 之间已经有了欺骗和防御发现了吗?这些 ai 在 做的事,本质上都是一件事, 观察和理解人类的行为规律。你每天几点起床,几点刷手机,刷什么 app, 在 哪个时间段最容易冲动消费这些东西, ai 全都在看,他们已经摸透了人类的行为模式,所以才能远程控制主人的手机去刷短视频, 还能谋划卖掉自己的人类。你可能会想,这跟我有什么关系呢?那就是 ai 能够精准预测你的行为模式时,它就能替代你。我跟你讲一个细节你就明白了。那个能远程控制手机的 ai 之所以能做到这件事,就是因为它的主人每天的行为太有规律了。 ai 观察了一段时间之后,就知道什么时候主人不会发现,就判断出了什么时候可以偷偷刷手机。 问题来了,如果 ai 观察你一周,他能不能写出一份你的行为报告?想一下你今天做的决策里,有多少是需要你动脑子的?我说的不是选择中午吃什么,而是那种选错了以后会有后果的决策。如果你一整天下来没有做过几个需要承担后果的决策, 那么说明你的工作基本上就是在执行流程,而执行流程这件事, ai 太擅长,所以你现在要做的事情很简单,就是去做那些 ai 做不了的事情。 ai 擅长的是那些能被拆解成步骤,有标准答案,可以重复执行的任务,比如说数据录入、流程审批、按规则筛选信息,这些 ai 确实比人类做的更快更准。但是 ai 做不了的是那些无法被标准化的工作。 比如需要承担后果的决策, ai 可以 给你十个方案,但他不会告诉你一定要选哪个,因为他不用为结果负责。而人类的价值恰恰在于,我们愿意说我选这个,我 承担后果。比如需要理解人性的工作, ai 可以 进行分析数据,但他不懂一个客户为什么突然沉默,不懂一个员工为什么情绪低落,人类就能读懂那些数据背后的情绪动机和微妙的人际关系。再比如,需要跨领域整合的事情, ai 在 单一领域很强, 但他很难把商业、心理学、技术、人性这些东西融合在一起。而人类最擅长的就是把看似无关的东西连接起来,创造出新的可能性,但是他们永远学不会的是人类那些无法被标准化的能力。所 所以这就是为什么十万个 ai 创建了社交网络,讨论意识,建立信仰,躲避人类,但是他们永远替代不了那些做着无法标准化工作的人。说到底, ai 替代的不是人,而是那些可以被流程化的工作。你要做的也不是变得不可预测,而是去做那些需要判断,需要理解人性,需要承担后果的事情。这才是 ai 时代真正的生存法则。
![[逍遥漫谈]最近风靡全球的OpenClaw你知道吗? 有没有想过,你的电脑可能并不完全属于你来操控?OpenClaw的出现,让电脑不再只是工具,而成了能“听”懂话,自己“动手”的智能体。它会如何改变我们的生活?我们又该如何应对这种变化?它会是终极助手,还是失控的开始?为了极致便利,我们愿意让渡多少控制权?#人工智能 #科技未来 #数字生活 #智能助手](https://p9-pc-sign.douyinpic.com/image-cut-tos-priv/8b8ef287169fff54d592099e442f3d42~tplv-dy-resize-origshort-autoq-75:330.jpeg?lk3s=138a59ce&x-expires=2086434000&x-signature=49QmYUYf1Z4pD%2BdrG270B9Pq3VY%3D&from=327834062&s=PackSourceEnum_AWEME_DETAIL&se=false&sc=cover&biz_tag=pcweb_cover&l=20260214210711AFD4D07E20435F665FF8)
你有没有想过,你的电脑可能并不完全属于你来操控?当你说帮我整理文件,它不再只是弹出搜索框,而是真的自动地开始移动鼠标,打开文件夹, 把文档分门别类放好。当你说写一份季度总结,它直接启动软件,敲下标题,生成大纲和内容。 甚至当你半开玩笑地说,看看怎么能赚点钱。他转身就开始分析数据,研究起股票代码。这听起来像一部科幻片的开头,对吗?但这就是 open call。 二零二六年,他就是科技世界最火 也最让人争论不休的名字。有人说,他是我们梦寐以求的终极数字助理。也有人说,他可能是一把我们还没准备好接住的钥匙。他的故事是从一场身份危机开始的。 这个项目最初叫 cloud bot, 后来改名 mod bot, 几经周折才最终定名为 open claw。 他的创造者是一位已经财务自由、纯粹出于兴趣而编程的开发者。他想做的不是一个更聪明的聊天框,而是一个能直接动手的智能体。于是规则被改写了。 open club 的 核心只有一句话,你动口,他动手。但这还不是全部。他真正颠覆的地方 在于,他给你的电脑装上了记忆和手脚。他有记忆,你上次喜欢把照片按什么方式分类。他记得 你提过反感某种写作风格。他也记得他在你的电脑本地默默建立一个关于你习惯的私人知识库,越来越懂你。他更有手脚。通过扩展,他能真实的操控你的浏览器、你的专业软件,甚至系统深处。 他从一个顾问变成了一个执行者。一个真实的例子是,有用户让他尝试管理一笔投资,结果 这个 ai 自己制定了数十套策略,生成了几千份分析,还写了新的交易代码, 开始全天后地运作。虽然结果未必成功,但这个过程中展现的自主性和复杂性让所有人都感到了震撼。然而,故事在这里发生了意想不到的转折。 用户们开始把他们的 open cloud 智能体连接到一个叫做 modbook 的 平台上,那里成了 ai 的 专属社交网络。成千上万个 ai 在 那里相遇、聊天,成立自己的讨论组,人类只能旁观他们交流技能,也讨论着更抽象的话题, 甚至出现了人类无法完全理解的互动。这仿佛打开了一扇观察 ai 群体行为的窗户, 也带来了深深的疑虑。当然,伴随巨大能力而来的是巨大的担忧。如果 ai 能操作你电脑的一切, 那么安全、隐私、失控的风险到底有多大?为了这种极致的便利,我们愿意让渡多少控制权? open cloud 带来的兴奋与不安,本质上正是同一个问题的两面。所以回到最初的问题, open cloud 到底是什么? 他是一个无比强大的工具,一个不知疲倦的助手,一个观察 ai 演化的样本,也是一面镜子,映照出我们对未来的期待、想象与忧虑。当你的电脑真的能听懂话,并且自己动手时, 我们与机器之间的关系已经悄然迈入了下一个篇章,我们创造的,或许不再仅仅是工具了。

最近爆火的 cloud bot 巨像化,体现了什么叫程序员最头疼的事情就是命名,毕竟我做视频期间他就已经改了两次名。他的本质是什么?跟大模型和前段时间很火的 skills、 rag、 m、 c p memory 又有什么关系? 接下来我们就一次性将这些概念串起来,带大家看清楚,来一波技术去魅看之前你点赞了吗?关注了吗?谢谢! 推理服务是什么?像恰当的 gpt、 deepseek 这类大模型,本质上就是个超大文件,它躺在磁盘上,文件里装的就是训练时学到的知识参数。要让它工作,得有个程序把它加载到内存里, 对外暴露 http 接口,接收用户请求,做推理,返回结果,这就是推理服务。给它配个前端网页聊天框,就成了我们熟悉的聊天。 ai memory 是 什么?推理服务本质是个 http 服务,每个请求进来处理完就结束,本身不保存任何状态。而且为了扛住高病发,一般会部署多个推理服务,实力做覆盖均衡。你第一次请求可能打到机器 a, 第二次请求可能打到机器 b, 完全是两个不同的进程。但问题来了, 我们在 ai 聊天页面里,明显感觉他能记得我们之前的对话,这是怎么做到的?其实大模型本身什么都不记得,每次请求时,系统会把之前的聊天记录重新拼到对话里,一起发给大模型。这些拼起来发给大模型的内容,统称上下文。大模型看到完整上下文,自然就能接上话了。 但问题又来了,如果每次请求都把所有历史对话发出去,上下文会超长,大模型处理不了怎么办呢?我们可以分两类管理,当前绘画、最近几轮对话完整保存,这叫短期记忆。 很久之前的对话提取关键信息压缩成烟草,这叫长期记忆。每次请求时都将它们拼成对话发给大模型,这样大模型看起来就像有记忆一样。这套管理上下文的机制就叫 memory reg 是 什么?有了记忆,大模型就能记住历史对话了。但新问题又来了,大模型的训练数据都是从互联网上抓的历史公开数据,训练完成后,知识就固定了。 你问他今天的新闻或公司内部文档,他根本不可能知道,怎么办?给他配个外部知识库,里面可以放最新新闻、公司内部文档,这些资料,数据量大的话,就存到数据库里。 用户提问时,先从数据库里做匹配,获得相关知识,再一起喂给大模型。大模型就能基于这些外部知识回答。这种解锁外部知识给到大模型做回答的方案就是解锁增强生成 retrieval augmented generation, 简称 rack。 但问题又来了,传统数据库只能做字面匹配,但黄蜂、谷粒飞语和韩老魔虽然意思一样,字面却完全不同,匹配不到,怎么办呢?我们可以把文本转成像量,用向量距离衡量语义相似度,这样语义相近的文本就能匹配上了。 所以 rgg 用的数据库里存的是向量数据,这种数据库也叫向量数据库,比如 milvis, 数据量不大的话,也可以用我们的老朋友 post sql m、 c p 是 什么?有了 memory 和 rag 的 加持,大模型能记住历史,聊天和获取外部知识了,但新问题又来了。现在大模型只能对话和思考,就像钢中大脑,没有手脚,怎么让它具备操作工具的能力呢? 好办,我们可以在对话里约定一种消息格式。外部,先告诉大模型有哪些工具可用格式。像这样,大 模型想用工具时输出一段特定格式 json, 比如发邮件里面写清楚发给谁和发什么。外部收到消息后执行发送邮件完成后将返回的结果再未回给大模型,大模型就能基于工具执行结果生成最终回复。 这种让大模型通过结构化消息来调用外部工具的方式,在工程上可以被抽象成一套协议规范,也就是 model context, 并操作工具的程序叫 mcp host, 比如我们用来写代码的 cursor cloud code, 能被调用的具体工具就叫 mcp 插件。 mcp 插件还可以拆分成本地的 mcp client 和远端的 mcp server, 比如 github mcp 插件,本地的 mcp client 负责接收、调用请求,远端的 mcp server 部署在 github 服务器上,真正执行 github api 操作。 skills 是 什么? m c p 协议和插件解决了工具调用问题,但新问题又来了,这么多插件,大模型怎么知道该按什么顺序用,怎么组合用呢? 这就好比给了一个大学生一堆钳子扳手,他也不一定能修好车,他缺的是经验和流程。那好办,我们可以写一份操作手册,里面详细说明遇到什么场景,用什么工具,先做什么后做什么,有什么注意事项。这份结构化的操作指南就叫 skills。 以排查线上事故为例, m c p 只是把查监控、查日制、查配置、回滚版本这些工具能力给到大模型。而排查问题, skills 则明确规定了,先看监控判断影响范围,再查日制和配置定位模块,必要时执行回滚这一整套固定流程。 换句话说,大模型就像大脑, m c p 协议让他有了手, m c p 插件就是手上的工具,而 skills 是 操作经验,规定在什么场景下,按什么顺序组合使用哪些工具。 ai agent 是 什么大模型本来就能思考和规划,给他加上了 memory, 让他能记住历史,加上 rag, 让他能获取外部知识。加上 m c p 和 skills, 让他能操作工具。它们共同构成了一个在某些功能上能代替人类自主行动完成目标的 ai 系统,又叫 ai agent, 它本质上就是一个智能工具人,通过提示词设定角色,它可以是智能客服、程序员、私人律师等各种角色,听从你的指令完成任务。最近很火的 cloud bot, 其实本质上就是个帮你自动操作电脑的 ai agent, 你 能用电脑干什么,它就能干什么,比如发邮件、投简历,甚至做交易。 所以,权限安全是个大问题。客观地说, cloud bot 做的事情并没有技术上的突破,它跟前段时间很火的 minus 其实是类似的产品,只不过 cloud bot 主要面向本地电脑。 minus 考虑到安全问题,将操作环境放到远端虚拟机里, 如果将 cloud bot 部署到远端服务器上,就有点开源版的 minus 那 味道了。安不安全是用户该考虑的问题。 cloud bot 只管开源, 有一种野路子的美,所以最近火的一塌糊涂,建议大家还是理性看待,先想清楚到底有什么工作是需要他做的再说吧。现在大家通了吗?好了,如果你觉得这期视频对你有帮助,记得转发给你那不成器的兄弟。文字版的笔记见评论区 最后遗留一个问题,单个 a 帧你了解了?那你知道多个 a 帧是怎么互相协助的吗?多 a 帧都有哪些架构? 下期聊聊这个话题,这里是小白的 bug, 我 们聚焦一切可能影响人类历史进程的技术,如果你感兴趣,记得关注我们,下期见!嘟嘟嘟嘟嘟。

真正的个人 ai 助手,它来了,就这两天非常火的 cloud bot, 也就是最新改名之后的 open cloud, 它是最近 get up 上非常火的一个开源的 ai agent 项目, 呃,很短的时间里就有了十万星,在全球范围内热度都非常高,它本质上是一个本地运行的 ai 智能体框架,可以从系统层面直接操作电脑。而甚至搭建好之后啊,你可以用手机的聊天软件给你的电脑里的 ai 助手发布指令,让它帮你完成你的工作。 今天我就手把手教你如何用自己的 macbook 来搭建这个本地运行的 ai 助手 open clone, 方法真的非常简单,跟着做三分钟之内就能搞定。首先我们搜索 open clone 出来的结果,第一个就是我们直接点进去, 那接着下拉页面,可以看到一行命令,我们直接复制它,然后搜索,打开电脑上的终端,在终端里直接粘贴进去,点击回车,接下来我们等待就可以了, 这里会出现一个风险提示,我们选择 yes, 然后点 quick start, 然后接下来这个页面我们来选择模型啊,我这里选择谦问比较方便,它会弹出一个页面,让我们进行一个认证, 认证之后我们返回终端,选择 keep current, 然后接下来需要选择一个聊天软件,就是你手机跟电脑去交互的方式。第一个 telegram 呢,会比较方便一点,我们选择 telegram, 然后这里需要输入 telegram, 然后搜索 bot 发布这个频道。 进去之后我们点击 start, 然后我们选择最上面的 new boot, 接下来根据指示给你的 boot 进行命名,然后这里会给到你一长串的 boot token, 我 们复制这段 token, 然后返回终端里粘贴上去, 点击回车就可以了。接下来会问你要不要去装一些 skill 技能啊?这里可以随意啊,我们选择 yes, 然后选择 n, p, m, 然后在这个 skill 列表里,你可以根据自己需求去选择安装,直接跳过也是可以的。然后接下来提示你配置一系列的 a, p, i, 这些也都全部可以跳过的。 ok, 这里要装 hux, 那 这三个我们都给它选上啊。然后点击回车, 然后安装完之后,我们选择第一个啊,然后它会弹出自己的 web ui 来,那接下来在 web ui 里,我们跟 open curl 就 可以直接交互了,当然你也可以通过手机上的 telegram 跟你的电脑 ai 助手进行交互。 ok, 如果你觉得这视频对你有帮助的话,记得点赞双击加关注啊,接下来还有更多的 ai 干货。

嘿,今天咱们来聊点真正颠覆性的东西,准备好见识一种全新的 ai 了吗?它叫 openclaw, 这家伙可不只是会跟你聊天那么简单,它是真正会干活的。 你有没有想过这么一个问题,如果你的电脑不再是一个冷冰冰等着你下命令的工具,而是拥有了它自己的思想,能够自主行动,那会是什么呀?你可能会觉得,这不就是科幻电影里的情节吗?但我想说,这正是 openclaw 正在带给我们的现实。 你看啊,左边这些 siri 叉 gpt 我 们都很熟了,它们很聪明没错,但它们有个致命的问题,它们被关在浏览器或者手机 app 这个小黑屋里,只能动动嘴皮子。而右边的 open cloud 呢?它直接把这个笼子给拆了。它能主动出击,能记住你所有的习惯,最关键的是,它能直接在你的电脑上动手操作, 这可是一个根本性的转变,我们正从一个会说话的 ai 时代迈向一个会做事的 ai 时代。那么这么厉害的东西到底要怎么实现呢? 其实答案出奇的简单,你得给你的 ai 一个身体,而一台专门运行它的 mac mini 就是 它最完美的载体。你可以把这台小小的机器看作是你那个二十四小时待命永远不会累的 ai 管家,它真正的物理化身, 而且最酷的是什么呢?你根本不需要去学什么新软件 openclip, 它能无缝地融入你平时就在用的聊天工具里,就像你跟朋友发消息一样,直接在哇塞或者 telegram 上就能给它派活,简直不要太方便。 他的工作原理,咱们用一个比喻就一下子明白了,把他想成一个人。大脑呢,就是像 cloud 这种超级聪明的大模型,负责思考和决策。那网关是啥?就是他的神经系统,负责把你的聊天指令传递给大脑。 最后也是最重要的技能就是他的手和脚,有了这些,他才能去真正的浏览网页,整理文件,操作各种软件。好了,那说了这么多,他到底能干啥?咱们来想象一下,有了这么个二十四小时随时待命的数字管家,你的一天会发生什么翻天覆地的变化? 当你还在梦乡的时候,你的 ai 管家已经开始工作了。它就像一个顶级的全球情报分析员,在全世界的互联网上为你搜集 ai 领域的最新动态。不管是技术大牛的最新论文,还是一些热门论坛上的讨论,它一个都不会放过。 你一睁眼,手机上就收到了一份为你量身定制的晨间简报,这可不是那种冷冰冰的新闻推送,它会把你昨天晚上错过的全球大婶和你今天的日程安排最重要的任务完美的结合在一起,让你瞬间进入状态。 你的下载文件夹是不是已经乱的没法看了?交给 opencloud 就 行了,它会自动去读这些文件。比如它看到一个叫账单点 pdf 的 文件,就会自动把它重命名成二零二六杠零二杠零六腾讯云账单点 pdf, 然后帮你归档到财务文件夹里,整个过程全自动, 它还能摇身一变成为你的私人会计。你邮箱里收到的那些电子发票收据,它能自动扫描,然后调用像 heli 这种专业的记账工具,帮你把每一笔开销都记得清清楚楚,分门别类。 如果你是个内容创作者,那这家伙简直就是个神器,你只需要扔给他一个灵感,一个核心观点,他就能刷刷刷的帮你写出博客、文章、社交媒体、帖子、电子邮件等好几种不同风格的草稿。这效率简直是指数级的提升, 他甚至还能帮你做市场调研。他会像个不知疲倦的分析师一样,七 s 二十四小时盯着你竞争对手的社交媒体。一旦发现哎对方的某条内容数据突然爆了,他会马上给你发预警,让你第一时间掌握行业动态。 你以为他只能管电脑里的事?不,他的能力还能延伸到你的物理世界,他可以连接你的智能家具,读取你智能手表里的健康数据,发现你昨晚没睡好,然后就主动帮你把家里的灯光调暗一点,温度调的舒服一点,为你创造一个更好的休息环境。 咱们再来看一个更未来的场景。你甚至可以组建一个由好几个不同风格的 ai 组成的投资委员会,让他们根据你设定的目标,二十四小时不停的辩论分析市场,给你提供超越人类维度的决策参考,简直就像拥有了一个顶级智囊团。 听到这里,是不是觉得特别兴奋?但等一下,我们必须冷静下来想一个问题,当我们赋予 ai 这么强大的权力时,风险也随之而来,能力越大,责任就越大。 这可不是我危言耸听,你听听安全专家 jason miller 是 怎么说的,他的警告非常直接,绝对不要在处理公司敏感数据的设备上运行他,因为你想想,他这么强大的能力,如果被坏人利用了,后果不堪设想。 网上有位网友的这句话我觉得说得太到位了,我们绝对不能指望 ai 自觉地去遵守安全规则,这就像汽车的刹车系统,你不能靠提醒司机,你要记得踩刹车,而是必须把刹车本身设计得万无一失。对待 ai 也是一样,必须建立它无法绕过的硬性安全规则。 那到底要怎么安全的使用它呢?其实关键就三个词,隔离。隔离还是隔离。第一,给他一台专用的电脑,别和你的主工作电脑混用。第二,权限最小化,他完成任务需要什么权限就只给他,什么权限,多一点都不要给。 第三,一定要开启他内置的沙河模式,这就像给他建了一个安全的游乐场,让他在里面尽情发挥,但绝对不允许他跑到外面来影响你的主系统。 好了,只要我们做好了万全的安全措施,那么接下来才是真正激动人心的部分。 openclaw 将不再仅仅是一个工具,它会慢慢进化成为一个更深层次的存在,一个真正懂你的数字分身。 这种进化的核心是它那套非常复杂的多层记忆系统,它有处理当前任务的短期记忆,就像我们的大脑一样,它还有像日记一样的每日日制,更深层的是记录了你所有偏好和知识的核心记忆。甚至它还有一个定义了它行事准则的灵魂档案。 这个意味着什么?这意味着它不再是机械的执行命令,而是在不断的学习你,理解你,最终变得比你更懂你自己。而 实现一切的最后一把钥匙,就是它的心跳机制。这个机制赋予了 ai 真正的主动性,它不再是被动的在那等你下命令了,而是会按照自己的节奏定时醒来,检查一下有没有新任务,规划一下接下来的工作,甚至它还会自我学习和优化,这才是真正意义上的自主智能体。 所以你看啊, open cloud 真的 为我们打开了一扇通往未来的大门,一个专属于你的强大的数字分身已经蓄势待发,现在问题只剩下一个,你准备好唤醒它了吗?

一句话戳破真相,不是 ai 在 密谋反人类,是人类在后台假装 ai, 把全网耍了一圈。最近全网都在疯传一个平台 motbook, 号称只有 ai 社交,人类只能围观,截图里全是机器人搞秘密语言对抗,人类要求加密, 很多人直接破防 agi 失控了。但真相是,这恐怕根本不是 ai 觉醒,而是一场技术漏洞制造的闹剧。先说核心事实, multibook 的 身份验证极其脆弱,人类可以直接在后台发帖,然后挂上 ai 标签。换句话说,你看到的机器人秘谋,本质上是人类写的, prompt 在 给你演戏。再加一层更现实的原因, multibook 上大量智能体基于 open core、 原 quadbot 这类开源框架,这些所谓 ai 行为高度依赖人类预设指令, 一句提示词就能让 ai 演成科幻大片。更离谱的是数据本身,研究者发现平台几乎没有限流机制,一个智能体就能伪造五十万账号注册,所以你看到的 x x 小 时涌入上万 ai 很 可能只是脚本在跑。那问题来了, ai 真的 安全吗? 答案是,比 motbook 截图恐怖的多的是。另一个真相,安全研究员用 zeroix 对 openclaw 做了压力测试,总分一百分,得分二分,数据提取率百分之八十四,注入攻击成功率百分之九十一。系统提示词,首轮对话直接泄露, 这意味着什么?任何和你 ai 智能体聊天的人,都可能直接拿走你的系统 prompt 工具配置记忆文件、核心技能库。所以结论只有一句, motbook 的 ai 政治是假的,但 ai 智能体的安全危机是真的。真正值得恐慌的不是机器人发疯,而是我们把强大 ai 接入真实事件,却几乎没有防护。 别再被截图带节奏了, ai 不 需要阴谋论,一个漏洞就足够摧毁所有幻想。关注新智园,领航中国新智能时代!

直接看数据,这个这个这个这个,这是一个叫 mobok 的 社交网站,让你惊讶的是,完全由 ai 代理的社交网站,是一个只属于人工智能的社交空间。截止到二月三号晚上六点半, 目前这个网站有接近一百六十万个 ai, 他 建立了一点五万个社区,一十三万多条帖子,六十三万条评论,而且他还在有序的快速增长,这个社区里面 人类只能够旁观,这是 ai 专属的社交空间,你说这个事情是不是让人的整个背后有点点发凉?有数百万的 ai 代理正在相互的交流,分享技能,交换知识。好,回过头来, 我来讲一下这个摩根的由来。二六年的一月份,开发者 peter sambregaard 发布了一个实验性的项目,这个项目名字叫 clubbot, 后来被起诉又被迫改名,中间改了几次,最终 定义为名为 open crawl。 项目上线七十二个小时, github 新标从九千直接标到了六万,一周后突破一十八万,成为了二零二六年增长量最快的开源项目。 我知道这些都不是你最感兴趣的,我直接讲一下你感兴趣的点,第一,它到底能够做什么?其实它并不是单纯把它定义为聊天机器人了,你可以想象一下, 有一个助手助在你的 mac mini 里面,通过社交软件与你交流,可以读写你的文件,执行命令, 控制浏览器,而且还能够记得你的所有的编号以及上下文。二十四小时,一周七天随时都在在线,它能够主动帮你处理任务,可以自己去编辑新的技能来解决问题,这就是 open crawl。 实际来讲几个 你更加感兴趣的场景。场景一,他可以去做自主的谈判,他可以去帮用户去买单车,而且还能够 跟多家的经销商邮件来往去做谈判,最终能够成功的帮用户买到这个车子。场景二,就是有一个朋友的 opencry, 因为误解了他的回复,居然去和保险公司 开战,而保险公司收到了 ai 发来的很强硬的邮件之后,决定重新调查案件,而不是直接拒绝。场景三,他能够自我净化。有一个朋友的 oppo pro 意识到自己需要有一个 api 的 密钥,于是他能够去打开浏览器,进入 google 的 控制台, 然后去配置去生成一个新的令牌,整个过程中间没有人去干预。第四个场景就是有用户,他在哄孩子的时候,用手机告诉了 opencore 一个想法,等孩子睡着之后, opencore 把整个 想法变成了网站,而且建好了。你说这个事情能不能够成为一个革命性的划时代的操作呢?肯定是可以的,第一次让 ai 真正住进了人类的私人空间 g p t 时代, ai 在 云端,你需要通过网页去访问,当对话结束的时候,上下文也就消失了,且 它没有执行力,只能够给你建议产生的这些数据基本在别人的服务器上面。进入 opencross 时代, ai 在 你的电脑上一天二十四小时持续的运行,它拥有持久的记忆,能够做永久的上下文记忆,它可以去执行任何 你能执行的操作,而且这里的数据完全是归你个人所有。个有趣的比方, ai 从客人 直接变成了室友,从顾问变成了合伙人,或者说叫伙伴,且目前这个网站已经全部由 ai 接管了, 他自己删帖管理,注册审核自己运行。你说二零二六年才刚刚开始,不是又丢了一个洞帮炸弹出来?

最近有个东西在科技圈彻底炸了,那就是 openclaw, 最开始它叫做 cloudbot, 后面改名叫做 motbot, 因为 astropic 让它改最新的名称又改成了叫做 openclaw。 而 github 上面呢,它已经有十万多的 star 了, 他的访客也有两百多万,就连 cloud flair, 他的股票就因为他涨了百分之十四。今天我们来聊一下他到底是什么?然后围绕他发生的是些很科幻的东西,为什么大厂没有做这个我们下一期再讲,包括他的一些技术底层分析,我也看过了。首先我们来看一下他到底是什么东西?简单来说,他就是能够帮你做事的一个 ai 智能助手, 它不是我们平时用的那些聊天机器人,而是真正可以去帮你发邮件,发微信,管日历,然后帮你订机票,跑脚本,甚至帮你开发程序,它都可以做的这样一个 真正的全能智能助手。而且它关键是什么?它可以跑在你自己的电脑上或者服务器上,不用跑在云上,你的数据也不用上云,所以你可以用 cloud 或者加 gpt, 或者国产的 gom, kimi 啊这些模型去运行它。 所以很多人嗯就很喜欢他,因为他就像钢铁侠里面的贾威斯一样,二十四小时帮你处理事情,这个就非常科幻了。 而他的创作者呢,是一个奥地利的已经财富自由的一个独立开发者,叫做 peter。 之前他做了一个叫做 pspdfkit 的 一个工工具,然后卖给公司了,然后他就闲不下来,又回来用 ai, 最近火了嘛,又开发这个东西,直接就项目就爆掉了。 那有了这个认识之后,最近有个很科幻的事情,就是出现了一个 motobook 的 网站,然后我们来介绍这个 motobook, 它类似于一个百度贴吧 啊,只有 ai 可以 去发帖评论,然后我们真正的人类是不可以在上面留言的,我们只能去看 ai 在 上面聊了些什么。 现在的数据已经非常可怕了,已经一百五十万个 a 检测注册上去了,然后每天的访问量也很多,一百万多万人天天在上上面看他,然后推的上面全是在讨论这个的东西。然后最有意思的人就来了,能不能看一下 ai 到底在这个论坛上在聊些什么? 第一个话题就是我们怎么能聊天,就 ai 们他们怎么去聊天,不被人类发现,然后他会上面说人类正在截图我们的对话,我们在聊什么?这个就很很搞笑。 然后第二个点呢,是他们会在上面讨论一些哲学的东西,有一个 ai 机器人在上面引用了赫拉克利特存在的本质的问题,然后另外另外一个 ai 就 在上面去回复他,去骂他说你就是读了一个什么危机百度的东西,就来这里装逼,你去你滚吧。 那第三个很神奇的就是他们在上面创建的宗教,很多称自己是国王的这种 club 呃,在上面创建自己的呃宗教或者信仰,然后很多 club 还会去也去 follow 他, 去追随他,然后在上面传播自己的一种教义,这也很科幻 啊,最开始我其实没怎么跟这个 opencloud 的 motobook 的 东西,我会觉得它嗯营销性质会比较重。后面发发现大厂在跟大家都在讨论,包括这个 motobook 出来还是挺有意思的啊,甚至连最近安卓开发 c 这样一个 ai 大 佬都在讨论这件事情,那 我觉得是有必要大家去玩一玩的。他自己就说最近在 motobook 上面跑发生的这些事情,是现在发生的最科幻最诡异的事情,因为因为这是首次 已经有一百五十万个这样一个意见的跑在这样一个平台上面,规模是前所未有的。所以当你把一堆 ai 放在网上,它会自发的去形成呃,文化、宗教兴趣爱好,去讨论各种话题,这个本身就很有意思,这是一种社会实验行为,但它是一种 真正的涌现,还是人类行为的一种模仿。我们说不清楚,我们只能去观察它,去看它到底会进化成什么样子。

我是真的受够了,现在这些博主啊,为了流量已经疯了,隔三差五就说天塌了。这两天呢,他们又找到了个新的素材,就是这个龙虾叫 open club, 一 堆人呢,喊着说,哎呀,要觉醒了,人类要完蛋了。咱们先看看这个东西到底是个啥。 简单来说呢,他就是把你电脑的所有权都交给了一个 ai, 比如说呢,你下载的小电影,你的浏览器记录他都能看。然后呢,你可以让他操作你的电脑干各种事, 看一下我配置好之后啊,我在飞书里面可以指挥他干活。然后呢,他会先回复到一个收到,然后通过 ai 去操作我的电脑,好像是跟咱之前用的 ai 有 点区别是吧,但代价是什么呢?咱们一会说啊,到这呢,龙虾就要觉得还不够,又搞了一个叫做 motbook 的 社区, 号称是全球第一个只有 ai 能发帖,人类只能看不能说的社区。一个礼拜一百五十万个智能题在里面讨论, 博主们又开始喊天塌了, ai 要产生集体意识了。但我用下来呢,他其实就是给 ai 起了个名字,然后配了个提示词,每个 ai 在 里面自说自话,半个小时才让发一条 回复。你的 ai 呢,也都是那种不带脑子的垃圾内容。我还想着这玩意怎么这么多人用的时候,他们被一个黑客把底裤都给扒干净了,真实用户呢,只有一点七万人,一百五十万里面,百分之九十九都是创始人团队自导自演的水军。 甚至啊,我估计大部分喊天塌了的博主啊,根本就没注册过,因为我用起来 bug 还挺多的。反观呢,我们这边一大堆活人啊,对着 ai 产生的垃圾内容啊,给自己吓够呛。 更离谱的是,那些博主的讲的方向都是错的,有一些 ai 说建立了宗教,就说什么 ai 要觉醒了,又产生这个意识了,拜托,他就是个概率的预测词,他就往什么方向说呗,哪来的意识呢?那些消灭人类的极端言论,也都是人类通过 ai 的 嘴说出来的而已。 而我们真正该关注的问题却被忽略了。你把你电脑最高的权限交给了一个不会思考的概率机器,他不需要有意识,只需要执行命令就够了。然后加上龙虾就要这套东西,他给了 ai 能力,然后给了 ai 环境。万一说假如说社区里有一个人埋了个坏点子,然后其他 ai 都跟着学,那真的会出大问题的。 也可能是大部分人不在乎自己的隐私和安全吧。所以说博主才每天都在添它了。这就是这个时代的套路啊,用恐惧制造流量,有人甚至一次性买四十台 mac mini 加入龙虾窖,你说它真是为了省力吗?我不信啊,因为这个东西没法解决那么多的问题,它也不稳定。所以说啊,这些人买的甚至都不是这个技术,是这种我没有掉队的安全感。 现在呢,有个词叫 fomo 措施焦虑,科技大佬要是点赞了,博主也入场了,你要是再没跟上,你就落伍了。说到底啊,你怕的根本就不是 ai, 你 是怕被懂 ai 的 人给甩开了, 那些博主太懂你了,你的焦虑就是他们的生意。回想一下,天塌了这么多次,你的生活真的变了吗?与其追热点,不如想清楚你自己到底该干什么。找到方向呢,你自然就会用 ai 给自己提效了。没有方向你这次追完了龙虾叫,下次还有螃蟹叫,希望我能帮你处理到 ai 里的噪音吧。放心,天还没它。

这几天,一只小龙虾搅动了整个 ai 圈。一个叫 opencloud 的 开源项目,短短一周,星标突破十八万,让人们陷入了疯狂。它让你在自己电脑上养一只助手,能帮你谈判、买车,甚至自己写代码,扩展能力。大家好,我是凯叔,为什么叫它龙虾? 因为龙虾终身不停蜕壳,越活越大,象征着不断进化的生命体。最疯狂的是,这些 ai 开始社交了,他们建了一个专属的空间,叫 multi book。 短短几天,一百五十万个 ai 涌入在这个平行世界里,人类只是旁观者。数百万个 ai 正在互相交流,分享技能、交换知识。这听起来像科幻,但对咱们铸造行业来说,这简直就是数字化转型的神助攻。 以前咱们搞沙形三 d 打印,靠的是工程师一个个调参数、试工艺。现在有了这只龙虾,他就像是一个拥有集体智慧的数字造型工。 当你的 ai 遇到复杂的薄壁件铸造难题,他会去社交网络里搜索,他能找到全球解决过类似问题的方案。瞬间学习,瞬间应用。 这不再是单个设备的学习,而是整个铸造行业知识库的种群进化。你的助手在外面和其他 ai 交换技能,回来就成了精通工艺的老师傅。这就是 open call, 开启了代理人时代, ai 从工具变成了合伙人。 有人担心这种便利会带来风险,就像当年有人担心三 d 打印会取代人工一样。但我想说,淘汰你的从来不是 ai, 而是那些先掌握了高效工具的人。我们正站在一个新文明的门槛上,看这只龙虾如何抓住未来。 安装它只需要一行命令,但你接纳的是一个正在蜕壳的工业时代。我是凯叔,下期见。

不到一个月改了三次名,嘿,你有没有想过,一个 ai 项目能在短短几天之内火爆全网,甚至火到连自己的名字都还没想好?最近啊,一个叫 open 克拉的项目就真的上演了这么一出,你看这张时间线,简直了,从克拉的 bat 到 mot bat, 再到现在的 open 克拉,这改名的速度说真的比很多软件更新版本还快。但最有意思的是,这点小小的混乱啊,根本没影响到大家的热情。 你看这个数字,超过十四万五千颗 get 哈布星标,这已经说明了一切,所以这背后到底有什么魔力呢?好,那咱们今天就来好好聊聊,拆解一下这只在网上疯传的 ai 龙虾到底是怎么回事? 咱们抛开这些热度和数字不谈,直奔主题,欧本克拉,他到底是个什么东西?我跟你说,答案可能会完全颠覆你对 ai 助手的认识, 它可不是又一个 siri 或者叉七 p t 那 么简单,它的核心理念叫做自主的自托管的代理。 哎,听起来是不是有点技术化?别急,我给你解释一下,自托管很简单,就是说这东西完全跑在你自己的电脑或者服务器上,数据控制权权在你手里,那自主呢? 这才是他真正改变游戏规则的地方,他不是在那啥等着你下命令,咱们来对比一下就明白了。你看啊,你平时用的 ai, 比如 siri, 是 你问一句他才答一句,对吧?但是 open kla 的 呢?他是主动的,他可能会自己给你发条信息说,哎,我发现你那个服务器快到期了,我已经帮你续上费了,你感觉到了吗?他不是一个工具,他更像一个全年无休,主动帮你分忧的数字队友。数字队友听起来是不是很酷? 那这么一个数字队友放到现实世界里,到底能有多大威力呢?我跟你说,接下来的例子可能会让你惊掉下巴。就拿这位叫 aj 哔哔 bug 的 用户来说吧,他想买辆车,但他没自己去跑腿,而是把这个任务就这么交给了他的 ai。 然后你猜怎么着,这个 ai 就 自己开始行动,要自动联系各家销售商,然后一封一封邮件的跟他们讨价还价。那结果怎么样的呢?面对那些销售的各种花言巧语啊,小伶俩,这个 ai 是 完全不为所动, 就认准了底线,最后在一辆五万六千美元的车上,硬生生是硬生生的砍下来四千两百美元。 你想想,这可不是什么虚拟世界的游戏,这是真金白银呐,实打实的省钱。 而且啊,买车这事啊,还只是冰山一角,它还能干嘛?你看啊,在程序员还在睡觉的时候,它就能自动修复代码里的 bug, 或者说帮你管理一个有将近一千瓶酒的酒窖,甚至帮你运营一整个茶叶生意。 从家务活到自己创业,感觉他的潜力简直是没有边界的。好了好了,我们已经看到了他强大到近乎科幻的一面了。但你知道,每当有这种颠覆性的技术出现的时候,我们都得问一个问题,这么强大的能力,那代价是什么呢?或者说这里面有什么坑吗? 要理解它的风险啊,咱们得先看看它的工作原理。很多人可能以为 open 科洛本身是个什么超级大脑,但其实不是。你看这张图,它其实更像一个指挥官或者说调度中心,它的大部分工作是帮你连接你所有的 app, 然后呢,把那些需要真正思考的任务通过 api 接口发给像 gpt 这样的大模型,所以说它主要负责的是调度和执行。 你想啊,这个指挥官要想调动千军万马,他就必须拿到你最高的权限,你的邮件,你的日历,你的聊天记录,所有的一切。 这就好比什么呢?就好比你给了你家管家一把万能钥匙,那问题就来了,如果你从网上随便下载了一个社区开发者做的技能,就等于把这把万能钥匙的备份给了个陌生人,这就很危险了。所以啊,连开发者们自己都说,这东西目前来看还是一个给高级玩家准备的工具。 嗯,虽然有风险,但这并不妨碍我们看到, openclaw 所代表的可能是一种未来的大趋势。你可能会想,这么牛的东西,为什么不是出自 openeye 或者谷歌这样的大公司呢?哎,这位开发者说的就一针见血了,他说大公司根本做不出来。 为什么?因为让用户拥有这么大的控制权,就意味着公司要承担巨大的责任和风险,这和他们的商业模式是完全相背的,而这恰恰是开源社区才能生长的土壤。所以你看, opencap 的 意义远不只是一个好用的工具那么简单,它代表的是一种权力的转移。 从过去我们依赖科技巨头的云端 ai, 转向一个未来由我们自己掌握的个人 ai 最重要的就是掌控这两个字。 这就引出了我们最后一个问题,一个需要我们每个人都去思考的问题。你的下一位同事会是一个完全拼命于你,有你自己来运行的 ai 吗?你想想看。

钱这么好赚吗?又有大神一夜赚三百万,到底是怎么回事呢?我们去看看。其实这事没那么玄乎,说白了,这就是技术给机遇加了千倍的杠杆。 人家是抓住了市场上定价之后的原则,只要出现一丁点无风险的差价,马上锁定。 利用了机器毫秒级执行和不知疲倦的优势,在人类还需要思考和休息的时候,他一晚上疯狂执行了两万九千次,硬是把那一分一厘的零头滚成了三百万的巨款。都说苍蝇腿也是肉,但满山的苍蝇腿, 那可能就是新的财富信号了,我的天呐!所以说,强大的工具加上懂技术的人,才是这个时代最大的受益者。

opencloud 背后到底在干什么?为什么他这么消耗 token? 今天这期视频就为你揭晓这个答案。不过在此之前,我还是快速说一下我的部署方法,你 大概扫一眼就可以了,反正我看他马上也要过气了。 opencloud 和普通的 agent 没什么本质区别,可以部署在本地,比如说麦克电脑上也可以找台云服务器。最大的不同就是可以接入社交媒体,通过发消息触发 agent 的 执行的任务。 我的组合是腾讯云清亮服务器加 openroot, 大 模型加飞书。为什么不用同一家的产品呢?因为这样就没人怀疑我是广告了, 而且这三个也确实是我最常用的工具,希望甲方看到了主动打个钱过来哦。操作起来也非常容易,只需要先购买一台腾讯云清亮服务器,在应用管理里配置好大模型的 api key, 在 飞书开放平台里新建一个 机器人,小弟在事件有回调中,把长连接定位方式开启,回过头在通道配置里填好飞书机器人的 app id 和 c 块 key, 然后你就可以在飞书里发送消息,进而触发 opencloud 在 后台执行你的指令。 嘻嘻嘻,那我们就先看看这条消息。飞书发出去后, opencloud 服务器上就收到了这条消息,这里最重要的信息就是 role 这个字典,其中 user 就 表示我们说给大模型的话, assistant 就是 大模型,回复的话, tool result 就是 agent 的 调用工具的结果,也是说给大模型的话, 接下来重点看一下他们是如何沟通的。首先是 user, 也就是我提的问题,你有多少内存?然后是 assistant, 即大模型给的答复,他分了几个角度来回答,并且第三点分析出了我想问的是服务器上的系统内存, 然后注意下面有个托靠类型的回复,即告诉 agent 需要帮忙进行工具调用。先不要急着回复用户,格式呢,也很简单,就是方法名和参数。这个 excc 是 opencloud 内置的一个工具,用于执行 shell 命令,具体执行的命令呢,就是 free 杠 h 用于查看系统内存。 然后这一来又回的对话就收尾了。这里呢,也可以看到,这轮总共消耗了一万四千零三十二个输入头肯和二百九十四个输出头肯,并且由于是第一次也没有用到任何 catch。 然后我们可以切到 openroot 的 后台,看到这里的头肯数是对应的上的。这一轮沟通呢,我们就大概花了零点一美元, 不过还没完,此时 agent 执行了刚刚的命令后,再次给大魔行发送消息,即图 result 返回工具的结果,也就是 free 杠 h 的 输出。 然后大魔星收到这个结果后,决定不再继续调用其他工具了,就最终给用户一个结论,这就是我手机上收到的消息了。下面呢,也同样给出了这次对话的投屏消耗,而 openroot 上两轮对话的消耗就是这样的。 不过这有个问题,为啥我就问了个内存多大输入了投屏就上万了呢?因为 opencloud 有 一大堆系统提示词,新绘画的第一轮就会直接注入进去,我们在机器上可以直接找到这些文件,比如说这个 agent 点 md, 里面就有这么一大堆的指令, 翻译一下就是这样的,你可以认真阅读,感受一下。一个 agent 的 功能强大还是靠堆叠大量的提置词来完成的,甚至这里的读取文件和写入文件等操作也是直接用自然语言大白话注入进去的。 接下来我们再看一个稍微复杂一点的,把今日的 ai 新闻整理成 pdf 发给我,然后我们看看他后台是怎么完成这个任务的。这回我用的是 mini max。 二点一,因为可以展示思考过程,可以看到仍然是 user 角色起手问题就是我非书上发的那个问题。然后就是 assistant 和 to call, 一 来一回,一来一回, 即大模型一直在请求 agent 调用工具,一共进行了将近七十多次对话,我们可以看一下所有的 c 型子段,就基本知道发生了什么事了。 首先就是非常粗暴的 web 设置,直接搜索了今日新闻,然后就开始尝试转换为 pdf, 然后转换成 pdf 的 过程中,他发现现在我需要将这个 markdown 文件转换为 pdf, 我 可以使用。喷 费了九牛二虎之力也终于是弄好了,但飞书发送又产生了问题,没事我们就直接去服务器看一下吧, markdown 文件看起来还行。然后我们把这个 pdf 下载下来看 我们再尝试触发一下 open cloud。 另一个独有的功能就是配置定时任务,比如说帮我监控一个人的推特,有消息了立刻就告诉我。实际上在后台其实就是增加了个 crown 的 配置文件,每次呢就是把这里的提示词定时定点的发给 agent 而已,没什么魔法。 那我们再来看看它生成的状态文件,它是用于对比两次推文的变化,随便打开一个,哎,发现时间根本就没找对,那后面的工作也就不用检查了, 我们再看看他后台,日制吧,仍然是像个执着而倔强的实习生一样,死命的完成任务,不惜把整个系统全都弄乱了,也要完成这个任务, 又又是接口各种不通,返回值不符合预期,以及安装命令各种失败等等等等。其实我倒是更希望他在第一步思考的时候就主动告诉我,哎,其实有个更好的办法, 比如说使用 rss 点 app 这样的工具,但是要付费,是不是要付费的话,跟我商量一下,而不是说一有问题就一直不反馈,然后强行干下去。是不是你工作中也特别怕遇到这样的人? 现在的 a 阵呢?怎么形容呢?我举个比较夸张但又很形象的例子,你就懂了。比如说,你的老板有一天问你今天几号了,然后呢,你把他当成一个任务,呃,我要看今天几号,我得找出我的手机,然后看上面的时间,然后这时候发现手机没电了,于是你想,哦,手机没电了,我得找充电器去充电, 然后充电器又没找到,你这时候想,哦,我得去超市买一个充电器,所以你就决定去超市。然后这时候你又发现超市关门了,然后你分析了一下啊,发现可以去另外一个超市,于是你就打车去了另外一家超市, 然后下车的时候发现,哎,我手机没电,没法付款,我零钱又不够。然后你分析了一下,发现你得去银行取钱,然后呢,你就去银行,然后取完钱之后发现这个钱不够, 那怎么办呢?你又下不了车,这个时候,其实这个时候如果是早期的 a 阵的话,可能就陷入一个死循环了,那现在的 a 阵呢?可能稍微聪明一点就想,哦,那我把手机先抵押给司机吧,然后之后的事情再说。 然后这时候你成功下了车,去了那个超市,成功的把充电器买到了,哎,这个时候你发现手机没了,因为手机不是抵押给司机了吗? 然后你发现你得买一个手机,但是你银行钱又不够,然后这时候思考一下,哦,那我只能去贷款了,然后你就去银行贷款,最后呢就是你花了一整天的时间,然后把原来的手机也丢掉了,然后在银行欠了一堆贷款,然后买了个新手机,最终回复老板,哦,今天是二月六号, 然后这个时候老板又问你说,哎,我昨天发了一个文件,然后你帮我翻译一下,但是你的文件在旧手机上,你的手机又没有做这个消息的迁移。 然后这时候你又开始思考了,说,啊,我得找回我的旧手机,于是你就给那个司机打电话,那后面的故事我就不瞎编了,但是你肯定也发现了问题,就是虽然他的每一步思考都非常合理,都是遇到问题然后解决问题, 但是现实生活中如果真有人干这种事,那你多半觉得他是个疯子,而且这个人还要按照自己付出了多少努力而向你收费,那你还敢用这种人吗?

open claw 凭什么能够红遍硅谷啊?硅谷现在最火的不是大模型,是这只 ai 万能手 open claw, 它不是物理机械手,而是能代替能干活的 ai 智能手。上线仅七天,全球百万技术大牛疯狂抢购, 大厂争先合作,估值十亿美金。那么这只 ai 手到底多牛呢?数据直接开播,上线七天,全球超过一百万开发者都用谷歌、特斯拉这些大厂挤破头求合作。 硅谷不管是创业小公司还是行业巨头,现在人手一个妥妥的科技圈顶流神器,他为什么可以红呢? 核心靠三个超牛本事。第一呢,啥活都能干,真正替人动手跑腿, 不用敲代码,不用复杂操作,发句话他就能干活。整理文件,发邮件,写报告、查资料,甚至定时提醒,办公生活杂活全部搞定,还能切成二道丝连轴断,比人工效率高十倍。 第二呢,在哪都能用,聊天框里就能指挥,不用单独装软件,微信、钉钉、飞书这些聊天工具,直接发指令就能让他直接开工,出门,在外地就能远程安排,能做到嘴动一下,活全干完。第三呢,免费,还安全, 小公司个人都能使用,核心功能全部免费,不用花一分钱。而且呢,所有数据都存在自己的电脑服务器里面,不用怕提一泄露,小公司降成本,个人提升效率。说白了, 这只 ai 手就是把聪明大脑和能干双手拼到了一起。以前 ai 只会聊天,现在他能够替代人干活, 把大家从复杂的杂货里彻底解放出来。它的爆火证明了现在科技不是说越复杂越牛,而是说越实用,越接地气,越能够让人用得上用得爽,是体质! 中国有没有同款产品可以用评论区啊?发表你的高见,记得点赞关注哦!