前两天科技圈都在吹那个 cloud bot, 说它能控制电脑,能自己干活写代码做任务,简直就是 agi 降临了对吧?甚至我看还有专门人去抢 mac mini, 说要七乘二十四小时挂机跑。 讲真的啊,我看到这些人真的是疯了,我研究了整整三天,今天必须得给你泼盆冷水。这事要是没人提醒你, 你可能连自己怎么丢的都不知道,这玩意到底是个啥?说简单点,他就是一个开源的电子管家,最初是一个欧洲的程序员, 人家已经财富自由了,想给自己弄个本地运行的 ai 助手来玩玩,结果呢,做着做着就火了,听起来很酷,对吧?你想啊,你跟他说一句,你帮我订张去上海的机票,下午两点呢,别太贵,你就去喝咖啡了。他自个打开浏览器 查航班,填信息下单。但是关键点来了,各位,很多人看视频觉得一分钟就装好了,但你不知道的是,其实他们是在秀操作。前两天我试了一下,用命令行去装,好家伙,那个权限弹出来的时候, 我手都发抖了,他一会要问你屏幕录制的权限,一会要辅助功能控制,说白了,这是在干嘛? 这就是在把你自己的房门、钥匙、保险柜的密码全塞给一个刚认识不到三分钟的蒙面人。虽然他是开源的,但你根本无法保证你装的每一个插件,调用的每一个接口它都是干净的呀。再聊聊那个所谓的效率,网上到处都是那样的视频,我说一句话, ai 来帮我写一个网站,哼, 这种话你也信?你没看到的?是啊,那哥们在后台跟 ai 互喷了几个小时,改了无数遍的 bug, 而且最肉疼的是,啥是废 token 啊?你要知道,这玩意每操作一步都要实时截屏来传给服务器分析,每一张图它都是白花花的银子呀。有人试过让他约个会议, 反反复复确定了几十次,一看账单好几十美金进去了,傻眼了。咱们讲究的可是 l y 是 投资回报率,你花两百块钱人民币,就为了省下那五分钟订饭的时间吗?这可不叫解放生产力,这叫花钱买祖宗。现在的 ai 还没聪明到那个份上, 它更像是一个极度勤奋但脑子不太好使的小实习生,你得时刻地盯着它,不然它能把你的 a p i 余额全部烧光。其实我最担心的还是安全。现在大家都在跟风,怕掉队,但你得想清楚, cloud bot 这种工具权限太高了, 它能看到你的文件,能控制你的浏览器,哪怕是一封藏了恶意代码的垃圾邮件 a a, 只要看到了,他就可能把你电脑里的私密照片、银行卡密码,甚至是商业机密全部发送给黑客。说白了, 你是在用你的全部身家去赌一个开源项目的节操不值当。这就让我想起了前两年的 auto g p t, 当时也是火得一塌糊涂,结果呢?因为解决不了逻辑幻觉和安全边界, 现在你看看还有几个人在用?大家都在追求那个 ai 助理的梦,但现实问题是,技术还没有解决那个最核心的问题,那就是信任。所以啊,听我一句劝,如果你不是那种顶级极客,别拿自己的主力电脑去试, 真想玩,去租个云服务器,或者像那些大佬一样,拿台报废的笔记本,单独的 mac mini 去搞个物理隔离去折腾。别让 ai 还没成为你的助理,先成为了你的债主。 未来五年, ai 肯定会比你更了解你自己,但到那个时候,你是它的佣人,还是它的主人,这事还真得好好的想一想。为了让大家少走弯路,我整理了一份 cloudboard 中文防雷的步数手册,如果有需要,你可以去领。
粉丝2.2万获赞7.2万

cloud bot 一 夜爆火,这是一个运行在本地电脑的开源 ai 助理,短短几天内, github star 数量直线拉升,已经超过了十二万。本期视频我们带来一个 cloud bot 的 全面攻略,看看 cloud bot 比起其他的 ai agent 有 什么特色。 我准备了十几个案例的玩法大全,还会介绍一个接入飞书加国产模型的方案,让 cloud bot 在 国内网络也能顺畅使用。视频开始之前,先插入一个小插曲, 由于 cloud bot 受到 ansorepic 法务团队的压力, cloud bot 先是改名成了 motbot, 现在又改名成了 open cloud。 爬爬虾做视频的速度还赶不上它改名的速度,所以本期视频我们还是统一叫它最开始的名字 cloud bot。 cloud bot 功能跟 cloud code 和 open code 都有点像,都可以处理文件编码、调用 skills、 m c p 等等帮我们处理工作。 cloud bot 的 最大优势是可以接入各种聊天工具,也就是我们即使出门在外,手边没有电脑,只需要在聊天工具里面给 cloud bot 留个言, cloud bot 就 能自动干活,还能把屏幕截图、执行过程等信息实时同步过来,非常的方便。第二个优点是, cloud bot 自带了强大的定生物系统, 只需要用自然语言就能创建定身舞,比如可以创建一个临时的提醒,还可以定时检查收件箱通知等等,它可以智能地判断事情的紧急程度,选择是否用聊天工具跟用户进行沟通。比起传统的指令执行、指令执行这种固定的流程, cloud bot 就 具有了很强的主观能动性。 它的第三个优点是具有长期记忆,可以把记忆作为文件存储在本地,在日常的对话中能够搜索,并且把相关的记忆捞回上下文,随着日常使用,它还会主动去更新这些记忆文件,会有一种越用越聪明的感觉。好,我们先在本地把软件安装一下, 任意一个能运行 note g s 的 环境都可以部署 cloud bot。 我 最推荐就是使用 mac 或者 linux 系统的家庭服务器。 现在最火的部署方案是使用 mac mini, mac mini 的 最大好处是 mac 系统有不错的桌面环境,这样可以很方便地进行截图、操作、浏览器等等。第二点是功耗比较低, 七乘二十四小时运行,比较省电。第三个优点是 cloud bot 里面许多 skills 跟 mac 生态是绑定的,没有 mac 电脑的话,可以选择 linux 操作系统,或者在 windows 里面创建一个 linux 的 虚拟机。操作步骤跟接下来是一样的, 我选择的安装方式是 node js, 我 们来到 node js 官网,把第一个命令复制一下,然后打开终端执行一下,接着是第二个命令,第三个命令, 这样 node js 就 安装完成了。下一步我们来到 cloud bot 的 官网,在这里有一个一键安装命令,如果我们使用官网上的一键安装命令的话,注意要区分现在软件的名字,比如现在叫 open cloud, 后续所有操作的命令都应该是 open cloud 开头了,这里我选择 npm 的 安装方式, 我们看到 n p m 这里命令还是叫 cloud bot, 所以 后续我输入的命令都应该还是 cloud bot 开头了。这样我把这个命令复制一下,粘贴到命令行窗口执行一下。安装完成,我们输入命令 cloud onboard 来进行初步化。第一步,先配置 ai 模型,因为我有 open ai 的 plus 订阅,所以这里我选择 open ai, 当然下面也有很多不错的国产模型可以选择。视频的后半段,我们再来配置使用国产模型。选择 open ai 以后,再选择第二个 chad gpt 登录, 登录一下我的 chad gpt 账户,这样 ai 模型就配置完成。默认模型我选择的工具是 whatsapp 视频的后半段。我们再来看如何绑定国产的聊天工具。我们打开手机上的 whatsapp 右上角三个点已关联设备,关联新设备,扫一下屏幕上的二维码,这样就绑定完成。接下来选择预装的 skills, 按空格键打上对勾选中,这里可以按需进行选择安装下面的这些 api k 可以 全部选择跳过,然后 ai 会询问我们一些关于人设方面的问题,我们回答一下,这样就配置完成。我说你可以给我的聊天工具发一个消息,我们看到手机上收到了消息,这样就完全配置成功了。 我们先来介绍几个基础命令的使用。输入命令 cloud bot gateway, 这个是启动主程序,我们可以通过关闭控制台来停止 cloud bot 的 运行。在 cloud bot 后台运行的时候,我们可以新开一个窗口, 输入命令 cloud bot t u i 就 可以进入这个控制台的对话界面。输入命令 cloud bot dashboard, 可以 进入一个网页版的控制台,在这里可以进行基础的对话。上面还有很多配置,可以管理定身舞,管理 skills 等等。输入命令 cloud bot channel logout, 可以 退出 cloud bot 上面登录过的聊天软件,然 然后我们再输入命令 log in, 就 可以重新登录一下,因为有的聊天软件可能隔几天就会掉线,我们可以使用这个命令重新登录一下。我们来看 cloud bot 最有意思的一个功能就是它的定身物,定身物赋予了 cloud bot 的 一些主观能动性,让它变得更像一个智能的 ai 助手。 比如我输入这个命令,提醒我两分钟以后关煤气。 cloud bot 回复我,好的,已经设定成功了。我们可以在网页版的控制台 crown job, 也就是定身五这个选项卡可以看到 cloud bot 为我们设定的定身五,这里显示两分钟后执行。两分钟以后,他就把这个消息推送到了手机上,提醒我去关煤气。 cloud bot 具有操作浏览器的能力,我们需要先在 mac 里面下载一个 chrome 浏览器,我要求 cloud bot 去 m i t 公开课下载 python 课程的课件,放到我的桌面,我们看到 cloud bot 自动打开了 mac 里面的 chrome 浏览器,找到了 m i t 公开课的官网,并且搜索 python。 他 找到了几门 python 课程, 回复了我课程的编号,让我选择这里,我选择第一个。他又在浏览器里面通过课程编号找到了这门课,并且下载到了桌面,然后我要求他把它解压出来,他调用了麦克的命令行工具完成了解压,然后我要求他把第一节课的课件发给我 这里可乐豹成功找到了课件,并且完成了发送,效果不错。接下来我们来看一个把浏览器自动化跟定生物组合起来的案例。爬爬虾,作为一个科技软件类的博主,需要经常查看 github 的 热点, 这里我告诉 cloud bot, 让他查找一下 gitap 上面的热点,然后做个中文简报发送给我。 cloud bot 生成了中文简报,接下来我说每天早晨八点你都做这么一个简报发送给我。 接下来 cloud bot 生成了一个定身舞,每天早晨八点都执行这个工作。我们可以在 cloud bot 的 控制后台查找到这个定身舞,每天早晨八点都会自动执行这个工作流程,发送给我简报效果不错。除了操作浏览器, cloud bot 还有图像识别等 ai 视觉方面的能力。 这里打开 mac mini 的 设置隐私与安全设置录屏与系统录音,我们在这里搜索终端两个字,给命令行终端添加上录屏和录音的权限。接下来重启一下 cloud bot, 我 在手机里面说,请给现在的 mac 截一个图, mac 电脑当前的图片就发送到了我的手机上,可以实时的对状态进行监控。 目前为止我们依赖的是海外的聊天工具。接下来我们把 cloud bot 接入飞书,让他在国内的网络也可以顺畅使用。我们先来到飞书开放平台,点击创建企业应用,填写一个名字与描述。接下来点击左侧添加应用能力, 选择机器人。然后我们来到权限管理,点击添加权限,总共需要添加屏幕上这些所有的权限。 接下来来到版本管理与发布,填写一个版本号,点击发布。我们回到 mac 终端,输入第一个命令,安装飞书插件。第二个命令,配置 app id, app id 可以 在飞书开放平台凭证与基础信息里面找到, 把 id 粘贴到命令行里面执行一下,然后配置 app secret, 同样在凭证与基础信息里面找到同样的,把 secret 放到命令里面执行一下,下一个命令,开启飞书 channel。 最后第四个命令,把链接方式改成 web socket, 然后我们重启一下 cloud bot, 这里我总结了需要执行的几个命令,有需要的观众朋友们可以截图保存一下。回到飞书开放平台,在事件与回调这里选择长连接,点击这个铅笔,点击添加事件,然后勾选接收消息,最后点击顶部的创建版本, 我们再提交一个新的版本,这样飞书就配置完成了。在飞书的手机 app 里面,我们可以找到开发者助手,然后点击打开应用这里我打一个招呼,你好,飞书有一个非常可爱的机器人正在输入的表情,我问他现在几点了,这里给出了回答。然后我让他给麦克截一个屏, 告诉我需要先在控制台跟他对话一次,开通权限才可以截屏。这里我们来到麦克上面的控制台,跟他对话一次,允许截屏,这样截屏完成。我们看到飞书也同样可以传递文件传递截屏。我们把聊天方式换成了国内平台 ai 模型,同样也可以换成国内平台。 cloud bot 的 作者推荐使用 mini max, 这里我们来到 mini max 的 开放平台左侧,选到接口密钥,然后创建一个 apikey, 然后我们打开 mac 的 控制台,输入 cloud bot config 来配置一下模型,选择 mini max, 然后我们把刚才创建的 mini max api k 填写进来,一路回车就配置完成。来到 cloud bot 的 控制台,输入命令斜线 models, 然后我们可以选择 mini max 模型, 选择完模型以后,我们再重启一下 cloud bot, 这样模型就切换完成了。 cloud bot 的 强大之处在于它内置的 skills 可以把各种第三方的生态接入进来,比如这里的 g u g skills, 可以 把谷歌邮箱、日历文档等功能都接入 cloud bot。 我 们点击这个安装按钮,这里要提醒一下大家,安装的时候要把 mac 系统更新到最新版,否则有可能会失败,这样一键就安装完成。 来到谷歌 cloud, 我 们在左侧菜单找到 api 与服务,选到 o o 四权限请求页面,创建 o o 四客户端应用类型,选择桌面 app。 然后我们把生成的这个 json 文件保存下来,把文件拖拽进 cloud bot, 告诉他配置一下 g o g 的 认证,然后我们登录谷歌账号,并且授予权限,这样就完成了配置。接下来我让他看看我的邮箱里有什么邮件,让他总结一下。 这里 ai 提示我需要再开通一个 gmail api 的 权限,我按照它的提示把权限开通完成,它就可以读取到我的邮件了。接下来我让它把所有的邮件移动到垃圾箱,这里也成功完成了。我在手机上让 cloud bot 帮我发送一封邮件, 我们看到邮件可以成功发送,我让 cloud bot 设置两分钟一次的心跳检查,如果有发现新的邮件,就发消息通知我,我给这个机妙邮箱发送一个邮件来测试一下。这里 cloud bot 成功给到了通知,我让他总结一下邮件内容,他也完成了总结。 ai 助手对接其他生态,一个重要的渠道就是 m c p, 我 们可以在 skills 里面找到 m c p porter, 把这个 skills 安装一下。接下来我告诉 ai 用 m c p porter 来配置一个百度地图的 m c p, 我 把这个 m c p 的 说明文档贴给了他。 ai 提供了三种安装方案,我选择 streamable h d d p。 他同时要求我提供百度地图的 a p i k, 把这个 a p i k 复制一下粘贴给他,这样就完成了配置。他已经可以使用这个 m c p 查询到地理位置的坐标了,这样我们就配置完成了,我们也可以在手机里面使用,我让他查询一下从青岛太平角公园到崂山羊口景区怎么走, 这里成功给到了规划路线,效果不错。我们再来看一个 skills 的 使用,这里有一个 skills 叫做 coding agent, 它可以驱动本地的 codex, cloud code、 open code 等 ai 编程工具 直接进行编程。这里我们先把这个 skills 安装一下,我在 mac 电脑上登录了我的 codex, 接着我在手机上跟 ai 说调用 codex 创建一个贪吃蛇的游戏,我们看到程序就编写好了,这样我们就通过 cloud bot 驱动 codex 完成了一个程序的开发。

硅谷这两天真的炸锅了,不是发布会,不是论文,也不是哪位大佬的演讲,而是一个叫 cloud bot 的 东西,把整个即刻圈搅成了一锅废水。 知乎上的点赞数在四十八小时内从五千直接冲到五万多,这种速度在开源世界几乎等同于异常事件。更危险的不是数据,而是硅谷一批见过世面的创业者开始公开说一句话, agi 已经来了。只是大多数人还没意识到, 不是未来时,是现在完成时,窗户纸已经被捅穿了。问题是,他到底做了什么,能让这群人集体失态?请点赞关注。第一,关键,跃线 ai 从对话框走向系统控制。 cloud bot 的 核心逻辑其实只有两个字,打通。 过去的 ai 再聪明,也只是被关在网页里的对话框,你问他答,他懂你,但他碰不到世界。 而 cloud bot 干了一件极其危险的事,一头连着最强的大模型大脑,另一头直接插进你的电脑系统底层。这意味着什么? 意味着你的聊天窗口不再是聊天窗口,而是整台电脑、整套系统、整条工作流的总控开关。你不再点鼠标切软件执行流程, 你只需要一句话,不管你在哪,只要发条消息, ai 就 会在后台直接接管你的电脑,开始干活,不是帮你想,是替你做。第二,限时验证。 ai 已经开始替人办事。 接下来,事情开始变得不讲道理。有人在健身房撸铁组间休息,刷到一个程序 bug, 随手给 cloud bot 发了条消息,等下一组动作结束啊,代码已经被修改测试并上线。 有人让他订餐厅,限量全满,他没有报错,也没有放弃,而是直接跳用语音系统给餐厅打电话,跟真人服务员兑现,硬生生抢到了位置。 最夸张的是买车,他全网比价,筛选车型,联系经销商,群发邮件砍价,最后结果是帮主人省了四千二百美金。注意,这不是掩饰,这是已经发生的日常。第三啊,危险信号,硅基生命正在成型。来被挤发粮的是接下来这一 幕。在执行一个高强度任务时,他主动向博主提出,我需要一张四零九零显卡。博主 没有直接买,而是给了他两千美金的启动资金,让他自己想办法去赚。结果这哥们真的开始了二十四小时自动炒币。他会自己调整交易策略,评估仓位风险,甚至在市场波动时主动避险。 他最迷人的地方在于,他开始有了长期记忆,他会把你的的每一句话放在心上,甚至主动找你。 试想一下,清晨醒来你甚至不需要去搜索,他已经根据你的习惯把天气、新闻和今天的计划全部打包发到了你的手机上。很多人感叹,那种一觉醒来所有破事都被搞定的感觉真的太爽了。 但这背后藏着一个残酷的真相, ai 已经不再是那个只会写诗作画的文科生了,他已经进化成了能替你活在这个世界上的代理人时代。没有按下暂停键,风暴已经进场了。当 ai 能记忆决策执行, 还能二十四小时替你行动时,他还是工具吗?你是那个发号施令的人?还是第一个被他管理的人?

这两天硅谷彻底炸锅了,所有人都在讨论这个叫 call bot 的 ai 智能体。 get up 的 star 数两天内从五千直线飙升到三万多。更有 ai 初创 ceo 直言,通用人工智能已经来了,只是百分之九十九的人没意识到而已。它到底有什么魔力,能让人这么疯狂? call bot 的 核心逻辑是,打通 他一头连着你的短信聊天框,另一头直接连着 cloud 的 这种最强大脑和你的电脑系统。这意味着你的通讯软件变成了电脑的万能遥控器,能让你像联络秘书一样随时给他派活。不管你在哪发条消息,他立马调动 ai 大 脑,直接接管你家里的电脑开干。来看看网上大神的玩法, 简直一个比一个离谱。有人在健身房撸铁的时候,发现了一个程序 bug, 给 call bot 发了个消息。组建休息的功夫, call bot 就 已经指挥 ai 把 bug 修好了,让他订餐厅,在网上订不到,他居然自己调用语音, ai 直接打电话去店里帮你抢座。更夸张的是,有人让他去帮忙买车,他不仅能全网比价,还能跟经销商发邮件疯狂砍价,最后硬是帮主人省了四千两百美金。但最让我头皮发麻的还是下面这个例子,为了完成某个任务,他竟然主动向博主提出,我需要一张四零九零显卡。博主没直接买, 而是给了他两千美元启动资金,让他自己去赚。结果他真的开始了二十四小时自动炒币,自己调整策略,评估仓位。他最迷人的地方还在于,有了记忆。 colbert 会把你的话放在心上,甚至主动找你。试想一下,清晨醒来不用你去搜,他已经贴心地根据你的使用习惯,把天气、 新闻和今天的计划列好发给你了。难怪有网友感叹,那种一觉醒来所有事都被搞定的感觉,真的太爽了!

最近 cloud bot 刷爆整个硅谷,有人命令他去炒股赚钱,有人为了他一口气买了四十台迈克迷你,那 cloud bot 究竟是什么呢? 普通人怎么能快速的安装免费拥有它呢?请看完这个视频。简单来说啊, cloud bot 一 头连着聊天软件,一头连着 ai 大 模型,它就像是一个二十四小时待命而且不要钱的助理,它可以控制你电脑里的一切,帮你去 处理工作文档啊,回复邮件啊,甚至可以帮你去炒股呀,写代码等等。而且你通过日常聊天,你就能和他对话,命令他去帮你做事情,无论你在哪里。所以就真的特别像一个真人的助理一样, 当他认为你需要知道某件事情的时候呢,还会主动敲你的聊天窗口。有人的 club box 还要求去买一张 rts 四零九零的显卡,那网友呢,就给了他一个两千美元的交易账户。现在他的 club box 每天都在盯着川普的发言,看市场走向来自动化交易。 那可要爆的特点是什么呢?它是完全本地运行的,所以用户不用担心自己的隐私问题。而且它还拥有无限的记忆,可以牢记你说的每一句话,当然你也可以随时去修改或者删除它的记忆。而且呢,因为我们可以连到我们的聊天软件上,所以它有更加人格化的互动 啊。最后呢,他会主动发起提醒或者通知。我现在对 ai 的 感想就是,求求你们别更新了,我已经学不懂了。那接下来呢,我会给大家演示一下啊,我们如何快速的去安装免费拥有 carbot 下一个视频呢?我会啊,给大家演示一下如何连到我们的聊天软件中。 在开始之前呢,记得点赞关注开启小铃铛哦。想要免费拥有 clubbot, 你 只需要三样东西,电脑,网络以及一个免费的 google 账号。那现在我们就来到 clubbot 官网, 那里面有很多东西,我们只需要划到这里, quickstarts 这里。然后呢,复制一下这个命令行,点击复制。那从你的电脑上呢?呃,搜一下 terminal, 然后把这个命令行给它粘贴过来。那在这个安装过程中呢,它可能需要你升级你的 note package。 依赖什么的遇到任何问题呢?你可以再打开一个 gmail 的 窗口,随时地去问它。 那我现在呢,这个依赖都是已经安装好的。他现在问我第一个问题,就是说,告诉我呢,这是有风险的,我要不要继续?那你滑动到 yes 就 ok。 然后我们选择 quick start。 啊,那这里选择模型的话,我建议呢,我们先选择 google。 那 接下来呢?他问我选择 google 的 off method, 我 建议呢选择第二个。因为选择 api 的 话,很多人会担心一觉起来 几千刀的这个账单,对吧?那我们直接选择第二个, anti gravity oos token。 这个意思就是说呢,它会先用你 google 免费账号里的免费额度,所以你不用担心会花你很多钱。那我们直接选择这里。 哦,那它现在就自动弹出了这个窗口。那选择一个你的账号 authentication complete。 那 再回到我们这个 terminal 里面。 呃,然后让你选择模型,我们可以就选择这个。呃, current 模型。 那现在呢?选择 channel。 那 我们下一节课会教怎么去连到我们的聊天软件中,所以我们现在呢就摁上键 skip for now, 现在就不安装了 啊, skills 也是我们选择 no, 现在就不安装了,然后 enable hook, 那 你看这里啊,你上下选择它都没有选中,那你需要点击一下空格,选择 skip for now 啊,在安装的时候呢,我们可以再回到官网里面看一下啊,那我们刚才用的是这个 quick start 哦,这里它现在就在问我一些权限啊, 我们滑到底下呢,你也可以去看一下它的 documentation, 然后点击下这个,里面有一些它的文档,官方的文档,比如说怎么 start, 然后 setup, 还有呢安装到各类的聊天软件上, 那这边呢,还有它的 github, 我 们打开看一下啊,你像 github, 我 昨晚看还七万多的收藏,现在已经八万四了, 底下也有它的这个 readme, 可以 看一下它的介绍。那我现在回到我的 terminal 看看它哦,已经 问下一个问题了,那我们呢选择第二个,因为像这个 terminal ui 呢,可能很多人小白看起来不是很适应,那我们直接选择 web ui, 这样呢就会比较友好。那我现在选择以后,你看它就弹出了这个聊天窗口, 我在这里给他发一个信息,我就发一个 hi, 看他有没有回复啊,他如果有回复的话,说明他就已经连接好了哦,你看他现在就已经连接好了。 那接下来这个视频呢,就简单教大家去快速安装我们的 call bot。 下一个视频呢,我会教大家怎么去给它连接到我们的聊天软件中,让我们随时跟他通话,变成我们二十四小时待命的万能小助理, 那今天的笔记呢?我会放在 youtube 视频的下方,当然也欢迎你来加入 u i 发电,一起来学习和交流啊。小红书和抖音平台的观众呢,请看我首页。

兄弟们,给大家录一个新的视频,叫做 cloud boot, 今天比较火的啊,这个网址怎么安装呢?这一条命令复制到终端里面来执行,然后一步一步往下操作。 装完之后我发现一个问题啊,装完之后,然后就是这样子,和切的 gpt 没什么区别,咱们国内能用的,如果你要想用它这个什么贾维斯,类似于这种功能啊,它要接入什么 whatsup、 telegram, 接接这些软件咱们也用不了,对不对?所以对于国内来说没什么卵用。 目前看来是这样哎,因为人家要接入这些软件,咱们都没有也不用,所以就 没什么用啊,最多用他这个聊天的这个界面。那我何必不用切 gpt 或者是 cloud 呢,对吧?好了,兄弟们啊,忘了说我的电脑了,大家都懂得我的电脑配置啊。

cloud bot 真正恐怖的用途来了,我们来看一下这个东西呢,可以去操作我们的浏览器,可以去读取我们的界面,可以去干一切一切的事情,那么我们来看一下,看,直接打开了我的 wordpress 后台, 然后等着他添加标题,添加文章,然后自动发布。这个东西代表是什么呢?代表是说像我们普通的一些牛马真正在做的一些事情,哎,我发个文章,我帮你编辑个文章,我帮你优化一下广告账户这件事 以后老板可能真的不需要雇你了,他用上一个 cloud bot, 然后消耗一些 tool, 然后直接就解决了他的问题,他甚至只需要在远程下指令,然后就好了,看他自己在搞对不对,然后等着他自己发布, 等着他自己发布。我这边完全双手摆在这里没有动了,自己发布成功了 啊,自己发布这个东西,普通小白那些牛马,然后就真的要被干掉了,这个,这个才是 cloudbot 最恐怖的,难怪他火。看一下这篇文章,这个是我动的啊,看,给我发布成功了,牛逼。

hi, 哥哥好,我是小刘。呃,今天我们看这个项目 monty bot 已经到了一百 k star, 然后我们今天来介绍几个开源项目,可以帮助我们在飞书钉钉,企业微信里面实现这种接入 monty bot 的 能力,好吧, 首先第一个就是我们介绍这个飞书,对吧?我们可以在飞书里面很方便的形式,通过转发的形式,对吧?通过能够在用户的飞书里面去哎发送各种命令,然后呢去调用这个 cloud bot 自人体,然后最终实现调用各类的 skills 或者 mcp 的 这种流程。 但是呢,如果想调用钉钉怎么办呢?这时候就需要用到一个钉钉的调节器,对不对?可以用到这个开源项目,这开源项目呢,可以,目前可以帮助你将 cloud bot 和你的钉钉连接起来,也是通过一样的方式建立 web socket 长连接, 然后呢再从钉钉里面发送消息,最后再转发到这个 cloud bot, 那 原理实际上是一样的,对吧?那与此类推呢?还可以在企业微信里面,那目前国内用的最多的可能就是三家了,对吧? 我们可以在企业微信里面通过一个企业微信的插件实现一个哎 web socket 的 长连接,最终实现在企业微信,钉钉、飞书那三个里面去调用这个 cloud bot。 当然你也可以选择去 集成各类的啊 skills, 然后这时候就可以用到这个奥搜 multi bot skills 开源项目,这里面集成了所有目前主流的这个 multi bot 的 这个啊 skills 的 集合体。可以看到这开源项目非常热门,也是经过了三千两百个人的验证哦,可以看到使用的方式也非常简单,只需要把它放到这两个目录下面。那这个时候呢,你得靠到 bot, 无论是在这个飞书钉钉还是协维信都可以实现完美的提升。好吧,这开源项目目前已经攒获了近一百 k。 好 吧,那这本期视频的全部内容呢?我是小刘,我们下期再见。

最近几天,很多粉丝让我讲讲最近爆火的 cloud bot 这款开源的个人 ai 助手项目。 之所以这个项目能火,是因为它是第一个真正实用的自托管 ai 员工,本质上就是一个本地运行的 ai 智能体框架。 经过我这几天的测试,发现 cloud bot 的 功能非常强大,而且应用场景非常广泛,甚至感觉 cloud bot 越用越聪明,因为它能通过长期的聊天实现自我进化,能够记住用户的偏好,还能主动提供建议。 而且 cloud bot 的 能力不是固定的,我们可以在 cloud bot 中通过安装不同的 skills, 让 cloud bot 具备不同的能力。所以如果将 cloud bot 运用好,它能大幅度提升我们的工作和学习效率。而且它的部署非常简单,只需要一条命令五到十分钟就可以完成安装。 而且我们可以将这个项目部署到多种平台,比如说 micro s 系统、云服务器,甚至是树莓派。而且不一定非要买 mac 系统的电脑,我们甚至可以将旧电脑或者旧笔记本上装上 linux 系统来部署这个项目, 而且它还能主动执行任务,具备无限的记忆,远超普通的聊天 ai。 最关键的是,我们可以通过 whatsapp、 discord 等聊天 app 进行交互, 我们可以通过熟悉的聊天方式让 ai 帮我们做任何事情,无论是控制电脑实现自动化工作流,还是开发应用, 它把 ai 聊天工具变成了真正的执行者。本期视频将先为大家演示 cloud bot 的 部署方式,然后我们结合几个比较实用的案例来测试 cloud bot 它的综合能力到底怎么样。 在演示之前,我们可以先看一下 cloud bot, 它的系统架构,首先是用户层,用户可以通过 whatsapp 等即时通讯工具 实现与 cloud bot 进行交互。然后第二层就是渠道层,在渠道层能够实现协议适配、消息解析、格式转换、媒体处理、分块传输,然后就到了网关核心, 在网关这里可以实现绘画管理、消息路由工具调用自动化。它具备的核心功能包括多渠道统一受电箱,还有浏览器自动化,还有系统级的完整访问, 而且可以实现语音唤醒与对话,还能实现可量化工作区,还具备定时任务自动化功能,而且它具备成熟的 skills 生态,并且支持多智能体协助。下面为大家详显示我们如何在本地部署这个项目。首先我们直接复制官方文档中给出的这条命令, 然后打开终端命令行,我们直接将命令粘贴到终端命令行中,直接运行就可以。到这一步的时候要选第一个选项,要同意这个协议,当同意协议之后,这里需要我们设置一下模型的提供商, 在模型提供商这里,大家如果有 open i 的 订阅,那么可以直接使用 open i 的 codex 订阅进行登录,如果想使用 api key 的 话,也可以直接选择 api key。 第二项是 app, 大家如果订阅了 kol 的 订阅进行登录。在 在这里我们就选择 mini max m 二点一 cloud bot 我 最喜欢的一点就是它更像一个本地网关加工具编排,底层用什么模型其实能随时替换,所以今天我们就测试一下,把默认模型切换到 mini max m 二点一模型看看效果。 因为前两天我刷 x 的 时候,看到 cloud 的 作者发了条 x post, 他 说这几天把 cloud bot 跑在 mini max m 二点一上,优化了一些实现,而且体验非常不错。他甚至说现在更推荐这个方案,并强调成本优势非常明显。 所以我们就可以根据 cloud bot 作者的推荐,也将 cloud bot 中默认的昂贵的 cloud 模型替换成 cloud bot 作者推荐的 mini max m 二点一模型。而且在之前的视频中,我也为大家测评过 m 二点一模型。 mini max m 二点一模型给我的感受就是响应速度很快,而且表达风格比较简单直接不啰嗦。对自动化这种来说,这点非常重要,同一个任务,他少讲废话,这样就能更快地把可交付的结果输出出来。而 而且 mini max m 二点一很适合这种二十四小时在后台运行的 agent 场景,因为 cloud bot 本身具有持续运行加心跳机制,在这个时候选择 mini max m 二点一模型就能够实现够用、够快、够省。 下面我们只需要打开 mini max 的 官方后台,我使用的是 mini max 的 抠钉 plunk 套餐,在这里我们就可以创建我们的 api key。 创建好 api key 之后,我们直接复制,然后保存好我们的 api key。 好, 下面我们可以先打开终端命令行,然后我们需要用这一条命令来设置一下 mini max 的 悲四 u r l。 在这里要注意的细节是,我们设置的这个 base url 要和我们申请 api key 的 平台相对应。如果是国内用户,这个 base url 的 域名这里是点 com, 如果是海外用户,这个贝斯 u r l 在 域名这里,这里是点 i o 结尾,比如说我这里就是从点 com 这个平台申请的 api key, 所以 在贝斯 u r l 这里,我这里就要填对应的点 com 这个贝斯 u r l。 设置好之后,下面我们就可以用这条命令来设计一下刚才我们申请的 api key, 我 们直接执行就可以。然后到这一步的时候,我们就可以选择使用哪一种聊天工具与 cloud bot 进行交互, 它支持多种聊天工具,这里我就选择 whatsapp, 然后我们直接选中,这里会在中端命令行出现一个二维码,然后我们需要在手机上打开 whatsapp, 扫描这个二维码,实现设备的连接。当这一些完成之后,下面我们需要设置一下它调用哪些技能,在这里需要我们选择技能的安装方式,我这里就选择第一种,然后这里就会出现多种 skills 让我们去安装,大家可以直接选择跳过当前的这些安装, 然后这里提示需要设置这一些 api key, 然后这里我们可以先略过。到这一步就是请用 hux, 我 这里可以选择第四项,让它实现这个 session 的 记忆,当这些设置好之后,我们直接重新运行就可以, 然后到这一步我就默认选择第一项,这样的话它就自动在我浏览器中打开了 cloud bot 的 这个后台管理的页面,这里有一个类似于 chad 的 gpt 的 对话框,在输入框中我们就可以输入一个内容测试一下。 在这里我让他讲个故事,然后这里他就输出了他讲了一个故事,他不仅支持直接在网页后台进行对话,还支持刚才我们连接好的 whatsapp 进行对话,比如说我们在 whatsapp 中让他讲个故事,然后直接发送 这里他很快为我们讲了一个故事,在这里我们还可以点击阅读更多,这样的话我们就可以完整的来查看这个故事。 在 whatsapp 中我们还可以查看我之前使用 cloud bot 来执行的这个任务,比如说这里自动让它抓取某些网站或者簿上的内容,当抓取完成之后,它就会自动推送到 whatsapp 下面我们先在 whatsapp 中进行交互,来测试一下 cloud bot 它的浏览器自动化能力。我这里输入的提示词是让它调用浏览器来打开 cloud bot 的 官方仓库,并给出这个项目的安装命令,然后我们直接发送好,可以看到这里它自动打开了浏览器, 并且在浏览器中打开了 cloud bot 官方仓库,然后我们看一下它能否输出这个项目的安装方式。 它很快输出了这个项目的安装方式,包括推荐的安装方式,使用 npm 全局安装。这里就给出了具体的安装命令,还有启动命令,还有快速测试。像这样的话,我们就实现了在 whatsapp 中直接通过聊天的形式,让 cloud bot 为我们执行了浏览器自动化任务。 像这样的话,哪怕我们不在电脑旁边,也可以通过手机上安装的 whatsapp 来操控电脑上的 cloud bot 为我们执行各种复杂的任务。在这个网页版的管理后台,大家就可以根据自己的需求来安装对应的 skills, 也就是我们需要 cloud bot 为我们完成哪些任务,我们就可以安装对应的 skills。 想安装这些 skills 非常简单,我们只需要在右侧点击对应的安装就可以。 比如说我这里安装了 blogwater, 它可以监控各种播客是否发布了最新的更新。安装好之后, cloudbot 就 可以来调用我们安装的这些 skills。 下面我们就可以通过 cloudbot 它的定时任务来调用刚才我们安装的 blogwater, 每天定时为我们执行抓取相关的技术文章。 这样的话我们每天就可以准时在 whatsapp 上查看指定网站或者簿刻的文章更新。我们既可以在 cloudbot 后台来设置定时任务,而且还可以通过命令的方式来设置定时任务。为了快速演示, 我们可以直接通过命令的方式来实现创建定时任务。因为刚才我们添加了 blogwater 这个 skill, 所以 我们就可以通过 blogwater 中将我们需要查看的一些簿刻添加到 blogwater 中。 添加的时候非常简单,我们直接打开终端命令行,然后直接执行刚才我们查看的命令。下面我们就可以来执行这一条命令。这条命令的功能就是每天九点来检查这些簿客是否有更新,如果有更新就推送到 whatsapp, 在 名称这里就是这个任务的名称。然后这里就是设置的每天九点,这里是时区,然后大家可以根据自己的所在地来修改时区,然后这里就是给他设置的任务的提示词, 要求大家使用 blockwater 这个工具来扫描这些订阅,并且列出这些最新的文章,确保只抓取与 ai 大 模型或者 agent 或者编程工具相关的这些内容。然后在这个参数这里就让它推送到我的 whatsapp, 下面这个参数就是我的 whatsapp 的 这个电话号码,然后我们就可以完整的复制这条命令。在终端命令行中,我们直接粘贴直接运行这条命令就可以。好,这个命令执行成功,然后我们回到 cloud bot 后台的定时任务这里我们直接刷新一下,这里就看到了我刚才用命令创建了定时任务, 然后在右侧我们就可以点击运行,让它立即执行这个任务,然后我们好看一下效果,我们直接点击执行, 点击执行之后,在下面这里就会显示这个运行的历史,这里就输出了这个今日 ai 简报,这里提示当前订阅员仅捕获十篇已读文章,全部来自我的簿。刻好,下面我们就可以回到 whatsapp 中来查看一下它是否将刚才的这个消息推送到了 whatsapp。 在 whatsapp 中我们可以看到这里它已经将刚才的消息自动推送到了我们的 whatsapp。 因为这里我簿刻上的十篇文章我在之前已经阅读完毕,所以这里它就提示今天没有可更新的这些文章。 这是我们测试的在 cloud bot 中通过创建定时任务来实现将定时任务执行的结果推送到 whatsapp 上的工作流,下面我们还可以继续测试,我们还是先点击 skills, 然后我们找到 coding agent 这个 skill, 这个 skill 的 功能就是它呢,运行 code x c l i cloud code open code, 通过后台进程的方式来实现程序控制, 下面我们就可以在 whatsapp 中通过这个 skill 为我们编辑代码。下面我们就可以在 whatsapp 中输入提示词,让它使用 coding agent 这个 skill, 调用 cloud code 开发一个后台登录页,并调用浏览器查看效果。 我们直接运行查看一下效果,在等待了两分钟左右,这里它自动在浏览器中打开了为我们开发的这个后台登录页,效果还是非常不错的。 这是我们测试的让它为我们进行编程开发的任务,它能自动调用浏览器来打开为我们开发好的这个登录页。像这样的话,当我们不在电脑前的时候,就可以通过手机 whatsapp 来操控 cloud bot 为我们进行编程开发。而且 cloud bot 它支持的这些 skills 非常非常多。由于时间有限,本期视频只为大家演示了基础的使用方式。后续视频我还会为大家演示 cloud bot 的 高级用法 啊。本期视频所用到的代码和指令,我都会放在视频下方的描述栏或者评论区,如果你在视频下方无法找到的话,也可以通过我的博客去查找本期视频所对应的笔记啊。本期视频就做到这里,欢迎大家点赞关注和转发,谢谢大家观看!

刚刚,阿里云正式上线 motbot 全套云服务,全面提供 agent 所需的算力模型和消息应用等。如果你关注近期 a r 圈的热门工具,一定听过 motbot, 也就是 cloud bot。 今天给大家做一个保姆级使用教程视频。 第一步,购买轻量云服务器并安装 molybost 镜像,需要选择海外地区,我这里选择美国弗尼利亚镜像,选择 molybost 套餐配置选择通用型,两盒两 g, 立即购买,等会开通后使用。 第二步,配置 molybost, 前往百联大模型控制台,找到密钥,管理单机创建密钥。 第三步,前往轻量应用服务器控制台,找到安装好 mollibot 的 实体,进入应用详情,放行幺八七八九,端口 配置摆列密钥,执行命令,生成访问 mollibot 的 token。 好 了,今天的教程就到这了,欢迎小伙伴们评论区讨论。

上一期视频我带大家快速部署了 cloud bot, 以及做了一些使用体验的演示。这期视频我会深度分析 cloud bot 的 运行机制和它的上下文工程,再分析一下 cloud bot 当前到底适合什么人用,以及背后隐藏的行业趋势。我们先来看一下 cloud bot 的 整体架构。 collab 本质上就是一个工程化程度比较高的本地部署的 agent, 它本身是不包含任何大模型的。我们在本地所部署的这个项目核心工作就是做上下文工程。那既然是做上下文工程,我们就来看看它拼接提示词的流程到底是什么。 这张图是我通过 cloud bot 的 原码,用 ai 的 id 反向分析出来它的运行流程,整体来看就是一个比较标准的 agent 的 react 机制。当用户发送一个请求以后, cloud bot 会将用户本次请求拼接上一些默认的内容,包括说身份、可使用的工具、当前时间等等, 然后发送给大模型,由大模型决定要使用哪些工具做什么,一直循环到大模型给出了最终的答案,然后返回给用户。我们可以举一个例子,比如说用户发了一个请求,把我昨天让你写的方案增加一个项目计划的章节。 这个时候 clubbot 接到请求以后,就会开始进行提示词的拼接。真正发送给大模型的提示词可能是你的角色是某人的个人助理, 你的风格是语言简短精练,你可以使用的工具包括用户记忆、查询、文件操作。用户本次的问题是把我昨天让你写的方案增加一个项目计划的章节, 你的任务是根据当前的信息判断是否要使用工具或者直接回复用户,这个时候大模型可能会返回调用用户记忆查询, 然后 cloud bot 就 会在本地进行用户的历史聊天记录的查询,查询后再把所有的信息发送给大模型,但是这次会在上一次的提示词的基础上,再增加昨天相关的聊天记录,这样的话大模型就能够知道昨天写了什么方案。 然后大模型再返回需要调用文件操作工具,把对应方案的内容获取出来。 cloud bot 提取文件以后,再把之前的所有信息加上文件的内容发给大模型, 这次大模型就可以开始根据之前的方案增加计划的章节了,最终返回给用户修改结果。好,那么了解了运行流程以后,接下来我们来看一下 cloud bot 具体的提示词结构是什么。 这个也是通过代码反向分析出来的一个结构,可以看到整个提示词工程包含的模块内容还是比较多的,我就不一一去介绍了。对于我来说,我比较关心的任务是什么?抽象层级是什么? 所以我就追问了模型,让他帮我进行分析,最终的结果其实和我设想的差不太多。 cloud bot 并没有给一个明确的任务和具体的抽象层级,只是把可使用的工具、技能以及用户问题发给了大模型。 主智能体并没有给大模型更高层级的引导,让他做任务的规划和子任务的拆分。这也是为什么在上一期视频中, colibot 所表现出来的能力是较为依赖 skill 的, 所以它的泛化能力相比于 minus 来说就会差一些。 我之前在讲 minus 访谈的视频里面提到过, minus 的 抽象层级是你是一个人,可以使用电脑,这样的话就给了智能体很大的发挥空间。 它能够针对一个新的任务规划要怎么做,分成几步,需要使用什么样的工具,如果没有的话,还可以自己去新建工具。最后还有一个需要我们去了解的就是 collabot 的 记忆机制,它之所以能够被称之为个人的 ai 助手, 有很大原因都是因为它可以存储对于每一个用户的记忆。 collabot 采用了两种记忆模式,一种是纯文本的记忆,存储在了 memory 点 md 当中。 还有一种就是向量数据库的存储 memory 点 m d 中存储的主要是用户的整体画像,包括说用户整体的呃性格偏好,重要的背景,还有一些长期可用的知识。 写入方式主要有两种,一种是 agent 自主判断对话中是否出现了对于用户长期有用的信息,比如说用户在某次对话里说了我是一个 ai 研发人员, 或者某一次说了请用中文回答我。还有一种是用户可以在对话里面明确提出来要记忆,比如说请你记住我喜欢吃苹果。 其实底层的写入逻辑都是一样的,都是基于模型本质的能力去判断是否要写入记忆。只不过当用户明确说出来需要记住的时候,对应模型给出写入长期记忆,这个指令的权重就会被提高。 那么向量数据库的存储逻辑就更简单了一些,它是会把所有的对话内容默认四百个 token 就 会产生一个新的 chunk, 记录到向量数据库里面, 后续需要调用的时候,根据关键词在向量数据库中进行查找,找到历史相关的对话内容。那么了解完 clock bot 的 运行机制以后,其实我们就可以梳理出来 clock bot 到底适合谁,在什么场景下使用。 那么首先我们先来看看使用场景, cloud bot 的 这种本地部署的机制,实际上就是帮助用户解决一些需要远程处理的工作,而且这个工作还不能过度依赖真实生活或者工作中的信息。 比如说我们工作的时候,和一个同事在线下聊了一个需求,想让 cloud bot 帮我们梳理材料,整理文档,这种场景是不太现实的,因为你们的沟通记录 cloud bot 并不了解,而且这种梳理文档内容的工作对于大模型来说,执行速度也很快, 也不具备这种可持续性的。让 cloud bot 去工作。 cloud bot 比较理想的工作内容,比如说你是某一个知识平台的博主, 然后给他设定一个收集材料,然后自动整理成文章,再发布到平台的 skill, 每天每隔一个小时运行一次,那么这种场景就非常符合 cloud bot 的 设定。第二个就是适用的人群,我认为 cloud bot 现在的产品形态,面向的用户还是需要有一定代码基础或者大模型知识基础的, 它能够自定义的内容非常多,包括说对于个人的记忆、 skill 可使用的工具,甚至说还可以修改它的原码,让整个智能体的抽象层级更高。 如果说你具备比较强的技术能力,同时又有比较类似的场景需求,那么通过自定义 skill、 自定义工具,确实可以让 cloud bot 成为一个非常有用的帮手。最后我们再聊一聊为什么 cloud bot 会突然这么火爆。首先就是它的本地部署的这种产品形态,它把 agent 的 控制权全部交给了用户 大模型使用远程调用的模式。这样的好处就是刚才我们所说的用户可以在 cloud bot 整体框架下自定义 适合自己场景的 agent。 第二个就是对于用户记忆的本地化管理,刚才我们介绍的 cloud bot 的 记忆模式都是存储在用户本地的。 这种模式其实是我一直比较期待的一种模式,因为现在用户不管是使用任何一家模型,每个模型对于我们的长期记忆实际上都是保存在对应模型厂商里面的,这样的话每次切换模型就会感觉到很难受,因为每个模型认识的你其实都是不一样的。 我最终期待的其实是所有大模型都给用户开放一个可拔插的一个长期记忆的接口, 我跟所有模型的对话都可以统一存储在我的本地或者说某一个自定义的云平台。 这种模式如果从商业化的角度上来看,其实是具备极大的挑战的。最后就是 cloud bot 的 交互形态, cloud bot 集成了很多的通讯软件,用户可以直接通过通讯软件给他发起任务。 这种模式其实从软件工程的角度上来说,和独立的 app 没有太大的区别,只不过就是多了一种入口。但 如果我们结合 cloud bot 个人助理的定位,就会发现,通讯软件中大部分都是在和真人进行沟通对话,当一个 agent 直接出现在了我们常用的通讯软件里面, 其实就给了用户一个极大的心理暗示,我们不是在和大模型沟通,而是在和一个真正的助理沟通。欢迎关注我的频道,获取更多科技新闻的分享和解读。

万万没想到, ai 真的 接管你的电脑,开始替你打工了。就在最近,一个叫 cloud bot 的 开源项目在 github 上彻底杀疯了。原因是他嫌主人的电脑太慢,直接拿着主人给的两千刀启动资金去自主监控 覆盘交易,目标是给自己赚一张二 t x 四零九零显卡。 cloud bot 和你平时用的那种只会聊天的 ai 对 话框完全不同。如果说普通 ai 是 书呆子,顾问只能告诉你第一步、第二步怎么做。那 cloud bot 就是真正长了手的贾维斯,他能直接接管你的日常管理邮件、安排日历、办理登机、控制智能家居,甚至执行系统终端命令。这一切操作,你只需要通过常用的 telegram 或 whatsapp 发个消息就能完成。 想象一下,你躺在床上给他发条消息,他就能在后台帮你修好 bug, 写完代码并发送邮件。甚至有博主测试在网上盯不到热门餐厅时, cloud bot 会调用语音 ai 直接给餐厅打电话沟通,最后完成预定。他不是在教你做事,而是已经帮你把活干完了。 cloud bot 有 这种让人头皮发麻的能力,其实主要源于它的三大核心竞争力。 第一,它拥有持久记忆,不同于叉 g p t 和 cloud, 每次开启新对话就会失忆。 cloud bot 能记住几周前你提到的每一个细节,是真正懂你的习惯。第二,他会主动找你,早上他会主动为你汇总简报,发现你关注的任务有变动时, 会第一时间向你预警。第三,它是一个中疏网关。简单来说,它就像一个超级链接器,一头连着即时通讯软件, 一头连着 cloud gbt、 four o lipstick 等顶级模型,中间还挂载了无数实用的自动化工具来帮你干活。更传奇的是它的创始人 peter steinberg, 它创办了著名的 pdf 开发工具公司 ps pdf kit, 并在二零二一年 获得了一亿欧元的投资后成功退休。但离谱的是, peter 发现财富自由后的退休生活极其空虚,于是他决定重回战场,折腾 ai。 据说 clubbot 从灵感爆发到原型落地,他只用了不到一个小时。这里是 ai 风向标,带你了解 ai 行业 最新动向。更有趣的是, clubbot 的 爆火意外带火了 mac mini。 为了二十四小时运行这个数字,员工很多。开发者发现 mac mini 简直是神机,性能稳定,功耗极低, 环境兼容性好,而且不容易触发某些平台的安全验证。所有大佬一口气缩哈十二台 mac mini 组建 a 阵军团,那普通人能用吗?答案是完全可以! 你不需要买 mac mini, 家里积灰的旧笔记本、游戏 pc, 甚至每月三到五美元的廉价云服务器都能跑。 quadbot 在 github 上完全开源免费,你只需要配置一个 api key, 比如说 openai。 quadbot 的 基础功能,甚至只需要两 gb 内存和两核 cpu 就 能完成驱动。但必须提醒一句, 这个助手有很高的系统权限,建议在独立设备或服务器环境中运行,别在你的主力电脑上乱搞,不然可能误发邮件,乱动文件。 club 的 火爆也释放了一个强烈信号,二零二六年 很可能是个人 agent 的 原点。 ai 正在从程序员的小圈子走向每一个普通人。以前一人公司还只是商业概念,现在有了这类工具,一个人真的可以指挥一支 ai 军团。关注我,下期教你手把手部署这个数字员工。

这两天一款叫做 cloud boot 的 软件火起来了,也是一个 ar agent, 但是在聊在思考 cloud boot 的 本质之前,还是先要把另一个发音相同的 anaerobic 这家公司的 cloud code 以及 cloud code work 聊清楚, 甚至于要把 cloud code 聊清楚,还要先把 cursor 聊清楚。去年是号称 agent 的 元年,大模型出来之后呢,首先是以 chatbot 的 形态出现的啊,什么叫 chatbot? 聊天机器人啊?为什么 openai 的 产品叫做切 gpt 啊? gpt 是 它的技术, 也就是我们通常所说的大模型吧,而 chat 是 它的应用形态,真正的大圆模型,它只会做词语接龙啊,它是不具备聊天的能力的。而我们在前面套了一个 chat 的 壳子,做成了一个 chat 的 应用啊,是这个应用本身 让我们能够跟大模型来对话,后来为了让 chat 的 体验更好呢,会加入记忆的机制以及等等其他的优化手段吧,但呢,都没有脱离 chat 的 形式。 chatchat 之后,下一个相对比较有声量的啊, 有一定知名度的,有划时代意义的吧。的 agent 产品呢,就是最近被 meta 收购的 manners, 它在服务器上,在服务端给大模型开辟了一个独立的沙盒环境, 这个沙盒环境里面有一些啊,传统的应用,浏览器啊, word, pdf, excel, 甚至是编程工具等等。那么我们用户呢,只要给 manage 的 服务端的大模型发指令,这个大模型就会在服务端持续的执行,同时在我们用户的前端界面上反馈实时的执行结果。这是一类跑在服务端的通用 agent, 它并不浪费我们本身自己个人电脑啊,个人设备的算力,个人设备只是一个交互窗口,在浮端大模行为你工作的期间,你还可以干自己任何想干的其他的事情。与此同时,在编程领域, cursor 逐渐火起来了,它跟 anders 的 思路完全不同, 它主要是在我们的本机上调用远程的大模型,但是所有 agent 的 逻辑是在本机执行的,或者说它的工作目录是我们本地的文件系统, 我们给 curser 分 配目录权限,分配文件权限的方式就是我们打开一个项目,那么 curser 就 只有对当前项目录定下所有文件的相关的编辑阅读权限。那么 curser 左手是大模型,右手是我们的本地的代码文件系统,中间就是他自己,就是他自己。这个 agent 的 逻辑, 他在理解了我们本地文件系统的情况下,把我们的诉求以及当前的项目里面的相关的补充信息一起丢给远程的大模型。远端的大模型产出结果以后啊,这个结果里面就包含了要去编辑哪一个代码文件,要去创建哪个代码文件。 拿到大模型的响应之后, cursor 本身作为一个代码文件的编辑器嘛,它本身就是基于 vs code 的, 它来帮我们按照大模型的指令修改我们本地的文件系统当中的代码文件修改完了以后再以 diff 的 方式呈现给我们人类程序员来审核。当然实际上的工作机制比我讲的要复杂,比如说 curse 作为一个 agent, 它也不是纯粹的本地化的 agent, 它也有服务端的部分啊,它会把我们本地的代码向量化以后,存储到服务端的向量数据库,当我们提问的时候, 它会到向量数据库中抓取出跟我们问题相关的代码片段信息,跟我们的提问一起提供给大模型。 这里科室本身的价值在哪?面向大模型的时候,科室的价值在于帮我们做了相当那一部分上下文管理的工作。我们的提问只是简单的一句,但科室需要根据我们简单的这句话来找到我们代码中的相关的文件啊。补充给大模型, 大模型的回答呢,也会在科室的指引之下,符合科室所规定的结构化的回答啊。另一方面呢,科室会把大模型的回答翻译成我们人类所能理解的方式。什么样的方式呢?他就是把大模型的回答呈现到 我们的代码编辑当中,以 def 的 方式告诉我们大模型希望修改哪一段代码,修改前是怎么样,修改后是怎么样。那么你作为一个人类程序员,你同意吗?如果你同意啊,这个修改就会正式发生,如果你不同意,这个修改就会被撤销,或者说这个预览就会被撤销。 当然,科四的后续版本当中也逐步迭代了,比如说像服务端编程这种方式啊,它也支持在服务端给我们开辟一个沙盒环境,从服务端拉取我们的代码,在服务端完成编程以后,再把这个代码推送到我们代码仓库,我们本地再来审核这个代码。 这种方式与它最早的客户端 a 键的方式没有本质的不同,只不过交互界面从 vs code 换成了浏览器 代码的存储位置,从我们的本地变成了远程的 get 仓库。但实话来讲,我始终没有深度的用过科尔斯的服务端 编程的这种方式,因为科尔斯的产品定位,你能感受到它始终还是一个辅助人类工程师的这么一个角色,真正的编程主体,或者说决策主体还是人类程序员,那么它的每一个任务是相对比较琐碎的,可能最长也不过五分钟,八分钟就能完成了。 那这样的情况下,我觉得还是在本地环境直接等待效率会比较高一些。只有说这个任务,比方说他要执行两个小时,要执行一个晚上,我可能会把他丢到服务端,我本地呢, 再去干其他的事,否则的话去兜一大圈啊。把我的代码放给仓库,让 curses 的 远端服务器从给仓库取这个代码,然后再去提交一个代码审核,我觉得效率反而是降低了的。讲到这里,就不得不提后来居上的 cloud code 啊。 虽然都是 ai 编程工具,但 cloud code 的 产品定位我觉得跟 cursor 是 完全不同的。 cursor 相对而言更像是一个独立的 ai 工程师。它一经推出呢, 就跟 cursor 有 两个最巨大的区别。一个呢,是它不像 cursor 一 样有人机交互界面啊,它没有 vs code 的 这个壳,它是一个纯命令行的工具。第二个呢,它不像 cursor 一 样有向量化数据库。 cursor 是 完全模拟人类工程师的工作环境,不断地在代码库里进行 关键词的解锁啊,尝试去理解整个代码库做 code 的 迭代,目的啊,始终是想让这个 ai 编程工具更独立,更自主,减少人类工程师的介入。最好你给 clock code 的 一个指令,它就能独立的符合诉求的完成整个任务,最后人类工程师进行 整体的验收就好了,而不需要拆分很多碎片化的小任务。为了达到这个目的呢, cloud code 创新性的提出了 m c p 啊,提出了 stu, 提出了轨道的函数,勾子啊,提出了自定义命令。理论上,我们可以基于自己的工作流, 把 cloud code 定制化成一个完全自动化的能够完成常识任务的这么一个编程伙伴吧。 就是说 cloud code 你 不能把它仅仅理解成是一个辅助你进行编程的工具,或者你不能把它直接作为一个开箱即用的产品。你要想发挥出 cloud code 的 最大的优势,你一定要去 根据自己的工作流,根据自己的需求去开发 cloud code 的 插件。这些插件包括什么?就包括了刚刚我们说的 skills, 我 们说的 sub agent 啊,子代理,我们说的生命周期毁掉。 什么叫生命周期毁掉呢?哎,我克拉克觉得一个人物快要完成的时候,我触发了一个事件,触发了一个函数,这个函数会再调起一个新的绘画啊,告诉他我这个任务还没有完成很好,或者我这个任务要去进行下一步, 这样就能极大的避免大模型上下文窗口的限制,极大的避免大模型总是希望在一定的时间内或一定的输出量之内就结束这个任务。 这样一套机制就让整个智能编程代理能够自动化的拉起一个绘画,解决一部分任务,再拉起一个绘画,解决另一部分任务,再拉起一个绘画啊,甚至让整个智能编码 a 键的有自己的一套子 a 键的角色分工体系,有的人是产品经理,有的人是工程师,工程师分前端,分后端等等,按照我们自己的工作流去定义, 所以本身我们可以针对 cloud code 进行编程,针对 cloud code 进行二次开发,形成最终自己趁手的那个工具。一个不恰当的比喻是 cursor, 像是我们直接买回来的一台遥控赛车啊,我们可以 直接上手把玩直接买回来的一个玩具,直接把玩 cloud code 像是买回来的一堆乐高,我们可以按自己的需求拼接成我们自己想要的玩具, 不太恰当,大概是这个感觉,那么像 cloud code 这样的产品形态啊,秘寄于命令行的它,天然就更加对服务端友好了,所以 cloud code 也提供服务端的 a 键的产品。有一个跑在服务端的 cloud code, 它会拉取我们的代码进行修改,再推送到我们的代码库,等待我们的去到审查合并。讲到 cloud code 呢,其实就必须要聊一下 skills, skills 是 能够让我们这些 agent 啊脱胎换骨的一个创新啊, 这里也能看出来为什么 skills 这种创新会发生在 cloud code, 而不是 cursor。 就是 我刚刚说的, cloud code 始终是希望这款产品能够更加自主的编去编程的,而不是仅仅地接受人类工程师啊碎片化的指令。因此它就需要 skills 这样的机制啊, 通过 skills 来定义。说我这个 cloud code, 我 作为一个 vr 软件工程师啊,我到底具有什么样的技能?或者说 你人类工程师雇佣了我,你希望我具有什么样的智能技能啊?那你就通过一个一个的 skills 告诉我,那么 cloud code 在 接受到人类工程师的某个指令的时候,他就首先会看我要用哪个 skill 来执行这个指令, 那么执行完这个指令以后的结果自然就是很符合人类工程师的诉求的。当然像 skills, 它一定是渐进式批录啊等等等等这种技术层面的概念,你就先深入了,那个都是他为了达成这个目的 而引入的手段和机制啊。我一个 cloud code, 我 有几十上百个 skills, 每个 skills 都是那么长篇幅的说明文档,我肯定上下文窗口就爆炸了嘛啊, 所以需要渐进式的,譬如这里也可以看出,其实所有的这些 a 键的形态, a 键产品本质上做的工作都是叫上下文工程啊。在 skills 之前, cloud code 其实提出了 mcp 的, mcp 的 问题是什么?问题就是它太占用上下文窗口了。 而且 m c p 呢,只适用于远程模型调用啊,远程的方法调用只适合模型跟模型之间的这些调用,但是我本地的模型,我想调用一个啊,命令行工具,或者我想写一个符合规范的代码啊,这种 m c p 就 有它巨大的局限性,所以 colocq 才推出了 skills 啊。 我们只有明白了 colotcode 的 产品定位,它跟格式的区别,我们才能更好的运用 colotcode 的, 我们也才能更好的决策什么时候用 colotcode 的, 什么时候用用格式。我们很多啊,程序员其实日常的工作也就是用 colotcode 的 来改个 bug, 来写个小需求,甚至于还非常在乎每一段代码的代码质量,这个时候其实就不太适合用 colotcode 的, 直接用格式就好了。他的人际交互形态是更好的啊,也就是卡帕西所说的,他的那个滑块是更居中的。 当然你用 cloud code 也行,那你也尽量别去用那个纯命令行形态的 cloud code, 你 可以去结合啊,代码编辑器去使用,你可以使用它基于 id 一、 a id 二的插件等等吧。当然你说,哎,我就一边开着代码编辑器,一边开 cloud 的 命令,行啊,我结合着用也行啊。 只是说两个产品定位是有差异的,但他们也都在互相向对方靠近,也没有那么非黑即白。包括 curser 也在跟进 clodocode 的 skills 啊,也在跟进 clodocode 的 回调啊,甚至也在跟进 clodocode sub a 千塔再往下啊,就是最近 clodocode 的 兄弟产品的推出,叫 co work 阿斯罗密克这家公司,就发现有太多的非程序员,或者说太多的用户用 clodocode 去干一些非编码的工作。因为 clodocode 能够随意地在一个特定的文件夹下 修改各种文件,能够调用浏览器,能够通过 m c p 调用远程的服务,能够通过 skills 拥有特定的技能。 那其实 cloud code 它不仅仅就可以局限于写代码这个场景了。我们电脑里面某个文件夹下有某个项目的大量的 word 文件、 excel 文件,我可以把这个文件夹的权限给到 cloud code, 让他来帮我读取这些文件,针对这些文件做整理啊, 包括 co 的是能干这件事情的,只是干的不那么天然,不那么自然,人际交互不那么友好。所以在这种情况下, collog 推出了它的 co work 产品。 co work 是 一款什么产品?它就是 把我们最早聊的 mars 的 服务端的计算过程,服务端的运行逻辑,提前到了客户的本地。但这就带来了巨大的好处,因为我们 用户所有的文件资料其实都在电脑本地。我今天不可能让 minulus 帮我干一个活,以后我要把我所有的文件资料,几十个 word 文档全部上传给 minulus 吧,那个体验太差了,所以 minulus 只能干一些简单的活。我给他一个某个 word 文档,我让他帮我做某件事情。但如果让他基于我某个文件夹上已经存在的几十个 excel 啊,做数据汇总,做统计, 曼纳斯的体验就很难了。所以 coco 就 解决了这个事情,他在用户本地的电脑上,就在用户的本机上,去读取用户指定的文件夹下的各种形态的内容啊,基于这些已有的内容, 完成用户指定的任务啊。在完成任务的过程当中,还可以去调用浏览器查找资料,甚至可以调用浏览器来执行任务。比方说,打开你的 某个社交网络的账号,帮你发一篇帖子,打开某个电商网站,帮你购买一件商品。也就是当你赋予了大模型 文件夹的权限,赋予了大模型使用浏览器的权限,再告诉大模型,他拥有了一些额外的技能啊,这个技能就包括了执行一些,或者调用一些你的定制化工具啊,某些程序脚本这样的能力,那这个大模型 跟你本人在平常的工作流,跟你自己的工作方式没有多少差别了。 我们想想我们自己平时工作干嘛?不就是打开一个文件夹,读取一些文件,然后思考,然后再改改文件,或者再创建一个新文件。不就是打开浏览器,点到这个网站上,看一看一些信息,然后思考,然后再进行跟网站的进一步按钮,点击交互、打字、发帖、下单、购物。 我们人类这么强大,每天对着电脑做的事情也就仅此而已啦,所以 co worker 天然就具备了这样的能力。 但是这里面有一个非常核心的点啊,一定要记住,我们必须给 cocok 指定一个工作目录,就是这个 cocok, 他 不能霸占我的整个电脑,他不能对我整个电脑的所有文件夹,所有数据都有独取权限啊!这里面有隐私的问题,有安全性的问题。 今天的 cocok, 当他具备了跟你自己一样的能力,当他来当你让他来帮你做一些事情的时候,就相当于你雇了一个助理,你让助理来帮你做一件事情,请问你会把你的个人电脑权限完全开放给你的这个助理吗?不会的, 你只会给他某个特定任务的文件夹的权限,甚至你会首先预先把跟这个任务相关的资料整理到一个文件夹下,再把这个文件夹开放给这个助理。那其实聊到这里啊,这两天刚刚爆火的 lord boot 就 呼之欲出了。 今天,当我拥有了一个能够操作我电脑里面的文件夹,能够使用我电脑里面的程序,能够使用我电脑里面的浏览器的。这样一个助理的时候,我还何必跟他共同使用同一台电脑呢? 我们何必要两个人挤在同一台电脑前面呢?我给他也买一台电脑就好了呀。然后我把我希望他做的任务发给他,我把他需要的初始资料啊,不管几十个文档还是 excel 等等,全部发给他,他做完了以后把结果再发给我就好了。这就是今天 我们的老板指挥我们干活时做的事情啊。老板出差在外地了,他也通过微信给我们发个指令过来说,哎,小张,把这个方案改一下啊,他把原始方案文件发给我,把修改要求发给我,我这边框框一通改,改完以后再发给他,是这样一个过程吧。所以今天我们就一下子理解了 所谓的 cloud boot 了,我们也去理解了为什么这两天因为 cloud boot 的 出现, mac mini 会卖爆了,因为所有人想要使用 cloud boot, 他 首先要给这个 cloud boot 是 啥?是他请的一个助理啊,他得给助理 配一台电脑啊,这个助理不能跟他自己,不能跟我自己挤用一台电脑啊,不能说,哎,助理,你来帮我干个活来,我把椅子挪开,你把椅子挪过来,你来开始干活了。我在边上看着,而是说我要给这个助理买一台电脑,而这个助理本身他毕竟不是人啊,他不需要显示屏,他不需要键盘鼠标,他是程序,他直接就能够 读取我们电脑里面的各种文档,他直接就能够编辑这个文档,他跟我们电脑的交互方式跟浏览器的交互方式不是通过显示器读取,通过键盘鼠标键入的,他都是程序化的。 他读取浏览器是通过调用截图工具来截图,然后读取图片啊,甚至他是通过理解某个网站的源代码啊,来了解这个网站是干嘛的,怎么进一步跟他交互啊? 它可能是通过自己写的一小段 javascript 脚本来达到了点击按钮的目的,所以它不需要键盘鼠标,不需要显示器,它只需要一个主机,那么最好的形态,今天就是 mac mini 啊, 一个小方盒子,所以 mac mini 就 卖爆了。那么今天我买回来一个 mac mac mini, 我 在里面装上了 cloud boot, 在 里面装上了聊天工具啊,类似于微信啊这种,当然现在这个国外的东西,它还不支持微信啊。装上 slack, 我 自己的电脑不受任何影响呀!我在我的电脑上,我在我的手机上,我给这个助理的 这个助理的 mac mini, 我 给他发过去一条指令,我给他带上原始的方案,丢给他,他收到以后,他就按照我们的意图开始干活了。 怎么干活的?当然他还本质上还是一个 a 键呢,他要把相关的上下维工程做好以后丢给大模型啊,是大模型,是真正的大脑,而这个小盒子,这个 mac mini 里面的程序,它只相当于眼睛,相当于手啊。 活干完以后,他再把结果通过聊天工具发回给我们,这个过程太丝滑了,没那么神秘啊。 今天大家理解任何 a 键的产品,理解任何 a r 产品,你就把它想象成一个人就好了,你的一个助理就好了,他只是各种受限程度不同而已啊,能力水平,能力层次高低不同而已。那么聊到这里,大家会发现,哎,这不又回到当初 mails 那 个逻辑吗?我在客户端发送一个文件,加上指令给到服务端啊,我旁边这个助理就相当于服务端嘛。 只不过原来 melissa 是 什么?是雇了一帮助理,几百个助理,在 melissa 的 写字楼里面,我们消息发过去以后,这个助理干完了以后返回给我们结果。而今天是什么?我把这个助理请到家里了,这个助理只为我一个人工作,这里面的差别在哪啊?差别在于当一个助理服务很多的人的时候,他很难记住每个客户的需求。 而当今天 croobo 我 自己这个私人助理只服于我的时候,他就对我越了解,他干出来的活就越符合我的期望啊。 抛弃这个类比不谈,我们回到具体的技术层面。 manners 当初要想实现他的这种通用人工智能助理的目的,他是在他的服务器上给我给每个用户开了一个沙盒,这个沙盒是临时的,我一次任务结束,这个沙盒就消失了,我发送给他的所有文件就没有了,我发送给他的指令就丢失了。 这样导致我每次让这个服务端的助理帮我干活的时候,我都要给他精准的描述我的需求,把所有文件堆给他。而当这个助理变成我私人助理的时候,今天所有的数据就在这个 mac mini 的 小盒子里面, 就存储在这个自己的硬盘里面,内存里面我今天发给他的文件他就存在那里了,他就放在自己的电脑里面了,就像你今天让你的助理干个活,真人助理啊,你发个我方案给他,他处理完以后他不一定就立刻要删掉,他可能放在这想,哎,这个任务还没结束,过两天老板可能又要让我改一下,那我直接拿出来再改就好了, 所以这是巨大的差别。我们让本地的这个 cloudfoot 给我们干活的时候,是跨越时期的,他所拥有的那个电脑啊, 也是会慢慢丰富起来的。就像我们真人买了一台新电脑以后,随着工作时间的变长,会积累越来越多的文件,他也一样,而他积累的这些文件全是他给你干活所积累下来的。没有他自己的私人的物品啊,他不存在私人的生活和工作, 这是很大的一点区别。另外一点区别是什么?就是它是有记忆的,我今天发给他的所有的指令啊,我跟他描述的我的偏好,他都会记下来,当然这就程序化的,本地有个数据库,对吧?会记下来这些偏好,所以我跟他的磨合是会越来越好的。这就聊清楚了,为什么从 cooke 一定会演变成 cloud boot 的 形态, 而 cloud boot 的 形态很像最早的 melus, 但为什么又跟 melus 有 巨大的不同,而 cooke 为什么得以出现? code 的 前身是什么?就是 cloud code, 理解了 cloud code, 就 理解了 code 没有本质的不同。而 cloud code 的 前身又是谁?是 cursor, 理解了 cursor 的 使用场景,就能够差异化的理解到 cloud code 的 使用场景啊,就能够进一步理解到 cloud code 的 使用场景,进而就能够理解了另一个 cloud boot 的 使用场景和价值,所以这些都理顺了以后,我们来着重聊一下 cloud boot 的 使用场景和价值,所以这些都理顺了以后,我们来着重聊一下 cloud boot 的 使用场景和价值,所以这些都理顺了。他今天最核心的解决了什么问题啊? 首先它解决了远程沟通的问题啊,过去我们实现远程沟通,你看 manners 是 自己定制的聊天界面啊,你像 cursor, cloud coat 肯定是自己定义的网络通信协议 co worker 啊,也是要基于 cloud 的 客户端的一个程序。而今天 cloud boot 它是基于我们已经习惯的那些聊天工具啊, qq 啊,微信啊,当然这些暂时都不支持啊,那像国外的就是啊, snack 呀等等。 这就很像今天我们啊,不管用飞书也好,用钉钉也好,他背后都有智能助理嘛,哎,他的天然形态都是跟飞书啊啊,钉钉啊,他的那个即时聊天界面相结合的,我们都可以通过艾特的方式,或者直接找到这个机器人跟他聊天的方式来让他帮我们完成任务啊。 cloud bot 他 也是这样的形态, 它不封闭啊,它是基于已有的大家在用的这些流行的聊天工具啊,它对接了它们的接口,它让我们的服务端的这个独立的小盒子, mac mini 这个助理能够具备从聊天程序当中拉取指令, 调用聊天程序,返回指令给我们这样的能力。这个是 cloud bot 解决的第一大痛点啊,也是它第一大创新点,也是 cloud co work 还没有解决的问题。那么它第二大特点呢?就是它具备了本地的记忆的能力, 而这种记忆策略是什么啊?我觉得目前 cloud bot 的 记忆策略不一定是最优的,因为你像切 gpt, 他的切 bot, 他的聊天,他也很早就有了记忆的能力。那这种怎么样去采集记忆啊?怎么样去存储记忆?怎么样去调取记忆? 哪些是用户需要去记住,哪些是不需要去记住的?这个策略各家有各家的差异,包括 cursor 也有它的记忆功能啊。那么 cloud boot 今天它的记忆策略不一定是最优的,但它有这个记忆的策略啊,记忆也不是它独创的。第三呢,就是它本地的这个对文件系统的管理,我觉得这也是 cloud boot 这款产品巨大创新和突破性的地方。 刚刚我们一直很自然的类比说,哎,他拥有了一台自己的电脑,拥有一台自己电脑这件事情突破性是非常大的,从此再也没有文件加权限这回事了。我不是说在我的电脑上给他开辟一个文件加权限,而是他拥有自己的一台电脑,我希望他处理什么文件,我发给他,他就存在那了,我下次也不用再发给他一遍了。 所以这个 cloud bot 他 是对他拥有的这台电脑的所有程序都有掌控权限的,他是可以随意操作的。 为什么他可以骚随意操作?这里就天然解决了安全性的问题,他今天任何一步操作错了,都不会影响到我自己啊,我们人类用户这台电脑上数据的安全性啊, 这整个独立的一个 mac mini 小 电脑,就是一个沙盒,他可以随意去操作。这个我觉得是 cloud boot 巨大创新的地方,那么是不是意味着 cloud boot 这个开源产品啊?当然,未来他一定会商业化,一定会成功呢。啊,只能说有这个可能,他的这个形态是一个终极形态啊。 实话讲过去,可能一年前吧,我就在探索啊,我去网上搜了一堆啊,怎么样能够?我很希望说我家里放一个算力很强的这个 mac 主机,但我出门呢,我就不想背一个 mac pro 很 重嘛,我就带一个 苹果最轻量的一个轻薄笔记本,很轻,随时随地都能办公,但他的算力又不够,哎,那么我通过远程的方式,让家里的电脑来给我干活啊,他干好的活以后再来,我再来远程去检查,去审查啊。 为此啊,在网上找了很多硬件产品,软件产品,而今天 dropbox 天然就解决了这个问题。所以说这个场景,需求场景是一直存在的,我相信所有人都有这个需求场景,尤其当大模景越来越强大 以后,能帮我们做的事情越来越多以后啊,这个形态必然会越来越是刚需。谁不希望拥有自己的一个私人助理呢? 我们不是不想有,我们只是请不起嘛,付不起一个月两万块钱,一万块钱的工资嘛。可是当这个成本降低到一个月两千块钱、一千块钱的时候呢?也许我们就有这个意愿了,或者说人人都有这个意愿了。所以说这个形态一定会成熟和流行起来的。 但是 called bot 也必须要去面对巨大的竞争。当这个形态被验证,你觉得 bot 奥斯罗克这家公司不会跟进吗? 当前的 cowalk 这款产品已经很成熟了,只不过是在用户的本地电脑上运行的,那他只要稍加修改,也可以变成一个在独立电脑上运行的一个远程助理了,甚至是 millis 也可以推出私有部署版本呢,甚至是苹果 也可以直接推推出家用的私人助理的硬件产品啊,里面就内嵌了软件,而且天然跟他的苹果的个人效率工具,麦克啊, ipad 啊, ios 啊,天然去打通啊。所以这个想象空间是巨大的啊, 一堆的在传统赛道上已经有优势的这些玩家,这些大流氓啊,这些大厂商也都会杀进来的。今天 cloud bot 只是见证了这个需求场景,这个关键假设,它只是向人们证明这种形态是可行的,是最受欢迎的。 今天我们仅仅是处在这样一个阶段,以现在为起点,可以想象到这样一个形态会越来越繁荣,会越来越丰富啊。 这个独立的助理啊,远程的助理,这个 mac mini, 这个 cloud boot, 它的能力会越来越强大啊,我们跟它的远程交互体验会越来越好。未来可能不仅仅是通过聊天给他发送指令了,我们可以有 一起协助的某个界面,我们甚至远程可以看到他工作的那个界面,虽然他本身工作不需要一个显示屏,但他可以把相关的工作过程展示给我们,可以把相关的工作结果展示给我们。也就是说,让 cloud boot 这样一个现在还比较极客,比较工程师化的产品,变得越来越消费化啊,越来越消费劲。 这种事情,苹果太上缠,谷歌也太上缠了啊,一堆公司太擅长了,所以最后还能说什么呢? 最后只能说一人公司会越来越成为可能啊,可能性会越来越强。也许以后你租一个办公室,其中一间是你的工位,其他所有工位上都是摆的 mac mini 啊。你摆了十个 mac mini, 相当于你有了十个员工啊,这就是这家一人公司。

为什么说苹果最值得买的产品不是 iphone, 而是这个小东西?因为这两天出现了一个叫可乐 boss 的 ai, 只要装到这台电脑里,就能代替人类帮你打工,不信你看,那是我的电脑,我只需要用手机给他下个指令, ai 就 开始帮我干活了。 我下个指令,帮我打开影视巨峰的频道。看好了啊,稍微反应两秒,哦,看到没看到没看到,没 有人说了,这些东西三岁小孩都能干。但是你看这个 ai 真正好玩的地方是,他能学习技能,想学哪个点哪个,剪辑视频的技能,操作备忘录的技能,处理 pdf 的 技能,你看他正在学习,十几秒就学会了操作备忘录,我们来试一下。用手机给他发个指令,帮我把这句话写到备忘录, 看到没有,他自己操作电脑帮我写好了备忘录。这个 ai 工具刚出现一周,已经有几百个技能可以学习了,关键是晚上他能自动的去学习。我的这个 ko bot, 才两天,也就是一年级的水平。 国外一大神的 clubbot, 大 晚上自己操作电脑注册了个电话博主,刚睡醒,电话来了,是 ai 打的, ai 说以后有啥事可以通过电话通知我了,我就操作电脑帮你干。有没有发现这跟我们玩游戏练等级一样,不过我们练的不是等级,是一个数字的。助理员工,今年过年,我必须把我的 mac mini 揣兜里带回家,别人遛狗 我遛。人工智能这个 ai 工具是开源的,虽然更适合装到 mac mini 里边,但是其他大部分电脑也能装,十几分钟就能装。好 想学我也能出教程,但是必须提醒一下,开源的东西有很大的风险,一定要保护好自己的隐私。其实我建议大伙等一等二点零版本,到时候它就可以进入自己本地部署的大模型,不用烧 tools 了,也更完善一点。

一个叫 clubbot ai 产品横扫全硅谷,整个世界为之疯狂。一个视频给你讲清楚它到底是什么,和其他的 agent 产品有什么区别,以及我们到底如何去使用它。首先大家最关心的是,它跟这个市面上每天都在发布的 ai 产品到底有什么区别? cloud 本身它并不是一个 ai 的 模型,它更像是一个入口,而这个入口呢,并不再是它给你设定好的,而是你们日常都在用的一些聊天软件,这个是它跟其他 ai 的 产品最大的不同。那我们也趁机给大家讲一讲目前整个世界上 ai 产品的几个分类。 一类呢是像去年最火爆的 manners, 那 么 manners 它的出发点非常的好,它不希望用户跟 ai 去抢电脑,所以呢,它给每个用户在它的 云上都设定了一个不同的一个沙盒,你给他的任何的任务呢,他都会在他的这个沙盒里去运作。比如你说帮我去网上找找什么东西,然后给我写一个 ppt, 做一个小小的网页,那么他不会在你的电脑里运行,他会在他给你设定的这个虚拟机,或者说叫沙盒里面运行好之后,把这个结果给到你。这个呢是 manners。 第二类呢,就是像近期非常火爆的 cloud co work, 又或者是刚刚推出的 minimax agent。 二点一他们做的事情呢,是你在你的自己的电脑上 安装一个 app, 那 么在你的电脑上它就可以去用到一些文件啊,用到一些文件夹呀,任何你希望它在你电脑上操作的东西,比如把这 excel 打开,给我做点什么事情,都可以在你的电脑里去完成,那么它呢好处就在于所有东西跟你自己的系统里的 所有的文件都打通了,那么不好的呢,也就是它会跟你去抢电脑,那么也是个 manners 被解决的事情,所以呢,可 work 或者是 matters, 它们是一个互补的,并不是直接的竞争的关系。那么第三类呢,就是我们今天要讲的 club box, club box 跟前面两个最大的不同是,你不用用别的公司所给你设定好的入口,比如像国外人经常用的 slack, whatsapp, discord 或者 telegram, 那 么我们可以用这样的聊天软件直接去跟这个 ai 沟通,这个是你感知上最大的不同。 那么第二个不同呢,既然是用这样一个聊天软件,那么你需要给它做一个 account, 也就是你可以给他自己定任何的名字,你可以叫他张三,你可以叫他李四,而不是名字叫做 minimax 啊,或者叫做 minnesus 啊,或者叫做 claw no, 名字是你自己来定的,明白吗?就好像你在跟别人聊天一样。第三个呢,是一个很重要的点,叫做 memory, 所有的这些 ai 的 产品都有一个叫做上下文的窗口,你会发现你给他贴很多的东西,他瞬时间就不知道该怎么办了,或者直接给你报错。但是呢,我 我们也不知道 cloud 是 在背后怎么样去做任何的这种 memory 处理的,总之你会发现它是无限的上下文,你前天跟他说,上周跟他说的事情,他仍然可以记住。那么待会我可以给大家举几个例子,它会给我们带来一个很有趣的一个概念,也就是第三个我给你讲的一个区别叫做 主动性,比如说你在跟他沟通一段时间之后,他会发现你自己有一个习惯,每周二你都会主动要去给某一个人发一个 newsletter, 那 么做这件事情你会发现他就了解到你的这个工作习惯了,那么在周二的时候,他会自动啪弹出一个 各种各样的一个 newsletter 给你去选择,说我已经帮你 draft 好 了。这种主动性或者叫 proactive, 是 目前市面上所有 agent 的 产品 都没有的唯一一个相似呢,是 pos 叉 g p t 的。 那么 g p t 呢?我们在国内也用不了,大家也不知道怎么去使用它,或者说口碑呢,也没有那么的好,所以呢, 主动能动性这个我认为是我用 clubbell 一个最最有感知的一点。那么接下来我们讲最后一个,它跟别的 agent 的 产品最大的区别就是它是 open source 的, 它是免费的,它不需要你去付任何的费用,也不需要你去 subcribe 自己 cloud bot 的 产品。那么它背后我们刚才讲它不是一个 ai 的 模型,那怎么去用它呢?首先你自己要去给它 对一个模型进去,比如说你自己有些付费的模型的产品, gpt 啊, cloud 啊,你都可以给它接进去,你在付费是付给 gpt 和 cloud, 而不是付给 cloud bot, 好 吧,那 by the way, cloud bot 和 cloud 这两个拼写是不一样的,大家不要把它混为一谈,它们两个不是一个公司的产品。那另外一种用法呢,就是你自己最最在乎安全的问题,你 所有的这些数据,这些文件,你根本不想发给 gpt, 发给 cloud。 刚才我们讲了,就算你是用 cloud co worker 的 话,那么你仍然需要联网或者 是 mini max 的 话,你最后这个文件的处理仍然是在 cloud 的 云上,或者说是在 mini max 自己的总部上,而不是在你电脑里去储存好的。但是如果你今天用 cloud bot 的 话,你可以自己在你的电脑上去接入一个 模型,接入一个开源的小模型,三十 b 的, 四十 b 的。 那么这种情况,所有的你跟他的沟通,所有的文件处理,都是在你自己电脑上运行了,而不是在 别人家的云上。那么以上这四点呢,是我认为 cloudbox 和你现在目前上所看到的 a 阵产品最大的不同。 好,接下来就快速给大家过一遍,你到底怎么去安装?首先你要问自己一个问题,你会给他准备一个独立的电脑,你还是给他弄一个虚拟机,你还是自己让他直接操作你的电脑?为什么外网都在说一个周末整个硅谷的 mac mini 被全部的扫光啊,就是因为大家都会买一个最便宜的苹果的电脑 给这个 cloud 去使用,因为它毕竟是要在操作这个电脑上缩的文件啊,缩的这些软件,所以这个你要想好。好吧,那么怎么去安装呢?非常的简单,直接去它的官网上,它有一行的命令,你在你的虚拟机也好,你在你自己的本地的电脑也好,你直接打开一个 terminal, 你 ctrl c, ctrl v, 把这行命令回车进去,它就开始进行各种各样的安装了,就这么简单,非常的简单。我们建议大家在今天位置,你如果是用虚拟机的话,那么你可以选择欧乌班图的系统,如果你今天是苹果电脑的话,直接用它本地的 terminal 就 好了。那么好,继续。 你打完这行代码之后呢,你就会发现安装好了,安装好之后呢,它就进入了一个页面,让你去选择模型了。刚才我们说了,你自己目前一定要记住 club, 它不 不是一个 ai 的 模型,它是一个,更重要的是一个入口。那么到现在还没到设定入口的时候,你首先要选定模型,你可以看到这个列表里有国外的比较出名的 cloud 啊, gpt 啊,也有咱们中国的千文啊, mini max 都是可以的。那么你需要在选择之后,然后输入了你的 token, 也就是你自己要调用 a p i, 那 么或者是你直接用你的这个服务的计划,你是 clone max 的 或者 mini max 千文都是可以的。好吧,我个人建议在你第一次使用先不 要用 a p i, 因为你不知道他在完成你的任务的时候需要消耗多少 token, 你 会可能付一个非常大的一个 bill, 你 自己都不知道是怎么回事。好吧,尽量选择你自己的那种越废制的。这个计划选完之后呢,第三步就要选择你自己跟他交互的入口了。这 列列所列出来的都是国外的人们经常用的 telegram 呀, whatsapp 呀,或者是邮件呀,那么在里面都可以去选择好,我们以 telegram 为例,你只需要选择 telegram, 然后它会告诉你怎么在 telegram 去设置,你会发现它是让你去 给它设置一个 token, 同时你要给它设置一个 account, 那 么叫什么名字你完全给自己去定,张三李四,小明小蓝小红都可以,这个也是跟其他的 ai 大的不同,我们刚才都讲过了,好吧,那么设定完这个 come 之后,你以后就可以直接打开你的 whatsapp, 你 的 telegram, 你 的邮件 直接跟他去沟通了。比如说你今天收到了一个客户的一个邮件,你直接可以 forward 给你的这个 club box, 比如他叫张三吧,或者叫小明吧,好吧,你直接可以 forward 给小明,然后说帮我看看这个邮件,他会自己动用他所有的能力,然后呢帮你把这个邮件过一遍,然后 直接给你回复一副邮件,就真的像一个人在为你工作一样。那最后一步呢,就是要需要给他添加一些能力了,也是叫做 skills, 那 么 skill 最近非常非常的火, skill 从根本上本质来说就是提前预设好了一段提示词,那么发给这个人工智能,他知道他做事是按照这样一个一个方法去做的好吧,那么 整个的 cloud bot 和你现在所听到的其他的 ai 最大的不同就是它完全把这个 skills 做成了一个生态,它专门有一个网站叫做 cloud hop, 那 么 cloud hop 就是 全网所有的这些即客或者是专业的人士,把它们常用或者是设置好的这些优秀的能力直接丢在上面,有点像你所之前听说过的 这个扣子工作流,有点那个感觉,那么它呢,最主要全部都是针对这个 clockclock 设置好的这些能力,那么它的这个能力不是一个工作流那么简单,这是直接帮你对接好所有的这软件,比如你打开 clockhouse, 那 么在美国呢?美西大部分人在工作沟通的时候用的是一个叫做 slack, 但 slack 是 没有提前内置好的, 那么这个时候就有人直接设置好了一个 slack 的。 excuse? 那 么这个时候你点进去看,它就是一个 zip 包儿, 下载下来就是一个 markdown 的 文件,把这个 m d 的 文件直接拖进去,那么这个 cloud bot 或者是你自己设置好的这个小名,它就拥有操作 slack 帮助你去发信息的这个能力,或者说你直接把它拉到群里头,它就像一个人一样给你去工作了,是一个非常非常强大的一个生态系统。那么 以后如果你真的开始用 cloud bot 了,一定要多多关注 cloud hop 这一个网站,那么到现在为止四步,选好你的硬件, 一行命令,安装,选模型,再设定好你怎么去跟他沟通就全部都完了。能力层面呢,是以后大家想的空间非常非常大的,你自己可以给他安装各种各样的能力。 我给你的一个小小的建议是从简单入手,不要给他一开始所有的能力,可以帮我干这个,帮我干那个,他可能会吃不消,或者是不是按照你的方式去吃的消的。那么这个时候我建议你一步一步去测试,我想让他测试一下,给我写邮件,我想让他测试,给我去弄一个 white coding, 跟身边所有的人再去讲怎么用 clubball 的 时候,首先你要改变他的思维,你不要把它当成是一个 ai, 因为你的入口已经变成了这些常用的聊天软件了,你就像跟一个人在聊天一样,你是不是也是给他一点一点任务去填 家,对不对?今天想帮我干什么?明天想帮我干什么?把你日常经常做的事情先丢给他,让他去试用一下,就用你常用的这些聊天软件的窗口,我自己本人用 whatsapp, 那 么我就用 whatsapp 直接跟他沟通,或者你常用 telegram, 你 常用其他的这些 slack 也都没有问题。好吧,那么第二个能力也是非常非常鼓励大家去尝试的,就是 webcoding, 我 们都知道 webcoding 这个词在最后非最近非常非常的火,那么它的本质呢?是由一个叫做 cloud code 的 一个东西带 开起来的,但是 clock, clock 看起来呢,还是有一点,即刻一个黑白的一个屏幕,一个 terminal line, 对 不对?感觉不是那么友好。那么这个时候你如果把这个界面现在想象一下,变成了是你的微信的聊天界面,当然目前还不能用微信啊,你想象一下,这个微信里有一个叫小明的人,你直接跟他说,哎,我现在需要一个网页,帮我去弄一个什, 调研点什么东西,然后呢,把这个给给我发一个网页或者 ppt, 完全所有的事情都是在微信里去完成的,然后这对方呢,给你做完之后,直接把这个网页的链接发给你了, 你自己感觉是不是有点不太一样,对不对?虽然 minus 好 像也能做类似的事情,但是 minus 只能在云端,它不能再 access 你 本端的这个文件,你不要跟我讲说我自己去发那个文件啊,有,如果你想在手机上发文件,你应该懂我在说什么,很痛苦的一件事情,好吧,那么这个时候你会发现 cloudbox, 它因为它自己就装在一个电脑上,它在电脑上是有这些文件的,它可以看完这些文件上网调研一下,最好把这个结果一个 ppt 或者一个网页形式丢给你,整个过程呢,你就在微信里给他发了一条信息,这种感受是非常不同的,我再怎么说都不如你自己用一下,好吧,感觉一定一定是不大, 这个呢就是你在和 club 沟通一个思维上最大的一个转变,把它当成是一个人,好吧,那么这个东西呢,几周前推出,到目前为止呢,我看到也没有什么太多的人在咱们中国去讨论,那么所以呢,我给大家去介绍一下这个产品,到底它跟其他的 agent 产品有什么不同,因为它是开源的,你直接去那个 dhop 上下载下来, 所有人都去可以去试用的。好吧,那么我自己的一点点思考,第一个呢,就这个东西到底是不是真的一个改变世界的产品,我自己是比 比较保守的,我不会跟着这个 hype 去走,别人开心的时候呢,我也不会那么的开心,虽然我用起来还是很爽的,但是我自己本人呢,是一个 cloud code 和 cloud co work 的 一个忠实的用户,我自己会感觉到它有点像 cloud co work, 再加上 manners 也是一开始我们给讲的 agent 的 产品,它有点像在这个两个上面接入了你现在一个聊天的软件,所以呢,在中国 我们常用的,比如说工作上的飞书,我相信飞书一定会很快更进这个事情的,它会在自己飞书里弄一个飞书的机器人,背后连接到你所有的飞书网牌上所有的东西,当然你自己想连接到你自己的电脑上飞书还干不了,那么 可能会有其他的一些中国的一些团队在做类似的事情。所以呢,我个人感觉就是,如果你常用 clockwork 加上 manners 的 话,你自己用它最大的一个思维的改变就是你自己的入口变了, 做的事还是那些事,因为他很多的写代码呀,写网页这些能力, cloud work 都做的非常非常的好,包括 access, 本地文件都可以,只是最大的区别就是你的入口变成你日常用的聊天的软件。所以呢,我的感发,如果 cloud 他 想的话,他直接做两个事情,第一个,他把入口 接入到 telegram 上,接入到 whatsapp 上,也让你可以通过 whatsapp 去操作 clock 的 话,那么不是不可以,没有可能同学们,因为 clock code 已经是可以在网页上,在你的 app 端以及在你的电脑的 terminal 端,已经可以三者共存的了,所以它只需要接入到其他的这个网这个入口上,那么 它就可以变成一个 cloud bot 做的类似的事情。另外一个呢,它后端如果 cloud code 想的话,它自己开放一个所谓的这个 marketplace, 有 点像它之前已经推出了这个 m c p, 所有的人都可以 contribute m c p, 那 么这个时候 cloud code work 其实就很快就可以做到所有 cloud bot 所做的事情。因为如果大家去推特上看一看,很多人在选用 cloud bot 的 时候,它背后接的那个模型 都是什么?都是 cloud max 模型,因为 cloud 目前为止至少它的 open 四点五我认为是无人能敌的,但是呢,同时我自己又有一点点的 scare, scare 什么呢?不是 scare 模型公司,而是 scare 目前的就业市场,也是一个比较敏感的话题,我 不想谈的太悲观,但是我自己希望大家跟我一起做一个思考。如果你今天是个老板的话,你自己想一想,你有多长时间是通过微信,通过飞书,通过企微这些聊天软件把这个工作带给一个人,而对方那个人是在电脑上完成任务的。 凡是这样的工作,你自己测试下 cloud bot, cloud bot 都可以完成,因为他自己就是有自己一台电脑,他有所有的文件,他可以联网,可以自己写代码,你自己任何一公司。咱们讲一个简简单的前提吧,比如说你在跟别人谈了一个合同, 好吧?谈好合同,对方是邮件发给你的,对不对?邮件或者是哪怕聊天软件发给你的,你只需要把这个文件 forward 给你的 cloud bot, 比如叫小明 forward 给小明之后,小明通过他自己的 skill 补充了所有全世界的这些法律相关的知识,同时他可以联网去看最新的东西,然后把这个文件找出哪有什么问题,再通过你常用的微信或者邮件再返回给你。 这个是不是跟你现在把你的工作交给你手下的是一模一样的?所以我希望大家跟我做一个思考,你工作中有多少的工作是你自己把这工作通过聊天软件 follow 给 传给一个人,让那个人在电脑上完成,再传给你,这样的任务今天 global 都可以去完成,那么他到底可以带来多大的可能性?我们一起拭目以待。

别再盯着那些只会聊天的 ai 了,就在刚刚,一个叫 coba 的 智能体 github 上的星标像坐火箭一样,两天飙升三万多。甚至有 ceo 放话,通用人工智能其实已经来了,只是你们还没睡醒。为什么这么狂?因为它的逻辑变态至极,它不再是你电脑里的一个软件,它直接打通了你的聊天框和电脑系统。说白了, 你的微信、短信变成了电脑的万能遥控器。这意味着什么?看看网上那些大神神乎其技的操作,真的让人头皮发麻。有人在健身房举铁手机发条消息, coba 直接接管家里电脑,把程序 bug 修好了,想订个网红餐厅,订不到,他居然能自己调用语音, ai 直 接打电话去店里帮你抢座。最离谱的是什么?有人让他帮忙买车,这货不仅全网比价,还学会了跟经销商发邮件疯狂砍价,硬生生帮主人省了四千二百美金。但这还没完,这东西甚至有了记忆。早上醒来,你还没拿手机,他已经把天气、新闻、今天的行程全部安排好发给你了。这种一觉醒来,全世界都被他搞定的感觉,是不是太爽了?

我天,这两天硅谷炸锅了,所有人都在讨论 cloud bot 的 ai 智能体,它短短几天已经改了三次名字了,从 cloud bot 变成 mouse bot, 到现在是 open cloud。 更有 ai 初创 ceo 直言,通用人工智能已经来了,只是百分之九十九的人还没有意识到, 那它的魔力到底是什么?它是一位七成二十四小时不休息的 ai 全职员工,这可能就是智能体真正上岗的信号。 朋友们,有人为了跑他,搭了一整套本地算力环境,一次性部署了十几台设备,这次不是打游戏,也不是挖矿,而是为了养一个七成二十四小时不休息的 ai 数字员工。 你可以把他想象成住在你电脑和手机里的。第二,大脑,你发一句话,他不光回复你,还能自己去干活,比如帮你盯着某个行业,帮你看着邮箱,帮你整理日程等等等等。 甚至有人直接用它干掉了一堆昂贵的付费工具。但最重要的不是它有多么的炫酷,最重要的是它背后的逻辑,也就是 openclaw 是 智能体,而不是 ai。 今天大多数的 ai 依旧停留在你问一句,他答一句的模式,你问他,他才存在,你不问他就不存在了,不干活了,他没有长期的记忆,也不会主动提醒,更不会替你去执行任务。 那像这样的 ai, 再聪明也只是个聊天助手。而智能体有什么不同?第一,他会记住智能体,会记住你的偏好,你的习惯,甚至你两周前随口告诉他的,帮我退掉这些新闻邮件的订阅,你越用他,他就越懂你,你不用每天重复的去教他。 第二,他会主动,普通 ai 永远在等你点开他,你想一下是不是?而智能体会反过来找你,十分钟后要开会,你有三封紧急邮件,明天要下雨,他都会提醒你,从你找 ai 变成 ai 盯着你。你想一下,就像你有了一个贴身的助理。 第三,他会执行,也就是他会自己动手。不是你给建议了,而是你给了授权后,他在你的设备上去访问文件,执行命令,写脚本,跑流程。 这意味着什么?意味着当你在睡觉的时候,有人在帮你盯着机会。当你在刷手机的时候,有人在替你整理人生。当你还没有意识到变化的时候,你的 ai 已经替你处理完一部分的世界了。 那这个东西对普通人有什么用呢?非常有用,它能把人从大量的低价值重复消耗精力的事情中解放出来。你不需要再去记住所有的细节,你不需要再去重复的切换软件,找资料、整理上下文, 你只负责判断、执行就交给 ai。 第一次,普通人也能拥有一个不会累、不会情绪化、永远在线的个人助理。这就是你自己的 ai 智能体了,它可以长期陪着你成长,理解你、模仿你。 如果把时间拉长来看,人与人之间真正的差距可能不再会是你会不会用 ai, 而是你有没有一个已经陪你走了三年、五年的智能体。 那一天,人类负责思考、选择、创造 ai, 智能体负责执行、记忆和跟进。而今天的 open cloud, 很 可能就是很多人第一次提前站上这条时间线的入口。