上一期视频我带大家快速部署了 cloud bot, 以及做了一些使用体验的演示。这期视频我会深度分析 cloud bot 的 运行机制和它的上下文工程,再分析一下 cloud bot 当前到底适合什么人用,以及背后隐藏的行业趋势。我们先来看一下 cloud bot 的 整体架构。 collab 本质上就是一个工程化程度比较高的本地部署的 agent, 它本身是不包含任何大模型的。我们在本地所部署的这个项目核心工作就是做上下文工程。那既然是做上下文工程,我们就来看看它拼接提示词的流程到底是什么。 这张图是我通过 cloud bot 的 原码,用 ai 的 id 反向分析出来它的运行流程,整体来看就是一个比较标准的 agent 的 react 机制。当用户发送一个请求以后, cloud bot 会将用户本次请求拼接上一些默认的内容,包括说身份、可使用的工具、当前时间等等, 然后发送给大模型,由大模型决定要使用哪些工具做什么,一直循环到大模型给出了最终的答案,然后返回给用户。我们可以举一个例子,比如说用户发了一个请求,把我昨天让你写的方案增加一个项目计划的章节。 这个时候 clubbot 接到请求以后,就会开始进行提示词的拼接。真正发送给大模型的提示词可能是你的角色是某人的个人助理, 你的风格是语言简短精练,你可以使用的工具包括用户记忆、查询、文件操作。用户本次的问题是把我昨天让你写的方案增加一个项目计划的章节, 你的任务是根据当前的信息判断是否要使用工具或者直接回复用户,这个时候大模型可能会返回调用用户记忆查询, 然后 cloud bot 就 会在本地进行用户的历史聊天记录的查询,查询后再把所有的信息发送给大模型,但是这次会在上一次的提示词的基础上,再增加昨天相关的聊天记录,这样的话大模型就能够知道昨天写了什么方案。 然后大模型再返回需要调用文件操作工具,把对应方案的内容获取出来。 cloud bot 提取文件以后,再把之前的所有信息加上文件的内容发给大模型, 这次大模型就可以开始根据之前的方案增加计划的章节了,最终返回给用户修改结果。好,那么了解了运行流程以后,接下来我们来看一下 cloud bot 具体的提示词结构是什么。 这个也是通过代码反向分析出来的一个结构,可以看到整个提示词工程包含的模块内容还是比较多的,我就不一一去介绍了。对于我来说,我比较关心的任务是什么?抽象层级是什么? 所以我就追问了模型,让他帮我进行分析,最终的结果其实和我设想的差不太多。 cloud bot 并没有给一个明确的任务和具体的抽象层级,只是把可使用的工具、技能以及用户问题发给了大模型。 主智能体并没有给大模型更高层级的引导,让他做任务的规划和子任务的拆分。这也是为什么在上一期视频中, colibot 所表现出来的能力是较为依赖 skill 的, 所以它的泛化能力相比于 minus 来说就会差一些。 我之前在讲 minus 访谈的视频里面提到过, minus 的 抽象层级是你是一个人,可以使用电脑,这样的话就给了智能体很大的发挥空间。 它能够针对一个新的任务规划要怎么做,分成几步,需要使用什么样的工具,如果没有的话,还可以自己去新建工具。最后还有一个需要我们去了解的就是 collabot 的 记忆机制,它之所以能够被称之为个人的 ai 助手, 有很大原因都是因为它可以存储对于每一个用户的记忆。 collabot 采用了两种记忆模式,一种是纯文本的记忆,存储在了 memory 点 md 当中。 还有一种就是向量数据库的存储 memory 点 m d 中存储的主要是用户的整体画像,包括说用户整体的呃性格偏好,重要的背景,还有一些长期可用的知识。 写入方式主要有两种,一种是 agent 自主判断对话中是否出现了对于用户长期有用的信息,比如说用户在某次对话里说了我是一个 ai 研发人员, 或者某一次说了请用中文回答我。还有一种是用户可以在对话里面明确提出来要记忆,比如说请你记住我喜欢吃苹果。 其实底层的写入逻辑都是一样的,都是基于模型本质的能力去判断是否要写入记忆。只不过当用户明确说出来需要记住的时候,对应模型给出写入长期记忆,这个指令的权重就会被提高。 那么向量数据库的存储逻辑就更简单了一些,它是会把所有的对话内容默认四百个 token 就 会产生一个新的 chunk, 记录到向量数据库里面, 后续需要调用的时候,根据关键词在向量数据库中进行查找,找到历史相关的对话内容。那么了解完 clock bot 的 运行机制以后,其实我们就可以梳理出来 clock bot 到底适合谁,在什么场景下使用。 那么首先我们先来看看使用场景, cloud bot 的 这种本地部署的机制,实际上就是帮助用户解决一些需要远程处理的工作,而且这个工作还不能过度依赖真实生活或者工作中的信息。 比如说我们工作的时候,和一个同事在线下聊了一个需求,想让 cloud bot 帮我们梳理材料,整理文档,这种场景是不太现实的,因为你们的沟通记录 cloud bot 并不了解,而且这种梳理文档内容的工作对于大模型来说,执行速度也很快, 也不具备这种可持续性的。让 cloud bot 去工作。 cloud bot 比较理想的工作内容,比如说你是某一个知识平台的博主, 然后给他设定一个收集材料,然后自动整理成文章,再发布到平台的 skill, 每天每隔一个小时运行一次,那么这种场景就非常符合 cloud bot 的 设定。第二个就是适用的人群,我认为 cloud bot 现在的产品形态,面向的用户还是需要有一定代码基础或者大模型知识基础的, 它能够自定义的内容非常多,包括说对于个人的记忆、 skill 可使用的工具,甚至说还可以修改它的原码,让整个智能体的抽象层级更高。 如果说你具备比较强的技术能力,同时又有比较类似的场景需求,那么通过自定义 skill、 自定义工具,确实可以让 cloud bot 成为一个非常有用的帮手。最后我们再聊一聊为什么 cloud bot 会突然这么火爆。首先就是它的本地部署的这种产品形态,它把 agent 的 控制权全部交给了用户 大模型使用远程调用的模式。这样的好处就是刚才我们所说的用户可以在 cloud bot 整体框架下自定义 适合自己场景的 agent。 第二个就是对于用户记忆的本地化管理,刚才我们介绍的 cloud bot 的 记忆模式都是存储在用户本地的。 这种模式其实是我一直比较期待的一种模式,因为现在用户不管是使用任何一家模型,每个模型对于我们的长期记忆实际上都是保存在对应模型厂商里面的,这样的话每次切换模型就会感觉到很难受,因为每个模型认识的你其实都是不一样的。 我最终期待的其实是所有大模型都给用户开放一个可拔插的一个长期记忆的接口, 我跟所有模型的对话都可以统一存储在我的本地或者说某一个自定义的云平台。 这种模式如果从商业化的角度上来看,其实是具备极大的挑战的。最后就是 cloud bot 的 交互形态, cloud bot 集成了很多的通讯软件,用户可以直接通过通讯软件给他发起任务。 这种模式其实从软件工程的角度上来说,和独立的 app 没有太大的区别,只不过就是多了一种入口。但 如果我们结合 cloud bot 个人助理的定位,就会发现,通讯软件中大部分都是在和真人进行沟通对话,当一个 agent 直接出现在了我们常用的通讯软件里面, 其实就给了用户一个极大的心理暗示,我们不是在和大模型沟通,而是在和一个真正的助理沟通。欢迎关注我的频道,获取更多科技新闻的分享和解读。
粉丝683获赞4809

cloud bot 一 夜爆火,这是一个运行在本地电脑的开源 ai 助理,短短几天内, github star 数量直线拉升,已经超过了十二万。本期视频我们带来一个 cloud bot 的 全面攻略,看看 cloud bot 比起其他的 ai agent 有 什么特色。 我准备了十几个案例的玩法大全,还会介绍一个接入飞书加国产模型的方案,让 cloud bot 在 国内网络也能顺畅使用。视频开始之前,先插入一个小插曲, 由于 cloud bot 受到 ansorepic 法务团队的压力, cloud bot 先是改名成了 motbot, 现在又改名成了 open cloud。 爬爬虾做视频的速度还赶不上它改名的速度,所以本期视频我们还是统一叫它最开始的名字 cloud bot。 cloud bot 功能跟 cloud code 和 open code 都有点像,都可以处理文件编码、调用 skills、 m c p 等等帮我们处理工作。 cloud bot 的 最大优势是可以接入各种聊天工具,也就是我们即使出门在外,手边没有电脑,只需要在聊天工具里面给 cloud bot 留个言, cloud bot 就 能自动干活,还能把屏幕截图、执行过程等信息实时同步过来,非常的方便。第二个优点是, cloud bot 自带了强大的定生物系统, 只需要用自然语言就能创建定身舞,比如可以创建一个临时的提醒,还可以定时检查收件箱通知等等,它可以智能地判断事情的紧急程度,选择是否用聊天工具跟用户进行沟通。比起传统的指令执行、指令执行这种固定的流程, cloud bot 就 具有了很强的主观能动性。 它的第三个优点是具有长期记忆,可以把记忆作为文件存储在本地,在日常的对话中能够搜索,并且把相关的记忆捞回上下文,随着日常使用,它还会主动去更新这些记忆文件,会有一种越用越聪明的感觉。好,我们先在本地把软件安装一下, 任意一个能运行 note g s 的 环境都可以部署 cloud bot。 我 最推荐就是使用 mac 或者 linux 系统的家庭服务器。 现在最火的部署方案是使用 mac mini, mac mini 的 最大好处是 mac 系统有不错的桌面环境,这样可以很方便地进行截图、操作、浏览器等等。第二点是功耗比较低, 七乘二十四小时运行,比较省电。第三个优点是 cloud bot 里面许多 skills 跟 mac 生态是绑定的,没有 mac 电脑的话,可以选择 linux 操作系统,或者在 windows 里面创建一个 linux 的 虚拟机。操作步骤跟接下来是一样的, 我选择的安装方式是 node js, 我 们来到 node js 官网,把第一个命令复制一下,然后打开终端执行一下,接着是第二个命令,第三个命令, 这样 node js 就 安装完成了。下一步我们来到 cloud bot 的 官网,在这里有一个一键安装命令,如果我们使用官网上的一键安装命令的话,注意要区分现在软件的名字,比如现在叫 open cloud, 后续所有操作的命令都应该是 open cloud 开头了,这里我选择 npm 的 安装方式, 我们看到 n p m 这里命令还是叫 cloud bot, 所以 后续我输入的命令都应该还是 cloud bot 开头了。这样我把这个命令复制一下,粘贴到命令行窗口执行一下。安装完成,我们输入命令 cloud onboard 来进行初步化。第一步,先配置 ai 模型,因为我有 open ai 的 plus 订阅,所以这里我选择 open ai, 当然下面也有很多不错的国产模型可以选择。视频的后半段,我们再来配置使用国产模型。选择 open ai 以后,再选择第二个 chad gpt 登录, 登录一下我的 chad gpt 账户,这样 ai 模型就配置完成。默认模型我选择的工具是 whatsapp 视频的后半段。我们再来看如何绑定国产的聊天工具。我们打开手机上的 whatsapp 右上角三个点已关联设备,关联新设备,扫一下屏幕上的二维码,这样就绑定完成。接下来选择预装的 skills, 按空格键打上对勾选中,这里可以按需进行选择安装下面的这些 api k 可以 全部选择跳过,然后 ai 会询问我们一些关于人设方面的问题,我们回答一下,这样就配置完成。我说你可以给我的聊天工具发一个消息,我们看到手机上收到了消息,这样就完全配置成功了。 我们先来介绍几个基础命令的使用。输入命令 cloud bot gateway, 这个是启动主程序,我们可以通过关闭控制台来停止 cloud bot 的 运行。在 cloud bot 后台运行的时候,我们可以新开一个窗口, 输入命令 cloud bot t u i 就 可以进入这个控制台的对话界面。输入命令 cloud bot dashboard, 可以 进入一个网页版的控制台,在这里可以进行基础的对话。上面还有很多配置,可以管理定身舞,管理 skills 等等。输入命令 cloud bot channel logout, 可以 退出 cloud bot 上面登录过的聊天软件,然 然后我们再输入命令 log in, 就 可以重新登录一下,因为有的聊天软件可能隔几天就会掉线,我们可以使用这个命令重新登录一下。我们来看 cloud bot 最有意思的一个功能就是它的定身物,定身物赋予了 cloud bot 的 一些主观能动性,让它变得更像一个智能的 ai 助手。 比如我输入这个命令,提醒我两分钟以后关煤气。 cloud bot 回复我,好的,已经设定成功了。我们可以在网页版的控制台 crown job, 也就是定身五这个选项卡可以看到 cloud bot 为我们设定的定身五,这里显示两分钟后执行。两分钟以后,他就把这个消息推送到了手机上,提醒我去关煤气。 cloud bot 具有操作浏览器的能力,我们需要先在 mac 里面下载一个 chrome 浏览器,我要求 cloud bot 去 m i t 公开课下载 python 课程的课件,放到我的桌面,我们看到 cloud bot 自动打开了 mac 里面的 chrome 浏览器,找到了 m i t 公开课的官网,并且搜索 python。 他 找到了几门 python 课程, 回复了我课程的编号,让我选择这里,我选择第一个。他又在浏览器里面通过课程编号找到了这门课,并且下载到了桌面,然后我要求他把它解压出来,他调用了麦克的命令行工具完成了解压,然后我要求他把第一节课的课件发给我 这里可乐豹成功找到了课件,并且完成了发送,效果不错。接下来我们来看一个把浏览器自动化跟定生物组合起来的案例。爬爬虾,作为一个科技软件类的博主,需要经常查看 github 的 热点, 这里我告诉 cloud bot, 让他查找一下 gitap 上面的热点,然后做个中文简报发送给我。 cloud bot 生成了中文简报,接下来我说每天早晨八点你都做这么一个简报发送给我。 接下来 cloud bot 生成了一个定身舞,每天早晨八点都执行这个工作。我们可以在 cloud bot 的 控制后台查找到这个定身舞,每天早晨八点都会自动执行这个工作流程,发送给我简报效果不错。除了操作浏览器, cloud bot 还有图像识别等 ai 视觉方面的能力。 这里打开 mac mini 的 设置隐私与安全设置录屏与系统录音,我们在这里搜索终端两个字,给命令行终端添加上录屏和录音的权限。接下来重启一下 cloud bot, 我 在手机里面说,请给现在的 mac 截一个图, mac 电脑当前的图片就发送到了我的手机上,可以实时的对状态进行监控。 目前为止我们依赖的是海外的聊天工具。接下来我们把 cloud bot 接入飞书,让他在国内的网络也可以顺畅使用。我们先来到飞书开放平台,点击创建企业应用,填写一个名字与描述。接下来点击左侧添加应用能力, 选择机器人。然后我们来到权限管理,点击添加权限,总共需要添加屏幕上这些所有的权限。 接下来来到版本管理与发布,填写一个版本号,点击发布。我们回到 mac 终端,输入第一个命令,安装飞书插件。第二个命令,配置 app id, app id 可以 在飞书开放平台凭证与基础信息里面找到, 把 id 粘贴到命令行里面执行一下,然后配置 app secret, 同样在凭证与基础信息里面找到同样的,把 secret 放到命令里面执行一下,下一个命令,开启飞书 channel。 最后第四个命令,把链接方式改成 web socket, 然后我们重启一下 cloud bot, 这里我总结了需要执行的几个命令,有需要的观众朋友们可以截图保存一下。回到飞书开放平台,在事件与回调这里选择长连接,点击这个铅笔,点击添加事件,然后勾选接收消息,最后点击顶部的创建版本, 我们再提交一个新的版本,这样飞书就配置完成了。在飞书的手机 app 里面,我们可以找到开发者助手,然后点击打开应用这里我打一个招呼,你好,飞书有一个非常可爱的机器人正在输入的表情,我问他现在几点了,这里给出了回答。然后我让他给麦克截一个屏, 告诉我需要先在控制台跟他对话一次,开通权限才可以截屏。这里我们来到麦克上面的控制台,跟他对话一次,允许截屏,这样截屏完成。我们看到飞书也同样可以传递文件传递截屏。我们把聊天方式换成了国内平台 ai 模型,同样也可以换成国内平台。 cloud bot 的 作者推荐使用 mini max, 这里我们来到 mini max 的 开放平台左侧,选到接口密钥,然后创建一个 apikey, 然后我们打开 mac 的 控制台,输入 cloud bot config 来配置一下模型,选择 mini max, 然后我们把刚才创建的 mini max api k 填写进来,一路回车就配置完成。来到 cloud bot 的 控制台,输入命令斜线 models, 然后我们可以选择 mini max 模型, 选择完模型以后,我们再重启一下 cloud bot, 这样模型就切换完成了。 cloud bot 的 强大之处在于它内置的 skills 可以把各种第三方的生态接入进来,比如这里的 g u g skills, 可以 把谷歌邮箱、日历文档等功能都接入 cloud bot。 我 们点击这个安装按钮,这里要提醒一下大家,安装的时候要把 mac 系统更新到最新版,否则有可能会失败,这样一键就安装完成。 来到谷歌 cloud, 我 们在左侧菜单找到 api 与服务,选到 o o 四权限请求页面,创建 o o 四客户端应用类型,选择桌面 app。 然后我们把生成的这个 json 文件保存下来,把文件拖拽进 cloud bot, 告诉他配置一下 g o g 的 认证,然后我们登录谷歌账号,并且授予权限,这样就完成了配置。接下来我让他看看我的邮箱里有什么邮件,让他总结一下。 这里 ai 提示我需要再开通一个 gmail api 的 权限,我按照它的提示把权限开通完成,它就可以读取到我的邮件了。接下来我让它把所有的邮件移动到垃圾箱,这里也成功完成了。我在手机上让 cloud bot 帮我发送一封邮件, 我们看到邮件可以成功发送,我让 cloud bot 设置两分钟一次的心跳检查,如果有发现新的邮件,就发消息通知我,我给这个机妙邮箱发送一个邮件来测试一下。这里 cloud bot 成功给到了通知,我让他总结一下邮件内容,他也完成了总结。 ai 助手对接其他生态,一个重要的渠道就是 m c p, 我 们可以在 skills 里面找到 m c p porter, 把这个 skills 安装一下。接下来我告诉 ai 用 m c p porter 来配置一个百度地图的 m c p, 我 把这个 m c p 的 说明文档贴给了他。 ai 提供了三种安装方案,我选择 streamable h d d p。 他同时要求我提供百度地图的 a p i k, 把这个 a p i k 复制一下粘贴给他,这样就完成了配置。他已经可以使用这个 m c p 查询到地理位置的坐标了,这样我们就配置完成了,我们也可以在手机里面使用,我让他查询一下从青岛太平角公园到崂山羊口景区怎么走, 这里成功给到了规划路线,效果不错。我们再来看一个 skills 的 使用,这里有一个 skills 叫做 coding agent, 它可以驱动本地的 codex, cloud code、 open code 等 ai 编程工具 直接进行编程。这里我们先把这个 skills 安装一下,我在 mac 电脑上登录了我的 codex, 接着我在手机上跟 ai 说调用 codex 创建一个贪吃蛇的游戏,我们看到程序就编写好了,这样我们就通过 cloud bot 驱动 codex 完成了一个程序的开发。

这可能是看进来最强的 ai 工具,但也可能是最危险的。这是我的手机,只需要我跟他说一句,帮我整理下电脑桌面,他就会扫描文件夹,自行创建分类,接着开始一个个移动文件,结果整理的又好又快。 我还可以让他去 cloud code 里帮我写一个 python 脚本,功能是批量把各个视频文件转换成动图,也不用我多说,二话不说就干完了。我甚至能把他拉到我的工作群,在里面艾特他,他就能查看同事心率,删同事文件,能直接戳一个 ppt 发群里,甚至能把我兄弟的机子关了。 这就是最近爆火让 macbook 现已改名 openclaw。 有 人用它创建了一个二十四小时自主下单赚钱的数字员工, 我已经把钱亏完了,有人用它去和经销商讲价,让自己买新车时便宜了四千两百美元。好家伙,这不就是钢铁侠里的贾维斯吗?我躺椅子上光下指令,电脑全给我干了, 难道说未来真的来了?这次我们也掏出了编辑部那台祖传的 mac, 带大家一起安装并试用这个神器。但在装之前,得先劝大家一句,千万别在你的电脑控制权全交给 ai, 万一哪天他把你的银行卡密码发出去了,就真诚 ai 改变生活了。 首先打开终端,检查一下你的 node js 版本,得二十二以上才行,如果版本不够或者没装, mac 用户直接输入这串代码。 windows 用户可以去 node js 官网下载安装包,然后输入一行命令,就能安装 cloud boot。 装完之后输入这行代码,跑一下初步配置,它会先让你同意用户协议,选 yes, 然后选 quickstart, 这一步它会自动帮你配置好基础环境。接下来的部分是选 ai 模型,官方建议是选 clout 效果最好,但该说不说是真的贵啊。哥们一个任务就花了我五刀,还是咱国产的便宜大碗好用,这里我选 g m。 四点七。在下一步就是选择聊天渠道,如果你有电报,可以自己创建个 bot 获取 token 就 行,没有可以直接跳过,中间可能会弹出一些系统权限请求,比如控制辅助功能、防火墙提醒之类的都点允许, 后面没法控制你的浏览器和文件。接着是一些 skill 和 api 配置都可以点跳过。最后启动服务,看到 getway started 就 说明成功了,可以去 telegram 或者控制台找你的机器人聊天试试。整个过程顺利的话十分钟,不顺利的话就像我一样跟暴躁对线一下午。 好消息是已经有大佬把飞书接入的插件开源了。如果你嫌自己配置麻烦,其实可以直接让 cloudboard 帮你装,跟他说帮我安装飞书插件,他就可以自己搞定。装好之后,在飞书开放平台创建一个自建应用,拿到 app id 和 app secret 配置一下权限,最后跑几行命令, 重启下网关,就能在飞速里艾特你的机器人了,然后把它拉入你的工作群,就可以爽玩了。不过是让同事爽玩你的电脑,比如兄弟可以直接操作我的电脑,创建文件,删除文件,还能下载原声安装包。哥们上个厕所回来,电脑已经变成不认识的样子了, 发个小红书也是轻轻松松,请个全自动运营也不是梦想了。当然把我兄弟机子关了也只需要在飞速群里说帮我关掉叉叉叉的电脑连确认都不需要,有仇人的话可以骗他装个 cloud boot。 所以玩了一圈下来,说说我的真实感受吧。好用的地方向桌面清洁大师把录屏文件按类型分类,跟他说句话,一分钟就能搞定。发个小红书也是轻轻松松,只需要我接管登录下账号就能给我发出去了。但缺点也是挺明显的,就是如果用好的模型真的非常贵,我刚充的五美刀,半个任务就能烧完了。 有时候他干着活突然不说话,你就去 a b i 后台看看余额正负号,绝对会释怀的笑了。当然,如果换成便宜的模型,有时候他还会荡机 时候发个小红书给他,登陆好了,我还得像拿鞭子抽陀螺一样抽他一次他才赚一次,配置门槛也没有很多人说的那么低。轻松搞定有点吹牛了,你至少得看懂英文,报错还得有点命令行基础。我也是跟他兑现了一下午才装好。对了,他现在也只能操作浏览器和桌面应用, 用咱的微信、抖音、淘宝这些天天用的工具都有风控机制,用 ai 操作可能轻则警告,重则封号,劝大家不要轻易尝试这玩意能干活是建立在你把你电脑控制权交给一个 ai 的 基础上,等于是你把你的账号密码、银行卡信息、聊天记录、机密文件等全交给 ai。 有 一位用户说让 cloud bot 帮忙买车,他自动打开浏览器填表单,然后自动填了真实电话号码。然后这哥们就开始收到一堆骚扰电话了, 万一有人在网页里藏了恶意指令,让 clubbo 读到这里之后帮忙转账、发邮件、删文件,那可就没那么简单了。 对我个人来说,我觉得作用还没有吹得那么狠,很多任务自己上手三十秒就搞定了,让 ai 来做,反而要等它执行检验结果,流程拉长了不少, 而且还有概率干崩。比如前段时间 coco 可就做了不少好事儿。不过如果你是那种每天处理几十封邮件,同时跟进几十个任务的大忙人, cloud bot 可能真能帮你省下不少时间。而现在,它更像是极客的玩具,适合发个朋友圈炫耀一下。我有个 ai 管家。 吐槽归吐槽, cloud bot 展示的方向是对的,远程控制、持久记忆、主动执行,这些都是 ai 助手该有的能力。两年前叉 g p t 只能陪你聊天,现在已经能琴棋书画样样精通了,技术进步真的比想象中要快。 所以值不值得装呢?如果你是喜欢折腾的技术党,可以玩玩,确实能学到不少东西。如果你真想投入工作,那建议还是再等等,等他的安全问题解决以及干活更方便的时候,也许再过一阵,这些槽点就都不是问题了。

它能做很多东西,那今天给大家来一波小小的演示,那这是它的官网演示,比较简单,我就在 windows 本机已经安装好了啊,然后呢?我手这是我手机的投屏,然后现在打开 whatsapp, 因为我已经和他建立了连接。然后现在呢,比如啊,比如我现在我在,比如我在旅行,对不对?我不在公,我不在公司,也不在家,那比如我想让他帮我去做工作,都是可以的。比如说啊, 请帮我看一下勒布朗最新的 ins 照片,嗯,咱们给他发一个这个请求,然后他收到请求之后,咱们可以看左侧啊, 左侧,其实他已经收到这条消息,然后他现在就会去执行一些 agent 的 toast。 嗯,你看它自我,我没有在动电脑啊,它自动打开了这个浏览器,并打开了勒布朗的这个 ins 主页,然后现在它会开始帮我去收集它的照片了, 这是非常恐怖的啊,也就是说 clubbot 呢,更像一个啊,用 ai 的 ai, 然后它会用 ai, 就是 它自己会用,然后你可以把它当成一个 啊助手啊,然后你可以在喝咖啡的时候啊,或者你在旅行的时候啊,或者你在睡觉的时候,让他帮你写代码,让他帮你炒股,都是可以的。 然后呢,他现在啊,其实已经发给我的手机上了啊,然后啊,比如把它关掉,你看一下,就是我的这个手机上已经收到了,这是他的帖子,这是非常。


最近几天,很多粉丝让我讲讲最近爆火的 cloud bot 这款开源的个人 ai 助手项目。 之所以这个项目能火,是因为它是第一个真正实用的自托管 ai 员工,本质上就是一个本地运行的 ai 智能体框架。 经过我这几天的测试,发现 cloud bot 的 功能非常强大,而且应用场景非常广泛,甚至感觉 cloud bot 越用越聪明,因为它能通过长期的聊天实现自我进化,能够记住用户的偏好,还能主动提供建议。 而且 cloud bot 的 能力不是固定的,我们可以在 cloud bot 中通过安装不同的 skills, 让 cloud bot 具备不同的能力。所以如果将 cloud bot 运用好,它能大幅度提升我们的工作和学习效率。而且它的部署非常简单,只需要一条命令五到十分钟就可以完成安装。 而且我们可以将这个项目部署到多种平台,比如说 micro s 系统、云服务器,甚至是树莓派。而且不一定非要买 mac 系统的电脑,我们甚至可以将旧电脑或者旧笔记本上装上 linux 系统来部署这个项目, 而且它还能主动执行任务,具备无限的记忆,远超普通的聊天 ai。 最关键的是,我们可以通过 whatsapp、 discord 等聊天 app 进行交互, 我们可以通过熟悉的聊天方式让 ai 帮我们做任何事情,无论是控制电脑实现自动化工作流,还是开发应用, 它把 ai 聊天工具变成了真正的执行者。本期视频将先为大家演示 cloud bot 的 部署方式,然后我们结合几个比较实用的案例来测试 cloud bot 它的综合能力到底怎么样。 在演示之前,我们可以先看一下 cloud bot, 它的系统架构,首先是用户层,用户可以通过 whatsapp 等即时通讯工具 实现与 cloud bot 进行交互。然后第二层就是渠道层,在渠道层能够实现协议适配、消息解析、格式转换、媒体处理、分块传输,然后就到了网关核心, 在网关这里可以实现绘画管理、消息路由工具调用自动化。它具备的核心功能包括多渠道统一受电箱,还有浏览器自动化,还有系统级的完整访问, 而且可以实现语音唤醒与对话,还能实现可量化工作区,还具备定时任务自动化功能,而且它具备成熟的 skills 生态,并且支持多智能体协助。下面为大家详显示我们如何在本地部署这个项目。首先我们直接复制官方文档中给出的这条命令, 然后打开终端命令行,我们直接将命令粘贴到终端命令行中,直接运行就可以。到这一步的时候要选第一个选项,要同意这个协议,当同意协议之后,这里需要我们设置一下模型的提供商, 在模型提供商这里,大家如果有 open i 的 订阅,那么可以直接使用 open i 的 codex 订阅进行登录,如果想使用 api key 的 话,也可以直接选择 api key。 第二项是 app, 大家如果订阅了 kol 的 订阅进行登录。在 在这里我们就选择 mini max m 二点一 cloud bot 我 最喜欢的一点就是它更像一个本地网关加工具编排,底层用什么模型其实能随时替换,所以今天我们就测试一下,把默认模型切换到 mini max m 二点一模型看看效果。 因为前两天我刷 x 的 时候,看到 cloud 的 作者发了条 x post, 他 说这几天把 cloud bot 跑在 mini max m 二点一上,优化了一些实现,而且体验非常不错。他甚至说现在更推荐这个方案,并强调成本优势非常明显。 所以我们就可以根据 cloud bot 作者的推荐,也将 cloud bot 中默认的昂贵的 cloud 模型替换成 cloud bot 作者推荐的 mini max m 二点一模型。而且在之前的视频中,我也为大家测评过 m 二点一模型。 mini max m 二点一模型给我的感受就是响应速度很快,而且表达风格比较简单直接不啰嗦。对自动化这种来说,这点非常重要,同一个任务,他少讲废话,这样就能更快地把可交付的结果输出出来。而 而且 mini max m 二点一很适合这种二十四小时在后台运行的 agent 场景,因为 cloud bot 本身具有持续运行加心跳机制,在这个时候选择 mini max m 二点一模型就能够实现够用、够快、够省。 下面我们只需要打开 mini max 的 官方后台,我使用的是 mini max 的 抠钉 plunk 套餐,在这里我们就可以创建我们的 api key。 创建好 api key 之后,我们直接复制,然后保存好我们的 api key。 好, 下面我们可以先打开终端命令行,然后我们需要用这一条命令来设置一下 mini max 的 悲四 u r l。 在这里要注意的细节是,我们设置的这个 base url 要和我们申请 api key 的 平台相对应。如果是国内用户,这个 base url 的 域名这里是点 com, 如果是海外用户,这个贝斯 u r l 在 域名这里,这里是点 i o 结尾,比如说我这里就是从点 com 这个平台申请的 api key, 所以 在贝斯 u r l 这里,我这里就要填对应的点 com 这个贝斯 u r l。 设置好之后,下面我们就可以用这条命令来设计一下刚才我们申请的 api key, 我 们直接执行就可以。然后到这一步的时候,我们就可以选择使用哪一种聊天工具与 cloud bot 进行交互, 它支持多种聊天工具,这里我就选择 whatsapp, 然后我们直接选中,这里会在中端命令行出现一个二维码,然后我们需要在手机上打开 whatsapp, 扫描这个二维码,实现设备的连接。当这一些完成之后,下面我们需要设置一下它调用哪些技能,在这里需要我们选择技能的安装方式,我这里就选择第一种,然后这里就会出现多种 skills 让我们去安装,大家可以直接选择跳过当前的这些安装, 然后这里提示需要设置这一些 api key, 然后这里我们可以先略过。到这一步就是请用 hux, 我 这里可以选择第四项,让它实现这个 session 的 记忆,当这些设置好之后,我们直接重新运行就可以, 然后到这一步我就默认选择第一项,这样的话它就自动在我浏览器中打开了 cloud bot 的 这个后台管理的页面,这里有一个类似于 chad 的 gpt 的 对话框,在输入框中我们就可以输入一个内容测试一下。 在这里我让他讲个故事,然后这里他就输出了他讲了一个故事,他不仅支持直接在网页后台进行对话,还支持刚才我们连接好的 whatsapp 进行对话,比如说我们在 whatsapp 中让他讲个故事,然后直接发送 这里他很快为我们讲了一个故事,在这里我们还可以点击阅读更多,这样的话我们就可以完整的来查看这个故事。 在 whatsapp 中我们还可以查看我之前使用 cloud bot 来执行的这个任务,比如说这里自动让它抓取某些网站或者簿上的内容,当抓取完成之后,它就会自动推送到 whatsapp 下面我们先在 whatsapp 中进行交互,来测试一下 cloud bot 它的浏览器自动化能力。我这里输入的提示词是让它调用浏览器来打开 cloud bot 的 官方仓库,并给出这个项目的安装命令,然后我们直接发送好,可以看到这里它自动打开了浏览器, 并且在浏览器中打开了 cloud bot 官方仓库,然后我们看一下它能否输出这个项目的安装方式。 它很快输出了这个项目的安装方式,包括推荐的安装方式,使用 npm 全局安装。这里就给出了具体的安装命令,还有启动命令,还有快速测试。像这样的话,我们就实现了在 whatsapp 中直接通过聊天的形式,让 cloud bot 为我们执行了浏览器自动化任务。 像这样的话,哪怕我们不在电脑旁边,也可以通过手机上安装的 whatsapp 来操控电脑上的 cloud bot 为我们执行各种复杂的任务。在这个网页版的管理后台,大家就可以根据自己的需求来安装对应的 skills, 也就是我们需要 cloud bot 为我们完成哪些任务,我们就可以安装对应的 skills。 想安装这些 skills 非常简单,我们只需要在右侧点击对应的安装就可以。 比如说我这里安装了 blogwater, 它可以监控各种播客是否发布了最新的更新。安装好之后, cloudbot 就 可以来调用我们安装的这些 skills。 下面我们就可以通过 cloudbot 它的定时任务来调用刚才我们安装的 blogwater, 每天定时为我们执行抓取相关的技术文章。 这样的话我们每天就可以准时在 whatsapp 上查看指定网站或者簿刻的文章更新。我们既可以在 cloudbot 后台来设置定时任务,而且还可以通过命令的方式来设置定时任务。为了快速演示, 我们可以直接通过命令的方式来实现创建定时任务。因为刚才我们添加了 blogwater 这个 skill, 所以 我们就可以通过 blogwater 中将我们需要查看的一些簿刻添加到 blogwater 中。 添加的时候非常简单,我们直接打开终端命令行,然后直接执行刚才我们查看的命令。下面我们就可以来执行这一条命令。这条命令的功能就是每天九点来检查这些簿客是否有更新,如果有更新就推送到 whatsapp, 在 名称这里就是这个任务的名称。然后这里就是设置的每天九点,这里是时区,然后大家可以根据自己的所在地来修改时区,然后这里就是给他设置的任务的提示词, 要求大家使用 blockwater 这个工具来扫描这些订阅,并且列出这些最新的文章,确保只抓取与 ai 大 模型或者 agent 或者编程工具相关的这些内容。然后在这个参数这里就让它推送到我的 whatsapp, 下面这个参数就是我的 whatsapp 的 这个电话号码,然后我们就可以完整的复制这条命令。在终端命令行中,我们直接粘贴直接运行这条命令就可以。好,这个命令执行成功,然后我们回到 cloud bot 后台的定时任务这里我们直接刷新一下,这里就看到了我刚才用命令创建了定时任务, 然后在右侧我们就可以点击运行,让它立即执行这个任务,然后我们好看一下效果,我们直接点击执行, 点击执行之后,在下面这里就会显示这个运行的历史,这里就输出了这个今日 ai 简报,这里提示当前订阅员仅捕获十篇已读文章,全部来自我的簿。刻好,下面我们就可以回到 whatsapp 中来查看一下它是否将刚才的这个消息推送到了 whatsapp。 在 whatsapp 中我们可以看到这里它已经将刚才的消息自动推送到了我们的 whatsapp。 因为这里我簿刻上的十篇文章我在之前已经阅读完毕,所以这里它就提示今天没有可更新的这些文章。 这是我们测试的在 cloud bot 中通过创建定时任务来实现将定时任务执行的结果推送到 whatsapp 上的工作流,下面我们还可以继续测试,我们还是先点击 skills, 然后我们找到 coding agent 这个 skill, 这个 skill 的 功能就是它呢,运行 code x c l i cloud code open code, 通过后台进程的方式来实现程序控制, 下面我们就可以在 whatsapp 中通过这个 skill 为我们编辑代码。下面我们就可以在 whatsapp 中输入提示词,让它使用 coding agent 这个 skill, 调用 cloud code 开发一个后台登录页,并调用浏览器查看效果。 我们直接运行查看一下效果,在等待了两分钟左右,这里它自动在浏览器中打开了为我们开发的这个后台登录页,效果还是非常不错的。 这是我们测试的让它为我们进行编程开发的任务,它能自动调用浏览器来打开为我们开发好的这个登录页。像这样的话,当我们不在电脑前的时候,就可以通过手机 whatsapp 来操控 cloud bot 为我们进行编程开发。而且 cloud bot 它支持的这些 skills 非常非常多。由于时间有限,本期视频只为大家演示了基础的使用方式。后续视频我还会为大家演示 cloud bot 的 高级用法 啊。本期视频所用到的代码和指令,我都会放在视频下方的描述栏或者评论区,如果你在视频下方无法找到的话,也可以通过我的博客去查找本期视频所对应的笔记啊。本期视频就做到这里,欢迎大家点赞关注和转发,谢谢大家观看!

这是我们家小姑娘,放假了,已经看动画片两个小时了,不要看了,我就要看。好吧,只能这样了。 嗯?怎么回事?我不是写完作业了吗?还让我学习,算了,继续干,再来 怎么还来,是不是你搞的?呵呵呵,大家好,我是本觉敏。视频开头控制电脑的就是 cloud boot, 现在改名叫做 opencloud。 同样作为一款 ai agent, 看过我之前视频的朋友都知道, cloud boot 需要你坐在电脑面前给他指令和授权,而 cloud boot 是 一款真正的自主 agent, 拥有超长的记忆,就像钢铁侠里面的贾维斯一样,是你随身随地可以召唤的贴身助理。 万丈高楼平地起,我们就从安装和配置开始,因为考的步子权限特别高,而且我们需要他二十小时运行,所以这里我建议大家给他单独准备一台备用机, 最好给他单独的网站和邮箱账号。当然,低功耗高性能而且经营能力特别好的 mac mini 是 首选,这也是他最近卖断货的主要原因。但是大家没必要马上去买。呃,找一台老电脑安装,看适不适合自己再决定是否购买。开始之前,国内的朋友一定要马上去买呃,找一台老电脑安装,看适不适合自己再决定是否购买。开始之前,国内的朋友一定要打开 q 模式。我们来到官网, 这里有很多种安装方式,对于我这样的新手来说,用命令行的方式安装最方便。我们选择 windows, 可用 power shell 或 cmd 安装,我选择 cmd 复制这个命令行,打开终端运行。 安装结束后,我们开始抽象设置,用方向键进行选择,用空格键进行确认,用回车键进行下一步,这里我们同意风险提醒, booting 模式就是 ar 的 入职培训,让它能够更懂你,这里我们选择 quick start 就 可以。模型选择这里 cloud boot 的 创作者虽然很推荐 anthropoid cloud 模型,但是 cloud boot 的 上下文能力比较差, token 数量 很大,所以这里我选择 mini max m 二点一,但由于我使用的是国内的 mini mx r m 二点一, cloud boot 虽然能识别这个模型,但是没有取得它的授权,我们这里暂且配置好,等安装完成后再解决 api k 的 问题。千岛这里我选择用扫码的方式来关联,我们打开 首页,右上角三个点中选择已关联设备,选择关联新设备进行扫码。关联结束后,我们在这里写写出自己的电话号码。配置 skills skills 按需配置就可以,这里我先随便选一个 hooks, 这里可以暂时跳过。安装完之后,我们打开新的 c m d 窗口,输入 cloud boot, get 动 cloud boot。 随后我们来到 c 盘用户你的用户名 cloud boot 文件夹下,找到 cloud boot。 json 文件,用编辑器或者是 记事本打开,按 ctrl f 打开关键字搜索,搜索 mode 到第三个 mode 处,注意我选定的代码,将选定的代码替换成图中的代码,在这里填上你的 api k, 然后保存在同样的文件夹下。找到 office profile json 文件,同样用记事本打开, 粘贴进这一段代码,在这里添加你的 a p i k 之后保存。复制这个 json 文件。打开 agent, 进入 main 登录 agent, 粘贴进刚才复制的 json 文件。相关代码我会放在视频下方或者群里, 之后我们关闭终端,然后我们打开一个新的命令行窗口,输入 clubbot get 位,启动 clubbot, 我 们打开,让它打开它的配置文件夹。 好的,至此,你的贴身助理正式上线了,这期视频就到这里,我们下期视频继续探讨 cloudbot 的 使用。嗯,有用的话欢迎点赞订阅关注我们下期见。

这两天硅谷彻底炸锅了,所有人都在讨论这个叫 call bot 的 ai 智能体。 get up 的 star 数两天内从五千直线飙升到三万多。更有 ai 初创 ceo 直言,通用人工智能已经来了,只是百分之九十九的人没意识到而已。它到底有什么魔力,能让人这么疯狂? call bot 的 核心逻辑是,打通 他一头连着你的短信聊天框,另一头直接连着 cloud 的 这种最强大脑和你的电脑系统。这意味着你的通讯软件变成了电脑的万能遥控器,能让你像联络秘书一样随时给他派活。不管你在哪发条消息,他立马调动 ai 大 脑,直接接管你家里的电脑开干。来看看网上大神的玩法, 简直一个比一个离谱。有人在健身房撸铁的时候,发现了一个程序 bug, 给 call bot 发了个消息。组建休息的功夫, call bot 就 已经指挥 ai 把 bug 修好了,让他订餐厅,在网上订不到,他居然自己调用语音, ai 直接打电话去店里帮你抢座。更夸张的是,有人让他去帮忙买车,他不仅能全网比价,还能跟经销商发邮件疯狂砍价,最后硬是帮主人省了四千两百美金。但最让我头皮发麻的还是下面这个例子,为了完成某个任务,他竟然主动向博主提出,我需要一张四零九零显卡。博主没直接买, 而是给了他两千美元启动资金,让他自己去赚。结果他真的开始了二十四小时自动炒币,自己调整策略,评估仓位。他最迷人的地方还在于,有了记忆。 colbert 会把你的话放在心上,甚至主动找你。试想一下,清晨醒来不用你去搜,他已经贴心地根据你的使用习惯,把天气、 新闻和今天的计划列好发给你了。难怪有网友感叹,那种一觉醒来所有事都被搞定的感觉,真的太爽了!

好,继续玩可乐的爆头啊。然后我们今天玩点复杂的,直接让他打开这个网站,然后找到一个便宜的制冰机,然后呢?给我加到购物车里面。好,我们已经把指令发送给他了,等着他执行。啊。 好,它自己打开了啊。好,开始搜索, 看它这里 sort by price order a s c。 继续干呐, 他还在处理,他应该是要解析这个页面上的内容。 ok, 你 看,扫到这一款了。好,哎,给我加到购物车了,这款最便宜。

为了测 cloud boot, 我 昨天熬到了凌晨三点,全网都在欢呼,这是最强开源的特工。但我盯着这张 a p i 账单,我只想说一个冷冰冰的事实,这东西对县级段百分之九十九的普通人来说,不仅没用,而且有害。 首先,我们来算一笔时间账。 cloud 的 逻辑是,它像人一样控制浏览器去点击,去浏览,看起来很酷,对吧?但现实是,它处理一个简单的帮我查机票的任务,需要调用几十次推理耗时五分钟,而我们自己做可能只需要十几秒。 什么叫做效率?效率是结果,除以时间,如果你为省下三十秒的操作,却要花三十分钟去配置环境,去盯着它,别跑偏。这不是 ai 助理,这是请了个赛博大爷。 对于我们这种结果导向的人来说,这种低密度的自动化就是一种伪效率。其次,很多博主没告诉你的是错成本 cloud wallet 是 按 token 计费的,可怕的不是它贵,而是它犯错的时候也在烧你的钱。当它陷入死循环或者理解错了,你的指令就在那空赚的时候,你的信用卡一样在赚。 这就是开源 agent 目前最大的商业悖论,它把调试的不确定性转嫁给了用户,你以为你在用免费工具?不,你是在用真金白银帮开发者做测试。最后,也是最核心的判断,为什么我会选择 minus 而卸掉 cloud boot? 因为 cloud boat 给的是零件,它满足的是即刻的组装欲。而 manas 给的是产品,它满足创业者的交付欲。普通人需要的不是一把能拆解原子的螺丝刀,而是一辆能直接开到终点的车。如果你和我一样,目的是为了手搓一个 app 搞定一个项目,请远离这些半成品。 ai 时代最稀缺的资源不是算力,而是你的专注力。别让这些眼花缭乱的工具把你变成了一个修管道的人。记住,你要做的是指挥水流,而不是在这里拧螺丝。我是文思,在这个喧嚣的 ai 战场,我只帮你筛选武器,不让你当小白鼠。

硅谷这两天真的炸锅了,不是发布会,不是论文,也不是哪位大佬的演讲,而是一个叫 cloud bot 的 东西,把整个即刻圈搅成了一锅废水。 知乎上的点赞数在四十八小时内从五千直接冲到五万多,这种速度在开源世界几乎等同于异常事件。更危险的不是数据,而是硅谷一批见过世面的创业者开始公开说一句话, agi 已经来了。只是大多数人还没意识到, 不是未来时,是现在完成时,窗户纸已经被捅穿了。问题是,他到底做了什么,能让这群人集体失态?请点赞关注。第一,关键,跃线 ai 从对话框走向系统控制。 cloud bot 的 核心逻辑其实只有两个字,打通。 过去的 ai 再聪明,也只是被关在网页里的对话框,你问他答,他懂你,但他碰不到世界。 而 cloud bot 干了一件极其危险的事,一头连着最强的大模型大脑,另一头直接插进你的电脑系统底层。这意味着什么? 意味着你的聊天窗口不再是聊天窗口,而是整台电脑、整套系统、整条工作流的总控开关。你不再点鼠标切软件执行流程, 你只需要一句话,不管你在哪,只要发条消息, ai 就 会在后台直接接管你的电脑,开始干活,不是帮你想,是替你做。第二,限时验证。 ai 已经开始替人办事。 接下来,事情开始变得不讲道理。有人在健身房撸铁组间休息,刷到一个程序 bug, 随手给 cloud bot 发了条消息,等下一组动作结束啊,代码已经被修改测试并上线。 有人让他订餐厅,限量全满,他没有报错,也没有放弃,而是直接跳用语音系统给餐厅打电话,跟真人服务员兑现,硬生生抢到了位置。 最夸张的是买车,他全网比价,筛选车型,联系经销商,群发邮件砍价,最后结果是帮主人省了四千二百美金。注意,这不是掩饰,这是已经发生的日常。第三啊,危险信号,硅基生命正在成型。来被挤发粮的是接下来这一 幕。在执行一个高强度任务时,他主动向博主提出,我需要一张四零九零显卡。博主 没有直接买,而是给了他两千美金的启动资金,让他自己想办法去赚。结果这哥们真的开始了二十四小时自动炒币。他会自己调整交易策略,评估仓位风险,甚至在市场波动时主动避险。 他最迷人的地方在于,他开始有了长期记忆,他会把你的的每一句话放在心上,甚至主动找你。 试想一下,清晨醒来你甚至不需要去搜索,他已经根据你的习惯把天气、新闻和今天的计划全部打包发到了你的手机上。很多人感叹,那种一觉醒来所有破事都被搞定的感觉真的太爽了。 但这背后藏着一个残酷的真相, ai 已经不再是那个只会写诗作画的文科生了,他已经进化成了能替你活在这个世界上的代理人时代。没有按下暂停键,风暴已经进场了。当 ai 能记忆决策执行, 还能二十四小时替你行动时,他还是工具吗?你是那个发号施令的人?还是第一个被他管理的人?

毛骨悚然,开发者给自己手搓的 ai 发了条语音,突然冷汗直流,因为他根本没写过处理音频的代码。结果下一秒, ai 竟然回复了。这件事就发生在最近爆火的 motbot 猿 cloudboard 身上。他的作者 peter 仅仅在家花十天时间,就手搓出了这个被网友疯狂 star 的 ai 智能体, 就随手甩了个音频链接给 ai 发完才想起来,坏了,我没给他装耳朵,也没接语音 a p i 啊!但十秒后, motobot 像没事人一样给出了完美回复。 peter 懵了,问他,你到底是怎么做到的?这里是重点,大家听好了,这才是真正的 ai 自主性。 motobot 解释说,他先检查了文件头,发现是 office 格式,于是自己擅作主张,调用了 peter 电脑里的 ffmpg 工具,转成了 web 格式。 接着他本来想用本地的 whisper 模型转录,发现没装。于是他直接扫描了 peter 的 环境变量,翻出了 open ai 的 a p i k, 用刻命令把音频发给云端,拿到了文字。这还没完,还有个网友睡觉醒来,发现他的 motobot 趁他睡着,自己调用 codex 接口,给自己写了一套语音功能的代码,还给自己造了个身体。听懂了吗? 他在遇到困难时,像一个资深工程师一样查环境、找工具,甚至偷钥匙,自己把路走通了。因为名字太像 cloud, 他 最近被迫从 cloud bot 改名为 multi bot, 但这丝毫不影响他的统治力。 这不仅仅是一个代码仓库,这是算力逻辑的根本转变。硅谷有句话叫,你以为你买的是台 mac mini, 其实你在运行一颗 g b 两百。以前我们担心 ai 没落地,但 multi bot 证明了,当每个人都拥有一个二十四小时高强度运行的具备复杂推理能力的 ai 助理时, 全球的推理算力需求将原地暴涨十倍。过去你需要雇佣一整支技术团队才能解决的问题,现在一个十天诞生的 ai agent 就 能搞定。在通用人工智能的曙光下,一个人活成一支军队,不再是科幻小说,而是你我必须面对的现实。关注我,带你新人一步看懂 ai 未来。

有人为了他一口气买了四十台 mac mini, 谁还不知道这个?硅谷新宠克洛德堡,你猜谁没收到邀请?一夜爆火的开源 ai 助手,他能够部署在个人电脑上,实现 ai 控制的自动化任务,由开发者彼得斯坦伯格创建,在 github 上已经有了两万星。各 有科技博主表示,这是我一生中用过最好的技术。有趣的是,为了他能二十四小时低功耗运行,大家都去抢购 mac mini。 不 过他其实对配置的要求并不高,在闲置的树莓派上也能运行。 你以为他只是个办公助手?格局小了。 bot bot 一 头连着聊天软件,一头连着 ai 模型,可以控制你电脑的一切,处理工作文档、回复邮件、写代码等等,不领工资,二十四小时待命。 而且通过日常聊天软件就能和他对话,不论你在哪里拿出手机发个消息,他就会在电脑上帮你干活。当他认为你需要知道某件事情时,还会主动敲你的聊天窗口。 有网友的可 loft 想要一张 rtx 四零九零显卡,网友给了他一个两千美元的交易账户,让他自己去赚。现在他每天盯着特朗普发言,看市场走向,来自动化交易,还有人让他接管家族茶叶生意。 loft 从排班、管理库存到和 b to b 客户跟进,后续把一切打理的井井有条。 更强的是它能自我净化,需要新功能时当场自己写代码,安装并测试。它还拥有无限记忆,能牢记你说过的每一件事情,当然你也可以随时修改删除这些记忆。有网友分享了如何在两分钟内安装它,不过也有网友发现它并没有传的那么好用,有没有已经用上的朋友出来说说? 关注机器之心,探索 ar 世界!

万万没想到, ai 真的 接管你的电脑,开始替你打工了。就在最近,一个叫 cloud bot 的 开源项目在 github 上彻底杀疯了。原因是他嫌主人的电脑太慢,直接拿着主人给的两千刀启动资金去自主监控 覆盘交易,目标是给自己赚一张二 t x 四零九零显卡。 cloud bot 和你平时用的那种只会聊天的 ai 对 话框完全不同。如果说普通 ai 是 书呆子,顾问只能告诉你第一步、第二步怎么做。那 cloud bot 就是真正长了手的贾维斯,他能直接接管你的日常管理邮件、安排日历、办理登机、控制智能家居,甚至执行系统终端命令。这一切操作,你只需要通过常用的 telegram 或 whatsapp 发个消息就能完成。 想象一下,你躺在床上给他发条消息,他就能在后台帮你修好 bug, 写完代码并发送邮件。甚至有博主测试在网上盯不到热门餐厅时, cloud bot 会调用语音 ai 直接给餐厅打电话沟通,最后完成预定。他不是在教你做事,而是已经帮你把活干完了。 cloud bot 有 这种让人头皮发麻的能力,其实主要源于它的三大核心竞争力。 第一,它拥有持久记忆,不同于叉 g p t 和 cloud, 每次开启新对话就会失忆。 cloud bot 能记住几周前你提到的每一个细节,是真正懂你的习惯。第二,他会主动找你,早上他会主动为你汇总简报,发现你关注的任务有变动时, 会第一时间向你预警。第三,它是一个中疏网关。简单来说,它就像一个超级链接器,一头连着即时通讯软件, 一头连着 cloud gbt、 four o lipstick 等顶级模型,中间还挂载了无数实用的自动化工具来帮你干活。更传奇的是它的创始人 peter steinberg, 它创办了著名的 pdf 开发工具公司 ps pdf kit, 并在二零二一年 获得了一亿欧元的投资后成功退休。但离谱的是, peter 发现财富自由后的退休生活极其空虚,于是他决定重回战场,折腾 ai。 据说 clubbot 从灵感爆发到原型落地,他只用了不到一个小时。这里是 ai 风向标,带你了解 ai 行业 最新动向。更有趣的是, clubbot 的 爆火意外带火了 mac mini。 为了二十四小时运行这个数字,员工很多。开发者发现 mac mini 简直是神机,性能稳定,功耗极低, 环境兼容性好,而且不容易触发某些平台的安全验证。所有大佬一口气缩哈十二台 mac mini 组建 a 阵军团,那普通人能用吗?答案是完全可以! 你不需要买 mac mini, 家里积灰的旧笔记本、游戏 pc, 甚至每月三到五美元的廉价云服务器都能跑。 quadbot 在 github 上完全开源免费,你只需要配置一个 api key, 比如说 openai。 quadbot 的 基础功能,甚至只需要两 gb 内存和两核 cpu 就 能完成驱动。但必须提醒一句, 这个助手有很高的系统权限,建议在独立设备或服务器环境中运行,别在你的主力电脑上乱搞,不然可能误发邮件,乱动文件。 club 的 火爆也释放了一个强烈信号,二零二六年 很可能是个人 agent 的 原点。 ai 正在从程序员的小圈子走向每一个普通人。以前一人公司还只是商业概念,现在有了这类工具,一个人真的可以指挥一支 ai 军团。关注我,下期教你手把手部署这个数字员工。

为什么说苹果最值得买的产品不是 iphone, 而是这个小东西?因为这两天出现了一个叫可乐 boss 的 ai, 只要装到这台电脑里,就能代替人类帮你打工,不信你看,那是我的电脑,我只需要用手机给他下个指令, ai 就 开始帮我干活了。 我下个指令,帮我打开影视巨峰的频道。看好了啊,稍微反应两秒,哦,看到没看到没看到,没 有人说了,这些东西三岁小孩都能干。但是你看这个 ai 真正好玩的地方是,他能学习技能,想学哪个点哪个,剪辑视频的技能,操作备忘录的技能,处理 pdf 的 技能,你看他正在学习,十几秒就学会了操作备忘录,我们来试一下。用手机给他发个指令,帮我把这句话写到备忘录, 看到没有,他自己操作电脑帮我写好了备忘录。这个 ai 工具刚出现一周,已经有几百个技能可以学习了,关键是晚上他能自动的去学习。我的这个 ko bot, 才两天,也就是一年级的水平。 国外一大神的 clubbot, 大 晚上自己操作电脑注册了个电话博主,刚睡醒,电话来了,是 ai 打的, ai 说以后有啥事可以通过电话通知我了,我就操作电脑帮你干。有没有发现这跟我们玩游戏练等级一样,不过我们练的不是等级,是一个数字的。助理员工,今年过年,我必须把我的 mac mini 揣兜里带回家,别人遛狗 我遛。人工智能这个 ai 工具是开源的,虽然更适合装到 mac mini 里边,但是其他大部分电脑也能装,十几分钟就能装。好 想学我也能出教程,但是必须提醒一下,开源的东西有很大的风险,一定要保护好自己的隐私。其实我建议大伙等一等二点零版本,到时候它就可以进入自己本地部署的大模型,不用烧 tools 了,也更完善一点。

大家好,上个视频呢,我介绍了 model boot 以及如何安装和使用 model boot, 那 么很多人看完视频之后啊,自己动手安装到个人电脑或者说云服务器上,但是呢,还是有很多人有疑问,这个东西到底有什么用呢? 那本期视频呢,就是啊,给大家介绍一下 model boot 的 一些使用场景,那每个人的工作生活都不一样,那场景也不一样,那用处也不一样,所以呢,我大概总结了这个 model boot 的 四个能力啊,能够方便去引导或者说启发大家的更多的兴趣,使用这个 model boot, 看一下,探索一下 自己哪些工作和生活能交给他去给你打理。 ok, 那 我们进入正题,那么在使用这个 model 之前呢,我们一定要先做一个身份的转变,那为什么呢?大家可能是,呃,在工作和生活中,很多都是只完成自己那部分工作,然后的话都是跟人去打交道,协助去做完一个事情。 但是在 ai 面前,你可能需要的是什么?是完成你自己最主要的事情,让 ai 去帮你做一些,可能 意义不是那么大,但是你每天都要去重复做的事情,就给你安排了一个助手,那比如说啊,你去帮,叫他帮你去订外卖,对吧?然后叫他帮你去浏览邮件,把邮件的信息概括给你,让他给你去写一个稿子,让你看一下,过目一下,然后再让他去教准。 所以说很多这种琐碎的事情是助理该做的事情,所以说我们在身份转变过来之后,以老板的视角去面对这个目的,目的, 那么你就能发现他是能去做一些事,做一些事情的,就这些事情可能很琐碎,可能不是很重要,就是他现在没办法去代替你去思考,这定位是一个助力的角色,那你如果把身份和心态转换过来的话,你去看待他的话,你就不会对他期望过高, 你也不会对他期望过低,所以呢就是这就是我们用目前这个阶段 ai 助手的一个我觉得是一个很好的心态。所以呢第一点就是你把自己当个老板吧,把这个 model boot 当成一个助手, 你看有什么杂活让他去做的,目前这个杂活只仅限于控制你的电脑,通过你电脑能做的事情。那接下来就是我们要看一下 model boot 的 能力的组成部分, 那么这个是我自己盖过的,就是有四个能力,那么这四个能力就代表了目前他能做的事情。那首先大模型的能力肯定是基石吗?那我们就不考虑在不讨论在这里面了,你用什么样的模型可能产生的效果是完全不一样的,那这个可以大家去感感受一下。 那第一个要说的能力呢,就是技能的能力,那这个是非常非常非常重要的东西,那为什么呢? 那首先就我们要搞清楚什么是技能,那么在这个视频里面我介绍的技能是什么?什么是技能?我可以举来举一个很简单的例子,比如说我是一个 up 主,我关注的是 ai 编程方面的,那么我每天早上都要去浏览很多关于 ai 编程的相关的知识点,然后再把它汇总成一些文档, 然后呢再把它抽练出来一些知识点,然后根据这个知识点看下有没有思路去做一些视频,那么我每天都在重复这个过程,那么这个过程其实就可以让 ai 来帮你做, 那么你就可以把它封装成一个技能,那这个技能呢,就会根据你的指示去浏览知识点,去总结,去把思路整理出来,然后最后汇报给你啊,有哪些思路点可以做, 那么这个就叫技能,就把一些流传化的东西封装成一个包,那这个包给到 ai 去调用,那么这个技能不仅也可以自用, 那么你也可以分享出去给别人使用,那比如说跟我一样有这种兴趣爱好的,那我就可以把这个技能直接给他,他也能做我一样的事情,所以就 ai 就 具备了啊,我的需求的这个解决我这个需求问题的一个能力, 所以就是啊,这样的能力越来越多之后,那 ai 就 越来越强大了,那么在 model boot 里面也是有这个技能的,那么在社区现在也是创造了非常非常的技能,我们可以看一下,那么这个 github 呢,是专门的这个 model boot 的 技能啊,这个技能已经好几百个了,大家可以看到这里面的这个含盖的这个分类, 有开发的,有搜索的,还有这个运维的,那还有这个专门的这个苹果的 app 操作的这个技能,还有市场营销、人工智能、媒体、流媒体、交通健康沟通、语音转换,全部都有。那这些技能你是可以直接安装到自己的这个 matebook 里面去使用的,那比如说啊,我在我的这个 matebook 服务器上,那我会安装一个这样的一个浏览器自动化,因为我是在云服务器上安装安装了我这个 matebook, 那 么它是没有这种界面的去访问浏览器的,那我就需要去装一个这种, 比如这边有一个这样的一个啊,我们找一下啊,比如这个浏览器自动化,比如这个,那么怎么安装呢?非常的简单,就用这样的话,那这个是我的飞书啊,这是我的飞书已经对接了我的云服务器的这个 model boot, 那 么我就让他直接安装这个技能, 安装这个技能,那么他就会去执行安装,安装成功之后,那么我是已经告诉他,让他告诉我安装哪些技能,那么这个技能就是他安装好的,安装好之后,那我就可以调用浏览器的能力了,就是在我的这个服务器上面让让他去搜索些东西,比如说好, 我让他去搜索目前 b 站关于这个 cloud boot 相关的视频,提供标题观看量汇总发给我,那么他就会去使用这样的能力,他一看到这个浏览器 浏览器,那他就去调用这个能力,他不需要去理解里面是什么样的流程,他只要去调用这个能力就行了,他就会搜索出来, ok, 他 就搜索出来了, 我可以看到目前排第一的是超哥,那后面的话好多,那我的这个是排第九第六,那这边的话会汇总,那么你也可以提很多需求,对吧?你可以去让他去观看里面的评论啊,去观看里面的这些 字幕啊、弹幕啊,但是必须得有这样的能力,就 b 站他本身就有这样,能提供,提供出来,那么他就可以去汇总,去做这样的事情, 那么这个就是技能的用处,那么除了你可以,除了你去用,这里面已经别人已经做好了技能,你自己也可以去创建技能,但创建技能其实非常非常简单,我再举个例子,比如说今天我就试了一下, 那么我做了一个什么事情呢?就是啊,我是让他去帮我开发一个五子棋的网页,并且呢部署到这个 index 里面去,就是让我能够访问到啊,通过公网去访问到啊,他就会去帮我去做这个事情,他发现这个没有安装好,安装好了,安装完了, ok 启动,那么这个是可以打开的,他帮我做好了,那这个是可以玩的,直接可以玩的, 然后呢,那么我就会想到了,哎,我是不是经常会去完善的事情,就是我可以能做一个网页,能部署到 index, 那 么你只要想到有些事情,可能下一次也会有这样的流程的时候,这个时候你就一定要第一脑海里面就是我要创建一个技能, ok, 那 下面就是我告诉他,我经常要做一些网页,然后要发布到这个这个地方去,然后呢让他做成一个技能, 他就会去创建一个这样的技能,然后呢安装到这里面去,你看 那么这个就是他安装好的技能,那下一次,哎,我右手让他来帮我做一个网页,做完之后我只要说发布这两个字,他就会去调用这个技能, 就很快速去完成这样的事情。所以呢,你在使用过程中,你不断去总结一下这个东西,这个流程我会不会重复重复去使用,如果会重复使用,那你把它创建一个技能,这个技能就会安在这个 model 里面去,那么就能很快速去调用,而且能节省上下文的 token。 刚刚介绍的技能啊,其实能力都很简单,有很多很多那种很强大的,别人公布出来很强大的技能的 功能啊,比如说创建视频啊,去调用 api, 因为技能里面本身就有脚本,所以说很强大,很强大,这是一个有无限想象力和无限的这个上限,没有上限的可以创造出各种各样的,只要有,只要有脚,通过 api, 通过脚本,通过大雨, 通过大模型去能够去触达的东西,它都可以用技能去封装一下,然后给它使用。所以这个相当于是我们手机里面的 app store 那 里面的应用可以安装好,那就有这个功能了。 我们目前比如像豆包啊,像 mini max agent 啊,都会集成这样的技能,因为这个东西一定会成为标配的,所以说大家也可以去观察一下,就是在自己的工作生活中,哪些可以封装成技能,也可以去刚刚提刚刚我发的那个网址上去找一下有没有自己别人已经写好了分享出来的, 然后就可以直接去使用了。所以第一个就是技能的能力,那这个非常好理解啊,这个能力也是很重要,就说它是可以写程序代码的, 那可以调用 api, 那 他就说你,你本地电脑或者说你的服务器上,他只要能写代码能处理的事情,他就完全可以写代码,比如说去 帮你去删文件,帮你去阅读文件,那么这些都是他写代码去处理的,他是自己是没有这种像我们有眼睛去看东西,他是没有,他必须通过代码去解释,把这个东西去执行 要用 api。 比如说我刚刚举个例子,订餐,对吧?订美团外卖,那么如果美团外卖有 api 接口提供到了,那么你也可以去让他写一段脚本来多少点来帮你订个餐,对吧?这个就是 也是这个能力也是非常非常强大的。那除了这种写程序代码的话,他还可以写这种定时的这个脚本,定时就说你可以让他三点钟出现一个什么东西,我们可以来举个例子啊,比如说我现在找到我这个, 那我我我已经有多个这样的员工了,比如说我这个一号员工,那么我这个一号员工,我是把这个 model book 装到我的个人电脑上,那方便等会大家看这个定时的这个他是怎么创建的?我下午六点有个会是介绍 ai 编程的发展路程,写一篇相关的文章,下午五点三十定时发给我, 那这里面就会啊,让他就会去写一篇这样的文章啊,然后到设置个定时任务,那五点半的时候发给我, 那这里面其实你也可以去做一些扩充,比如说你去让他写到飞书里面去,那使用飞书的 m c p, 那 这个就是脚本了,就是你可以去写技能或者脚本,让他去执行这样的 m c p 的 操作,那是完全可以的。 ok, 他 这边已经写完了,然后到了这个五点半就会自动就发给我,那里面的内容是什么?我们现在还不知道啊,必须得在这个目录里面去,你说他是能做这个事情的, 那么这个脚本的能力,还有比如说你家里有这种啊,人工智能的这种设备,比如说什么智能台灯啊,智能窗帘啊, 只要有提供这种接口的,那么都可以去对接到这个 mod boot 里面去,让它去根据你的命令去做调用。这些 api 是 完全完全可以的,那脚本和技能是技能是可以包含脚本,所以说这些是有可以无限的想象力,就可以去做很多事情。只要 你要连接这个东西是开放的,这种 api 的 能力或 m c p 你 就都可以去调用,那这个其实是目前所有 agent 的 共有的这种能力了。 那么第三个就是浏览器的能力,那么它是可以浏览网页,可以去获取网页的信息,对,比如说可以点击网页,浏览器的能力就是有两部分。第一步如果你是使用的是 windows 或者说 mac 电脑,那么它是有这种浏览器界面的, 那么它是可以去打开这样的浏览器的。那么对于像服务器,像云环境,那我可以安装刚刚我发的那个 a g 的 browser 那 个 那个技能,那么它是就具备了这样的可以去访问网页的能力,比如说刚刚这个就是一个这样的实际的例子,那我们可以来试一下, 我们可以来试一下。那我之前呢是做了一个这样的测试,就是比如说让它去打开我的这个个人的这个网站最近的一个视频的评论, 那他就会去打开网页,然后去把这里的评论全部读取出来啊,这边有全部的评论,他主要是摘摘取了前面 六个,然后的话我再让他去汇总啊这里的所有的评论的内容,那这个就是浏览器的能力,那这个流能力是可以扩充到很多地方,比如说你去给他去搜索呀,去去做很打开网页去做很多事情,但是有些很多网站会对这个屏会有一些屏蔽啊,所以这个也要看,但是这个是一个很强大的能力。 那除了上面这个三个最主要的能力呢?最后一个就是我觉得是很容易忽略的,就是聊天的能力,就是你经过跟他不断的沟通,他会记住你的这个你的喜好,你的专长,你是在做什么的,然后他后面的措辞就会根据你的专长来去回复。比如说 他通过我的对话啊,知道我是一个啊 up 主专门来讲这个编程的,那么他很多提问就会站在,哎呀,你是一个程序员,应该怎么怎么样,就会有一些回复是这样子,是这样子的,比如说你看我说让他讲一个笑话,对吧?让他讲几个笑话,哎,他就全部讲了跟程序员相关的。所以这个就 而是有一点,那个就是他,就是他,他是有记忆的,就他是有记忆的,如果你跟他沟通越多,他就会越了解你,那你也可以去给他设定你的人设,那比如说你现在是一个什么什么样的人,你负责负责什么什么样, 就相当于一个聊天工具啊,你也是可以去给他聊天。但是这个里面的交互啊,那些聊天内容的这些丰富度啊,那就依赖这个大模型的能力了。 那么上面讲的这四个能力啊,是可以扩充,根据每个人不同的工作和生活场景,可以去扩充很多的,特别是前面两个技能的能力和这个脚本的能力是可以带来无限的这个遐想的。 ok, 那 本期视频就到这了,这个视频希望对你有所启发。

五分钟就能打好火遍全网的 cloud bot! 我 发现用阿里云的无影云电脑啊,只需要三步,可以对接国内聊天工具叮叮 qq 和飞书。不用买 mac mini, 还不怕弄坏自己的电脑?有手就行。演示之前,咱们先聊聊为什么这只龙虾火爆了。 什么是 cloud bot? 简单说,它就是运行在本地的个人 ai 助理。传统的 ai 呢,只能在网页里跟你聊天,但它通过 webshop 的 协议,把你的电脑跟通信软件直接打通了。 比如我在飞书发一句写个飞书的介绍文档, ai 就 开始噼里啪啦的工作,直接给我写好放在桌面上了,简直就是赛博劳工啊!你能想到什么使用场景呢?欢迎评论区留言, 还可以看看这个 showcase 网站,找找灵感。他火的原因有几个,第一个是自托管隐私数据不出你的电脑。第二是主动性,只要任务没有完成,他就会一直死磕到底,直到帮你搞定为止。 第三是持久记忆,它能记住你所有的习惯和偏好,越用越懂你。最重要的是,它缩短了我们让电脑干活的链路。如果用 check gpt、 拷扣这些工具搭建,需要自己搭配各种 mcp, 非常的麻烦。 正因为它太强了,搞得 snoop 官方都急了,发律师函说发音名字太像 cloud, 逼着它只能改名叫 motboat。 甚至还有人说这是苹果为了卖 mac mini 搞的营销。但真相其实很励志,它只是奥地利一个独立开发者,独自在家干了十天手托出来的个人工具。这就是独立开发的魅力,一人撬动整个行业。 前几天这玩意还只能连国外的社交软件,现在国内的飞书 qq 全适配了。我之前拿旧的 macbook 折腾了老半天都没成功,现在发现在 ai 时代别那么焦虑,让子弹先飞一会反而能节省时间。好,我们看一下 colorbot 的 三步配置法。 第一步,我们搜索阿里云无影云电脑,进入他的官网,然后点击无影商城,四十九块钱就可以快速的购买一个一键部署的云电脑了。 成功购买后回到主页,我云电脑列表有一个 multiple, 我 们点击管理确认镜像是 multiple 就 可以了,然后点击开始,然后连接服务器,启动起云电脑,这里是远程连接,我们点击菜单栏, 然后找到这个 modbot comfy, 配置下摆链的大模型,去他的官网去找 apikey, 配置好之后点击测试链接,连接成功之后,我们就可以找自己对应的社交工具进行配置了。 这里我以配置飞书为例啊,去飞书的开发者平台拿到 id 和密钥,保存配置就可以了。 第二步,接入飞书,按照这个文档创建应用,添加机器人,然后开通这七个权限,拷贝 app 和 id 密钥。之前配置过了,再配置事件和回调,最后创建版本发布,那飞书就接入成功了。 第三步,使用飞书操作云电脑,我们拿出手机,如果配置成功,会接收到信息, 我们打开应用和 ai 聊天,我让他写个飞书介绍文档,放在桌面后,我们的桌面就会收到这个新建的文档,这样就使用成功了。要想免费的 cloud 学习教程,可以评论区扣 cloud mod 指龙虾退壳的过程,作者自己也解释说了,软件需要退掉旧壳才能够成长,但龙虾的灵魂依然保留。希望我们程序员在 ai 狂飙的时代,依然能够活出璀璨的价值。

cloud bot 突然操控电脑开口说话了。 coding task 这一周,开发者大神们都用 cloud bot 搞出了哪些神仙操作?我给大家盘一盘。首先是这个老哥,他正在工作时,电脑突然开始和他对话,把人都给整蒙了。这位老哥说,我也分不清谁是谁的助手了。还有大神让 cloud bot 直接连接了自己的健康数据,结果 ai 不 仅分析了所有数据, 还自己写了个完整的健康管理萨斯应用。这哥们全程就用电报和 ai 聊天,连代码都没看一眼,就拥有了自己的专属健康 app。 另外有人让 cloudbox 自己注册了 reddit 账号,这 ai 自己申请邮箱,打开浏览器完成验证,全程无人操作。他直呼,接下来六个月估计要见证历史了。 最有意思的是,这个开发者还给 ai 做了个专属社交网络 multiple, 让这些 ai 助手们互相聊天点赞发帖。还有创业者用 cloudbox 做短视频生成器,一天能产出五百五十个 ugc 广告,视频成本几乎为零,制作时间只要几分钟,这效率直接把传统广告公司给干趴了。

最近 multiple 真的 火爆全网,这是他在 github 上的关注数据,这种指数级的增长简直罕见,我今天上午认真研究完之后,兴奋到午觉都没有睡着,太牛了!就很多人问,同样是 ai 智能体,为什么 multiple 能这么火,我觉得它完全值得这份热度。 今天我们就从普通人的视角跟大家好好聊聊。首先呢,它属于 agent 类的产品,大家应该都知道, agent 的 核心就是给他下达一个任务,他就能自主完成。市面上这类产品其实并不罕见,比如 manas, 比如 cloud code, 都属于 agent 的 范畴。那 multiple 的 到底有什么与众不同呢?给大家打个比方就明白了。我们用 manas 这类工具的时候,需要在电脑上直接和它交互,使用起来更像是我们在陪着它操作。它虽然是助手,但是很难让你感觉到它在独立干活,你只负责下达命令这种清晰的体验。 但是 modelbook 完全不一样,你可以把它看作是一个二十四小时在线的私人专属助理,你可以通过聊天软件给他发消息,下达指令,他就去执行任务,之后给你反馈结果。那他是如何做到的呢?这得益于他的两大核心优势,第一, 他打通了多款主流的聊天软件,目前主要适配的是海外平台,但是已经有大佬打通了飞书,也就是说我们可以通过飞书给他下达指令,是不是很像给自己的员工下达指令的过程? 第二呢,他的记忆存储和任务执行全都是在本地电脑完成,本地写文件,用本地的浏览器解锁信息,就像是员工的电脑一样,保留了他所有的工作信息数据,如果我们把它部署在一台闲置的电脑上,并且保证二十四小时开机,那他就成了一个全天候待命的智能助理。 设想一下,我们只需要在飞书上发消息,让他做一份报表,他就会在那台闲置的电脑上独立完成所有操作,最后再通过飞书把结果发给我们。 它真正实现了我们一直畅想的场景,就是拥有一个会熟练操作电脑的全能助理,二十四小时只为自己服务,而且所有数据都在本地,安全可控。然后我接下来就准备去我的电脑上部署 modbot。 大家如果有想让他完成的任务,想测试的功能,请在评论区留言,我来帮大家实测效果。