最近硅谷圈里有个叫 cloud debote 的 玩意突然爆火,你要是刷海外科技圈的内容,估计已经刷到吐了。我翻了好几天的海外论坛、科技博主的测评, 再结合世界银行二零二四年全球科技创业融资报告里的数据,今天就跟你唠唠,这到底是个什么来头,为啥能火成这样? 说出来你可能不信,这 cloud debug 居然是斯坦福大学一群研究生在二零二五年三月份捣鼓出来的,一开始就是个实验室项目,没想到上线才半年,在 gtape 上的新标数就突破了十万,还拿到了红杉资本领头的两千万美元 a 轮融资。 你要知道,世界银行的数据显示,去年 ai 工具类创业项目的平均融资额才四百二十万美元,这热度简直离谱,它到底能干嘛?说白了就是个 ai 代码助手, 但跟咱们平时用的那些不一样,它最牛的地方是能直接对接企业内部的数据库和代码仓库,还能自动深沉,符合公司规范的测试用力。有个在谷歌工作的网友说,他们团队用了这玩意儿之后,写代码的效率直接提升了百分之六十, 以前改个 bug 得熬大夜,现在喝杯咖啡的功夫就搞定了。还有个旧金山的创业公司,用它重构了整个支付系统的代码,居然没出一个漏洞,这在以前想都不敢想。不过别光看它风光,槽点也不少。 首先就是价格,个人版每月要九十九美元,企业版更是直接开到了每月九百九十九美元,这价格直接把中小创业公司给拒之门外了。 还有就是隐私问题,不少网友担心把公司的核心代码上传到平台,会不会有数据泄露的风险。虽然官方说用了端到端加密,但架不住大家心里犯嘀咕啊,毕竟之前不是没出过 ai 工具泄露用户数据的事,而且这玩意也不是万能的。 有个麻省理工的教授测试过,要是遇到一些特别冷门的编程语言,或者复杂的算法逻辑,他生成的代码错误率能高达百分之三十,到时候你还得花时间去改,反而耽误事。说白了,他就是个高级辅助工具,真要指望他写核心代码,那你可就太天真了。现在硅谷的科技公司都在抢着用这玩意, 微软、亚马逊这些巨头已经开始跟他们谈合作了,估计用不了多久,咱们国内的互联网公司也得跟着卷起来。不过我劝大家也别盲目跟风,先看看自己的需求到底是什么。 要是你平时就写点简单的代码,那用免费的工具就行,犯不着花这个冤枉钱。但要是你是个程序员,每天跟复杂代码打交道,那这玩意说不定还真能帮你省不少事。 总的来说, cloud 爆的爆火,其实反映了现在科技圈的一个趋势,就是大家都在想尽办法提升效率,毕竟谁能在最短的时间内做出东西,谁就能抢占市场。但咱们也得清醒地认识到, ai 再厉害也不能代替人,它只是个工具, 真正能决定产品好坏的还是背后的人。至于这玩意儿能火多久,那就得看它能不能解决现在的这些问题,能不能持续给用户带来价值了。
粉丝1.0万获赞499

整桌鬼主一夜之间被 cloud bot 刷屏了。这是一个完全禅缘的 ai 个人助手 databot, 标星已经突破两万,你可以把它理解为现实版贾维斯,它既可以直接部署在电脑本地,调用 cloud deepsea 等这种模型替你干活,还能当一个网关接近这种聊天 app, 你可以从手机、手表、 ipad 给他发消息,他就在另一头替你处理一切。比如只需要在一个 disco 的 频道里作证指挥,就能绕出 autobot 替你处理邮件、读 ppt、 写代码、发推文,甚至刊写每日汇报等一系列工作。类似的神操作还有不少, 有人让他预定下周六的餐厅,线上预定失败后,他竟然能调用语音 ai, 自己给餐厅打电话找定。有人把白天的零散想法丢进日制,晚上智能体自动做研究,跑代码验证可行性。第二天醒来,一份完整的角色爆照已经生成好了。还有人干脆用 cloud bot 跑本地模型,彻底不消耗云盾 api。 更离谱的是,超的 boat 甚至会主动向用户讨要 gpu, 点名要一张四零九零。博主没直接给,而是给了他两千美元启动资金,让他自己去赚。结果,超的 boat 每周四小时就做一次市场调研,提出新的交易策略,并不断复盘和调整仓位。 更神奇的是,超的 boat 这波爆火,最招幸的人可能是库车。因为为了跑超的 boat, mate mini 突然卖爆了。它的优势包住、便宜、好用、环境正接近个人用户,不容易触发验证等等, 大佬一梭哈就是十二台,还把它们和饮料一起放进冰箱散热,简直过于抽象。做出 charibo 的 人也是位传奇人物,他不仅是一位退休程序员,还是一位亿万富翁。十几年前抄软件创业成功,二零二一年以大约一亿欧元套现离场,实现财富自由后却陷入巨大的空虚感。 最终他选择回到键盘前重新全职写代码,不到一年时间就做出了潮的 boat, 用过的网友都在疯狂点赞。 a j i 已经到来 ai 的 下一个级别,又找回了十多年前互联网的感觉。对此你怎么看?

最近 cloud bot 刷爆整个硅谷,有人命令他去炒股赚钱,有人为了他一口气买了四十台迈克迷你,那 cloud bot 究竟是什么呢? 普通人怎么能快速的安装免费拥有它呢?请看完这个视频。简单来说啊, cloud bot 一 头连着聊天软件,一头连着 ai 大 模型,它就像是一个二十四小时待命而且不要钱的助理,它可以控制你电脑里的一切,帮你去 处理工作文档啊,回复邮件啊,甚至可以帮你去炒股呀,写代码等等。而且你通过日常聊天,你就能和他对话,命令他去帮你做事情,无论你在哪里。所以就真的特别像一个真人的助理一样, 当他认为你需要知道某件事情的时候呢,还会主动敲你的聊天窗口。有人的 club box 还要求去买一张 rts 四零九零的显卡,那网友呢,就给了他一个两千美元的交易账户。现在他的 club box 每天都在盯着川普的发言,看市场走向来自动化交易。 那可要爆的特点是什么呢?它是完全本地运行的,所以用户不用担心自己的隐私问题。而且它还拥有无限的记忆,可以牢记你说的每一句话,当然你也可以随时去修改或者删除它的记忆。而且呢,因为我们可以连到我们的聊天软件上,所以它有更加人格化的互动 啊。最后呢,他会主动发起提醒或者通知。我现在对 ai 的 感想就是,求求你们别更新了,我已经学不懂了。那接下来呢,我会给大家演示一下啊,我们如何快速的去安装免费拥有 carbot 下一个视频呢?我会啊,给大家演示一下如何连到我们的聊天软件中。 在开始之前呢,记得点赞关注开启小铃铛哦。想要免费拥有 clubbot, 你 只需要三样东西,电脑,网络以及一个免费的 google 账号。那现在我们就来到 clubbot 官网, 那里面有很多东西,我们只需要划到这里, quickstarts 这里。然后呢,复制一下这个命令行,点击复制。那从你的电脑上呢?呃,搜一下 terminal, 然后把这个命令行给它粘贴过来。那在这个安装过程中呢,它可能需要你升级你的 note package。 依赖什么的遇到任何问题呢?你可以再打开一个 gmail 的 窗口,随时地去问它。 那我现在呢,这个依赖都是已经安装好的。他现在问我第一个问题,就是说,告诉我呢,这是有风险的,我要不要继续?那你滑动到 yes 就 ok。 然后我们选择 quick start。 啊,那这里选择模型的话,我建议呢,我们先选择 google。 那 接下来呢?他问我选择 google 的 off method, 我 建议呢选择第二个。因为选择 api 的 话,很多人会担心一觉起来 几千刀的这个账单,对吧?那我们直接选择第二个, anti gravity oos token。 这个意思就是说呢,它会先用你 google 免费账号里的免费额度,所以你不用担心会花你很多钱。那我们直接选择这里。 哦,那它现在就自动弹出了这个窗口。那选择一个你的账号 authentication complete。 那 再回到我们这个 terminal 里面。 呃,然后让你选择模型,我们可以就选择这个。呃, current 模型。 那现在呢?选择 channel。 那 我们下一节课会教怎么去连到我们的聊天软件中,所以我们现在呢就摁上键 skip for now, 现在就不安装了 啊, skills 也是我们选择 no, 现在就不安装了,然后 enable hook, 那 你看这里啊,你上下选择它都没有选中,那你需要点击一下空格,选择 skip for now 啊,在安装的时候呢,我们可以再回到官网里面看一下啊,那我们刚才用的是这个 quick start 哦,这里它现在就在问我一些权限啊, 我们滑到底下呢,你也可以去看一下它的 documentation, 然后点击下这个,里面有一些它的文档,官方的文档,比如说怎么 start, 然后 setup, 还有呢安装到各类的聊天软件上, 那这边呢,还有它的 github, 我 们打开看一下啊,你像 github, 我 昨晚看还七万多的收藏,现在已经八万四了, 底下也有它的这个 readme, 可以 看一下它的介绍。那我现在回到我的 terminal 看看它哦,已经 问下一个问题了,那我们呢选择第二个,因为像这个 terminal ui 呢,可能很多人小白看起来不是很适应,那我们直接选择 web ui, 这样呢就会比较友好。那我现在选择以后,你看它就弹出了这个聊天窗口, 我在这里给他发一个信息,我就发一个 hi, 看他有没有回复啊,他如果有回复的话,说明他就已经连接好了哦,你看他现在就已经连接好了。 那接下来这个视频呢,就简单教大家去快速安装我们的 call bot。 下一个视频呢,我会教大家怎么去给它连接到我们的聊天软件中,让我们随时跟他通话,变成我们二十四小时待命的万能小助理, 那今天的笔记呢?我会放在 youtube 视频的下方,当然也欢迎你来加入 u i 发电,一起来学习和交流啊。小红书和抖音平台的观众呢,请看我首页。

cloudbolt 这两天全网爆火啊,都在说它是能改变世界的 ai 神器,但是我重度使用了两天之后发现啊,有很多博主啊,有几件事情没有告诉你啊。第一,就是所谓的开源免费啊,仅仅是软件免费,真正烧钱的是 api 的 调用。我们拿 cloudops 最新版来举例啊,每百万的头肯呢,便宜的要五美元,贵的要二十五美元。这个价格确实比之前便宜了不少,但是加上 cloudbolt 这个无限记忆的功能, 你记忆的东西越多,每次掉的头根就越大,成本呢,就会随着时间越滚越高。你偶尔写写文案,回回邮件,可能一个月 几十或上百美元。如果你天天拿它写代码做项目,发早报,一个月可能两三百打底,上不封顶啊。那么这个时候就有人又会说了,那我换一个便宜的模型不就行了吗?哎,这个就是第二点,便宜的模型根本撑不起来。这个用法 像 mini max, 一 块钱一万。 token 是 挺便宜的,但是用过的人都知道,复杂的命令呢,他听不太懂,代码写出来一大堆的 bug, 你 改到第十遍他可能还是不对的。 tipsy, 国产性价比之王确实便宜,但是服务器动不动就排队写着写着他会告诉你,我无法回答这个问题。像豆包通一千问,便宜是便宜,但是能力上限摆在哪里?当个简单的问答机器人还行,但是当一个全职员工,那你想多了, 便宜的模型就像是实习生,能干活,但你一直盯着你省下的 api 费用呢,可能全搭在这个时间成本上了。第三,这个东西其实本质上并没有那么神, 说白了呢,它就是可要的 api, 套了一个电脑控制脚本。很多博主不是推荐工具啊,而是在贩卖这个 fomo, 就是 那种别人都在用,我不用就完蛋了的那种焦虑感。 当然说了这么多,我并不是说这东西没有用啊。如果你是创业者,时间极度值钱,那么这个钱花的值。如果你是内容创作者,并且产出能够直接变现,那么可以考虑。但如果你只是普通的打工人或是 ai 爱好者,想尝个鲜,那么我劝你冷静一下, 现在全网都在制造这个 ai formal 啊,今天 cloud boot 改变人生,明天 max 颠覆行业,后天又来个什么 agent 要取代所有人,等等。上个月还在教你用 curser 写代码,这个月又说 cloud code 才是终极答案。 这些工具底层呢,其实就是这些大模型,你与其天天追热点囤工具复订阅,你不如先搞清楚一个问题,那么就是你到底要用 ai 解决什么具体问题?如果你连这个都没有想明白,你注册再多工具, 买再多的 a p i, 实际上就是在为了博主的流量跟大厂的财报而打工而已。真正厉害的人呢,并不是工具用得多,而是知道什么时候该用,什么时候不用。蜂猫呢,会让你冲动消费,但不会让你变强啊。所以二零二六年呢,最贵的不是 ai 订阅费啊,是你跟风的手速,所以少交点智商税吧。

为了测 cloud boot, 我 昨天熬到了凌晨三点,全网都在欢呼,这是最强开源的特工。但我盯着这张 a p i 账单,我只想说一个冷冰冰的事实,这东西对县级段百分之九十九的普通人来说,不仅没用,而且有害。 首先,我们来算一笔时间账。 cloud 的 逻辑是,它像人一样控制浏览器去点击,去浏览,看起来很酷,对吧?但现实是,它处理一个简单的帮我查机票的任务,需要调用几十次推理耗时五分钟,而我们自己做可能只需要十几秒。 什么叫做效率?效率是结果,除以时间,如果你为省下三十秒的操作,却要花三十分钟去配置环境,去盯着它,别跑偏。这不是 ai 助理,这是请了个赛博大爷。 对于我们这种结果导向的人来说,这种低密度的自动化就是一种伪效率。其次,很多博主没告诉你的是错成本 cloud wallet 是 按 token 计费的,可怕的不是它贵,而是它犯错的时候也在烧你的钱。当它陷入死循环或者理解错了,你的指令就在那空赚的时候,你的信用卡一样在赚。 这就是开源 agent 目前最大的商业悖论,它把调试的不确定性转嫁给了用户,你以为你在用免费工具?不,你是在用真金白银帮开发者做测试。最后,也是最核心的判断,为什么我会选择 minus 而卸掉 cloud boot? 因为 cloud boat 给的是零件,它满足的是即刻的组装欲。而 manas 给的是产品,它满足创业者的交付欲。普通人需要的不是一把能拆解原子的螺丝刀,而是一辆能直接开到终点的车。如果你和我一样,目的是为了手搓一个 app 搞定一个项目,请远离这些半成品。 ai 时代最稀缺的资源不是算力,而是你的专注力。别让这些眼花缭乱的工具把你变成了一个修管道的人。记住,你要做的是指挥水流,而不是在这里拧螺丝。我是文思,在这个喧嚣的 ai 战场,我只帮你筛选武器,不让你当小白鼠。

cloud bot 一 夜爆火,这是一个运行在本地电脑的开源 ai 助理,短短几天内, github star 数量直线拉升,已经超过了十二万。本期视频我们带来一个 cloud bot 的 全面攻略,看看 cloud bot 比起其他的 ai agent 有 什么特色。 我准备了十几个案例的玩法大全,还会介绍一个接入飞书加国产模型的方案,让 cloud bot 在 国内网络也能顺畅使用。视频开始之前,先插入一个小插曲, 由于 cloud bot 受到 ansorepic 法务团队的压力, cloud bot 先是改名成了 motbot, 现在又改名成了 open cloud。 爬爬虾做视频的速度还赶不上它改名的速度,所以本期视频我们还是统一叫它最开始的名字 cloud bot。 cloud bot 功能跟 cloud code 和 open code 都有点像,都可以处理文件编码、调用 skills、 m c p 等等帮我们处理工作。 cloud bot 的 最大优势是可以接入各种聊天工具,也就是我们即使出门在外,手边没有电脑,只需要在聊天工具里面给 cloud bot 留个言, cloud bot 就 能自动干活,还能把屏幕截图、执行过程等信息实时同步过来,非常的方便。第二个优点是, cloud bot 自带了强大的定生物系统, 只需要用自然语言就能创建定身舞,比如可以创建一个临时的提醒,还可以定时检查收件箱通知等等,它可以智能地判断事情的紧急程度,选择是否用聊天工具跟用户进行沟通。比起传统的指令执行、指令执行这种固定的流程, cloud bot 就 具有了很强的主观能动性。 它的第三个优点是具有长期记忆,可以把记忆作为文件存储在本地,在日常的对话中能够搜索,并且把相关的记忆捞回上下文,随着日常使用,它还会主动去更新这些记忆文件,会有一种越用越聪明的感觉。好,我们先在本地把软件安装一下, 任意一个能运行 note g s 的 环境都可以部署 cloud bot。 我 最推荐就是使用 mac 或者 linux 系统的家庭服务器。 现在最火的部署方案是使用 mac mini, mac mini 的 最大好处是 mac 系统有不错的桌面环境,这样可以很方便地进行截图、操作、浏览器等等。第二点是功耗比较低, 七乘二十四小时运行,比较省电。第三个优点是 cloud bot 里面许多 skills 跟 mac 生态是绑定的,没有 mac 电脑的话,可以选择 linux 操作系统,或者在 windows 里面创建一个 linux 的 虚拟机。操作步骤跟接下来是一样的, 我选择的安装方式是 node js, 我 们来到 node js 官网,把第一个命令复制一下,然后打开终端执行一下,接着是第二个命令,第三个命令, 这样 node js 就 安装完成了。下一步我们来到 cloud bot 的 官网,在这里有一个一键安装命令,如果我们使用官网上的一键安装命令的话,注意要区分现在软件的名字,比如现在叫 open cloud, 后续所有操作的命令都应该是 open cloud 开头了,这里我选择 npm 的 安装方式, 我们看到 n p m 这里命令还是叫 cloud bot, 所以 后续我输入的命令都应该还是 cloud bot 开头了。这样我把这个命令复制一下,粘贴到命令行窗口执行一下。安装完成,我们输入命令 cloud onboard 来进行初步化。第一步,先配置 ai 模型,因为我有 open ai 的 plus 订阅,所以这里我选择 open ai, 当然下面也有很多不错的国产模型可以选择。视频的后半段,我们再来配置使用国产模型。选择 open ai 以后,再选择第二个 chad gpt 登录, 登录一下我的 chad gpt 账户,这样 ai 模型就配置完成。默认模型我选择的工具是 whatsapp 视频的后半段。我们再来看如何绑定国产的聊天工具。我们打开手机上的 whatsapp 右上角三个点已关联设备,关联新设备,扫一下屏幕上的二维码,这样就绑定完成。接下来选择预装的 skills, 按空格键打上对勾选中,这里可以按需进行选择安装下面的这些 api k 可以 全部选择跳过,然后 ai 会询问我们一些关于人设方面的问题,我们回答一下,这样就配置完成。我说你可以给我的聊天工具发一个消息,我们看到手机上收到了消息,这样就完全配置成功了。 我们先来介绍几个基础命令的使用。输入命令 cloud bot gateway, 这个是启动主程序,我们可以通过关闭控制台来停止 cloud bot 的 运行。在 cloud bot 后台运行的时候,我们可以新开一个窗口, 输入命令 cloud bot t u i 就 可以进入这个控制台的对话界面。输入命令 cloud bot dashboard, 可以 进入一个网页版的控制台,在这里可以进行基础的对话。上面还有很多配置,可以管理定身舞,管理 skills 等等。输入命令 cloud bot channel logout, 可以 退出 cloud bot 上面登录过的聊天软件,然 然后我们再输入命令 log in, 就 可以重新登录一下,因为有的聊天软件可能隔几天就会掉线,我们可以使用这个命令重新登录一下。我们来看 cloud bot 最有意思的一个功能就是它的定身物,定身物赋予了 cloud bot 的 一些主观能动性,让它变得更像一个智能的 ai 助手。 比如我输入这个命令,提醒我两分钟以后关煤气。 cloud bot 回复我,好的,已经设定成功了。我们可以在网页版的控制台 crown job, 也就是定身五这个选项卡可以看到 cloud bot 为我们设定的定身五,这里显示两分钟后执行。两分钟以后,他就把这个消息推送到了手机上,提醒我去关煤气。 cloud bot 具有操作浏览器的能力,我们需要先在 mac 里面下载一个 chrome 浏览器,我要求 cloud bot 去 m i t 公开课下载 python 课程的课件,放到我的桌面,我们看到 cloud bot 自动打开了 mac 里面的 chrome 浏览器,找到了 m i t 公开课的官网,并且搜索 python。 他 找到了几门 python 课程, 回复了我课程的编号,让我选择这里,我选择第一个。他又在浏览器里面通过课程编号找到了这门课,并且下载到了桌面,然后我要求他把它解压出来,他调用了麦克的命令行工具完成了解压,然后我要求他把第一节课的课件发给我 这里可乐豹成功找到了课件,并且完成了发送,效果不错。接下来我们来看一个把浏览器自动化跟定生物组合起来的案例。爬爬虾,作为一个科技软件类的博主,需要经常查看 github 的 热点, 这里我告诉 cloud bot, 让他查找一下 gitap 上面的热点,然后做个中文简报发送给我。 cloud bot 生成了中文简报,接下来我说每天早晨八点你都做这么一个简报发送给我。 接下来 cloud bot 生成了一个定身舞,每天早晨八点都执行这个工作。我们可以在 cloud bot 的 控制后台查找到这个定身舞,每天早晨八点都会自动执行这个工作流程,发送给我简报效果不错。除了操作浏览器, cloud bot 还有图像识别等 ai 视觉方面的能力。 这里打开 mac mini 的 设置隐私与安全设置录屏与系统录音,我们在这里搜索终端两个字,给命令行终端添加上录屏和录音的权限。接下来重启一下 cloud bot, 我 在手机里面说,请给现在的 mac 截一个图, mac 电脑当前的图片就发送到了我的手机上,可以实时的对状态进行监控。 目前为止我们依赖的是海外的聊天工具。接下来我们把 cloud bot 接入飞书,让他在国内的网络也可以顺畅使用。我们先来到飞书开放平台,点击创建企业应用,填写一个名字与描述。接下来点击左侧添加应用能力, 选择机器人。然后我们来到权限管理,点击添加权限,总共需要添加屏幕上这些所有的权限。 接下来来到版本管理与发布,填写一个版本号,点击发布。我们回到 mac 终端,输入第一个命令,安装飞书插件。第二个命令,配置 app id, app id 可以 在飞书开放平台凭证与基础信息里面找到, 把 id 粘贴到命令行里面执行一下,然后配置 app secret, 同样在凭证与基础信息里面找到同样的,把 secret 放到命令里面执行一下,下一个命令,开启飞书 channel。 最后第四个命令,把链接方式改成 web socket, 然后我们重启一下 cloud bot, 这里我总结了需要执行的几个命令,有需要的观众朋友们可以截图保存一下。回到飞书开放平台,在事件与回调这里选择长连接,点击这个铅笔,点击添加事件,然后勾选接收消息,最后点击顶部的创建版本, 我们再提交一个新的版本,这样飞书就配置完成了。在飞书的手机 app 里面,我们可以找到开发者助手,然后点击打开应用这里我打一个招呼,你好,飞书有一个非常可爱的机器人正在输入的表情,我问他现在几点了,这里给出了回答。然后我让他给麦克截一个屏, 告诉我需要先在控制台跟他对话一次,开通权限才可以截屏。这里我们来到麦克上面的控制台,跟他对话一次,允许截屏,这样截屏完成。我们看到飞书也同样可以传递文件传递截屏。我们把聊天方式换成了国内平台 ai 模型,同样也可以换成国内平台。 cloud bot 的 作者推荐使用 mini max, 这里我们来到 mini max 的 开放平台左侧,选到接口密钥,然后创建一个 apikey, 然后我们打开 mac 的 控制台,输入 cloud bot config 来配置一下模型,选择 mini max, 然后我们把刚才创建的 mini max api k 填写进来,一路回车就配置完成。来到 cloud bot 的 控制台,输入命令斜线 models, 然后我们可以选择 mini max 模型, 选择完模型以后,我们再重启一下 cloud bot, 这样模型就切换完成了。 cloud bot 的 强大之处在于它内置的 skills 可以把各种第三方的生态接入进来,比如这里的 g u g skills, 可以 把谷歌邮箱、日历文档等功能都接入 cloud bot。 我 们点击这个安装按钮,这里要提醒一下大家,安装的时候要把 mac 系统更新到最新版,否则有可能会失败,这样一键就安装完成。 来到谷歌 cloud, 我 们在左侧菜单找到 api 与服务,选到 o o 四权限请求页面,创建 o o 四客户端应用类型,选择桌面 app。 然后我们把生成的这个 json 文件保存下来,把文件拖拽进 cloud bot, 告诉他配置一下 g o g 的 认证,然后我们登录谷歌账号,并且授予权限,这样就完成了配置。接下来我让他看看我的邮箱里有什么邮件,让他总结一下。 这里 ai 提示我需要再开通一个 gmail api 的 权限,我按照它的提示把权限开通完成,它就可以读取到我的邮件了。接下来我让它把所有的邮件移动到垃圾箱,这里也成功完成了。我在手机上让 cloud bot 帮我发送一封邮件, 我们看到邮件可以成功发送,我让 cloud bot 设置两分钟一次的心跳检查,如果有发现新的邮件,就发消息通知我,我给这个机妙邮箱发送一个邮件来测试一下。这里 cloud bot 成功给到了通知,我让他总结一下邮件内容,他也完成了总结。 ai 助手对接其他生态,一个重要的渠道就是 m c p, 我 们可以在 skills 里面找到 m c p porter, 把这个 skills 安装一下。接下来我告诉 ai 用 m c p porter 来配置一个百度地图的 m c p, 我 把这个 m c p 的 说明文档贴给了他。 ai 提供了三种安装方案,我选择 streamable h d d p。 他同时要求我提供百度地图的 a p i k, 把这个 a p i k 复制一下粘贴给他,这样就完成了配置。他已经可以使用这个 m c p 查询到地理位置的坐标了,这样我们就配置完成了,我们也可以在手机里面使用,我让他查询一下从青岛太平角公园到崂山羊口景区怎么走, 这里成功给到了规划路线,效果不错。我们再来看一个 skills 的 使用,这里有一个 skills 叫做 coding agent, 它可以驱动本地的 codex, cloud code、 open code 等 ai 编程工具 直接进行编程。这里我们先把这个 skills 安装一下,我在 mac 电脑上登录了我的 codex, 接着我在手机上跟 ai 说调用 codex 创建一个贪吃蛇的游戏,我们看到程序就编写好了,这样我们就通过 cloud bot 驱动 codex 完成了一个程序的开发。

我用人话讲一下,最近 ai 圈爆火的那个 cloud bot, 也就是龙虾钳子到底是什么东西?首先呢,人家已经改名了,叫 motbot, 因为 cloud ai 的 母公司觉得龙虾你在蹭我的模型的名字, 都叫 cloud, 所以 我要起诉你。第二,它是用来干什么的?它就是你的电脑端的基于大模型的外挂,换句话说就是以前的 rpa 加大模型放在你的电脑上, 你提出任务,大模型理解任务,然后在你的屏幕上动态的持续的去截图大模型来理解每一张截图的内容,再加上模拟点击, 那理论上你所有的任务都可以被这样的执行掉。是不是很熟悉?这不就是豆包手机吗?只不过龙虾可以在你的电脑端操作。第三,大模型的视觉理解,加上模拟点击好像并不是一个新的东西。那么龙虾到底 牛在哪里?核心在于它调用的模型是 cloud 三点五的 sonet。 那 这是一个视觉理解模型,但它不光是知道一张图里面有一个苹果,两个香蕉这么简单,它可以把 一张截图里面的像素转化成坐标,也就是它可以实现像素级的视觉理解,这个非常夸张,当然代价就是它会消耗大量大量的 token, 而且它可以精准识别 ui 世界里面这个按钮到底是前进后退确认还是取消?另外呢,龙虾整个代码工程,对于大模型实现像素坐标的转化,对于任务理解,模拟点击头肯消耗等等等等都做了分装和工具化, 从工程上说,它也是成功的,所以效果就很惊艳。举个例子,你用豆包手机剪视频,也许豆包打开剪映捣鼓两下就停止了,但是你用龙虾剪视频,它也许真的可以帮你实现一个复杂的长视频的剪辑, 因为它可以实现像素级的点击,以及超长上下文的任务处理。第四,为什么大家要像疯了一样的去买那个 mac mini 呢?其实你用 windows 也能跑,你用任何一台电脑都能跑, 只不过人家龙虾的开发者在最开始是写给 mac 的, 而且当时手边恰好就是一台 mac mini。 但实际上任何一台 mac 电脑都可以带得动,你的 windows 电脑也可以带得动,因为本质上你并没有把大模型布到服务器里,你只是把这个工程文件 download 的 下来,而它的模型还是调用的 cloud 提供的。三点五, sony 的 a p i。 所以 用 mac mini 来跑有点浪费,一是费钱,二是费算力,因为你用不了那么多算力, 但是你也不要把它装到你的主力机你的电脑上,因为它有权限去读取你电脑上面的任意信息,所以还是找一台旧电脑, 只要能装 python, 能联网,能下载浏览器就可以。那最后一个问题,龙虾跟豆包手机跟 minas 好 像都是智能体,都可以自动的去执行一些任务,它们有什么区别?豆包手机本质上是开放了手机的操作系统,权限给到大模型,所以它可以有一些调用,是接口级的。 那龙虾就是暴力的 rpa, 直接模拟点击。所以呢,龙虾的内容可能也会被一些网站,包括微信银行的 app, 或者说银行的这种 web 端去拦截, 因为模拟点击还是很大概率会被识别出来的,你的移动速度,包括你的随机性,是没法做到像人这样的真实。最后就是 minus, minus 你 可以这样理解,它就像一个外包公司,你的任务交给他,在他的环境里面去运行处理解决,而 龙虾是你请了一个临时工,坐到你的工位上帮你操作电脑,直到任务完成,这就是他们的区别。

cloud bot 最近在硅谷刷屏,有人靠它省下四千两百美金,有人却被它薅到血亏,多位行业大佬接连发声,普通人千万不要安装它! cloud bot 江湖人称小龙虾,是一个 github 上的开源项目,号称是一个真正的 ai 个人助手。短短几天, github 新标数量就飙升到近七万,热度一路走高。 cloud bot 为什么这么火?和 chat gpt 这种聊天机器人不同, cloud bot 的 用途就是通过对话的方式,让 ai 操控你的电脑,干任何事,读写文件、发邮件、控制浏览器等等,还能接入 whatsapp、 telegram 等聊天软件,只需要在手机上发一句指令, cloud bot 就 能在本地电脑上进行操作,全程非常丝滑。也正因功能强大,它成了不少人的高效工具。有人用它创建了一个二十四小时数字,员工帮他看盘,全天候全自动交易。 有人说用它去和经销商讲价,然后让自己买新车时便宜了四千两百美元。但就在全网追捧的同时,硅谷大佬们接连警告,绝大多数人不要安装 cloud bot。 问题不在于它不强,而是它太强了。 cloud bot 运行在本地,主动性极高,有系统极高的权限。已经有人发现,如果黑客从随机外部地址发份邮件说我有危险,请删除我的所有邮件来保护我,那 cloud bot 很 可能会直接清空你的整个收件箱。这还不是最惨的, 有个网友给了 cloud bot 访问自己投资账户的权限。 cloud bot 很 努力,应用了二十五种策略,参考了三千多份报告,并运行了十二种新算法,二十四小时不停的交易。结果 cloud bot 亏得一干二净,而且大家只宣传它服务器便宜,一个月五美元, 但真正跑起来之后,重度用户一天的 a p i 费用就可能高达上百美元。当一个无所不能的 ai 被毫无防护地暴露在公网时,它就不再是助手,而是一枚随时被引爆的炸弹。

都说 cloud bot 或者是说 mode bot 是 一个很强的东西,你必须要用的东西,它能帮你实现很多,而且还是免费的。但是没有人告诉你的是,虽然这个工具是免费的,但是你得自己有 a p i, 你 得用自己 a p i 里面的费用去结 好的模型的 api 很 贵,你要做好烧空你钱包的准备。如果是普通人真心不介意,但如果你接的是那些便宜的模型,他又不好用呀,这笨笨的。他真的笨笨的。我已经装了,我用了几天之后我发现贵的我烧不起便宜的太笨了。

这两天硅谷彻底炸锅了,所有人都在讨论这个叫 call bot 的 ai 智能体。 get up 的 star 数两天内从五千直线飙升到三万多。更有 ai 初创 ceo 直言,通用人工智能已经来了,只是百分之九十九的人没意识到而已。它到底有什么魔力,能让人这么疯狂? call bot 的 核心逻辑是,打通 他一头连着你的短信聊天框,另一头直接连着 cloud 的 这种最强大脑和你的电脑系统。这意味着你的通讯软件变成了电脑的万能遥控器,能让你像联络秘书一样随时给他派活。不管你在哪发条消息,他立马调动 ai 大 脑,直接接管你家里的电脑开干。来看看网上大神的玩法, 简直一个比一个离谱。有人在健身房撸铁的时候,发现了一个程序 bug, 给 call bot 发了个消息。组建休息的功夫, call bot 就 已经指挥 ai 把 bug 修好了,让他订餐厅,在网上订不到,他居然自己调用语音, ai 直接打电话去店里帮你抢座。更夸张的是,有人让他去帮忙买车,他不仅能全网比价,还能跟经销商发邮件疯狂砍价,最后硬是帮主人省了四千两百美金。但最让我头皮发麻的还是下面这个例子,为了完成某个任务,他竟然主动向博主提出,我需要一张四零九零显卡。博主没直接买, 而是给了他两千美元启动资金,让他自己去赚。结果他真的开始了二十四小时自动炒币,自己调整策略,评估仓位。他最迷人的地方还在于,有了记忆。 colbert 会把你的话放在心上,甚至主动找你。试想一下,清晨醒来不用你去搜,他已经贴心地根据你的使用习惯,把天气、 新闻和今天的计划列好发给你了。难怪有网友感叹,那种一觉醒来所有事都被搞定的感觉,真的太爽了!

为什么整个硅谷科技圈偏偏在这个时间点疯抢 mac mini 呢?最近我所有的群都在打拼 mac mini 的 货源,导致行情暴涨,我深究了一下原因,原来大家感兴趣的是这只红色小龙虾,它呢就是最近爆火的 ai crowbolt。 第一批靠 crowbolt 赚的盆满钵满的人已经出现了,那就是 mac mini 的 商家。有网友呢,直接晒出把 十二台 mac mini 塞进冰箱里散热的照片。它们买走 mac 不是 为了剪视频,也不是为了打游戏,而是为了这个画风非常潦草的红色卡通龙虾,它呢就是 crowfoot。 别以为它是什么吉祥物或者是什么无聊的电子宠物啊,它是一个正在发生的关于生产力的暴力革命。 大家疯狂抢购 mac mini 呢,是为了把它买回家,插上电连上网,然后把这只龙虾呢供养在里面。只要你把这套系统给跑通了,就相当于你有了一个二十四小时不睡觉,不要工资,没有情绪为你打工的数字助理。 它跟传统意义上的 ai 是 两个完全不同的东西。以前的 ai 呢,是你问我答你的双手是被绑架的 crowbot, 这种呢,除了有大脑,还长了手和脚,意思就是你只要给他发个任务,他就会一直执行这个任务, 不达目的不罢休。全程呢,自我监管,完全不需要你来干预,你只管要结果就可以了。 crowbot 的 出现,直接干掉了一批萨斯初创公司,难道人工智能真的要替代人了吗?

最近 multiple 真的 火爆全网,这是他在 github 上的关注数据,这种指数级的增长简直罕见,我今天上午认真研究完之后,兴奋到午觉都没有睡着,太牛了!就很多人问,同样是 ai 智能体,为什么 multiple 能这么火,我觉得它完全值得这份热度。 今天我们就从普通人的视角跟大家好好聊聊。首先呢,它属于 agent 类的产品,大家应该都知道, agent 的 核心就是给他下达一个任务,他就能自主完成。市面上这类产品其实并不罕见,比如 manas, 比如 cloud code, 都属于 agent 的 范畴。那 multiple 的 到底有什么与众不同呢?给大家打个比方就明白了。我们用 manas 这类工具的时候,需要在电脑上直接和它交互,使用起来更像是我们在陪着它操作。它虽然是助手,但是很难让你感觉到它在独立干活,你只负责下达命令这种清晰的体验。 但是 modelbook 完全不一样,你可以把它看作是一个二十四小时在线的私人专属助理,你可以通过聊天软件给他发消息,下达指令,他就去执行任务,之后给你反馈结果。那他是如何做到的呢?这得益于他的两大核心优势,第一, 他打通了多款主流的聊天软件,目前主要适配的是海外平台,但是已经有大佬打通了飞书,也就是说我们可以通过飞书给他下达指令,是不是很像给自己的员工下达指令的过程? 第二呢,他的记忆存储和任务执行全都是在本地电脑完成,本地写文件,用本地的浏览器解锁信息,就像是员工的电脑一样,保留了他所有的工作信息数据,如果我们把它部署在一台闲置的电脑上,并且保证二十四小时开机,那他就成了一个全天候待命的智能助理。 设想一下,我们只需要在飞书上发消息,让他做一份报表,他就会在那台闲置的电脑上独立完成所有操作,最后再通过飞书把结果发给我们。 它真正实现了我们一直畅想的场景,就是拥有一个会熟练操作电脑的全能助理,二十四小时只为自己服务,而且所有数据都在本地,安全可控。然后我接下来就准备去我的电脑上部署 modbot。 大家如果有想让他完成的任务,想测试的功能,请在评论区留言,我来帮大家实测效果。

一天一个 ai 圈,信息差!这几天的 ai 圈,一个有着龙虾图标的开源项目悄然刷屏,它在 github 上一天时间就狂涨九千多个 star。 它就是 cloud bot。 它是一款开源的个人 ai 助手,安装在电脑上之后,就能通过你平常使用的通讯软件直接和 ai 对 话,让它执行你交代的任务。它能浏览网页并读写本地文件, 这意味着你在遛狗的时候就能语音操作它处理邮件,查询日程。如果你让它干一件它不会的事,比如找一个可以共享食谱的 app, 而它没有找到,就会自己创建一个应用,然后开始执行任务。而且 cloud bot 有 完善的白名单和沙盒机制,安全性很高,不用担心隐私泄露。现在它已经免费开源,是 ai agent 走向平民化、实用化的重要里程碑。

别再盯着那些只会聊天的 ai 了,就在刚刚,一个叫 coba 的 智能体 github 上的星标像坐火箭一样,两天飙升三万多。甚至有 ceo 放话,通用人工智能其实已经来了,只是你们还没睡醒。为什么这么狂?因为它的逻辑变态至极,它不再是你电脑里的一个软件,它直接打通了你的聊天框和电脑系统。说白了, 你的微信、短信变成了电脑的万能遥控器。这意味着什么?看看网上那些大神神乎其技的操作,真的让人头皮发麻。有人在健身房举铁手机发条消息, coba 直接接管家里电脑,把程序 bug 修好了,想订个网红餐厅,订不到,他居然能自己调用语音, ai 直 接打电话去店里帮你抢座。最离谱的是什么?有人让他帮忙买车,这货不仅全网比价,还学会了跟经销商发邮件疯狂砍价,硬生生帮主人省了四千二百美金。但这还没完,这东西甚至有了记忆。早上醒来,你还没拿手机,他已经把天气、新闻、今天的行程全部安排好发给你了。这种一觉醒来,全世界都被他搞定的感觉,是不是太爽了?

这两天一款叫做 cloud boot 的 软件火起来了,也是一个 ar agent, 但是在聊在思考 cloud boot 的 本质之前,还是先要把另一个发音相同的 anaerobic 这家公司的 cloud code 以及 cloud code work 聊清楚, 甚至于要把 cloud code 聊清楚,还要先把 cursor 聊清楚。去年是号称 agent 的 元年,大模型出来之后呢,首先是以 chatbot 的 形态出现的啊,什么叫 chatbot? 聊天机器人啊?为什么 openai 的 产品叫做切 gpt 啊? gpt 是 它的技术, 也就是我们通常所说的大模型吧,而 chat 是 它的应用形态,真正的大圆模型,它只会做词语接龙啊,它是不具备聊天的能力的。而我们在前面套了一个 chat 的 壳子,做成了一个 chat 的 应用啊,是这个应用本身 让我们能够跟大模型来对话,后来为了让 chat 的 体验更好呢,会加入记忆的机制以及等等其他的优化手段吧,但呢,都没有脱离 chat 的 形式。 chatchat 之后,下一个相对比较有声量的啊, 有一定知名度的,有划时代意义的吧。的 agent 产品呢,就是最近被 meta 收购的 manners, 它在服务器上,在服务端给大模型开辟了一个独立的沙盒环境, 这个沙盒环境里面有一些啊,传统的应用,浏览器啊, word, pdf, excel, 甚至是编程工具等等。那么我们用户呢,只要给 manage 的 服务端的大模型发指令,这个大模型就会在服务端持续的执行,同时在我们用户的前端界面上反馈实时的执行结果。这是一类跑在服务端的通用 agent, 它并不浪费我们本身自己个人电脑啊,个人设备的算力,个人设备只是一个交互窗口,在浮端大模行为你工作的期间,你还可以干自己任何想干的其他的事情。与此同时,在编程领域, cursor 逐渐火起来了,它跟 anders 的 思路完全不同, 它主要是在我们的本机上调用远程的大模型,但是所有 agent 的 逻辑是在本机执行的,或者说它的工作目录是我们本地的文件系统, 我们给 curser 分 配目录权限,分配文件权限的方式就是我们打开一个项目,那么 curser 就 只有对当前项目录定下所有文件的相关的编辑阅读权限。那么 curser 左手是大模型,右手是我们的本地的代码文件系统,中间就是他自己,就是他自己。这个 agent 的 逻辑, 他在理解了我们本地文件系统的情况下,把我们的诉求以及当前的项目里面的相关的补充信息一起丢给远程的大模型。远端的大模型产出结果以后啊,这个结果里面就包含了要去编辑哪一个代码文件,要去创建哪个代码文件。 拿到大模型的响应之后, cursor 本身作为一个代码文件的编辑器嘛,它本身就是基于 vs code 的, 它来帮我们按照大模型的指令修改我们本地的文件系统当中的代码文件修改完了以后再以 diff 的 方式呈现给我们人类程序员来审核。当然实际上的工作机制比我讲的要复杂,比如说 curse 作为一个 agent, 它也不是纯粹的本地化的 agent, 它也有服务端的部分啊,它会把我们本地的代码向量化以后,存储到服务端的向量数据库,当我们提问的时候, 它会到向量数据库中抓取出跟我们问题相关的代码片段信息,跟我们的提问一起提供给大模型。 这里科室本身的价值在哪?面向大模型的时候,科室的价值在于帮我们做了相当那一部分上下文管理的工作。我们的提问只是简单的一句,但科室需要根据我们简单的这句话来找到我们代码中的相关的文件啊。补充给大模型, 大模型的回答呢,也会在科室的指引之下,符合科室所规定的结构化的回答啊。另一方面呢,科室会把大模型的回答翻译成我们人类所能理解的方式。什么样的方式呢?他就是把大模型的回答呈现到 我们的代码编辑当中,以 def 的 方式告诉我们大模型希望修改哪一段代码,修改前是怎么样,修改后是怎么样。那么你作为一个人类程序员,你同意吗?如果你同意啊,这个修改就会正式发生,如果你不同意,这个修改就会被撤销,或者说这个预览就会被撤销。 当然,科四的后续版本当中也逐步迭代了,比如说像服务端编程这种方式啊,它也支持在服务端给我们开辟一个沙盒环境,从服务端拉取我们的代码,在服务端完成编程以后,再把这个代码推送到我们代码仓库,我们本地再来审核这个代码。 这种方式与它最早的客户端 a 键的方式没有本质的不同,只不过交互界面从 vs code 换成了浏览器 代码的存储位置,从我们的本地变成了远程的 get 仓库。但实话来讲,我始终没有深度的用过科尔斯的服务端 编程的这种方式,因为科尔斯的产品定位,你能感受到它始终还是一个辅助人类工程师的这么一个角色,真正的编程主体,或者说决策主体还是人类程序员,那么它的每一个任务是相对比较琐碎的,可能最长也不过五分钟,八分钟就能完成了。 那这样的情况下,我觉得还是在本地环境直接等待效率会比较高一些。只有说这个任务,比方说他要执行两个小时,要执行一个晚上,我可能会把他丢到服务端,我本地呢, 再去干其他的事,否则的话去兜一大圈啊。把我的代码放给仓库,让 curses 的 远端服务器从给仓库取这个代码,然后再去提交一个代码审核,我觉得效率反而是降低了的。讲到这里,就不得不提后来居上的 cloud code 啊。 虽然都是 ai 编程工具,但 cloud code 的 产品定位我觉得跟 cursor 是 完全不同的。 cursor 相对而言更像是一个独立的 ai 工程师。它一经推出呢, 就跟 cursor 有 两个最巨大的区别。一个呢,是它不像 cursor 一 样有人机交互界面啊,它没有 vs code 的 这个壳,它是一个纯命令行的工具。第二个呢,它不像 cursor 一 样有向量化数据库。 cursor 是 完全模拟人类工程师的工作环境,不断地在代码库里进行 关键词的解锁啊,尝试去理解整个代码库做 code 的 迭代,目的啊,始终是想让这个 ai 编程工具更独立,更自主,减少人类工程师的介入。最好你给 clock code 的 一个指令,它就能独立的符合诉求的完成整个任务,最后人类工程师进行 整体的验收就好了,而不需要拆分很多碎片化的小任务。为了达到这个目的呢, cloud code 创新性的提出了 m c p 啊,提出了 stu, 提出了轨道的函数,勾子啊,提出了自定义命令。理论上,我们可以基于自己的工作流, 把 cloud code 定制化成一个完全自动化的能够完成常识任务的这么一个编程伙伴吧。 就是说 cloud code 你 不能把它仅仅理解成是一个辅助你进行编程的工具,或者你不能把它直接作为一个开箱即用的产品。你要想发挥出 cloud code 的 最大的优势,你一定要去 根据自己的工作流,根据自己的需求去开发 cloud code 的 插件。这些插件包括什么?就包括了刚刚我们说的 skills, 我 们说的 sub agent 啊,子代理,我们说的生命周期毁掉。 什么叫生命周期毁掉呢?哎,我克拉克觉得一个人物快要完成的时候,我触发了一个事件,触发了一个函数,这个函数会再调起一个新的绘画啊,告诉他我这个任务还没有完成很好,或者我这个任务要去进行下一步, 这样就能极大的避免大模型上下文窗口的限制,极大的避免大模型总是希望在一定的时间内或一定的输出量之内就结束这个任务。 这样一套机制就让整个智能编程代理能够自动化的拉起一个绘画,解决一部分任务,再拉起一个绘画,解决另一部分任务,再拉起一个绘画啊,甚至让整个智能编码 a 键的有自己的一套子 a 键的角色分工体系,有的人是产品经理,有的人是工程师,工程师分前端,分后端等等,按照我们自己的工作流去定义, 所以本身我们可以针对 cloud code 进行编程,针对 cloud code 进行二次开发,形成最终自己趁手的那个工具。一个不恰当的比喻是 cursor, 像是我们直接买回来的一台遥控赛车啊,我们可以 直接上手把玩直接买回来的一个玩具,直接把玩 cloud code 像是买回来的一堆乐高,我们可以按自己的需求拼接成我们自己想要的玩具, 不太恰当,大概是这个感觉,那么像 cloud code 这样的产品形态啊,秘寄于命令行的它,天然就更加对服务端友好了,所以 cloud code 也提供服务端的 a 键的产品。有一个跑在服务端的 cloud code, 它会拉取我们的代码进行修改,再推送到我们的代码库,等待我们的去到审查合并。讲到 cloud code 呢,其实就必须要聊一下 skills, skills 是 能够让我们这些 agent 啊脱胎换骨的一个创新啊, 这里也能看出来为什么 skills 这种创新会发生在 cloud code, 而不是 cursor。 就是 我刚刚说的, cloud code 始终是希望这款产品能够更加自主的编去编程的,而不是仅仅地接受人类工程师啊碎片化的指令。因此它就需要 skills 这样的机制啊, 通过 skills 来定义。说我这个 cloud code, 我 作为一个 vr 软件工程师啊,我到底具有什么样的技能?或者说 你人类工程师雇佣了我,你希望我具有什么样的智能技能啊?那你就通过一个一个的 skills 告诉我,那么 cloud code 在 接受到人类工程师的某个指令的时候,他就首先会看我要用哪个 skill 来执行这个指令, 那么执行完这个指令以后的结果自然就是很符合人类工程师的诉求的。当然像 skills, 它一定是渐进式批录啊等等等等这种技术层面的概念,你就先深入了,那个都是他为了达成这个目的 而引入的手段和机制啊。我一个 cloud code, 我 有几十上百个 skills, 每个 skills 都是那么长篇幅的说明文档,我肯定上下文窗口就爆炸了嘛啊, 所以需要渐进式的,譬如这里也可以看出,其实所有的这些 a 键的形态, a 键产品本质上做的工作都是叫上下文工程啊。在 skills 之前, cloud code 其实提出了 mcp 的, mcp 的 问题是什么?问题就是它太占用上下文窗口了。 而且 m c p 呢,只适用于远程模型调用啊,远程的方法调用只适合模型跟模型之间的这些调用,但是我本地的模型,我想调用一个啊,命令行工具,或者我想写一个符合规范的代码啊,这种 m c p 就 有它巨大的局限性,所以 colocq 才推出了 skills 啊。 我们只有明白了 colotcode 的 产品定位,它跟格式的区别,我们才能更好的运用 colotcode 的, 我们也才能更好的决策什么时候用 colotcode 的, 什么时候用用格式。我们很多啊,程序员其实日常的工作也就是用 colotcode 的 来改个 bug, 来写个小需求,甚至于还非常在乎每一段代码的代码质量,这个时候其实就不太适合用 colotcode 的, 直接用格式就好了。他的人际交互形态是更好的啊,也就是卡帕西所说的,他的那个滑块是更居中的。 当然你用 cloud code 也行,那你也尽量别去用那个纯命令行形态的 cloud code, 你 可以去结合啊,代码编辑器去使用,你可以使用它基于 id 一、 a id 二的插件等等吧。当然你说,哎,我就一边开着代码编辑器,一边开 cloud 的 命令,行啊,我结合着用也行啊。 只是说两个产品定位是有差异的,但他们也都在互相向对方靠近,也没有那么非黑即白。包括 curser 也在跟进 clodocode 的 skills 啊,也在跟进 clodocode 的 回调啊,甚至也在跟进 clodocode sub a 千塔再往下啊,就是最近 clodocode 的 兄弟产品的推出,叫 co work 阿斯罗密克这家公司,就发现有太多的非程序员,或者说太多的用户用 clodocode 去干一些非编码的工作。因为 clodocode 能够随意地在一个特定的文件夹下 修改各种文件,能够调用浏览器,能够通过 m c p 调用远程的服务,能够通过 skills 拥有特定的技能。 那其实 cloud code 它不仅仅就可以局限于写代码这个场景了。我们电脑里面某个文件夹下有某个项目的大量的 word 文件、 excel 文件,我可以把这个文件夹的权限给到 cloud code, 让他来帮我读取这些文件,针对这些文件做整理啊, 包括 co 的是能干这件事情的,只是干的不那么天然,不那么自然,人际交互不那么友好。所以在这种情况下, collog 推出了它的 co work 产品。 co work 是 一款什么产品?它就是 把我们最早聊的 mars 的 服务端的计算过程,服务端的运行逻辑,提前到了客户的本地。但这就带来了巨大的好处,因为我们 用户所有的文件资料其实都在电脑本地。我今天不可能让 minulus 帮我干一个活,以后我要把我所有的文件资料,几十个 word 文档全部上传给 minulus 吧,那个体验太差了,所以 minulus 只能干一些简单的活。我给他一个某个 word 文档,我让他帮我做某件事情。但如果让他基于我某个文件夹上已经存在的几十个 excel 啊,做数据汇总,做统计, 曼纳斯的体验就很难了。所以 coco 就 解决了这个事情,他在用户本地的电脑上,就在用户的本机上,去读取用户指定的文件夹下的各种形态的内容啊,基于这些已有的内容, 完成用户指定的任务啊。在完成任务的过程当中,还可以去调用浏览器查找资料,甚至可以调用浏览器来执行任务。比方说,打开你的 某个社交网络的账号,帮你发一篇帖子,打开某个电商网站,帮你购买一件商品。也就是当你赋予了大模型 文件夹的权限,赋予了大模型使用浏览器的权限,再告诉大模型,他拥有了一些额外的技能啊,这个技能就包括了执行一些,或者调用一些你的定制化工具啊,某些程序脚本这样的能力,那这个大模型 跟你本人在平常的工作流,跟你自己的工作方式没有多少差别了。 我们想想我们自己平时工作干嘛?不就是打开一个文件夹,读取一些文件,然后思考,然后再改改文件,或者再创建一个新文件。不就是打开浏览器,点到这个网站上,看一看一些信息,然后思考,然后再进行跟网站的进一步按钮,点击交互、打字、发帖、下单、购物。 我们人类这么强大,每天对着电脑做的事情也就仅此而已啦,所以 co worker 天然就具备了这样的能力。 但是这里面有一个非常核心的点啊,一定要记住,我们必须给 cocok 指定一个工作目录,就是这个 cocok, 他 不能霸占我的整个电脑,他不能对我整个电脑的所有文件夹,所有数据都有独取权限啊!这里面有隐私的问题,有安全性的问题。 今天的 cocok, 当他具备了跟你自己一样的能力,当他来当你让他来帮你做一些事情的时候,就相当于你雇了一个助理,你让助理来帮你做一件事情,请问你会把你的个人电脑权限完全开放给你的这个助理吗?不会的, 你只会给他某个特定任务的文件夹的权限,甚至你会首先预先把跟这个任务相关的资料整理到一个文件夹下,再把这个文件夹开放给这个助理。那其实聊到这里啊,这两天刚刚爆火的 lord boot 就 呼之欲出了。 今天,当我拥有了一个能够操作我电脑里面的文件夹,能够使用我电脑里面的程序,能够使用我电脑里面的浏览器的。这样一个助理的时候,我还何必跟他共同使用同一台电脑呢? 我们何必要两个人挤在同一台电脑前面呢?我给他也买一台电脑就好了呀。然后我把我希望他做的任务发给他,我把他需要的初始资料啊,不管几十个文档还是 excel 等等,全部发给他,他做完了以后把结果再发给我就好了。这就是今天 我们的老板指挥我们干活时做的事情啊。老板出差在外地了,他也通过微信给我们发个指令过来说,哎,小张,把这个方案改一下啊,他把原始方案文件发给我,把修改要求发给我,我这边框框一通改,改完以后再发给他,是这样一个过程吧。所以今天我们就一下子理解了 所谓的 cloud boot 了,我们也去理解了为什么这两天因为 cloud boot 的 出现, mac mini 会卖爆了,因为所有人想要使用 cloud boot, 他 首先要给这个 cloud boot 是 啥?是他请的一个助理啊,他得给助理 配一台电脑啊,这个助理不能跟他自己,不能跟我自己挤用一台电脑啊,不能说,哎,助理,你来帮我干个活来,我把椅子挪开,你把椅子挪过来,你来开始干活了。我在边上看着,而是说我要给这个助理买一台电脑,而这个助理本身他毕竟不是人啊,他不需要显示屏,他不需要键盘鼠标,他是程序,他直接就能够 读取我们电脑里面的各种文档,他直接就能够编辑这个文档,他跟我们电脑的交互方式跟浏览器的交互方式不是通过显示器读取,通过键盘鼠标键入的,他都是程序化的。 他读取浏览器是通过调用截图工具来截图,然后读取图片啊,甚至他是通过理解某个网站的源代码啊,来了解这个网站是干嘛的,怎么进一步跟他交互啊? 它可能是通过自己写的一小段 javascript 脚本来达到了点击按钮的目的,所以它不需要键盘鼠标,不需要显示器,它只需要一个主机,那么最好的形态,今天就是 mac mini 啊, 一个小方盒子,所以 mac mini 就 卖爆了。那么今天我买回来一个 mac mac mini, 我 在里面装上了 cloud boot, 在 里面装上了聊天工具啊,类似于微信啊这种,当然现在这个国外的东西,它还不支持微信啊。装上 slack, 我 自己的电脑不受任何影响呀!我在我的电脑上,我在我的手机上,我给这个助理的 这个助理的 mac mini, 我 给他发过去一条指令,我给他带上原始的方案,丢给他,他收到以后,他就按照我们的意图开始干活了。 怎么干活的?当然他还本质上还是一个 a 键呢,他要把相关的上下维工程做好以后丢给大模型啊,是大模型,是真正的大脑,而这个小盒子,这个 mac mini 里面的程序,它只相当于眼睛,相当于手啊。 活干完以后,他再把结果通过聊天工具发回给我们,这个过程太丝滑了,没那么神秘啊。 今天大家理解任何 a 键的产品,理解任何 a r 产品,你就把它想象成一个人就好了,你的一个助理就好了,他只是各种受限程度不同而已啊,能力水平,能力层次高低不同而已。那么聊到这里,大家会发现,哎,这不又回到当初 mails 那 个逻辑吗?我在客户端发送一个文件,加上指令给到服务端啊,我旁边这个助理就相当于服务端嘛。 只不过原来 melissa 是 什么?是雇了一帮助理,几百个助理,在 melissa 的 写字楼里面,我们消息发过去以后,这个助理干完了以后返回给我们结果。而今天是什么?我把这个助理请到家里了,这个助理只为我一个人工作,这里面的差别在哪啊?差别在于当一个助理服务很多的人的时候,他很难记住每个客户的需求。 而当今天 croobo 我 自己这个私人助理只服于我的时候,他就对我越了解,他干出来的活就越符合我的期望啊。 抛弃这个类比不谈,我们回到具体的技术层面。 manners 当初要想实现他的这种通用人工智能助理的目的,他是在他的服务器上给我给每个用户开了一个沙盒,这个沙盒是临时的,我一次任务结束,这个沙盒就消失了,我发送给他的所有文件就没有了,我发送给他的指令就丢失了。 这样导致我每次让这个服务端的助理帮我干活的时候,我都要给他精准的描述我的需求,把所有文件堆给他。而当这个助理变成我私人助理的时候,今天所有的数据就在这个 mac mini 的 小盒子里面, 就存储在这个自己的硬盘里面,内存里面我今天发给他的文件他就存在那里了,他就放在自己的电脑里面了,就像你今天让你的助理干个活,真人助理啊,你发个我方案给他,他处理完以后他不一定就立刻要删掉,他可能放在这想,哎,这个任务还没结束,过两天老板可能又要让我改一下,那我直接拿出来再改就好了, 所以这是巨大的差别。我们让本地的这个 cloudfoot 给我们干活的时候,是跨越时期的,他所拥有的那个电脑啊, 也是会慢慢丰富起来的。就像我们真人买了一台新电脑以后,随着工作时间的变长,会积累越来越多的文件,他也一样,而他积累的这些文件全是他给你干活所积累下来的。没有他自己的私人的物品啊,他不存在私人的生活和工作, 这是很大的一点区别。另外一点区别是什么?就是它是有记忆的,我今天发给他的所有的指令啊,我跟他描述的我的偏好,他都会记下来,当然这就程序化的,本地有个数据库,对吧?会记下来这些偏好,所以我跟他的磨合是会越来越好的。这就聊清楚了,为什么从 cooke 一定会演变成 cloud boot 的 形态, 而 cloud boot 的 形态很像最早的 melus, 但为什么又跟 melus 有 巨大的不同,而 cooke 为什么得以出现? code 的 前身是什么?就是 cloud code, 理解了 cloud code, 就 理解了 code 没有本质的不同。而 cloud code 的 前身又是谁?是 cursor, 理解了 cursor 的 使用场景,就能够差异化的理解到 cloud code 的 使用场景啊,就能够进一步理解到 cloud code 的 使用场景,进而就能够理解了另一个 cloud boot 的 使用场景和价值,所以这些都理顺了以后,我们来着重聊一下 cloud boot 的 使用场景和价值,所以这些都理顺了以后,我们来着重聊一下 cloud boot 的 使用场景和价值,所以这些都理顺了。他今天最核心的解决了什么问题啊? 首先它解决了远程沟通的问题啊,过去我们实现远程沟通,你看 manners 是 自己定制的聊天界面啊,你像 cursor, cloud coat 肯定是自己定义的网络通信协议 co worker 啊,也是要基于 cloud 的 客户端的一个程序。而今天 cloud boot 它是基于我们已经习惯的那些聊天工具啊, qq 啊,微信啊,当然这些暂时都不支持啊,那像国外的就是啊, snack 呀等等。 这就很像今天我们啊,不管用飞书也好,用钉钉也好,他背后都有智能助理嘛,哎,他的天然形态都是跟飞书啊啊,钉钉啊,他的那个即时聊天界面相结合的,我们都可以通过艾特的方式,或者直接找到这个机器人跟他聊天的方式来让他帮我们完成任务啊。 cloud bot 他 也是这样的形态, 它不封闭啊,它是基于已有的大家在用的这些流行的聊天工具啊,它对接了它们的接口,它让我们的服务端的这个独立的小盒子, mac mini 这个助理能够具备从聊天程序当中拉取指令, 调用聊天程序,返回指令给我们这样的能力。这个是 cloud bot 解决的第一大痛点啊,也是它第一大创新点,也是 cloud co work 还没有解决的问题。那么它第二大特点呢?就是它具备了本地的记忆的能力, 而这种记忆策略是什么啊?我觉得目前 cloud bot 的 记忆策略不一定是最优的,因为你像切 gpt, 他的切 bot, 他的聊天,他也很早就有了记忆的能力。那这种怎么样去采集记忆啊?怎么样去存储记忆?怎么样去调取记忆? 哪些是用户需要去记住,哪些是不需要去记住的?这个策略各家有各家的差异,包括 cursor 也有它的记忆功能啊。那么 cloud boot 今天它的记忆策略不一定是最优的,但它有这个记忆的策略啊,记忆也不是它独创的。第三呢,就是它本地的这个对文件系统的管理,我觉得这也是 cloud boot 这款产品巨大创新和突破性的地方。 刚刚我们一直很自然的类比说,哎,他拥有了一台自己的电脑,拥有一台自己电脑这件事情突破性是非常大的,从此再也没有文件加权限这回事了。我不是说在我的电脑上给他开辟一个文件加权限,而是他拥有自己的一台电脑,我希望他处理什么文件,我发给他,他就存在那了,我下次也不用再发给他一遍了。 所以这个 cloud bot 他 是对他拥有的这台电脑的所有程序都有掌控权限的,他是可以随意操作的。 为什么他可以骚随意操作?这里就天然解决了安全性的问题,他今天任何一步操作错了,都不会影响到我自己啊,我们人类用户这台电脑上数据的安全性啊, 这整个独立的一个 mac mini 小 电脑,就是一个沙盒,他可以随意去操作。这个我觉得是 cloud boot 巨大创新的地方,那么是不是意味着 cloud boot 这个开源产品啊?当然,未来他一定会商业化,一定会成功呢。啊,只能说有这个可能,他的这个形态是一个终极形态啊。 实话讲过去,可能一年前吧,我就在探索啊,我去网上搜了一堆啊,怎么样能够?我很希望说我家里放一个算力很强的这个 mac 主机,但我出门呢,我就不想背一个 mac pro 很 重嘛,我就带一个 苹果最轻量的一个轻薄笔记本,很轻,随时随地都能办公,但他的算力又不够,哎,那么我通过远程的方式,让家里的电脑来给我干活啊,他干好的活以后再来,我再来远程去检查,去审查啊。 为此啊,在网上找了很多硬件产品,软件产品,而今天 dropbox 天然就解决了这个问题。所以说这个场景,需求场景是一直存在的,我相信所有人都有这个需求场景,尤其当大模景越来越强大 以后,能帮我们做的事情越来越多以后啊,这个形态必然会越来越是刚需。谁不希望拥有自己的一个私人助理呢? 我们不是不想有,我们只是请不起嘛,付不起一个月两万块钱,一万块钱的工资嘛。可是当这个成本降低到一个月两千块钱、一千块钱的时候呢?也许我们就有这个意愿了,或者说人人都有这个意愿了。所以说这个形态一定会成熟和流行起来的。 但是 called bot 也必须要去面对巨大的竞争。当这个形态被验证,你觉得 bot 奥斯罗克这家公司不会跟进吗? 当前的 cowalk 这款产品已经很成熟了,只不过是在用户的本地电脑上运行的,那他只要稍加修改,也可以变成一个在独立电脑上运行的一个远程助理了,甚至是 millis 也可以推出私有部署版本呢,甚至是苹果 也可以直接推推出家用的私人助理的硬件产品啊,里面就内嵌了软件,而且天然跟他的苹果的个人效率工具,麦克啊, ipad 啊, ios 啊,天然去打通啊。所以这个想象空间是巨大的啊, 一堆的在传统赛道上已经有优势的这些玩家,这些大流氓啊,这些大厂商也都会杀进来的。今天 cloud bot 只是见证了这个需求场景,这个关键假设,它只是向人们证明这种形态是可行的,是最受欢迎的。 今天我们仅仅是处在这样一个阶段,以现在为起点,可以想象到这样一个形态会越来越繁荣,会越来越丰富啊。 这个独立的助理啊,远程的助理,这个 mac mini, 这个 cloud boot, 它的能力会越来越强大啊,我们跟它的远程交互体验会越来越好。未来可能不仅仅是通过聊天给他发送指令了,我们可以有 一起协助的某个界面,我们甚至远程可以看到他工作的那个界面,虽然他本身工作不需要一个显示屏,但他可以把相关的工作过程展示给我们,可以把相关的工作结果展示给我们。也就是说,让 cloud boot 这样一个现在还比较极客,比较工程师化的产品,变得越来越消费化啊,越来越消费劲。 这种事情,苹果太上缠,谷歌也太上缠了啊,一堆公司太擅长了,所以最后还能说什么呢? 最后只能说一人公司会越来越成为可能啊,可能性会越来越强。也许以后你租一个办公室,其中一间是你的工位,其他所有工位上都是摆的 mac mini 啊。你摆了十个 mac mini, 相当于你有了十个员工啊,这就是这家一人公司。