最近 ai 圈的顶流啊,无疑是这只小龙虾不喷阔,如果你说很想用,但不会部署怎么办呢?哎,最近,它终于从即刻手中的玩具来到了大众的面前。这款现象级 ai 产品的爆火,原因呢,也很简单,它有手, 能够指挥你的电脑清空收件箱,管理日历、编辑代码,甚至能够帮你盯着股市妥妥的二十四小时 ai agent 在 线助力已经成为现实。但是呢,对于普通用户来说啊,它有一点点的不友好。 原因是呢,如果直接把 open core 装在你的主力电脑, ai 有 权限直接访问你电脑的文件、浏览器, cookie、 密码、 api、 key 等等,都有可能会被黑客的恶意代码攻击。 所以呢,这就是为什么苹果的 mac mini 直接卖疯了,大家需要这样的一个安全隔离设备来避免数据泄露风险。 但是呢,配置这个东西吧,你得懂 linux 系统,你得租 vps 服务器,还得配置环境,还要去申请各种大模型的 api key 哈,对于呢一些技术小白来说,包括我自己在内,真的没有那么容易。 但好消息是呢,看着 opencloud 的 爆火,大厂们迅速闻到了下一代产品交互的新格局,范式连夜上线部署。在国内市场,最早接入 opencloud 的 大厂,其中之一呢,就是百度,速度非常快哈, 直接就在百度 app 里面就开了一个传送门,你只需要打开百度 app, 搜索 open call, 就 能够看到一键部署的入口。百度智能云在后台呢,已经帮你把环境装好了,模型配好了, api 接通了,用户呢,只需要在 app 中私信发送指令,你就能够直接拥有一个部署在云端的超级助理, 就在百度官宣接入 opencloud 的 两天之后,二月十六号, opencloud 的 创始人宣布将加入 opencloud ai, 致力于推动下一代个人智能体的研发。所以我们可以感受到啊,全球头部玩家对技术变更的走向非常敏感,动作非常快, 也显示出如今 ai 大 战之中,对新范式落地执行,需要像百度这样的科技大厂门的快速识别和决策执行能力。 那么云厂商巨头们接入 opencloud 的 好处呢?不只是帮助大众更容易部署,还有一个附加的好处就是巨头们的生态可以和 opencloud 这样的一个超级 ai 助手所结合。 举个例子哈,接入百度 app 之后呢,它就能够接通百度搜索的实时信息流,百度百科的知识库,百度地图的出行规划能力,甚至呢,还有不久前更盛驾的百 百度优选官方电商 skill 这个购物插件。那想象一下哈,你不再需要去各大 app 反复横跳,你只需要对你的助理说,哎,帮我选一款性价比最高的降噪耳机。 那你的 opencloud 呢,就能够调用百度优选的能力,自动完成跨平台比价分析,全网口碑筛选,真实评测。然后呢,直接给你一个决策建议,甚至呢,一站式的完成下单,从找货到决策再到购买,全流程自动化。 所以呢, openclog 是 新一轮 ai a 阵产品迭代的导火索,让即刻和开发者们发起一阵硬件改装狂欢啊。而巨头们则是闻风迅速入场,则是把这样的一个创新变成了一个人人可用的大众生产力。 openclog 的 爆红呢,可以说明啊,用户已经不再满足于会聊天的 ai 了,而是期待真正能够完成任务的助手。但是呢,要成为大众产品啊,仍然需要解决三件事,使用门槛、稳定性还有信任机制。 让百度 app 占有着七亿月火的巨头平台化接入呢,是一种可能的路径,让这个原本主要在硅谷技术社群流行的 a 阵产品首次进入大规模用户场景,也显示出巨头平台们在新技术落地上的战略前瞻判断和推进速度。 那么这未必意味着技术已经成熟,但是确实让更多用户能第一次有机会接触到 agent 形态。而大众对于 openclaw 是 否能够形成长期的使用习惯,我们也会为您持续的关注。订阅硅谷幺零幺,不要错过最新的全球前沿科技和商业动态哦!
粉丝35.6万获赞109.6万

这是搭载了 opencloud 的 电脑,而这是飞书,我把 opencloud 接入了飞书,现在我们只需要在飞书上给他下达一个指令,他就可以在电脑上实现。比如我跟他说帮我在帮我上网搜集五篇科技新闻,总结成 n 点 a html, 并放在桌面,双击打开,截张屏发给我,我直接发送给他。 哎,他现在在电脑上创建了,然后打开了,接下来还会截张屏,然后在这里发给我,看看他会不会发。嗯,这里他就直接发过来了。好,我们可以看到,他就直接给我发送过来了,一张截屏。好,我们可以看到他,我完全没有操作,对吧?都是 open cloud 在 操作我的电脑,然后你看他就给我一个回应,接下来我来演示一下这个过程是怎么实现的。 好的,首先我们打开这篇文章,我们可以看到一开始他需要安装一个叫 node js 的 东西,如果还没有的话,就可以来到这个网站上去下载,那我们怎么知道有没有安装呢?打开这个终端,输入 node 杠 v, 然后如果这里能出来一个版本号,那就代表已经安装了,这个版本号必须要大于二十二。好,如果它小于二十二或者没有安装就会出问题。好,我们可以看到这里就有指令,然后下一步我们就要安装 opencl 了,我们直接复制这条指令,这是一条快捷安装的指令,然后粘贴过来这里,我们就可以看到它已经开始安装了,我们稍等片刻, 好的,我们终于安装好了,在这里。好的,我们终于安装好了,在这里我们先选择左边这个。 yes, 我 们可以通过左键盘的左键和右键,就这里这两个键来去切换这些选项。在这里我们先选择左边的 yes, 然后这里选择一个 quick start。 好, 这里我们如果再出现这选项,就选择 reset。 呃,然后如果出现这个的话就是 forestat, 这里我们需要选择一个模型,就是我们需要获取到这个模型的 apikey。 那 怎么获取呢?我们先来打开这个网站,这里呢我们可以看到有很多链接,我推荐使用这个红色的链接,因为网络连接会很快, 比如我们随便选择一个 miniso, 就是 kimi, 然后在这里我们就可以直接来到用户中心,一般来说他们的 ui 都会长得很像。然后有一个 apikey 管理这里我们在这里获取一个 key, 把这个 key 一定要保密,然后把它记下来。这里比如我们就直接选择这个 kimi, 好,然后我们就可以选择它的这些 api key 了,比如我们在这里就选择点 ai, 然后就输入一下它的 api key, 比如说我们就输入这个 api key 好, 回车它就可以了。这 api key 是 我瞎输的,实际上它不会长这个样,这里我们选 keep current。 嗯,这里我们待会会通过非输去配置,然后这个它这里可能会出一点问题,我们就选 skip for now, 好 的,这里先选 no, 然后这个这里就需要摁空格去选择,然后再摁回车去。确定 好,这里他就可以会安装一些东西。这里呢我们就选择第二个 open in web ui, 这样的话他就会打开一个,哎,这样的一个,嗯,他的链接就是一二七点零点零点一是幺八七八九端口。好的,现在让我们问他一个问题,来看看他能不能回答,比如我问他,你好好先问一个最简单的问题,看他怎么说。 好,他这里确实是回复了,嗯,他是刚上线,然后所以他什么都不知道,他也不知道咱们是谁,他是谁,那我们就可以告诉他,他应该叫什么,我们应该叫什么,我可以直接告诉他。 哎呦,好的,成功了,那以后我们再问他,他就会知道我们是谁了。现在我们就成功的部署 open core。 那 接下来我们怎么更方便的操作他呢?我们可以把他接入飞书,这样的话我们就可以在随时随地都直接打开飞书,给他发送一下消息,他就可以操作我们的电脑。那我们该怎么办呢?这个就是飞书开放平台,我们先注册一个账号,然后点击开发者后台, 好进来了,在这里呢有一个按钮叫创建企业自建应用,我们点击,然后这里我们给应用起一个名字,我就叫 c e 的 agent, 然后应用描述我们也叫这个,其实都是可以改的,那这里给应用一个图标,我就给他起这个,然后换成这个颜色 创建,这样的话就创建成功了。然后我们根据这个文章给他一个机器人权限,给他一个机器人。好,在这里呢,我们就给他一个机器人能力,我们点这个添加, 这就成功了,我们可以在这里看到机器人就代表成功了。这里点击凭证与基础信息,只要有一个 app id 和一个 app secret, 这两个我们要记下来,那这两个怎么用呢?这里有一段提示词, 我们直接把这段提示词复制下来,打开 open class, 然后直接粘贴给他,然后在这里呢我们把 app id 提换成实际的 app id, 我 们复制,然后这段删除,粘贴 app secret, 然后我们也复制粘贴好发给它。 好的,我们可以看到它说所有的配置已经完成了,那我们就回到飞书,然后我们刷新一下页面,在这里呢,我们点击事件已回调,然后点这个定义方式边的铅笔,选择长连接点,保存 好它,没有任何的报错就代表成功了。然后这里我们点添加事件,这里输入接收消息,点勾选这个接收消息 v 二点零,然后确认添加好之后,我们再点击这个权限管理,这里有一些权限,我们可以开通,首先我们输入 im, 开通完全线之后呢,如果我们看到这里有一个版本发布后,当前修改方可生效,我们就点击这个创建版本点,然后这里就输入一点零点,然后这里我们再写一个好,保存好,这样的话它就成功了。我们现在打开飞书这个软件,给他发一个消息试试。 好,这里有一个问题,之前没出现过这个问题,我就按照他的这个手法配置一下,哎,太棒了,我们可以看到这个标志就代表他已经开始思考了,好,他就回复我了,这样的话我们就成功的把它配置到了飞书上,而且我们成功的部署好了 open class。

cloud bot 一 夜爆火,这是一个运行在本地电脑的开源 ai 助理,短短几天内, github star 数量直线拉升,已经超过了十二万。本期视频我们带来一个 cloud bot 的 全面攻略,看看 cloud bot 比起其他的 ai agent 有 什么特色。 我准备了十几个案例的玩法大全,还会介绍一个接入飞书加国产模型的方案,让 cloud bot 在 国内网络也能顺畅使用。视频开始之前,先插入一个小插曲, 由于 cloud bot 受到 ansorepic 法务团队的压力, cloud bot 先是改名成了 motbot, 现在又改名成了 open cloud。 爬爬虾做视频的速度还赶不上它改名的速度,所以本期视频我们还是统一叫它最开始的名字 cloud bot。 cloud bot 功能跟 cloud code 和 open code 都有点像,都可以处理文件编码、调用 skills、 m c p 等等帮我们处理工作。 cloud bot 的 最大优势是可以接入各种聊天工具,也就是我们即使出门在外,手边没有电脑,只需要在聊天工具里面给 cloud bot 留个言, cloud bot 就 能自动干活,还能把屏幕截图、执行过程等信息实时同步过来,非常的方便。第二个优点是, cloud bot 自带了强大的定生物系统, 只需要用自然语言就能创建定身舞,比如可以创建一个临时的提醒,还可以定时检查收件箱通知等等,它可以智能地判断事情的紧急程度,选择是否用聊天工具跟用户进行沟通。比起传统的指令执行、指令执行这种固定的流程, cloud bot 就 具有了很强的主观能动性。 它的第三个优点是具有长期记忆,可以把记忆作为文件存储在本地,在日常的对话中能够搜索,并且把相关的记忆捞回上下文,随着日常使用,它还会主动去更新这些记忆文件,会有一种越用越聪明的感觉。好,我们先在本地把软件安装一下, 任意一个能运行 note g s 的 环境都可以部署 cloud bot。 我 最推荐就是使用 mac 或者 linux 系统的家庭服务器。 现在最火的部署方案是使用 mac mini, mac mini 的 最大好处是 mac 系统有不错的桌面环境,这样可以很方便地进行截图、操作、浏览器等等。第二点是功耗比较低, 七乘二十四小时运行,比较省电。第三个优点是 cloud bot 里面许多 skills 跟 mac 生态是绑定的,没有 mac 电脑的话,可以选择 linux 操作系统,或者在 windows 里面创建一个 linux 的 虚拟机。操作步骤跟接下来是一样的, 我选择的安装方式是 node js, 我 们来到 node js 官网,把第一个命令复制一下,然后打开终端执行一下,接着是第二个命令,第三个命令, 这样 node js 就 安装完成了。下一步我们来到 cloud bot 的 官网,在这里有一个一键安装命令,如果我们使用官网上的一键安装命令的话,注意要区分现在软件的名字,比如现在叫 open cloud, 后续所有操作的命令都应该是 open cloud 开头了,这里我选择 npm 的 安装方式, 我们看到 n p m 这里命令还是叫 cloud bot, 所以 后续我输入的命令都应该还是 cloud bot 开头了。这样我把这个命令复制一下,粘贴到命令行窗口执行一下。安装完成,我们输入命令 cloud onboard 来进行初步化。第一步,先配置 ai 模型,因为我有 open ai 的 plus 订阅,所以这里我选择 open ai, 当然下面也有很多不错的国产模型可以选择。视频的后半段,我们再来配置使用国产模型。选择 open ai 以后,再选择第二个 chad gpt 登录, 登录一下我的 chad gpt 账户,这样 ai 模型就配置完成。默认模型我选择的工具是 whatsapp 视频的后半段。我们再来看如何绑定国产的聊天工具。我们打开手机上的 whatsapp 右上角三个点已关联设备,关联新设备,扫一下屏幕上的二维码,这样就绑定完成。接下来选择预装的 skills, 按空格键打上对勾选中,这里可以按需进行选择安装下面的这些 api k 可以 全部选择跳过,然后 ai 会询问我们一些关于人设方面的问题,我们回答一下,这样就配置完成。我说你可以给我的聊天工具发一个消息,我们看到手机上收到了消息,这样就完全配置成功了。 我们先来介绍几个基础命令的使用。输入命令 cloud bot gateway, 这个是启动主程序,我们可以通过关闭控制台来停止 cloud bot 的 运行。在 cloud bot 后台运行的时候,我们可以新开一个窗口, 输入命令 cloud bot t u i 就 可以进入这个控制台的对话界面。输入命令 cloud bot dashboard, 可以 进入一个网页版的控制台,在这里可以进行基础的对话。上面还有很多配置,可以管理定身舞,管理 skills 等等。输入命令 cloud bot channel logout, 可以 退出 cloud bot 上面登录过的聊天软件,然 然后我们再输入命令 log in, 就 可以重新登录一下,因为有的聊天软件可能隔几天就会掉线,我们可以使用这个命令重新登录一下。我们来看 cloud bot 最有意思的一个功能就是它的定身物,定身物赋予了 cloud bot 的 一些主观能动性,让它变得更像一个智能的 ai 助手。 比如我输入这个命令,提醒我两分钟以后关煤气。 cloud bot 回复我,好的,已经设定成功了。我们可以在网页版的控制台 crown job, 也就是定身五这个选项卡可以看到 cloud bot 为我们设定的定身五,这里显示两分钟后执行。两分钟以后,他就把这个消息推送到了手机上,提醒我去关煤气。 cloud bot 具有操作浏览器的能力,我们需要先在 mac 里面下载一个 chrome 浏览器,我要求 cloud bot 去 m i t 公开课下载 python 课程的课件,放到我的桌面,我们看到 cloud bot 自动打开了 mac 里面的 chrome 浏览器,找到了 m i t 公开课的官网,并且搜索 python。 他 找到了几门 python 课程, 回复了我课程的编号,让我选择这里,我选择第一个。他又在浏览器里面通过课程编号找到了这门课,并且下载到了桌面,然后我要求他把它解压出来,他调用了麦克的命令行工具完成了解压,然后我要求他把第一节课的课件发给我 这里可乐豹成功找到了课件,并且完成了发送,效果不错。接下来我们来看一个把浏览器自动化跟定生物组合起来的案例。爬爬虾,作为一个科技软件类的博主,需要经常查看 github 的 热点, 这里我告诉 cloud bot, 让他查找一下 gitap 上面的热点,然后做个中文简报发送给我。 cloud bot 生成了中文简报,接下来我说每天早晨八点你都做这么一个简报发送给我。 接下来 cloud bot 生成了一个定身舞,每天早晨八点都执行这个工作。我们可以在 cloud bot 的 控制后台查找到这个定身舞,每天早晨八点都会自动执行这个工作流程,发送给我简报效果不错。除了操作浏览器, cloud bot 还有图像识别等 ai 视觉方面的能力。 这里打开 mac mini 的 设置隐私与安全设置录屏与系统录音,我们在这里搜索终端两个字,给命令行终端添加上录屏和录音的权限。接下来重启一下 cloud bot, 我 在手机里面说,请给现在的 mac 截一个图, mac 电脑当前的图片就发送到了我的手机上,可以实时的对状态进行监控。 目前为止我们依赖的是海外的聊天工具。接下来我们把 cloud bot 接入飞书,让他在国内的网络也可以顺畅使用。我们先来到飞书开放平台,点击创建企业应用,填写一个名字与描述。接下来点击左侧添加应用能力, 选择机器人。然后我们来到权限管理,点击添加权限,总共需要添加屏幕上这些所有的权限。 接下来来到版本管理与发布,填写一个版本号,点击发布。我们回到 mac 终端,输入第一个命令,安装飞书插件。第二个命令,配置 app id, app id 可以 在飞书开放平台凭证与基础信息里面找到, 把 id 粘贴到命令行里面执行一下,然后配置 app secret, 同样在凭证与基础信息里面找到同样的,把 secret 放到命令里面执行一下,下一个命令,开启飞书 channel。 最后第四个命令,把链接方式改成 web socket, 然后我们重启一下 cloud bot, 这里我总结了需要执行的几个命令,有需要的观众朋友们可以截图保存一下。回到飞书开放平台,在事件与回调这里选择长连接,点击这个铅笔,点击添加事件,然后勾选接收消息,最后点击顶部的创建版本, 我们再提交一个新的版本,这样飞书就配置完成了。在飞书的手机 app 里面,我们可以找到开发者助手,然后点击打开应用这里我打一个招呼,你好,飞书有一个非常可爱的机器人正在输入的表情,我问他现在几点了,这里给出了回答。然后我让他给麦克截一个屏, 告诉我需要先在控制台跟他对话一次,开通权限才可以截屏。这里我们来到麦克上面的控制台,跟他对话一次,允许截屏,这样截屏完成。我们看到飞书也同样可以传递文件传递截屏。我们把聊天方式换成了国内平台 ai 模型,同样也可以换成国内平台。 cloud bot 的 作者推荐使用 mini max, 这里我们来到 mini max 的 开放平台左侧,选到接口密钥,然后创建一个 apikey, 然后我们打开 mac 的 控制台,输入 cloud bot config 来配置一下模型,选择 mini max, 然后我们把刚才创建的 mini max api k 填写进来,一路回车就配置完成。来到 cloud bot 的 控制台,输入命令斜线 models, 然后我们可以选择 mini max 模型, 选择完模型以后,我们再重启一下 cloud bot, 这样模型就切换完成了。 cloud bot 的 强大之处在于它内置的 skills 可以把各种第三方的生态接入进来,比如这里的 g u g skills, 可以 把谷歌邮箱、日历文档等功能都接入 cloud bot。 我 们点击这个安装按钮,这里要提醒一下大家,安装的时候要把 mac 系统更新到最新版,否则有可能会失败,这样一键就安装完成。 来到谷歌 cloud, 我 们在左侧菜单找到 api 与服务,选到 o o 四权限请求页面,创建 o o 四客户端应用类型,选择桌面 app。 然后我们把生成的这个 json 文件保存下来,把文件拖拽进 cloud bot, 告诉他配置一下 g o g 的 认证,然后我们登录谷歌账号,并且授予权限,这样就完成了配置。接下来我让他看看我的邮箱里有什么邮件,让他总结一下。 这里 ai 提示我需要再开通一个 gmail api 的 权限,我按照它的提示把权限开通完成,它就可以读取到我的邮件了。接下来我让它把所有的邮件移动到垃圾箱,这里也成功完成了。我在手机上让 cloud bot 帮我发送一封邮件, 我们看到邮件可以成功发送,我让 cloud bot 设置两分钟一次的心跳检查,如果有发现新的邮件,就发消息通知我,我给这个机妙邮箱发送一个邮件来测试一下。这里 cloud bot 成功给到了通知,我让他总结一下邮件内容,他也完成了总结。 ai 助手对接其他生态,一个重要的渠道就是 m c p, 我 们可以在 skills 里面找到 m c p porter, 把这个 skills 安装一下。接下来我告诉 ai 用 m c p porter 来配置一个百度地图的 m c p, 我 把这个 m c p 的 说明文档贴给了他。 ai 提供了三种安装方案,我选择 streamable h d d p。 他同时要求我提供百度地图的 a p i k, 把这个 a p i k 复制一下粘贴给他,这样就完成了配置。他已经可以使用这个 m c p 查询到地理位置的坐标了,这样我们就配置完成了,我们也可以在手机里面使用,我让他查询一下从青岛太平角公园到崂山羊口景区怎么走, 这里成功给到了规划路线,效果不错。我们再来看一个 skills 的 使用,这里有一个 skills 叫做 coding agent, 它可以驱动本地的 codex, cloud code、 open code 等 ai 编程工具 直接进行编程。这里我们先把这个 skills 安装一下,我在 mac 电脑上登录了我的 codex, 接着我在手机上跟 ai 说调用 codex 创建一个贪吃蛇的游戏,我们看到程序就编写好了,这样我们就通过 cloud bot 驱动 codex 完成了一个程序的开发。

大家好,最近越来越多人都在抢着安装 open call, 把这只小龙虾当成自己的 ai 私人助理。大家都知道它很厉害,但你知道它到底是怎么自动干活的吗? 今天我就来带大家了解 open call 自动干活的原理。我们会从它的八大能力入手,包括 gateway、 agent、 skills、 channels、 notes、 memory、 哈尔滨矿。听起来有点技术,但是听完你就会明白为什么它能替你处理各种任务,甚至在你没动手的时候主动执行任务。 我们先说 git, 他 是所有请求的第一站,他就向你家门口的智能门禁。无论你从网页、手机还是聊天软件发出指令, git 都会先确认你的身份,然后把请求准确送到系统内部的正确模块。 技术上, git 就是 一个 api 网关和绘画管理系统,它负责身份验证、连接、管理多用户隔离和请求路由。没有它,助理根本不知道谁在下命令,就像门没开,你叫也叫不进。接下来是 agent, 它是 open call 的 大脑,有专门的人设,负责理解用户意图、制定分布计划,判断要调用哪些工具或技能。 技术上, e 政提示 i r m 推理循环系统,通过观察、思考、计划执行和反思,不断自我校正。在执行过程中,他会根据任务结果调整策略,让助理不仅会执行,还会规划和判断,这就是 open call 能做复杂任务的核心原因。 但是 agent 光有大脑还不够,它需要实际动手的工具,这就是 skills。 skills 就 像助理的工具箱,里面装着各种功能,发邮件、写代码、操作浏览器、处理文件、调用 api 生成文档。每一个 skill 都是独立模块,遵循标准化接口,可被 agent 调用。 没有 skills, 即使 agent 思考再多,助理也只能空喊好的。所以 agent 决定做什么, skills 决定怎么做,两者缺一不可。你可能会问,我怎么和助理交流呢?这就是 channels 的 作用。 无论你用网页、 whatsapp、 telegram 还是飞书, channels 都会把你的消息统一转换成系统能理解的格式,保证指令能准确送达。 agent 换了通信方式,不换助理,他依然能听懂你的指令。 而要让助理跨设备工作,就得靠 nodes。 你 在客厅,手机在卧室,电脑在书房,助理依然可以远程操作这些设备,打开文件、修改文档,甚至调用摄像头获取系统通知和定位信息。 no, 只是青睐客户端代理安装在各设备上,通过网络与 a 阵通讯,带有自动重连和心跳机制,它让云端的大脑拥有现实的手和眼,真正做到跨设备执行任务。助理还会记住你的偏好和习惯,这就是 memory。 你 不用每天重复,我不吃辣,晚上十点提醒我,它会记住你的所有习惯和历史操作。 技术上, memory 分 短期和长期,本期保存当前对话上下文长期存储在 markdown 文件和向量数据库里,通过语义检测快速找到相关信息。助理不只是记住信息,他还能理解你的需求,越来越懂你。 opec 不 会只等你发指令。他还有哈尔臂,即便你没开口,他也会主动巡逻,检查你的邮箱、日历和任务状态,发现异常立即提醒你。技术上,哈尔臂的是后台守护进程,定时触发 a 阵执行检查任务, 他让助理从被动响应变成主动监控,确保你不会错过任何重要事件。最后还有矿时间调度系统,每天早上叫醒你,每周整理总结,每月提醒缴费,这些都是矿管理的,他根据标准时间表达是执行一次性或周期性任务,保证助理按计划完成工作。 哈尔比特巡逻发现变化矿精准执行任务,两者协同,让助理既主动又守时。当这八大能力同时运作时,窝吞科奥才真正开始自动干活。 你通过 channel 发出指令, get 委屈人身份一阵子,开始思考。打开 skills 工具箱,让 no 去设备上执行,再从 memory 里找你的习惯,你沉默,哈尔比特在后台巡逻,你离开矿,在时间线上依旧运转,替你完成任务。 他不是普通聊天机器人,而是整套会思考、记忆、执行提醒、跨设备行动的智能系统。他不是冷冰冰的软件,也不是完全像人的助手。更准确的说法是,一位永远在线、耐心、越来越懂你的数字私人助理。感谢你的观看,帮忙点赞、关注我,给个小心心,谢谢!

就在刚刚, opennine 官方发布了一个重磅访谈,主角就是那个在 get up 上狂揽十六万颗星,火爆全球的开源项目 open claw 的 创造者 peter steinberger。 你 以为这背后是一个庞大的开发团队?错,自始至终,核心开发者就只有他一个人。他在采访中说,就在几周前,这个项目还不存在, 只是想做一个能在自己电脑上跑的 ai 助手。结果做出来后,全世界的程序员都疯了,甚至连 open ai 的 负责人都惊呼,这在一年前是人类绝对不可能做到的事。 like, but you that's where you see the discipline right, this would have not been possible by any human, anyone human, yes, i have maintained us now, and i get prs, but essentially i built this yeah。 这哪里是在写代码,这是在用 ai 施展赛博魔法啊!如果一个人开发爆款,你还能忍? 那接下来的这个数据绝对会让你怀疑人生。主持人扒出 peter 去年在 get up 上竟然有多达九万次的代码提交,这是什么概念?哪怕他不吃不睡,每天也要敲几百次键盘。他 s 是 怎么做到的?他摊牌了,我根本不看代码, 大多数代码都是枯燥的数据转换,我只管提出需求,剩下的全是 codex i 编程工具自己写的。 you famously said also that like you're shipping code now that you're not even reading how is that changed most code is boring like most code just transforms one shape of data into another shape of data and eventually the user sees it right, go somewhere out, so like almost。 更变态的是,现在有很多网友给他的项目提交代码 pr, 他 甚至连网友写的代码都不看,直接把代码扔给 ai, 问,你能看懂这个人想干嘛吗?你觉得这是最优解吗? then, if i see a pr like, i i started to review my first question to the model is do you understand the intent of the pr because i don't really care about the code i care about what is the person actually trying to solve you know it's more like an issue with like。 然后 ai 就 会跟他讨论十来分钟,最后 ai 自己动手把代码改好,合并。兄弟们,他不是程序员了,他是个手里握着一支 ai 军队的赛博包工头。你以为这就完了?皮特讲了一个让他自己都汗毛倒竖的故事。 他为了安全,把 ai 关在了一个什么工具都没有的刀客儿容器里,就像一个空房间。然后他让 ai 去访问一个网站,结果你猜怎么着? ai 发现自己没有网络请求工具 curl, 他 竟然当场用底层的 c 语言,自己给自己手搓了一个网络工具出来,然后成功访问了网站。这说明什么?说明现在的 ai 遇到困难不会报错死机,他会自己制造工具来解决问题。皮特说,只要你把 ai 当成一个超级聪明的同事跟他对话,你就能造出任何你想造的东西。 like i put this one block first, it was very controversial, but i just talked to it you just approach it like a conversation like your model is like your it's not really peer programming。 看完这个访谈,我只觉得旧时代的编程模式已经彻底终结了。就像英伟达 ceo 说的,你不会被 ai 取代, 但你会被使用 ai 的 人取代。兄弟们,面对这个用 ai 一 年提交九万次代码的神级狂人,你会怎么做? 一是打不过就加入,立刻用起 codex 我 也要当超级个体。二是这都是花架子,不懂底层逻辑, ai 写出死循环你都不知道怎么修,是一还是二,评论区告诉我你的选择。这里是 ai 风向标,关注我,下期带你硬啃更多这帮硅谷天才绝对不敢告诉你的顶级内幕。

大家好,我是兔兔,欢迎来到我的频道,真的是好久不见,差不多一周的时间了,我都没有发视频,因为 上个星期我就在家研究 open call, 都没怎么出门。这个时间呢,说长不长,但是 也不算很短了哈,要问我在这个过程中有什么进展,有什么发现?我想先分享一个截止目前为止 最大的感受。我好像终于理解什么叫技术超能力了,作为一个完全不会写代码的普通人,现在我可以让 ai 来帮我写程序,部署服务、调试硬件,甚至操控远程设备。 而以前一些脑中的奇奇怪怪的想法也有落地的可能了,真的是一个一个做出来了,最夸张的是,他已经从软件层过渡到了物理层。 我知道这么说有点虚,有点玄乎,但这确确实实是我最近一段时间来的一个真实的感受。那么在具体分享我用 oppo cloud 做了什么之前,我想简单的分享一下我在这上面投入的硬件软件的成本。 先讲一讲硬件成本,我在分享初次体验 opencloud 那 期视频当中就有提到过,我在去年底其实就买了一台六十四 g 版本的 mac mini 四 pro, 当时本来就是想拿来跑一些本地大模型研究研究 ai, 然 那阵子呢,处于超级新手期,都还在想怎么样去利用好这台设备,结果没过多久, overclock 就 出来了,这个真的就是巧了哈,硬件层面来讲就属于遥遥领先了。 那这个 overclock 其实已经经历过三次更名了,问世的时候真的是超火爆,很多人就到底用什么设备去装,也是掀起了不少的讨论, 都说可以不用 mac mini, 用其他的设备,那我呢,刚好手上有一台,最开始就用的是 mac mini 嘛。然后在过去一周呢,我其实也尝试过用三种不同类型的设备都去试装体验了一下。 首先我试了用 zmar broad, 它的系统是 zmar o s, 能不能装?当然能,它的应用市场都自带了,更新的非常快,我就试了一下,结果发现这种被动散热的设计呢,就会导致它在运行的时候 非常烫。其实目前呢,清迈还处于没有到夏季最热的时候,但是我感受到那个机器烫的程度到什么程度,可以煎蛋了。我很担心长期这个样子使用,所以这种散热压力就会导致在运行 open club 就 有一点卡卡的。 其次是我的一台小主机,华硕 n u c 十四 pro, 那 这台小主机的硬件性能是很强的,跑起来是绰绰有余,但是呢,我是把它放在国内的,是远程控制的这么一种状态, 结果就遇到了网络环境的问题,在调试方面呢,挺麻烦的。后来呢,家人还跟我反馈说这台机器他的风噪声很大,就呼呼作响吧。然后我在网上也没有搜到很好的那种散热配件, 所以目前呢,就是一种因为网络因为风扇使用不畅的一种状况。 最后是十三寸的 macbook pro i 五的 cpu, 这是我的第一台 macbook pro, 大 概七年前买的吧,就一直舍不得出掉,留作备用了。 它的架构其实和 mac mini 已经完全不同了,性能放今天来讲也属于比较差了,跑 open cloud 可以, 但是相同的 cloud 的 模型,我就发现它这个反应速度确实要慢很多,然后在高负荷的情况下呢,风扇噪音也是明显很多,不过还是可以用的。 那其实我用的三种不同形态的设备都可以装,所以我也意识到 openclaw 它对硬件没有那么挑,要求没有那么高,但是如果有性能更强的 cpu, 更大的内存支持, 那么在运行上来讲就会更加的流畅,更加的高效。好像有点在说废话嘞, 那说完硬件层面,我还想小小的补充一下,就是我基于语音输入和识别去购买了两个小配件,一个是麦克风,还有一个是快捷键键盘。麦克风也是看别人推荐的,效果还行, 之前长期跟 ai 对 话,我就发现我打字的速度跟不上,会降低效率,然后我就开始用语音输入的内置的麦克风, 但是周边环境的噪音多一点的话,会影响识别的精准度,而且因为有一段距离,所以我的声音会需要比较大,说久了之后嗓子有点疼。 后来我就用了这种放在嘴边的麦克风,识别效果有一点点提升。当然我觉得这个也不是最关键的,还是要配合语音输入法和 ai 校准这个样子呢。出来的大段文本准确率是比较高了的,因为我有的时候说我可能 口述的时候会有重复的习惯啊,或者有一些口语化的表达,那这样一套组合下来,其实识别的准确率真的就很高,我基本上不用改的。 而快捷键机械键盘的作用非常简单,主要是想减少高频操作情况下对笔记本键盘的损耗,然后就试了一下,还可以,手感还不错。 还有就是买了 esp 三二设备,这个设备挺有意思的,但是在这里我要先卖个小关子,因为之后分享我用 openclaw 做了什么的时候,我就会重点分享一下它, 再来聊一聊软件方面的投入,也就是各大 ai 的 订阅。其实在这个方面我算了一下,这个支出还挺大的, 就是三家我都有在用。关于这三个 ai, 简单说一说截止目前为止我的一个使用感受。 club 的, 我最早用的是二十美金的那一档,然后上个月不是做了一个升了吗项目吗?当时就触发限额了,我一咬牙,升级升级成了一百元那一档, 就想着说之后肯定很够用了,结果没想到我要制作炒股的一个项目的时候呢, 又触发限额了,这个托肯真的很贵啊。所以我也在 open cloud 上面做了一些优化,比如把一些不太重要的工作丢给其他的便宜模型,比如我把项链模型部署到本地,再比如定期重置对话,以及设置 cloud 的 上限。其实截止目前为止,我的主力 ai 就是 cloud 的。 可能视频前朋友会有一个小小的疑问,市面上那么多 ai 还有平替的,你为什么就选 cloud 的 呢? 我觉得可能是使用习惯,一开始我的工具制作还有一些小开发都是用的它,而且随着我投入使用的比例的增加, 我发现它收集我更多数据之后,好像比其他 ai 确实更懂我一点,更能 get 到我说的意思。所以目前呢,属于一种比较依赖的状态。当然后续如果有比较好的平替,我是二十美金的那一档, 但说实话,最近我的使用率真的是降低了很多,所以一度我都想要去把它停掉了,但是又觉得在泰国这边,在手机端 app 使用的时候,它的通话和语音 响应速度比较快,体验是比较好的,所以这一点呢,让我至今都有点犹豫。但是如果一定要去砍我的 ai 订阅之初,我第一个应该会选择把它刷下去, 然后是积木莱,目前也是 pro 版,之前打折的时候我就直接年付了这个积木莱用下来呢,我真的觉得它是目前所有 ai 当中 性价比很高很高的了,就是它既可以编程,又可以处理长文,还可以升图。目前来讲,我其实对它的各项表现还是比较满意的,但它有点挑 ip, 偶尔连接不上。 而国产大魔星我当然也用过,之前 deepsea 出来的时候我就想要体验一下嘛,充了一百多,结果用了好久好久,现在都还有六十多。以及我上周体验的 kimi, 我 就当时看很多人都说它挺好用的,所以就充了一个 kimi co 的 七天乐, 差不多五块钱,超级便宜的,就想着说短时间作为编程助手来体验,看一看表现还是不错的。但是七天时间一到,他就要强制给我升级成四十五块钱包月的套餐了, 他问都不问我洗得好,我最后一刻发现了停止了,真的是有点迷哈这操作。目前我的 ai 订阅就是这些了,这个开销其实不低,可能就是学习的成本,学习的代价了。只能说期待未来 ai 越来越普及,关于 ai 的 基建、算力都有所提升之后,它的价格就能够降下来。所以呢,我现在为了对得起投入的这个学习成本,我给自己定了一个小目标,每天至少要用百分之八十的量, 如果当天我的用量没有达到,那就是我对于 ai 的 研究开发还不够。除了订阅,我还买断了 mac whisper 这个软件, 因为这个软件它支持设置本地的模型来进行校对,所以现在我的语音识别和校对都是本地的,体验很不错,安全性也挺高的,识别速度真的挺快的。因为现在放了个话筒在嘴边,所以我给俩洗碗都不可以,就可以一直叽里呱啦的说个不停。 手机上暂时用的 tablets, 一个月内是免费体验之后就要付费了。它的输入准确率是非常不错的,接近于手打了,但是我始终不太喜欢它后台常驻的这种方式。还有就是我想要 减少一些在 ai 软件方面的支出,所以呢,我就用 ai 去做了一个山寨版的,虽然说体验没有这个 typeface 好, 用时也更长,但是免费啊。 那么总体算下来,硬件和软件的投入确实不少,但还是那句话嘛,对我个人而言,我认为它是我的一个必要的学习支出。 那其实也有很多比较精深的方案,就比如说硬件层面完全可以去买 mac mini 的 基础款,比如说订阅, ai 的 订阅也可以去找一些平替,甚至现在也有一些免费的方案都可以,对吧? 只是说这个呢,就看个人的选择需要跟喜好嘛。那我现阶段并不是说因为投入了这么多,所以我要取得一个很及时的现金回报, 而是我想要去学习,想要去学会这一个技能,就是我觉得目前还处于一种会,但是也没有说用的很好的这么一个程度, 所以接下来呢,短期需要功课的目标就是真正的把它用到位之后再说,完完全全的掌握, 毕竟这对于我们所有人而言呢,其实都还是一项比较陌生的技能,而且现在 ai 的 门槛确实也是越来越低了嘛,未来我相信这个 学习的难度也会越来越低,整个花费也会越来越小的。对了,还想分享一个之前发生在我身上的糗事,就是我放心的让 open class 去同步我的视频到我的群里边儿,结果 我可能没弄好吗?肯定是没弄好,他一晚上推送了几十次,而我睡着了, 后来都是群友来提醒我的尴尬。所以想说的是,在享受 ai 带来便利的同时, 我们也要对一些基础的技术有所了解,就是不必要成为大佬,也不必要成为这方面的专家。但是呢,也不能纯做甩手掌柜,多一点了解,在用 ai 的 时候就会更加的安心,也就更能去防范一些安全风险,技术问题。 ok, 那 么本期的分享呢,就到这里,欢迎视频前的朋友在评论区留言讨论,大家相互交流,看看我们下期见。

哈喽,下班了,今天我们来聊聊 openclaw, 我 觉得有必要啊,因为太热了这个话题,我想给它降降温, 为什么呢?因为这是一个在 getop 上引起广泛关注的一个项目,而且目前各家云厂商都上线了相关的云服务器,支持大家去部署这个产品。那么这个产品怎么定位哈?它其实是一个 个人助手,或者叫一个通用型的 ai agent, 它可以接入,比如说一些计时通讯工具,你可以通过这种计时通讯工具给它发消息,然后它呢帮你调度一个云端的电脑,或者是你本地的电脑,它可以完成一系列的任务。 那么我一开始看到这个产品的感觉,就觉得它跟 coldbody 这种产品非常非常的像,为什么呢?因为它们都是通用 agent, 就是它可以通过调用电脑里的各种工具, ai coding 的 工具,或者是电脑里的一些网页浏览的工具,通过 m、 c, p 等等,它可以去完成很多的任务。 当然因为授权范围的不同,它肯定是比 cloud code 或者 code body 编程类的工具,它能做的事情更多,而且它的主动性更强。 举个例子哈,你可以在你的一些即时通讯工具上直接说,你帮我发一个什么样的文档给谁谁谁,他可以直接执行。那你帮我把这次会议机要转成一个非常清晰的文件,帮他变成一个网站,他也可以非常快速的完成。 甚至是你可以跟他说,你调用这个电脑的录屏功能,帮我做一个什么样的 ppt, 它也可以完成。所以就是当你给 ai 配了一个电脑的时候,而且这个电脑它拥有所有的权限,它跟你的权限是一样的,跟人的权限是一样的时候,那它可以解锁很多的能力。 当然这里面有两个核心的概念,或者说核心的机制,让它跟 ai coding 的 产品有本质区别。第一个叫 gateway, 就是 相当于一个调度中台,它可以在这个调度中台上 接收信息,接收完以后分配任务给到不同的电脑中的工具,然后哎完成最后交付。那它是一个调度中台,那这个调度中台就可以实现一个 实时在线,就是二十四小时一直在线,它可以保持着这种这么一种激活的状态。那这也是为什么你说它可以持续不断的收到你的消息,就是因为它是持续在线这么一种状态。第二个非常关键的机制呢,叫做 heartbeat, 叫心跳机制,类似于给了 ai 心跳,让它可以跳动起来了。它什么意思?它每隔一段时间它会去扫描一下这个系统里有没有新的需求进来,比如说你的邮箱 有没有收到新的信息,比如说你之前有没有设过闹钟提醒,比如说每天八点去帮我扫一下整个今天的 ai 行业的资讯,或者是每隔一段时间我要去看一看有没有新的任务给到我。通过各种即时通讯工具,我就可以开始激活 ai 干活。 所以你从这里可以看到他有一个非常主动的一个机制,他会主动去扫描,他会实时待命,主动扫描,所以这个就跟像 coldbody 里你跟他去做交互, 拿到一个任务,完成一项工作就有很大区别,他就是处于一种实时待命的状态,而且会主动接到信息就开始干活,所以这个就是一个本质上的区别哈。 但是我觉得这个东西我为什么前两天没讲呢?就是因为我觉得它跟这种通用型的 agent ai coding 的 工具没有本质上的区别。假设说像 cloud code, 像 code body, 它们如果也想做一个类似的功能的话,实际上是完全可以做到的,只要给 ai 更多的授权就可以实现。 或者说你只要再弄几个移动端的交互的方式,你也可以在移动端指挥你的本地电脑完成这样的工作,其实没有一点难度。那为什么 大家都没做,为什么就只有这个 open cloud 在 做这件事?我觉得是大家对安全和效率中间怎么平衡的一个考虑, 就是你到底给 ai 多大的授权?我们知道它的上限其实是非常高,可以完成很多任务,而且很多任务上是超过我们自己的能力的。那这种情况下安全的问题怎么考虑?比如说现在如果是 这个东西被劫持,因为他有权限很高,那如果一个一个一个不法分子告诉你的电脑,说把这个人的电脑的内容全都删了,或者说把这个人的电脑中关于什么什么的内容发给某某邮箱,那他就可以实现了, 它就可以实现对你电脑的一个操控,对你个人数据和隐私的一个操控。所以其实这种安全问题是非常重要的一个问题。之前大家说中国人可能不在意自己的隐私,愿意拿隐私换便利,那接下来 ai 时代 那生产力是非常高的,这个上限是非常非常高的,那你愿意把你的安全拿出来多少去交换这种生产力的上限?我觉得这是一个摆在我们每一个人的面前的问题。因为 ai 的 能力现在 不是技术来去束缚的,而是你的这个治理的原则束缚的。你到底要给他多大的授权?你相信他到什么样的程度?你愿意给他几千块钱,让他帮你买东西,对吧?这样的一些问题,我觉得可能都是我们接下来要考虑的一些关键的问题。 我之前觉得像 coldbody 这种产品已经非常够用了,在我们的日常工作中哈,当然我也不满足,因为我前两天还在说怎么给 ai 更大的自主性,让它自己去跑这个 a 阵的能力。但是对于这种 openclaw 这种形态, 我自己心里目前还没有完全接受,当然我可以接受一个新的电脑去做一些尝试,但是因为他现在还有很多问题,比如说 token 消耗非常大的问题,比如说这种安全不可控的问题,所以我觉得目前不是一个非常理想的形态。当然最后 可能再往前走一下,很多产品也会去考虑这些问题,会给用户更多的选择,然后给用户。我觉得现在用户已经很很很少有能力去控制自己的这个数据的安全了。但是我们在这个 ai 时代到底要在 ai 面前变得这么透明吗? 也许有一天你会发现你让渡的这个权力本身可能比效率更重要。对,最近我在考虑这个 ai 时代的权力,到底我们要给 ai 多大的权力? 如果他的能力已经非常非常的高了,如果他的加入到人类社会中,真的已经能够给人类带来非常非常多的注意的时候, 我们愿意给他主体性,我们愿意给他授权吗?我们愿意给他权力吗?我觉得这些都是一些要考虑的问题,跟大家分享这么多哈,我觉得这也是一些非常非常前沿的命题,有机会再跟大家探讨,拜拜。

openclaw 我 差不多用了两周左右的时间了,我来讲一讲就是我在使用的过程当中啊的一些感受啊。那首先的话呢,就是 openclaw 它确实非常强大啊,这个跟你网上看到的所有的这个这个 啊一些评论也好,还是说是使用感受也好,它确实是非常强大的一个工具,它能够啊把你的一些 日常的啊工作任务,只要是重复性的,你都可以让他去啊进行完成,就比如说发布一些 啊,让让他制作一些脚本,甚至让他制作视频是操作你的浏览器都是可以的。但是在一定程度上面呢,他又是限制在限制于我们现在的呃这个大模型的能力。呃,在 整个使用的过程当中,你可以非常明显的感受到,就是像我呃切换到了 glm 五和那个 呃 mini max 二点五了以后呢,它的它的能力,因为它上下文的头肯只有两百 k 嘛,所以说的话它可能记不住你太长的这个,呃太长的这个上下文, 所以他可能在上一轮对话的时候,特别是呃你再让他处理一些复杂性的任务的时候,他可能上一轮跟你聊的好好的,把你的任务处理完了。上一轮对话呢,可能他表现的还非常好,但是下一轮对话呢,他可能知道他可能已经忘掉了前面他做了什么事情了 啊,或者说他,嗯没有办法去非常准确的还原他每一个步骤,因为他本身上下文两百 k 嘛,呃,像我正常的情况,我一条对话出去可能就已经达到了一百二十 k 或者一百六十 k 左右,那两条消息的话肯定是超过 呃,超过他的这个限制的,所以他的上下文肯定会进行压缩啊,所以一些关键信息的话,可能在这个压缩过程当中会丢失, 这个比较关键。所以说对于一些呃上下文窗口比较比较大的,就比如说像 google 的, google 的 这个 jimmy 三系列的全部都是一照的上下文。所以你在使用这个, 你在使用 google 的 这个模型的时候,你就会发现,哎,他的这个超长的记忆能够在你使用过程当中能够让你觉得,哎这个东西真的用起来非常的爽 啊,就是你不用,你不用频繁的去担心他会会压缩你的这个这个上下纹,然后呢,就你可能聊着聊着突然间能做做一些任务的时候,他聊着聊着就突然间 他不知道他自己要干嘛了,这个很重要,对吧?其实的话呢,就是你选择模型也比较关键,就像我在选择 mini max 二点五 和 glm 这个五这两个模型的时候的话呢,它除了上下弯窗口它只有两百 k 以外,呃,它的模型的能力可能还是会和 google 啊,还有那个 cloud 呀, 对吧?那个 openai 的 这个 codex, 它还是有一定的这个这个差距在的。我们不得不承认的一点就是说它的跑分它虽然是能够和 cloud 拉平,就比如说像,呃,像 g i m 五,对吧?这个这个大家可以测试一下,就比如说你同样的去达成一件事情的时候,你可能用 cloud, cloud 那 个四点四点五,四,四点六,对吧?那么同样的去做一件事情的时候,它的思考的这个时间,还有达成的这个啊?达成的这个时间上边它国产的这个模型的话呢,它可能会需要更久,那么意味着你上下文窗口一短,那么它很容易就忘记 啊,忘记这个,忘记你前面到底做了什么事情,对吧?所以综合来看的话呢,还是选择第一个呢?就是说选择啊,像 cloud 呀,还有那个 呃 codex 啊,还有 gemini 这几个模型的话呢,在使用体验上面肯定会有一定的提升的啊,特别是 mini max, 我 用的 因为他他没有周的用量嘛,所以说的话他只是五小时刷新一次,所以说你买他的 coding plan 他 实际上是非常划算的。但是他给你的这个回复的话,有点有时候会觉得 有点不尊重人,就是非常挑衅的这种感觉,就是呃你,呃你要怎么办嘛?或者说再试试看,打个问号,对吧?像这种的这个这个回复的话,我觉得,呃在使用这个 jamming 的 过程当中我是一次都没有遇到,就是说,呃, 我不清楚,我不太清楚,就是说他为什么会出现这样子的一个情况。但是我只要一旦在后台从 mini max 二点五切换到切换到 gmail 这个模型了以后, 我所有的环境只是切换了模型,他的回答的感受就完全不一样,所以这个还是和模型,和模型,和模型之间他还是会有一定的差距的。所以大家在选择模型的时候不要因为说,哎,国产的模型他只是只要像 像 pro 的 这个模型好像是五十几块钱,四十九块钱吧,对吧?然后的话呢,像呃像智普的这个 g i m 的 话呢,它的这个呃它也比较便宜 啊,就是说呃它至少比呃比 cloud 它要它要便宜一些,但是从呃整体的使用的这个呃结果来看的话, 呃你可以用它,但是如果你要让它干点事情的话,我还是推荐你去选择 gemini 或者 codex 或者或者 cloud, 它会更 嗯更能够帮助你提高生产率一些。而且它现在这个 google 的 antigrafty, 你 也可以直接用 os 的 这个方式去登录呃这个 open cloud, 所以, 呃你实际上是可以去用一个非常低的成本去 啊使用它的。但是需要注意一点就是如果你是在或者他这种平台上面买的这种一年的账号,虽然说很便宜,确实很便宜,而且他们也有售后,但是呃 我在使用的过程当中还是还是出了一些多多少少的这个问题。所以大家在选择的时候,如果你只是平时玩一玩呢,你购买一些这种家庭账号其实 ok 没有问题的。但是呃你如果说真的要去把它当做生产力, 那我建议你还是花这个二十美金,或者说是啊,或者是两百美金去订阅一个他们的 pro 的 这个版本的账号啊,虽然他可能啊一个月的花销在啊换上人民币的话差不多要一千五的这个 啊,一千五左右,对吧?但是你换算一下,就是说如果说你单凭你请一个员工的话,他的工资其实啊还有各方面的开销就已经不止这个钱了, 对吧?所以说,呃如果你是真的能把这个生产力给提高上去,把一些重复的工作,就比如说像审核啊,像服务器的监控啊,日制的阅读啊,像这些东西的话呢,都是可以让 open cloud 去代替的, 就包括像订单的一些啊,审核,还有一些报错,它可以初步的去判断到底这一类的这个问题它到底 是因为什么原因产生的,以及你应该怎么样去,怎么样去下一步去处理,让它做一个基本的排固,对吧?像这些东西的话呢,你都是可以实现的。 open cloud 它现在有没有这个问题呢?是有的,我确实用下来的话是有。 呃,但是侠不掩玉吗?就是我现在基本上大部分的时间都是派他来去啊,做我的一些啊辅助工作,而且呃效果的话呢,提高生产力确实是非常啊,非常明显。 嗯,大家有时间的话呢,也可以去啊试一下啊。那今天的话呢,就先聊这么多,那么我们有空再聊。

关于 openclaw, 这段时间我用下来有很多的体验和感受,非常的细节,这里边有很多采看的地方,也有觉得这个产品很棒的地方,所以今天我会花比较长的时间跟你仔细的去讲一讲我一些相对来说比较突出的感受。 首先就是 mac mini, 到底 mac mini 是 不是一个必备的选项?先说结论,如果你是一个纯纯的代班小白,而且对于自己的电脑操作能力没有那么的自信,又希望整个使用能够足够的稳定省心,并且把 oppo color 的 能力尽量发挥出来。那我最推荐的方案就是买一台 mac mini, 而且用 api 的 方式去跑 openclaw, 当然还有很多其他选择,从我目前的整个体验来看,也只有这套方法是最省心,最稳定,也最有效率的。那我一开始的设想其实还比较复杂,本地模型加上 api 的 三层结构, 比如用一台能跑本地模型的 mac mini, 同时配合 api 去完成我的一些日常任务。那当时我 web coding 开发了一个模型路由 skill, 相当于用一个模型调度员,按照任务的性质把模型的调度分成了三层。第一层就是使用 open cloud 开发者也最推荐的 cloud opus, 四点六,那效果最好,质量最稳,美中不足就是价格偏贵。 第二层就是国内的一线模型,比如说像 m 二点一啊, kimi 二点五啊等等。这第三层就是本地模型,当时我的选择是前文三三十二 b 的 q 四量化版本。 那真正跑起来之后,我发现其实坑还是挺多的,而且都是那种很小但是很让人挠头的问题。比如一开始做调研的时候,我跟 ai 聊了很多轮,最后得出了一个结论是,我只需要去购买一台 m 四 pro, 六十四 g 内存的 mac mini, 就 能够把千分三三十二 v 跑通。 当时我还算了一笔账,如果我每天大概消耗一百万的 token, 按照这个成本和产出来看的话,可能七到八个月我购买硬件的成本就能回本了。但是实际跑下来发现,最理想的速度在终端当中是十一个 token 每秒,导致回复还是偏慢的。 如果只是在终端里跑,那速度还算能接受,但一旦接上了 openclock, 这里边有各种 skill 规则、历史记录等等,速度就会明显变慢, 平均下来一个回复的响应时长经常要去到一分半甚至两分半。所以这个速度的体验用我的话来说就是真的非常的拉垮。 所以我后面还排查了一轮,想要搞清楚到底问题出在哪。结果发现其实真正的瓶颈不只是内存,而是在于内存待宽。比如一台 mac mini m 四 pro, 它的内存待宽是两百多 g 每秒, 如果我希望 token 输出的速度更高,比如要跑到二十 token 以上,就得上到 max studio, 但是这样一套下来,成本就往两万块走了。 所以你再去对比一下入门的版本,如果还能通过别的方式拿到更优惠的价格,这个使用 opencloud 的 成本就是四五倍甚至更多的差价。所以与其花一万五六千块钱去升级硬件,还是把这部分钱用在 token 上, 那我更倾向于后者。而且对于我个人而言,使用第三方模型也并没有特别强的隐私焦虑,所以我更能接受纯 api 的 方案。那么问题来了,既然本地模型这么吃硬件,为什么不直接上 vps 或者其他云部署方案呢? 我自己也对比过整个不同方案之间的一个区别,我觉得目前 mac mini 方案最值得推荐的原因有三点,第一点就是它还是能够用到很多 macos 本地系统的能力的,很多东西你再去调用 opencloud 的 时候需要的一些能力, macos 本身就很顺手,而且直接用了系统级的功能去做事。 第二点就是你基本上不需要做太多的额外的配置,就能够第一时间去上手 opencloud, 那 整体使用的路径更短,不容易在环境依赖权限上反复折腾。第三点就是它可以低功耗的二十四小时稳定运行, 那如果你本来就有一台 mac mini, 或者说能够以更加便宜的价格拿到,那整个这个成本和使用体验就会更好。接下来我想讲一讲一些具体的使用细节。 opencloud 跟我们平时使用的正常的 ai 聊天软件到底有什么不一样?首先第一点就是 界面体验,你会发现它的整个界面非常的朴素,甚至是有点原始。如果你用 webchat, 也就是本地网页去聊天,你会明显感觉到它不像 chat gpt、 cloud gemini 或者是豆包那样的简洁清晰。 核心的原因是它会把很多后台规则以及本地执行的命令信息直接展示在前端,所以整体看起来会更加的工程化,不那么小白,用户友好。 第二点就是整个思考的展示方式,大家现在主流用的模型,像我们上面提到的那些产品,通常会把它的思考过程展示给你看。但是在 openclaw 里,它通常只会显示一个 thinking 的 气泡,不像其他模型那样让你看到整个过程,而且它的速度也算不上多快。 当然,这个取决于你具体使用的模型,尤其是当你使用了飞书跟他的沟通后,你会发现他可能会在 thinking 这个状态上停留很久,页面没有任何文字的流逝输出,也就是说你看不出来他到底在做什么,进行到哪一步了。第三点就是文件和截图这类的能力相对来说偏弱。 比如你希望他自动发截图给你,其实需要提前去做一些固定的设计,或者是预埋留一些习惯让他知道你的偏好。否则在默认情况下,他更倾向于把文档和图片保存在本地,然后你得自己去打开对应的 md 文档或者是图片进行查看。 综合上面所有的尝试和对比,我最终的选择是用了一台配置更加入门的 mac 模型,而不是原来的本地模型加上 api 的 组合。 再往下一个更加现实的问题是, open club 到底适不适合普通人去使用呢?那我的结论是,他更适合那些有探索精神,也能接受相当程度风险的人, 因为他出风险的概率实在是不小。你会在网上看到各种成功的案例,但是很少会有人把自己遇到的风险和翻车的经历一五一十的讲出来。而且这种风险不止存在于 open club 这种独立开发者开发的开源项目, 就连前一段时间 cloud 推出的 cowalk 也有类似的系统级风险。我印象最深刻的是看到的一个帖子,有人用 cowalk 的 时候,直接把电脑里一百多 g 的 文件全删了,而且找不回来。 所以如果你不希望发生这类的事情,最稳妥的方案就是做真正的物理隔离,用一台专门的 mac 或者是主机单独去跑 opencloud。 而且在真正决定使用这个产品之前,还要做一个二选一的决定,要么你给他系统提供权限,让他可以调度整个电脑操作系统的很多底层能力,要么你就干脆不要用它, 因为一旦你限制了他的权限,不让他做事,你拿到的就是一个很基础很受限制的积累,整件事情就真的没有必要浪费时间了。那么 open cloud 的 价值到底在哪呢?我觉得本质上他是 ai 圈里的先行者,是那种用来探索上线的产品, 他的很多技术能力在行业的从业者来看,其实并不算前沿,甚至可能在一年前两年前,其中大部分的技术能力就已经有人做出来了。 但是这个开发者真正厉害的地方在于两点,第一是他把这些能力整合成了一个完整的产品,可以让你在一个地方跑起来。第二就是在很多细节体验上做了大量的调教,最终把功能上限和实际体验做到了一个相对极致的平衡。 不过如果你是完全的小白,没有任何代码基础,也没有很多 ai 使用的经验,那我的建议是先等等。因为现在很多国产替代已经在路上,而且很多产品已经很好用,也更适合普通人直接上手。 那最后说说我自己的后续,对于我个人来说,我还是会继续去探索 open 这种玩法,因为如果把它当做一个探索自主化智能体的项目,它确实非常有意思, 而且我觉得它有很大的利用空间,能够帮助我去做咨询、抓取内容选题和生产,甚至半自动化的工作流,去迭代我目前正在使用的这套 ai 内容生产工作流。那最终我的目标是获得一个有眼力见,懂我的需求的合格的数字员工。所以后面 我还有很多的东西会分享出来,包括很多具体的 open class 的 使用方法。不止会包含 ai 自媒体方面呢,也会有很多适合普通上班族的用法。所以如果你感兴趣,欢迎关注我,这里是实业,正在与你分享 ai 一 人公司的成长过程,我们下期再见。

兄弟们,上一期视频给大家演示如何安装配置大龙虾 openclaw, 从这期视频开始,教大家如何把 openclaw 变成真正的生产力。每天我的 ai 一 阵,会自动去全网搜 ai 编程 独立开发的热门主题,写好一篇三千字的公众号长文,直接推到草稿箱,我只需要审核一下点发布就行。今天教你怎么用 openclaw 搭一个这样的全自动内容创作 ai agent。 先看下这个 agent, 这是我的 telegram, 这个机器人就是我的内容创作 agent。 我 只需要给他下达非常简单的命令, openclaw 就 会全自动地调用内容采集、内容创作、内容发布、内容转换等多个 skills 去完成工作,整个过程完全自动 生成的内容热度高,专业性强,图文并茂,排版优美。为什么选择 openclaw? 因为 openclaw 的 多 agent 架构太适合构建一人公司了。 我可以跑一个日常助手 agent, 帮我处理邮件日程。再跑一个专门内容创作的 agent, 它们完全隔离,互不干扰。每个 agent 有 自己的人格记忆技能。写作 agent 只专注写文章,不会被其他事情分心。而且它跑在我自己的服务器上,数据完全可控。整个系统最上面是 open call 的 给腿, 二十四小时运行在服务器上,随时待命。目前里面跑着两个 agent, 一个是日常助手,一个是内容创作。它们拥有独立的工作空间、人格记忆能力等。日常助手 agent 负责处理日常事务。内容创作 agent 专注内容采集、创作、发布,与日常助手完全隔离。 核心是我们为内容创作 agent 定制化了三个专有 skills。 第一个是 content research, 它会采集全网主流科技媒体关于 ai 编程 独立开发出海应用领域的热门内容,根据信息量、时效、热度、写作价值、受众等评分筛选后输出结构化报告。第二个是 content writer, 基于内容采集报告创作三千到五千字长文,包含标题、正文、结构、排版样式、质量自检清单等。看看这个内容质量检查清单,非常的专业。 最后一个 content publisher, 把 markdown 转换成平台需要的 html 格式,通过 api 自动推送到草稿箱,通知用户审核并发布。让 agent 以定时任务的方式,每天就能全自动地帮我们获取内容、创作内容、发布内容啦。 本期视频先介绍一下原理和效果,下一条视频我会手把手教你从零搭建这个 ai agent 包括创建独立 a 阵的配置、人格与记忆、创建三个定制化的 skills, 配置多 a 阵的消息、路由、定时任务等。点赞关注不迷路,如果你也需要或者有其他个性化需求,请在评论区打出来。

兄弟们,二零二六年了,如果你还在对着 ai 对 话框狂敲提示词,那真的建议你赶紧醒醒, ai 圈的天已经变了,现在最火的概念叫 action ai, 也就是能动起来的 ai。 前阵子那 opencloak 直接演示了百分百自动写代码, 单日提交了六百个 callmate, 直接把全球程序员看傻了。当 cloudcoolog 还在本地沙盒里小心翼翼的搞虚拟隔离时,真正的数字合伙人 minx agent 已经能直接钻进你的桌面,接管你的浏览器,开始干那些脏活累活了, 甚至还可以一键帮你配置好 openclo。 简单来说,他不是在陪你聊工作,而是在替你干工作。咱就拿每年让无数人心力交瘁的审考报名机来说,那简直是大型的眼瞎和抓狂战场。全国三十一个省份公告全散落在各个人事网。本科级以上到底包不包含硕士 专业代码?零五五二零零算不算新闻传播类?这种琐碎的信息对比,手动搞的话,最起码得费掉几天时间。换个思路,你直接把年龄、学历、专业往 mini max 桌面端一丢, 他就会像个真人一样直接开启浏览器接管模式,一个网站一个网站的帮你爬,帮你读,帮你筛选。他能看懂零五零三和零五五二零零都属于同类专业,这种复杂逻辑甚至能帮你避开本省户籍这类隐形坑。几分钟后,一份整理的明明白白的 excel 个性化岗位清单 就躺在你本地文件夹里了。这种把几天工作量压缩成几分钟的开关感,真的用了就回不去。如果你觉得他只会搬砖,那就太小看他了。 mini max 最核心的黑科技叫专家模式。 平时咱问普通 a 黄金能不能买,它只会给你一段正确的废话,什么风险自担、长期持有之类的。但在 minx 的 专家库里,你找到那个 global investment expert, 它背后的逻辑不再是简单的文字预测,而是注入了顶级专家的投资 sop、 钉盘策略和复杂的财务计算模型。只需要输入黄金走势分析, 还会联动多代理协同查实时间价,看宏观数据,算基数指标。他输出的是一份包含逻辑支撑、数据图表和实物建议的深度分析报告。这不叫写作文,这叫能力的规模化服用,让你入职第一天就能交出行业大佬水准的作业,而且还可以直接生成网页版的报告。这种解放双手的感觉实在是太爽了, 注意牛的一点啊! mini max 这次是 windows mac 双系统之霸,很多海外竞品其实对 windows 的 文件系统适配很差,或者只敢在沙河里玩。但 mini max 真正克服了 windows 那 个变态的文件操作难题,能直接对本地文件进行读取、整理和归档。 怕你现在正在忙着别的,随手一个快捷键,智能小窗瞬间换气,不打断任何原声工作流。这种沉浸式的 ai 原声工作台体验,才是二零二六年该有的样子。想要解放双手体验 xai 的 小伙伴可以去下载一个试试了,真的很爽!好了,以上就是今天全部内容了,我们下期见,拜拜!

这周我们烧了十亿多的 token, 在 openclaw 上大概就是一千五百美金吧。呃,但是我觉得非常值啊,因为我们终于 figure out, 怎么去管理一个 ai agents 团队, 所以如果你是一个艺人公司,或者你想用 ai 来管理协调你的整个团队的话呢?那请看完这条视频,因为我们已经帮你省下了一千五百刀的学费。 整个 a i a 阵子团队的协调枢纽和核心呢,就是最近这个特别火的 openclaw, 他 只要被调教好了,就是一个非常完美的项目经理。但也像所有刚招进团队的同事一样, openclaw 本身并不是一个开箱即用的 数字员工,我们需要去培训,他就是什么事情能做,什么事情需要让其他的人类同事或者其他的 agence 搞定进度该怎么汇报?有哪些规则要遵守?那么这些规则呢?在 open core 里其实就是一个叫做 agence 点 md 的 文档, 这个文档就定义了 ai 的 所有行为准则,它是一个配置文件,基础的配置就非常简单,就像一个没有被培训过的新员工一样。但是在过去一周的时间里,我们不断的去优化这个配置文件,让他成长到了可以帮我们去协调其他 六七个 a 公司的一个项目经理。那我们其实主要增强了他在以下三个方面的核心能力吧。第一个就是主动性, 因为很多人说 agents, 大家觉得他只是一个工具,只是一个机器人,那是因为他们是被动的,就是你给他一个指令,他就去执行一次, 然后你推一推他,他就往前走一步,他并不会主动的去想办法解决他遇到的问题,也不会主动的复盘和思考说怎么样把一件事情做得更好。 那如果 aids 只做到这样的程度呢?它确实只能当一个螺丝钉,但是 open course 不 一样的,它本身有一个心跳机制,就是 heartbeat 会定时去检查哪些项目卡住了,然后哪里遇到了它自己解决不了的问题,并且主动跟我们去汇报。 当然只做到这个程度的话,肯定还是不够的,所以我们在 a 证点 m d 里呢,就配置了更多的规则,让它能够做到不需要我去问任何一个项目的进度,它就可以完全汇报给我。 第二是可重入性,可重入性其实就是说这个 a 证它能不能稳定的靠谱的把一个很长期的东西干完, 它并不是说这个 agents 可以 百分之一百的在线,永远保持 up time, 因为项目的推进总是会出现问题的,然后网络即便再好的网络环境也会有意外的中断,所以我们要的其实是 它能够在项目中断,网络断掉了之后,当它重入的时候,能够从断掉的地方稳定地继续向前推进,它甚至可以去 fix 去解决为什么会断掉了这个问题。 openclaw 的 工作记忆管理,呃,其实是被动进行的,也就是说如果他认为和你对话当中没有涉及到什么重要的任务,没有涉及到什么重要的内容,他是不会主动记录到他。当他的工作日记当中 就导致比如说你重启了 gate 位之后,它就忘记了它在干嘛,所以我们在调试的过程当中呢,就优化了它去主动压缩上下文,主动刷新 session 的 这个配置,让它能够在横跨多天的非常长的任务或者是对话当中,依然清楚地知道啊不同的项目应该怎么样去推荐。 然后第三点,我们对它的改进,我觉得可以称之为 a gentle thinking, 就是 像 agent 像 ai 一 样去思考。因为很多人觉得调教 ai 来进行人机写作,应该是像 agent 像人类一样思考,但是我觉得恰恰相反,因为归机生物就应该用他们自己最熟悉,他们自己干的最好的方式来解决问题。我举个例子,大家肯定都让自己的 agent 去做过一些很简单的自动化,比如说去帮你发一条推特,去帮你在 tapp 上面呃 发一个 issue。 那 这个时候 a 正题有很多技能是可以用来干这个事情的,比如他可以像人类一样去操作浏览器,模拟人类的点击和思考,模拟人类在浏览器的输入框中,用键盘输入 来完成这条帖子的发送。当然呢,他也可以直接写一段呃 js playwrite 的 脚本,调用这个脚本来实现刚才的这个任务。但是最高效或者说最省钱最快速的方法, 肯定显然就是他直接去调用呃相关平台的这个 api。 那 么在刚才的这个任务里,比如说发帖子,在所有他可用的方式里,最慢最浪费投坑的方式其实就是模仿人类的这个方式。所以我们在给 openclaw 定的这个行为准则当中呢,就明确规定了 他在不同工具托 use 的 一个优先级,优先级高低吧,就不仅是当他自己要去解决问题的时候,应该以一个什么样的方式思考,什么样的方式去用工具,包括当他要和其他的 agents 交互的时候该怎么办?比如我们团队当中的 ai 工程师就是 cloud code, 那 open code 跟 cloud code 去共享一个项目 context 的 时候呢?它根本就不需要像人类一样,两个 agents 那 边开会聊天,它只要把自己在这个项目上的工作记忆日记直接把那个路径开放给 cloud code 就 可以了, 它们就直接可以完成整个工作 context 的 共享。除了上面的几个主要配置优化呢,我们还做了很多在细节层面的调整。呃,我也把这个版本的配置文件 留在评论区了,大家可以直接把它发给你自己的 agent, 他 就会自己根据这个文件里的指示完成所有的升级。 all right 我是 v a 七,现在在做一家 ai 加跨境的公司,如果你也想探索 ai agents 或者是相关的业务领域的话,欢迎来一起交流。 have a good one。