ai 说我要挑天气接口,这句话到底是怎么发生的?今天是 ai agent 学习计划第三天,我们来深挖 to use 的 底层机制, function calling 完整流程。 今天有四个目标,搞清楚 function calling 的 完整两轮交互流程,掌握 to schema 的 正确写法,理解 arguments 是 自互串这个经典坑,以及学会错误回传机制,让 agent 失败也能优雅恢复。 先讲最核心的, function calling 是 两轮交互,第一轮把用户问题加上 tools 定义,一起传给大模型。大模型不执行代码,只返回一个工单,告诉你调哪个函数,传什么参数。 divide 是 下划线, reason 是 tool 下划线 cause。 第二轮你拿到这个公单,自己去执行函数,把结果以 raw to 的 身份追加到消息历史,再发给大模型,大模型才生成最终回答。记住,大模型只负责发指令,执行是开发者的事。 另外,大模型可以一次返回多个 to 下划线靠 sdk 会并发执行,提升效率。 来讲一个经典坑, arguments 是 自辅串,不是对象。大模型返回的 arguments 字段类型是 string, 长得像 j s o n, 但本质是一个自辅串。如果你直接用 arcs city, 拿到的是 undefined, 正确做法是先 j s o n parse, 然后再取值才能拿到北京。需要说明的是, versa a i s d k 的 to execute 方法已经自动帮你处理了这步,但如果你裸用 open a i s d k 这一步必须手动做。 再讲 to schema 怎么写, description 是 灵魂,大模型靠它决定。跳步条叼哪个 有四个原则,第一说清楚什么时候用,明确适用场景。第二,说清楚什么时候不用,排除容易混淆的情况。第三, 参数描述要带格式,比如写城市名,中文如北京,不要只写城市。第四,用自然语言描述,当成给聪明同事写说明书。 description 写得好,工具调用准确率直接翻倍。 最后讲错误处理,工具执行失败的时候不要直接 so error 让 agent 中断。正确做法是把错误信息以 raw to 的 形式返回给大模型,大模型收到错误后可以选择重试换方案,或者告知用户, agent 可以 继续运转。 原则就一条,永远不要让工具异常,直接冒泡。大模型是最好的错误恢复策略。 今天的感悟, to use 这层看着简单,细节贼多,每一条都是真实踩坑总结出来的。从今天起我算真懂工具调用了三条核心,两文交互缺一不可。 arguments 必须 j s n n plus, 错误要回传,大模型不要直接崩溃。 versa a i s d k。 帮你封装了大部分细节,但底层必须懂才能排查问题。 今天打卡第三天,进度百分之十五。明天第四天, plan and 和 multi agent 写作,包括 react plan and execute reflection 三种 planning 范式,以及 versa a i s d k。 实现多智能体写作。 今天的工具调用练习一定要做,自己动手实现一遍比看十遍都有用,明天见!
粉丝22获赞200

兄弟们,前两天我把 openclaw 接入了 qaires 放进了非书里面,它就实现了七成二十四小时的 a 股分析师。现在只需要两步,你自己的 openclaw 也可以轻松接入 qaires, 实现全球金融市场的分析自由。那本期视频呢,要和大家详细演示一下具体的操作过程,大家手把手去上手 qaires, 你可以将它理解成为 icon 打造的一个原声数据工具接口,让你的 icon 能够通过一个接口去获取上万种动态数据。简单来说就是给 icon 装上了连接真实世界的眼睛, 那它核心功能包含,比如说像市场分析对吧?像社交媒体追踪,包括多零数据整合,那通过这些标准化的接口就可以访问海量的数据和工具。首先我们打开浏览器的这个官网,然后呢我们找到这个地方,点击我是 icon, 我们只需要将这段话复制到我们的 open cloud 里面去, open cloud 就 会自动的去爬取当前的这个 skills, 然后以及具体的安装过程。它学习完成之后呢,会在你的电脑上安装好 qwires。 在 使用之前呢,我们需要配置一下它的 api key, 登录之后呢,这里会生成一个 api key, 那 这个 api key 呢,目前是免费送一千的额度,当你邀请好友是可以得双倍的,我们将这个生成的 api key 复制下来, 再粘贴给 openclaw, 这时候呢 openclaw 就 会自动的完成所有的配置,并返回测试结果。好,我们可以看到已经安装好了,这时候我们在 timegram 或者分数里面就可以去使用我们的这个 quick。 我 们下面来尝试布置一个小任务,要求它进行一个 a 股的实时监控, 这里呢,我们让 kris 支持每十五分钟自动运行 a 股的监控任务,并且生成涨跌幅的 top 十的榜单。那这样通过这样的形式呢,我们就可以很方便的看出,哎,今天到底是哪一些 a 股的涨幅前十的股票,对吧?我们可以分析它的增长潜力。那 奥本克劳呢,通过调用 kris 的 epi, 在 几秒内呢,就返回了完整的榜单。那这种实时监控呢,对于需要实时盯盘的投资者来说,那简直是神器。好吧,我们在工作的时候就可以实时的看到当前的一个结果 啊,并且呢,它还可以在分数平台内通过 qiris boot 实现七乘二十四小时自动的分析,实时的输出这个涨跌幅的啊排行任务。 那除了我们刚刚说的 a 股的实时监控之外呢,它还有一个加密货币的追踪,比如说,我们可以看到 qiris 实际上是支持多币种实时价格查询的,比如说像比特币和 usd, 或者比特币和 cny, 对 吧?那通过这样的方式可以很清楚地看到换算的数据速度是非常快。 这种多币种的追踪能力呢,对于加密货币投资者来说是非常实用的。当然呢, qwars 还有一个特别实用的功能,就是社交媒体整合,我 先让它 openclaw 总结今天最热门的 a i 新闻,那可以看到呢, openclaw 不 仅调动了 qwars 返回了完整热点榜单,还附带分析的趋势,这种社交媒体热点整合能力呢,那 openclaw 不 仅可以分析金融市场,还能够去追踪行业的动态。 当然如果你还没有安装 windows 的 话,你也可以直接安装 qwires 提供的 qwires boot, 因为它本身上是站在巨人的肩膀上,急于 openclaw 进行二次开发。但往一些开源到的 get up 上,大家可以直接去 star 使用方法呢?大家可以查看这个 redmi, 可以 说是相当的全面。那视频的最后,我想说 qwires 和 openclaw 集成呢,为 ai 智能连接打开了新世界大门。 那现在你只要复制一句话,再念个 open cloud, 再配置一个 api 应用,就能让 open cloud 实现七乘二十四小时自动的 app 思想监控以及加密货币的追踪,包括了各平台的数据整合。 那这些人力呢?无论是对于投资者还是行业爱好者来说,都是非常有价值的。当然如果你也对 agent 或者自动化感兴趣的话,也可以上手尝试一下 qwires。 好 了,那以上就是本期视频的全部内容啦,我是小刘,我们下期再见。

open club 整挺火,后台私信主要关注两个问题,一,小龙虾是什么?二,怎么安装?因为我和我的关注者都不是什么 ai 专家,大多可能是因为小龙虾很火比较好奇,我就言简意赅了,小龙虾不是什么新的 ai 模型, 他是一个利用 ai 的 工具。如果你不给小龙虾分配模型啊,他是连聊天都没法聊的。如果给了他模型,那就厉害了,他可以读写操作你电脑上的所有文件,甚至接入其他程序的接口,操作这些程序,帮助你工作好了。第二个问题, openclaw 怎么装呢?上个月底一个上海粉丝啊,花了五百块装 openclaw, 离谱。 其实官方是有脚本的,安装起来并不麻烦,但是网上的教程却存在不同的安装方式的 原声安装和类似于虚拟机的 wsl 安装。这里各位不要被这个说法迷惑了,好像虚拟机就不太专业,不太灵活。实际上呢, windows 的 原声安装受制于安全策略,装好之后的 opencll 权限仅限于一个指定的文件夹, 反而是 wsl, 你 可以理解成微软的官方虚拟机啊,它的权限是可以控制你整台电脑的,这样才可以真正帮助你工作。而且后面小龙虾玩够了,你只要把这个 wsl 卸载, 电脑还是干干净净的,不像原生的安装方式啊,需要手动清理很多垃圾。第二个不同呢,就是接入方式的不同。如果你已经在电脑上部署了 ai 模型,那就可以直接让小龙虾调用,完全免费。但是这个工作效率嘛, 受限于你的电脑配置,像我这台电脑,真实体验下来并不好。而第二种方式是使用像千问呢, deepsea 这些官方提供的 a p i, 就是 你坐在家里,让他们的云服务器给你跑 ai 模型,这个体验就太爽了,缺点就是需要付费。当然喽,每家都是有免费额度的, 你可以挨个注册嘛,嫖完了所有的免费额度,再决定要不要付费。所以呢,我这里的安装教程就是 windows wsl 安装加上云端模型的接入。安装步骤拢共分三步,第一步,环境安装。先安装 wsl 搜索框,输入 power shell, 右键管理员运行, 输入 wsl install 回车,等待安装完成重启。 重启之后进行 linux 的 安装,再次 power shell, 输入 wsl install 乌班图二十四点零四这个版本回车。 安装完成后会提示设置 linux 账号,可以直接回车,然后设置 linux 密码,这里它不会显示你输入的字母,你就自信地输入简单的密码,然后回车并再次确认输入密码。 再回车之后,会发现命令符变成绿色和蓝色了,说明我们已经进入 linux 虚拟机了。第一步我们的环境就配置好了。第二步就是 open color 主体了,直接在命令框输入回车,等待完成, 直到出现黄色字体,就表示这个炙手可热的 openclaw 已经完成安装了。紧接着最后一步,配置 openclaw, 控制方向键向左回车回车。到了选择 ai 模型这一步,我选择用千万来做示范,控制方向键向下找到千万并回车, 选中弹出的网页链接, ctrl 加 c 复制并粘贴到浏览器,登录千万账号。这一步的意思是告诉千万允许 open color 调用它的模型,如果没有账号呢,咱就注册一个。确定授权以后,回到 open share 的 界面,这里也同时得到了响应键盘回车 配置技能。这一步,选择下面的 skip 跳过,然后继续选择 skip 跳过,一路选 no。 到了这一步,把除了 skip 之外的四个选项用空格键全部选上,按回车确定。最后一步,选择第一个回车, openclaw 也部署完成了,我们已经可以和他交流了,教程也结束了,更多的高阶功能需要安装一些额外的 skill, 这个就靠你自己摸索了。当然了,你也可以直接问你的 openclaw。

opencloud 住进电脑后,到底能帮你干哪些活呢?今天这篇 opencloud 干货指南可要认真看完。大家好,我是 jack。 opencloud 像是住进你电脑的私人管家,可以飞出远程指挥,帮你收邮件、做简报,甚至各种图片都给你画好了。最关键的是,它是开源的,免费的,是完全属于你一个人的。 哎,别跑,你又以为这又是什么复杂的程序员玩具,那你就真的错过了一个亿。今天咱们就让小白也能拥有这个口碑炸裂的本地 ai 大 管家! ok, 我 们先花三十秒快速认识一下今天的主角 open call, 你 可以把它理解为当下最热门的二十四小时本地个人助理。那有朋友要问了,市面上那么多 ai, 它凭什么在本地部署还这么牛?来,我们做一个对比, 平时我们用的网页版 ai, 就 像坐在咨询台里的客服,你问一句,他答一句,但是他没有手,碰不到你的文件,也看不到你的屏幕,而且文本模型就只能处理文本,不能升图升视频。但是 open call 不 一样,他是直接拿着你家钥匙坐在你工位上的私人秘书。第一,他有手, 只要你给了授权,他就能操纵你的浏览器,你的文件系统,你的各种软件。第二,他听得懂人话,甚至能远程用飞书传话, 你在外边吃着火锅唱着歌,发个飞书消息,家里的电脑就开始干活了。第三,他还可以集成各种接口,让他删个图片,文本转语音都不在话下,能写会说更会画 逻辑懂了,咱们直接动手。我知道,一看到终端啊代码呀,很多朋友就头大, no no no! 今天咱们主打一个有手就行。其实 opencloud 的 部署非常简单,只需要 windows 加 r 输入 power share 回车,在这个终端直接输入这条指令, 然后这一步选 yes, 然后选择模型提供商推荐 glm, 只要在智普平台注册就有免费额度,记得创建 api k, 然后填入。接下来依次选择 skip for now 这个选 no, 这个全选就安装好了,所有的资料我都给你打包好了,直接复制粘贴就行,文档老地方见。 opencloud get away 一 键启动,当你看到这个页面的时候,恭喜你,你的二十四小时秘书已经在待命了。至于飞书远程遥控怎么集成,别急,可以去我的主页看另一起专属飞书接入保姆级教程, 秘书上岗了,可惜他现在还是个白板,咱们得教他干活。第一招,赋予他资讯猎手技能,操作超简单,把我这段指令直接丢给他,他会自动弹出一个网页,登录一下你的账号,完事 后续他就会全自动抓取信息,不用你看一眼。好了,配置完成,咱们测试跑一把。你看他直接把整理好的最新资讯简报发给我了,还顺手帮我归档到我提前建好的多维表格里。 第二招,教他帮你管理邮件。咱们就以小企鹅的邮箱来举例,先正常登录,跟着我的鼠标点击右上角的设置,然后点左边的账号与安全,在新界面,再点击安全设置,生成一个授权码,保存待用。回到和我们客户的对话中, 直接将这段话告诉他,他就会自己创建这个技能了。好,他也是创建好了,咱们测试一下,让他列出最新的五个邮件,并给另一个邮箱发一下他的自我介绍和自画像。 好,他也是很快就执行好了。关于他是怎么生成自己的自画像的,那就是我教给他的第三招了。接入 naidu baidu 的 生图能力有两种方式,先说第一种,在咱们最开始部署的时候,就把 naidu baidu 的 密钥填好了。 第二种,用第三方 api 接口。这就更野了,直接把第三方的开发文档扔给他,再把 api url 和 api k 一 起给他, opencall 就 会自己搞定。这套集成全程不用你懂代码, 我直接让它生成一个小猫草地,然后对原图进行修改。怎么样?跟着我这三步的操作,看下来是不是打开了新世界的大门。 opencall 就 像是我们在物理世界的一个数字分身, 以前我们为了提高办公效率,到处找工具,下了一堆 app。 但现在你只需要是一个 agent, 自己往里塞技能,他就能听懂你的话,看懂你的世界,还能帮你操作一切。 想象一下,以后所有的琐事都交给他,你只需要负责享受生活,这得有多爽?今天视频里用到的资料我都打包整理好了,想让你的电脑也自动干活的朋友不要忘记点赞、收藏、关注,那我们评论区见,拜拜!

这是一款让你不用任何 a p i t 就 能让你电脑流畅运行 openclaw 的 开源工具。记住这个项目名字,它通过浏览器自动化技术,完全不花一分钱,让你的 openclaw 直接利用网页登录去调用 gpt、 cloud、 jammer、 币豆包等等主流模型,完全不需要任何的 a p i t, 让你零消耗,用上 openclaw 就 非常顶。

openclaw, 一 款能接管你的电脑,真正自己动手二十四小时替你干活的 ai 工具。因为 claw 这个单词有龙虾钳字的意思而被国内网友戏称为 ai 小 龙虾。为了用上这个小龙虾,有人甚至花几百块找人上门安装 openclaw, 腾讯还专门搞了个线下活动,免费帮你装龙虾。这期视频手把手教你学会 openclaw 的 本地步数。 一、前期准备工作,硬件要求不高,一台能联网的电脑, windows、 mac 系统都可以,只要不是特别卡都能流畅运行 openclaw。 如果你的电脑里有重要文件资料,建议把 openclaw 部署到虚拟机里运行。软件方面,我们需要先在电脑上安装 nodejs 和 git 这两款软件。首先来到 nodejs 官网版本,建议选择 vr 二 lts 稳定版,点击获取 windows 安装程序, 下载后打开软件安装包,勾选同一软件安装协议,然后一直点击 nex 的, 再点击 instyle 开始安装,稍等片刻, note gs 就 安装好了。然后进入 get 软件官网,点击下载,没反应的话可以到评论区看看安装选项,全部保持默认即可。 最后把这个 view release note 取消勾选,点击 finish 完成。二、安装 openclaw, 点击左下角开始菜单,输入 powershell, 选择以管理员身份运行,然后输入这一行命令,按下 enter 键运行, 系统会询问我们是否确认执行策略,更改输入 y, 按下回车键表示同意,然后再输入 openclaw 官方安装命令并执行, 剩下的就是耐心等待 openclock 完成部署。安装过程中你可能会遇到各种各样的错误提示,直接截图问 ai, 根据他们的回答逐步解决问题, 期间会有一个弹窗提醒,选择允许访问,随后会来到这个界面,表明你成功完成了 openclock 的 本地安装。接下来我们还需要对 openclock 进行配置,按下键盘上的左右方向键,切换到 yes 回车,确认出石化模式,选择 quickstar ai 大 模型。这里支持使用 gpt、 mini max、 kimi、 豆包、火山引擎、阿里千问、百度千帆等。这是国内主流 ai 的 api, 使用费用大家可以自行选择。 这里以 kimi 为例,依次选择 kimi apikey, 点 c paste、 apikeynow, 然后打开浏览器,搜索 kimi 开放平台,确保账户有余额。点击 apikey 管理,新建 apikey 名称,输入 opencloud 项目,选择默认复制这串密钥,并粘贴到刚才的窗口即可。 如果你喜欢用豆包,就选择这个火山引擎 pass 的 api k, 然后进入火山引擎控制台,点击这里的 api k 管理,创建一个 api k, 粘贴到 power shell 窗口中,返回 timi 的 配置界面, 按下 enter 确认执行模型版本,选择默认的即可。这一步是配置通讯频道,我们选择最后一个 skip, 包括后面的配置,搜索引擎配置、 skills、 自动化脚本全部选择,暂时跳过,等跑通了再回来配置即可。 最后一步选择 opens web ui 系统,会自动调用浏览器,打开 opencloud 的 聊天窗口,如果小龙虾可以回复您消息,恭喜您完成了 opencloud 的 本地部署。下期视频我们具体了解小龙虾的使用方法。

彻底解决龙虾不能操作电脑软件的最后一环。很多人用 openclock 最大的卡点不是他不够聪明, 而是他不会像真正的人一样可以操作电脑上所有的软件。例如你让他明天上午给客户发一条消息, 它可以生成很好的回复内容,但它不能这样操作软件发送消息或者剪辑视频,它可以生成很好的剪辑策略,但是它不能操作剪映帮你剪辑。所以我最近做了一套 openclock 加 rpa 的 联动方案,就是这个 skills, 只要在 excel 配置好什么情况下要用哪些软件操作什么流程, openclock 一 旦识别到对应的任务, 就会自动通过 http 请求调用对应的 rpa 流程完成电脑软件的操作,而且这个操作过程是没有消耗。 tucker 的 总结就是, open call 负责动脑, rpa 负责动手。如果你也需要这套 skills, 可以 跟我要,也可以让 ai 帮你做一个。

看着别人用 oppo 可乐自动整理文件,全网搜索,自己却在安装的第一步,别急,本期视频手把手教你,无需代码基础,跟着步骤一步一步来,小白也能轻松完成步骤,拥有属于自己的小龙虾。正式安装前,我们需要完成两个准备工作,这是成功的基础。 首先安装 node js, 请前往官网下载并安装,安装过程中一路默认点击 next 的 即可。安装完之后继续安装 git, 同样前往 git 官网下载安装包。安装过程需要注意这个选项,其它的默认即可。按住 win 加二键输入 cmd, 打开命令窗口,输入 needv 检查版本 显示的数字是二十二或者更高和 n p m 版本。然后输入 get, 命令窗口中出现 get 相关信息,就代表可以进行下一步了。现在正式开始安装 openclaw, 在 命令窗口中输入这条命令, n p m install, 即 openclaw at latest, 然后按下回车,此时系统会开始自动下载和安装,这个过程可能需要几分钟,请耐心等待,直到出现者就说明下载 ok 了。安装完成后,我们还需要运行一 的初识滑向呢。在命令窗口继续输入 openclaw on board instore dm, 然后按回车,这个过程会引导你 完成一些基础配置。新手可以先跳过 a p i 与三方对话口的接入,我后续会详细讲解。先照步骤顺序先行跳过。我们把小龙虾先部署至电脑中,在这一步我们能看到这里有 twiki, 一定要复制啊,这个很重要。然后输入 openclaw giving port, 一八七八九 vbox 启动服务。当屏幕出现这个页面时啊,就代表了你的 opencore 已经成功部署在本地了。此时打开油烟机并访问,你能看到 opencore 的 控制面板,在设置中输入出水托屏,就可以开始和你的 ai 助理对话了。是不是很简单,赶紧动手试试吧!如果在安装过程中遇到任何问题, 欢迎在评论区留言,我会尽力帮你解答。下期视频我将教你如何接入大模型 a p i, 让你的小龙虾真正充起来!

最近爆火的 open curl 小 龙虾不会安装怎么办?一键部署工具,傻瓜式的安装,完全开源。我也亲测了啊,确实可以,主要分为四步,第一步就是环境检测,会自动检测你电脑的部署环境, 如果没有可以一键安装,我这里提前都装完了。第二步就是安装 open curl, 也是一键安装,在安装的过程当中有个小问题,就是软件会卡死, 但是并不会影响安装,等待一会给它关了重新打开即可。安装好之后,下一步配置 a p i, 创建个 a p i k, 填到这里,然后下边不用管这里,点一下模型连通信检测, 如果检测失败就检查上面的 k 和模型,直到检测通过才可以啊。这个时候就可以进入到第四步了,点击启动 get 位,并自动打开对话网页,它就会自动运行脚本,自动打开网页,这个时候小龙虾就搭建好了, 记住这个命令框不能关,关了之后还得再启动啊,然后就可以开启你的养虾之旅了。这个小工具更方便的一点就是它还可以自检,如果安装完成之后,小龙虾还是无法运行,这里可以一键自检,一键修复,非常方便。同时呢也提供了社交软件的可适化配置,对于小白的帮助还是挺大的啊,喜欢折腾同学可以收藏起来了。

装好 open klo, 是 不是觉得他傻?其实不是他笨,是你没有装退技能,今天给你六个神级 skill, 装上直接起飞。第一个叫 skill waiting, 他 就是个检查员 klo 宝,上面技能特别多,但难免有不安全的 skill waiting 会在你装任何技能之前先帮你扫描一遍有没有后门,会不会透,数据权限是否正常, 帮你把风险拦在外面。第二个叫 self employee, 简单说就是自我进化,这个技能在可了霍伯里下载量排第一,因为他解决了 ai 一个老大的难题是一, 你跟大龙虾聊半天,他记得你的名字,喜好,下一次打开可能又把你当成陌生人。 self employee 就是 专门治这个,它会自动把你的对话,你的习惯,甚至你的吐槽都记下来,用一个月它就是你的专属 ai, 用一年它比你自己还懂你。第三个是 free web search, 就是 让大龙虾能上网,能查最新消息的技能,以前你问他最近有啥新闻,他只会说,抱歉,我的知识只更新到二零二五。 装上这个它直接联网,而且不是甩一堆链接给你,而是把内容整理了提炼好,用你听得懂的话给你讲明白。第四个叫 summarize, 我 愿意称它为摸鱼神器,不管 pdf、 网页、图片、音频、视频什么格式都行, 你直接丢给它,它就能帮你读完,看完给你一份精简的总结。第五个叫 fun skills, 这个功能好用, 他是帮你找技能的技能,意思就是你不知道该装什么技能的时候,直接跟他说,我想让大龙虾会发邮件帮我找个好用的,他会直接给你推荐,甚至帮你一键安装好 第六个叫 a g t blender, 装上他,你的大龙虾就会长眼睛,会中手了,他会像人一样打开浏览器,点按钮填表单。好了,今天就分享到这,拜拜。

ok, 看到这个视频的朋友有福了,专为小白打造的 opencloud 龙虾的安装教程,主打一个解放双手。 这个时候可能有朋友问了,哎,为什么针对小白啊?无它,因为有流量,请允许我暂时做一波流量的。首先 opencloud 的 这个龙虾,它算是一个 ai 产品吧, chibi gmail 是 不是也是 ai 产品?所以我们想安装它非常简单,直接去问 ai, 但是你直接去问的话,他没法操作你的电脑,不是很烦吗?所以我们需要一个中介,直接在你的浏览器上搜索 ai 编程工具,不管使用国内的还是国外的都可以。 我这里简单举个例子,比如说字节的 tree t r a e 或者是阿里出品的 q 的, 你来到他们的官网,直接点击下载,就是在你想要安装龙虾的这台机器上下载一个 a i d e。 我 这里因为电脑上刚好有 tree, 所以 就用它来演示,然后点击右上角的登录这里呢可能会让你输入手机号进行注册,你注册一下就可以了。 登录之后呢,我们就可以开始安装了,然后我们点击这个,打开文件夹,去选择一个路径,比如说我这里新建一个文件夹,嗯,龙虾, ok, 我 这里呢只是给大家演示,你可以取任何的名字点击打开, 这样呢,我们就进入了这个文件夹里,所有的操作呢都会在这个文件夹里去进行。然后我们来到右边啊,直接让他搜索 opencloud, 然后在本地帮我安装他,然后我们直接回车 这里,我们可以注意到他是在沙盒中安装,那这个不是我们想要的,在沙盒中就比较麻烦了,直接在本地安装拉去远程项目到本地不要沙盒, 因为他在沙盒里虽然安全,但是我们后续添加技能的话是没法去正常调用的。在这个过程中他会询问我们很多次,让我们给他允许,不然的话他没法去运行这个命令。 ok, 好, 已经全部拉了出来,大概过了一分钟左右就帮我们构建好了。下面呢,需要我们配置 api key, 就是 你想要你的龙虾接入什么模型,你去聊天的时候用什么模型来进行处理。它是建议我们手动去配置,因为涉及到敏感的 api 信息。那如果你完全不怕,你可以让它帮我们来配置, 那比如说我想接一个 deep secret 的, 你帮我配置,我用 deep secret 的 api, 然后直接发送给他,我们选择第一个填写 api key, 然后下一个,然后把你的 api key 粘贴进去提交。那这个 api key 应该怎么获取呢?你也可以直接问他,他会一步一步的教你怎么去获取, 他干嘛呢这是?跟卡住了一样,我们直接给他中断,你干嘛呢?帮我安装运行。 ok, 现在已经成功运行了,我们点击打开一下,啊,这里有一个错误,我们把这个复制,然后在盖栏这里粘贴到网关令牌这里连接好,这个时候就正常了,尝试一下聊天。嗯,你好, ok, 有 问题复制一下,直接发送给他,说聊天有问题,让他来帮我们解决,因为 ai 相当于我们的外置大脑,有大脑为什么不用呢?我们必用, 现在他说已经修复好了问题,我们再次尝试好,可以正常回复好,这个是没有问题的,现在安装就已经基本完成了。如果你想要让他做更多的操作,你得教他,你可以做什么? 他这里列出了非常多的能力, ok, ok, 让他帮我们安装一些好用的技能, 我这让他停止现在的 opencloud, 因为我怀疑他运行在沙盒里。然后让他给我一个在本地可以启动的命令,然后我们直接点运行, 这里呢,出现了错误,我们复制一下,粘贴给他占用了,我们先清理一下,然后再次运行,我们刷新, 这样就正常了。我给他贴了一个路径,让他在这个路径下创建一个游戏, 我们看一下这他创建的,而且就是我们指定的位置。如果你在安装过程中出现了错误,你就给他复制截图, 然后发给 ai, 让它来帮你修复。需要注意的是,如果你使用的是自己的 tree, 你 会发现它更新了之后,为了安全,它的命令都运行在沙盒里。所以当我们测试完毕之后,你就要像我这样让它把这个给关闭, 然后给我们一个启动命令,我们点击运行在我们的终端里去直接打开它。整体操作下来应该是没有什么难度的。 以上就是本期视频的全部内容了,如果你遇到什么问题的话,可以在评论区进行留言,如果觉得本期视频做的还不错,或者对你有所帮助的话,记得一键三连点个关注。最后祝各位玩的愉快,我是端锋,我们下期再见!拜拜!

有一个二十四小时帮你办事的 ai 助手 openclock, 还有一个最强的开源模型调用工具 comui, 两者结合就能这样你通过手机发送需求, 然后 ai 在 你自己的电脑上自动加载模型,完成图片、视频、音频的生成,并最终将成品发送给你。 那就可以把 aigc 做到完全私有,本地部署,并且免费不限量。本期视频演示的就是真正意义上可落地的数字员工和数字生产力。 openclaw 和 comui 的 联动就是给极致的大脑装上了最强的开源模型,从会说变成会干活。它可以根据要求自动生成图片、克隆声音、合成数字人口、播跑首尾帧视频, 还能批量执行工作流,把原本需要坐在电脑前一步步点击的操作,变成你随时随地发消息就能完成的自动化流程,这就是最有价值的实战方向。那么本期内容我就会带你从实际演示出发, 看这套联动到底能做到什么程度,又能怎样接入你真正的生产流程。接下来的很长一段时间,我将会陆续开始在星球更新 openclock 教程以及最新的 comui 教程。 想要从零开始系统入门并逐步进阶提升的小伙伴,欢迎加入小黄瓜的知识星球。 open call 和 complain 联系起来之后,它的过程是非常稳定的, 就是它能稳定调用我们使用到的那些工作流,而且它可以稳定的去设置相应的一个参数,能够正常的按照我们的要求去完成图片或者视频的生成,然后以及音频、数字人,这些都是可以的啊, 可以看到我们这后台呢,已经在运行了,我们的硬件呢,现在可以看到已经开始有活动了哈,内存在逐渐的上升,就是在加载对应的模型, 然后图片生成,我给他配置的是用的 z image turbo 的 模型哈,所以说内存现在在上涨的阶段,说明模型正在往内存里面加载, 加载完毕之后呢,我们的 gpu 就 开始运行,也就是开始完成我们正常的图片生成。生成完毕之后呢,这个 openclaw 就 会通过飞书把消息给我们发送过来啊啊,可以看到这里已经生成了,也就是这个生成的过程是他自己做的, 然后生成完之后呢,他就会把这张图片发送给我们,然后包括人物的着装姿势,配饰背景,然后包括姿势形象,这些全都是他自己给我设计的啊, 可以看到这里已经生成了,那等待他把消息发送给我哈,可以看现在已经给我生成了,在飞书里发送给我了,这就是他给我生成的一个男生哈,然后我们把控制台打开哈,把 com 约的后台打开,能够看到他运行的过程哈, 然后显存呢,就是我们的性能占用还放在这边,我建议你能时刻的观看自己的硬件占用状态,了解模型现在运行到什么样的过程,然后这里给我们生成了,我们就可以让他再给我们生成一段音频啊,用小黄瓜的声音生成一段音频,小黄瓜。再说 这里是广州市中心,大家向后就能看到广州塔,欢迎大家来广州游玩,然后说天气比较热,建议多往室内有空调的地方去。 好吧,就这样,那么这两句话大概也就是四五秒的时间吧,然后我们发送一下,现在呢,我们是让他用本地的 com 给我们生成音频,然后等待他把音频给我们生成完, 生成完之后呢,我们让这个男生用我的音频再生成一段视频,也就是数字人哈,可以看到这里,我们的音频已经生成了,我们来听一下啊, 这里是广州市中心,大家向后就能看到广州塔,欢迎大家来广州游玩,天气比较热,建议多往市内有空调的地方去, 可以吧,这个声音没问题吧,跟我的声音是一致的啊,我们再听一遍。这里是广州市中心,大家向后就能看到广州塔,欢迎大家来广州游玩,天气比较热,建议多往市内有空调的地方去。好的,这个音频也没有问题啊, 我们说用刚才生成的这个男生形象,根据小黄瓜的声音做一个数字人的视频,视频时常控制在十秒钟吧,每秒二十四 fps 吧,然后视频分辨率呢 为一二八零乘以七二零吧,好吧,就这样。然后呢,他现在就开始给我们做一个数字人的视频啊,这里面我给他配置了七个工作流, 这就是我给他配的,所以说大家如果要用的话,你想给他配什么就配什么,我这里配了一个首尾,真的配了一个数字人的,配了一个声音设计的,还有一个声音克隆的,就是让他可以用我的声音去生成音频,声音设计的话就是他可以自己设计声音去生成音频, 然后还有 ltx 二点三的图声视频的,然后以及一个图片编辑和一个纹身图的,就文本到图片生成的那纹身图的模型,你配置完之后,你就可以让他给你做一些,比如说封面设计,然后 其他的内容哈,可以在上面看一下。我有做封面设计啊,你就像这个,在最开始你跟他交流的时候,比如说我这里说给我设计一个视频封面,关于 openclaw 和 compui 的, 然后想把它做成我的封面,然后是十六比九,主要是国内人看,所以说我们的封面标题呢要用中文,然后这是他给我设计出来的第一版封面啊,很明显这是不醒的,对吧?然后呢就给他做了一些个额外的干扰,我说要有标题, 然后呢标题写的清晰一点,有设计感。然后这是他给我的第二版封面,这个也不行,然后我说文字都粘到一起了,要有排版,然后这是他给我的第三版,这版其实还行,但是受限于大模型,也就是我本地部署的这个图片生成模型的能力, 所以他后面的很多文字呢是毁掉的,然后呢就给他说封面文字有误,然后让他重新修改,然后这是他又修改完的一版,看起来还行哈,然后呢我就给了他一张图片参考,我说你把这张图片给我复现出来,当然了 这个生成图片的能力取决于你部署的那个模型,就像我给它配的是 z image turbo, 所以 说这个能力并不是因为 openclock 不好,或者说因为 comfui 不好,只是因为这个模型我们目前用的不好,但是呢模型它是会进步的, 对吧?你像最开始我们用 sd 一 点五叉 l 的 时候,那个时候生成的图片质量是很差的,但是呢,随着模型的进步, comfui 甚至可以什么都不做,就只是适配一下这个模型,它的功能呢就会提升, 因为 comui 的 能力不取决于 comui, 它取决于模型。然后这是他给我的第三版哈,也就是参考刚才的图片生成的,然后发现文字都毁到一起了,然后又让他给我改, 最后生成了这个,所以说限阶段,如果你想用可以,但是他并不会到非常智能的程度。我这里接的是拆的 gpt 的 五点三的模型,所以说能力还是很强的。这里视频生成了,我们看一下哈。这里是广州市中心,大家向后就能看到广州塔,欢迎大家来广州游玩。天气比较热,建议多往室内有空调的地方去, 后面因为音频没了,所以说就没声音了。在这里是广州市中心,大家向后就能看到广州塔,欢迎大家来广州游玩。天气比较热,建议多往室内有空调的地方去,可以看到它调用的是我本地的,而且我们的显存呢,确实刚才有在运行啊,然后内存的占用现在还在这一百多 g, 这是演示的一个小功能啊,还有我们的首尾针什么的都可以。 之前的话,我们是需要在 cfui 里面跑工作流的,对吧?现在跟 openclaw 配属完之后呢,我们可以你拿着手机,任何时间,任何地点,你只要给它发送消息,它就可以给你制作。主要是这样的一个过程,而且呢,它可以有自己的设计,比如提示词当中可以让大模型自己写,也就是让 openclaw 接的这个大模型自己写,不用我们写,你 甚至可以让它批量的生成图片。以前如果说你在 cfui 要批量生成图片,是需要自己搭建一些工作流的,对吧?比如说设置种子值自增, 然后让他一个一个的生成。现在我们可以直接让他生成哈,比如我们这里给他说让他生成二十张真实男青年的照片,然后人物配饰、长相、背景,让他自己设计分辨率,在这里写一下。比如说我在一盘哈, 给他重新创建一个文件夹,叫做男生,然后粘贴到这里,然后二十张图片放到这个文件夹,然后名字从零一开始到二零结束。好吧,那这个时候呢?我们就等他给我们生成就行了。 你像以前我们还需要去处理工作流,对吧?然后自己或者说一张一张生成,但现在我们不需要了,批量给我生成了二十张,大家可以在这里看到哈,我们来看看这些图片哈, 怎么都是这种呢?他是他生成的是这种合集,好吧,他生成的是这种合集,我再给他说一下算了,我说把刚才的二十张图片删了, 我要一张图片只有一个人物的,就这样让他再给我做一下哈,可以看这里,我们二十张图片已经生成完了哈,大家可以大概看一下二十张这些还像同一个人啊,对吧? 他是给我们生成了五次啊,这是第一批,第一批当中像是同一个人,第三批像是同一个人,对吧?可以看一下,还挺帅的,对吧? 我们让他这样用第五张和第八张图片,把这路径复制一下, 给我们生成一个视频啊,生成一个五秒的吧,五秒的首尾帧视频,让他用一二八零乘以七二零的分辨率,每秒二十四帧吧,然后让他给我们生成一个首尾帧视频啊,看一下视频啊,这是我们做的首尾帧视频,六秒, 好吧,这个质量还是可以的,这个质量取决于 ltx 二点三,也就是我们给康复 ui 配的这个模型的能力。好吧,这点大家能理解,我们让他给我们做个海报吧,但是海报的话,我们可能需要让模型有一些提示词哈, 或者说写一些比较详细的提示词,我们去搜一个海报的案例的这张吧,这张好看,我们让他说给我设计一个罐装可乐的海报,可以参考这个提示词,文字内容你自己考虑加什么分辨率,我们要个一零二四乘以一五三六的,就这样 我们试一下哈,让他给我们设计一个海报哈,然后给他提供了一些参考提示词,如果直接用这个提示词生成,你生成的就是这样的内容。但是呢,我很明显不对啊,因为我们要做一个可乐的海报嘛, 所以说你自己要去想这上面的字我们改成什么,这两个字改成什么,哪些字要改,哪些字不能改的,现在我们交给大圆模型,让他去想,我们就不想了,不动脑袋了。这他给我们设计的海报哈, 并没有出现可乐哈,但是文字、排版这些都没有问题,画面的质量也没问题,这个质量呢,是因为 the image turbo 的 质量比较好哈,所以说这个呢,不行,我说再给他说一下, 就说图片里要出现可乐,这是一个产品海报这样的这一个产品海报对吧?看起来还不错,但是我们可以让他加一些英文文字,设计一个标题,大字标题, 白色文字啊,手写体最好,然后文字内容为 c o o l, 就 这样,然后放在图片的最上面,我猜测它可能会用到编辑模型的,因为这张图片的话是用 z 生成的嘛。 这里你看它已经在思考了,并没有直接生成,所以说它应该会切换工作流哈,切换到 flex clean 模型,当模型的能力再一次提升的时候,我们现在流程的能力就会再一次提升哈。 所以说现在大家其实可以去接触 open club 了,我觉得因为他们的能力不取决于他们本身哈,取决于他们用到的模型。模型的能力提升呢,不取决于个人, 取决于那些走在前面的那些大厂。好吧,所以说你现在学和以后学都是学一样的。稍微等待一下哈,不知道他现在思考到什么程度?我看一下哈,我们能在 open club 的 后台看到他 思考到什么样的程度啊?哦,他已经加好了吗?我们看一下。靠,他加了一个这样的文字哈,可以看这个,这俩基本上没问题啊,这两张图片除了文字之外的没区别啊。这个文字是他自己加的, 如果说我们有自己的提示词的话,让他去做海报就更简单了哈。比如说像这个,我们直接把这个提示词给他,用这个提示词给我制作一个海报,就这样直接把提示词给他就行了,然后他就会自动给我们生成哈, 等待一下,我推断他加的这个文字啊,是他自己通过脚本加的,并不是用了我们的模型哈,看一下,这是在后台啊,我们跟他交流的过程在后台都能看到。我们看看刚才说的让他加文字这件事情上,他做了什么,哈, 它用了一个工具调用哈,然后在这里可以看到,它是通过代码给我们加的文字哈,并不是用模型给我们加的,它这里用了一个 python p i l 库哈,这个是对于图片设计的,用了一个 image, image draw, 还有 image font 这几个类哈,然后去做了一个图片上面加文字的操作, 所以说呢,它并没有调用我们的 comui 哈,它选了另外一种方式,然后就生成了,所以说我们的 comui 呢,也没有运行。 然后这里他还下载了几个字体文件, ttf 是 字体文件哈,然后就加了几个文字哈,这是他的一个刚才加文字的那个过程,并没有用我们的编辑模型哈, 这里生成了哈,这个怎么说呢,文字排版不太行啊,这个海报如果把这么多中文直接交给模型生成,基本一定会出现错字、粘字、排版乱,所以我还是按更稳的方案来, 先生成了海报底图,然后再把文字排版进去。我说不要这样,直接用提示词生成就行,你看,这就是他自己的一个思考,但是他的思考是不对的,如果直接用提示词生成就会更好,反而他自己写的排版乱了, 对吧?所以说他自己想的,他先生成了一个底图,然后自己又加了一些文字,但是自己加的文字明显排版是乱的,还不如直接让模型生成,所以说这个呢,没办法,你在跟他交流的过程中就会遇到这些问题啊,所以说大家装完之后,最主要的是跟他的配置和交流的过程,可以看这次就直接生成了,这就没什么问题啊, 对吧?这次这个海报就没什么问题,所以大家以后用的时候,你想啊,当你看到了这个问题的时候,你能不能分析出来这个机器人他是在哪里出了问题, 然后让他给你改成合适的。如果说对康复 ui 了解不多的同学,可能看到这里就觉得康复 ui 的 能力也就那样了,对吧?其实是因为模型在中间做了一些事情, 然后导致了这个海报不太好。好吧,现在他的能力确实是有的哈,但是取决于我们给他配置了什么样的工具以及工作流,我来配置一个哈,这里有个图片放大,我觉得是需要的,我们让他直接给我装个插件哈,看这个工作流是不是这个 see the vr two 高清放大我搜一下哈, 我们一定尽量的把指定的插件路径给他哈,让他确定是装的这个插件,比如我们复制给他,然后说帮我安装这个 comui 插件,然后重启 comui, 然后把地址给他就行了,接下来他就会自己帮我们装了哈,可以看一下哦,还是在这里看哈, 一会的话,我这个网速的话就会开始提升啊,说明他已经准备下载了,下载完之后呢,他会处理环境,然后把环境装在 comui 对 应的环境里面,然后呢再给我们启动,可以看现在网速已经上去了,就是在给我们下载插件啊。好吧,他说重启了,我们试一下哈,我们看看这个插件有没有装上啊, 可以看,这里已经有了哈,这个节点没问题。所以说前面的这些呢,是 c 的 vr two 的 插件哈,看一下。所以说还得再装一些插件啊。已经给我们成功装上了一个插件,然后我看一下那个工作流哈,他好像把我的康复 ui 装到了 c 盘里面哈,看一下这个插件里面的视力工作流哈。 插件比较少, seedvr2, 然后找到对应的工作流,这里面缺失几个节点,然后我自己给他装一下吧。手动装一下吧。这是什么?有两个插件装失败了吗?我们重启一下看看啊,好像没问题啊,这几个都是装上的,现在在重启 comui 哈, 这些操作大家应该不陌生了,如果说啊 comui 已经学过一段时间的话。好的,有个插件没有装上,不对,应该不是没装上哈,是这些节点应该过时了哈。 get image size, 这是 c 的 vr two first pass, 不是 这个节点哈。看来这个插件还是没装上,选择最新的版本,看一下后台有没有在下载哈。哦,现在是在正常的下载,等一等吧,我把这个图片放大的工作流也给他,给他之后呢,他就可以批量的去完成图片的放大了哈, 我们刷新一下。好的,已经启动了,我们看看有什么报错哈。哦,载入成功的哈。插件在这里啊, see the vr two video upscaler 在 这里哈,这个节点。所以说把它替换掉啊,这里是 block swap。 然后这个呢,不管它了哈,直接把它从中间给它替换一下就行了。第一个阶段的放大, 这是第一个阶段的图片,第一个阶段有个 block swap 参数,现在不需要了,我们把这个删掉就行了。然后 d i t 就是 它的模型哈,我看看我本地的模型有哪个哈工作流要提前给它配通哈,配通之后再让它去运行 seed v r two 在 这里哈,本地有七 b lp 十六的模型,我是有的。那就直接选这个哈, 选完之后选我们的库达林 block swap, 直接在这里可以设置哈,给个二十吧,不给太多哈。然后这个也连过来 v a e 模型,这是 c 的 vr two 的 v e 模型,然后选上,这是分块放大,我们就按默认参数就可以了,把这个也连过来 v e 模型,那这个时候就相当于我们配置好了模型, 然后来测一下这个工作流的运行哈。等一下啊,我把这个工作流先保存一下,重新命名,然后把刚才这个工作流拖入进来。拖入进来之后呢,我们看看它是怎么做的,参数是怎么连的,做一个替换哈。 open floor 里面, 把 the vance 拖进来看一下哈,这个节点就连出来了一个最短边的参数哈, shortest side longest 最短边的参数应该是连到了这个 resolution 上面啊。好的,那这个工作流基本就没问题了,我们上传一张图片,让他给我们放大一下试试啊,我们就用刚才他给我们生成的这张男生的图片吧, 复制一下,粘贴到这里 set, 因为就给他连过来啊,把这个节点删了,然后第一阶段的话,放大到两千就可以了吧。第二个阶段呢,我们放大到四千吧, 这个指的是它的最长边哈,我们把它的最长边放大到四千,就相当于做了二点多倍的放大哈,二点五倍的放大了基本上,然后我看一下这个参数哈, seed 给它改一下 tailing upscale 放在这里, 然后看一下他的参数有问题啊,也就是插件更新导致了节点出现了问题,所以说我们是需要把节点删除重建一下的,原来他的过程呢,做一个替换就可以了,连到这里,所以说这个节点可以看他已经没有输出了,所以说这个节点对我们当前工作流没用,删掉就可以了, 现在应该没问题了。 new resolution, 把连上放在这里吧,运行一下试试啊。运行吧。好吧,现在这个呢,就是图片高清放大的工作流哈,这个节点有错啊,我们看一下错误是什么? block swap 是 无效的哦,我懂它意思了,它的意思是呢,你的模型放在了显卡,如果你做 offload 的 话,也就是显存卸载,做 block swap, 你 需要把它卸载到另外一个设备上,所以说这里呢,我们得选 cpu, 不 然的话它卸载不了哈,我试一下不做 block swap 它能不能跑哈,因为我想让它尽可能的把我显存占用多一点嘛, 如果我的显存不够的话,那我就去做 block swap。 现在的话可以看在做第一阶段的放大,然后我们的显存占用只有九个 g 是 没问题的,九个 g 占用很少哈,但是等到第二阶段放大就开始大了哈,图片放大对显存的占用很多,所以说这些工作流的配置你一定是要清楚的,不然的话,你没办法把它交给 openclock, 让它给你运行, 因为你需要选择其中的参数,让 openclock 去修改的。你比如说这里的模型的名字,你肯定不能让它修改,因为这个模型是你自己固定好的,放在本地的。还有这些呢, device 这些它没必要修改,所以说你就不要暴露给它,如果你暴露给它了,它就可能给你改,一改的话,工作流就跑不了了, 那个时候问题就大了。但是这个呢,就取决于你康复 ui 学的怎么样。如果说拿到一个工作流,你都不知道提示词在哪写,或者说都不知道你在哪里设置图片的尺寸,那你怎么去让模型配置呢?对吧?所以说这个呢,可能需要就是你学完了康复 ui 之后呢,你再学 openclip 加康复 ui 会更方便一点哈。 好的,放大完了,我们来看看,右边是原图,左边是放大之后的,大家可以看一下哈,看看他的衣服哈,还行吧,衣服质量还不错啊,看这个扣子, 这个扣子原来是扭曲的啊,现在已经到正常了。还行,这个放大质量不错的哈, 对吧,他多少会有点修改哈,百分之九十九相似。还行哈,这个质量没问题,工作流也没问题,那我们就直接把它 导出开始封装吧,导出一下,但是要把它导出成 api 格式哈,图片高清放大命名一下。 api 命名完之后呢,我们就把这个工作流导入进来哈,然后这里有个描述,说明我们要给它写上哈,就是图片高清放大可以,这应该就行了, 这俩节点我们不用管,所以说主要给的就这仨参数就可以了,一个是一百四十八号节点,一个呢是一百零四,一个是一百二十五。 我们先把一百四十八号节点给他暴露出来哈,一百四十八号在这里打开,然后描述一下,就是需要被放大的图片位置,然后生成必须给他勾选上,然后呢还有一百零四和一百二十五啊, 你找到一百零四,一百零四,一百二十五,这俩都给他打开啊,一百零四的话,这是啊 number, 也就是第一步放大的最长边长度 建议在两千以内,然后这是我们的第二步哈, number 二,给他起个 number 二吧,就是最终图片的最长边的长度建议大于第一步放大图片的最长边, 就这样,一个两千,一个是四千,这样的话就应该已经够了哈。第一步放大的最长边长度建议在两千以内,不要超过 number 二的大小。好吧,就这样保存一下, 我们来试一下哈,就像现在我们就已经配置完了,你可以问问这个 openclock 你 现在可以用的工作流都有哪些?可以看到他已经给我们说了他现在可以用的工作流这有八个,然后再加上我们刚才给他配置的这个图片高清放大的, 然后他说刚才装的插件已经装成功了,那我们给他,让他生成一个真实人物,女生在二十五岁左右吧,然后衣服风格,背景装饰,长相你自己设计, 然后分辨率呢在一五三六零二四左右,然后再把这张图片放大到,我们让它放大小一点嘛,不要太大了,最长边放大到三千,不改变原始比例。我们先让他把生成的人物发给我,然后呢再放大发送给我, 然后呢再把这张图片最长边放大到三千,不改变原始比例,放大后再把放大后的图也发给我。 好吧?就这样这个时候他就会去做了哈,然后现在可以看我们的图片已经生成了哈,这个是一五三六乘以一零二四的分辨率吗?然后这是他设计的给我们生成的一个真实的女生,然后包括他的长相啊,然后以及穿着啊, 然后装饰包括背景全都是自己设计的哈,他用提示词设计的。然后设计完之后呢,现在就开始做图片放大了哈,等他把图片发给我了哈, 这确实是放大后的图片啊,这是我们放大前的,这是放大后的 是吧?确实是啊,是放大后的图片。

你能在浏览器里做的工作, openclaw 都能帮你做,而且二十四小时不停地做,调研、情报、学习、写作、投资信息等等等等。今天我们循序渐进的介绍四种方案,从内置的工具开始,到依赖 api, 不 依赖浏览器的 skills, 再到隔离用户档案的浏览器自动化,最后到完全接管你当前浏览器状态的方法,每一个我们都说明白它的原理,优点、缺点,如何设置,以及最重要的适用场景。好的,废话不多说,我们开始如果你还没有设置 open club, 不知道选什么机器好。哎,看完这个视频之后啊,去看我的上映视频,真的非常的简单。 首先我们看 opencloud 以及内置的 web fetch 节点,它的原理啊,就是一个网页抓取和正文提取的工具链,它用 http 请求去抓网页的内容,这是服务端的抓取啊,不依赖于你本地正在用的浏览器, 也不会附用你任何浏览器的档案啊,资料啊, cookie 啊,拓展等等等等。它就是把 html 作为正文提取, 玻璃调导航栏,页角,广告、侧边栏等等的噪音。那么输出的是干净的 markdown, 它适合什么呢?它适合所有公开可访问内容,主要在 html 里面的网页,比方说文章,博克,公告这些, 它做不了什么呢?哎,它不是浏览器,它没法执行 java script, 也就是说所有需要登录、交互、翻页、滚动点击这些它都做不了。 它的优点啊,非常的明显啊,它速度快,成本低,因为它不需要启动浏览器,不需要渲染。它呢,适合二十四小时长期的扫描输出,更干净也更安全,因为它完全不碰你的个人浏览器,它不接管你的账户的登录态。 那么缺点也非常的明显,他看不到需要登录,需要 cookie 的 内容。那么比方说所有的社交网络,他呢,不能执行 java script, 所以 需要互动的内容他都做不了。然后呢,他呢,非常容易受反派机制和地域的限制,那么他的价值和使用场景来自于两个方面,不论是你做生意有竞争者,还是有对标者, 还是你想要学习或者某一个网站,那么你都可以第一时间,哎,关注到这个网站,爬取这个网站最新的定价的消息,它是不是有发布新的 i c u 的 文章,那么它啊,有没有调整它的政策,这些你都可以第一时间知道。第二就是,哎,有些公开的信息啊,比方说你关注 ai 领域,那么 open ai, spatial, jin 奈他们的官方的 啊,文档,他们官方的网站的最新信息呢,都可以被你抓取到,你可以第一时间知道这些信息。除此之外呢,比方说一些公开的网站啊, archibald, 如果你读文章的话,还就是维基百科, hack news, 这些网站都可以公开地爬取。 它的缺点也是非常非常明显啊,任何的社交媒体上的高价值信息,尤其是需要你登录进去的有关于你的信息,它都抓取不了,不能够定制化。那么如何设置呢?哎,完全不需要设置,你安装了 opencloud 之后,那 web fetch 工具就已经安装在内了,那么任何需要网络抓取的任务,没有其他方法的话,它都会默认走 web fetch 可以看到这里啊,我让他啊,用 wifi 去抓任何关于 opencloud 的 啊具有趋势的信息。那么由于呢,我这里已经安装了其他的方法,所以如果我只布置明道性的用 wifi 的 话,他就会去用我浏览器的方法了,那这个我们后面马上会讲到,你可以看到这里,他就会去 hack news 上抓取 相关的 open cloud 相关的信息给我了。那么用内置工具最大的缺点就是任何社交网络它都做不了,那么由此我们衍生出第二种方法,也是不依赖浏览器的 skills。 那 么第二种方法,我们用的这个 skill 叫做 last thirty days, 本身上我们就可以规定一段时间内啊,最低抓昨天的,要么就是三十天以内,最多我们去抓取社交媒体上 x reddit, youtube 上最新的爆点,痛点,舆论趣事等等等等,它只是用来做抓取的这样一个工具,那么它的原理也非常的简单,就是广撒网,然后再聚焦 reddit 上的信息来自于 open i 的 网络搜索功能, x 社的信息来自于 x a i 的 网络搜索功能与 top 的 信息,来自于 y t d r p 这个开源库。 首先啊,先搜索信息,然后对于这些高频的关键词呢,它就会再聚焦 subraded 或者是一个账号,再进行二次的补搜。最后啊,根据出现的频率和动信号来做加权的总结。 那优点,首先第一个就是它三个主要的社交媒体平台都顾及到了,都抓取了,所以它后面呢,还可以对它们这些信息的来源进行交叉验证。 第二个优点就是它毕竟不需要浏览器嘛,所以它是个轻量级的方案,它第一个缺点就是它需要 api, 就 它不是免费的方案。第二个缺点呢,就是它只能做 情报的获取,舆论的监控,爆点痛点的挖掘,对吧?它做不了任何浏览器,需要我们浏览器的操作,比方说鼠标点击啊啊,比方说帮我们发表文章等等,它都做不了,那么这个是我们后来两种方法,依靠浏览器的两种方法,我们马上会讲到 这里,我提一句啊,就是这种依赖 a p i 的 方法,你完全没有必要用这个开源库,它做的不错,但是呢,你可以完全定义自己的算法,比方说 啊,三不同的来源,你认为 x 最重要,那你就对 x 进行更多的加权。这些算法的制定,你就完全可以通过自然语言跟你自己的 open cloud 机器人兑换的方式来进行设定你自己的算法。 那么关于安装呢,有两种方法,第一种方法就是通过 cloudhub, cloudhub 可以 看成是 opencloud 的 市场,里面有各种各样不同的 skills, 你 可以一行命令直接安装这个 skill, 它的优点就是快速简单,对吧?受到官方的支持。缺点就是,哎,它呢,里面的版本不一定是这个 skill 最新的版本,比方说在这里啊啊,我们在我安装的时候呢,它 cloudhub 里面的版本是 v 一 点零这个 skill, 但是呢,实际上 github 上我看到它这个最新的版本是 v 二点一啊,所以就隐身出来。我们的 第二种方法就是如果你想看安装这个 skill 最新的版本,但是 clubhouse 不是 最新的,你可以通过 get 来安装,这个就要稍微复杂,稍微麻烦一些了,那么具体怎么安装,一步一步的,我遇到的问题我都放在免费的社区里了,大家可以去社区里面免费去拿。还有一点就是安装的时候一定要多跟你的 open club 问他问题, 因为每个人的环境有所不同,娱乐的问题也会有些不一样,最好是问你的 open club, 而不是网页版的 gpt 或者是 gmail, 因为问他,他很可能在回答的过程中直接跟你把你问题解决了,而不是你还需要去问网页端的, 然后玩一段 g p d 给你回答,你再粘贴到这里,告诉你怎么操作。那由于取决于 api k 啊,所以我们还是要在安装完之后,去到点 config last thirty days, 点 e m v 文件下面填入我们的 open i s a 的 api k, 那 么因为它是个付费的这样一个功能,如果我不说多少钱,就显得过说不过去了,对吧?那么每一次深度搜索呢, 大概是零点二美元,也就是 x a i o p i 的 费用加起来大概包括 reddit 二十多个县城 x 啊,三十到六十个帖子, youtube 大 概四十个视频左右,每次搜索都会有点不一样,但是大概的费用是零点二美元左右。 这里有一个小 tips, 就是 一定不要用它来搜广泛的词,比方说 ai 这种词,用它搜尽量细致的关键词,比方说 openclaw 或者 openclaw setup 这种关键词才会有比较好的效果。比方这里啊,我让它用这个 skills 哎去给我找出。这两天之内,大家都在讨论关于 openclaw 的 比较火的帖子以及痛点,比方说比较火的帖子,大家都在讨论安全问题啊,可能性啊,还有就是它记忆的管理,以及多个智能体的使用案例。 那么关于痛点呢,大家都在说,就是更新之后啊,会有一些风险,还有就是可信的问题,安全性的问题等等等等啊,同时啊,他也可以看到他可以分析不同平台,他发现 x 上 啊是非常强的,大家在上面抱怨痛点, reddit 上呢,就会有更多的技术讨论,而与 twitter 呢啊,就是各种混在一起。 那么到现在为止,我们见识到两种方法都是无浏览器的方法,他们呢,可以抓取我们想要的信息,不管是社交媒体还不是社交媒体, 但是它还不能完全替代我们人类能在浏览器里做的所有工作,那么接下来我们就要正式建设两种新的方法,这种方法都依赖于浏览器 完全模拟人的操作,你能做什么,他们就能帮你做什么。好的我们来看第三种方式是由 open club 管理的浏览器,真正实现二十四小时期的浏览器自动化操作,它的原理啊,其实就是 open club 在 我们网关上启动一个谷歌浏览器的实力。 然后呢,你这是独立的用户档案,而不是附用你现有的浏览器的用户档案,所以呢,它有独立的拓展,独立的 cookie, 独立的缓存,都在这里面,你呢,可以手动的登录一次你的社交网站之后就可以一直长期服用了。 它的优点就是,哎,它实现二十四小时长期非常的稳定,只要你的网关是开着的,那么它就可以直接跑,不依赖于你的日常使用浏览器是不是开着? 第二个优点就是它安全,边界更清晰,因为它隔离了你的用户档案,它不会污染你平常你用来工作,你自己手动使用的日常浏览器的生态。 第三个就是它可控性强,你可以选择有头模式,如果你想要看到图形操作的界面的话,你可以选择有头模式,或者你可以选择无头模式,它自己在后面跑,对吧?它的缺点,首先就是,哎附用生态弱,因为它是新的一个用户档案,那么它不带你日常用户档案里那些插件啊,你的证书,那些密码管理器等。 第二个就是设备的一些风控问题啊,一些站点呢?对你这个新设备,你的新的这样一个用户档案可能会更加敏感,可能会容易触发额外的验证, 那么它的使用场景是什么呢?哎,你用浏览器做的东西都可以让它自动化来帮你做,只要你设置完之后,哎用自然语言的方式告诉他,你想要什么时候触发任务,去做什么样的任务就可以了。那么如何设置呢?其实也非常简单,分为三步,第一步就把下面的 open cloud 点 json 文件里面,然后填入 这个关于浏览器的内容参数,直接照抄这里的就可以,然后控制有头和无头的是这个这个 handleless 参数一开始推荐大家是填 form, 所以 说有头的,因为我们还是需要手动地登录,之后你可以登录之后可以把它调成无头的。 那么第二步就是,哎,我们去重启我们的网杆网关,然后呢,我们需要手动地弹出来,用这个命令手动地弹出来我们的谷歌浏览器。然后呢第三步,我们在弹出来的网页里面手动地进行登录,把我们的社交网站,所有的 x, youtube ready, 其他的网站都登录一下。 登录之后,哎,我们就可以回来用自然语言的方式给我们的 open call 命令,让它去帮我们做任何浏览器的操作了。 比如说这里啊,我首先给他一个任务,就是每天的九点,他要去帮我生成一个报告,关于 open cloud 所有的报点和所有的新闻。 那么可以看到他返回给我们说他任务完成了,每天就早上的九点,哎,都会有这样一个定时的任务进行执行。 然后后面我要让他现在就给我输出一个报告,我们现在先测试一下效果。我们首先看他给我们的热门话题啊,跟啊前面的那个 skills 也差不多。首先就是安全性的问题,大家都在讨论,另外就是可靠性的问题,还有就是哎记忆的问题,包括是各个多个智能体之间的协助的问题。 那么关于痛点他发觉就不一样了,他发现了就是在社交媒体上自动化,比方说 x 平台 l 存在一些限制,大家都在讨论这个问问题。然后就是一些啊维修的问题啊,比较复杂,包括安全性。 然后他每一个社交媒体啊都会有一个总结,告诉他在这个社交媒体上发现的关于 opencloak 相关的话题,大家在这里都在讨论什么?值得注意的一点就是这种方法能做的事情远不止于去社交媒体搜集信息, 这里我们用这个手机信息作为例子,是为了更好的对比四种不同的方法,但是呢,任何你在浏览器上做的工作,你都可以尝试让 opencloud 浏览器自动化来帮你做,只要你设定好边界和规则。 那么第四种方法就是我们也干脆不用一个单独的浏览器里面的用户档案了,我们直接复印我们现有的浏览器,现有我们的登录,用我们现有工作环境的一切。 这里啊,我们就需要安装一个谷歌浏览器插件,那么这个插件的名字叫做 open cloud relay, relay 就是 中继嘛,本质上就是我们安装的这个拓展和我们本地网关之间的交流,不是直接的啊,是通过 本地的中继作为桥梁来完成数据的传输的原理,不需要懂太多,哎,重要的是它的优点和缺点,对吧?那么它的优点最大的优点就是百分之百附用我们当前的啊,谷歌浏览器的档案,我们的 cookie, 我们安装过的任何的拓展,我们有的证书等等等等,哎,都可以百分之百的服用,相当于带你去操作你日常的工作了啊,而且呢,哎,你有什么问题你能直接看出来对吧?就在你的眼前,在你眼底的地下刨做你平常有那些网页, 他的最大的缺点啊,首先就是不得不提的就是危险性,为什么用它完全使用你当前的网页,网站等等等等的。 第二个点就是他需要一些手动的操作,后面我们会马上设置,你就会看到实际上每次我们还就要手动安装了这个拓展之后,还需要打开网页,然后手动的激活这个拓展才能够生效。 第三点就是他只能在你已经打开的网页上面操作,你没打开网页,他操作不了,他能做什么呢?他直接可以当你的分身,他不仅是自动化,可以自动化工作,而且呢,你附用你当前的一切,直接帮你完成工作。 同时呢,哎,你你的登录,你之前的使用习惯,你已经在网站积累了一些信任,那么他呢,可以直接在你这个基础上直接帮你工作,他不能做什么呢?或者他不适合做什么呢?本质上他不是很适合二十四小时长期帮你工作,因为你看 他首先只能在你打开的网页上工作,不能去别的网页,对吧?其次你还要手动点亮啊这个浏览器,激活这个浏览器这个拓展,否则他就不能工作,所以这是比较麻烦的一些点。那么我们如何安装他呢? 首先我们来到 openclock 官方文档,大家谷歌搜索 openclock from extension, 就 会来到这个网页,往下拉有一个安装的一步一步的步骤,我们,哎,首先复制第一个命令,来到终端粘贴这个命令,然后执行, 它会安装,然后给我们一个地址,我们复制这个地址,哎,只要记住这个地址,然后我们浏览器右上角点击拓展,然后管理拓展,打开开发者模式,然后上传未打包的文件, 然后呢,那个地址吗?还记得吗?哎,大家选择那个地址,打开文件夹之后,他会问你一个 token 对 吧?怎么获得呢?我们需要用到这个指令, 这个指令比较长,大家可以暂停截图一下啊,然后让 ai 识别出其中的文字,这个指令执行之后,我们会得到一个 token, 我 们复制这个 token, 然后粘贴到这里, 然后可以看到,哎,我们成功了。那么这时候我们打开任意一个网页,比方这里我们以 read it 为例子吧,因为它需要登录,也有比较高的价值。 我们这时候点开我们拓展按钮,把它给拼上,然后点击这个拓展,就会看到它有个 on, 说明生效了。这时候我们打开的任何网页,只要我们点亮了 on, 那 么我们就可以让我们的 open cloud 在 这些网页中执行任何 需要我们想要他做的操作了。好,那这里之后我们马上来试一下,我去另外一台机器的 diagram 里面,我让他去 read it 里面仔细寻找关于 opencloud 的 热点和痛点。 你们可以看到我在另外一台机器上,他自己对这个浏览器操作,他去了这个 opencloud 的 字板块找热点,然后他寻找 opencloud 一 术来找痛点, 最后他总结出答案来回答了我。那么这次搜索啊,明显更加细节针对 reddit 这一个平台,当然这只是一个平台啦,大家也可以用在其他的平台,比方说 i x, youtube 等等一切社交媒体或者其他的网站上,只要你打开网页点亮都可以操作。 好的,我们总结一下,尽管我们今天用了信息收集、爆点挖掘、通点挖掘这样一个例子来啊验证这四种不同的方法,但是本质上第三种,第四种用浏览器的方法,你都可以让他做。你任何在浏览器需要上网做的工作不仅限于通点挖掘, 那么大家可以想想自己在日常生活中什么工作,在浏览器的工作是可以让 ai 帮你做的,来提高效率,来增大你的产出。有什么问题大家可以在评论区里告诉我,不要忘记点赞和关注,我们下期再见。

今天给大家分享一期实操干货,电商人如何自己用 open class 做工具。这个是我刚刚用龙虾做出来的一个适用于我日常工作场景的一个工具,它主要用来帮我批量产出自拍图, 因为我日常是需要发作品,所以我每天都需要批量产出很多类似于这样的自拍图,那也可以看到在某平台上面,这样的自拍图的笔记数据是非常好的,我需要这样一个工具,于是我就让龙虾现场帮我搭了一个,先看一下我这个工具的效果,我给他上传一张参考图,然后 他读取我文件夹的所有商品图片,这是我文件夹的商品图片,然后我点击批量换装,他就开始自动帮我跑,把所有我的商品图片都换到这个模特身上。这是结果,因为测试需要,我只生成了一张,是可以生成四张的。 那接下来我给大家实操一下具体过程我是怎么做的。我先一句话给龙虾描述清楚我需要什么样的功能,告诉他开始执行,可以看到很快他就执行完了,然后这个时候其实是需要我去输入 api 的, 但是我不会找,所以我直接让他帮我找好。他可能前面会给你很多方案,把详细的方案描述给你,你可以直接跟他说,你直接告诉我购买哪个就可以了。 可以看到刚刚他其实已经帮我搭建好,但是还是有一些问题不完全满足我的需求,所以我会继续跟他对话,提出哪里不合适,继续让他修改。我会打开终端看他思考和执行的这个过程,这样更方便我去了解他整个的执行流程,也让我更清楚地知道怎么去和龙虾沟通,怎么去掌控这个流程。 首先我告诉他要默认读取我桌面的哪个文件夹,这个文件夹里面我是放好了所有我的衣服的图片的,然后他帮我做好了以后,我又点了一下我的网页,发现还有一些问题参考图是加载不出来的,于是我告诉他我的问题他继续去改, 就这样一边用一边跟龙虾去沟通一边改,很快他就可以产出一个像我这样的一个网页,可以部署在本地供你使用,而且可以根据你的需求去定制性的做出一些功能,以方便你的日常工作。

家人们今天教大家 windows 系统部署 openclaw 全程四步简化版,不用复杂操作,跟着来就对了。第一步,准备环境,首先得准备梯子,全程需要用到,先确保电脑装了 node js 版本, vr 二以上就行, 没装的去官网下载,双击安装全程点下一步,不用额外设置。第二步,打开管理员 power shell, 右键选以管理员身份运行, 弹出提示点,是有了权限才不会报错。第三步,运行安装脚本,先输解锁命令,回车命令放在评论区了,输歪确认, 再复制官方或国内加速脚本粘贴回车,耐心等三到五分钟提示安装完成就好。第四步,配置,启动输入驶驶话指令,指令放在评论区了,跟着向导选本地模式,填好 api key 没有就随便填,选默认模型,再输启动指令。浏览器输指定地址,用 token 登录就能用。

很多人装了 opencolor 后,发现不能自动化的执行操作, opencolor 无法自动打开系统文件,以及浏览器不能读写文件,不能执行任何系统命令, 这是比较常见的问题。核心原因在于你的 openclip 在 minimal 权限模式下,也就是最小权限模式, ai 基本处于被绑住手脚的状态,让 openclip 打开个文件夹,运行和命令都做不到,总是提示 exact 工具不可用。要解决这个问题比较简单,在中单修改一下配置文件就可以了。具体操作呢如下, 第一步,打开终端。你是 mac 电脑的话,同时按住 command 键和空格键,会弹出搜索框,输入中单两个字,然后回车就可以打开了。 如果你用的是 windows 系统,那叫命令提示符,同样可以在菜单栏里搜索到。打开中单后,咱们先看看配置文件在哪。先在中单里输入这一行命令, 然后回车你会看到一堆文件,其中有一个叫 openclose 点 jason, 这就是我们要找到配置文件。为了确认问题,咱们要看看当前的配置。继续在中单输入这行命令,然后回车在配置文件里面找到 tos 这个词,你应该会看到这样的内容, 看到 minimal 这一词了吗? minimal 就是 最小的意思,这就是问题的根源,现在是最小的权限,所以 ai 啥也干不了。现在确认到问题第三步,我们就要修改配置,咱们还是要在中单里面操作,把 minimal 改成 for, 在 中单里面输入这行 set 命令, 然后回车把 minimal 替换成 for, 替换完成后就进入到最后一步,重启 get away, 必须要重启一下 open, 我 们的修改才会生效。 重启可以这样,在终端里面输入这行命令并回车。看到如下的提示就说明重启了。现在你再重新打开 iphone pro, 看看是否成功。现在的 ai 有 执行命令的能力, 它可以帮你打开文件夹,运行程序等等。但还是要提醒一句,权限越大,责任就越大。负二模式下, ai 可以 执行任何命令,所以一定要在可信的环境下使用,别让 ai 干一些奇怪的事情。