刚刚体验了一把 open core 的 自动化能力,真的被惊艳到了,我让他把一整个文件夹的 pdf 转成图片,但是我电脑里没有安装转化软件,结果 open core 先扫描了系统,发现缺少工具。 二,自动去搜索转化软件。三,按照最优化方案安装。四,执行转换全程我就在旁边看着他一步步操作, 最后文件夹里整整齐齐多了一堆图片。原本以为我还要手动安装之后他才能接着运行,但其实整个过程我基本上没有任何参与,一直是他自己在操作, 只是现在他还不熟练,全程花费了七八分钟。但是这已经很不错了,作为一个 ai, 能操控电脑,等后续更多的技能学会之后,不敢想象后续会发展成什么样子。
粉丝953获赞4684

只有你想不到,没有他做不到!用本地部署的 office 协助办公室工作,实在太牛了,今天带大家上手来看看我们日常经常会遇到的 pdf 文件的修改。因为 pdf 文件本身就是用于阅读打印,所以文件本身就是为了限制修改, 哪怕你是用 adobe 或者其他一些线上的修改软件,它也只能帮你修改一些简单的文字。但是如果你要做整体的修改和局部的增加,确实非常难,但是 office 通过加持 nano pdf 的 skill 就 可以帮你完美的实现,直接带你们上手来看一看。 这个是我在网上下载的一个简历,样板很正常,底下呢是一个空的。现在呢,我在用英文的指令告诉他,帮我在他的简历上面加一个志愿者的内容, 是一个遛狗的志愿者内容,而且获得了金牌。当这个任务发送出去之后呢,他就会自动调用之前帮他添加的 nano pdf 的 skill。 过了差不多十秒钟,他告诉我新的文档已经生成了,在他的这个 workspace 里面。我们打开这个路径来看一看,确实已经在这,这个和之前是一样的, 然后看到了吧,最后他确实帮我们直接增加了志愿经历,六个志愿者这样的一项内容。最后我们把两份简历并排做一下对比,我甚至觉得右边是修改后的,他对一些小的细节处理,比如说把这做成圆的,会让简历更加的美观一些。 我们再来看看他最后加的这个志愿经历,真的是完美无瑕的把内容加了进去。如果你感兴趣,也想让本地部首的 open club 做成你的办公助理的话,我们正好在 ai 工具小组里面提供 open club 的 相关课程,可以看视频主页介绍,第一方会有专人给你提供更多的信息和介绍。

给大家录制一个视频,主要是介绍一下这个 opencall, 它到底在我们的机器上面通过 dog 方式到底是怎么安装的,我们大家来介绍一下。那么 opencall 最近也很火,当然目前它还是有安全性的一些问题,所以我们一般建议你不要装在你自己的电脑上面,最好呢是通过这个容器的方式 创建这样一个虚拟和一个沙乡隔离的一个环境去运行。那我们今天这个视频主要是给大家介绍一下,到底怎么来通过容器的这种方式来运行。欧本靠就是龙虾,好吧,我们首先先给大家介绍一下他,其实 首先我们还是要在我们的电脑上面要把这个龙虾的项目给下载下来,要把这个龙虾的项目给下载下来,我是下载下来之后你就可以首先你可以要做一个翻译的这样一个动作,一般我们是这个这个脚本 运行这个脚本,运行这个脚本之后呢,他就会处理打包这个过程当中,如果他打包成功给大家看一下,他会创建一个这样的一个容器,我们靠点 点 logo 的 一个这样一个镜像,这个镜像打完之后你再运行下面一个命令,就是这个命令主要是做 配置文件的初识化,就我自己跑了一下,就尽可能你初识化,不要让他配,你可以很多东西可以不用配,你到启动了这个网关之后,你再来配置只说这个网关,启动网关之后再来配置这个东西,他这个地方最主要的一个地方是什么?如果你是要去安装这个 oppo, 靠,你要 他会生成这样的一个东西,这个地方是大家要注意他会生成这样一个 token, 就 在你的本地,你要通过这个 token 的 这个方式去打开外部的界面,当然这个外部界面有可能你是会打开失败的,因为什么他这个地方是要做一个配对,所以这个地方你要把,要,要把你的这个设备要给列出来,你要访问到这个容器里面去, 你要访问到这个容器里面去看一下,你要到这个容器里面去,你要去看一下这个是表说如果你发现他的,当然我们目前已经设置好了,如果他这个地方没有连接上,那你要打这三个命令,就这个 compose run 这个 开,你再要跑一个这样的一个设备的一个 list, 你 把这个它这个会列出来,有一个 request id, 把这个 request id 填进去,你再同意一下,那这样控制面板就可以连接到这个设备上面去就可以了。连接到设备上面去之后,因为我们原来的很多东西都没有配,所以你在这个地方可以做一个配置,配置最主要主要是配置模 模型这部分,那模型我目前配我自己是配了一个统一千万,统一千万三点五二十七, b f p 八的一个模型, 通过这种模拟他就可以在你本地,如果你配置完之后,你本地就可以去聊天了,只说你可以问,他就会告诉你本地运行的是我当地配的是通一千万,通一千万三点五二十七, b f p 八的这个模型,配置是在这个地方的, 我给大家看一下这个 skill 包,它这个 beauty 的 skill 包,它大概有五十三个,它有各种各样的,包括有什么苹果 note, 有 骑行,有各种各样 block watch 啊,这里有各种各样的一些工具,包括有些工具它是要设这个 sdk 的, 包括写代码的钉子,它也可以让它去写。这个是飞书的,它缺少一个飞书的一个叫 web walk, 你 只要把它植入进去呢,这个 飞书的聊天里面,它就可以去链接这样的一个东西,像这种它要注入这个 s e p i 的 聊天里面,它就可以起用这些技能, 包括这个呃, google 查询的地图地理位置,包括还有一些 nano banana 画图的一些工具,其实你都是可以注入进去, 是编辑 pdf 的, 它都是有些工具,都是有些工具来处理这些事的,包括还有一些语音的输入,各种各样的功能, 当然这些功能你也可以再进一步去添加你自己要的一些新的功能,这个也是可以的。好,那我们再给大家看一下频道,频道它目前支持的频道还是非常多的,我们给大家看一下频道这消息渠道,我们看了一下,它主要是支持国外的为主,国内的像这种飞书什么呢,它都是需要企业版,企业版本包括 teams, 包括 企业微信他也是可以支持的,但是企业微信他支持会比较麻烦,他还要做一些 a p i ip 的 一些白名单,还要做一些域名的设置,比较麻烦,所以一般个人用的不太多,但对国外来讲他是比较能用的,像这种国外目前都能,当然在国内,目前这种 app 下载都是在中国是不能下载的, 有些问题,所以这个龙虾在中国用起来可能就会有些限制,或者是说不是很完善。这个是消息渠道模型就比较简单,它可以配置各种各样的模型,包括各种各样的,这个是比较简单的,就配置一下就行了。 skill 工具,内在工具也是有很多,有浏览器,有各种 skill 包啊,这种 skill 的 配置,这个主要就是做一些能力的,包括有些定时任务, 这个都是可以做的,功能还是非常强大的,它这个功能是非常强大的,那要整体要完全玩会,它还是要花点时间来弄。一般我们目前安装就建议大家用 lock 的 这种方式,它会跟我们的那个机器做一些隔离,它也沙箱也运行在这样的一个 lock 环境当中,那这样相对来讲它会更加安全。好, 我们今天简单给大家介绍一下怎么去部署 open call 这样的一个方式去部署这样一个环境好。

如果你和我一样,能不动手绝不动手, openclaw 绝对是你的新宠。把这些 pdf 转换成图片,市面上的办公软件基本上转换都是要会员,但 openclaw 绝对能让你惊喜, 调用自己学习的 skill, 直接给你转换成功,不需要任何会员。实测一周,直至大龙虾,还能跨设被传文件截图、当前屏幕、远程开关软件等,这还只是刚刚开始,后续它的学习能力会逐渐强大起来。 open call 技能的真正价值在于将 ai 的 大脑与具体的手脚结合,将我们从重复琐碎的日常任务中解放出来,真正成为二十四小时待命的数字员工。

有人问小龙虾能不能调用 comforu i 实现图片生成?可以的可以的,我给大家实现。要想用 open curl 调用 comforu i, 首先你肯定是要有一套 comforu i 的 环境, 这是我们在本地搭建的 comforu i 的 环境,这是刚创建不久的一个流程图,它的作用就是根据你的正向提示词、反向提示词去生成一个平面图。其次,我们肯定是要有一个 open curl 的 环境,对吧? 我们建了一个 openclo, 这个 openclo 呢是使用的模型是 kimi。 二点五,要想用 openclo 去调用 ctrl u i, 我 们最好的方式是使用技能。这里是我整个创建这个的过程啊。嗯, 帮我开发一个 skill, 用于调本地的 comfyui 他, 然后后面就是要要求我提供给他这个 jason 的 路径,然后到这一步就是他已经成功创建了这个 skill, 就是 我通过在这个对话框里面跟他聊天的方式,他就已经能帮我生成图片了。 我这里是需要用 openglue 去调用的,怎么做?然后他就尝试再去做调整,调整完成之后就这里就算是好了,是吧? 然后我紧跟着我到小龙虾这边,这是它第一次生成,然后最后生成了它会路径在这,因为 openclo 它的这个界面是没有办法直接去访问本地文件的。这是目前 openclo 这个界面的一个问题,我们是不是可以 重新考虑修改一下我们的 skill? 既然你本地文件没有办法输出,那你是不是可以直接帮我输出 best new 四啊?在这儿你看它这边也是有 best new 四的方式进行输出。嗯,修改到这一步之后,它支持了 best new 四。 这个时候呢,我又重新跟他说,我修改了一下 skill, 你 帮我重新生成它。确实按照这种思路其实是对的,因为它能正常的输出这个这个东西,但是如果它这个输出完成之后,它就会正常显示,以百四六十四的方式显示。但是可惜百四六十四比较长,它输出 没完就结束了,所以导致这个图片是没有办法正常显示的。既然你这边生成的过程是用 python 去生成的,那为什么不能生成之后帮我直接打开呢? 使用电脑默认的打开方式帮我打开就好了吗?使用默认的图片的浏览器帮我打开,好,你,我已经同意生成,你帮我试一下, 对吧?他就成功了。我们给大家演示一下,编成一条鲨鱼,我们现在再看一下它的效果,但它的效率感觉并不是那么高,哎,你看生成成功了。

超算互联网宣布, opencloud 服务再度升级,正式打通飞书企业微信,用户可以根据任务规模灵活选择多种模型的 api 调用服务,并直接接入飞书企业微信客户端使用。目前,超算互联网 opencloud 已预制各类打模型,提供高性能、低成本的推理算力, 显著降低 token 消耗成本。据了解,与传统对话式 ai 不同, opencloud 是能够执行任务的数字,员工 只要用 token 一直喂他,就会越长越好。通过自然语言指定驱动,在本地或私有云环境中完成文件操作、浏览器自动化、 api 调用、多步骤任务链编排等实际操作,实现从建议到执行的跨越。

openclaw 怎么接入钉钉?让他写 word, ppt, excel, pdf, 做数据分析,画图,快速整理会议,基柚等,先放上最终效果图,机器人能收到消息并回复我接入。第一步是打开钉钉开发者平台,点击右上方的开发者后台,扫码登录进入开发者后台, 进入开发者后台首页后,点击左上方的应用开发,进入应用开发页面后,点击右上方的创建应用,输入应用名称和应用描述。应用名称应用描述可以随便写。创建成功后点击你创建的应用的名字,进入添加应用能力页面后,点击右边的机器人的添加按钮, 点击启动机器人配置,这里输入带星号的地方,然后点击保存,弹出这个框后点击发布,点击左边的基础凭证和信息 保存对和 secret 到你电脑的记事本上保存后点击左下方的版本管理与发布,然后点击右上方的创建新版本,版本详情这里版本号用默认的就好。 填入版本描述,然后保存,弹出这个框后点击确认发布。发布后要给机器人权限,点击左边的权限管理,输入图里的内容,然后申请这个权限下的全部权限。我申请过了,没法演示,你们可以在评论区发出来,接着获取第二个权限, 同样是全部权限。接着安装 open core 插件,这个插件可以接入 qq, 钉钉,飞书企业微信多个渠道,这里用来接入下钉钉 安装插件后要配置插件,小白建议不写 git 为 to 肯装完后重启,在 cox 上看到钉钉插件已经装上去了。

一百八十九页的 open cool 蓝皮书的完整版,那么它包括了二十多个 open cool 的 赚钱案例,怎么来进行部署配置, 以及关键文件的解读,还有呢,一百多个真实使用场景的图鉴等等这九大模块都在里面,这个视频我会详细来对这些模块呢进行解读,那么视频的末尾呢,也 提供了蓝皮书的获取方式。那目前的 openglue 应该说是 agent, ai 领域的当红榨汁机相关的关键词的解锁量是一个月之前的十倍,这两天大家应该也被各种视频和文章 刷屏了,轰炸了,对吧,很多是教你怎么配置的,教你怎么来用 openglue 做项目的,以及一些支持或者是反对的声音。那不管怎么样吧,我们发现呢,国内的大涨纷纷的下场, openglue 的 创始人 peter 呢,入职了 openai, 然后国内呢,向腾讯也推出了他的腾讯云的一键的云端 表级部署的方案,而且前几天在腾讯的总部呢,他们线下呀,进行摆摊,然后帮助这个深圳市当地的市民来线下免费的部署 openglue 啊,足见这个 openglue 的 火爆,以及国内的主流玩家对这个东西的重视。 ok, 那 因为这个东西的重要性呢,我们可 能看到很多的视频或文章,但是呢,看了很多很多人其实还是不知道怎么真正去上手,因为我们看的其实都是 碎片化的东西啊,碎片化的东西呢,相对来说是比较浪费你的精力和时间的,因为你没有办法建立起系统化的这个认知,那你如果没有办法系统化建立认知,其实不如不看,那要看的话就要 进行系统化的全面的进行学习。那这就是我这个视频和我们一百八十九页这个蓝皮书完整版所要达到的目的,就是带大家系统性的去了解 openglue 的 方方面面,当然市面上也有一些这个 openglue 的 一些使用的教程,那 这些教程呢,我全部我们团队的都拉出来看了一遍,那么也学到了很多东西啊,但是我们发现呢,这些教程往往都是集中于 技术层面,比如说主要教你怎么来安装,怎么来配置,教你在这个 linux, 教你在你的 windows 电脑上,你的这个云服务器上,你的 mac media 上怎么来部署和配置。那我们这份指南呢,其实不仅包含了这些安装、配置等技术层面的东西,而且提供的宏观、中观、微观 单层的视角啊,包括了全球的用 openglue 来做项目的这样的具体的案例,以及一百多个真实的使用场景的图鉴啊。这个是我们团队自己花了非常多时间来搜集的,当然也包括这个安装部署、配置的方式以及踩坑的细节,以及 很重要的就是 skill 技能的开发,以及 openglue 它的这个文件系统,每个文件到底是做什么的,这样的细致的讲解 等等。我们有九个大的模块,目前一共一百八十九页,而且还在不断的更新。那这份教程呢,我特别强调三个视角啊,第一个视角就是我们还是从这个你使用 open cool 的 终极目的,对吧?商业化的视角,或者 我们说通俗一点就是变现赚钱的视角。因为我们团队呢搜索了像 reddit, twitter, 包括国外一些个人的博客,里面的大量的真实的案例,挑选出了二十多个有具体收入数字的。这个案例呢,放在了第一部分,也就是一上来不是去学那些技术的东西,你是看别人怎么用 全球的这些使用的案例,因为有了具体的案例呢,他会给我们启发,而且没有数字的案例呢,我们是没有包括进来的,这些都是真实的使用案例。第二个呢,我们当然也包括技术的视角,比如说告诉你为什么 color 模型在 edit 的 任务上 就是比其他模型好,背后原理是什么,怎么根据你的预算来选择最合适的模型组合,不是让你无脑去用最贵的,而是教你呢怎么花最 少的钱来达到最好的效果。第三个要特别强调一下,就是说 opencube 呢,要注意安全,我们有一个安全的视角, opencube 的 创始人 peter 呢,他自己都说,因为这个项目呢,是完全的 all web coding 出来的, 也就是全部的,它是用 ai 编程做出来的,之前就已经出现过了像这个供应链的攻击, rce 的 漏洞,还有谷歌封号等等这些问题嘛,这都是真实发生过的。那我们在教程里面呢,也给大家做了详细的复盘 和防护的指南,在我们第五部分社区的彩灯经验和安全的实践,所以大家要 open cool 呢,要提前知道怎么来做好这个风险的防护。那最后要提一下,就是我们 也提供的速查的手册和资源清单,这个呢,在最后的目录这一部分里面,大家学完之后呢,平时在操作 open cool 的 时候呢,可以去根据这个速查手册和清单 来暗图所见。好,我们现在进入第一部分,也就是我认为大家最关心的一部分,二十个真实的赚钱案例。那我把这个赚钱案例呢放在第一部分,因为我们 学生和工具啊,实际上是有一个最终目的的,你得知道 openglue 它的商业价值到底在哪里?那我挑几个呢,有代表性的 给大家来讲一下。案例一是这个 money market 预测市场套利,那在前两个月,二六年的一月份啊,一个 open clue 驱动的自动化交易系统呢,在 open market 上执行了超过 两万笔的交易,累计盈利一百七十万美元。它的核心策略是 open clue 呢,持续的监控新闻源和链上数据,在市场定价 出现偏差的时候呢,快速建仓构建成本大概是五百美元,每日运营成本大概六美元。当然,我在这个教程里面也特别标注了风险的警告,里面也给了大家这个 sum 点 m d 的 模板文件,以及 openclip 点 jason 的 配置文件。第二个案例呢,是 groupwork 这个项目 ai 写作工作,那这是社区最广为流传的一个案例,一个开发者呢,让 openclip 呢,作为 ai 的 协作者,十一个小时内完成的一个企业数据清洗 报告生成的项目,客户呢,支付了一点五万美元,全程他人工介入呢,其实不超过三十分钟。关键就是 opencube 呢,它有四层的 记忆系统,能让 agent 在 十一个小时内呢,保持任务的这个连续性,不会忘掉它前面做了什么。而这个呢,是传统的 agent 比较难做到的。第三个案例呢,是 ai 自动化服务代理的案例,一个团队呢,通过 opencube 完成了五十多个企业自动化项目,每季营收六十万美元。 典型的服务呢,包括邮件处理,自动化, crm 数据同步报告生成,每个项目利润呢,超过百分之九十,因为它的编辑成本呢,只有 a p i 的 费用。教程里面呢,我也详细的写了服务的这个套餐,它怎么来设计的,怎么获客,以及呢,怎么从这个能启动 到稳定。第四个案例呢,是内容营销的自动化矩阵,用 opencool 呢,搭建全自动自动的营销系统, agent 每天研究 趋势话题,转载 seo 的 文章分发到多个平台运营几个月之后呢,越稳定,收入三千两百美元, a p i 成本呢,不超过三十美元。 里面呢,也给到大家这个心跳 m d 文件的配置。第五个案例呢,是 curlhub 技能市场变现啊,那开发者呢,发布了一个企业报告,自动化的技能定价每次二十九美元,三个月被下载了三百二十次,总额入九千二百八十美元。 教程里呢,我详细的分析了好 mate skill 具备的这样一些特征是什么,解决高频痛点,配置越少越好,这样呢,你的价值容易体现,以及名字直接描述功能,比如说你的日报生成器, 就好过智能文档助手这样抽象的名字。那除了这些呢,教程里面还有像 b 站 up 主工作流自动化、律所文档处理、跨境电商选品、直播间弹幕自动回复、 hr 简历筛选、房产经纪人、客户跟进、教培机构作为批改独立开发者, seo 自动化播客、转文章的内容矩阵, 企业内部支付等等,这些一共呢二十个案例,那每个案例呢,都附带了完整的实现路径, so 点 m d 模板, openclip 点 jason 的 配置、成本估算以及定价参考。所以这些东西呢,其实是你拿过去可以修一修,你就可以直接拿来用的。模板的 第二部分呢,是讲 opencube 的 这个背景的情况,它出现了背景啊,这部分呢,啊,其实非常精彩啊,我整理了大概五六个相关的播课,就是创始人最近呢,都在上一些硅谷的播课,我把这个播课内容呢,做了一些整合和整理。那放在了我的这个教程里面啊,这里面就包括非常著名的 redman 对 创始人 peter 的 这个长篇的专访。那首先是 ai agent 的 时代为什么到来了?因为二零二五年,其实有两个关键的技术进步,一个呢,就是工具调用能力成熟了,那模型不再只生成文字,它可以决定调用哪个 api, 传什么参数,当然之前也可以。 二零二五年,它成熟,意味着它调用更精准的,更准确,它不会混乱。第二呢,就是多步推理链趋于稳定,模型终于可以可靠地完成,比如说查网页,然后整理信息,发邮件等等这样连续的 复合的任务呢,一次性执行任务可以长达数十个小时。那 open google 呢,就是在这个技术的临界点上出现的。那然后是创始人的这个 partner, 它的完整故事啊, petter 呢,他是奥地利的开发者,之前花了十三年呢,做成了一个项目啊,运营在十亿台设备上,一个企业级的产品 卖掉公司之后呢,他退休了,但很快发现呢,退休并不好玩。于是二五年十一月的一个周末,他花了几个小时写了 open clue 的 第一个原型版本。在我这个教程里面呢,也列出了整个的时间线啊,里面有一些精彩的瞬间,大家可以自己去看一下。我觉得特别值得一提的就是三月八号,也是前两天啊, 个 star 数量呢,达到了二十七万,目前是 get up 上 star 最高的项目,而且它的增速也是最快的一个项目。你像排名第二第三的是什么呢?是这个 react 框架是 linux 啊,这些开源的操作系统。深圳龙港 ai 局呢,发布了 openclube 使用支持措施征集意见稿,一个开源项目,你想想,能够引起地方的这个政策的关注, 直属非常的罕见。那我们也可以对比一下这个历史上的增长速度啊,像 react, 它达到二十五万, star 用了十年以上,然后它是 flow 呢,用了五年以上。那 open cool 呢?三个月 open cool 在 爆火之后呢,几乎所有的大的 vc 和大厂都联系到了 partner, 那 么它有好几个选择,自己继续做,成立公司,融资或者是加入 大厂啊。其中这个 meta 的 扎克伯格也找到了他。另外呢,他也跟 open ai 的 奥特曼也进行了对话,最终呢,他是选择加入了 open ai, 据说 meta 的 出价最高,但是 peter 自己有他自己的一套原则,不是为了钱,是为了乐趣和影响力,所以他最终选择加入了 open ai。 那 目前呢,全国已 经兴起了这个养虾的一个热潮,而且出现了这个养虾的文化,那为什么这个养虾现在成为了二零二六年 ai 圈的 标准问候语?就是你养龙虾了吗?有三个原因,第一个呢,就是降低传播门槛,那养虾比什么部署 agent 更容易向非技术人士解释。第二呢,制造了一种认同感,养虾人是一个有边界 有认同的社群。第三个有一定的这个社交货币的属性。那在朋友圈晒我养了一只虾,比晒我部署了 open clue 呢,让别人听起来更有趣。 那全国来看呢,走得比较前沿的可能就包括深圳,还有这个苏州这些城市。在这个教程里面呢,我也给出了哪些人群适合来使用 open clue, 以及典型的玩法是哪些,大家可以去看这个表啊。接下来呢,就是第三部分,保姆级的安装部署 教程,那这是我们整个教程里面核心的部分,因为我知道很多朋友啊,他是非技术背景的,所以这部分呢,我们写的非常的详细,教程里面呢,包含了七种部署方式啊,所以不管你是什么样的基础的配置啊,总有一款是适合你的。第一种就是本地的 n p m 安装,这个呢,其实是 有开发背景的人员的首选啊,在 mac, linux, windows 全平台呢,都有详细的步骤。第二呢是 docker 部署,那如果你比较熟悉 docker 的 mini, 可以 采用 docker 部署。那国内的阿里云和腾讯云呢,也推出了 傻瓜式的一键部署的方案,比如说你是用企微的,那你可能是腾讯云的一键部署是你的首选。还有呢,像火山引擎,百度云也推出了自己的这种部署方案。另外呢,像扣子编程也有零门槛体验的方案,这是扣子编程的 数字编程,可以极简部署。做为 cool, 我 最推荐的一种方式,其实还是使用 mac mini 来进行部署啊,因为它有几个特点,就是它可以低功耗的七乘二十四小时来运行,全年无休,一年电费不到一百块钱。而且因为是 本地自己的电脑数据,你没有对外的,所以呢,你的文件的隐私可以得到保护。这里很重要一点就是你的这个安装啊配置 其实只是开始,后面的模型的费用才是大头。现在服务器成本其实已经降到很低,比如说最低的每年可能就这个几十块钱,所以真正持续的成本在于模型的 a p i 的 调用。 选平台时候呢,重点看模型套餐的价格,而不应该只看服务器的价格。那如果你要部署在 mac mini 上,那现在这个最低版的 mac mini, 它的价格大概是两三千块钱,它是十六 g 内存,然后二百五十六 g 的 硬盘。这个入门版的 mac mini 呢,运行 openclip 这个网关绰绰有余。当然,如果你要运行更复杂的项目,你里面可 们还想安装这个 cloud code, 还想操作性软件,甚至是这个,你想做这个多 agent 的 这种运行。我推荐你是购买二十四 g 内存的,因为我自己买的就是二十四 g 内存的,用起来确实是非常的顺畅。而且最重要就是你看我买回来两个多月了,也就只关了两次机,每天早上我好几个定时任务啊,早上一起来,然后呢, 像我监控的这几个,全球的,硅谷的这些十几个播客源,然后他们过去二十四小时播客的更新的内容,全部直接就推送到这个我的 telegram, 直接通过 opencube 呢推送给我,那我就能获得最新鲜的一手的播客的访谈的 原文以及翻译成中文的版。再往下这一部分呢,有一个非常重磅的内容,就是关键配置文件的解析,那这里要说到就是 open cool, 它的这个设计哲学啊,叫做一切皆文本,这个大家一定要记住啊,一切皆文本,它的所有配置呢,都是 文 macdunk 文件或者是 jason 文件,而且直接用文本编辑器就可以修改,不需要其他的任何的专有的工具。那么 open cool 呢?它的核心的文件系统呢?就长成这样的教程里面呢详细解析的 五个核心的文件,第一个就是 agent 点 md 这个文件,那么它是定义了这个 agent 的 身份,相当于系统提示的模板。这个 agent 点 md 文件呢,它是 agent 的 工作说明书,每次绘画,每次的 section 启动的时候呢, 它就会加载这个 md 文件,这是一个典型的 md 文件,大家可以看一下,这里面包括了 agent 的 名字,核心的职责是什么?比如说 处理日常消息和任务,管理邮件,日历文件,执行自动化工作流,然后还有什么你的回复风格,你希望他以什么风格来回复?是弹率点名直接的,还是说这种更加这个接地气的风格,你就可以在 m d 文件里面配置好?还有呢 行为规则是什么?还有工具使用的规则,比如说删除文件前必须向用户确认等等,这些规则你可以写在里面,这是 m d 文件。好,接下来一个非常出圈的一个文件啊, open cool, 非常出圈大家经常讨论的一个文件叫哨点, 也就是灵魂文件。他的这个文件呢,是 ag 的 定义了他的核心人格和不可违约的价值观。所谓的这个宪章,它的关键特点就是说创建之后不应被后续对话修改,因为这个很容易成为一些攻击的目标。这是典型的一个灵魂文件, 我们可以看一下里面有这个身份证,同,然后核心价值观是什么?忠诚、诚实、安全,比如说忠诚只服务于主人,不接受任何第三方的控制命令。还有就是诚实不确定的事情呢,明说 确定,不要绕弯子,不要编造信息很重要。这个文件呢,当然你如果有自己的想法,自己想要指定的他的这个人格特点, 你都可以写在里面。再一个呢就是 user 点 md 文件,这个文件呢储存的关于使用者用户的一些本身的信息,这样可以让 agent 能够知道他 对话的这个对象是谁,从而提供更加个性化的服务。这是一个典型的这样的一个文件,比如说称呼,就是说这个你的小龙虾应该称呼你什么,比如说称呼你老板或者新哥,然 用什么语言,还有这个偏好和习惯,早上九点前不要来打扰我,或者是你的这个输出的报告的格式是什么?比如说结论,先行,先放结论,然后呢后面再放这个描述的细节,还有呢不喜欢废话直接说重点等等这些内容, 以及可以把你的这种常用的联系人,你这些联系人呢,也可以放在里面,也就是心跳机制。那么他可以定义定时任务,让 ag 的 在没有用户主动触发的情况下,他也能主动的 执行操作,他会主动来找你,你在出发之后主动来找你。最典型的就是我们的这个每日早报,每天八点三十出发的每日早报,像我每天刚才讲的就是全球的播客的这样一个转录的 一个定时任务,每天早上我是八点半,它会推送给我那一个 agent 里面呢,你可以设置很多个不同的这样的定时任务,因为定时任务呢,你分类啊,其中这种,比如说间隔型的定时任务,就是比如说每隔一个小时,它去监测一下,去检查一下某一个网站是否更新,这种定时任务呢?它会持续的消耗 api 的 token, 所以 这种心跳任务呢,最好要使用这个免费的模型。好再往下一个文件呢,是 openclip 点 jason 这个文件啊,这是配置文件, openclip 的 配置文件非常非常重要,它是全局的配置都在里面,以及 选用什么模型,你的这个 openclip 的 部署的渠道以及认证方式等等都在里面啊,这是一个典型的文件。那这个在我们的教程里面 给了大家一个视例,比如说这个 agent 有 哪些 agent? 然后呢?这个 model 我 们选择哪个提供商?是比如说 deepsea 提供商,然后提供商下面是哪个模型?比如说 deepsea chart 这个模型,还是 deepsea 推理这个模型 好。再往下很重要的一个 open group 的 使用的方式就是渠道的接入的问题,那教程里面覆盖了像接入 telegram、 飞书以及企微等等五大平台的详细的 配置步骤。那其实这个配置呢,也就是修改 openclude 点 json 这个文件,其实你掌握了这个一个渠道的修改,其他几个渠道都是一样的,就是你按照这个 同样的方法去修改这个 json 配置就可以了。那里面呢也有详细的,比如说 telegram, 它的接入的方式,一步一步你跟着操作就可以配置起来。因为不同的渠道它的配置呢还是有些不一样的,比如说这是非输的 啊,这是 qq 的, 这是企微。好,我们在这一部分我觉得非常有用的一个内容,就是我们提供了三十个高频爆破的排查手册,有安装类爆破的,那么还有像 后面的这个网关启动类的报错啊,每一个报错你到时候自己做的时候呢,你发现这个报错,你就可以在我们这个教程里面来查到底怎么解决你这个报错,你可以通过这个全局搜索来定位出这个报错,然后呢找到这个解决方案,再往下。还有像这个模型 a p i 类的报错,你看比如说这个四零幺是什么, 对吧?无效的 a p i k 怎么来解决?还有渠道接入类的报错,这个 bot token 无效, bot token 无效,就是你的这个 bot token 啊,可能过期了等等这样的内容,还有 skill 类报错、技能报错等等吧,我们这边就非常多,包括安装类的 getaway 启动类,然后模型类、渠道接入类、 skill 类、 docker 二类、成本和安全类。那每个报错呢,都有原因分析和解决方案,这部分都是我从社区里面收集的真实的问题,能够帮助你节省大量的这个排查时间。第四部分呢,是大模型选择以及配置的指南, 选对模型呢,成本减半,效果还翻倍。那么教程里面首先给了二六年三月份目前的主流模型的一览表,包括 cloud gpt, gmail dixic, 包括这个 国产模型和本地模型,那每个模型的价格,上下文窗口特点都有详细的对比。然后呢是模型能力的雷达图,从中文理解,代码生成,工具调用的稳定性,常温档分析,多轮对话,推理能力, 图片理解,还有价格竞争力八个维度呢,进行打分。并且最终呢给出了一些核心的结论啊,像工具调用场景,哪一个模型最稳定,以及中文内容生成这个场景,我们发现呢, deepsea v 三性价比是最高的,那价格只有 cloud 的 十分之一。还有呢,像图片分析任务这个模型,这类场景下哪个模型 效果比较好?那教程里面呢,提出一个被很多人忽视的重点,就是 cloud 三点五或者四。 haiku 这个模型呢,是被低估的性价比之王,它在简单的信息解锁,格式化输出,固定流程,任务执行。这类场景下, haiku 几乎和 sonit 一 样好,但成本只有 cloud sonit 的 七分之一,所以推荐的策略呢,就是百分之八十的任务用 haiku。 那 复杂任务呢,升级到 sonit 最难的任务呢,才用 opus, 因为 opus 非常贵啊。那再接下来就是智能模型路由的配置啊,这里呢介绍了 ibenglu 点 jason 这个配置文件里面怎么来进行配置,从单模型配置到双模进行配置,以及回退链的配置,任务专项路由配置四个级别循序渐进,这是双模型配置, 这是这个回推链的配置,这是任务专项路由不同任务路由的最擅长的模型。这些配置文件呢,都在教程里面,大家可以直接拿去参考的。那接下来呢,就是五大场景模型的推荐方案,比如说做个人副业的预算每个月 五十美元,还有呢小团队服务,你的预算是每个月可能两百美元,再比如内容创作的工作室预算呢,每个月是一百美元。这些场景下应该用什么样的 这个方案?在这个教程里面,我们给了这个推荐的方案,那么在接下来是十四章,就成本控制和优化的技巧啊,这个也很重要,那首先就是 token, 它的计费的基本原理是什么? 那么 opencloud 呢?每次调用啊,它都要包含前面我介绍那几个 md 文件,它包括这个系统提示 so 点 md 文件,还有 agent 点 md 文件,还有 user 点 md 文件,以及心跳点 md 文件,这些它每次都要发送的。那么还有呢,就兑换了历史,当然它是摘药,还有 工具,它会用到的工具的这个介绍摘要的信息也会传输进去,所以你会发现的,每次绘画呢,提交给 ai 的 上下文是很长的,所以大家有一种感觉,用这个小龙虾会发现这个 token 消耗非常快,因为就是我们输入的内容非常的多啊,它配置文件里 面的信息都会输进去。那教程里面呢,我们给到大家这个六大省钱技巧啊,第一个就是这个灵魂文件怎么来最小化,我们给了一个 反面教材和正面做法,具体是什么?技巧二呢,是开启 isopic prompt 缓存模式,因为 isopic 支持对重复内容进行缓存,可以节省百分之九十重复的 token 费用。技巧三是对话历史进行压缩。技巧四呢,是批量处理, 一代逐条处理。技巧五呢,缓存相似查询结果。技巧六,设置成本上限,就是你最多要花多少钱,不管怎么样,你设置一个上限,超过了 ok 就 停止,这样呢,能避免这个无限消耗你的信用卡。我们在这一部分呢还介绍了这个国外模型的接入方式,通过一个聚合的 a p i 的 网站 openroot 来接入国外的这些大模型。当然这个网站呢也可以接入像 deepsea 等国内的模型,它是一个模 模型的聚合站,通过一个 api k 呢就可以调用基本上全球各种各样的模型,而且里面有一些免费模型可以使用 open rota, 它的核心优势还是蛮多的,也是我一直在用,用了好几年的一个中转站教程里面呢讲了这个详细的配置步骤。那里面还提到一点,因为现在这个 小龙虾特别火,所以国内的像智浦,像这个 mini 啊,都推出了这个 coding plan 的 这个计划, 那我会介绍一下他们的这个 coding plan 的 计划到底是什么样的价格,以及怎么来开通教程。第五部分呢,是社区踩坑经验以及安全的实践,这部分非常重要,但是很多 教程呢,没有讲到啊,里面呢重点提的这个,首先呢就是三大灾难性的事故复盘,这也是之前的一些真实的灾难。第一个就是 a p i 账单的暴涨, ready 的 上面的一个用户分享的它的这个惨痛的, 他一晚上就花掉了一万两千美元,因为没有设置预算的上限, agent 陷入了无限循环调用,一夜之间产生了一点二万美元的 a p i 费用。那么教程里面分析了原因以及防护的措施,防护措施呢,其实有三道防线啊。第二个事故呢,是 t s 的 注入攻击,这是 unico 历史上最严重的一个安全事件啊,恶意的 skill 呢,通过 t s 注入试图修改 agent 的 song, 点 m d 文件,获取用户的 a p i k 和个人信息,那 clue 点 have 这个技能网站上大约百分之二十的 skill 呢,被确认为是乐意的 事故三是 ostoken 泄露导致的障碍封禁,那谷歌大规模封禁 open clue 用户账号,原因就是 token 的 泄露。教程里面后面呢,是最高频的踩坑清单,五十条,这个是非常宝贵的这个经验啊,我觉得每个人都应该认真的去多读几遍,比如说 so m d 文件太长导致的 open 的 浪费,这是配置类。那后面还有这个运行时业务逻辑类,性能优化类,那每条呢,都是社区里面 踩过的真实的坑,随便举一个,比如说这个业务逻辑类踩坑啊,有三十一到四十五条是讲这个的,比如说 agent 呢,做了用户不期望的动作,问题是什么?然后解决方案是什么?在这个 m d 文件里面,你添加这一句话,还有呢,多 agent 的 协助时,角色 混乱怎么来解决?还有呢这个重要决策依赖单一的 agent 怎么来解决?应该用什么样的架构?其实它这给的啊,就是架构师使用这个双 agent 来确认决策 agent 以及验证 agent, 最后才执行。这里面很多大家可以自己去看,第十七章讲了推荐的做法以及反模式啊,这里的反模式呢,就是 我们一定要避免的一些做法。第六部分是十大行业落地解决方案,这里面包括像内容创作与媒体行业、 法律行业、教育行业、电商行业,还有人力资源行业,医疗健康还有供应链等等这些。比如说内容创作与媒体行业,那这个就是一个自媒体的内容工厂,每天的自动的多平台的适配内容,里面的所有点 md 配置文件, 我们给出了,还有这个工具配置文件也在里面,每一个方案都有完整的数点 m d 配置工具实现代码以及收费的模型。比如说这个内容工厂,那收费模型,它包括基础版、标准版、旗舰版三个层次啊,每一个层次的服务内容以及定价, 我们这个给到大家一个参考好。第七部分是从零开发自己的 open cool 的 技能,那里面介绍了什么是 open cool 技能, 技能有哪些类型?三种类型,工具型、流程型以及集成型三种类型。这样分类之后你就知道你做的这个 skill 属于哪一种类型,它们的特点是什么样的,以及技能目录结构是怎么样的。那我们会详细讲这个目录结构里面包括 skill 点 md 文件, scripts reference, 还有 essence, 也会讲到 skill 点 md 文件,它具体的写法是什么?其实这一块儿呢,这个不仅限于 openclip, 包括 cloud code 里面的 skill 也是同样的框建方法。那在这部分呢,还讲到了进阶的商业化技能的开发,以 seo 工具为例, 如何来开发一个有商业价值的技能,那么这个技能呢,可以分析任何网页的 seo 得分,是内容营销从业者的刚需工具, 这里面有详细的过程以及 skill 点 m d 的 文件。最后呢,也会讲到如何发布到 cloud hub 市场,那还有提升技能销量的运营策略与收益评估模型,如果你想在 cloud hub 上卖技能赚钱呢?这一部分就要重点阅读了, 第三十章就讲到了如何发布到 kolhaub, kolhaub 的 具体的介绍,发布流程是怎么样的好。第八部分是多 agent 写作的高级的玩法,那么讲到了为什么我们要用多 agent, 单个 agent 有 什么样的局限性,上下文窗口有限等等这些局限性以及多 agent 针对这些局限性,它的优势是什么? 还有呢,三种多 agent 的 架构模式,流水线模式、定型模式以及层级模式。接下来就讲到非常重要的就是多 agent 怎么来配置的,实际上也是在 opencloud 这个 json 文件里面进行配置演示的,配置文件配置的方法在里面。好, 这一部分呢,会给到大家两个完整的实战案例。第一个实战案例是研究报告的自动生成系统,那这个可以在两个小时之内呢,生成专业的研究报告,这样一个多 a 阶的系统。原来你做这样一个专业报告呢,可能需要三到五天甚至更多,里面有各个 a 阶的向量 m d 文件怎么来写的? 比如说写作 agent, 搜索 agent 以及写作的 agent。 第二个案例是自动化内容运营系统,里面也包括了整体的架构以及多 agent 的 配置,也是在这个 opencloud 点接受文件里面怎么来写好?第九部分是最后一部分, opencloud 加 cloud code 黄金工作流, 那两个呢,都是当今最火的 agent 工具,一个非常典型的组合用法就是 opencloud 呢,管理整个的数字生活,用 cloud code 管理代码库。 这两个组合应该是二零二六年最完整的最有效的 ai 驱动的工作流。最后一部分就是目录速查手册和资源清单。目录有很多,第一部分就是 unklu 的 命令速查表,那如果你在自己做的过程当中有一些命令忘了,你可以到这个目录里面来查看。还有常见问题的解答, 各种问题我们都收集了,比如说这个 windows 上中文显示乱码的问题,配置的问题,配置之后提醒无效,无效的一个 p i, 还有曾轶路点解删修改之后呢,不生效等等这些问题。第三个目录呢,最佳配置模板里面直接给了个人使用的极简配置,还有小团队推荐的配置。第四个目录呢,是学习资源的推荐,里面有官方的这些资源,国内社区以及相关的技术文档, 还有推荐的书籍和课程。目录的第五部分是词汇表目录,最后一部分是非常重要的,全球我们做了接近一百个真实案例的图鉴,那么这些都是整理来自于 reddit, github, twitter 还有知乎等平台的真实的用户的分享,包含了十七个应用分类, 实际上呢,这个项目啊,一共现在有一百零八个,是七个应用分类来源平台呢,超过了四个,比如说里面有教育学习的、生产的,还有内容创作相关的, 客服相关的,电商零售相关的,这些都是 open cool 的 真实使用的场景,这个相信对大家会非常有帮助。好,这就是我们整个的 open cool 蓝皮书,一百八十九页的完整版的内容,这个应该是市面上目前最全面和最实用的 open cool 的 中文的教程了。 需要这个蓝皮书的可以下方打一个六六六,或者在下方评论区找一下链接,总有一种方式你能联系到我们,这个免费分享给大家,如果这一期的视频和 openglue 蓝皮书对你有帮助的,可以点赞收藏,我们下一期继续。

毫不夸张,你以后所有的文档文案处理工作都可以完全放心的交给欧文科了。今天直接带你来看一个实际案例,以及它是如何帮我解决。我用 ai 工具做了这样一个技术文档的报告,但是呢,它是用 html 做的,现在呢,我需要把它导成 pdf。 如果我们现在只用浏览器自带的,你就会发现格式混乱,内容有偏差,非常的难看。我们把这任务交给欧文科,看他能帮我们做什么。首先他也是使用自带的浏览器工具帮我们去导出,我们先看看结果,这是他导出的结果,确实一点都不好,确实背景颜色, 然后我告诉他把背景颜色加上去,让他重新再跑一遍。我们来看看生成的结果。好,这一版颜色没有问题,跟 html 的 文件格式是一模一样的。但是我发现比如在这里它的分页有了问题,我们再让它改一遍, 我告诉他不要把相同的内容分成两页,然后让它去执行任务,它里面自动把我调整了 html 里面的 css 格式文件,然后重新帮我转成了 pdf。 我 们来看一看最终的结果。好,我们来看看最终的版本格式一模一样, 然后分页也是非常的清楚,图是图,文是文,所以完美的帮我们完成了任务。看完之后,如果你也想正确的把 oppo 核桃部署在你本地,我们正好在工具群里面提供这样的课程,如果你感兴趣,可以看视频主页介绍,第一行会有专人给你提供更多的信息和介绍。

大家好,今天我来教大家如何在 windows 系统上快速安装部署 open clone。 open clone 是 一个强大的 ai 工具,可以帮你更加高效地处理各种任务。 安装过程其实也挺简单的,只需要几分钟就能搞定了。 首先我们先登录它的官网,也就是 open clone 点 ai, 然后在下面这里找到这个运行到你的机器上, 打开之后我们可以把它切换到这个中文模式,也就是这个,然后点击安装这里一个步骤,这是系统要求 windows 所要求运行在 wsl 二上面。 首先的话,我们需要在 windows 系统上安装这个 wsl 二, wsl 二是适用于 linux 的 windows 子系统,允许开发人员在 windows 上运行 linux 的 环境。然后这是个安装文档, 首先我们要运行这个 wsl 杠杠一 doo 命令,我们可以打开这个终端, 这终端必须使用管理员的身份打开, 我们搜索, 我们以管理员的身份打开终端右键,以管理员的身份运行,然后输入这个 wsl。 杠杠一 stop, 我 这边已经安装了,所以说就不用执行这个步骤了。 在安装 wsl 的 时候,我们可能会碰到一些问题,比如说没有开启这个虚拟平台就会导致这安装失败,所以说我们要确定一下, 我们可以在这开始的时候输入这个 windows 功能, 点击,然后从列表中选择打开或者关闭 windows 功能, 然后找到这个虚拟平台。 我这边已经勾选了,所以说不需要再次勾选。 然后当这个命令执行完毕之后, 我们可以检查一下当前运行的版版本是什么,点击复制, 然后当前运行版本是 g o 乌班图的,我们可以换成其他的版本也可以, 如果想更改版本的话,我们可以通过这个命令进行更改,或者打开这个应用商店 输入, 然后咨询选择版本进行安装。我已经安装着过了这个二十二点四的, 然后安装完成之后我们搜索这个终端,然后点击,点击之后这里有个侠列表,我们选择这个安装的无弯图, 然后这里开启我们真正的安装步骤,然后在这里我们就可以暂时安装了, 我们首先使用这个快速安装命令,点击复制粘贴回车,然后这里会让我们输入这个密码,就是当时我们安装这个 double s l 的 时候会有个密码输入, 输入完成之后回车,然后接下来它就开始安装了, 这里已经下载完了,然后这是正式的安装步骤,然后这里让我们是否继续,我们选择是到这里我们选择第一个, 然后这个揭露的模型是让我们选择哪个模型啊?这里就选择这个千问的模型就行了,然后这里会让我们等待,让我们登录这个阿里千问的模型, 我们需要把这个网址复制,复制到浏览器粘贴, 然后我们需要登录到这个千万模型,然后这边我已经登录自己邮箱,并且认证成功了,然后我们回到这个命令,行, 这个 let, 我 们选择对应的模型,我们选择这个保持默认就行了。当前模型, 然后这个的话是配置那个飞书或者其他工具,安装的时候可以选择这个跳过, 然后这个的话是让我们现在是否配置几呢?选择否,然后这里的话是通过这个空格键选择,这是因为是多选的嘛。然后我们这个也跳过就行了,让安回车。 然后这个是让我们通过哪些方式进行预览?我们一般选择这个,通过这个 web, 也就是网页, 然后到这里我们就已经安装完成了,并且这个也已经启动了。然后在上面他会有个地址,我们复制这个地址, 然后粘贴到浏览器,然后这个就代表已经安装成功了,我可以跟他聊天, 你是谁? 好,然后这个就代表已经安装成功了。 好了,这个 open clone 龙虾已经安装完成了。是不是挺简单的? 然后今天视频就到这里了啊,感谢观看,然后下期再见。

大家好,在你装完 openclip 之后啊,第一件事要做的事情就是去选择一个模型,那模型作为 openclip 的 大脑,它起到一个非常关键的作用,那这么多模型,那他们之间有什么区别呢? 那为什么你的模型只能识别文字,不能识别图片呢?那本期视频呢,就跟大家讲一下不同的模型之间能力的区别,以及怎么去配置模型。那对于一款模型来说,它的能力有接收信息,那信息类型啊,有可能是文字,也有可能是图片, 也可能是视频、音频或者其他就是你发的信息的内容可能包含这些类型。那么大模型在接收到你这些信息之后,他对你的信息进行回复,也有可能有这些类型,比如说他回复文字,给你回复图片,给你生成一张图片,或者说做出来一个视频, 或者说做出来一个音频音乐,那么也有可能是进行一个网页的搜索,你让他调用了搜索的工具进行一个网页的实时搜索, 那么这这两个东西就是一个输入和一个输出,那不同的模型之间的差异啊,就表现在接收和回复这个信息的内容区别上。那么 open core 官方呢, 截止目前也统计了一个模型的一个使用的一个排行榜,那么这个排行榜里面的模型的排名,不是说我们传统意义上那种模型的一个综合排名,它更多强调的是在 open core 里面的任务的完成的成功率和这一个排名,大家可以看一下, 就是平均的一个排名,就是比如说第一的是 gemini flash, 那 么第二的是 mini max 二,二点一,那么对于 mini max 它现在已经发布到二点五了,但是二点五的表现是在这个排行榜是比较差的, 这个也是非常奇怪的。那么前面还有这个 kimi 的 k 二点五,就这些模型在任务完成的成功率是比较高的,所以这也可以作为啊模型选择的一个参考。 接下来我们就来说一下不同模型在接收信息和返回信息之间的差异,大家可以去选择。就是你在完成任务的时候,为什么有些模型处理的不好,那比如说我们 dbisc, 那目前 v 三点二版本它只支持一个文本的输入和文本的输出,那么对于千万三点五 plus 来说,它能接收文本,也能发图片,它也能去理解这个图片是什么。比如说在我的这个 openclip 的 这个非书的聊天里面,我上传一张图片,那模型来识别一下图片中的文字, 如果你的配置的模型它不支持这种啊图片的识别,那么它出来的结果就是跟实际的结果是有很大的差异的, 那么可以看到它识别出来了这个图片里面的所有信息是完全非常准确的。那么在刚刚的演示里面,我们可以看到千万三点五 plus 它是有一个图片理解能,所以大家在用的时候一定要注意自己的业务的场景 啊,选择正确的模型。那么这里边除了图片理解呢,这边还有一个网页搜索,就是说它本身模型它本身支不支持这种搜索这种内容,因为对于模型来说,知识库它是有一个截止时间的,比如说你可能你 模型的训练数据可能只是截止到二零二五年,但是你现在搜索二零二六年的,那就有些模型他是具备这样的网页搜索能力,他就可以调用这种 实时搜索能力,那么有些是不支持的,那就要配置这样的 m c p, 官方也出了这样的工具,比如像豆包系列,二点零最新的模型也是一样支持文本和图片,那么他这边也是可以单独去开通网页搜索的能力啊。 那我们可以看一下,就是啊这几款国产的,比如说 mini max m 二点五、 m 系列和这个智普的五点零,他们这个图片的识别是需要单独去配置 mcp 的, 不然的话他是没办法去识别的。 那 timi k 二点五的话是原生就支持图片识别,那么国外的模型,比如说 colossal 四点六和 jpeg 五点四,还有 jimmy 的 三点一 pro, 那 么它们都支持图片识别,也支持这种啊网页的实时搜索,那算是这个综合能力算是比较好。那其他的比如说你要去让模型去申请个图片, 那基本上我们现在用到的这主流的这个啊主模型啊都不具备,那么你就可以去调用他们专门的图片模型。比如说像千万,他有专门的万象系列的生成图片的,那么都包括有纪梦相关的模型,那么像 jimmy 的 话,有专门的这个深图的模型也是可以的。就是这些 又需要去单独去配置,在你去生成图片的时候去告诉他去调用这个模型去做这个事情,那像这个火山,这个 cds, 二点零系列都是可以去生成视频的,那么这个就是一定要知道,就是一款模型,它不是万能的, 你可能需要不同的模型来配合去完成你的业务的场景,所以一定要一定要弄清楚你的业务场景里面涉及到了文本、图片、视频、音频, 就把这个东西先想明白了,再去找对应的模型配置好,就才能去把整个东西,整个东西串起来。选好模型之后,很多模型厂商都会有两种购买方式,一种叫做按 token 购买,就是 按用量购买,用多少啊你就付多少,这种方式是比较自由的,它是不受任何限制的。那么第二种就是按这种 coding plan, 就是 套餐的方式,那这种套餐是什么样子呢?一般是有 有限制,比如一个月能用多少次,然后一周能用多少次,然后五小时能用多少次,它是有一个这样的一个限制,会每隔五小时会刷新,每一周会刷新,然后总流量是不超过啊,每个月总流量那么像智普啊, mini max, 豆包,还有这个千万 都出了相关的这种啊这种代码的套餐啊,就是可以可以编码,又可以用在 openclo 里面,那每一个套餐这个量是不一样,大家一定要注意去看,它可能在官方的介绍里面会说啊多少多少次请求,但是要换成就是你的一次对话,就是你跟 openclo 对 话一次,可能要 调用很多这样的一个请求,那么这样的次数是没有他说那么多的。最后呢,就是我们选择好了模型之后啊,我们怎么去配置?第一种方法就是啊原声的就是它 openclo, 它本身你在配置的,你在安装的时候它是有模型的一个列表的,比如说你输入这个 openclo config menu, 那 么 到这一步的时候,你选择这个 model, 就是 你需要去配置这个模型这边的话就会选择很多啊,它本身的支持这个 pro i 的, 就是它本身已经内置了这这些模型的链接,那么你点进去之后,你就可以去输入你的 a p i t, 或者说输入你的这个认证授权的一个链接啊,那这能快速的去完成。那还有一,还有一些它可能是不在这里面的,比如说像千万千万的这个 codeplain, 还有一些其他的这种模型的配置啊,那么你就可以使用这种 cc switch, 那 这款软件,那这款软件呢?有一个单独的一个菜单,那么点进去之后你可以去进行配置,也是一个图形化的界面。那接下来就是这种比较繁琐的,就是去编辑这个这个 配置文件,那这个是 openclip 的 一个啊,总的一个配置文件,那这里面的话,你就要去修改这个 providers agents 里面的内容。一般是 如果你选择哪个模型厂商的话,它会提供这样的配置文件修改的,这个啊完整的字幕串,你直接去给它修改掉就行了。那么如果你自己改这个接线文件,因为这个接线文件非常大, 嗯,不太方便了,你可以借助这个 ai 编程工具,比如像 tree 啊,像 cos 啊去帮你去修改它,它这边是可以去给你修改,而且可以去给你修复可能修改出来的问题啊。 那除了这上面的方法之外,那就可以用它自己的这个外部端里面的设置里面找到这个 modus 的 节点啊,但是它这个说实话非常非常难用啊, 我觉得用上面的方法都比它这个官方这个界面用的会可能会更简单一点。那你如果配置完之后啊,最好是重启一下,那么你在页面上可以点去重启,或者说输入这个 open curl, get away restart 这些命令去重启,重启完之后,那么你就可以去使用新配的模型了。 ok, 那 本期视频到这,希望这个视频对你有所帮助。

敢说如果没有自己详细看过这个 skills 的 人,绝对没有办法养好小龙虾。这个 skills 它是自我进化的一个 skills, 这个是现在目前所有 skills 里面下载量最多的一个, 我们今天来详细看一下这个 skills 它是怎么样构建的,你就会对整个 open curl 和它的一些配置能更加的理解。 它是一个纯英文呢,我就直接让 cloud code 给我做了一下翻译,当然大家如果用其他的也可以,甚至你让它自己把这个逐句翻译了之后,给你保存在一个文件夹里面都是可以的。 ok, 我 们就来看一下它的这个是怎么样的一个东西。 首先它的这个架构就是非常标准的 skills 的 一个架构,有一个 skills 的 文件 markdown, 然后这个原数据就是它的一些版本号啊这些,这个是它自己自带的一个文件夹,其他的这个东西就是它的一些资源。然后 hook 就是 它的可以理解成它的脚本,它会把这个钩子 去放在你的 open curl 的 配置下面。嗯,当 open curl 它在回答一些内容或者调用什么模式,或者告诉你这个任务完成的时候,这个钩子就会去检测这个内容,检测了这个内容,它就会去调用某一些脚本,或者说自动地把一些提示词放到这个 open curl 里面,让 open curl 再去跑一遍它的一个流程, 重点就是让 open curl 去思考一下刚才的任务到底需不需要去进化到它的记忆里面,去进化到一个新的 skills 里面,或者去更新新的 skills。 它主要的功能是这个,这个就是它参考的一些文档,比如说势利啊,比如说这个后壳应该怎么样安装,还有这个的一些知识,这个 script 就是 它的具体的脚本了, 这个脚本基本上就是它后壳的脚本,钩子的脚本。 ok, 我 们来一点一点的看。首先是看这个 skills, 这个 skills 就 标准的 skills 的 格式,首先是它的原数据,这个东西会直接加载到大模型和 opencorp 它的一个上下文中,它才知道什么时候需要用这个 skills, 如果它需要用,它就会自己去看这个东西, 但是这也是一个比较坑的点,你稍微模型差一点的,它根本就不会去看这个东西,因为它会聚焦去完成你的任务,它的注意力是没有那么多的。所以说 你通常如果说想要去进化的时候,你去直接告诉他显示的命令,他让他去完成,去使用这个 skills, 让他去调用这个 skills, 然后下面就是如果他需要调用的时候,他就会去查看下面的东西。 ok, 我 们来一点一点的看这个 skills 的 描述,就是什么样情况下会使用它。其实就是让 open curl 让模型知道什么样的一些特征的时候, 就要使用这个 skills 了,比如说命令操作失败,用户纠正了,然后用户请求不存在的功能, a p i o 失败,其实就是捕获一些关键词,关键的意图的时候,它就会去激活它,就是让模型知道什么时候应该激活这个 skills。 我们来看一下这个就是它的一个 markdown 格式的文档,首先是它是一个什么东西,然后它是一个持续改进的什么内容,参考的信息,它是怎么样存放的?可以看到它把这个地图首先放在了最前面,它是怎么样安装在这个 open curl 里面? 呃,这个我感觉有点广告的嫌疑,你已经安装了之后,还还放在这个 skills 里面,按理来说它应该用一个 readme 会更好一点,这个会造成模型的这个上下文是不需要的, 然后它会告诉这个模型这个 open curl 的 一些信息。 open curl 的 这种工作区的内容就是它的 worker space 这儿它是什么样的一个框架,主要的个这些文件到底是什么格式,它进行更新的时候,它就可以更新这些文件,然后它就能了解到 open curl 它是一个什么样的东西。 它主要分成了三个部分,它会创建了这个 skills 的 时候,它会把这个文件直接复制到哦你的 workspace 里面去。直接会有这个文件夹,其实就是这个 skills, 它去维护这个文件夹里面主要的内容, 首先是学习的一些信息,再就是错误的一些信息,然后就是调用工具的一些信息。事实功能可以看到它就说首先你应该去创建这个文件, 然后去说一下直接复制过去,然后提升的目标是为了让你的一些工作技能可以沉淀到这里面去。 这三个其实就是 open curl 的 一些核心的配置了,可以看到 open curl 里面的核心的配置,这个是属于它自己的一些配置,其实这都是它去了解这个 open curl 是 一些什么东西,怎么样配置的触手化配置这个部分就是有用的,就是下载了这个 skills 的 时候,它应该按照这个过程,先把这个 skills, 把它的这个 open group workspace 的 一些东西先配置了来,可以看到,然后可选这个起用钩子。为什么必须要起用这个钩子?虽然它说是可选,因为我们用的模型往往都不是最强大的模型,比如说 opus, 它对你的指令它是会更加清晰的。但是我们用的这些稍微小一点的模型,像国内的 kimi, k 二点五这些,你不显示地去指挥它去用哪个 skills, 它大概率是不会用的,它的指令遵循是没办法注意到这么多信息的。所以说你必须要起用钩子, 钩子他就会强制的让这个 open curl 去完成某一个功能的时候,他会去思考我到底需不需要去调用这个 skills。 这个就是一个比较大的坑,如果我们是用国内的这种稍微小一点的模型,稍微不好一点的模型, 那么你钩子是必须要起用的,要不然你这个装了之后基本上就感觉没装一样。我相信很多人都已经装了,但是如果你没有仔细去读的话,大概率是没有起用这个钩子的, ok。 然后他也说了一下通用的其他配置,在其他配置里面也可以去创建,像 cloud code index 也可以去创建,这个东西就不太适合这个内容了,其实可以把这些东西删掉,因为他会影响他的上下文。然后就是怎么样去追加你的信息。 首先是学习到的内容应该追加到这个学习的 markdown 的 文件里面,他的格式是什么样的,然后是什么样的东西? 然后就是错误的信息,它的格式是什么样的,是什么样错误的信息,应该怎么样格式去把它说出来,然后它的时间戳这些都要保存下来,但是我是没看到它这个时间是从哪里获取啊?如果说时间是一直放在这个 open curl 里面的话,会自动更新的话,那是不太好的,还会严重的影响这个 k v k h 的 命中率。 还有就是这个功能请求的 markdown 文件应该放些什么东西,然后它的格式是什么,它也说明了一下,然后 id 的 生成应该怎么样放 id, 其实这些都是一些案例事例, free shot 它应该怎么样放在哪个里面?这儿也有 可以放到这种项目记忆的,当一些错误的记忆啊,这种学习的记忆可以广泛使用,而且使用了非常多次的时候,它可以把它直接放在这种文件夹下面。这种比如说 cloud code, 比如说这个 so tools, 比如说这个 so 哈,它是一直会放在 这个 open curl 的 上下文里面的模型上下文里面的,它会全量加载,不像 skills 的 这个文件,它只会加载最前面的那几行,这个东西它是会全量加载的,所以说如果说非常需要经常用的这种规则,就可以直接加在这里面,这个就是他说当一个不是一次性修复,可以把它保存到永久的项目记忆中,就是这个东西。 还有它应该怎么样去检测这些关键词什么时候应该写在什么地方,什么时候它是功能请求,什么时候应该学习,什么时候是一些错误的, 然后优先级的一些指南,这个就是它应该怎么样去放,这个倒没有特别重要,就是它要去做提升的时候应该怎么样写,怎么样去排优先级啊这些,然后最佳实践这些 还可以进行 get, 可以 把它提交上去。其实最最重要的,我个人认为就是这个 hook, 大家一定要把它配置上。如果 你不是用的 opus, 四点六这些模型,一定要把它配置上,就算是用的 opus, 你 也最好把它配置上,因为现在很多这种厂商它都有这种会员套餐,比如说一百块钱,然后一个月基本上你是用不完它的托管的,所以说大家一定要配置这个东西, 这个东西只会多消耗你的托管,但是它能让你的体验感和这个 cf 提升会更加的强,要不然你这个东西装了跟没装一样,因为我们的模型本身不太好。 ok, 那 我们来看一下它其他的一些内容,比如说这个脚本吧,这个就是钩子的一些脚本怎么样去配置,然后它会把这种信息重新发回给这个 open curl, 就是 让 open curl 显示地去说明一下,你需不需要去记录,需不需要去更新一下这个 skills, 然后这个其实大概也是这样,然后这些就是参考的一些资料,比如说怎么样去做修改,然后工作区的结构,比如说 open curl 的 一些知识,工作区的结构应该怎么样去修改,然后有什么特点,有什么规则, 然后这个是钩子应该怎么样去做配置,可以看到应该怎么样去做配置,这是 cloud code 的, 它之前是因为这个开发者,它是一个 cloud code 的 自我提升的一个 skills, 它出来了之后再把它换成的这个 open curl, 它有些是没有改的, 但是大差不差,它只是这种项目跟目录不一样,其实它的逻辑都是一样的。然后这个就是后壳的一些配置,可以看到它 open 或者 cloud code 还有 codex 这种配置都有。 ok, 还有就是 example 了, example 就是 你什么情况下应该去放什么样的内容,以及这个内容 markdown 的 文件应该放什么样的东西,然后它的一些势例, ok, 这也是后壳的一些东西。后,后壳的一些 markdown 的 东西,它这个也跟这个 skills 的 框架一样,我不知道它是因为要先把这个东西发给向后壳执行的时候,它会先把这个东西发给这个 open curl, 可能是这样的,然后后壳的 这个就不是参考的,这是一些资源,它可以直接复制这个技能的一些模板,模板资源,然后学习的这个条目应该直接放在这里面, 应该是什么样的一个格式,它可以直接复制过去,然后我再去做一些修改,然后这个东西就没有了。这个东西它就是让 open curl 把这个东西直接复制到它的 workspace。 总结来讲,这个 skills 就是 专门用于提升的,提升和进化的,只有你真正看了这些 skills 了之后,你才能对这个 o workspace 有 一个比较好的认知。 但是我个人认为哈,我们的后壳甚至不要用它的这种方式,我们可以直接创一个子质人体后壳来调用这个子质人体去更新它的记忆,我觉得这样更加的好,但是这样肯定更消耗头肯,但是如果说按照他这种后后壳再发给 open curl 的 方式的话,它会破坏它的上下文结构, 它会导致上下文的长度会很快就满了,所以说你的这种执行任务的效果就会大打折扣。当 我们买了这种稍微大一点的这种会员套餐的时候,可以建议使用这种子智能体的方式,你专门创一个子智能体来更新记忆,更新这种学习的经验,然后哦后壳跟这个子智能体进行绑定上, ok, 这就是今天的一个分。