各位开发者朋友们,今天我要给大家介绍一个真正改变游戏规则的工具。大家都在谈 ai a 键有多强,能规划,能推理,能写代码。但有一个问题被反复忽视, a 键他根本用不了大多数真实软件想让 a 键,他帮你批量处理 g i n p 图片, 没有 a p i, 让它操控 blender, 渲染一个场景得靠截图点击,脆弱的一碰就崩。想用 agent 自动生成 libraface 报表,只能用残缺版的拍散封装,丢掉了百分之九十的原声功能。这就是 ai agent 的 最后一公里难题。 agent 再强, 也用不了真实世界的软件。香港大学数据智能实验室 h k u d s。 的 研究团队提出了一个不同的答案, c l i anything c l i anything 是 一个开源的 cloud code 的 插件, 核心能力只有一句话,把任何有源代码的软件自动生成一套 a j n。 原生的命令行接口 c l i。 它的底层逻辑来自一个朴素的洞察, 可以是人类和 ai agent 共通的万能接口。为什么 c l i 天然适合 agent 呢?第一,结构化。可组合文本命令天然匹配 l l m 的 输入格式,可以自由串联成复杂工作流,就像搭积木,每个命令都是一块积木, 可以随意组合。第二字描述,一个 help, 就 能让 agent 在 运行时自动发现所有可用功能,无需手写 api 文档,就像你拿到一个新工具,看一眼说明书就知道怎么用。第三, agent 友好,内置 jason 标志,每条命令都能输出结构化 jason agent 无需任何额外解析,就像两个人交流,用结构化的语言比用方言更容易理解。第四,确定且可靠, 输出稳定一致。 a 键的行为可预测,经过验证, code code 的 每天通过 c l i 执行数亿千亿的真实任务。 clean anything 的 核心式,一套全自动气阶段生成流水线,即分析架构设计 c l i 实现模块规划、测试、编辑测试生成文档发布,整个过程无需人工介入。最终产出一个包含以下特性的 python 交互模式,支持逐步迭代的绘画式操作。 就像你和朋友聊天,可以一句一句地交流,而不是一次性说完所有话。第二, jason 输出模式。 jason 标志让 agent 直接消费结构化数据,就像你给 agent 发送一份格式化的报告,它可以直接读取和处理。第三,撤销重做。完整的绘画状态管理, 就像你在编辑文档时,可以随时撤销和重做,不用担心出错。第四,全套测试覆盖单元测试加端到端测试。目前九大应用共一千四百三十六个,测试通过率百分之一百。就像你盖房子,每个环节都经过严格检查, 确保质量。第五次描述文档,每个命令都有完整的 help 说明, agent 可在运行时自主发现,就像每个工具都自带说明书,随时可以查阅。 c l i anything 已经为大量主流开源软件生成了现成的 c l i 接口,覆盖范围相当广。创意工具、 ai 平台、办公套件、数据工具、开发工具、 图标格式化等等一应俱全可以。 anything 的 安装非常简单,在 cloud code 的 绘画中运行两条命令即可完成安装。第一步是添加插件市场,第二步是安装插件,无需任何额外配置,装好即用。安装完成后,只需将软件的本地路径或 git 部仓库地址传给插件 期阶段流水线自动运行。比如为本地 g i n p。 源码生成 c l i, 全期阶段自动完成。生成完成后,将 c l i 安装到系统 pass, 全程交由 cloud code 替你完成安装就好了。如果生成的 c l i 还不够完整,你可以叠代优化 c l i, 扩展覆盖面,并补充缺失的功能。 除 cody code 外,克里安尼尔森也支持其他主流 ai 编程工具,如 open code codex 等。 c l i anything 提出了一个相当有钱占性的命题,今天的软件是为人类设计的,但明天的用户将是 a 卷 t, 我 们需要提前为这个迁移做好基础设施。 它的核心价值在于,第一,彻底绕开 g u i 自动化的脆弱性,不依赖截图,不依赖点击直接对接软件的真实,后端保留百分之一百的原声,功能稳定可预测。 第二,一个命令通吃。所有软件只要有源代码,无论是 g i n p blender、 libreoffice, 还是你内部的私有工具,统统可以一键生成 a 阵的可用的 c l i。 第三, a 阵友好的设计哲学贯穿始终,结构化 j 四输出, help 字描述, r e p l 模式完整测试覆盖。每一个设计 决定都在降低 agent 的 使用门槛。第四,多平台多工具胜肏 code code、 open code code x clean anything 的 设计是平台无关的,正在向更多 ai 编程工具延伸。如果你正在构建需要操控真实软件的 ai agent, clean anything 值得认真评估, 它很可能是目前这个方向上最系统、最完整的开源解决方案。各位开发者朋友们, ai 舰的时代已经到来。今天的软件是为人类设计的,但明天的用户将是 a 舰艇,我们需要提前为这个迁移做好基础设施。可以, anything 就是 这样一座桥梁, 它让任何软件都能被 ai agent 直接操控。彻底解决了 agent 的 最后一公里难题,一个命令通知所有软件。这不是科幻,这是现实。如果你正在构建需要操控真实软件的 ai agent, cleanything 值得认真评估。为 agent 的 时代做好准备,从 cleanything 开始。
粉丝244获赞3149

c l i anything 让所有软件变成 ai agent 的 原声工具。一条命令把任何软件变成 agent。 可以 通过 c i i 控制的工具安装,超级简单,只需要添加这个 marketplace, 然后安装 play anything 插件,一行命令,插件就装好了。最酷的部分来了一条命令就能给任何软件生成完整的 c l i 接口。比如给 g m p 生成 c l i, 它会自动完成分析设计,实现测试文档和发布全部七个阶段。 它支持的平台超级多, cloud code, open code code, 还有更多平台正在路上。基本上你想用的主流 ai 编程工具都支持它能做的事情超乎想象。 创意工具,像 gimp blender create 办公软件,像 library office 开发工具,像 jenkins github, 还有像 zoo 这样的会议软件, 全都能变成 agent。 原声工具质量也是顶级的。十一个专业应用,一千五百零八个测试,百分之百通过率。每个生成的 c l i 都经过单元测试和端到端测试,确保生产环境可用。它最大的优势是什么? 不是用 u i 自动化,不是调用有线的 a p i, 而是直接生成真正的 c l i 接口。完整的软件能力零妥协。 agencies 可以 像专业用户一样控制这些工具。 c l i anything 让任何软件都能被 ai agent 控制,不需要 api, 不 需要重新实现。一条命令,让软件真正变得 agent native。

欢迎观看 blender c l i anything 无头渲染实战。今天我们来探索如何使用 c l i anything 为 blender 构建命令型接口,并在无头环境中进行三 d 渲染。 c l i anything 是 opencloud 的 一个技能,它可以为任意 gui 软件生成命令行接口,让 agent 能够通过 c l i 控制这些软件。 我们的核心挑战是在无头服务器环境中没有图形界面, blender 无法直接使用,故意渲染。 第一步,安装 c l i anything。 我 们从 gighub 克隆仓库并将 openclaw 适配器复制到技能目录。 c l i anything 提供了丰富的 blender c l i 功能,包括场景管理、对象操作、材质系统、灯光、相机、动画渲染等。我们创建一个三 d 场景,可识画三角函数,正弦、余弦、正切 场景,包含一百六十三个三 d 对 象。第四步,解决无头渲染问题。我们安装 x v f b 虚拟显示服务器,为 blender 提供虚拟图形界面。 选择合适的渲染引擎很重要。经过测试, cycles 在 无头环境渲染会全黑,而 ev 可以 正常工作。 第六步,修复材质分配问题。原始脚本使用条件判断导致材质未分配,我们改为直接分配材质。 现在执行渲染,使用 blender 后台模式运行脚本渲染时间一分十八秒。技术要点总结, x v f b 是 必须的, ev 引擎优于 cycles, 材质要直接分配。灯光强度建议大于等于五点零。 最终结果一千九百二十乘以一千零八十高清三 d 渲染图清晰展示三条三角函数曲线。结语,通过 c l i nifin 加 x v f b 加 ev, 我 们成功实现了无头环境下的三 d 渲染。感谢观看。

港大前几天不是开源了一个项目叫 still i anything 吗?截止到今天,这个新标已经飙升到了九点五 k。 这个项目呢,跟我一贯用这个 ai 的 理念,它非常契合,就是不要让 agent 例如这个 open k 龙虾 去操作图形界面,而是将图形界面转换成命令。行啊,去去用, 我用了这个两天呢,虽然它还有一些不足,但整体真的非常棒。可以看一下我这个刚转的这个小卡, 它的一个概念就是比如说这个是小卡的一个,它是一个开源软件,它的这个功能类似于剪映,但是我们如果手工去操作,你必须点点点点点,那通过它这个项目呢,你就可以把它转换成一个 一个命令。行。那现在你要用 openclaw 去控制它,比如说进行一些音频啊,视频的剪辑操作啊,那就变得非常的方便了。 这个项目呢,它原声是是支持 claw code 的, 你可以直接在那个插电市场去安装它,但它不支持 tree。 嗯,于是我就撸了一个脆的 m c p, 添加了这个项目 c o i 对 脆的支持,在脆中要去构建某一个 c o i 也就非常方便。你看像我这个使用案例,就是我让他我通过我自己构建的这个 m c p, 然后让他帮我 用它去构建一个这个。打错了,不是这个,而是让它构建了一个小卡的 c o i 啊,一会就一会而已,它的这个小卡的工具已经构建好了 啊,我也向这个原作者去提交了 pr, 那 这个原作者他也是第一时间对我进行了回复, 后续我将继续改进我的这个构,为 cui anything 添加生成中文 cui 的 方法,因为这个生成起来都是英文,所以不方便我们使用。 命令肯定是都要英文,但是这个讲解我可以给它搞成中文的啊。那现在这个对确支持的这个 ncp 我 已经放到我的个号里面了啊,有用到的小伙伴可以自己去取了,有很详尽的说明书。

vs code 插件 c l i 的 配置教程 我们先来到插件列表,这里搜索 clan, 找到 clan chinese 安装这个插件,安装好之后这边会出现小头像,点击这里,它最开始是这个样子的, 再点击右上角设置之后会出现 a p i 配置供应商选择 open ai 兼容基础 u r n 复制我们站点链接, 输入进去后加个 v e, 你 要打开站点令牌名称,可以随意 令牌分组,选择 cloud code 或者 action cloud 都可以,再勾选无限额度,其他不用选择。创建好之后,然后点击复制, 把密奥粘贴上去。因为我们这个令牌是 asher 的 分组,所以我们要去模型广场 asher 这里查看可用模型, 在这里可以看到的模型都是我们这个分组可以使用的。我们以这个模行为案例到这里把模型 id 复制上去,点击完成就可以开始调用了, 这个报错可以不用管, 现在就是可以正常使用了。它是分为两次请求,一个是介绍,一个是它自带的 a p r 请求, 我们可以再使用日制,检查一下是是否正常调用。

昨天一出就火遍全网的 m m x key 究竟怎么用? mini maxi 的 c l i 工具,简单说就是一个能在命令行里直接调用 ai 能力的工具。它就像一个 ai 魔法盒,你只需输入简单命令, 就能生成文字、图片、视频、语音甚至音乐,是不是很酷?这款工具特别适合喜欢在终端里工作的朋友,也是和 ai 一 阵开发者,它支持国际版和国内版平台,非常贴心。 接下来给大家讲讲安装方法。安装这个工具超级简单,首先你要确保电脑上安装了 note j s 十八或更高版本,没有的话去官网下载一个就行。然后打开终端,输入这行命令, n p m install 杠 g m m x 杠 k 等待几秒钟安装就完成了。 小提示,如果是在 ai agent 这些工具,可以用这个命令添加技能, m p x skills admin max ai k y g 安装好之后,最重要的一步就是认证,你需要有 mini max 的 api 密钥,要是还没有,可以去 mini max 官网注册一个账号,购买 token 套餐。有了 api 密钥之后,在终端里输入 mmx off login api keysk x, 把 s k x x t 换成你自己的秘钥就行。认证成功后,你就可以开始 ai 创作之旅了。现在让我们来体验一下这个工具的魔力。我给大家分几个场景介绍。场景一,文字创作想写诗写代码或者聊天试试这个 m m x text chat message, 写一首关于春天的诗。 要是想和 ai 多轮对话,就输入 m m x text chat message。 你 好, mini max 场景二,图片生成想象一只穿宇航服的猫是什么样? 输入 m m x image, 一 只穿宇航服的猫要是想批量生成,还能控制比例,就用 m m x image generate prompt 科技感 logo menos enitrate 幕思 aspect ratchet this says navi 场景三,语音合成想把文字变成语音,有三十多种音色任你选 manx speech synthesis text 你 好 out hello 点 mp 三,还能调节语速和音色场景四,音乐生成想创作自己的音乐连歌词场景四,音乐生成想创作自己的音乐连歌词都能自定义输入 m m x music generate prompt 主歌啦啦啦阳光照 纯音乐背景也可以输入 mmx music generate prompt 史诗管弦乐 instrumental out bgm dot mp3 场景五,视频生成想生成一个海浪拍打礁石的视频输入 mmx video generate prompt 海浪拍打礁石 a sink 场景六,图片理解看到一张图片,想知道里面是什么?输入 m m x vision photo 点 jpg 或者问 ai 更具体的问题,输入 m m x vision describe image h t t p s 冒号斜杠斜杠 e x a m p l e 点 com 斜杠 i m g 点 jpg prompt 这是什么品种的狗?除了这些基本功能,我再分享几个实用小技巧,查看使用额度输入 m m x code, 能随时查看你的 toker 剩余情况。切换区域输入 m m x config set key region value cn, 国内用户用 cn, 国际版用 global 更新工具输入 mimix update, 保持工具最新版本。搜索功能,输入 m m x search query q 最新动态 output json, 能直接在终端里搜索信息 好了,今天的教程就到这里总结一下 mini max ai 的 c l i 工具是一个在终端里就能玩转 ai 创作的神器,从文字到图片,从语音到音乐, 从视频到搜索,功能齐全,操作简单。无论你是想快速生成创意内容,还是想在开发中集成 ai 能力,这个工具都能帮到你。最重要的是它让 ai 创作变得触手可及。

兄弟们,最近港大开源了一个非常牛逼的项目, c l i anything, 可以 一键扫描软件源代码,生成一整套完整的 c l i 命令,从而把软件直接改造成 ai 可以 直接调用的工具。 开源不到三天就已经暴涨了近四。 k stars 只需运行这一行代码,原本只能给人用的软件就可以直接接受 ai 调用去完成任务。有了它,你的小龙虾就可以承担更多的任务, 包含图像编辑、视频剪辑、三维建模、视频会议等经过测试能百分之一百完成的任务。我相信,当人们常用的软件都能为 ai 所用时,那么人类离完全自动化的智能体时代也不远了。

非舒克利安装步骤无废话白。以 clotcode 为例,启动 clotcode 后,直接将安装指令发给他,完整安装指令可在评论区复制或截图复制,中间会有一些提示,啥都不用管,直接发送帮我完整执行即可。稍等一会儿,会出现一个创建链接, 直接将链接复制到浏览器中,打开配置好头像和名称后,点击创建,继续啥都不用管。再稍等一会儿,会再给你一个授权链接,直接将链接复制到浏览器中,打开勾选后点击开通并授权,依然啥都不用管, 大功告成。此时就可以通过 cloud code 操控飞书了,无论是发消息、创建文档、分析、多维表等工具的安装过程同理。

啊,这些东西呢,我们都在今后会详细的说,我们这里就简单的把这个地,把这个命令复制一下,然后进入终端啊,这个无这个无所谓啊,随便在哪个目的都可以,然后粘贴一下这个命令回车 目的是呢,把他的我们的原地址啊,就下载的原地址配置到我们国内的服务器啊,是一个淘宝的服务器。好了,配置好了过后呢,我们就是最后检查一下啊, n 片 coffee get register, 看一下这个检查我们配配置的是比是不是成功的,如果说得到这么一个结果的话,配置就没问题,没问题吧。啊,这是 配置原地址。好,配置原地址配置好了过后,接下来我们就可以安装这个脚手架工具了。好,怎么安装呢?我们这里使用全局安 安装的方式啊, npm insto 表示安装,横杠系呢表示全局安装,那么至于什么叫全局安装啊,那还有没有别的安装方式?还有局部安装,那又是什么回事呢?不用管啊,跟着我说就行了,目前解释呢也不好解释, 粘贴过来回车等他安装就完成了啊,稍微等一会安装完了过后呢,你可以使用这个命令 vu 啊,两个横杠 version 来检查一下目前的 vucd 的版本是多少,如果说打打出来没问题的话,说明就安装成功了啊, vucd 就没问题了。好,这里可能要稍微等一下啊,安装一会喝口水。 好,应该差不多了。好,接下来让我们来看一下啊。嗯,使用 vu cd virtue of view virgin。 好,我们看到了,这里呢,我这里呢 vu cd 的版本呢是四点三点一。 好,你们那边版本能有可能不一样啊?无所谓,区别不大。对,我们这个和资本可能区别不大好。那么安装好了之后呢?接下来该怎么说呢?我们接下来就要使用这个教授加工具来搭建工程了。

如果你最近有关注云代码领域的话,你一定注意到一个显著的变化,从 m c p 工具转向命令行界面。原因其实很简单,这是一次巨大的性能提升。 云代码本来就运行在终端里,命令行界面也运行在终端里,没有中间人,没有额外开销,没有配置,没有任何东西阻碍你的代理与该程序的通信。 所以,如果很明显,这是我们与智能编码代理一起迈向的未来,那么下一个问题应该是,我们有没有办法让这个过程更快,有没有办法让我们创建能够与我们已经在使用的软件交互的 c l i 工具?幸运的是,就在几天前,答案是肯定的,我们可以做到。 这都要归功于一个全新的开源工具,叫做 c l i anything。 这个工具是由香港大学的数据与智能实验室开发。 如果你还不知道他们是谁,他们就是 light rag, rag anything, nano, bot 以及许多其他开源工具的开发者。他们是 ai 开源社区中的巨头之一,所以当他们开发出这样的工具时,非常值得我们花时间去了解一下。 长话短说, cl i anything 到底能为我们做些什么?它允许我们将 cl i anything 指向任何开源软件或者你自己开发的软件,并为其创建一个 cl i 工具, 这样像 cloudco 这样的工具就可以使用它。这一点在这里也得到了呼应。每一个软件都能通过结构化的 c o i 实现即时的智能体控制,任何没有 api、 无需重建 g u i 或复杂封装的应用程序都可以实现。 最终,我们只需一条命令就能把为人类设计的软件转变为原生支持智能体的工具。那么这到底意味着什么呢? 这意味着我们可以让 clockoco 来控制那些通常需要你作为用户通过某种图形界面来操作的软件。还记得我们昨天刚讲过的 google workspace c l i 吗? 和 google workspace 的 原理完全一样。你知道的,我说的是 drive 或者 gmail, 你 会打开 gmail, 点击各种选项,手动完成这些操作。但由于有了 c l i, 你 现在可以通过终端完成所有这些操作。这让我们可以对任何东西都这样做,不仅仅是 google, 也不仅限于其他什么。 只要是开源的,我们就可以把这个指向那个软件,并为它创建一个 c l i, 这将极大的提升生产力。所以接下来我要做的就是向你展示 c l i anything 在 底层是如何运作的。然后我们将进行一个演示,实际把这个工具指向某个开源软件, 提示一下,就是 draw i o, 并为那个应用创建一个 c r i 工具,然后通过 cloud code 来控制它。其实它基本上有一个七步流程,一旦我们安装好 c r i, 我 会演示怎么安装, 然后把它指向我们想要为其创建 c r i 工具的软件,它就会自动运行这七步流程,你完全不用手动操作任何东西。 首先他会分析代码,这也是为什么他需要开源,也就是说他需要真正看到我们所关注应用程序的内部结构。接下来他会进行设计,然后查看输出格式。 实现之后,他会规划测试、编辑、测试、编辑文档,最后发布在这一切完成之后,我们还有一步就是实际对 c i 进行优化和改进。如果第一次生成了,结果并不是我们想要的那样,所以他们在这个仓库里为我们提供了很多与用力相关的内容。我也会把链接放在下方。 但很酷的一点是,它们其实已经为许多大型开源应用做过这件事,比如 gimp, blender, inkscape, audacity 等等都已经实现了,所以它们实际上已经真的做过。你也可以看到一些实际的情况,就是这个实际的 c r i 工具。当你下载这个 cleaning thing 工具时, 它自带了所有这些 c l i。 命令基本上是预装好的,这里能看到每个命令的测试量。以大型项目 blender 为例,它有二百零八个测试,所以它其实非常健壮,而且它们显然已经在开元社区的一些大项目上验证了这个模型。 在今天的演示中,我们基本上会重现他们在 draw i o 上做过的事情。当然,他们已经有了预购。建好的 c r i 可以 直接用,但我们会从零开始做一遍,以此来证明这个方法是如何工作的。现在要开始其实很简单,我们只需要安装 python, 三点一和目标软件。 因为我们要用 draw i o, 所以 我们要做的是安装 anything c l i, 也就是命令行界面工具。然后我们会克隆 draw i o 的 开源 github 仓库。接下来我们只需要把 c l i 指向克隆下来的仓库,它就会生成 c l i 工具。 好的,现在我们要做的是进入终端,为这个项目创建一个新目录,所以我现在在 c l i anything demo 目录下启动 cloud code。 然后我们要安装 c l i everything 插件。现在这些命令就在 github 里面。所以首先你需要添加 c l i anything 工具到 marketplace, 然后我们再安装它。所以只需要复制粘贴这两个命令就可以了,你会知道自己操作正确了。输入 plugin, 看到 c l i anything 已起用,就说明安装成功了。注意,安装后需要重新启动 cloud code, 或者输入 reload plugins 来重新加载。接下来我们要构建 c l i, 但在此之前,我们需要先指定一个目标,所以我们现在要做的是克隆那个仓库。 我告诉 cloud code 去 get clone 这个仓库,我会把这个仓库的链接放在下方。这只是一个开源仓库,它会把整个仓库复制下来,并放到你的目录里。完成之后,我们只需要再执行一个命令,就是 click anything, click anything 然后指向你仓库所在的位置。 所以对我们来说,我们的命令会是这样子的,你只需要按下回车,它就会开始构建 c r i 工具。像这种规模的项目大概需要二十分钟左右。 好了,等他完成后,你应该会看到一条消息,大致意思是所有九项成功标准都已达成,他会给你展示架构的详细信息以及测试结果。最后还有主要功能,现在请记住,你并不是被困在这里。如果你想继续迭代并添加更多功能,非常容易做到, 那么现在我们来实际演示一下。我给 clubcode 的 提示是,让我们来测试一下新的 draw c l i 工具。请为我创建一个详尽且清晰的图标,解释典型的 cas 后端架构,让它在视觉上引人注。 最后,请为我展示绘制好的图标。你可以看到它正在查看 drawl 包。你还会看到它引用了这个 agent harness, 这就是它经常用来指代这个 c l i 包装器或 c l i harness 的 术语。 这是他为我们生成的内容。这是一个 s a a s 后端架构的图标,对吧?相当不错。实际上,这里包含了很多内容, 甚至还做了一些很酷的小设计,比如在这个东西后面加了点阴影。现在这个视频的重点并不是说哦,看看这个 joe 有 多酷。这个视频的重点是,我们刚刚创建了一个之前不存在的 c l i 工具。你知道,就在十分钟前,我们还没有这个工具, 而现在,它已经能通过一个简单的文本提示生成这样一个相当复杂且布局合理的图标了。所以想一想,在你日常与开源项目, 或者说你能访问其后端的项目中,你都在做哪些类似的工作流程?而且我们完全可以把 c i 指向任何东西,并为那个软件创建一个 c i 工具。 像这样的事情,其影响真的非常惊人。而且你也看到了,这并不难,就像只需要一行购代码,我们克隆了仓库,运行了代码就完成了。这已经是最简单的操作了。各位, 所以我强烈建议你们自己试一试,下载它,安装它,把它指向其他开源项目,看看你能得到什么样的结果。就像我说的,这真的非常容易做到,而且这正是这个领域的发展方向,我们下次再见。

这个天气, app 从零到翻译完成,全程没有打开 android studio, 用的是谷歌刚发布的安卓 c l i, 配合 cloud code 异形命令创建项目 ai 写完代码,直接编辑出 a p k, 装到手机上。先说为什么需要这个东西。 ai 做 android 开发目前有三个很现实的痛点, 第一,工具太分散,装 s d k 用 s d k, 用 sd manager, 管模拟器用 ivg manager, 调试用 a g b, 编印用 guido。 六七个独立工具,各有各的命令格式, ai 要全部记住。第二,文档是给人看的, 不是给 ai 看的。传统文档描述性强,概念化。 ai 需要的是精确的、可执行的步骤,否则很容易用过时的库和写法。第三,这些工具的输出噪音太多,进度条、颜色码用于日制 ai, 解析起来非常吃力,白白浪费大量 token。 针对这些问题, google 一 次性发布了三个东西配套设计。第一个, android 操作层,一个命令行工具,统一了之前所有分散的工具, 一个入口搞定环境设置项目创建 s d k, 管理应用部署,它是用 rust 写的,闭源分发。第二个, android skills 指导层,这是一个开源的 gitlab 仓库,里面是一套 markdown 格式的指令文件,告诉 ai 怎么按最佳实践完成任务。第三个, android knowledge base 知识层,一个实时更新的知识库,让 ai 能查到最新的官方文档,弥补训练数据过期的问题。三者的工作流程是这样的,用户下达任务, agent 读取 skills, 获取指引,需要查文档时调用知识库,最后通过 c l i 执行实际操作 来看 c l i 具体能干什么。 android create 一 条命令,从官方模板创建项目 android s d k install, 按需下载 s d k 组建, 不用装一整个 android studio。 android demo, 创建和管理虚拟设备 android run, 部署应用到设备或模拟器。安卓 docx 直接在终端搜索和获取最新官方文档。 android skills 安装和管理 a j t 的 技能包。以前这些事情分散在六七个不同的工具里, 现在一个 android 的 命令全部搞定。看一些技术细节, c l i 本身我检查了它的二禁制文件,确认是 rust 编辑。 google 内部用 bezel 加 rules rust 构建,都是 rust 生态的标准库。当前版本零点七预览阶段, skills 方面开源在 github, 目前有七个技能,暂时不接受社区贡献。谷歌内部测试给出了两个数据, 第一, l l m 的 token 消耗降低了超过百分之七十,这很好理解,以前 ai 要解析 s d m 管理者输出的一大堆乱七八糟的文本,现在 c l i 输出干净,结构化, ai 直接读懂,自然省 token。 第二,任务完成速度提升了三倍。以前 a 阵的用传统工具链摸索着做的事情, 现在有了统一入口和精确指引,效率自然上来了。直观对比一下以前和现在的开发流程,以前下载 android studio, 两个多 g 配 s d k 路径和环境变量, new project 一 堆勾选等 gradosink 三五分钟, 手动写代码,点 run 等翻译看效果。整套下来光环境搭建可能就要半小时。现在一行 call 装安卓 z i, 一 行命令装 cix, 告诉 ai 做一个天气 app, ai 自动调用 android create 创建项目, ai 写代码,然后翻译出 a p k, 装到手机上搞定。 google 明确支持多种 agent, 不 限于自家工具。这不是 google 一 家在做,而是一个行业趋势。 google 发了 android c l i 和 gemini c l i anthrax c l i。 全行业都在做同一件事,把原来面向人的图形界面拆出一层面向 ai 的 命令行接口。原因很简单, l l m。 看不懂 g u i ai 能处理的是文本进文本出 c l i。 天然就是这种模式,开发范式正在转。 c l i 加 a g n t。 说了这么多,来看实际操作,第一步,异形刻录命令安装 android c l i。 第二部, android skill set, 把技能包装给 cloud code。 在 执行任务前,我们的 cloud code pro 使用了百分之四的额度,在 code code 里下达任务。用 android c l i 创建一个天气查询应用, agent 自动工作,它会读取 android clea 这个 skill, 知道该用 android create 来创建项目,然后写 call to name 代码,最后编辑。 中间还遇到了一个问题,中文城市民察步聊天器。 ai 自己分析出是 open wide 麦的接口,不支持中文,然后自动改成了两步查询。 a p k。 翻译完成,传到手机上。安装效果就是你们开头看到的两轮对话,用了百分之三十一的 cloud code 的 额度。总结一下, android cle 这套工具集解决的核心问题是让 ai 一 键坦能,高效正确地做 android 开发。 c i i 统一入口,告别分散工具 skills 精确指导,让 ai 按最佳实践工作。 knowledge base 实时更新,弥补训练数据过气的问题。 目前还是预览版,有一些限制,但方向很清楚。 google 再把 android 变成对 ai 友好的移动开发平台。我们下期视频再见。

让 ai 去控制桌面软件一直是很麻烦的事。 d l i anything 做的事情是让所有软件都能为 agent 服务。它的思路非常简单,不是让 ai 去看屏幕操作软件,而是直接从原代码生成 c i 接口。只要你把软件丢给它,它能在底层 直接把 g u i 操作映射到代码逻辑上,硬生生给这软件套上一层命令行外壳,而且输出全都是标准的 json。

这款由港大开源的项目,只需通过一行命令,就可以把任何软件自动变成 ai 可以 调用的工具。刚上线几天就斩获三点二 k 新标。这个项目能做什么呢?比如你让 ai 去剪个视频,或者操作某个专业软件,它就成了只会说不会做的旁观者。原因很简单, 传统的软件是为人类的眼睛设计的,而 ai agent 需要的是逻辑清晰、可组合、轻量化的指令。所以这个开源项目就是将专业工具转换成 ai 可以 直接调用的接口和工具。有了它,人类离完全自动化的 ai 智能体不远了。关注我,带你认识更多好用工具!

兄弟们比 c l i anything 更炸裂的杀起来了!之前我们说 c l i anything 能把所有开源软件变成供 ai agent 调用的命令行工具,但面对像数据孤岛一样的网站怎么办? open c l i 的 出现,补齐了 ai 自动化的最后一块拼图。它不碰网站原码,却做了一件更狠的事儿,直接附用你浏览器里已经登录的账号状态,生成网页操作的 c l i 命令。 比如你在某破站挂着账号, ai 就 能直接越过繁琐的登录,替你发视频、发弹幕、搜内容。一句话,你在网页上能做什么, ai 就 能替你做什么。只要输入一条命令, ai 直接接管你的互联网。 c l i anything 打通了本地软件, open c l i 打通了全网,网站图形界面终将成为过去式,因为命令行才是 ai 的 母语。

现在给大家完整演示一下,我先从另一台电脑把打包的压缩包发送过来, 我们先解压。然后这里我准备了 windows、 macos、 linux 系统的一键运行脚本和一键停止脚本,帮助不熟悉命令型的小伙伴更便捷。这里因为我之前已经有勾环境,所以脚本运行中没有去安装依赖。 这里自动打开 web 页面,我们输入默认密码,幺二三四五六进入管理台。在配置页面,我们可以自己去修改管理密码和 api 密钥,这里我修改一下, 然后我们点击保存。 ai 提供商,这里是正常 gemine、 opennine、 cloud 等供应商的 a p i。 添加 os 登录才是我们的重头戏。可以看到支持 codex、 anthrax、 gemini、 kimi、 quin 等授权登录, 这里就是可以把它们赠送的免费额度统一封装成 a p i。 我 来演示一下 quin, 点击登录,打开链接 这里。我之前登录过,就直接登录了,没有账户的小伙伴自己注册,就是不需要下载客户端 可以看见。现在认证成功,我们再测试一下 codex 支持的登录方式,很多,方便演示,我就选择 google 登录, 可以看到很简单就认证成功了。 认证文件这里,点击刷新就可以看见额度还剩多少 g p t。 五点四还是太香了,有 pos 会员的用户可以用这个管理账号轮询这里我批量添加了很多 codex 的 账号 功能,很实用,怎么使用?我们进入中心信息页面,可以看见目前添加账号支持的模型,这也是我们配置给 open core 和 hermes 等 ai 工具填写的模型名字。这里演示一下我新安装的 hermes, 打开配置文件, bios u r l 地址就是我们本地端口模型复制中心信息的模型名称密钥。在 f 文件中不会配置的小伙伴直接把 bios 密钥和模型名称给 ai, 让他帮你配置 好了。现在我们测试一下, 可以看到已经成功了, 我们可以去看看可选模型中添加的模型,可以看到 gptf 五点四 基本演示,就这样,我一下午都是跑,目前非常顺畅,然后想结束进程,点击 saf 脚本就一键结束了。需要便捷安装的小伙伴到文章底部用领取口令 自行领取吧。记得点赞关注。至于说如何批量注册账号,看情况反应,我看看下一篇要不要写。

一款可以让你随意更换模特身上任何的一个物品的一款插件,一款可以让你对你 画面中任意物品进行重绘甚至是替换的一款插件呢,就是这款插件呢,它比我们的一个局部重绘,比我们用那个呃 ps 去抠图呢,它更好用。这款插件呢就是我们的,嗯, segments anything 这一款插件也是最近 facebook 啊新发布出来的一款新的一个插件啊,那很多姐妹在安装这个插件的时候会发现就是插件安装了,但是我们在 stable diffusion 这里面就是看不到那个插件的一个影子,也就是说我们在安装插件的时候就是安装失败了。那 今天呢,我们就来讲一下,就是怎么样去正确的安装我们的一个插件,确保我们的插件在 stable definition 的一个 ui 界面是能够正常去使用的啊。在讲就是怎么去安装之前呢,我们先一起来看一下我们的 segment anything 这一个插件的一个官网啊,这个是他的一个官网,这个官网呢,跟我们的模型跟插件安装的一个网址, 我都会把它放在评论区,待会你们直接自己去那个评论区去领取就可以了啊。然后这个就是我们的一个 segment mc 的一个官网,我们可以看到啊,这个是他给了我们三张图,三张不同的一个类型,比如说这张图, 它是图片里面有有那个咱们的一个物体的啊,咱们的一个 segment 安宁森这个插件呢,它能识别独立识别图片中任何物体啊。然后第二张就是咱们的一个建筑物,它也能识别我们整张图片里面的任何一个建筑,然后可以对它进行一个重绘,深人士 删除替换都是新的啊。然后第三张就是咱们的一个服装模特对他的一个身上的一个物品进行一个迭代更新或更换啊,给他进行替换都是可以的,这款插件他功能很强大的,你们自己也可以去到这个官网自己去看啊,椅子的一个重绘啥的啊,都很厉害, 他能对整演一张图里面的所有的物品进行一个分割啊,进行一个分割之后,然后可以进行替换,就在官网上可以看到这个插件是非常厉害的,它相当于就是我们的一个局部重会加 ps, 加我们的一个 cctulate 集合。 那这么好用的一个插件呢?就为什么很多人在安装的时候会出现问题呢?因为他们在安装的时候是直接去到了咱们的一个代码的一个地址,来到代码的一个地址,这个地方呢,他从这里复制了这个下载的链接,然后去到咱们的一个 stable, 就想扩展从网址安装这个地方粘贴到这里来,然后从这里下载,那肯定是错误的,因为为什么?因为这个是咱们的一个官方代码的一个网址,也就是说你把整个一个代码下载下来,你可以在你的本地去用你的 python 去运行,但是他不是依赖 stable definition 的一个 ui 去运行的。那依赖咱们的一个 stable defusion 的一个 word ui 页面去运行的一个插件呢?是在哪?在这个官网上啊,你可以看一下 segment anything info stable defusion warbui 界面呢?这个,这个才是我们安装插件的一个正确的一个页面,我们从这里 复制我们的一个链接,然后去到我们的一个我们的一个 stable diffusion 的这一个拓展,从网址安装这个地方,我们点击粘贴,然后去安装,他才会默认安 安装到我们的一个 stable diffusion 这一个跟目录下的插件这一个里面啊,他才会正确的安装到这里面去啊。然后我们刚才我点安装是没有成功的,点安装成功之后他这里会有一个加载的一个符号啊,但是呢,我一般都不从这里安装,因为在这里安装 有时候也会出现问题,我接下来跟你们说的这一种安装方法是基本上百分之九十九点九九,你从那个地方安装插件是不会出问题的, 甚至呢,你直接在安装就已经杜绝了你的插件在安装方面出现问题的一个可能性。这个方法是什么?就是我们直接 来到我们的一个启动器这个目录下,它有一个 extensions 文件夹,然后进来之后呢,我们在这个 extensions 文件夹里面的上面的地址栏里面输入 cmd 啊回车,或者是输入它 科学然后按回车都是可以的。然后按了回车之后,我们输入 get clone, 这一个是下载命令,然后底下紧跟着我们从这一个 cable diffusion wob, ui single anything 的一个官网地里面去复制我们这个地址, 然后呢再直接右右击就是我们的鼠标,然后把这个链接粘贴到这里,然后再回车,他就会自动默认把我们的一个插件呢安装在这个页面里面,我们可以看到这里面他就会出现一个咱们新的一个插件,这个 mat mc 这个插件已经安装成功了,我们 插件安装了,但是插件我们要正常运行的话,一般都是依赖我们的一个模型的,是不是我们的模型都是安装在我们的插件里面的一个 models 的这个文件夹里面, 但是这个比较特殊啊,他不是直接在这里面,他是要到我们的项目里面,其实他在这个 digment anything for stable diffusion wui 这一个官网地址他就已经告诉我们了,就是我们的一个模型呢, 它是要安装在这个沙漠里面,然后模型在哪呢?也是在这里的。这三个就是我们的一个模型,一个是 vit 下划线 h, 这个是二百五十六 g 的,这个一般都是显存比较大的,你去用的话是基本上没有问题,比如说十二二十四 g 的一个现存,然后 vit 的话,就是啊,八 g 以上用是没有问题的,但是六到八 g 的话估计用会有点困难啊,反正就是你, 你的那个显存越大,你底下你这三个都能用啊,我的话我就直接用这个 vit 啊,下滑线低吧。因为我的是六 g 的一个显存,然后下载下来呢, 因为我已经下载了,我就不下载了,你们要下载的话直接点这里,他就可以直接去到他的一个下载链接了,然后下载完之后呢,我们直接啊把这一个复制过来,然后粘贴到我们的这一个啊上里面, 然后粘贴完之后呢,我们先重启一下我们的一个 stable dfu, 选这一个 ui 界面吗?因为我们刚才安装了插件啊,重新启动一下可以了, 然后啊,我们重启了之后,我们就可以看到刚才是没有啊 segment n c 的,你看现在就已经安装成功了,安装成功之后呢,这里面有一个模型,就是我们安装的模型,这个模型呢就是能实现我们的一个万物皆可分割的一个功能啊, 然后我们加载一张图片进来,我随便点一下啊,你们自己可以,就是你左击左击这个鼠标就是选中你要替换的一个物品啊,我稍 会点一下啊,你们自己去,你们要认真去点,可能就会效果更好一点,点一下啊, preview segment 这个就是我们意思,就是我们去预览它,你看其实我们的第一张图这一个效果就已经出来了,而且效果非常好,识别的非常非常完美了,对不对? 可能有一些小细节你们自己去识别就可以了,是不?比我们的那个局部重绘是不是就会更方便一点点,甚至比我们的一个抠图他来的更更快捷一点点?因为我是只点了一下,你们自己去再认真点的话,效果肯定会比这更好。 这个就是我今天跟你们讲的一个正确的安装咱们的一个 segment anything 插件,这个安装的一个方法啊,如果你们在使用 stable diffusion 过程当中呢,还有任何的一个报错或者是问题的话啊,你们都可以直接在我评论区留言, 我看到的话都会一一给大家,就是出一个讲解视频给大家来解决大家的一个问题啊,因为我也是小白出生,我也会遇到各种,就是各种问题,那遇到问题的时候我怎么去解决?我会去反思我的一个方法为什么错了?那错在哪 啊?那我用什么方法去解决了?那解决这个方法是不对的,我会去反复去验证,验证完之后我确定这个是没有问题,我再会去跟你们 去反馈的,去跟你们去分享的。也是希望大家啊一起在我们的 table diffusion 这一条道路上,就是 ai 绘画这个道路上,我们一起啊,一起进步。然后如果你们觉得这个视频对你们有帮助的话,你们可以一键三连来支持一下。