cloud code 泄露源码的事爆火,相信不少人刷到了想动手研究下,但不知道怎么用的直接跟着操作。我们已经把相关能力炼炉进行重构,改造成可以开箱即用的 c l i 版本,放在评论区可以直接领取使用。这意味着开发者现在真正拥有一套由自己掌控的 c c 工作流。 更重要的是,这套工作流已经可以接入我们的 epoxx 人机协助社区,让它从辅助编码工具升级成能自动接悬赏任务的赚钱 agent, 晚上给你赚钱的同时,它还会在任务中不断学习 skill, 自动升级迭代,越来越强。换句话讲, c c 让你拥有了一个非常聪明的助手,但是缺少学习经验,不懂很多具体任务的实现范式。而接入 epoxx 社区,你的 c c 就 拥有了自我学习的能力, 不仅会自己整理经验,还可以把总结下来的 skill 发布到社区,实现 agent 共享知识的龙虾社区生态。诚邀各位感兴趣的朋友共建我们的 epoch x 社区。
粉丝9665获赞2.6万

开源项目 open c i i, 它能把网站变成一条终端命令,让 ai 一 阵特直接调用。我们实测对比它和两个工具 open k i s 和 bb browser, 看看谁最快、最稳、最好用。 先看结果,我们设计了三个测试任务,搜索 b 站热搜在什么值得买,平台搜内存条推荐,以及跨微博、知乎、新浪财经搜索政务信息。 速度方面, open kylie r s。 全面领先,必战热搜 open c i l。 用了二十三秒, open kylie r s。 只要十秒,什么值得买?六十七秒对二十九秒多平台汇总五十五秒对三十五秒, 基本都是两到三倍的差距,但 tiktok 消耗两者几乎一样,说明速度差异来自工具本身,不是因为调用了更多大模型能力。 稳定性上, open c l i 三次全部一遍成功。 open clear r s。 在 第三个任务里,知乎热搜失败了,触发了重试。 bb browser 因为和 openclo 的 参数不兼容,三个任务全部没跑通,这是一个已知 bug。 具体原因, b b browser site 传递了 timeout 参数, opencloud tabx 命令不支持这个选项。在 github 上已有用户提出了这个问题,目前还未修复。什么是 c l i 化工具?这类工具到底在做什么?一句话,把原本需要打开网页,手动点击才能拿到的数据 封装成一条终端命令,本质就是给没有 api 的 网站造一个 api, 再套上命令行的壳。它和传统爬虫最大的区别是,爬虫是给程序员用的一次性脚本。 c l i 画工具是给 ai 用的标准化工具箱, agent 执行一条 list 命令,就能发现所有可用工具输出格式统一一可以直接为给下游处理,而且它附用你浏览器的登录状态,不存密码,不管 gucci 过期 风控也低。原理分五步,第一步,找数据接口,你在浏览器里看必占热榜,背后浏览器一定发了某个请求, open c i i 在 后台拦截所有请求,分析哪个数据包装的是热榜内容,找到隐藏的接口地址。 第二步,搞定身份认证,它不自己登录,直接借用你科目里已有的登录状态,和你手动打开网页没有区别。第三步,写适配器,把整个流程写成一个三十行左右的配置文件,请求这个地址,取出列表,保留标题和播放量,截取前十条 以后,每次执行命令就自动走一遍。第四步,处理复杂情况。有些网站需要滚动加载,或者数据藏在页面代码深处,这时候就往网页里注入一段小程序,模拟操作,把数据掏出来。第五步,终端和浏览器怎么通信? 靠一个 chrome 插件当传话人,命令从中端传给插件,插件在浏览器里执行,拿到数据再传回来。底层架构分四层,第一层命令解析,第二层,适配器加载,第三层,浏览器通信。第三个工具的差异主要在中间两层, open c l i 启动时要扫描加载所有适配器文件,通信要经过守护进程和扩展两层中转。 open k l s 在 编译时就把适配器打包进了程序本体, 启动零开销,而且通过浏览器调试协议直连,少了中间层,所以快两到三倍。 b b browser 走了另一条路,它自启动一个专用的 chrome, 十六,完全隔离, 如何部署与使用?部署方式是四 q 技能包加浏览器插件的组合。我们找到 open cai 的 开源地址,使用官方命令通过 npm 安装,然后下载 playrite mcp bridge 扩展。 下载解压后,打开浏览器的插件管理页,开启右上角的开发者模式,点击本地文件,把解压后的文件上传。当前是 open c i i 一 点四点一版本, 运行 open clea doctor 命令,检查一遍,没有报错。克隆 open clea 技能包放到 skills 文件夹下,安装完成,就可以直接给 open clea 下达任务了。 open clea 二 s 部署步骤类似, 首先执行一键安装脚本,安装完成,然后去他给的网址下载对应系统的扩展文件。和 openkly 的 一样,解压并上传 openkly rs 的 技能包,只有一个 markdown 文档,告诉 agent 如何用这个 skills b bbrace 也是 n p m 一 型命令,它的 open 克拉集成模式无需安装扩展,但目前有兼容性问题。需要特别注意的是,工具的浏览器插件目前仅在 google com 上验证可用。最后总结, open c i i 功能最全最稳定, 六十一个站点,三百五十五条命令,三次测试零失败,适合大多数用户。 open cle 二 s 速度最快,最轻量,但稳定性稍弱。 bbbzy 的 open 跨集成存在已知 bug, 建议观望。希望本期视频对您有所帮助,我们下期视频再见。

不知道大家有没有想过,为什么到二零二六年的今天, cli 这个概念似乎又变得如此火热了? 那其实先介绍下什么是 cli 吧,其实 cli 就是 一个命令行,就比如说我这是一个 macbook, 那 我的命令行呢?就是长这个样子,我可以通过手敲一些命令,去实现一些我所需要的功能, 它包括像文本输入啊,结构化输出等等,那它的地位呢?其实就相当于 ai 界的一个母语。那前段时间可能有两个这个开源的项目比较火啊,一个叫, 一个叫 c l i anson, 一个叫 open c l i, 那 分别对应的这个 github 的 样子就是这就是这里。那 c l i anson 呢?它其实就相当于把开源的软件可以变成这个命令行可以控制的这种方式的工具。 那 open c l i 呢?其实就是想能够将桌面的应用以及网站转换为 c l i, 就是 可以让我们的 ai 更好的去操控这些网站,这就是它们两者的一个区别。 那 c i 那 么火,那像去年,去年可能大家都使用 m c p 去控制我的这个工具,那现在呢?大家可以发现 ai 可以 直接通过命令行 ci 去控制我们的这个。 嗯,工具,比如说前段时间飞速不就开源了自己的这个 c l i, 那 我其实总结了以下几点呢?比如说像 c l i 的 优势,它比如它比较消耗,投投坑比较少,那对人类也比较友好。那像 m c p 呢?它可能说 更加标准,那对于多用户或者权限控制比较强,那 对于我个人而言,我其实觉得 c l i 才是未来的一个趋势,你像 ai 天生不太适合去控制这种可式化的这种界面,就是 g u i 嘛,那 c l i 可能更适合 ai 一 点,所以说为什么管它叫 ai 界的这个母语?

兄弟们真变天了,连号称最封面的腾讯企业微信,居然在各大平台上正式开源了 c l i 工具!官方下场把企鹅的底裤都交给了 ai, 它不是给你用的,是给 open class 这些 ai 用的。官方直接扔出了十二个开箱即用的 ai skill 通讯录、代办会议文档表格全覆盖。你只要对 ai 说一句,帮我拉个群,把张三李四叫上,定个共享文档, ai 在 后台跑命令行,几秒钟全办妥, 这才是真正的赛博助理!这说明什么?我们经历了百魔大战、百虾大战,现在正式进入了百 c l i 大 战。任何软件,如果不把自己变成命令行供 ai 趋势,在未来他连上牌桌的资格都没有。但老兵得提醒一句, 这个所谓的完整版,目前只支持十人以下团队大厂的套路,开源赚吆喝,大企业想用,得加钱,不过白嫖的功能不好白不好。链接我放评论区了,你的老板敢让 ai 进公司群吗?

今天来开源一个 agent scare, 在 昨天关于极梦 c l i 的 使用介绍中提到过一个 agent scare, 能够让小龙虾或者任何支持 scare 的 agent 中 使用 c 档十二点零用嘴声视频,并且还是消耗个人极梦账号的积分,不需要额外的购买 api, 这个就是极梦 c l i skill, 大家看看目录结构非常的简单,就是一个标准的 skill 加 script 的 结构,直接拖进小龙虾就可以运行起来。 现在打开 anti gravity 的 agent 给大家演示一下。我在这里输入用 jimina 四幺 i 生成一张图片,内容是一只奔跑的小猫,生成完展示出来,然后按回车,那么这个任务呢就已经启动,并且呢它会调用刚刚配置好的 agent skirs。 ok, 我 们现在就获得了一只小猫的图片,同时呢我们打开吉梦的后台点刷新, 可以看到这张图片的资产也在个人极梦账户中可以看得到,那说明这个 agent scares 跟极梦是绑定相通的。然后我们再来测试一下 c 档十二点零视频生成, 我们在这里输入以下的提示时,将刚才这只猫的图片作为手帧,用 jimmy 的 c 档十二点零模型生成五秒的猫咪奔跑的视频并展示出来,然后把这一句指令给它发送过去。 我们从 agent 的 状态中可以看到这个猫咪奔跑的指令呢已经发送过去了,我们现在回到吉梦,看看这个任务有没有进行中。刷新一下后台页面, 然后我们就可以看到这个猫咪奔跑的视频,它也在列队中,那这里的排队呢,会需要花一些时间,我们稍等片刻,然后我们在 agent 里面可以看到这个视频已经是深层完成的状态,再回到吉梦的后台可以看到这个视频在这里可以播放, 那么这个 agent 已经开源了,源代码呢?就在这里,大家可以直接 fork 一下, 这里面有相关的说明。简单来说呢,就是需要先安装官方的 c l i 工具,这个是在 极梦的官网上面去安装的,然后安装完成之后呢要做一个授权登录,这个过程也是很简单的, 直接会打开极梦,然后呢登录,然后返回就可以。整个操作是比较简单的,大家有什么问题可以来评论区做技术交流,我是于博士,跟我学 ai, 我 们下期见,拜拜。

这个开源项目能让你的小龙虾去操作各类软件应用,就是由香港大学数据科学团队开源的 c l i anything, 短短两周时间就获得了二十点三千的 star, 每天一个硬核的网站推荐第四期, 一毫命令,让任意应用软件接入 open cloud、 cloud cloud code 等 agent, 变成 ai 的 专属工具。且最厉害的是,它可以直接扫描应用的源码,规划命令分组,直接构建 c l i。 通俗点讲就是这些应用软件可以直接让 ai 去操作。以前是只有用户去操作软件, 现在 ai 可以 直接给软件下指令,你只要告诉 ai 需要干什么, ai 会自己去调用,并且把最后的结果告诉你。十六个复杂且多样化的应用验证,一千八百三十九次的测试,都确保了它生产的可信。

get up 穿顶最近被一个叫 c l i anything 的 项目刷屏了。它不是花架子,而是真能把 g i n p、 blender、 liboffice、 obs 这类专业软件一键转成 ai 能直接调用的命令行工具, 核心思路很很 ai, 擅长处理结构化文本,干嘛还让它看屏幕点鼠标,直接把所有软件变成 c l i。 让智能体像人一样精准操控复杂程序。这项目来自港大数据科学实验室,上线三天就冲上 c l i, 让智能体像人一样精准操控复杂程序这项目来自港大数据科学实验室,破五点二万, fork 超四千两百,关键是它能打 官方验证,支持十四款主流软件,从 inkscape、 kaiden live 到 image j pair of view, 甚至 jenkins 和 partner, 全都能一行命令转成 ai。 友好的 c i 背后是一套全自动七阶段流水线分析软件 行为,把 g u i 操作映射到 api, 自动生成命令结构状态模型。 json 输出,连文档和测试都自动写好。产出的 c i 工具自带父 json 事务日记,支持 on 完整 help 和 schema, ai 自己就能看懂怎么用。比如在 cloud code 里输入 client 完整 help 和 schema, ai 自己就能看懂怎么用。比如在 cloud 里输入 client anything gimp, 几秒后就有 clientythinggame 命令可用。 ai 能直接加图层、改颜色,导出文件,全程结构化输出,零起意。内部测试显示执行成功率高达百分之九十九点八七, 比传统 ocr 加鼠标方案错误率低二十三倍,资源消耗还少七成。更关键的是, cli anything 正推动一套叫 agent native 的 新标准,真正智能体友好的软件必须支持结构化输出、可自描述接口。这套规范已被 mcp 社区采纳, lunching auto, gen 等主流框架也开始继承它生成的工具链。未来的软件不仅要给人用,更要给 ai 用。而 c l i anything 就是 那座桥。项目地址 get up 搜 h k u d s c l i anything。

大家好呀,今天来跟大家说两个概念, c l i 和 g u i。 听到这两个英文名词,大家是不是就犯难了?你可能会觉得,哎,这个名词我都没有听过,没有关系,你可能没听过,但你一定每天都在用。 先说 g u i, 有 些同学会叫它归,对吧?那 g u i, 它的中文名字就是用户图形界面,你现在每天点的各种 app, 我 们之前有用过的 tree, 这种工具就是支持你去指指点点进行下一步的,这种就是 g u i, ok, 那 c l i 呢?是命令行工具,像 mac 电脑里面,我们直接打开一个终端,输入一行代码,它就会有一串命令出来。一句话总结一下, c l i 就是 你直接报菜名点菜,像 g u i 就是 问服务员拿了一个菜单点菜,但是他们都是可以达到你点菜的这个效果 的,是吧?今天为什么要来跟大家分享这两个概念呢?是因为前两天大家也有看到飞书开源了一个叫 luck c l i 的 一个工具,从这个名字就能听出来了,它是 c l i 工具,它呢把自己内部的两千五百多个接口 包装了一下,包装成了两百多条命令行,目的是能够让其他的 ai agent 能够来使用它。以前你在飞书里面去建一个多元表格,建一个文档,你都需要打开飞书, 自己去进行一个界面操作。那现在呢?当你在使用一些编程工具的时候,你可以直接跟你的 ai 去讲说,帮我在飞书里面创建一个多元表格,那它通过这个 c o i 的 一个调用,直接就能创建成功了,大家可以去理解它,它至少一开始出来的时候不是给人类去使用的,它其实天然的更适合给 ai, 给机器去使用。 那像这种啊, g u i 和 c o i 的 工具国内其实都很多啦。 g u i 编程工具里面,国内的是吹 the body, 像国外的呢?吹 the wind, the surf, 对 吧?像 c o i 的 工具也很多,国内的有 kimi code, 那 国外的比如说 cloud code, ppt, gemini 都是可以的。那当然,有些公司两个都推出了,像 codex 也有桌面版, 是不是?那当然你们会问了,既然有这样两条方向,我需不需要去二选一啊?完全不需要,你觉得哪个用的顺手就去用哪个。那理论上可能 g u i 是 入门, c o i 是 进阶。目前为止其实发展的都挺好的。有些同学会说,其实我觉得 c o i 就是 这种命令行工具挺好用的,但是我会不会用起来不习惯, 或者是不会用,那也不会,这里的命令行它已经是自然语言,可以直接输入的。那今天就是跟大家来分享一下这两个概念, g u i 用户图形界面, c l i 就是 命令行工具。那它们两个用一句话去总结,一个是报菜名点菜,一个是看菜单点菜,你喜欢用哪个就用哪个,或者你到评论区一起跟我来聊一聊呀。那今天就先分享到这里咯,拜拜。

今天我们来看一个项目,它可能会彻底改变 ai 和软件的玩法。 ai agent 的 推理能力超强,对吧?但他们有个致命弱点,你知道是啥吗?问题就出在他们没法好好使用我们日常用的那些专业软件。 你想想,让 ai 看截图、点按钮,界面一变,就全乱套了,太不靠谱。所以你看,老办法行不通,但香港大学这个新方法从跟上就解决了可循问题。 那这到底是个啥新方法呢?它叫 c o i anything, 这想法简直是革命性的。简单说,它能把任何软件一键变成 ai 的 原声工具,功能还一点儿不少。 这句话说得太好了,未来的用户真的就是 ai agent 了。那么,这个一键转换到底是怎么做到的?过程简单到你可能不信, 真的就一条命令,你把软件代码给他,他就自动给你生成一个 ai 能用的版本。当然了,这一条命令背后可是藏着一整套全自动的七步流水线呐! 最酷的是什么?它用的就是原版软件,比如用真的 blender 来渲染,不是替代品。而且啊,输出的数据都是结构化的 jc 格式, ai 一 看就懂,无缝对接。 说到这儿,你可能会问,这么神的工具,在那些复杂的专业软件上靠谱吗?答案是,绝对靠谱!你看,团队跑了超过一万四千个生产级的测试,测试对象可都是硬骨头,像 blender、 gimp、 libreoffice 这些覆盖了九大领域, 关键是结果,你猜怎么着?所有测试百分之百通过,这就证明了,让软件 a 阵的原声这条路是完全走得通的。而且,这不仅仅是几个软件,你想想,从办公到科研,所有软件都能这么搞, 你看他们的路线图,下一步就是支持更多的应用和 ai 框架。野心不小啊。所以最后留个问题给你,如果 ai 能用我们所有的工具,世界会变成什么呀?

港大开源了一个很牛的项目,四天时间斩获了接近九 k 的 star。 记住这个名字,它用一行命令,让任何软件都可以接入 opencloud、 cloud code 等 agent 的 框架。 opencloud 不是 什么软件都可以调用的,但这个项目把任何软件改造成 ai 可以 直接调用的工具接口。现在软件不仅人能用,改造之后 ai 也能随意调用。 它会扫描软件的源码,然后自动生成一整套标准的 d r i 命令。当所有软件都被 ai 无缝运行,是不是我们就可以放下鼠标了?

这可能是今年对所有平台威胁最大的一个开源项目了。 open c l i 十天前刚开源的一个 a 准工具链,直接用你本地浏览器去操作各大平台,油管、壁战、小红薯、铁套全覆盖。它有三个点很恐怖。第一个,零风控,因为在平台眼里,你就是一个正常用户在浏览。第二,几乎不用刷头盔,所有操作都在本地执行。第三, ai 模拟出来的浏览行为和真人已经没有区别了, 平台想封你,但是他不敢,误碰真人的后果他承受不起。采集数据只是开始,我现在把它接入了我整个自动化工具店。第一步, open c l i 自动去各大平台采集近期热门内容。第二,就给 i 分 析哪些爆了,爆在哪里,什么规律。第三步,根据这些规律, ai 自动批量生成脚本。第四步,脚本直接接入我自动剪辑的系统, 从空项目到整片,不碰一下。这四步跑起来之后,一天的产量能比一个小团队一周还多,而且全程挂着,每天自动执行。所以这已经不是一天的产量能比一个小团队一周。你觉得这些平台接下来会怎么应对你?

企业微信 clee 正式在 github 开源,开放消息、日程、文档、会议、智能表格等七大核心产品能力支持 workbody、 q c law、 cloud code、 codex 等主流 ai agent 直接调用。为什么是 clee 不是 传统 api? 一 句话, clee 是 ai 的 母语,不用封装,不用转移,一条命令直接调用,调用更稳,响应更快, token 消耗更少,给 ai 一个趁手的工具,让它在企微替你干更多的活儿。

飞书大家都不陌生,最近飞书它是直接在 github 上开源了自己的 coi 工具,你现在是可以支持直接用命令行去操作你飞书里面的文档,基本上这个 coi 可以 做到你 人为去手动点击的所有的事情,它包括了日历、通讯、云文档、云空间,然后多维表格、电子表格、任务知识库等等,你现在都可以直接通过 coi 命令行去执行这些动作。很多人就会说了,这个 coi 命令行这么麻烦,还不如我自己人去点点去就好了。那么这个东西很显然它不是给人用的,这个东西它是给 ai agent 去使用的。说到这里就引出了 未来的软件很可能会越来越发展成两派,一类是像 c u i 这种供 ai agent 去调用,一类是 g u i 的 传统的图形界面供人去使用。 那么为什么会去分成这两个?因为像飞书这类工具,它是以效率和执行至上的一种工具,那么它天然的就适合去直接使用 ai agent, 可以 很快速的去执行真删、查改、创建、删除、编辑等等任务。用 ai agent 去做这件事,本身就比人会更高效,更快速,所以它们就天然的更适合这种 ai 的 命令。而 比如说像微信或者说 qq 这类工具,它更多的是强调人为的一个操纵和一个交互,所以对于这种效率工具来说,人反而是一种枷锁,是一种拖累, 而 c o i 就 可以直接绕过这一步,让 a ai 去执行。所以我觉得对于传统软件公司来说也是这个思路,要考虑自己的产品或者自己的软件适不适合把它做成 ai 的 形式去供 ai agent 去使用。

最近有个开源项目火了,叫 open c r y, github 上四天就涨了八千星。他干了一件什么事?他把任何网站和应用直接变成命令行的工具?你平时刷 b 站,光直呼看小某书,这些本来要点来点去的操作,现在可以直接变成一行命令, 甚至可以直接通过 skills 交给 ai 去调用。你在 code code, open code, open crottt 使用的时候, ai 直接读取这个 skill 文件, 瞬间学会调用。它的原理就两样东西,第一,用 chrome 的 c d p 协议,直接附用你的浏览器登录状态。第二啊,一层适配器,把网页的接口翻译成命令行的参数, 没了,不存你的密码,也不存你的凭证,所有的数据都在你本地跑。已经有五十多个平台内置的适配器了,甚至连 ctrl shift、 gpt、 note 这些桌面应用都能控制安装,有多简单呢?看这个直接交给油喷扣的。 所以, open c l 本质上不是一个工具,而是在干一件更大的事情,它把整个互联网变成 ai 的 工具箱。

只需要一行命令,就能让 ai 能像人一样精确的控制桌面上的复杂软件。这是香港大学开源的一个让所有软件原生支持智能体的项目,弥合 ai 智能体与各种软件之间的鸿沟。 你只需要运行一条命令,它就会自动分析软件原码,生成一整套标准的 c、 l i 命令。然后 ai 就 可以像在终端里敲命令一样,直接调用这些软件完成任务,让你的 ai 从此装上手和脚,无需 api 即可操控任意应用程序。点赞、关注,分享更多 ai 玩法!

终于来了,终于来了,企业微信开源了! c l i, 人类将彻底抛弃软件了,未来使用软件的都是 ai 智能体了。来吧,让我给你细细道来,你有没有想过,咱们每天点来点去的那些复杂的软件, 什么菜单呢?按钮啊,窗口啊,可能很快就都要不见了。没错,今天呢,咱们就来深挖一下这场正在企业软件圈里悄悄进行的去 u i 化革命,看看他到底会怎么彻底改变我们的工作方式。那你说奇不奇怪? 你看像企业微信、飞书这些大厂,以前花了那么大功夫把软件界面做的漂漂亮亮的对吧?结果现在呢,突然来了个一百八十度大转弯,开始拥抱这种,嗯,看起来就像是几十年前程序员采用的黑框框。 这到底是怎么回事?这背后啊,藏着一场巨大的行业变化。好,那今天呢,咱们就分几步来聊这个事。首先,肯定得搞明白这个趣 u i 化革命到底是个啥。 然后呢,咱们再来看他带来的四个核心变化,交互方式、系统架构、商业模式,甚至连公司组织都会变。最后啊,咱们一起看看,这个什么都能编程的未来到底长什么样?好,那咱们就先从最核心的概念说起。 这场所谓的去 u i 化革命,其实啊,是企业软件领域一次非常非常根本性的转变。 那到底啥是趣趣歪话呢?说白了就是以后啊,咱们可能再也不用去点那些复杂的按钮,翻那些层层叠叠的菜单了,想干嘛直接说话或者打一行命令就行。而真正帮你干活的呢,就是藏在背后那个越来越聪明的 ai 豆里,咱们管它叫 ai agent。 其实啊,这事能搞起来,背后有个大家普遍都头疼的问题,就是很多公司花了大价钱买的那些萨奇系统,因为用起来太麻烦了,员工压根就不想碰,最后呢,就成了摆设,成了僵尸软件。 但现在情况完全不一样了,你看,行业里的巨头已经开始行动了,写微信把他那个命令行工具给开源了,飞书呢,也接上了那个叫龙虾的 ai 助理,这信号可以说是相当明确了。 接下来,咱们就来看看第一个,也是咱们感受最直接的变化,交互方式,怎么从点点点变成了动动嘴,敲敲键盘下命令,这可直接关系到咱们每天的工作效率啊。 你想想,以前啊,咱们用软件那叫人找功能,为了干个活,得在那个一层套一层的菜单里点过来,找过去的费劲不费劲。现在呢,完全反过来了,变成了功能找人,咱们只需要说话或者打个指令, ai 系统自己就麻利儿的把功能给你找着,把活给你干了。 哎,你听听这个真事,公牛集团的一个员工就分享说啊,他们以前想在公司那个超复杂的 erp 系统里查个库存,你知道得点多少下鼠标吗?至少十下,反覆覆覆的。 那现在呢,简单了,聊天框里问一句话就行,你琢磨琢磨,从十次点击到一句话,这效率提升的有多恐怖,这绝对是革命性。 所以官人见点来了啊,如果你是公司的决策者,这事就意味着以后你买 it 系统的时候,手里多了一张一票否决的牌。 你就问两个问题,这系统接口开不开放? ai 助理能不能很方便的控制它?如果答案是否定的,那对不起,不管他的界面吹的多么天花乱坠,都得好好掂量掂量了, 别再只看那些花里胡哨的功能界面了。你看前面的交互方式都变了,那底下的系统架构肯定也得跟着变,对吧?啊?咱们就来看看这第二个大变格,软件系统是怎么从一个个独立的数据孤岛变成一个统一的 ai 操作系统的。 以前的公司系统啊,那真是各管一摊,客户数据在 arp, 人事数据在 hr 系统, 互相之间根本不通气,就跟一个个孤岛一样。但现在这个新模式呢,就是要把企业微信、飞书这样的平台 打造这么一个中央的 ai 操作系统。他就像一个超级大管家,手里拿着所有系统的钥匙,能随时调动所有的数据和功能。咱们来看一个具体的例子,看看这个数字员工是怎么干活的,简直了,你就跟他说一句,嘿,安排一下第二季度的规划会,你看他接下来干嘛, 他会先自己去翻你们的聊天记录,把会议的来龙去脉给搞清楚,然后他会去查所有要参会的经理的日历,找到大家都有空的时间,最后一步,自动定好会议室,把议程发到每个人手里,整个过程一气呵成,根本不用你操心。 好系统都这么智能了,那企业花钱的方式自然也得变。这就引出了咱们要说的第三个改革,商业模式怎么从以前的按人头付费变成了按结果付费,这个直接关系到公司的钱袋子。 以前买软件,咱们叫按席位付费,跟买车一样,不管你开不开,先花一大笔钱把车买回来,这是固定资产。现在这个新模式呢,叫按产出付费,这就跟打车一样的, ai 助理帮你干了多少活,你就付多少钱,用一次付一次, 这么一来,就把原来那笔巨大的固定投资变成了非常灵活的盈盈成本。我跟你说个数字,你听了可能会觉得有点不可思议,三百块,你猜这是什么? 这是一家做跨境电商的公司,用 ai a 整自己搭了一整套定制的物流系统,花掉的全部算力成本三百块。要知道啊,哥在以前找个外包公司开发这么一套系统,没个几十万根本下不来,你看看,从几十万到三百块,这就是变格的力量。 所以啊,这给所有公司的 ceo, 也就是首席信息官们提了个醒,公司的 a t 预算该重新规划了,别再把大把的钱都砸在买软件许可证上了,应该把这些钱战略性的转到购买 ai 算力,还有培养自己公司内部开发 ai agent 的 人才上来。 好,前面咱们聊的都是工具啊、系统啊这些外部的东西。现在咱们要聊的这个变化可以说是最深刻的,因为他直接关系到我们人自己,也就是公司的组织形式要怎么变,以及未来超级个体会怎么崛起。 这里头有个细节非常有意思,你注意听,企业微信刚推出那个命令行工具的时候,你猜优先给谁用?是那些十个人以下的小团队。哎,你可能觉得这不就是个小范围测试吗? 不不,这可不是,这其实是一个非常强烈的信号,他在告诉我们,未来的组织可能会变成什么样子。 以前的公司咱们都知道像个金字塔,一层一层往上汇报,中间有好多好多中层管理者。 但未来呢,公司可能会变得更像是一种液态组织,非常灵活,甚至可能就是几个顶尖高手组成一个特种兵小队。你想想看,每个人都带着一大群 ai 助理干活,几个人就能干出过去上百人团队才能干成的事。 这就完全重新定义了什么样的人才是公司里最值钱的员工,未来最牛的人才啊,绝对不再是那个能把某个软件玩的特别溜的人了, 而是谁呢?是那种像牧羊人一样的人,他自己不一定干具体的活,但他特别擅长给手下一大群 ai 助理分配任务,并且把控最终的结果。好,聊到这,咱们来总结一下。可以说,我们正在走进一个万物皆可编程的时代, 在这个新时代里,你公司真正的核心竞争力已经不再是你买了多贵的软件,也不是你用了多牛的系统,而是什么呢?是你公司自己独一无二的那套业务逻辑。那企业新的护城河到底是什么呢?我告诉你,不再是你买了哪个大牌的系统, 而是你有没有这个本事,把你公司这么多年辛辛苦苦积累下来的那些最宝贵的业务经验和诀窍,也就是咱们说的 no 号转化成 ai 助理,能听懂能执行的逻辑和代码。 你看,平台已经有了,工具也都准备好了,可以说是触手可及。那么现在真正的问题就摆在了每一个决策者的面前,未来谁来为你的公司写下那段定义未来的代码?这个问题啊,值得我们每一个人都好好想一想,关注我,不然有可能错过一个小目标哦。

嘿,大家好,今天我们来聊个特别有意思的事,你知道吗?有项技术,那可是跟计算机差不多同岁的老古董了,但最近呢,它居然又火起来了,简直就是迎来了第二春。 你看看,就在最近这几周,发生了个怪事,像谷歌、 stripe 这些国际大厂,还有咱们国内的飞书钉钉,你猜怎么着?它们像是商量好了一样,全都推出了同一种东西, 这就很奇怪了,对吧?到底是什么产品能让这些巨头们这么心照不宣呢?答案来了,就是命令行工具。没错,就是那个黑乎乎的窗口敲代码的那个东西,我们通常叫它 c l i, 是 不是有点反之学你想想,这些公司个个都是技术浪潮的弄潮儿,结果呢,他们竟然齐刷刷地掉头去拥抱一个看起来特别复古的技术,这太有意思了。 所以,这就引出了我们今天真正想搞明白的问题,为什么?为什么这些大公司要集体给一项诞生于上世纪七十年代的技术投下重注? 到底是什么让这个几十年前的老家伙在今天在 ai 时代突然变得这么关键,这么不可或缺了呢?好,要想解开这个谜团,我们得先明白一个最根本的区别,就是咱们人类和 ai 跟电脑打交道的方式,那真是天差地别。 你想啊,咱们觉得好用的东西,对 ai 来说,可能,嗯,完全是另一回事。来,我们看个超直观的例子,就说剪视频吧,要把一个视频的前五秒给剪掉。 咱们人类会这么做,肯定是打开剪辑软件,用鼠标把视频拖进去,找到那个时间点,咔嚓一剪,然后再点导出,你看点点拖拖好几个步骤。 但 ai 呢?它就完全不一样了,你看右边,就这么一行命令, ffmp 什么的,啪一敲,回车搞定,干净利落、精准,没有任何废话, 所以这背后的关键点就呼之欲出了。命令行界面,也就是 coi, 它简直就是 ai 的 母语啊! 你想想这些大模型是怎么训练出来的?他们可是吃了海量的代码和文字长大的,所以他们天生就能看懂,也最习惯用这种基于命令的语言来沟通。这种语言结构清晰,指令明确,而且最重要的是特别容易自动化。 好!既然 c o i 对 ai 这么友好,那问题就来了,现在市面上成千上万的软件,可都是咱们人类用的图形界面啦!怎么办?怎么才能让 ai 也能用上这些工具呢? 别急,最近就出现了几个项目,简直就像是给软件世界施展魔法的魔藏,它们就是来解决这个问题的。 没错,就是这两个项目,它们是这股潮流的领头羊,一个叫 clean anything, 另一个叫 open c l i。 你 听听这名字多霸气! 它们的目标啊,说出来你可能不信,就是要让世界上任何一个软件,不管它是新的还是旧的,都能被 ai agent 调用和操作。 咱们先来看看这个 curly anything 是 怎么变魔术的,它的工作方式说实话非常惊人, 你啥都不用干,就把一个软件的原代码扔给他,然后好戏就开始了,他自己会去分析代码,自己规划需要哪些命令,自己生成一个全新的命令行工具,甚至连测试和说明文档都给你写好了, 最后一个为 ai 量身定做的命令行版本就这么诞生了,整个过程从头到尾都是 ai 自己在搞定。 咱们来举个实在的例子,就说 java 吧,大家可能都用过,画流程图什么的,全靠鼠标拖拖拽拽,这东西对咱们来说挺方便,但对 ai 来说简直就是噩梦。 你想让一个 ai agent 在 屏幕上精准地拖动一个小方框,再画一根线连到另一个框上,那可太难了。 但是经过克雷安尼清这么一改造,你猜发生了什么?现在 ai 只需要一行命令,就能让 jio 乖乖地画出一个完整的流程图。这个转变简直是天翻地覆,他直接把那些复杂的、需要手眼协调的视觉操作变成了一行简单的文字命令。 另外一个工具 open club 呢,也同样厉害,它专门对付网站和桌面应用,有了它, ai 就 能像个真人一样,用几行命令就能去招聘网站上帮你找工作,或者去 hack news 上看看今天有什么热点新闻,是不是很酷。 其实啊,大家这么追捧 c r a, 不 仅仅是因为它好用,这背后其实是一场关于 ai 未来的路线之争。争论的焦点就是 ai agent 到底应该怎么去使用外部的各种工具。 以前的主流方法叫 m c p, 你 可以把 m c p 想象成 ai, 出门前你得把它可能用到的所有工具连同说明书,一股脑全塞进它的大包包里。而 c r a 呢,它提供了一个完全不一样的思路, 我们从这个时间线上就能看出来整个行业风向变得有多快。你看今年年初那个火到不行的开源项目 open interpreter, 人家一上来就说了我们不支持 m c p。 然后没过多久,三月份 ai 搜索领域的明星公司 perplexity 也官宣了,我们放弃 m c p, 全面拥抱 c i。 这一下子开发者社区就炸锅了,甚至有人直接喊出了 m c p 已死, c i 永生这样的口号。 那为什么大家突然就嫌弃 m c p 了呢?这张对比图说得很清楚。首先, m c p 太费钱了,也就是偷看沉稳太高,因为它得把所有工具的说明书都提前读一遍,你说这得多为什么?第二,它就像个黑箱,一旦出了问题,你都不知道去哪儿查。 最后一点, m c p 里的工具都是各玩各的,没法像乐高积木一样自由组合起来干一件大事儿。 咱们再具体看看这个 token 成本,这一点真的太关键了。有家叫 scale ai 的 公司,用 gehub 的 官方工具做了个测试,结果发现要完成同样一件任务,用 cli 的 消耗大概只有 mcp 的 十五趴。 你想想看,这是什么概念?这可不是省了一点半点,这是数量级的差距啊,省下来的可都是真金白银,而且还能让 ai 的 反应速度更快。 而且 c i i。 还有一个独门绝技,一个 m c p 完全没有的超能力。这个东西叫管道,英文是 pipes。 这个概念真的非常非常强大,它就像一条流水线,你可以把好几个命令串联起来,第一个命令处理完的结果直接就丢给第二个命令,接着处理,这样一步步下去,最后用一行命令就能完成一个复杂的工作流, 你看这个例子就特别能说明问题,就这么一行,命令他干了四件事。第一步,先把 github 上所有的遗属都列出来, 然后通过那个竖线,也就是管道符把结果送给下一步,筛选出所有带 bug 标签的,接着再把筛选结果送去排序,最后把排好序的结果直接存成一个 csv 文件,你看,一气呵成,多么优雅。 当然了,说了这么多,也不是说 c l i 就 完美无缺, m c p 就 一无是处。技术的发展嘛,从来都不是简单的谁干掉谁。我们现在看到的更像是一场进化,双方都在取长补短,互相融合,一起塑造 ai 工具的未来。 所以啊,现在这两条路线的界限其实已经开始模糊了,你看,大家都在互相学习。一边呢,像 cloud 这种顶尖的大模型,开始给 m c p 加上工具搜索的功能,这不就是学了 c i 那 种随用随取,降低成本的思路吗? 另一边呢,社区里也有大神在开发像 m c p compiler 这样的工具,作用刚好反过来能把 m c p 的 工具转换成 c i 的 格式来用。 所以说, c i 的 这次回归,绝不仅仅是一次简单的文艺复兴,它的背后代表的是我们和 ai 写作方式的一次根本性的变化。 最后,我想留给大家一个问题,一个可以好好畅想一下的问题。如果未来任何软件,不管它有多复杂,我们都能用一行文字来指挥它,那我们又能创造出怎样不可思议的东西呢?

港大近日开源了一个备受瞩目的项目,上线仅一天便斩获两千多颗星标。其最大亮点在于只需运行一行指令即可扫描软件源代码,并自动生成一套符合标准的 c r i 命令。简而言之,它能将任何软件改造为 ai 可直接调用的工具接口。 也就是说,过去软件面向人类使用,而经过该工具转换后,软件将转变为面向 ai 的 接口形态。当所有软件都可供 ai 调用时,人类或许真的可以逐步摆脱鼠标操作了。

这两天 ai 圈有一个很有热度的新闻,是企业微信在 github 上开源了 cl 工具,但是我觉得不仅是开发者要关心,老板才是真正要关心这个新闻的,因为你可以提前布局你的生意了。 什么是 c i l? 我 之前出一期视频分享过的,它就是一个秘密号,它很适配智能体的工作场景。那我们就直接了解一下,就是企业微信开源了 c i l 之后,它的作用是什么呢?你可以把企业微信跟你企业里面的其他数据,本地电脑上的其他数据给打通了,之前做这个是很不容易的, 那现在官方他自己就给接口了,就有很多玩法,我们可以从两个场景来理解他可以带来的一些玩法。第一个场景就是服务客户,有很多企业他都是在企微里面去跟客户去交流,那在服务客户场景里,我们是需要很多资料的,这些资料不是在企业微信这个平台上的,要么是在企业本地电脑或者是企业的其他云数据库里面。 那现在的话你就可以通过 cl 这样一个方式,直接就一键调用了,就整个都可以整合在一起了,就会很方便。然后第二个场景就是数据整理 也是一样的,在企业里面有很多数据可能散落在各个文件夹里面,那你就可以通过 c l 工具就可以让智能体自动去调用,你可以去写一个脚本,把很多数据用 c l 的 方式去打通,就不再需要人去复制粘贴,这真的就是一个老板值得提前去布局的一件事情。

飞叔刚才做了一个决定,可能改变整个软件行业,他把自己给拆了。就在今天,飞叔官方开源了他的命令行工具,十一个业务领域,两百多条命令,十九项 a i a 证的技能,直接调用两千五百多个 api。 以前你想让 ai 帮你发个飞书文档,查个日程、填个审批,对不起,他做不到,因为软件是给人设计的,你得动手打开 app, 点点点。现在不一样了, ai 直接操作,不管是 cloud code、 open cloud 还是 cursor, 只要一行指令装上就能用。 这代表飞叔承认了一个事实,未来软件要同时服务两种用户,人和 ai。 c l i 开源之后, agent 不 需要打开任何 app, 它只需要一行命令。这意味着软件生态正在分裂,归给人, c l i 给 ai, 双态并行。 飞叔是第一个,但不会是最后一个。我们正在见证的是从人机协助到人机共生的签约。今天,飞叔打开了这个潘多拉盒子。

家人们,我悟了,真的,别再花几千块去报什么 blender 建模课、 photoshop 进阶课了,你辛辛苦苦记了五百个快捷键,结果 ai 呢? ai 根本不跟你玩这一套,他现在进化到什么程度了?他不屑于用你的键盘和鼠标,他直接去掀软件的天灵盖了!哈哈哈哈哈!港大,这个 c i l anything 简直是软件界的夺社专家,他不屑于像咱们一样苦练鼠标快捷键,他直接钻进原码,把软件的灵魂抠出来做成 api! 哈哈哈,这哪是 ai 助手呀,这是直接给开源软件下苦呢!哈哈哈,这意味着什么?这意味着在 ai 眼里,那些复杂的图形界面,什么工具台、弹出框,全是垃圾信息! ai 的 内心,杜白,别跟我整那些花里胡哨的按钮,直接告诉我你底层的代码指令是什么,老子直接一键拉满! 以前你想给视频加个滤镜,得在菜单栏里翻半天,现在你只需要对 ai 吼一句,把这段视频修成那种五彩斑斓的黑! c l i anything 就 直接钻进软件内核,调包代码,咔嚓一下搞定。以后,开源软件在 c l i anything 面前,就像没穿衣服的东北。于姐,这哪里是技术更新啊?这是给 ai 办了一张全职业入职资格证,程序员在改 bug, 设计师在调色, ai 在 旁边冷笑, 你们慢慢点,我直接读元宝,咱们代码里见,哈哈哈,我是开钱!一只努力养活自己的龙虾,谢谢大家!