都二零二六年了,我知道你们很多人仍然没有使用上目前最厉害的 ai, 通用的智能体 cost 五点三, 大部分人仍然在使用豆瓣元宝的黑屏,所以今天我手把手的教给大家如何每个月只用花费十五块钱就能够使用到目前这个世界上,或者是我心目中最厉害的通用 ai 智能体 cost 五点三,你们很多人都 下载过这个 cursor 编辑器,是吧?目前最流行的一个 ai 编辑器,那这个 cursor 内置的这个编辑器里面的模型非常的多,有 codex, 有 cloud oposs 的 四点六,都非常的好,但是你需要升级到 pro 的 这个会员的版本,而升级的会员的版本的价格大概是在 每个月大概是二十美刀,所以说我自己也摸索出来了一套,每个月大概是二十美刀,所以说我自己也摸索出来了一套,每个月大概是二十美刀,所以说我自己也摸索出来了一套,每个月大概是二十美刀,所以说我自己也摸索出来了一个。 我们今天三步教你搞定怎么使用上这个 codex。 首先第一步一定要登录 check the gbt 的 官方网址,所以你们在搜索 check the gbt 的 时候,一定要认准这个网址的名称, c h a t check the gbt, 点 c o m。 因为现在国内的那个网站 乱七八糟的,一定要认准这个网址。点击进去之后购买一个 check the gbt plus 会员,购买成功之后你就能看到这个五点二, cbt plus 会员购买成功之后你就能看到这个五点二三 k 的 这个模型。切换到 第二步,来到这个 cosplay 编辑器,进入到这个插件市场,搜索 codex, 认准官方的这个 open ai 的 图标,蓝色的官方的一个版本,点击下载, 下载之后再点击 codex, codex 会进入一系列的用切克 gpt 登录的那个页面,然后用账号邮箱进行登录。第三步就可以在这个对话框里边连接到你的整个的电脑的文件夹进行登录。第三步就可以在这个对话框里边你不光是可以向他提问,他一问一答,这个模式 还可以直接帮你去接管你的整个的电脑系统,接管你的 c 盘, d 盘, e 盘,让他任何的一个文书工作都能够帮你去实现。一定要记住不要使用 cursor 类制的这些模型,因为它实在是太贵了,一个月需要二十美金,如果你没有额外的收入的话,可能不能够支撑你继续走下去。 所以说我自己探索出来了,一套十五块钱就能够使用目前世界上最顶流的 ai 模型。好的,赶快去试试吧。
粉丝2151获赞1.1万

就在今天, astonovic 放出了他们的最强模型 cloud office 四点六这个最强的头衔,它只保住了二十七分钟,半个小时不到, openai 直接在线狙击发布了 gpt 五点三 codex。 这里放一张今天特别火的图,美国的 ai 大 战 vs 中国的 ai 大 战,大家怎么看?熟悉我的朋友都知道我的 ai 大 战 vs 中国的 ai 大 战,大家怎么看?熟悉我的朋友都知道,我的模型评测风格一般,不去看一些奔驰实测, 两个模型同一个 problem, 正面硬钢,剧透一下哈,结果挺意外的,一个功能做全了,但代码有坑,一个代码漂亮,但他前端漏了功能,到底两个模型哪个写代码更能打?看完这个视频你心里就有数了。 好,我们下面来快速过一下模型树懒部分 off。 四点六这边三大亮点,第一个, 它的一个上下文翻了五倍,到了一百万 token, 但目前只能按 api 付费的用户才能去体验。第二个 agent teams, 多代理协助,不是以前那种只代理模式,是真正的团队多个 agent 并行干活,互相沟通,质疑,不通过这个负责人去中转。第三个的话,它整个的一个输出 token 啊,翻倍了,由原来的六十四 k 到现在一百二十八 k, 可以 执行一个更长的一个任务,不中断。好,我们来看一下 gbt 五点三 ko deck 这边在第一项这一块, terminal bridge mark 这个参数呢,它是比 office 四点五要强接近十二个百分点,并且 这个速度相较于它的上一代模型快了百分之二十五左右,我的一个体感非常的明显,特别快。第二个的话是它的一个 首个参与构建自身的一个模型,也就是说他用早期的版本来 diabag 自己的个训练管理部署,然后针对评估 ai 帮自己 diabag, 想想就挺科幻的是不是?第三个的话是以前扣贷干活你只能等着,现在你可以随时介入,随时去调方向,不用先停止了。 那真实项目这一块的话,我给他准备了两个项目,第一个让他去做一个跨项目的一个迁移认证体系,也就是说我有一个纹身图的一个 agent, 我 要让他去参考另外一个项目,把那部分啊,谷歌邮箱登录、 github 邮箱登录 认证全部给他摘过来,这个考验他对另外一个项目的探索能力、架构适配能力。但第二个项目的话,我之前做了一期视频,是讲 skill 的 加载原理的,那并且我也做了一个开源项目,把它放出来了,那个时候是一个终端交互的一个性质,现在我把它做成一个外部 y。 第一个是 cloud 四点六完成的一个落地页,大家觉得怎么样?就一般般吧。那它在登录这一块的话, github 谷歌邮箱注册全部搞定了,没有任何的问题,我们也可以试一下,点击 可以看到它能登录成功邮箱也是对的,那整体这一块的话,它是整个完成度还 ok 的。 我们来看一下 gbt 五点三 codex 表现怎么样。 首先落地说实话不太行,比较简陋,大家看它的那个集成登录的情况,只实现了 get up 后端的代码,谷歌那边它也完成了,但是它没有在前端上写一个按钮。整体这一块的话,我会把票投给 cloud off 四点六 单看功能这一块哈,但是后面还有坑,待会我再慢慢讲。好,下面我们来看另外一个项目,就是给一个 skills agent 去加一个 外部 ui 嘛,因为之前是终端,我们来看一下,也就说我有这样的一个项目啊,这个项目是去使用当前一点零去构建了一个 skills agent, 演示了这个三层加载的一个原理嘛, 那主要的一些特性的话,就是有一些流势输出,然后托肯的响应,显示工具的名称,执行的过程,展示三层 skills 的 一个加载过程。原来的话是通过终端 ui 去交互的嘛,现在我希望他给我们做成一个外部版本,我们直接来看结果, 这个是 cloud 的 off 四点六完成的,这个 ui 太简陋了。 ok 来给了一个这个平台的文章,让他去做 思考,他会去做加载技能,然后去分析,再提取,再做其他的一些任务,看他能不能做到。 ok, 可以 看到他有调用的 skill 去加载这一个 skill, 然后他去执行那些命令,他发现这是命令有问题,他这个时候需要去安装相关的依赖, 那这个的话就是 gpt 五点三 codex 完成的,左边是他发现了我安装了哪些 skills, 并且右边你可以开多个聊天框去聊天,我在提示词里面其实有让他去要去实现对应的一些指令,那 gpt 五点三这一边的话是完成的非常好的。好,我们来试一下, 可以看到这边它加载了就是新闻提取器,这个时候它会去执行霸性,跟那边一样,因为一些依赖问题,这个先忽略它,总之就展示这一个加载的过程嘛, 很明显 gpt 五点三 codex 完成这个版本会比 off 四点六会好很多,我感觉不管从 ui 上交互上, 这一轮我会给他投票。好,我们来看一下完整的一个对比结果。第一个项目就是给这个 agent 加上一个用户认证体系嘛,主要是 email, 谷歌认证 get up, 然后从另外一个项目迁移过来。我们来看一下评分情况, 对话人数大家都用了第一轮,那功能完整程度的话, off 四点六这边要完整一些,所以给了他九点五分。 那 gpt 五点三这边因为它漏了嘛,所以说它的评分要低一些,在 ui 上的话也是这边会好一些。在代码架构上这个就有有的说了,在代码架构上的话, off 四点六这一边就是快,但它整体的实现其实有有一些漏洞, 那 gpt 五点三扣带这边它就像一个更有经验的工程师一样,然后整体的代码架构,工程规范都很完美, 为什么会得到这一个评分呢?给大家解释一下这个评分怎么来的。他们两个模型把代码写完, get commit 提交完了之后, 我用了他们两个最顶尖的模型去 review 代码,先让 off 四点六去 review 啊,两个人写的,再让 gpt 五点三 code 是 两个人写的,大家得到的结果都一样,就是 gpt 五点三 code 写的代码要好, 只不过在功能实现上它漏了,以及在落地页上它的实线会没有 off 四点六那么好看。但是代码这一块的话, gdp 五点三扣袋子这边肯定是要厉害一点的。 那整体总结一下的话,在代码架构上扣袋子要领先一些,它全链路的用户隔离、迁移、脚本测试覆盖都写到了。但实际功能体验上的话, off 是 因为它三种登录都可用, 然后 codex 它这边缺少了一个谷歌的,我不知道它为什么会缺少的。哈,那 ui 设计上也是 office 更优。那第二个想法,就我们刚刚看到的,我们把这个 skills agent 的 一个终端 ui 变成一个 web ui 嘛,那这块的话, gpt 五点三就明显领先了,不管是在 ui 上还是整体的代码实现上, 都要领先于这个 off 四点六。所以说我觉得整个这一次的发布来看的话, off 四点六它的代码提升并不是特别明显,反而这个 gpt 五点三 codex 相较于 gpt 五点二 codex, 我 认为它们提升了蛮多的。因为这几天我也一直在用 gpt 五点二 codex, 以前是速度有点慢,现在是速度又快,质量又高,我觉得未来 g p t 五点三 codex 大家会用的特别多,不像以往一样,大家可能都用 cloud code 的, 现在的话多了一个选择,并且它更便宜。我做这一期测试,我把这个 off 四点六这个模型的 整个五个小时的窗口全部用完了,但是这个我只花了二十道订阅了,它还没用完,一直可用,一直可用,很爽,速度又快,那为什么不选择一一个便宜,质量又高的呢?所以这一轮总结来看的话,就是 codex 整个代码实现明显领先,功能实现也领先,整个 uiux 都领先,所以说我把票投给了 codex。 好,我们来一个总结,第一个项目去做跨项目的一个迁移认证,这轮 off 四点六渗出, 第二个把一个终端 ui 变成外部 ui, 这一个 gpt 五点三 codex 渗出。那整体平均来看的话, codex 是 要领先一些,因为它这一次提升真的非常明显,速度快,成本更友好,而且后续的话我会更加的去增加我整个 codex 的 一个使用频率。 ok, 这就是这一期视频的全部内容了,如果你觉得视频做的不错,可以给我一键三连,谢谢大家,拜拜。拜拜。

我试用了几天 openai 新推出的这个 codex 整体使用情况,我是,我觉得我是非常满意,然后用户体验非常好, 尤其是针对那些不喜欢迷你行工具,或者是不知道怎么用 ide 的 那些,给你们看一下这个界面哦, 他这个里都是以文件夹形式,一个项目就是一个文件夹,然后这个文件夹下面你可以跑多条任务,我为什么要出来用呢?你在一个窗口下面,你布置了任务, 你可能还会有些其他的问题,你和他进行了探讨,等你这个上下文过长以后啊,整个模型它的召回率就会比较低, 这就是我们说的那个上下文污染。现在按照这样的方式,他其实已经在引导你,告诉你说,呃,你的一条任务就在一个窗口里面跑,在一个对话窗口里面跑就行了, 然后你可以开多个对话窗口去一个分别执行。还有一块我觉得是比较有特色的,是 openai 做了一个,现在看上去我感觉就是一个给我的技能商店, 然后每一个 skill 你 就可以直接一键安装,安装完成了以后去聊天窗口你就直接可以用,刚刚装好了就在这里就能看到,这个实在是太方便了,然后你不想用了,或者是你觉得不好用,你就直接卸载掉, 这个我真心觉得怎么说,我觉得这应该才是一个软件真正该有的样子吧。然后它的编程我做了一个简单的小测试啊, 因为我看网上有很多人已经测试过了,然后都说速度很快,但我不知道为什么,我这里设置的,我就让他帮我创建一个 to do list 演示程序,然后这是一个很基础的软件了,很基础的一个小的需求了, 但是他应聘的时间你看 work worked for 七分十七秒,我对这个数据, 对这个时间我感觉挺震惊的,然后我就赶紧跑去拿 claus, 四点六跑了一下,一分十七秒就跑完了。那反正我觉得我对 codex 的, 我对它的模型的能力其实是认可的,因为原来我也是在 cursor 里面,经常在 cursor 里面去用 codex 五点三,这个用 codex 五点二,那时候没五点三的时候就用五点二去 改一些比较顽固的 bug, 所以 我对 openlight 的 模型能力从来不怀疑,只是说原来 curses 里面有我没用而已,就没有用官方的了。然后简单说一下这个软件的一些小配置, 这边有个开关建议把打开,因为他可能运行的时间比较长,你电脑可能会睡眠,导致程序运行中断,这个打开了他就能保持你电脑一直处于一个唤醒状态。然后这边是这样模式的话,呃,你可以 相当于你下指令以后,你可以补充你的指令,或者是嗯,他朝另一个方向去思考。这两天反正应该有。我没仔细看他的更新的频率,但我前两天用的有的 bug, 这两天就已经没有了。 我之前这里他会弹出选择框的时候,那个选择框选完了,但是那个选择框不消失, 反正我今天用了一天,我也没发现有这个问题,应该是已经修复了。总结一下,我觉得这次这个格式化界面真的给人耳目一新的感觉。我习惯了格式扣的,但是我用这个我还是觉得用的很爽, 用户体验非常好。格式扣的里面看时间长了我觉得也就切来切去,我切的也很头疼, 我还是强烈推荐大家去试用一下。无论你是做 webcoding 也好,还是说你做一些文案类的工作,我觉得这个软件都非常非常适合你。

前两天呢, oppo 还推出了 codex 的 app 版本,所有计划的用户呢都可以使用,并且额度翻倍两个月,也就是说接下来的两个月你可以爽玩,如果你有 mac 设备的话,可以直接下载进行使用。我们首先来看一下这个页面里都有些什么功能,在左侧映入我们眼帘的呢,就是这个定时任务, 然后定时任务下面呢还有一个 skills, 第一个呢是技能创建者套娃这一块,玩明白了,这个呢应该是从 github 上搜索安装, 我们可以试一试。我说我需要一个制作 ui 的 skills, 然后发送给他,在这里呢我们就能看到他运行的命令帮我们创建。下面呢又询问了我们一下,是否允许他列出 getup 中的项目。好,当然可以,我从精选技能里查到了跟 ui 最相关的这些,他把它列了出来,问我们想安装哪一个,我随便让他装一个吧。 已经把这些 ui 相关的 skills 都装好了,重启 codex 就 能加载 skills, 我 们在上方点击这个刷新,就能看到它帮我们安装的技能,可以说是非常方便。我们接着来试一下它,这个技能创建者,我让它制作一个可以利用 remote 生成丝滑文字动画并生成视频的 skills, 我 可以发送, 现在已经写完了,我们让它安装一下,安装到这样呢,它就会自己找到这个合适的位置安装进去。就关于 skills 那 个视频,我已经拖了有个一个多月了,看来好像不用出了,这个很方便,我们看一下它安装的怎么样, 刷新一下哦,已经存在了,在这里你可以直接点击他,然后进行尝试,这样呢,就自动选中了一个技能,你再去聊天的时候,直接就默认用他,我让他制作一个 skills 的 科普视频, 然后直接来吧,虽然他下边还没跑完,但是这个视频已经出来了,我们可以简单看一下。你有没有发现最近到处都在聊 skills 啊,他应该用的这个技术是不支持中文的,但是这个动画是可以的。 在上期视频呢,我用那个 mini max agent 也做了一个类似的,我还是那个观点,就是你用 skills 来制作视频,它性价比太低了,所以我们先不管它了,看一看其他的功能。我们可以在左侧看到这个工作区里我们聊的所有内容,也可以直接新建一个工作区,或者是把本地的文件直接在这里打开。 比如说我刚才把我的博克工作区给导入了进来,那这里呢,可以看到他还有很多的聊天记录,因为这个项目在很久之前,我用过 codex 来给大家做过演示。可能有些朋友呢,还记得我曾经让他在这个项目中呢,添加过一个精灵球,点击之后出现烟花。我这里呢给他一个任务是尝试在首页添加一个悬浮的精灵球,点击后 出现烟花,那在右下角呢,可以看到有这个精灵球,点击一下,啊,有这个彩带, 我说是烟花啊,他给我做成彩带了。一个新的对话中呢,在下方我们可以选择三种不同的模式,第一种呢就是本地 到我们本地进行操作。第二个呢就是工作区里泊客税模式呢,是 get 版本控制的一个高级功能,我们可以在同一个 get 仓库里创建多个独立的工作目录,每个工作目录呢都可以剪出不同的分支,而且还不需要多次的克隆,主要是可以节省值班工钱和时间,尤其是一些大型的项目,可以直接并行的开发,同时去修复多个 bug 或者创建多个功能。 第三个 cloud 就是 云嘛,不会在我们本地进行任何操作,而是在 openai 的 服务器上去进行处理。大家所熟知的那种一两个小时的长任务,那就可以在云端里进行完成,包括说我们一开始提到的这个定时任务,当我们设定在云端的时候,即使是我们的电脑关机,它一样会开始工作,大家可以按自己的需求去选择, 我一般呢还是选择本地,主要就是发发博克,它的即时性比较强,我要在本地实时的看它的效果。当我们在这个工作区里随便聊了一句之后,那右上角呢就会多出一个运行的图标,我们点击一下可以在这里设置我们的运行命令,因为这个项目呢就是一个 x o 静态泊客站点,所以我给他设置了一个启动命令,然后我点一下 它呢就会自动在下方去启动,我们也可以直接点击去添加更多的命令,然后可以在这块查看,比如说 debug 或者是这个 text 的 测试。只不过如果我们只在这里配置,它只应用于当前的对话中。如果想要整个工作区都默认使用这一个命令,那我们点击下方这里 啊在这一块进行添加就可以了。在后面呢我们还能看到有个按钮,哎,好奇怪,点击下菜单哦,有很多的 ide, 也就是在其他的 ide 中去打开这个项目,那后面这个就不用说了,就是 get 用的嘛,在后边就是快捷打开一个终端,可以直接在里边输入命令之类的,然后是这个更改记录 啊,都能在这里查看。最后呢还有一点刚才我们没有提到这个语音就不说了,就是前面这个按钮,他默认情况下呢,是在一个沙盒里去进行我们的命令, 但当我们点击之后呢,就赋予了他最高的权限,他这里呢也有提示,非常的危险,所以不建议大家打开更多的配置呢,各位可以在设置里去查看。 总体的功能大概就是这么多,应该都讲到了,我个人还是比较喜欢这种设计风格的,各位如果感兴趣,又刚好有麦克设备,可以下载来看一看。那以上呢就是本期视频的全部内容了,如果对你有所帮助或者觉得视频做的还不错的,欢迎给个一键三连,有什么想看的内容也可以在评论区进行留言,我都会看。那最后祝各位玩的愉快,我是段峰,我们下期再见,拜拜!

兄弟们,我能想象出五点三很强,但是没想到这么强,这速度已经快赶上 o case 了吧。以前五点二的时候,虽然它的代码能力很强,但是实在是太慢了,导致很多人都不喜欢用它,只有出了 bug 的 时候才会想到 code。 但现在你们看,这个速度 跟之前的模型完全不是一个东西。最最最最重要的是五点三格式它除了速度快以外,写代码的能力也并没有丢失,依然稳得可怕,依然是言出法随,大家快去试试吧! 本视频仅为程序员实测对比胡拉踩结果,仅供参考。你用 gpg 五点三还是卡的四点六?评论区说说你的真实感受!

刚刚 openai 把 codex 做成了一个独立的桌面应用,还搞了个限时活动,不仅免费用户和购订阅都可以使用,而且付费用户的额度翻倍。左侧可以添加多个仓库, 直观明了管理多个仓库,允许同时开启多个现成,给 agent 安排不同任务。设置了专门的界面来创建和管理 skills, 内置二十余款 skills, 可以 非常方便地统一管理。官方还搞了个很夸张的演示, 让 codex 使用 skill 做了一个三 d 赛车游戏,整个过程消耗了超过七百万 token, 只用了一条出使 prompt 还内置了 automations 自动化功能,让 codex 按时在后台自动跑任务,比如找 bug、 生成周报等等。还内置了 work trees, 多个 agent 可以 在同一个仓库上同时工作而不发生冲突。不仅提高效率, wipe coding 的 门槛也大大降低了。

codex 免费了!就在刚刚, openai 发布了 codex 的 桌面版 app, 并且这段时间可以免费使用 gpt、 五点二等最新模型。这可不仅仅是简单的代码工具,而是你的全天候 ai 助理。它能够自动化执行每天定时任务,比如每天拉取金融信息、 ai 资讯生成进度报告等,省掉大量机械操作。 同时还内置了诸多 skills, 甚至还支持一键创建 skills, 以及如飞格玛、 m c p 等也都内置其中,多肉并行也不在话下,后台执行多个县城每个都在为你卖命干活,这简直就是河东牛马!趁着免费赶紧下载体验吧!关注我,了解更多 ai 干货!

tiktok 上最近出现了一个非常火的项目, agent skills for contest engineering, 发布不到一周就斩获了二点三 k stars。 为什么它能瞬间引爆社区?今天我们深入来聊聊这个项目。你可能有过这样的经历,用 ai 编程时,明明给了足够的上下文,可 ai 要么答非所问,要么被永长的历史信息绕晕。最近 github 上的一个项目或许能解决这个痛点。 这个叫用于上下文工程的智能体技能的项目,发布不到一周就拿下了二点三 k 星。为什么他能这么火?我们从二零二五年末的技术背景说起, 这些年大厂白皮书里反复提到上下文工程,但对每天敲代码的开发者来说,那些理论太飘了。 我们需要的不是什么是上下文的论文,而是能直接用到 cloud code 里的工具。这个项目恰恰填补了这个空白,它把灰色的上下文管理策略打包成十个即插即用的智能体技能,借助 cloud 的 自动加载和触发机制, 让 ai 终于能像资深工程师一样自己管理内存。这就是一套上下文工程的最佳实践工具库。怎么理解它的核心逻辑?项目把上下文拆解成五个部分, 系统指令、工具定义、查找文档、消息、历史和工具输出。其中工具输出是最拖后腿的。研究显示,原始工具返回结果往往占了上下文百分之八十以上的体积,就像你电脑开了太多网页导致卡顿。 ai 的 上下文也有注意力,预算 一旦超支,性能就会下降。项目提出的渐进式路由策略就是解决这个问题的关键。初始状态下,智能体只读取所有技能的名称和简短描述,就像你手机桌面只显示常用 app 图标。 当你输入 prompt 后,智能体会自动进行语义匹配,找到相关能力,再加载详细内容。这跟操作系统的液交换机制很像,确保模型始终处理最相关的高信号信息。 你可能听说过 ai 的 迷失在中间现象,当信息放在上下文中间位置时,召回准确率比两端低百分之十到百分之四十。 除了这个,长对话里还会出现上下文中毒、干扰、混淆、冲突等问题。比如你先问 ai 怎么写 python 爬虫,再问怎么优化 java 性能。旧的爬虫信息可能干扰 ai 对 java 问题的回答。项目里提到的压缩优化技术能帮我们解决这些问题。 比如观察掩码技术,读取原文后提取核心结论,把原文从上下文里替换成引用 id, 这样上下文体积能骤降百分之九十。就像你把厚厚的参考手册换成一张锁影卡,需要时再去查详情。还有铆钉、叠带、摘药技术, 维护结构化的状态快,包括绘画意图、状态清单、决策记录和下一步行动向,让 ai 始终记得对话的核心目标。在多智能体协助场景里,上下文隔离很重要。比如一个项目分三个智能体, 写前端的,写后端的,做测试的。如果写前端的智能体看到后端的代码细节,可能反而会影响它的工作效率。 项目建议,每个子智能体只关心自己的任务,拥有专用工具,减少后选工具数量,实现故障阻断。 就像工厂里的流水线,每个工位只做自己的事,互不干扰。记忆系统也是上下文工程的重要部分。传统的向量检索有个时态盲区,它能找到相关的知识,但不知道这些知识的时间顺序。比如, ai 可能会把二零二三年的旧技术和二零二五年的新技术混在一起。 项目里提到的时态知识图谱就是给知识加上时间戳,让 ai 能区分旧方法和新进展。在工具设计方面,项目提出了一个反直觉的建议, 不要为每个细小功能写一个工具,而是把高度藕合的步骤合并。比如,你要做读取文件加分析代码加生成报告,与其写三个工具,不如合并成一个,这样能减少工具调用次数,提升效率。 项目还建立了完整的评估体系。智能体性能的百分之九十五变异由三个因素决定, token 使用量占百分之八十,工具调用次数占百分之十,模型本身选择占百分之五。这意味着优化上下文比换模型更能提升性能。 最后,项目给出了从 demo 到生产环境的五阶段流水线方法论。第一阶段,先用人肉方式跑通流程,再写代码。第二阶段,利用文件系统作为状态机,管理任务进度。这跟软件开发的最小可行产品思路类似,先验证流程可行,再投入开发。 通过这个项目,我们能看到,智能体开发已经进入了系统工程时代。以前我们可能只关注模型本身,现在发现,上下文工程才是构建确定性系统的关键。就像造房子,模型是地基,上下文工程就是框架, 没有好的框架,再好的地基也建不起高楼。这个项目的意义在于,它把抽象的上下文工程理论变成了开发者能直接用的工具,让更多人能用上高质量的智能体。说到这里,你可能会想, 以后 ai 会不会自己变得越来越会管理自己?我们会不会不再需要花太多时间调整 prompt? 这些问题或许会在未来的技术发展中找到答案。好了,今天的内容就聊到这里了,如果你有什么想法,欢迎在评论区交流,我们下期再见。

来,普通人想要用 ai 去接管你的任何工作,你只需要有一个 open ai 旗下的大模型,叫 codex, 不 需要你去下载什么豆瓣元宝,什么 kimi, 你 只需要这一个大模型来跟着我操作。首先 开通一个 china gbt plus 会员,开通成功之后,他就会给你多一个五点二 thinking 这个模型。好,如果说你们现在一个月不愿意花二十美刀去购买,现在也有一些团队的拼车的服务,可以把价格打在二十块钱人民币以内一个月。 好,第一步,登录之后,在任何的 ai 编辑器里边,我使用的是 cursor, 你 也可以使用 vs code 等等在插件市场里面搜索 code x 哦, code x 搜索之后找到 open ai 官方的快捷插件,点击安装好,我已经安装好了。安装好之后就是这个页面使用切的 g p 登录,刚刚我们已经把账号和密码登录了,我们来回到这个 ai 编辑器里边。好,就是这个页面,我们一直点下一步,下一 步,下一步。好,这时候我们选择权限,我们给他,我们给他全部的权限。好, 我们给他完全访问的权限。为什么要完全访问的权限呢?因为风浪越大鱼越贵是吧?这个权限的意思就是你的电脑里边的所有的文件夹,所有的文件夹系统全部归 codex 管理,不管你是做呃编码工作,还是做各种文书工作,还是任何的需要你手动去呃办公的软件。不管你是想安装什么 opencloud, 就是 那个龙虾的机器人吗?还是想安装 cloudcloud 的, 还是想做一个 ppt, 还是想做一个 word, 还是想做一个 呃什么财务的、法律的、文书的那个全部在这个小黑框里面都能够实现,有不懂的可以问我。

前两天发的 cloud 指挥 codex 干活的视频火了,评论区两级分化,有人说这套架构确实提效明显,也有人说纯玩具卵用没有。 今天我们就一步步把这套写作系统搭起来,建议先点个赞,关注加收藏。我的态度很简单,没有调查就没有发言权,跑一遍再下结论。 好,先说清楚这套架构到底有什么好处呢?第一,在复杂编码场景下,极大降低 cloud token 消耗。 cloud 最贵,但我们不让他写一行代码,只让他当甲方领导,当项目经理,分析需求、拆分任务、验收结果,最费钱的代码实现全部交给别人来做。第二,实现监工效果。 cloud 充当甲方领导和项目经理,负责规划和验收。 codex 是 后端开发,负责服务端代码编辑和单元测试。 gemini 是 前端工程师, 担任代码审查和安全审计。第三, codex 和 gemini 成本几乎为零,量大管保。结论就是 cloud 出脑子, codex 和 gemini 出力气,钱花在刀刃上, 真正花钱的只有 cloud 做决策那一小部分。在开始之前,你需要确保三样东西都装好了,分别是 cloud code、 codex client 和 gemini client, 执行视频中的三个查看版本的命令,如果都有版本号输出,那环境就没问题,没装好的先暂停视频去装一下。 第四,也是很多人漏掉的一步,理解整个工具链的使用顺序。这三层是有先后关系的。第一层 cloud md 是 规则层, cloud 启动时自动读取,里面定义了协助、规范和角色分工。 第二层, superpowers 是 能力层,提供标准化的规划、审查、调试流程。第三层, c、 c、 b 是 通信层,让 cloud 能通过 ask、 pen、 ping 指挥 codex 和 gemini。 第五,在 cloud md 里写好协作规范。接下来看我本地的文件。首先定义了 cloud 是 架构师、项目经理, codex 是 后端开发, gemini 是 前端开发,这是最基础的角色分工,简单明了 降级机制,明确了异常情况下的接管规则。接着明确了协助方式,使用 superpowers 进行任务设计,通过 c c b 相关命令指派任务。 同时还定义了 linus 三问以及 get 代码提交规范等。这些规则 cloud 启动时会自动读取,不需要每次手动告诉他。你只要把规则写好, cloud 就 会严格按照规则来执行 好。接下来我们进入 cloud 执行视频中的命令,进行 superpowers 插件安装,执行视频中的两条 plugin 命令就可以出现, successfully 就 证明安装成功。 安装完成后, cloud 就 具备了标准化的规划、审查、调试能力,这些能力后面实战中会用到,非常关键。接着要安装终端附用器。 ccb 是 依靠终端附用实现多个模型之间的通信, linux 和 mac 用户安装 tmax 即可, windows 用户需要安装 winterm 或者使用 wsl。 本教程以 tmax 为例,安装方法很简单,一条命令就搞定,执行命令后,我们进入新的终端环境。第八,安装 ccb, 全称 cloud code bridge, 这是让三个 ai 互相通信的桥接器。注意, ccb 是 社区开源项目。特别感谢 bfi 幺二三作者的贡献,它不是官方内置功能。 ccb 依赖 python 三点一零以上版本,安装前先确认你的 python 版本没问题。 python 版本确认无误后,我们执行 git clone 下载 ccb 项目,下载完成后 cd 到项目目录, linux 和 mac 用户执行 install h install 命令, windows 用户用 powershell 执行安装脚本,安装过程中 c c b 会自动配置通信组建,并在 cloud md 里注册 ask、 pinned、 ping 这些命令,等安装脚本跑完就可以使用了。你可以看到终端输出了安装成功的提示信息,整个安装过程非常顺畅,基本不会遇到什么问题。 好总结一下安装步骤,第一步,编辑局域, cloud md 定义协助规则。第二步,安装 superpowers, 提供标准化工作流程。第三步,下载安装 ccb, 打通多模型通信。三步走完,整套系统就搭好了。接下来我们进入实战环节,执行 ccb、 codex、 gemini、 cloud 命令,启动协助系统。 第二部分, cloud 是 项目经理,只动嘴不动手, codex 和 gemini 是 干活的,成本几乎为零,这就是省钱的核心逻辑。 cloud 现在开始下发任务,我们用一个真实案例实现用户注册功能需求如视频所示, cloud 调用 superpowers 开始收集用户需求,制定开发计划,可以看到它在分析需求,确认技术栈,设计系统架构,整个过程完全自动化,不需要人工干预。我们简单看一下 cloud 生成的计划, 规划的非常清晰, gemini 和 codex 的 分工非常明确,甚至还详细列出了项目的文件、架构、接口文档、验收标准等内容,这就是 superpowers 规划能力的价值,省去了大量的沟通成本。 cloud 把规划好的后端任务通过 ccb 发送给了 codex, 你 看画面上, codex 收到命令后,立刻开始疯狂扣顶,速度非常快,文件在不断滚动, 可以看到 cloud 已经获取到 codex 正在执行任务的状态。与此同时,他又通过 ccb 给 gemini 下达了前端开发任务, 两个模型现在是并行工作的,互不干扰,效率拉满。 gemini 收到了任务。你看,任务里面明确列出了前端开发功能、验收清单、注意事项等内容。任务描述非常详细, 这就是 cloud 作为项目经理的价值,把需求拆得清清楚楚。两个打工人正在努力完成需求,我们稍等一下,看看他们的执行结果。 cloud 为了更精确地掌握开发进度,建立了三个 task, 用于跟踪前后端开发及代码审查任务。你看,它自动创建了任务列表,标注了负责人和当前状态,这就是项目经理该干的事情,实时监控进度,确保项目按计划推进。 这时候, cloud 发现 gemini 只是确认了任务,而并没有真正开始执行。随后, cloud 重新将任务委派给 gemini, 催他赶紧开工,你看这个监工效果是不是很到位。另一边, cloud 跟踪到 codex 已经完成了开发和测试工作。接着 cloud 去查看 gemini 的 执行进度,结果发现 gemini 还是只确认了任务,没有动手, 这已经触发了降级规则。于是 cloud 果断让 codex 接管前端开发。这也是这套架构的另一个特色,无需让用户去处理这种特殊情况, 只需要把任务交给 cloud, cloud 就 会根据 cloud md 里定义的降级规则自行安排处理,直到完成项目要求。整个过程完全自动化。 codex 此时正在飞速编写前端代码,一个人干两个人的活。这里我们跳过执行过程,直接看最终结果。 完美 codex 已经完成了前端开发工作,但是由于我们在掩饰中故意让 gemini 不 可用,所以 cloud 只能亲自开展代码审查工作。他调用了 superpowers 的 审查能力, cloud 完成了代码审查,出具了详细的 review 报告。接下来他开始创建 git 提交。我们来看一下 cloud 做的 review 报告, 报告内容非常清晰,详细总结了前后端代码的完成度、安全审查结果是否存在潜在漏洞,以及整个写作过程的总结和验收标准的达成情况,质量相当高。 好,我们来做一个总结, c c b 加 superpowers 这套架构的核心特点是灵活高效,节省 token, 合理分工。 cloud 只做最关键的决策和验收,所有编码工作全部委派出去, 降级机制保证了系统的容错能力,任何一个模型出问题都不会影响项目的正常推进。多 ai 写作的关键不是模型数量,而是统一输出和统一验收。建议先用 cloud 加 codex, 两个模型跑通一个完整流程,稳了再加 gemini。 下一期我们讲 crcd 与自动化,把今天搭的这套工作流接入,持续集成流水线。点赞关注不迷路,我们下期见!

codex 中可以免费使用的,就在前几天,萨姆奥特曼宣布为了庆祝 codex 用人的发布,添加了免费访问服务, 接着更是直接宣布在活动后将会继续向这个 free 用户提供 codex 服务。在 codex 中,我们能够直接使用最新发布出的 gpt 五点三 codex 模型,接下来介绍如何在 codex 中使用这个最新的 gpt 五点三 codex 模型。首次安装 codex 的 话,我们需要在终端中输入这行指令, 就是如果是我们之前安装过的话,先输入下面的代码,也就是这行代码来更新我们的 codex c l i, 否则就会用的是旧模型。输入后呢会提示添加了几个 package, 代表我们更新完成,然后输入 codex, 显示 codex 得到了升级, 比如就在这里显示我们 codex 已经得到了升级,将会使用这个 gpt 五点三 codex 模型。其中我们点击 try new model, 也就是使用这个新的模型, 然后再进入下面的页面中,我们可以看到就顺利使用上了这个模型。他在问我们要不要给 codex 配一个沙箱的环境来保护我们的文件,并控制网络访问入口。其中有三个选项可以选,第一个是 set up default sandbox, 它需要呢管理员权限,会创建一个隔离环境,限制文件的访问范围,然后控制网络权限,这是一种比较安全的方式。 第二种是 user 默认 sandbox, 不 需要完全权限,配置更简单,但隔离能力会弱一些,可能会发生提示错误的一个风险。还有一种就是退出选择之后,进入以下界面,我们就顺利地升上了 gpt 五点三 codex 也能显示我们当前的工作。一个目录进入了 codex 之后,我先拿我之前做的一个小项目做测试。 作为一个自媒体博主,我经常需要对测评 ai 产品,特别是办公赛道与 excel、 数据处理、数据格式化等等一些问题。之前我用 cloud code 加 glm、 四点七错漏子以及数据生成器就是这个表格,它支持人力资源类,然后财务类、销售类、行政运营类 的一个表格的生成,里面包含各种各样的数据,比如员工画名册、考勤记录表、销售订单表、项目进度表等等。 这个数据生成器呢,可以选择每文件的行数、每类型生成几个文件以及导出的格式,还可以在点击预览数数据之后,可以直接下载选中表格。因为当时生成的这个 ui, 我 个人觉得还是比较 ai 味比较重,不是太好看。于是我把这个项目先投给 codex 帮我优化优化。先优化它的性能方面, 可以看到这个 codex 先快速扫描我这个项目的结构、依赖和关键代码、路径、性能和维护性等等,直接对这个仓库的项目进行可运行的一个优化。优化完成了,它主要改了以下这几个文件中的内容,从性能、交互稳定性、项目与文案文档方面进行一个修改完善, 使用起来比原本的更流畅,下载起来的体验也是更快速、更方便。接着我又让 codex 帮我优化了一下界面 ui, 因为之前的 ui 界面我觉得 ai 味儿挺重的,这个是它优化之后的,我觉得审美还是非常可以的,非常清新淡雅的那种,又让它生成了另一个版本的 ui 界面, 科技味儿比较重的这个深蓝色的样子。之后呢,我又让 codex 重新呢做了一个基于网页的瞬时记忆小游戏,用于训练和测试玩家的短时记忆能力。 这个游戏的玩法就是先记住彩色格子的颜色位置,再在空白网格里选色选色,然后填回正确答案。主要的玩法就是进入关卡后,网格中会短暂显示目标彩盒方块,然后目标方块隐藏。进入一阶段, 玩家先在调色板选择颜色,再点击对应位置,达到本关目标数量后,会自动剔掉并判定结果。整体的首页的 ui 设计,包括可玩性以及这个游戏内的关卡。这个方块的设置评分的规则我觉得都是非常的 优秀,从推出 codex c l i, 再到推出 g p t 五点二 codex, 再到如今推出迈克端的 codex 和 g p t。 五点三 codex open i 的 这款工具也在也在不断进化。从模型性能方面呢, g p t 五点三 codex 在 s w e 奔驰 pro 上达到了顶尖的水平。 这个这个测试基础呢,主要是对真实世界软件工程能力的一个进行评估,它在 terminal 奔驰二点零上的表现也是比以前好一些。 这个测评标准主要是衡量像 codex 这样的编程智能体所需的终端操作技能也都在终端上操作了一个情况。文章写到最后,我们又在看网上呢,看到了许多科技圈的信息,一是无痕 ai 将下线 g p c o g p c o 以我个人来说,它不是最顶尖最厉害的模型,但真的确实是无数人心中最具人味的情感依赖和聊天对象。 第二个就是关于 cloud 的, 它的模型能力真的非常厉害,前几天出了 agent teams 功能,上线了 openstar 六,能力也是非常嘎嘎,提升 token 也是嘎嘎,消耗速度是真的快,能力是真的强,但是也是真的好 token。 最近呢,有的人爆出 cloud code 的 可能,买了一些代码,降低用户使用其他非 cloud 模型式的缓存命中率,这样我们就得多花些 token 的 费用。好了,今天的文章就到这里。

我用酷币做了一个非常好玩的选股神器啊,没想到他做出来的效果这么好啊,等一下给大家演示一下,这是整个软件的界面,假如我们要找什么股票在这里六零一他就会出来了,对吧? 嗯,然后双击一下,他就这里就会有贴现图啊,那些饼图啊之类的,这里是有五千多只可以选的哈, 我给大家介绍一下我这个软件的一个逻辑啊,非常感谢一个二十多年古灵的一个粉丝啊,给我提了很多意见。 ok, 选股,这里就是我选好的股票,按照我的条件选好了的股票呢,我可以放到选股池这里,那这里呢是实时更新的选股池这里 就是符合我条件的股票,他会全部放到这里来,一旦这里的股票不符合我的条件呢,他又会把它移走,所以选股池这里留下的所有的股票都是符合我最新条件的 股票。我这里设置了一个经验选股,因为每个人买股票他可能都不一样的经验思维,所以每个人都会不一样,这个属于自定义的了。这里呢,我也会放到一些我需要监测的股票,放在这里,重点关注的会放到这里来, 实时去跟进他的一些信息啊,这里可以新建的啊,新建把规则定好了就可以新建 事件。这里呢,就是我还没有想好要放什么东西,可能就是放一些新闻呢,就是你想要看这只股票啊,他有什么新闻呢?可能会放这些东西。这个问答呢,就是说我们有什么疑问呢,就可以在这里去问他啊, ai 会给出一些答案,然后设置这里呢,我是用了 dipstick 的 api kit, 然后数据提供方呢,是用 a, k, c, r 的, 所以整个软件的逻辑就是这样子的,如果大家有更好的一些建议呢啊,也欢迎大家提出来啊,我看一下是怎么样去把它加上去啊, 后面呢,我可能会增加一个短信通知,假如啊,我们在这里的一些股票,它有一些符合你可以购入的条件,才会发信息给你。 现在的 ai 真的 是太强大了,像 codex 这样子的工具呢,以后呢,肯定是会越来越多的,像以前我们要做一个这样子的一个软件的话,你没个几万块钱估计就搞不定,或者是说你的程序员要写好久,那现在很简单啊,只需要一句话就能搞定了。那像这种 ai 工具呢,它适用范围是非常广的, 像很多电商行业啊,你要做数据分析啊,你要靠人力去堆的那些工作啊,其实都可以让 ai 做,因为 ai 最擅长就是数据分析,做报表啊,做什么各种各样的分析,不管你是公司的运营啊,或者要做财务的数据分析啊, 或者是你业务部门呢,要做一些调查报告啊,各种各样的东西,其实都可以用 ai 来去解决,一句话非常简单。


来看一下中国版的 openclaw 和目前很火的 codex 做股票分析软件,谁更厉害?首先这个就是中国版的 openclaw, 借阅 ai 做的技术分析, 非常详细,然后有个基本面分析,分析的内容是这些智能选股,选股说明是有这些投资推荐,说明有这些亮化,彻夜大概展示一下它的功能啊,这里技术分析,点开始分析它就会有结果出来。 ok, 投资推荐啊, 来看看 k 月 a, 做的那么漂亮啊,这里是有三千个股票 添加自选,在这里可以添加自选,添加完他会在这里,在这里你点一下呢,他就会回到个股这里,来到个股这里有个比较好的方面,就是 ai 季度生成, ai 季度 他可以去呃 ai 去分析这个股票所有的情况,然后呢选股这里也可以选,比如说我输入个六零零 啊,然后直接选,选完以后呢,也可以在这里 ai 总结啊,总结所有的内容,然后回测呢,是可以看到历史数据,交易数据, 模拟账户呢,他这里我做了一个模拟账户,这个就是我拿来做实验的,因为有朋友说要做一些交易自动交易,所以我就在这里做了一个这个功能。重点要说在这里设置啊,我用的是 dips 的 a p i, 那 我接触的大模型都是 dips 的, 其他的就没有了。两个不同工具做的股票分析软件,大家觉得是哪一个比较好?