警惕！社保类诈骗 #反诈

codex自动审核超时修复方法

149

3

23

26

举报

发布时间：2026-05-08 09:23

查看AI文稿

粉丝5.6万获赞50.7万

相关视频

04:40
告别复杂代码！零基础用Codex做提效工具 #codex #vibecoding #openclaw #AI编程 #OpenAI
查看AI文稿
AI文稿
面对全网热捧的 web coding 和 openclaw，没编程经验的普通人到底能用 ai 编程做些什么？本期视频我会站在一个普通人的角度来聊聊这个问题，而且我还用 open ai 的 codex 做了一个试例，希望本期视频能帮大家打开一些思路。我个人认为， ai 编程对普通人最有价值，也是最容易真正用起来的，就是提高工作效率。比如我平时会给游戏公司做广告素材提交出稿的时候，对我来说就是一个非常典型的重复劳动，单纯浪费时间。有这个时间我可以多写一个脚本，或者多做一个选择题。刚开始我也想过在网上找现成工具，但很多这类工具都会压缩画质，完全达不到我的要求。我就想能不能直接用 ai 来帮我写一个批量加水印的工具呢？今天我主要使用的是 open ai 的 codex， codex 是前段时间新推出的 ai 编程工具，目前 plus 会员和 pro 会员都可以免费使用。进入 excel 主页之后，点击这个 codex 就会跳转到它的主页。我个人建议啊，最好把 codex 的应用下载到本地，用起来更方便。打开应用之后，点击 add new project，这时候就会弹出文件窗口，在电脑里找一个空间大的盘创建文件夹。比如我这儿新建了一个 test 一之后， codex 写的代码文件都会保存在这里。因为我这个水印工具已经做好了，所以就直接带大家来看一下我前面是怎么一步一步把它做出来的。一开始我只用大白话提了一个需求，我想做一个批量给图片增加水印的工具，水印位置可以设置，他思考后呢，给了一版初稿，我测试就发现了第一个 bug，没办法选择本地文件，所有电脑里的图片不管什么格式都选不了。我又发现了第二个 bug，选好原图和水印图之后呢，没有预览图，这个是很重要的，因为没有预览图，我就不知道水印放的位置和效果怎么样，我直接就截图发给他。处理完之后，这个图片水印工具就可以用了。我们先来看一下成品，这里可以选择原图和水印图，选完之后，右边就会出现预览，这里可以调整水印的位置，比如说什么右下角、左下角、中间等等，选项很多，这边呢还可以调整水印的大小，透明度也可以修改。而且 codex 还考虑到边距问题了，就是水印离图片边缘的距离也能调。最后再选择输出文件夹，点击开始批量处理，它就会直接把处理好的图片输出到你指定的位置。那如果我手动处理六张图，至少也得两三分钟吧，现在有了这个工具，几秒钟就能搞定。有了这个图片水印工具之后，我就开始思考，在给游戏公司制作素材的时候，还有哪些步骤可以让 ai 编程帮我解决。然后我就给 codex 补充了三个新的需求。第二个需求是批量处理图片尺寸和大小，因为很多广告平台对于图片尺寸和文件大小都有要求。第三个需求是把一张一比一的图片拆成九宫格，这种形式大家在平台上应该能经常看到。第四个需求是批量给视频增加水印，连图片出稿都要加水印，那视频出稿肯定也是需要的。这三个新增的需求主要目的也都是为了帮我节省时间。我让 codex 把这四个需求整合成一个工具箱网页，首页要有四个按钮，点击就能跳转到对应功能。我测试后发现了一个共同的 bug，四个工具都没有预览图，而且都不能选择下载路径，我就截图反馈给他，他发现确实是同一个问题，然后就都修复了。我继续测试，发现视频水印工具还有一个问题，没有办法输出视频，接着反馈，接着修复，最后我就得到了一个完美符合我需求的工具箱网页，一起来看一下效果。首先可以看到首页有四个按钮，分别对应着我四个需求。这个页面排版其实挺好看的啊，整体是很简洁的风格，而且它还做了一些细节，比如这个鼠标悬浮上去的时候，卡片会有轻微浮动的效果，这种小设计我觉得还是挺加分的。图片水印功能和刚才给大家演示的一样，就不重复演示了。接着看图片尺寸处理功能，我这里选了一张一比一的图和一张十六比九的图，页面里同样会有预览，还会告诉你输出规格和预估文件大小。选择输出文件夹之后，点击批量处理，它就会直接导出，检查一下尺寸和文件大小都没有问题啊，非常不错。再来看九宫格功能，选一张一比一的图片之后，我们在预览区就能看到他已经把九宫格切好了，而且文件名也做了排序规则，方便后面发图的时候按顺序排版，这一点考虑的其实挺稀的，下载下来看一下没有问题，每张图的尺寸和大小都符合要求，而且文件名都自带序号。最后来看一下视频水印功能，逻辑和图片水印差不多，也是选择原视频水印图，再调整水印参数。下载下来看一下。视频水印没问题，但视频没有声音，我在需求里是写了保留原视频音轨，我实际测下来，他目前还做不到完整保留音轨判断，可能是浏览器本身对阴鬼捕获知识有限啊。不过作为出稿工具，我觉得问题不大，很多游戏推广内容的出稿重点是先让对方确认画面，所以这一点我个人是可以接受的。最后顺面对比一下 codex 和 jimmy 奈分别给我做的图片水印工具。在用 codex 之前，我也用 jimmy 奈写过同样的需求， jimmy 奈给的是原生的 html 代码，需要我自己把代码复制到文本文档里，再另存为 html 文件功能。虽然没问题，但是从最终呈现来看，我觉得 codex 的 ui 确实更好，整体完成度更高。而且在制作的过程中，不需要我手动去处理代码，我只需要跟 codex 沟通就可以了。所以我觉得如果你没有编程基础，只是想解决一个自己真实存在的问题， codex 会更友好一些。而且最近 openai 更新了 g p t 五点四模型， codex 对自然语言的理解能力更强了，大家真的都可以去试一试。 ai 编程对普通人来说，不一定是让你去做一个多么复杂的产品，也不一定是让你突然学会写代码，它更现实的意义可能是把你工作里的那些重复琐碎、浪费时间的环节想办法自动化，哪怕只是帮你省下半个小时，长期来看价值都非常大。也许你做不出一个 app，也未必要做一个什么很厉害的平台，但只要你能做出一个真正解决自己问题的小工具，那它就已经很有意义了。今天的视频就先到这里了，记得关注冲破新衣叉 ai 教学我是专业的，那我们下期再见。
55冲破信息差
09:17
GLM5真实项目评测，开源界的Opus平替？ GLM5 到底能不能打？这期我用两道真实编程任务 + 一个生产级 Agent 项目，把它和 Claude Opus 4.6、GPT-5.3-Codex 放在一起做了一次三方横评。
三个模型拿到的是同一份 prompt、同一个项目代码，公平对比。
GLM-5 核心信息：
来自智谱 AI (Z.ai)，744B 参数 (40B 活跃)，MoE 架构
预训练数据 28.5T tokens，相比 GLM-4.7 大幅升级
定位：从 Vibe Coding 到 Agentic Engineering
完全开源，权重可下载（HuggingFace / ModelScope）
两道编程题分别考察：
跨项目认证体系迁移（Google/GitHub OAuth + 落地页）
终端 CLI 工具改造成 Web 聊天界面（Thinking + 工具调用 + SSE 流式输出）
除了编程，我还把 GLM-5 接入了自己一直在用的自媒体视频拆解 Agent，实测在真实生产链路里的表现。
#GLM5 #opus46 #ppio #ai新星计划 #抖音年味新知贺岁
查看AI文稿
AI文稿
这临近过年，我们的国产模型真的太猛了。前面我做过两期视频，用同样的 prom，同样的真实项目任务实测，对比了 cloud office 四点六， gpt 五点三、 codex mini max 二点五。那期视频做完之后，评论区就有人让我测试一下质朴新发布的模型 gom 五，咱也是加班加点的干出来了，而且据可靠消息，过两天还有 deepsea 微视版本的发布，到时候也给大家带来一期真实项目的一个编程实测。求一个一箭三连不过分吧？在这里要插播一下，当我准备去测 gm 五的时候，我去官网去订阅它的 cooling plan，直接受庆了，就我的套餐买不到。哇，那如果按 ipa 计费的，我目前也没有找到。他们可以用 insulate 的一个协议来测试 gm 五，所以我就用了 ppl 他们家的去测试，他们是非官方首发部署的 gm 五，一个开源模型的一个权重，那兼容安斯罗比的一个协议接到可拉扣的里面也非常方便，因为我之前的评测的话，都是用可拉扣的去做的嘛。所以说为了保证公平公正，我们也是用同样的工具方的编程任务去做实测。好，我们先去创建个 api k，这里我就写 gm 五确认，点击复制好，我们开始进入真实项目的一个编程实测环节，也是同样的 prompt。哈，那第一个任务的话，是把我们另外一个项目里面完整的一个用户认证体系，包括邮箱、谷歌认证登录、 github 登录迁移到我有一个新的图片生成 a 级的项目里面，同时让它去做一个落地页，需要考验它的一个代码理解能力，架构适配能力，一个工程规范。这个任务还算比较复杂，之前用 mini max m 二点五去测的时候，它花了三轮对话才完成的，那 op 四点六跟 gpt 五点三 colex 的话，它们一轮对话就完成了。那第二个任务的话是我本地有一个 skills agent，它是一个终端 ui 交互的，我们把它做成一个外部聊天页面，让它保留 syncing 工具，调用流逝输出。这个任务主要考验它全站开发，流势输出以及 u i u x 的一个交互能力。之前测试的话， off 四点六跟 g p d 五点三 codex 他们一人赢了一局，那下面我们就开始做 g o m 五的一个测试。这两个项目现在都是开启了一个沙杯进者的模式去探索已有的代码。那右边的话，它弹出来一个让我选择想用的框架以及 u i 主键库，我就按我一个常用的方式去选好，它提示已经成功了。好，我们打开了他给我们写的这个 y y，哈，他把这个 skills 是放在右边的，就展示我已有的一些项目，来测试一下它可用吗？好，我们开始让他去总结这篇文章，看一下他有没有去做到加载这个 skills，然后加载完了之后去执行一些脚本去做爬虫，然后再去做总结。可以看到这边他已经加载到这一个 skills 了，下面去执行一些命令总结出来了哈。整体的话完成度还可以的，就是他这个 ui 上稍微会差一点点，相较于那个 gbt 五点三 codex 的话，这个完成的没有 gbt 的好。左边这个窗口就是 cloud off 四点六写的，这个 ui 上确实会差一些。右边的话是 gbt 五点三 codex 写的，当时我是把票投给了他，那么同时去可以看一下刚刚那个任务，他们俩其实都没什么太大问题，不是特别难，后端也就 thinking，然后做工具调用，可以看到都是 ok 的，没有什么太大的问题。好，下面我们去看一下那一个纹身图 agent 用户认证体系那块它完成的怎么样了？可以看到它这个已经完成了哈，可以看到这个代码它已经写完了，我们先看它能不能一次性去启动，之前 mini max m 二点五这一块是没有做到一次性启动，我们先开新开一个窗口去测一下。好，我们可以看到 g m 五的话，它目前启动是没有什么问题啊，我们再看一下它实际的一个表现，我们看一下它整个 ui 表现哈， ui 还行，那我们看它的那个认证功能可不可以用。我们先试谷歌登录，谷歌登录的话，它这块放了一个小 bug 啊，它把那个毁掉的端口弄错了，我们改一下。好，我们继续。好吧，登录失败了，这边还是有些问题，你看到它登录的时候认证失败了，应该是数据库的表结构那块有点问题，从这么看的话， gbt 五点三 codex 跟 op 四点六还是要猛一些哈，就是它们没有这些问题。好，我们再来选择谷歌登录，刚让它修复了一下，好，他终于可以了。哎，有个问题，他登录成功之后没有回，没有进到我们的那个主页面，登录成功之后没有进到我们 agent 里面，这个算第二轮对话吧，看他第二轮对话能不能搞定好，我们点击登录选择谷歌，他还是没有修复成功，他还是要再刷新一下，看没有再刷新一下，进来再给他描述一下吧。现在还有个小问题，当我们认证之后，他先跳转了到首页，我再刷新页面，他才进到了 a 镜的里面。在他这是第三轮了，就证明他在这个方面其实跟 mini max m 二点五差不太多，他们俩再点登录。我靠，跟这个问题杠上了，他还是修复不了啊，还是有问题，你能不能好好深入去修改一下，去思考一下。这是我们第四次对话，让他去修改这一个小问题哈，这个表现呢，就有一点不是特别好了，我们再来，如果他再再进不去，我就不撤了，这个就默认他四轮吧。好，我放弃了。这个问题我不测了，他修他，我跟他一直对话，他修不了。我们之前测 gbt 五点三跟 colorof 四都是一轮。 ok，我们下面来看一下评分，整体的一个打分标准是第一个，我人为的去检测他们的一个功能完整性以及 ui 的一些情况。那代码架构，工程规范，我都是把他们所有的代码给到 gbt 五点三， codeof 四点六，让他们分别去 review，然后去打分。它现在结果是这样子的， off 四点六，在第一个项目用户认证里面，它是表现最好的，它在功能完整度以及 ui 落地上是表现的比较好，并且是一轮就完成任务了。但是它的代码架构跟工程规范会有一些小问题， gpt 五点三扣贷 x 的话，它的代码架构以及工程规范会比它好，而且是这四个模型里面最好的。那它的功能完整度呢？因为它漏了一个谷歌登录的一个前端，所以说这个评分稍微低一点，那它 ui 落地页的话也会稍差一些。上一期视频测试 mini max m 二点五这一边的话，他是花了三轮对话去完成了这个任务。那智普这边的话，刚刚你也看到了，其实四轮对话完下来之后，他还有一些小问题，所以说评分的话，他俩其实差不太多吧，我个人感觉哈，我们来看第二个，把这个 skills agent 做成一个外部 ui，那这个项目的话就是 gpt 五点三 codex，它在业务完成上逻辑错误控制以及 ui 代码质量工程实现都是最好的。那剩下这三个的话，大家表现的都差不多吧，大家有优势的地方也有他劣势的地方。好，下面我们开始进入 agent 的实测环节，把 gm 五模型接入到我这一个真实的一个 agent 的项目里面去，它是做自媒体视频拆解的，主要需要去看他的一个速度，拆解深度以及表达一个真实感。那整个 a 型的工作内容的话，就是先去下载视频，做音频提取，转文字，然后去做内容的结构化分析，爆款元素的提取，最终输出一个拆解报告。好，我们下面开始吧。好，右边也完了，我们来简单看一下哈，他们两边格式上会有一些差异。在拆解上我们看他这个结构拆解这块，他这个时间出其实是有问题的，他做的不对，因为我这个是十二分钟的，他是做了十四分钟到十五分钟，那 g m 五这边的话，它也有讲一个时间戳吧。啊对，你看它有二十分钟，还有三十到三十五分钟都来了，所以说我感觉它在整个 a 帧的表现里面不是特别好啊，它这个拆解的深度也不太够，我感觉相较于昨天我测那个 mini max m 二点五的话会稍微差一些。好，我们下面总结一下。把 gm 五接到这一个自媒体视频拆解的 a 帧里面，它的一个表现情况哈，整体上的话速度偏慢，就响应速度不算快，可能跟当前用户量大有关系，因为都知道它这个套餐都卖的受庆了。第二个的话，它的拆解深度的话相较于 mini max m 二点五会有一些稍稍不足。第三个的话，它的一个真实感稍微偏弱一些啊，这是整体的一个表现情况。好，下面我们进入整个的一个总结环节，在编程方面的话，一句话，在我的这一个测试项目里面， gbt 五点三 codex 表现最好，比 off 四点六会好一些。 glm 五跟 mini max 它们的体感接近，都是开源的嘛，并且它们的成本非常低，所以说对于一个高性价比的一些开发任务的话，我觉得这两模型都非常不错。好，这就是这一期视频的所有内容了，如果你觉得这期视频做的不错，一定记得给我一键三连哦。那下一期视频的话大概率是做 deepsea 微四，有可能是在过年那一天发布，我猜测哈，据可靠消息。好，那视频就到这里了，大家拜拜拜拜拜拜拜拜。
851程序员阿江-Relakkes
09:01
Claude构建多智能体协作实战教程让claude指挥codex和gemini ，构建自动化工作流#claude#codex#gemini#agentteam
查看AI文稿
AI文稿
前两天发的 cloud 指挥 codex 干活的视频火了，评论区两级分化，有人说这套架构确实提效明显，也有人说纯玩具卵用没有。今天我们就一步步把这套写作系统搭起来，建议先点个赞，关注加收藏。我的态度很简单，没有调查就没有发言权，跑一遍再下结论。好，先说清楚这套架构到底有什么好处呢？第一，在复杂编码场景下，极大降低 cloud token 消耗。 cloud 最贵，但我们不让他写一行代码，只让他当甲方领导，当项目经理，分析需求、拆分任务、验收结果，最费钱的代码实现全部交给别人来做。第二，实现监工效果。 cloud 充当甲方领导和项目经理，负责规划和验收。 codex 是后端开发，负责服务端代码编辑和单元测试。 gemini 是前端工程师，担任代码审查和安全审计。第三， codex 和 gemini 成本几乎为零，量大管保。结论就是 cloud 出脑子， codex 和 gemini 出力气，钱花在刀刃上，真正花钱的只有 cloud 做决策那一小部分。在开始之前，你需要确保三样东西都装好了，分别是 cloud code、 codex client 和 gemini client，执行视频中的三个查看版本的命令，如果都有版本号输出，那环境就没问题，没装好的先暂停视频去装一下。第四，也是很多人漏掉的一步，理解整个工具链的使用顺序。这三层是有先后关系的。第一层 cloud md 是规则层， cloud 启动时自动读取，里面定义了协助、规范和角色分工。第二层， superpowers 是能力层，提供标准化的规划、审查、调试流程。第三层， c、 c、 b 是通信层，让 cloud 能通过 ask、 pen、 ping 指挥 codex 和 gemini。第五，在 cloud md 里写好协作规范。接下来看我本地的文件。首先定义了 cloud 是架构师、项目经理， codex 是后端开发， gemini 是前端开发，这是最基础的角色分工，简单明了降级机制，明确了异常情况下的接管规则。接着明确了协助方式，使用 superpowers 进行任务设计，通过 c c b 相关命令指派任务。同时还定义了 linus 三问以及 get 代码提交规范等。这些规则 cloud 启动时会自动读取，不需要每次手动告诉他。你只要把规则写好， cloud 就会严格按照规则来执行好。接下来我们进入 cloud 执行视频中的命令，进行 superpowers 插件安装，执行视频中的两条 plugin 命令就可以出现， successfully 就证明安装成功。安装完成后， cloud 就具备了标准化的规划、审查、调试能力，这些能力后面实战中会用到，非常关键。接着要安装终端附用器。 ccb 是依靠终端附用实现多个模型之间的通信， linux 和 mac 用户安装 tmax 即可， windows 用户需要安装 winterm 或者使用 wsl。本教程以 tmax 为例，安装方法很简单，一条命令就搞定，执行命令后，我们进入新的终端环境。第八，安装 ccb，全称 cloud code bridge，这是让三个 ai 互相通信的桥接器。注意， ccb 是社区开源项目。特别感谢 bfi 幺二三作者的贡献，它不是官方内置功能。 ccb 依赖 python 三点一零以上版本，安装前先确认你的 python 版本没问题。 python 版本确认无误后，我们执行 git clone 下载 ccb 项目，下载完成后 cd 到项目目录， linux 和 mac 用户执行 install h install 命令， windows 用户用 powershell 执行安装脚本，安装过程中 c c b 会自动配置通信组建，并在 cloud md 里注册 ask、 pinned、 ping 这些命令，等安装脚本跑完就可以使用了。你可以看到终端输出了安装成功的提示信息，整个安装过程非常顺畅，基本不会遇到什么问题。好总结一下安装步骤，第一步，编辑局域， cloud md 定义协助规则。第二步，安装 superpowers，提供标准化工作流程。第三步，下载安装 ccb，打通多模型通信。三步走完，整套系统就搭好了。接下来我们进入实战环节，执行 ccb、 codex、 gemini、 cloud 命令，启动协助系统。第二部分， cloud 是项目经理，只动嘴不动手， codex 和 gemini 是干活的，成本几乎为零，这就是省钱的核心逻辑。 cloud 现在开始下发任务，我们用一个真实案例实现用户注册功能需求如视频所示， cloud 调用 superpowers 开始收集用户需求，制定开发计划，可以看到它在分析需求，确认技术栈，设计系统架构，整个过程完全自动化，不需要人工干预。我们简单看一下 cloud 生成的计划，规划的非常清晰， gemini 和 codex 的分工非常明确，甚至还详细列出了项目的文件、架构、接口文档、验收标准等内容，这就是 superpowers 规划能力的价值，省去了大量的沟通成本。 cloud 把规划好的后端任务通过 ccb 发送给了 codex，你看画面上， codex 收到命令后，立刻开始疯狂扣顶，速度非常快，文件在不断滚动，可以看到 cloud 已经获取到 codex 正在执行任务的状态。与此同时，他又通过 ccb 给 gemini 下达了前端开发任务，两个模型现在是并行工作的，互不干扰，效率拉满。 gemini 收到了任务。你看，任务里面明确列出了前端开发功能、验收清单、注意事项等内容。任务描述非常详细，这就是 cloud 作为项目经理的价值，把需求拆得清清楚楚。两个打工人正在努力完成需求，我们稍等一下，看看他们的执行结果。 cloud 为了更精确地掌握开发进度，建立了三个 task，用于跟踪前后端开发及代码审查任务。你看，它自动创建了任务列表，标注了负责人和当前状态，这就是项目经理该干的事情，实时监控进度，确保项目按计划推进。这时候， cloud 发现 gemini 只是确认了任务，而并没有真正开始执行。随后， cloud 重新将任务委派给 gemini，催他赶紧开工，你看这个监工效果是不是很到位。另一边， cloud 跟踪到 codex 已经完成了开发和测试工作。接着 cloud 去查看 gemini 的执行进度，结果发现 gemini 还是只确认了任务，没有动手，这已经触发了降级规则。于是 cloud 果断让 codex 接管前端开发。这也是这套架构的另一个特色，无需让用户去处理这种特殊情况，只需要把任务交给 cloud， cloud 就会根据 cloud md 里定义的降级规则自行安排处理，直到完成项目要求。整个过程完全自动化。 codex 此时正在飞速编写前端代码，一个人干两个人的活。这里我们跳过执行过程，直接看最终结果。完美 codex 已经完成了前端开发工作，但是由于我们在掩饰中故意让 gemini 不可用，所以 cloud 只能亲自开展代码审查工作。他调用了 superpowers 的审查能力， cloud 完成了代码审查，出具了详细的 review 报告。接下来他开始创建 git 提交。我们来看一下 cloud 做的 review 报告，报告内容非常清晰，详细总结了前后端代码的完成度、安全审查结果是否存在潜在漏洞，以及整个写作过程的总结和验收标准的达成情况，质量相当高。好，我们来做一个总结， c c b 加 superpowers 这套架构的核心特点是灵活高效，节省 token，合理分工。 cloud 只做最关键的决策和验收，所有编码工作全部委派出去，降级机制保证了系统的容错能力，任何一个模型出问题都不会影响项目的正常推进。多 ai 写作的关键不是模型数量，而是统一输出和统一验收。建议先用 cloud 加 codex，两个模型跑通一个完整流程，稳了再加 gemini。下一期我们讲 crcd 与自动化，把今天搭的这套工作流接入，持续集成流水线。点赞关注不迷路，我们下期见！
9973大力AI
08:32
真实项目实测MiniMax M2.5，速度快到离谱！ MiniMax M2.5 到底能不能打？这期我用两道真实编程任务 + 一个生产级 Agent 项目，把它和 Claude Opus 4.6、GPT-5.3-Codex 放在一起做了一次三方横评。
三个模型拿到的是同一份 prompt、同一个项目代码，公平对比。
两道编程题分别考察：
跨项目认证体系迁移（Google/GitHub OAuth + 落地页）
终端 CLI 工具改造成 Web 聊天界面（Thinking + 工具调用 + SSE 流式输出）
除了编程，我还把 MiniMax M2.5 接入了自己一直在用的自媒体视频拆解 Agent，从 M2.1 升级到 M2.5，实测速度、拆解深度和表达真实感的变化。
结果有惊喜也有差距，具体数据都在视频里。
时间戳
00:00 三个模型同台PK，怎么测的
00:41 编程实测开始 - 两道真实项目任务介绍
01:31 同时开跑 - MiniMax M2.5 现场编码
02:34 第一题完成 - 终端UI转WebUI效果展示
03:17 三方横向对比 - Claude / GPT / MiniMax 谁更强
03:47 第二题 - 跨项目认证迁移（复杂度拉满）
05:41 编程评分对比 - 三个模型打分拆解
06:09 Agent实测 - 接入真实自媒体视频拆解项目
06:36 M2.1 vs M2.5 - 速度与拆解深度实测
07:39 用ChatGPT和Gemini交叉评分，避免主观偏见
08:11 最终结论 - 谁该用哪个模型
#MiniMax #MiniMaxM25 #AI编程实测 #ai新星计划 #抖音年味新知贺岁
查看AI文稿
AI文稿
前两天我做过一期视频，用同样的 prompt，同样的真实项目任务实测，对比了 cloud ops 四点六和 gpt 五点三 codex 那期视频做完之后，评论区有人问国产模型能不能也拉进来比一下，这次机会来了，这一期视频我要做两件事情，第一个，把上期那两道编程题原封不动的丢给 mini max m 二点五，看看它在同一张考卷上能拿多少分。第二个的话，我有一个自己一直在用的自媒体 agent 的项目，之前跑的是 mini max m 二点一，这一次直接升级到 mini max m 二点五，看看他在真实的一个生产电路里面升级到底带来了什么。看过我视频的人都知道哈，我做评测比较关注模型，他在一个真实任务里面的一个表现。好，我们正式进入编程实测环节，我直接附用之前的两道题， prompt 一字不改。第一道题的话，是把一个项目里面完整的一个认证用户体系直接迁移到我有一个图片生成的一个 agent 的项目里面去，同时再让它做一个落地页，需要考验它对于另外一个项目的一个代码理解能力，架构适配能力以及一些工程规范。那第二个项目的话，我以本地有一个 skills agent，之前是做的是终端 ui 的一个部分，那这一次的话，我希望把它升级成外部 ui，并且它要保留 string 工具调用流逝输出的一个完整链路，这个就考验它的一个全栈开发能力，以及它的 sse 流逝输出，还有 ui 方面的一些交互。上期的成绩是 cloud op 四点六和 gpt 五点三勾代码各赢一局，那这一次我们把 mini max m 二点五加进来，看一看它的结果怎么样？好，开始测试，两个一起弄，可以看到右边这个它识别到我们要做的是一个全单元 y，它去加载的那个 front designer 这个 skill，那左边这个项目的话，他发现他是需要去探索已有的项目，去找到那边是怎么做 get up 登录，怎么做谷歌邮箱登录的。先去探索嘛，先去开 saf 界面的探索，可以看到他这边已经构建成功了，现在在进行一些后端跟前端的验证，整体这个过程测试下来的话，他会遇到一些变异问题，他也自己去修复了。待会等他测试完之后，我们来看一下他跟 cloud 四点六以及 gpt 五点三 codex 同样的代码，同样的提示词完成了一个效果怎么样？那左边的话先让他一直跑，左边这个任务要重一些，可以看到这个地方他说项目已经启动了，然后他还专门创建了一个简单的启动脚本，来方便我后续去使用。之前我在测试 mini max m 二点一的时候，有一些开发任务，前端后端写完之后，我需要手工让他去给我写一个 start 点 s h 的脚本，这一次让你可以看到他在这个过程他自己去发现的这个行为，这一点点赞。现在他说已经完成了，我们现在开始去测试一下这个就是他把那个终端 ui 变成了一个外部 ui 的一个版本啊，可以看到左边他已经把我们已有的一些 skill 加载出来了，这个是没有问题的，下面我们来测试一下，给他一个任务，看他能不能去做到加载对应的 skill，然后工具调用 simi 以及流逝输出都没有问题。好，我们开始这个申请的过程，看起来没有问题，加载技能也还行，那看他执行命令 ok，他也调了对应的工具，只不过这里的这个图标他刚刚是有些问题的，这个状态是有些问题，有个小 bug。那整体的话，这一个过程其实已经把我们终端 u i 想要展示的东西已经展示出来，只不过有些小瑕疵。那之前那期视频的话，也测了 cloud op 四点六跟 gpt 五点三 codex 嘛，左边是 cloud 的模型，右边是 gpt，当时我是把票投给了 gpt，不管它是从 ui 交互还是它整个功能交互上，明显 gpt 五点三 codex 要优要好一些。我们也可以来测试一下，直接给他一个链接吧，看他怎么怎么搞。他也在申请，他也在加载技能，那明显能看到 gpt 五点三 codex，他做错做的要好一点，对不对？好，下面我们开始去看他做的那个用户认证那个项目，那做用户认证迁移这个项目的话，其实比我们刚刚看到的任务其实要复杂一些，因为他需要从另外一个项目去探索，找到想要的东西。其次他还得在这个项目里面去，在各种代码里面去找到他要在哪个地方去修改，前段是要修改哪些，后段是需要修改哪些，所以整体上他的复杂度要高一些。也可以看到他其实并没有一次性去完成这个任务，中间也报错了，我也跟他去沟通交流了，那最终的话是跟他对话了三轮，他才把这个任务完成了。那这个任务在之前 op 四点六以及五点三 codex 测试的时候，他们是能一次性通过，跑的时候没有问题，项目也能起起来。那 mini max m 二点五这边的话是有一些问题，我对话了三轮，然后把这个任务搞定了，我们来看一下他的一个表现。好，我们先看左边，左边是之前 call 四点六写的落地页嘛，光看 ui 其实没什么难度，因为这个项目主要是考察他去另外一个项目里面把后端代码找到，把对应的数据库找到，找到了之后再放到另外一个项目里面。所以说整体是需要看它的代码实现的功能，比如说这个 get up 登录可不可以，谷歌登录可不可以，以及它的代码实现的怎么样，因为涉及到登录嘛，肯定安全性这些要考验。下面我们来看一下 mini max m 二点五它这个 ui 写的还可以的，比这两可能稍微会好一点，那它的这一个谷歌登录跟 get up 登录的话也是 ok 的。好，我们来试一下它这个谷歌登录好，可以看到它，其实谷歌登录是 ok 的，那我这个其实就是一个纹身图的一个 a 帧嘛，那它整体完成度啊，也还可以，但它不是一轮完成的，它中间有一些包的导入错误，还有些细节性的问题没有做的很到位。好，我们来一个整体的一个评分对比。关于这个纹身图的 a 帧的项目的话， call 的 off 四点六表现优异一些，得分是八点二，那 gpt 五点三 codex 它因为漏了一些功能，所以说它评分要低一些，但是它的整个代码价格、工程规范是这三个模型里面完成的最好的。那 mini max m 二点五这边它的得分就稍微要差一点，整个的功能完成度还 ok， ui 的话会比它俩会好一点，但是它的代码架构跟工程规范会偏弱一些。好，下面我们开始做 agent 的实测，把 mini max m 二点五放到我已有的一个真实 agent 的项目里面去，它是做自媒体视频拆解的，之前接的是 mini max m 二点一，这一次升级了，我们重点看三件事情，第一个是速度，第二个是他的一个拆解深度，第三个的话是表达一个真实感。好，我们现在准备两个窗口，左边的话我准备用来测试 mini max m 二点一，右边的话我们测试 mini max m 二点五。好，我这边找了一期我之前做 skill 原理讲解的视频，我们同时去点击看左边跟右边他的一个整体的一个速度以及拆解的深度，再看他的一个其他的表现。开始好，这边有点慢，但没关系，我们来看一下，我们把这个展开，这个也展开，从这个可以看得到，它其实右边会稍微快一些哈，但是这个先不管，因为这个部分的话是跟 a 镜头没有关系，去做语音转，文字是本地的一些模型去转，等他把这些字幕内容提取到之后，我们再看他们的一个速度。好，现在开始了，大家能明显感觉到吗？ mini max m 二点五的是不是快的特别多？这边已经做完了，这边就是还在，还在做，那在速度这一块，他现在提升真的非常的明显，特别快，那他最终输出这个结果，我们要怎么去做评测呢？到底是左边的好还是右边的好？我不能以我主观的去选择哦，右边好，左边好。所以说我找了两个模型去做评测，我们把任务给到它以及它的产出字幕内容全部给到两个模型，第一个是恰当的 gpt，第二个是谷歌的界面，来去看这两个模型到底哪一个分析的这一个深度，以及他的一个真实感更强，最终得出的结果。我们来讲一下，那整体的一个结果的话是 m 二点五肯定是提升的蛮多的，第一个是速度变快了，第二个是他拆解的更稀了，第三个的话是他的一个真实感更强了。好，下面我们来做一个总结。一句话的话就是当前我们这个任务的评测的话，在编程这一块 codex 要领先一些，那 off 四点六要辞职， mini max m 二点五的话更适合做一些速度优先以及你追求性价比的快速落地的一个场景。好，这就是这期视频的全部内容了，熬了一个通宵做的，如果觉得这期视频做的不错了，记得给我一箭三连，大家拜拜。拜拜。
971程序员阿江-Relakkes
06:00
如何榨干GPT5.5？亲测4个超实用方法奉上 #GPT #AI新星计划 #AI工具 #Codex #是子鱼AI
查看AI文稿
AI文稿
gbt 五点五被认为是目前最强大的模型，那对普通人来说，究竟能用它来做什么呢？所以我深度使用了几天，整理了四个超级实用的玩法。今天这条视频就来分享给大家，我们直接开始第一个做产品调研。对产品经理来说，社交媒体上的用户反馈其实很重要，因为很多真实的吐槽往往不是出现在正式问卷里，而是出现在评论区 ready 的这些地方。产品经理最怕闭门造车，但问题是这些反馈如果人工一条条捞回来，分类总结起码一天起步。 gpd 五点五发布之后， cloud 官方发了一篇推文，解释了 cloud code 降至的原因，并做了改进说明。但官方的说法是一回事，用户买不买账是另回事。我特地把 cloud 这条推文下面的评论，以及 reddit 上一些用户的反馈都整理起来，让 gpt 五点五帮忙判断用户到底在抱怨什么，下一步应该改进什么。可以看到 gpt 五点五的分析非常详细，它把内容分成了用户反馈、代表性评论、问题归因、信任评估、行动清单这些大类，每个类别都给了对应的场景、应对方向和下一步动作。我们以前做这样一份表格，可能要花上两三天，或者是找第三方调研公司，但现在只要有足够的信息给到 gpt 五点五，再结合 context 这个 open ai 自己出的 a 站的工具，相当于 gpt 五点五的手，它就可以帮你梳理的非常详细和系统化。第二个用法，做汇报 ppt。以前我们用 ai 做 ppt 的时候，主要看它排版好不好，审美够不够，但往往忽略了一个更重要的一点， ppt 真正发挥作用的地方不是好看，而是能不能推动决策。毕竟 ppt 往往用在职场中一些非常重要的场合，比如转正报告啊、晋升答辩啊、年度总结。所以，仅仅美观是不够的，我们还需要一个聪明的大脑，帮你把背景、问题、方案、风险以及希望领导拍板的地方讲清楚。我这次试着让 gpt 五点五模拟一个产品负责人的视角，做一个把 ai 客服系统延期三周的汇报。他直接生成了一个有审美、有内容，而且风格非常专业严谨的 ppt。它不仅能够在你提供的信息技术上提炼出核心要点，而且所有内容，包括色块、字体、数据都可以进行二次编辑。当然了哈，这个 ppt 肯定不能直接当做最终稿，但它提供了一个非常完整的框架，我们可以用它来梳理思路，然后再调整优化。第三个用法是制作动态科普。现在 ai 的概念越来越多，其中还有很多非常抽象的概念。有时候我们需要向朋友、同事或者非技术团队解释某个概念，口干舌燥说了一大堆，还是很抽象。所以用这种能看见、能操作的交互网页会更有帮助。我让 gpt 五点五制作了一个解释上下文窗口概念的网页，他在左下角用一句话解释了上下文窗口的重点。 ai 不是无限记忆，在一次对话里，他能记住内容是有限的，还形象的做了一个上下文占用比例的进度条。我试着把指令文件、聊天记录这些拖进去演示，可以看到，当上下文占用量超载之后，原先的那些指令和文件就都被压缩，最后甚至被挤出去了，这比我们用抽象的文字去表达要直观的多。这个思路还可以延展其他的 ai 概念，或者说是物理、数学概念，也可以让他做出来，比如让他讲清楚复利业变换或者背页式定义，这些都很方便学习。最后一个玩法是办公培训。以前企业要开展 ai 培训，通常是从外部找机构定老师，老师需要根据企业的实际情况梳理课间，尤其是给行政、市场、销售、人事这些非技术部门做课间，然后再开展一到两天的封闭式内训，这个过程既耗时又耗财。所以我就用 gpt 五点五做了一个通用的企业内训 skill。当你输入需求，它可以自动生成一份系统且具体可交付的企业 ai 内训包，里面有培训方案、培训课件、 ai 工具、应用表、学员练习册、培训测试题以及课后七天行动计划。创建第一版 skill 大概只用了十来分钟，让 codex 安装并测试之后，我发现两个问题，第一个是它生成的全部都是 markdown 文档，还需要转换格式。第二个是在整个培训方案中涉及到工具的部分，讲的比较泛，所以我把问题反馈给他，让他优化升级。第二版改好之后，我就丢了一句，帮我生成一个 ai 办公室提效记录训练营的内训包，没给行业，没给员工画像，但它生成的文件清单是多样的，有 ppt、 excel、 word 和 markdown 内容。我们也来看一下。首先最核心的培训课间，他直接列了这样一个框架，你可以按照这个框架填充具体内容，也可以再提供行业、企业背景信息，让 gpt 继续细化 ai 工具应用场景表，把市面上主流的文字、图像、视频模型都放进去了，还匹配了适合的岗位任务场景提示词。在这个记录上，你再根据要培训的部门稍微二次加工一下，就能直接用了。实战比讲课更重要，所以在学员练习册中，他也把一些工作中的高频场景放了进来，比如整理会议基奥、分析常文档、改写邮件。课后七天行动计划，按照学习难度和上路顺序做了一个任务表，第一天选择任务，第二天拆解任务，第三天写题词词，循序渐进。我觉得这个培训包有两个明显的优点，第一个是非常系统化，你不用从零到一去想内训究竟要策划成什么样子，而是可以直接用这个框架来细化内容。第二个是延展空间很大，拿到这个初步方案之后，你可以再把脱敏之后的行业信息、企业资料以及员工现阶段的痛点、难点丢给 gpt 五点五，让他去细化这个培训班，我认为他至少能省掉前期规划的工作量。那剩下的呢？就按企业实际的情况往里面填充具体内容。以上就是今天分享的四个深度玩法， gpt 五点五我觉得确实好用，能听懂话、会说人话、能干活。这四个玩法可能不像网络上一些演示那么炫酷，但根据我的经验呢，他们是比较能够结合实际工作去应用的方法。那今天的分享就到这里，下期再见。
38是子鱼AI
05:14
用 Codex+Remotion，生成百万博主同款动画 #ai新星计划 #ai动画 #remotion #codex #ai智能体
1.9万投哥不请自来
05:47
使用GPT5.4和Codex进行引言小综述书写
目前本人已经在在投trans期刊论文和硕士毕业论文中使用，效果很好。使用GPT写初稿，使用Codex复查参考文献内容合理性。
#毕业论文 #论文 #论文写作 #ai
查看AI文稿
AI文稿
朋友们，今天我们主要来讲解一下，当你已经写完一篇刊刊论文或者毕业论文的方法结果以及结论，而对于整体的背景以及小棕树却无从下手。接下来我将使用拆了 gpt 五点四以及 codex 对整体的步骤进行一个完整的讲解。首先我们要把我们目前已经写好的方法、结果和结论整合成一个完整的 word 文档。这里我选择了上传一篇我已经发表的其他论文，将其讨论以及背景部分都全部的删除，仅留下了方法、结果一、结论。这时候我们要打开柴的 gpt 五点四的深度研究功能，输入我们第一个指令。第一个指令主要是利用深度思考，深度研究去对我们目前的方法、结果、结论进行一个整体的分析总结，然后搜寻大量的相关文献，对前期的引言以及相关工作以及小综述进行一个初步的量化。最后在完成相应的工作之后，深度研究会反馈我们一个 pdf 以及 word 文档。这时候我们把相关的引言部分单独摘出来，复制到我们的论文当中，再将我们的论文作为第二个附件。这时候我们要采取第二个指令，调动 china gpt 五点四 thinking 大模型。这一步的步骤主要是通过五点四 thinking 对我们整体前期完成的一个引言，一个初步的评判工作，并且要系统解锁我们的真实文献，并且尽可能地下载可获得的 pdf 全书。这时候我们可以对前期深度研究所给的相应的小综述进行一定的判断。然后在我们第二步的指令当中一定要补全我们的研究方向，例如到底是电力电子电力系统还是相关的控制等等，补足我们的论文主题以及我们相应的目标刊刊，如果合适的话，我们也可以在这里上传几篇，我们觉得比较满意，可以仿照参考他的格式以及整体的背景写的格式的论文作为参考。这时候我们需要对我们已经写好的前期的 word 文档进行进一步的修改，补足相应的文献。随后我们要将我们的所有的文献都下载下来，这时候可以进行第三步。第三步就是我们相应的先找文献，但不马上重写，有可能前两步他给的文献质量并不是很高，这时候我们就可以先不写正文，先只对我们的研究论文引言以及相关的工作部分所需要的文献检查进行一个整体的筛选以及下载工作。最后可以进一步的提炼我们所需要的参考文献。这时候我们就已经完成了使用拆的 gpt 的主要步骤，但是经过我大量的书写，发现其实拆的 gpt 五点四 thinking，它给的相应的参考文献以及写的小宗数可能会存在文献错乱，就例如它就例如我们会发现我们看这篇文档像这样的相应的句子，它会引用长达多篇甚至数十篇文献，但我们经过仔细的发现，其实它这时候引用的文献与我们的实际内容并不相符。这时候我们就需要使用 codex 进行进一步的文献的修改以及追踪。这时候我们需要在 codex 当中先新建一个任务，然后在任务文件夹当中把我们所有的参考文献按着一二三四五六七八的顺序按着引用的顺序标好，然后这时候我们再次使用柴德 gpt 五点四去给 codex 写相应的指令，这时候我们主要的作用是让 codex 去阅读我们文件夹当中的参考文献，然后一一相应地去侦查它给在我们 word 当中它给的参考文献的顺序以及内容是否正确，然后再让我们的 codex 去一步步的替代。这时候我们会使用我们的第四个指令，这个指令主要的作用是先让先要把这个指令给拆了 gpt 五点四，然后同时之后让拆了 gpt 五点四，输出可以直接复制给 codex 的相应指令，这时候我们使用 codex 直接改我们的相应的论文，让它直接替代我们的已经标错的参考文献，并最后让它标出来。同时最后这一步 codex 也会输出相应的表格，就如同我们所示，他会其实会对我们每一个参考文献进行非常详细的总结。这一步在前期的文献调研工作的时候也可以尝试使用，我们会发现他对我们每一篇参考文献都针对于方法和结论都对了非常详细的改革，并且对可信度都有了一个非常客观的评价，同时它也会对于我们哪一条要真正的使用修改也会进行标注，最后它会反馈我们一个新的文档，这时候我们发现对比两者不同的部分，新的使用 codex 修改之后的 word 文档，其参考文献与真实的文献内容可以对应，这时候我们的小棕树就可以采用并进行最后的润色修改并使用发表。
9318右岸讲AI
01:30
艾尔登法环上线当天光速破解，破解组在发布后宣布解散！#游戏 #主机游戏 #单机游戏 #游戏日常
查看AI文稿
AI文稿
爱尔登法还在上线当天就被破解啦！破解团队 plaza 在二月二十五日发布了爱尔登法还的破解版，并当即宣布解散。借此机会，今天小鹿就来和大家聊聊这个著名的游戏破解团队。在前一天的二月二十四日，破解团队 codex 发大部长文宣布解散。长文里说到，当初 codex 是为了和当时最有名的破解团队 reload 进行竞争，但没想到 reload 这么不经打，没多久就分崩离析了。在一一五年，首个使用低加密的古墓丽影崛起出现，让国内的三大妈破解组无从下手。此时 codex 联合了 cpy 成功破解了低加密，至此低加密的零破解神话陨落，也因此出现了低加密影响游戏性能的论调，并衍生出正版受害者的说法。此后 codex 还建立了普拉达团队， codex 主要是负责游戏主体的破解，而 plaza 主要是负责游戏附加内容，例如 dlc 或者是后续内容的更新。 codex 最后一个破解作品是模拟人生四的 dlc。婚礼习员。一天后，普拉仔在发布爱尔登法还破解版时说到，在扣的 x 发布解散消息时，很多人问为什么不把爱尔登法还作为最后的告别礼物，我们觉得这个提议很好，所以我们做到了，也该说再见了。在 codex 成立的这八年里，破解了七千三百多款游戏，普拉扎则破解了五千三百多款游戏，国内的大部分盗版资源也是源于这一个传奇的破解组，但以后破解作品可能会越来越少了。屏幕前的你们有玩过盗版游戏吗？
9839游戏不麋鹿
00:34
05女大，学习ai编程江景房怒省5w渲染费 #codex #gemini #Claude code##AI coding
查看AI文稿
AI文稿
来回复一下大家比较关心的房子进展情况。最近已经学会用 codex ai 编程批量生图，先把自己想要的一个风格和感觉写成一个文件，然后让 ai 去读这个文件，不断的去修改和去确定这是最终的一个效果。图写完我现在就要去健身了，手臂真的一点力量都没有，已经尽力了，这个腿部力量倒是可以。行吧，就结束了，拜拜。下期见。
1.6万郑梦奕
03:38
“我是真的真的生气啦” #2025影娱年终大赏 #混剪
732杨城影剪
01:23
科技show场 | 不会写代码？跟AI聊天就可以做app了 #大模型 #codex #vibecoding 你会写代码吗？如果我告诉你，现在让你做一款app，比写一篇小红书笔记还快，你信吗？不用怀疑，这就是VibeCoding，用自然语言描述需求，AI自动编写代码和功能
10经济观察报
00:43
Caude4，AI编程王者归来！ #claude4 #ai编程 #ai #ai新星计划 #waytoagi
6342赛博小凡
06:17
十环的力量究竟有多强？
1.5万幻影燃剪
00:06
GPT-5.5，泄露了 01
27视界新闻
00:20
你的腿终于好啦
16.3万半个吹曼平筐改名
00:11
AI王座争夺战激烈
OpenAI靠GPT-5.5夺回第一
Anthropic估值已超1万亿美元#AI赛道
17长江商报
00:42
知名国外游戏破解小组CODEX宣布解散#单机游戏
查看AI文稿
AI文稿
知名游戏破解小组 c od e x 宣布解散。这支成立于二零一四年的小组，最初的目的是跟另一只团队瑞娄底的比拼竞争，如今不少老团队解散， c o d e x 认为最初成立的目标早已实现，是时候走上新的道路了。 c o d e x。小组活跃时期，在六年内发布了超过三千七百个学习版游戏，破过许多不同种类、不同平台的加密技术，比如多重不同加密保护的刺客信条起源和孤岛惊魂舞，还有特殊加密的街霸舞我的世界地下城等等。今天他们发布了最后一份学习版模拟人生寺的最新 dlc。此后后期团队中的成员就将各奔东西，对一路上所有支持陪伴他们的人表示感谢。这里是 3dm 为你带来最新的游戏资讯。
2.0万3DM游戏
01:01
#2023上海国际车展雪弗兰双门跑车，竟然是迈锐宝XL改的#上抖音看新车#2023上海车展看新车
查看AI文稿
AI文稿
我现在在上海车展啊，我发现一个两门的雪佛兰，但它不是科迈罗，它竟然是一个迈锐宝 xl，宽体的造型，还有碳纤维的前铲，这可是真的啊，并且像侧裙啊，上方都有碳纤维的装饰，整台车肌肉感十足啊！可以看到两侧不仅有风刀加持，还有出风口的设计，这就是典型的美式肌肉车的设计风格，并且这个大尾翼真的够大的，这个造型太招摇了，坐到车内，随处可见的翻毛皮包裹，并且融入了黄色缝线，开着它不战斗都难。动力方面呢，依旧采用的是通用二点零 t 发动机，具体参数目前还不清楚，但是这么激进的一台车，不把马力提升到三百匹以上，仿佛有点说不过去。在这个每家都在造电车的时代，还在琢磨着这种肌肉燃油车，属实不易。如果说这台迈锐宝 xl 扣的 x 量产的话，你们会买吗？请持续关注我们，我们在抖音懂车帝提前为你解密上海车展！
2375睿车社
00:08
黄仁勋要求全员用OpenAI，GPT-5.5表现亮眼
119中华网

热门推荐

热门分类