1.0万
1476
1731
2805
举报
发布时间:2026-03-09 08:49
查看AI文稿
谭拼坊.
谭拼坊.

粉丝1.6万获赞17.8万

相关视频

  • OpenAI深夜突袭!GPT-5.4五大升级+编程实测 OpenAI 刚发了 GPT-5.4,这次跟以往的迭代不太一样。不是简单的参数升级,而是把 1M 上下文、原生电脑操作、中途 Steering、Token 效率提升、Codex 合并这五个关键能力整合到了一起。 
核心定位变了:从「更会聊天」变成「更能干活」。AI Agent 算是正式进入实战期了。 
五大核心变化:
- 上下文窗口翻倍到 1.05M tokens,长任务不用分段了
- 原生 Computer Use:OSWorld 75% 超越人类 72%,直接操作电脑
- Mid-response Steering:思考过程中可以打断、补充、改方向
- Token 效率提升 47%,同任务更便宜更快
- Codex 编码能力直接整合 + /fast 模式,Vibe Code Bench 第一  
#gpt54 #大模型评测 #AI编程实测 #OpenAI #ai新星计划
    04:16
    OpenAI深夜突袭!GPT-5.4五大升级+编程实测 OpenAI 刚发了 GPT-5.4,这次跟以往的迭代不太一样。不是简单的参数升级,而是把 1M 上下文、原生电脑操作、中途 Steering、Token 效率提升、Codex 合并这五个关键能力整合到了一起。
    核心定位变了:从「更会聊天」变成「更能干活」。AI Agent 算是正式进入实战期了。
    五大核心变化:
    - 上下文窗口翻倍到 1.05M tokens,长任务不用分段了
    - 原生 Computer Use:OSWorld 75% 超越人类 72%,直接操作电脑
    - Mid-response Steering:思考过程中可以打断、补充、改方向
    - Token 效率提升 47%,同任务更便宜更快
    - Codex 编码能力直接整合 + /fast 模式,Vibe Code Bench 第一
    #gpt54 #大模型评测 #AI编程实测 #OpenAI #ai新星计划
    查看AI文稿
  • 盘点一周AI大事2月8日|AI相亲、AI当老板、AI狼人杀 Anthropic发布最强大模型Claude Opus 4.6
OpenAI发布最强编码模型GPT5.3Codex
OpenAI推出Codex桌面版
Google上线AI狼人杀
AI雇佣人类平台RentAHuman爆火
AI雇佣AI平台ClawTasks爆火
龙虾相亲平台MoltMatch爆火
智谱开源最强OCR模型GLM-OCR
字节发布最强视频模型Seedance 2.0
研究员开源无痕编辑视频模型Edit Yourself
字节开源最强分子预测模型Protenix-v1
Google发布论文配图AI Paper Banana 
#AI新星计划 #前沿科技趋势发布月 #AI #AIGC #OpenAI
    02:53
    查看AI文稿
    2.6万产品君
  • 2026必备Vibe Coding工具!Codex新手教程! OpenAI的Codex免费开放了!搭载超强的GPT-5.3,现在就是普通人入局Vibe Coding的zui佳时机!#VibeCoding #Codex #Claude
    02:28
    查看AI文稿
  • 真实项目实测MiniMax M2.5,速度快到离谱! MiniMax M2.5 到底能不能打?这期我用两道真实编程任务 + 一个生产级 Agent 项目,把它和 Claude Opus 4.6、GPT-5.3-Codex 放在一起做了一次三方横评。
三个模型拿到的是同一份 prompt、同一个项目代码,公平对比。
两道编程题分别考察:
跨项目认证体系迁移(Google/GitHub OAuth + 落地页)
终端 CLI 工具改造成 Web 聊天界面(Thinking + 工具调用 + SSE 流式输出)
除了编程,我还把 MiniMax M2.5 接入了自己一直在用的自媒体视频拆解 Agent,从 M2.1 升级到 M2.5,实测速度、拆解深度和表达真实感的变化。
结果有惊喜也有差距,具体数据都在视频里。
时间戳
00:00 三个模型同台PK,怎么测的
00:41 编程实测开始 - 两道真实项目任务介绍
01:31 同时开跑 - MiniMax M2.5 现场编码
02:34 第一题完成 - 终端UI转WebUI效果展示
03:17 三方横向对比 - Claude / GPT / MiniMax 谁更强
03:47 第二题 - 跨项目认证迁移(复杂度拉满)
05:41 编程评分对比 - 三个模型打分拆解
06:09 Agent实测 - 接入真实自媒体视频拆解项目
06:36 M2.1 vs M2.5 - 速度与拆解深度实测
07:39 用ChatGPT和Gemini交叉评分,避免主观偏见
08:11 最终结论 - 谁该用哪个模型 
#MiniMax #MiniMaxM25 #AI编程实测 #ai新星计划 #抖音年味新知贺岁
    08:32
    真实项目实测MiniMax M2.5,速度快到离谱! MiniMax M2.5 到底能不能打?这期我用两道真实编程任务 + 一个生产级 Agent 项目,把它和 Claude Opus 4.6、GPT-5.3-Codex 放在一起做了一次三方横评。
    三个模型拿到的是同一份 prompt、同一个项目代码,公平对比。
    两道编程题分别考察:
    跨项目认证体系迁移(Google/GitHub OAuth + 落地页)
    终端 CLI 工具改造成 Web 聊天界面(Thinking + 工具调用 + SSE 流式输出)
    除了编程,我还把 MiniMax M2.5 接入了自己一直在用的自媒体视频拆解 Agent,从 M2.1 升级到 M2.5,实测速度、拆解深度和表达真实感的变化。
    结果有惊喜也有差距,具体数据都在视频里。
    时间戳
    00:00 三个模型同台PK,怎么测的
    00:41 编程实测开始 - 两道真实项目任务介绍
    01:31 同时开跑 - MiniMax M2.5 现场编码
    02:34 第一题完成 - 终端UI转WebUI效果展示
    03:17 三方横向对比 - Claude / GPT / MiniMax 谁更强
    03:47 第二题 - 跨项目认证迁移(复杂度拉满)
    05:41 编程评分对比 - 三个模型打分拆解
    06:09 Agent实测 - 接入真实自媒体视频拆解项目
    06:36 M2.1 vs M2.5 - 速度与拆解深度实测
    07:39 用ChatGPT和Gemini交叉评分,避免主观偏见
    08:11 最终结论 - 谁该用哪个模型
    #MiniMax #MiniMaxM25 #AI编程实测 #ai新星计划 #抖音年味新知贺岁
    查看AI文稿
  • OpenAI新上线GPT-5.3-Codex模型,在codex cli或者客户端中就能直接使用,编程、审美能力均有提升。
#codex #科技  #openai  #chatgpt #ai编程
    04:43
    查看AI文稿
  • 摩动核爆改机动奥特曼—路基艾尔改造教程 @摩动核潮玩 
#黑暗路基艾尔 #奥特曼 #银河奥特曼 #模型 #有男生会拒绝这个玩具吗
    03:21
    查看AI文稿
  • codex用起来好爽啊,一个软件窗口就够了!强烈推荐大家去试试…
#ai新星计划 #openai #codex #skills
    04:09
    查看AI文稿
  • codex真是性价比拉满了 #codex #chatgpt5.4 #ai #ai编程
    00:26
    查看AI文稿
  • AI接管你的所有工作,只在Codex #AI编程
    01:59
    查看AI文稿
  • GLM5真实项目评测,开源界的Opus平替? GLM5 到底能不能打?这期我用两道真实编程任务 + 一个生产级 Agent 项目,把它和 Claude Opus 4.6、GPT-5.3-Codex 放在一起做了一次三方横评。
三个模型拿到的是同一份 prompt、同一个项目代码,公平对比。
GLM-5 核心信息:
来自智谱 AI (Z.ai),744B 参数 (40B 活跃),MoE 架构
预训练数据 28.5T tokens,相比 GLM-4.7 大幅升级
定位:从 Vibe Coding 到 Agentic Engineering
完全开源,权重可下载(HuggingFace / ModelScope)
两道编程题分别考察:
跨项目认证体系迁移(Google/GitHub OAuth + 落地页)
终端 CLI 工具改造成 Web 聊天界面(Thinking + 工具调用 + SSE 流式输出)
除了编程,我还把 GLM-5 接入了自己一直在用的自媒体视频拆解 Agent,实测在真实生产链路里的表现。 
#GLM5 #opus46 #ppio #ai新星计划 #抖音年味新知贺岁
    09:17
    GLM5真实项目评测,开源界的Opus平替? GLM5 到底能不能打?这期我用两道真实编程任务 + 一个生产级 Agent 项目,把它和 Claude Opus 4.6、GPT-5.3-Codex 放在一起做了一次三方横评。
    三个模型拿到的是同一份 prompt、同一个项目代码,公平对比。
    GLM-5 核心信息:
    来自智谱 AI (Z.ai),744B 参数 (40B 活跃),MoE 架构
    预训练数据 28.5T tokens,相比 GLM-4.7 大幅升级
    定位:从 Vibe Coding 到 Agentic Engineering
    完全开源,权重可下载(HuggingFace / ModelScope)
    两道编程题分别考察:
    跨项目认证体系迁移(Google/GitHub OAuth + 落地页)
    终端 CLI 工具改造成 Web 聊天界面(Thinking + 工具调用 + SSE 流式输出)
    除了编程,我还把 GLM-5 接入了自己一直在用的自媒体视频拆解 Agent,实测在真实生产链路里的表现。
    #GLM5 #opus46 #ppio #ai新星计划 #抖音年味新知贺岁
    查看AI文稿
  • 最强AI助手,Codex大模型
    01:55
    查看AI文稿
  • 每月15元,用上最顶流Codex 5.3通用智能体
    02:17
    查看AI文稿
  • iFlow CLI实测,动嘴完成需求验证的编程利器 想找一个省心、稳定好用的终端AI助手?iFlow CLI内置国产大模型GLM/Kimi/MiniMax,支持Skills、Hooks、MCP,开箱即干!本视频演示两个实战场景:用对话式编程完成「以图搜图」POC开发,以及用自定义 Skill 对代码仓库做体检。告别IDE依赖,让AI在终端里帮你写代码、选技术栈、做架构规划,从模糊需求到可运行 Demo 只需口喷编程.
    18:41
    查看AI文稿