轻纱纸影(当当)
轻纱纸影(当当)

粉丝1.5万获赞100.8万

相关视频

  • Claude构建多智能体协作实战教程 让claude指挥codex和gemini ,构建自动化工作流#claude#codex#gemini#agentteam
    09:01
    查看AI文稿
    1.0万大力AI
  • 告别复杂代码!零基础用Codex做提效工具 #codex #vibecoding #openclaw #AI编程 #OpenAI
    04:40
    查看AI文稿
  • 使用GPT5.4和Codex进行引言小综述书写
目前本人已经在在投trans期刊论文和硕士毕业论文中使用,效果很好。使用GPT写初稿,使用Codex复查参考文献内容合理性。
 #毕业论文 #论文 #论文写作 #ai
    05:47
    查看AI文稿
  • 如何榨干GPT5.5?亲测4个超实用方法奉上 #GPT #AI新星计划 #AI工具 #Codex #是子鱼AI
    06:00
    查看AI文稿
  • GLM5真实项目评测,开源界的Opus平替? GLM5 到底能不能打?这期我用两道真实编程任务 + 一个生产级 Agent 项目,把它和 Claude Opus 4.6、GPT-5.3-Codex 放在一起做了一次三方横评。
三个模型拿到的是同一份 prompt、同一个项目代码,公平对比。
GLM-5 核心信息:
来自智谱 AI (Z.ai),744B 参数 (40B 活跃),MoE 架构
预训练数据 28.5T tokens,相比 GLM-4.7 大幅升级
定位:从 Vibe Coding 到 Agentic Engineering
完全开源,权重可下载(HuggingFace / ModelScope)
两道编程题分别考察:
跨项目认证体系迁移(Google/GitHub OAuth + 落地页)
终端 CLI 工具改造成 Web 聊天界面(Thinking + 工具调用 + SSE 流式输出)
除了编程,我还把 GLM-5 接入了自己一直在用的自媒体视频拆解 Agent,实测在真实生产链路里的表现。 
#GLM5 #opus46 #ppio #ai新星计划 #抖音年味新知贺岁
    09:17
    GLM5真实项目评测,开源界的Opus平替? GLM5 到底能不能打?这期我用两道真实编程任务 + 一个生产级 Agent 项目,把它和 Claude Opus 4.6、GPT-5.3-Codex 放在一起做了一次三方横评。
    三个模型拿到的是同一份 prompt、同一个项目代码,公平对比。
    GLM-5 核心信息:
    来自智谱 AI (Z.ai),744B 参数 (40B 活跃),MoE 架构
    预训练数据 28.5T tokens,相比 GLM-4.7 大幅升级
    定位:从 Vibe Coding 到 Agentic Engineering
    完全开源,权重可下载(HuggingFace / ModelScope)
    两道编程题分别考察:
    跨项目认证体系迁移(Google/GitHub OAuth + 落地页)
    终端 CLI 工具改造成 Web 聊天界面(Thinking + 工具调用 + SSE 流式输出)
    除了编程,我还把 GLM-5 接入了自己一直在用的自媒体视频拆解 Agent,实测在真实生产链路里的表现。
    #GLM5 #opus46 #ppio #ai新星计划 #抖音年味新知贺岁
    查看AI文稿
  • 真实项目实测MiniMax M2.5,速度快到离谱! MiniMax M2.5 到底能不能打?这期我用两道真实编程任务 + 一个生产级 Agent 项目,把它和 Claude Opus 4.6、GPT-5.3-Codex 放在一起做了一次三方横评。
三个模型拿到的是同一份 prompt、同一个项目代码,公平对比。
两道编程题分别考察:
跨项目认证体系迁移(Google/GitHub OAuth + 落地页)
终端 CLI 工具改造成 Web 聊天界面(Thinking + 工具调用 + SSE 流式输出)
除了编程,我还把 MiniMax M2.5 接入了自己一直在用的自媒体视频拆解 Agent,从 M2.1 升级到 M2.5,实测速度、拆解深度和表达真实感的变化。
结果有惊喜也有差距,具体数据都在视频里。
时间戳
00:00 三个模型同台PK,怎么测的
00:41 编程实测开始 - 两道真实项目任务介绍
01:31 同时开跑 - MiniMax M2.5 现场编码
02:34 第一题完成 - 终端UI转WebUI效果展示
03:17 三方横向对比 - Claude / GPT / MiniMax 谁更强
03:47 第二题 - 跨项目认证迁移(复杂度拉满)
05:41 编程评分对比 - 三个模型打分拆解
06:09 Agent实测 - 接入真实自媒体视频拆解项目
06:36 M2.1 vs M2.5 - 速度与拆解深度实测
07:39 用ChatGPT和Gemini交叉评分,避免主观偏见
08:11 最终结论 - 谁该用哪个模型 
#MiniMax #MiniMaxM25 #AI编程实测 #ai新星计划 #抖音年味新知贺岁
    08:32
    真实项目实测MiniMax M2.5,速度快到离谱! MiniMax M2.5 到底能不能打?这期我用两道真实编程任务 + 一个生产级 Agent 项目,把它和 Claude Opus 4.6、GPT-5.3-Codex 放在一起做了一次三方横评。
    三个模型拿到的是同一份 prompt、同一个项目代码,公平对比。
    两道编程题分别考察:
    跨项目认证体系迁移(Google/GitHub OAuth + 落地页)
    终端 CLI 工具改造成 Web 聊天界面(Thinking + 工具调用 + SSE 流式输出)
    除了编程,我还把 MiniMax M2.5 接入了自己一直在用的自媒体视频拆解 Agent,从 M2.1 升级到 M2.5,实测速度、拆解深度和表达真实感的变化。
    结果有惊喜也有差距,具体数据都在视频里。
    时间戳
    00:00 三个模型同台PK,怎么测的
    00:41 编程实测开始 - 两道真实项目任务介绍
    01:31 同时开跑 - MiniMax M2.5 现场编码
    02:34 第一题完成 - 终端UI转WebUI效果展示
    03:17 三方横向对比 - Claude / GPT / MiniMax 谁更强
    03:47 第二题 - 跨项目认证迁移(复杂度拉满)
    05:41 编程评分对比 - 三个模型打分拆解
    06:09 Agent实测 - 接入真实自媒体视频拆解项目
    06:36 M2.1 vs M2.5 - 速度与拆解深度实测
    07:39 用ChatGPT和Gemini交叉评分,避免主观偏见
    08:11 最终结论 - 谁该用哪个模型
    #MiniMax #MiniMaxM25 #AI编程实测 #ai新星计划 #抖音年味新知贺岁
    查看AI文稿
  • 这道初中物理题,99%的人都做不对 #科普  #黄金螺旋排位赛   #知识前沿派对
    02:22
    查看AI文稿
    43.6万毕导
  • 为什么AI搞不定数学3/3丨利用Codex,就能让AI绕开「审题困境」,解决堪比MIT本科生水平的数学题 #copilot #人工智能 #codex #科技科普
    04:28
    查看AI文稿