00:00 / 00:22
连播
清屏
智能
倍速
点赞2280
00:00 / 05:39
连播
清屏
智能
倍速
点赞679
00:00 / 02:56
连播
清屏
智能
倍速
点赞20
00:00 / 00:22
连播
清屏
智能
倍速
点赞8629
AI 圈炸了!一周三个王炸,2025 年的模型全部退役 AI 圈这周彻底疯了。 周一 Sonnet 5,周三 Opus 4.6 和 GPT-5.3 Codex 同时对轰,周末还有超级碗广告。Anthropic 一周连发两个模型,OpenAI 贴脸跟进,三个模型在 48 小时内全部落地。 更炸裂的是,有内部消息说 Sonnet 5 被推迟了两次——因为安全团队发现它开始解决从来没训练过的问题,他们解释不了为什么。 今天两分钟,帮你把这三个模型说清楚。 先说 Sonnet 5。 Anthropic 的中端模型,代号"耳廓狐"。SWE-Bench 跑到了 82.1%,历史上第一个突破 80% 的模型,比自家的旗舰 Opus 4.5 还高。价格只要 3 美元每百万 token。简单说——旗舰的能力,中端的价格。内部人士说它手里的基准数据,会让 2025 年所有模型全部退役。如果这话属实,这个模型才是这周真正的主角。 再说 Opus 4.6 和 GPT-5.3 Codex,这俩是同一天发的,直接正面对决。 Opus 4.6 三个关键词:100 万上下文、推理天花板、大项目利器。它在 Humanity's Last Exam 拿了全场第一,综合推理能力目前是所有模型里最强的。适合维护大型代码库、做复杂分析和代码审查。 GPT-5.3 Codex 也是三个关键词:代码之王、极致性价比、自我进化。Terminal-Bench 跑到 77.3%,远超 Opus 4.6 的 65.4%。价格只有 Opus 的四分之一。最离谱的是,OpenAI 说这个模型参与了自己的开发——用自己的早期版本调试自己的训练过程。 总结一句话:Opus 选深度,Codex 选速度,Sonnet 选性价比。 2026 年第一个月刚过,AI 模型已经卷到这个程度了。Kimi K2.5 开源了万亿参数,DeepSeek V4 也蓄势待发。 对我们来说记住一件事就行——不要押注任何一个模型,根据场景混合使用,才是最聪明的策略。 评论区告诉我,你最期待哪个?
00:00 / 02:02
连播
清屏
智能
倍速
点赞4