AI 圈炸了!一周三个王炸,2025 年的模型全部退役 AI 圈这周彻底疯了。 周一 Sonnet 5,周三 Opus 4.6 和 GPT-5.3 Codex 同时对轰,周末还有超级碗广告。Anthropic 一周连发两个模型,OpenAI 贴脸跟进,三个模型在 48 小时内全部落地。 更炸裂的是,有内部消息说 Sonnet 5 被推迟了两次——因为安全团队发现它开始解决从来没训练过的问题,他们解释不了为什么。 今天两分钟,帮你把这三个模型说清楚。 先说 Sonnet 5。 Anthropic 的中端模型,代号"耳廓狐"。SWE-Bench 跑到了 82.1%,历史上第一个突破 80% 的模型,比自家的旗舰 Opus 4.5 还高。价格只要 3 美元每百万 token。简单说——旗舰的能力,中端的价格。内部人士说它手里的基准数据,会让 2025 年所有模型全部退役。如果这话属实,这个模型才是这周真正的主角。 再说 Opus 4.6 和 GPT-5.3 Codex,这俩是同一天发的,直接正面对决。 Opus 4.6 三个关键词:100 万上下文、推理天花板、大项目利器。它在 Humanity's Last Exam 拿了全场第一,综合推理能力目前是所有模型里最强的。适合维护大型代码库、做复杂分析和代码审查。 GPT-5.3 Codex 也是三个关键词:代码之王、极致性价比、自我进化。Terminal-Bench 跑到 77.3%,远超 Opus 4.6 的 65.4%。价格只有 Opus 的四分之一。最离谱的是,OpenAI 说这个模型参与了自己的开发——用自己的早期版本调试自己的训练过程。 总结一句话:Opus 选深度,Codex 选速度,Sonnet 选性价比。 2026 年第一个月刚过,AI 模型已经卷到这个程度了。Kimi K2.5 开源了万亿参数,DeepSeek V4 也蓄势待发。 对我们来说记住一件事就行——不要押注任何一个模型,根据场景混合使用,才是最聪明的策略。 评论区告诉我,你最期待哪个?
00:00 / 02:02
连播
清屏
智能
倍速
点赞4
2026年2月19日 AI新闻早班车 🔥 Claude Sonnet 4.6性价比逆袭 价格:输入3美元/百万token,输出15美元/百万token(仅为Opus 4.6的五分之一) 性能:金融分析63.3%、办公任务1633 Elo,两项指标超过自家旗舰! 能力:100万token超长上下文,OSWorld计算机操作得分72.5(一年前仅28分) 影响:Box公司CTO证实重度推理问答提升15%,开发者一次调用重构整个代码库 ⚡ Grok 4.2开启“周更AI”时代 学习效率:提升17倍,模型修正周期从72小时缩短到2.5小时 热部署:单个对话模块7分钟完成更新 应用突破:医疗研究响应时间3-4周→2天,客服知识库更新48小时→90分钟 伦理挑战:“认知漂移”现象与价值观锚定系统 💎 Meta与英伟达芯片军备竞赛 协议规模:数十亿美元多年期采购 芯片数量:数百万枚最新一代AI加速芯片(包括“Vera Rubin”系列) 年度投入:Meta 2026年AI基础设施高达1350亿美元(去年两倍) 产业意义:标志AI重心从“训练”转向“推理”,高效低延迟成为新战场 【核心观点】 2026年AI竞争全面升级:从单纯性能比拼转向成本、效率、实用性的全方位较量。技术普惠时代加速到来,企业能用更低成本获得更强AI能力。 【话题标签】 #AI新闻早班车 #人工智能 #科技前沿 #ClaudeSonnet46 #Grok42 #Meta #英伟达 #AI芯片 #AI推理 #企业数字化 #技术普惠
00:00 / 05:24
连播
清屏
智能
倍速
点赞41
00:00 / 01:15
连播
清屏
智能
倍速
点赞272
00:00 / 07:33
连播
清屏
智能
倍速
点赞83
00:00 / 00:55
连播
清屏
智能
倍速
点赞2