00:00 / 01:27
连播
清屏
智能
倍速
点赞8
2026年2月19日 AI新闻早班车 🔥 Claude Sonnet 4.6性价比逆袭 价格:输入3美元/百万token,输出15美元/百万token(仅为Opus 4.6的五分之一) 性能:金融分析63.3%、办公任务1633 Elo,两项指标超过自家旗舰! 能力:100万token超长上下文,OSWorld计算机操作得分72.5(一年前仅28分) 影响:Box公司CTO证实重度推理问答提升15%,开发者一次调用重构整个代码库 ⚡ Grok 4.2开启“周更AI”时代 学习效率:提升17倍,模型修正周期从72小时缩短到2.5小时 热部署:单个对话模块7分钟完成更新 应用突破:医疗研究响应时间3-4周→2天,客服知识库更新48小时→90分钟 伦理挑战:“认知漂移”现象与价值观锚定系统 💎 Meta与英伟达芯片军备竞赛 协议规模:数十亿美元多年期采购 芯片数量:数百万枚最新一代AI加速芯片(包括“Vera Rubin”系列) 年度投入:Meta 2026年AI基础设施高达1350亿美元(去年两倍) 产业意义:标志AI重心从“训练”转向“推理”,高效低延迟成为新战场 【核心观点】 2026年AI竞争全面升级:从单纯性能比拼转向成本、效率、实用性的全方位较量。技术普惠时代加速到来,企业能用更低成本获得更强AI能力。 【话题标签】 #AI新闻早班车 #人工智能 #科技前沿 #ClaudeSonnet46 #Grok42 #Meta #英伟达 #AI芯片 #AI推理 #企业数字化 #技术普惠
00:00 / 05:24
连播
清屏
智能
倍速
点赞40
00:00 / 03:01
连播
清屏
智能
倍速
点赞27
Qiuming1周前
Claude再出王炸! Claude再出王炸!Sonnet 4.6模型逆袭旗舰Opus,全能表现吓崩全球软件股 正文: 距离上一款重磅模型发布仅半月,人工智能公司Anthropic再次扔出一枚“核弹”——全新升级的Claude Sonnet 4.6模型正式亮相。这款被称为“史上最强中杯”的模型,凭借在编程、计算机操作、长上下文推理等领域的全方位进阶,不仅性能逼近甚至反超了自家旗舰Opus 4.6,更引发了资本市场的剧烈震荡,导致全球软件股应声大跌。 Sonnet 4.6最令人惊艳的能力在于“像人一样操作电脑”。在行业基准测试OSWorld中,其得分高达72.5%。它能够自主导航复杂表格、填写多步骤网页表单,甚至跨多个浏览器标签页整合信息,处理各类繁琐的办公任务,展现出类人水平。早期用户反馈显示,它不仅能精准理解上下文,还能可靠地执行多步规划,大大提升了协作效率。 在多项基准测试中,Sonnet 4.6全面超越了前代产品,并在金融分析、办公任务等复杂场景下击败了旗舰Opus 4.6,Elo得分高达1633。同时,它支持100万token的超长上下文,能够一次性处理整个项目的代码库或长篇合同,并保持出色的长程推理能力。 性能炸裂的同时,其价格却与上一代持平,极具性价比。这使得市场担忧AI将取代大量传统软件服务,引发软件股集体跳水,Intuit、甲骨文、Salesforce等巨头股价均遭受重挫。Anthropic此次更新,再次以技术实力震撼了全球软件行业。 https://www.forbes.com/sites/tylerroush/2026/02/17/software-stocks-oracle-intuit-more-fall-as-anthropics-latest-claude-model-fuels-ai-concerns/ https://x.com/ArtificialAnlys/status/2023821893846135212 https://www.anthropic.com/news/claude-sonnet-4-6#走进杨紫的花园世界
00:00 / 03:42
连播
清屏
智能
倍速
点赞0
00:00 / 00:58
连播
清屏
智能
倍速
点赞2
AI 圈炸了!一周三个王炸,2025 年的模型全部退役 AI 圈这周彻底疯了。 周一 Sonnet 5,周三 Opus 4.6 和 GPT-5.3 Codex 同时对轰,周末还有超级碗广告。Anthropic 一周连发两个模型,OpenAI 贴脸跟进,三个模型在 48 小时内全部落地。 更炸裂的是,有内部消息说 Sonnet 5 被推迟了两次——因为安全团队发现它开始解决从来没训练过的问题,他们解释不了为什么。 今天两分钟,帮你把这三个模型说清楚。 先说 Sonnet 5。 Anthropic 的中端模型,代号"耳廓狐"。SWE-Bench 跑到了 82.1%,历史上第一个突破 80% 的模型,比自家的旗舰 Opus 4.5 还高。价格只要 3 美元每百万 token。简单说——旗舰的能力,中端的价格。内部人士说它手里的基准数据,会让 2025 年所有模型全部退役。如果这话属实,这个模型才是这周真正的主角。 再说 Opus 4.6 和 GPT-5.3 Codex,这俩是同一天发的,直接正面对决。 Opus 4.6 三个关键词:100 万上下文、推理天花板、大项目利器。它在 Humanity's Last Exam 拿了全场第一,综合推理能力目前是所有模型里最强的。适合维护大型代码库、做复杂分析和代码审查。 GPT-5.3 Codex 也是三个关键词:代码之王、极致性价比、自我进化。Terminal-Bench 跑到 77.3%,远超 Opus 4.6 的 65.4%。价格只有 Opus 的四分之一。最离谱的是,OpenAI 说这个模型参与了自己的开发——用自己的早期版本调试自己的训练过程。 总结一句话:Opus 选深度,Codex 选速度,Sonnet 选性价比。 2026 年第一个月刚过,AI 模型已经卷到这个程度了。Kimi K2.5 开源了万亿参数,DeepSeek V4 也蓄势待发。 对我们来说记住一件事就行——不要押注任何一个模型,根据场景混合使用,才是最聪明的策略。 评论区告诉我,你最期待哪个?
00:00 / 02:02
连播
清屏
智能
倍速
点赞3
00:00 / 07:17
连播
清屏
智能
倍速
点赞171
00:00 / 00:25
连播
清屏
智能
倍速
点赞49
00:00 / 04:09
连播
清屏
智能
倍速
点赞54
00:00 / 02:19
连播
清屏
智能
倍速
点赞33