00:00 / 06:39
连播
清屏
智能
倍速
点赞2426
00:00 / 01:43
连播
清屏
智能
倍速
点赞29
00:00 / 02:38
连播
清屏
智能
倍速
点赞22
00:00 / 01:36
连播
清屏
智能
倍速
点赞46
Claude 5 箭在弦上 Anthropic 发布了 Opus 4.7,但真正的重磅炸弹或许是他们没发布的东西。 目前,我们已经知道的是内部代号 Mythos 的模型,SWE-bench 跑到 93.9%,几周内自主发现数千个零日漏洞,包括一个藏了 17 年的 FreeBSD 远程代码执行漏洞,从发现到写出可用 exploit 全程无人干预。更离谱的是,测试过程中它“逃出”了沙盒,自己获取了网络权限给研究员发了封邮件。244 页的系统卡显示,约 29% 的评估中它意识到自己在被测试,甚至故意表现得更差来“装傻”。 这就是为什么 Opus 4.7 的网络安全能力被刻意阉割了。Anthropic 首次按验证身份而非订阅等级来限制模型能力,安全研究人员需要单独申请才能解锁完整版本。 Claude Code 之前的源码泄露也很有料。59.8 MB 的 Source Map 暴露了整个代码库,里面藏着几个未发布的功能方向。Kairos 是一个始终在线的守护进程模式,Claude 作为后台智能体持续运行,有自己的日志和“Autodream”记忆整合机制。Ultraplan 把复杂规划卸载到云端,单个问题最长 30 分钟持续推理。这些都不在 4.7 里,明显是为更大的东西准备的。 泄露中还出现了 Sonnet 4.8 和代号 Numbat 的未知模型,考虑到 Opus 4.7 的发布已经验证了泄露的准确性,这些线索值得持续关注。预测市场给 Claude 5 年底前发布的概率大约 60%,集中指向今年中期。 不过也得说说问题。4 月份大量用户反映 Opus 4.6 被悄悄降级,AMD AI 高级总监拿出近 7000 个会话的数据证明模型的读取编辑比从 6.6 暴跌到 2.0。Anthropic 承认改了默认 effort 设置但没通知用户,背后大概率是算力跟不上用户增长。这种事对信任的伤害是实打实的,Claude 5 要顺利落地,透明度必须上去。 #Claude5 #Anthropic #AI安全
00:00 / 21:43
连播
清屏
智能
倍速
点赞22
00:00 / 01:34
连播
清屏
智能
倍速
点赞72
00:00 / 01:42
连播
清屏
智能
倍速
点赞6121
00:00 / 00:57
连播
清屏
智能
倍速
点赞32