00:00 / 01:12
连播
清屏
智能
倍速
点赞1
00:00 / 02:19
连播
清屏
智能
倍速
点赞1657
00:00 / 00:26
连播
清屏
智能
倍速
点赞1223
00:00 / 05:31
连播
清屏
智能
倍速
点赞17
00:00 / 00:25
连播
清屏
智能
倍速
点赞41
00:00 / 00:58
连播
清屏
智能
倍速
点赞6
Claude Opus 4.5,到底强在哪? 今天,又又又又有大模型发布了,编码最强王者,Anthropic 发布了他们最新的顶级大模型——Claude Opus 4.5。 一句话总结:它不仅变聪明了,还变便宜了,而且是目前全球在「写代码、做智能体、操作电脑」方面最强的模型。 首先,最炸裂的地方来了: 在真实世界的软件工程测试 SWE-bench Verified 里,Opus 4.5 的准确率——80.9%!是所有模型里最高的! 甚至超过了 GPT 系列、Gemini 系列,真正意义上的第一名。 而且这次它的价格也下来了: 输入 5 美元、输出 25 美元每百万 tokens。 以前 Opus 系列贵得不行,现在人人都用得起。 更夸张的是它的能力升级: 官方测试说,Opus 4.5 能自己理解模糊的问题, 遇到跨系统的大型 Bug,它能自动找到修复方法。 以前 Sonnet 4.5 做不到的,现在它都能轻松搞定。 测试人员给出的评价只有一句: “它就是能懂你。” 而用过提前版的大公司也全在叫好: 有人说它“重构两套代码库完全没压力”; 有人说“复杂代码任务比之前快一倍”; 还有人说“Excel 财务建模准确率提高 20%”; 甚至在 Cursor 和 GitHub Copilot 的工作流里, 它用更少的 token 做更难的事。 最离谱的是它在智能体 Benchmark 里, 居然自己“找到了政策里没说禁止,但完全合法”的解法, 情商+智商都溢出屏幕。 这次更新还带来一堆产品级升级: Claude 代码助手更聪明了、Excel 直接用、Chrome 一键全网页操作、 长对话不会再“撞上下文墙”, 智能体能跑更久、推理更深, 甚至能带着小智能体小团队一起做项目。 最后,它的安全性也提升巨大: 行业里最难骗的模型之一, 强 prompt injection 攻击也很难绕过去。 一句话: Claude Opus 4.5——又把 AI 的天花板往上推了一截。 今年 AI 最强发布之一,没有之一。Claude Opus4.5正式发布 #ClaudeOpus45 #Anthropic发布Opus45 #claude
00:00 / 02:06
连播
清屏
智能
倍速
点赞2