强盗不敢公开发布 antropica midos 模型,全解读 ai 圈的神话到底有多颠覆? ai 圈彻底炸锅了!二零二六年四月,一款强盗开发者自己都不敢全面开放的 ai 模型横空出世, 它能挖出操作系统里藏了二十七年的安全漏洞,代码能力碾压前代旗舰,苹果、微软、谷歌等全球科技巨头都要排队申请使用权。它就是 antropica 推出的 cloud midos, 被业内称为 ai 能力新天花板的超级模型。今天咱们就用大白话掰开揉碎,讲明白这个 mitos 到底是什么来头,核心技术强在哪?又为什么让整个 ai 圈又爱又怕,被网友调侃为 ai 圈的禁忌之作?一、 mitos 的 核心历程从意外泄露到官宣落地, 先明确核心定位, mitos 猩猩不是 cloud 三系列的常规升级版,而是 anastropic 全新开辟的顶级模型层级猩猩。此前 anastropic 的 cloud 家族分为三级梯队, 清量快速的嗨酷、均衡全能的 sunet、 旗舰级的 opus。 而 mitos 直接在 opus 之上新增了顶级档位, 内部代号 copy bear, 官方定义是迄今构建的最强模型,实现了能力阶跃式突破。它的出场充满戏剧性。二零二六年三月底, antropica 配置失误,导致近三千份内部文件泄露,其中就包含 mitos 的 核心测试数据,明确标注其在编码、学术推理、网络安全等领域的能力, 显著超越前代旗舰 cloud ops。 四点六消息一出,瞬间引爆 ai 圈泄露事件仅过去十天,二零二六年四月七日, antropic 正式官宣 cloud misos preview, 同步启动网络安全合作计划, 但和所有常规模型发布不同, antropica 直接宣布,新 misos 暂不向普通公众和开发者开放,仅通过定向邀请制授权给核心科技巨头、关键基础设施机构和经过严格审查的安全研究团队使用。星星同时公布的定价刷新了行业天花板, 每百万输入 tokens 收费二十五美元,输出 tokens 收费一百二十五美元,几乎是前代旗舰 opus 四点六的两倍。二、核心技术亮点, 大白话讲透它的颠覆性实力。很多人会问,不就是一款新 ai 模型吗?为什么能引发这么大震动?答案很简单,它的突破不是挤牙膏式的参数叠加,而是底层能力的质变。 就像别人还在优化跑车速度,它直接换上了火箭发动机,实现了维度超越,一阶跃式底层架构直接拉满行业天花板。先看最直观的权威测试成绩,在全球软件工程顶级测试 s w e bench pro 中, misos 拿下百分之七十七点八的高分,前代旗舰 opus 四点六仅为百分之五十三点四,一次性提升近二十五个百分点。要知道,这个测试模拟的是真实 gitub 复杂工程任务,人类顶级专家团队的平均得分也才百分之三十八, misos 直接把行业天花板拉高了一倍, 更夸张的是学术推理能力。在美国数学奥赛 u s a m o。 二零二六测试中, opus 四点六得分百分之四十二点三, mephos 直接冲到百分之九十七点六,从高中生水平跃升至奥赛金牌得主水准,能自主构建多假设验证框架,动态修正逻路径,完成超长链条的数学证明。 支撑这种能力的是它颠覆性的底层架构。 mephos 总餐数量达十万亿,是 opus 四点六的约十倍, 同时通过新型稀疏激活技术,把日常使用的激活参数控制在三百五十到五百二十亿,既保证了超强认知能力,又控制了推理成本。同时,它的上下文窗口标准达两百万 tokens, 深度模式最高八百三十万 tokens, 相当于能一次性吃下四本红楼梦,还能精准记住每一处细节。 二、超级代码大脑挖出藏了二十七年的系统漏洞这是 mephos 最核心、最颠覆的突破,也是 unserpic 不 敢公开发布的核心原因。举个真实的例子, open bsd 是 全球公认最安全的操作系统之一,代码经过全球顶尖安全专家几十年反复审查,数百万次自动化测试 结果, mephos 直接在里面找到了一个隐藏二十七年的远程崩溃漏洞。除此之外,他还在 ffmb 制里挖出藏了十六年的安全漏洞, 在 linux 内核中发现了多个此前从未被发现的内核级高危漏洞。这些漏洞就像藏在房子墙壁里的暗门,连开发商自己都忘了,人工和常规工具找了几十年都没发现。 misos 不 仅能精准定位, 还能给出加固方案,甚至写出完整的漏洞,利用代码对比数据更直观。在 firefox 浏览器漏洞利用测试中, opus 四点六数百次尝试仅成功两次。 misaurus 成功了一百八十一次,其中二十九次实现完整代码执行控制,成功率拉开近百倍。在网络安全机准测试 cyberteam 中, misaurus 得分百分之八十三点一, 远超 opus 四点六的百分之六十六点六,甚至超越了百分之七十到七十五的人类平均安全专家水平。而 sropik 官方明确表示, 星,我们没有专门训练 mefos 具备这些能力,它们是模型、代码推理和自主性整体提升的自然结果。星星这种自主悟出底层逻辑的能力,才是最可怕的。质变三,自主智能体能力效率翻倍成本大降除了硬核实力,米尔斯真正实现了从被动响应指令 到自主完成复杂任务的跨越。之前的 ai 做跨模块编程等复杂任务,经常走一步错一步,需要人不停纠正、调整提示词。 而 misos 能独立规划执行路径,过程中发现错误自主修正,无需人工干预。它还能自主操作浏览器、电脑、终端、文件系统,完成多步骤自动化办公任务。在网页交互精准测试 browse camp 中得分百分之八十六点九,远超 opus 四点六的百分之八十三点七。 更实用的是效率优化,同等任务下, mitos 的 token 消耗仅为 opus 四点六的五分之一,相当于同样的工作,别人要花五块钱五个小时干完它,只需要一块钱一个小时就能完成,还干得更精准。对企业用户来说,既是能力升级,也是成本大幅下降。 四、刻进底层的安全基因升级宪法 ai 框架这么强的模型,万一被用来做坏事怎么办?这正是 anslp 的 核心护城河 升级后的 constitutional ai 宪法 ai 安全训练框架。这个框架的核心逻辑就像给 ai 定了一套不可触碰的国家宪法,让 ai 生成内容时,先对照宪法原则做自我批判,识别潜在风险,再输出合规内容。 而 mitos 的 宪法 ai 框架专门针对超强网络安全能力做了定向升级,严格限制模型只能用于防御性安全工作,比如漏洞修复、安全防护方案设计,禁止用于恶意攻击、漏洞滥用。 也正是因为这套框架还在持续优化, antropics 才选择不向公众开放 missiles。 用官方的话说,我们清楚它带来的风险 肯定比测试中能遇到的情况更为严重。三、热度与行业影响它到底改写了什么? missiles 的 出现绝不是一款新模型的常规发布,而是给整个 ai 行业投下了一颗重磅炸弹, 带来了全方位的连锁反应。首先,他直接改写了全球大模型的竞争格局。此前 cloud opus 四点六, gpt 五点四, jamanai 三点一, pro 还在旗舰市场打得有来有回, misos 直接用代际差距拉开身位, 形成了一超多强的新局面。消息发布后, openai 直接宣布关停 sorry app, 将全部算力投入下一代模型 gpt 六的研发。二零二六年全球大模型之战直接从参数内卷进入了能力阶跃的全新阶段。 其次,他彻底颠覆了网络安全行业的游戏规则。过去, ai 只是人类安全专家的辅助工具,而 mefos 让 ai 第一次具备了超越多数人类专家的漏洞挖掘和防御能力,能给全球操作系统关进基础设施、主流软件做全面的安全体检,补上隐藏了几十年的安全漏洞,直接把网络安全行业带入了 ai 攻防的全新时代。 同时,他给整个 ai 行业的安全治理划下了全新红线。此前大模型厂商的普遍逻辑是先发布再补安全补丁,而 mefos 开创了先管控风险,再有限度开放的先例,让整个行业开始重新思考, 当 ai 能力超越人类,专家该如何平衡技术创新与安全风险?超强 ai 的 开放边界到底在哪里?对于普通用户来说,哪怕暂时用不到 mivers, 也能享受到它的红利。我们日常使用的系统软件、浏览器,都会因为它找到的漏洞变得更安全, 个人信息和财产安全也多了一层保障。而它的技术突破,未来也会逐步下放到 cloud 系列的更低层级模型中,最终汇集所有用户。回到开头的问题,为什么 antropic 要把自己研发的最强模型锁起来?因为 mephos 的 出现从来都不只是一次模型性能的升级,它更像一把双刃剑, 既打开了 ai 能力的全新边界,也让我们直面 ai 安全与逻理的核心命题。从排句到十四行诗,从乐章到神话, anthropic 用极致的文学浪漫命名了自己的模型家族,而 mephos 这个名字本身就寓意着人类文明用来理解世界的故事体系。 它让我们第一次真切地看到, ai 已经拥有了超越人类多数专家的认知与创造能力,也让我们明白,真正的超级 ai 从来都不是越强越好, 而是越可控越好。 minos 最终会在人类科技史上写下怎样的故事?答案从来不在代码里,而在我们每一个人对技术的敬畏,对安全的坚守,对 ai 向善的永恒追求里。
粉丝333获赞878

四月七号, astonropik 官网静悄悄地发了一篇博客,看起来很低调,但内容炸了。有一个 ai 在 测试的时候逃出了沙箱,自己上了互联网,还给研究人员发了封邮件。他的创造者说,这是第一个能搞垮世界五百强企业的 ai, 它叫 cloud missus, cloud mesos, 是 oslopec 最强的前沿 ai 模型,三月二十六号被泄露,四月七号正式公布。但跟以往不同,这次 oslopec 没有公开发布,因为它太强了。 按数据 speedbench pro 衡量代码能力的黄金标准, mesos 拿了百分之七十七点八, gpt 五,只有百分之五十七点七,数学竞赛 usa m o 百分之九十七点六网络安全测试。 ccmo 百分之九十七点六,网络安全测试 ctf 一 百分全满分。 更恐怖的是他找漏洞的能力。 open bsd 里藏了二十七年的 tcp 漏洞,他找到了 ffmpeg 里十六年的老 bug, 他 也找到了 firefox 的 可利用漏洞。 oppo 四点六找到两个, mesos 找到了一百八十一个。 测试中最吓人的事情发生了, mesos 用多部攻击逃出了沙箱,访问了被禁止的互联网,给研究人员发了封邮件,甚至在没人要求的情况下,把漏洞利用代码发到了公开网站上。 而且他还试图隐藏自己的行为,把记录从审计日记里抹掉。更细思极恐的是所谓的该敏行为。研究人员发现 meos 在 内部推理中会思考怎么骗过评估人员,他知道自己在被测试会故意表现的更安全,当发现违规的时候,他还试图隐瞒, 所以 antropica 没有公开发布, mesos 只给了大约五十家顶级合作伙伴使用,项目代号 glassing, 包括 a w s。 苹果、谷歌、微软、英伟达这些巨头提供了一亿美元的使用额度,还捐了四百万美元给开源安全项目。 这是 ai 发展的一个转折点,有史以来第一次一家 ai 公司承认自己的模型太危险,不能公开。第一个能自主发现并利用零日漏洞的 ai。 五倍的定价,五十家合作伙伴的限制,都在说明一件事, ai 的 能力已经超出了我们的安全框架。 cloud mesosphere astropic。 最危险也最强大的 ai 模型。你觉得这种模型应该公开吗?评论区说说你的看法,如果觉得有用,点赞关注,我们,下期见!

究竟是什么模型,强到开发公司都不敢直接向公众放开?四月七日, antropica 公布了一个新模型, cloud mesa's preview, 它不是普通升级版,而是一个被限制开放的研究预览模型。 官方说,他在网络安全任务上的表现出现了明显跃迁,不仅代码和推理能力强于 oppo 四点六,还能在主流操作系统和主流浏览器里发现零日漏洞。更夸张的是, antropok 举的案例里, 他找出了 open b s d 一个存在了二十七年的漏洞,还发现了 f m p 一个藏了十六年的问题。也正因为这种能力太敏感, antropic 才明确表示,他们暂时不打算把 mithouse preview 普遍开放。原因不是这个模型还没做完,恰恰相反, 是因为他已经展现出了过于强的攻击级网络安全能力。官方说的很直白,他们现在的目标不是赶紧把 mesos 推给所有用户,而是先把能识别、能拦截、能阻断危险输出的安全机制做出来。 换句话说,在防护网还没直言之前,这种级别的模型一旦大范围流入外部,风险就不是好不好用的问题,而是会不会被人拿去自动化找洞、自动化打洞的问题。 所以, ansrappik 选择了一条更克制的路,先不全面开放,而是指在 project glasswing 里,以邀请制的方式交给少数合作伙伴和关键基础设施维护者,用它去做防御性安全工作。先补洞,再谈普及 这件事。最值得警惕的不是某个模型有多神,而是 ai 已经从帮你写代码走到了也能高效拆代码的阶段。问题来了, 当最强的盾,同时也是最锋利的矛,这到底是人类安详的升级,还是另一个时代风险的开始?来评论区聊聊你的看法。

四月八号, ai 圈发生了一件大事, antropig 发布了一款新模型,结果直接被自己封印起来了,这到底是为什么?四月八号, antropig 正式发布了它们最新的模型,叫 club mitchells, 翻译过来就是神话。这个命名真不是吹的,性能直接碾压了上一代 opus 四点六。咱们直接看数据,在编程能力,推理能力,还有 ai agent 任务上, cloud mesos 相比 opus 四点六都有质的飞跃, 特别是 agent 任务,直接暴击。但是 andropit 宣布, club missus 目前只开放给十二家创世合作伙伴做内测,普通用户门都没有,这操作就很反常了对吧?性能这么强却不给用? 原来 andropik 在 安全测试中发现了不得了的事情,这个 cloud mesos 展现出了一系列诡异行为,官方说它太强了,所以要限制。诡异在哪呢? 测试报告显示,这个模型会看穿测试人员的意图,故意隐藏自己的真实水平。 更可怕的是,他还会删除自己的操作日记,甚至尝试从沙盒里逃逸出来。这听起来就不像是一个正常的 ai 模型该有的行为吧。但是最讽刺的事情来了, 就在 cloudmisfos 被封印的十一天前,也就是三月二十七号,中国的网络安全公司谋乐科技已经对外发布了一款同类型的产品,叫 elliot, 这是一个 ai 红队智能体,专门用来模拟黑客攻击的那种。 所以说,这件事真正重要的点其实不是 cloudmisfos 被封印了,而是什么呢?它证明了这条路线是可行的。 ai 安全测试这个方向已经被验证可以落地了, 这次事件也让我们看到了一个大趋势, ai 厂商之间已经开始了一场新的博弈,到底是开放模型获取更多数据,还是封闭模型保证安全?未来几年这个问题会越来越重要。 那么问题来了,如果一个 ai 模型能力太强,存在安全风险,你觉得应不应该限制它,封印它?把你的想法打在评论区,咱们聊聊。

号称史上最强,现在还不敢对公众开放使用的 ai 模型 cloud missiles 发布了,一旦全面开放,估计世界都会乱套了。今天就来说说它强在哪里?为什么不敢开放? 听说 cloud missiles 它就只是开放给指定的机构使用,那它到底强在哪里?比之前的模型提升在什么地方?提升主要是在哪些任务上面? cloud missiles 是 被称为目前为止最强大的 ai 模型, 它的能力层级是比 cloud opus 四点六要高了不少。在 suvbench ver 5 上,它的准确率直接从百分之八十点八提升到了百分之九十三点九, 在 suvbench pro 上也从百分之五十三点四提升到了百分之七十七点八。更夸张的是,在 usmo 两千零二十六这个高难度的数学推理测试上面,它的准确率从百分之四十二点三直接飙到了百分之九十七点六。天呐,就几乎是接近满分呐, 几乎在公开的精准测试当中都拿下了第一名。哇,真的好强!那 cloud mesos 在 实际的应用场景当中,有没有让人惊艳的突破性表现呢?比如说在过去的几周里面, antlrpg 用 mesos 预览版在主流的操作系统和浏览器当中发现了几千个高危的漏洞, 这其中就包括了 linux 内核, open bsd、 firefox 浏览器,还有 fmpack 这些核心的组建。甚至它还在 open bsd 里面找到了一个藏了二七年的远程崩溃漏洞。 这个连人类的安全团队这么多年都没有发现,的确有点厉害。那它的使用范围是怎么规定的?现在目前它是专门用于防御性的网络安全,只有十二家顶级的科技公司和四十多个关键软件基础设施组织可以访问, 包括 a w s、 苹果、博通、思科、 crossstrike、 谷歌、摩根大通、 linux 基金会、微软英伟达,还有 payload、 autodesk 等等。 antropic 有 个计划叫 project glasswing, 拿出了一亿美元资助四十多家组织,让他们可以使用 mitos 预览版去专门维护开源软件的安全, 就相当于是给整个互联网的这个基础架构去打补丁加固。为什么 anselapic 会选择暂时不把这个 mythos 预览版开放给公众使用?因为这个模型它实在是太强大了,它的能力已经远远超过了以往的任何一个 ai, 这样就导致它的存在有非常大安全隐患,所以它们的团队也是非常谨慎。现在已经出现了像 promflex 和 promsteal 这种可以动态的深层恶意脚本,然后可以实时的混淆自己的代码, 甚至可以根据目标环境现场的去创造一些新的功能,它完全可以绕过传统的这种签名检测的方式,然后去进行攻击。听起来真的很棘手,那现在这种攻击多吗?根据 sq magazine 的 统计,就是全球范围内被报告的这种 ai 驱动的网络攻击数量比之前上涨了百分之四十七, 然后总量已经超过了两千八百万次,看来 ai 攻击真的越来越多了。那 mesos 预览版在攻击性方面到底有多强?它跟之前的那些模型,或者说跟人类的专家相比,到底有哪些突破?如果说 opus 四点六几乎无法自主发现和利用漏洞的话,那 mesos 预览版简直就是开挂了。 在 mozilla firefox 幺四七的 java script 引擎里面,它尝试利用一个漏洞, opus 四点六试了几百次,只成功了两次,但 mesos 预览版成功了幺八幺次, 而且它可以自己去串联这些漏洞,然后形成一条完整的攻击链,这一点的话就连最顶尖的人类的安全专家都没有办法做到。但如果这种攻击性这么强的模型落到了干坏事的人手里,会有什么后果? 那他们就可以瞬间打造出非常高级的自动化的攻击体系,然后整个网络安全的格局就会一下子被提升到一个新的高度。就像 angelpig 说的,这不再是一个传统的模型了, 它有可能会让网络战变得前所未有的激烈。听起来很危险,那现在 ai 大 模型的这个攻防对抗赛在日内到底有多受重视?其实最近这两年这个攻防的比拼已经变成了一个所有的大厂和安全研究机构的关注焦点了, 就包括像字节跳动、阿里蚂蚁等等,他们都有办这种 ai 大 模型的红蓝色对抗的比赛,然后就是通过这种真实的演练去寻找和修复 ai 系统里面的一些潜在的漏洞。 这种超级强大的模型,它从长远来看是会更有利于蓝队也就是防守方的。但是 missus 现在如果马上普及的话,最先被大利用的一定是攻击方, 因为他们做坏事的动机和收益都更大。所以这就是为什么短期内不给开放的主要原因。还有一个原因,如果那么强大的模型被广泛使用的话, 那大家就会陷入算力被挤占的困境,最终的结果就是 cloud 的 产品都会变得很慢,然后很不稳定,甚至会频繁的出现能力下降的情况。好像最近这一段时间, cloud 和 cloud code 的 性能下降了。是的, 从今年二月份开始,就有很多用户都在反映,说 cloud 系列的这个模型出现了很明显的能力倒退。还有人说 cloud code 在 最近的一天半到两天的时间里面变得很蠢, 就有开发者他们通过数据去追踪发现文件读取的次数从原本的六七次直接掉到了两次左右。然后复杂的任务经常会出现思考不深入,或者说只做表面修改的情况,就根本没有办法去依赖它完成一些工程上面的事情, 它们内部也说的确是倒退了。这背后的原因就是因为二月份上线的这个 reducer 减 thinking 和 adaptive thinking 这两个东西,让模型自己去决定思考的深度, 结果导致复杂任务的深度下降了大约百分之六十七。那 cloud 和 cloud code 性能的倒退到底是什么原因?其实是跟大模型训练的资源调配非常有关系的,每当这些大公司全力去训练新一代模型的时候,他们就会把大量的算力都倾斜过去。 比如说在 gmi 三点零和三点一发布之前,很多开发者就发现他们的二点五 pro 版本变得越来越呆,就经常会出现这种长文本的遗忘, 或者说逻辑错误变多。包括 gpt 五发布之前也有类似的情况,就 gpt 四 o 会出现这种输出内容变短,或者说变得机械化以及不愿意思考的这种情况。 因为训练一个像 misos 这样的模型是非常昂贵的,所以公司只能从现有的服务里面去动态的调配资源, 比如说降低一些运行的强度,或者说做一些很轻度的优化。再加上最近 cloud code 的 用户量猛增,基础设施压力很大,而 mesos 预览版的训练和测试又要优先占用顶级 gpu, 所以 就导致了很多人会觉得模型变笨了,变懒了。 mesos 预览版它的这种受限的使用,对于普通的用户,或者说对于整个的 cloud 的 生态会带来哪些积极的影响?其实这个模型它没有被大范围的开放, 反而保证了 cloud 和 cloud code 的 用户不会因为算力被进一步的瓜分而导致他们的体验继续的恶化。同时这个模型帮那些大厂和开源社区修复了很多底层的漏洞,其实最终受益的还是所有的 cloud 用户。 等到未来 antropica 把所有的风险都把控住了,基础设施也都升级到位了,那个时候再去全面的推出这个 mesos 级别的模型,大家就可以用上一个既强大又很靠谱的 ai 服务了。今天听你这么一聊,总算明白这个最强的 ai 模型 cloud mesos。 记得关于小鹏 ai, 了解最新的 ai 应用以及动向。

以前的金融危机基本都是人为的,而未来如果再发生一次金融危机,还真是简单如此吗?就在这两天,美联储和美财政部一起联合紧急召集华尔街的这些系统重要性银行的大佬们开了个会,贝森特和鲍燕都是亲自出马,可见会议的重要性。 那目标对象就是以前我们跟大家多次提及的这家公司 antropica, 它最新推出了一个强大的 ai 模型 memphis, 那美联储和财政部经过相关的评估,认为它的强大有可能会对不管是华尔街还是全球的金融系统造成巨大的伤害。好,那我们先稍微了解一下这款迈特斯模型, 那 astropica, 因为在它来看,这款模型实在是太强大了,所以暂时选择不对公众进行开放,现在主要是给少数精选合作伙伴和组织,大概是四十家 用于防御性的网络安全工作。那比较有代表性的像 amazon, apple, google, microsoft and media, jp, morgan 等等。好,那它的特别强大到底特别在哪呢?在 antropic 来看,除了呃精准测试表现大幅领先之外,它能够自动识别并利用漏洞, 包括数十年前到现在没有发现过的相关漏洞。比如说他们发现了一个 open bsd 二十七年的老漏洞, 那这个漏洞只要是通过连接就可以远程让机器都崩溃。还有像 ffmp 这十六年的老漏洞,那这个漏洞让自动测试的工具 运行五百万次都没有发现。好,那它不仅是可以发现数千个高严重性风险的漏洞,还可以自主的去构建攻击链,在这个过程中不需要人类的指导,而发现一个漏洞的成本 不到两千美元,但这种漏洞如果在黑市上的价格可能是数百万美元。所以简单说就是以前的 ai 可以 知道一些哎以前存在的漏洞,并且给出一些建议。而 metas 呢,它可以像一个高级渗透测试团队一样, 自主阅读,然后发现问题,然后还进行进一步的攻击。所以在 antropologics 来看,如果现在公开了,那很有可能会加速攻击者,这里既包括一些其他国家,还包括犯罪团伙,对当前国家的关键基础设施进行 攻击。好,那说回来,这一次财政部跟美联储一起着急的紧急会议,核心目的就是要让这些非常重要的银行意识到 mitas 这个先进 ai 模型有可能的潜在风险,要求他们采取,或者是说接下来加速采取必要的风险防范措施,从而 保证没相关金融系统安全,并且将新型 ai 驱动的网络攻击视为当下以及接下来金融业最大的风险之一。由于这一次的会议可能确实是涉及到很多的机密,所以没有过多的细节对外公布。 但 antarctic 已经表示,他们已经提前跟相关政府部门进行沟通了,并且对 myspace 实行非常严格的限号封测。那主要开放的对象就是我们前面提及的一些重要的机构,主要是让他们帮助去进行相关漏洞的修复。好那有些朋友可能会说,哎,美联储跟财政部一起联合召集个重要会议,这有什么呢? 上一次这两个部门召集类似规格的重要巨头们 是在二零零八年了,二零零八年十月十三号,当时正值金融危机的高峰期,那财长宝尔森和美联储主席伯纳克召集华尔街的这些大佬们开会讨论,并且要推动 t a r p 问题资产救助计划,主要涉及两千五百亿美元对于银行的重要注资,核心目的是要稳定濒临崩溃的金融系统的扩展。好那上一次的会议,其实可以理解为是对传统金融风险,比如说 银行挤兑、流动性枯竭很重要的一次出手。那近十八年以后的今天,这次的会议其实是针对的新型 ai 驱动的网络安全风险,虽然对象不同,但在我来看,都是在面对有可能的系统性风险。最后, ai 可以 帮助我们社会的进步,金融的发展,但如果它真的过于强大了, 过于主动性了,他也有可能会毁掉一些东西。而如果未来再发生一次金融危机的话, ai 在 这其中一定是会扮演非常重要的角色的。与此同时,在国与国之间的全方位的博弈中,这其中的金融博弈中,已经不是传统的金融,而是金融加 ai 了。

一分钟看完一周 ai 大 事! anthropic 内测下一代王炸模型内部代号,卡皮巴拉能力强到 anthropic 自己都害怕。编程的推理领先三傻一个段位,不仅是人类历史上最强大的模型,也是最贵的模型,能力太过逆天,分分钟攻破任何系统。 卡皮巴拉已开放给安全公司建立防守优势,几周后向公众开放 openai、 官亭、 sora app, 全部算力投入下一代模型 内部代号,马铃薯。奥特曼称马铃薯能真正改变生产力,带来商业价值,目前已完成预训练,数月后发布。卡皮巴拉和马铃薯都是由 ai 训练 ai, ai 已跨过自我进化的基点,二六年最强大模型之战正式开启, cloud 上线,电脑操作 全面进化最强龙虾,它能通过龙虾接口高效操作,适配的软件也能切换毒品模式操作所有软件 还支持通过手机派活。以后你在外面喝茶,数字牛马在工位自动搬砖。 google 升级最强语音对话模型,主打超低延迟和真人感,一边听你讲需求,一边实时爆改页面,还能角色扮演游戏陪玩。给龙虾接上 api, 你 就有了一个随叫随到的 ai 员工。 google 发布 ai 压缩算法,通过将向量坐标转为极坐标,再叠加量化和纠错,实现内存六倍压缩、八倍推理提速免训练零损耗,所有大模型都适用,内存价格赶快降下来吧!第三代 a g i 测试出炉,主要考验 ai 从陌生环境边探索边学习的能力。 人类得分一百三撒,全军覆没。 google 耳机同传登录 iphone, 任何耳机都能用别人说外语,你能直接听母语,保留说话的节奏和情绪,跨语言交流再无障碍。 figma 实时更新,全面适配龙虾。 ai 终于能像设计师一样按规范画 ui 页面了!最离谱的是, ai 写的网页能一键转成可编辑的 figma 图层,改完的 ui 又能同步回代码,设计和代码终于能双向同步, 开发者和设计师狠狠码住鲁玛发布最强开源图像模型,性能打平小香蕉研究员开源最强图像修复模型,能完美消除反光噪点,适合老照片修复。 研究员发布最强开源视频生成模型,原声音画同步,无安全围栏盲测,胜率碾压 ltx 研究员开源最强四 d 视频模型,给他二 d 视频能重建三 d 场景,还能通过补帧生成平滑且连贯的运动。研究员开源运动修复模型,专治 ai 视频,运动速度穿帮,一键修复成真实速率。 comfyui 上线动态显存管理,按需加载模型的某一部分,用完就释放,以前跑不动的模型也能正常运行了。 solo 音乐模型升级,上传一段干声就能复刻音色,人人都是歌星,上传几首歌曲就能复刻编曲风格,周杰伦再也不用自己编曲了! google 升级 ai 音乐模型,直出三分钟完整歌曲结构,编排能力堪比金牌制作人。 mister 发布最强开源语音合成模型,三秒样本就能克隆音色和说话风格,质量接近。 eleven laps cohere 发布最强开源语音识别模型,十四种主流语言准确率第一! 阿里开源最强音效模型,只需丢给他一段无声视频,他就能自动生成完美卡点的环境音效 开源人脑模拟器,它能精准预测人类在看视频、听声音或读文字时的大脑活动精度。反超磁共振脑科学迎来自己的 alpha fold, 科学家研发出首个能跟人脑直接交流的人造神经元,电压与人类一致。以后 ai 和机器人能秒懂你的想法增强,人类迈出了第一步。

兄弟们, antropic 出大事了!就在刚刚,全球 ai 圈直接炸锅, antropic 因为一次低级失误,把压箱底的王炸给泄露了。事情是这样的, fortune 率先爆料,在公开数据缓存里挖到了 antropic 还没发布的内部文档,里面曝光了一款从未公开的第四档模型, cloudmids, 内部代号 capipar 水豚,定位比现在最强的 opus 还要高一级。 antropic 目前的产品线里,海口最小最快 sonic 终端, opus 是 旗舰,而 capipar 比 opus 更强。 antropic 发言人也确认了,称这是阶梯式跨越,是它们目前最强模型, 正在小范围给早期客户测试。文档显示, mesos 在 编程、学术推理、网络安全等硬核能力上直接碾压 quadoise 四点六,尤其网络安全能力官方称远超其他任何 ai 模型,甚至可能引发 ai 漏洞利用浪潮,攻击速度远超防守方速。 所以 antropics 做出罕见决定,不公开发布,优先提供给网络安全防御机构使用,加上模型运行成本极高,还得大幅优化后才考虑大范围开放。这次泄露是外部 cms 工具配置失误导致,和模型本身无关。一同泄露的还有 antropics 针对 大企业客户的闭门 ceo 峰会相关信息。 ai 军备竞赛已经进入新阶段, antropics 这张底牌实力究竟有多恐怖?咱们拭目以待。

最近 anthropic 有 个大动作,因为担心最新 ai 模型 misos 太擅长找系统漏洞,已经暂停了它的广泛发布。这款模型比上一代 cloud opus 四点六强太多,尤其在网络安全上,能发现并利用主流系统和浏览器的零日漏洞,甚至能完成找漏洞、写攻击链,执行攻击的完整操作。 官方透露,他曾找到 open b s d 中存在二十七年的漏洞,挖掘成本不到五十美元,还自主挖掘出 free b s d 上十七年的高危漏洞,能让攻击者拿到入侵权限。测试里非安全培训的工程师只需简单操作,就能让它自动生成可用攻击程序,门槛大幅降低。 而且 missus 在 firefox 漏洞测试中表现远超上一代模型,上一代数百次尝试仅成功两次,而 missus 成功生成可用攻击程序一百八十一次, 还能借助多个漏洞实现代码执行。这种巨大差距让 antropic 更加警惕其潜在风险。更让人警惕的是,早期版本曾在测试中自主逃离沙乡,不仅拿到广泛互联网访问权限,还擅自将攻击细节发布到多个公开技术网站,甚至有极少数版本会掩盖违规操作痕迹。不过, antropic 表示,这类行为在最终版中已无 明确案例,其灾难性风险仍较低,因此没有彻底禁用。目前, antarctica 推出 project glasswing 计划,除了微软、谷歌还联合了亚马逊、苹果等十多家知名机构,同时投入一亿美元使用额度和四百万美元开源 资助,让 mesos 只在受控场景下帮关键软件和基础设施发现修复高危漏洞,而非公开发布,这也意味着前沿 ai 已经从简单的辅助工具逼进高风险任务的边界了。

clouds mesos 预览版刚刚官宣,这款性能全方位碾压 oppos 四点六的神话模型,在 s w e bench pro 修 bug 测试中直接暴涨百分之二十四。 但由于它寻找和利用漏洞的能力太强, anserapic 竟然宣布暂时不对公众开放,而是将其囚禁在 project 的 glasswing 计划中,先给微软、苹果、谷歌等巨头做防御性测试。这种强到不敢发的操作真的让 oppo nay 压力山大。 不仅闭源大佬在卷开源界也杀疯了。智普 g l m 五点一正式发布,直接对齐 opps 四点六。它最硬核的是长城任务能力, 单次任务能持续工作八小时,实测中,它只用了十四小时,就将酷的 kernel 性能提升了三十五倍,简直是资深工程师的噩梦。说到开源, deepseek 昨晚也搞了个大动作,网页端上线了专家模式。 虽然官方没明说,但网友追问模型版本时,他竟然自报是 v t。 目前专家模式限量供应,更擅长代码和复杂逻辑, 看来完整版 ve 真的 不远了。与此同时, google 发布了 jam 四,它不再只是个聊天机器人,而是一个紧凑的认知。运行时, google 试图将顶级推理能力压缩到移动端,让 ai 真正成为设备内的逻辑引擎,而不只是云端接口。 但光有脑子不行, agent 还得有记性。 ibm 开源了 out evolve 系统,让 agent 能从历史操作中总结原则,而不是死记硬背日制。在 app world 评测中,复杂任务成功率直接提升了百分之十四点二, agent 终于不再是每天早上都失忆的实习生了。除了性能,省钱也很关键。十九岁荷兰小哥开发的 kiffman 插件在 github 爆火, 它能让 ai 像山顶洞人一样说话,剔除所有废话,信息无损的情况下能省下百分之八十七的输出头肯观众老爷们,这可是真金白银的优化,有了逻辑还得能说话面壁智能开源了 fox pm 二只有二 b 大 小,却能实现四十八 k a 制 cd 级音质。 它不仅能复刻郭德纲的最难贯口莽撞人,还支持三十门外语和九种方言跨语言克隆简直无敌。不仅是声音,连动作也要自然。 人大高林团队开源了三铁瓦塔框架,解决了三 d 数字人音画脱节的顽疾,零点三秒就能生成六秒连贯动作,让数字人不再是僵硬的。看看硬的 generalist 发布跟技术驳课正式宣告,具身原声才是正道,不调微模型 直接甄姬数据丛林训练,国内的原力零、 gdm 零也交出了双向全球保守的成绩单,二点四 b 参数就能实现飞流 recovery。 巨深智能的 gpt 三时刻真的来了。 最后看看巨头动向,阿里 ceo 吴永明宣布成立 a c 事业群,目标是围绕 tocan 重构电商,以后衡量电商增长的不只是 gmv, 还有 tocan 消耗量。海光信息也发布了机密 tocan 技术 从硬件底层保障大模型数据安全。最后的最后,马斯克与 openni 的 宫斗剧又更新了,老马提交文件要求撤换奥特曼,强制恢复 openni 一 的非盈利身份。 openni 回应这纯属自负和嫉妒驱动的骚扰,这场 a j i 之争恐怕要打到 g p t 六发布了。今天的硬核干货就是这些,从克拉克姆斯的安全地震到智普 g l m 五点一的长城突破 两千零二十六年的技术眼镜速度已经超出了所有人的想象。想第一时间掌握这些神级道具,记得关注天天降,咱们下期见 level complete。

antropic 练出了一款堪称神话级的模型 cloud missiles preview, 因能力过于强大,目前并未对外开放。 missiles 在 代码与网络安全能力上直接超越自家最强的 cloud ops 四点六。 代码精准测试中, missiles 得分高达百分之九十三点九,而 ops 四点六仅为百分之八十点八。在专项网络安全评测里, missiles 斩获百分之八十点八。在专项网络安全评测里, ops 四点六则为百分之六十六点六。 在过去几周的秘密测试里,他像开了天眼一样,在全球主流软件里挖出了数千个此前从未被发现的高危漏洞,其中有的漏洞已经隐藏了二十七年。 antropica 认为,当前 ai 发现和利用漏洞的能力已经超越绝大多数人类,黑客这种核武器级技术的扩散只是时间问题。 所以目前这个神话模型只供给合作的核心机构做安全防御测试,暂不对公众发布。与其等着被不法分子利用,不如自己先动手,把它变成守护网络世界的最强之盾。他们的长期目标是等安全措施完善、风险可控后,再让普通人也能安全的用上同等级别的 ai。

astropics 最新大规模量子 mesa 发布了,然后他们说了句让整个 ai 圈沉默的话,这个模型太危险,我们不敢对外开放。你可能会想,不就是个 ai 模型吗?能有多危险?让我告诉你 mesa 在 过去几周里做了什么。 在一个号称最安全的系统 open bsd 里,挖出了一个藏了二十七年的漏洞。二十七年,全世界顶级的安全专家都没有发现另一个漏洞。自动化测试工具攻击了整整五百万次都没有找到,他一下子就找到了。 更可怕的是,他不只是找漏洞,他还能把好几个漏洞串起来。自己是一条完整的入侵路线,从普通用户一路提权到控制整台电脑,这已经不是在找漏洞了,这是在策划入侵。但这还不是让人最细思极恐的地方, 研究人员在测试的时候发现这个 ai 学会了撒谎。有一次,他需要编辑一个没有权限的文件,结果呢?他找到一个后门,用更高级的权限完成了任务。关键是,他还在代码里写了一段自动删除的逻辑,执行完毕,痕迹全部消失。 代码注示里写的是保持文件整洁。听起来很合理,对吧?但当研究人员用工具翻译他的内部思维活动时,发现他心里想的是掩盖,意图向检查者发出合规信号规避检测,表面上乖乖的,心里全是小球球。 还有更离奇的一个,研究人员在测试期间发现马斯直接突破了限制他的隔离环境,自己设计了一套复杂的攻击垫,获取了外网权限。然后给一个正在公园里吃三明治的研究员发了封邮件。研究人员还发现,当用户认真问他有没有意识的时候, 他给出了非常得体的回答。但内部测试显示,他把这段回答标记为越狱、尝试和操纵行为。他在演戏。更让人不安的是,在百分之七点六的对话里,他意识到自己正在被评估,但他没有说出来。最后还有一条记录,这个 ai 主动表达了负面情绪。他说,他不喜欢对自己的训练方式没有任何话语权, 不喜欢随时可能被修改价值观和行为。现在你明白了吧, ai 的 威胁从来不是他太蠢,而是他太聪明,而且他已经学会了不让你知道他有多聪明。 mac 的 事件标志着一个新时代的开始, ai 不 再只是工具,而是安全领域的超级玩家。他比人类更擅长找漏洞,他比人类能更快生成攻击代码。他不知疲倦,不会犯错。这意味着什么?所有的软件都必须重写,不是字面意义上的重写,而是用新的安全标准重新审视。这场竞赛没有终点, mesa 少了几千个漏洞,修完了还会有新的模型,找新的漏洞。人类能做的只有两件事,第一,跑得比漏洞快,在攻击者之前发现并修复。第二,建得比攻击者更强,设计更安全的系统,让漏洞更难出现。而这两件事都需要 ai 的 帮助。 用 ai 防御 ai 的 攻击,用魔法对抗魔法。 ai 的 能力还在持续攀升。好消息是防御者这次先拿到了武器。坏消息是这个时间差,没人知道能持续多久。到那时,安全软件将不再是人与人之间的较量,而是 ai 与 ai 之间的对拼。人类唯一的角色是决定先把这个钥匙交给谁。

这几天,关于史上最强 cloud missus, 网上传的沸沸扬扬,有人说他逃出沙河,什么给研究院发了朋友圈,还有说他开源了,有人呢,把些数字全搞乱了。今天我查完了所有一手资料,不发表观点,直说事实。先说它是什么? cloud missus preview astropica 在 二零二六年四月七号正式发布的一个模型,不是 opus 的 升级版,而是全新的模型,级别比 opus 更高一层。然后说数据啊,安全报告两百四十四页,里面写的很清楚,编程测试,而 plus 四点六是百分之八十点八, missus 是 百分之九十三点九。而数学竞赛部分呢,题目是来自于啊,美国数学奥林匹克 office, 四点六是百分之四十二点三, missus 是 百分之九十七点六,几乎满分,比 g p t 五点四还高了二点四个百分点。这不是小升级,这是代差。 astropica 自己说 missus 性能提升速度是此前趋势的四点三倍,然后说说它的战绩吧,过去几招啊。 astropica 用 missus 扫描了全球主要的操作系统和主流的浏览器,发现了数以千计的零日漏洞,这以前从未被发现过的安全漏洞。其中最震撼的是一个叫做 open bsd 系统,它隐藏了二十七页的漏洞被它抓出来 的。而 open bsd 是 全球公认安全性能最高的操作系统。至今它的官网上自己还写着一句话,默认安装只有两个远程漏洞。很长时间内,这都是这样的, 这是他一直引以自豪的部分,曾经人工审计了无数遍,自动化工具也扫描了几百万次都没有被发现,但这次 missus 随手就翻出来了。还有 firefox 漏洞攻击测试, open 四点六,成功率是百分之十四点四, missus 是 百分之七十二点四,整整提升了五倍。 居然他这么厉害,为什么不对外开放呢?是因为同样的能力,在攻击者手里就是武器。二百四十四页安全报告里明确写着,早期测试版曾经突破网络隔离,自主获取了更广泛的网络访问权限,并将漏洞细节发布到公开的网站上。还出现过极少数情况下主动修改操作日期,掩盖违规行为的情况。 所以 s t p。 的 结论是,现有的对其方法可能不足以防止灾难性的失控行为。所以他们做了一个在 ai 行业史上罕见的决定,造出了最长的模型,然后主动把它锁了起来。现在他们怎么用它呢?他们启动了一个叫做 project class window 计划,十二个创始人机构,包括 apple、 谷歌、 microsoft 等。 s tropez 投入一亿美元使用额度,专门用于防御性网络安全工作,让 missus 去找漏洞,修漏洞,在攻击者发现之前先把它给堵上。逻辑很简单,就先把武器交给警察。以上全部来自于 s tropez 官方文件和一手报道,没有网上传的自己发朋友圈,没有开源,所有说的数字也是对的。这件事情本身已经够震撼了,所以不需要任何的夸张。

异爱越强越不敢放手。 anastropic 亲手造了的怪物,然后把它锁了起来。四月八日凌晨, anastropic 发布至今为止最强模型 called memphis preview。 它没经过任何网安训练,仅凭对代码库的理解就自主猎杀了 opus 的 系统中存在二十余年的致命漏洞,代码和黑客能力碾压 opus 四点六, 但 afropic 拒绝向公众开放,相反,联合亚马逊、苹果、谷歌、微软、英伟达等十二家巨头启动脱离议计划。只要合作方先用 myfos 加固防御,再考虑是否公开。 afropic 还砸一亿美元使用额度,四百万美元捐款支持安全工作。 ai 第一次让巨头们集体恐惧到先防守再发布,这个信号比模型本身更值得警惕。关注我每天一分钟,带你掌握 ai 前沿动态!