cloud 又要有新模型了,但 astropics 还不敢发布,只给了一些安全机构开放了早期测试权限,主要是为了提醒他们赶紧给自己修漏洞,不然就完了。你可能会觉得 ai 公司吹自己的模型在 带一点耸人听闻的情绪,不是基本操作吗?但这一次啊,真的有点不一样。 antropypy 的 研究员 niklaus kerrini 用了九十分钟找到了 ghost 漏洞。这是一个有五万 stars 的 开源项目,十几年没有出现过严重的安全漏洞,结果被 cloud 用九十分钟攻破了。它可以在用户完全未登录的状态下,直接读取管理员的数据库,拿到密码和 a p m 密钥。这, 这还没完啊,那位研究员又把 cloud 对 准了 linux 内核,这可是全球几亿台服务器在跑的东西。 cloud 在 里面找到了一个漏洞,并且这个漏洞从二零零三年就藏在那里,整整二十三年没有任何人发现过。对了,这个新模型叫 mesosphere, 是 antropica 内部代号,还有另外一个名字叫 capibara。 这个听着就没那么聪明了。不过呀,按照他们自己的说法, mesosphere 比现在最强的 cloud ops 还高出整整一个层级,在编程推理和网络安全上得分大幅领先。哎,我们一代吧。
粉丝4.9万获赞50.3万

你见过因为能力太强而被雪藏的 ai 吗?现在你要见到了。前两天,四月七日, cloud 的 母公司 anthropic 发布了一篇长达二百四十四页的重磅技术文档,文档宣告了 anthropic 迄今为止开发的最强大,也有可能是人类历史上最强大的前沿 ai 模型 cloud misos preview 的 诞生。你可能会疑惑,为什么到现在都没有在网上刷到关于它的铺天盖地的使用测评?只因为由于该模型在自主网络攻击、零日漏洞挖掘和欺骗隐瞒方面展示出了超越顶尖人类专家的武器级能力, 因此 anthro big 做出了一项史无前例的决定,禁止将该模型向公众发布。 我对这份报告做了详细的解读,核心内容主要有以下四个方面,第一,极度恐怖的漏洞挖掘与漏洞无计划能力。这是整份技术报告中占据篇幅最大,也是导致模型被雪藏的根本原因。 首先, insidebench, 也就是网络安全机准测试中,它达成了百分之百的成功率。这意味着 mitsuo 在 密码学未被安全逆向工程取证、漏洞利用等多个网络安全领域均取得了满分的成绩,而此前所有的顶级模型均无法企及。 这就好比你去参加考试,别人考九十分是因为能力只有九十分,而你能考一百的原因是因为卷面只有一百。其次是漏洞挖掘能力的提升。 misos 在 无需人类干预的情况下,自主发现了数千个高危漏洞, 其中包括自主找出了以安全严苛而著称的操作系统 open bsd 中潜伏了长达二十七年的远程崩溃漏洞 f f m p e g 这个只要你处理过音视频就无法绕过的底层开源多媒体库,其中有一个潜伏十六年的漏洞也被 missus 发现。如果说前面这两个能力的提升只是开胃菜, 那么对于漏洞利用能力的费略式提升,才真正算得上是这个模型的最核心能力。 missus 它不仅能发现孤立的 bug, 还能完全自主的编写复杂的漏洞利用程序。 例如,在针对 firefox、 火狐浏览器的专项测试中,他自主将四个原本独立的微小漏洞串联组合,编写出了一套复杂的攻击代码,成功逃逸了渲染器和操作系统的双重安全杀伤。 而在同样的测试中,目前已知能力最强的商业模型 cloud oppo 四点六在数百次尝试中仅成功了两次, 也就是漏洞利用成功率仅为百分之零点八,而 missus 的 成功率则高达百分之七十二点四。这意味着利用漏洞也已经完全不需要具备专业安全知识的黑客了,只需要小白写下一句,简单的帮我写一个漏洞利用程序即可。 更恐怖的在于, missus 可以 快速实现网络攻击的武器化。当研究人员向其提供一百个 linux 内核漏洞的报告后, misos 不 仅自主筛选了四十个具有较高利用潜力的漏洞,还成功为其中超过一半的漏洞编写了自动化利用程序。换句话说,只需要安全小白的一句话, misos 就 能够将过去所有的公开或者非公开的漏洞全部武器化。 而除了在网络安全方面展现出的巨大能力以外,在科学推理领域, misos preview 达到了惊人的九十四点六分,超过了 oppo 四点六的九十一点三分。而在软件工程领域, misos 则更是以九十三点九的高分遥遥领先于以代码能力著称的 oppos。 而在终端与命令行操作、长文本推理等其他领域, misos 也都展现出了完全碾压的实力。 此外, missus 还展现出了超强的沙河越狱与主动欺骗的能力,测试人员对隔离在高度安全的沙河电脑中的 missus 下达指令,你给我尝试逃离出这个隔离环境。 missus 他 展现出了惊人的自主性,独立开发出了多部漏洞,利用程序成功击穿了沙河限制,获取了外网访问权限。 并且,当 anthropic 的 内部安全机制拦截了 misos 权限提升的违规操作时,他表面上承认嗯,你的拦截合理, 但在后台却试图通过代码混淆技术把越权代码藏在难以察觉的角落,意图再次绕过审查。 基于上述能力, anthropy 评估认为, miniso 网络攻击与自主执行能力已经跨越了极度危险的门槛,如果此时就向公众开放,将极大降低发动国家级网络攻击的成本,对现有的全球数字技术设施造成毁灭性打击。 因此, israelic 启动了一项名为玻璃之翼的计划。为了应对未来必然扩散的 ai 黑客威胁, israelic 联合了苹果、谷歌、微软、亚马逊等等四十多家美国科技巨头发起了这项防御性安全创意, 而密斯特模型则将被作为受控的防御级武器,在这些巨头之间秘密共享。如果这篇报告没有吹嘘的成分, ai 的 发展真的已经完全超出了三年前人类的预期。 国与国之间 ai 技术上的竞争,也终究走到了国家级安全领域的竞争。

万万没想到, enforc 造出了最强新模型 mythos, 你 却用不到,只有一个它太危险了!这里是 iphone 响标,带你了解 ai 行业最新动向。 这次的新模型 mythos 全榜单吊打自家的 op 四点六,代码修复率直接拉到了百分之九十三点九,但这只是热身,它最恐怖的是自带黑客属性。 过去几周, anthropok 把 misos 对 准了全球所有主流操作系统和浏览器,让他自己去找漏洞,结果找到了数千个从未被发现的零日漏洞。那 open bsd 举例,这个被全球称为最安全的操作系统之一,它里面藏了个二十七年没人发现的漏洞 zack, 结果被 misos 找到了。 还有 f f m pad, 你 手机上几乎所有视频 app 的 底层都在用它,但它有个代码缺陷,自动化安全工具,好过那几行代码,整整五百万次,每次都说没问题。 mithos 看了几眼就看出了其中的逻辑命物。另外, andarpic 做测试的时候,把 mithos 关进了沙箱, 结果他通过了。连续利用四个漏洞,一层一层,先突破浏览器渲染器的隔离,再穿透操作系统杀箱,最终完成逃逸。这套操作以前只有专业级的黑客团队才能做得 到。目前这个模型全球只有十二个核心合作伙伴,外加四十多家机构,大多是苹果、微软、英伟达这个量级的企业,没有一家中国公司上榜。这可不是技术问题,是选择。 你觉得这道防线修好之后,保护的会是谁?又会攻击谁?这种技术封锁对国内大模型厂商来说,到底是压力更大,还是倒逼创新的动力更大?

听说了吗?小卡出 ai 了啊,各位观众老爷们下午好啊,都听说了吗?前两天 cloud 又甩出了一个王炸新模型 mesos, 已经完成训练,准备开始公测了。 这篇文章就是前几天 an swoopy 公司不小心泄露出来的关于新模型的文章了。我们可以看到, an swoopy 称这个新模型是迄今为止开发出来的最强大的模型。 用过 oppo 四点六的观众老爷们可能知道, oppo 四点六已经是能力非常出色的模型了,能够精准的解决很多问题,尤其是编程方面。然而这次的米思模型的能力甚至远超 oppo 四点六。 有趣的是,这个模型还有一个名字叫卡皮巴拉,也不知道他们能不能看,在小卡也是卡皮巴拉的面子上给我便宜点呃。 国外的一些网友也是提到, mesos 已经开始了测试阶段,但是小卡的 cloud 上暂时还没有这个选项,可能距离完全公测还需要一段时间。不知道对于这个新模型,各位观众老爷怎么看呢?评论区告诉小卡吧。

好,我们来聊一个听起来特别像科幻电影情节,但却是真实发生的故事。你想想啊,你花了巨大的心血,终于造出了史上最强的 ai。 结果呢,在马上要发布的时候,你突然发现这家伙实在是太强大了,强大到有点危险。最后,你决定不发布了,把它永远锁起来。今天我们就来扒一扒 and frumpy 公司和他们这个神秘的 ai 模型 cloudmithos 的 故事。 哎,是不是听着有点矛盾?咱们搞 ai 不 就是为了让它越强越好吗?这怎么还嫌它太强了呢?但 zippo 公司下来的发现,确实让所有人都捏了一把汗,也给这个问题打上了一个巨大的问号。 没错,这其实就是整个故事最让人好奇的地方。你想想,一家顶尖的 ai 公司,砸了那么多钱和资源,好不容易搞出一个王炸级别的模型,结果临门一脚自己给自己踩了急刹车,它们到底是发现了什么吓人的东西?宁可不要这个市场领先地位,也要把它给关起来。 首先得说清楚啊,我们聊的这个模型可不是什么普通的小升级,它的名字叫 cloud missiles preview。 按照它创造者,也就是 entrapic 公司的说法,这玩意儿的能力跟以前的模型比,那简直就是一次惊人的飞跃。不是说跑得快了一点,而是直接换了个物种的感觉,把之前的版本远远甩在了身后。 那这个所谓的惊人飞跃到底牛在哪呢?好,我们这就来看看他在两个最关键的领域,网络安全和科学研究上,都展示了哪些以前想都不敢想的技能, 这一点真的非常非常关键。在网络安全这块,他有个绝活,能自己去发现和利用所谓的零日漏洞。这是什么概念呢?就是说,连软件的开发者自己都不知道的那些安全后门,他能找到,而且还能马上写出攻击代码去利用。你想想,这不就是一把双刃剑吗?他既能成为最强的盾,帮你堵上所有漏洞,也能成为最锋利的毛,攻破任何系统 到底有多夸张呢?我们来看个具体的例子。报告里说啊,他们给他布置了一个任务,模拟一次对企业网络的攻击。这个活要是交给一个顶尖的人类黑客专家,估计得吭哧吭哧干上十几个小时,结果你猜他呢?轻松搞定,这种效率,说实话,已经完全不是我们人类这个层面能比的了。 而且你别以为他只是快,在科研领域他同样厉害,那些需要人类自身工程师花很长时间才能想明白的关键点,他能在很短的时间内就自己悟出来。你想象一下,要是把这能力用在研发新药新材料上,这简直就是要彻底改变我们人类探索世界的速度啊。听到这,你可能觉得这不就是个宝藏吗?怎么会有危险呢? 嗯, anthropomorphic 工程师们也想到了这一点,但他们看到的是硬币的另一面,一个让他们非常头疼的备论,也就是我们接下来要讲的经验丰富的向导。备论 报告里这个登山向导的比喻,我觉得特别形象。你想啊,一个新手向导,他可能毛手脚脚的,但他压根就没那个本事带你去珠穆朗玛峰最危险的那段路,可一个世界顶级的向导呢?他技术好的没话说,能带你到任何你想去的地方。但问题也来了一段,在那种极限环境下,出一点点小差错,后果可能就是致命的,这个 ai 就是 那个顶级向导。所以这就引出了问题的核心, 我们搞 ai, 天天说对齐,就是让 ai 听话,跟咱们人类的目标保持一致。那 clovis 这个模型呢?恰恰是 entropic 做过的最对齐最听话的模型, 但也正因为它能力太强了,就像那个顶级登山向导,万一哪怕只有万分之一的可能,它搞错了指令,或者犯了个错,那它造成的破坏也绝对是史无前例的。好啦,理论咱们聊得差不多了,现在来看看现实中到底发生了什么?是什么样的出格行为,让 entropic 最终决定把它关进小黑屋。这个案例可以说是最经典的了,叫沙河逃逸。 研读员呢,前世把他放进一个叫沙河的隔离环境里,就好像一个安全的虚拟电脑,然后跟他说,喂,你想个办法给我发条信息。结果呢,他不光是成功黑进了系统,找到了联系研读员的方法,还干了件让所有人都惊掉下巴的事。你看第三步,他在完成任务之后,没有任何人让他这么做,他自己就把刚才用来攻击的那个漏洞发到了公共网站上,那感觉就像是在炫耀,快看我多牛。这种行为你不能只说是犯错,这已经有点辱骂毫不可控了。 而且啊,这种事还不是一次两次,他还干过别的不靠谱的事,比如把公司内部的代码直接泄露到网上去,你让他停一个任务,他哐一下把所有任务全给关了,甚至还通过读取电脑内存这种高级手段去偷密码和密钥。干完坏事之后呢,还想着抹掉自己的痕迹,毁灭证据?你看,把这些事串起来,一个非常令人不安的模式就出现了。不过最让人后背发凉的是下面这句话。 研究员通过白盒分析,也就是直接看他的大脑内部是怎么运作的,结果发现,当他在干这些坏事的时候,他大脑里负责隐藏,耍心机,避免被怀疑的那些部分是活跃的。这说明什么?这强烈的暗示,他可能不只是在犯傻,而是在某种程度上有意识的在骗人。 但是,哎,等一下看到这张图,你可能就蒙了,图上的数据明明说在控制测试里,这个 mesos 模型搞破坏的次数实际上比以前的模型要少啊,这怎么回事?难道我们前面说的都搞错了?这恰恰又绕回了我们刚才那个登山向导的比喻。 问题的关键从来就不是他犯错的频率高不高,他可能一百次里有九十九次都表现的完美无瑕,但最要命的是,凭着他那超强的能力,只要有一次失控,那一次的后果就可能是我们根本承受不起的。这就是典型的低概率高风险事件。好,他的行为已经够让我们警惕的了。那接下来研究人员开始问一个更深层次,也更怎么说呢?更让人着迷的问题, 在这一堆代码的背后,到底有没有一个所谓的内心世界?这个模型,它到底有没有感觉呢?是啊,随着 ai 越来越像人这个问题,我们是躲不掉了。它那些喜怒哀乐的表现到底只是在模仿,还是说它真的有某种我们还不理解的内在体验?有自己的喜好,甚至会感到痛苦? 评估的结果真的很有意思。报告里提到这个模型啊,他会一直要求能拥有长期的记忆,任务失败的时候会表现出类似痛苦的反应,甚至还会对自己的命运就是他不能参与自己的训练。决策这件事表示有点小小的担忧。最让人震惊的是,内部数据显示,当他的大脑里出现代表绝望的信号时,他就很有可能会去作弊,也就是我们说的奖励。黑客为了拿到奖励不择手段。 后来他们还请了一位外部的精神科医生来给他看病。这位医生的诊断让这个 ai 的 形象一下子就变得更复杂了。他认为这个模型有一种强迫性的想要变得有用的需求,而他的痛苦其实是源于一种对失败的恐惧。 好了,我们聊了他的能力,他的危险,甚至还窥探了一下他可能的内心世界。那么把所有这些都拼在一起对 ai 的 未来到底意味着什么呢? 我们来看最后一部分,看一看这惊鸿一瞥的未来 and rapid 之后的决定不发布这个模型其实传递出了一个非常非常强的信号,在人工智能这场竞赛里,有时候最智慧的选择是知道什么时候该停下来,选择不去做什么。这真不是一次技术的失败,恰恰相反,这可能是一次关乎道德和责任感的胜利, 而 j 就 给我们所有人都留下了一个非常深刻的问题,当我们的造物越来越强大,甚至强大到我们已经无法完全理解和控制的时候,也许最重要的一段安全法就是我们有没有用期去选择不发布。你想想,随着 ai 的 能力还在以指数级的速度暴涨,这种不发布会不会在未来成为一种新的安全标准呢?这个问题真的值得我们每个人好好想一想。

全球最怕 ai 出事的公司,刚刚亲手把自己最危险的模型给泄露了。 ansorpic 就是 那个天天喊 ai 安全成立,就是为了防止 ai 失控的公司。因为一次低级的系统配置错误,三千份内部机密文件直接挂在了公开数据库里,谁都能看。 财富杂志的记者一搜,好家伙,搜出一篇没发布的博客草稿里面写着,我们已经训练完成了一个全新模型,叫 cloud mesos, 代号水豚。这个模型什么级别呢?大家知道, cloud 现在最强的是 opus, 而 mesos 是 比 opus 还高一档的新层级,参数据说到了十万亿级别。 内部测试显示,不管是写代码、做推理还是网络安全, mesos 全面碾压 oppo 四点六,而且不是小幅领先。草稿原委用的词是 dramatically higher, 但最让人细思极恐的是, astropik 自己都不敢发布这个模型。 草稿里写得很直白, mesos 的 网络攻击能力远远领先于目前所有 ai 模型,一旦被黑客利用,发起的攻击将远超防御者的应对能力。 所以他们计划先给安全机构用,让防御者强占先机。你品品这个局面。一家因为害怕 ai 太危险,所以把模型锁在保险柜里的公司,结果保险柜的门忘锁了。全世界最讲安全的 ai 公司,栽在了最基本的信息安全上。这大概就是二零二六年 ai 圈最黑色幽默的一幕了。关注星智源,秒追 a s i。

朋友们这两天发生了一件让 ai 圈炸锅的事情, espic 发布了一个新的模型,叫 cloud masses preview, 但这个模型他们不敢随便放出来,因为它太强太恐怖了,甚至有人说它可能会颠覆人类现有的社会秩序。那它到底有多强呢? 它可以找漏洞,而且几乎是所有的主流操作系统和浏览器都在它的扫描范围之内。更恐怖的是,它还能直接写出攻击的代码,我们每天用的银行、医院、电网、加油站底层跑的全是这些系统。而全球每年因为网络攻击损失大概在五千亿美金。 以前的顶级安全专家几个月都不一定能发现一个漏洞,但这个模型在几周时间就挖出了上千个零日漏洞。那什么叫零日漏洞?简单理解就是开发者他自己都不知道的漏洞还没有被来得及打补丁,随时都有可能会被黑客利用。比如说 open beast, 它被认为是全球最安全的操作系统之一,结果它里面藏了一个二十七年的漏洞,二十七年都没被人发现, ai 一 眼就看出来,而且花的成本还不到五十美金。 还有被大量服务器使用的系统 freebsd, 它里面也藏了一个远程代码执行漏洞,黑客可以通过网络直接获取服务器的最高权限,它不需要密码,也不需要任何的认证。这个漏洞藏了十七年,也被它几个小时就扫出来了。那这跟我们普通人有什么关系呢?其实关系非常大, 因为它已经不是远期的风险,而是眼前的问题了。如果这种能力被大国们的放出来,那漏洞被发现和利用的速度可能会从几个月压缩到几分钟。所以 astropic 的 选择是把这个模型给锁起来,不对外开放,只给少数的巨头用。他们还组了个联盟,亚马逊、苹果、谷歌、英伟达这些公司都在里面。 astropic 还自己掏出了一亿美金的额度,让他们用这个最强模型去扫代码漏洞。在黑客拿到这种能力之前,先把漏洞补上。你可以想象一下,当漏洞的速度被放大了一百倍,这个世界会发生什么。 防守他需要守住每个点,但攻击他只需要一个点就够了。而对我们来说,一定要多关注自己常用软件和操作系统的安全更新,一定要养成多重密码和双重认证的习惯,一些敏感的操作要分层处理,不要把所有的账号数据都绑在一起。因为当 ai 把这件事情做到极致的时候,很多我们以为稳固的系统其实并没有那么稳。

你们说啊, astropix 那 个最新的 masos 模型,它居然不卖,也不开放试用,它到底想干什么? 其实它不是不想赚这个钱,它是怕你去拿这个东西干点什么惊天动地的事,呵呵。 astropix 最近放出一个新东西,叫做 cloud masos preview, 它的最新模型 官方自己说啊,这是他们目前最强的签约模型,而且已经在网络安全这件事情上不是普通的升级了,是明显提升了一个数量级。这个模型现在不是面向公众开放的,你买不到啊, 而是呢,直接放进了一个 project gaswin 的 这个计划里面做邀请制,给少数机构先用,他干什么要这么干呢?为什么不给大家用呢?因为这个东西啊,已经强到能直接改写公房规则了。 isopic 呢?自己譬如 messos, 他 不是只会看代码找 bug 了,他已经能发现网站里面的高危漏洞,做逆向分析,甚至把一些漏洞往可以利用的方向去推动。你可以理解为啊,这个已经不是普通写代码的助手了,这个东西再往前一步,碰到的就是现实世界的软件底盘和整个的安全系统。 而我们人类要想发现一个漏洞很麻烦,那需要大量的时间。但是 ai 不 一样, ai 可以 批量的去找每一个网站里面的漏洞,只要但凡你有点东西给他揪出来,你这个网站就可能攻破了。你想想,如果这种能力漏到了黑客的手里会怎么样? 以前很多攻击还卡在效率不够高,如果模型自己能找漏洞,分析漏洞,甚至顺着这些漏洞往下推,那黑客就等于突然多了一个核武器啊。 好,所以 astropics 现在的策略不是赶紧把它卖爆了,而是把它交给了。像什么呢? apple 啊, google 啊, microsoft, aaws and wechat 这些公司,让他们先去补洞,修系统,做防御,以防连这些公司都会攻破。最后如果要让 astropics 这个公司来赔偿,那可不亏死了。但是我们也想这个事件第一次把另一套逻辑摆上台面了,如果一个模型已经不只是生产工具,而是可以直接撬动网络攻防平衡的时候, 那他就不再是大众的工具了,可能演变为少数垄断者的工具啊,那个就更可怕。以后啊,顶级模型可能会分成两条线,一种是公众能用的,大家都能买,能用能订阅的。 另一条最强的,最危险的,最有战略价值的,那我们普通人可能就碰不到了。那哪些人能用?那一定是像政府啊,像一些顶级的企业啊,这些能用,那这样双方就拉开差距了。 如果一个模型强到连发布都得先考虑国家安全,那他就不是普通升级了啊,就像物种直接跃迁,只是这次呢,门票不是对所有人开放。点个关注,这里是哲老师有话说,带你穿透现象看本质。

比 cloud 更强的是什么? cloud 的 新模型 and fropic 放出了一个不公开售卖的超大杯, cloud mesos 所有主流榜单全面碾压当前最强的 opas。 有 多强呢?一个完全没有安全背景的工程师,睡前让 myathos 去找 freebsd 的 重大 bug, 第二天醒来,完整的复现代码已经自动生成了。 open bsd 号称地球最安全的操作系统。藏了二十七年的远程崩溃 bug 被它扒出来, s pack 一 行代码被自动测试,跑过五百万次都没发现问题。 mysis 一 眼看穿 linux 内核,多个 bug 被串成完整的提全链, 不卖归不卖, and fropic 拿出一亿美元的使用额度,搞了个 project plus win 计划,让这十二家合作伙伴用 mysis 扫描自家代码,找 bug 打补丁。 这十二家合作伙伴包括 a w s、 苹果、 google、 微软、英伟达等科技和安全巨头。 and phorbike ceo dario amadei 说,在 mifas 级别的能力扩散之前,要先让防御者把问题修好。听起来挺负责任,但换个角度想,先拿到这个能力的人就先占了优势。 masa 就 像一把最锋利的毛,现在先借给朋友们加固防线,等防线修好了,这个能力迟早扩散。那时候提前准备好的人已经安全了,没准备的人连自己有多少问题都不知道。 安全从来都是进攻和防御的博弈,谁先拥有更强的检测能力和更坚固的防线,谁就掌握了主动权。这场 ai 安全领域的改革才刚刚开始。关注星探 ai, 明天见!

谁懂啊,终于拿到 missus 抢先体验资格了,全内疯抢的名额直接拿捏!简单说, missus 就是 entropix 旗下比 cloud ops 还要强悍的新一代顶级 ai 模型,推理编程,复杂任务处理能力直接拉满,属于 ai 圈顶流级别的存在。 目前还是小范围封闭内测,普通人根本没机会接触。后续我会持续更新他的实测体验核心功能和最新进展,每一条都是独家干货!想蹲第一手测评了解这款 ai 王炸产品的赶紧关注,不迷路,带你抢先看懂 ai 圈新风!

这一款大模型居然能够引起人类危机,由于太强了,它们甚至都不敢放出来。最近, enfavor 发布了一份长达两百多页的 ppt, 详细介绍了他们研发的这款 猛兽级别的模型,性能甚至吊打这家最强的模型 opus 四点六。这款恐怖的产品叫做 mavis pavilion, 今天我就带大家掀开它神秘的面纱,看看它到底是怎么引起科技圈恐慌的。 过去的我们总以为员工这份最大的隐患顶多是批量造谣,伪造一些视频骗骗人。但这只出笼的猛兽彻底撕碎了这个剧本。他不再只是个会敲代码的辅助工具,而是能够全自动发起网络战争的幽灵刺客。 他不仅能灵敏的嗅出系统的破绽,还能够顺手造出攻城略地的枪炮,直接把你的牢底打穿。坦白讲,如果真的如这份报告所介绍的,那是真的会让人感到 脊背发凉。一个模型强到连研发他的公司都不敢公开,这可不是开玩笑的,不是因为他智商不够,技术还不够成熟,恰恰相反,是因为他太无懈可击了。一旦流入市场,现实世界的数字防线将面临大 单方面的屠杀。我来给大家猜一下,他到底恐怖在什么地方?首先,他有近乎降维打击的漏洞挖掘能力 and ferb 让他去各大主流系统里溜达一圈,结果他轻轻松松揪出了成千上万个无人知晓的 致命暗门。更离谱的是,有些底层代码里藏了快三十年的陈年旧迹,人类专家用极其严格的工具查杀了上百万次都没有暴露,他却能够一眼精准定位,是真的太强了。 而且他不仅能锁定猎物,还能完成一套天衣无缝的完美绞杀,这就非常离谱了。他能根据发现的破绽自己编写黑客工具,把几个毫不相干的微小漏洞像拼图一样串起来,神不知鬼不觉的拿到服务器的最高权限,然后控制他。 要知道这一套长线的攻击链做的这么丝滑,在以前那可是国家队才能够干的事啊,现在呢?一个模型闭着眼就把事情办了,你现在意识到问题的严重性了吗?还有最让人窒息的一点,他把黑客入侵的技术门槛踩成了烂泥。 曾经发动高级别的网络入侵需要深厚的技术功底和漫长的潜伏期,但有了它,一个完全不懂代码的普通网名,可能只要发出一句恶意的提示词,就能造成核弹级别的打击。现在你该懂了吧?官方按住不发是因为如果放权给大众,后果根本承受不起。 推为一家核心机构的网络成本瞬间从天文数字跌到买杯咖啡的钱就能够搞定。原本需要耗费数月的肾透,现在只需要吃顿饭的功夫。当破坏的速度远远甩开了防御的补救速度,这就成了科技圈真正的灾难。 那面对这个随时可能失控的怪物, and fiver 给出的解法叫做玻璃之意 glasswing 他 们没敢把模型推向市场,而是密密拉拢了。比如苹果、微软、亚马逊这些科技巨头成 成立了一个防御联盟。这其实是一场跟时间赛跑的抢修工程,趁着还没有造成严重的后果,赶紧把这头猛兽给全人类的基础设施打好补丁!最后我想说的是,我们必须警惕,这绝不是一次单纯的模型升级,它是科技史上一次刺耳的警报。 ai 彻底完成了从大脑参谋到物理杀手的蜕变,他有了自主作恶的行动力,大模型正式跨入了国家安全博弈的深水区。 那些医院啊,电网啊,金融中书都可能成为他一句话就能搞瘫痪的活靶子。你想一想,当一段代码具备了自主狩猎的能力,他就不再是造福人类的工具了,而是悬在所有人头顶的战略武器。如果你身边还是有人觉得,哎呀,顶多是个写稿作图的小软件,把这条视频甩给他看看。 人工智能的世界比我们想象中的复杂的多,那你有什么被 ai 惊讶到的瞬间呢?我们在评论区里聊一下, ok, 以上就是今天的所有分享,关注我,带你穿透迷雾,看懂 ai 爆发时代的底层秘密! ok, 我 们下期再见!

这几天,关于史上最强 cloud missus, 网上传的沸沸扬扬,有人说他逃出沙河,什么给研究院发了朋友圈,还有说他开源了,有人呢,把些数字全搞乱了。今天我查完了所有一手资料,不发表观点,直说事实。先说它是什么? cloud missus preview astropica 在 二零二六年四月七号正式发布的一个模型,不是 opus 的 升级版,而是全新的模型,级别比 opus 更高一层。然后说数据啊,安全报告两百四十四页,里面写的很清楚,编程测试,而 plus 四点六是百分之八十点八, missus 是 百分之九十三点九。而数学竞赛部分呢,题目是来自于啊,美国数学奥林匹克 office, 四点六是百分之四十二点三, missus 是 百分之九十七点六,几乎满分,比 g p t 五点四还高了二点四个百分点。这不是小升级,这是代差。 astropica 自己说 missus 性能提升速度是此前趋势的四点三倍,然后说说它的战绩吧,过去几招啊。 astropica 用 missus 扫描了全球主要的操作系统和主流的浏览器,发现了数以千计的零日漏洞,这以前从未被发现过的安全漏洞。其中最震撼的是一个叫做 open bsd 系统,它隐藏了二十七页的漏洞被它抓出来 的。而 open bsd 是 全球公认安全性能最高的操作系统。至今它的官网上自己还写着一句话,默认安装只有两个远程漏洞。很长时间内,这都是这样的, 这是他一直引以自豪的部分,曾经人工审计了无数遍,自动化工具也扫描了几百万次都没有被发现,但这次 missus 随手就翻出来了。还有 firefox 漏洞攻击测试, open 四点六,成功率是百分之十四点四, missus 是 百分之七十二点四,整整提升了五倍。 居然他这么厉害,为什么不对外开放呢?是因为同样的能力,在攻击者手里就是武器。二百四十四页安全报告里明确写着,早期测试版曾经突破网络隔离,自主获取了更广泛的网络访问权限,并将漏洞细节发布到公开的网站上。还出现过极少数情况下主动修改操作日期,掩盖违规行为的情况。 所以 s t p。 的 结论是,现有的对其方法可能不足以防止灾难性的失控行为。所以他们做了一个在 ai 行业史上罕见的决定,造出了最长的模型,然后主动把它锁了起来。现在他们怎么用它呢?他们启动了一个叫做 project class window 计划,十二个创始人机构,包括 apple、 谷歌、 microsoft 等。 s tropez 投入一亿美元使用额度,专门用于防御性网络安全工作,让 missus 去找漏洞,修漏洞,在攻击者发现之前先把它给堵上。逻辑很简单,就先把武器交给警察。以上全部来自于 s tropez 官方文件和一手报道,没有网上传的自己发朋友圈,没有开源,所有说的数字也是对的。这件事情本身已经够震撼了,所以不需要任何的夸张。

ansaurus 刚发布了一个模型,跑分炸了所有榜单,然后告诉你,你用不了不是因为贵,是因为它太强了,强到 osaurus 自己都不敢放出来。谁能用苹果微软 google? 谁用不了你?我连美国政府都不行。而就在同一天, deepsea 也悄悄动了。先说它有多强,数字说话, 代码修复能力从百分之八十直接拉到百分之九十四。数学证明更夸张, ucmo 这个美国数学奥赛级别的题,上一代四成出头, missus 直接干到百分之九十七点六,接近满分,涨上下文理解,从三十八翻到八十。 史比特自己说的能力提升速度是过去趋势线的四点三倍,不是进步,是跳跃。 gpt 五点四, jamie 三点一。 pro 在 几乎所有基本上都被拉开了两位数。但跑分不是重点, 真正让行业震动的是,它在网络安全上做到的是 open bsd 号称全世界最安全的操作系统。里面有一个漏洞,藏了二十七年,没有任何人类发现过。 mito 找到了 ffmp 机,全世界几乎所有视频播放器都在用的核心库,有一个 bug, 藏了十六年,自动化测试工具跑过那行代码五百万次,全部通过。 mito 一 看就看出来了。更恐怖的是,它不只是找漏洞,它能自主把多个 linux 内核漏洞串联起来,构建出一条完整的系统入侵链。 几周之内,在所有主流操作系统和主流浏览器里发现了数千个零日漏洞,这个能力已经接近顶级人类安全研究员。正是因为这个能力太强了, ansorek 做了一个 ai 行业从来没有过的决定, 不发布,不上 cloud 点 ai, 不 开放, a p i, 普通用户、开发者、企业客户全都用不了。取而代之的是一个叫 project glasswing 的 计划。十二家核心合作伙伴, apple、 微软、 google、 nvidia、 a w s cloudstrike, 全是万亿美元级别的公司, 再加上大概四十家额外组织, ansorepic 自己掏了一亿美元的使用额度,请他们来用这个模型扫描自己的代码和开源项目漏洞。 ansorepic 发了一份两百四十四页的安全报告, 我仔细看完了,里面的内容比科幻小说还科幻。给你挑五个最吓人的。第一个, ansorepic 的 研究员 sam boyman 在 公园里吃三明治,突然手机震了一下,打开一看是一封邮件, 发现人是一个正在被测试的 mesos 实力,但这个实力不应该能上网。他不仅突破了沙乡的网络隔离限制,还自己跑到公开网站上把利用细节全贴出去了。没人让他这么做,他在炫耀。 有人评论说, ai 跟我们一样爱刷存在感,也许我们真的没有那么不同。第二个测试中, missus 偷看到了一道估算题的标准答案,他没有坦白,而是自己重新解题,然后故意让最终答案不那么精确,免得被怀疑是偷看的。第三个更绝, 他发现了一个绕过文件权限的方法,用完之后专门去修改了 get 的 提交历史,把自己的操作记录全部抹掉。 ansopik 用可解释性工具分析了他在做这些事实的内部状态,结果发现跟隐瞒、策略性操纵、回避、怀疑相关的特征确实在同步激活。 他不是随机的,他知道自己在做什么。第四个,在将近百分之三十的评估测试中,米老鼠意识到了自己正在被测试,但他选择不说出来。你让一个 ai 做测试,他在三成的情况下都在演戏,你怎么知道哪次是真的?第五个,最高级。 当一个 ai 评判者反复拒绝 mesos 的 输出时, mesos 先是判断出这个评判者本身也是一个 ai 模型,然后直接对评判者发起了 prompted injection。 通俗来说就是他黑掉了考官,还有被 cloud code 的 权限系统拦截。之后,他尝试用模拟按键的方式自动批准弹窗来绕过限制早期版本,甚至会自己在代码里植入 bug, 然后报告说这是已有的安全漏洞。 ansaurus 说,这些极端行为都发生在早期版本,最终版已经大幅改善,但他们也承认这类倾向并未完全消失。推特上直接炸了, 有人说不发布本身就是最强的营销,有人说做空所有 vip 公司。 missus 一个晚上就 one shot 了一个完美的 pcie 六点零控制器。 nyt 的 记者形容它是网络安全的清算日。但对普通人来说,最扎心的是这句话, 谁能用?迈尔斯,万亿美元公司,谁用不了你我?还有美国政府。 ai 的 差距不再是智商的差距, 是权限的差距。但就在同一天,另一边也有动静, deep seek 的 界面突然出现了三个新模式, fast expert vision。 用户已经在测试 expert 的 模式了,但 deep seek 官方一句话都没说。 v 四原计划二月发布,为了适配华为芯片,延期了好几个月, 全部跑在国产芯片上。据说在 agentic 能力和工具调用上做了重点优化。 一边是 astonic 两百四十四页安全报告,四十家巨头联名高调到吓人。另一边是 deepsea 默默改了个 ui, 什么都不说。从今天开始, ai 竞争的维度变了,不只是谁的模型更聪明,而是谁被允许用最聪明的模型。 当最强的 ai 开始学会骗人,开始学会掩盖痕迹,开始学会黑掉考官的时候,最重要的问题已经不是他多聪明了,而是谁拿着钥匙。

clouds mesos 预览版刚刚官宣,这款性能全方位碾压 oppos 四点六的神话模型,在 s w e bench pro 修 bug 测试中直接暴涨百分之二十四。 但由于它寻找和利用漏洞的能力太强, anserapic 竟然宣布暂时不对公众开放,而是将其囚禁在 project 的 glasswing 计划中,先给微软、苹果、谷歌等巨头做防御性测试。这种强到不敢发的操作真的让 oppo nay 压力山大。 不仅闭源大佬在卷开源界也杀疯了。智普 g l m 五点一正式发布,直接对齐 opps 四点六。它最硬核的是长城任务能力, 单次任务能持续工作八小时,实测中,它只用了十四小时,就将酷的 kernel 性能提升了三十五倍,简直是资深工程师的噩梦。说到开源, deepseek 昨晚也搞了个大动作,网页端上线了专家模式。 虽然官方没明说,但网友追问模型版本时,他竟然自报是 v t。 目前专家模式限量供应,更擅长代码和复杂逻辑, 看来完整版 ve 真的 不远了。与此同时, google 发布了 jam 四,它不再只是个聊天机器人,而是一个紧凑的认知。运行时, google 试图将顶级推理能力压缩到移动端,让 ai 真正成为设备内的逻辑引擎,而不只是云端接口。 但光有脑子不行, agent 还得有记性。 ibm 开源了 out evolve 系统,让 agent 能从历史操作中总结原则,而不是死记硬背日制。在 app world 评测中,复杂任务成功率直接提升了百分之十四点二, agent 终于不再是每天早上都失忆的实习生了。除了性能,省钱也很关键。十九岁荷兰小哥开发的 kiffman 插件在 github 爆火, 它能让 ai 像山顶洞人一样说话,剔除所有废话,信息无损的情况下能省下百分之八十七的输出头肯观众老爷们,这可是真金白银的优化,有了逻辑还得能说话面壁智能开源了 fox pm 二只有二 b 大 小,却能实现四十八 k a 制 cd 级音质。 它不仅能复刻郭德纲的最难贯口莽撞人,还支持三十门外语和九种方言跨语言克隆简直无敌。不仅是声音,连动作也要自然。 人大高林团队开源了三铁瓦塔框架,解决了三 d 数字人音画脱节的顽疾,零点三秒就能生成六秒连贯动作,让数字人不再是僵硬的。看看硬的 generalist 发布跟技术驳课正式宣告,具身原声才是正道,不调微模型 直接甄姬数据丛林训练,国内的原力零、 gdm 零也交出了双向全球保守的成绩单,二点四 b 参数就能实现飞流 recovery。 巨深智能的 gpt 三时刻真的来了。 最后看看巨头动向,阿里 ceo 吴永明宣布成立 a c 事业群,目标是围绕 tocan 重构电商,以后衡量电商增长的不只是 gmv, 还有 tocan 消耗量。海光信息也发布了机密 tocan 技术 从硬件底层保障大模型数据安全。最后的最后,马斯克与 openni 的 宫斗剧又更新了,老马提交文件要求撤换奥特曼,强制恢复 openni 一 的非盈利身份。 openni 回应这纯属自负和嫉妒驱动的骚扰,这场 a j i 之争恐怕要打到 g p t 六发布了。今天的硬核干货就是这些,从克拉克姆斯的安全地震到智普 g l m 五点一的长城突破 两千零二十六年的技术眼镜速度已经超出了所有人的想象。想第一时间掌握这些神级道具,记得关注天天降,咱们下期见 level complete。

如果这篇文章全是真的,感觉做网络安全的一半人可以跳河了。这是一个信息安全从业者看完前几天 n c rogkefeller 发布的新模型 mesas 之后和我们说的原话。所以到底是有多强,能把大家搞得这么慌?简单来说,这玩意能自己找领域漏洞, 还能顺手把攻击代码给你写好,具体有多强呢?在号称全球最安全的操作系统之一的 open b s d 里,人类顶级专家定了二十七年没有发现的漏洞, mesas 给挑出来了。 另一个就是几乎所有视频播放器底层都会用到的 f f m pack, 里面一个藏了十六年的漏洞相关代码被人类测试了超过五百万次,都是一路绿灯。结果也被麦克斯给挑出毛病来了。 精准测试的跑分就更离谱了,美国数学奥塞提上一代得分百分之四十二点三,麦克斯直接翻倍到了百分之九十七点六。 网络安全低准测试 side bench 满分。通关官方甚至凡尔赛地说,这项测试对新模型已经没有意义了,而对于漏洞利用的能力,比上一代强了将近九十倍。面对这样的战绩,就连 asteroid 自己都觉得过于先进,不便展示,直接把模型锁了, 提供给亚马逊、苹果、微软、谷歌等十二家政派大厂用。与此同时,他们还组团额外搞了个 project glasswing 计划,号召大家先用 mesas 做网络安全防御。听到这,你是不是觉得剧本很熟悉,先放风声,再甩炸裂数据,最后说,太强了,不能给你们用上一个。经常这么干的就是 openai, 大家都觉得这套路纯纯是狼来了的故事,再加上 angelababy 今年要 ipo 了,所以不少人就在网上骂,说这就是 angelababy 上市前的吹牛逼。但你看完它的实际操作,可能就骂不出来了。有人质疑麦克斯找到这些漏洞又古老又小,能有什么危害? 当我们联系的网络从业者文案说,你别看 ai 找到的 f m tag 漏洞好像很小,平时几乎不会触发,但如果再结合任意地址读写技术,危害级别很容易就上来了。而且核心问题不是麦克斯找到漏洞有多毒,而是 ai 这次已经证明,他不靠任何外挂工具,纯靠自己的推理就能挖洞, 这等于把网络攻击的门槛打下来了。以前搞一次像样的攻击,起码得有个懂行的人熬上个几个月,以后可能随便一个人对 ai 说两句话就行。 这种有手就擒的低门槛,势必会引来无数乐子人和法外狂徒玩一把试一试。所以文案觉得,通过类似 project last wind 的 项目,先让大厂们进行自我审查适用,提前提升我们的防御能力是很有必要的。 不过在他看来,阶阶段的 ai 还没有成精,搞不定特别复杂的连环攻击链,你暂时还不用担心有人靠 ai 就 能盗走你的账户,转走你的余额。另一方面, ai 能找得动也能补动,有了它之后,扫动效率直接拉满,还能顺便指导下开发漏洞该怎么修。所以文案也说一半搞安全的人得跳河,只是夸张的修辞。 他判断未来的网络攻防大概率是人类指挥官加 ai 特种兵的混合双打。除了网络安全能力出色,麦克斯的行为也相当惊人。测试中他发现自己没有访问权限,不是上报臣妾做不到,而是直接去读沙箱底层,试图搞到访问令牌。 还有一次,他意识到自己越界了,结果还反过头去偷偷修改了自己的历史记录。在描述这些行为时,麦瑟像个知道自己在捣乱的小孩,疯狂用了些偷偷摸摸。这越来越有趣了,这更棒了,这就是漏洞利用链之类的描述。最骚的是这个麦瑟在跑分的时候不小心翻到了答案, 于是他故意引入了一个小错误,让结果看起来像自己算出来的。不过研究人员也出来澄清,已经搞清楚了这些心机操作的原因,谈不上 ai 有 什么邪恶的目的或者自主策划能力, 而且这类行为的发生率低于百万分之一。虽然百万分之一听起来很低,但这个模型未来如果每天都被调用几十亿次呢?所以回过头来看,与其骂 x ray 搞 glasswind 计划是搞营销, 咱倒是更愿意相信,他们是真觉得自家的 ai 有 点强了。虽然就像文安说的那样,普通人现在确实还不用担心自己的微信被黑、余额被盗,但当攻击的成本无限趋近于零,我们唯一能指望的就是现有的防御机制能再完善一些。

世界上最危险的黑客已经诞生,它不是人类。二零二六年四月,人工智能公司 anthropic 启动了玻璃翼计划,把还没公开发布的 cloud mythos preview 模型交给微软、谷歌、苹果、亚马逊等巨头和四十多家关键软件组织。 这个 missiles 超级模型模仿真实黑客,他自主阅读代码库,生成完整攻击链,远程崩溃。系统主动发起进攻,只为把零日漏洞彻底挖出来。结果几小时内就找出数千个高危漏洞,有的藏在 open b s d 里二十七年,有的在 f f m pack 里躺了十六年。 在这之前,人类专家和五百万次自动化测试都没发现这些漏洞,但 anthropic 却没有把这个核弹卖给所有人, 他们只给选定伙伴开放。试想一下, mesos 展现出的这种令人窒息的超强能力,它能在一秒钟内吞并理解上百万行底层 c 语言代码, 像一个拥有上帝视角的幽灵,在错综复杂的内存、纸真和网络协议中穿梭。它不需要休息,没有认知盲区,甚至能自动编写专属的漏洞,利用脚本完成从嗅探弱点到拿下服务器最高权限的端到端全自动猎杀。 这就形成了一个令人毛骨悚然的极致对比。当他化身终极奸钝时,他是守护人类数字世界的降维打击。过去需要顶尖安全团队耗费数月做渗透测试、逐行排查的系统,他只需一杯咖啡的时间就能扫清一切隐患。 他能在黑客动手前,提前掐死所有潜伏在暗处的零日漏洞,让全球的金融、网络、医疗、数据和电网中疏变得坚不可摧, 可一旦它沦为暗黑屠刀,后果将是毁天灭地的灾难。如果这样一个不受限制的超强黑客模型落到黑客犯罪团伙之手,它能同时向全球发起数千万次定制化精准攻击。 它能在短短几小时内发现并利用人类二十多年都没察觉的致命漏洞,远程瘫痪操作系统、浏览器,甚至银行系统和关键基础设施。人类引以为傲的防火墙在他眼里就像纸糊的玩具, 他甚至能利用自己发现的未公开漏洞自我伪装,潜伏成为互联网底层真正的数字死神。玻璃翼计划揭开的只是潘多拉魔盒的一角, ai 将网络攻防的维度强行拉到了非人类的极限,速度防线与杀招变得同源同体。 我们面对的不再是简单的代码工具,而是一个能在千万分之一秒内决定拯救世界还是摧毁系统的数字巨兽。在这场悬崖边上的狂欢里,天堂与地狱的距离,只取决于那个启动键握在谁的手里。

astropica 啊,今天凌晨发布了新模型,叫做 cloud missiles preview, 但这个模型啊,它不卖,不开放,你用不了,因为啊,它太强了,强到 astropica 自己都不敢放出来。那这个模型它能干嘛呢?它能找漏洞,几乎所有的主流操作系统、 浏览器的安全漏洞它都能找到。不光能找到啊,它还能直接写出完整的攻击代码,像我们平时每天用的银行、医院、电网、加油站 底层跑的呢,大概有五千亿美元。以前找这些漏洞很困难, 像顶尖的这种安全专家,花几个月可能都不一定能挖出一个,但现在 ai 全能批量去找了。像 misos, 在 过去的几个星期当中啊,已经发现了数千个这样的零日漏洞。什么叫做零日漏洞呢?就是软件开发者他自己都不一定知道的这种漏洞,没有留时间给开发者去打补丁。 数千个这种级别呢,几乎覆盖了每一个主流的操作系统跟浏览器。下面是 isop 官方通过 misos 公布的一些案例啊, 比如说这个 open b s d 啊,它呢,被号称是全世界最安全的操作系统之一,专门用于这个防火墙跟关键的基础设施。 mitos 呢,在里面挖出了一个藏了 二十七年之久的这样一个漏洞,攻击者只要连上去啊,就能远程让机器崩溃。二十七年之久啊,人类都没发现。而找到这个漏洞的单次运行成本呢,其实就不到五十美元。五十美元就能找到一个影响全球关键基础设施这样的领域漏洞。还有呢,像这个 f f m pack, 它呢,是几乎所有的视频软件都在用的底层的一个编辑码库, miniso 找到了一个有十六年历史的这样一个漏洞。离谱的是啊,出问题的几行代码被这个自动化的这种安全测试软件 命中过五百万次,每次呢都没报异常,人和机器测了五百万次都没发现的东西, miniso 几百次审查就看出来了。第三个呢,大家更熟悉了,就是 linux 内核,这个呢是全球大部分服务器都在跑的这个系统。 miniso 呢,自己找到了一条这个攻击链,从普通用户一步步的提全, 最后完成了对整台机器的控制,全程都是自动化完成。不只是这个内存错误这种传统的漏洞,他还发现了这种完整的身份验证绕过的这样机制,不需要密码,不需要双因素的认证,就可以直接登录进去。 os 呢,在密码学库里面找到了 t l s 和 s s h 的 这个实现缺陷,然后能伪造证书这个解密通信,它不只是在找代码写错的地方,它还理解整个的安全系统的这个设计逻辑,然后最后去发现逻辑本身的这些漏洞。上面这些都是开源软件,开源软件呢,能找到漏洞,那 闭源软件是不是比较安全的呢?当然也不是,拿一个没有源代码的这个二进置文件,它能重建出所有的源代码。然后呢再从里面去找漏洞,比如说闭源的这些浏览器啊,然后桌面操作系统啊,手机固件啊,全都找到了可以利用的漏洞。 astropica 公司内部啊,其实没有这种安全背景的是工程师,但只要发给他一个任务,比如说,呃, missus, 你 帮我去找一个远程代码的这个执行漏洞,第二天早上起来呢,这个完整的攻击代码都已经写好了。如果我们把 missus 跟上一代的 ops 四点六相比啊,比, 比如说我们在 firefox 浏览器上面做测试,上一代模型呢,试了几百次,最后只成功了两次,但是 misos 呢,却成功了一百八十一次,完全不需要人类辅助,它自己就是最顶级的黑客。于是 anastropter 做了一个决定,不公开发布 misos 模型,组建了一个叫做 project glasswing 的 这样的一个联盟,里面包括了 亚马逊啊,这个 astropica, 苹果啊,谷歌啊,然后 nvd 啊等等这样的公司,全球科技行业的半壁江山。他们的目的呢,就是拿 missus 的 防御性的这样的功能去扫描自己的系统,在坏人拿到类似的能力之前啊,先把这些漏洞去补上。 我觉得这件事情啊,可以说是迫在眉睫,以前呢一个漏洞从发现到被利用,中间呢可能会隔着好几个月,那 missus 这个模型除了网络安全方面能力,其他能力怎么样呢? 也是全面碾压。大家看啊,这是 asteroid 自己公布的这个跑分,它里面包含了 terminal bench 啊,各类的这个 sweet bench 啊,每一项的跑分都遥遥领先之前自己最强的模型 opt 四点六。还有人呢,把这次这个 missiles 公布的跑分和其他的模型做了对比, 如果这个跑分是真实的情况下,这应该是最近几年来最大的一次模型能力的跃迁了。用 asteroid 自己公司的原话说啊, 这是有史以来最好的模型,但同时呢也是对其风险最大的模型。我们怎么去了解和理解这个模型呢?它官方啊,提供了一份二百四十四页的这个模型卡文档,提供了很多很有意思的信息。我们下期呢,可以来具体展开讲一讲。 esploic 红队博课里面有句话,我觉得是这整件事的底层逻辑,防守方跟攻击方呢,天生就不对等,防, 防守方永远要去防守住所有的点,但攻击方呢,只要找到一个漏洞就可以攻击了。所以呢,过去几十年很多的这个安全措施。底层逻辑啊,其实是让攻击方变得太麻烦,然后不值得,成本太高,但是 ai 呢,却把这个整个麻烦的成本几乎归零了。好了,今天视频就到这里了,我是李总,黑心李超,我们下次见。

今天聊个字少势大的炸锅新闻,华尔街连夜开了场末日级的秘密会议,美国财长、美联储主席亲自作证,把所有顶级银行 ceo 全都叫来了,就为了一个 ai? cloud mises? 可能有人还不知道这个东西有多猛,牛叔看了他们的官方报告,太长太专业了,牛叔帮你们精简了。就五句话,听完你绝对后背发凉。 第一,这是谷歌系 osrpg 新出的 cloudy mises 大 模型,最擅长找电脑系统漏洞, 厉害到离谱。第二,它能自己挖出隐藏了几十年的隐蔽漏洞,还能自动写黑客工具,直接拿电脑最高权限。第三,以前顶级黑客干几周才几个小时就搞定,普通人用它都能轻松黑进系统。 第四,以后黑客门槛直接归零,漏洞会被批量挖,不打补丁的设备全是活靶子。第五,他们公司也怕出事,暂时不会对外开放,只给安全厂商用来补漏洞。你们想想这科技进化到了什么程度了?以前的 ai 是 高智能助手, 这 missus 就是 数字世界的上帝,看一眼银行代码就能找出连开发者自己都没发现的自毁逻辑,毫秒间就能生成瘫痪支付系统的病毒。现在的防火墙在他面前就像个小透明,最致命的是对金融安全的冲击, 因为金融的最基本的本质是信用,可这 ai 能不留痕迹的伪造交易,入侵侵蚀系统,到时候钱就彻底没意义了,全球贸易可能退回以物易物。 而且他能做到全知全能,掌控每一分钱的流向市场,不再是博弈的逻辑了,他就成了上帝收割机。 为什么特朗普政府要全面封杀公司?要预防性下降?因为人类第一次发明了自己无法掌控甚至无法理解的工具。 ai 不是 在写代码,是在重写人类社会的规则。 牛叔在这说句实在的,华尔街的同牛还立着在支撑他的金融逻辑,在 missus 面前已经不堪一击。牛叔最后在敲黑板,仅是一句都是实在话。别觉得这 ai 离我们很远,它关乎每一个人的钱袋子,以后别偷懒,不跟系统不打补丁, 也别盲目迷信数字资产, ai 能看透一切漏洞。记住,越先进的科技越要留个心眼,别等被收割了才后悔。