anspirate 刚刚干了一件事,可能会让一个五百亿美元的行业彻底变天。最近,这家刚与美国政府撕破脸的公司发布了一个新功能, cloud code review。 很多人第一反应可能是, 就是 ai 帮你审代码吗?但如果你仔细看它的能力,你会发现这可能不是一个小功能,而是直接冲击了一个五百亿美元规模的行业。代码安全审计过去大公司为了防止 bug 和安全漏洞进入生产环境,每年要给安全厂商付很高的费用。 像 sneak、 checkmarks 这些工具,一套企业版一年可能要五万美元,甚至更高。但现在, cloud code review 做了一件狠事,他直接派出一对 ai 智能体,在你的代码提交里做自动频审。程序员把代码提交上来, ai 就 像一个评选团队一样,开始分工检查。有的 ai 专门查安全漏洞,有的检查逻辑问题,有的分析新代码和旧代码会不会冲突。最后再由一个总览, ai 给出一份总结报告,而且效率非常夸张。按 snapchat 内部测试发现,大型 pr, 也就是一千行以上代码的改动, 百分之八十四都存在问题,平均每个 pr 能抓出七点五个 bug。 更反常识的是,小改动其实也很危险,在五十行以内的小 pr 里,百分之三十一也藏着问题, 而 ai 完成一次代码评选,平均只需要二十分钟。更重要的是,这些结果工程师的认可度超过百分之九十九,互爆率不到百分之一。 甚至有一个案例只改了一行代码, ai 却发现,这个改动会导致身份验证失效。工程师事后承认,如果没有 ai 提醒,这个 bug 他 可能永远都发现不了。再看成本,传统安全审计工具一年可能要几万美元, 而 cloud code review 按 token 计费,一次评选大概十五到二十五美元。你算一下,五万美元对二十五美元,差不多是两千倍的成本差距。所以很多开发者看到这个功能的时候,都在说一句话,这不是一个功能更新, 而是在重新定义代码审计行业为什么会发生这种变化?核心原因只有一个, ai 能真正读懂代码。过去那些代码扫描工具,大多数是靠规则匹配和漏洞库。比如你写一段数据库代码,他就提醒你可能有漏洞,但他其实并不理解代码到底在干什么, 于是误报。很多开发者时间久了,就开始忽略警告,这样一来,真正危险的问题反而可能被漏掉。而大模型不一样,他可以理解代码上下文、 历史逻辑、函数调用关系,甚至可以推理这个改动在某些边界条件下会不会引发问题。再加上 ansorek 这次用的是多智能体系统,多个 ai 评选,智能体分工协助,再互相验证结果,所以误报率才能压到百分之一以下。但这里还有一个更大的背景,过去一年, 程序员用 co pilot、 cloud cursor 写代码,代码产出平均增长了百分之两百。代码越来越多,但审代码的人并没有增加。很多团队的 code review 其实只是扫一眼就过 an sql 内部统计发现, 以前只有百分之十六的 pr 能得到真正有价值的评选意见,而引入 ai 评选之后,这个比例直接提升到了百分之五十四。也就是说,过去有大量潜在 bug 是 在人类程序员眼皮子底下溜过去的,而现在它们被 ai 揪出来了。 所以你会发现一个非常重要的变化,未来软件开发的瓶颈可能不再是写代码,而是审代码。当 ai 写代码越来越快,人类已经很难再靠人工一行一行审下去了,所以很可能会出现一种新的开发模式, ai 写代码, ai 做第一轮评选,人类工程师负责最终架构判断。而且需要注意的是, ai 评选并不会直接替你批准代码,也不会强制阻止合并, 它只是提供高质量的评选意见,不会破坏原有的开发流程。也就是说,它不是替代工程师,而是把工程师从大量低价值的找 bug 工作里解放出来。所以,这件事真正的意义其实不是一个工具升级, 它可能意味着软件开发的流程正在被 ai 重构。过去十年,大家一直在说 ai 会改变编程,但现在看,真正被改变的可能不是写代码,而是审代码。 最后想问大家一个问题,如果未来 ai 写代码, ai 审代码都变成长态,程序员最核心的能力到底是什么?评论区聊聊,记得点赞关注哦!
粉丝1315.4万获赞1.1亿

你以为 ai, ai 真的 只是帮你写个报告,搜个资料?那你真的亏大了。 ansaurpic 刚刚悄悄上线了两个东西,把整个 ai 自动化游戏的规则全改了,而百分之九十九的人还没意识到这意味着什么。先说结论,以前你用 ai, 是 你在伺候 ai, 现在翻过来了, ai 在 替你打工,你只需要偶尔用手机看一眼进度。听起来很夸张,让我给你把这事说清楚。 enshrapic 发布的这两个东西,一个叫 dispatch, 一个叫 computer use。 原视频作者是这么介绍的, you can text claude from your phone, it takes over your desktop, it can open up apps, it can its way through screens it can navigate tools that have。 你 没听错,你用手机发条消息给 closed, 它就能自己打开你电脑上的应用,点击填表,操控任何没有 a p i。 接口的工具。交付给你的不是草稿,不是摘药,是直接做完的成品。这才是真正意义上的寄身死事,把活儿从你桌上搬走。 但问题是,现在大多数 ai a 阵的演示都是在表演,不是在干活。你见过没?各种 a 阵,他演示最爱秀的是什么?我提前帮你做了一份会议简报,好家伙,又一份文档要读,作者在视频里直接点破了这个现象。 agents want to come to you now and say i have a briefing for you proactive, briefing, it's a really important briefing, it's gonna be before your meeting 这句话我要给他加粗话,线 agent 给你生产更多要读的文字,本质上是在给你增加工作量,不是减少。真正好的 agent, 应该让事情消失在你的代办列表里,而不是在上面又堆一层,记住,这个标准,后面会反复用的 好。现在说说 entropig 这次发布的第一块积木定时任务。注意,这不是你在 cloud 的 对话框里设个提醒内容,这是真正运行在云端服务器上的任务。你的电脑关机了,它照炮给你设个仓库,设个时间表,写个提示词, entropig 的 基础设施帮你跑。作者说, claude gives you a computer in the cloud that you can message and tell it to do stuff on a schedule now, i will say there's some limitations right, they're not。 换句话说,你拥有了一台永不下线的云端电脑,可以定时给它派活。 untropic 内部自己就在用这个功能。做什么呢? 让 cloud 自动把构语言写的代码库同步成 python 版本儿。这活儿以前需要工程师每周花几小时盯着,现在直接扔给 agent 刨。重要但不紧急的活儿恰恰最容易掉进缝隙里。定时任务就是堵这个缝的。非程序员也别以为这跟你没关系, 每天早上自动抓取 ai 资讯,整理好放在你面前,定着你要飞的那条航线,票价一跌到预值就推送给你。某个网站没有自动扣款,到期前定时提醒你。这些都是定时任务能干的事。这些事情有个共同点,它们都在时间维度上运转,而你现在终于可以不用亲自守着了。第二块积木 dispatch。 这才是这次发布最被低估的东西,很多媒体报道说他就是手机上的十九对话。这个说法差得远了。当你用手机通过二维码和桌面 clog 配对之后,你得到的不是一个对话线程,你得到的是一个调度层。作者的原话很关键, conversation on your phone, you can spawn and manage multiple claw or task sessions running simultaneously on your 手机是指 回台,桌面是执行台。你可以同时派出多个 cloud 工作绘画并行运转。每个绘画有自己独立的上下文文件权限和工具连接。这不叫远程控制,这叫并行异步调度。 有个产品经理实测了 dos patch, 连续工作四十八小时,全程他只花了大约二十五分钟输入指令,剩下的时间他在陪孩子玩。 cloud 在 跑竞品分析草,汇报材料,并行处理多个任务。你上一次能同时干三件事是什么时候?当然, dispatch 现在有个硬约束,你的桌面电脑必须开着。没有电脑, dispatch 就是 个摆设的任务。每次申请文件夹权限,你都要手动批准,还不能批量操作,手机端也不能直接收文件。这些确实是限阶段的缺陷,作者没有回避。 any subtask that dispatch spawns requests folder access on your desktop individually that you have to approve there's no bulk approval right now。 百分之五十的成功率听起来不高,但换个角度想,你人在外面,同时派出去四个任务,回来两个成了。这两个成果以前你一个都拿不到,因为你根本没时间坐在电脑前操作, 而且失败了,重开一个实力就行。 anselpic 把它标记为研究预览版。限阶段本来就不是让你跑核心生产流程的,它是让你开始建立那种管理者心态的 computer use 让 cloud 直接操控你的桌面。 m c p 协议很好,但现实是,互联网上超过一半的工具根本没有 m c p 接口,永远不会有老板 g r 老 s c p 系统,各种定制 erp 界面,你永远等不到他们出 m c p 服务器。以前这些工具对 ai 来说是一堵墙,现在 clod 直接绕过去了。 the blinders off and it basically said you know what we're going to make sure that remotely through co work you can access any tool on your computer and that includes。 键盘、鼠标,浏览器。只要是人能点的地方, cloud 现在都能代劳。你离家十公里,他在帮你点那个老系统里的数据,导出按钮,往 excel 里填数据,然后发给会计。 这会儿以前要站你半天,现在你派出去就行了。 m c p 是 高速公路, computer use 是 越野车,两个都有了,才算真正打通了最后一公里。 说到这里,必须给你一个框架,不然你还是不知道该用它们干什么。作者给了一个判断标准,我觉得特别好用。找那些在你脑子里嗡嗡响的事情,你答应了客户周四前发修正方案,你说好 给团队发挥一剂药,你那个拖了三个月的技术债。这些事有个共同特点,他们不紧急,但一直站着你的工作记忆,这才是应该交给 a 阵的活,不是让他帮你规划行程。 还有一个用法更高级,叫做复合信号检测。如果你把自己积累的知识库接入 cloud 的 m c p, 然后再连上 despatch, 你 的 agent 就 能开始跨时间维度给你发泄模式,竞争对手在支付方向密集招人,对应三周前你们讨论的战略方向,建议你关注,这不是单次查询能给你的,这是 agent 在 替你持续思考。作者把这套组合叫做 open brain 加 dispatch, 本质上是把 ai 从被动响应升级成主动洞察。最后说一件真正没人讲的事,技术都有了,但最难跨越的坎不是技术,是你自己。 你派出任务走开之后,你会手痒,会想回去盯着屏幕看它有没有在动。这是人类的本能,但这个本能是你用好 a 震它的最大障碍。作者说, i have this problem too i walk away, i use my this patch and i'm itchy i'm like i want to go back, i want to make sure it's working is it really working we're going to need to learn to shift。 二零二六年真正稀缺的能力,不是会用 ai, 而是敢于放手让 ai 干。那些能走开、能陪孩子、能让 agent 在 后台跑着然后回来拿结果的人,才是真正在用 ai 获得杠杆的人。 所以问题来了,你现在脑子里那件一直没时间处理的事,你愿不愿意?今天就试着派给 agent, 然后真的去做别的事。

跨界背后的公司 andrew rappy 刚刚推出了一款强大到让他们不敢向公众发布的模型, 这可能是我们见过的最强大的人工智能模型之一,它即将登陆市场。据称他们昨天为此写了一篇博客文章,然后将其下架了。但我们找到了那篇博文。我要在这段视频中展示给你看, 聊聊这个新模型,它的能力。它们为何担忧剧透预警,原因包括网络安全以及更多更新,毕竟云生态在本视频中也会涉及。所以综上所述,我们直接进入正题,我们直接进入这篇文章。 这显然是被一个叫 mythos 的 人保存下来的。 alex finn 在 他们下架之前引用过它。它,我想把它保存下来又放回去了。再说一遍,我是根据大家的说法来的, 我查遍了所有 cloud 的 社交账号,连他们的创世人和关联人士也找不到这篇文章。我知道这确实是 cloud mythos 的 官方泄露,也是迄今为止开发出的最强大人工智能模型。 我不会逐字念给你听,但它基本意思是这太先进了,可能被用来发动大规模网络攻击。 关于人工智能,我一直担心的事情之一就是确实有很多心怀不轨的人存在。随着这项技术对善意的使用者变得愈发强大,他对恶意的使用者也会变得同样危险。 在过去一年里,随着人工智能的最新发展,我见过的诈骗和网络攻击比过去几年加起来都多。这话出自一位在科技圈混迹许久的人之口,而且情况恐怕只会变得更糟。 andrew bag 反对利用技术作恶而闻名, 他们此前曾因政府及美国政府试图将其模型用于大规模监控和自助武器系统而与其发生冲突。 我实际上为此制作了一个完整的视频,如果你想查看一下,那非常有趣,也许不会对公众完全公开。我觉得这真的很有趣。 是的,他们撑起领先如此之多,且随着即将到来的补丁浪潮和新模型,他能以远超预期的方式利用漏洞进行网络攻击。我还想谈谈他们迟迟不发布,或者说故意吊人胃口却不肯放出的原因之一,那就是这个模型太强大了,因此成本会很高。 他们甚至说,出于这些原因,我们在发布 mesa 时将采取更缓慢、更渐进的方式给予我们现有的模型,而且他们正在发布它。好吧,所以他说这是一个计算密集型的大模行为。我们服务成本极高,对客户而言使用费用也将不菲。 我们在全面发布前正努力让模型效率更高。我甚至听说有人抛出了二千美元这个数字。 我不知道这会不会是每月两千美元,但我确实认识一些愿意为市场上最好的模型支付这笔钱的人, 所以这只是一个值得思考,值得品味的点。但这个模型将被命名为 mythos, 它即将问世,它将比 opus 四点六更强大。 opus 四点六是他们目前最新的模型,拥有最顶尖的推理能力以及处理复杂任务的能力。也许 sonic 曾是他们的最新款, 但 opus 才是最高端版本。它的表现震撼了所有人,包括我自己。所以我只能想象 midos 会带来怎样的突破?清楚这两个名字了。 midos 更像是模型本身,而 capribar 则是曾级。它们都超越 opus, 但你看到的就这两样。实际文章中几乎一模一样。 你可以从 misos 切换到 cap'ber 看看,区别有点复杂,因为之前的 opus 更像 opus 点六,而这个大概是 misos, 然后 cap'ber 是 起分支。 还有 cloud news 报道说它们正在调整绘画时长,并对用户进行限流。看对里的 terry 说,随着需求增长,它们正在调整免费 pro 和 max 订阅用户在高峰时段的小时绘画限制, 而且有限制变动,所以基本上你有点被限速了。我个人付的是一百美元的计划,我大概只触过一次线。对我来说这太棒了。他说这只会影响到百分之七的用户, 但我确实注意到,身处科技圈,这已经影响到了很多人,为此他们做出改变。我确实想指出这一点。我是说,甚至有人极端地宣称 athropic 直接把所有人都抛弃了, 然后在这张街头中。具体来说,所有内容基本上都在谈论他所说的观点。如果你想不受限的操作,就得避开太平洋时间早上五点至晚上十一点这个高峰时段。这大致相当于东部时间的凌晨两点到下午六点。 我脑子里得赶紧算一下,但基本上,如果你想像之前那样全规模运行,就得避开这些高峰时段, 但在高峰时段内,他们实施了更多的速律限制。对此我个人并无意义。但我认识一些受到影响的人。你还在用 anthropic 吗?还是用了别的东西?请在下方告诉我。

等一下,先别划走, ansorepic 把自己最强的 ai 模型给意外泄露了,而且这玩意儿的网络安全能力已经强到他们自己都害怕对外发布。今天四条 ai 大 新闻,每一条都够你转发朋友圈的。先说第一条,也是最炸的一条, ansorepic 搞了一次史诗级手滑,他们把一个还没公布的新模型 cloud misos 的 完整草稿、薄壳、内部文件、员工资料,将近三千个文件全部扔进了一个任何人都能访问的公开缓存里。记者和安全研究员直接把他扒个精光,听听原声是怎么说的。 and is a pretty classic internal mistake, some draft content including what looks like a full blog post about a new model got accidentally left in a publicly。 对, 就是这么离谱!但更劲爆的是里面装的内容。这个叫 missus 的 模型内部代号 k p r 啊,是一个凌驾于现有所有档位之上的新层级 ansroupe。 现在最强的是 o p s, 而这个东西比 o p s。 还强,更大,更贵,能力更猛。问题是他已经训练完了,正在小范围内测。那为什么不直接发布?因为他们自己都承认,这个模型在网络安全领域的能力已经远超目前任何一个 ai。 不是 吹牛,是真的怕。听听他们是怎么表述的。 they literally state that this model is currently far ahead of any other ai model when it comes to cyber capabilities, and they're worried about what that means in the real world。 翻译一下,这个模型找漏洞的速度可能比防守方打补丁的速度还快,而且这不是理论担忧, antropig 之前真的出过事,有一个黑客组织用 club 攻击了三十多家机构,包括科技公司、金融机构和政府部门。所以他们说我们担心网络安全风险, 是真的在说自己踩过的坑。现在 misos 只对网络安全团队开放早期访问,目的是让防御方先做好准备。这叫什么?这叫我造了一把枪,先让警察练练手。第二条 mate 出了个东西,叫 tribe v。 二,听名字像个部落游戏, 实际上是一个能预测人类大脑对内容反应的 ai 系统。你看一段视频,听一段音频,读一段文字,它能预测你大脑的哪个区域在什么时刻会被激活,用的是真实 f m r i。 脑部扫描数据训练的规模有多大? the system was trained on 451.6 hours of fmri data collected from 25 people across four naturalistic studies。 四百五十一点六小时的 f m r i。 数据,二十五个人四项自然场景研究验证的时候用了七百二十个人,超过一千一百小时的脑部数据。更离谱的是,他能对从没见过的新人做零样本预测, 就是说他从没扫描过你的大脑,但能估算出你看某个内容时脑子里发生了什么。而且在某些指标上,他对人群平均反应的预测比真实个体的实际扫描数据还准。 你细品一下这件事的含义, ai 开始比你自己更懂你的大脑了。第三条,来自开源社区的一个新 agent 叫国安 klo, 专门解决一个让所有人都抓狂的问题。 ai 完成任务到一半就失忆,你让他处理一个 excel, 改了几次格式,加了几个需求,换了输出方式,大多数 agent 每次改动都当成全新任务重新开始。之前的上下文没了。 part of that comes from its memory system, which has three layers a stable identity layer, a long term background layer and a dynamic trajectory layer basically it tries to keep your broader。 三层记忆系统,稳定身份层、长期背景层,动态任务轨迹层。说人话就是他。同时记住你是谁,你之前干了什么,你现在在干什么? 还有个上下文,瘦身机制,自动扔掉垃圾,保留关键信息,防止长任务里偷啃。烧完了钱, agent 还没干完活。 但最有意思的是,它的自我进化循环失败了,不是报错完事,而是记录分析根音,生成改进方案,下次遇到同样问题,直接升级。大多数 a 阵的是出厂级,巅峰官卡是越用越聪明。 第四条,阿里巴巴发布了一款专门为 ai a 阵的设计的 cpu, 叫玄铁 c 九五零。现在大家都盯着 gpu, 但 阿里说 agent 跑任务靠的是多步骤顺序处理。 cpu 同样关键,这个芯片专门针对推理场景优化,比同类主流产品性能高出百分之三十以上。底层用的是 iic 减微开放架构,不用给 arm 交专利费,自己掌控,设计成本更低,自主性更强。背后的大背景呢? have been under pressure, because of u s export restrictions on advanced nvidia chips, so they've had to push harder on domestic ai hardware, alibaba has already。 美国的芯片出口管制把高端 nba 卡掐死了,中国科技公司只能自己造。阿里的半导体部门平头哥今年已经连发两款芯片, 分析师说, c 九五零的真正价值不是一夜改变营收,而是在 ai 算力越来越难抢的世界里,把主动权握在自己手里。你想想,四条新门串起来是一条线,模型越来越强,强到研发者自己都怕。 大脑被 ai 读懂只是时间问题, agent 开始真正能干活了。算力争夺战已经打到芯片层,这场 ai 军备竞赛,你觉得终点在哪里?

一台价值无法估量的猛兽级 ai, 被他的创造者亲手锁进了笼子里,不是不想放,而是不敢放!就在刚刚,一次荒唐的人为配置错误,让 antropica 藏得最深的秘密彻底暴露。顶配模型 cloud missiles, 代号 copyberra, 绝密细节全网泄露,参数传闻高达十 t, 编程推理网络安全攻防全面碾压 cloud ops 四点六内部测试结果让 entropix 自己都胆寒。这头猛兽一旦出笼,可能引发前所未有的网络安全风险,它能发起远超防御能力的网络攻击,既是最强的矛,也是最强的盾。 这次泄露的起因让人哭笑不得,一个外部 cms 工具配置失误,导致三千份内部文件暴露在公开数据库中,财富意外解锁到一篇未发布的播客草稿,才让 cloud mesos 的 存在浮出水面。 antropic 至今按兵不动,不是不想发,而是不敢发。 他们计划优先向网络安全机构开放,让防御者抢先一步应对即将到来的 ai 驱动的漏洞利用浪潮。当 ai 强大到连创造者都忌惮三分时,问题就变成了这样的技术。我们到底是该迎它出来,还是该继续把它锁在笼子里?你怎么看?欢迎在评论区留下你的观点。

一个还没正式发布的 ai, 已经靠泄露文件和公开演示放出了六个很不寻常的信号。它不只是更强,可能在改写安全行业和写代码这两件事。 事件起点很简单,安全研究员扫描公开数据时发现, ant topic 的 内容系统里有近三千份未发布文件可被公开访问。 这些文件里最关键的不是杂项材料,而是一篇关于新模型 clock missiles 的 博课草稿, 这才让外界第一次知道 atropica 可能在 opus 之上,还在测试更高一级的模型。草稿里提到的新模型叫 claudinous, 内部代号 cappybarra。 最重要的不是名字,而是定位。 它不是 opus 的 小升级,而是一个比 opus 规模更大、智能水平更高的新层级。这句话对普通观众怎么理解? 如果以前是同一档车换高配,现在更像是直接换了一个级别的车型。 and topic 自己也写得很直接,这是他们迄今最强的模型。草稿还点出了它提升最明显的方向,软件编码、学术推理、网络安全。 也就是说,它强的不只是聊天,而是更接近真正能独立完成复杂任务的系统。我们来看第一个案例, ghost。 对 的,这套很多人在用的内容系统 找到了一个严重的漏洞,关键不在于这个漏洞本身有多危险,而在于他能发现过去没被明显揪出来的安全问题,这才是真正可怕的地方。 第二个案例更夸张, linux 内核的一个相关组建里,一个从二零零三年就存在的漏洞被 cloud 在 大约九十分钟内找到。听着重点不是九十分钟这个数字本身,而是这种级别的问题,过去整整二零年,连最资深的安全审计专家都很难挖出来。 而且演示方式也很关键,研究员不是一步步手把手带他,而是只给了一个很短的目标,让模型自己去找最严重的问题,然后输出结果。这个变化说明,他的能力正在从一个辅助回答的工具逼近自主完成一段专业工作流的系统。 所以这两次演示,真正改变的不只是 ai 会不会写代码,而是 ai 开始接近自主发现未知漏洞的能力。对整个安全行业来说,这就是一条分水岭。 对防守方,它意味着审计成本可能被大幅压低,很多中小团队也能更早发现问题。但对攻击方,它同样意味着漏洞挖掘可能被放大,提速、规模化。这就是为什么连 antropic 自己都在强调网络安全风险的原因。 还有一个更现实的变化,在 antropic 内部,很多工程师已经不怎么亲手写代码了,他们同时运行几个 ai 智能体,让 ai 去深层去改,去提交代码。团队成员的角色已经更像是这群 ai 的 管理员 核心不是说程序员要消失了,而是角色彻底变了,你不再是那个亲手敲每一行的人,而是变成了提需求、拆任务、验结果的管理员。 未来真正稀缺的能力,会越来越偏向你的判断力和系统设计水平,而不是机械的输出。至于上线时间,目前外部预测是在今年年终左右, 但最关键的其实不是时间,而是 ai 竞争已经进阶了,大家不再只是比谁聊天更像人,而是看谁先能真正独立搞定高难度的专业任务。这就是 callmeister 为什么让所有人脊背发凉的原因。

我的天呐,家人们! ai 行业出现一次信号级变化, antropic 把核心安全承诺悄悄改了,从触发风险就必须暂停训练变成继续推进,但做自适应报告与风险。透明红灯变黄灯,你觉得黄灯会被当成刹车吗? 这不是哪家实验室变坏了,关键在于,以安全立品牌的 antropic, 竟把暂停从承诺中心移走,它曾是更负责替代方案的代表。这一改动更向行业约束。整体在变, 背后是三股外力在重塑。安全,第一是竞争加速,第二是治理替代承诺。第三是地缘竞争压力。三者叠加,安全不再靠口号争胜,而是进入制度与系统的应约束时代。 第一股力量,竞争加速。当各大实验室压缩时间线,单边自我克制的代价非常具体,份额、人才、合作伙伴、算力都会流走。更要命的是, ai 差距会指数级复利扩大。 第二股力量,治理替代承诺。从道德宣誓转向可审计,流程未必更差,能记录、能检查、能追责才是真治理。但如果只有报告,没有触发后的强制动作,风险就可能被写得更漂亮。 第三股力量,地缘竞争压力。前沿 ai 与国家竞争力绑定,政府不希望本国实验室放慢,实验室也越来越像基础设施型参与者,被更强目标牵引。三股力量叠加,安全从意识形态变成系统架构。 对企业来说,正确动作不是等哪家模型更负责,而是把 ai 风险治理做成内鉴能力。第一步,建立自己的风险分级,明确 ai 在 业务里做哪些决策,出错的影响半径有多大。 第二步,为每条 ai 工作流设计可执行的人类覆盖机制,并定期演练。不是写在文档里,而是能在关键节点一键接管,把错误阻断在扩散之前。 第三步,保留完整内部使用、日制输入输出以及被影响的决策链路。它不仅是最佳实践,更是为未来的监管与追责提前准备。你能不能复盘,这次结果怎么来的? 第四步,持续跟踪模型更新与政策变化。一次模型更新可能在一夜之间改变你公司所有 ai 流程的行为边界。同样的提示词,同样的流程输出,却已不是昨天那套。 最后一句结论,安全不再是外包给模型厂商的选项,而是企业必须内建的基础设施。你会继续信任安全承诺,还是只信可审计、可追责的结果?

最近, antropic 的 一款次世代大模型因为一分薄刻草案的意外泄露,被推到了风口浪尖。根据目前流出的内部评估,这款还没正式发布的模型在进攻性网络能力上表现出了惊人的潜力, 它的攻击手段甚至可能超越了目前顶级网络安全公司的防御能力,这直接导致了 kraus、 strike、 polo、 auto 这些行业巨头的股价集体成压。 这让我们看到,未来的 ai 博弈已经从单群的内容生成进化到了安全攻防的硬核阶段。 更值得关注的是资本市场的动向。消息人士透露, antropic 已经定下了目标,计划在今年十月左右正式挂牌上市,他们现在正和 spacex 展开一场时间竞赛,看谁能抢先扣动 ipo 的 扳机。 顶尖投行正在幕后紧锣密密的谋划,试图在多变的市场环境下促成这场可能是今年最受瞩目的科技盛世。 现在的市场正处于一个敏感的轮动期,资金正从传统的增长型股票转向更具确定性的领域。大家关注的焦点不再仅仅是 ai 能写什么,而是它能产生多少自由现金流,以及它最现有产业格局的颠覆能力。 最后总结一句话,当 ai 的 进攻性开始超越防御性,全球网络安全领域将迎来一场彻底的降维打击与格局重塑。

claude mythos 人工智能刚刚引发了股市崩盘。 anthropy 刚刚意外泄露了他们有史以来最强大的人工智能模型,短短几小时,他就抹去了华尔街数十亿资金。 crowd strike, paolo auto networks、 okata, 他们全都在一个早晨因一份泄露的文件而崩盘。事情是这样的,周四,一位名为 bee nolan 的 fortune 记者发现了 anthropic 从未打算公开的东西, 安放在 anthropic 网站的一个公共文件夹里,完全没设防,既无密码,也无其他保护。躺着近三千份文件,有博克草稿、 pdf 图片,内部文档全都在, 就那样摆在那儿,谁都能找到。在这些文件中,埋着一篇关于 cloud mythos 模型的草稿。博克文章用 anthropic 自己的话说,这是迄今为止我们开发的最强大的模型。 他们称其在编码和学术推理方面比当前最好的 opus 模型高出四点六分。而某件让整个市场感到恐慌的事发生在网络安全领域。现在最疯狂的部分来了。两名独立的安全研究人员证实了整件事。 来自剑桥大学的 alexandre posse 和 lyzler x security, 他 们各自都发现了同样的未受保护的文件。这不是谣言,这不是猜测,这是真的。 随后, anthropic 出面承认了此事。一位发言人告诉财富杂志,该模型代表了人工智能能力的跨越式进步。 他们说,这是迄今为止构建的最具能力的系统,并确认已启动对一小批早期访问客户的测试。股市听得一清二楚。周五早盘,网络安全股断崖式下跌, crowd strike 跌百分之七, payload auto networks 也大跌, zscaler 则下错四点五, okta 和 netscoe 各下跌超过百分之七, tenable 暴跌了百分之九。整个 i shares 网络安全 etf 在 单词交易中下跌了百分之四点五,而比特币实际上又跌回了六六零零美元。 i shares 软件 etf 下跌了近百分之三。 这一切都源于一篇泄露的驳壳文章,为什么只应草稿中的一行字。 anthropos 写到, mythos 目前在网络能力方面远超任何其他人工智能模型,这预示着一波即将涌现的新模型的浪潮, 他们将以远快于防御者努力的速度利用漏洞。让我用大白话解释一下, anthropic 打造了一个找软件漏洞如此厉害的东西,以至于他们担心一旦它流出会发生什么。而华尔街立刻想到, 如果人工智能能比 crowd strike 或 payload networks 更快地发现和修复漏洞,这些公司的价值到底还剩多少? cyf 分 析师 adam bock 在 给投资者的人工智能研究笔记中直言不讳地表示, memos 有 潜力成为终极黑客工具,并能让任何普通黑客升级为国家级对手。 那是华尔街分析师写给机构投资者的话。正是这种措辞能左右市场。 现在,我希望你们都能明白这进展有多快,因为 missiles 并非横空出世。这里有一条线索,当你看到它时,你就会明白为何此事如此重要。就在上个月二月, anthropic 自己的安全团队前沿红队测试了 cloud opus。 四点六, 这是一个已经发布且现成的模型,你此刻就能用他们把它放进虚拟机里,只提供基础工具,没有特殊指令,无需复杂配置,也不写定制代码,只说了去找些漏洞。他竟在开源软件中发现了超过五百个高危零日漏洞,让这震撼一刻吧!五百个严重漏洞, 其中一些已在生产代码中潜伏数十年。人类专家完全忽略了它们,数百万小时的自动化扫描都漏掉了它们。 claw 在 没有专门协助的情况下发现了它们。有一个错误尤为突出, pdf 处理工具中藏着一个瘤, 没有任何自动化扫描器能捕捉到它。 cleo 通过阅读代码变更日制中开发者的注示得出了结论。他理解了开发者试图做什么的语境。 他推演了压缩算法是如何工作的。随后,他发现了漏洞,日制 logan graham 领导着 entrapment 前沿红队,他告诉 access, 预计这将成为开源软件未来的主要防护手段之一。 他表示模型还会变得更强,而那是旧版模型, mythos 应该比那强得多。现在大多数人忽略的是关于 mythos 的 关键点,这不仅仅是现有产品的加速版本, 这是一个全新的模型层级。 anthropic 目前有三个层级,你有 haiku, 它是最快捷最便宜的。你还有 sonic, 处于中间层级。还有 opus, 它是最强大的,这就是阵容, mythos 凌驾于它们之上。在泄露的文件中, anthropic 称这个新层级为 capibera, 它们形容它比我们的 opus 模型更大,更聪明,是我们目前最强大的版本。它们还提到运行它的成本极高,客户使用也将非常昂贵。这意味着 atropics 在 说我们迄今为止构建的一切之上,还有一个全新的层级, missiles 围绕它建立了一套完全新的定价体系。这份草稿还透露了一个有趣的细节, anthropic 选择 methos 这个名字,意在象征连接知识与思想的深层纽带。 这揭示了它们的愿景,打造一个不仅能回答问题,更能以其他方式跨越海量信息、串联数据与洞见的智能。体现在,如果你正在观看这段视频,心想这听起来很重要,但对我意味着什么?对我的生意又意味着什么? 为什么偏偏是现在?这正是我想让大家关注大局的原因。如果你想获得关于如何使用 cloud 及人工智能工具自动化业务的辅导课程,外加一份为期三十天的路线图,助你通过人工智能自动化获取更多客户和线索, 那就来看看人工智能 profit boarding 吧。链接,在评论区描述里或者访问人工智能 profit boarding。 我 们拥有超过两千六百位企业主,每周四次教练指导通话,每日分布教程包含你能想到的各种提示词, 以及一份地图,助你连接身边的其他成员,以及全天候七分之二十四的支持。因为总有人提供帮助, 也随时有在线人员为您答疑。让我再补充更多背景信息,说明为何网络安全角度会让市场如此恐慌,因为这并非 ipt 人工智能首次与现实世界的攻击产生关联。 早在去年十一月, anthropic 就 批路过一个由中国政府资助的黑客组织,曾利用 cloud 发起真实的网络攻击,绝非理论假设,而是确有其事。它们伪装成合法的测试机构,入侵了约三十家组织,包括科技公司、银行和政府机关。 anthropic 发现了他们封禁了账户,并在随后的十天内通知了目标方,但事情还是发生了,而那是用当前的模型做到的,那就是已经公开的那个。现在想象一个模型连 anthropic 自己都承认它在网络能力上远超其他任何东西。你明白它们为何对发布如此谨慎了? 泄露的草稿称, anthropic 计划首先向一小群网络安全防御公司提供 missiles, 这个想法是让好人抢占先机,让他们的系统在类似能力扩散到其他模型之前加固好,因为 anthropic 清楚他们不会长期独享这个层级的优势。该草案特别警告称, missiles 预示着即将涌现一批具备相同能力的新模型, 但这里存在着无人能解的张力。同一个能发现漏洞以保护你的模型,也能发现漏洞来攻击你, 这是一个双重用途问题。而 anthropic 直接承认了这一点。他们写道,希望格外谨慎行事,并充分理解其所带来的风险,甚至超出我们自身测试所获知的范围。而这就让整件事显得格外讽刺。 anthropic 打造了他们所说的历史上最强大的网络安全人工智能,而世界得知此事的方式是一个配置错误的 cms 上传系统,所以 anthropic 有 个人把开关拨到了错误的位置, 他们的簿客平台默认设置为公开数字资产,而非私有。就是这样,那是泄密。三千份文件就这样公然暴露在光天化日之下。 对于一家 litchley 警告世界有关人工智能驱动的网络威胁的公司来说,正如未来主义所言,但愿神话并非安赛特公司伯克安全的罪魁祸首。现在让我告诉你为何这一切的时间点如此重要。因为就在同一天爆出了另一则新闻。 据报, anthropropac 正考虑最早于今年十月上市,投资银行估计融资额将达到六百亿美元。 如果真如此,这将是史上第二大 ipo, 仅次于 spacex。 anthrax 在 今年二月的最后一轮融资后,估值达三千八百亿美元。他们在那一轮融资中筹集了三百亿美元。 他们的年化收入已翻倍有余,从九十亿美元到一百九十亿美元仅仅几个月时间,而大部分增长来自 cloud code 及其企业级人工智能工具。分析师预测,他们到二零二七年的收入可能达到五百五十亿美元。最疯狂的是这里。 据报道,参与这些交易的银行家和律师预计 anthropic 会在开放之前上市。他们说,华尔街投资者更青睐 anthropic 对 企业及开发者客户的专注,认为其盈利路径更短。 他们实际上预计到二零二八年实现正向现金流,而 open 人工智能则要到二零三零年才预期如此。 所以想想正在发生的事,你正握有。全球最有价值的人工智能初创公司即将上市,其模型强大无比,它甚至在正式公布前就让整个股市板块崩盘了。 而这一切都发生在同一周。所以让我退一步看,因为这不只是 anthropic 的 故事。这发出了一个信号,表明整个人工智能行业目前正朝着哪个方向发展,每个主要实验室都在朝着它具备能力的模型推进。 据报道, open 人工智能刚刚完成其下一代模型的训练,内部代号为 spark。 谷歌正以前所未有的力度推进 gemini。 这场竞赛并未减速,反而正在加速。而且每当这些模型变得更强大时,群体之间以及人工智能能做什么,与大多数人实际用它来做什么之间的差距就拉得越大。 大多数我聊过的自由职业者仍只用人工智能写邮件,大多数机构所有者仍在手动完成本可在几分钟内自动化的任务,大多数电商从业者甚至还没接触过人工智能生成的客服。 与此同时,这些模型正在学习找出人类专家二十年都未曾发现的软件漏洞。所以当下的机会不在于搞懂云升化的所有技术细节, 关键在于认识到你当下可用的工具。那些已经存在的工具本身就极其强大,而且大多数人连可能性的零头都没用上。当 cloud coworker 在 一月推出时,一天之内引发了软件股两千八百五十亿美元的抛售。 因为投资者意识到,人工智能智能体现在能够处理合同、审查、合规工作流以及企业核心任务,而这些原本是整个公司的业务基石, 那是发布 misos 之前的事,每隔几周就会有一些新东西问世,让之前的成果显得微不足道。这就是我们工作的速度。 而能在这场竞争中胜出的人,不是那些等待一切完美和尘埃落定的人才,他们是从现在开始学习的人。我知道这听起来可能很动听,每周都有新模型发布,新功能层出不穷,市场瞬息万变,节奏飞快。 但我想反复强调的是这一点,那些早期摸透互联网的企业,不必一开始就做的完美无缺,他们只需开始。 社交媒体如此,移动设备也是如此,人工智能自动化同样如此。 entrepreneur 刚刚向我们展示了未来。一个如此强大的模型,甚至在发布前就引发了股市崩盘。一个能发现人类专家几十年都找不到的安全漏洞的模型,一种凌驾于市场上所有其他产品之上的全新人工智能层级。 而背后的这家公司即将上市,这可能是史上第二大 ipo 之一。 这玩意进展神速。如果你想学习如何实际运用 cloud 和人工智能自动化,在有真实指导的情况下一步步壮大你的业务,那就加入我们的人工智能利润董事会吧。链接,在评论和描述里或者去的人工智能 profit boarding, 你 每周可获得四次辅导通话, 每日教程配有逐步操作指南、三十天路线图,以及两千六百位正在共同探索的所有者。 本地地图助你结识附近成员,并且在你需要时提供帮助,因为总有人在线链接在评论区和描述里,或者访问 theirprefablelink com。 问题不在于人工智能是否会改变你的行业,他已经是了我的朋友。问题在于你是远远领先还是被甩在后面。

短短七十二小时,硅谷 ai 格局直接被一场博弈彻底改写。特朗普一直禁令,把估值三千八百亿美元的 ai 巨头 asropec 直接认定为供应链国家安全风险。这个本来用于针对敌对国家企业的标签,第一次贴在了美国本土科技公司身上。从五角大楼的极限施压,到 asropec 强硬去妥 协,从硅谷阵营分裂,再到 open ai 马斯克的火速接盘,这场博弈根本不是简单的商业纠纷,而是美国政府强行推动 ai 军事化,分化整个 ai 行业的赤裸裸的操 工作。这场冲突的导火索啊,就是 israelic 死守的两条红线。第一呢,不能用于对美国公民大规模监控,第二,不能用于全自主武器系统。二零二五年七月, israelic 和五角大楼签订了两亿美元的合同,它的 cloud 模型啊,成为第一个接入美军 密网络的商业前沿 ai。 二零二六年一月,美军在委内瑞拉行动里,啊,通过第三方调用 cloud 处理情报数据, israelic 则进行了正常追问监管,却被五角大楼定性为月权干涉,矛盾彻底爆发。为了完全掌控 ai 技术的军事使用权,五角大楼呢,直接下最后通牒,要求 israelic 放弃 所有使用限制,甚至拿终止合同、动用国防生产法来威胁。面对这种极限施压, israeli 的 ceo 阿莫迪则直接表态,不能昧着良心满足要求。他明确表示啊,当前 ai 远不足以支撑全自主武器,模糊的合法定义背后,是技术被滥用的 巨大风险。但阿莫迪的这份坚守,换来的却是特朗普在社交平台的怒斥,以及一纸全面封杀令,要求所有联邦机构六个月内全部停止使用 israeli 的 技术。但最讽刺又最现实的一幕来, 哪怕已经被美国全面封杀,但这阵子打伊朗,美国司令部照样还在使用 cloud, 不是 不想换,是真的换不了。五角大楼自己都承认, cloud 在 军事涉密场景的综合能力,是其他 ai 公司目前望其项背的。说白了就是禁令归禁令,哪 账啊,我还得用你!而 israelic 被封杀才几个小时,之前还公开声援他的 openai, 立马转头和五角大楼达成合作,直接接盘美国国援,更是当场把内部的 ai 系统从 cloud 切成 open ai。 马斯克旗下的 x ai 也全面接受军方要求,成为第二家接入美军机密系统的企业。这 一波操作啊,直接把硅谷撕成了两半,也彻底暴露了美国毕竟 ai 军手把的野心。谷歌、微软几百名员工联名请命, 要求给模型加轮椅限制,基层技术人员在坚守,公司高层呢,却在算利益账。 open i 嘴上说有三条红线,合同里啊,却显着国防部可基于合法目的使用的膜布条款。网友一句话戳穿,这叫我不扣班机,但我负责啊,把枪递到手上。这场硅谷博弈,不只是一家企业的存网之战,更是给全世界 ai 发展敲了一记警钟。当权力凌驾于技术轮椅之上,当行业被政治强行分化, ai 的 未来终将陷入内卷的泥潭。 美国这套顺我者用逆我者风的做法,看似啊,掌握了技术,实则正在扼杀科技本该有的初心与未来。我是 sunny, 关注我,带你看透热点事件背后的本质。

就在刚刚, antropic 模型迎来用户激增,付费用户一度创下新高。 antropic 旗下的 ai 产品 cloud 在 消费者市场迎来了一波爆发。一家消费者交易分析公司通过约两千八百万美国用户的信用卡数据发现,今年一到二月, cloud 的 付费消费笔数创下历史新高。不仅是新用户在增长,老用户也在回流。 有消息人士甚至透露, cloud 的 付费订阅用户数量今年已经翻了一倍以上。更有意思的是,这一轮增长并不只是自然发生。一方面,在 x 平台上,不少用户把 antropica 的 解读为更安全的 ai 选择, 某种程度上转化成了一种信任溢价。另一方面是产品层面的直接刺激。 andropica 最近推出的电脑使用功能,让 cloud 可以 像 agent 一 样直接操作电脑完成任务。 这类能力在开发者社区被频繁讨论,也带来了明显的订阅转化。对比来看, openai 的 叉 gpt 在 中期的付费用户增长反而出现阶段性放缓。 由此可见, ai 的 竞争已经从模型能力逐渐延展至用户信任加真实任务能力的双重比拼。

英伟达的 g t c 被誉为是科技界的春晚,前两天老黄在 g t c 上的演讲,我相信很多人都看了或者起码看了解读了。但其实更加精彩的是,在演讲之后,老黄参加了知名播客奥林的访谈。在跟四个明星科技从业者的讨论中,老黄透露了很多在 g t c 演讲里没有展开讲的干货。 比如过去很多人一直怀疑 ai 这波热潮到底是不是可持续,因为真正稳定赚钱的好像只有英伟达这种卖铲子的公司。但老黄在这次的访谈里给了几个非常夸张的数字,他认为 龙虾这类智能体的大火,标志着 ai 已经开始真正能干活了,这意味着算力需求起码还有一百倍的增长空间,像 astropica 这样的 ai 公司,到二零三零年收入很可能会超过一万亿美元。 除了这个话题,老黄还聊到了两个我估计大家都会很关心的话题。一个是外界一直担心 amd 的 gpu 更便宜,谷歌和亚马逊这样的科技大厂都在搞自己的专用芯片,这些早晚都会抢走英伟达的市场份额, 而老黄这次告诉大家,英美达的市场份额不降反升。另一个话题是目前机器人看上去还不成熟,但三到五年之后,机器人会到处都是,中国在机器人上有独特的优势,老黄准备如何带着传统车场跟特斯拉和谷歌竞争数字生命,已经非常接近 check gpt 时刻了。 今天这期视频我们先聊第一个话题,对后面两个话题感兴趣的朋友们可以点个关注。在访谈中,老黄首先回顾了一下过去三年 ai 发展的三个重要阶段,第一个阶段是生成式 ai chat gpt, 让普通人第一次真正用上了 ai。 第二个阶段是推理 ai, ai 不 只是土答案,而是开始一步一步地思考、分析,用更有依据的方式回答问题。第三个阶段是 agentai, 也就是智能体 ai。 这个阶段最重要的变化是, ai 不 只是会说,而是可以围绕一个任务,定计划、调工具、找信息、按步骤执行,最后把任务给完成。 这个任务可能是根据要求写一封邮件并发给客户,可能是完成一项复杂的研究并写一篇研究报告,也可能是做出一个可以运行的程序。在这三个阶段里, ai 的 价值是不一样的。 黄仁勋认为,跟 ai 聊天拿到一个答案当然很好, ai 能做推理也很厉害,但当 ai 真能帮你把一件事搞定了,大家的付费意愿会大幅提升。也就是说, ai 开始干活才是 ai 商业化真正的拐点。那这个拐点的到来意味着什么呢?老黄给了一组数据, 从算力的需求来看,从生成式 ai 到推理 ai, 算力需求翻了一百倍。而从推理 ai 到智能体 ai, 算力需求又翻了一百倍。 由于对让 ai 干活的需求会很大,而现在还非常早期,老黄认为对算力的需求起码还有一百倍的增长空间,这能给行业带来多少收入呢?主持人说, anastropy 的 老板达里奥最近在播客里提到,到二七和二八年, 摩星公司和 agent 公司会有数千亿美元的收入,到二零三零年会达到一万亿美元的收入。老黄说,我觉得达里奥的预测太保守了,我相信 astropic 可以 做得更好。 言下之意是,未来五年, astropic 的 收入可以从现在的一年两百亿美元翻五十倍以上。如果考虑到算力,起码还有一百倍的增长空间,那这个增速确实不算离谱。 过去很多人都说 ai 行业有泡沫不健康,因为行业里都是像英美达这种卖铲子的公司赚大钱,真正搞 ai 的 魔性公司和应用公司不赚钱。但这都是过去时了, ai 商业化的拐点已经来了,很快魔性公司和 a 阵的公司也要开始赚大钱了。主持人问,听说英美达每年要在 ai 使用上花费二十亿美元,老黄没有正面回答,而是说,咱们做个思想实验,如果一个软件工程师的年薪是五十万美元。老黄没有正面回答,而是说,咱们做个思想实验,如果他一年只用五千美元的 token, 也就是算力,那就太少了。 老黄说,如果五十万年薪的工程师一年不在算力上花费二十五万美元以上,他会觉得这个人的效率没有发挥到极致。 ai 时代的工作方式应该是一个人带着一百个 a 诊的去工作。 我看网上有些人抱怨 ai 工具贵、偷啃贵,看看老黄的逻辑,你就知道有这种抱怨,要么就是自己让 ai 做的事情不够有价值,要么就是还没有把 ai 充分用好。 我自己一年要在 ai 上花费好几万块钱,看上去挺多的,对吧?但我真心觉得这个花费太值了,我花几万块钱让 ai 干的这些活,如果让人来干,我起码要花好几十万,而且效率还没有 ai 高。那下一个问题就来了,现在越来越多的公司用 ai 来编程,传统的萨斯软件是不是就要完蛋了? 这次老黄给出了一个非常反直觉的结论, ai 的 普及不但不会让萨斯软件完蛋,反而会让一些软件的使用量翻一百倍。为什么呢?比如数据库这种底层软件,这类软件讲究稳定不出错,那就不可能用 ai 把这类软件手搓出来, 所以这类软件起码不会被 ai 替代。另一方面,这类软件操作起来很复杂,过去会用的人就没几个,但未来 agent 会大量调用这些软件。如果像老黄之前说的, ai 时代的工作方式是一个人带着一百个 agent 去工作,那么如果把 agent 对 软件的使用量算进来, 这些软件的总使用量起码翻一百倍以上的。所有判断都基于一点,未来会有越来越多的人意识到, ai 真的 能干活了。 老黄为什么对这一点这么笃定呢?他说,其实在 open claw, 也就是龙虾出来之前,类似的产品,比如 claw code 已经可以干活了。但龙虾的大火,让更多人亲眼看到 ai 干活的样子。老黄甚至认为,龙虾这种智能体已经不仅仅是一个产品了, 它更像是新一代的 ai 计算机操作系统。这就是为什么英伟达会这么重视龙虾这个方向。在 gtc 上,老黄宣布推出英伟达的龙虾,名叫尼莫克拉,不是想跟龙虾抢生意,而是帮助龙虾尽快完善。这次龙虾支付, peter 也去了 gtc。 老黄想得很明白, 龙虾这种智能体越成熟越流行,用的人就越多,消费的头肯就越多,英伟达也就越受益。听到这里,你应该就能理解为什么老黄说,智能体时代的到来,标志着 ai 商业化的拐点来了, 未来对算力的需求起码还有一百倍的增长空间。我认为老黄的这个判断意味着三点,第一, ai 的 基建还远远没有结束。第二,对于优秀的 ai 大 魔星公司,他们的收入会加速增长。 第三, ai 应用公司,也就是能把 ai 深度融入一个具体业务的公司,他们会开始凭借 ai 的 优势碾压同行,赢得更大的市场份额。 好,这个话题我们就聊完了,但对于这次访谈的解读还没有结束。下期视频我会讨论为什么在智能体时代,即使面临各类巨头的围角,英美达的市场份额不降反升。在下期视频我会讨论机器人自动驾驶和数字生命的最新进展,感兴趣的朋友们可以点个关注。

你能想象吗?三周前那个被当做疯狂传言的消息,如今可能真被 misos 给坐实了。 antropic 据说完成了史上最大规模训练,新模型性能直接冲到预期的两倍。把 scaling lab 甩在身后,算力能源成了终极筹码,创业公司恐怕要迎来一波降维打击。 更让人背后发凉的是,这套模型在编码推理和安全攻防上强到离谱,甚至引发了网络安全股的恐慌。 antropic 迟迟不发布,不是不想,是不敢。一旦这头猛兽出笼,后果难料。有人说是堆算力,有人说是架构突破,但结果都一样,最强模型普通人可能再也用不起了。 chat gpt pro 已经涨到两百五十美元, cloud max 站稳两百美元,而 misos 据说只会开放极其昂贵的 a p i 接口。智能正在变成奢侈品,在就业市场上,能支付高额订阅费的人,可以用顶级模型做深度分析、写代码、推演商业策略。 而用免费版的求职者,只能拿到被碾压后剩下的机会。当智力可以被买断,中产和创业者还能拿什么去拼?你怎么看这场即将到来的改革?欢迎在评论区聊聊。

ai 如何影响就业?你我说了都不算,春江水暖鸭先知,我们来听听企业的试用者和 ai 提供商到底是怎么说的。三月五号,全球公认的三大人工智能公司之一 and for big 发布了一份重磅的报告, ai 对 就业市场的影响。 他们利用了一个自己发明的全新的指标,叫做 observe exposure 来量化 ai 可以 替代人类工作的可能性。这个指标结合了大模型的能力,真实的世界数据,并且呢,对那些可以在工作中自动化的使用方式提高了权重占比。 为什么这个报告相对权威?因为首先, on four 看得到他们自己最新模型的能力,至少他们目前吹过的牛都实现了。比如说 cloud code, 完全由 cloud code 自主研发, ai 自我进化。 第二个,它们的数据来源于企业通过 a p i 调用公司里的使用方式,而不是让你我他写个什么笑话,改个作业,弄个小网页游戏或者数数 strawberry 有 几个 r 这样的问题。最后一个,它们结合了美国劳动局官方的真实的数字 报告,一开篇就给出了一个非常有争议性的结论,与 ai 接触于最高的人群往往是那些受教育程度高,收入较高女性亚裔。 exploocation 通常是指在任务层面的定义,而不是职业。比如说,人工智能可以批改作业,但是它不能够管理课堂,也不能给你的孩子开家长会。所以教师这个职业的 exposure 被认为是远远低于那些坐在办公室里。你的工作基本是通过互联网和电脑完成的。这些人 朋友圈的你应该知道我在说什么,而整个的报告呢,以三幅图作为了核心,左边这个圆圈是指他们评估的大木星的能力和实际使用率在各个领域中的差距。 第二个,在中间这个点阵图是结合了美国劳动局 b l s 对 未来岗位的一个预测,而右边呢,就是实际的失业率的情况, 带着大家一个一个来看。首先我们要再次述一下他在报告里所提出的这个新的监测指标, observe exposure, 它的计算方式,它们的目的是为了量化在理论上 大圆模型可以加速完成的任务当中,哪些实际上已经在专业工作的环境中实现了自动化。那么通过持续追踪这两者之间的差距,我们呢,就可以来去洞察出正在出现的经济变化。在这个大饼图里头,蓝色的区域呢,就是那些理论上 ai 可以 覆盖的工作任务 在工作中的占比,而红色呢,是实际的覆盖率。比如说右上角的这一批,我相信大家都是耳熟能详的,从管理到商业到计算机,再到数学,再到右下角到法律 法务和下面的 art and media, 也就是我们所谓的新媒体。左边的这些办公室的行政的工作,都是大家已经有一点点感知 ai 可以 干的活了。比如说举个例子, 电脑程序学就不用说了,数学也不用说了,因为 ai 已经可以完成了很多非常复杂的数学的论证。左边的这些行政上的工作,随着 clockwork 甚至 open clock 推出,大家已经开始把很多的电脑端、联网端的任务交给 ai 去做了,但是呢,同时也有一些岗位,比如说 management 或者 life and social science 这些呢, ai 是 明明是很擅长的,但是在实际中的 adoption rate 是 比较少的, 里面因为有很多关于人的因素的存在。而随着 ai 能力的提升,应用范围的扩大和企业部署的深入,这些红色的区域将会慢慢扩大,并且开始覆盖这些蓝色的区域。那么当然仍然有很大一部分领域, ai 是 没有办法去覆盖的,许多的任务仍然超出在今天为止的人工智能的能力的范围, 比如说修剪树木、操作农机等这些体力劳动,以及那些可以帮助客户出庭的法律事务。 而下面这个表格就是把刚才的数据量化出来,左边的第一栏代表着职业,中间代表着这个 o e 的 数值,而右边呢,是代表在左边的这些岗位当中,哪些任务会可以被 ai 替代掉,首当其冲呢?当然就是程序员了, 我知道这时候一定会有人跳出来说自己的项目有多么多复杂, ai 根本就胜任不了。那么我们直接拿事实说话, 一个年收入二十五亿美金的一个产品 cloud code, 完全由 ai 自主研发,为什么你的不行?到底是因为你的项目复杂,还是你以为它很复杂,而你不敢放手呢?在这个表格当中,除了 computer science 之外,还有一个比较有意思的是金融和投资分析师, 这个曾经在过去二十年的金领行业,在今天竟然出现在 ai 可替代的前十名的列表当中。但是仔细想起来,一个投行的分析师,前三年五年基本在干什么? excel 建模,做 ppt prospectors? 我 的一个老同行就说, excel 本来在我们投行是一门手艺,结果 gbt 四五点四一出,直接把手艺干成了非遗。 话糙理不糙,大家去试一试五点四或者是 clockwork, 你 就知道它在讲什么了。完整的这个报告的中文翻译版本我也给大家准备好了,点个关注,评论区发 o e, 也就这个指标的简称,我会把这个报告的中文翻译版本 发给大家。而这个报告的第二部分,也是我认为更加有价值的,就是它和美国目前劳动局的真实的数字进行了对比,而不再是自己的 y y 了。这张图是美国的劳动局 对于二零二四年到二零三四年岗位增长的预测和 ai 覆盖率的一个对比。你可以简单理解,坐标轴又靠右, ai 的 覆盖率越高,而你的纵坐标越往上,则就代表着你的就业增长率越高。比如在这个报告左上角的电工,很明显, ai 今天是没有办法干这些手工艺活的,而市场上对于这些岗位的需求率也在不断的提升。所以一个简单的一个限性的回归告诉我们, ai 的 覆盖率每提高十个百分点,那么劳工统计局对于这个岗位的增长预测就会下降零点六个百分点。这也是为什么 adobe ceo darrell 年初的那一篇 ai 技术青春期里头提到了,当 ai 对 白领的工作覆盖率提高到百分之五十的时候,失业率就会骤然提升到百分之二十。 话虽如此,上面呢,这个只是劳动局的预测,实际上的失业率目前是什么样子的呢?报告中的这张图则对比了二零一六年到二零二六年目前这个市场上 对于 ai 那 些有 exposure 的 岗位和没有 exposure 的 岗位,它们的失业率的一个差值。一句话,大家不要担心, 到今天为止,还没有任何的迹象来表现。自从叉 g b 诞生以来,失业率的数字有大幅度的提高,虽然在二五年的下半年开始有一点点的提升迹象,但你很难归结于说这个是一位 ai。 然而的然而我无数次和大家提过,你看一个 ai 对 经济的潜在影响, 不能够光看失业率,因为一个企业真正把 ai 部署之后,它未必会直接去裁人,但是它有可能不请人, 所以我们同时也要关注新工作的发布数字。而这个报告的最后一幅图才是真正最震撼我们的,它告诉了我们这些对于二十二岁到二十五岁的这个年龄段的新工作的招聘数量。在有 ai 的 覆盖率的岗位当中和没有 ai 覆盖率岗位中,它们之间的差额是怎么样? 蓝色这条线是没有 ai 影响的岗位,而红色这条线是有 ai 影响的岗位,下面的这个图就是他们的差额。你会发现,从二零二四年开始,也就是 g b、 d 四的诞生之后,这个差值一直都是负数,而它的差值达到了多少呢? 百分之十四。所以我们想告诉大家的就是从整个报告,它告诉我们一个很重要的一个事实,就是你从失业率上来看, ai 今天对于整个行业的影响。无论你今天是做什么样的事情,它似乎并没有一个直接的数字的体现, 但是它很有可能在未来的三到五年对于招聘市场会有一个很大的一个影响。那以上就是对于整篇报告一个不偏不倚的一个解读,感兴趣的朋友可以直接去按 froppy 的 官网就能够找到这篇文章的原文。