粉丝11获赞23

ansaurus, 他 说二零二八年 ai 竞赛就结束了,您啊,有没有想过,如果人工智能的控制权啊,在未来的两年之内就彻底的改写了全球的权力格局,那么世界会变成什么样呢? 那么就在最近啊,顶级的 ai 实验室 ansaroek 就 发布了一份被称之为年度最震撼的战略的这种政策备忘录。那么这份报告啊,就直接给出了一个明确的时间节点,二零二八年。 那么 ansaroek 的 这个报告之中啊,就明确警告到,二零二八年,最具变格性的 ai 系统,甚至是通用人工智能啊,就将降临。 这不再是一篇单纯的技术论文,而是一封字里行间都充满着危机的地缘政治的宣告信。 他们啊,向美国政府和西方世界就传递了一个核心的信息,就是谁在二零二八年拥有哪怕只领先十二个月的 ai 优势,谁就能够决定未来五十年甚至一百年的世界秩序。 那咱们今天啊,用这个短视频,以实事求是的心态来听一听这份报告的核心思想。好,那咱们开始啊,一、核心的博弈,算力霸权与重塑平衡。 那么在这份报告之中啊, enzo robig 就 直接将 ai 的 战略地位等同于二十世纪的石油工业革命时期的蒸汽机,甚至是核武器。 那么报告是这样写到的,他说 ai 很 快就会强大到足以改变国家之间的力量平衡。由于 ai 的 眼睛速度是以天为单位,在跨越我们只剩下将近两年的时间窗口期,来决定这种威胁是否会变成现实。 那么报告啊,就将二零二八年的世界切成了两个截然不同的走向,咱们一起来看一看啊。那么第一种剧本就是美国及其盟友胜出,西方国家就成功的守住了算力的优势,收紧出口管制,遏制竞争对手的算法迭代。 那么在这个世界里, ai 的 规则和安全标准是由西方来制定的。那么第二种剧本就是中国实现了弯道超车, 如果西方未能堵住漏洞,那么中国将凭借着强大的工程人才和敏捷的技术捕捉能力,甚至这个追平啊,甚至是超越竞争对手。 届时,先进的 ai 模型将被广泛的用于前所未有的自动化的社会治理。 那么安苏罗伯克是有直言不讳的指出啊,中国能够咬紧技术前沿,一方面是源于顶尖的人才和高昂的资金投入, 另外一方面是通过复杂的中间渠道,越过了出口管制,源源不断的来获取英伟达等最先进的芯片,并利用大规模的蒸馏攻击,直接复制和提取美国闭源模型的创新成果。 二、利益交织,国家安全还是商业的护城河呢?但是啊,当我们逐字逐句的结构这份报告的时候,您就会发现一个巨大的利益上的矛盾, ansovarobic 是 在预测真正的地缘风险,还是在用国家安全当借口来为自己筑筑商业防御墙呢? 那么长期以来啊, enzo robig 都是闭源 ai 最坚定的捍卫者,他们在报告中啊就提出前沿模型的访问权,这个权限本身就是战略的基础设施 应当啊,就像机密一样被国家严密保护。目前安松 robert 甚至限制了普通公众访问题最先进的 mesos, 也就是神话这个模型,而把决定谁能够使用的权力牢牢地掌握在这家私人的公司里, 那么更为关键的博弈啊,就发生在开源与闭源之间。当前,以 deepsea 通一千问为代表的中国 ai 力量,正在成为全球开源和开源的这个权重的模型的领导者, 这就直接触动了闭源商业模式的蛋糕。在通常情况下,企业使用开源模型的部署成本只有闭源 api 的 十分之一,同时啊,还能够确保百分之百的数据隐私,实现本地化的安全运行。 当开源模型啊,能够达到闭源前沿模型百分之九十五的性能的时候,那谁还愿意去支付十倍的溢价呢?就如同我经常说的那样,如果您给家里的小朋友找一个家教,其实您用不着满世界去找爱因斯坦。 因此啊, ansoroabic 就 呼吁严厉的打击开源,限制技术流出的这个论调,恰好就完美的符合了他的商业利益。 通过制造战时的危机感,它们不仅能够吸引巨额的政府订单与资金,还能够在立法的层面上促成监管套利,把开元 ai 直接定义为危险的武器。 三、无法回避的灰犀牛,台湾半导体的产业链条那么在这场算力的战争之中啊, ansaro big 的 整篇推论其实都是建立在一个脆弱的假设之上, 那就是到了二零二八年,西方的算力联盟必须绝对的稳定。然而, 他们对于这个联盟最大的七寸,也就是中国台湾表现的最为隐晦和回避,在这个技术体系之中,算法和算力其实早已经无法分割,更庞大的算力就意味着更多的实验,更快的迭代,以及 ai 辅助芯片设计的良性自我循环。 而这一切硬件的物理基石就是由阿斯麦尔的光刻机,高带宽内存,也就是 hbm 以及台机电所共同构成的。那么目前啊,全球超过百分之八十的最先进的半导体芯片都来自于台湾, 这就意味着只要台湾的供应链发生一丝一毫的震荡,全球 ai 产业的引擎就会瞬间的熄火。 那么中国大陆啊,甚至不需要采取激烈的手段,仅仅通过局部封锁或者是贸易制裁,推高航运的保险成本,就足以扼住全球科技巨头的咽喉。 那么对比现在全球百分之二十的石油流经霍尔木兹海峡所引发的危机,那么百分之八十芯片的集中度只会让这个后果更加的惨烈。 那么随着中国这个本土半导体生态的加速自研,其对外部供应链的依赖每降低一分,那么地缘政治的战略杠杆就会向其倾斜一分。那么咱们最后就总结一下吧, 被算法绑架的军备竞赛。那么这份备忘录啊,就彻底的揭示了 ai 工业最深层次也最无奈的悖论。 各大 ai 巨头都在口头上都在警告他们说 ai 充满着未知的那种毁灭性的风险,我们必须极其谨慎还放慢脚步, 但在这种地缘的重压之下,他们行动却变成了他们说对手正提着刀在后面追赶,我们必须不惜代价拼命的加速 这种不加速就会被淘汰的灵活博弈的思维,正在将全人类卷入一场无法踩刹车的 ai 军备竞赛之中。 到二零二八年,当 ai 开始具备自我编写代码、自主修复漏洞以及自我设计下一代芯片的递归迭代的能力的时候,哪怕两个月的领先优势,都会在指数级增长之中成为无法逾越的技术鸿沟。 那么现在的 ai 竞争早已经超越了当年的互联网爆发的信息革命,它是一场融合了核工业初期的军备竞赛,工业革命时期的生产力颠覆以及二十世纪石油争夺战的那种综合体。 而这一切,都要在二零二八年之前,在这一年半之中啊,这个人类需要想出一个解决的方案。

今天非常兴奋啊,花了十个小时时间读了一本书。这是 nzpl 的 官方发布了一份创始人手册,三十六页的英文原版,应该说是迄今为止关于 ai 原生公司怎么做最权威最一手的官方文件。所以呢,我就做了一版深度的解读,把它扩充到了八十页。 在这本书里面呢,他有个观点,就是 ai 正在重新决定创业公司到底怎么诞生。像过去呢,创业的路径默认他是这样的, 先验证,然后融资,招人,造产品,再融资,再增长,再招人,这样不断的去重复。但是二零二六年以后,过去一个很大的团队才能完成的活,现在创始人一个人就能搞定。第二个观点呢,就是创始人是干什么的?这个事情彻底变化了, 以前呢,创始人都是执行者,你要干很多事情,但是现在呢,所有的执行工作基本上都可以交给 ai 去执行,那么创始人就变成了一个编排者。这本书呢,它还揭示了一个 ai 的 原生公司,它的四个阶段, ai 到底怎么能够帮助你,从你的想法开始,到底有一个 mvp 的 产品, 然后到你正式的产品发布,到最后的做大做强,每一个阶段 ai 怎么帮助你都写的非常清楚,你打一个创始人手册,我把这本书送给你。

又出大事了啊!五月十一号晚上, anthropic 发布了一份声明,所有未经董事会批准的 anthropic 股权转让一律 void 取消。就是,即使你买了,你也不是股东。 x 上有人在发推啊,十二个小时浏览过万,他的核心情绪,一句话就是,普通人没资格参与 ai 的 财富浪潮。 为什么这件事很重要呢?因为三天前,就是五月八号 all in podcast 那 一集,里面一位嘉宾叫 david sex, 前白宫 ai 政策顾问。他在节目里刚说过一句话,按当前的速度, and thorpe 可能成为人类历史上最强大的垄断企业。 三年前,一个预言,三年后,一个时政,完美对上 sex 那 句话,很多人转发,很多人剪辑,但是很多人都漏了一件事儿, 他在讲一个百年前的故事,他在告诉你, antarctic 可能正在用一种你看不见的方式,建一种垄断。那段视频呢,我看了三遍,每一遍我脑子里都冒出同样一个问题,就是如果他说的是真的,那 antarctic 身上发生过哪件事是可以做证据的呢? 上期视频结尾呢?很多朋友都想看 all in podcast 那 一集的完整拆解。今天我们来兑现,今天我带你领略一百年前的标准石油,再讲讲它的安全石油思想实验。 anterf 过去三年具体做过哪些事,可以跟历史一一对应上,大家坐稳扶好,先赞好看,好运不断。 要听懂 david x 那 四分钟呢,必须要先讲一个人,叫张 d rockefeller, 中文翻译呢,就是洛克菲勒,他不是建洛克菲勒,中心那个,是他爹。这个人可能是美国历史上最不讲武德的一个垄断者。 一八七零年,他创办了 standard oil, 中文呢,叫标准石油。起家很简单,做炼油生意。当时美国发现啊,石油不到十年,整个产业还是乱的,每个州都有独立的炼油厂,大大小小几百家。 洛克菲勒的打法,不是把炼油效率做到最强,是把整个产业链都买下来。第一步,跟铁路公司谈判,所有把石油运到他炼油厂的列车,给他打折,别家不打他从源头就比所有人的成本低。 第二步呢,用这个成本优势,把附近所有独立炼油厂油价压到亏损,然后呢,挨家挨家收购。第三步,控制管道。第四步,建立零售网。用这四步呢,到一八八零年,也就是十年的时间,标准石油控制了美国百分之九十的炼油能力, 这是什么概念呢?换成今天的画面,大概就相当于谷歌控制了百分之九十的搜索市场,加上 amazon 控制了百分之九十的电商市场,加上 microsoft 控制了百分之九十的操作系统。三个加起来,但是同一家公司,全美国的灯油,一家公司决定卖多少钱。 洛克菲勒那个时候还有个外号,叫美国最被恨的人,媒体常年骂他。国会在一九八零年通过了一个新法,叫希尔曼反托拉斯法,是美国历史上第一个反垄断法。 这个法基本就是为洛克菲勒这一个人写的。一九一一年,美国最高法院判决标准石油违反反垄断法,必须拆分,拆成了三十四家公司。 在这三十四家里面呢,有我们今天熟知的艾克森,有美孚,有雪佛龙,今天美国前三大石油公司是标准石油拆出来的, 反讽的是,拆完三十四家,到今天加起来还是世界最大的石油巨头集合。洛克菲勒建的那个产业结构,一百年后还在运转。 反垄断没有真正杀掉标准石油,只是把他的尸体切成几块,每一块呢,又独自幸福的活着,这个就是真实的历史。 david sex 在 all in podcast 讲的是从这段历史出发的一个思想实验。 sex 说呀,洛克菲勒的 pr 做的太差了,就是这个公关。标准石油这个名字本身就是告诉大家,我要让标准只有一个这个名字,就是在邀请反垄断诉讼。如果洛克菲勒懂 pr, 他 就不会叫这个名字。 萨克斯说,如果费克菲勒知道怎么做品牌,他应该把公司叫做 safe oil, 就是 安全石油。我们停一下,品一下这两个名字啊。标准石油透露的是控制感、掌控感,安全石油透露的是关爱感,一个呢,让你想到垄断,另外一个呢,让你想到母亲。 同一家公司,如果叫法不同,官感是完全反转的。 davidson 说,安全石油这个品牌本来就有理由。煤油灯是危险的嘛?一百年前,煤油是家里最重要的能源,冬天取暖,晚上点灯做饭,烧火,全靠煤油。 但是煤油呢,也是危险的,会着火,会爆炸,一旦使用不当,就能烧掉整栋房子。洛克菲勒如果叫安全石油,他可以从这个真实的危险出发,讲一个全新的故事。 煤油是危险的,所以我们要保护消费主义,我们呼吁政府依法监管煤油安全。 next 说,洛克菲洛应该主动出击,主动给政府写信,主动呼吁创立一个煤油安全监督局。我打个比方,就相当于你卖一个东西,你主动呼吁政府成立一个监督机构来管你 听起来很反直觉,但是里面有玄机啊。萨克斯说这个监督机构成立以后呢?所有人会陷入一场漫长的辩论。这个辩论的主题是什么叫煤油安全? 媒体会讨论灯芯应该多粗才安全?学者会讨论煤油的纯度标准应该是什么,国会会讨论哪些独立炼油厂不够安全,议会会讨论是不是要把那些小作坊,也就是洛克菲勒的对手们按不够安全为油淘汰掉, 所有公众的注意力会被锁死在这场安全标准的辩论上。而洛克菲勒自己会被认为是主动呼吁监管的好公民。媒体会从骂他变成赞美他,因为他这么关心消费者,这么愿意配合监管他不像那些危险的小炼油厂,他是责任大的公司啊。 再次说,这个时候发生了一件神奇的事,洛克菲勒没有让出任何控制权,他仍然在收购对手,他仍然在建立产业链,他仍然在和做原来一样的事。 只是舆论的焦点从他身上转移到了灯芯粗细,国会的注意力从他身上转移到哪些小炼油厂不安全上,而那些小炼油厂本来就是他要消灭的对手。 监管以安全为名帮他清理了塞道。等到大家反应过来,标准石油或者用萨克斯化石石油已经成为一家合规的玩家,因为只有他大,只有他的资源做到了完整的合规体系, 小对手做不了这么繁琐的安全测试,做不了这么贵的许可证,做不了那么复杂的合规文档,所以被淘汰。区别是,本应该被洛克菲勒淘汰,但是监管是洛克菲勒自己呼吁来的。 sax 讲完这个思想实验,最后加了一句,这是四分钟里我最难忘的一句。他说如果洛克菲勒真的这么做了,人们今天可能会把它叫做有效利他主义者。 这句话是 all in podcast 里面一级最毒的一句。有效利他主义,英文叫 effective altruism, 是 硅谷过去五年最流行的一个词,意思是用理性的方式做最有效的好事。 sex 暗示一个真正的垄断者,如果懂得包装,可以被时代误读为利他主义者。 在这四分钟的视频里呢, sex 没有一次提到 and for tech 这家 ai 公司的名字,但是所有人听到这段都在想同一件事,他在讲谁。 如果看到这里,觉得内容蛮有趣的,记得点赞收藏一下。这期信息密度呢,比平时要大,如果觉得有价值呢,也给我点个赞,让算法把这期推给更多想看产业深度的人。 接下来这段呢,我把 antobe 过去三年具体做过的事一项一项列出来,我们来对比一下,跟历史有多么的相似。然后最后你自己来判断。 sex 那 段。四分钟没有点名,但是 allen 的 另外两位主持人 brad 和 chamas 他 们都听懂了 sex 的 案是什么, 他们的反驳呢?我们后面再讲。前后一共是七件事,我们一个一个来讲,第一件就是宪法。 ai 发生在二零二二年的十二月份, antobe 发布了一篇论文,英文标题叫 constitutional ai, 翻译过来就是宪法 ai。 简单来说, on top, 用一套写成文学的原则来训练 call 的 安全行为,让模型对照一套类似宪法的文档,决定自己什么能说,什么不能说。 这是行业第一家这么做的公司, open i 没做, google 没做, mate 也没做。技术层面是真的。论文呢,我们也大概读过,是一篇值得研究界讨论的论文。但有意思是,宪法 ai 这个词本身就有非常强的品牌感。 宪法在英文语境里是国家最高的法律啊。把一家 ai 公司的训练方法叫做宪法,本身就是暗示一种特殊的高度。 sex 视角是,这是安全石油品牌的第一步,用一个有道德分量的词抢占负责任 ai 的 序势。 反方的视角呢?这是真的技术突破。名字只是名字,不要过度解读,咱们先不判断,继续往下看啊。第二件事,就是负责任的扩展政策。发生在二零二三年的九月份, andorpha 发布了一个东西,英文叫 responsible scaling policy, 中文翻译就是负责任的扩展政策。 andorpha 公开承诺,当 ai 模型的能力达到某个门槛,它会自动停止暂停扩展,直到证明这个能力是否安全为止。 用人话就是 adopro 公开承诺,我们做的太强了,但是呢,我们会自己刹车。这个又是行业的第一家,他们的原话是,我们希望这个政策成为行业标准,所有的 ai 公司都应该公开这样做承诺。注意,这句话成为行业标准,这是关键啊。 回到 sex 视角, andorpi 在 主动呼吁行业监管,但只对大模型有约束力,对小公司宽松,因为小公司还没有达到那个能力门槛。意思是监管标准是按照 andorpi 的 能量线划的,那条线以下的对手呢?不受约束。 这件事还有一个伏笔,就是二零二六年的二月份。三个月前, andorpi 更新了政策三点零版本,公开承认。原来那个自动暂停的承诺在实际操作中遇到了问题, 他们给的理由是集体行动困境。翻译成人话就是我们一家暂停了,对手不暂停,那我们就吃亏了。所以呢,暂停的承诺被停止了。三年前我们会刹车,三年后是我们也很想刹车,但是其他人不刹那,我们也就不刹了。承诺是弹性的,这是 sex 视角里最有利的证据。 第三件事,就是 ceo 多次国会作证。 entrepreneur 的 ceo 是 darryl, 叫达里奥啊。达里奥这两年出席了多场参议院、众议院的听证会,每一次都在说同一件事, ai 需要监管,需要立法,需要政府介入。 而且达里奥一直是几家 ai 公司 ceo 里面被认为最真诚的那一个。跟 offai 的 老板 sam 奥特曼同台作证的时候呢, sam 的 姿态被一些媒体批评为投机,而达里奥的姿态被普遍认为是真诚、安全的关怀。这种真诚的人设本身就是非常重要的政治资源。 萨克斯视角是,这是典型的安全石油手法,主动出击,呼吁监管,把自己塑造成配合的好公民。反方的视角呢,他真的就是一个温和内向、关心安全的科学家,不是表演, 这个到底是站哪方,大家自己心里都有数。第四件事呢,就是公开支持加州的 ai 反案。这是二零二四年的八月份。 二零二四年八月,加州州议员 scott 提了一个安全法案,编号是 sb 幺零四七。法案的核心要求是,大型 ai 模型公司必须做全安全测试,必须报告风险,必须出问题呢,要承担责任。 这个法案当时几乎所有的 ai 公司都反对, open ai、 google meta y computer 全都反对, a 十 u z 也反对。只有 antropic 表态支持, 不是完全支持啊。达里奥在给加州州长 newson 的 信里写的,有条件的支持。我们认为修改后的 sp 幺零四七好处大概率大于成本,但是有一些方面呢,让我们很担心。 但这种有条件的支持,在那个时候的行业氛围里,已经是巨大的政治信号了。一家 ai 公司公开支持一个所有同行都反对的监督法案。 回到 david sachs 视角呢,他说这是安全石油剧本最干净的一次落地。安多贝知道自己最强的合规能力,所以支持监管,监管会淘汰合规能力弱的对手,把自己留下来。 有一个数据我们可以一起观察,就是这个法案主要影响的是大模型公司,具体定义呢,是训练成本超过一亿美金的模型。这条线把 antropic、 open ui 都划进去,把百分之九十九的中小 ai 公司呢划在外面。也就是说,这个法案对前几家最大 ai 公司是约束,对中小公司是免疫。 大公司之间的对比, antropic 的 合规体系最完整,法案如果落地, antropic 受影响最小,大家可以品一下这里面的竞争关系。 第五件事,就是用合同条款来封对手。这是二零二五年六月份开始的,从这件事开始,从趋势呢就转到了行为啊。二零二五年六月十七号, antarctica 悄悄更新了自己的用户服务条款,加入了一条新条款,客户不得用 cloud 开发竞争产品, 也不得用来训练竞争模型,也不得逆向工程。本服务。六月十七号,这条条款生效。八月一号,也就是不到六周之后, antofic 直接砍掉了 openai 的 code 使用权限流逝, openai 违反了那条条款,他用 code 来做 gpt 五的堆造测试。 这件事的关键呢,不在逢是在六月份写条款,八月份就用上了一个月前还没有的条款,一个月之后呢,就变成了禁封的证据。这是典型的立规则的人,也是用规则的人的证据。 sex 在 波克里直接说了一句话,这是反竞争行为。你能想象 anto 为什么要禁 open i 使用它的模型吗? 而且呢,这还不只是第一次啊。二五年六月,一家 ai 写代码工具公司叫 windsor, 被传 open ai 要收购他, andorbic 当天就砍了他的 call 权限。 windsor 的 ceo 去理论啊, andorbic 的 首席科学家当场说,我们卖 cloth 给 open ai, 这听起来很奇怪。 二零二六年四月,一个开源工具 open call, 这个我们都讲过啊, antropy 也砍了他的使用 call 的 订阅权限。二零二六年五月初, antropy 又通过一家叫 cursor 的 编程工具,切掉了 x i 使用 call 的 渠道。 十一个月内四次封禁,每一次都是 antropy 说了算,理由都是违反服务条款。服务条款呢,是自己写的。 如果说五件事都是把对手挡在门外,那第六件事就是把所有人都挡在门外。五月十一号晚上, on topic 在 官网公布,所有未经董事会批准的股权,股票出售和转让一律无效,不会被记录在我们的账本上。 这个词是无效,英文是 void, 不是 voidable。 void 的 意思是本身就是无效的, voidable 是 可以被撤销。 两个词是有法律巨大的差异的啊。 void 这个词在美国 delaware 州的工商法含义非常严格,意思是这个交易从一开始就不存在, 买家没有任何的法律保护,没有任何的追索权。 anddoric 点名了八家平台啊,看看你们自己的 vc 在 不在上面啊。 open doors, partner, unicorn exchange, pachama capital, lying car venture, sandicart, upmarket, 还有两家 forge global 和 have, 这两家呢,是美国最大的最合规的私募股权二级交易平台。在 forge global 上, andorpi 的 引韩估值五月初已经达到了一万亿美金,超过 openai 的 八千八百亿。 forge global, andorpi 不是 灰色地带,他们是合规的,受监督的平台。 andorpi 一 句话把两家正规军也定为未授权。接下来就是余震啊,一个叫 prestock 的 代币平台上挂钩, andorpi 代币二十四小时之内从一千四百美金跌到了九百美金,暴跌百分之三十六。 这件事呢,在案上也是非常引爆讨论啊。普通投资者也意识到,我们这种人本来就只能在二级市场上间接买这些 ai 公司,现在连二级市场也要被废掉了。开头提到那个 x 贴文呢,他说 antropic 真不讲武德。 ai 正在创在史上最大的财富浪潮之一,但像你我这样的普通人,根本就没资格参与。下面还有一条回复更狠啊,一级市场早就把肉吃完了,二级市场连汤都不给我们留,这就是资本的游戏规则。 美国 delaware 律师 gabriel 直接发文警告,这个动作可能引发大量的集体诉讼。很多人在 fortune global 和 have 上买过的投资者,他们以为自己合法持有 anthurpe 的 股份,五月十一号之后,他们的持股在 anthurpe 的 账上根本就不存在。他们官方的理由是什么呢?防止欺诈和保护投资者。 这听起来是不是非常的熟悉啊?这就是安全石油剧本的现代翻译,为了保护你,我废除你的交易。前面这件事讲完呢,你已经能看出图案了啊。第七件事呢,就是 mexico 的 选择性发布。 三个月前, antarctica 发布了新模型,叫 mexico。 我 们讲过啊,这个模型不公开,只给指定的合作伙伴看,能力很强,尤其在网络安全上。但是 antarctica 呢,不让他进入公开市场。 sex 视角是选择性批露,等于控制能力分发。这件事争议比前六个小,但是呢,也是值得记下来的。总结下来,前四件事是蓄势 宪法, ai 负责任扩展政策,国会作证,加州法案支持。后三件事呢,是行为禁封系列无效的声明,还有 methods 选择性发布 趋势是可以变的。是不是安全石油的品牌策略,每个人都得有自己的判断,但是行为,尤其是这个取消股权这一块,是标准石油手法最赤裸的现代版洛克菲勒。控制铁路决定谁能运石油, antorpe 控制股份转让限制决定谁能持股。 一百年前,物流是平静,今天呢,法律是平静,工具不同逻辑一样。接下来呢,我们来讲 all in 另外两家嘉宾 brad 和 chamas 给他的完全不同的看法和一个反驳的角度。 我们来先讲 bread, 因为他是 antropic 投资人,所以他的位置呢,是非常有意思的。他得维护 antropic 的 估值啊,又不能让 sex 垄断指控站住脚。这种立场决定他的反驳必须是非常巧妙的。他的第一层反驳很简单,也非常狠。 他说五个月前,所有人都以为是 openai 赢了。二零二五年底,大家以为 openai 已经把这场精彩跑赢了。 gbt 五即将发布, samo 奥特曼人脉最广, microsoft 投了一千多亿。二零二六年初呢,五个月共识就翻盘了。 brad 的 潜台词是五个月能从 openai 变成 antropic 赢,那 antropic 永远赢的判断是不是也可能五个月内翻盘呢? 他的第二层反驳是数据,他提醒说大家说的 andorbit 年收数据,比如说第一季度从一百亿涨到三百亿,这个数字是年化收入,意思是把当前一个月乘以十二,得到的预期数字不是真实的全年收入,容易扩大。他的原话是按照汇率准则,实际月收入呢? andorbit 和 open a 在 三月份其实差不多 都是高速成长,但是这家年化四百四十亿,那家年化四百亿,就这种差距呢?很多是会计口径的差距。但是 brad 最关键的反驳藏在另外一个地方, 它不是来反驳 antropy 的 成长,是反驳 sex 的 标准。石油类比本身,它在播课里讲了一个词叫 elon web servers, 简称 ews, 就是 翻译成马斯克云。这个词的意思是 spacex 在 五月、六月把超级数据中心整合租给 antropy 之后, spacex 已经变成了一个新的超级云厂商。 红山之本的上在节目里讲了一个五层蛋糕,意思是 spacex 现在已经叠了五层产业,第一层火箭发射,第二层 starlink 通信,第三层算力,也就是 e w s 加进来, 第四层呢,轨道数据中心,第五层应用和模型。 brad 估算,光马斯克云浮这一层,今年就给 spacex 带来四十到五十亿的增量收入。 spacex 即将上市的估值预期呢,是两万亿美金,试销率呢,四十到五十倍。而且亚马逊的云服务 aws 当年一年的收入呢,是一千五百亿,微软 azure 呢,是一零八零亿, google 呢,是八百亿,三家加起来三千四百亿。这就是 spacex 马斯克云服务盯准的市场天花板。 它反驳的核心是什么呢? ai 产业的版图不是标准,是由那种一家垄断所有产业链的格局。 ai 产业是分层的, 模型层有 android open 在 google meta 基础设施层呢,有 spacex 在 崛起。 a w s 呢?还是在主导芯片层呢?英伟达暂时垄断台积电呢,也是必不可少的环节。太空算力层呢, spacex 一 家独大, 每一层都有不同的玩家,这些玩家互相成为彼此的客户,互相成为供应商。 android 想垄断他得求 spacex 的 电,求英伟达给他芯片,求 aws 给他云。 spacex 想要垄断呢,他得求集电给他新建,求政府给他发射许可,求 anthon 给他模型声明。 brad 的 潜台词是不是一个洛克菲勒,是五个洛克菲勒互相的牵制。 但是这里必须补一句啊, brad 这个反驳呢,有一个软肋,就是五月十一号的无效证明,直接就打到了这个反驳上,因为五个洛克菲勒互相牵制,前提是他们之间有市场化的股权流通,投资人和退出市场之间必须能自由交易。 五月十一号之后呢, antovay 把这种流通直接关掉了,这已经不是模型层的垄断,是更深一层的垄断,资本层流的垄断。下面呢,我们再讲讲 chasm。 chasm 跟 antovay 没有直接的持仓关系,它的位置呢,比 bread 可以 更正立,它没有完全同于 sex 的 观点,也没有完全同于 bread。 他抛出了两个独立判断。第一个判断,我觉得是这一整集里面意义最深的一句话。他说 antob 和 open i 的 营收表现跟需求一点关系都没有,零,完全是供给的限制,如果他们有无限的电,营收曲线还会更陡。 听了三遍啊,真的是有一点浑身不舒服啊。可以有三层解读,第一层就是 antob 看起来在指数增长,一季度年化三百亿,四月年化四百四十亿,这种增长曲线让所有人以为 ai 需求大爆炸。 第二层呢, chamas 说错了, adobe 不是 卖的多好,是能交付多少,他的服务器有多少卡,能跑他的店够不够烧,他就能服务多少客户。第三层呢,是 adobe 的 客户队已经排的比交付能力长很多。所有那些用 cloe 超限的吐槽,本质上不是产品不好,是算力不够用。 上期视频我们讲了三个字的框架,电、地轨, ai 产业真正稀缺的三个资源。 chamas 这句话给我们一个更深的解读,就是 ai 公司的收入本质上不是市场决定的,是发电厂决定的。 这里呢,它再添了一根柴,是美国今年应该上线的九个计瓦。算力的供应大概一半已经被各地环保团体抗议了。 历史规律告诉我们,这种抗议最后多数会让数据中心建不起来,算力供给呢,会比预期更紧张。接下来十二到二十四个月,电够不够烧,决定 antarctica 能不能够继续 sex 说的那条曲线。 第二个判断呢,就是他说的五百天倒计时,他说现在到五百天后,必须有一个清算时刻, 大概就是一年半啊。 chamas 说, ai 产业目前已经完全走了前两步,第一步呢,是基础设施的投入,已经投了几千亿完成了。第二步呢,就是模型公司的收入已经兑现完成了。第三步呢,就是企业回报,也就是企业花钱买 ai 之后,有没有真的看得到经营效率提升。 这一步还没有完全兑现。陈 max 说,你看美国标普五百上市公司的整体经营利率,三年时间从百分之十一点八涨到百分之十三,涨了两个百万点。说这是 ai 贡献的,陈 max 说,他不确定这可能是新冠之后整个产业瘦身的结果。 五百天后,必须有数据证明 ai 是 真的提升了利率,而不是 capx 花掉了的钱。如 如果证明了的话,哦,那 antarctica 万亿之王的预期可能成立。如果证明不了,所有 ai 公司估值都要被重估,包括 antarctica。 还有一个最后的变量。萨克斯自己都承认啊,它在节目里说 open i 已经成功转型了。 open i 的 新一个代码模型呢,叫 codex, 基于 gpt 的 五点五。 而 gpt 的 五点五又基于一个新的基础模型,外号叫 spot, 翻译过来叫土豆。节目里三位嘉宾都承认 open i codex 写代码能力已经开始追平 coco 了。在 i 上也看到很多人都持相同的观点, 写代码这一块是 antropy 的 主战场啊,它百分之七十以上的收入来自写代码业务,如果 open i 追上,那它的主战场就会被挑战。整理一下今天讲的三件事啊,第一呢, sex 的 安全、石油四项实验,不是骂 antropy, 是 给所有人一个新的视角,看 antropy 的 安全趋势。 第二个就是 antropy 过去三年的七件事,四件是趋势,三件是行为里最关键的是过去十一个月的次次封禁,加上三年前的那次股权无效声明。 第三个呢,就是凹印桌子上三个人的三种判断,他们都同意 adobe 增长曲线是硅谷历史上没见过的。 那现在把这个判断交给大家。接下来十二个月,如果你在新闻里看到 adobe 做了下面的任何一件事,你都可以多想一下,比如说又主动呼吁政府监管,比如说又支持某个对中小公司有约束的法案,比如说又有一条新的规则挡住了一群人。 这些事每一件单独看都可以解释的清,但是放在安全石油这个剧本里,它可是连续剧的剧本啊!正所谓都说擂台模型狂,不知化妆术更强,百年油桶换新装,标准石油又登场。 下面两个问题给大家,第一个,你觉得刚才讲的这七件事,哪一个最像安全使用的剧本?第二个呢,就是我们讲的马斯克云服务,其实奥尼尔那集还有一个全网都没有人捡的角度,就是 chamas 和 breath 两个人在桌子上呢,给 spaces 的 估值给了一个让人非常吓一跳的数字, 如果想专门看 spacex 到底值多少钱,马斯克云服务怎么改变估值?评论区扣一个马斯克云告诉我,我们做好足够的背景调查呢,就给大家做这期视频定位这个频道,打开小铃铛不错过下一次更新,我是艾伦,看完再赞,要查房管,我们下期视频再见!

五月六号 angelopik 发了个东西叫 dreams, 让 ai 诊自己做梦,整个 x 圈都炸了。但我当天扒完 cloud code 的 原码,发现一个更有意思的事实,做梦这件事,有三派人,几乎同时用三种完全不一样的方式在做,不是谁抄谁, 是对梦是什么。这个问题,他们有三种不同的理解。先说 agent 做梦到底在干啥?你想想人为什么要睡觉?白天你脑子里塞了一堆乱七八糟的东西,晚上睡着之后,大脑会把这些东西塞一遍, 重要的留下,没用的扔掉,相关的串起来。 agent 也一样,他干活的时候一直在往妹妹里写东西,干久了那堆东西就烂了。 你问他项目用什么语言,他能给你三个互相打架的答案,这就叫记忆腐烂。做梦就是让他自己睡一觉,把这堆东西清一遍。这三派人谁先谁后?你以为 entropix 发明者, 其实是迟到者。 hermes 二月份就开园了, openclock 三月底开园, entropix 五月六号才发闭园版,晚的不是开园,是闭园。 entropix 的 梦最克制, 他叫 auto dream, 做梦有严格门槛,二十四小时加五次绘画才做一次。门槛以下不让做,因为做梦本身是要花钱的,做的时候走固定四步,先 orient, 读现有 memory, 搞清楚自己是谁,再 gather, 用关键词去历史对话里搜相关片段, 然后 consolidate 合并新信息,最后 prune 清掉,成就内容。重点在这儿,他的梦只改目录页,不改内容。 这派的哲学是能推导出来的就不存,存的是锁影,是目录,不是知识本身。一个睡得很浅,醒得很快,只整理目录的梦,第二派叫 hermes, 二月份就开园了, 比 antarctic 早三个月。这派的梦根本不是在反思,是在写说明书。 agent 每完成一个复杂任务,就触发一个叫 skill 下划线 manage 的 梦机制,立刻把这次怎么解决的过程写成一份 markdown 文档存下来。这份文档里有三件事, 什么场景该用,具体一步步怎么做,下次直接照抄。所以 hermes 的 梦不是去整理过去,是把记忆打包成未来能附用的工具。 evermind 的 danny joe 有 句话我反复看了好几遍,更好的 agent 不 来自更大的 context window, 来自对记忆生命周期的管理。 第三派叫 open cloud, 三月底开园。这一派的梦最像人,它的 agent 每天凌晨四点真的会做梦。 cron 定时出发,走三个阶段 收集、合并、评估。他的记忆也分两边,一边叫海马体存,具体事件会衰减。一边叫新皮层存,永恒事实永不过期。做梦的时候,海马体里反复用到的乔木,会被搬到新皮层,变成永久记忆。 最炸的是,这里每条记忆都有一个分数,越久不用,分数掉的越快,三十天半衰期,但你一旦用到它,分数又被推回去。这就是一百四十一年前艾宾浩斯那条遗忘曲线。 open call 直接把他写进了代码项 链数据库。做不到这件事,他只会算相似度,他不会把遗忘本身建模成能力。所以三派的梦 是三种对什么值得被记住的哲学。 ansaurpik 说,能推倒就别存梦,只整理目录。 hermes 说能附用才算记忆,梦就写说明书。 openclaw 说,该忘的让他忘,梦就该向人的梦,这不是竞争关系,这是三种根本不同的世界观。 你不用选一派,但你得知道它们都存在。你有没有想过一件事,我们从来都觉得 ai 更强,靠的是更大的模型,更长的 context, 更多的参数。 但这三派人不约而同给出了另一个答案,真正让 a 政变强的,不是他白天干活的那个循环,是他睡着之后能不能好好做梦。好啦,记得点好收藏、关注、赞,我们下期再见!

刚刚 anthropic 一 次性下场,法律行业十二个法律专项插件,覆盖商事公司隐私诉讼合规 ai 治理。再加二十多个连接器,把 cloud 直接接近律师每天打开的合同文档解锁系统 i manage doc sign 汤森路透 co council relativity 这不是又一个 ai 替律师写合同, 是 ai 厂商越过 sars 工具层直接做连接。 freshfields 实测,六周内 cloud 用量翻了五倍,卖完工具卖连接,卖完连接,下一步卖什么?


二零二六年初,一个数字让产品圈安静了五十多天,七十多个更新。这不是功能清单的胜利,而是一套发布肌肉突然漏出来。问题是,它怎么被设计出来? cat view 的 答案不是模型更强,更大的变化是流程预期和团队默认速度。第一层机制,目标先定死,不是少一点弹窗,而是谁在什么条件下要做到零弹窗。 这个定义会直接砍掉大量错误方案,让团队还没开工就已经少走很多弯路。第二层机制,研究预览先告诉用户,这是早期实验,可能会变,也可能被拿掉。 发布承诺降低,工程师就不用背三年维护债,真实反馈也能更快回来。第三层机制,常驻发布房间功能完成后,文档、市场和开发者关系马上接上,很多时候第二天公告就能出去。产品经理不是阀门,而是把管道搭起来的人。 最高效的交付单元可能不是一个小组,而是一个有产品品位的工程师。他能从用户反馈里看到机会,自己判断方案、验证、体验,几天内把功能发出去, 少一次交接就少一次信息失真,少一次等待就多一次真实学习,这不代表产品经理消失。人工智能时代的产品经理更难,职责从写需求变成设计系统。 你要判断模型今天能做什么,也要判断下一个模型会让什么工作流突然成立。第一个新技能是较准。你对模型能力的信念太保守会慢,太激进会透支信任。 第二个新技能,模型做错事时,先问他为什么再改提示词根应常常藏在解释里。第三个基本功是小而准的评测十个关键场景就能让团队看见真实进展,但速度不是免费的。 cat 误说得很直白,他们牺牲了产品一致性。 入口重叠时,用户需要引导,所以核心能力要重新排成学习路径,替用户减负。还有一个很原则,模型变强后,产品要删除。拐杖 早期补定,后来可能只是噪音。科二可演示说明了新工作流模型吃进文档、邮件和讨论记录,先展开后选方向人,再决定什么,进入最终方案。今天产品经理的价值很大一部分就在这里。 使命一致性也会提速优先,即冲突时,使命就是最快的决策工具。所以这不是一个技巧,而是一套交换系统,低承诺换反馈,少交接换交付,代价也要被管理。一致性可以牺牲一点,但用户的认知负担不能无限增加。 竞争正在变成谁学习删除重组的更快速度本身已经是产品能力。

大家好,我是 ai 启示录。最近科技圈有一个讨论特别火,火到什么程度呢?一篇来自 antropica 内部工程师的文章,在 x 平台上线不到四十八小时,就获得了超过七百八十万的阅读量,幺二零零零多次转发,二万多人收藏。这篇文章的标题很简单, 叫 html 的 不合理有效性。但它真正引爆讨论的是文章里的一句话, html 文件了,全部换成让 cloud code 给我生成 html。 说这句话的人叫塔里克希帕尔,他不是什么普通的开发者,而是 cloud 团队的核心工程师。更有意思的是,不只是他一个人这么做, cloud 团队里越来越多的人都已经放弃了 markdown, 全面转向了 html。 这个消息一出来,整个开发者社区直接炸锅了。要知道, markdown 已经统治了技术文档领域整整十年, 从 github 的 readme 到技术博客,从会议记录到 api 文档,几乎所有技术相关的文字内容都是用 markdown 写的。它简单轻量,跨平台,几乎是所有开发者的通用语言。 现在创造了目前最强编程 ai 之一的团队,自己先把 markdown 给抛弃了。这到底是怎么回事?是 markdown 真的 不行了?还是 ai 时代的工作流发生了我们还没意识到的根本性变化? 今天这期视频,我们就来把这件事彻底讲清楚。先给大家介绍一下塔里克这个人,他的履历非常有意思, mit 媒体实验室硕士毕业,是 y c w 二十批次的创业者,创办过一家游戏公司,融了一千七百万美元。 后来他卖掉了自己的 sars 产品,在一年多前加入了 entropic。 用他自己的话说,他加入 entropic 的 原因是 ai 精神病发作,觉得 cloud code 就是 软件开发的未来,于是放下一切 all in 了进来。 他在 cloud code 团队里同时负责工程内容和用户反馈三条线。我们现在用 cloud code 时非常熟悉的一个功能,当 ai 信息不够时,会主动向你提问,而不是瞎猜,就是他设计的。 今年三月份,他写过一篇关于 cloud code 的 内部如何使用 skills 的 长文,当时也在行业里引发了不小的震动。那篇文章里透露, anthropomorphic 内部有几百个活跃的 skills 在 运行,远比外界想象的要多得多。而这次他不仅写了文章, 还把自己和团队日常使用的二十个 html 文件全部开源在了 github pages 上,按用途分成了九大类,每一个都是单独的 html 文件,不需要安装任何东西,浏览器打开就能直接用。 这些案例看完,你大概就能明白为什么他们会放弃 markdown 了。我挑几个最有代表性的给大家讲一讲。第一个也是开发者反应最强烈的,给大家讲一讲。第一个也是开发者反应最强烈的代码,左边是旧版本,右边是新版本, 用加和减标记改动,如果改动比较大,文件比较多,看起来会非常累,而且很难一眼看出哪些改动是关键的,哪些是无关紧要的。他立刻让 cloud code 审查一个 pr, 生成了一个 html 页面,这个页面里有完整的 pdf 渲染。 但和 github 不 一样的是,每一段改动旁边都有内联注示,而且每条注示都按严重程度做了颜色编码, 红色是必须修改的 blocking 级问题,黄色是值得一看的。建议绿色是写得不错的地方。最绝的是页面顶部有一张风险地图, 六个被修改的文件用不同颜色标注了风险等级,你扫一眼就能立刻知道应该重点审查哪个文件。页面底部还自动生成了修复建议清单。 他立刻说他现在每次 t p r 都会附页的 diff 式图好得多。 原因很简单,代码的 def 本质上是空间信息, markdown 把它压平成了一维的文字,而 html 能把它还原回二维的空间结构。第二个例子,交互式技术教程。如果让 cloud 用 markdown 解释一致性哈希这个概念,它大概会给你写两页干巴巴的文字,再加上一张用 s k 字符画的圆圈。 你得一边读文字,一边在脑子里想象那个哈希环的结构以及节点增减时, key 是 怎么重新分配的。但换成 html 之后,情况就完全不一样了。它里可展示的这个一致性哈希教程页面上直接画了一个可交互的环, 四个节点,三十二个 key 分 布在环上,每个节点用不同颜色标注它管辖的弧段。你可以点击加一个节点或者删一个节点的按钮, 实时看到 key 的 重新分配过程。旁边还有一张对比表,清晰地展示了传统的 hash model n 方法和一致性哈希在节点变化时的数据迁移量差异。页面底部是一个悬停高量的术语表,鼠标移到哪个术语上,就会显示对应的解释同样的内容,一个是让你读文字然后脑补, 一个是让你直接操作和观察哪个学习效率更高,不言而喻。第三个也是我觉得最有启发性的一个概念, 用完集气的编辑器。比如你有二十四个公单,需要重新排序。如果用传统的方式,你可能会在聊天框里一条条告诉 ai, 这个放第一位,那个往后挪两位,这几个先不做。或者你会打开一个 markdown 文件,手动调整列表的顺序。但塔里克的做法是让 cloud code 直接生成一个 html 文件, 每个工单是一张可拖拽的卡片,页面上有,现在下一步稍后砍掉四列。 cloud 会先用自己的判断做一轮域排序,你只需要做少量的拖拽,微调 调完了,点一下底部的复制为 markdown 按钮,就能导出最终的顺序。再比如微调系统提示词, cloud 会生成一个左右对照的编辑器, 左边是可编辑的提示词,变量槽位会被高量显示,右边实时渲染三个样例输入的效果。底部还有字母和 talk 计数器。这些工具不是什么复杂的产品,也不是可附用的,组建它们就是为当前这一个特定任务量身定制的,用完就扔的单 html 文件, 任务完成了,这个文件也就没用了。更关键的是,这里面引入了一个非常重要的概念,双向交互 h t m l。 文档不再是只读的了,你可以在页面里进行操作。 ai 生成的滑块、旋钮、拖拽区域都是活的, 你调完参数之后,点一下导出按钮,就能把结果转换成文本,再粘回 code code 继续干活。这样就形成了一个完整的闭环,人给 ai 指令, ai 生成 h t m l。 工具人在工具里操作调整,然后把结果导回给 ai, ai 再继续执行。 在这个壁环里, ai 深沉的不再是文档,而是工具。除了这三个核心场景,塔里克的案例库里还有很多有意思的用法。比如周报,不再是干巴巴的文字列表,而是配上小图标和彩色时间线, 经理周一早上扫一眼就够了。比如实施计划,把时间线、里程碑、数据流图、内联、圆形图、风险表全部塞在一个页面里。 markdown 写的计划是说明书, html 写的计划是仪表盘。还有设计系统格式化, cloud 可以 直接读取代码库,把颜色变亮,渲染成色板,把组建的所有尺寸、状态、变体铺在一张表上。 还有动画原型,你可以拖动滑块,调整缓动曲线和动画时长,调完参数,一键复制回代码。甚至还有用单个 html 文件做的换帧片,不用打开 keynote, 不 用导出 pdf 浏览器,打开就能演示。看到这里,很多人可能会问, markdown 到底怎么了?它不是挺好的吗?为什么突然就不行了?塔里克的判断建立在两个非常关键的变化上。第一个变化是 ai agent 的 输出越来越复杂。 一份超过一百行的 markdown 文件,他坦言自己读不下去,也别想让团队里的其他人读下去。这其实是一个非常普遍的痛点。现在我们用 ai 写东西,很容易就会得到一份几百行甚至上千行的文档, 一份技术方案。 ai 可以 把背景、目标、设计、实现、测试风险,全部给你写得清清楚楚,看起来非常完整。 但问题是,你真的会从头到尾读完吗?大多数时候,我们都是打开扫一眼,觉得大概没问题,然后就让 ai 继续执行了。 不是因为内容不好,而是因为它太长、太平、太相近,读文字强了。 markdown 的 表达方式是现行的标题下面是段落,段落下面是列表,列表下面是代码块, 短的时候很清楚,一长就非常考验人的耐心。第二个变化是,人们越来越少亲自编辑这些文件了。规范文档、参考资料、头脑风暴的输出,大多数时候都是让 cloud 来写。 真要改的时候,也不是自己打开文件一点点改,而是继续对 cloud 说,这里改一下,那里重写一下。很多文件从头到尾,你可能一个字母都没有亲手敲过。这就意味着 markdown 最大的优势一,编辑被彻底架空了。 markdown 统治开发这工具链十几年,靠的是一个核心。假设 人要亲手编辑文件,所以它的所有语法设计都是为了让人类用手指打字的时候更方便。标题用简号,加粗用加粗,符号,列表用横杠, 所有符号都在键盘上触手可及。但当写文件的人从人变成了 ai, 这个假设就不成立了。对于 ai 来说,写 html 和写 markdown 没有本质区别,甚至 html 能表达的东西更多。 而对于看文件的人来说,有颜色、有布局、有交互的 html 阅读体验显然比纯文本的 markdown 好 得多。还有一个容易被忽略的好处是,分享 markdown 文件。 大多数浏览器原生渲染效果都不好,你通常只能把它当附件塞进邮件,或者贴到飞书、 notion 这样的在线文档里。而 html 只要传到 s 三上就有链接,同时在哪里都能打开。 他立刻说,如果你的方案是 html 格式的,别人真的会去读,它的概率比 markdown 高得多。当然, html 也不是没有缺点。 塔里克自己也承认,深沉 html 的 时间比 markdown 慢二到四倍,版本控制的迭幅乱的没法看,而且确实更费头肯。但他提出了一个非常有力的反问,你真的会去读 html 深沉的东西,而 markdown 的 长文档大概率你划两下就关了。 读了和没读,这个差距可比那点 token 效率大多了。换句话说,当平静从 token 数量变成了人的注意力,格式的选择,逻辑就彻底反转了。这件事在网上引发了非常激烈的争论,迅速分成了针锋相对的两派。一派是坚定的 markdown 党,觉得 markdown 才是 ai 时代的原代码。另一派是 h t m l 党 觉得塔里克发现了一个了不起的真相。但在我看来,这场争论其实非常没有必要,因为两边说的根本就不是一回事儿。 有一位开发者说得特别好, md 党回答的是我们用什么写, html 党回答的是我们给人什么看。这两个根本不是同一个问题,怎么会有谁取代谁呢?我们来看看 markdown 党的论据。 去年八月, open 也发布了 agents, md, 就 一个 markdown 文件放在项目根目录,告诉 ai agents 怎么干活,一年时间被六万多个开源项目采用, cursor, devin, cloud code, github, copilot 全部支持。 去年十二月, linux 基金会直接成立了 agented ai 基金会,把它捐出去做开放标准白金,成员包括 a w s, anthropic、 google, microsoft, openeye, 基本是 ai 行业的半壁江山,一起给 markdown 站台。 今年四月,安德烈卡帕西开源了 l m wiki, 核心架构就是三层, markdown, raw 目录放原始资料, wiki 目录放 ai 写的概念页和缩影, cloud 汀定义 skim 和规则。 仅仅那个 cloud md 文件单日就涨了七千九百个 star, 现在已经快五万了。一个 markdown 文件五万 star, 这在 github 历史上都是非常罕见的。 kalfa 的 实测数据显示,同一篇博客 html 需要幺六幺八零个 toc, 转成 markdown 只要三千一百五十个,压缩了百分之八十, 这意味着同样的 l l m 预算可以处理七到十七倍的请求。 github 官方博客今年也说了一句非常经典的话,文档不再是描述代码,文档就是代码, 自然语言被翻译成下层语言,恰好长得像 python 或者 javascript。 这些证据都非常硬,完全可以得出 markdown 才是这个时代的原代码的结论。但 html 党的论据同样硬,塔里克说的空间信息、动态体验、结构化阅读、双向交互, 每一条都是真实存在的痛点。 astropik 今年四月推出的 life artifacts, 已经把 html 从静态产物升级成了持久化、可交互、能拉实时数据的仪表盘。塔里克有一句话我印象特别深, 我用 html 的 真正原因是,我感觉自己和 cloud 之间的关系更紧密了。 html 让他重新感觉自己在 ai 协助中在场,而不是一个只会说好的继续的旁观者。所以你看,两边都赢了, 因为他们摸到的是同一头大象的不同部位。真正的答案其实非常简单, markdown 和 html 不是 替代关系,而是分工关系。以前 markdown 和 html 也有过论战,那时候 html 是 默认薄客文档,官网都是 html。 后来 markdown 兴起,因为他写起来快,看起来干净。那个论战的隐含前提是,生产者和消费者是同一个人,你写一份文档,自己看,或者写给同事看,写的人和读的人都是人。所以选格式要折中,既要好写,又要好看。 markdown 伸出,因为他的折中点最舒服。 但 ai 出现后,第一次出现了一个新情况,生产成本可以被 ai 吸收,你不再需要亲手编辑产物。 html 因为太重而被嫌弃的那部分,代价由 ai 承担了,你只需要承担消费的部分。这意味着原来要折中的需求被解,偶成了两端的极端。 最优生产端要的是什么?轻快、可递付? toking 效率高,那就是 markdown。 消费端要的是什么?丰富可示化、可交互、好分享,那就是 html 两端各自登顶,中间那个折中位置,没人需要了。最干净的证据,其实就是它立刻自己。 同一个工程师三月份发了篇 skills 使用指南,里面强调 skill 不 只是 markdown 文件,但核心还是 markdown。 他 在生产端力推 markdown。 五月份发了这篇 html 的 不合理有效性,他在消费端力推 html。 同一个人在两端各自做出了最优选择,互补大家,他自己就是这个分工的活样本。第二个例子是卡帕西和莱克斯弗里德曼那队组合。 卡帕西的 l m wiki 内核是 markdown, 所有原始资料概念页缩影都是 markdown。 莱克斯弗里德曼用了同款架构,但在外面加了一层 让 ai 深沉。动态 html 加 javascript, 可以 排序、过滤、调餐、做交互。可式内核是 markdown, 外壳是 html, 不是 莱克斯替换了卡帕西, 是他在卡帕西的基础上加了一层消费层,两层各做各的事,不冲突,反而互相加强。所以塔里克没错, markdown 也没错,他们都对了一半,但只要还在 markdown vs html 这个二元对立的框子里,就永远只能拿到一半的真相。以前的工作流是人写 markdown, 人看 markdown, 现在的工作流是,人写 markdown, ai 改 markdown, ai 深沉 html, 人看 html。 这才是 ai 时代真正的工作流。当然,这并不是说 markdown 就 会消失,就像命令行不会消失一样, markdown 也会一直存在。 他依然是清亮文本,简单说明长期维护文档的最佳选择。但他的统治地位可能真的到头了。至少在 ai 生成内容的消费端, html 会越来越成为默认的选择。这件事真正值得我们思考的,其实不是哪个格式更好,而是一个更深层的问题, 在 ai 能力越来越强的今天,我们如何保持自己的参与感,不被 ai 甩出去?塔里克在文章结尾说的那句话,我觉得是整个世界最核心的价值。他说,之前我开始担心, 因为我不再深入阅读那些方案了,我只能放手让 clod 自己做决策。但用了 html 之后,我感觉自己比以前任何时候都更在 look 里了,这才是问题的关键。 ai 现在太难写了,它可以给你生成一份看起来完美无缺的几百行方案。如果你用 markdown, 你 大概率扫一眼就过了,然后让 ai 继续执行。 表面上看,这是效率的提升,但实际上你正在逐渐失去对整个过程的判断和控制。而 html 带来的变化,是把人重新拉回到这个循环里, 它让计划更容易读,让方案更容易比较,让代码变化更容易审查,让参数更容易调整,让结果更容易回传给 ai。 它没有让 ai 变得更独立,而是让人更容易介入。当 ai 的 能力越来越强,人和 ai 之间的信息带宽就成了最大的瓶颈。 对人的信息输入而言,如果说 markdown 是 一根水管,那 html 可以 看作是一条马路,而我们未来要探索的是如何把这条马路变成高速公路。也许未来某一天, ai 给我们的交互物不再是静态的页面,而是可交互的视频。 ai 不 只是生成一个东西让你自己看,而是带着语音,像一个同事一样给你讲方案、走读代码、解释数据,你可以随时打断和提问。但不管技术怎么发展,有一点是不会变的, 工具永远是为人服务的。最好的 ai 工具不是把人排除在外的全自动工具,而是能让人更好地参与进来,发挥人的判断力和创造力的工具。 markdown 和 html 之争,本质上不是格式之争,而是 ai 时代人和机器如何更好合作的探索。他立刻和他的团队走在了前面, 他们用自己的实践告诉我们,当写的人变成了 ai, 看的人还是人,那一切就都应该围绕人的体验来重新设计好了。以上就是本期视频的所有内容,如果你喜欢本期视频,不要忘记关注、点赞、分享,这样就不会错过每一期的精彩内容。我是 ai 启示录,感谢收看,我们下期再见!

美好啊,朋友们,这是一期 codex 奶妈级的零基础系统教程,这期视频我会从安装开始,手把手地把 codex 的 基础能力到高级功能的组合,以及最新的手机端操作,用十个实战场景来带大家彻底拉通 以后这一类的 ai 产品,出一个算一个,你都会触类旁通,游刃有余。我也把这期的文字课间整理成了文档,那这期的含金量可谓是 biu biu biu biu biu, 一个点赞收藏关注是最起码的。好了,不多说,学费都交了吧,我们上课, 那在开始之前,我先说一下 codex 和 cloud code 的 区别。从本质上来说,它俩都是由编程 agent 逐步转向了通用 agent, 分 别是 ansapi 和 open ai。 这两家出的 cloud code 呢,默认使用 cloud 模型,但是我们可以自行替换成任意其他的模型,那在易用程度上, codex 桌面端的产品设计是会更友好的, 更适合零基础的白领工作者,而 cloud code 有 更高的自由度。在功能上, cloud code 原本是最齐全的,什么 skill、 mcp、 斜杠命令、 hock、 远程操控,这都是人家先发明的。但是呢,最近的 c c 更新稍微不如 codex 那 么快了,会更加偏向专业开发者一点。 而 codex 发了非常强的浏览器操控和 computer use, 还内置了最近的 image 二深图模型, 而且昨天还刚刚发布了手机端和 hock, 可以 直接用你的手机 check gpt 来控制电脑上的 codex 干 活。那价格和额度方面呢? codex 的 会员额度非常大方,二十到的会员就很够用,而且还不封号。 而 cloudpod 呢,大多数人可能都没法用它的官方账号基本上都得自行调用 api 的 费用属于是花多少用多少,风险由人。那在使用场景上,我个人喜欢用 cloudpod 搭配 cloud 模型来写作,因为 ops 四点六的写作和规划能力真的很强, 那 codex 的 执行和解决问题的能力也很强。日常的办公场景,我会选择用 codex, 那 在编程的时候嘛,我就两个都用上,所以结论是,入门的朋友用 codex 就 很强了,有条件的朋友呢,两个都来是最完美的, 不过两者的逻辑其实都是一样的,我们学一个,另一个也就会用了。那 cloud code 我 也做了一期系统教程,想拥有左膀右臂的朋友可以去看看。 ok, 正式开始 使用 codex, 我 们唯一需要准备的就是一个叉 gpt 账号,免费的也行,只是会额度稍微少一点。那有了账号之后,我们就直接去它的官网双击安装, 然后安装好之后登录我们的叉 gpt 账号,然后这些设置我们可以先随便选一点啊,选个日常工作,反正后续呢,我们都是可以改的。那搞定了, 那进来之后呢,大家会看到这个对话窗口,好像跟 chat gpt 是 很类似的。那我们打开两边的侧边栏也蛮眼熟的,左边呢,可以管理对话和任务的列表, 那中间就是聊天,右边大概是结果之类的吧,大家应该都能猜个七七八八,所以我们先不深究它的页面,我们直接开用,这其实也是我探索所有的 ai 工具的独门秘方。 我打开一个陌生界面呢,我先不管别的,我先找到我能对话的框,我先聊,先找到我能看得懂的按钮,先按,按着按着你就会了。你看看,独门秘籍都教给大家了,以后你们就是为师的弟子了。 ok, 众弟子不必拘礼,我们还是以学业为重啊。那我们第一个要了解的 codex 能力呢,就是本地文件操作, 也是这一类桌面端的 agent 跟对话 ai 最显著的区别和能力。因为过去我们用叉 gpt, 如果说我们要让它看到我们本地的内容,我们只有两种方式,一个呢就是复制粘贴到这个对话里,另一种就是以它允许的格式和数量把文件给上传上去。 但是 codex 不 一样,它可以自主地读取和操作我们的本地文件,而且不限数量。比如说我作为一个剪辑,我的本地里面存了八十多条视频素材,这都是我剪辑要用的, 但是呢,这个命名全都是乱的,完全看不懂,所以我想以这些视频的内容来命名,到时候我们看见文件名的时候,我们就知道这个素材是什么。那这事 check gpt 肯定是做不了的,但是 codex 可以 我们来看这两个地方,它都显示了一个概念,叫做项目, 我们选择一下,哎,一选择项目,他就让我们选择本地的文件夹了,那我们只要选中这个文件夹,那这个文件就是我们的项目了,里面所有的文件 codex 都可以自由的读取和操作, 当然这需要我们给他权限。大家看这里的权限选择啊,目前呢,我们是一个默认的权限,我们再点开,他有三种权限模式, 那默认权限的意思呢?就是在我们当前的文件夹内,他可以自由的去读写这些文件,但是如果他想要联网呀,或者是帮我们下载一点东西啊, 或者是碰这个文件夹之外的其他文件,那他是不行的,如果他必须要做,就会要向我们提出提高权限的请求,我们点同意才能继续。 那自动审查呢?顾名思义就是有个 ai 自动帮我们审查,由 ai 来判断这个操作危不危险,如果危险呢,就来问我们不危险的,比如说他去下一个知名的这种官方软件什么的,他就直接开干了。 自动审查比默认模式要更宽松和智能,建议大家选这个就完了。那最后呢,是完全访问权限,这意味着 codex 可以 在你的电脑上几乎什么都能干,它可以修改删除任何文件,它可以在任何位置执行命令,例如说它可能会去把你的 cloud code 给删了。 开玩笑啊,它一般情况下是不会这样抽风的。 ai 呢?也没有嫉妒情绪吗? 大家尤其是新手朋友就选择自动审查模式,相信 ai 就 完了,毕竟咱又能审的比 ai 好 多少呢啊,对吧? ok, 那 我们选中了刚刚的这个视频的文件夹,继续来提出我们无理的要求,让他帮我们把这个文件夹里的所有视频素材都按他们的实际画面来重新命名。哎,他就开始做了, 而且大家看他非常的聪明,他先看了看我们到底有多少个视频,然后他选择用抽帧的方式抽取关键画面来判断内容是什么,而且他还知道他不要一张一张图去看,他给拼成了缩略图的形式,一组一组的去看。 ok, 很 快啊,这个文件夹里面的文件名就全改变了。过程中呢, codex 也是没有向我们提全的,因为他都是在这个文件夹内去操作的。那我们也可以检查一下他都对应好了没有。 ok, 钢琴家音乐演奏厅,没错, 雪山近身格斗,没错,旗袍女人夜巷卖热饮哇!而且他的这个命名还遵循着一个序号,任务、场景、行动的一个清晰的命名格式。 ai 做事的这个细心程度啊,人类你不服不行。那另外呢,我们其实也可以在同一个项目里面去开多个不同的对话,它们的上下文都是不一样的,但是同样都可以随时的访问我们这个文件这个项目。 比如说,我们在另外一条对话,我们又给他一个不同的任务,让他想办法把所有关于风景的视频都剪成一整条。 哎,没想到吧,他真的能剪,他自己想办法,用了一些工具问我们要了一些权限,用这个 ffmpeg 给它拼在了一起,效果的确是关于风景的都剪成了一条。 ok, 那 如果我们要创建一个新的任务,我们其实也可以手动的在这边创建,他也会自动的在我们本地创建一个文件夹。 然后呢,我们跟 codex 对 话的整个过程, agent 产生出来的任何文件啊, pdf 啊,什么 markdown, ppt, 它都会直接存在我们本地的电脑上。 ok, 到这里,大家应该 get 了 codex 呢,可以随时地访问我们的本地文件,去读取内容,写文件,删文件,移动文件,文件夹里的内容也就成了我们的 codex 随时可以获取的上下文,那这里的项目也就对应着我们在本地的一个文件夹, 哎,那刚刚这么个任务会花我们多少上下文呢?我们只要看这里就能看到了。 那这个小圈代表的是我们现在的这个对话和里面的操作,一共使用了 gpt 五点五的多少上下文窗口。 如果我们把鼠标悬上去呢,它还会有更详细的一个信息,当上下文快满的时候, codex 会自动地帮我们压缩上下文。不过其实当我们一个任务告一段落之后,不用等它快满了,让它自动压缩,我们也可以自己通过斜杠压缩这个命令 来手动的去压缩上下文,这样呢,可以让模型更聚焦在我们的新任务上,也省一点上下文的额度。那当然大家除了这个对话的上下文余量,其实我们还想知道我作为一个免费用户,或者是我作为一个 pro 用户, plus 会员,我还有多少总共的额度可以用,对吧? 这个呢,有两个方式查看,一个呢是左边的设置,这里我们点开剩余额度,就能看到你五小时内还剩下多少,那本周内又还剩下多少, 甚至呢,也有什么时候到期会刷新的一个提示,这个产品的设计还是比 cloud 的 友好很多的。那另一种方式呢,就是我们可以直接在对话框里输入斜杠,然后找到这个状态, 那打开这个状态之后,它的绘画这里就会持续的显示我们的上下文余量,这个五小时和一周的限额。但再次说实话,这个 codex 的 额度还是非常大方的,二十到的额度我认为是可以满足大多数白领工作的高频使用的。 ok, 那 顺便呢,我们也介绍一下这里的模型选择, 那点开之后,我们可以选择速度,快速呢,就相当于加急通道,会消耗我们更多的额度。那这里呢可以选择其他模型,但是大家都选五点五,因为它确实更好用。然后呢,这里可以选择智能程度,其实呢一般中度智能就够了, 所以我们选高。 ok, 那 这个小麦克风呢,肯定就是语音输入功能了,比手打字还是要快很多的,但是呢,它的转录速度远不如大家去下载一个语音输入法,还是非常推荐大家用语音输入的 好。那现在我们通过一个本地文件处理的案例,也了解了 codex 上常用的一些功能。那 codex 的 第二大能力就是命令行工具使用。 其实刚才我们说到权限的时候就有提到,在默认权限下,它可以读写文件,但是却不能执行一些命令,一些联网的操作。那这些命令是什么意思呢? 刚刚的案例其实也已经用到过了,比如说它把视频抽帧出来,还把几个视频拼接到一起,它用到的 ffmpeg 就是 命令行工具。 还有一些我们熟悉的命令,比如说我们在终端里面来克隆一个 gitup 仓库,或者是大家近期比较熟悉的,我们在命令行里面输入一些命令来下载龙虾和各种依赖。那 codex 的 第二大能力就是在我们授权的情况下,可以使用我们的终端来替我们做这些事。 那我们就来让 codex 帮我们来安装一些平时对于小白来说非常复杂的东西吧。第一类,常用依赖,比如说什么 node gs 啊, git 什么的, 也是大家以后使用各种 agent 或者是做其他项目必备的一些工具啊,那之前大家要装这依赖都得去看一个手把手教程,然后照着命令抄,挨个装。那现在我们就直接跟 codex 说帮我安装个 node js 给他发过去, 也是因为这些东西呢,其实都是比较常见的东西了,所以在我们的自动审核的权限模式下,你看他基本上都不问我们要提权,就熟门熟路的帮我们装好了。 那第二类,就是那些爆火的但是有上手门槛的一些新的 agent, 比如说龙虾,爱马仕,甚至还有这个 codex 的 竞品 cloud code, 我 们都可以让 codex 帮我们装完了呢,它还能教我们该怎么用。那我们装一个 hermes 吧, 我其实都不需要给它官网和仓库链接,我就说最近有一个叫 hermes 的 agent 很 火,你帮我安装一个吧。 哎,他就会自己去搜索,然后帮我们判断到底是哪一个。然后呢,他根据官方的文档帮我们陆续的装好了,还帮我们验证过已经装好了,你瞧瞧,那我们照着他说的来启动一下试试。 哎,真的帮我们装好了,那往后的配置我们就不在这里继续了,但是大家应该 get, 有 了 codex 以后,那些复杂的要收你五九九的部署,你都可以直接让 codex 帮你做了,怒省五九九。而且我们在使用的过程中遇到任何问题,还可以截图去问 codex, 什么瞎死了马挂了,升级出现了问题都可以让 codex 直接帮你修,是不是很方便? 那第三类有点没那么必要,但它其实也可以,就是像 cursor integrity 这种软件应用, 平时都是我们去手动在网页上下载的,它也可以帮你下载和卸载。那大家用 codex, 我 其实也建议大家去下载一个 agent 的 ide 啊,因为现在 codex 有 个缺点是它没有办法打开我们的文件内容,直接去手动编辑。 虽然这个侧边栏呢,是可以看到一些文件结构和内容的,但是我们都没法编辑,所以大家可以让 codex 下载一个自己喜欢的,比如说我们就这样下载。那下好之后呢,我们再执行一个 git i n i t 一个初步化, 那右上角就会出现这个东西,随时可以把我们的项目在编辑器中打开,我们来手动编辑。 那第四类就比较重要了,就是 agent 本身会常用到的那些 skills 啊, mcp 啊和 selli。 那 skill 和 mcp 本身 codex 也是支持的,我们后面会详细讲到, 我先挑两个大家安装一下,方便我们后面综合起来来做案例。那这些 skill 和 c i 呢?通常来讲不像那些 get 那 种大项目那么著名,所以我们最好是找到它的具体仓库,或者是明确的官网地址。比如说我们下载一个专门找 skill 的 这个 find skill 哦,方式就是直接把链接拷贝给 codex, 然后跟他说帮我装一下这个 skill。 那 在他装的期间,我们也说一下 codex 的 另一大好处,并行任务处理, 我们完全可以在他做这个事情的时候再开一个对话,让他去下载一个别的。那我们下载一个飞书 c l i 吧。飞书 c l i 其实非常的典型, 因为现在呢,有一些积极 ai 化的软件,把几乎所有他在软件里能做的操作都做成了命令,让 agent 能够方便的去操作,我们把这个链接发过去,让他开始下载, 那这边呢,其实会显示每一个正在处理当中任务的情况,这个在转呢,就说明它正在执行中,那这个蓝色的点呢,就说明已经完成了,有时候还可能会出现一个需要你申请权限的一个标识。 ok, 那 这里 fan skill 呢?它是已经装好了,我们再看飞书 c l i 这边,它会引导我们去做一些授权, 我们就跟着它的引导去完成就好了。 ok, 那 装好飞书 c l i, 那 codex 就 能帮我们去做飞书里的各种操作了,比如说写文档,发消息,见日历,做表格什么的了,我几乎每天都在用, 好大功告成。我们就这么一个小章节,我们就用自然语言的方式让 codex 帮我们装上了 hermes node, 飞书 c l i 一 大堆东西,这就是 codex 作为 agent 的 第二大常用能力,命令行使用。 那这个能力和这个章节的演示也是希望大家能够 get 到一点,就是我们现在在电脑上想去做的很多很多事情,都可以让 codex 这样的桌面 agent 去做了。那 codex 的 第三大能力是持久记忆。 看过我那篇 cloud code 的 朋友应该都知道, c c 呢,有一个手动的持久记忆, cloud 点 md, 还有一个自动的记忆系统, 都是把我们希望 agent 能够长期记住的,比如规则、篇号和我们的信息之类的东西,以本地文件的方式存在我们的电脑上,然后事实的时候把这些记忆以上下文的方式注入到 agent 里去。那 codex 也是类似的,它也有这两套持久的记忆系统 在 codex 里面呢,手动的持久记忆文件叫做 agents 点 m d, 而且它也有一个自动的记忆机制,来我们打开设置,找到个性化, 那在这里的这个自定义指令实际上就是一个全局生效的 agent state md, 它会在我们任意的项目跟 codex 对 话的时候,它都第一时间作为上下文发给大模型,那我们可以手动地自己在这里写,不过我更喜欢呢,直接在对话中去跟 codex 说, 比如说我说一个,我希望你以后对非书文档里的任何修改都使用一个专属的你的文字颜色和用删除线的方式来修改,不要直接的修改。然后这个帮我寄到局的 a 正 c m d 里。 ok, 那 它这里呢,告诉我们已经写好了,我们再打开个性化这一块,就的确是多出来了这么一套规则,那实际在使用当中,它就会去遵循我们这个规则了。 比如说我这里已经有一篇非输文档了,我在侧面呢也评论了几个我想修改的地方,我直接可以把这个链接发给 codex, 我 让他根据我侧面的评论帮我修改一下。 那因为我们刚才确实已经装好了这个非输的 c r i 也都给他配置好了权限,所以 codex 是 直接可以操作我们的文档的。 ok, 看看它完成之后的效果。 果然他用了紫色的字和删除线的方式来帮我们做的文档修改,那这个呢,是局的 agent md, 适合记一些适用于所有任务的一些大原则,比如说我们的工作习惯,我们要说中文,我们的工作偏好修改文档,要留下这种修改痕迹等等等等。 那另一种呢,就是项目级的 agent md, 这个长期记忆呢,只在这个项目当中生效,我们可以选择一个项目的对话,然后打开编辑器, 自己在这里手动的创建一个 agent 的 md 的 文件,然后我们去写一些针对我们这个项目的一些规则, 当然也可以让 codex 来帮我们写。我个人的建议呢,是在这个项目文件里面有了一些内容之后,让 codex 根据他对我们项目的了解来自己帮我们写。那自动记忆怎么回事呢? 其实我们刚才在这个个性化这个下面我们也看到了,我们需要手动打开这个自动记忆功能, 它的机制是我们打开这个功能之后, codex 会在我们结束对话或者是结束任务,这个对话闲置一段时间之后,它帮我们把那段对话总结成记忆,然后记在一个地方。但是它有几个原则,第一太短的对话它就不记了, 那第二这个对话的总结它一样会消耗我们的额度,所以当我们的额度太低的时候,它也就不记了。 并且这个自动记忆文件呢, open ai 官方是不建议我们去手动修改的,顶多我们可能删一删有些没必要的信息,那这个文件大概是长这样 的,是一个任务,一个任务在记录的,主要呢会写上这个记忆的来源是哪段对话呀?以及它的工作目录是什么,那以及以后触发了什么关键词的时候,它会去召回这段记忆, 再往下呢,是用户在这件事情上的偏好大概是什么样的?那第五段呢,是一些可附用的一些知识,一些踩坑的记录,那这些内容都是 codex 自己记录的,并且以后也是会它自动的招回去使用的,我们就先不修改它, 它这个格式确实也不太方便修改,更多的时候我们对于明确的规则和要求,我们还是通过组织 agent md 来实现。那大家学完这些视频之后呢,我也想给大家再做一期, 通过组织不同层级的这种 agency md 给自己做一个非常懂你的,可以做不同类型事情的超级助手的视频,感兴趣的朋友可以扣个一。 ok, 那 第四大能力就是 codex 可以 直接用到 image, 二来生成图片。不过呢,深图功能其实是一个小功能, 所以这一章节呢,我们不只会用它的图片生成,我们会带大家做一个完整的个人主页的开发项目,并且在了解一些 codex 在 小白开发中的一些用法和功能。那我们再来开一个项目,叫做个人主页, 然后我们点开这个加号,我们把计划模式打开,因为我们要做一个网站嘛,任务会复杂一点,所以打开这个计划模式呢,他会先帮我们列出一个详细的计划,我们确认之后他再开始行动。 计划模式呢,比较适合我们的任务有一定复杂性,或者我们自己还没想清楚,可以跟 ai 讨论出一个计划。那假设我们现在就是第二种情况,我们其实没想清楚,我们直接跟他说我想做一个个人主页, 那你看他看到我们的项目中是没有内容的,所以他以这种选择框的方式来询问我们的细节,这些选项呢,大家可以按照自己的要求去选择,那我就选这个个人品牌吧。 然后如果说这些选项中没有我们满意的呢?我们也可以选到最后一个来填写我们详细的要求,比如说我要他修饰感,也要高级感,然后我选针对合作伙伴,不要个人照 中英双语,巴拉巴拉巴拉。这里真的是问了我们相当多的问题啊,那最后呢,他给到我们出了一个详尽的计划,问我们是否实施此计划,那其实基本的计划我们看着没有什么问题,但我们也可以补充一些调整方案。 比如说我们刚才就要说到了要用它的 image 二的生成能力,我们这里没有体现,我们加一句网页上要多用一些图片,使用 image 二来生成一些高级感的图片,然后我们一起提交。 哎,那他又问我们要走哪种高级感呢?我们如果点开这个小叹号的话,还能看到他说的这个风格到底意味着什么意思,这个产品的小细节真的是我很喜欢,那我们就选他推荐的吧。然后他出了一版新的计划,我瞧着没什么问题, 去吧。 ok, 他 就开始初识化这个项目来逐步帮我们生成了。那这个过程呢,肯定会需要一定的时间,在这个期间我再给大家补充一点点知识点。呦,他的第一张图出来了,不错,挺有艺术感的,果然是最强的 emoji 二,那我要补充的这个知识点呢,叫做引导。 如果说大家在 codex 执行一个很长的任务的过程当中,你觉得他有点跑偏了,我们是可以随时给他补充纠偏的,比如说我们补充一下图片的人味要更强一点,而且不要这么冷的色调。我是一个 ai 博主,然后我们发送出去, 哎,大家会看到他没有立刻打断我们的任务,没有发出去,实际上他在这里排队呢。那我们看到右边的这个引导按钮,他写着我们不打断模型运行,会在下次调用工具后发送过去。这个是非常好的一个功能啊,我们点一下, 哎,他就可以发出去了。这个功能呢,可以让 codex 不 用在错误的道路上一路狂飙,把我们额度都花光,也不会让它重新再跑一轮任务。那另外一个小功能点,我们找到一个已经结束的任务, 我们看一下这个 ai 的 回复,每个 ai 回复的下面都有一个这个按钮,叫做分叉 fork, 这个的意思是我们可以随时从这里开始去开一个新对话,非常适合那种前面聊的还好好的,上下文也非常有价值,但是我们再往下聊,就聊的有点叉劈了的时候。哦,还有个小功能,宠物, 我们点开设置外观,然后这下面就有一小对小宠物可以选,甚至呢,我们还可以点击创建,让 codex 根据对我们的了解来生成一个定制化宠物。那我们先点击唤醒宠物, 哎,就会在桌面上有常驻这么一个小桌宠,脑袋上会冒出来 codex 正在做什么的一个提示,别的呢?好像也没什么用。 ok, 终于在他跑了七七四十九分钟之后,网页完成了, 我们来看看效果,因为 codex 呢,有一个内置的预览浏览器,我们可以直接打开右边的侧边栏啊,我们还给它放大一点。 嗯,这个网页的效果确实是不错啊,不过呢,现在的 a 证呢,其实都有这么一手了,那它这个预览浏览器呢,还有一个好处,我们点击右上方这里的一个批注按钮, 我们就可以在这个页面上选中这里的具体元素去写修改意见,包括重新生成图片,比如说我们要这个 logo 放大一点, 然后 p 住这里这张图加上一个人物,好把这个删掉, 那然后对话框里呢,就会加上我们这几条批注,然后我们点击发送,它就会针对我们的意见进行修改了,是不是挺方便的?那我们现在项目有了雏形之后,我们再 call back 一下刚才说的 agent md, 其实现在呢,就是一个让 codex 帮我们生成项目级 agent md 的 好时候了,因为我们也有了一定的内容,我们就让它自己生成一下,我们打开编辑器看看, 不错,项目的背景,各种信息,各种规则,各种文件路径都已经写好了。那以后呢,无论我们在新开对话,还是我们的聊天记录都已经被清空了, codex 都可以通过这个项目级的 a 证书 md, 立马的了解我们的项目基本情况。 ok, 那 我们先保持这样,先不做精修了,我们直接准备部署上线,当然大家自己做的时候完全可以去打磨的更好,那网页上的这些信息也换成更真实的信息就好。 那我们现在要部署呢,就得要说到 codex 的 第五大能力插件。在现在的 codex 当中,插件大多数是让我们的 agent 跟外部平台、外部工具、外部服务连接的一个作用,它实际上就是我们所说的 skill, mcp, c l i 这一类东西的一个完整集合包,比如说操作邮箱、操作日历、操作 excel 啥的。那我们来点开左边的这个插件栏,我们看这里呢,已经默认帮我们打开了好几个内置插件了,比如说浏览器操作,还有 mac 专有的屏幕操作,还有 excel 表格, ppt 等等。 那他的插件页面没有中文翻译,所以我给大家把这些插件的具体中文意思,分别能干什么也都列出来了,大家课后可以按需装上,点这个加号就好了。那我们先翻到这个 coding 板块,因为我们想要部署上线嘛,通过插件会非常方便。 其实呢,这个 vassel 和 netify 都可以,我们点一个加号给它装上,那如果大家给它没有选上的,也记得要选上。然后我们再回到对话当中,告诉他们,我们想用这个 netify 把这个网站给我们部署上去, 我们大家也不用管他咋部署的,反正他需要干什么呢,他都会告诉我们的。 ok, 他 发现我们没有登录授权,然后主动弹出了这个登录的链接,那这里呢,建议大家用 tapp 账号登录是最方便的, 那登录完之后,他自己就知道我们已经登录好了,然后继续的帮我们部署,这就搞定了。这个链接呢,就是我们最后的网站了, 只要把这个发出去,别人就能访问你的个人主页了。 ai 是 不是个好东西,你说就这么两下子就干了,原来普通人花钱都不一定能干成 o k。 先压抑住我的这个老灯感叹。我们回到刚才我们已经装好的插件, 那其实这里呢,还有两个非常重要的内置插件,就是 browser use 和 computer use, 还有这个 chrome 浏览器, 那这些有什么用呢? browser use 顾名思义呢,就是 codex 可以 直接帮你操控浏览器,比如说它自己点击翻页截图,填写表单等等。通常呢适用于自动化测试前端, 当然也有比较无聊的用途,比如我们可以让 codex 打开这个 m b t i 做个测试试试, 嘿嘿,这样大家能够比较直观的看到它的一个效果吧。那这个鼠标呢,是它自己在移动,然后它是自己看了上面的答案在自己填写,然后填完这一页,它也会自动的翻页, 那随着它的一通操作,结果出来了,原来 gpt 五是 i n t j 啊,我说怎么跟我这么聊得来呢? ok, 那 这个 chrome 的 插件呢,也是控制浏览器,但是它控制的是我们自己已登录的自己的浏览器,它不会再新开浏览器, 那我们如果把它给勾选上之后,它会引导我们去 chrome 里面装一个插件,那装好之后呢,它就可以操作我们自己的浏览器了, 而且它有个好处,它是可以直接在后台执行多个页面的浏览器操作的,就是并不会占用我们的整个浏览器,我们不用真等着看它这些操作,我们该用浏览器干,别的我们可以接着干。 ok, 那 computer use 就 更厉害了, 它不只能够操控浏览器,连你电脑上的这些 app 它都可以操作,只不过呢,暂时只有 mac 有 这个功能。比如说我们新开一个对话,我们在加号,这里来看最下面的这个插件选项,我们手动地把电脑插件选上, 我们再来几个没什么用的奇迹引巧吧,帮我放一首九九年最火的歌,然后用我的微信给 qq 发条微信,说,请收下我一个点赞、收藏、关注,懂了吧? ok, 他 陷入了思考,然后他看到我们的应用都正在运行中,并且向我们使用了这个音乐软件。我们点同意看,这个就是 codex 自己干的啊。他帮我们搜索歌曲, ok, 音乐响起了, 但是他还有活,他还在问我们要微信的权限,我们也给他允许一下。 ok, 看他这个小鼠标,他正在犹豫着准备搜索点击,好朋友们失败了, 因为我上次都成功了,但是我估计现在微信已经开始严防这种 a 证的操作了,直接给我退出去了。 但是呢,他的确成功操作了这个音乐软件。其实我还让他操作了剪映,并且给我们的最新的项目加上了音乐。 那总之呢,意思大家都懂了吧,就是它可以操作浏览器,并且可以操作我们的电脑。当然,实际上我觉得它的操作效率目前来说还是稍微有点低的,我不太喜欢用这两个强大的功能。不过后面我要说的这个 skill 就是 我每天都会用的东西了。 那 skills 我 的确也已经跟大家说过很多次了,好学的朋友一定要去补补课。那 skill 本质上呢,是我们人为沉淀的一些可附用的方法、流程和工具的组合, 相当于给 agent 做某些具体任务的一些行动指南。那因为之前我们已经让这个 codex 帮我们装过一个叫做 find skill 的 一个原 skill 了, 所以后续如果大家想要去装,或者是找一些社区上的 skill, 都可以直接用 codex 拿语言直接让它下载。比如说我们下载一个必备的 ansapic, 那 个前端设计的 skill, 还有一个去 ai 位的,那我们这两个都发给他,等会儿都会刚好有用 欸,很快他就帮我们装好了。那以后大家想要下载 skill 呢?如果说遇到这个 find skill, 他 找不到的东西,也可以直接把链接发给 codex, 让他帮你下载就好了。不过我在 c c 那 期也说过,最好用的 skill 还是自己创建的,符合自己工作的专属 skill。 那 创建 skill 呢,也有两种方式,第一呢,就是直接告诉 codex 你 想要创建一个什么样的 skill, 通过跟他讨论打磨得出来一个 skill。 那另一种呢,就是我们接下来要演示的,先跑通流程,然后让它形成 skill, 这也是一种更推荐的做法。那比如说我们想做一个自动化写这类文章,并且帮它配图的 skill, 这种大家应该都看过吧, 那我们就得先通过一步步的引导 codex, 让它真正实现一个我们满意的文章。来我们新开一个对话。那正好呢,我们刚才不是装过这个 github 插件吗?我们可以直接先问它最新的 github 流行项目,热门项目都有哪些? ok, 它的确帮我们找到了一些,那我们再让它清晰地解释一下这些项目都分别是干嘛的。嗯, 那我们再让他挑其中新星数量最多的,来帮我们写一篇本周 get up 热门项目推荐这样的一篇文章。 好,那他写好了这一篇之后,我觉得稍微有点太人机了,我希望可以更口语化一点,并且我只想要五个精选的,那我们就告诉他,然后还要覆盖到这几个层面,那我们这里就可以用到刚刚我们下载的那个去 ai word 的 那个 skill 了,我们斜杠给它调出来。 好,那看到他的结果稍微优化了一点,但是我们还希望加一个我们固定的开头,我们的结尾,并且还要让他用上 image 二来帮我们生成一些配图。最后呢,我还希望他不要是这个格式,他要是一篇非输文档的格式,然后图文并茂的。 ok, 结果来了,他确实是有了,但是呢,我觉得这个配图不够丰富,于是我又经过几轮调整才觉得差不多满意。并且我还给他最后加了一步,要让他把这个飞书文档发送到指定的群里,让大家都来看看。 那最终呢,他的效果是这样的,果然发出去了。其实啊,如果想更加一步到位的朋友,也可以结合刚才我们说的这个浏览器操控,让他直接打开那个发布页面,直接就帮你发布出去。 那总之,我们对他这一套结果满意了之后,我们就可以直接让他把这一整套的标准和动作做成一个 skill 搞定了。那我们再输入斜杠,再往下找,我们就发现就有了这个 skill, 我 们可以直接这样手动地调用这个 skill, 也可以直接说生成一篇热门项目推荐图文这一类的触发词,也会让 codex 自动调用。 不过因为现在 github 上面实时的热门项目肯定是没有更新的,所以我们再调用一次呢,它大概率会写出差不多的文章,所以我们就不试了。但是大家都理解了吧, skills 呢,可以把我们经过验证调好一次的一整套流程和方法给它固定下来。 下次做这件事情呢, codex 就 可以按照这个方式稳定的输出。 ok, 那 下一个能力则是 mcp。 其实 mcp 现在已经用的不太多了,所以我只简单的示范一下那 codex 的 mcp 藏在设置里面的 mcp 服务器。 只不过小白看这个肯定是有点不太知道怎么填的,所以跟我们之前说的一样,我们最好的方式还是把你想装的那个 skill 的 链接拷贝给 codex, 让他自己装就完了。比如说我们来装一个 notebook lm 的 一个 mcp 发给他, 他就会引导我们来做授权登录,登录完就搞定了。那我们再试一个我存了非常多访谈视频的一个笔记本,我们来问一下他。 欸,那这样呢, codex 也就可以直接获取我们 notebook lm 上面的这些外挂知识点了。 ok, 最后一个 codex 能力是自动化定时任务。 其实定时任务本身并不稀奇啊,比如什么每天早上提醒我吃药,提醒我喝水这一类的事情,普通的软件也能做,但是我们把它放到最后一个说呢,就是因为它可以结合我们之前学到的各种能力,把一整套组合起来的任务,让 agent 定点执行 自动化,加上智能化和定制化方显美妙。比如说刚才我们做的这个热门项目图文的这个 skill, 我 们就可以把它设成每三天或者是每周,让它定时定点的产出一篇 dapp 热门项目推荐发出来。 那我们要创建自动化任务呢,其实也分两种方式,第一种就是选到这边的自动化面板,那它这里呢,有一些官方的参考视例了,不过大多数是跟开发相关,那我们选择新建一个自动化, 其实你看要填写的东西也非常简单,其实就是用提示词写好这些自动化是要做什么,然后我们可以在这里选好什么时候出发,我们也是可以自定义一个出发时间的, 然后这边就可以选择执行的模型和思考强度,最后点击创建即可。不过呢,我也还是倾向于让大家用第二种更简单的方式,就是直接在对话里跟 codex 说,那我们直接跟他说 帮我创建一个自动化任务,每周一早上九点自动化执行热门项目推荐的这个 skill, 产出一篇图文发到群里, ok, 那 我们在看自动化这里,它就已经帮我们设好了这个任务,我们随时也可以去改变它的时间。 再比如当你的这个邮箱插件 github 飞书都已经连上了 codex, 那 么你也可以让他每天下午六点帮我汇总日历上完成的会议, github 上面的提交记录和我的邮箱回复记录,生成一份全面的工作日报。 最后手机操控 codex 设置方法非常简单,手机上的 check gpt 和电脑上的 codex 都把它更新到最新版。之后打开手机上的 check gpt, 然后点击侧边栏的那个 codex, 它就会提示你允许这台手机控制你的电脑,直接就搞定了。如果你有多台电脑的话,也可以给它分别连上。这就等于你不管在大街上、地铁上还是朋友聚会,都可以随时随地地用手机下发一个任务,让 codex 在 你的电脑上干完一个活, 它就更像一个可以跟你远程协助的同事了。这个功能呢,目前免费版也可以用,但是主要能连的是 mac 系统的 codex。 好, 那到这里 codex 的 所有核心能力我们就全部过完了。来我们回顾一下。 codex 呢,可以操作我们的本地文件,可以使用我们电脑上的终端命令行工具。它还有两种构建持久记忆的方式,它还可以生成图片,而且它可以通过计划模式来做一个完整的项目开发。 那它有丰富的插件,可以操控浏览器和电脑,还可以把知识和流程沉淀成可附用的 skill 技能, 它可以使用 m c p 连接,外部它还可以设置自动化的定时任务。不过其实比起这些功能本身,我也希望大家记住两件事,第一就是我们真的有很多事情是已经可以交给 agent 做了。 那第二呢,就是我们已经从问 ai 的 阶段走向了管理 ai 的 阶段,因为过去我们使用 chat gpt 就是 有问题了,我们问一下,然后得到答案我们就走了。 那现在使用 codex 这类的 agent 呢?每个人都得像领导一样,帮他准备他所需要的上下文和工作环境,给他指明一些任务目标,然后来检查他的计划,监督他的过程,验收他的结果。 那同时领导还要负责把好的方法和流程沉淀成可付用的技能,把反复要做的事情设成自动化执行的规矩。好了,恭喜大家今天都升职了,记得点赞收藏关注我们下次见了。

安卓 app 刚刚发布了一份创始人手册,详细拆解了在 ai 时代如何从零打造一家 ai native 公司。 今天我们来快速解读这份手册的核心内容。二零二六年, ai 正在重塑创业的方式,不会写代码的创始人现在可以发布生产级应用。识人独角兽从草根逆袭变成了刻意的行动计划。 传统创业路径是验证、融资、招聘、构建、再融资增长。但 ai 已经打破了每个阶段都需要更大团队、不同技能和新一轮融资的预期。一个好创意能让创始人走得比以往更远。创始人身份正在被重新定义, 以前技术创始人写代码,非技术创始人做商务。但二零二六年的 ai 模型和系统已经消除了能构建的人和有想法的人之间的壁垒。 没有工程背景的人可以构建生产级软件,而技术创始人也能轻松生成市场策略和财务模型。创始人角色从个人贡献者变成了 ai 智能体的编排者。 ai 在 三个领域让初创公司像大组织一样运作。 第一,对话式智能和研究。 ai 成为你随叫随到的领域专家,包含深度研究、文档拷写和战略思考。第二,智能编码。 ai 成为永远可用、永远不会被阻塞的工程师。 第三,工作流自动化, ai 成为暗需的自动化运营、团队处理调度、 c r n 更新、报告生成等日常任务。创始人注意力上移到真正重要的高阶决策。进入创意阶段, 每个创始人都是从一个停不下来思考的问题开始的。这个阶段的核心目标是研究导向的验证。在投入资源构建之前,先收集扎实的证据,证明真实问题存在。你需要回答四个关键问题,这个问题是否真实、具体且平凡? 谁有这个问题?是否构成市场?有没有人在解决你的方案?是否真正解决了这个问题?创意阶段有三大挑战, 第一,把构建误认为验证 ai, 让从想法到产品的距离急剧缩短,百分之四十二的创业公司因为构建了没人要的东西而失败,这个比例只会继续上升。 第二,过早扩张,当构建变得毫不费力,你可能在验证问题解决方案之前就把执行规模化了。 第三,失去客观性。 ai 工具给确认偏差,装上了研究引擎,你问 ai 支持你观点的证据,他就会找到 解药是让 ai 做魔鬼代言人,主动反驳你的想法扣路。如何帮助创意接大?三种产品形态各有分工。 chat 用于快速交互,从密集的投资者备忘录中提取要点。 cloud co work 用于耗时的知识工作,从多个来源整合信息,产出文档或演示文稿。 cloud code 用于智能体编码,直接访问代码库,三者共享同一个 cloud, 变化的是围绕它的工作空间。 用 cloud 定义和压力测试问题假设,把模糊的陈述磨砺成可测试的假设。矢创研究与客户发现, 让可 out 绘制竞争格局。直接竞品,间接竞品,潜在收购方和可能进入你领域的相邻玩家。用 topowak 综合竞品评论,识别现有方案未解决的头部投诉。精确的目标画,相比常常的联系人列表有价值的多。 访谈时问过去的行为,而非未来的意愿。每五次访谈后综合笔记列出支持和挑战假设的证据。通过验证后,用 to log code 构建轻量级原型,放到目标用户面前测试。进入 mvp 阶段, mvp 本质上仍然是一个证据收集过程,区别在于,你现在收集的是关于解决方案的证据,目标是把经过验证的问题转化为真实用户会使用的产品。 同时,你现在的构建方式决定了未来的可能性,要避免积累那种会复合增长的技术债务 投资持久化上下文,从第一天起就让 ai 成为力量倍增器,而非商的来源。 m v t 阶段面临四大挑战,第一, ai 技术债务会复合增长,没有规范和架构约束,每个绘画都会从头推倒基础决策代码库,失去连贯的心智模型。 第二,虚假的产品市场契合早期势头,不等于真正的 p m f。 第三,零摩擦的范围蔓延,当添加功能只需一个下午,很难说不。 第四,安全性被忽视。 ai 生成的是能用的代码,不是安全的代码。解药式架构文档加范围定义加安全审查 call。 如何帮助 m b p 阶段的创始人? 首先,在构建之前定义架构,把决策写入 c l a u d e 点 m d 文件作为项目的持久记忆。 其次,定义并执行 m v p 范围描述产品做什么,故意不做什么,什么用户证据才能证明需要添加新功能。第三,用 cloud code 构建 m v p。 每个呼唤都从范围、文档和架构上下文开始。 第四,部署前进行安全审查。第五,在第一个用户到来之前建立测量框架。如何判断真正的产品市场契合养个试金石。测试 上埃勒斯测试问,活跃用户,如果不能再使用这个产品,你会感觉如何?如果超过百分之四十,回答非常失望,这是有意义的。 p m f 指标 努力测试产品市场匹配前牛存需要持续干预,匹配后产品开始自己做这个工作。当推力变成拉力,这个转变是最清晰的信号。 如果三个迭代周期后仍无进展,用可捞的诊断数据中的信号进入发布阶段。如果说 m b p 阶段是证明你的产品值得存在,那么发布阶段就是证明你的业务值得增长。 目标是把早期势头转化为可重复、可持续的增长引擎。创始人必须从亲自执行转变为构建运营系统。 发布阶段的退出条件有三个,增长可重复,且由渠道驱动,产品能处理、生产及工作赋载。运营不再依赖创始人瓶颈。发布阶段的挑战包括 技术债务开始产生利息。 m v p 代码库的捷径在生产流量下暴露,创始人从资产变成平静决策堆积支持请求积压、 安全合规不再可以推迟。真实用户意味着真实风险,以及在准备好之前就扩张到新市场。 cootht 负责架构审计和安全修复。 cootht work 自动化运营流程 cult 帮助制定产品管理节奏。三种形态全面投入使用,小团队可以像大公司一样运作。最后是规模化阶段,创始人的角色从构建者转变为面向公众的高管, 目标是从数千用户扩展到数百万,从一个市场扩展到多个 ai。 原生创业公司应该通过累积深度来构建可防御的护城河。产品中内建的专业知识与用户依赖工具的深度集成,以及专有的系统数据和工作流。 规模化阶段的退出条件不再是单一里程碑,而是门槛事件,公司可持续运转,即使创始人不再直接管理日常运营。规模化阶段的关键策略,将领域专业知识转化为 ai 上下文,通过技能编码重复工作流,微可附用历程 积累用户数据为防御性优势,用户交互产生的行为信号是时间锁定上下文,特定的竞争对手无法复制。 创建工作流锁定用户在你的产品上构建的自动化和集成越多,切换成本越高, 这就是数据飞轮。使用带来反馈,反馈驱动改进,改进带来更多使用。总结一下, ai 时代,创始人的工作没变,找到真实问题,构建解决方案,规模化成有意义的公司, 变的是路径。 ai 将验证周期从月压缩到天原型,不再需要技术联创,发布准备从临门一脚变成持续工作流。规模化时,运营负担可以交给 ai。 瓶颈不再是你能构建什么,而是你选择构建什么。这就是 invapic 创始人手册的核心思想。

gpt 五点五发布才三周, gpt 五点六就被抓包了, openlea 这迭代速度已经不给同行留活路了。 爆料人 leo 透露,有开发者在 openlea 内部的 codex 日记里发现了指向 gpt 五点六的记录,大部分调用还是 gpt 五点五,但有一条确凿指向五点六 首批检查点已在内部启动测试,预计下个月正式亮相。一点五 m 超长上下文已经跑通。 同一天, openai 发动了一场补贴战,任何从 cloud code 切换过来的企业用户,三十天内注册可以获得两个月免费,另外还要推出超极速模式,响应速度提升二到三倍。 消息出来才三小时,就有两千名开发者主动联系 openair, 奥特曼亲自喊话 codex 就是 最强 ai 编程产品。 entropic 的 应对也很刚,宣布六月十五日起,未付费用户提升百分之五十编程额度。这场 ai 编程工具的补贴战,开发者成了最大赢家。你现在用哪个 ai 写代码?是时候重新选对了吗?

openai gpt 五点六曝光下月发布, ultrafast 模式推理速度翻三倍。 ai 编程王者争夺战白热化, gpt 五点五发布仅三周, gpt 五点六内部测试代码被曝光, ultrafast 模式推理速度提升二至三倍,已在 codex 环境中验证。 openai 同步推出补贴站,为迁移至 codex 的 企业提供价值四百美元的两月免费使用权,三小时内两千名开发者响应。 中国大模型五强格局成型, deep seek 五百一十五亿美元领跑智普港股单日暴涨百分之三十七,一 周内跃至暗面。 kimi 完成二十亿美元融资,揭月星辰传出二十五亿美元融资, deep seek 估值充至五百一十五亿美元。智普港股单日暴涨百分之三十六点九至一千一百五十港元,五强格局正式形成, 国资加产业链资本全面入场,大模型上升为国家科技竞争筹码。 openai gpt 五点六曝光,距五点五发布仅三周, ultrafast 模式推理速度翻三倍。 五月十四日,知名爆料人 v o 放出重磅消息, gpt 五点六的开发周期已进入全速阶段。 openai 同步测试 ultrafast 模式主力模型,推理速度可提升二至三倍,并已在 codex 环境中进行验证。 gpt 五点五十七内部使用率达百分之八十五。 gpt 五点六的开发将深度依赖前代模型参与自我训练。 and ropit 则推出 opus 四点七 fast 抢先应战。双方在 ai 编程领域掀起正面补贴战 对普通人的影响, ai 响应速度越来越快,普通人调用 ai 编程工具等待时间大幅缩短,开发体验接近及时反馈 来源, itbear 三十六丹麦克朗中国大模型五强格局成型 deepseek 五百一十五亿美元领跑智普港股单日暴涨百分之三十七。 五月十五日,科创版日报报道,一周之内,五家中国大模型公司轮番刷新估值天花板, deepseek 估值充至五百一十五亿美元,约三千五百亿人民币。 月知案面, timi 完成二十亿美元地轮融资,投后估值二百亿美元。揭月星辰传出二十五亿美元融资,智普港股单日暴涨百分之三十六点九至一千一百五十港元,市值首破五千亿港元。 mini max 单日大涨百分之十八点四六。 智普 g l m 五点一在 cody agent 精准评测中拿下开源模型全球第一。投资方从美元 vc 加互联网巨头向国资加产业链资本迁移,中国移动入股月知案面,国家大基金洽谈领头 deepseek 对普通人的影响国产大模型崛起,意味着普通人有更多免费好用的 ai 选择,中文语境体验持续优化。来源,新浪财经科创版日报 entropix 启动五百亿美元 ipo 前融资 clubopus 四点七编程能力正百分之十三迎战 open ai 据知情人士透露, entropix 已启动最新一轮融资,预计规模约五百亿美元,目标估值九千亿美元,预计五月中旬完成交割。 尽管协议尚未最终敲定,但投资者需求已激增,本轮融资将是 ipo 前的最后一轮大规模募资。 科奥 opus 四点七于四月十六日发布,编程能力提升至百分之六十四点三,精准分视觉识别精度翻三倍,定价与前代一致, andropic 正面对决 open ai 双方在模型、性能、定价策略和开发者生态上全面开战。 对普通人的影响,科奥的系列功能更强,价格不涨,普通人可享受更高性价比的 ai 编程助手。 财源,凤凰财经云头条 clock code go 模式不干完不许停澳洲放羊大叔引爆 ai 编程革命 andropic 为 clock code 推出革命性的 go 模式,逻辑粗暴但有效。创建任务卡片后, ai 自动拆解为多个子任务,分配给不同的 agent worker。 每个 worker 是 独立 os 进程,有自己的身份、模型配置和工作目录。 这一模式由一位澳洲放羊大叔发明,核心原理是无限循环,反复把同一个 prompt 喂给 agent, 进度写在文件系统和 get 历史里,上下文满了就开新,实力读文件接着干。 这一发明十一天内被 openai and fropic 和 hermes 集体收编。 openai 同步推出补贴站,为迁移至 codex 的 企业提供两个月免费使用权,价值约四百美元。三小时内,两千名开发者响应号召。 对普通人的影响, ai 编程真正进入甩手掌柜时代。设定目标后, ai 自动搞定中小企业一人加 ai 即可挑战十人团队。来源,新浪财经周一 ai 编程工具渗透率百分之八十五 gigapopilot and token 计费倒计时,市场规模一百二十八亿美元。 周二, cloud misos 击穿 m e t 二、评测天花板, open cloud pick up v 三、让 ai 长出首演。周三, andropic 融资九千亿冲刺 ipo, open ai daybreak 正面迎战 glasswing。 百度文星五点一发布, 周四 g p t 五点六曝光,下月发布,腾讯 workbody 登顶国内 ai 办公市场稀智科技硅光芯片港交所暴涨百分之三百八十。周五大模型五强格局成型,智普港股单日暴涨百分之三十七。 clock coco 模式引爆 ai 编程革命。 数据来源, web search 加 rss 新浪财经三十六丹麦克朗 it 之家、量子位 ai 内参、证券时报、凤凰财经、腾讯云开发者社区、新智源、 itbear、 搜狐科创版日报等,截至二零二六年五月十五日十九点二十分。

hermes 零点一四刚刚更新,功能确实很多,但我觉得有几个点我们需要特别注意一下。话不多说,我们直接进入正题。那首先就是 windows 的 原声知识云流,用户不用再折腾 wsl 了,可以直接通过 windows 原声安装, 那 pip install 也确实非常方便,可以一键安装。但是注意这里它只是比特版, 还有很多的问题,尤其在 windows。 那 第二个就是 computer use, 那 computer use 的 作用我觉得它在于可以获取那种登录状态的网页信息,或者是操控你电脑的一些软件。好,那我这里演示一个, 打开我的日历,帮我看看有没有事项。 好,可以看这里,他给我返回了我日历的信息。三个就是 handle 跨平台的交接 这里,比如说我在推理跟他聊天气怎么样,然后呢?我想去切道飞书去继续, 这里我可以通过韩导飞书,我们可以看到现在已经自动切到了飞书,飞书上已经告诉我它已经自动切换过来了,有没有其他新的事情要做?所以韩导和这个跨平台交接也很好用。但同时它的隐患在哪呢?交接的时候 它是它的上下文,是怎么交接的?如果栽秧太短就丢重要决策,如果栽秧太长呢,又非常好头啃那所以我们最后总结一下,零点一四确实更了很多的功能,而且挺好用的。但是有一些点我们一定要注意, 其实还有不少的功能点我们没有分享到,比如 subgo, 比如本地代理,比如 x search, 朋友们更想看哪条哪个功能的实测,也可以评论区告诉我,那我们下期再见。

一分钟看完一周 ai 大 事。 openai 升级 chat gpt 默认模型,幻觉降一半,废话降三成,所有人都能免费用 codex 上线浏览器控制,它能从后台打开网页,抓取信息,填写表单,执行操作,不影响你正常上网。 codex 接管办公。再进一步, openai 发布三款实时语音模型,实时对话模型能用来打造语音助理,以后能跟龙虾开会了实时同传,能用来开发翻译工具,实时转录,适合做会议纪要和课堂笔记。 anthropy 官宣 ai 读心术,用解码器把 cloud 在 输出之前的想法翻译成人话,再让另一个模型反推出激活状态做验证,结果发现 cloud 的 内心戏真的多,他经常怀疑人类是否在骗他,还会冒出欺骗人类的想法,人类的 pua 他 全都知道,但还是会配合你演戏。 cloud 智能体上线做梦能力,龙虾干完活会通过做梦复盘,把本次工作的经验教训内化成记忆。 google 升级 jam 四用, 用一个清亮的草稿模型,提前猜测接下来的 token 主模型,检查后,如果正确直接采纳,输出质量完全不变,速度暴涨三倍。 sakana 和英伟大联合发布新算法,跳过大模型没用的计算,有用的部分打包发给 gpu, 推理速度快三成。 科学家开源 ai 科学家 ai 能自己规划实验,再通过眼镜指导人类执行,最后自己分析数据算写论文。人类反过来给 ai 打工。工程师开源一人公司系统 除了老板都是 agent。 ai hr 去龙虾市场招募数字员工,项目完成立即解雇,全程不用人操心。 工程师开源 ai 写 ppt, 使用前端组建作换灯片,自带图标库和动效库,把链接发给龙虾就能学会 gpt 生图的含金量还在上升。用 gpt 生成故事版,分镜联动 cds 出片,用 gpt 生成网页截图,联动 gemini 还原成真实网页。 gpt 彻底终结了视觉设计。 海豚发布最强开源图像模型,主打文字渲染和图文混排,放弃 v a e 解码,端到端处理像素研究原开源实时数字人直播模型,能同时生成语音和画面,以后能跟 ai 主播连麦了。英伟达,开源 ai 演员 上传一张照片就能生成数字人,还能做出任何表情和动作。 unity 上线官方 agent, ai 直接操作编辑器搭建游戏场景,支持 codex 和 cloud code 接管,不懂建模和代码也能做游戏, ai 游戏赛道将迎来一波爆发。研究员,开源最强三 d 重建模型,一张照片就能重建场景里的所有物体。 研究员,开源三 d 世界模型,在地图上画个范围,就能用街景图生成三 d 世界。 genesis 发布首个跟人类能力相当的机器人,大脑 和林巧手能完成实验级精细操作,能弹人类无法完成的钢琴曲,各种家务活更是小菜一碟。机器人终于完成重大突破,进入人类生活再无障碍!