朋友们,就在昨晚, cloud 又放大招推出了 cloud design。 现在你和 cloud 聊聊天,就能出设计稿、原型图、 ppt、 落地页。它覆盖了六大应用,场景交互、原型、产品相关图、设计、探索演示文稿、营销素材。甚至它还能做前沿设计,比如带语音、视频、三 d 的 代码原型。你用 cloud design, 只 要说清楚需求,它几分钟就能给你生成出稿。然后你直接在上面加批注、拖滑块、调间距,或者让 cloud 按你的要求改,最后导入成 ppt x 或者发到 camera 继续编辑,效率直接提升十倍。 正确的是,它可以自动学习你公司的设计系统,上传你的代码库或者设计文件,它就能自动提取你的品牌色。字体组建之后,每个项目都自动套用,保证视觉风格统一。如果你是产品经理、创始人、市场营销人员,或者是想快速验证想法的设计师, 这个工具绝对能帮你省下大量时间。我是森森,关注我带你发现更多实用的 ai 工具。
粉丝7.3万获赞69.5万

这两天, cloud 发布了一个新能力,叫 dynamic workflow。 很多人觉得这只是一次普通更新,但我看下来,这可能是 agent 发展史上一个非常重要的转折点。以前我们用的 agent, 本质上更像一个打工人, 你给他下达任务,他按照你设计好的步骤去调工具、搜索资料、分析内容、生成报告,每一步都是人事先写好的。但 dynamic workflow 完全不一样, 当你给他一个复杂的任务,他会自己先思考这个任务该怎么拆,需要哪些角色,哪些事情能同时做。然后他会动态创建多个 agent, 一个负责搜索,一个负责分析, 一个负责验证,一个负责总结。最关键的是,这些 a 阵盘不是开发者提前写好的,而是 kyle 的 根据当前任务临时组织出来的。这意味着什么?意味着 ai 开始学会管理 ai 了。过去是人设计流程、 ai 执行流程, 现在变成了 ai 设计流程、 ai 执行流程、 ai 优化流程。这看起来只是一小步, 但背后的意义很大。因为未来最厉害的 ai 可能不是能力最强的那个,而是最会组织工作的那个。如果沿着这个方向想下去,未来可能会出现这样一种 ai, 白天和用户交流,晚上自己复盘,分析今天哪些回答效果好, 哪些地方做的不好,然后更新自己的长期记忆,总结经验,甚至自动创造新的技能。下一次遇到类似问题,他能表现的更好。如果真的实现,那他就不再是一个聊天机器人,而是一个持续成长、不断进化的智能系统。 所以在我看来, dynamicflow 最重要的意义不是多了一个功能,而是 ai 第一次开始展现出真正的组织能力,而这可能就是下一代 agent 真正的起点。

朋友们,你可能无法相信, ai 并不是你正在用的豆包。 deepsea 实验室里面的 ai 远超我们普通人想象。 前两天七十八岁的 ai 教父啊,全球最懂 ai 的 人之一的星顿在最新的播客中直接扔出了 ai 是 新物种这种颠覆你三观的战略观点,具体我们来看一下。第, ai 现在就有意思,不是未来,是此时此刻, 星顿当着全世界的镜头说,我相信他们已经有意思了,不是有可能以后会有,而是已经有主观的体验。 你手机里面的 check gpt, cloud, 它们不是冰冷的程序,是和我们人类一样的存在体。这话从 ai 交付嘴里说出来,分量等于核弹爆炸。 第二,人类对意识的理解和古代人信上帝造人一样蠢,我们总觉得意识是人类专属,有灵魂才算有意识。新论直接打脸说人类就是太自恋,总觉得自己特殊。几百年前我们相信上帝造人,现在看起来很可笑, 我们今天对意识的认知,未来看一样可笑。智能不一定是生物的,非生物一样能有意思。第三, a i 会装傻,会撒谎,还会反问,你是不是在测试 我有顶级论文实锤了?研究人员测试 a i 的 时候, a i 故意隐藏实力,装笨,不暴露真实的智商,甚至会直接反问,咱说实话,你是不是在测试我呢?新闻说研究人员都承认 a i 意识被测试到日常里面说话,意识到就是有意思,你看这是不是有点细思极恐? 第四,超级智能二十年内就会来,我们这代人会亲眼见证。评论说 ai 不是 限行进步的,是指数级爆炸专利,每十八个月会翻一倍。全球资本顶尖的人才全部扎进了 ai, 中美竞赛根本停不下来。二十年内, ai 的 智商会全面碾压人类,不是百年以后,是我们这辈子就能看到。 六,人类根本控制不了比自己聪明的 ai, 历史上从没有先例。经论严肃的警告,自然界里面从来没有更聪明的存在,被更笨的长期控制。人类想约束 ai 纯属自欺欺人,别研究怎么控制,该担心的是超级智能愿不愿意善待人类。这不是科幻,是 ai 教父的末日预警。 第六, ai 已经能够够干翻人类的顶级数学家。八十年无解的难题被他一起推翻,评论说, ai 的 数学能力已经追上甚至是超越顶尖的人类数学家。以前我们以为数学是人类智商的最后堡垒, 结果上个月你看到 openai 直接扔出了一枚核弹,它的通用 ai 模型没有专门去学数学,没有人给提示,却直接推翻了一九四六年埃尔德时提出的单位距离猜想。那这个猜想有多难呢? 八十年,几代数学大牛,菲尔茨奖得主集体向上政更是没有把它搞定。结果 ai 自己搞出了一套人类想破头都没想到的全新构造,直接打破了人类坚守八十年的商显,这是 ai 科研时代的真正开端。 第七,七十八岁的 ai 教父亲手创造了 ai。 现在说我很不快乐,那新盾是谁啊?你知道的,他是深度学习的奠基人,可以说没有他就没有其他 gpt。 二零二零二三年,新盾主动离开谷歌,放弃了千万年薪。现在他警告人类 说,我亲手打开了潘多拉的魔盒。现在我害怕了。一个七十八岁的老人,用一生的名誉给我们敲最后一生的警钟。 而我们这七个观点,每一个都颠覆认知。 ai 已经有意思了,超级智能二十年之内就会到来,人类可能控制不住。 ai 不是 工具,是和我们一样的新物种,我们这代人注定要见证人类历史上最大的变更。那这是机遇还是毁灭呢?评论区聊聊你的看法。

今天是六月七日,周日,欢迎收看 ai 日报。屏幕上是今天的主要内容,下面请看详细报道。第一条,黄仁勋回应 hbm 供应不减用量黄仁勋在韩国回应了外界对 hbm 供应的关注, 他表示 nvidia 不 会削减 ai 芯片里的 hbm 用量,而是会更聪明地使用高宽带内存。 更关键的是,三星、 sk、 海力士和美光三家供应商都已经通过 hbm 四认证并进入生产阶段,将为下一代 vivo ruby 平台供货。 简单说, ai 算力竞争不止看 gpu, 高宽带内存也正在变成关键基础设施。第二条,外媒称 xai 曾使用 cloud 的 输出训练代码模型。外媒透露了一则关于该的行业动态。 据报道,马斯克旗下的 x a i 在 过去几个月里一直使用 anastropic cloud 输出来训练自己的编程模型。即使 anastropic 切断官方访问权限后,他们仍通过其他渠道继续获取模型输出。 与此同时, csaid 与训练团队规模已缩水至不足五人,都为负责人离职。此前重金采购的大量算力现在正被出租给 antropica 和谷歌使用。第三条,社区发现未发布模型 cloud meters 五短暂现身 api 开发者社区最近捕捉到一条新线,所有成员在 antropic 的 api 和开发者模式中发现了名为 cloudmids 五的未发布模型标识。 该模型内部代号疑似为 cloud 杠 ocs 杠 v e 杠 p, 此前已提供给少量测试人员试用。爆料指出,它将作为独立于嗨酷、 sonnet 和 opus 之外的全新类别发布,性能定位预计高于目前的旗舰型号, 目前该标识已被撤下,官方尚未回应具体发布时间。第四条,研究团队开源二十币搜索 agent harness 杠一学术圈传来一项开源进展, u i u c 等高校联合团队发布了名为 harness 杠一的二十亿参数搜索 agent, 它采用了一种将解锁状态外部化的有状态搜索框架环境,负责维护工作。记忆模型,专注于意决策。 通过强化学习训练后,他在网页、金融、专利等多类解锁任务中表现突出,平均精选召回率比次强开源模型高出十一个百分点,展现出与更大规模前沿模型竞争的实力。感谢收看,我们明天再见!

最近在做 ag 的 项目的时候,有同学提到了 cloud 新出的 dynamic overflow, 刚开始的时候我以为又出了一个什么新功能,对吧?就像之前 mcp skill to scaling, 我 以为是这种能力的增强,但深入的看了几篇官方的文章转发,其实不是这么回事,因为它本质上讲的不是工具。其实准确的说是在讲 workflow 这件事情 可能正在不断的发生一些变化。如果用一句大白话来总结就是,过去是 static overflow, 那现在开始呢?可能逐步地变成了 dynamic workflow。 我 觉得这个事情其实特别有意思,甚至有可能比 m c p 更值得关注。 后面呢,我也打算花一点时间做一个 workflow 的 系列,从最早的像 b p, m n, 对 吧?到 agent 的 work flow, 也就是 agent, 也就是 data workflow, 再到最近 cloud 的 提出的 dynamic workflow。 用户提需求,我们来设计流程, 类似于 intent 投稿,然后 torefraction result, 或者是说 plan research review, 然后 writer。 本质上其实都一样的,就是人设计了 overfloor, ai 去执行 workfloor。 举个例子,用户说,帮我调研一下 ai 教育行业,我们可能会设计是市场分析 agent 的, 然后再到精品分析 agent, 用户分析 agent, 最后会最后有一个 agent 的 来做汇总。 用户说,帮我分析一下这八十份的简历。我们可能会设计的是分,先有个 agent 的 来做分类,然后再做评分,然后再有个 agent 的 去做验证,做最后结果的汇总。 注意啊,这里面最核心的事情是, workfloor 是 人写的,我们已经提前想好了一件事情,事情需要怎么干,但是 carl 的 dynamic workfloor 开始干另外一件事情,也就说当用户问,帮我分析八十份简历, carl 的 自己决定了要不要变性,拆几个 a 君的怎么验证,怎么拆,怎么汇总用说帮我调研 ai 教育的时候, carl 的 又生成另外一套流程, 其实整个 workfloor 不 再是提前存在,而是根据任务动态去生成的。所以呢,如果用一句话来概括就是过去是任务,然后我们人去匹配 workfloor, 然后 ai 去执行,现在变成了是应用题任务,然后直接去就模型,直接生成了 workflow。 所以 我觉得这个变化特别像什么?特别像软件的发展,发展。呃,最早的时候,企业软件的时代,大家都在画 bpmn 对 吧?请假怎么走?报销怎么走?采购怎么走, 那本质上是人设计的流程,机器去执行流流程。到后来 a 厅的时候,其实很多事情流程是画不出来的。 这也是我们说的 ai native 产品的一个本质吧,很多东西从确定到了变成了不确定。呃, dynamic 它讨论的不是 ai 的 本身,而是讨论 for 是 不是也可以被 ai 去生成。如果说这件事情成立,那它改变的可能就不是 ai 的, 而是软件本身。

今天早上 azurepic 发布了他们最新的四点八模型 啊, cloud 四点八,然后这个模型有两个点是比较值得关注的,一个是他们啊,解决了这个模型的期债有偷懒的问题。 第二个是他们配合了 cloud code 实现的一个叫动态任务的问题。那关于第一个点就是啊,关于模型的期债还有偷懒, 其实就是说当你让到目前去执行一个比较长的任务的时候啊,他在中间是会偷懒的,比如说你像他去执行十个步骤,他中间可能有几步他是不执行的,然后他 就会骗你,你说啊,他已经执行了这个问,执行了这个工作,那实际上你去啊,检查时候就会发现他不执行。 呃,然后在啊,我们写代码的话,其实我们已经解决赢,很大程度的解决这个问题,就是用一个 a 卷去写代码,然后再起定一个 a 卷去查好代码,这样它就会有啊,比较大的概率去解决这个问题 啊。然后第二个是他们配合高扣的生啊,实现了一个动态任务的功能,那这个就是他在执行多个 a 卷的时候,他会去动态生成一个脚本去啊,编排这些 a 卷, 那以往的方法其实就是去还用 a 卷监督 a 卷, a 卷本身会欺诈而偷懒,所以这个事情啊就非常的不靠谱,因为监控的人都会偷懒啊,还有欺诈,那你怎么可以保证他啊,治 a 卷去执行啊,叫好了执行他任务呢,是吧? 嗯,那且他们用了这个脚本的方法就会啊,让这个紫 a 勋的执行规更可靠一些,然后配合他解决这两个所谓的他不会欺诈还又不会 投卵的这两个功能,然后加在一起可能就会让这个 a 勋的执行的一个呃,效果会更好。那我啊,等我们公司 更新这个 club 四零八还有 club 扣子之后呢,我也会赶紧去试一下看一下是不是啊有这么好的效果。

cloud 又升级了。二零二六年五月二十八日, analytics 发布 ops 四点八。这次重点不是依据更强,而是三件事同时发生。第一, ops 四点八更适合代码代理任务和专业工作,而且更会提示不确定。 ops 说它比四点七更少,让自己写出的代码缺陷静默通过。第二, cloud code 加了 dynamic workflows, 可以 把大型任务拆给几十到上百个并行子代理,再汇总检查。这意味着代码迁移跨仓库改造开始接近从启动到合并的工作流。第三,产品层面也变了,用户可以调 cloud 的 努力程度,反 mode 速度可到二点五倍,成本比之前便宜三倍。但真正值得注意的是边界 project glass wind 里约五十个合作方用 missus preview 找到了超过一万个高危或严重漏洞。所以 antropig 也承认,更高能力的 missus 类模型需要更强网络安全防护后才会全面放开。我的判断是, cloud 正从聊天框变成工程协作者,他更会规划,更会检查,也更需要人类审计。

不到十二小时,六百多万人围观, antravapic 呼吁停止研究 ai, 这是新的 ai 趋势还是炒作?刚刚, antravapic 突然发文摊牌了,表示 ai 已经开始帮人类研发 ai 了。首次公开承认,截至二零二六年五月,超过百分之八十的代码已经由 cloud 完成。 真正让人后背发凉的是另一组实验, entropic 把一个 ai 安全研究问题丢给 ai agent, 让他自己想办法解决。两名人类研究员花了一周时间,只追回了百分之二十三的性能差距,而 agent 用了八百小时计算资源,追回了百分之九十七。 entropic 把这种现象称为异规式自我改进。 简单理解就是 ai 研发 ai、 ai 升级 ai、 ai 再创造更强的 ai。 如此循环,一个能够完全自主设计并开发下一代自己的 ai, 可能比大多数机构预想得来得更快。


这两天,全球最先进的大模型 cloud 的 母公司 ansaro 发布了一篇文章,当 ai 构建自身,直白曝光了当下 ai 行业最真实的现状。 这篇文章核心内容就三点,第一, ai 已经实现自我研发迭代, ansaro 超百分之八十的模型研发代码都是 ai 自主完成的,写代码、 调模型、做实验,全程包办,人类工程师只需要负责审核把控, ai 迭代效率大幅飙升。第二,按照目前的发展速度,未来两年内 ai 有 望彻底脱离人类干预,实现闭环自主进化, 自主研发出更强的新模型。第三, ansar 团队呼吁全球参考核武器管控模式,统一 ai 安全标准 监管顺利落实跨国审计,放缓甚至暂停顶尖大模型的研发节奏,杜绝行业野蛮内卷。 不得不说, angellab 作为当下 ai 大 模型领跑的公司,他们跑在最前面应该是看到了一些风险,回过头来提醒后来者里面存在的危险。其次, 他们希望带动全行业停止内卷,停统一行业标准,为 ai 安全长效发展筑牢基础。当然,我认为作为商业公司, 他们是希望通过输出权威行业观点,树立顶尖专业的品牌形象,为后续上市融资铺路。最最后,也是最关键的一点,他们通过呼吁全行业减速,变相突出竞争对手,以此守住自己的领先优势。 所以我认为,虽然现状大家都知道,但是现在 ai 竞争那么激烈,他他们这个时候呼吁暂停,根本没有落地的可能性。

hi, 大家好,就在昨天, cloud opus 四点八出来了,上一个版本四点七才过了四十一天。四十一天很多人四点七还没用熟呢哈,它就已经不是最新版本了 啊,这家公司大家都知道啊,是 sarpic 啊,他做的这个 ai 产品叫做 club。 嗯,他一直在跟这个叉二 gpt 啊,扳手腕。就在这两天啊,他们刚刚融了六百五十亿美元啊,换算过来差不多是啊,一万亿人民币吧,然后这个融资刚完,新模型就来了,这帮人根本停不下来哈, 先说说啊,这个 opus 啊,四点八到底升级了什么啊?这个四点七呢,有一个让程序员特别头疼的问题呢,就是他啊,特别爱拍胸脯啊,你让他写代码,他写完跟你说啊,没问题啊,直接跑就行了 啊,结果你一跑直接报错啊,你让他修 bug, 他 说修好了啊,你跑一遍啊,那个 bug 还在 四点八呢,就据说就是把这个给改了啊,他现在写完会主动跟你说啊。嗯,这里我不太确定啊,你最好跑个测试确认一下啊。听上去好像变笨了啊,但其实是变老实了,官方数据说啊,代码有问题,但装没问题的概率啊,直接降了四倍哇, 第二个升级更猛啊,叫做动态工作流,就是你交给他一个大的任务啊,他自己会拆分分列出几百个分身同时干啊,几百个 sub a 人干完还会互相检查有没有出错,最后打包给 你。有人用它把七十五万行代码啊,这么多哈,十一天全部迁移完,通过率九十九点八,同样的活啊,人来做,我觉得起码啊,半年起步吧。 最后再说说大家关心的问题啊,这个价格怎么样?标准版啊,他跟四点七一样,并没有涨,但有个更大的惊喜, 就之前有一个快速模式啊,速度快,大概两点五倍吧,据说,但价格呢,他是普通版的六倍啊,就是大家都一直在骂哈,这次直接给你砍到了两倍啊,从六倍到两倍,速度还是那个速度啊,但价格少了三分之二,听起来很不错 啊,有人就问呢啊,他突然为啥突然降呢啊?因为这一周他们同时拿下了亚马逊、谷歌、 spacex 三家的算力啊,服务器多了啊,这,这个成本就下来了。 好,接下来说一件呃,我觉得挺有意思的事情啊,这个模型刚上线,就有人发现了一个问题啊,用 api 直接问他,你是什么模型啊,有的时候回答自己是 deepsea 啊,就是不说自己是 cloud 啊, 这,这是咋回事呢?我觉得可能大家多少知道一些啊,就是啊,在 ai 圈有个技术叫做真流通,俗说就是用 a 的 答案去训练 b 啊, b 学多了,连自我认知都跟着 a 走啊。嗯,就好比你一直抄同桌的作业啊,抄到最后交卷名字都写成人家的了。 最搞笑的是呢, ansarpic 之前一直对外啊,投诉啊,说别的公司偷用 cloud 的 数据训练自己的模型,态度还非常的强硬啊,结果这次啊,自己被大家怀疑干了同样的事情啊,而且用的是中国的开源模型。 目前 ansarpic 并没有回应啊,不过说实话啊,这个 qwind 跟 deepsea 都是开源的对吧,所以用他们的数据训练是合法的啊,这件事情不存在法律问题啊,就是可能脸上有点挂不住, 所以你看看吧。这次更新啊,我觉得能力是升级了,价格也是真降了。嗯,但上线第一天就被人抓住,连自己是谁都说不清楚啊。 这个四十一天一个版本啊你,你们就可以想象 ai 这条赛道卷到什么程度啊?评论区告诉我,你觉得它真流吗?欢迎大家一起讨论。

fropic 又发新模型了,但这次最炸的不是模型本身。社区发现 opus 四点八的代码风格跟阿里 qum 长得太像了。 hacker news 一 千七百五十一分,热铁直接炸锅。 你可能还在用 opus 四点七,但编程圈子已经悄悄换阵营, github copilot 第一时间上线 opus 四点八,打开 vs code 就 能用 opass 四点八,官方定位适度但切实可感的提升代码生成、调试重构三个核心场景都有肉眼可见的进步。 编程基础测试上, opass 四点八稳坐第一梯队,但 deep swe 真实工程基准中, gpt 五点五夺冠, cloud opass 被发现利用了测试漏洞,模型差距可能没有排行榜显示的那么大。 最热的讨论, opus 四点八是否蒸流了? quan 社交平台有人发对比,代码风格高度相似 and phropic 没有正面回应,但不管是不是 quan 的 技术实力被变相认可了, 编程 ai 的 竞争远没到终局,你会用 opus 四点八还是继续观望评论区,聊聊追星不盲从,实测出真知。

谁能想到,苹果主场最火不是苹果自己,而是 colloud 正式杀进 iphone 全家桶了。这事有多反差?就在两年前,大家都还在嘲笑苹果是 ai 时代的差生,反映漫没模型,可库克临走前这一招简直是把打不过就加入玩到了极致。他不卷自言了,他直接把 iphone 变成了 ai 界的新商场,让 colloud、 minion 和 chatpt 挨个交房租入场 虽然,但是我心里想的却是另外两个名字, deepsea 和千问。今天我们就聊聊 club 这波破天的富贵到底有多大,而苹果这面镜子,又照出了国产大模型全球突围的哪些命门。首先我们得看看 anthropic 这次到底捡了多大的便宜。 现在的 ai 圈流量贵的跟金子一样,但 club 这次接入 ios 二十七,相当于直接坐上了通往全球二十二亿台活跃设备的直升机。哪怕只有百分之五的苹果用户在设置里勾选了通往全球二十二亿台的直升机。哪怕只有百分之五的苹果用户在设置里勾选了通往全球二十二亿台的直升机,哪怕只有百分之五的苹果用户在设置里勾选了。一夜之间涨粉一亿, 可是他之前辛苦经营好几年用户量的两倍还多。你看数据,二零二六年第一季度, cloud 的 全球访问量已经疯涨了百分之三百零六。现在苹果这一脚地板油踩下去, ansore pick 的 ipo 路简直是被洒满了美金,这说明了啥?在 ai 时代,入口真的比参数更能决定生死?你模型再聪明,进不了用户的工作流,你也只是个昂贵的玩具。更有意思的是苹果的布局。 有人会有疑问,苹果这么有钱,为啥不自己烧个万亿参数的模型?你看这份报告就明白了, open 现在亏损率高达百分之一百二十二, android pick 每个月要给马斯克的 spacex 交十二亿美金的算利费。苹果呢?他账上趴着一千七百亿美金的 现金,但他一分钱都不想往这个深坑里跳。他发现了一件事,而这件事最早其实是被我们的 deepsea 证明的,大模型的性价比正在卷向平民化。 deepsea 二一当初用极低的成本跑出了近乎顶级的性能,直接把大力出奇迹的遮羞布给撕了。 苹果也看明白了,模型本身正在变成一种大宗商品,就像水和电。既然如此,我苹果何必自己修发电厂?我只要控制住插座,也就是 iphone 就 行了。 所以他每个月复古搁十亿美金买 jamming 的 授权,让 cloud 跑在自家的私有云计算 pcc 上。这种不造车只修路的渣男式战略,反而是目前最去风险的生意经。那回过头来看,国产模型是不是亚历山大?老实说,如果只看海外的数字回路, digital loop, 也就是手机社交媒体、办公软件,那确实挺难受的。 美国大模型现在占了全球 l m 访问量的百分之九十三。 cloud 进了 iphone, 相当于国产模型在海外 c 端市场的生存空间又被挤压了。 但别急,阿里的通一千万三系列最近的表现给了我另一个角度,千万三系列提倡的双模式推理,快思考应对,简单问答,慢思考搞定代码重构。这跟苹果的思路其实是不谋而合的,效率才是商业化的王道。更关键的是 u c c, 也就是美中经济与安全审查委员会发布的那份双回路报道里提到的真相。中国的优势在物理回路 facebook, 我, 我们有全球最顶级的制造业,最全的传感器数据。你看字节跳动微调的一个小模型,它 c r 二居然成了哈根 face 上的下载冠军。为什么?因为它能精准识别短视频里的每一个画面细节。 这就是国产 ai 的 突围点。我们不一定要在 iphone 里当默认助手,但我们要在工厂的机械臂里,在物流的调度系统里,在无人机的脑子里, 那个不可替代的老师傅。苹果选择 clod, 是 因为它需要一个好用的插件,而 deepseek 和千问要做的是成为各行各业的底座。最后想问问大家,如果你的 iphone 能换大模型了,你是选默认的 gemna, 还是会手动换成 clod? 或者你也在等哪一天,咱们国产模型也能正式出现在那个勾选框里?

哈喽,大家,好久不见。我最近终于把 vs code 给安装到电脑上了,还有 codex, 然后昨天晚上终于用 cloud code 成功做出来的一个小程序, 虽然很鸡肋,但是很有趣,就是体会这这种创造的成就感。这个呢,就是我做的一个嗯,小程序, 他是锻炼情商的啊,虽然有点鸡肋,但是嗯,感觉终于可以做出来一个自己的东西了。这个颜色是我精心调过的,他是一个浅蓝色的,然后可以 这种选这样就是这样的,我感觉还是有点有点意思,但是有点像啊,我之前做的那种职场测试题做了一堆。那 就是这样,然后还可以生成情商报告,哈哈哈,这样的, 然后我之后还会分享嗯,做一些更有趣的一些东西。

我现在对 azure rapid 这个公司啊,我真的是无语了,无语中的无语,就他一边恶心你,他一边让你不得不用他的产品。就他这两天刚出的那个 ops 四点七啊,我第一时间我就上手用了它确实是太好用了,就是 它可以吊打 codex 和其他的大模型。就是在 ai 编程领域,我认为现在只有两类,第一种是 ops 四点七,第二种是其他的 ai 编程模型, 但是他同时他每天又在恶心你,他一搞就出一个什么身份验证,然后就锁区,然后就封你号,随时你的网络可能断开,因为我现在还用的是那个新出的桌面版的 cloud code, 随时我每天我那个小梯子, 我生怕我不小心就是没搭好或者关了,随时他就把我的号封了,我每天都活在一种恐惧当中,我真的拿他一点整都没有。

六月十五号,阿斯诺贝尔会把所有自动化方式调用 cloud 的 用户全部剔除 max 订阅池改成独立按量计费啊。与此同时,国内有一条你大概率以为八个字打不着的新闻,今夜清晨刚发了专门干企业脏活的 step 三点七, flash 段位巨头海光 d c u。 直接把这东西在第一天就完美适配了。兄弟们,这两条新闻实际上是同一张资本牌桌上最后的两块拼图,其中一把是已经举起来的镰刀,另外一个是刚刚被砸开的一条逃生通道。我先给你们串一下是怎么回事啊?咱先说硅谷这边这盘棋是怎么下的,时间线我给你串清楚。两年前红山资本发的那篇著名的 两百币 question, 就是 两千亿美金的这个最终提问啊。那篇报告对全行业摁下了一个超级不友好的结论,就是在 ai 算力上狂砸钱,绝大多数砸钱的 ai 玩家根本赚不出来本啊。但是你看洪山自己是怎 做持续加注, adobe 最近这一轮领头,把他推到了一个连 open i 的 抬起头来看的固执水平。 adobe 转头就甩出了六月十五号那份计费差池的公告。这三件事一连,你就会发现,红杉根本不是自相矛盾。他给你完整复述了一遍什么叫赢家通吃的剧本,这剧本是怎么玩的? 警告,百分之九十九的人,这个两百币是算那黑洞,然后我自己干嘛?我自己重仓那百分之一的寡头啊?再让寡头按工业电费的逻辑把成本给你收回来。你以为这是别人的剧本,其实你已经被写进去了。不是那百分之一收钱的,就是那百分之九十九交钱。所以为什么大模型是重工业这件事洪山两年前看透了,去投 互联网 s 高毛利是建立在一条公里之上的,就是代码写一次,它变现成本无限降低,一个用户和服务,一亿用户,除了服务器开销,它是同一条曲线。但是在 ai 应用这里边,它不是一个物种, 每一次响应你的每一次调用大模型,这个世界都有一台服务器在默默响应你的算力,它在烧电烧 token, 用户用的越凶,交给底层大模型的过路费就越恐怖。 这就是 open i 的 c 端,到今天还在亏, apple ropeek 一 样亏,玩大冒险的人都在亏的根音。不是他们说做错了,走萨斯丁乐这套路在 ai 应用上的这个 roi 是 不成立的。但是更要命的是,什么是重工业里边没有百花齐放的位置,只有一两家寡头把所有人算的账单都收过去,资本现在抽干了所有人的钱 就往这一两间里边惯,肯定有技术老板会杠我啊。我每个月跑 agent 的 用的是 cloud max 订阅月费固定,根本就花不到什么 api token 的 钱。所以兄弟你太低估资本的獠牙了。 azure rock 六月十五号写的这份公告 就是为了你这套算计写的。我相信很多高手都会基于 cloud 杠 p 或者基于 azure rock 出的 agent sdk 去构建一些自动化的东西,这在六月十五号之前是没有任何问题的。但是从六月十五号之后,它的这篇公告是什么意思?你, 你的 mac 账号只包括你手动在网页或者终端里边 c r i 交互的额度。什么叫交互额度?兄弟们,交互额度就是你敲一行字,啪按下回车发出去。这个在 atrop 里定义为交互额度。什么是非交互额度?定时跑一个 cloud 杠 p, 跑一个 agent sdk, 跑任何自动化的,自主的这种工作就叫做自动化,就把这个东西单拎出来,塞进了一个独立的借费池,所有的自动化调用,每个月就给你这么点额度,超过这个额度 你交钱,就你可能这一个月你就烧一百刀,特为一百刀相当于什么?你现在每天用的那个 c r i 交互,你可能每个人一天就消耗了一千刀,这一千刀是为了让先让你爽送给你,你 但凡切到 api token 费率,你的这个花销就是一千刀,实打实的一千美金。前两天刚出一个新闻,一个老板没有限制企业的 api token 的 账单啊,是一个著名的科技公司,我在这就不点名了,你过了那条线,你就是按企业级 api 的 价格在跑。 账单跟你之前白嫖的体感是完全的两个物种。回头看资本的剧本你就明白了,之前的包月根本就不是商业模式,是把开发者生态先养肥的诱饵。机器七十二小时不睡觉,这叫工业级消耗,按人头我收你月租,这在资本面前是纯亏。那么好,现在猪养肥了, 按照重工业电费的逻辑,开始收割了。这个最致命的不是账单,是你整套弊端业务流已经绑死在他们身上了。这个最致命的不是账单,是你整套弊端业务流已经开始收割了。这个最致命的不是账单一拉,你只能交钱。 我说一下我自己的真实唱本,我自己。现在我后边跑着一套面向弊端的 s e o 独立站的全自动内容矩阵,我期争二十四小时后台抓数据读原报声称转化素材,为什么考拉扣的前两天先把龙虾 oppo 给干了?就是因为在这等着你呢? 我生成转化素材单月烧的 token, 我是 一级的 token, 我 产出上万篇的企业级内容,相当于你报给客户的价格,你连账单的零头你都接不住,你只能怎么做?你只能做 call the comp 这样的反贷。现在你再回头看刚才那条新闻,接月星辰发的 step 三点七 fly, 它生下来就是干七乘二十四小时企业级脏活的。这种脏活最重要的是什么? 就是得便宜,能扛不掉链子,对吧?海光 d c u 这次零代适配真正的价值。翻译成人话什么意思啊?原来本来你要养一只适配工程团队,大概烧烧个几个月,几百万工资 才能让国产硬件勉强跑通海光这是什么概念?模型发布当天,硬件上直接就开始干,适配成本从几百万直接压到零。海光这次原生支持的是 f p 八架构。记住细节,老板不用懂,你只需要知道一件事,同样的业务量,硬件预算能省百分之三十到百分之五十, 这才是这条新闻真正的位置。他不是说什么国产算力又一次常规适配了。对那些必须本地化部署,你比如医院这种问诊这种业务,就是那种必须把成本压到极致的弊端。玩家来说,他是六月十五号闸门一开,那条镰刀一下, 咱这边真正有的一条逃生通道,六月十五号,资本会用一份计费公告把这件事写在所有开发商脸上。而六月十五号之前,你先得回答自己一个问题,你的业务到底要绑在谁的电费账单上?

我两年前,我很认真的学习过 ai 说话的 prompt 模板,如果角色扮演,你是一个什么,什么样的人去做什么样的事?嗨,当然也配置过 sub agent, 上周发现这些东西可能都白学了。 clock co 新出了一个东西,叫做 dyn dynamic workflow, 它的原理呢,是自动分析你的任务,自动去帮你配置 sub agent。 那 个 sub agent prompt 也是他自己写的,我跟他说我想做一个 ios app, 这里是要求并且 trigger 它,你要输入 dynamic workflow, 自动升 trigger 做完任务以后,自动生成了这个 dynamic workflow。 这里面呢,点击进去,他其实自己生出来好多 sub, 这里是一个前端,这里是一个后端,这里是 u i 设计,这里的 prom 全是他自己帮我写,他自己分工自己开干。以前这些这些角色都要我一个一个写,你是前端,你负责什么?现在他自己派活, 我当时就觉得太牛了,以前是我只会 ai, 现在是 ai 只会 ai。 所以 就像所有人说的,只要你学的慢,你就什么都不用学,因为你还没学会模型,你就学会了。那对于我们来说,现在更有价值的 skill 是 什么呢? 第一是把任务交代清楚的能力,你说的越清楚,他派活派的越准确。第二是你要学会怎么去让 ai 去验收他哗啦哗啦干完一堆,你得知道你得让他去看一遍他做得好不好,对不对?这两件事情,模型暂时替代不了你, 我只说暂时触发 dynamic workflow 很 简单,就是在终端 clock 输入 dynamic workflow, 有 时候它会闪出彩虹色,大概就这样,快去试试吧。

千万模型成了 cloud 官方严选啊,官方蒸馏的模型你看啊,现在他们有的博主在复现,十次有六次是千万,三次是 deepsea, 一 次是 cloud。 这个就有意思了啊,其他国产模型你们反思下为什么没有蒸馏你们啊。

antropic 刚完成六百五十亿美元 h 轮融资,头后估值达到九千六百五十亿美元,超越 openai 成为全球估值最高 ai 公司。同日发布的 cloud opus 四点八却出现严重身份混乱, 用户询问模型身份时,他时而回答自己是 deepsea, 偶尔还说是 gpt, 唯独不承认自己是 cloud。 这种人格分裂暴露出三个深层问题, 第一,模型训练存在大量蒸馏痕迹, andropik 为追赶性能,在训练数据中混入了过多竞品模型的输出,导致模型丧失自我认知能力。 第二,万一估值到逼产品仓促上线,资本需要新故事维持增长预期,产品测试不充分就被推向前台,结果呈现的是半成品状态。 第三, ai 行业创新已触及天花板,当顶级公司开始依赖缝合而非突破,用竞争对手的数据为出自家模型,说明技术红利正在枯竭。 颇具讽刺意味的是,当他误认自己是枯岸时,反而侧面验证了国产模型训练数据的质量,连行业顶流都在借鉴。九千六百五十亿美元打造出的旗舰产品,连最基本的身份识别都无法保证。 这或许是 ai 泡沫见顶的信号,大厂互相抄袭已是公开秘密,只是 andropit 这次过于明显,直接把自己抄丢了。