报道有存银行安卓管理闲听介绍谷歌开发者大会,市面向开发者和科技爱好者展示谷歌最新技术和平台的年度省会。首先最重磅的就是大会主指演讲,他带来了安卓十三的更新、 google pla 隐私保护升级等一系列的干货,官网也提供一百三十多门丰富的技术课程一共学习。除此之外,现场还有很多互动展区, 用天丝富豪展区将日常各种声音转化为乐器声,用手指挥就可以演奏音乐。再譬如富艾特展区,我们可以放置自己喜欢的图案自拍并打印,看似平平无奇,实际上展示了富艾特多平台无障碍运行的特性。这可以让陈璇轻松的开发各种跨平台的应用,保住自己极其可谓的发量。 这是谷歌艺术与文化展台,也是必打卡的地方。譬如官庙月色小名,我们就能对价值超高的艺术藏品进行涂鸦和再创作。再譬如这个叫做见微之助的 ar 技术互动产区,可以直接让我们在屏幕上全景游玩司马泰长城,甚至探索内部结构。这对孩子的启蒙教育以及出行受限的旅行规划都很 很有帮助。科研、医疗工作很于都有很大的想象空间。总的来说,这次大会让我很有感触,因为原本枯燥的代码都可以在这里变得直观有趣,能够真正的实现想法,解决问题。购买胃癌不再是程序员的事情,因为它终将变成所有人都触手可及的美好未来。
粉丝85.5万获赞805.1万

兄弟们,沉寂已久的谷歌终于来炸街了,就在刚刚结束的谷歌 i o 大 会上,发布了天花乱坠的各种 ai 产品,但真正重点就两个,一个是独一档的多模态能力和超强的 ag 能力。 先来看个最狠的,谷歌发布了全新的世界模型 jimmy nike omni。 你 可以将任何形态的文件作为输入,比如文字、视频、图片、音频一起发给他。 jimmy nike omni 能以任何你要求的形式输出给你, 从此 p 视频就像 p 图一样简单。但如果说 omni 是 无敌的感官,那么同时发布的 jimmy nike 三点五 flash 就是 专为代码和 ag 的 优化的, 它的输出速度达到了同类前沿模型的四倍,每秒狂飙一千五百个 token。 谷歌在现场用全新的 ai 开发平台 anti gravity 二点零展示了它有多逆天。 杰米奈三点五 flash 仅仅持续工作了十二个小时,就从零首写出了一个完整的操作系统内核。它在开发时,后台自动派生出了九十三个 ai 子代理,总 token 成本低于一千美元。而同类型的任务如果交给人类团队,至少需要数月的时间。 更硬核的是这个首出的操作系统,既然能直接加载毁灭战士 doom, 现场就玩起来了。 随后谷歌顺势推出了 gemini spark, 你 可以理解,它是谷歌为你远程部署了一台七乘二十四小时,搭载了 gemini 全套能力的服务器。它能跨越应用,直接打通各种第三方软件。你只要给他一个目标,他自己就能拆解,步骤全自动帮你搞定。 比如自动检查信用卡账单里的隐藏订阅费,把货一记录整理成文档,然后群发等等。最后还有压轴亮相的谷歌智能眼镜,戴上它, jimmy 奶就变成了你现实世界里的专属管家。路过咖啡店,眼镜自动识别,你只要动动嘴, ai 就 把咖啡给你点, 还能实时 ai 导航和同城传译。从这次 ai 大 会上看得出,谷歌正在疯狂地将 ai 模型的能力产品化,毕竟用户真正需要的是能解决问题的产品,而不是 ai 模型本身。第二呢,谷歌之前明显在多模态发力过猛,在 ag 能力方面有点落后于 antropics 和 open ai, 现在眼看 ag 大 爆发,所以他就奋起直追。但即便是刚刚发布的 gmi 三点五 flash, 也依然和这两个头部公司的模型有差距。那么 gmi 三点五 pro 会不会惊艳全场呢?大家可以期待一下。好了,我是阿朱,关注我,让我们一起在 ai 潮头冲浪!

兄弟们,就在今天,谷歌 i o 开发者大会正式开启,这是 alphabet 沉寂许久后,发起了一场声势浩大的 ai 绝地反击战。过去一年其市值大幅走高,华尔街早已用资金看好它的全站 ai 布局, 从自研算力、芯片、大模型,到云计算、移动生态、企业软件,完整产业链优势无可替代。如今市场不再满足行情上涨,更期待清晰落地的产品战略。今天龙一这条短视频给大家梳理谷歌大会九大核心看点,精准匹配对应 a 股优质企业。 看点一, getmy 大 模型迎来迭代升级本次大会市场最关注 gemini 系列模型更新,按照谷歌稳定迭代节奏,此次大概率为版本优化升级,跨代重磅新品短期亮相概率偏低。核心看点集中在通用 ai 助手进阶智能交互功能,完善视频理解与长文本处理能力升级, 同时开源模型与机器人 ai 模型同步更新。目前旗下智能服务用户规模与算力调用量持续暴涨。谷歌重心全面偏向商业化落地,加速抢占民用与企业级 ai 市场, a 股核心受益蓝色光标一点天下,深度扎根谷歌海外生态,承接 ai 营销与大模型生态落地订单,充分享受流量与商业化红利。看点二, ai 智能体成为全场核心主线智能体是本次大会核心主题,谷歌全新智能体平台即将亮相, 主打自主规划任务,跨平台工具调用,全流程自主执行,彻底革新传统 ai 交互模式。谷歌定位底层生态搭建者,联合行业伙伴完善产业闭环,全力争夺办公智能助手、企业流程管理等优质隧道,在多模态智能办公领域抢占先发优势。 a 股核心受益,天福通信、藤井科技, 主营高速光互联与光学核心器械完美匹配,智能体高带宽低延迟传输刚需。看点三, android x 二生态落地布局下一代穿戴终端新星谷歌携手消费电子巨头推出全新智能穿戴眼镜产品, 主打轻量化机身,搭配旗舰级专用芯片与高清影像配件,适配日常多场景使用。谷歌负责搭建底层操作系统,合作品牌负责硬件研发生产,复刻安卓生态发展思路,全力抢占空间计算新赛道,布局下一代智能终端入口。 a 股核心受益力迅,精密领益制造深耕消费电子精密制造,包揽 x r 设备组装结构件与升学配套核心业务。看点四,谷歌云强势领跑业绩增长领跑行业谷歌云业务增长势头迅猛,增速远超行业。另外,两大头部玩家在手,积压订单体量庞大,半数订单将在两年内转化为实际引收, 深沉式 ai 相关业务更是迎来爆发式增长,大额长期合作订单持续落地,客户消费力度稳不提升。本次大会重点关注云服务定价、新业务布局以及头部 ai 企业合作细节。 a 股核心受益,工业复联、英维克分别拿下谷歌云服务器代工与数据中心夜冷核心订单,算力基建订单充足,业绩稳健。看点五,自研 tpu 芯片正式对外开售今年下半年,谷歌将对外开放自研专用 ai 算力芯片,明年持续扩产放量,这款芯片专为 ai 训练与推理量身打造,能效表现优势突出。 全球 ai 芯片市场空间广阔,谷歌入局将重塑算力行业格局,市场重点关注芯片售卖模式、盈利空间与合作细则,这也是谷歌转型全占算力巨头的关键一步。 a 股核心受益互电股份深南电路专攻高端算力服务器 pcb 版, 深度切入谷歌 tpu 全产业链,高端产品附加值极高。探点六,深度绑定头部 ai 初创企业谷歌不仅入股头部 ai 企业,还敲定千亿级别云服务合作订单, 叠加百亿级战略投资,形成完整产业资金闭环。即便市场选用别家 ai 产品,底层算力依旧依靠谷歌体系运行,形成天然业务对冲。双方深度合作细节与算力扶持政策将在大会进一步透露。 a 股核心受益中际续创新益盛高端高速光模块核心供应商大批量供货。谷歌算力集聚, 承接头部 ai 企业算力扩容需求。看点七,谷歌搜索全面 ai 化作为谷歌核心基本盘搜索引擎,全面搭载 ai 能力, 实现智能问答、内容精简梳理、多模态解锁等全新功能,摆脱传统网页跳转模式,直接为用户输出解决方案,一托庞大用户基数,稳固市场地位。同时发力企业端智能搜索市场,聚焦 ai 搜索全新广告变现模式与商业化路径。 a 股核心受益省广集团中文在线, 一家主打海外全域广告投放,一家深耕 ai 多模态内容创作,适配谷歌搜索 ai 生态变更。探点八,安卓系统全面植入端侧 ai, 全新安卓系统深度融合大模型能力覆盖手机、平板、车载便携本等全品类设备, 完成从传统触控系统向智能 ai 系统的转型。凭借海量全球用户,移动端 ai 普及速度优势明显。大会重点关注轻量化端测模型工号功能适配与第三方应用开放权限。 a 股核心受益,瑞生科技、德克利主营终端升学传感与高速组网设备,全面适配安卓端测 ai 硬件配套需求。 看点九,敲定 ai 全站闭环终极战略九大看点最终指向谷歌终极目标,打造软硬件一体化 ai 全产业生态。从底层算力硬件、中层大模型服务到上层应用生态,终端产品全面自主可控、 稳整生态,带来更快的创新速度、更低的运营成本与极高的行业壁垒,也是谷歌抗衡行业禁品的核心底气。 a 股核心受益,塞微电子、光库科技布局算力互联核心芯片与光通信器械卡位谷歌全站生态最上游核心配套环节。 家人们,谷歌 i o 大 会吹响 ai 下半场竞争号角,上半场算力 gpu 热度褪去,下半场自研算力芯片加全站生态成为主流方向。 a 股一众深度绑定海外科技生态的实体企业,手握稳定订单与实际业绩,是下半年 ai 赛道优质布局方向。 龙一题材梳理,专注硬核逻辑拆解,喜欢的朋友记得点赞收藏,一起认准产业大势,紧跟行业风口,把握新一轮 ai 产业发展红利。

小道消息爆料啊,谷歌在这个月的开发者大会上,大概率会发布一个全新的模型。这个疑似泄露的新模型名叫欧米尼,主打的是全模态能力。简单来说,以前的 ai 主要是处理文字和图片,或者外接其他工具来生成视频, 我一开始也不信他能有多大的突破,直到看到爆料说,这个新模型可能会让 ai 原生支持模型输出,甚至具备更深度的记忆功能。 这意味着以后你只需要输入一段文字,他就直接能在内部给你整合生成一段完整的视频,不需要再跳到别的视频生成网站里去弄。 这对咱们普通人来说,做视频做内容的门槛又被拉低了一大截。对谷歌来说,他们想要做的就是把自家的 ai 从单纯的聊天助手变成全能型的生产工具了。你会看好他这次的更新吗?

记得上周谷歌在山建城开了每年例行的谷歌开发者大会,但是今年有一点点不一样,它正面的撞上了 openai 的 春季发布会,也撞上了 appstore cloud 的 新的功能上线,撞上了整个行业最密集的军备竞赛的窗口。那谷歌在这个节点向世界证明了一件事情, 这场 ai 的 战争,它没有掉队。那么我们今天一起来拆解一下谷歌二零二六年的 ai 的 战争,它没有掉队。那么我们今天一起来拆解一下谷歌到底拿出了什么 好。先说结论,谷歌这次的产品矩阵是有史以来最完整的一次,它分了四个层级。第一层呢, google 的 gemlife, 三点五 flash, 速度快,跑分比上一代快四倍,成本也低,面向开发者和 api 的 调用场景。第二层, gemini 的 omni, 它是一个全模态的旗舰模型,文字、图片、音频、视频,全能吃,全能输出。第三层叫 gemini spark 云端,二十四小时的智能体,在你睡觉的时候,它会帮你把任务跑完。第四层, ai 的 overuse 和 ai mode 已经覆盖了二十五亿的用户, ai 的 搜索不是未来,而是现在。 那现在谷歌这个矩阵的逻辑就非常清晰了,快的打价格战,强的打持久战,大的打规模战。 我们来重点说一下 jamming 三点五 flash 啊,因为这个模型可能是今年最被低估的发布之一。 flash 这个模型骨骼一直是用来代表快而便宜的,但这次的三点五 flash, 它不仅仅是快,它的能力也很强, 他这次的跑分儿呢, m m l u 的 综合推理达到了八十七点三分,超过了 g p t 四 u 的 八十六点四代码生成英文一到是九十五点一分,非常领先,常温本理解,九十九点二分基本满分。多模态的 m m m u 七十三点四分,比 g p t 的 四 o 的 七十一点二高出了一档。 那为什么这个很重要?因为这次的 flash 模型,它不仅是便宜,而且不差。这个就证明它是 api 生态的核心竞争力,开发者不会为了贵的模型而迁移平台。但如果便宜的在这些关键指标上又进行了领先,那么迁移成本就消失了。 flash 呢?其实现在是谷歌的流量入口,也是它锁住下一代应用生态的沟子。下一个产品呢?我们来介绍 jimmy 的 omni, 我 的理解是它是谷歌对于 agi 入口的这个问题的回答。 什么叫全模态模型?它不仅仅能看图,能听声音,而且是任意输入,任意输出。你给他视频,他可以给你文字分析,你给他语音,他给你生成图像,他能给代码截图,他能给帮你调试代码,他可以做任何你想到的事情。那这是一种范式转变。 过去的 ai 呢,是多个工具的集合,而欧米尼则是想要打造一个统一的感知生成引擎。当然,谷歌并不是第一个做全模态的,全模态这个东西大家应该不算陌生, g t 四 o 很 早就在这条路上了,但是谷歌有一个非常强大的优点,它就像国内的字节一样, 它拥有非常庞大的数据库, youtube, google maps, google photos, 它的搜索引擎,这些全部都是全媒体数据的天然矿脉,是任何其他公司在短期内无法复制的。好 一个数字二十五亿,这是 ai overview 的 越活用户数量,不是注册用户,是越活。大家用 google 搜索的时候有没有发现,在你每次搜索的时候都会有一个 ai overview, 你 甚至有时候不需要点击你搜索的任何一个网站的链接,你就能得到你想要的答案。 那这样的一个从传统点击链接到 ai overview 的 一个转变,就是谷歌现在正在做的一个非常领先的事情。 而 ai mode 呢,现在也已经有十亿用户在用,这数字呢,是很多 ai 初创工资一辈子都达不到的两级。这就是现在谷歌最大的护城河,它的分发能力很强,我不管你的模型谁更强,谷歌能让 ai 触达最多人,这一点是短期内没有人可以撼动的。下一个产品我们讲 gemiland spark, 这是我今天最想讲的一个产品之一,它的核心概念呢,是二十四小时的云端自主运行的 ai 智能题。你交给他一个任务,比如说帮我整理这个月所有的竞品动态,生成一份报告,快去睡觉, 第二天早上这个报告就会向你的收件箱里。谷歌把这个拆成了三个阶段,任务理解和规划、工具调用和数据收集,以及最终的输出和推送通知,整个过程都会在谷歌的云端跑,不依赖你的设备在线,也就说你的硬件条件不需要那么高, 这就是从 ai 驻守到 ai 员工的跨越。当然这里还有一个很现实的问题,其实就跟当时的小龙虾跟 hermes 一 样,你愿意把多少的权限交给他,他可以帮你发邮件,帮你订机票,帮你提交报告,这每一步其实都是真实实践的操作,一不出错的代价可能就会很大, 所以谷歌目前的方案就是人在回路,关键的节点需要你来确认。但至于这个边界会怎么移动呢?这个还值得大家持续关注。我们再聊聊硬件,安卓的 x r 智能眼镜也是这次在开发者大会上发布了。 那谷歌联合三星侦透 monster warby parker 呢,做了一款非常酷的 ai 眼镜,这个组合很有意思啊,三星其实是提供了芯片和显示技术。那侦透 monster 呢,是一个非常潮流的眼镜品牌,很多明星都非常喜欢戴,它给你提供了非常强大的这种设计。 那 warby parker 呢?是美国最大的直销眼镜品牌之一,谷歌同时在解决两个问题啊,就是技术可行性以及时尚穿戴性, 谁也不想戴一个非常厚重的这种眼镜,在路上就想戴一个酷酷的,好看的又好用的。那在现在谷歌这个就实现了,功能上它可以实时看到你的视野识别场景,给你语音提示,帮你记忆你见过的人和事。可能外观上有针头吗?所有的支持它也不会难看, 对吧?我要说一个历史背景,二零一三年,其实谷歌做过一个 google glass, 但是最后失败了,主要就是因为外形长得太奇怪,而且功能不实用,隐私受到了争议。所以至于这次谷歌能不能解决这些问题,我相信有 gentle monster 跟 warwick parker 的 加入呢,至少让外观这个问题有了解答,那隐私和功能的话,我们还需要时间来验证。 而开发者部分,我们重点说一个细节,叫 web mcp, 谷歌这次在 i o 上宣布了支持 web mcp 的 标准。 mcp 呢?模型上下文协议,不懂的观众也可以看我的上期视频,那是 iso 去年发布的一个开放协议,用来让 ai 模型连接各种外部工具, 那谷歌选择了支持这个标准,而不是另起炉灶,这也是一个很重要的信号,说明 ai 基础设施层的互操作性的标准正在形成一个行业的共识。对开发者来讲,这意味着你在 java 上写的 mcp 集成,理论上是可以附用到任何其他兼容 mcp 的 模型上,那这样生态的互生核就开始打通了。 另外 gemini a p i 有 了官方的安卓的 x r s d k, 还有 vertex ai 的 新一批的企业工具,谷歌也在努力的把 gemini 变成整个 google 的 技术栈的大脑。好,我们来拉一下横向比较,谷歌 openai, astropica 谁在哪个维度领先? 那从速度上我们可以现在看到 jamming 三点五 flash 是 非常领先的准确度。 cloud 四的 opus 跟 gpt 我 觉得还是非常有优势的。而多模态,我觉得谷歌的 omni 跟 gpt 现在可以属于是并驾齐驱,但搜索整合上,谷歌现在可以说是无可争议的。第一 常识任务的话, jamming spark 领先,但 cloud 的 computer use, 包括现在的入侵功能也在快速的追赶开发者生态上面, openai 的 历史积累最深,但是谷歌在追赶这个方面,我觉得应该是速度比较快的。 总结来说,谷歌在部署规模和分发能力上现在是第一的,在模型的综合能力上也绝对是属于第一集团的领跑者,那在创新的速度上,我觉得已经比两年前的他们快了很多了。 它还不算是全方位领先的一个最强的厂商,但它是覆盖最广,也最难被绕开的那个。最后一个问题,谷歌这次发布为什么值得重视?那三年前 chgbt 出现的时候,外界普遍认为谷歌被打了个措手不及, 那个时候就会有人说谷歌的搜索呼声盒会被 ai 颠覆。有人说谷歌搜的太慢,但我们今天回头看,谷歌不但没有被颠覆,反而把 ai 能力深度嵌入了自己所有的产品里面。二十五亿的 ai overbook 用户,这不是谷歌失败的证据,而是谷歌把 ai 变成基础设施的证据。 这次 i o 呢,让我看到了,不是一个追赶者,而是一个完全成型的平台转型开始进行总攻的一个巨头。他的优势呢,不在于某一个模型比别人强多少,而在于他有能力把 ai 能力以最低摩擦的方式送到最多用户的面前。 呃,我想用一句话来总结今年的谷歌 io, 谷歌证明了 ai 的 终极不只是魔性之争,更是分发之争、生态之争、习惯之争。你每天用 google search, 你 用安卓手机,你的邮箱呢?是几秒?你的文件在 google drive, 那 谷歌的 ai 其实在渗透你生活的每一层。 这不仅仅是谷歌 vs open a i vs espionage 战争,这是一场谁的 ai 成为你默认的战争?谷歌正在用规模硬的这场战争。好,那我们这期就到这里,我是小卡,我们下期再见。

朋友们,昨天的谷歌 i o 大 会你们看了吗?我早上起来刷他的新闻,好像没什么波澜啊,但是有另一个新闻,然后我一下就清醒了, codex 的 额度又重置了警感信,而且 sam 奥特曼的推写的特别漫不经心, 让我隐约觉得谷歌这场大会肯定是有点料的。所以我用了一早上,仔仔细细看完了,也分析了,果然让我发现了三条重要的线索。当然,我还是建议大家完整的看一下这场发布会,我觉得料特别多,然后再结合我给的三条线索,看看你们有没有收获。 这场大会简而言之,没有什么创新,但是非常的务实,他发了很多东西, google omni, 一个可以从任意输入到任意输出的世界模型 gimna, 三点五 flash, 质量超越了三点一 pro, 当然价格也差不多,速度飞快。还有一个全面向 codex 的 ui 靠拢的 anti gravity, 二点零, 一个和 ospec 命名完全一致的 managed agents api, 一个叫做 german spark 的 谷歌版小龙虾,还有七十二小时在后台帮你搜索的 google search agent。 最后还有一个不知道多少场都已经发布过的仅有语音版的智能眼镜。因为都是产品发布会啊,所以就信息特别的零散, 但是呢,我是能看到有几个非常清晰的大方向的。我先说第一条啊, gemini omni, 这是一个号称能从任意输入产生任意输出的世界模型, 虽然看大家测试的结果啊,视频生成效果比不上 cds 二点零,但是如果从 word model 的 角度看,它可能还真的有点特殊意义。你想象这么一个画面啊,就你站在一条河边,左边有一条断掉的独木桥,地上有一根木棍, 上方呢,垂下来一根细细的藤蔓,右边还有一条破了洞的小船。这如果是真实世界,你打算要怎么去过河? 所以,不管你选择哪条路,我相信你在你的脑海里一定都会闪过每一条路径的预演画面。但是如果是未来的机器人呢?也是一样,他应该不只能看见这些东西,他必须在脑子里先模拟走断桥的时候会不会塌, 木棍能不能当支撑,藤腕能不能承重,破船漏水的速度够不够撑到对岸。如果未来我们要进入一个机器人时代,我们就必须有一个阶段,需要一个模型来生成符合物理世界规则的内容,让机器人去学习。这就叫 word model。 在一个给定的物理体系里,不是要画的像,而是要符合规则。前两天我看了一个演讲,是英伟达的金饭在红杉资本分享会上的一个演讲,他讲了一个很关键的路线,叫 real to seem to real 什么意思呢?就是先把真实世界扫描进来,变成一个可交互的仿真环境,然后在仿真里大规模生成变化的内容,训练机器人的策略,最后再把训练好的能力迁移回真实的机器人。这其实就是在复制大语言模型的成功路径啊。 大元模型是预测下一个 token, 而在机器人世界,要预测的是物理世界的下一个状态。未来真正关键的就是能不能把真实的世界变成可训练、可推力、可交互的模拟世界。 这就是为什么我觉得 omni 这条线非常重要?如果 jamming omni 真的 能做到任意输入到任意输出,并且能保证物理的一致性,那它就不是普通的视频模型了,而是迈向巨深智能训练闭环的关键基础设施。 它的价值就远不止发布会上那些整活的视频。当然,我的设想的场景还太遥远了。只是举个例子,我用 c 氮二点零是完全没法过河的, 但是我用了 gpt image 二,它就能想象出多种场景,并且推演出最符合逻辑的过河方式。虽然这不是视频,但似乎有那么点味道了。 于是我又用了一张迷宫的图交给他,他也能正确生成走出迷宫的路径。我用了很多视频模型都去尝试,答案不意外,没有任何一个能做到。 很可惜啊, api 还没开放,我无法访问 gemini omni。 但是如果它能做到,那它的价值就不可小觑了,就不应该再把它和 cds 做比较,而是把它放在更重要的位置去看。所以,这就是第一条线索,谷歌很可能向世界模型迈出了一大步。 那第二条线索呢?是我看到了交互方式正在飞速的演进。你们还记得吗?去年这个时候,大部分的人应该已经开始从科斯转到 cloud code 的 这种终端交互的形式了吧。 但是我相信现在很多人的主力应该已经切换到 codex 的 桌面版了吧?为什么呢?因为命令行输出的文字界面里,大部分其实都是我们不关心也看不懂的信息。 但桌面版它的右边就可以弹浏览器啊,也可以弹 preview 啊,可以有更丰富的表达和交互。 anti gravity 现在就是在走向这种眼镜,它把以前的 id 已经藏起来了,给了一个和 codex 基本上差不多的一个工作台。 它不再强调你去点目录,读文件,手动改代码,它强调的是 agent first。 谷歌用了一个词叫 mission control。 这句话很准确啊,未来的 agent 的 控制面不是让你盯着代码细节的,而是让你看清更多的 agent 的 状态,谁在做网站,谁在做素材,谁在规划架构,哪个任务需要批准,哪个任务可以接管,哪个 agent 跑偏要暂停,这才是桌面版 codex anti gravity 这类界面真正适合做的事儿 就是变成一个多 agent 的 状态,面板和指挥台。我们现在再来看 ai studio 的 一个 demo, 它是一个电台演示的 demo。 谷歌说了一句很关键的话,这句话的中文含义是生成式的 u x。 举个例子就是 ai 在 运行过程中生成小组件来和人类交互。 前段不是有一种讨论在说让 ai 生成 html 比生成 markdown 更好,因为人类很快就能看懂网页,而看 markdown 就 很费劲。说就是这个道理。 u i 和 u x 的 作用现在变了,它们不再是为人类的体验服务了,而是让人类更快的去确认结果。那为什么不用更加动态更丰富的表现来提高人类的效率呢?所以相信我, generative u x 由 ai 实时生成的交互在未来的几个月十分重要。我不知道是几个月啊,因为实在是发展的太快了。而后面的语音部分更加精彩了,这是谷歌的拿手好戏。谷歌的实时语音我不知道大家用过没,非常强, 演示者直接用语音,让 antigravity 去微调 gem 四音频模型,能听懂 lara 这种专业词。 agent 接着生成实现计划,写代码,跑训练。这不是语音输入法,这也不是 tts, 不是 asr, 这是语音直接指挥 agent 端到端的语音。 如果再结合发布会后面提到的 x r 眼镜,把航班、酒店、旅行信息用特殊的卡片实时显示到眼镜前,那就让这条路线更清楚了。 现在是 codex 式的控制台,还有输入框,未来会不会直接是语音输入了?会不会连电脑屏幕也不需要了?手表、眼镜、手机是不是都是可以交互可以确认结果的设备?那我现在正在做的多一阵系统正在策划做语音的部分。 我每年暑假都会带女儿去三亚冲浪,如果能在路上用语音麦克风来输入车机的屏幕来确认工作结果,让 agent 随时都在家里的服务器里干活,这是我非常向往的场景,我现在正在为他努力,而且我也相信这就是未来的 agent 的 交付方式。 所以一个核心的洞察就是,如果要做产品,绝对不能再停留于 chat 这样的交互了,我们脑洞应该开的更大一点,想的更远一点。 那第三条线索就是谷歌也搞了一个 open crawl, 而且可以多 a 着呢,和谷歌最擅长的搜索一起交互。 openclaw 当时最吸引人的就是它通过心跳或者说定时任务,可以二十四小时不间断地干活。要知道真实世界的行动是不是都是信息驱动的,比如说金融信息、地缘政治,还有突发的信息都会影响我们的决策,所以谷歌做了一件很务实的事, 他把搜索能力塞进了能七成二十四小时后台运行的 agent 里。谷歌在发布会上把它叫 search agents, 他 们不是等你搜索,而是你设好目标,他们就在后台一直盯着。 这里的重点不只是持久,他甚至还可以同时有多个 a 阵的为你服务,时刻盯着不同维度的信息源。而且他有多 a 阵的来解决信号产生时的动作。我们不再是搜索一个答案了,而是 a 阵时刻发现我们想要的答案,然后把方案做好。给我们 发布会里举了几个例子,比如说你关注某类生物科技的股票,他就会接入实时的金融数据库, 市场一动就会给你综合的更新。如果你在找房,他就会扫全网社交平台和论坛,如果你喜欢球鞋,他就会盯着运动员联名的发售动态。这个功能叫 germanspark, 更像是一个入口,而 search agent 是 一个触发器,多 agent 提供了解决方案, 所以这一整套就串起来了。那顺便提一句, gmail api 里也出现了一个 managed agents, 看我前几期视频,应该听着很耳熟吧,最早是 onslap 提出的,现在谷歌也复刻了一套, 一个 api 调用就能拉起无数个带沙箱环境的云端 agents。 这说明谷歌啊,不只是想让 agent 来陪你聊天儿,它是在补执行层面的东西。 这就是第三条线索。我认为很快云端随时待命的大量 agent 呢,都不会是稀奇的事了。而发生什么样的信号,产生什么样的行动,依然需要我们去定义。 我很感慨啊,前不久我还在思考什么样是一个好的架构,一转眼人家成熟的方案已经摆在眼前了。所以总结一下,如果只是从产品看,这些都没啥新意,不是谷歌独创的。但是如果按这三条线索看,就会发现他在顺应一些时代的方向, 世界模型的方向,交互方式的进化,云端二十四小时不停歇的多 agent, 而这些越来越强大,越来越成熟的基础设施,怎么样才能进入我们的生活,这依然是最难的问题。 谷歌的大部分服务我都无法访问,我相信你们肯定也是一样,但用不了。谷歌不是重点,重点是国产玩家有没有在做同样的事,他们能不能追上。 所以呢,下一期我想继续顺着这个线索聊,我们怎么样国产变得更好。好了,以上就是本期的全部内容了,谢谢大家。

谷歌刚刚在 i o 大 会上发布了关于 spark, 所有人都在说这是 ai 的 又一次进化,但是真正发生的事情可能要比进化恐怖的多得多。 先来看 spark 到底是干什么的,它号称是全新的个人 ai 智能机,它可以自主实现帮你订机票、订酒店、回复邮件、更改文档等等这一系列的操作重点,它不像扣代斯基一样帮你操作软件,而是全程不会打开任何的界面,这是最恐怖的事情。你能管这个东西叫做进化吗? 绝对不是,这是杀死软件的开始。在过去的四十年,所有的软件都绑着一根绳子,那就是你的注意力,你打开页面他才会动,你不在的时候,那软件就是死的。 但 spock 直接剪断了这根绳子,绕过的用户曾直接调用了底层的 api 和数据,那么你精心设计的界面按钮和交互流程全然都不在了,这也就意味着作为用户的这个角色正在更换。那么一个没有用户的软件还能够叫做软件吗?

刚刚结束的二零二六谷歌开发者大会,可以说是直接亮出了 ai 时代的最终风向。如果你没空看全城,今天这条视频带你一网打尽所有核心细节。这次大会给我最直观的感受就是谷歌要把 jamie 塞进几乎所有产品里,就像微塑料融入血液一样, jamie 彻底无处不在。 他们的策略简单粗暴,拿 gemini 随便加个名词就当新产品发布,比如 gemini spark、 gemini omni 或者 gemini flow。 谷歌把这叫做 gemini 智能体时代。这意味着未来的谷歌搜索、 gmail、 安卓系统,甚至你的智能眼镜,全都会变成 ai 智能体。 说实话,看到这里,我突然意识到,谷歌其实已经放弃用蓝色超链接来整理世界信息了。传统搜索引擎在他们眼里已经是老古董,他们现在的真正野心是在 open ai 和 antropica 之前,让自己直接成为人类接入现实世界的底层接口。 不管你对谷歌评价如何,它应对海量数据的工程能力确实是断层领先。过去两年,他们每个月处理的 to 量数量从九点七万亿一路狂飙到了极其夸张的三点二千万亿。 为了支撑大家每天用各种 ai 工具生成无数千奇百怪的图片,谷歌母公司的基础设施开销也跟着爆炸式增长。支撑这种算力规模的核心就是谷歌的 tpu 芯片。 这次他们宣布把 tpu 拆分成了两款专用芯片,负责训练的 tpu t 用来教 ai 如何思考,负责推理的 tpu 则专门用来在全球范围内大规模生成搜索结果。 这次大会真正的重头戏是 jammy, 这是一款能够接收文本、视频和音频等任意输入,并生成任意内容的超级模型。 谷歌的大佬 damis hashabis 显然已经彻底掌握了世界模型的精髓,现在的模型早就不只是在生成像素了,它们能理解语言、物理规律甚至运动轨迹,足以在你需要的时候实时模拟出现实世界。 跟着新模型一起发布的还有一套叫做 neuralexpressive 的 全新设计系统,表面看只是换了图标和渐变色,但它真正的杀手锏是暗虚深层界面,只要你给出提示词,它就能凭空捏造出图标、时间轴,甚至是以前根本不存在的新应用。大模型方面,谷歌这次主推了以速度见长的 jamminite flash three 五,从第三方跑分来看,它的智力水平基本追平了 oppo 四点七和 gpt 五点五,但运行速度一迹绝尘。 不过让大家有点失望的是啊,最顶级的 jamming 三 point five pro 依然处于保密状态,估计要等到今年夏末才会正式面试。对程序员来说,这次有个非常硬核的发布,谷歌把他们的 ai 编程工具改名成了反重力新版本,看起来非常像 open ai codex, 核心逻辑从手敲代码变成了管理 ai 智能体。 虽然老派程序员可能看不惯,但现场演示堪称王炸。他们用这个工具花了十几个小时,消耗几十亿个头啃,从零开始徒手搓了一个完整的操作系统。 最有意思的是,当他们试图在这个系统上运行经典游戏毁灭战士,却因为缺驱动而报错时,杰姆奶直接在舞台上现场写出了驱动代码,几秒钟后游戏就跑通了。 这种疯狂输出代码的速度确实吓人,不过速度翻倍,价格也跟着翻倍了。杰姆奶, three point five flash 的 价格是上一代的三倍,更是一点五版本的三十倍,虽然还是比 crow 的 便宜,但已经不能算白菜价了。 如果你是前端开发者, chrome 浏览器这次还悄悄更新了一个超级实用的 html 和 canvas api, 简单来说,它允许你直接在 canvas 里渲染原生 html 元素, 这意味着你可以一边用 webgl 实现像素级的高级交互,一边用普通 html 搞定基础界面,开发体验直接拉满。以上就是今年谷歌开发者大会的全部精华,觉得有用的话点个关注,我们下期再见!

就在刚刚五月二十号凌晨一点的时候,谷歌的开发者大会正式的开始直播,那肯定有很多朋友没有看这个直播,我只能说各位真是有先见之明,整个直播时长有两个多小时, 又臭又长,直接给我看历劫了。信息密度呢可以说是非常的小,就是发布了一个全新的模型三点五 flash, 其余的其他功能呢都是接入的这个模型,各种乱七八糟,内容呢都加了在一起,大会的后半段呢,直接变成了现场直播带货,我看完就是一句话,真是闹闹又麻麻 闹马。我们首先看一下大会的第一个部分,就是 gmail 模型家族,整场都在讲这个, gmail ai 发布了 gmail 三点五 flash, 它的定位呢是前沿智能模型和 agent 执行力合二为一的旗舰快速模型,头跟的输出速度呢是其他旗舰模型的四倍, 非常的夸张,而且在编程 agent 的 多模态基础上,超过了 gmail 三点一 pro 就是 一个 flash 模型,超过了三点一 pro 模型,这个就意味着这次模型呢是小而快,听起来非常的不错, 但是我不禁要问,那么代价是什么?没错,它的价格也赶上了 pro, 上一代的 pro 模型呢,每输入百万, token 呢是二美元,输出是十二美元。这次的三点五 flash, 它的输入是一点五美元,输出是九美元, 其实非常接近了,在他们直播中有这样一张图,说是用了九十三个 agent, 输出了二十六亿的 token, 总共金额小于一千美元啊,我先保持一下质疑, 这次价格涨的确实有点多,这还只是 flash 模型三点五 pro 呢,预计在下个月,也就是六月上线,那你想想吧,那个价格肯定会更高呀。那第二个呢,就是 jimmy 欧姆尼全新系列,目前用的也是三点五模型,核心定位呢是推理能力加创作能力融合首发的 jimmy 欧姆尼 flash 接受图片、音频、视频文本的输入,也可以输出生成视频,还可以创建我们自己的声音生成的视频呢,让他说话的声音就是我们自己的。 你可以理解为把视频生成模型,图片生成模型全都融到了一块,缝合怪奇美拉。另外顺带一提,它的内容检测能力呢,从 jimmy nike 的 app 版扩展到了搜索和谷歌浏览器中,也就是说,当你看到一个图片,你不知道它的真伪,那么你可以把这张图片发给他,问问他是否由 ai 生成 它可以进行判定。这个怎么说呢,就我体感下来,其他的生成模型我都能认出它是 ai, 唯独 g p t 的 那个确实是有点真假难分,你不会针对的 g p t 吧?那山姆就有话说了,你不是我的兄弟,你是个路人。 接下来就是重头戏,谷歌的 a i d e 反重力二点零上线了,全新独立的设计啊,真是不愧是谷歌啊。从这个设计页面上呢,我就看到了无数个神支持了 doa 盾,并且速度非常的快,而且如果你是新开通的,或者以前就是 o 叉用户,还会送你 一百套的额度,那去领吧。什么意思?下一个更新的是全新的设计语言,几乎是全平台桌面版、手机版以及网页端都进行了更新,变得非常优雅,动画非常丝滑,同时引用了全新的字体,不过对于阅读中文来说好像不是特别方便, 只是阅读英文的时候看起来确实很优雅。每天的额度呢,也改成了卡尔的那种限额五小时刷新,直到达到周限额 结束了,也就是说,如果你是 pro 用户,可能用一会就没有了这个额度。下一个 jimmy spark, 二十四小时全天候, agent 直接运行在云端,在手机上,电脑上拿起来就直接控制它使 用的模型呢是 jimmy, 三点五,可以实时监控我们的信用卡账单,追踪邮件,自动整理笔记,制作文档。这个几乎就是一个 agent 的 平台的标配了,它本身就是一个超级 mcp 客户端,接的非常多。这个时候可能有朋友说了,哎,这个不是小龙虾吗?是吗? 目前这个我们用不了,你是 plus 用户, pro 用户都用不了,你必须得是 air ultra 用户。二百五十美啊,不对,现在降价了,是二百美元一个月。但是这个计划对我个人吸引力不是特别大,再下去沉淀沉淀吧,我们看下一个谷歌搜索 三十年以来最大的更新,在二五年年底的时候呢,谷歌浏览器就推出了 ai 模式,那现在呢?把这个 ai 的 模型换成了 gmail。 三点五, 我们输入的越长,搜索框越会主动的进行扩展,因为它是内置在浏览器上,主要还是为了搜索嘛。当你一个很简单的问题,他就会给你回复很短的内容,但是当你长篇大论的跟他讨论的时候,他就会开始进行深度思考 啊。 deep think, 也就说类似可绕的那种,判断你的意图,以及你这个问题的复杂程度,他自己来决定给你回复多少。另外这样一个浏览器也有 agent 了,二十四小时全天监控。我们提一个问题, agent 在 后台跨博克新闻社媒以及谷歌的实时数据 持续监控,也就说你可以让他实时帮你监控一些内容。那这个监控的功能呢?我个人认为可以用在理财的方面,比如说黄金的金价,实时给你追踪一些股票的价格,实时的给你发送。 不过这个功能呢,暂未发布,夏季向 ai pro 凹叉用户开放下一个 mini app。 这个功能是在我们搜索的时候,那一个非常长的任务,它会自动给我们生成看板,或者是生成网页,生成一个小应用,我们可以直接快速的跟它交互,那比如说我问一个太阳 长什么样子,那它呢?就会生成一个类似网页,或者是一个三 d 的, 我们可交互,可以拖动旋转。这个太阳演示看下来呢,还是非常有意思的,但是仍未发布, 发布时间是未来几个月。 ai pro ultra 美国地区的用户可以使用,也就说你不在美国,或者你是免费用户,那么你都是用不了的,太可恶了,他不是我们的兄弟,他是路,厉害。最后还有几个我快速给大家过一下,因为我个人感觉非常的无聊,一个是全网通用购物车, 让 ai 帮我们去购物,去比价美国豆包啊,真是实至名归啊。还有一个呢,是给油管准备的 ask youtube, 可以 直接处理复杂的查询和后续的追问,其实跟 grog 差不多, grog 呢,是可以读取 x 平台的所有推文,那这个 youtube 呢,自然是可以读取油管上的所有视频,以结构化交互形式呈现。这个呢,现在已经可以用了,局限于 youtube 会员的美国用户啊,注意你得是会员哦。 最后呢,就是他们的带货环节,首先是他们的安卓 x r 啊,智能眼镜,想当年我也买了一个小米的异样眼镜,老傻了。我 目前呢是两个版本,一个是带屏幕的,一个不带屏幕的,只不过带屏幕的还没有发,各位感兴趣可以去看一看。大概 就这么多内容,如果各位非常闲的话也可以去看看。这个直播还是蛮催眠的。那以上呢,就是本期视频的全部内容了,如果你对上述我们提到的这些内容某 某一部分你感兴趣,可以在弹幕里留言,我们可能会单独出一些视频来测试,或者是解读一下。各位记得点赞,不点赞的话你就不是我的兄。 ok, 最后祝各位玩的愉快,我是段峰,我们下期再见!拜拜!

我们总在期待 ai 真正走进生活,接管繁琐、重构效率。而二零二六年谷歌开发者大会, google io 直接把这份未来照进了现实。这不是一次常规的功能迭代,而是谷歌吹响全面进军智能体时代的冲锋号。 从大模型性能的跃级,碾压视频生成的物理级,真实到自研算力的极致升级,全场景消费产品落地,这场发布会堆满了颠覆行业的极致升级。全场景消费产品落地,这场发布会堆满了颠覆的从不是悄无声息的更新, 而是某一次惊艳全场的跨越式破局。这一次,谷歌让整个 ai 行业迎来了全新的拐点。读懂这场发布会,首先要看一组近乎夸张的增长数据。数据背后,是 ai 从实验室技术变成全民基础设施的真实作证。两年前,谷歌全系服务每月处理的待币总量仅九点七万亿, 比时, ai 还处于稳固探索的成长阶段。去年 i u 大 会,这个数字暴涨至四百八十万亿,行业进入快速普及期。而如今,谷歌月度待币处理量正式突破三点二千万亿,同比暴涨七倍。 指数级的增长背后,是全球用户、企业、开发者对谷歌 ai 的 海量调用,也是其解决真实场景问题、承接复杂算力需求能力的最好证明。技术的生命力永远藏在真实的落地与富用之中。用户规模的爆发,更直观印证了谷歌 ai 的 全民普及速度。 短短十二个月, jamie 应用月活用户从四亿突破至九亿,实现翻倍增长,平台日请求量同步暴涨七倍。不止是核心模型产品, 谷歌搜索 ai 概览坐拥二十五亿月活,上线仅一年的搜索 ai 模式,月活用户已然突破十亿。这些庞大且持续攀升的数据,彻底打破了 ai 是 小众工具的固有认知,标志着智能 ai 已经从可选功能变成了全球网民离不开的数字生活刚需。真正的科技普及,是让先进能力褪去门槛,融入日常。 整场发布会的核心底气源自 jmi 三点五系列大模型的全面迭代。而率先亮相的 jimmy 三点五 flash 彻底改写了轻量化模型的行业定义,打破了轻量模型必妥协性能的固有规律。 过往我们默认极速模型只能胜任简单任务,高端复杂场景必须依赖旗舰模型,而这款新品直接实现了跃级反杀,用轻量化的速度与成本跑出了旗舰级的智能上线。 各项权威精准测试数据直观展现了它的硬核实力。 carmeno 半尺二点一代码测试得分百分之七十六点二,远超前代 jammer 三点一专业版的百分之七十点三。 gdp y l a a 评测 elo 分 值达一千六百五十六,大幅领先前代一千三百一十四的水平。 m c p adelson 评测得分百分之八十三点六,叉 c f 推理测试得分百分之八十四点二,全方位实现性能跃升。更让人意外的是, jennifer 三点五 flash 的 综合能力已经能够对标甚至局部超越 g p t 五点五、 cloud o pad 四点七这类行业顶级旗舰模型,彻底改写了 ai 模型的性能梯队格局。 性能越级的同时,它的效率优势更是碾压同级产品,其内容输出速度达到主流前沿模型的四倍,每秒可生成近两百八十个代币,而 g p t 五点五、 o p s。 四点七的每秒输出量仅六十至七十,这意味着行业终于迎来了一次关键突破。 用户和开发者无需为极致性能支付超高成本,也不用为了速度牺牲智能精度,高效与高端智能从此可以兼得。技术最好的进化从来不是单一维度的极致,而是多维度的平衡。成本优势的革新,更是本次更新最影响行业格局的关键点。 谷歌 ceo 桑达尔皮沙伊在演讲中明确表示, gmail 三点五 flash 已不足同类旗舰模型二分之一部分场景,仅三分之一的成本输出同级前沿智能能力。官方测算显示,头部科技企业若将每日一万亿待币工作量的百分之八十赋载迁移至该模型,每年可节省超十亿美元成本。 这笔可观的资金不再消耗在昂贵算力上,而是可以回流到业务创新、技术研发中,大幅降低了高端 ai 商用的准入门坎,让顶级 ai 能力不再是巨头专属。除了以上线的 flash 版本, gemini 三点五 pro 专业版也已完成内部测试, 预计次月正式上线。目前,谷歌内部全场景适用反馈显示,该模型在复杂逻辑推理、超长文本处理、多模态深度理解等核心能力上均有显著升级。作为后续主力旗舰模型,它的正式落地值得整个行业持续关注。 如果说 gemini 三点五是现有 ai 能力的极致优化,那全新的 gemini omen 系列就是谷歌面向通用人工智能 agi 交出的未来答案,也是整场发布会最具里程碑意义的突破。蒂普曼的首席执行官德米斯哈萨比斯直言, java 纳米的诞生是人工智能发展进程中的关键转折点,它彻底跳出了传统生成式 ai 的 技术之故,重构了多模态内容生成的底层逻辑。市面上绝大多数纹身视频多模态模型本质都是素材拼接与画面拟合,看似流畅的画面往往暗藏物理逻辑混乱、细节失真、内容空洞的问题, 只是做到了形似,却做不到神似。而伽马奈奥尼是真正意义上的全模态同步理解、全维度精准生成模型,可同时接收文本、音频、图像、视频四类数据,深度拆解各类信息的内在关联,生成的内容兼具视觉美感、逻辑通顺度与科学严谨性,真正实现了让 ai 看懂世界、理解规律、复刻真实。 大会现场的蛋白质折叠演示完美全是了它的独特优势。模型丝滑还原、氨基酸裂扭曲折叠形成 alpha 螺旋、 beta 折叠的完整生物过程, 动态画面,精准贴合真实生物原理,搭配同步适配的专业旁白解说,每一处细节都经得起科学推敲。对比同类 ai 生成的悬浮失真、逻辑错乱的科研画面, jimmy 让 ai 生成内容告别了视觉假象,真正具备了实用价值与科研价值。 ai 的 终极价值是模拟真实世界,服务真实需求。 它的核心壁垒在于独一无二的全模态同步训练体系。不同于其他模型单一模态训练简单拼接融合的模式, jamalami 从训练阶段就同步打通图、文、音、视频四类数据,深度学习不同信息的关联逻辑与物理规则。正因如此, 它生成的动态内容完全贴合现实规律。滚动的弹珠,精准遵循重力轨迹树叶波动的树琴,琴弦会发出对应频率的声响, 彻底解决了传统生成模型物理崩坏、画面违和的行业通病,让 ai 创作从随机生成进阶为规律创作迭代是自然语言编辑能力,更是大幅降低了 ai 创意创作的门槛。用户可以通过连续对话,对生成的视频画面进行层层迭代优化,每一次指令都会承接原有场景, 保留角色,统一延续物理逻辑,不会出现画面断层、元素错乱、趋势断裂的问题。无论是将静态雕塑转化为流动气泡,让触碰的镜面泛起液态涟漪,还是创意字母动态视频制作模型,都能精准落地用户创意搭配适配字幕与配乐,全程无需后期二次加工,可控性与完整性拉满。 智能创作的本质是让机器适配人的创意,而非让人迁就机器的局限。坐地节奏上, gemini flash 已正式上线谷歌 ai 会员专业版、旗舰版,用户可在 gemini 应用与谷歌 flow 平台直接体验。本周内,该功能将免费登陆 youtube shorts 与 youtube 创作平台,面向全网普通用户开放。 未来数周,官方将开放配套 a p i 接口,全面赋能开发者生态。后续还将持续迭代图像、音频,多维度输出能力,不断宽应用场景。 在技术快速落地的同时,谷歌始终守住合规底线,针对性解决 ai 深度伪造、内容滥用的行业乱象。所有 gemini omni 生成的视频内容都会自动嵌入谷歌 synths id, 隐形溯源水印,肉眼无法识别,但可通过 gemini 应用谷歌浏览器、谷歌搜索一键合页,精准区分 ai 生成内容与原创内容, 从技术源头遏制虚假内容传播。对于风险极高的声音克隆功能,谷歌采取审慎落地策略阶阶段仅支持用户基于个人原声修改自有视频音频,严控伪造他人声线的风险,在创新与安全之间找到了平衡。 进步的前提永远是克制与规范。目前, cid 溯源体系已实现规模化行业落地,累计未超一千亿份图文内容,时长六万年的音频资源完成溯源标注。同时,谷歌将可信内容验证能力拓展至搜索与浏览器生态,并达成跨行业合作。 openai、 qq、 十一 labs、 英伟达等头部企业均已接入该体系, 让 sims id 成为 ai 行业通用的透明溯源标准,为整个行业的良性发展筑牢根基。所有顶级 ai 模型的突破,都离不开底层算力的支撑。本次谷歌重磅发布的第八代张亮处理器 tpu 八,以双芯片差异化架构补齐了 ai 训练与推理的核心算力短板, 展现了顶级科技公司的基建实力。全新架构分为 tpu 八 t 训练芯片与 tpu 八推理芯片,各司其职,精准适配不同场景。 其中 tpu 八 t 专为大规模模型训练打造,原始算力达到上一代的近三倍,依靠 gx 框架与帕特维分布式系统,打破了单一数据中心的算力枷锁, 可实现全球超百万颗 tpu 的 分布式协同训练,组建全球最大的 ai 训练集群。这一突破,直接将超大模型的训练周期从数月压缩至数周,让 ai 技术迭代速度迈入全新层级。 算力的上限决定了 ai 能力的上限。面向用户交互场景的 tpu 八推理芯片则主打极致低延迟与高效节能,一托谷歌二十七年搜索业务积累的延迟优化经验, 芯片实现全链路耗时压缩,交互响应更加丝滑。同时,两代全新 tpu 芯片的单位功耗性能直接翻倍,在爆发算力的同时严控能耗,兼顾了性能与环保,解决了高端算力、高耗能的行业痛点。为支撑 ai 算力的爆发式升级,足以窥见其深耕 ai 赛道的决心。 二零二二年,谷歌年度资本开支仅三百一十亿美元,二零二六年,这一数值预计飙升至一千八百亿至一千九百亿美元, 短短数年,投入翻近六倍。巨额的基建投入不是盲目扩张,而是为长期的 ai 生态布局筑牢地基,为后续模型迭代、产品落地、生态拓展提供源源不断的算力支撑。所有看似突然的技术爆发,都是长期重金深耕的必然结果。 开发者生态层面, antigravity 二点零平台的全面升级,标志着 ai 开发正式进入智能体时代。该平台彻底摆脱单一代码编辑工具的定位,升级为即开发、调试、部署、管理于一体的全流程自主 ai 智能体。研发中初新增独立桌面客户端,支持用户调度调度,多场景智能体 批量完成复杂任务。同时,谷歌专为该平台定制优化的极速 flash 模型,推理速度达到行业前沿模型的十二倍,为智能体自主高效运行提供了核心动力。谷歌内部的待币处理数据最能体现其技术的高速迭代节奏。今年三月,内部 ai 开发工具日处理待币量为五千亿,如今已突破三万亿,且保持数周翻倍的高速增长。 海量的真实场景调用数据形成了强大的正向反馈闭环,持续帮助模型修复缺陷、优化细节、提升适配性,让技术在真实使用中持续进化。最好的技术迭代永远来自真实场景的打磨。谷歌 ai 开发工作室 ai studio 迎来全方位功能升级,大幅降低了全站 ai 应用的开发门槛。 平台新增原声 celtlin 语言支持,可直接开发安卓原声应用,深度打通 google workspace 办公生态,支持一键部署智云运行平台兼容全系 firebase 服务, 开发者可在平台内独立完成应用开发测试上线全流程项目成型后还能无缝迁移至安泰 gravity 平台深度迭代,整套流程高效流畅,无需跨平台操作。 api 层面的托管,智能体服务进一步抹平了智能体开发的技术壁垒,用户仅需一次简单 api 调用即可获取配置完整、自带远程沙箱环境的可用智能型, 无需复杂的环境搭建与参数调试。配套的 anti gravity sdk 工具包还支持开发者自定义智能体功能,自主部署至私有服务器,兼顾了轻量化入门与深度定制的双重需求。 针对安卓开发者群体,本次更新带来了一系列实用性极强的工具,核心稳定版安卓命令行工具正式上线,支持 ai 智能体直接对接安卓开发环境,自动完成 sdk 下载、应用真机运行等重复性工作, 解放开发者双手。官方开源的安卓开发技能库,能够指导大模型遵循行业最佳实践,高效完成 jetpack、 compose 迁移等复杂开发流程, 大幅降低开发出错率。全新上线的 androidbench 安卓开发评测榜单,成为首个专注移动端开发任务的大模型评测体系, 全面收入 g m i 四等开源模型的实测数据,为开发者选型提供精准参考。更具实用性的是,安卓开发工具预览版上线,代码迁移智能体可自动识别 react native 网页框架、 ios 原声代码等多端原码,批量重构为 cody 原声安卓代码,将原本数周的迁移工作量压缩至数小时,彻底解决跨端迁移的行业痛点。 科技的进步本质是不断简化复杂的工作。前端网页开发领域,谷歌推出开源 y m c p 通用标准,为浏览器 ai 交互建立行业统一规范。该标准支持开发者封装 javascript 函数、 html 表单等结构化工具,让浏览器端 ai 智能体能够更精准、稳定地执行复杂网页任务,告别以往交互混乱、指令失效的问题。 com 一 百四十九版本已开启相关实验性使用,后续将快速适配浏览器端 jmi 智能体。配套的现代化网页开发指南,覆盖一百余种主流开发场景,为 ai 编码智能体提供专业合规的开发规范,一键即可部署落地,助力开发者打造高性能、高安全的优质网页应用。 同时上线的 chrome 智能体调试工具,将专业调试能力赋能 ai 智能体,支持代码实时合页调试与优化,可自动完成质量审核,模拟真实用户操作,无缝接续绘画,全程无需人工干预,极大提升开发运维效率。新增的 html in canvas 实验性接口,支持将真实 d o m 元素融入 webgl、 webgl pu 画布, 打造兼具 3 d 沉浸感和简爽可交互的高端网页体验,刷新了网页开发的视觉与功能。上线将钓鱼面向开发者的硬核升级。本次大会面向普通消费者的 ai 产品更新,更贴近大众的日常工作与生活,全新的全天候个人智能体。 gemini spark 一 托谷歌云专属虚拟机,二十四小时不间断运行, 基于 gemini 三点五鱼 anti gravity 调度框架打造,擅长自主拆解、执行长周期复杂任务,初期适配谷歌全系生态。后续将通过 m c p 标准接入 adobe、 dropbox、 uber 等三十余款第三方工具, 用户可通过 app、 邮件对话框随时调用。今年下半年,安卓将上线全新交互界面,安卓的 halo 实时展示智能体任务进度。 今夏, gemini spark 将深度切入 chrome 浏览器,成为全网通用的私人智能助手,让 ai 真正无处不在。 gemini spark 已于本周开放受邀测试,下周将在美国地区面向谷歌 ai 旗舰用户开启 beta 测试。 它可以自主整合邮件文档素材,生成工作汇报,智能调度日程,自动跟进事物,把繁琐的办公琐事、生活规划全部自动化,让用户从重复性工作中彻底脱身 ai 的 终极意义是帮人节省时间。聚焦核心,谷歌搜索同步上线二十四小时在线的个性化信息智能体,可主动捕捉用户所需信息,精准匹配场景,辅助决策。今年夏季率先面向专业版、旗舰版用户推送,同时搜索新增 jimmy 三点五 flash 驱动的生成式编码能力, 针对个性化问题生成动态布局与交互式格式化内容。今夏将全网免费开放。针对长期复杂任务搜索,可生成专属持久化仪表盘与追踪面板,相当于为用户定制专属轻量化小程序, 持续跟进任务进度迭代优化结果。 youtube 全新 ask youtube 智能问答功能,彻底重构视频消费方式,用户无需手动拖拽进度条,逐条翻阅视频,只需提出复杂问题,平台即可精准匹配优质视频,并直接跳转至核心解答片段,大幅提升信息获取效率。该功能现已开启小规模测试,今年夏季将在美国全面上线, 办公场景迎来颠覆性升级。 doclive 语音实时创作功能彻底解放双手,无需打磨精准提示词,用户只需随心口述想法、梳理思路, jammin 就 会自动整理逻辑,优化内容,生成完整文档,支持语音新建编辑所有文档内容。后续该语音能力将逐步覆盖 gmail、 keep 等办公工具,让内容创作告别键盘,实现随口即成文。 除此之外,谷歌地图上线智能对话问答功能,支持自然语言咨询、复杂出行、地理问题交互,更贴合人类沟通习惯。 bilibrain 每日智能简报,可自动整合邮件日程 代办事项筛选核心信息梳理、优先级推送下一步行动,帮用户高效梳理每日工作重点。谷歌 flow 平台新增任务规划智能体,可自主拆解复杂任务分布落地,同时支持视频特效、手绘动画、文字排版等创意,可式样创作,兼顾实用性与趣味性。 全新 ai 图像创作工具 google pix 基于新一代纳米生成模型打造,颠覆了传统平面修图制图逻辑。它不再将图片视为静态整体,而是拆解为无数独立可编辑元素,用户可精准修改、替换、优化任意细节,精准落地个性化创意。 该功能现已开启受邀测试,今年夏季将全面开放给谷歌办公套件专业版、旗舰版用户。硬件终端领域,谷歌正式入局智能穿戴 ai 眼镜,开启实景智能交互新时代。今年秋季,谷歌将联合 gentle monster warby parker 推出音频智能眼镜,支持实景问答、精准导航、免提通话、实景拍摄、实时翻译、全语音控机等全场景功能, 解放双手双眼。后续还将推出透视显示款智能眼镜,直接在人眼视野投射信息,实现沉浸式无感交互,让 ai 从屏幕端走向现实场景。 科研领域,谷歌发布歼灭癌科学专项套件,全方位助力科研创新。通过打通安泰 gravity 智能体平台,与三十余个主流生命科学数据库、科研工具,搭配专属实验室实验能力与科研技能库,大幅降低科研门槛,自动化完成数据整理、模型推演、原理复刻等工作, 加速生物医药、生命科学等前沿领域的研究进程,让 ai 成为科研人员的得力助手。纵观整场二零二六谷歌 i o 大 会,所有更新都指向一个清晰的终点。 ai 正是告别被动应答的工具时代, 迈入主动思考、自主规划、独立执行的智能体新时代。谷歌通过模型性能跃级、算力基建升级、全场景产品落地、开发者生态完善,让 ai 彻底渗透生活、办公、开发、科研、硬件等所有场景。 技术从不会止步于当下。真正的行业变化从来不是单一功能的迭代,而是全生态、全维度的范式重构。随着谷歌各项能力持续落地普及, ai 将彻底改写人类的工作与生活方式,开启全新的智能文明阶段。

你敢信吗?现在的 ai 已经不是在帮你写文案,而是在帮你造世界了。 google 刚刚在 i o 大 会上宣布, ai 每月的 token 处理量已经突破了三点二千万亿。这不是数字游戏,看看这个 gemine, 三点五 flash, 每秒输出一千五百个 token, 写代码快到肉眼看不清。 最离谱的是, google 用九十三个 ai 智能体协助,只花了十二小时,拖出了一个能跑毁灭战士的操作系统。 这意味着,未来的软件开发可能真的只需要你的一句话。这次最重磅的是 gemini omni, 能创造一切的全新视频生成模型,只要你敢想,它就能把任何输入变成视频、图片,甚至整个世界。这个 omni 模型不是简单的修图,它结合了最顶级的生成式媒体技术,能实现深度的世界理解。 它最先落地的就是视频生成,未来还要实现全品类输出。这不仅仅是 ai, 这是你的私人好莱坞特效组。 这次还有一个重磅工具, java spark, 它不是聊天机器人,而是你的二十四小时个人代办分身。它能在后台帮你定股市、定行程。甚至在你买电脑配件时提醒你 cpu 和主板插槽不匹配。搜索不再是给链接,而是直接给你结果和工具。有人可能会问,这些 ai 工具对我们普通人有什么用? 以前 ai 是 工具,现在他是合伙人。这意味着普通人的创造力上限被无限拔高了。你不需要懂底层代码,只要你有想法,未来的差距不再是技术,而是你的想象力和指令能力。这一波 ai 浪潮,谁能踩中,谁就是下一个时代的超级个体。

上一周最核心的新闻其实就是谷歌的爱港欧大会,然后这个大会呢,也被称为其实科技界的两个春晚之一,然后另外一个是那个苹果 w w d c 嘛,全球最多开发者都在那边等着去听明年大概怎么走向的,基本就是两个开发发发布会了,一个爱港欧,一个 w d c, 因为几乎我们所有的 产品线都是一拖一两个系统,一个安卓,一个苹果吧,但 windows 它又不做,又没有什么什么比较有用的东西,大家其实就是掐着鼻子用嘛,所以说比较起来就是全球最多的开发者,看看明年到底怎么玩,到底在什么平台上玩,有什么其他的基础设施的更更新,都要看这两个发布会里边所说的东西。 这里边呢?今年这个发布会呢,其实我觉得谷歌的思路非常正确,但是其实你可以看到网上有分两边说法吗?第一种说法就是谷歌完了是吧?这个大企业,尤其老老派企业那种调性, 慢吞吞,傲慢,然后又什么东西都是自以为是那种状态,对吧?很多人这么说,但我觉得不是啊,我我我对这次谷歌发布会 非常的满意,我觉得他做的非常的对,而且这个思路呢,有一点点硬核的超我们中国的思路,你知道吗?什么呢?就首先,对,而且前一阵子不是说谷歌跟豆包合作吗?很多人说谷歌 jimmy 是 中是个大豆包, 嗯,也可以这么说吧,这次谷歌其实它在发布会里边其实就提了一个模型,就 jimmy 的 三点五 flash。 呃,为什么大家对这次发布会失失望呢?因为三点五 flash 的 这个性能并没有在任何的比如说 backmatch 啊等等各种各样的跑分网站上能超过我们现在特别风头一时无量的,比如说 gpt 五点五啊,或者说 op 四点七啊,更别说 misos 这些这些传文中的这种。呃,这种这种模型了,根本超不过 它,只是快加便宜这件事,不是我们中国产品的这种这种模型了,根本超不过它,只是快加便宜这件事不是我们中国产品干的嘛。你谷歌浓眉大眼儿,你搞这玩意儿干嘛? 但是事实上呢,我会觉得谷歌这个这次真的对了,就是我不知道你们怎么看啊。呃,我,我前一阵子危言耸听说了一段话,这段话呢,其实 很多同学在我那个评视频评论底下,其实说的还挺还挺悲观的。我就说有可能 missus 这个模型就是传言地瞟最强模型。 missus 这个模型以后就不对外公开了, 就不对外发布了,因为它可能是因为保证技术领先,为了防止我们中国人去蒸馏它,对吧? astropica 这公司可能就只是给某数少数几个企业,它甚至都不是以订阅形式,它都以什么股权、股权转让或者利益分成的形式去跟跟这些企业合作。 当然这个肯定是这个阴谋论了,但我觉得还有一个最重要的原因,我不知道你们最近看没看过,就是他们说,呃, missus 在 少数几个企业找找出几个科学家在测试的时候, 他们发现他们攻克一些顶级的漏洞,比如说苹果最新的呃系统漏洞的时候,呃,他们确实能做到绝大多数的人类安全员都做不到那种呃,漏洞排查成排查速度,但问题就在于 它的成本也是现在人类这个研究员的几倍甚至几十倍,它在排查一个错误的时候,它的这个成本甚至能到同类模型,比如说五点五 g p, 五点五的一百倍。 那换句话说,有可能啊,就你想一想,就以你们现在在用 cloud 的 感觉,我不知道你们什么感觉啊?就是你自己用的 pro, pro 会员够用吗?一个月一百多肯定不够用啊,我天天抄,我天天抄,对话稍微长一点,那就抄啊, 我在昨天跟我们的,跟我们的这个,这个,我们晚上在背那个 ai 宣誓课的,跟我们那帮同学们说的时候,我说我这次演讲稿的所有的内容是跟着 ai 对 话框里边你,你写的演讲稿吗? 你这得多少钱啊?当然不是一个对话框啊,聊一会就得总结一下前文开心框啊。如果你们能知道现在的模型, 你一个月花的钱,你其实都不太够用的情况下,那你就知道比这个再贵一百倍是一种什么样的感受。而这件事情其实你还是个人开发者,你甚至不是开发者,你就是个人使用,使用用户。 如果是要商用的话,那 missus 的 这个价钱我估计它不,它不对外推出,除了它这个模型比较的封闭,比较危险,对吧?或者说它这个模型不想让我们中国超蒸馏以外,它还有最重要的原因就是它放出来你用不起,我何必放呢? 就是,这就是一个很有意思的事情,就是我们很喜欢去看这些模型,它去蒸不断的高度。但事实上其实 我会觉得这两年其实真正的方向就两条,第一条呢就是追顶级,第二条呢是追便宜。当然 可见范围内中国是追便宜条线吗?就是如果你想去做一个东西,这个东西超级牛逼,但他没有办法商用,这也是扯淡的,我们之前之前见到很多手机也是如此,尤其是手机的后半程的时候,很多手机转一些非常奇怪的地方。举个例子,我记得当年索尼手机推出了一个叫八 k 屏幕, 就是手机屏幕是八 k 的, 然后里边的芯片,什么电脑级的芯片,唯一的问题就是超级的贵,或者超级的散热超级差,比如说这个电池续航超级差等等的各种各样的问题。就是你去追这件事情,对于我们肉眼来看,四 k 跟八 k 其实没什么区别,但你为他所投入的成本可就多多了。 对于模型也是如此,绝大多数的用户,其实就拿我们中国来说,绝大多数用户用豆包免费版就够了, 绝大多数的真的不说用户吧,绝大多数的老百姓用豆包免费版就足够了。所以你去把他这个智能提到那么高的高度, 然后把价钱提到那么高,其实这件事情是不是真的适配于所有企业,这个需要考虑清楚的,我绝对相信谷歌具备能力能去卷最顶级的模型,但问题谷歌是在美国,是类似于我们中国这种做基础设施的企业, 换句话说,他真的走那条顶级的科研之路是他的正确选择吗?我举个简单例子啊,就是你可以去想象,当然你是 isopic 或者呃那个什么 gpt, 他 们是没法想象这种空间的。有一个用户或者说你家里边人给你写了一封很重要的邮件, 然后你就可以用你的谷歌文档或谷歌邮箱去总结这个邮件以及历届的邮件发送到谷歌文档,然后从你的谷歌网盘上调用你们之前存储的各种各样照片做一个相关的视频, 然后定时发送到 youtube 上面给这些人都能通知,并且然后这个可以根据 youtube 去定定相关的,什么什么店铺的,什么什么庆祝仪式。 一个模型可以打通谷歌的全部生态,那所以你就可以看到想去做这件事情,那么一需要去解决的几个事。首先第一个就这个模型一定足够便宜,你不能跑一半, 提示你需要付费,同时你需要能够去打通多模态,就他能去理解视频,理解声音,理解画面,可以操作软件,就这件事情整,你要知道越了解多模态,他其实成本越高。所以换句话说就是我会觉得谷歌在走他擅长的东西,而且他在走他只有他能做的事情。 在中国我甚至都没有想到哪一个企业可以做成这件事情,腾讯可能也就腾讯了吧。就你说谷歌邮箱应该对标的是 qq 邮箱,谷歌网盘大概对的是我们百度网盘,谷歌的视频 大概对着对着抖音或者是 b 站,然后谷歌地图大概都对标的是阿里的这种,这种,这个这个什么高德地图。所以其实你要知道中国是没有一个能够解决所有老百姓基础需求的一个全生态的工具平台,或者说这个公司的, 所以中国只能说是它便宜,但是谁来把它打通?这个我我不知道靠什么豆包手机,或者可能是华为,华为,华为电脑,我不知道是或者是哪一个第三方的工具,但谷歌自己就会搞定这个事情了。所以你就可以看到谷歌在前两天的发布会先发布了一个谷歌的谷歌电脑, 哎,包括以后谷歌手机全生态打通的谷歌手机,这一切的一切都要求他的 token 值足够便宜,他的模型模态足够多,还有就是他的上下文的稳定性,然后对于某一个用户的信息记录足够长。所以这次发布会里边你就可以看到他专门做了一个特别有意思的事情,就是 他发发了一堆小工具啊,比如说 omni 啊,什么 spark 啊,一堆小工具。但是你可以看谷歌最近一直在做一些什么东西,比如说在这次发布会里边,十二小时手搓个操作系统, 操作系统本身没什么,没不关键,它并不是关键信息,但是问题在于一个一个模型可以稳定自我迭代或者自我工作十二小时, 如果你们用过现在的模型你就知道了。哇,我是觉得 cloud code 也好,这个 codex 也好,它是能操作十二个小时的,但是它能并不代表我的钱包能,你们用过一定知道我什么,我说什么意思,你敢让你的你家里的爱马仕或者小龙虾跑 oppo 四点六都不用四点七, 你敢让你家的那个小龙虾跑 sony 四点六吗?跑个跑个十二小时,你敢吗?跑死你,我跟你说你跑的 跑的尿裤子,我跟你说天天回家就琢磨,我的天呐,我的完了,这这这个都别说这这两天的限流了,这月限流都给我干干没了。对,你顶多能能拿 mini max 跑一跑,或者说拿这个量胜的 deep 跑一跑,你根本不敢用这些顶级模型,所以 你能看到谷歌在上面用它的这个这个这个 flash 三点五它敢跑?那换句话说,其实这件事情随着谷歌大量的 算力,对吧?他 t p u 啊,他的他的各种各样的这个追追便宜,追追追这种流量,或者追上下文的这个长度,追自己的什么什么缓存命中不断加这种技术的情况下,你会发现 就是以后这件事情可能我们老百姓用的就是谷歌的东西了,所以他会推出大量的设计平台设计工具,声图工具、声文工具,甚至自己的代码工具,安什么 anti graphic, 忘了叫什么什么产品了。就这种东西他都为的是打的是基础设施这种玩法,还是我刚才开开篇说的,太中国了, 但我觉得是对的,我觉得是对的,就是一定是走基础设施, ai 在 未来一定是基础设施,谁能拿住用户的绝大多数的用户基础,使用新式,他就能占据下一个时代的这个主要市场。谷歌啊, 真的是精。就是我们一直认为在移动互联网时代,真正最赚钱的一定是苹果, 获胜的一定是苹果,因为他走高端,他是最赚钱的企业。确实在上个时代没问题,最高端的一定是,但是你仔细去看苹果这两年他也在走低端,也在走量,在互联网时代的中后期,其实如果有一款手机能够雄霸天下,只是苹果当时这个对手 出生的太晚了,比如说小米啊,比如说我们的华为啊,当然华为也不走这个路线了,就走的平价路线。事实上在中国,在非洲市场,比如说波导手机,或者说一些什么步步高、 vivo、 oppo 等等,这些手机它其实的市场份额可一点不少, 只是因为在当时起步太晚了,所以谷歌一直在想的事情就是,如果当年他能去统一所有的安卓市场,走评价,走市场基础路线,那么跟苹果的竞争真不好说谁赢谁输。 到现在为止,我也不认为以后的天下是苹果的,可能安卓或者说这个这个走量的这个市场可能还是走基础设施,这个市场可能还是大势所趋。 所以在这次 ai 时代,谷歌一开始就想清楚了,我不跟你们走高端,我就走量,我就走基础实施,我让所有人的生活习惯里边都用的是我这个东西,做生活习惯, 只是你在做小树科研的时候,你可能在上班的环境正襟危坐是吧?调好网络环境,沐浴更衣,打开电脑打开用 cloud, 除那以外所有的场景都在用 gemine。 哇,我觉得这个思路真的很正确啊,我一直觉得这个东西非常非常正确, ai 是 基础设施, ai 不是 科研工具,或者说 ai 主要是基础设施,只在很少数的时间要扮演科研工具, 所以这件事情,所以我觉得这次谷歌发布会,从谷歌公司的思路来说是一点都没错,而且这一波走下去,我认为就是等,等下一波谷歌出这个 pro 以后,他应该会有更多的 这个子弹,对吧?因为市场占有率应该会更更多。我最近用了一下谷歌的这个三点五,其实还挺好用的。说实话三点五 flash 挺好用的,日常使用的话,我我更倾向于用谷歌,用 jimmy。 如果你不是去做一些,呃,比如说像我们同学去做着 ai 相关的工作,或者你做一些 啊比较前沿的什么科学研究的话,我真的没必要。我建议你不要用,不用别的,就用 jimmy nike 就 好了。而且 jimmy nike 的 这个这个模型其实最好的地方就在于它跟我们中国还是最友好的一个模型了。就最友好,没有之一的模型 就是三大模型里边就跟它三大最好。因为 jimmy nike 在 香港已经可以明确可以使用了,这是三个模型里边唯一在香港,中国香港已经就是唯一可以用的。 gbt 其实理论上都不让用,当然你用香港节点是可以代理的,但是他那块是不允许注册的。举个例子,你用香港手机号是没法用的,但是 jimmy 是 可以的,明确可以,而且 jimmy 几乎就不封,中国大陆几乎就不封。没听说过封, 可能有封的我不知道。当然你用那什么白嫖教育账号,你封他那个付费版,那那那肯定那有那确实有,但是就是说你你你自己用其实完全没问题,所以你完全不需要考虑任何的 什么代理环境。唯一的问题就是你,你去考虑如何能够白嫖他,你不考虑白嫖的话,基本上不会封,怎么注册都行, 然后他的模型的这个模态能力也很好,就是视频啊、音频啊、画面啊什么都很好,所以我我真的觉得这次发布会发布还挺震撼的,尤其是他打通了他的所有全生态。其实谷歌每一年都在想去用 ai 打通他的全生态, 很多人说他就应该抛弃他的全生态,专攻一个顶级的 astropok 这样的,这种顶级的这种,呃, 大圆模型也好啊,或者说这个超强 a 阵的也好啊,我觉得那才是你站着说话不腰疼呢。那凭什么呀? 是吧?凭什么呀?凭什么我又有钱又帅,跟你一样走走?走什么走?这个这个这个,赶人流啊,是吧?你靠陪伴,你靠长情的陪伴,你靠嘴皮子,我长得又高又帅,我就靠脸 是吧?我家底这么厚,我跟你比什么?比什么?这个这个什么,真心呢?比什么这个智能去。谁跟你比智能去?咱就比市场,市场我已经站好了,我干嘛跟你扯这个?不跟你扯这个,你研究去吧。然后我跟你说,谷歌最聪明点在于什么呀?一边一边加入什么反蒸馏联盟 啊,中国模型老蒸馏,我们我们,我跟 osrop, 跟那个什么 open i, 我 们三家联合,哎,我们建立一个防中国蒸馏模型的小小机构, 一方面自己在公司里边用着 i s r p, 然后自己蒸馏它,嘿嘿。哎,然后再让中国用,然后再赚赚中国市场的钱,这能输吗?我就问你,然后,然后 i s r p 那 个那个傻子,你说就天天中国市场这么大,市场丢了, 然后谷歌做你的平替比你便宜,而且还跟你模型差不多,天天,对吧?我我我让你因为一边喊着不让蒸馏,让你失去市场,然后我自己蒸馏你,然后我自己抢占市场,太精了。

谷歌格了自己的命。在刚刚结束的开发者大会上,谷歌在他的搜索引擎中植入了 ai model, 省去了搜索链接和搜索广告, 这就等于直接干掉了自己的搜索广告引创集。另外, gmail 三点一也直接升级到了三点五, 不仅模型能力达到了同行的顶尖水平,而且速度提高了四倍。另外,他还推出了全能模型金明奈欧米尼,他能完全理解真实的物理世界, 支持多模块输入、深层逼真的符合物理规律的视频,而这个能力正是现在人形机器人所缺失的。除此之外,你对谷歌的哪些产品更新更感兴趣呢?

谷歌也有自己的龙虾了,在正在举行的谷歌开发者大会上,谷歌正式推出 gemini spark 个人 ai 智能体。简单来说,它就是谷歌版的 openclaw, 它运行在专有的虚拟环境中,不用担心 ai 搞乱个人电脑的数据,支持自然语言对话,动动嘴就能让 ai 同时执行多项任务。 spark 不 仅可以在电脑和手机上运行, 还能在 chrome 中直接运行。下面看看 spark 的 强大执行能力。 spark 在 我们的 laptop 当中是可以的,但是移动也可以,安卓和 iphone 的 这个系统都是可以,所以可以看一下这是我的手机,我就把它打开去 spark, 所以大多数的这个任务您可以看一下呢,在所有的设备端呢同步了,非常非常有帮助啊。 spark 非常了不起啊,他能够去把你想象的变成真,如果你特别特别繁忙的话,那相当于说,哎,你今天一个任务,明天一个任务。 spark, 你 把它扔给他,你就可以忙你的了,他可以帮你在后台忙, 好帮我开几个 frex。 第一个就是和桑德接下来开的哪些会议,然后呢,去把它提亮,这样我不会去错过。第二,这样是我的新邻居,给他们家庭发一个邀请函,然后呢,他好像没报名啊,邀请他们第三个, 然后呢,去做一个文件来提醒我一下,接下来马上学前结束了,给孩子要做什么?包括让我看起来非常非常清晰,不要错过任何一个截止时间点, 好,把这些都发出去,你会发现我刚才的语速非常快。但是 spark 一个任务,一个任务,一个任务的所有的这个内容,真的是我说多快它就多快的可以捕获到,所以呢这是一个单现成,是它的奇石点,但是在后台的话它可以把单现成切分成几个小的任务。那接下来的话我把我手机旁边一丢, 然后就可以过我的人生了。然后呢我们知道 spark 就 会做好,我们让 spark 忙他的吧,之后咱们再检查他作业做的怎么样。

就在今天的凌晨呢,谷歌他举办了二零二六年的开发者大会,发布了很多的新成果,让人眼花缭乱。但是我们要去抓最关键的突破点,也就是真正重要的东西。 这次大会的这个核心,他不是说模型参数又大了多少,而是谷歌在重新定义这个人和手机之间的关系。以前是你打开一个又一个的这个 app 自己来操作,那以后可能就是你对着手机说一句话,剩下的他全办了。 那为了支撑这套东西跑起来呢?谷歌这次端出了三样东西,第一个是 germany 三点五 flash 模型,它最大的特点不是聪明,是快,生成的速度是其他模型的四倍,而且今天起全球免费。那为什么 快这么重要?你想啊,如果说你让 ai 帮你改个行程,它在那儿转了三到四秒转圈圈,你还下次敢用吗?只有响应快到几乎没有延迟,你才敢把一些真正重要的事儿交给他去做。第二个呢,就是 germany spark 的 智能体,这个就是让 ai 长出手脚的关键一步了, 它能够跨应用去推理和执行,那么这件事儿背后的信号其实挺大的,以后那些 app 可能就不再只是你手机上的主角了,它们会退到后台,变成一个又一个被 ai 去调用的 功能模块。第三个就是它们这次又重新杀回了智能眼镜的赛道,这副眼镜它不只是拿来拍照的了,它是 ai 的 眼睛 搭载的技术,能让 ai 实时看懂你眼前的东西,你带着它走到哪里, ai 就 看到哪里,这个就把线上和线下的这种物理世界打通了,所以你看呢?把这三件事串在一起,就是谷歌它想搭建的一条 完整的炼炉 ai, 有 了眼睛看世界,有了足够快的大脑做判断,再配上 spark 这双手去执行。那么问题来了,听起来挺美好的,但是市场它在担心什么呢?核心其实就一个问题,你信不信任它 让你把你的支付权限、社交账号、行程安排全部都交给一个对话框,你真的放心吗?如果说用户在这个问题上过不去,那么 spark 再强也不过只是个高级的搜索工具,它是没有办法真正进入到你的生活里去干活的,这个也是目前多空分歧最大的地方。 那么我们回头再来看看国内这边,这周正好有三部门联合发了国内第一个智能体的专项政策,提了十九个典型的应用场景, 那么专家也判断在未来三年,这个领域是会爆发式增长的。但是国内真正要解决的问题是各家的这个 app 之间的数据能不能打通。如果说华为、小米、百度这些本身有全家桶的这个公司,他推不动这件事,那么国内的智能体就会很尴尬, 有脑子有想法,但是手脚被绑住了,所以落到 a 股,其实盘面已经有反应了,五月份整个智能体的板块普遍在涨, 机构调研和这个资金的关注度也明显在升温。但是这里要冷静地看,目前确定性最高的其实不在软件还是在硬件, 第一条线呢,就是谷歌这条链上的硬件。这次谷歌他发了新手机 pixell, 十一也重新杀回了智能眼镜。 那么这两款产品的逻辑不是拼参数,它是为了跑通端侧 ai, 你 想这个 gemini spark, 它要在本地做推理,那么对 npu、 算理、内存、待宽散热的要求就实打实的往上跳了一个台阶。 所以这条链上的这个机会不是炒概念,是实实在在的供应链增量。比如说做高待宽存储的,做这个新型散热方案的,做智能眼镜、光波导和危险式的, 这些环节会有订单跟着谷歌的产品节奏来走。第二条线呢,就是国产智能体带动的硬件升级。这周国内刚出了这个智能体的专项政策,方向已经很明确了,不管最后跑出来的是哪家,只要智能体要落地,手机端侧的算力就必须往上顶。 这个就带来了一个确定性比较高的逻辑,就是国内手机厂商接下来的旗舰机大概率会把能跑智能体作为一个核心的卖点,那么对应的存储升级、散热升级、端侧的推理芯片这些需求都会跟着起来。 这条线呢,和谷歌没有直接的关系,但是逻辑是同一个逻辑,软件倒逼硬件迭代,所以总结一下,谷歌链的硬件吃的是谷歌新品周期的增量, 国产链的硬件吃的是智能体政策推动之下,国内手机厂升级的这个增量。这两条线呢,不完全的重叠,各有各的节奏,但是底层的驱动因素其实是一样的, 端测 ai 不 再是跑个 demo 这么简单,而是要真的干活了。最后呢,我们再说两个需要盯紧的这个指标,一个就是这个 germany spark 公测之后,用户有没有留下来持续用,如果说只是长个新线就卸载了,那么这个故事的根基就不成立。 第二个呢,就是新手机跑端侧大模型的时候,发烫和续航撑不撑得住?如果说体验翻车,那么所谓的这个换机潮也就无从谈起。那聊到这,我也想问问你,假如这几个产品真的摆到你面前, 一个是快到没有延迟的 ai 助手,一个是能替你跨应用干活的智能体,还有一副能看懂你眼前一切的这个眼镜,你最愿意为哪个买单?或者你觉得哪个对你根本没有吸引力呢?

五月十八号中午好,来看今日消息。一、谷歌开发者大会倒计时, gemini 模型会迎来清量升级,智能眼镜产品线有望重启。 解读一下, gemini 将不再是独立的 app, 而是嵌入安卓底层的原生能力,属于大模型的时代来了。二、长新科技更新科创版 ipo 招股书引发各界关注, 公司表示,全球 durm 产品供不应求,价格大幅上涨,随着公司产销规模的持续增长,产品结构的持续优化,公司的业绩将保持增长。三、国内三大运营商均开启 tock 工厂业务模式落地, 国内 tock 工厂将迎来快速发展期,具备一定算力、资源推理、优化、云服务能力的公司将积极布局和落地。 四、二零二六,上海徐汇量子黑客松大赛正在火热进行,量子产业正处于工程化的临界时刻。解读一下,量子科技仍处于启动前夕。资本市场方面,五月十一号,国一量子首发上市申请获上交所审议通过, 本源量子于二五年九月启动 ipo, 辅导你在科创版上市。量悬科技宣布完成六亿 c 加仑融资,同步启动 pro ipo 轮融资。 五、杭州市聚深智能创新发展大会上,国家人工智能应用中试基地正式揭牌。 解读一下,基地将致力于构建以算力保障、数据开发、模型服务、场景验证为核心的公司技术服务平台,构建从算力芯片到本质到模型开发再到应用场景开发的完整产业生态。 六、 ai 数据中心至光纤价格暴涨,交货周期延长至二十周以上。好了,消息就这么多内容,仅做科普,不构成投资建议,我们回头见。