粉丝8.7万获赞54.6万

谷歌也有自己的龙虾了,在正在举行的谷歌开发者大会上,谷歌正式推出 gemini spark 个人 ai 智能体。简单来说,它就是谷歌版的 openclaw, 它运行在专有的虚拟环境中,不用担心 ai 搞乱个人电脑的数据,支持自然语言对话,动动嘴就能让 ai 同时执行多项任务。 spark 不 仅可以在电脑和手机上运行, 还能在 chrome 中直接运行。下面看看 spark 的 强大执行能力。 spark 在 我们的 laptop 当中是可以的,但是移动也可以,安卓和 iphone 的 这个系统都是可以,所以可以看一下这是我的手机,我就把它打开去 spark, 所以大多数的这个任务您可以看一下呢,在所有的设备端呢同步了,非常非常有帮助啊。 spark 非常了不起啊,他能够去把你想象的变成真,如果你特别特别繁忙的话,那相当于说,哎,你今天一个任务,明天一个任务。 spark, 你 把它扔给他,你就可以忙你的了,他可以帮你在后台忙, 好帮我开几个 frex。 第一个就是和桑德接下来开的哪些会议,然后呢,去把它提亮,这样我不会去错过。第二,这样是我的新邻居,给他们家庭发一个邀请函,然后呢,他好像没报名啊,邀请他们第三个, 然后呢,去做一个文件来提醒我一下,接下来马上学前结束了,给孩子要做什么?包括让我看起来非常非常清晰,不要错过任何一个截止时间点, 好,把这些都发出去,你会发现我刚才的语速非常快。但是 spark 一个任务,一个任务,一个任务的所有的这个内容,真的是我说多快它就多快的可以捕获到,所以呢这是一个单现成,是它的奇石点,但是在后台的话它可以把单现成切分成几个小的任务。那接下来的话我把我手机旁边一丢, 然后就可以过我的人生了。然后呢我们知道 spark 就 会做好,我们让 spark 忙他的吧,之后咱们再检查他作业做的怎么样。

报道有存银行安卓管理闲听介绍谷歌开发者大会,市面向开发者和科技爱好者展示谷歌最新技术和平台的年度省会。首先最重磅的就是大会主指演讲,他带来了安卓十三的更新、 google pla 隐私保护升级等一系列的干货,官网也提供一百三十多门丰富的技术课程一共学习。除此之外,现场还有很多互动展区, 用天丝富豪展区将日常各种声音转化为乐器声,用手指挥就可以演奏音乐。再譬如富艾特展区,我们可以放置自己喜欢的图案自拍并打印,看似平平无奇,实际上展示了富艾特多平台无障碍运行的特性。这可以让陈璇轻松的开发各种跨平台的应用,保住自己极其可谓的发量。 这是谷歌艺术与文化展台,也是必打卡的地方。譬如官庙月色小名,我们就能对价值超高的艺术藏品进行涂鸦和再创作。再譬如这个叫做见微之助的 ar 技术互动产区,可以直接让我们在屏幕上全景游玩司马泰长城,甚至探索内部结构。这对孩子的启蒙教育以及出行受限的旅行规划都很 很有帮助。科研、医疗工作很于都有很大的想象空间。总的来说,这次大会让我很有感触,因为原本枯燥的代码都可以在这里变得直观有趣,能够真正的实现想法,解决问题。购买胃癌不再是程序员的事情,因为它终将变成所有人都触手可及的美好未来。

参加现场 google i o 开发者大会很难,基本只能参加线上会议。黑色托特包那个牌牌很重要,是谷歌官方认证专家暨第一谷歌开发者专家。 专家有免费直通门票,无需抽签付费可以进入的私密技术论坛。高管闭门会分享内部技术分享有前排专属席位和优先通道及专属休息区。与谷歌官方团队一对一对接, 与全球 g d 一 行业顶级专家、企业技术负责人闭门交流技术人脉,可优先举手提问,直接对话核心负责人与企业高层对接,提前体验未发布新品,获取未公开的技术资料,可申请专项技术咨询,可免费获谷歌产品高阶调用额度。 受邀参加谷歌全球专家闭门峰会,费用由谷歌全额承担。 g d 一 身份可作为企业技术实力背书,这个身份可助力事业发展,但获得不易。

明天谷歌二零二六 i o。 开发者大会就要开了,先聊一个试试。上一次谷歌在 ai 圈这么紧张,还是二零二三年切的 g p t。 刚出来的时候,年夜拉响红色警报,全公司转成 ai first。 三年过去了,企业市场被 g p t 五点五吃了, 开发者用脚投票选了 club, 杰米来了,说好听点叫稳中有劲,说难听点起了个大早,赶了个晚集。所以这次 i o 谷歌没有退路, 今天不练发布者预告,我们一起捋三个值得盯着看的东西,任何一个成了,都可能改变我们拿手机的方式。第一个,杰米莱,四点零,谷歌的背水一战,先看牌面,现在 ai 大 模型这个牌桌上,企业端 gpt 五点五坐庄 开发者圈 cloud office。 四点七是默认选项,杰米莱卡在中间,技术不差,但就是没人用。 这次加密来四点零,如果如期发布,号称参数量冲到三到五万亿上,下文窗口从两百万 token 直接拉到一千万,什么概念?你跟 ai 聊天,聊着聊着他就失忆了。 那一千万 token 意味着整本三体扔进去,他还记得你第一张提过谁的背景。别急着激动, 有分析师认为,这次更可能放出来的不是四点零,是三点二或者三点五级别的小迭代。逻辑很简单,谷歌现在怕的不是不够强,是不够稳。想想将来四点零要是翻车了, 幻觉满天飞。数据搞错,那就不是产品事故,是舆论场上再无谷歌。所以明天凌晨,我们盯住一个数, s w 一 奔七 pro 的 分数, 如果过了百分之六十五,那 cloud 该睡不着了。没过,那就是明年再战系列的更新。第二个 o s 手机电脑眼镜要合体了。听起来很科幻,其实是个务实的事儿。 谷歌准备在 i o 上发一个新的系统,叫 alumnormos, 简单说就是把安卓 chromos 还有 xr 眼镜的系统三个合成一个。那你可能会问,手机用的好好的并它干嘛?关键在于 ai agent, 那 种你说话他替你干活的 ai 助手。现在的 ai 助手有一个要命的问题,他在聊天框里,不在你的系统里。你跟他说帮我在美团上点个餐, 他会回你建议你打开美团 app。 这不是废话吗?我自己不会打开吗?但如果是系统级的 ai, 它能直接操控屏幕跨应用,就把这事给办了。 这次谷歌说娇米莱四点零会以系统级 agent 的 身份长在 elm normos 里,真的能看到你的屏幕,操作你的应用,记住你的习惯。目前能这么玩的只有苹果的封闭生态。谷歌想在不封闭的前提下做到这件事, 野心大,风险也成正比,系统级 ai 一 旦出错,不是回答错了,是你的手机可能被它玩坏,所以明天的演示很关键。现场跨应用的操控是真流畅,还是提前录好的? 那第三个,安卓 xr 眼镜,八十克不到的 ai 眼镜。去年 i o 展过 xr 的 原型机,今年要发消费级的产品了,预计售价四九九到七九九美元,重量压在八十克以内。那做个对比,苹果的微信 pro 是 六百克,戴半个小时脖子就开始抗议。 核心能力是你看到什么 ai 识别什么,实时翻译,抬头显示通知 gimmel 对 话。有意思的是它的定位, mate 的 rain 眼镜卖的不错, 但功能浅,主要就是拍照加语音助手。苹果的微信 pro 功能强,但太重太贵,出不了门。谷歌这次卡在中间,一副能日常带的 ai 助手逛着街,他帮你认路。翻译推荐餐厅,像有个 ai 在 你的耳边跟你叨叨, 但问题也在这,你愿意让 ai 看到你看到的一切吗?谷歌说有 led 指示灯,录像的时候会亮,但技术上 它也可以不亮。当 ai 有 了眼睛,你的隐私边界在哪儿?这才是比参数更值得琢磨的事儿。总结一下,明天凌晨一点,谷歌 i o 二零二六开幕三件事儿,焦米莱四点零能不能追上 gbt 和 cloud, 决定了谷歌未来三年在 ai 圈的饭碗。 luma os 能不能把手机、电脑、眼镜打通,决定了我们的数字生活要不要被重新定义。安卓 xr 眼镜能不能做成日常 ai 助手,决定 ai 走出屏幕是不是空话,我个人的票投给第二个。 不是技术最炫是系统及 ai 一 旦落地,那我们每个人用手机的方式都会重新改写一遍。我是小朱,点赞关注,一起读懂 ai 时代规则,下期再见!


谷歌发布新 ai google omni, 以为又将引领行业,结果拉了坨大的国外网友都看不下去了,直呼不如 cds。 就 在昨夜,谷歌 ai 全家桶迎来饱和式发布, google i o 二零二六已经不是传统意义的开发者大会了,更像是一场 agent 的 总动员。 大家最期待的 gemini omni, 本以为谷歌憋了这么久,终于要端出一个能和字节正面对抗的视频模型,结果上线试用后谷歌就露馅了。号称能实时输入、实时生成的世界模型 omni, 现在只能单线成输出,视频生成结果也远不如 cens 二点 零,看看这几段贴脸对比就知道了。但除了翻车的 omni, 谷歌其他模型还是很吭的。 gemini 三点五 flash 输出速度是同档竞品的四倍,成本还更低。 gemini spark 部署在谷歌虚拟机上的云端 agent, 即使把电脑关了,也能继续跨平台运行。谷歌搜索二十五年来的最大升级, google search 全面 a 卷化,支持多模态输入。能看出来谷歌是真的急了。不过字节、 open ai、 anthropic 轮番上阵, ai 大 战留给谷歌的时间还有多少呢?



有人说 jammer 现在变得跟豆包一样聪明了,这句话是讽刺,但我觉得这恰恰说明,谷歌总算想明白了一件事。过去两年, ai 行业所有人都在卷智商,试图在各大 benchmark 上多拿零点一分,但在经济学中,这叫典型的过度服务。 对于百分之九十的用户来说,从够用到顶级之间的差距大,模型公司付出的算力成本是呈指数级爆炸的。 这就是 cloud 目前面临的困局,为了服务那百分之一极度挑剔的高端程序员,他们把模型做得极其昂贵。而 google 这次彻底想通了, gmail 三点五 flash 放弃了做最强做题家,换来高达其他前沿模型四倍的每秒输出 token 速度。 在 i o 大 会的现场, google 还展示了用底层更新的 anti gravity 二框架驱动 agent 的 极限能力。他们让九十多个 agent 协同工作了十二个小时, 从零开始完整构建了一个能运行毁灭战士的操作系统,总开销仅仅花了一千美金。如果在以往,单单消耗的 token 费用就可能高达数千甚至上万美金。 那谷歌为什么要放弃高端市场?因为在这轮 ai 竞赛里,高端用户的心智基本已经被两家公司锁定了。 谷歌如果这时候还在这个赛道里正面硬打,打的是一场后发劣势的仗。而且更重要的是,高端用户根本不是谷歌需要的那批人。谷歌真正的战场是搜索、 youtube、 gmail 是 那二十多亿个普通用户每天反复打开的产品。 这批用户不需要最聪明的 ai, 它们需要的是用起来顺手的 ai, 这才是谷歌的护城河。 而整场发布会另一个被严重误读的是多模态,尤其是视频生成。 google 拿出了全新的多模态模型 gemini omni, 它被称为视频版的 nano banana。 如果你仔细看 gemini omni 的 演示,你会发现 google 的 重点根本不在于生成一段震撼的大片,而是精准控制与爆改。 google 真正害怕的是抢走全球数十亿年轻人注意力的 tiktok。 对于百分之九十的短视频创作者来说,真正缺的是极低门槛的二次创作能力。所以 google 把 ai 视频能力做成了傻瓜化的编辑工具。 在韩国餐厅老板的真实案例中,店主可以自行完成菜单、动画和推广视频的制作,而不再需要花钱请专业技术人员。这才是最恐怖的羊毛。 google 正在用足够好用、成本极低的 app 里千千万万的草根博主。 如果说降价和视频只是商业层面的围角,那么 anti gravity two 发布则是直接把刺刀捅进了传统程序员的心脏。 过去大家对 ai 编程的认知还停留在 ide 里的一个代码补全插件,但这次 i o 大 会上, google 直接宣布 anti gravity two 是 毫不避讳的 agent 优先,它直接提供原生的 c l i 和 s d k, 并且可以和本地浏览器进行完全联通的即时联调。 最令人毛骨悚然的是它的生态整合能力。在这个框架下,你不再需要自己去折腾服务器部署和繁琐的测试。它突破了应用边界,可以直接一站式开发能在 google play 上发布的应用。那作为普通人,我们该怎么在这个白刃战的阶段套利? 我们可以利用谷歌这次极度廉价的 gemini 三点五 flash 和 anti gravity c o i 给自己搭一套零门槛桌面自动化工作流,建议大家先收藏或截图。 步骤一,明确分工,把你手里的模型做物理隔离,重复性、标准化的任务全部给 gemini 三点五 flash。 安装 gemini c l i 之后,直接在终端输入下面的指令, 需要深度推理关键判断的任务,再去掉 cloud 或者 gpt。 这一步做好,你的 api 账单可以直接砍掉百分之四十到百分之六十。步骤二,用 anti gravity cli 实现本地全自动测试循环。这一步稍微有一点点门槛,但我会说得足够清楚,让你知道该怎么做。 核心逻辑是这样的,以前你写代码或者改网页,每次改完要自己打开浏览器看效果,发现问题再回去改,再看再改。这个改到看到改再看的循环是纯粹的体力活。 现在你可以用一个简单的 bios 脚本,让这个循环完全自动化。以前你不敢这么玩,是因为无限循环截图会让 a p i 账单原地爆炸。但现在 flash 一 次截图分析的成本大概不到零点零零一美元,你一天循环一百次,成本不到一毛钱。 步骤三,跨模态生态白嫖如果你是 mac 用户,这一步是这次 i o 大 会给你最直接的红利,而且完全免费,只需要把你的发票、 pdf 财报截图直接拖到桌面框,选这些文件,按住快捷键, 直接用语音下达指令。它会用多模态视觉直接读取这些本地文件,理解文件结构,自动在 gmail 里抄格式完整的邮件放进待发对列。 你要做的只有两件事,说完这句话,然后核查一遍邮件内容点发送。你不需要花一分钱去买 r p a 软件, 谷歌已经把这套能力白送给你了。但请注意, mac 端的视觉联动仅仅是谷歌庞大沙雕里最浮于表面的前菜。如果你只把 jammer 当成一个更聪明的快捷指令,那你就完全没有看懂 i o 大 会真正的底牌。 这场大会释放的最危险的信号在于, ai 正在从被动召唤走向后台挂机。在过去,无论 chat、 gpt 还是 cloud 有 多强大,它们都有一个致命的物理缺陷。只要你合上笔记本屏幕或者切出 app, 它的工作就停止了。 但在这次 i o 大 会上, google 抛出了一个让所有做效率类 sas 的 创业者倒吸一口凉气的怪物, gemini spark。 它是什么?它不是一个聊天窗口,而是一个二十四小时运行在 google cloud 专属虚拟机上的全天候个人代理。 你只需要按住语音键。说完后, gemini spark 会在后台利用底层的三点五 flash 模型,极速将这段语音拆解成多个独立的子任务,自动生成了带有颜色标记和复选框的代办清单。 更致命的是, google 宣布,今年夏天 spark 将直接集成到 chrome 浏览器中,作为跨网页的代理运行。 这意味着,那些靠帮用户打通不同软件接口来收月租的中间件,以及无数个主打自动整理日程的效率 app, 瞬间失去了存在的意义。如果说 spark 只是在帮你处理内部事务, 那么 google 接下来发布的两款 agent 则是直接把枪口对准了全网的商业流量。过去二十年, google 搜索的商业模式是流量分发,你搜索一个关键词, google 赚广告费,但搜完即走是这种模式的死穴。这次 google 寄出了 search agents, 他把搜索从被动解锁升级成了主动侦探。你可以同时启动多个 agent, 在 后台二十四小时全天候扫描全网。配合这个动作的是另一个怪物, universal cart。 这是一个跨越 google 搜索、 youtube 和 gmail 运行的智能购物车,能在后台自动为你比价,追踪价格走势,监控捕获。看懂这背后的羊谋了吗? 然后我们现在再回过头来看,为什么 google 敢于降智?为什么它允许 gemini 三点五 flash 在 极限考题上丢分,甚至被嘲笑是美国豆包。因为对于 google 来说, ai 从来不是一件拿来炫耀智商的奢侈品,而是一项用来垄断入口的基础设施。 openai 和 antropica 必须卷智商,因为它们是模型军火商,如果它们的模型不够聪明,用户下个月就不续费了。但 google 不 一样, google 卖的是水电。当 ai 走向智能体工作流时,软件的商业模式就变成了卖消耗。 google 根本不在乎你觉得 jamming 聪不聪明,只要你习惯了用 anti gravity 在 本地极速条代码,只要你习惯了 spark 在 后台替你读邮件和钉盘,你就在无时无刻地消耗 google 云端 tpu 的 算力。 酷狗甚至可以把模型能力像自来水一样免费送给你,或者极低迷的价格倾销给你,用极度廉价的 token 耗死那些只靠卖模型存活的创业公司。 最后说一句我自己的判断,有人说谷歌这次 i o 大 会没有惊喜,没有那种哇颠覆性的东西出来了的感觉,我反而觉得这恰恰是谷歌成熟的标志。早期的 ai 军备竞赛,靠的是一个接一个的技术起点,但起点之后是什么?是落地? 是整合?是让这些能力真正进入普通人的日常工作流。谷歌这次做的就是这件事,没有一个单点让你目瞪口呆,但整体拼起来,你会发现,你日常用的每一个谷歌产品都悄悄变了。 这不是高光时刻的发布会,但这是真正改变用户行为的方式,而改变用户行为,才是商业竞争里最难也最值钱的事。记得关注这里是 ai 商业漫谈,每周分享最新的 ai 资讯和商业理解。

今年谷歌 i o 大 会有哪些看点?对国内的产业又有哪些影响?我们一个视频说清楚。首先是 token 方面,到了二零二六年,现在的月度处理量已经飙到了三千两百 t, 单平台的 token 日处理量都超过一百 t 了, e p i 每分钟处理一百九十一亿 token, 这个消耗速度确实是有点吓人。顺着这个 token 的 消耗,它们模型的迭代也挺有意思。这次发布的是 jimmy 三点五的中监态系列产品, 偏推理方向,那个 gemini 三点五 flash 版本的性能直接超越了三点一 pro, 速度比其他 sota 模型快了四倍。然后 gemini 三点五 pro 预计是在二零二六年六月发布,听说是要在 coding 和 coding agent 领域有比较强的加强。 还有一个很关键的动作就是谷歌首次在推进 world model, 也就是世界模型。紧接着他们还发布了原生全固态模型 gemini omni, 整合了图像、视频还有世界模型这些技术。这可以说是谷歌 ai 体系的核心,贯穿系统。说白了,这就标志着谷歌的 ai 愿景正在从组织全球信息转向模拟并代理物理世界。说到代理, 他们这次明显在聚焦 code agent 和 agent 的 生态。谷歌推出了一个叫 universal commerce protocol, 也就是 u c p 的 协议,摆明了是对标 andropic 的 m c p 协议。然后他们还发布了一个 agent 产品,叫 spa r k, 这个东西可以在谷歌云上七成二十四小时运行,目前它只支持谷歌自有的工具, 不过后续也会接入第三方工具。整体看下来,未来的 agent 将会把搜索引擎从一个单纯的信息入口,直接升级成交易和任务的执行平台。 你看,在搜索和电商业务的升级上,这个逻辑就体现得很明显。搜索端那边,他们推出了由 gemini 三点五驱动的 ai overviews 智能搜索框,支持上传图文和视频,还能开启对话式搜索, 甚至还能代替用户去和商家沟通。这种主动代理功能,电商端也是个大动作,他们推出了 universal cart, 也就是通用购物车,能支持跨平台的商品聚合、 ai 自动追踪、降价,还有补货提醒这些 a 政功能。其实前面提到的那个 u c p 协议,已经接入了 shopify 等主流平台,甚至还支持酒店预定等服务。 他把 a p i 支付协议打通了,用户可以通过 agent 进行有限额的信用卡消费,基本上就把发现、决策到支付的全链路闭环给做成了硬件和端测。他们也没落下,这次宣布了和三星合作, 基于交通平台去开发 ai 眼镜,这里面的产品包含了带显示功能和语音交互的两类。就在二零二六年秋天,他们会先推出语音交互款,功能上支持听音乐、拍照、通话以及调用手机 app 等, 未来还会继续向 ar 智能眼镜的方向去发展。当然,这背后全靠算力在撑着。谷歌此前已经公告过,二零二六年的资本开支是在一千八百到一千九百亿美金,它们第八代 tpu 的 算力比前一代直接提升了三倍。这次第八代 tpu 分 成了两款,一款是八 t 训练芯片, 专门用于大规模预训练,支持跨数据中心训练,能完成超百万卡集群的部署。光模块标配一点六 t, 另一款是八 i 推理芯片,这是谷歌历史上首款推理专用的芯片,特别强调低延时,最大能支持一千一百五十二张八 i 芯片的集群互联。而且你会发现 谷歌的 tpu 正在从自用转向外公。他们和黑石成立了 e t u cloud 的 合作公司,黑石出使就投入了五十亿美元, 目标是在二零二七年上线五百兆瓦的数据中心容量,来提供谷歌的 tpu 算力服务,整个投资预计会达到两百五十亿美元。关于 tpu 的 出货量,预期他们二零二五年出货量还不到两百万张,二零二六年预计就会有大约四百万张, 二零二七年预计能达到一千万张,到了二零二八年预计会达到两千万到三千万张。既然芯片出货量上去了,集群和网络架构肯定也得跟着升级。它们的最小 pod 的 计算单元提到了九千六百张卡,同时还首次推出了可以商用的 scale out 网络, 最大支持三万四千四百张卡的集群训练。这么一来,光模块的用量就大幅提升了,训练端和推理端都在加单,同时 ocs 交换器的用量也在提升, 训练端和推理端都有明显的增配需求。聊到这,咱们来看看整个产业链上那些正在受益的公司。光模块产业链这边,你可以重点看看谷歌的光模块供应商, 像中际旭创、力迅精密、联特科技,还有美股的 f i n i s a r。 上游的光芯片供应商里面有原结科技的厂商,比如光库科技、德克利福金科技、藤井科技、 海泰星光也都值得留意。再往深了看,半导体产业链的变化也很大。 t p u 制造相关的有台积电,他们负责了 t p u 的 全部流片和 koloss 封装。还有博通 作为 t p u 核心设计供应商,和谷歌签订了长期协议,一直到二零三一年,同时还供应数据中心网络组建。联发科也参与了部分的 t p u 设计。存储相关的有美光、海力士、三星, 随着 tpu 出货和 token 消耗的增长,它们 hbm 和 dram 的 需求都在跟进。而且随着视频和图片生成以及 agent 任务结果的存储需求增长, enfinash 的 需求也在动。 pcb 相关的有沪电股份、深南电路、彭鼎控股、圣虹科技、广核科技、东山精密,它们都是 tpu 回到 gpu 主板的核心供应商。服务器和交换机组装这边有天弘科技,负责服务器和交换机组装,力迅精密和东山精密则负责光模块组装。 甚至连数据中心基建产业链都在变。受这种百万卡集群和跨数据中心合作需求的影响, d c i 也就是数据中心互联的前景挺广阔的,像诺基亚电力企业,还有数据中心厂商都卷在里面。最后就是应用端产业链了, ai 营销里面有一点,天下、汇量科技、蓝色光标, ai 电商里面有值得买。焦点科技,视频深层领域则有中文在线、昆仑万维这些,大家伙都在跟着。

这里是美国 last week, 昨天晚上我刚写完最后一行代码,就是为了带着我的秘密武器来参加这一场盛会。 酷狗的 tpu 给大家介绍一下,我旁边这一位是我花了两个通宵开发出来的机器人 sig 马, 我要带她去美国。我先借助 gemma 出众的设计能力,画了软件架构以及产品外观,然后让 ai 一 步步帮我完成开发。 平时放在旁边就像一个电子宠物。我用了 gemini live a p i 啊!它能实时理解我的说话内容,并使用它特别的视觉语言和声音和我们对话。 它的大脑有多个 agent 控制,通过 adk 统一管理。有负责唱歌和大叫的 vocal agent, 负责画面的 art agent, 负责画线框图的 diagram agent, 负责说话的 talk agent。 那 它到底有多强?先卖关子,一起去展会现场和 google 朋友们一起看一看吧。 酷狗 cloud max 是 酷狗每年规模最大的开发者企业集盛会,今年是收到抖音科技、抖音精选以及酷狗共同的邀请来美国参加,带大家看看会有什么重磅的技术发布。 刚才我还遇到了一位 google 高管,聊了一会儿,他分享了非常多的干货。放在视频的结尾,我带 sigmat 见了很多来自 google 的 开发者。 sigmat say hi to our friends yeah! hello friend that's awesome! sigmat 可以 实时画出他听到的内容。 can you draw an image of a squid coding that's our logo? yes, oh, that's awesome! sigma 还会发出叫声,甚至唱歌。 actually today is my birthday, please uh show me a cake and uh play the song named happy birthday do you heard it yeah yeah! 我还向 google cloud consultant 解释了 sigma 的 原理,于是他打算给 sigma 出一个难题, ha ha, yeah, everything is generated with gemini and it's using the adk, because it needs multiple agents one for generating the sound, one for generating the diagram can i ask of it yeah, yeah, sure hey sigma can you please draw a diagram of your architecture and the different agents that you have oh actually it did yeah, we have multiple agents yeah, we have three agents one yeah! that's pretty cool! 干货时间现在我已经回到酒店,给大家总结一下有哪些非常有价值的技术。第一点是 google 的 全站优势,从底层算力数据模型到 agent 应用。 大会不仅首发了最新的第八代 tpu 作为算力的基石,现场还有一个 demo 真是刷新了我的认知,让我意识到,除了有 jammer 和 nintendo 这些常见的模型之外, google cloud 上的 ai 模型啊,真是做到了全方位的覆盖, 在这个 demo 里上演了一场从宏观到微观的多模型携手接力。宏观层面上, alpha 二 s 的 模型啊,让地球地貌和天气变得可搜索、可追溯、可预测,堪称地球数字孽生。 然后, jammy 作为科研助手,辅助人类分析数据,推演新的实验假设。微观层面,由 alpha four 的 模型预测蛋白质结构解码植物疾病,研发抗热作物, 还有量子计算芯片 vlog, 模拟传统超算都无法完成的复杂分子过程,从底层硬件到 agent 应用,从宏观地球模型到量子计算,多层级的 ai 技术壁垒。第二个重点是,和去年相比啊,有大量的案例不再是单纯的好玩,而是全面的在产业落地。 比如在一个叫 ai design workshop 的 展区啊,可以借助 ai 设计自己的产品。我设计了一款复古的合成器,令人惊艳的是,通过 nano 不 nano 和 vivo 三一下生成了从产品零件拆解到产品宣发素材一整套的 marketing kit。 这种 ai 生成的高质量宣发素材正在被越来越多的企业采纳。第三个重点,如果说去年重点是 agent 开发工具店,那今年重点就是企业级 agent 平台。像我开发的 sigma 就是 基于这一套 gemini enterprise agent platform, google cloud 打通了 agent 产品从开发、部署到上线运营的完整生命周期。基于 a、 d、 k 完成开发后啊,通过 agent run time 轻松部署,支持自动扩容、内置的 m、 c、 p、 session 和 memory 存储等核心 agent 的 功能,开发者几乎没有运维负担,只需要专注在业务逻辑, agent 跑起来后还要方便管理。 google cloud 提供了完整的 governance 功能,通过 agent 的 identity 为每个 agent 分 配独立的身份控制权限,配合 agent registry, 能够实现对所有 agent 的 统一登记、管理与监控。那产品上线后呢?由于大语言模型的不确定性,比传统软件更难 bug, google cloud 提供了一套完整的 observability 能力,让开发者能精确追踪 agent 的 每一步执行路径,方便解决问题。 可以说,对于有出海需求的 ai 应用而言, google cloud 是 提供了全方位的保驾护航。友情提示,部分 google 技术仅适用于出海开发者。有了这么多强大的底层技术,企业到底该怎么落地呢?在现场,我和 google 大 中华区 cmo 跟旺聊了聊, 它一针见血地指出,很多人对 ai 营销的理解还停留在匠本真效和深层素材的表面啊。 google mark, 我 们一直在讲一个事情呢,就是 node user, 然后 node magic。 那 connect to 啊,怎么把 我们的 user 跟我们的产品的 magic 连在一起?那无论是强大 tpu 还是全能的 agent 的 平台,它们都是属于这个时代的 magic。 而我们要做的,就是用这些 magic 助力出海的业务,解决全球用户及企业的痛点,用 ai 驱动更高效的商业增长。那看在我大老远跑来美国带大家看最新最 magic 的 技术的份上,大家记得到抖音精选 app 里,帮我猛点推荐大拇指,让更多人看到!