第一、第二、第三、第四、第五。
粉丝1221获赞5268


五月十九日二零二六,谷歌 i o 大 会重磅落幕。谁也没想到,曾经被 open ai 死死压制跌入谷底的谷歌,这次居然彻底爆发,上演年度最强 ai 翻盘。今天,我们来一次性讲透这场含金量拉满、野心十足的谷歌 i o 大 会,让我们把时间拨回大会当天的山景城现场, 谷歌 ceo 劈叉一上台,没有客套,没有话柄,直接播放了一段意味深长的短片。视频里亮出二零一七年那篇封神的 transformers 论文,八位作者的名字逐一浮现,旁边,紧跟着他们后来创办的 ai 公司 logo 屏幕后只留下一句话, he came back。 紧接着,当年论文第二作者 norman shazier 登场,谷歌花二十七亿美元把这位出走的顶尖人才重新买回公司。 短短几十秒的开场,看似简单却暗藏深意,浓缩了谷歌十几年最戏剧性的 ai 城府。要知道,谷歌亲手发明穿梭码,却眼睁睁看着别人靠它引爆 ai 革命。自从 chat 的 gpt 爆火后,谷歌彻底慌了, 紧急拉响内部红色警报。为了自救,他招回两位创始人合并互掐多年的 ai 部门,疯狂收拢外流人才。而这场 i o 大 会,就是谷歌蓄力三年半,正式重回 ai 牌桌,抢回庄家位置的翻盘之战。 熬过漫长的低谷与整改,本次谷歌终于亮出了自己的底牌,整场发布会的逻辑也变得格外清晰。如果说往年, i o 谷歌还在执着比拼模型参数、比拼智能程度,而二零二六年,谷歌思路彻底转变, 整场大会只讲一件事, ai 要从会回答变成会干活。整场发布会的核心关键词只有一个,那就是 agent 智能体。 在众多新品中,本次最重磅的产品就是个人 ai 智能体 geminis park。 它常驻云端后台,哪怕手机、电脑关机离线,也能自动整理邮件、梳理日程、跟进工作, 全天候自主处理任务。也正是这款产品的亮相,标志着 ai 彻底摆脱了被动问答,真正迈入主动代办的智能体时代。不止个人智能体迎来升级,谷歌还大胆对自家核心业务下手,带来了颠覆性的改动。谷歌上线二十五年来最大一次搜索改版, 传统十条蓝色链接,成为过去式全新搜索智能体,可以主动筛选、整合、分析全网信息,把搜索引钱变成私人信息管家。与此同时,搭配强悍的 jamie 三五 flash, 谷歌彻底解决 ai 落地最大痛点,性能超越前代旗舰,速度提升四倍,成本直接压缩至原来的三分之一, 企业再也不用在质量和价格之间两难取舍。在亮眼的 ai 智能体背后,谷歌的野心远不止于此,他还悄悄铺开了一套完整软硬件生态,打算从底层改写行业格局。系统层面,他推出全新桌面系统 amoledos, 打通安卓与 chrome os 壁垒,深度内嵌 ai 能力。同时联手联想红旗推出高端笔记本正面硬钢 windows 和 macos, 强势入局电脑端市场。除此之外,谷歌兼顾开发者与普通用户,完善全维度生态布局。面向开发者,谷歌上线专属命令行工具,简化智能体开发部署流程,降低开发门槛。硬件端还联合三星沟通,推出 android x 二智能眼镜,实现跨设备联动,补齐穿戴生态,完成全品类硬件布局。 从顶尖人才回归到全民智能体落地,再到系统硬件开发者生态全面打通。二零二六,谷歌 i o, 标志着 a g 的 时代正式到来。不难看出,未来 ai 比拼不再是纸面参数,而是更低的使用成本、更强的执行能力、更深的生态嵌入。 这一次,折服三年半的谷歌彻底醒来,你觉得满血复活的谷歌能不能彻底碾压 open ai? 欢迎在评论区留下你的看法。

就在五月二十号凌晨一点的时候,谷歌的开发者大会正在进行全球直播,然而与众不同,史无前例是抖音居然进行了实时转播,还带同声传译,而且这次还成为了谷歌 i o 二零二六年中国区首席内容合作伙伴。我觉得相比起发布会的内容,这个才是更为关注。那发布会无非就是发布了一个君来三点五 再去的一个新的模型,以及其他的一些更新,说白了能力也不是特别强,价格还比较贵,所以具体的吐槽内容你可以去看其他博主的截图。那我更关注的是这个合作的背后是什么意味呢?难道海外的 agi 真的 要大规模的登陆中国了?那今天视频的主要内容就是对 ai 行业的黑化和专利名词 做一个扫盲式的科普,主要就是针对下沉市场,你不需要有任何的专业知识。那另外感谢抖音科技对本期节目的邀请和支持,让我们开始今天的节目。第一个就是 talk, 假设 ai 是 个小学生,那小学生写作文是要用字来跟你算钱的,那中文大概一个字对应一个 talk, 英文一个单词对应一到两个的 talk。 那 token 是 大模型的处理文字的时候的最小单位,那这些模型读你输入的文字生成回答都是一个一个 token 切开来处理的。那比如说我们用 api 调用 ai 模型的时候,贵不贵就看 token 的 输入和输出价格,它是按量计费的, 所以有的时候我们用 ai 来写长文档会非常贵,或者聊天聊聊太久也会变慢变贵,都是因为这些 token 在 进行不断的积累。 第二个就上下文假还是一样的,假设 ai 这个小学生,那这个学生一次考试能看多少题?有的只能记住眼前的那一页,而有的可以翻看一整本书,记住这个书里的全部内容。所以我们在选 ai 的 时候,很看这个 context 就 上下文的长度, 有的是两百 k, 有 的是 em, 那 这个 context 越长,你能丢给他一整本书,让他总结,让他读完整个项目代码以及长对话不失意的能力就越强。现在大家为什么喜欢用 deepsea 去进行写作,就因为 deepsea 有 v 四 pro, 上下文能力特别厉害。第三个就是提示词 prompt, 好 比你妈让你写作业的时候给你提的要求,比如说写篇作文和写一篇四百字关于秋天的作文,这里面要有比喻句,结尾要点题,要开门见山, 那给你不同的要求,你能给他产出的结果就会天差地别了。同一个 ai, 同一个问题,那提示词的好坏就可以差好几倍,所以才会有提示词工程师这个职业。 网上现在还有人在卖那种提示词模板,这也是一个蓝海。所以有的时候我们在用 ai, 他 输出效果我们不是特别满意的时候,可能不是他能力不行,可能是我们 给它的这个提示词不太行。第四个就是生成式 ai, 什么是生成式 ai 呢?就是能够创造新内容,包括文字、图片、音频、视频代码的 ai, 那 这些是区别于那些只能做分类识别、预测的判别式 ai 的。 但我们现在听到的 ai 基本上都是生成式 ai, 像掐 gbt、 豆包、 deepsea、 mjeremy, 全部都是生成式 ai, 手机里面的像人脸识别、垃圾邮件过滤啊这种就是属于判别式 ai 了,和深层式 ai 不是 一回事。好,第五个大语言模型 llm 就是 一个语文能力特别强的学生,几乎读了所有人类的书,现在主流的 ai 产品后面都是 llm 嘛,像 chris leclo 的 excel, 千万全部都是。实际上 各家 ai 的 差别就是理解和深层自然语言的这么一个能力嘛。所以我们在选模型的时候,本质上就是在选不同公司家的这个 llm。 哈。 下一个 transformer 这个词大家应该会在非常多的发布会里面听到,我们还拿小学生的举例,那以前的学生死记硬背,只能从头读到尾,那 transformer 呢?让他能够同时看一整段话,而且自己来判断这段话中哪些部分是最重要的。 那在二零一七年的时候,谷歌提出的神经网络架构,核心就是注意力机制,今天几乎所有的主流大模型都是基于这个 transformer 架构来研究出来的,你可以把它理解成一个安卓的其他系统,就是不同的 ai 公司。好, 再往下一个就是多模态,这个我们平时也会经常听到说某某公司发布了一个多模态的模型,意思就是说这个学生他不光会语文,还会音乐美术,来看图说话,那区别于只能处理文字的单模态, 那有些 ai 他 就看不了图。比如说就像 deepsea v 四 pro, 他 好像看不了图的。再往下一个就是幻觉。我们在使用 ai 的 时候经常会出现的一个问题就是这个学生他遇到了不会的题,不会跟你说老师我不会,而是正儿八经的瞎编一个完全不着调的一个答案。 那为什么会出现这种情况呢?要不然就是这个 ai 模型它能力太弱了,要不然就上下文窗口太长了,所以有的时候一些模型查资料我们就不能全线,有可能他给出数据引用和人民全部都是错的。那在这一点上,我就觉得 girl 可是做的非常好的, 它的搜索能力和信息整合能力几乎是我用过所有 ai 模型里面的扛把子,它给出的数据来源你随便点一个进去,基本上都是真实正确,而且是最新的。再往下一个就是蒸馏,蒸馏技术是大家炒的最大声的一个技术, 说白了有一些公司是在河里面钓鱼,但有些公司是在你钓上来的鱼桶里面钓鱼。关于蒸馏这个事情,我不想在这输出太多的个人观点,我只能表达说这是一个很好很好的技术,它也助力了很多国产 ai 模型的 快速发展。再往下一个就是 agent 智能体验,一个大火的一个热词,那像大家平时听说到了什么扣带,什么小龙虾,什么 hermes, 包括我前两期视频里面讲那个 mini max marvel, 他 也是属于智能题,他说什么意思?你原本跟 ai 是 进行隔空对话,你跟这个小学生对话,但是现在 这小学生他随着几年增长,他变成一个研究生了,你现在可以把这个研究生请到你的家里来帮你干活了,多厉害呢?但他不光会做题,还会自己放书上网查,跑去问老师,在你的电脑,你的 家里面来帮你处理一些复杂的任务,能够自主规划,调用工具执行多部任务啊!你只需要给他一个目标,他就可以自己拆解成步骤,然后调用搜索计算机代码和 a p i 来一步一步地完成,直接接管你的电脑,帮你完成很多事情。 所以为什么现在托管的消耗暴涨,就是因为 ai, 它从一个聊天软件变成了能够真正帮你实现打工和干活的这么一个东西。那么以上是我总结出来二零二五到二幺六最专业最热门的几个 ai 词汇了。如果你是一个完全不懂 ai 小 白,我希望这期视频可以对你有那么一丝丝的帮助。好,那么让我们下期视频再见!

就在刚刚五月二十号凌晨一点的时候,谷歌的开发者大会正式的开始直播,那肯定有很多朋友没有看这个直播,我只能说各位真是有先见之明,整个直播时长有两个多小时, 又臭又长,直接给我看历劫了。信息密度呢可以说是非常的小,就是发布了一个全新的模型三点五 flash, 其余的其他功能呢都是接入的这个模型,各种乱七八糟,内容呢都加了在一起,大会的后半段呢,直接变成了现场直播带货,我看完就是一句话,真是闹闹又麻麻 闹马。我们首先看一下大会的第一个部分,就是 gmail 模型家族,整场都在讲这个, gmail ai 发布了 gmail 三点五 flash, 它的定位呢是前沿智能模型和 agent 执行力合二为一的旗舰快速模型,头跟的输出速度呢是其他旗舰模型的四倍, 非常的夸张,而且在编程 agent 的 多模态基础上,超过了 gmail 三点一 pro 就是 一个 flash 模型,超过了三点一 pro 模型,这个就意味着这次模型呢是小而快,听起来非常的不错, 但是我不禁要问,那么代价是什么?没错,它的价格也赶上了 pro, 上一代的 pro 模型呢,每输入百万, token 呢是二美元,输出是十二美元。这次的三点五 flash, 它的输入是一点五美元,输出是九美元, 其实非常接近了,在他们直播中有这样一张图,说是用了九十三个 agent, 输出了二十六亿的 token, 总共金额小于一千美元啊,我先保持一下质疑, 这次价格涨的确实有点多,这还只是 flash 模型三点五 pro 呢,预计在下个月,也就是六月上线,那你想想吧,那个价格肯定会更高呀。那第二个呢,就是 jimmy 欧姆尼全新系列,目前用的也是三点五模型,核心定位呢是推理能力加创作能力融合首发的 jimmy 欧姆尼 flash 接受图片、音频、视频文本的输入,也可以输出生成视频,还可以创建我们自己的声音生成的视频呢,让他说话的声音就是我们自己的。 你可以理解为把视频生成模型,图片生成模型全都融到了一块,缝合怪奇美拉。另外顺带一提,它的内容检测能力呢,从 jimmy nike 的 app 版扩展到了搜索和谷歌浏览器中,也就是说,当你看到一个图片,你不知道它的真伪,那么你可以把这张图片发给他,问问他是否由 ai 生成 它可以进行判定。这个怎么说呢,就我体感下来,其他的生成模型我都能认出它是 ai, 唯独 g p t 的 那个确实是有点真假难分,你不会针对的 g p t 吧?那山姆就有话说了,你不是我的兄弟,你是个路人。 接下来就是重头戏,谷歌的 a i d e 反重力二点零上线了,全新独立的设计啊,真是不愧是谷歌啊。从这个设计页面上呢,我就看到了无数个神支持了 doa 盾,并且速度非常的快,而且如果你是新开通的,或者以前就是 o 叉用户,还会送你 一百套的额度,那去领吧。什么意思?下一个更新的是全新的设计语言,几乎是全平台桌面版、手机版以及网页端都进行了更新,变得非常优雅,动画非常丝滑,同时引用了全新的字体,不过对于阅读中文来说好像不是特别方便, 只是阅读英文的时候看起来确实很优雅。每天的额度呢,也改成了卡尔的那种限额五小时刷新,直到达到周限额 结束了,也就是说,如果你是 pro 用户,可能用一会就没有了这个额度。下一个 jimmy spark, 二十四小时全天候, agent 直接运行在云端,在手机上,电脑上拿起来就直接控制它使 用的模型呢是 jimmy, 三点五,可以实时监控我们的信用卡账单,追踪邮件,自动整理笔记,制作文档。这个几乎就是一个 agent 的 平台的标配了,它本身就是一个超级 mcp 客户端,接的非常多。这个时候可能有朋友说了,哎,这个不是小龙虾吗?是吗? 目前这个我们用不了,你是 plus 用户, pro 用户都用不了,你必须得是 air ultra 用户。二百五十美啊,不对,现在降价了,是二百美元一个月。但是这个计划对我个人吸引力不是特别大,再下去沉淀沉淀吧,我们看下一个谷歌搜索 三十年以来最大的更新,在二五年年底的时候呢,谷歌浏览器就推出了 ai 模式,那现在呢?把这个 ai 的 模型换成了 gmail。 三点五, 我们输入的越长,搜索框越会主动的进行扩展,因为它是内置在浏览器上,主要还是为了搜索嘛。当你一个很简单的问题,他就会给你回复很短的内容,但是当你长篇大论的跟他讨论的时候,他就会开始进行深度思考 啊。 deep think, 也就说类似可绕的那种,判断你的意图,以及你这个问题的复杂程度,他自己来决定给你回复多少。另外这样一个浏览器也有 agent 了,二十四小时全天监控。我们提一个问题, agent 在 后台跨博克新闻社媒以及谷歌的实时数据 持续监控,也就说你可以让他实时帮你监控一些内容。那这个监控的功能呢?我个人认为可以用在理财的方面,比如说黄金的金价,实时给你追踪一些股票的价格,实时的给你发送。 不过这个功能呢,暂未发布,夏季向 ai pro 凹叉用户开放下一个 mini app。 这个功能是在我们搜索的时候,那一个非常长的任务,它会自动给我们生成看板,或者是生成网页,生成一个小应用,我们可以直接快速的跟它交互,那比如说我问一个太阳 长什么样子,那它呢?就会生成一个类似网页,或者是一个三 d 的, 我们可交互,可以拖动旋转。这个太阳演示看下来呢,还是非常有意思的,但是仍未发布, 发布时间是未来几个月。 ai pro ultra 美国地区的用户可以使用,也就说你不在美国,或者你是免费用户,那么你都是用不了的,太可恶了,他不是我们的兄弟,他是路,厉害。最后还有几个我快速给大家过一下,因为我个人感觉非常的无聊,一个是全网通用购物车, 让 ai 帮我们去购物,去比价美国豆包啊,真是实至名归啊。还有一个呢,是给油管准备的 ask youtube, 可以 直接处理复杂的查询和后续的追问,其实跟 grog 差不多, grog 呢,是可以读取 x 平台的所有推文,那这个 youtube 呢,自然是可以读取油管上的所有视频,以结构化交互形式呈现。这个呢,现在已经可以用了,局限于 youtube 会员的美国用户啊,注意你得是会员哦。 最后呢,就是他们的带货环节,首先是他们的安卓 x r 啊,智能眼镜,想当年我也买了一个小米的异样眼镜,老傻了。我 目前呢是两个版本,一个是带屏幕的,一个不带屏幕的,只不过带屏幕的还没有发,各位感兴趣可以去看一看。大概 就这么多内容,如果各位非常闲的话也可以去看看。这个直播还是蛮催眠的。那以上呢,就是本期视频的全部内容了,如果你对上述我们提到的这些内容某 某一部分你感兴趣,可以在弹幕里留言,我们可能会单独出一些视频来测试,或者是解读一下。各位记得点赞,不点赞的话你就不是我的兄。 ok, 最后祝各位玩的愉快,我是段峰,我们下期再见!拜拜!

参加现场 google i o 开发者大会很难,基本只能参加线上会议。黑色托特包那个牌牌很重要,是谷歌官方认证专家暨第一谷歌开发者专家。 专家有免费直通门票,无需抽签付费可以进入的私密技术论坛。高管闭门会分享内部技术分享有前排专属席位和优先通道及专属休息区。与谷歌官方团队一对一对接, 与全球 g d 一 行业顶级专家、企业技术负责人闭门交流技术人脉,可优先举手提问,直接对话核心负责人与企业高层对接,提前体验未发布新品,获取未公开的技术资料,可申请专项技术咨询,可免费获谷歌产品高阶调用额度。 受邀参加谷歌全球专家闭门峰会,费用由谷歌全额承担。 g d 一 身份可作为企业技术实力背书,这个身份可助力事业发展,但获得不易。

hello, 大家好,这两天谷歌发布了他们的 ai 开发者大会,也是同步上线了很多非常厉害的 ai 模型、 ai 应用, 然后我总结一下,其实有两个最强大的一个应用,我也想跟大家分享一下。第一个就是谷歌的多模态的一个产品, ai 产品就因为 呃之前骨骼一直压轴,就是压轴在这个多模态上面,就是为了跟和 forrick 区分出来,然后他们现在也是发布的这个多模态欧米尼也是效果非常非常好。总之一句话的话就是 你现在可以输入任何的文字音频输给他,然后你改修改视频,就跟你修图一样,非常非常简单,就他多么快能力是做的非常好的。第二块的话就是他这一次的 ai 产品,让我呃最惊艳的还是他的 spark 模型, 怎么说呢,他就等于说是他在云端不甩一个服务器,就可以打通任何第三方软件之间的一个壁垒。就像我们之前也都知道,其实我们平时在用 a 键的时候,这些第三方软件他是没有办法去有效去调用那些服务的,对不对? 你像我有时候我想去分析抖音跟小红书的这些数据播放量,我传统的这一件我就做做不到,但现在呃谷歌发布的这个 spark, 它就可以打通任何第三方软件这样一个壁垒, 我想分析我的社交媒体的数据,或者说我想分析我的银行账单,可以很方便的进行,所以说这个是我认为 呃最厉害的一个地方,所以这也是我准备下一个阶段马上去尝试的。就谷歌发布的这个 spa 的 ai 产品,这次给大家分享,大家如果有时间可以去看一看他们完整的一个发布会,好,拜拜。

昨天谷歌 iu 大 会,发了一堆新东西,但创始人谢尔盖布林说方向错了。据内部人士透露,布林用完 object mesos 模型之后,在公司内部说了一句话,这就是 agi。 如果你用了还不觉得这是 agi, 那 我不知道什么叫 agi, 然后他直接否掉了自家方向。我不要什么多模态大模型了,什么能生图能做视频都不重要,我只要一个能写代码的模型,而且我要求我们的工程师用的编码模型必须是我们自己的。 硅谷财报数第五分钟了解最新 ai 局势,今天我们一起来了解一下谷歌的焦虑。五月十九号谷歌 iu 大 会, jimmy 三点五 plus 视频生成模型 omni 个人 ai 助手 spark anti gravity 二点零开发平台皮差一亲自站台,说这是谷歌 ai 的 一次重大飞跃。蒂曼的 ceo 说,三点五 plus 几乎所有指标都超过了自家上一代旗舰。谷歌还宣布,二零二六年资本开支一千八百到一千九百亿美元,四年前才三百一十亿。 账面上谷歌打的相当不错,上个季度总额收入一千零九十九亿美元,同比涨百分之二十二。谷歌云最猛,单季收入二百亿美元,同比增长百分之六十三,增速超过了同期的 awes。 杰姆纳月活七点五亿,企业版四个月卖了八百万付费席位。第七代 tpo 安稳已经商用,单芯片算力跟英伟达 gb 二百几乎打平。 听起来很猛,但 ai 这场仗的胜负手已经不在这些地方。现在真正值钱的赛道是 cody, 开发者愿意掏钱,企业愿意千年约,用户粘性极强,而把这条路趟出来的是 antopik。 antopik 去年年底年化营收九十亿美元, 四个月后三百亿。 salesforce 花了近二十年才做到一百亿。达里奥自己都愣了,说我们计划的是十倍增长,结果来了八十倍。 钱从哪来的? code code 这个命令行编码工具二零二五年中才正式发布,六个月做到十一年化营收,二零二六年二月突破二十五亿。 mark 芬茨的数据 code 在 企业编码市场拿了百分之五十四, open a 只有百分之二十一。 gta 公开提交里百分之四是 qq 写的,一个月前还只有百分之二。开发者平均每周泡在上面二十个小时,半个工作周,需求大到算力都不够用。五月六号, anddrop 跟 spacex 签了协议,拿下 coltiv 数据中心,全部算力二十二万块,英伟达 gpu 三百兆瓦。 马斯克之前一直骂 angelo, 结果见了团队之后说印象深刻,转头就把算力租给了他们。骂归骂,生意归生意。拿到算力后, angelo 立刻把 coco 的 额度翻了一倍,取消高峰时段限速还是不够用。更魔幻的是谷歌的角色。 上个月谷歌向 antropica 投了一百亿美元现金,承诺最高追加到四百亿。 floyd 就是 在谷歌 ppu 上训的。 antropica 还欠了五千兆瓦的 ppu 算力。长乐。谷歌既是 antropica 的 对手,又是投资人,又是基础设施供应商,这个三重关系放在商业史上都较为罕见。 antropica 二级市场已经触及一万亿美元,正在谈九百到九百五十亿美元的新一轮融资。 openai 最近一轮融资八百五十二亿美元, 三个月前差距还不存在。二月份 android 估值三千八百亿美元,三个月翻了将近三倍。 brand 的 企业支出数据付费用 android 的 企业占比百分之三十四点四,首次超过 openai 的 百分之三十二点三。一年前才百分之九。 一家不到五年的公司估值碾压九亿周,活的恰鸡屁蒂姆公司不靠 c 端流量,就靠一个让程序员上瘾的命令行工具。 mesos 就是 这条路的终极产物。软件工程机准硕士本只得分百分之九十三点九,上一代百分之八十点八。数学竞赛约瑟默百分之九十七点六,接近满分,上一代百分之四十二点三。安全方面, on topic 用 mesos 几周内自主发现了数千个零日漏洞, windows, mac, linux, phone, firefox 全覆盖。有一个藏在 openbsd 里二十七年的远程崩溃漏洞,全世界公认最安全的操作系统。几十年人工审计没发现 mitos 犯出来了。 firefox 漏洞利用测试,上一代试了几百次,只成功两次, mitos 成功一百八十一次。 强大 and sook 自己都不敢公开发布。拿了 app, 谷歌、 microsoft 等十一家巨头专门做防御性安全检测,不连用完才说出那句话,不是客套,是真被吓到了。 钱在,投票,人也在。就在昨天, capitol 宣布加入 antelope, open a 联合创始人,前特斯拉 ai 总监, webcody 概念的提出者。他在 youtube 上从领手戳大模型的教程,是全球程序员的入门圣经。 不缺钱不缺名,可以回优碰 a, 可以 去谷歌,可以继续创业。但他选了 nzi, 去的是预训练团队,训下一代机做模型,不是去做应用做产品,是去造下一代 ai 的 大脑,这个行业里最会判断方向的人之一。用脚投了票。 谷歌不是没试过 antigo, 就是 对标 cologne, 这次 i o 还升级到了二点零,但开发者不买账。更难看的是,谷歌内部对漫团队被特批可以用 cologne, 其他团队不让用了,怕泄密不用效率低。这家最核心的 ai 团队都在用竞对的产品写代码。 最尴尬的是时间长,布林三四月份才醒过来,确定是主战场,但下一代模型已经在训行内,教练单一轮两三个月,中途改不了方向,等出国发现不在主战场上了。 昨天 i o 发的 omni spark, 恰恰是布林说不重要的方向。现在谷歌要重新训一个编码大模型,先追上再说, 一步慢,步步慢。硅谷现在有个共识,一个模型能把代码写好,就有机会用代码改进自己,代码越强,自我迭代越快。 antropolis cfo 公开说过,内部超过百分之九十的代码已经是 cla 写的, ai 在 写让自己更强的 ai, 这个循环已经在跑了。 ai 这场仗不是谁花钱躲谁赢,是谁先看清战场在哪,谁赢我是小赵,关注我,一起看清经济背后的真相!


别被 openai 造手机的新闻骗了,百分之九十九的人到现在都没看懂,这根本不是多一个手机厂商内卷, 是一场冲着苹果、谷歌要改写整个移动互联网格局的精准脚刹。天风国际国民赏的爆料不是空穴来风, openai 联合高通、联发科定制 ai 芯片,拿来利群精密做系统级设计, 二零二八年量产 ai 原生手机。消息一出,高通暴涨百分之十二,立讯直冲涨停。资本市场的反应早就暴露了这件事的分量。 第一个真相,现在市面上所有的 ai 手机全都是伪命题,不管是安卓加个大模型,还是苹果给 siri 升个级,本质上都是在 app 生态的框架里,给手机加个 ai 插件。 你还是要手动开 app 填信息,一步步操作, ai 永远是工具人,成不了主角。而欧鹏 ai 要做的是从跟上掀桌子, 从芯片、底层操作系统到整机硬件,全为 ai 原生打造。核心逻辑不是让你更好的用 app, 是 彻底干掉 app。 未来你一句话, a a 一 都能帮你搞定,行程、订票、约客户,全流程 手机直接变成你的 ai 分 身。第二个真相,这场合作没有一个配角,全是赌上未来的生死局。高通为什么拼?现在的他被苹果压着,被联发科抢份额,安卓内卷已经走到头了,和 openai 定制 ai 芯片,是他唯一能从安卓芯片供应商 升级成 ai 时代终端霸主的机会。一颗定制芯片的营收顶三十个普通手机处理器,励志为什么能拿到入场券?它不是简单的代工厂,而是要全程参与手机的软硬件协同设计,直接从苹果供应链的打工人,变成下一代 ai 终端的联合定义者, 这是他逆袭富士康的唯一机会。第三个真相,这场战争的矛头从来不是安卓厂商,是统治行业十几年的苹果和谷歌。谷歌靠安卓的 app 生态赚流量霸权, open 直接釜底抽薪。 当用户不用开 app 了,安卓的意义在哪?苹果靠软硬一体的生态闭环赚走行业百分之八十的利润,而 openai 直接复刻了这套闭环,甚至更激进。当手机的核心变成 ai 能力,你还会在意拍照多强,跑分多高吗?苹果的护城河第一次出现了真正的裂痕, 那些还在疯狂卷硬件参数的手机厂商,根本没意识到,他们的对手早就不是同行,而是一个要改写行业规则的新物种。关注我,带你看懂商业变局里的底层逻辑,不做热闹的看客,只做趋势的先行者。

谷歌发布新 ai google omni, 以为又将引领行业,结果拉了坨大的国外网友都看不下去了,直呼不如 cds。 就 在昨夜,谷歌 ai 全家桶迎来饱和式发布, google i o 二零二六已经不是传统意义的开发者大会了,更像是一场 agent 的 总动员。 大家最期待的 gemini omni, 本以为谷歌憋了这么久,终于要端出一个能和字节正面对抗的视频模型,结果上线试用后谷歌就露馅了。号称能实时输入、实时生成的世界模型 omni, 现在只能单线成输出,视频生成结果也远不如 cens 二点 零,看看这几段贴脸对比就知道了。但除了翻车的 omni, 谷歌其他模型还是很吭的。 gemini 三点五 flash 输出速度是同档竞品的四倍,成本还更低。 gemini spark 部署在谷歌虚拟机上的云端 agent, 即使把电脑关了,也能继续跨平台运行。谷歌搜索二十五年来的最大升级, google search 全面 a 卷化,支持多模态输入。能看出来谷歌是真的急了。不过字节、 open ai、 anthropic 轮番上阵, ai 大 战留给谷歌的时间还有多少呢?

谷歌格了自己的命。在刚刚结束的开发者大会上,谷歌在他的搜索引擎中植入了 ai model, 省去了搜索链接和搜索广告, 这就等于直接干掉了自己的搜索广告引创集。另外, gmail 三点一也直接升级到了三点五, 不仅模型能力达到了同行的顶尖水平,而且速度提高了四倍。另外,他还推出了全能模型金明奈欧米尼,他能完全理解真实的物理世界, 支持多模块输入、深层逼真的符合物理规律的视频,而这个能力正是现在人形机器人所缺失的。除此之外,你对谷歌的哪些产品更新更感兴趣呢?

明天谷歌二零二六 i o。 开发者大会就要开了,先聊一个试试。上一次谷歌在 ai 圈这么紧张,还是二零二三年切的 g p t。 刚出来的时候,年夜拉响红色警报,全公司转成 ai first。 三年过去了,企业市场被 g p t 五点五吃了, 开发者用脚投票选了 club, 杰米来了,说好听点叫稳中有劲,说难听点起了个大早,赶了个晚集。所以这次 i o 谷歌没有退路, 今天不练发布者预告,我们一起捋三个值得盯着看的东西,任何一个成了,都可能改变我们拿手机的方式。第一个,杰米莱,四点零,谷歌的背水一战,先看牌面,现在 ai 大 模型这个牌桌上,企业端 gpt 五点五坐庄 开发者圈 cloud office。 四点七是默认选项,杰米莱卡在中间,技术不差,但就是没人用。 这次加密来四点零,如果如期发布,号称参数量冲到三到五万亿上,下文窗口从两百万 token 直接拉到一千万,什么概念?你跟 ai 聊天,聊着聊着他就失忆了。 那一千万 token 意味着整本三体扔进去,他还记得你第一张提过谁的背景。别急着激动, 有分析师认为,这次更可能放出来的不是四点零,是三点二或者三点五级别的小迭代。逻辑很简单,谷歌现在怕的不是不够强,是不够稳。想想将来四点零要是翻车了, 幻觉满天飞。数据搞错,那就不是产品事故,是舆论场上再无谷歌。所以明天凌晨,我们盯住一个数, s w 一 奔七 pro 的 分数, 如果过了百分之六十五,那 cloud 该睡不着了。没过,那就是明年再战系列的更新。第二个 o s 手机电脑眼镜要合体了。听起来很科幻,其实是个务实的事儿。 谷歌准备在 i o 上发一个新的系统,叫 alumnormos, 简单说就是把安卓 chromos 还有 xr 眼镜的系统三个合成一个。那你可能会问,手机用的好好的并它干嘛?关键在于 ai agent, 那 种你说话他替你干活的 ai 助手。现在的 ai 助手有一个要命的问题,他在聊天框里,不在你的系统里。你跟他说帮我在美团上点个餐, 他会回你建议你打开美团 app。 这不是废话吗?我自己不会打开吗?但如果是系统级的 ai, 它能直接操控屏幕跨应用,就把这事给办了。 这次谷歌说娇米莱四点零会以系统级 agent 的 身份长在 elm normos 里,真的能看到你的屏幕,操作你的应用,记住你的习惯。目前能这么玩的只有苹果的封闭生态。谷歌想在不封闭的前提下做到这件事, 野心大,风险也成正比,系统级 ai 一 旦出错,不是回答错了,是你的手机可能被它玩坏,所以明天的演示很关键。现场跨应用的操控是真流畅,还是提前录好的? 那第三个,安卓 xr 眼镜,八十克不到的 ai 眼镜。去年 i o 展过 xr 的 原型机,今年要发消费级的产品了,预计售价四九九到七九九美元,重量压在八十克以内。那做个对比,苹果的微信 pro 是 六百克,戴半个小时脖子就开始抗议。 核心能力是你看到什么 ai 识别什么,实时翻译,抬头显示通知 gimmel 对 话。有意思的是它的定位, mate 的 rain 眼镜卖的不错, 但功能浅,主要就是拍照加语音助手。苹果的微信 pro 功能强,但太重太贵,出不了门。谷歌这次卡在中间,一副能日常带的 ai 助手逛着街,他帮你认路。翻译推荐餐厅,像有个 ai 在 你的耳边跟你叨叨, 但问题也在这,你愿意让 ai 看到你看到的一切吗?谷歌说有 led 指示灯,录像的时候会亮,但技术上 它也可以不亮。当 ai 有 了眼睛,你的隐私边界在哪儿?这才是比参数更值得琢磨的事儿。总结一下,明天凌晨一点,谷歌 i o 二零二六开幕三件事儿,焦米莱四点零能不能追上 gbt 和 cloud, 决定了谷歌未来三年在 ai 圈的饭碗。 luma os 能不能把手机、电脑、眼镜打通,决定了我们的数字生活要不要被重新定义。安卓 xr 眼镜能不能做成日常 ai 助手,决定 ai 走出屏幕是不是空话,我个人的票投给第二个。 不是技术最炫是系统及 ai 一 旦落地,那我们每个人用手机的方式都会重新改写一遍。我是小朱,点赞关注,一起读懂 ai 时代规则,下期再见!


就在今天的凌晨呢,谷歌他举办了二零二六年的开发者大会,发布了很多的新成果,让人眼花缭乱。但是我们要去抓最关键的突破点,也就是真正重要的东西。 这次大会的这个核心,他不是说模型参数又大了多少,而是谷歌在重新定义这个人和手机之间的关系。以前是你打开一个又一个的这个 app 自己来操作,那以后可能就是你对着手机说一句话,剩下的他全办了。 那为了支撑这套东西跑起来呢?谷歌这次端出了三样东西,第一个是 germany 三点五 flash 模型,它最大的特点不是聪明,是快,生成的速度是其他模型的四倍,而且今天起全球免费。那为什么 快这么重要?你想啊,如果说你让 ai 帮你改个行程,它在那儿转了三到四秒转圈圈,你还下次敢用吗?只有响应快到几乎没有延迟,你才敢把一些真正重要的事儿交给他去做。第二个呢,就是 germany spark 的 智能体,这个就是让 ai 长出手脚的关键一步了, 它能够跨应用去推理和执行,那么这件事儿背后的信号其实挺大的,以后那些 app 可能就不再只是你手机上的主角了,它们会退到后台,变成一个又一个被 ai 去调用的 功能模块。第三个就是它们这次又重新杀回了智能眼镜的赛道,这副眼镜它不只是拿来拍照的了,它是 ai 的 眼睛 搭载的技术,能让 ai 实时看懂你眼前的东西,你带着它走到哪里, ai 就 看到哪里,这个就把线上和线下的这种物理世界打通了,所以你看呢?把这三件事串在一起,就是谷歌它想搭建的一条 完整的炼炉 ai, 有 了眼睛看世界,有了足够快的大脑做判断,再配上 spark 这双手去执行。那么问题来了,听起来挺美好的,但是市场它在担心什么呢?核心其实就一个问题,你信不信任它 让你把你的支付权限、社交账号、行程安排全部都交给一个对话框,你真的放心吗?如果说用户在这个问题上过不去,那么 spark 再强也不过只是个高级的搜索工具,它是没有办法真正进入到你的生活里去干活的,这个也是目前多空分歧最大的地方。 那么我们回头再来看看国内这边,这周正好有三部门联合发了国内第一个智能体的专项政策,提了十九个典型的应用场景, 那么专家也判断在未来三年,这个领域是会爆发式增长的。但是国内真正要解决的问题是各家的这个 app 之间的数据能不能打通。如果说华为、小米、百度这些本身有全家桶的这个公司,他推不动这件事,那么国内的智能体就会很尴尬, 有脑子有想法,但是手脚被绑住了,所以落到 a 股,其实盘面已经有反应了,五月份整个智能体的板块普遍在涨, 机构调研和这个资金的关注度也明显在升温。但是这里要冷静地看,目前确定性最高的其实不在软件还是在硬件, 第一条线呢,就是谷歌这条链上的硬件。这次谷歌他发了新手机 pixell, 十一也重新杀回了智能眼镜。 那么这两款产品的逻辑不是拼参数,它是为了跑通端侧 ai, 你 想这个 gemini spark, 它要在本地做推理,那么对 npu、 算理、内存、待宽散热的要求就实打实的往上跳了一个台阶。 所以这条链上的这个机会不是炒概念,是实实在在的供应链增量。比如说做高待宽存储的,做这个新型散热方案的,做智能眼镜、光波导和危险式的, 这些环节会有订单跟着谷歌的产品节奏来走。第二条线呢,就是国产智能体带动的硬件升级。这周国内刚出了这个智能体的专项政策,方向已经很明确了,不管最后跑出来的是哪家,只要智能体要落地,手机端侧的算力就必须往上顶。 这个就带来了一个确定性比较高的逻辑,就是国内手机厂商接下来的旗舰机大概率会把能跑智能体作为一个核心的卖点,那么对应的存储升级、散热升级、端侧的推理芯片这些需求都会跟着起来。 这条线呢,和谷歌没有直接的关系,但是逻辑是同一个逻辑,软件倒逼硬件迭代,所以总结一下,谷歌链的硬件吃的是谷歌新品周期的增量, 国产链的硬件吃的是智能体政策推动之下,国内手机厂升级的这个增量。这两条线呢,不完全的重叠,各有各的节奏,但是底层的驱动因素其实是一样的, 端测 ai 不 再是跑个 demo 这么简单,而是要真的干活了。最后呢,我们再说两个需要盯紧的这个指标,一个就是这个 germany spark 公测之后,用户有没有留下来持续用,如果说只是长个新线就卸载了,那么这个故事的根基就不成立。 第二个呢,就是新手机跑端侧大模型的时候,发烫和续航撑不撑得住?如果说体验翻车,那么所谓的这个换机潮也就无从谈起。那聊到这,我也想问问你,假如这几个产品真的摆到你面前, 一个是快到没有延迟的 ai 助手,一个是能替你跨应用干活的智能体,还有一副能看懂你眼前一切的这个眼镜,你最愿意为哪个买单?或者你觉得哪个对你根本没有吸引力呢?

大家好,这里是浩宇说才。北京时间五月二十日凌晨,谷歌年度开发者大会在美国加州拉开帷幕。与 往年不同,今年的谷歌不再单纯为模型参数焦虑,而是向全球资本市场交出了一份极具野性的答卷。 通过高达一千八百亿至一千九百亿美元的全年资本支出,谷歌这系统性的将人工智能全面切入搜索、浏览器、手机及智能眼镜等核心入口,加速完成从技术单点突破到全站商业变现的华丽转身。 在大会开场,谷歌首席官桑达尔皮叉一用一组亮眼的数据稳住了华尔街的军心。过去一年,谷歌月处理数据量高达三点二千万亿,同比增长七倍, 其人工智能应用的越活跃,用户数甚至飙升至九亿。这不仅宣告了谷歌在深层次人工智能领域的绝地反击初见成果,更为其庞大的基础设施投入提供了强有力的商业化支撑。 本次大会的核心看点在于谷歌对商业逻辑的深刻重构。在模型层面,谷歌发布了专为复杂任务打造的新一代轻量级模型,该模型生成速度是其他前沿模型的四倍,且极具性价比, 企业客户若将大部分工作留切换至该模型,每年可节省超十亿美元成本。此外,谷歌还推出了能模拟物理世界的视频生成模型,补齐了多模态生成的最后一块拼图。 然而,模型只是底层基建,真正的商业野心藏在智能体之中。谷歌正式推出了全天候运行的个人人工智能助手,以及面向开发者的智能体编程平台, 这意味着谷歌的人工智能不再只是一个被动的聊天对话框,而是进化为能跨应用执行任务,甚至直接完成下单支付的超级助理。 在电商领域,谷歌推出的通用商务协议正试图打通从搜索、推荐到支付的全链路,将传统流量入口改造为高价值的交易入口,直接重塑搜索、广告与电商的变现逻辑。 在底层算力上,谷歌自研的新一代芯片产能大幅上调,不仅有效降低了对外部芯片的依赖,更通过云服务向外输出算力,开辟出全新的营收增长曲线。 从豪掷千亿美金的算力基建,到全面落地的智能体生态,本次开发者大会清晰地传递出一个信号, 人工智能竞赛的下半场生态协调与商业闭环能力将比单一的技术突破更具决定性。对于投资者而言,谷歌正在用真金白银证明 自己不仅是技术的追随者,更是全站智能时代的规则定义者。今天的分享就到这里,如果喜欢的话,点赞关注一下哦!

你敢相信吗? ai 产品发展太快了!就在前几天,腾讯刚刚发布了吐司 ai 产品,谷歌 i o 二零二六开发者大会上就放出了大招。 谷歌人工智能开发是叫你直接打个字就能生成延伸的安卓应用,不是网页版,不是 demo, 是 能安装能分享的真 app。 它们采用科特林语言和安卓全新声名式 ui 开发框架型,还能调 gps、 蓝牙、 nfc 这些硬件。 说白了,以前你学几个月的编程才能做的事,现在只要你会打字就行了, 轻轻松松就能做个应用软件门槛越低,用的人越多,背后少的 top 就 越猛。 腾讯谷歌帮你把 a 做 app 这件事情,从专业技能变成普通需求,就跟当年抖音教你拍视频、剪视频是一个逻辑。 在我看来,以后别专门去学安卓开发了,直接去学怎么提好需求工具已经替你做了百分之九十的事,剩下的百分之十是你要什么说什么说清楚。 算力服务商的春天还在继续,每一个被降价的门槛,都是偷啃小号的新入口。

今天是二零二六年的五月二十号啊,在这个特殊的日子里面呢,也迎来了我这个视频日记的第二十期啊。今天呢,本来是准备了其他的方面的内容,但是呢,看了这个谷歌的二零二六开发者大会过以后, 呃,我也决定临时的去把这个内容给更改了。那谷歌这次所发布的其他方面的东西就不想多说了,但我对其中的一块特别感兴趣。 那么呢,也就是这一次谷歌全新发布的它的叫多模态的大模型 gemini omni。 那 首先呢, omni 这个词的意思呢,是你可以把它理解为叫全能啊,它也就是谷歌迄今为止发布的最强最先进的这个模型。 呃,它实际上是有几个意义的啊,就是它也代表着这个 ai 的 技术,能从能看能听的这种半多模态, 然后演变成真真正正的多模态啊,也就是说什么呢,所谓的这个多模态的一个输入, 也就是说他能进行任意的输入和任意的输出,那么我理解呢,就是这一块,就是预示着相当于这个行业呃,会在以下几个维度会带来一些局面。第一个呢,你可把它理解为叫范式的改变。 第一个呢,以前只是能用文字来回答一切,那么现在你可以把它理解为叫可以生成一切啊,过去的一个多肽的一个大模型,基本都是你可以把它理解为叫半半双向 啊,你可以输入图片视频,他以文字回答你,那本质上这也是一个单单模态的一个输出。但现在这个 jimmy 的 欧米娜也实现了这个输入和输出的双向的全多肽啊,你可以输入文字、音频、图片或视频 啊,他不仅能用文字来回答他,还能输出高质量的这种视频,音频啊,还有图像等等这样的一些。还有一块呢,他是叫视频领域的终极能力,他可以用人话来微调这样的一个视频, 我理解这个应该就是一个叫杀手级的功能,它相当于你可以连续的对视频提出修改的要求,就好像你指挥真人导演一样啊,你丢给那个 jamaican omni 的 这样的一段视频,你跟他说改变环境, 换个镜头角度,改变角色动作啊,或者是切换风格等等,你可以像指挥导演一样去要求他 啊,这个是相当厉害的一个事情。然后第三个呢,就是在场景一致性和物理逻辑上的一个突破。嗯?这个为什么这么重要? 因为之前的这些大模型能理解这种物理世界的逻辑的不多,但现在呢,你可以把它理解。第一个就是说他目前的场景一致性做的相当的好。而过去的 ai 智能视频,他有一个痛点,就是你转换镜头的时候, 他的角色也会发生一些形变啊,但这个奥尼尔在这个多伦的一个复杂的对话的过程,能保持角色的一致性,以及物理逻辑和场景的连续性,这非常不可思议啊。 第二个呢,就是你可以把它理解为他迈向了现实世界的一个模型,他生成的不仅仅是这样的一个像素点, 他能在理解物理世界的逻辑的基础上来生成相应的视频,他不仅仅是拼凑图像那样是看起来好像是真实的, 他现在生成的是什么呢?他是理解了物理世界真实的运转规律而生成的这样的一个内容。还有一块就是针对叫视觉的理解和交互啊,你看可以看他的官方的演示视频,里面有一个那个半珠穿行于管道的这样的一个视觉的一个案例, 你可以看出来他对这种语境的理解能力是相当的强了,他对于啊那个重力的变化,针对于动能,针对于流体这种物理效果的精准的一个识别, 它甚至呢还能实绘出手绘的这种鱼,并让动画根据轨迹,根据水流去进行流动,这种实施动画的效果呢也是极其震撼的。最后呢,把谷歌官方的这段视频放在最后,大家看了以后如果感觉到震撼,那么就去试着去用一下吧。好,明天见, uh huh。

谷歌刚刚在 i o 大 会上发布了关于 spark, 所有人都在说这是 ai 的 又一次进化,但是真正发生的事情可能要比进化恐怖的多得多。 先来看 spark 到底是干什么的,它号称是全新的个人 ai 智能机,它可以自主实现帮你订机票、订酒店、回复邮件、更改文档等等这一系列的操作重点,它不像扣代斯基一样帮你操作软件,而是全程不会打开任何的界面,这是最恐怖的事情。你能管这个东西叫做进化吗? 绝对不是,这是杀死软件的开始。在过去的四十年,所有的软件都绑着一根绳子,那就是你的注意力,你打开页面他才会动,你不在的时候,那软件就是死的。 但 spock 直接剪断了这根绳子,绕过的用户曾直接调用了底层的 api 和数据,那么你精心设计的界面按钮和交互流程全然都不在了,这也就意味着作为用户的这个角色正在更换。那么一个没有用户的软件还能够叫做软件吗?