粉丝93.7万获赞2040.2万

笔画完全跟随动作,写出来的公式也完全正确。谷歌全新 ai 视频引擎金布莱奥米首爆视频版香蕉来了!谷歌这次是瞄准了 siri 下架窗口搬上来的新品。 那么面对一代视频强者,七代是二点零,又有怎样的表现呢?两分钟带你了解这个即将上线的全新 ai。 首先,奥米到底是什么模型?在哪用? 目前它正处于大规模推送或内测阶段。如果你是 g m 两高级定员用户,可能会看到推荐使用选项,这是别向大众发布,应该在五月的谷歌 i o 大 会后就能看到了。为什么要叫它视频版香蕉?因为它继承了当年 nano banana 那 种即插即用,极度精准理解人话的特质。以前出片结果还是抽盲盒,全看概率。 在奥尼,标志着 ai 视频进入了逻辑生产时代,他不再是单纯的在模拟像素,而是在模拟这个世界的运行逻辑。大家最近可能在网上刷到了谷歌爆出的几个演示视频,教授在黑板上写公式和吃意面喝奶油汤。这一段视频展示了奥尼最核心的两个能力,极致的致富精准度和动作逻辑。跟随兄弟们,你们细品 视频里那个老教授在黑板上飞速书写粉笔碎屑、手部关节的自然扭动,甚至写字时的力度感都极其真实。但最让我感到头皮发麻的是,那个公式本身,它是完全正确的。 这种逻辑一致性目前在整个 ai 视频圈是非常领先的。它证明了奥秘不只是在画画,他真的看懂了这段公式。所以,如果你问我,他能带来什么表现?他能让 ai 教学课件复杂的科技演示,精准的产品说明视频从不可能变成一键生成, 但是它并非完美。当设计那种超大幅度极高爆发力的物理动作时,它的表现力确实没有另外两家对手那么激进。 或许你想知道它和苏拉二现在是二点零上比到底谁更强?首先是 opalion 的 苏拉二,它的强项在于它的物理引擎画面冲击力依然是很强悍的,但现在关闭了使用,无论是网页应用还是 a p i 都没法调用了。 然后字节的吸氮是二点零。他最强的地方在于他的饮用系统和角色一致性。你给他一张照片,他能保证在深层的视频里人脸几乎不崩,这对于短视频博主和短剧团队来说是非常棒的。在动作的表现上来说,我们也有目共睹,虽然还没有正式发布调用价格,但目前测试段效果非常恐怖。 正式价格让我们拭目以待吧。以前我们或许觉得 ai 视频就是图个娱乐,但 jamie 阿莫里告诉我们, ai 已经可以处理极其严肃的内容了。虽然他在动作爆发力上还有提升空间,但这种极致的准确性,这是目前专业创作者最缺的东西。那么问题来了,面对这个不仅会拍片,还会算微积分的视频相交,你会用它来做什么呢?

兄弟们,沉寂已久的谷歌终于来炸街了,就在刚刚结束的谷歌 i o 大 会上,发布了天花乱坠的各种 ai 产品,但真正重点就两个,一个是独一档的多模态能力和超强的 ag 能力。 先来看个最狠的,谷歌发布了全新的世界模型 jimmy nike omni。 你 可以将任何形态的文件作为输入,比如文字、视频、图片、音频一起发给他。 jimmy nike omni 能以任何你要求的形式输出给你, 从此 p 视频就像 p 图一样简单。但如果说 omni 是 无敌的感官,那么同时发布的 jimmy nike 三点五 flash 就是 专为代码和 ag 的 优化的, 它的输出速度达到了同类前沿模型的四倍,每秒狂飙一千五百个 token。 谷歌在现场用全新的 ai 开发平台 anti gravity 二点零展示了它有多逆天。 杰米奈三点五 flash 仅仅持续工作了十二个小时,就从零首写出了一个完整的操作系统内核。它在开发时,后台自动派生出了九十三个 ai 子代理,总 token 成本低于一千美元。而同类型的任务如果交给人类团队,至少需要数月的时间。 更硬核的是这个首出的操作系统,既然能直接加载毁灭战士 doom, 现场就玩起来了。 随后谷歌顺势推出了 gemini spark, 你 可以理解,它是谷歌为你远程部署了一台七乘二十四小时,搭载了 gemini 全套能力的服务器。它能跨越应用,直接打通各种第三方软件。你只要给他一个目标,他自己就能拆解,步骤全自动帮你搞定。 比如自动检查信用卡账单里的隐藏订阅费,把货一记录整理成文档,然后群发等等。最后还有压轴亮相的谷歌智能眼镜,戴上它, jimmy 奶就变成了你现实世界里的专属管家。路过咖啡店,眼镜自动识别,你只要动动嘴, ai 就 把咖啡给你点, 还能实时 ai 导航和同城传译。从这次 ai 大 会上看得出,谷歌正在疯狂地将 ai 模型的能力产品化,毕竟用户真正需要的是能解决问题的产品,而不是 ai 模型本身。第二呢,谷歌之前明显在多模态发力过猛,在 ag 能力方面有点落后于 antropics 和 open ai, 现在眼看 ag 大 爆发,所以他就奋起直追。但即便是刚刚发布的 gmi 三点五 flash, 也依然和这两个头部公司的模型有差距。那么 gmi 三点五 pro 会不会惊艳全场呢?大家可以期待一下。好了,我是阿朱,关注我,让我们一起在 ai 潮头冲浪!

google 在 二零二六 i o 大 会彻底放飞了,把 gemini 塞到谷歌所有产品里, chrome 浏览器、安卓系统、 workspace、 视频模型、 a 镜工具等等,几乎所有核心产品都开始围绕 gemini 重构, 内容太多,茶馆挑了几个普通人也能用上的工具。首先是 gemini, 三点五 flash 精准测试中来看,提升不是很明显,重点在于响应快和便宜。缺点也很明显,用在编程上代码质量会差一点。 其次是 jamaniami, 视频模型,可以根据你给的任何提示生成视频,无论是图像文本还是视频,甚至是音频也可以生成,质量相比 cds 二来说还是差一点,因为 jamaniami 侧重于多模态,更像是一个视频版的 nano banana。 最后就是 google pix, 应用,一个类似于 canvas 的 工具,基于 jamani 辅助图像的设计和编辑,可操作性更高,比 google stitch 更灵活。 当然, google stitch 也升级了, ui 设计和生成,质量更高,审美更好。这次谷歌的 i o 发布会看点实在是太多了,你们觉得哪个产品或者技术才是最亮的?点关注茶官, ai 学习不迷路!

今天谷哥说了,我要用 ai 接管你的手机了,我第一反应不是激动,是想笑。半年前,国内有人干过一件一模一样的事,结局你猜怎么着?被微信和支付宝联手给干死了? 去年十二月,志杰和东兴搞了一个豆包手机,三千四百九十九,号称帮你一键下单,帮你操作手机点外卖,发微信 首发三万台,二十四小时就抢光了,闲人上人甚至炒到三万六一台。要不第二天微信封杀,跟着支付宝封杀美团,封淘宝,封高德封 招行,他也封,二十多个主流 app 排着队的把豆包手机给挤出去了,有的直接弹窗警告环境异常,根本,有的就不让登录, 然后七十二小时一台三万六的手机,三千七都没人要,就因为一个问题大成,不给你权限就是个废物,为什么封啥?说白了说透就一个字,你想啊信靠啥赚钱?你点进微信刷朋友圈刷视频,还碰见广告,点一个进去, 支付宝也一样,刷刷刷的,看见什么理财产品点进去他都有广告,他赚钱。所有的 app 都是这么个逻辑,你在里面多停留一会,就他就有多赚一分钱的可能性。 结果豆包手机说,我让 app 直接操作,手机替你操作,你连看都不用看一眼,那 app 怎么赚钱?你动了别人饭碗,别人不干你干谁? 那是技术问题,这是利益问题。回到今天,谷歌处境一模一样,今天谷歌说,杰米奈帮你操作手机,填表格,订机票 单,问一句,微信会答应吗?支付宝会配合吗?抖音会配合吗?豆包手机都把答案贴你脸上了。字节跳动,国内互联网巨头搞个 ai 手机都被封的渣都不剩,谷歌在中国甚至连搜索引擎都打不开,你觉得支付宝微信能给他开绿灯? 别说中国,就在海外, facebook instagram 这些 app 凭什么把自己的流量入口让给谷歌的 ai? 说白了你就看明白了吧, ai 手机这个概念不是技术做不到,是利益格局,它就不允许谁掌握 app 谁就有一一票否决权。谷歌也好,苹果也好,字节也好,想挑个 app 直接操作用户的手机,先问问微信答应不答应。 所以今天这个新闻就当八卦看看就得了。 ai 手机真正能用上内天,不是技术突破的那一天,是各大厂商达成利益分配协议的那一天, 那可能要等很久,甚至不可能。所以现在冲着新闻去买单,跟半年前花三万六买豆包手机的就是同一批人关注我。不吹不黑,有事说事。

你以为 ai 还在陪你打字聊天?错!就在今天凌晨,谷歌 i o 开发者大会直接炸场!全新 gemini 三点五 flash 加上 omni 全能 ai 正式发布! 谷歌直接把 ai 焊死在手机系统最底层,不用唤醒,不用点开 app, ai 主动上手替你干活,手机彻底变成 ai 机器人,整个科技行业被谷歌硬生生掀了桌子。先问大家一个问题, 你现在用手机是不是越来越累?想发个朋友圈,修图半小时,想写个工作汇报打字一小时, 想找个快递定个外卖,来回切换七八个 app, 出门忘带充电器,忘记日程,忘回消息,手忙脚乱,像个手机奴隶。更扎心的是, 以前 ai 是 你问我答你不找他,他永远不动。现在呢?美国 ai 贵到离谱,国内 ai 功能零散, 普通人想省心根本没选项。但今天,一切都变了,谷歌直接把 ai 管家塞进手机, 不用你动手, ai 主动帮你搞定所有事。今天,咱们不用复杂术语,不讲会设代码,用最简单的大白话,把谷歌这两款颠覆性 ai 给大家讲明白。 首先是这款 jamberry 三点五 flash, 我 们可以做个简单的数据对比,它的计算速度是限阶段顶尖大模型 gpt 五点五的四倍,这个速度到底有多快? 它的计算速度相当于子弹的四十倍,你眨一下眼睛的瞬间,它就能完成上千字文案创作,十几张图片处理。最恐怖的不是速度,是它的成本。 很多人觉得高端 ai 研发昂贵,普通人消费不起。但是这款模型把 ai 成本直接打到地板,他的调用成本仅仅是美国同类高端模型的二十分之一。 简单来说,一杯普通奶茶的价格,就可以让他为你完成一百万次 ai 计算。而他的能耗则更是低到离谱,一次普通查询消耗的电量仅仅相当于微波炉工作一秒钟。 以前的高端 ai 是 有钱人专属的科技奢侈品,而现在的 gemini 三点五 flex, 是 人人都能用、便宜又好用的平民核弹。 如果说三点五 flex 是 速度之王,那 gemini omni 就是 真正意义上的全能大脑。 他实现了史无前例的全模态融合,文字、图片、音频、视频代码,没有他看不懂做不了的事情,一句话生成短视频,一键修改专业图片,随口指定编辑程序代码,零基础普通人也能一秒变身行业大神。 而且谷歌这次野心极大,他把欧米尼深度绑定在搜索浏览器、安卓系统、智能眼镜等全生态产品里,全球月活跃用户直接突破九亿。 这也就意味着,谷歌不再把 ai 做成一款单独软件,而是直接嵌入电子设备底层。过去,我们的手机是一个个相互独立的 app, 误导我们手动切换、手动操作。 而现在, ai 站在最顶层,统一接管手机所有权限,自动整理信息自动分析数据自动处理日常耍事不用你点开软件,不用你语音唤醒,你的手机正在悄悄看懂你,服务你。 谷歌这一次更新,根本不是简单的版本迭代,这是赤裸裸的行业降维打击,一场没有硝烟的科技洗牌正在上演。 我们先做一个最简单的过去与现在的对比。放在几年前,人工智能只是手机里一个可有可无的附加功能,聊天、翻译、生成文案仅此而已。 而现在,人工智能彻底架空所有应用软件,直接掌控系统底层,从被动回答变成主动预判你的需求。以前是人适应手机,现在是 ai 适应人类。放眼全球科技巨头,这场竞争的差距更是被无限拉大。 谷歌豪掷一千九百亿美元押注 ai 赛道,不惜亏本压低模型成本,用低价加全生态的模式疯狂抢占全球市场。 反观苹果,至今没有拿出成熟的智能大模型, siri 智能助手严重落后,被谷歌按在地上摩擦。最惨的还要数市面上成千上万的中小型应用软件, 修图笔记、办公工具类 app, 它们的功能正在被 ai 一 点点吞食。不需要单独下载,不需要付费开通会员, ai 一 键就能全部搞定。未来,百分之九十的小众工具 app 都会被时代彻底淘汰。 如果我们把目光放回 ai 本身,你会发现一场更残酷的强弱对比正在发生。 美国高端 ai 性能强悍,但是价格昂贵,普通用户想要开通完整服务,每月成本高达两百美元,绝大多数企业和个人根本承担不起。 长久以来,国外资本一直靠着高昂的技术垄断费用收割全球用户,我们普通人只能使用阉割版、低配版 ai。 但谁都没有想到,短短一年时间,中国 ai 实现惊天反转,悄悄完成弯道操车。 目前全球大模型排行榜上,中国 deepsea 个 v 四跃至暗面, kimi 二点六稳稳稳居全球潜力,综合性能对标美国顶尖模型,但是调用成本只有美国同类产品的十分之一。如果说美国 ai 是 造价昂贵的高精尖武器, 那中国 ai 就是 性价比拉满的廉价核弹。而且国产大模型更懂中文语境,更贴合国人生活习惯,方言识别、本土文案、生活化服务,这些都是国外 ai 永远无法复刻的优势。 很多人看完谷歌发布会,都在感叹美国科技太强,担心我们追不上。但我想说的是,谷歌的危机恰恰就是中国的机会。 谷歌虽然底层技术强悍,但是他有一个无法规避的致命断脉,水土不服。 他不懂中国市场,不懂国人习惯,更没有办法融入我们的本土生态。而如今,国产鸿蒙系统装机量已经突破六千万,微信八百人,专业团队全力适配鸿蒙生态。 国产系统搭配国产 ai, 形成了一套完全自主可控、私密安全的本土闭环。我们不需要盲目崇拜国外科技,也不用过度焦虑行业差距,美国 ai 在 实验室里秀肌肉、拼参数、搞垄断, 而中国 ai 扎根生活,落地产业,解决普通人的真实问题。我们在成本上碾压,在场景上适配,在生态上突围。看似美国遥遥领先, 其实胜利的天平正在悄悄向我们倾斜。今天这场谷歌发布会,给全世界敲响了警钟。 ai 时代,不进则退,慢进则亡。我们必须承认,美国在人工智能、底层架构、算法研发上依旧有着深厚的积累。但是我们更要清楚,科技竞争从来不是一场一次性的赛跑,而是一场漫长且持久的博弈。 从曾经高价进口处处被卡脖子,到如今自主研发成本碾压全球, 从被动跟随到并行突破,中国 ai 正在一步一个脚印打破国外垄断。 未来的人工智能不会是美国一家独大,未来的智能设备也不会全部受控于谷歌。科技没有温度,但是人类有选择,有人在领跑行业,垄断市场,而中国始终脚踏实地,用普惠科技俘虏普通人。 在这场看不见硝烟的 ai 大 战里,没有永远的强者,只有不停奔跑的追赶者。你觉得未来国产 ai 能不能彻底超越谷歌?你现在最想用 ai 帮你做什么事?评论区留下你的观点点赞、收藏,带你看懂最新科技风口,见证中国 ai 的 崛起之路!

谷歌直接甩出王炸,联合三星尖头 monster 和 warby parker 打造的全新 ai 音频眼镜,预计今年秋季上市。没有显示屏,全靠 jamaica ai 语音播报信息,听音乐、拍照通话。调用手机应用,无需套手机,不用低头看屏。 google io 现场演示具体场景用法。烹任时语音获取詹姆尼 i 实时建议、步行导航,自动添加顺路咖啡店停靠点语音完成外卖点单全流程,以及朗读被静音的群消息,并自动将日程添加到日历。想拍照更简单,支持语音指令触发, 还能自动添加卡通话效果。照片预览会同步显示在连接的智能手表上,不仅能实时翻译, 翻译的同时还能尽量还原说话者的原声语气,就连视线里的菜单、路牌文字都能直接翻译给你听。而这一切的背后,是谷歌和三星联合打造的全新 android x r 平台,针对高空枭龙芯片优化,把 jammy 大 模型直接塞进了这副小眼镜里。 此外,这款眼镜同时支持安卓和 warby parker 负责外观设计,三星负责硬件制造, 谷歌提供 ai 大 模型和应用。声叹,十年前第一戴谷歌眼镜以失败告终。十年后,谷歌带着 ai 卷土重来,那么这一次,你觉得它能成功吗?评论区聊聊。

家人们,谷歌最近更新了新的视频模型 gemini omni 已经上线,今天给大家介绍下更新的新功能。第一个可以创建角色附用,也就是我们所说的角色库, 方便拿来做长视频和保持人物一致。新增了 flow 内置的智能体,可以直接完成脚本和分镜图的生成。我随便测试了一个香水的带货视频,生成出来的效果也是不错,最新的 omni 模型也是可以做出这种分镜效果了。 可以预见后面 tk 的 视频类型会变得越来越多,后续也会给大家持续分享不同的玩法。第三个,你可以直接在 flow 打造属于你自己的工具,包括调整图片角度、图片编辑等等, 利好大家创作。第四个可以上传你自己本人的照片和声音,生成你自己的 ai 视频。第五个呢,就是 flow app 在 android 的 移动端推出,可以在手机上创作视频了,大家赶快都去试起来吧!

google i o 发布会上, gmi omni flash 已进入 gmi app。 google flow 和 youtube shorts omni 机器文字、图片、视频和音频混合输入。 omni flash 已上线 omni ipi 一 级,未来急救开放, omni pro 会在其后公布更多信息。 search 和 chrome 加入内容屏障验证,用户可以通过圈线搜索或在 chrome 中右键询问内容是否由 ai 生成。 系统会显示内容来自 ai 相机,还是曾被星球系 ai 工具编辑? daily breeze 面向美国 google ai plus pro 和 ultra 订阅用户推出 google maps, 加入 ask maps 发布会。例子中,孩子掉进鸭塘婚礼三十分钟后开始,用户需要知道哪里可以步行买到新裙子。 dogs 获得语音创建能力,用户可以直接说出想法, 让 jimmy 从 drive 调取简历,从 gmail 找到活动信息,再生成 google docs 草稿。 google pics 面向海报信息图、宣传图。 stitch 可以 生成网站或应用界面,并导出代码。 google flow 接入细频编辑。 flow music 可以 生成音乐 demo。 android x 二,眼镜分为显细眼镜和音频眼镜,首批音频眼镜将在今年秋季推出。 google 还揭晓了 code mind 二,用于自动寻找和修复关键软件漏洞。

今天凌晨,谷歌 i o 二零二六如期而至,随即宣布 gemini omni、 gemini three point five、 flash 等等一系列新产品。 这是什么?硅谷年夜饭?算粒满汉全席。媒体老师也非常懂事,标题直接起飞,谷歌亲手淘汰谷歌 视频版 nano banana, 全能 ai 创作引擎,全场最大的 c 位,毫无悬念给了 gemini omni。 这玩意号称是真正的全能大模型,能吃进任何形式的输入,拉出任何形式的内容。文本、图片、音频、视频,只要你敢喂,他就敢接, 而且首发支持视频输出,江湖人称视频版 nano banana。 你 看这个排面,劈柴哥和哈萨比斯同台登场,大招跟不要钱一样往外扔。他们说 omni 不是 在简单拼接素材, 他是在理解物理世界。以前的 ai 画个物理现象,重力和动能常常让牛顿想从苹果树下爬起来打人。但阿米不一样,哈萨比斯说他实现了阶跃变化, 氨基酸折叠都能给你干成科学准确的定格动画。甚至你拿个手机自拍,手心里画个圈,他就能立刻给你生成一个黑洞。看起来这不仅仅是降维打击,这简直是从四维空间扔了二象薄, 画面太美,数据太狂,狂到让人觉得好莱坞明天就得集体去送外卖。但这还不够刺激,发布会的另一个高潮是 jammer 三点五 flash。 只要你懂点行,你就知道现在的大模型卷速度卷到了什么地步。 三点五 flash 在 精准测试里,把自家前代旗舰 jammer 三点一 pro 按在地上疯狂摩擦,更离谱的是,它的输出速度直接翻倍,对比 gpt 五点五和 opus 四点七,速度快了四倍有余。这什么概念? 你这边的提示词刚敲完回车,他那边的答案已经糊你脸上了。天下武功,唯快不破, ai 界直接来了个闪电侠。 这还没完,谷歌还顺手倒出了一箩筐的重磅炸弹。 anti gravity 二点零桌面应用直接进化成 agent 的 开发平台。 james park, 七乘二十四小时在线的赛博打工仔。不需要五险一金,不需要情绪价值,只要服务器不断电,它就能给你打工到宇宙热季。 顺带把 jimmy 也改版了,代号 neuralexpressive, 改成算力计费。你以为他在做慈善,其实他在教你什么叫资本的洋谋。 甚至连搞了二十五年的谷歌搜索都迎来了史诗级升级。接入三点五 flash 智能搜索框,自动生成小程序。这一套组合拳打下来,干货密度堪称历年之最。大场发力,寸草不生。 那你说这东西真的这么神吗?往往打榜数据越炸裂,发布会的 ppt 越精美,里面的水分往往就越能养活一太平洋的鱼。 我怀着激动颤抖的心,拿着号称能改变世界的 omni 进行了实测。这需求可太真实了。毕竟咱们干自媒体的,天天盯着各种 ai 视频工具找灵感,就指望他们能帮着出大片,但结果给我看笑了。哎, 硅谷的公关稿还是太保守了。这哪里是改变世界,这简直是重新定义了拉胯。宣传片里是好莱坞质感,随手一划就能变黑洞。小提琴手在雪山和赛博朋克之间无缝切换。物理逻辑严丝合缝。 到了我这呢,我输入几段简单的指令,生成出来的视频,当场给我整出了工伤。说好的理解世界呢?服务员你好, 我想要一杯客了!好的,没问题!这一刻,我都怕他给我念出一段大悲咒来超度我的显卡。那些在发布会上惊艳全场的连贯性记忆力和物理法则,在实测面前碎的渣都不剩。 这不叫接月变化,这叫当场火化。网上的各路媒体还在疯狂吹捧热搜,通稿满天飞,但和实际效果一比,简直是截然不同的两个平行宇宙,那还能说啥了?看完这场魔幻的体验,我算是彻底清醒了。 现在的 ai 圈有一种极其不健康的畸形风气,只要打榜厉害,只要 ppt 做的炫,就能吹成天神下凡。 巨头们在台上拿着特供版的 demo 疯狂秀肌肉,底下的信徒们跟着无脑狂欢。 ai 好 不好用?只有我们这些一个个坐在电脑前疯狂敲着键盘,试图用它来铲除实际价值的用户给出的真实反馈才算数, 你数据再炸裂到了用户手里,变成了一坨赛博垃圾,那他就是毫无价值!请这些 ai 公司收起你们的滤镜吧!面对用户的实测反馈,少吹点牛,多打磨点细节,这才是对技术真正的尊重。这里是起点世界,聚焦最新 ai 资讯,我们下期视频不见不散!

兄弟们,别再苦苦守着 cden 四二零排队了。当所有人还在等挤牙膏的时候,谷歌刚刚悄悄把一个真正的王炸级视频大模型直接塞进了你的手机里。 他叫寂寞乃奥姆尼。这根本不是什么普通的纹身视频工具。这是一场对短视频、影视甚至广告外包行业的物理级抹杀。大家好, 我是进化中的阿晨。这期硬核拆解,我们直接榨干这八分钟的外网实测。看完他的三张底牌,你就会明白传统的影视护城河是怎么在一夜之间崩塌的。第一张底牌是从找素材变成主演一切 以前的人工智能视频,你只能生成一些虚无缥缈的假人,但奥姆尼的核心玩法是本色出演。你只需要对着手机读几个数字,转转头,它就能完美一比一复刻你的场景里。 for both images and videos, but the real stand out here are the videos if you select this, there are all these pre defined templates that you can use and some of these are pretty awesome, i've been playing around with them, so here's one example, i just selected this template called metallic and then used my avatar, didn't give it any other prompt, and this is what it came up with what is this? 看懂这个压迫感了吗?这不是五毛钱的绿木扣像,这是人工智能在底层把你和光影完美融合,无论是被外星金属吃意大利面,甚至去教量子力学。这意味着什么? 这意味着以后的短视频博主、讲师带货主播连床都不用下。不需要摄像机,不需要打光化妆,你敲几行字, 你的赛博分身就能在全宇宙任何地方替你拍片出镜,出镜成本彻底归零。第二张底牌,告别抽卡盲盒,拿下真正的像素级控制权。玩过人工智能视频的人都知道,人工智能就像个神经病,你想改个衣服颜色,他能把整个画面全给你换了。但奥姆尼彻底打破了这个魔咒。 now, i then asked it to make just one change i asked it to change the vest color to blue and that's it。 在 这段赛博朋克奔跑的视频里,老外只提了一个要求,把背心换成蓝色。奇迹出现了,画面中所有的光影动作背景连一,唯独背心的颜色被精准替换。 这意味着,人工智能视频终于从一个抽卡玩具,变成了真正可以商用的工业级生产工具。第三张底牌,物理世界的一键修改器。如果你以为它只能生成虚拟画面,那你就太天真了。它最恐怖的地方是直接篡改现实。 now another really cool feature about omni is that you can upload a video and ask it to edit the video so here i uploaded this clip of just some footage i took while driving a couple of weeks ago showing the mountains and i sent it to omni and said make it look like there's an active volcano in the video, i gotta say it did a really good job while maintaining the rest of the。 注意看,这是一段极其普通的车载行车记录仪画面。老外只输入了一句,让背景看起来有一座活火山。 奥姆尼直接在完全不破坏原有树木和车速的情况下,硬生生在远方种下了一座喷发的火山。以前做这种级别的特效,你需要专业的后期团队做追踪光影匹配收费至少,但一句提示词,三秒钟,现实世界彻底变成了可以任意拿捏的橡皮泥。 总结一下,寂寞乃奥姆尼到底改变了什么?他把出镜成本、特效成本和修改成本全部达到了无限,趋近于零。当产出视频不再需要机器设备和后期团队时,工具的壁垒就已经被踏平了。以后不再有会不会剪视频的人,只有会不会用人工智能表达想法的数字导演。 当视频产出变得无限且廉价时,最值钱的将不再是技术,而是你的剧本、你的脑洞和你的品味。我是阿晨,别再用肉身死去试着驾驭你的数字分身,咱们一起重构商业。

作为一个马上拥有百万粉丝的 ai 室内设计博主,昨天谷歌的欧米尼一发布,我先帮设计师把天塌了,嘿嘿,开个玩笑,作为备受期待的最新视频模型,欧米尼在设计装修行业到底是亨是拉?今天来一期深度测评。 先说结论,欧米尼不是简单取代 v e o 或者其他的视频模型,它真正改变的是视频生成的玩法。以前用 ai 做视频更像抽卡提示词写了一遍,有 任何一点不满意的只能重来,时间和 token 都在这个过程中浪费掉了。但欧米尼更像一个视频版的设计文件,你可以把图片、视频、音频、文字全部丢给他,然后继续对话修改。真正让我惊喜的有两点, 第一,视频可以局部优化重绘,比如保持空间结构不变,把灯光换成夜店氛围。再比如,镜头别旋转改成从门口推进到吧台,墙面材质替换成微水泥,家具不要动。所以当客户对设计提案任何一点不满意的时候, 不需要再全部重新生图再做视频,只需要一个简单的指令就够了。第二,整套图的风格迁移。以前想模仿别人的案例风格,要么得一张张写,空间一致性还经常出问题, 要么用康复 u i 搭一个看似酷炫,实则对新手极不友好的工作流。而现在欧米尼直接内置了一个工作流,真的很傻瓜很一键。但是欧米尼并不是万能的或者取代别人。如果你问现在最适合设计行业的视频模型是什么,我不会说只用欧米尼效果图方案和漫游渲染 v o。 三点一,还是更稳,想做广告片辅 拿镜头大片改 c 战士。二点零更猛,想低成本批量出素材,可零依然很实用。欧米尼最适合的是什么呢?不是从零到一生成一条炫酷视频,而是视频方案改稿,客户刁难你的各种问题,灯光太冷,材质太硬,镜头太快,不够高级。你说欧米尼改,这对设计行业太关键了。因为我们做方案最痛苦的不是 出第一版,而是客户百般刁难,反复修改,最后还是用第一版。所以欧米尼最亮眼的地方不是画质有多窄,而是它让视频从一次性生成,变成了可持续修改。这意味着未来设计公司做新媒体,不再只是简单的发效果图,而是把案例、脚本、画面、视频修改,全部变成一条 ai 内容生产下课。

欢迎来到 gemini onni 的 世界, gemini onni 和 c n s 二点零到底哪个强?今天我就为大家测试一下。整个 gemini 的 ui 都已经改变了, 我们现在无论是手机端还是网页端都可以选择三点五。 flash 最大的变化还是左边栏。以往这个 gem 我 常用的那几个,我可以按一个图标,它会固定在这里,现在呢,它把它们藏在里面,要点进去才能够用到,希望这个功能能够恢复回来。 接下来进入今天的测试,重点就是这个制作视频 gemini omni, 打开这个页面以后,你会发现好像似曾相识。 这边能够添加参考,这边能够选择它的比例。我打开 check to b t 的 图片生成,你大概就知道什么意思了。这边能够上传参考,这边能够选择比例。下面有一些灵感的案例,你看一下这个 洗面奶 omni 是 不是还蛮像的,但它是视频生成,那我们马上来测试一下。我上传了自己的形象照,随便用一个模板来测试一下。点击这个年代时尚,然后直接什么都不写,按提交,他正在分析,他告诉我这个可能要几分钟的时间,正在生成视频。 ok, 我 们看一下成品,一共十秒, 不太像,就样貌的还原, 有点拉垮。这个测试我自己是不太满意的,那刷到视频生成,就不得不拿他跟 c 点二点零进行对比了。我就拿这段提示词加这三张图,看能不能生成一个媲美这个视频 的成品。那图片呢?我已经上传到 jamalony 这边了,提示时也是一样的,只是它不能 at, 你 看我按 at 它是没有反应的,所以我直接把这个 at 删掉,然后直接生成它,现在正在生成中,我们等待一下。那在它生成过程中,我们先看一下 cns 二点零的成品是怎么样的。 ok, 我 们来看一下成品, 感觉很到位,很高清, 虽然他没有标那些文字出来,但是我觉得他整一个质感呢,跟他的呈现是比刚刚 c 点十二点零更加高级 的。然后从图片还原度上,你其实会看到他是高度的还原的,几乎是一模一样的,所以这个模型还是蛮强的。但是有一点还是可以吐槽的,我们再看一遍, 你来看一下它的运镜,它为什么这个包会自动会转呢?就是实际上我们应该用 这个相机啊,镜头去运镜,去找不同的角度,但是它这个包自动转起来就有点就是脱离现实了。那其他来说,我感觉它整一个场景啊,跟呈现啊,跟还原度都非常的好, 来个稍微复杂的,就是通过这一段提示值这个形象,然后穿这些衣服,再给一个参考视频最后的成品是这样子的,那我在 jamalani omni 这边呢,上传了图片以后,准备要上传视频的时候呢,他说呢, jamalani 也可以参考的,视频时长不可以超过十秒,也就是说我在这边我需要选择一个时长, 那我就拉后面一点吧,就从这里开始就好了,我大概就选这个,看它,呃,效果是怎么样的,选完以后我就按完成。 ok, 那 你现在看到我 模特在这边,衣服在这边,视频在这边,提示时,我也粘贴进来,把这个 app 去掉,那我们直接就这样提交。那他这个还是挺严谨的,因为有人像, 我先按同意,他已经在生成当中了。 ok, 结果来了,无法生成该视频,也就是说涉及到人像跟一些有人像的参考视频,那可能就会违反他们的政策,就无法生成了, 这个也是能够理解的,我们就换其他来试一下。那么换成这个案例啊,就是这两个就是不太像真人,用这一段绿幕的打斗视频 跟这一段运镜,看一下用这个提示词能生成怎样的效果。那我已经上传了两张图片跟两段视频,并且粘贴这个提示词,我直接按提交。不知道这种偏卡通一点的人物形象会不会过审,但是还是有点担心的,因为呢,这边有真人的一个 示范,这个呢是一个运镜,我们静待结果吧。 ok, 我 已经确定了,就是有真人的都无法生成,那我们再换换这个女士背影在晾衣服的,这个应该就可以了。那我已经上传的图片在粘贴提示时直接提交。我们先来看一下 cds 这边的成品是怎么样的, 优雅的女士在晾晒衣服,动作还挺娴熟的。 ok, 我 们看一下鸳鸯这边的版本,晾晒衣服。呃,这个镜头的切换有点声音啊, 也没有背景音乐。呃,基本是做到了,但是就是我感觉这个刚刚那个切到桶那个镜头有点奇怪,其他还好吧。 我现在又想到一个事情,就是我第一个测试不是有人像吗?难道是用无片的人像?可以视频的人像参考是不能的。那我来验证一下我的这个想法, 当我要验证的时候发现呢,我这边已经变成了灰色,也就是说我这个 pro 会员每天只能生成三条视频,我只能等到明天再验证我的想法了。 ok, 过了十二点,我的额度又回来了, 我又重新把今天模特换装的图片上传了,这次呢,就没有传视频,因为我今天的第一个测试是有人像图片,他都成功了,而我后面两次是既有人像又有视频的人像,所以失败了。那我现在就验证一下,只是有 图片人像到底能不能成功?那我已经上传了,并且呢,我后面这句呢,就改了一下,就不是再参考视频了,我试一下成不成功,另外我把比例也变成竖屏的发送,见证奇迹的时候啊,到底 能不能成功呢?他现在正在生成视频当中。 ok, 成功了。也就是说我们上传的素材,如果是图片有人像的没问题,如果是视频带人像的就不让你通过。那我们来看一下成品怎么样?好可爱,这个可能要打码了 啊,它整体效果呢,就是还原了我提 只是说的鱼眼,然后转场。但是呢,衣服呢,好像有一些变化,我们来验证一下。首先我们来看一下第一套衣服啊,他这个豹纹的上衣是差不多,但是他的裤子呢,颜色是有变化的,然后包包也有, 鞋子也是对的,那他第二套的变化就有点太大了,你看他的上衣这边就直接是蕾丝镂空的,然后他原版这边是下半部分才是镂空的,而且他裤子也不太 太像。我们再来看下一套啊,这一套就是只有这个包包挺像的,衣服的颜色啊,裤子的颜色啊,还有他鞋的构造都不太一样,并且他这个项链他也没有戴上,那下一套呢,就是衣服呢,就完全不一样了,因为他这里的一个 勾肩是黑色的,他这边呢就是黄色的,然后字体呢又不一样,包包也不一样,裙子也不一样,鞋子也不一样,就是像,但是不太一样。那我们看一下最后一套啊,就是上衣完全颜色是变了,然后他这边是没有眼镜的, 就佩戴了眼镜。这个包包呢就不太一样,裙子也是不一样,包括他的这个袜子啊,跟鞋啊,也是不一样的。也就是说他这次的换装呢,只是把衣服变成类似的,但并不是真的就换上了这些衣服。那我们来看一下 c 店三点零的这个版本是怎么样的? 还原度很高,这个衣服的颜色不对,这一套就 就这一套呢,也还原度很高,只是这个裤子呢颜色不太对。那其他其实它整体的还原度是比 jimmy 二点零是完胜的。接下来我们来测试一下 p 视频,我先用我的形象照跟一个背景参考图,让它生成一个视频,那等它等一下生成完这个视频以后,我直接让它改背景,看有什么变化。 ok, 已经生成了,我们播放一下, 欢迎来到 gemini omni 的 世界。 omni 的 世界怎么多了一个 omni 的 世界,就是它整体的还原度, ok 的, 人物的还原度,环境的还原度就 ok, 只是说话呢,有一点点的问题。 那接下来呢,我就要测试一下保持前景的人物,跟他说话的内容不变,然后只替换这个背景, ok, 我 告诉他保持人物以及说话的内容不变, 只把背景替换成中国风发送,我们看一下它到底是不是保持前景不变,只变背景, ok, 视频深层呢,它确实把背景替换成中式的风格,我们来播放一下, 欢迎来到 gemini 的 世界, omni 的 世界。哎,怎么第二个 omni 的 世界,它切换了一下背景,但从整体的效果来说,它确实是替换了背景。那前景人物的动作啊, 声音,包括读多的那个 only, 都跟刚刚那个视频是一样的,只是第二个 only 的 时候,他把背景切换了 一下,那这个效果呢,其实我还是满意的,确实可以 p 视频了, ok, 最后我就来评价一下,通过这几轮测试以后,我对捐满了 only 的 感。 首先呢,从整体的测试效果来说,其实他是能玩的,但是呢,我这个 pro 的 会员呢,他每天只有三次,所以也就只能是玩完了。那从生产力来说呢,它的效果其实对比 c 点四二点零呢,还是有一段的差距的。虽然他最后这个视频替换背景的效果还是挺好的,但是国外视频模型的录 还很长,我们国家的 seed 是 二点零还是遥遥领先。 ok, 以上就是今天的所有分享,那你玩过没有呢?把你的感受写在评论区,我们下期再见。

如何把谷歌的 gemini 免费的安装到你的电脑手机上,并且呢,不用联网也可以使用,也不用担心数据泄露,也不用支付会员费用,答案就是安装它们的开源模型 gemma。 那 gemma 又是什么呢?和 gemini 虽然是两个名字,但是它们本质上都是同一个东西。 gemma 是 gemini 的 开源模型,也是 gemini 经过简化之后的模型。这里面要讲一个大模型为什么叫 gemini, gemini 经过简化之后的意思。 二零二三年,谷歌为了应对拆 g p t 带来的生存威胁,谷歌合并了内部两大顶级 ai 实验室, 谷歌 brain 和 deep brain, 那 这个就是谷歌 ai 版图上的双子星。其实在拉丁语里面, gemma 就是 gemini 这颗大宝石切下来的一块儿小明珠。打个最简单的比方,网页上那个无比强大的 gemini, 就 像城市里面的中央供水系统, 水流极其的庞大,但是你必须连上水管,也就是连上互联网,并且用多了,人家是要按流量收你费用的。而 gmail 就是 谷歌免费送给你的一台满级配置的高端净水器, 虽然出水量不如水厂大,但是它完全免费,完全是属于你自己的。在最新发布的 jam 四家族里面,同样支持多模态,也就是它既可以看图,也可以听懂声音,还可以写代码。 点到这里,你肯定会问,谷歌是来做慈善的吗?为什么要把一个模型免费放出来呢?那这样子谁还会去充 jamie 的 会员费呢?这个其实是谷歌一个极其高危的羊毛,想象一下,谷歌现在建了一栋无比豪华的写字楼, 如果他把内部的办公空间完全免费开放,让所有的创业者出创公司全部搬进来,表面上看他亏了租金,但实际上呢?当整个商业生态都用他的标准写代码,他就掌握了 规则制定权。等这些小公司项目做大了,需要更强的算力了,自然就会购买谷歌云服务,或者租用顶楼收费的 vip 会所。 另一方面,谷歌面对试图垄断闭源生态的 openai 和开源大户 meta, 如果不把 jama 拿出来免费送,那整个 ai 时代开发者生态就会被别人拿走。所以免费送模型本质上就是为了抢夺未来十年的技术话语权。 那这个免费开源神器到底适合谁呢?首先,对于做科研、商业分析、金融投资的朋友就特别合适,因为自己手里面有大量未公开的研报和财务数据,根本不敢上传到网上的 ai 里。而像 jam 这样部署在本地电脑的开源模型就是他们最好的选择。 而最新发布 jam 四有四个版本,就像小杯、中杯、大杯、特大杯,那到底选哪个好呢?这条视频就直接告诉你答案,手机就直接选小杯,普通电脑选中杯,高端电脑选大杯, 企业级的就选超大杯。如果你不知道你的电脑是什么型号的,那就选中杯。那如何安装这个开源大模型呢?建议去欧拉玛的官网上下载,注意一定要下载带 it 版本的, 它代表了是能够听懂人话的指令微调版,如果你在安装的过程中出现问题,建议搭配豆包使用。这就是本期的视频啊,关注我,带你了解更多 ai 内容!

小胖啊,谷歌商店能不能下载谷歌相机外版自带的谷歌全家桶有没有?谷歌相机现在都已经二零二六年了,怎么还有人纠结谷歌相机呢? 早期各安卓厂商的软件调教不够好, hdr 算法不够成熟,甚至白平衡都不够稳定。移植于谷歌手机的谷歌相机确实是一种很好的玩法。 当时的手机呢,用上谷歌相机之后,能得到不少的提升,比如对比原厂相机程序,有更少的图模锐化,有更好的 hdr 效果。但近几年呢,手机厂商不仅在卷硬件,而且也在卷软件优化,所以自带的相机其实是更好的选择。 现在谷歌手机虽然软件调教还是独一档,但那也是特定的相机模组,而且自研 soc 才做出来的一个效果。 你说那种第三方移植自行配置的版本,能比各厂商专业工程师还强吗?说白了,你在某安社区和海外论坛找半天的谷歌相机,也只能体验到一些花里胡哨的滤镜和华而不实的相框。哦对,还有各种崩溃 闪退。所以说,兄弟们还在纠结谷歌相机,不如多想想怎么用手机拍照更加好看。自带的相机程序和这些应用,我还更加推荐关注小胖,玩三星不踩坑!

北京时间五月二十日凌晨一点,谷歌一零二零二六开发者大会在美国加州山景城开幕。 与往年相比,今年这场发布会的重点不是某个模型或功能,而是一次系统性转向。一加,谷歌正把 ai 智能体全面塞进所有核心人口,从搜索框到 chrome 浏览器,从 android 的 手机到智能眼镜, 詹姆奈不再只是一个对话助手,而是一个可以持续运行跨应用执行任务的 ai 代理。他能替用户追踪信息、 生成内容、调用工具,甚至直接完成下单和操作流程。在开场演讲中,谷歌 ceo 桑德尔 p 叉一。桑德尔 p 叉 i 表示,过去十二个月是谷歌飞速发展的一年,谷歌每月处理的偷看数量达到三点二千万亿个,同比增长七倍。 gemini 应用月活跃用户数达九亿 ask youtube ai 视频搜索进入对话加跳转片段时代在大会开场后的产品展示中,谷歌首先介绍了 youtube 和办公场景中的 ai 功能。谷歌推出 ask youtube 功能, 该功能将在 youtube 网站中加入聊天机器人式交互界面,用户可以通过自然语言引导系统找到更符合搜索意图的视频片段,并直接跳转至视频中的相关部分。谷歌表示,该功能目前正在测试,并计划于今年夏季在美国更广泛推出。 随后,谷歌展示了 doc's life。 不 同于传统文档编辑工具, doc's life 允许用户直接通过语音与 google docs 对 话,而不必输入具体提示词。现场演示中,一名用户需要为高中职业日准备校友演讲。 gemini 自动提取演讲要点,从 google drive 中获取简历信息,并从 gmail 中调取活动详情,随后帮助用户创建和编辑文档。 从 t p u 八至詹姆莱三点五 flash d 谷歌全面升级 ai 底层与生成能力。在介绍应用层功能后,皮叉 e 转向 ai 基础设施。皮叉 e 表示,谷歌 ai 基础设施支出正在大幅增长,预计今年的支出将达到一千八百亿美元、一千九百亿美元。 谷歌还重点介绍了自研 ai 硬件 tpu 张亮处理单元。谷歌称,最新一代 tpu 八将分为两类,一类面向大规模 ai 训练,另一类用于模型实际服务用户时的快速响应。 随后, deepmail 的 首席执行官德米斯哈萨比斯、丹尼斯哈萨比斯登台,介绍世界模型相关进展,并发布 gemini。 这是一款基于谷歌在世界模型方面积累的新型视频生成模型。 按照谷歌的介绍, gemini omni 可以 基于多种输入生成视频,并支持对话式编辑。用户可以通过自然语言修改角色背景和场景,也可以上传自拍,并将其转换成其他风格或内容。 嗨!萨比斯称,未来 omni 将能够根据任何输入生成任何输出。首款模型 gemini omni f 点 lash 将于今年夏季推出。 围绕 ai 生成内容识别,谷歌还扩展了 sims id 验证功能,用户可以询问一张图片是否由 ai 生成。 p 叉一现场以一张他和另外几个科技巨头 ceo 的 梗图为例,展示该 ai 检测能力。 p 叉一随后发布 gemini 三点五 flash, 它表示该模型比此前 gemini 三点一速度更快,专为更复杂的智能体任务更长工作流和现实世界开发者使用场景构建。 谷歌称, gemini 三点五 flush 生成输出 token 的 速度大约是其他前沿模型的四倍,因此尤其适合 ai agent 和编码工具。 anti gravity 与 gemini spark 智能体从编程走向个人助理模型发布之后,谷歌的软件开发平台 anti gravity t y 负责人瓦伦莫汗 vernon mohang 登台介绍智能体编程平台 anti gravity 二点零,该平台被谷歌定位为面向 a i a 政治时代的编程工具,直接对标 encyclopedia 的 cloak code 和 open l 的 codex。 瓦伦默罕称,谷歌通过 nt gravity 二点零及其代理系统从零开始构建一个操作系统,整个过程所消耗的 token 成本不到一千美元。他还表示, nt gravity 二点零毫不掩饰地以智能体为先。 紧接着, p 叉一发布 gemini spark, 谷歌将其定义为一款全天候运行的个人 ai 助手,基于 gemini 三点五并运行在 google cloud 虚拟机上,用户可以通过 gemini 应用访问 spark。 按照谷歌的说法,即便用户合上笔记本电脑, spark 也可以继续工作, 同时也能在智能手机上运行。谷歌表示, germany spark 未来将与第三方工具集成,相关工具将陆续公布。该功能本周将面向受新人测试人员推出,下周面向美国 good dot g l e l ultra 订阅用户开放。 为了降低成本,谷歌还推出价格更低的 ultra 套餐,起始价为一点零零美元每月。今年夏天, spark 也将在 chrome 浏览器中运行。 谷歌还展示了如何通过 germany spark 来策划街区派对。在演示中, spark 汇总的所有回复追踪了每位参与者携带的物品,自动向尚未回复的邻居发送了后续邮件,并在 google search 中创建了一个实时回复追踪器。 它还生成了一份 j o gogo slides 派对宣传册,其中包含了充气、城堡和社区规则等详细信息,这些信息都来自六 o go drive 中的文件。谷歌还计划发布安卓的 halo, 用于承载其在安卓手机平台上的 ai 智能体。 按照谷歌的设想,安卓的 halo 将成为手机上 ai 智能体运行状态和任务进展的可式化入口。 ai mode 和 ai overview 谷歌用智能体重构搜索随后,谷歌搜索副总裁伊丽莎白李德 l s r e 的 登台,介绍 al mode 和 al overview 相关进展。谷歌推出全新的搜索框,新搜索框不仅具备传统自动补全能力, 还能提供 ai 生成的搜索建议,并支持多模态搜索,允许用户在搜索请求中上传照片和视频。更大的变化是, ai 智能体进入搜索。 谷歌介绍,全新推出的信息智能体可以全天候在后台运行,用于回答极其复杂的问题,例如追踪特定行业的市场动态。用户无需反复手动搜索。智能体可以持续监控网络, 并在相关信息发生变化时更新结果。谷歌计划在今年夏季推出这类智能体,并在之后增加更多专业化代理。谷歌搜索产品副总裁罗比斯坦 robbie stan 介绍, ai mod 还将接入 anti gravity 的 编码能力。 谷歌称,搜索未来可以在交互界面中生成可交互画面,并帮助用户创建迷你应用。例如,当用户想寻找周末适合全家参与的娱乐活动时,搜索可以从零开始,生成一个周末活动计划表。 universalart ai 智能体升级购物体验,能追踪优惠、监控价格在搜索之后,谷歌广告和商务副总裁 vivienne sriennois 登台,展示同样具有智能体元素的购物相关功能。 谷歌宣布了一系列全球合作关系,相关合作将使用开元的通用商业协议,服务也将扩展到美国以外的新地区。 谷歌还发布了 universal cart, 这是一款由 ai 智能体驱动的通用购物车,可在 google 服务中使用,包括搜索和 jimmy 应用,后续还将支持 youtube 和 gmi。 用户在搜索、与 jimmy 聊天、 观看 youtube 或阅读之妙时,都可以把商品加入同一个购物车。谷歌称, universal cart 可以 追踪优惠、监控价格变动,显示价格历史。在商品重新上架时,提醒用户,甚至还能识别兼容性问题。 例如用户组装一台定制电脑时,如果某个部件不兼容,购物车可以进行提示。随后,谷歌介绍 jamal 应用的重大更新。 gemna 应用将采用新的 neural express 设计语言,带来包括交互式图像反馈、生成视频时间线在内的全新体验。 gemna omni 也将接入该应用,支持用户创建和编辑视频。智能体也将加入 gemna 应用。 第一个名为每日简报,可以利用用户的 google 服务信息概览当天行程。高级用户还可以构建自己的智能体工作流。 安卓 x r 智能眼镜,从导航到下单无需掏手机硬件方面,谷歌预告了由 gentle monster w r b parker 与三星合作推出的 android x r 智能眼镜。这款智能眼镜将有两种形态,一种是可以与用户对话的语音眼镜, 另一种是可以将信息投射到用户面前的显示眼镜。 gentle monster 和 warby parker 联名款属于语音眼镜,计划于今年秋季上市,并可与 ios 和安卓的设备配对使用。 现场演示中,谷歌人工智能与眼镜产品负责人 nish 的 body 使用智能眼镜点了一杯咖啡。 gemini 为他导航到一家咖啡馆,打开手机中的 door dash 外卖平台,并准备好他常点的氮气冷萃咖啡订单 用户仍需最终批准下单,但 gemini 已完成打开应用、找到饮品和准备订单等步骤,而手机始终放在口袋里。