00:00 / 00:58
连播
清屏
智能
倍速
点赞74
00:00 / 01:43
连播
清屏
智能
倍速
点赞16
谷歌新视频生成模型omni测评 Google I/O 2026 上,Google 发布了 Gemini Omni。 一句话理解:它不是单纯的视频生成模型,而是把 Gemini 的多模态理解、世界知识、推理能力和视频创作能力结合起来,目标是实现“从任意输入,到任意输出”,第一步先落地在视频生成与编辑上。 这次最值得关注的,不是它能不能“一句话出片”,而是它开始把视频创作变成一条可连续交互的工作流。你可以用文本、图像、视频、音频作为输入,让它生成统一风格的视频;也可以继续用自然语言修改画面、镜头、动作、风格和细节。每一轮指令都会基于前一轮继续推进,而不是重新生成一条孤立视频。 它的另一个重点是“懂世界”。Gemini Omni 不只是让画面看起来真实,而是尝试理解物理规律、历史背景、科学概念和文化语境,让视频更接近有逻辑的表达,而不是单纯的视觉拼贴。比如蛋白质折叠、字母主题、连锁反应轨道这类复杂概念,也可以被转化成 explainer 视频。 产品节奏上,首个模型 Gemini Omni Flash 已开始面向 Google AI Plus / Pro / Ultra 订阅用户,通过 Gemini App 和 Google Flow 推出;YouTube Shorts 和 YouTube Create App 也会逐步开放免费使用,未来几周还会向开发者和企业客户开放 API。 我的判断是:Gemini Omni 的真正意义,不只是 Google 又发布了一个视频模型,而是视频 AI 开始从“生成工具”走向“创作工作流平台”。 未来的视频创作,可能不再是“写一个 prompt,等一条片子”,而是像和一个懂世界、懂画面、懂上下文的创作助理持续协作:先生成,再修改,再补充,再统一风格,最后形成完整内容。 这对内容创作者、视频工具厂商、AI 产品经理和多模态开发者,都值得重点关注。 #谷歌IO发布会 #gemini #谷歌IO2026
00:00 / 00:36
连播
清屏
智能
倍速
点赞52
00:00 / 00:43
连播
清屏
智能
倍速
点赞1
00:00 / 00:54
连播
清屏
智能
倍速
点赞581
00:00 / 01:01
连播
清屏
智能
倍速
点赞30