00:00 / 00:54
连播
清屏
智能
倍速
点赞11
00:00 / 01:01
连播
清屏
智能
倍速
点赞29
Google Omni Flash 广告能力测试 ⌚️我用一只「北极星齿轮手表」做了一轮多视频模型能力测试。 这次不是简单看“谁的画面更炫”,而是用一个极其复杂的产品对象,去压测不同视频模型的真实能力: ✦ 黑钛金属表壳的高光反射 ✦ 镂空机械齿轮的结构稳定性 ✦ 陀飞轮与指针运动的连续性 ✦ 星空表盘、北斗星图、蓝色夜光的细节还原 ✦ 镜头推进中,产品形态是否跨帧崩坏 ✦ 广告级质感、物理真实感与视觉高级感 这类机械腕表其实是非常适合测试 AI 视频模型的对象。 因为它不像人物测试只看脸,也不像风景测试只看氛围。 它同时要求模型理解:机械结构、金属材质、微距细节、空间光影、品牌气质、镜头语言和跨帧一致性。 这次我重点对比了几个方向: Google Omni Flash,看它对复杂多模态对象和视频编辑逻辑的理解能力; 可灵 O3,看它在多镜头、主体一致性和结构保持上的稳定度; Grok,看它的速度、指令响应和广告动势; Seedance 2.0,看它的物理运动、镜头调度和电影感; 快乐小马,看它在产品广告、材质表现和高端商业质感上的表现。 同一只表,不同模型跑出来的结果完全不一样。 有的模型更会“拍广告”,有的更会“做运动”,有的更会“保结构”,有的更会“造氛围”。 真正有意思的地方,不是判断谁赢谁输,而是看每个模型在复杂产品视频里的能力边界。 这只「北极星齿轮手表」,就像一块小型的 AI 视频压力测试板。 齿轮转起来的那一刻,模型的稳定性、理解力和美学能力,全都藏不住了。 #AIGC #AI视频 #视频模型测试 #GoogleOmniFlash #可灵O3 #Grok #Seedance2 #快乐小马 #机械腕表 #北极星齿轮手表 #FlowMuse
00:00 / 02:07
连播
清屏
智能
倍速
点赞13
00:00 / 00:54
连播
清屏
智能
倍速
点赞559
00:00 / 00:10
连播
清屏
智能
倍速
点赞4
谷歌发布全新视频模型Gemini Omni,视频编辑迎来质变 Gemini Omni 可以说是这次 Google I/O 大会上最亮眼的产品。这款由 Google DeepMind 团队推出的全新多模态视频生成和编辑模型,可以说是视频领域的 “Nano Banana”。和之前的 Veo 相比,Omni 最大的突破在于它是一个从底层架构重新设计的全模态模型,支持把图像、视频和音频素材混合输入,通过非常简单的日常语言(Prompt)就能完成复杂的视频编辑。 模型最让人惊艳的地方,是它的可控性和对时间维度的感知力。比如你可以让画面里演奏的小提琴凭空消失,或者直接改变摄像机的拍摄视角,而背景和人物动作依然保持完全一致。甚至你只需要提供自己几张不同角度的照片和一段语音,就能一键生成声音和表情都高度还原的个人虚拟分身。 更有意思的是,Omni 还展现出了一些没有经过专门训练的涌现能力,比如自动让视频画面配合音乐节奏进行同步,或者根据上一段视频的剧情逻辑,直接续写并生成下一个场景。 安全方面,DeepMind 也考虑得很周全。所有生成的视频都会默认嵌入 SynthID 隐形水印,并且支持 C2PA 元数据标准,用户可以直接在 Gemini 应用里上传视频来检测它到底是不是 AI 生成的。目前普通用户已经可以在 Gemini 应用中体验到这些功能,专业创作者则可以通过 Flow 工具进行更深度、多轮的创作。 #AI视频生成 #谷歌 #gemini
00:00 / 44:10
连播
清屏
智能
倍速
点赞9
00:00 / 04:10
连播
清屏
智能
倍速
点赞27
00:00 / 01:43
连播
清屏
智能
倍速
点赞16