粉丝4.1万获赞134.0万

谷歌的欧米尼视频生成模型上线了,我们可以在这个 flow 平台上进行体验,同时 flow 平台也上线了很多的视频和图片编辑小工具, 那么本期视频我就给大家测试体验一下欧米尼模型还有这些小工具。首先我进行测试的时候,模型只开放了 fresh 模型, 目前最高能生成七二零 p 十秒的视频,每个视频消耗三十个点数, umi pro 会员一共有一千个 ai 点数,而且我在使用的时候,它的首帧参考功能还没有上线,所以我就简单测试了几个纹身视频的例子, i will send you back to the dark abyss。 好,提示词所要求的东西都有,但是动作,电影质感还有音效都差很多,可以看一下 c 带是二点零的, 而且在 flow 这个平台,我们可以在下面这里输入提示词,直接对视频进行二次编辑。比如我直接输入一条金枪鱼跳上船,我们来看一下效果, i will send you back to the dark abyss。 他 这添加的内容太生硬了,几乎是不可用的。当然有可能他是 fresh 模型的原因。我们再多看几个例子, 这条视频的话,飞机驾驶是还不错,女主的紧张感和节奏也还行,但最后飞机仪表盘反向了,而且多了一个人。下一个我们试一下著名 ip 加想象力 why won't this stupid code work? 暂停一下,这里电脑里表现的内容太棒了,连代码的说尽都像那么回事。 i refuse to do this? 直接切镜头换风格 anymore why won't 他 这条真人路飞生成的其实挺棒的,这是就中间莫名其妙多出来一个动漫风格的镜头,下一个是变形金刚的镜头, 这个表现就太差了,别说跟 c 站十二点零比了,连快乐马都比不过。 下面是一个著名 ip 加动漫风格, anya will defeat all the villains, 这个表现其实还算可以了,介于 first 和 cds 二点零完全体之间, 下一个是香港电影。如果记忆是一个管头,我希望他永远不回国。起 这个案例就表现的很差了,无论是中文音还是镜头都不符合要求。如果记忆是一个罐头,我希望它永远不会过期。来一个九比十六的变身镜头, 那就再来一次, 感觉能比快乐马好上一些,但是这种动作和特效还是 c 大 师您的拿手好, 再试一下科幻镜头, 这个表现太拉胯了,完全没有电影质感,比快乐马都差远。 总结一下就是 omni, 它的表现肯定是不如 cds 二点零的,但它毕竟还是 flash 模型,不知道它有没有正式版,如果有正式版还是未来可期的。它还有一个优点就是足够的便宜,性价比还是很高的,目前生产速度也快,而且目前还 现那些著名的 ip。 今天除了欧莫尼这个更新之外, pro 这个平台还上线了巨多的图像编辑和视频编辑小工具, 我也帮大家测试了一下,总结一下就是很鸡肋,就是看起来很厉害,实际上就是一些常见的开源项目整合而成的图像和视频编辑工具, 比如说编辑文字动画的呀,还有说像什么手绘转图片,从各个仕图和角度去查看原始的图片,这个就是千问的技术吧,我记得还有什么视频跟随音乐动起来,这样的就适合整活。 还有一个是上传三 d 模型,然后再转化为二 d 平面图片, 它的视频小工具还有一个印象比较深刻的是一个抽帧加抠图加重叠的技术, 其他的图像小工具的话,要不然就见太多了,要不然就完全没什么意义。总结一下的话就是 omni 未来可期,图像工具的话作用不大。 那么以上就是 jimmy 在 本次 flow 上的更新的测试结果了,我个人是比较失望的。好,如果本期视频对你有帮助的话,麻烦帮我点个赞。

笔画完全跟随动作,写出来的公式也完全正确。谷歌全新 ai 视频引擎金布莱奥米首爆视频版香蕉来了!谷歌这次是瞄准了 siri 下架窗口搬上来的新品。 那么面对一代视频强者,七代是二点零,又有怎样的表现呢?两分钟带你了解这个即将上线的全新 ai。 首先,奥米到底是什么模型?在哪用? 目前它正处于大规模推送或内测阶段。如果你是 g m 两高级定员用户,可能会看到推荐使用选项,这是别向大众发布,应该在五月的谷歌 i o 大 会后就能看到了。为什么要叫它视频版香蕉?因为它继承了当年 nano banana 那 种即插即用,极度精准理解人话的特质。以前出片结果还是抽盲盒,全看概率。 在奥尼,标志着 ai 视频进入了逻辑生产时代,他不再是单纯的在模拟像素,而是在模拟这个世界的运行逻辑。大家最近可能在网上刷到了谷歌爆出的几个演示视频,教授在黑板上写公式和吃意面喝奶油汤。这一段视频展示了奥尼最核心的两个能力,极致的致富精准度和动作逻辑。跟随兄弟们,你们细品 视频里那个老教授在黑板上飞速书写粉笔碎屑、手部关节的自然扭动,甚至写字时的力度感都极其真实。但最让我感到头皮发麻的是,那个公式本身,它是完全正确的。 这种逻辑一致性目前在整个 ai 视频圈是非常领先的。它证明了奥秘不只是在画画,他真的看懂了这段公式。所以,如果你问我,他能带来什么表现?他能让 ai 教学课件复杂的科技演示,精准的产品说明视频从不可能变成一键生成, 但是它并非完美。当设计那种超大幅度极高爆发力的物理动作时,它的表现力确实没有另外两家对手那么激进。 或许你想知道它和苏拉二现在是二点零上比到底谁更强?首先是 opalion 的 苏拉二,它的强项在于它的物理引擎画面冲击力依然是很强悍的,但现在关闭了使用,无论是网页应用还是 a p i 都没法调用了。 然后字节的吸氮是二点零。他最强的地方在于他的饮用系统和角色一致性。你给他一张照片,他能保证在深层的视频里人脸几乎不崩,这对于短视频博主和短剧团队来说是非常棒的。在动作的表现上来说,我们也有目共睹,虽然还没有正式发布调用价格,但目前测试段效果非常恐怖。 正式价格让我们拭目以待吧。以前我们或许觉得 ai 视频就是图个娱乐,但 jamie 阿莫里告诉我们, ai 已经可以处理极其严肃的内容了。虽然他在动作爆发力上还有提升空间,但这种极致的准确性,这是目前专业创作者最缺的东西。那么问题来了,面对这个不仅会拍片,还会算微积分的视频相交,你会用它来做什么呢?

兄弟们,今天谷歌 gemini 生成视频发布了,给大家做个测试,看看效果怎么样。我做的三个主题分别是机械战士打斗仙侠人物打斗迪士尼皮克斯三 d 动画。想通过这三个场景来看 gemini 模型视频能力。接下来我们来看看这两个模型最终的表现,大家各自打分吧。 有请三位选手依次登场。 i don't want to go to school, but it's time to get up sleepyhead fine, i'm going! 各位看官,你觉得哪个好?

dance 二点零这次终于有对手了!谷歌刚刚发布的视频模型 omni 到底行不行,我们一试便知。先来看 omni 强在哪里?首先是视频编辑能力, omni 能够在改变画面元素的同时,保持角色和场景的一致性,比如把现实中的雕塑变成泡泡,一触即破, 把自拍里的镜子变成液态,让人碰到就变成终结者。或者是把小提琴手从音乐厅挪到草地上,再变换一个拍摄角度,不过他好像忘记把琴带出门了,真是尴尬。其次是物理引擎更加精准,那说人话就是重力、速度和碰撞之类的效果更加真实。 另外,奥尼也拥有了全能参考的能力,除了能够参考图像、视频和音频合成最终效果之外呢,还能给视频加上指定的特效包装。正为我的动销同事捏一把汗, 那接下来我们看看同框对比 omni 和 c dance 二点零谁的效果更好呢?实测下来, omni 的 物理效果确实更加优秀啊,画面风格也更加丰富多变,但中文能力就远远不如国产模型 c dance 了,这些有机材料就能自醒发光,而且 c dance 的 人物位置更加稳定,画面更有影视风格。 目前这面的 omni flash 模型已经正式上线,不过每天只能生成三条视频,你觉得 omni 能够和 c dance 一 战吗?来评论区咱们接着聊。

用 ai 做带货视频啊,昨天谷歌更新了啊,新更新的那个视频模型是那个欧米,然后呢,今天我们测了一下,测下来啊,他应该是也是拉了多大的,他就是怎么说呢,他只有 c 档三点零百分之七十的能力吧,七十到八十左右我觉得。然后呢,他整体做下来,做一些简单的,其实也还行啊,他唯一的优点就还是那句话,还是那个优点,就是便宜啊, 别的优点好像也没见到啊,怎么说呢,看来看来,将来啊,将来有可能真的是 c 档三点零一家独大。本来我想的说的是,你只要是能关键你这次更新也就算了,你只更新个十秒的,你好歹更新个十五秒的,最长十秒的,如果去发墨西哥和巴西也够用啊。我说实话真的够用,因为今天我测了几套题石模板, 但是就是确实挺让人失望的啊,真的是拉了一坨大的。大家看一看他做的视频啊,做的视频其实还行,肯定是不如 c 档子啊,就是说的过去,主播是期望太高了啊。

分享五个 gemini omni 的 超强用法,一、改变原视频里的物品材质。二、替换原视频里的物体。 三、把视频转变成各种风格。 四、画艺术线稿。 五、编辑原视频物体。

谷歌今日凌晨发布了 gemini, 在 底层逻辑上简直就是一次史诗级的进化,瞬间引发了轰动,我们一起来看看实际的测试效果吧。哈喽,各位小伙伴们大家好,今天给大家演示一下最新的视频模型 omni flash 的 使用方法。 好,这个的话呢,它支持使用十秒啊,然后三十个积分这种方式操作好,那么怎么来操作呢?假如说我们要做这样的一个漫剧效果 好,那么首先第一个我们可以使用分镜啊,这个是我之前做的分镜。好,那么我直接把这个分镜的话呢,放到我的这个提示词里边啊,那么我可以直接到这里艾特一下就可以了。好,我艾特一下分镜,点击确认。好,然后的话呢,我可以直接说 啊,使用啊,根据分镜,或者我把它删掉啊,根据分镜生成动画。 好,然后我艾特一下这个分镜,这个分镜好,可以了。好,然后人物参考,使用这一个人物。好,然后场景参考,场景参考, 再使用一下这个场景。哎,我的场景也有了。好,这样子的话呢,那么就直接就 ok 了啊,然后我们直接来生成好生,呃,动画流畅,然后运镜流畅 就可以了。好,那么就直接点击生成好,这个的话呢,大家就可以看到一条非常运镜流畅的,并且呢有音效的这样的一个画面呢,就可以展示。 嗯,而且它的准确度是非常高的啊,就是没有脱离我们的这一个分镜,所以的话呢,这个是一个非常好用的功能。

哥发布了一个新模型,感性叫 jamie omni, 这颜值视频版香蕉来,先看官方演示。这是 omni 生成的一段视频,教授在黑板前写数学公式,人物公式,光线都很真实。你注意看粉笔灰,它是真的会往下掉的, 有重力有惯性,不会随机飘,既没有手部变形,也不会画面闪烁,画面连贯,特别的稳定。然后是第二个小球跟随轨道往下滑落。这个视频真的能感受到是重力在作用,不像其他视频模型就有种说不上来的奇怪。现在市面上那些 ai 视频工具, space dance, 阿克林他们做的视频是深沉的,你给提示词,他出视频 出来不满意我们去抽卡 jimmy 米不一样,他就可以边生成边编辑的上传一段已有的视频,直接跟他说需求可以摆很多轮。这个逻辑跟其他工具是不是你可以对话了?一个剪辑老师,他能做到这样的事情,是因为他真的懂这个世界, 懂重力,懂历史,所以粉底会掉渣,小头滑落才这么形象。真实的视频更真实。现在 gemini omni flash 已经上线了,订阅了 pro 的 用户可以直接去 gemini 里面使用。

三秒钟说清楚 google 的 gemini omni 到底强在哪?以前的 ai 看视频向保安看监控,有画面,但不一定懂剧情。 omni 的 野心更大。图片、文字、声音、视频一起进来,它要理解成同一个故事。 你给他一段素材,说雨天改夕阳,镜头推进一点,主角别换脸。他不是简单套滤镜,而是像副导演一样,边听你吐槽边改分镜。更厉害的是,他会带着世界知识看画面,物体怎么动,光怎么落,人物前后该不该一致都要尽量讲得通。 对创作者最爽的不是炫酷,而是少写实验提示词,丢参考图说风格调节奏,让草稿变成能看的镜头。 当然别神话复杂,动作细小,文字长,视频一致性仍可能翻车。真正的变化是 ai 视频从按按钮抽盲盒,变成和一个会看会听会改的剪辑搭子。开会以后,拼的不是谁喊得最悬,是谁把需求说的最清楚。

想不想像我这样 p 视频?今天小明给大家带来了五种 online 的 超强玩法,话不多说,和我一起做起来吧!第一课,随意变化细节首先拍一条展示美甲的视频,然后挑选一些自己喜欢的款式,把视频和照片拖进来,输入这段提示词 你就可以得到。同理,你还可以做。第二课,一键替换主体。第一步,拍一条你想改变的物体的运动视频,然后确定你想让它变成什么, 寻找参考图或用提示词描述。拖进工作台,输入这段提示词你就可以得到。第三课,转换视频风格准备一条你想改变的视频,在工作台输入这段提示词,你就会得到。 第四课,食物变现稿依旧准备一条你想改变的视频,拖入工作台,输入这段提示词, 举一反三我们就可以做到视频想怎么 p 就 怎么 p。 准备一条你想编辑的视频,输入这段提示词就可以得到。 怎么样,是不是简单好玩,快发出来你做出的视频,艾特小明批作业吧!关注我,带你了解更多的 ai 玩法!

今天我用这条视频给你介绍一下 jamna omni 强大的视频编辑能力。当我进入到咖啡店里打个响指,室内的灯光就可以开始闪烁。而当我坐到座位上, 我面前的椅子可以凭空出现一只小猫,我的手上也可以凭空出现任何东西。而当我拿起这杯咖啡, 它可以变成透明的,也可以再打一个响指变成任何颜色。

让你拍条短视频,不是刮风就是下雨,一会说家里背景拿不出手,我说可以用 ai 换个背景, 一会说没有一身像样的行头,我说可以用 ai 换身衣服,然后你又说开不了口,不知道说啥,我说现在好多大佬都在用 ai 数字人做口供,你说好了齐活了,完了我尘替身了。

google 新发布了 omni 视频模型,效果不错,基本可以平替 cds 二点零。但是有个新问题就是输出视频有水印,有没有办法可以去掉?答案是,有的兄弟,有的 直接看效果。左边是原版,右边是处理后完整竖屏画面。左右对比,你会看到右下角水印区域明显变干净,整体画面不受影响。 整个流程基于开源项目 gamemini watermark remover 改造而来。原项目只支持图片去水印,我把它扩展到了视频流程,分四步, 用 f, f mag 抽出 p n g 针,从前几针里定位水印,对每一针调用核心,与 move watermark 做反向 alpha blending, 最后用 f f m p 重新合成视频,并保留原音轨。 这里踩到第一个坑。 s t k 的 标准检测主要面向官方图片尺寸,遇到七田二十 x 一 二八零这种视频针会返回 no watermark detected。 通俗点说,官方的水印检测只认识固定尺寸的图片,视频针的尺寸不在他的目录里,所以他找不到水印。解决办法是跳过官方检测,自己写一个扫描逻辑,把视频针的右下角区域切成小块,逐个和已知的 gemini 水印图案作对比,找到最匹配的位置。 第二个关键是 alpha gain 默认强度容易过度扣除,出现暗色心形残影,强度太低又流水印。我的做法是量周边亮度,再试几个 gain, 让水印中心区域的亮度尽量贴近周围背景。实测下来, alpha gain 设成零点六,是个不错的经验值。 最后的经验是视频清水印。真正重要的是固定水印的工程化处理检测,一次复制 frame buffer, 批量反混合再重组。对于七十二秒一七三零帧的视频,总耗时大约一百秒,基本可以进入可复用流程。没用 ai 等于 ai 没用。我是阿星,下次见。

就在刚刚,谷歌在新发布会上一口气发布了多款模型, gemini omni 可通过多种模态输入生成视频,并支持对话式编辑。用户只需提供一张静态照片、一段音乐及一句视觉效果描述, gemini 即可将各自素材整合为一段视频,也可通过自然语言修改其中的绝 四背景与场景,或上传自拍照片将其转换为其他风格的内容。 gemini 三点五 flex 基础模型适合处理长周期智能体任务,谷歌称其在几乎所有基础测试中超越 gemini 三点一 pro, 输出 token 速度为其他前沿模型的四倍。那么你觉得谷歌的新模型跟 cds 相比怎么样呢?

炸裂就在刚刚,谷歌发布了 gmm 模型,它是全球首个真正原生全模态生成模型,文字、图片、音频、视频任意输入,任意输出。你拍了一段自拍视频,用一句话就能换掉背景, 改变风格,同步音效,一张草图秒变完整影片。更可怕的是,它内置了 jimmy 的 推理引擎,真正理解你的创作意图,物理规律、历史背景、文化语境, 全部融合在每一帧画面里,而不是生硬的堆积像素,这是迈向世界模型的关键一步。好了,关注我,每天都有 ai 新体验!

今天我用这条视频给你介绍一下詹姆娜唯一强大的视频编辑能力。当我进入到咖啡店里打个响指,室内的灯光就可以开始闪烁。而当我坐到座位上, 当我面前的座位可以凭空出现一只小猫,我的手上也可以凭空出现任何东西。而当我拿起这杯咖啡,它可以变成透明的,也可以再打个响指,变成任何一色。