最近我刷 tiktok, 老是刷到这种视频,前后反差超级大,这种带点荷尔蒙的剧情啊,真的特别抓眼,国内好多博主也在翻拍啊,个个都是爆款。 那么这种视频怎么快速复刻呢?以前我们可能需要把视频下载下来,再导入各种 ai 软件一顿捣鼓,要么就是下载失败,要么就是生成出来的画面啊,驴头不对马嘴,而且还没有办法自由发挥。今天呢,我就用几分钟手把手教大家一键搞定同款视频啊,而且还能自由调整画面。 老规矩,本期的提示词模板也准备好了,可以老地方来拿,大家来打开欧迷你 work, 这里有超多专家 agent, 用下来有点 ai 知乎的感觉,它也可以解决传统 ai 创作流程的缺失,经验难以复用的一些问题。我们日常当中遇到的各种问题啊,在这里基本都能搞定, 专业做 ppt 设计的也有视频剪辑的,什么都能干。咱们来找到这个 ai 视频生成专家工具,选择雇佣,然后就直接可以跟他对话了,让他帮我们干活啦。然后我们可以在这里粘贴 tiktok 的 视频链接,不用搞各种乱七八糟的下载操作啊,他就可以直接帮我们提取视频的内容。然后呢,我们让他制作同款风格的视频。 在这里啊,我们也可以自主修改视频各类的一些细节,想要更换视频当中的女主角色啊,也可以上传图片,按照原视频的风格框架重新制作,完成咱们人物面孔的替换啊。 可以看到啊,第一步,它会自动分析整条视频,然后帮你拆分出所有场景。我这个视频呢,它直接识别出了三个场景,它分析细节真的特别到位,场景画面、人物情绪、镜头变化,全部都给你写的清清楚楚, 我们直接核对就可以了,而且自由度也超级高,人物的风格也随便你选,视频的清晰度也可以自己调。背景音乐呢,你想保留原版或者换新歌,也完全没有任何问题。全部设置完成之后呢,它它会自动提取每个场景的关键画面,帮你逐帧生成,自动剪辑,自动合并,全程不用你动手啊! 来,咱们来看最后的成品,整条视频的节奏、镜头画面质感几乎跟原版一模一样啊!当然,如果大家想要追踪海外的一些热点视频,也可以找到这个 trading content monitor 这个专家, 让他帮我追踪现在所有的剧情视频的热点,他就会立马开始工作,输出这种超详细有文字有图片的报告啊!除此之外呢,我也会让他帮我回复邮件,写 ppt, 开会的时候,我也会让他帮我进头脑风暴。不愧是全干的 ai 乎啊!有了这个专家级别的 agent, 每天干劲满满,七成二十四小时秒回,还有什么搞不定的呢?咱们赶紧上手试一试吧!
粉丝14获赞77

jamn 欧米尼翻车了!就在昨天的 google i o 大 会上,全新的视频模型 jamn 欧米尼正式亮相发布之中呢,所有人都期待他能够创作出超越现有视频模型的作品啊,但现实似乎并没有按照大家想象的方向发展,就连 jamn 欧米尼一直强调的真实世界物理规律,在 cds 面前也毫无还手之力。 无论是画面、构图、分镜,还是单纯的生成效果,都显得一塌糊涂啊。讯息能力似乎与 cds 完全不是一个级别, 但詹姆尼真的很差吗?其实也不完全是啊,在连续编辑上,他的表现反而更加出色。以这段视频为例,将画面中的小提琴手所处的场景更换为草地,人物的动作、神态、表情都完整的保留了下来。 将手中的小提琴给去掉之后呢,仍然能够看出前后非常高的一致性。再看这段发布会上演示过的案例啊,经过欧米尼的多轮编辑后呢,人物会根据不同的设定做出不同的反应, 同时保留出真实的物理效果。由此可见, java omni 并不是专门用来做精美短视频的模型啊,更像是视频版的 nano banana, 它可以精准的根据用户指令修改视频,而不是单纯的创作虚拟型作品。 所以,如果你想通过 ai 一 键成片啊,我想 cds 仍然是现在的第一首选。但如果你追求可控编辑、灵活修改,那么 java omni 无疑更加值得尝试。 比 cds 那 种令人惊讶的视觉效果, jimmy 欧尼更像一个可控的视频工作站,你可以反复修改,局部调整,灵活性远高于 cds, 换句话说,欧尼的价值比生成画质本身更加突出。目前你就可以在 jimmy flow 里进行体验了,赶快试试吧!这是我还推荐第五百四十一个神器,关注我,解锁更多硬核 ai 工具。

dance 二点零这次终于有对手了!谷歌刚刚发布的视频模型 omni 到底行不行,我们一试便知。先来看 omni 强在哪里?首先是视频编辑能力, omni 能够在改变画面元素的同时,保持角色和场景的一致性,比如把现实中的雕塑变成泡泡,一触即破, 把自拍里的镜子变成液态,让人碰到就变成终结者。或者是把小提琴手从音乐厅挪到草地上,再变换一个拍摄角度,不过他好像忘记把琴带出门了,真是尴尬。其次是物理引擎更加精准,那说人话就是重力、速度和碰撞之类的效果更加真实。 另外,奥尼也拥有了全能参考的能力,除了能够参考图像、视频和音频合成最终效果之外呢,还能给视频加上指定的特效包装。正为我的动销同事捏一把汗, 那接下来我们看看同框对比 omni 和 c dance 二点零谁的效果更好呢?实测下来, omni 的 物理效果确实更加优秀啊,画面风格也更加丰富多变,但中文能力就远远不如国产模型 c dance 了,这些有机材料就能自醒发光,而且 c dance 的 人物位置更加稳定,画面更有影视风格。 目前这面的 omni flash 模型已经正式上线,不过每天只能生成三条视频,你觉得 omni 能够和 c dance 一 战吗?来评论区咱们接着聊。

有好多人在喷美国豆包啊,也就是珍妮奶昨天发布的那个欧米尼的模型又拉垮了。实际上我觉得你可能是,呃,没研究好啊,它还是很强的,给大家看一下它的用途,我觉得是大家用错了啊,这原视频,然后我上传了我的产品图啊,我的产品图, 我上传了我的产品图,然后呃,换了一个模特,你看一下,直接一一句话跟他说,换一个产品,换一个模特,他就可以直接生生出来了,看见没?一件复刻爆款视频呀,这不就是 能理解吗?这还不强吗?这这已经不是那个即墨的那种动作变更的,能理解吗?那个动作变更他可能是用那个 ctrl u i 去做那个那个什么做出来的效果啊,这个就是他这个世界模型,我直接把原视频里的产品和人物一键就替换了呀,那我以后去复刻爆款视频的时候, 就不需要像传统的大家去用那个什么呃,先上传爆款视频,然后给真皮奶或者豆包去用多肽的模型去分析他的脚本啊,然后你去从零开始生成,现在我直接把人家的爆款视频上传给他, 加一个自己的产品或者模特啊,他不就直接出来成品了吗?这才是就是史诗级的这个更新啊。

哈喽,今天分享三个是欧米尼的鞋修技巧来看效果。第一个用到的是欧米尼的视频编辑功能,可以让他把视频中的人物参考素描图的人物特征替换成新的真实感人物。还可以把视频中的黑色宠物替换成参考图中的金毛犬,还可以参考上传音频 的音色,生成和原视频一样的内容。稍等一会,我们来看一下制作结果。 my vet told me this is literally a cure for my crackhead dog。 可以 看到人物和宠物都替换成功了,整体的动作复刻的也差不多 ok。 第二个技巧,如果不需要替换人物,也可以只上传宠物图,让 omni 把视频中的宠物换成金毛犬, 其他的动作和产品保持不变。我们来看一下效果。 my vet told me this is literally a cure for my crackhead dog dog pumpkin yogurt water mix it together until it's fully combined。 可以 看到宠物成功地替换了,并且产品的一致性保持得比较稳定。 然后第三个技巧,如果我们做的是宠物用品类的带货视频,视频中不需要人物出现就更简单了。那这里我们可以只用到宠物替换的功能,那么产品整体的一致性会更加稳定,并且真实感非常在线。另外还有第四个技巧,除了上传人物的素描图,也可以让 omni 随机生成一个新的角 色来替换视频里的人物。在生成完后,我们可以再基于这一个生成好的角色去裂变生成其他的场景。 我们来看一下效果。 my vet told me this is literally a cure for my crackhead dog oh pumpkin you。 可以 看到新生成的这个角色和视频场景的融合还是比较自然的。 最后,如果要生成长视频,就可以拆分成多段来生成,在生成完后可以直接在画布编辑拼接,如果有不满意的也可以二次编辑视频,生成新的片段。基本的思路就这样。好了。以上本期视频呢,觉得有用的话给我点赞关注,咱们下期见,拜拜。

谷歌的 omni 模型生成视频效果到底怎么样?经过我们全员的检测呢?先说检测,这个绝对是今年上半年性价比最高的模型,先看视频, 左边是 omni, 右边是 c 点,四二你们自己感受一下,我们给他的提示词呢是一模一样的,这两个模型的效果呢,其实也差不多,所以今天给大家讲一讲我们测试出来最直观的感受啊。首先第一它的整体表现呢,已经可以跟那个快乐马一个梯度的 啊,差不多可以达到这个 sims 二百分之九十的效果,而且他也是这种全模态的参观模型,他可以上传这个文字、图片、视频,包括他的那个声音都是可以的,所以他可以跟那个 sims 二做一个对比。然后第二的话,他特别匹配就做一个生产流程,因为他不是单纯就生成一条视频,他可以不断的去改,不断的去调,去替代, 你们做过的视频你们应该清楚,对吧?我如果想换一个品,想换一个样式,我想换一个模特,我一般都要重新去生成的。但是光比的话,我们可以直接去改变视频里面 的一个元素,这样的话我们可以把我们创作的视频做一些点对点的修改,它会特别的方便。那我们测试的这几天呢,这个点是特别让我们欣慰的,因为其他的模型根本就没有这个功能。然后第三个大点的话,就是它的价格,也就是它的性价比它的区域高, 你去看一下现在国内的模型,包括 c 零十二,包括那个 happy house, 它们的价格对吧?都是一块钱一秒,也甚至有更贵的到幺零八零 p 三四块钱一秒的,这些都有, 但是欧尼的话他让我看到了就像去年下半年那个 solo 的 感觉一样,透视大概还不到我们现有模型十分之一的价格,所以不管是线上线下,我真的很推荐这个新模型啊,大家可以两个去试一下,它是可以真正的把我们的视频生产成本压掉百分之九十的,谁用谁知道。

分享七个 google omni 在 电商场景的实用玩法,一、改变视频中的人物背景。 二、替换原视频中的产品或穿着。三、在原视频的基础之上做细节调整。四、多角度切换拍摄。 五、给视频加一个创意开头, your boyfriend for his birthday 六、故事面板直升视频。 your fodger is not giving wait what oh no, oh my god is that me the right fodger changes everything。 七、一次性视频多分镜提示词拼接。

分享五个 gemini omni 的 超强用法,一、改变原视频里的物品材质。二、替换原视频里的物体。 三、把视频转变成各种风格。 四、画艺术线稿。 五、编辑原视频物体。

视觉盛宴呐兄弟们!谷歌发布现今最强模型 gemini a i, 正式从深沉内容迈入模拟现实。它彻底推翻 vo 叠加式架构,以原声多模态统一基座,深度融合 nano、 banana、 ginny 和 vo 的 全站能力, 实现文本、图像、音频、视频任意输入输出,正式宣告 a i 从文本预测跨入模拟现实的全新阶段。 模型精准理解重力、动能等物理规则,解决传统 ai 视频穿模和时真痛点。对话式编辑颠覆创作流程,一句话修改场景风格与元素,完整保留原片动作与序幕逻辑草图一键深沉影院级大片 产品,标配 avatar flow 数字分身,搭载星思 id 加 c r p a 双层溯源水印,平衡创作自由度与内容安全。多模态协调训练催生自发能力,无专项训练即可实现风格迁移,场景续写能力边界远超训练预设。 作为谷歌世界模型战略的核心在体,杰姆莱欧米尼重新定义多模态生成范式,当 ai 能完整理解并模拟现实规则,内容创作与数字交互的未来是否已迎来不可逆的底层重构?

ok, 呃,本期我们跟大家分享一个 ai 工具,为什么要分享这个工具呢?是因为这是一个,呃,这,这是一个 ai 的 一个内容创作的工具,我觉得还是挺有意思的。那么呃,首先我们来看一下啊,就是它对于我们这种内容创作工作者来说是比较以 呃有趣的,所以我们先先看一下它是个什么东西,先给大家看一下网站长啥样。呃,这个网站大概是这样子的,那我们首先看一下大概是这样一个界面,然后呢?呃,当它目前是内侧的,这是它的侧边栏,然后呃它基础的一个板块,一点零版,做的还是很简单的。然后我待会会跟大家详细介绍一下这是什么东西。首先 这是个什么东西?我帮大家总结好了,第一它就是一个把 ai 从单个的聊天机器人升级成为一个多专家的一个创作流系统。什么意思?就是你光看它界面好像是叉 gpt 那 种,类似于大圆模型,但是它 不光是这么简单,那么它官网上展示了一些它核心的一些功能,对吧?那么官网上展示一些功能是什么意思?它这个产品主要面向的市场痛点是这样子的,比如说它消耗的 talk 非常的高。第二就是 有一些 ai 产品,它交付质量不如人,或者说它没有办法,它我们创作者它必须要在多个 ai 中进行来回切换,所以修 呃修改成本也比较大。然后第二个就是呃, ai 解决 ai 创意标准化的一个问题,那么它的差异点在哪里呢?就是,嗯,多 ai 协做到底是个真需求吗?这是我认为的,就是还是说它是一个表演秀, 很贵的一个表演秀,就是到底他把这些 ai 整合到一个平台里面,然后让他们一起协同干活,是不是可行?其实我现在目前来看我觉得是可以的,因为目前刚刚刚最近不是有一个马马维斯也出来了吗?我也体验了一下,呃是可以代替一部分小规模团队的那种内容生产, 那么他现在要验证的创业模式是有没有实际的生产力,他能不能出一个成品,待会儿我也会验证。第二个是他的实际的消耗成本是不是更低的?然后就是不他在里面配置了不同的专家 a 诊的嘛, 这是它产品的一个特色,那么它们之间的协助效率到底是比你一个单个人干活或者我单独调用某一个 ai 工具更高呢?还是更低?然后第二很明显它现在目前面向的一些人群,我觉得以这个内容组织, 呃内容创作型的这个人群为主,因为我看到它里面并没有内置一些言爆分析、数据分析这些,呃就是这种类型的一些 skill 在 里面,目前还是以这种 ppt 啊,音频生成、视频生成为主的一些技能。那么首先它对标的产品我刚才也说了,我觉得很像是, 呃,不是叉 g、 p、 t 这种类型的它,它肯定更更像是那个 menace 或者是 mars 这种产品,其实它是一个融合的工具,那么嗯,它把很多的工具,你像现在目前的工具融杂揉在一起,产品架构大概是这样子的啊, 一个很简单的一个,这个,这个很常见,对吧?然后他这里是他的任务中心,这个任务中心你简单的看,他就是个产品经理,下面就是他的员工,而且感觉都像是,呃,你看一个内容分析,一个任务运营,一个生产者,一个 ppt 设计者,一个新媒体运营,对吧?这个是 trending content, 应该内容趋势分析,可能是个数据分析员。 好,这个 test 建,建好之后这个界面是什么意思?它不是标签,就是它不是超链接,你点了个标签没有用的,你看这里有个编辑,对吧?那么意味着意味着什么?就是你点这个编辑之后,它这个内置了官方内置了一百零五个 这个技能给你,你可以全部 update 一下,或者可以把它删除或者添加。目前只是说,呃,因为这些技能你不,你最好建议它的建议是说你不要全选,然后再一键添加,因为有一些技能它是互斥的,有的提示词也是互斥的,它可能会产生一些不稳定, 也就是他会让如果你尝试把技能拉满的话,他会提醒你,最好不要,因为这会改变 agent 的 记行为和交互模式,所以基本上他这里是给你一个提醒。 然后呢?他这个人,这个人就这个 ai, 他 其实相当于一个总规划师,他一个 ai 产品经理,那么他你付你其实对话的,你发需求的,你就是用户,那么你其实发需求是发给他这个这个 ai 的, 所以他说他会 got, 然后来开始分析你的诉求,你看他其实是做了这样一个动作, 那么他产品逻辑就是你提需求,然后这个 assistant 就 来理解你的需求,然后他,然后他来调用里面不同的专家模型,就是刚才这些这些人,这些 ai, 这些 ai, 你 同时你也可以自己创造自属于自己的任务的一个 ai 的 模式, 然后帮你完成任务, ai 来帮你组织工作流,是吧?我觉得这个想法是可以的。然后呢他也想做一个专家市场,也就是说在这个市场里面你可以下载很多,呃,他们官方制定的,甚至我觉得未来也可以是用户自己上传的,对吧?那就类似于一个智能体介的一个苹果市场的一个感觉。然后也结合了这个自动化,他也做了一些自动化的任务, 嗯,然后 skill, 对 吧? skill, 然后这里内置了一个,目前是一百零五个。刚刚说过了,产品架构就是这样的,首先一个 ai system 帮你去做意图判断、能力分配调用,然后这里有很多技能。 然后呢我主要重点是讲这个实测,实测是这样子,首先分析了一个这个,呃,作为新媒体运营,相当于一个账号检测的一个专家,比如说他支持这样一些平台,然后做一些简单的这个数据分析,那么我就简单的测了两个账号,随便勾了两个跟网球有关的,那么他确实有板有眼的跟我生成了一个 呃,油管的一个两个频道的对比,你看这个是红的两个频道,他们各种字段维度去进行一个比较。然后呢还有他们的 top performer 在 最好的这个数据排名排名前五, 然后以及多维度去比较他们分数,把他们的这个结果量化了一下,对吧?量化了一下,然后还有深度的一个比较,他也给到了最后一个内容总的一个总体的评价,所以他是有板有眼的给你做了一个内容的分析。 然后其次的案例是,呃,这个生成的案例,看一下 ppt 生成啊。 ppt 生成大概我还没让它正式生成,但实际上呢,就是说,呃,我看了一下它里面的就是用户,比如说提一个需求,然后我是把它的翻译,我把这个 ai 和用户的翻译,把它翻译成中文,然后我主要是看了一下它的思考过程是什么, 那它真的是像每一个这个员工一样,去不断地跟呃这个用户去进行需求的明确,最终它会产生一个产品。当然这个 ppt 我 还没生成, 然后这是常规的图片生成,图片生成的话,我生成的是一样一个暹罗猫在泰国寺庙睡觉的场景,然后呢?它确实是这样。呃,乍一看的话,我觉得就是中规中矩吧, 背景加这个毛毯加这个修容猫,然后很明显它是一个拼合的一个结果,然后点数消耗,它是这样一个界面,其实有点像 mini max, 对 吧?但是我觉得这样的设计是挺鸡肋的,就是把这个消耗记录,然后以及它定位模式。定位模式,我觉得这里吐槽的点就是终身版,因为我觉得我看到终身版就觉得是个坑,呃,感受不是太好, 总体的体验是响应速度太慢了,呃,尤其是某一些这个 talk 消耗太快了,尤其是视频生成,基本上,呃,这个内测用户生成不了多久,马上就没有,他一开始只有一百个嘛。然后,呃,再看一下这边的 音频,既然是内容生产嘛,对吧?既然是内容生产,我就让他做了,我就实打实的让他做了一个跟内容生产有关系的任务,这任务我也看一下放哪去了?我的任务应该是我看一下啊, 哎呀,我还,哦对,这里,哦他的历史记录在这个地方,那么我们的诉求是,比如说作为,作为一个自媒体创业者,去吧生成一个播客,那么这是我的一个需求。然后,嗯,他 在这个地方其实在第一步并没有给我交付成品,而是帮我生成了两个 bgm, 然后呢?呃,给到了我一个工作流,也就是他并没有,他一开始并没有直接把打成品给我,而是 他说怎么从文字稿到音频节目给我生成了一个这个界面还 ok 的 一个工作流。比如说先预处理文稿,然后 tts, 然后 bgm, 最后是混音,其实这个都他希望他这边是给了你自己一个建议,然后最终的成品我给大家看一下,五分四十七秒,它确实是一个成品。 嗨,今天我们来聊聊体验,我最近有一个特别崩溃的感受,我花三个月读完一本大不投, ok, 这就是他基本的一个生产工作流,他能交付一个音频产品,嗯,中规中矩,我觉得还是可以的。

当你不小心打开 gemini, 又不小心打开里面的阿凡达,聪明的你发现,只要露入你的人脸,你就可以拥有自己的数字分身,它可以一键生成你的口播视频。 don't be trapped by dogma, which is living with the results of other people's thinking 演讲视频 it is the combination of years of work and i cannot wait to share it with you 带货视频 i feel like my whole body is relaxed friends who like it click the link below to buy it 以及专属于你的大片。 can you hear me is anyone there open the door open the door。 这就是谷歌刚刚发布的新的视频模型 omni, 它能从你的自拍里提取出一个数字分帧,让它替你出镜,你只需要把想法告诉它就行。我这几天用下来的感觉就是因为它录入的人脸信息还是比较多的,确实比之前 open at 的 sorry 要更加真实, 用它做口播视频和带货视频会更加自然一点。另外,它生成的视频成本还是比较低的,五个小时的额度可以让你生成三到四条视频, 而且生成的速度非常快,大约两分钟就能生成一条十秒钟左右的视频,那这是它的优势。不过它还有很多毛病的,一条视频最多只有十秒, 你的文案写的太长,它就会自动跳过,只保留十秒以内的内容。另外,虽然谷歌说这个视频模型是符合物理规律的,但是实际体验下来还是有很多 bug 了,因为它只露露你的脸。当你要生成全身的视频的时候,跟本人的差距还是挺大的。而如果你是做跨境电商的,可以用它来试试帮你做带货视频。

万众期待的谷歌最新的视频生成工具今天终于在谷歌 i o 大 会上发布,这个工具完全走了和 c dance 二点零 不同的路线。谷歌说在这次的发布中有三个特殊的能力,第一个能力就是跨媒体的创作能力,这个新工具可以接收文本、图像、音频、视频的各种形式的输入,并将它们自由结合,生成全新的内容。第二次的新的工具展示了重点能力,就是替换功能, 用户可以非常精确的修改画面中的特定元素,例如无缝替换场景的角色,调整局部细节,改变整体艺术风格,切换背景环境,甚至转换摄像机的视角。第三就是强大的生存类,谷歌用了构建世界这个词, 这个新的工具可以打破现实界限,生成复杂动态且富有想象力的各种场景。

吉梦 ai 的 对手终于来了!谷歌当红杂志机 jimmy 阿米视频模型正式上桌!和吉梦比它强在哪?两个字,真实物理引擎更接近现实世界, 质感就像实拍一样。而且支持图片、音频、文字视频一播出还能对话式微调,关键价格更有优势,两块一条,对比十几块,不要太香。想做出不像 ai 的 ai 视频, jimmy 阿米值得一试。

哈喽,早上好,现在是早上的七点,其实我五点钟就起来了,因为今天欧迷你上线,我就想看一下我的账号能不能有幸的去使用上它。在拍这个视频之前我已经嗯简单的探索了一下了, 所以现在的话呢,可以给大家拍一个视频。首先我准备了一段大概十五秒的一个脚本,脚本里面是包含了创意,然后就设计元素,因为早上试的时候呢啊,放了一个真人参考图上去是不过审的,那么我就把这个形象人物形象的 这些描啊特征我都用文字去让 ai 给我描述出来了。我试过有大概两个渠道是可以用上欧迷你的,详细的话我就视频里面不能讲了,你们自己看就好了。然后,呃,然后的话选择十秒,竖屏参数都是一样,然后把这个内容放上去,我们点开始 一次就呃生成两个哈,这一边是 c 档是二点零的,同样的 c 档是二点零,我们选十五秒,这边可以选十五秒哈,哦, ok, 呃,然后欧米尼这边的效果已经出来了,我们看一下哈,唤醒你的不该是喧嚣,而是对深度的渴望,掌管你的种熟时区 deep moment 咖啡。 然后这一次,呃,点进去之后呢,是要有一个像进度条的一样的东西,就是我可以随意拖动,随意拖动到每一帧的一个地方,然后刚刚我尝试一下这个,这个挺有趣的,就是我拖动到男主角的这个地方,然后跟他说把男主角的衣服改成黄色,其他 五遍,然后直接发送给他。这个就有点像我们在啊制作制图的时候啊,对话框的一个形式,告诉他我在哪里修改修改什么地方,然后就跟我昨天发的一个前三是很相似的,哎,你看他就把这个男主角的衣服改成黄色了。这时候我们回去看一看, c 档是二点零的,还在排队。好,现在 c 档是二点零的效果也出来了,我们看一下哈。 唤醒你的不该是喧嚣,而是对深度的渴望,掌管你的专属时区, deep moment 咖啡, 专注每一滴。然后两个模型对比下来的话, c 档子二点零的运镜还是比较优秀的。然后欧米尼的话呢,它就是中规中矩的一个感觉,在实际应用上面的话呢,它的效果也已经不错了。 呃,今天演示的这个还相对比较简单的,动作幅度小,场景简单。呃,那么在后面的话,还会在实际应用上面去看一下动作幅度大,场景切换的比较丰富的情况下,它的一个表现是怎么样。 讲的再好,实际应用上面的体验感是非常重要的。那么在后面的一个广告片的时候,我也会融入到,如果使用 omini 的 话,它的效果会是怎么样?那么我们下期见啦,拜拜。

好,来搞快速的 ai 影视人物替换的全流程啊,走过路过不要错过啊。用的是这个项目,要首先我们随便生成两个角色啊,我这里生成的是国风的,所以用 sigm 的 效果会比较好,然后一次生成多几个,然后待会我们再选好,要把这个节点复制一份,然后直接生成男的,然后刚才女的忘记调比例了,人物照这里最好用素图的,出半身就比较好,可以看的全一点啊。把我们上期的 cnb 生成的剧情视频拿过来,然后今天以它为原视频来进行替换人物。 我们点上面裁剪视频啊,之前是需要一个一个片段的出的,现在可以直接选智能剪辑,然后对一般的场景啊,选均衡就可以了。然后点击开始,他会自动的计算, 等待他的处理好。裁剪出来的节点呢,会自动的排列起来,我们可以看一下,每个镜头基本上都是单独的一个片段了, 他们的头像都有偏好的,要我自己做替换呢,就为了剪变,一般都是合并同类项的,就之前都是在剪辑软件来做嘛,现在方便了点,就是如果是同一个人的单镜头,可以全部合并到在一起处理,就是例如这里的三四六就是同一个人的, 然后框选同类,点一下上面的合成视频,然后他们三个镜头就合在一起了,好把它扔到一边,然后这两个领导的两个镜头也是点合成视频,要把它二合一, 然后这里的一和五是双人镜头的,这些是需要单独的处理的。好,最后我们就是只需要处理四个镜头就可以了。好了,看图片这边也生成好了,开始选角,然后这两个都分别生成了四张图啊,然后点右上角,点开他 找个粉底液,将军呢,就喜欢这一款了,在这边女主角就是感觉随机的一般呢,然后随便选一个人就行了, 我们可以先换单人的,然后我们这个女人就替换这个型男的,然后男主角这边就替换这个领导的。好,要创建一个视频生成节点,你要选 rehab 的 工作流的视频编辑 v 二点五,好吧,就连接到原视频和参考图, 然后我们这里要需要判定一下,就当前这领导的是非常清晰的,就镜头是有紧身的,人物也很突出,所以这种主体比较清晰的,可以直接用抠出主体来处理,然后打开高级设置,然后把抠出主体来选上,就相当于把人物抠出来,要替换成参考图的人,但是背景是不变的。 然后其他的选项目前不是很重要啊,可以看左边的叹号啊,都有他们的详细的说明,然后第一次这里写蓝人,或者不写无所谓参数设置,分辨率,帧率和生成时长,然后都是一些常规的设置, 然后这边可以看这个灰色的数值,然后他就是原视频的总帧数,当帧率发生变化的时候,总帧数也会实时的做变化, 可以把生成的帧率往左边拉到镜头,然后他就是全时长的生成了。好,然后就大概是这些要用过之前的五点二工作流版本的都驾轻就熟了。好,把他们先拉到一边,然后做另一个视频。 这边也是要看的,先观察原视频啊,然后原视频虽然是同一个人的单镜头啊,但是他三个镜头有三个景别,然后位置都是不同的,所以这里如果用主体抠像应该是不太好识别的。好,然后我们就可以用到上面的功能栏了,然后找到抠像功能,点开, 先拖动时间久,找到这个人身体占比比较大的那一帧,然后开始打点,上面我也写了提示的,然后绿色是选中,然后红色是排除,随便打几个点就行了,不用太多。然后点开齿轮设置有一些相应的调整。主要是三个扣像模式啊,都差不多,都可以尝试一下,然后 ec 比较稳定, m a 二是最新的一个扣项模型啊,然后选好就直接开始, ok, 来看一下结果啊,扣的非常的清楚的,法师都是清晰可见,然后扣的很干净啊,但是这里应该是脸部,耳朵这一块应该是没有扣出来的,后面替换可能会有点问题的,但是先不用管他,直接来试一下吧。 咱们现在把执照也加进来啊,现在就是原视频加他的执照和替换目标,好调整一下参数,然后进入高级设置里面。按照以往经验来说啊,就一个画面,他的耳朵没有抠出来吗?应该是需要开启举行执照了,需要把人尽量的盖住,然后点击开始, 这里要终止一下,这里还是蓝人忘记写回来的,但其实可以不用写,因为参考图他的强度会比平时高很多,然后写不写差别不是很大。 好,咱们稍作等待,要完成了看一下结果,把他们都拖过来。当然有今天参加会议的人里面人是怪物,伪装的好,效果非常好啊。后面这个最后一个镜头可能还是有点影响的,那旁边还有这一个坏男人的镜头也可以, 这点开可以看到和原视频的一个对比,然后双击可以把它全屏,你有证据吗? 你有证据吗?好,这是单替换的,非常的简单啊,现在就做多人的。其实这镜头,呃,两个人的镜头我建议单独换了,就是先换左边,再换右边,一个一个的替换,如果你想要快一点的,可以做手张图来换,但其实快不了多少,因为这是两个人的,如果是三四五个的,那么用这个方法就可能快一点。 先看一下视频啊,当前视频是固定机位的,所以挑哪一帧也无所谓,然后随便选一帧,最好是用没有字幕的点右上角的相机可以截取当前帧,好在右边出来了,然后我们替换,需要用到的是图像生成节点,然后双击创建。那么这里有两种啊,一种是工作流的换法, 也是我们之前的图片人物替换的 v 三,然后另一种是直接用香蕉来换,我就个演示一次,香蕉的话比较简单的,要把这些人物拖过来,把他们呢全部连接上, 然后这比例要和替换图选一样的,十六比九的,然后提成大概就是图一和图二的人物替换到图三,你们可以暂停参考一下,然后图三就是刚才的提取的帧,这可能要多跑几次啊。香蕉虽然很强,但是有时候多人替换的效果还是挺随机的。 ok, 刚才的男女位置写错了啊,这是第二次生成的,可以看到现在只是人物人脸替换过来的,然后衣服还是原来的,然后我们来看第二张, 第二张就是正常的,然后女人是没有问题的,但是男人的颜色太亮了,不够融入场景好,香蕉就这样子,有时候就随机的好,有时候就一般好。然后是人物替换 v 三,然后我们这边只能一个个的替换了,然后替换的位置是有讲究的,首先选的是替换目标,之后才是要选被替换的图, 和之前工作流版本的位置是一样的。然后这边需要画制造,让 ai 知道你要替换哪一个目标。截点这里有一个知道编辑器,然后点进来,先换右边这一个,然后在他周身画就可以了。针对这个功能来说啊,他中间会自动填充的,一定要把它换完整啊,让他 首首尾闭合,然后这边如果你觉得画笔要切换成这种网格状的,然后他的显示样式不同,但是效果是一样的 好,画好就可以保存。然后在缩略图这里可以看到,这里有一个遮罩的标识,好选一下分辨率,然后这个流程很简单的,没什么选的,就直接开始好,一次性替换的出来的效果就非常完美了。然后继续啊,然后把蓝人也拖过来好,接下来就以这个结果继续叠戴, 也是直接在蓝的身上画圈啊,一定要闭合啊,首尾都要相连起来 好,继续生成好,那么这个结果就很好了,就人物和场景都非常的融合的,但这里的手部有点瑕疵啊,我们快速演示,就先不用管他了。好了,现在可以看到图片还是有点不太清楚的,可以用香蕉来直接高清,或者之前的分辨率调高一点也可以。 我是比较喜欢香蕉的高清啊,就效率会比较快,然后效果也是非常好的。好,来对比一下,是原图的一次是零乘以八百,像素是有点低的,然后这边是香蕉高清,二 k 的 人物是没有变化的,整体都变得非常清晰了。 ok, 然后我现在好参考图以后,把刚才要替换的视频也拖过来,创建视频节点,然后选视频编辑。 v 五点二之前的替换视频也有讲到过了,如果是固定机位的镜头,是可以不用抠像的,然后打开高级设置,这里 选多人控制,然后这就是相当于用上面这两个人的姿势来驱动下面这个参考图,把帧数、分辨率这些的参数设置好就可以了, 好结果非常完美啊。按照这个方法,你要把最后一个画面也替换掉了,我自己就直接的快进跳过。 那么当所有的画面都替换好以后,也是和之前一样啊,我们需要把画面给自动拆卸出来,像这一个三四六号镜头,然后拆出来都是有单独的镜头排序的,免得你拖来拖去把它打乱了。 然后点裁剪,这里有个智能裁剪,然后这里三个镜头其实很明确,所以参数可以不用选,然后我这里直接加速排一下,然后其实我现在这里啊几个镜头还好,如果镜头多了,确实会有点乱的。 好,排序好以后就全选,然后点上面的合成视频,然后稍等一下,然后右边就生成结果了, 就来看一下结果。好,要在群里的小伙伴也可以看群文党来拿工具,要么?你说的太过匪夷所思了,你有证据吗?当然有,今天参加会议的人里面就有一个人是怪物伪装的。

兄弟们,今天谷歌 gemini 生成视频发布了,给大家做个测试,看看效果怎么样。我做的三个主题分别是机械战士打斗仙侠人物打斗迪士尼皮克斯三 d 动画。想通过这三个场景来看 gemini 模型视频能力。接下来我们来看看这两个模型最终的表现,大家各自打分吧。 有请三位选手依次登场。 i don't want to go to school, but it's time to get up sleepyhead fine, i'm going! 各位看官,你觉得哪个好?

小米最狠的竟然不是画质,而是他竟然会自己剪辑成片!注意,这绝对不是后期剪辑,而是纯提示词控制的多镜头快切!比如你写全景特写、侧面跟拍甚至俯视镜头,他就能在同一条视频按节奏严丝合缝的切出来。而且连人物状态、动作方向、空间关系竟然全能接上!这个逆天的能力, c 单三目前真的不具备, c 蛋斯尔更擅长稳定的单镜头,而 omni 已经开始真正理解镜头之间的关系了。第二个升级能力是提示词控制更准,你要车门上有 pop 字样,你要军靴踩碎木板,甚至要红光扫过人物面部。 omni 明显更容易把这些机器聚 细节执行出来。他早就不仅是做氛围了,他开始完美适配品牌视频产品演示和技术可化。第三个能力是人物质感,更像工业级的引擎渲染。千万别误会,这可不是脸更清楚,而是皮肤、汗珠、眼球、光线之间的物理关系变得更加完整。所以我对欧米的最终判断是,他绝对不是单纯的更会生成视频。 他是在把 ai 视频从一个普通的出片工具,强行推向了视频引擎的硬核高度。多镜头快切解决视觉精准控制解决工业可控,人物质感 彻底解决角色真实。我把这次硬核测试用到的已经整理成了一套现成的模板,包括多镜头快切、人物质感、物理交互这几大类。想直接附用抄作业的老地方自取。我是关关,每天带你硬核玩转 ai。