粉丝4826获赞7603

如何生成这样的人物三十图呢?其实很简单,这里呢我为大家准备了一份题诗词,直接把这个题诗词放到节目里面去,然后放上你的人物图片就可以了。 那这里呢,我用我的真人照片做了一份参考,然后呢生成出了这么一份三十图出来,我觉得这个已经完全可以用了。 生成这样的三人图有什么好处呢?第一就是你在生图和生视频的时候呢,你参考的角度越多,它生出来的越准确,减少你抽卡的成本。第二呢就是在吉梦 c 档次二点零中呢,你用这样的三人图就可以完美的规避掉这个不能用真人形象的问题, 如果现在你不想用你的真人脸,或者说是你现在没有一个合适的虚拟形象的话。这里呢我也为大家准备了一份这样的题词,你先在节目当中去,你把你的这个人物形象生成出来,然后你再把生成的单张的人物图片你放到这个题词里面去,生成三十图,就可以直接去使用了。

没有用三式图,也不用把照片上的人脸涂掉,只需要上传一张正常的带人脸的照片,就可以在极梦的官网上生成你想要的有电影感的有活人感的 ai 视频。 看到这个艾特服了吗?他在这里新增了一个创建主体,你可以在这里上传自己预先生成好的角色图,而且可以上传多个角度,这样可以保持人物高度的统一性。 你看我这个只是上传了一张照片,不用涂脸,也不用额外的去生成他的三式图,你只需要在提示词里艾特你刚刚创建好的这个角色就可以了。那么现在 就只剩排队的问题了,什么时候吉梦能把这个网站亲生的高级会员的排率待遇提升一下就好了。现在在人家第三方十分钟就能生成的视频,在你这要等六个小时,这对吗?这真的对吗?

题目, c r 的 人卡脸的问题被我彻底解决了,而且只有三种形式可以稳定的关联,分别是角色卡、故事版,还有三十图。第一种是角色卡,你只需要给他一张真照片,然后再输入这段题词,让他把人物的五官、脸型、发型、穿搭、气质全部提炼成一张完整的人物角色卡。后面上视频的时候,直接上传这张角色卡图片, 生成的视频,人脸就非常的稳定。第二种是咕转形式,这个更加适合已经有视频内容的人,你可以直接让 ai 按照视频内容,把每个镜头的人物动作、表情、警别环境全部提取出来,然后输入这段提示,直接生成咕转图片,这样 c d 二点零在生成视频的时候,不是乱猜人物,而是按镜头去还原,不管场景、动作、风景怎么变,生成的人物 脸和动作一致性都非常的强。第三种呢,就是三式图,只需要上传一张真人的照片,绕出这段题词,他就会把人物生成正面、侧面、半侧面三种视角,再加上面部和身体的特征,生成人像定型三图。你们看我这些形式连生成了这么多条视频,真人脸都调到过,而且人像效果都非常的好,还不是那种有点像,而是五 五官脸型气质都能跟真人对得上,所以现在别再只上传一张真照片去应对过审了。最后再给大家总结一下,角色卡更加适合去做人设定,故事版更加适合按视频内容去拆镜头,三十图更加适合做真人脸的稳定参考。

哈哈哈,陛下,别来无恙,你封不住我的 啊!这这这, 你怎么会流云剑法? 大家好,我是陈白色。在用 cds 生成视频的时候,总会有一个问题在困扰,那就是场景的一致性的问题。 我们虽然可以通过上传场景参考图来固定场景,但是这张上传的场景图的角度总是会出现在这个场景里, 俗称卡场景,这让我们的视频镜头变得单一,那么就像我上一个做的这个视频一样,我在做这一段战斗的时候,所提供了一个场景的参考图,但这个场景参考图它只有这么几个角度的东西,并且它背后的背后的这一个场景,它在视频的过程中始终出现破损大件的场景, 并且镜头角度都有这个东西,那么时间长了,这个镜头就不够丰富,比较单一。其实我在生成这段场景的时候,就已经在考虑场景一致性的问题了,因此我其实先用了一个基础的图,先用了这张基础的图,然后进行扩展,把它 扩展成了多张图,再来生成这个。但是这个拓展的这一个环节其实还是比较难做到的,因为本身对于 ai 来讲,它无法去确定你的这张图的背后是什么, 无法合理去预测。另一种情况是随着人物在场景中的移动,每段场景总会发生变化。这里有两个解决的办法, 一是做好每一个分镜图,这也是做好一个精品必不可少的。另一个就是我今天要给大家分享的一个全网独家的解决思路,就是通过全景图的方式去控制场景,主要是这么几步,一、深层场景。 第二步,将场景图变成一个三百六十度的 vr 全景图。第三步,通过软件自由截取场景图,或者通过截取四个方位的四十图或者十二宫格图。第四步,使用多宫格图作为场景图的参考,进行生成视频。那么接下来就具体的思路及操作过程。 有的人可能还记得我之前做过一个 mv 威廉古堡,在做这个之前我还觉得挺简单的,但是做了之后逐渐的就发现,因为他的场景在室内,这个室内的空间全都是静静, 并且每段视频的场景都会发生变化,那么场景的问题巨难解决。尽管我当时提出了一个可以用千问进行角度变换,改变一些角度就是这个应用,但是他生成的场景的图片原理还是一段一段生成的, 他的这个图片仍然不是连续的图片,总会有 bug 的 地方出现。另外,我发现 c 档在做场景的时候,会参考你提供的这个场景的元素,自己进行推理而来, 那就像人物设定图一样,我们给他提供的设定图可能会提供多个角度细节的一些设定,通过这样来保持人物的一致性。 那么我在想,我们是不是也可以提供一个场景的多角度图来保证场景的一致性?那么因此我就用相交生成了一个同一个场景的四十图来进行生成,做了这么一张,然后我通过这张图去生成了一段视频,参考视频大家请看。 那么大家仔细看这段视频在生成的过程中,它是严格按照我们给予的这个场景的参考图来生成的,但有个问题是,我们给的这个场景的参考图,它本身并不是连续的, 它每一张图都是独立来生成的,那么它的逻辑是不合理的。比如我们看这张图 它是没有衔接的,这就导致我们最后生成的视频,你就会发现它的背景为了接近你的参考图,它会不断的进行改变, 那么这个事情本质上就是因为我们的场景参考图是它的逻辑的问题。那么为了解决这个问题,我就想到了是否咱们能用三百六十度的 vr 图,因为这样的全景图它是一个连续的场景,且是合理的。那么这里 我也是在 ronyhab 上做了一个应用,那么 ronyhab 这个平台呢?也是我常用的平台,我一般学习 ctrl u i 或者使用一些香蕉等闭元的模型的时候,都可以在这里找到。还有很多大佬分享的工作流,我在这里也是放了很多的应用,最近也是新添加了两个 新的人设图的应用,把之前的人设图进行了一个细化,那么做漫剧的时候,可能对于这种服装的细节更需要,大家可以去看看,那么用我注册码注册就有一千点,每天登录还有一百点。那么回到这个 vr 应用,这个应用使用方法是非常简单,在这里上传场景图,然后点击运行, 它就可以生成三百六十度的 vr 图,比如这些, 那么我用这些 vr 图再去生成视频,发现,哎,仍然是有问题的,那有啥问题呢?例如这个,我用这张图来生成了一段视频,那问题在于 vr 图它在平面上是一个扭曲的形状, 视频参考后它的视频也是扭曲的,那么我们这里就要多一步处理,将这个 vr 图转换成为一个平面图,我为此也是写了个小程序,我把这个程序也是放到了豆包里面,豆包这里有个应用广场,大家打开链接就能直接用,或者你们也可以让豆包自己写一个这种 vr 三百六十度全景图查看器,我也把这个应用的代码放到了网盘里面,你们也可以直接打开用就可以了。这个就是我们把我们生成的三百六十度的 vr 图转换为一个平面可去看的一个图片, 这样它的场景是整个是连续的或者这样的场 景, 像是这样的场景, 这里我们直接把我们生成好的三百六十度的场景图直接复制进来,我们就可以直接在里面进行观看, 那么场景你想要什么角度的场景,你就可以直接去截,我这里也是提供了多种角度的截图方式,像是截取当前画面,或是直接一键四宫格或是十二宫格截图, 那么截取当前截图这个不用解释了,他就是以你散的画面来截,截取一张十六比九的图片, 那么这个四宫格跟十二宫格呢?根据你现在这个视角的正面、左面、右面、后面截取四个方位的图, 而十二宫格是多了,这么在四个方位的图基础上增加一个上,增加一个下这样的一个场景,那么我们再拿这个场景图去生成视频,你看这个截图啊,他有的地方是有些扭曲的, 但这个问题我在测试的过程中,我发现在视频生成的环节中,他就将这些扭曲全部进行修正了,因为他本身的扭曲并不大,他在视频生成参考的时候,会将这些扭曲进行一个修正。 那么以上就是整个的一个视频的思路,我们在这里看几段最终生成的效果, 万岁万岁万万岁万万岁! 独处的时刻,每一次旋转都是与自我的相拥。呃,这其中还是有几个不足的地方。第一个是这种三百六十度的 vr 全景图生成确实是很困难的, 特别是通过参考图再去扩充来生成,很容易出现无法闭环的问题,那么这个问题就只有多出卡,所以我的应用也是用的香蕉二来做的,推荐还是用二 k 或者四 k 来生成。 第二个问题就是他生成的这个接粪并不总是完美,总是会有一些问题,不过有的时候像这种情况下,他的接粪不够明显的时候,用集闷给他单独进行这一段荒雪,然后进行重绘,例如这个场景接粪他就不完美。 因此我用急闷在这里进行了一个重绘,进行了修复。这个问题单独把这张场景图进行了一个修复。其实想要保持场景的问题,还有一个办法,例如用库家乐你去搭建一个场景出来,还有一种你像我现在演示的这种, 像我这样通过建模来搭建一个场景,那么你这样你生成的场景的图片 也是合适的。不过这个方式就比较费时了,我也就不多介绍了。那以上就是今天要分享的内容,如果你觉得这期视频对你有用,还请关注一键三连,你们的支持就是对我最大的鼓励,我是深白色,我们下期见。

即梦 ai 生视频超十五秒就变脸,场景跳脱、画面断层,用好这三步,精准把控一致性,新手也能做出商用级短片。第一步,锁人物,全程一张脸彻底告别分段变脸,很多人生完一段就换脸,核心是没固定好角色。即梦 ai 电脑版二零二六最新功能,一、托全能参考模式,彻底解决变脸问题。 一、创建专属角色参考打开即梦 ai 的 视频生成,选择 cds 二点零的全能创建,上传完成后给图片人物命名和修改介绍,详情 可以给上传的人物主体添加特定音色,所有操作完成后保存即可,后续所有镜头直接引用艾特该图片即可。二、锁定角色特征参数提示词开头输入艾特图片一作为固定主角, 在提示词中明确要求全程保持人物五官、发型、服饰完全一致,后续所有镜头附用此描述。三、全程附用同一角色,所有镜头均引用同一张角色参考图, 切换角度动作,仅修改提示词中的动作描述,不要更换参考图。第二步,锁场景画面不跳戏,前后风格统一,人物一致后场景翻车更常见,亮度突变,色调漂移,背景乱换。借助极梦 ai 电脑版可轻松实现场景全程统一,一、生成场景图统一精准。 点击首页图片生成模式,输入具体场景描述,在这里给大家展示一下描述情况,可以看看,分辨率设为一零八零 p, 与后续视频分辨率一致,点击生成,生成后点击图片右下角创建主体,命名为全片场景宝典,作为全片每一个场景的参考图。注意,同一个场景只需要一个版本。 二、统一光影色调,避免跳戏。在每一段视频的提示词中固定加入统一的光影关键词,不要中途修改。给大家设立两段不同色调的关键词作为参考,可以看看。注意重点,同一部视频只能用一套光影关键词,即使不同镜头也不能混用暖调和冷调。 三、引用场景锚点,每段提示词在有场景描述的地方艾特场景图,以保持环境不变。在提示词中明确要求全程保持场景布局,光影色调完全一致, 即使镜头移动,背景也不会乱换。第三步所衔接无缝拼接十五秒片段,打造流畅长视频,即梦 ai 目前单条镜头最长支持十五秒。 长视频需拆分生成,巧用伪真续拍加批量生成技巧,可实现片段间的无缝衔接。提前用豆包、 zip 等工具生成分镜头脚本时,严格按照时长规则拆分,无台词、空镜头时长小于等于四秒,带台词的镜头时长小于等于六秒,单幕画面总时长小于等于十五秒。拆分完成后,将每个镜头对应的提示词 好逐一导入极梦 ai 上一段视频生成并确认无误后,截取其最后一帧画面保存至本地素材库。生成下一段镜头时,上传该伪真图作为参考,并在提示词中说明 此图为上一段视频的结尾画面,再输入本段的动作、剧情描述,设置相同时长与分辨率后生成。在每段提示词的末尾统一添加衔接约束语,与上一段画面衔接。平滑自然,角色、五官、发型、服饰、 体态完全一致。场景布局、光影色调无任何变化,人物动作连贯无跳脱。按照以上三步标准化操作,仅需三十分钟,即可制作出人物形象统一、场景风格一致、画面衔接流畅的完整 ai 短片。需要这套可直接套用的标准化提示词模板的朋友,可在评论区留言模板获取关注塔塔,了解学习更多 ai 使用技能!

ai 绘画用参考图保持人物一致性,百分之九十九的人第一步就做错了,你是不是明明生了人物图?当参考结果在增加场景后,人脸立刻变形,身材比例也极度不合理, 整张图片好像完全变了一个人。今天三个深图小技巧,让你的人物一致性效果直接拉美!视频后面我还整理了各类 ai 绘画小技巧的笔记, 想要的一见三零后继续往下看。方法,一,生图的时候,许多人习惯生成前景人物图,然后再生成脸部特写,但这一步就错了,因为你出来的九比十六前景图的时候,人物的脸本来就不清晰, 再生成脸部特写的时候, ai 就 会去修补之前缺少的数据,从而让人脸出现了变化。正常的方法应该是先生成一个脸部特写的图片,用做参考 去生成一张上半身的特写,然后用这张上半身的特写图去生成人物的前景图,因为这样可以时刻保证我们人脸数据是清晰准确的,从而变化场景的时候不会让 a i t。 补充数据,从而引起人物变化。 方法二,很多人用参考的时候统一用前景的人物图,但这也是错误的。正确的方法应该是,我要生成人物脸部特写的时候, 就应该用这种上半身脸部特写,甚至只有头部特写的。这个原理和方法一是一样的,你用前景人物做参考,加入场景以后,必然会有光影、色彩等数据影响到 a i t。 补充人脸的数据,而 这时候的场景光影、色彩就是 ai 最先考虑的数据,所以人脸就会发生变化。方法三,就是解决这种人物比例失调的办法。首先我们先不用参考,生成一张我们需要的图,选定一张满意的之后保留备用, 然后用我们的参考去做替换。但这里要特别注意,当你用参考图是九比十六的人物图的时候,去替换一张十六比九的人物的时候,要先把九比十六进行扩图,成为十六比九比例的, 记住一定是扩图的。做完这一步后,你再去对比参考图一盒要替换图片的人物大小, 如果比例依旧不过,这时你需要再进行一个扩图,直到参考图的人物比例以替换图的人物大小一致或者略微小一点再进行替换。这样你才能得到一张身材比例、人物细节一致的图片。 因为你直接用九比十六比例的人物的时候, ai 优先顺序是保证参考图不发生变化,从而导致替换的时候出现问题。除了这三个方法以外, 还有很多深图小技巧,例如一张图生成多视角场景一致的小技巧等,这些我都整理成一个笔记,想要了解的可以在评论区留下。五要。

逼自己一周练完 ai 漫剧视频制作,存下吧,很难找全了!警告,本期视频耗时两个月,制作时长两百分钟,呸!你系统的学习 ai 视频制作,这应该是抖音据良心的 入门到进阶的 ai 教程了,哪怕你是零基础,也能学会相关的制作流程和资料,包括可商用的小说素材、运镜提示词背的 ai 工具等等,我都整理成了一份懒人文档。在这节课中,我们将基于 ai 生成的故事来创建故事中的角色,完成角色的一个设计。 我们使用到的工具是豆包的一个大模型和极梦 ai, 它们都可以免费在线的来进行使用。 因为我们生成的是一部大约一分钟的 ai g c 动画短片,所以角色的设计会相对简单一些,你可以用一种放松的心态来对待这个学习的一个过程。现在我们就开始吧。首先,我们来简要讨论一个问题,那就是为什么我们需要进行角色设计? 毕竟我们创建的 aigc 短片只有大约一分钟的时间,真的有必要进行角色设计吗?角色设计的意义又是什么呢?实际上,我们创作角色设计有两个主要的目的,第一个呢,是保持角色的统一性, 无论是一分钟的短片,还是涉及到任何场景切换的地方,只要镜头中出现的是同一个角色,我们就需要在整个过程中保持我们角色的一致性。想象一下,如果小树在向阳坡荒废时是平头, 到了向日葵盛开时的场景,却变成了有刘海的一个卷发小男孩,观众们就会瞬间疑惑,这还是同一个人吗?所以第一个我们角色设计的核心意义呢,就是让观众始终认得我们所设计的角色。 这个呢,在任何设计场景切换的故事中,提前建立角色设计是必不可少的步骤。第二个核心意义呢,就是契合我们故事的氛围,因为我们视觉是为情感服务的,角色的外观设计必须与这种氛围完美的匹配,让观众一眼就能感受到我们故事的温度, 通过色彩、造型和材质传达故事潜在的情感基调。在我们进行角色设计中呢,我们仍然使用豆包大圆模型工具和图像生成工具来进行生成 豆包这个工具设计设计。我这里呢,总共有三种方法。方法一呢,是根据剧本的故事情节内容,用大圆模型来生成对应的角色设计的提示词,以供参考。然后使用专门的 ai 图像生成工具, 比如即梦来生成角色的一个外观。这种方法的第一步,需要我们使用 ai 大 元模型来生成提示词。此外,我们还需要利用大元模型的文本参考功能,这种方法呢,特别适合,就比如我们已经完成了剧本创作,我们只需要将我们的剧本给到 ai, ai 就 会自动的帮我们从剧本中提炼出最重要的视觉元素。第二种方法呢,是参考现有的设计,然后在脚本中生成角色。这种方法需要我们为角色设计找到一个参考图像,然后使用具有语言理解能力的图像生成模型来生成相似的角色设计。 这种方法的好处呢?如果我们对某个角色的视觉风格有明显的偏好,或者在网上看到了喜欢的参考图,这个方法就能让我们的设计更加的可控。 我们通过上传我们想要的一个参考图片,让 ai 来学习其中的绘画风格、色彩搭配和造型特点,从而让我们生成风格一致,内容原创的角色设计。 第三种方法呢,是最快速的方法,当你已经对角色有明确的视觉想象,或者需要快速出图进行风格测试时,通过指令让 ai 直接来生成我们的角色 是最高效的选择。这种方法的好处就是速度快,迭代灵活,且特别适合在设计过程中不断的调整和优化我们的设计作品。首先咱们来演示第一种方法, 我们先从上个课程里把最终修改好的故事剧本调出来,然后上传到豆包。上传完成之后呢,大圆模型会自动地解析我们文档里的所有内容。我们这里下面呢是根据是个文档可以进行的一些快捷指令,比如详细总结这篇文档的内容,做成 ppt, 对文档的内容进行润色。不过我们今天呢用不上这些快速选项,我们需要大圆模型帮我们完成角色设计的设定,所以要按照下面的方式来编写我们的提示词, 这里我还是当他是一个专业的角色设计师,参考我刚才上传的向阳坡的剧本设计。三个角色外貌的提示词,风格呢是二 d q 版。最后提示词需搭配,即梦 ai 来生成。这里我们直接上传给 ai, 大家可以看到,没过一会就得到了我们故事里的主要角色,阿树阿和阿乔他们的一个外貌提示词描述, 而且他还很细致的整理了比如阿叔的发型、服装和标志性的一些细节。这个对于我们在比如极梦的一些图像生成平台,他理解我们生成的内容就会容易许多。但我们仔细想想,这样的信息其实还是不够完善的, 因为从前面的故事剧本里,我们能清晰看到比如村里人、种地路过都笑着夸这三个孩子能干的这个画面。这个角色设计其实是没有设计的,这里呢,我们就可以根据实际的剧本内容来进一步的展开。比如我这里继续让 ai 来生成,村里人种地 路过都笑着夸这三个孩子能干的角色设计,告诉 ai 这个并没有设计,让 ai 再帮我设计一版。 在发送之后呢,我们就能看到下面就是迭代之后的一个版本,并且加上了村里人种地路过都笑着夸这三个孩子能干的角色设计。 这个方法呢,就是我们利用大圆模型的上下文关联能力生成出来的角色设计。接着我们只需要复制这些提示词,然后使用图像生成模型来生成特定的角色设计。 接下来我们就来看一下第二种方法。第二种方法呢是参考图生成原创角色,我们参考现有的设计来生成剧本中的角色。实际上不仅仅是在当前我们 ai 时代,在传统的我们设计当中,我们在设计角色时,为了创造出更好的设计, 往往需要参考其他已经落地成品的一个作品,从中来汲取灵感。例如我们可以在别人已经生成过的 ai 作品里,找到一些可以让我们来使用的元素,如学习这个小女孩的服饰,或者另一个小女孩的发型和表情, 结合了各方面的优势之后呢,设计出自己独特的角色,这个呢是角色设计中最常见的一种方法,因此在我们 ai 时代的来生成图片的过程中,我们也可以参考这种方式来进行生成。 首先我们在网上搜索我们认为合适的图像作为参考,就比如这一张,我们回到我们的大圆模型里,然后将我们需要参考的图片上传到我们的大模型里。至于提示词呢,直接输入,你是一个大师级的角色设计师, 请参考这些图像来设计。阿河的外观风格为二 d 水彩角色保持双臂自然下垂,正立站着,视角比例为十六比九。在这段描述里呢,有一个非常重要的话术,即角色直立站立,双臂自然下垂,正面站立。 当我们生成角色设计图像时,如果没有这句话,生成出来的结果呢,往往有许多的随机构图或者角色姿势的一个改变。 在我们后期需要创建角色三式图时, ai 可能并不能很好的理解我们想要生成这个任务的角色,所以我们最好先生成一个正面的式图,这里我们直接点击发送。一会呢,我们就能看到 ai 大 元模型已经成功的为我们设计出了我们阿河的一个角色设计图像。 这个角色呢,它是综合了我们上面三张的一个参考图像。当然,如果我们对当前的设计方案不满意的话,还可以继续迭代我们的提示词,让 ai 设计几个不同的版本, 点击发送之后呢,我们就又获得了四张不同风格不同样貌的一个阿和的一个形象。我们可以直接将这些图片作为我们后期生成人物图像的一个参考图片,当然这样生成图像的时间是非常低的,我们豆包上也没有任何的经济成本, 所以如果生成的设计还不够满意的话,我们还是可以重复之前的操作,生成更多的图像,从中呢来选择我们所需要且契合我们剧本的一个角色。接下来我们就来看一下第三种方法,直接让大圆模型来生成角色设计。 这种方法呢其实并没有技术挑战性,我们直接只是 ai 大 圆模型来设计一个角色的外观。方法的好处就是可以快速迭代,风格呢也能自动的联动,特别适合在设计过程中不断的调整和优化我们的设计方案。 这里我们就直接告诉 ai, 我 们就用之前他所生成出来的 ai 角色设计的一个提示词,让他直接帮我生成阿河的一个角色。我们能看到下面四张呢,就是他所生成出来的图片,都非常的精美, 画面和我们的剧本贴切,年龄上的也相符合,如果不满意还可以进一步的来戏化我们的提示词。 在这这样不断尝试之中呢,借助 ai 大 元模型的理解功能,就可以对我们已经生成的设计做一些调整,最终得到我们需要的图像效果。 当然我们还能让 ai 学习它所生成的这个画面。我们下面就可以这样告诉 ai, 基于阿河的形象设计一个红布头巾务农大婶的形象设计。下面就是务农大婶的形象设计, 我们也可以这样说到,让 ai 基于阿和和大神的形象创建一个他们在开满向日葵的山坡对话场景,阿和和大婶都很开心,这样呢就可以将我们刚才所生成的两个人物形象合并在一个场景里,我们直接发给 ai, 最后生成出来的画面呢,就是上面阿和和大神对话的一个场景。 当然,如果你对这个形象不满意的话,我们还可以要求 ai 再生成几个不同的版本来让我们进行选择。通过上述方法,我们已经成功地设计了阿河和大婶的一个形象,当然这是还不够的,因为在故事中还有阿树阿乔的角色设计, 我这里还可以进一步的让 ai 来生成阿树阿乔的角色。我们直接发给 ai, 它也是完美的生成了阿树阿乔的角色。我们使用大圆模型来生成图像,虽然从生成质量来看呢,可能不如专门的图像生成工具, 但是在我们前期创建故事时,可以很方便的将它与上下文联系起来,确保在不同的场景中生成的角色一致性,这样就能获得更好的效果。这个呢是第三种方法。 在讲完了使用大圆模型直接来生成角色的方法之后呢,我们来谈一下风格。在我们设计角色的外观时,首先要确定我们画面的艺术风格, 常见的一些风格,比如现实风格、动漫风格、二维插画、匹克斯风格、三 d 动画等。然而对于这些风格,如果没有具体的指定的话,其实 ai 并不知道我们具体要什么风格,因此我们在设计我们的图像时,需要保持艺术风格的统一, 比如我们这里就使用了二 d 水彩 q 版的一个风格,同时呢,我们也需要保持水彩 q 版风格的一些特征,比如笔触特征、色彩搭配、造型比例等。但是在生成比如写实风格的时候,笔触特征、色彩搭配和造型比例就会相应的改变。 如果我们在设定风格时,我们不知道我们到底要什么风格,我们就可以去网上找一些参考的图像,让具有大圆模型 解能力的图像生成工具来学习这种风格。最后呢,生成具有一致性风格,但是不同外观的角色设计。例如这里我们就可以 找一张这样的图片,然后这里我们可以告诉 ai, 我 会给你我想生成画面的提示词,所有后续所生成的图像呢,都需要引用我们上传这张图片的这样一个风格。然后 ai 就 会帮我们分析这个风格呢,是 q 版古风萌系插画风格, 就比如我们这里直接让他生成一个小女孩放风筝的一个场景,然后他就会参考 q 版古风萌系插画风格来生成小女孩放风筝的场景。 从结果上来看呢,最终生成出来的效果和我们之前上传的图片是很像的,包括这个小女孩,能明显的看到就是我们上传途中的这个小女孩。以上呢,就是本节课的全部内容, 这节课中我们解释了如何使用 ai 大 元模型来设计故事脚本中的角色,还介绍了三种角色设计的方法,以及如何确定生成图像的艺术风格。 下个视频我们将详细讲解这些方法,以及如何操作我们的极梦 ai, 获得更好的生成效果,例如制作角色三式图,从而获得更多更稳定的角色设计的产出。

很多 ai 海报看起来一眼假,不是因为画质不够,而是因为主体和背景根本就不在一个空间里。今天这条视频,我教你用 ai 做出这种高级感的商业海报,不靠堆素材,而是用一套更稳的光影合成流程。我们先准备好人物图或产品图, 然后再准备一张海报参考图。如果你觉得人物的服装和参考图差距很大的话,你可以找一张合适的服装图片,然后把人物图和服装图一起发给 ai, 再加上这段提示词, 就可以换上合适的衣服了。那现在我们来到极梦,选择图片生成,使用图片五点零 light 模型,然后把准备好的两张图片添加进来,加入这段提示,等待升成 就完成了。 ai 负责生成画面,但你要负责把画面拉回到真实的商业摄影逻辑里面,这才是 ai 海报从一眼假到高级感的关键。如果对你有帮助,记得点个关注,那我们下次再见。

乱豆包加极梦加剪映,一晚上搞定一部 ai 漫剧日入八百,现在没有保留的分享出来,新手直接抄作业,第一部剧本生成,第二部拆分分镜,第三部文生图,第四步图生视频,第五步剪辑合成,相关的工具和制作流程都打包好了, 感兴趣六六六低调研究。大家好,我们这期视频来讲解极梦 ai 的 参考图生成都打包好了,大家好,我们这期视频来讲解极梦 ai 的 首页,点击左侧的生成选项 模式修改为图片生成模式。既然是参考图生图,我们首先要上传一张参考图,通过点击这里的加号或者鼠标拖拽的方式将参考图上传上来,我们此次生成就以这张图片为例。 先来看参考图生图的第一项演示功能,修改颜色。这里我们直接在提示词里面描述,将人物的头发修改为暗红色,其他部分保持不变,回车发送可以看到一段时间后图片就生成好了, 整体的修改效果还是非常不错的,十分稳定的将人物的头发颜色修改为了红色,同时和原图相比,人物在造型和背景上都保持了高度的一致,如果我们想要修改其他部分的颜色,就直接在提示词中描述修改某个部位的颜色即可。我们下面来看第二项功能就是修改环境 次生成,就以这个站在草地上的人物为例,回到极梦 ai 的 生成页面,我们将这张参考图上传到预备窗口当中,而提示次方面就直接描述给人物的背景 更换为健身房,只改变背景不改变人物。现在点击发送可以看到此时我们生成的结果,就在原图的基础上,将人物所处的草坪背景更换为了健身房背景。而相较于原图,我们可以看到人物在造型设计、长相特征上,甚至连打光上都是没有发生改变的,而是让背景的光影和环境 主动去适配人物,一次性会生成四个结果,我们可以从中找一个与人物融合程度更好的。下面再来看第三项功能,就是修改姿势和角度,我们再次更换一张新的参考图, 以这张图片为例,回到极梦 ai 的 生成页面,将参考图上传到预备窗口当中,而提示词方面,我们就直接描述想要人物做的事情 及想要人物所处的环境。例如这里我们就直接描述生成人物在咖啡厅喝咖啡的画面,点击发送可以看到一段时间后图像就生成好了,现在点击查看大图,可以看到我们新生成的图像在人物的长相特征和穿着上,是不是和原图保持了高度的一致性呢? 同时在人物改变姿势和所处环境的时候,我们也能感受到人物身上的光影也随着环境发生了改变,并不会产生单纯的抠图 p 图后的违和感,这就是如何修改姿势和视角。下面再来看第四项功能,如何固定造型修改环。 此次生成我们以这张图片为例,因为这项功能经常会应用在一些电商产品宣传图更换背景上,我们依然回到极梦 ai 的 生成页面,将参考图上传到预备窗口当中,在上传好之后,提示词就描述固定产品的造型,给产品更换一个沙漠的背景,背景中有金字塔和河流。 此外在生成之前,为了能够更好的固定产品的造型,我们可以点击上传产品参考图的位置,再点击之后会弹出一个叫做智能参考的窗口,在窗口中点击左下方这个人像图标, 此时就会识别画面当中的主体内容,在识别好之后,会以淡蓝色的形式覆盖在主体上面,以此来标记选中的区域。 看到这里我们就成功的选中了产品的主体部分,现在点击右下方的保存,这样一来我们在生成时就能够更好的固定产品的造型设计。下面点击生成,可以看到一段时间后效果就生成好了,成功的生成了我们在提示词中所描述的沙漠、金字塔 和河流的背景,且产品和环境之间在光影上十分统一协调。这里我们同样放置一张原图来对比一下,可以看到产品原本的受光以及造型是没有任何改变的,而背景的受光 地面上的影子则主动迎合了原本的产品进行了生成。所以和上一个演示不同,这种锁定主体的生成方式是不会改变主体本身原有的受光的。我们下面来看第五个功能,就是参考风格,我们此次生成就以这张图片为例,回到生成页面, 将图片作为参考图上传到预备窗口当中,在上传好之后,提示词这样书写参考图片的风格。生成配色姿势,设计不同的图片,现在点击发送,可以看到一段时间后符 和要求的四张图片就生成好了,在设计配色和人物姿势上都产生了不同的效果。我们继续来讲解第六项参考图生图功能,那就是 control night。 如果大家使用过 stable diffusion 的 话,相信对这项功能并不陌生,或者多少听说过这样的功能,其实在极梦 ai 上 同样有这样的功能。回到极梦 ai, 我 们将下方的图片模型由四点零更换为三点零,在更换好之后,点击图片预备窗口中的图片,此时弹出的窗口在选项上和四点零模型会有很大的差异。 可以看到下方提供了更多的图片参考选项,有智能参考、角色特征、人像写真、主体识别、风格参考、边缘轮廓、紧身和人物姿势。其中后三项就是和 control night 相关的功能, 我们现在选择这里的边缘轮廓,可以看到右侧就会输出对应的检测图,将人物的线稿轮廓进行锁定,点击右下方的保存,此时再生成新的结果,就会生成在轮廓和设计上 与参考图非常近似的结果。比如现在我们输入将图片的色调改为黑金色调,现在点击发送可以看到由于锁定了人物的线稿轮廓, 所以最终生成的效果人物在造型设计上就和我们上传的参考图保持了高度的一致,但同时也不难发现最终生成的结果在环境的表现上并不是很好,同时也并没有很好的理解我们的意图。我们要的是黑金色调相关的设计,而并非将人物变成金属质感。带有黑色装图的人物 也是三点零模型和四点零模型之间的差距,对于语言的理解能力,四点零模型会更胜一筹。而其他的三点零模型当中,和 control night 相关的参考图升图功能亦是如此。 例如现在我们来看下一项功能就是景深检测,这项功能通常用来修改一个风景图的四 g, 例如现在我们上传一张风景图,然后将检测类型改为景深。在修改好之后,可以看到右侧的检测图就成功的检测出了我们 所上传这张风景图片的深度,点击保存。而提示词方面,我们就书写将季节改为冬季,回车发送一段时间后,修改了季节的图片就也生成好了。现在点击大图看一看效果如何吧。 可以看到最终生成的结果并不是十分理想,虽说整体的画面深度和原参考图相比,确实在深度构图上保持了高度的一致,但也不难发现 整体的美术风格发生了巨大的变化。所以需要大家知道的是,这项功能同样是一个比较过时的功能,大家想要改变图片的季节的话,还是建议将图片生成模型修改回四点零模型,然后直接在提示词中描述将季节改为冬季。 说四点零模型并没有专用的 control night 相关功能,但我们在修改时只需要在提示词中强调其他部分保持不变,然后点击发送可以看到,通常来说就能获得比使用了深度检测更好的转换季节的效果,在美术风格上与原图保持了高度的一致。 下面再来看第三项 control night 功能,那就是人物的姿势检测, open pose。 现在上传一个人物的图像,我们依然是以这张图片为例,在上传好之后,将图片的生成模型修改为三点零模型,然后点击图片预备窗口中的图 片,将参考方式选择为最右下方的人物姿势。记得在选择好之后,要修改一下生图的比例,改为适配当前参考图的比例, 这里我们就选择九比十六。可以看到,此时的检测图就非常完整的检测出了人物的骨骼轮廓,这就代表着待会生成的新的图片,在姿势上也会与这张图片的姿势保持高度的统一,而具体的设计 内容和风格就取决于提示词的描述了。在选择任意的参考方式时,包括在使用四点零生成模型参考时,在左下方都会有一个参考强度的选项,这个选项通常保持默认即可, 当然具体要看生成的结果来决定。如果你觉得生成的结果可以再参考多一些原图,就可以将这里的参考强度调整的高一些,反之则调整的低一些,现在点击保存。而提示词方面,我们就新 描述一个人物的形象,例如这里我们描述一个穿着 j k 的 高中少女,现在点击发送可以看到一段时间后图片就生成好了。不难发现,生成这四张图片在人物的姿势上都与参考图保持了高度的一致,是一个正面双臂自然下垂的站姿。我们最后来看多图参考功能,这项功能很好, 就是字面意思,可以将多张参考图同时进行参考融合在一张图上。例如这里我们首先将图片生成模型修改为四点零,来获取更好的融合效果,然后分别将一件衣服的图片以及一个人物的图 上传到参考图的预备窗口当中。在实际操作时,大家也不仅可以上传两张图片,想要上传第三张、第四张也是可以的。不过上传的图片越多,在融合的时候可能融合的效果就会越差。在大多数情况下,我们也不需要用到那么多参考图, 现在就在提示词中描述,让图二的人物穿上图一的衣服。这里图二指的就是我们上传的第二张图片, 图一指的是我们上传的第一张图片,以此类推,现在点击生成。需要注意的是,在生成的时候,在宽高比上一定要选择合适的宽高比,例如当前的两张图片都是九比十六的,我们就选择九比十六,或者调节为最左侧的智能选项,让 ai 自行判定什么样的比例是最合适的。 段时间后图片就生成好了,我们点击查看大图,看一看效果如何吧。可以看到生成的结果就成功的让人物穿上了在参考图当中,我们所提供的碎花长裙,且人物的长相特征、姿势都是保持不变的,与周围环境的光影也融合的非常恰如其分。 当然,如果有对应的鞋子或者帽子,或者像眼镜这些内容想要穿在人物的身上的话,我们可以一并将这些内容相关的参考图上传到预备窗口中,并在提示词里面描述对应的要求。 相信大家都具备举一反三的能力,所以这里就不再做荣誉的演示。那么以上就是关于本期极梦 ai 参考图升图功能的全部讲解,如果觉得本期视频的内容对你有帮助,也不妨点赞、关注、支持一下,我们就下节课再见! 大家好,我们这期视频来讲解像刚刚那样的水墨风格的短视频该如何用极梦 ai 制作。来到极梦 ai 的 首页,我们这次生成依然使用 的是 agent 模式。在提示词方面,我们就书写生成十六张水墨风格的故事图片,要求前后连贯,有逻辑。故事讲述的是中国古代故事,彩色水墨风格,中式美学,人物造型 简洁生动可爱比例十六比九。和上节课的流程类似,一段时间后,我们就获得了由 agent 模式所生成的十六张前后连贯且具有逻辑的中国古代故事风格。是彩 色水墨风格,带有中式美学,可以看到整体生成的效果还是非常不错的。像这样由 a g 的 模式所生成的带有前后逻辑的 图片,如果说不做额外的要求,通常 a g 的 模式是不会给我们回值具体的故事内容是什么的。我们可以通过生成的图片所使用的提示词来分析出当前的故事讲述的是什么内容。 看到像第一张图片是一个年轻的女画家正在专心的作画,而第二张图片是画家在取水的时候,有一条鲤鱼闪闪发光,紧接着鲤鱼化做人形,并且指导这个小画家如何进行作画。所以这一系列图片大致讲述的就是一个小画家的奇遇,接受了来自于湖中 神仙的指导,变得更加擅长绘画。那么了解了大致的故事梗概,我们可以从生成的这十六个结果当中,挑选一些我们认为比较好的结果,特别是像这种场景当中带有人物的,我们最好能够保持人物的一致性,所以在人物的造型方面要有所筛选,有时可能会需要重新生成分镜头图片, 再将这些分镜头图片生成好之后,我们下面要做的事情就是将它们下载到本地电脑,根据出场的前后顺序,以及我们对故事的了解,从小到大,从前到后进行标号。在标号完成之后,我们下面要做的事情就是回到极梦 ai 当中,使用智能多帧功能来生成一条连贯的视频 图片,与图片之间使用不同的运镜和画面描述。比如第一张和第二张图片,我们使用的是推镜头,但和上节课的运镜描述会有所区别。这样的区别主要源自于画风的差异, 我们当前生成的是有大量流白的水墨风格,且除了这样的风格外,故事本身也伴随着一些神话色彩,会出现一些超越常识的画面表现。所以我们这里来举几个例子。首先将生成模式切换为首尾帧生成 来看第一个分镜头画面,我们生成的是推镜头,镜头推进来到窗外,自然过渡到下一张图片,此时的第一张图片是这个样子的, 而第二张图片是这个样子的。可以看到在景别上,两张图片基本是一致的,近景画面镜头的高低也基本一致,所以我们要做的事情就是在同一高度下对镜头进行运镜,这里就使用了推镜头。而像第一张图片,画面当中是有窗户的,通常像这样的画面,根据我们观看一些影视剧的经验, 常导演会安排一个镜头向窗外推进的运镜,所以这里我们就使用了同样的运镜,让镜头推向窗外来展示下一个画面。现在点击生成一段时间后,视频就生成好了,可以看到整体的效果还是不错的。镜头逐渐向窗外推进, 展示到第二张图片的画面,同时得益于水墨风格的加持,像画面当中一些事物的消失和出现也显得非常的自然。 我们刚刚讲过,此次生成的故事会带有一些神话色彩,所以可以看到像第二张到第三张所展现的故事其实会相对抽象一些。第二张展现的是现实世界中年轻的小画家遇到锦鲤时的画面,而第三张则展示的是锦鲤化做人形,将神笔 赐予小画家的画面。这样的画面也许是梦境,也许是锦鲤化成的仙女,将小画家拖入了异空间。因此对于这样的画面,我们就需要根据画面原有的内容来 发挥我们的想象力,来设计一个巧妙的转场效果。例如这里的提示词,我们就填写降镜头,镜头从水面进入水中,自然过渡到下一个 图片。我们以镜头逐渐入水的方式,营造出一个在水下的异空间,让第一张图到第二张图的过渡变得合理。现在点击生成看一看效果如何。一段时间后视频就生成好了,可以看到这样的转场效果也是比较自然的。镜头不断下降进入到水底, 水底展示出第二张图片所显示的画面,当然每次生成都会伴随着一定的随机性,如果对当前的视频片段生成结果不满意,可以点 击下方的再次生成。越是一些极具创意的转场效果,生成起来,生成好的概率越低一些。在实际制作中,如果大家同样是制作一些带有神话色彩的故事,其实类似的情形还有很多,届时大家要具体问题具体分。 至于像其他的分镜头画面,在转场效果上和我们之前所学习的就基本一致了。例如像平移镜头或者平移后旋转镜头, 可以看到之后的图片,在镜头的景别上都是基本一致的。所以我们使用的无非是推镜头、拉镜头或者是旋转镜头。无论使用何种镜头,关键在于让转场的效果更加巧妙,更加自然。我们最后再来说一下剪辑 成片的相关技巧。在剪辑这样的短视频时,由于镜头与镜头之间的转场衔接都是以十分丝滑自然的方式进行的, 所以通常不需要添加转场效果。所以更多的时候我们进行的是配音和配乐。在配乐方面,就根据画面的风格和内容,在左上方的音频分选项中搜索对应的题材。比如我们当前搜索的是国风,当然如果你的视频需要商用的话,也 通过 ai 来生成一个国风音乐。此外就是音效的部分,在不同的场景下,我们要根据生活经验的常识来判断哪些部分该加入什么音效。比如像当前的画面是一个倒水的镜头,我们所添加的音效就是一个倒水的音效。还有像这一段理 鱼从水面跃入水底,我们所添加的就是一个物体掉入水中的音效,还有像这里神女赐予神笔的画面,我们所添加的就是一个魔法发光的音效,好像山顶上有风的音效,鸟鸣的音效以及有孩童的画面,孩童欢声笑语的音效。大家在实际制作时,根据当前画面可能 出现的声音以及可能出现的位置来添加相应的音效即可。那么以上就是本期视频的全部内容,在制作这个短视频时,我所使用的素材以及提示词都整理成一个文档放到评论区的置顶了,大家需要的话可以自取。 也希望大家通过这两节课的学习,能够掌握这种首尾真生成时,不同的警别之间该如何转场的要领。如果觉得本期视频的内容对你有帮助,也不妨点赞关注、支持一下,我们就下期视频再见。 在上一期视频中,我们使用 ai 大 语言模型生成了剧本和脚本,这期视频我们将利用已经生成好的剧本脚本来生成分镜头图片。首先我们需要了解为什么要生成分镜头图片。在大多数时候,想要制作 ai 视频片段, 我们都并非在 ai 视频平台以文声视频的方式直接生成,因为本身生成一条 ai 视频在资金和时间成本上消耗不低, 使用文生视频的方式有太多的随机性,极有可能生成十条视频,有五条都是不满意的结果。因此在大多数情况下, 我们想要生成 ai 视频片段,采用的方式都是先生成图片,再使用图生视频的方式,以此来更加可控的生成视频片段。所以生成图片是制作 ai 视频作品必不可少的一环, 是最花时间的一环。我们这节课会从前期准备提示词结构、提示词描述技巧以及图片修改技巧四个方面来讲解和分镜头图片生成相关的知识。 首先来看生成图片的前期准备。通常来说,一则完整的故事都是需要故事当中出现主要人物或者说主要事物的。所以首先我们需要对故事当中的主要人物进行造型设计。 通常来说,在生成的脚本当中就会包含简单的对人物造型的描述,比如我们上节课对陌生的描述就是树发浅灰不一。因此如果甲方或者我们自己对生成的主要角色并没有特定的要求,可以直接在 在提示词中要求根据脚本生成陌生的全身正面。角色造型比例是多少,风格是什么可以看到,此时我们就直接获取了关于角色造型上的一个设计。当然,除了根据脚本当中已有的简单描述对角色的造型进行设计之外,我们同样可以根据自身的想法 来单独设计角色的造型。比如人物没有束发,可能是披头散发的状态,或者是短发。人物的服装不是灰色的,可能具有更加华丽的设计和其他的颜色。这些内容我们可以直接用正常描述的方式告诉 ai, 是可以生成对应的结果的。再来看前期准备当中的第二点,对故事画面的美术风格进行设计。要知道大多数的影视作品在美术风格上都要保持前后的一致性,不能说前期是写实风格,后期就突然变成了三 d 风格,所以这里我们也要预先对将来画面当中的美术风格 进行固定。这里同样是要通过提示词来描述,比如这里在生成角色造型时,我的要求就是高精度三 d 建模风格, 此时生成的角色就不像写实人物那般有着写实的比例和长相特征,而是更像是一个三 d 动画电影当中的人物长相。那么问题来了,如果我们喜欢某一张图片当中的美术风格,但又不知道该如何用提示词描述, 该如何获取这个风格的提示词呢?其实方法也非常简单,比如现在我们来到极梦 ai 的 首页,在这里可以看到很多由其他作者生成的作品,如果喜欢当中的某一个作品的美术风格,我们就可以点击查看大图。 以这张图片为例,可以看到右侧就展示了作者在生成这张图片时所使用的提示词,而我们要做的事情就是直接将这些提示词复制下来,在复制好之后, 回到豆包 ai 当中,直接 ctrl 加 v 粘贴,然后按住 shift 键再按下回车另起一行,此时向豆包 ai 这个大语言模型提出要求,去除上述提示词中对具体事物和氛围的描述,只保留画面美术风格相关的提示词, 然后点击发送可以看到,这样一来,我们就快速的从其他作者的作品当中提取出了和美术风格相关的提示词。 当然,由 ai 提取的和风格相关的提示词未必都是准确或者说我们需要的,所以在使用时还需要经过一次人工的筛选,比方说当前所提取的这些提示词中,像全景航拍就并非是对美术风格的描述,而是对景别的描述,在使用时最好先将其删除。 我们下面就对刚刚所提取的提示词进行一定的删减,同时配合自己新增的提示词描述, 生成一组图片,看一看效果如何呗。可以看到最终生成的效果在美术风格上是不是和刚刚我们所见到的那种带有三 d 质感的图片非常的接近呢?当然在很多时候使用这样的方法, 由于生成的主题不同,在美术风格的最终表现上也并非绝对能够完全贴合我们参考时作者生成的图片。大家可以多对提示词的描述,根据自己的理解,结合生成的结果进行修改,以此来满足自己对画面风格的要求。 回到豆包 ai, 我 们继续来承接之前的内容,在设定好角色也就是陌生的形象之后,我们自然要继续设计画面当中出现镜头比较多的 零露的形象。这里我们就继续向豆包 ai 要求用相同的风格生成脚本当中提到的零露,可以看到最终生成的效果也非常出色,成功的生成了零露的形象。当然大家同样可以靠自己的想象来描述零露都有什么样的特征。我们现在已经获取了人物造型的设计, 同时也规定了画面的美术风格。下面要做的事情就是书写提示词描述来生成脚本当中的每一个分镜头了。主要有这六个方面, 分别是景别,比如近景、中景、远景等等。第二个方面是画面当中出现的事物,像人物、动物、环境等等都是画面当中出现的事物。而第三点是时间和光照,白天、夜晚、傍晚的光照是不同, 同时光照也可以来自于不同的方向,像正面光、侧逆光等等,能够表达的人物情绪也有区别。 而色调方面,包括冷色调、暖色调,或者可以用某一部电影当中的调色,比如教父的风格等等。而构图方面则包括水平构图、对称构图、 s 型构图等等,可以让生成的画面体现更多的情绪。最后一点是质量词, 像胶片颗粒质感、电影感构图、超高清十六 k 等等,这些词汇都能提升生成结果的画面质量。例如在设计好陌生和零露的形象之后,我们就开始了第一张图片的生成,这张图片就集合了刚刚 所说的提示词结构相关要素。景别方面要求是航拍镜头远景,而这里的白天、晴天则是在描述画面当中出现的事物, 像胶片、颗粒质感、电影感构图、超高清、十六 k、 三 d 高精度建模则是带描述画面的美术风格 以及相关的质量词。可以看到,在这些描述当中,我们并没有描述色调,这里主要是从两个方面考量的。第一个方面,本身 ai 生成的图片在色调上表现的就足够优秀了, 不需要去单独的提及或者调色,即便要调色,也可以用后期的剪辑软件,以更加可控的方式进行调色。第二方面就是我们在生成图片时 刚刚所提及的各种提示词结构,并不是每一种都要在生成图片时使用,比如说景别,有时候我们不去描述,但要求生成的内容是人物的证件照,通常也会采取近景取景框、指框选人物上半身的方式来生成人物的证件照。 所以在很多情况下,我们就主观的描述自己想要生成的画面,无需考虑刚刚我们所讲解的提示词结构,也是能够生成很好的效果的。当然,如果生成的质量不佳,我们自然还是要根据刚刚的提示词结构来了解如何去完善当前所书写的提示词,生成更加令人满意的效果。我们 下面再来看生成图片时的提示词描述技巧。首先第一点,提示词描述尽量直观、客观,和写作文、写小说是不同的。在生成图片时,太多的修饰词可能会导致 ai 误判我们的意图。比方说我们上一节课所展示的说长城蜿蜒的像一条巨龙, 我们的目的并非是要生成巨龙,而是在描述长城本身这个建筑的宏伟景观。但很多时候 ai 是 不会了解这样的华丽的词造的。类似的描述还有鲫鱼越出水面飞得很高,就像是长了翅膀一样。 用这样的描述来生成图片,也极有可能会让 ai 认为我们要生成长了翅膀的鲤鱼,而并非在描述鲤鱼飞的很高。可以看到此时生成的结果就当真生成了一条长了翅膀的鲤鱼。因此在描述时要保持直观和客观。第二个技巧,脚本只是参考 画面描述,主要还是要靠自己思考。在很多的 ai 视频生成教程当中,会有一些教程会教大家直接复制粘贴脚本当中的提示词来生成分镜头画面。但事实上,在这些分镜头画面的描述中,会存在很多不合理或者不适合在同一个镜头下生成的内容。 例如我们看第一个镜头陌生有什么样的造型,青石有什么样的造型,同时还描述了陌生身上戴的这块玉玺是长方形的, 有淡白玉色,有简单纹路。但实际上我们都知道,在一个人物的全身,也就是打坐的画面中,人物身上所携带的这块玉玑是基本不可能看清上面有什么样的纹路,甚至看不清它具体是什么形状的,因为在整个画面当中的占比可能非常的小, 所以像这样的画面我们就无法在同一个脚本分镜头中生成,而是至少需要分为两个画面,一个画面是陌生在打坐的画面,另一个画面才是预觉得近景镜头特写。如果直接复制粘贴这里的提示词生成的画面就会非常的矛盾。所以大家作为导演, 在拿到剧本脚本之后,最好能够先在自己的脑海中形成一个完整的画面。在更多的时候,我们根据自己脑海中所形成的完整画面进行提示词的直观客观描述,这样往往能够生成更好的效果。而第三点就是 ai 目前能力有限, 有时需要适当的修改提示词描述的内容,或者在生成好内容之后,我们对剧本和脚本进行一定的更改。举一个简单的例子,例如像当前故事剧本当中的第一句话,他猛的睁眼,将手中的欲绝置在青石上, 欲绝滚落进西间。如果大家有一定的 ai 视频生成经验的话,会发现这一句话当中所描述的人物动作在 ai 视频片段的生成中其实非常难制作,人物需要先将手中的欲绝抛出,欲绝需要掉落在青石上, 同时在青石上还要进行滚落,滚落到西间见其涟漪。如果是真实拍摄视频,这串动作并不难做到。但实际上在 ai 生成时,这种涉及到诸多物理碰撞的内容想要制作成功是一件十分困难的事情。 所以这里我们不妨直接让玉玑丢进水中,同样能够表现人物打坐三日无法引气入体、内心烦躁的情形。 当然,在遇到类似的情况时,可以先尝试按照剧本当中可能更复杂但表现力也更好的画面去生成,如果做不出来的话,再考虑改为更加简单的画面。第四个提示词描述技巧,就是有角色说台词的画面时,尽量使用近景正面镜头,这同样是我们将来在给角色对口型时, 能否成功的给角色对口型进行考量的。在极梦 ai 当中,给角色对口型使用的是数字人功能,他需要我们先上传一段视频或者图片,再添加对应的配音。当我们需要对口型的人物是一个远景人物,且并非正面朝向镜头时,此时对口型要么会失败,要么效果非常不明显。 比如说我们来看这段视频,孤独使我的内心更加坚强。可以看到,虽说生成的画面人物的嘴部依然是有动态的,但整体的表现效果会相对一般,人物的身体也伴随着说话出现了不太自然的动态效果。我们再来看一个人物近景特写对口型时的画面,咕咚 使我的内心更加坚强,可以看到此时生成的画面,人物的口型和台词就十分匹配,且面部的动态表现比较清晰自然。所以当我们遇到有角色在说台词的画面时,就尽量使用近景和正面的镜头,以获取更好的对口型效果。我们最后来看图片生成之后的修改技巧。 在通过纹身图生成图片时,很多情况下并不能一次性就生成让人满意的效果,但也许生成的图片百分之八十是满意的,剩余的百分之二十相比于重新生成一张进行后期的修改是性价比更高的选择。或者有些时候我们需要表达一个很长的镜头 来表现画面的时间流逝,或者是人物的一连串动作。所以我们首先来看第一点,固定镜头下长时间事物运动的表达技巧。这里就包含很多方面了,比如我们现在想要表达一年四季的变化,那么在生成好人物盘腿打坐的画面之后, 我们就可以直接让 ai 大 语言模型帮助我们固定画面当中的人物造型和构图,但只改变画面当中的四季。 比如我们首先生成的第一张图片是类似于春季或者夏季,在提示词中,我们要求将上图的季节改为秋季风格,其他部分保持不变,此时就获取了人物在秋天打坐的画面。 同样的道理,我们继续描述,将上图的季节改为冬季,其他部分保持不变,那么最终就成功的将图片 改为了冬天的季节,有了这些图片之后,我们使用首尾针生成或者多针生成的方式就可以生成一组 人物,从春天到夏天再到秋冬天,一直在这个位置打坐,以此来表现人物十分勤勉、十分有毅力的镜头片段效果。当然,除了描述季节之外, 我们也可以描述将人物修改成某种姿势,在人物的身边添加某些事物,减少某些事物,其他部分保持不变,相信大家这里都能举一反三,我们就不再赘述。 第二个图片修改技巧,就是如何在保持造型和风格一致的条件下修改环境和状态的技巧。其实这一点在大多数情况下不需要我们特意去保持, 因为使用 ai 大 语言模型来生成图片是有上下文关联的功能的。比方说我们在刚刚演示时,提示词中只描述了鲤鱼跃出水面,飞的很高,就像是长了翅膀一样, 本身的意图是想单独生成一条跃出水面的鲤鱼,但得益于 ai 大 语言模型能够关联上下文的能力,他依旧认为我是想要基于上面这张图片来修改新的内容,而且可以看到生成的结果在美术风格上同 同样保持了上图当中的风格,所以很多情况下我们不太需要单独的提及要保持画面的风格。但需要注意的是,在实际的制作过程中,偶尔会出现我们上传了一张参考图,但生成的结果和参考图在造型上美术风格不统一的情况。 就像这里是我之前制作了一个 ai 故事短片,在制作的时候,像这张图片是一个已经制作好的角色造型,是一个三 d q 版卡通形象,但人物整体还是偏向于写实的特征。在上传了这个参考图,提出了相应的修改要求之后,可以看到生成的结果并不能让人满意。 虽说人物在造型的设计上保持了一致,但整个人物的比例和特点都发生了翻天覆地的变化。因此在遇到这种情况时,该怎么解决呢?最好就要更换一个图片生成平台。在使用不同的图片生成平台生成图片时,其实每一家所使用的生成模型都会有所区别, 有些模型擅长生成写实的风格,有些模型擅长生成绘画的风格,有些模型这个角度生成不好,有些模型这个风格生成不好,这些都是很常见的情况,所以大家在对图片的内容进行修改时,也不要在一棵树上吊死。 如果时代生成不好,除了用极梦 ai 或者豆包平台之外,也不妨尝试用其他的平台,比如说用可灵 ai, 或者像一些开源的使用 context 的 模型、 flex 模型或者 banana 模型的工作流都是可以的。例如现在来到利布利布 ai, 我 们点击这里的在 comfui 运行, 此时就来到了 comfui 工作流的操作页面。这是一个 context 的 模型的工作流,其基本功能就是参考图生图。在左侧的图像输入窗口, 将刚刚未能在豆包上生成成功的人物造型进行上传,在提示词描述当中描述我们的需求,例如这里我们就输入和在豆包上一样的提示词,根据图片生成人物特写,生气、拍桌子、表情愤怒,而比例方面我们修改为十六比九,然后直接点击开始升图, 看到一段时间后,图片就生成好了,整体的生成效果还是非常出色的。我们将在豆包上面生成的人物造型放在旁边,同时将原版的人物造型参考也放在旁边。 可以看到在对比之下,显然使用 context 的 模型工作流能够生成人物的造型更加统一的画面效果。当然在豆包上大多数情况下是直接可以修改的,只是偶尔会出现这样的问题, 对界时也不妨尝试使用其他方式,在保持人物造型和美术风格的情况下,来修改环境和画面当中事物的状态。最后一点就是灵活的使用参考图生图的功能,要知道参考图生图不光只局限于上传单一的图像参考,目前大部分的图像生成平台都是支持多图参考的, 比如现在我们将陌生的人物形象和零度的人物形象同时上传,在上传好之后,输入提示词,生成人物骑着白鹿在丛林中的画面,然后点击发送,可以看到最终生成的效果。既保留了零度的形象,也保留了陌生的形象,同时也符合了提示词中 描述的人物在丛林中的画面的要求。在很多其他的事物无法生成出来或者生成的结果不符合要求时,同样可以使用多图参考功能, 将指定的物品按照提示词的要求进行结合,灵活的使用参考图生图的能力。最后来简单总结一下这节课我们讲解了图片生成的相关知识,包括前期准备提示词结构 提示词描述技巧和图片修改技巧,这些知识能够帮助大家在生成分镜头图片时更容易生成出理想的画面。当然大家在实际操作时遇到的问题,我会尽可能帮助大家解决,在操作过程当中遇到的问题, 同时也会分享相关的课程资料。以上就是本期视频的全部内容,如果觉得本期视频的内容对你有帮助,也不妨点赞、关注、支持一下,我们就下期视频再见! 大家好!在先前的课程中,我们已经讲解了 ai 剧本脚本该如何生成,以及如何根据我们所生成的剧本脚本生成对应的分镜头图片。这节课就到了正式的生成 ai 视频片段的环节了。目前市面上的 ai 视频生成平台有很多,我们该如何选择呢?根据我这些年的使用 经验,综合操作的便利性、生成的效果和平台所提供的功能来看,通常我们制作一个完整的 ai 视频作品,能够用到的平台有三个,分别是可琳 吉梦和 made journey。 我 们下面就分别对这三个平台进行逐一介绍。首先来讲解吉梦平台的视频生成功能,来到吉梦 ai 的 首页,可以看到在这个页面的最上方我们就能够找到相关的生成选项。其中默认的这个 agent 模式是允许我们输入任意的要求。当 当前平台会根据已有的功能来尽量满足在提示词中所输入的要求,但目前这项功能还不算特别智能, 生成的效果有时会不符合我们的想象,所以要专门生成视频的话,我们还是使用专门的生成功能比较好。点击左侧的生成分选项, 来到专门的生成页面,然后在左下方将当前的功能切换为视频生成功能。在几乎所有的 ai 视频生成平台中,视频生成都分为两个类型,一个是文声视频, 另一个是徒生视频。需要强调的是,几乎在所有的情况下,纹身视频都不是一个明智的选择,因为纹身视频在内容上是较为不可控的,无论是画面当中的形象,还是在生成视频时视频中事物可能发生的变化,以及镜头的运镜都存在相当多的未知数, 所以在几乎所有的情况下,使用图声视频才是明智的,更加高效的选择。当然,我们也会简单的讲解一下在文声视频时有哪些注意事项。既然是文声视频,我们所描述的内容就要远比图声视频要多,不仅需要描述画面当中镜头的运动方式和 和事物的变化,同时也要描述画面本身有什么。所以我们这里来回顾一下生成图片时的提示词基本结构。可以看到需要非常清楚的生成一幅画面就要描述关于画面的诸多方向,所以这里我们首先描述景别,例如近景,一个少女穿着白色毛衣,在白天 走在街道上,冷色调电影感构图。然后就是来书写质量词,例如胶片颗粒质感、超高清十六 k 等等。在描述好关于图片部分的内容之后,先不要着急生成,我们还需要描述和画面当中的运动以及运镜相关的内容。 先来描述运镜方面,像人物走路的画面就非常适合使用镜头跟随的运镜,我们就书写镜头跟随人物,而人物方面呢,我们就描述面向镜头向前走。现在生成一个图片时所需要的内容,以及生成一个视频时 所需要描述的内容都已经描述好了,就可以回车发送了。可以看到最终整体生成的视频效果还是不错的。 不过像人物的长相,画面的具体内容,街道上有无行人,人物的年龄,这些内容本身我们就没有描述,所以生成的也比较随机。 虽然整体视频生成的质量和动态效果是好的,但在内容上未必都是我们需要的。所以这里再次强调,不建议大家使用文生视频功能,大多数情况下就使用图生视频,那么今天说到图生视频,我们下面来看一看图生视频都有哪些功能,机制都大同小异, 所以我们就只讲极梦 ai 上的主要功能,大家在使用其他平台时注意举一反三。首先是最为基础的手绢图声视频功能, 这也是最常用的一项功能,这项功能需要我们通过戳拽或者点击上传的方式将图片上传到手绢图的预备窗口当中。在上传好之后,接下来就是输入提示词描述了。不同于文声视频, 图生视频本身上传的参考图就已经给出了充足的画面信息,因此在图生视频时,我们就只需要描述画面当中事物的运动变化以及运镜即可。 首先来描述运镜,这里我们就描述固定镜头,水在流动,风吹起人物的头发和草地。因为当前的画面我们要展示 的是我们在上一期视频中生成的人物在打坐的画面,因此无论是运镜方面还是人物的动态方面,都会相对显得比较静态, 所以我们需要尽量的让画面当中可动的部分进行一定的运动,将画面当中的水流还有草被风吹动的效果都可以在提示词中提及。在写好提示词后,就直接点击生成图,生视频时会直接根据图片本身的宽高比 来决定视频生成的宽高比,所以大多数时间就是上传图片,描述运镜和事物的变化,然后点击发送就可以了。趁着生成的这段时间,我们来讲解一下相关的参数设置。 先是视频生成模型,和其他平台一样,在选择视频生成模型时,版本标号越高的模型通常效果就越好,但消耗的点数也会越多,建议大家在使用时都选择版本标号最高的。这里的生成方式在即梦上有首尾帧升视频、智能多帧升视频和参考图升视频三项功能, 而宽高比方面通常选择自动匹配,时间方面有五秒和十秒可选,这里不是很建议大家在非必要的情况下选择生成十秒钟的视频, 因为视频生成的时间越长,画面当中的动态以及各种结构的可控性就会变得不可控,极有可能会生成失败。至于运镜方面,目前极梦 ai 上提供了一些运镜的模板, 运镜和我们自己手动输入提示词在效果上是一样的,所以如果不太清楚运镜该怎么描述,可以直接使用模板当中的描述,知道怎么描述的话,就直接在提示词里面描述,现在视频已经生成好了,来看一看效果如何吧。可以看到整个视频的动态效果还是不错的,水的流动非常的自然, 风也轻微的吹动了,人物的头发槽也在轻轻的晃动。像这样的视频生成,每次的效果都是有一定随机性的,如果对当前的效果不够满意,可以根据当前的提示词和生成的效果对提示词的部分加以改进,或者适当的修改原图当中的某些内容。当然如果觉得全部都没有问题, 就是因为随机性导致生成的效果不好,也可以直接点击下边的再次生成一条新的视频。我们下面再来看首尾真生视频, 就是字面意思,我们刚刚已经上传了手帧图,用手帧图生成了一个视频片段,通过手帧图生视频,人物在结尾时是如何表现的,画面中的事物在结尾时是如何发生变化的,这些都是未知数, 但手尾帧生视频则不同,我们现在再来上传一张尾帧图的图片到预备窗口当中,此次上传的是这张陌生在秋天的环境中打作的图片, 这样一来我们就可以控制生成的视频在伪真实是有怎样的事物变化和画面表现了。提示词我们同样书写固定镜头,水在流动,风吹起人物的头发和草地。这里进一步的我们要增加一个对于运镜的描述,叫延时摄影, 水快速流动,草快速摇晃,通过这样的方式让画面当中的水流和草的晃动能够更加迅速,以此来表现画面当中从夏季 快速到秋季的效果。至于时长方面,我们这里可以赋予它更长的时长,给整个的移轴摄影效果留出充足的时间。当然这里我们就选择五秒钟,其实也是够用的,现在再次点击生成一段时间后,视频就生成好了,来看一看效果如何吧。 可以看到最终生成的效果,虽然在落叶飘落到地面上的效果时还不错,但整个人物后方的水流效果就显得非常假了, 这也是生成的随机性导致的,可以考虑多生成几次来获取更好的效果。我们继续来看极梦 ai 上视频生成的下一个功能就是多帧生成,点击这里的下拉菜单,将首尾帧生成修改为智能多帧,此时就会多出一个图片上传窗口, 而我们要做的事情就是在第三个多帧上传窗口再次追加一张图片,将其拖拽到这个位置,此时可以看到在图片与图片之间有一个间隔的位置,点击这个间隔的有摄像机图标的位置, 会弹出一个文本输入框,这个位置是用来描述图片与图片之间在运镜和事物变化上的描述的。 我们上传的第三张图片是人物在冬季打作的画面,因此提示词描述基本上和上一张在季节上更替的描述 保持不变。当然因为有了前车之鉴,上一条视频生成的并不是很好,所以在提示词里面我们可以追加一个描述,那就是季节快速更替,同时将水快速流动这个选项进行删除,让 ai 自行来决定水该如何流动,然后复制下来, 点击确定。同样把上一段图片与图片之间衔接的提示词内容替换为当前的内容,点击确定。多帧生成功能。在图片生成时,它的上限不止三张,我们可以继续添加第四张、第五张图片,以此来生成一个连贯的、 时间较长的视频画面,来表现更多更长的画面当中事物的变化动态。例如像先前我就生成过一个使用四张图片合成的多帧生成的视频,就是这个人物在水中游泳的视频。可以看到整个视频的连贯性,还有人物表情的自然性还是表现的相当不错的。 视频的持续时长长达二十秒左右,不过像这样的长度对四张图片在人物长相特征和环境的一致性上要求就比较高了。我们回到最下方,现在图片和提示词都已经描述好了点 生成,看一看效果如何吧。可以看到最终在生成效果上表现的依然在水的动态上,不是很尽人意,这也是当前的视频模型本身的机制导致的。在遇到这种情况时,大家不妨尝试更换视频生成模型,以此来谋求更好的效果。所以我们下面来讲解一下其他的 ai 视频生成平台。 在讲解之前,我们来提一嘴最后的主体参考功能,这项功能允许我们上传画面当中事物的参考图, 比如上传一只兔子,上传一个帽子,提示词就书写兔子戴着帽子在做什么事情。这样一来会使得生成的视频内容在兔子和帽子的造型上保持和上传参考图一致的形象,但这种方法和文声视频类似,虽然一定程度上保持了画面当中所出现事物的造型是符合我们需求的, 依然在其他的方面,比如周围的环境、色调、氛围上是不可控的,比不上。我们先通过参考图生图的方式,将兔子和帽子生成在同一个画面上,然后在确保画面当中在色调、氛围和周围环境上也是符合我们需求的,再来进行图生视频。 因此这个功能我们就不再赘述,大家感兴趣的话可以上传参考图,配合提示词的描述,生成一段视频试一试。我们下面再来讲解一下关于可灵平台的使用方法。 来到可灵 ai 的 首页,需要先说明的是,这些视频生成平台在使用操作和功能上基本上大同小异,在可灵 ai 平台依然是点击左侧的视频生成选项,可以看到同样分为了文声视频 和图声视频,具体的操作也和在极梦 ai 上是一样的,所以我们就不再做过多的演示。唯一多出的一项功能是这里的多模态编辑功能,这项功能能够对视频当中已经出现的事物进行替换, 增加元素或者删除元素。我们就以替换元素为例,这里先前我已经生成过一条视频了,我们可以看一看效果如何。 就是这条视频当中显示老人在喂狗的画面,其实原视频是展示的老人在喂猫的画面,而参考图是一只狗。那么具体该如何操作,能够把视频画面当中的猫替换成狗呢?我们下面来简单演示一下。首先需要将进行多模态编辑的视频,通过拖拽或者点击上传的方式 上传到这个位置,在上传好之后,可令 ai 会分析视频当中都有什么事物,如果分析成功,会自动弹出一个窗口,在这个窗口中,我们的鼠标就变成了一个自动选区工具,可以通过点击的方式选中要进行替换的内容。 比如点击这只猫的部位,此时猫的身体就变成了绿色,如果某些地方没有变成绿色,我们就多点击几下, 绿色能够覆盖猫的全身,当然此时的绿色范围只显示当前我们所见的这一帧画面的内容,那其他真的画面是否也把猫给选中了呢?可以点击这里的预览完整选区选项,可以看到此时视频就开始自动播放,如果在整个播放过程中, 几乎猫的全身都是绿色,那么就说明整个猫在将来会被成功的进行替换。确认无物之后就点击右下方的确定选项,然后在下方我们需要上传一张去替换这个猫的事物, 可以自己上传一张图片,也可以选择官方所提供的素材。在上传好图片之后,同样会弹出一个窗口让我们选择。参考的是什么?参考的是长相,参考的是主体或者参考的是服装,通常选择智能参考就可以, 我们点击确认。最后是提示词描述的部分,可以看到这里,可怜 ai 已经给出了一个书写的模板,我们直接填空就行了。使用图片中的主体替换视频中的猫。这里之所以写主体,是因为图片里面这个东西具体是个什么也不太好判断, 是一只小黄鸭带了个兔耳朵帽子,所以直接描述主体就好了。而视频当中我们要替换的这只猫就很明确了,它就是一只猫,所以这个框里面就写猫, 这就是关于替换元素该如何使用。至于增加元素,我们在上传一条视频后,点击这个视频的位置,并不会弹出窗口,让我们设定在哪个位置来增加元素, 所以全屏提示词的描述,在上传好主体参考之后,可以看到下方的提示词描述框已经打好了模板,告诉我们基于视频中的原始内容,以自然生动的方式 将图片中的什么,我们就这里写主体融入视频中的什么。这里的这个框是用来描述你要生成的具体位置的,比如猫的旁边,这样一来生成的视频就会在猫的旁边来加上我们所上传的这个事物的造型。 而删除元素的话,和替换元素的操作方法类似,在上传视频之后会自动弹出一个窗口,或者我们点击已经上传好视频的位置,也会弹出这个窗口,通过选区的方式选中要进行删除的元素 确定。而提示词呢,就描述删除视频当中的什么,这里当然是写猫,这样一来新生成的视频这个猫就会被删除了。这就是关于可灵 ai 视频生成功能当中的多模态编辑功能, 具体该如何操作,不过具体的效果大家可以看到,向右侧视频当中的这条狗在替换之后,在清晰度上是远不如视频当中其他的部分的。因为要想使用可灵一点六模型,而可灵最新的是二点五 turbo 模型, 中间差了很多个版本,所以是否使用这项功能就看大家的取舍了。在更多的时候使用多模态编辑其实更适合去处理在现实生活中拍摄的视频,而非 ai 生成的视频。 毕竟在处理 ai 生成的视频时,与其在视频上处理,不如在源头,也就是在生成视频时所使用的图片上去处理 来的更加方便。我们在刚刚可令 ai 和极梦 ai 的 演示中,或多或少都出现了画面质量不佳,或者生成的动态效果不好的情况,这也是我们此次讲解要讲解多个平台的原因,那就是每个平台的视频生成模型都有各自的优劣, 可能在生成某些场景时表现很好,但一旦遇到一些特定的场景,比如像极梦 ai 遇到流水的场景,就生成的不尽人意。所以下面我们来讲解一下关于 made johnny 如何生成视频。 相信大家平时生成图片都是使用 discord, 所以 首先我们来到 discord, 在 任意的图片生成结果的右下方点击这个位置,此时就来到了 made journey 的 官网。 如果是第一次通过这种方式打开 made journey 的 官网,我们需要点击左下方的 sign in, 然后选择用 discord 的 账号来登录一下,在登录完成之后,点击左侧的 create 选项,这时就来到了生成页面,在这个页面可以生成图片,也可以生成视频, 这节课就只讲解生成视频相关的功能。点击左侧的图像加选项,在这里可以上传首尾帧图片。在图片上传好之后,我们来了解一下相关的参数设置。 首先是最上方的提示词输入,这里的描述方式和先前在其他的视频生成平台一样,主要描述的有两个方面,一个是视频的运镜,另一个是画面当中事物的变化。例如这里我们描述人物戴上墨镜。在写好之后,记得将提示词翻译成英文。 通常来说直接上传手帧图描述提示词,然后点击右侧的发送,就可以开始生成视频了。在生成的这段时间,我们再来讲解一下其他的相关功能。可以看到,在上传好手帧图之后,右侧 ending frame 是 上传伪帧图的地方, 它的使用方法和其他的视频生成平台一致,我们就不再重复的演示。但我们可以注意到,在下方有一个 loft 选项,我们将这个选项进行勾选,此时手帧图和尾帧图会自动视为同一张图进行使用这项功能。在勾选之后,我们会生成首尾相接的视频, 这样我们生成的视频就能够无限循环,手帧和尾帧之间能够丝滑的衔接。而最右侧的 motion 选项则是在设置视频生成的动态的分为低动态和高动态, 选择低动态的话,视频当中物品的运动就会相对柔和缓慢一些,而选择高动态视频当中事物的变化就会更加激烈,更加迅速。此外,在提示词输入框的最右侧还有一个 settings 选项,在打开这个选项之后,可以看到右下方还有进一步的参数设置。 首先是视频生成的品质,可以看到这里 s d 指的是高清模式,而 h d 指的是高清模式,对应的大约是一零八零 p 的 分辨率,而下方有单次生成的视频数量。可以看到当前我们所生成的视频一次性会生成四条视频, 而这里在设置数量区域,我们可以选择一次性生成一条或者两条视频。在视频生成好之后,将鼠标旋至在 生成好的部分,这一行就会自动播放预览当前的视频。可以看到在 matejoy 上面生成的视频在整体的质量和人物动态的自然程度上还是相当不错的。我们点击打开任意一条视频,再打开之后,在右侧会有相应的后续选项可选。 我们现在将页面进行汉化,来看一看这些后续选项都有哪些。首先是重新生成选项,在点击之后就会基于当前的提示词和手帧图进行重新生成。 然后是下方的将起始针作为重新生成的参数,或者将提示词作为重新生成的参数。再往下还有自动状态下的低动态和高动态可选。可以看到在这个位置还有一项功能叫扩展视频。 在点击这项功能之后, mate john 你 会将我们当前生成的视频作为一项生成参数。我们可以配合着提示词来描述这项视频在结束之后继续发生什么样的事情。例如当人物戴上墨镜之后,再让人物去吃个汉堡, 或者让人物摘下墨镜来做其他事情都是可以的。这项功能不同于极梦 ai 的 多帧声视频,它可以基于视频本身配合提示词的描述来延长这个视频的内容。当然我们也可以在这个位置追加一个结束帧来告诉 meghan 延长后的视频人物最终是在做什么? 虽然在操作上有所不同,但是在机制上, made journey 的 视频延长功能和吉梦 ai 的 多帧生成功能在底层逻辑上基本是一样的,只是在 made journey 上可能会更麻烦一些,需要先生成一个视频, 再用这个视频加上伪帧图来延长视频。以上就是关于 made journey 的 视频生成功能的具体操作。总结一下,我们这期视频讲解了 ai 视频生成的平台选择、纹身视频 及各个平台的徒生视频功能该如何进行操作。大家日常使用的话,通常选择极梦可灵就可以, 而极梦 ai 在 生成的性价比上也会更高一些,价格大概是可灵 ai 的 三分之一,同时生成的质量也并不比其他平台差。当我们遇到极梦 ai 平台生成不好的视频内容时,在 考虑使用其他平台看看能否生成令我们更加满意的效果,这也是我们一次性讲解多个平台的操作方法的意义所在。以上就是本期视频的全部内容,如果觉得本期视频的内容对你有帮助,也不妨点赞、关注、支持一下,我们就下期视频再见!

逼自己一周练完,其实你很会极梦 ai 前一百六十八集存下巴很难找全的警告,本视频耗时三个月制作,制作时长三百分钟,陪你系统学习极梦 ai 视频制作,这应该是目前抖音具良心的 ai 视频了,哪怕你是零基础也 能轻松学会。所有在教学过程中用到的指令呢,我都已经给大家整理完毕,有需要的小伙伴六六六抱走不屑!话不多说,我们开始上课,这一课我们来讲解极梦 ai cds 二点零 题日词的风格。在上一次视频中,我们讲解了 ai 的 绘画里题日词的框架有哪些,包括风格、视角、主体、背景、细节、光影和这两词。 当然其实除了主体描述之外,其他内容都不是 b 选项,你就算不写, ai 也能帮你生成,只不过可控性没那么高。所以为了让我们生成的画面更可控,今天我们来细分讲解在体式词中风格到底有哪些写法。 本期内容一共分为四个板块,第一个我们来讲解风格的重要性,第二个我们来去细分一下风格的分类。第三,我们利用一些工具来获取我们风格的体式词。第四点,风格的融合。 下面我们先来看第一点,风格的重要性。同一组体式中,如果风格体式的部分描述不同,那么生成的结果在划分上就会有很大的区别。 在我们之前进行测试生成的案例中,我们就能够看到同同样是生成一辆汽车,它们的画风和背景都有很大的差异。而在我们的首页的灵感界面中发现里面 我们去查看其他作者的作品时也会发现,在这些作品里面,几乎百分之八十以上都是偏写实风格,剩下大部分是三 d 风格,而动画风格、拼图风格能见到的数量会非常少。 之所以会有这样的占比,就是因为他们生成难度是以此递增的。往往在生成 ai 视频片段时,最容易生成的是真人显示风格,其次是三 d 卡顿风格,最后才是二 d 动漫风格。 所以我们说风格为什么重要,因为它不仅能决定画面最终生成的视觉效果,更重要的是它决定你今后在生成 ai 视频片段时的这个难度。 当然之所以会有这样的难度区分,主要还是因为训练 ai 视频生成模型时素材量多少决定的,写实风格素材更多,所以训练更加完善。至于这个问题,我们只能期待未来 ai 视频生成模模型不断迭代更新。 下面我们来说第二块风格的重要性。我们下面来看风格的分类, 总的来说,风格的分类大致可以分为三大类,而每个大类下面又能够继续细分。我们先来说第一大类,三 d 类。 现在我们在首页的搜索当中,我们去搜索一下三 d 关键字。 第一大类是三 d 类,比如说我们平时看的影视作品当中,飞屋环游记、 冰雪奇缘等,或者说我们玩过的游戏类似于像幻影、大标刻这类三页游戏。再比如说某些国国漫作品,像凡人传这种三 d 制作的国漫,都属于可以归类三 d 类。 三 d 类风格一共他们都有一个共同特点,他们在刻画精度上很多时候是相近的,因为大量的作品使用类的 这个引擎是相似的,尤其是虚幻引擎为主,比如说虚幻四、虚幻五,画面表现会有相似的底层质感。那么问题来了,为什么剑魔引擎相同,最终却能衍生出不同分类的三 d 作品? 原因就在于我们讨论风格时,除了引擎的质感,还可以进一步细分到美术设计。 你会发现同样是三 d 的 这个人物的长相特点、穿着特点、设计画面色调、后期色调,大家风格都可能不同,就比如说皮克斯风格,在色调上更明亮,饱和度更高。像我们玩过的游戏,放一大片的风格 更加的写实,人物比例也更加写实。而三 d 罗曼人物长相偏写实,但略有夸张,可能眼睛更大一些,鼻子更小一些,人物更美型一点。 所以总结一下 sunday 风格的题诗词,通常可以用公司动画公司、知名影视作品名称、知名游戏名称、引擎质感来进行替代描述。 就比如说这个作品,我们点去看一下它的体式词,这里就有三 d q 版匹克斯动画艺术,我们就可以以这些公司名称作为体式词, 来让我们的 ai 模型去更好地理解我们所要制作的作品它的一个最终效果。 下面我们来看第二大类,绘画类。这类风格大家其实并不陌生,因为它不仅包括我们常说的超画风、漫画风,也包括大量经典的人物绘画风格。 而绘画类风格最核心的区别往往不在于画的是谁,而在于美术设计和表现手法,构图是如何安排,用的是什么光影色彩是偏冷还是偏冷?笔触细不细,人物气质怎么表达等, 这里我用三个特别经典的案例来进行举例,你一下就能明白同样是人物画,风格差别能有多大。第一个是我们非常熟悉的蒙娜丽莎, 这类风格给人的感觉就是非常写实,非常克制,过度非常柔和。你会看到人物的绵变化不是硬切出来的,而是很细腻的渐变,整体氛围沉静稳重。 那如果我们用体式词去描述这种风格,就会更偏向于文艺复兴。写实肖像 柔和,明暗过渡细腻皮肤质感克制配色古典构图。 那第二个案例是米维尔的带珍珠耳环的少女, 它同样是肖像,但风格完全不同。它最突出的特点是柔光,尤其是那种从侧面打过来的光,让人物的这个脸部眼神深处的高光非常干净,背景又很简洁,所以人物会特别突出。 对应到提示词里,你就会更强调柔和、侧光干净,背景氛围细腻、高光低噪点的这个写实质感。 那第三感历来我们一起看一下博朗尼的伦勃朗的字画像, 伦勃朗最典型就是强烈的明暗对比,也就是我们常说的暗部非常深,亮部非常亮,人物从暗处被光刻出来的立体感很强,情绪也很厚重。 这种风格在题词里面更偏向于巴洛克风格,强对比面,戏剧化光影、暗背景以及强烈的这个体积感。 你会发现这三个作品都是这个人物化,但是他们的风格差差异来源于哪里? 来自光影逻辑、色彩策略、构图方式和刻画方式。这就是绘画类风格的这个核心, 更多的是在讨论美术设计上的风格差异。另外,绘画类还有一个常见的细分,就是刻画精细度,有的风格更偏向于概括和评图,明暗分区更简单,有的风格更偏向 厚图和写实塑造,明暗过渡更细腻,更接近真实的光照。专业点说就是平图和后图后或者是后绘之间这个区别。所以总结一下,绘画的风格,其实通常可以用传统 绘画类别、流派或者是年代标签、经典作品或者是画家名称来进行描述。你只要找到你想要的参考作品,把它的光影啊,色彩、笔触特点提炼出来,写进提示词里,生成的结果就会更接近你想要的风格。 第三大类是写实类。写实类其实是我们在做图腾视频或者做商业图片时最常用也是最稳定的一大类风格。 你在电视上、短视频平台上能看到很多,比如自然摄影风格、街头摄影风格、产品摄影风格以及人物摄影风格等。它们最常见的这个区分依据往往就是拍摄对象不同。 自然摄影拍自然风光,街头摄影拍城市与人文产品摄影拍商品,人物摄影拍人像。我们先从拍摄对象的来理解。写实 类自然摄影更强调宏大景观和真实氛围,比如说山川白云线、森林云海,它会使用大量的广角、远景 层次感以及偏真实的这个自然光街头摄影更强调瞬间和故事,比如人群街头、霓虹灯远反光,很多时候画面会带一些抓拍感,构图更自由。 产品摄影就更商业,它会强调主体干净、质感清晰,光影可控。比如白底 横拍、三点补光、反光板补光,目的就是把产品的这个材质、形状、细节拍到最清楚。 人物摄影则更强调肤质、轮廓、情绪,比如说半身肖像特写、眼神、发丝细节等。或者更明确的风格方向,像证件照、杂志封面、时尚街拍风等。 除了拍摄对象写之类,还有一个非常重要的划分,角度、设备带来的效果。比如胶片相机风格之所以存在,就是因为胶片带来的独特的颗粒感、色边和对比关系。 我们把这个再讲细一点,胶片往往会有更明显的颗粒感,暗部会更厚重一些,高光可能会柔和溢出, 整体颜色可能会偏暖或者是复古。在体式词里写胶片摄影,颗粒复古色调生成出来的照片,质感就会更像拍出来的。 相对的,如果你写数码摄影,超清锐利细节高动态范围,他就会更像现代相机拍出来的商业照片, 细节更干净、更锐利。甚至镜头也能成为一种风格。比如说五十毫米人像镜头会更自然,八十五毫米的人像镜头会更压缩,背景更适合拍这个肖像,广角镜头会有更多的空间感和 后置冲击。 除了设备,写实类还可以用镜头语言、拍摄手法来划分,比如前景深,背景虚化会让主体更突出,长焦压缩会让背景更靠近主体。 d j 的 仰拍会让人或建筑显得更气势,俯拍航拍会更像纪录片、大片的开展镜头。这些都属于写实类非常好用的分格词,因为它们能直接改变画风、 画面的呈现方式。此外,我们也可以用知名影视作品来划分分格,就比如说实际上中国他经常用 食物特写勾起人的食欲,近景、微距与热气、油光刀工细节,再加上柔和带有层次的这个灯光, 这种镜头语言辨识度足够高,很多人会把它当成一种美食纪录片风格。同理,像一些电影常见的电影级光影、 剧情片质感以及计时记录片风格,也都可以作为写实类风格的参照。因为他们有固定的构图习惯、色彩倾向,还有这个光影逻辑,所以你会发现风格的叫法其实并没有绝对的体系化。 你能直观感受到的特征,不管是拍摄对象、镜头语言、设备、质感、色彩、调色,甚至是某个影视作品的这个视觉风格,都可以称之为风格。大家在描述写实风格时,一个 最简单的方法就是先找参考案例,然后把你能观察到的关键特征拆出来写进提示词里。比如对象是什么?光线是自然光还是澎湃?镜头是广角还是长焦? 背景是虚化还是清晰?质感是胶片还是数码?这样写出来的提示词就会更加稳定、更可控,也更容易生成符合你预期的写实画面。 下面我们来看第三点,风格题时词的获取技巧。既然风格的划分角度这么多,你要凭空的举一反三,写出任何风格其实不容易,那怎么办呢?最有效的方法就是找参考,看其他作者是怎么写的。 那我们来到集美 i 的 首页,我们找到发现, 如果你相中了某一种风格,你就直接点开作者作者的这个作品,查看大图,同时去查看它的这个提示词。接下来要做的事情就是从提示词里面把风格相关的这个 词提出来。方法也很简单,现在我们 ai 时代可以利用大元模型、豆包和 deepsea 来提高我们的这个效率。 就比如说这里我们去找一个这个作品,我们去复制它的这个提示词, 来找到我们的购包助手,我们通过它来告诉他,去帮助我们去提取我们所需要的风格。 好,这样我们就可以快速的去获取题目的风格的相关的这个词语。 我们获取完这些风格题词词之后,通常能这些分格词能在一定程度上生成和作者相近的画面。那我们现在回到 gmail, 我 们去试一下, 我们去复制一下这些题词词, 点击生成。像之前它是一个仓鼠,我们这里可以改成这个猫咪, 然后点击发送。 好,我们可以根据生成的这几张图片来看,它的这个风格跟我们的参考图非常相近, 但是我们发现了他生成的这个角色主体是不是跟我们描述的所不一样呀?所以这这样这种情况下 我们就要去哎通过调整这个关键字,调整提词词来去达到我们所需要的这个效果了。以上就是这个风格提词词的这个获取技巧。 最后我们来看一下风格融合,风格融合就像杂交实验一样,有成功也有失败。 我们先来展示一下两组成功的案例,第一组案例,把这个三 d 皮克斯风格和我们凡人修仙传、传统国漫风格进行融合, 你会发现他的这个融合效果是不错的,原因在于他们之间有互补,皮克斯的这个人物更加的卡通,眼睛更大,偏孩童比例感人。悬疑悬疑传强调仙侠特效、 国风服装发型设计、场景设计,最终融合的结果就是人物奖项相比更偏向皮克斯,但服装发型场景还有它这个特效更偏向于这个国漫仙侠,这就是它们能够互补的地方。 那我们下面再来看一下这个第二组案例, 把上世纪八十年代风动漫风格和这个逆水寒风格进行融合,你会看到融合的效果是,呃,逆水寒提供这个背景服装画型设计, 而这个八十年代动漫风格提供这个刻画方式,一个是提供设计,一个是提供画法,两者不冲突,所以融合的也比较顺,但也会出现这个不融合的情况。 那不融合的情况呢?我们就可以用这个水墨风格加这个 type 风格,我们让它去进行生成, 就比如说我们用水墨风格加这个 type 风格,让它去进行生成,生成结果虽然会把两者硬融合在一起,但画面会产生很强烈的这个冲突感,看起来很不适。 像这两组的话,就看着非常别扭,这是为什么呢?因为在于两者的这个核心表达 会进行冲突。水墨风格它讲究这个大量的留白刻画,更加的这个抽象,更加的写意。而赛博赛博朋克呢,讲究发光 写实的这个金属质感,而发光效果需要这个暗部衬托,这就和水墨大量留白冲突。同时赛博朋克更加强调具体写实的细节,也和水墨偏抽象的表现会有其冲突, 所以多个角度来看,两者更像是在打架,拼到一起就容易让观众感觉不适。 大家尝试其他风格融合时,一定要去遇到类似情况,我们也可以用今天这个思路去进行分析,到底是哪一部分在冲突,为什么?为什么融合不起来?以上就是关键词里的风格相关知识, 希望大家通过这段视频的学习,能够掌握风格体式的这个会技巧,以及同时具备自己修改风格体式的这个能力,让 生成让自己更加满意的图片效果。

只需一张照片,就能做出这种动态邮票的效果。 先在大梦上传照片和参考风格,选择五点零模型,用这个提示词把照片转成插画风格,生成的图一定要和原图保持相同构图和主体位置,后面做动画衔接才会更自然。若进入视频生成,把原始照片拖进去,输入动态提示词,选择二点零模型, 让画面里的主体动起来。视频生成完成后,再用刚才的插画图对视频进行风格替换,最后放进剪辑软件,加一个简单遮罩,普通日常也能变成这种动态邮票视频。

逼自己一周学完极梦 ai 视频制作,存一下吧,很难找钱的。欢迎收看二零二六全新极梦 ai 视频系统教程。明明用的同一个极梦,为什么别人做的视频就能一发入魂, 符合预期效果,而你的视频却像脱缰的野马一样浪费积分不说,结果还得全靠运气。今天这期全是技巧,手把手教你从零到一,搞定完整 ai 视频,无论你是新手小白,还是有一定经验的老手,学完都会有所收获。话不多说,咱们直接开整。 hello 各位同学们,今天这节课我要带大家学习两个非常实用的知识点,第一个是 tile, 第二个是 personalized, 也就是个性化风格。这两个功能,一个偏图案生成,一个偏个人审美训练,都特别适合实际应用。 上课前,大家可以先在弹幕里扣个八八八,完成今天这节课的学习打卡。先来看第一个 tile。 不知道大家在生活里有没有见过这样的图案,比如窗、莲花纹、地毯图案、瓷砖、文样、包装纸、贴纸、背景。这些东西有一个共同点,就是它们都需要重复拼接, 而且拼接之后不能有很明显的接缝。 midori 里就有一个专门做这种效果的参数,叫做它哟,官方现在对它的解释很直接,它哟可以让图像的边缘和 自己拼接的更自然。适合做无缝重复图案,比如布料、壁纸这类需要连续铺开的设计,我们直接来操作一下。先来到 create 页面,在输入框里写你想生成的内容,比如这里,我想生成的是可爱的小鸭子 风格。二 d 扁平插画花纹图案提示词写好之后,在后面加上这个参数 tile, 然后把画幅调成一比一正方形,再点击发送。 这里我建议大家做 tile 图案的时候尽量优先用方图,因为它最适合做重复拼接。官方文档里也直接举的是单块 tile 反复平铺的逻辑。 生成完成之后,你会得到四张图,这四张图并不是已经铺好的一整张壁纸,而是四个可以拿去重复拼接的单块图案。这一点大家一定要理解,因为官网也明确说了,它有生成的是单个,它有不是直接帮你把整个大图铺满。 想看完整重复效果,需要你再拿去做拼接测试。比如这里我挑一张自己比较满意的图,把它保存下来, 然后你可以放到 photoshop 里,或者放到任意可以复制拼接的工具里,复制四份、九份、十六份,去看它拼起来是不是自然。 这里我就不演示了,大家去尝试一下。如果拼接之后边缘衔接的很好,没有很明显的断层,那就说明这个 tile 做成功了。这也是为什么这个参数在做布料、包装纸、背景纹样、贴纸底纹的时候特别好用。但这里我一定要提醒大家一个最新官网里特别明确的点 title 图不建议再做 upscale, 因为官方专门写了 title, 一 旦 upscale 往往会破坏原本的无缝拼接关系。 所以如果你的目标是做连续图案,那就尽量直接从原图里调效果,不要再对 title 做放大重绘。所以大家可以把 title 记成一句话,它不是让图变好看一点,而是让图更适合无限重复。好,接下来咱们来看第二个内容。 personalize 这个功能现在官网其实已经做得比以前更完整了,你可以把它理解成让 midori 慢慢学会你的审美偏好,然后生成更符合你个人喜好的图。 官方对 personalization 的 描述是,它像一个风格助手,你通过选择自己喜欢的图片, midori 会慢慢了解你偏爱的审美方向,并把这种偏好应用到你后续的生成中。所以 personalize 的 重点不是单次参考哪一张图, 而是让系统逐渐知道你整体更喜欢什么样的色彩,什么样的氛围,什么样的视觉风格。那这个功能怎么开启呢?首先来到官网里的 personalized 页面,你会看到自己的 global v 七 profile。 这个默认全局档案一开始是需要先解锁的, 解锁方式不是写 prompt, 而是不断去选你更喜欢的图片。官方现在的说明是,进入你的 global profile, 点击图片网格,持续挑你喜欢的图, 进度条,达到要求之后就能解锁这个 profile。 这里我建议大家在使用这个功能的时候,并不是必须做多少多少张测试才可以,因为官网现在更强调的是,你选的越多,系统就越懂你。 也就是说,不是只到达最低门槛就结束了,而是你后续继续选图,继续点赞,它都会不断更新你的个性化风格。除了局局 profiles, 现在官网还有一个很重要的新东西,叫 mood boards。 moodboards 也是 personalization 的 一部分,但它不是靠你不断选图训练出来的,而是你自己主动收集整理一组图片,做成一个风格版,让 mid journey 按这组图的整体审美去理解你的需求。 官方也明确说了, moodboards 属于个性化的一种,而且它比普通 style reference 覆盖的审美范围更广。 不过这节课咱们先把重点放在最基础的 personalize 开启和使用上。训练好之后,回到 create 页面, 在 imagine bar 旁边,你会看到一个 p 按钮,点击它按钮变色之后就说明个性化已经开启了。 你也可以通过下拉菜单去选择默认使用哪个 personalization profile 或者哪个 moodboard。 官方文档里对这一点写得很明确, p 按钮就是打开或关闭 personalization 的 入口。 除了点按钮,还有一种方式就是直接在 prompt 最后加上 p。 如果你想调用默认的 personalization 配置,直接写 p 就 可以。如果你想调用某一个特定的 profile 或 moodboard, 也可以把它对应的 id 放在 p 后面。我们来演示一下。 比如这里,我想生成一个正在吃棒棒糖的长发酷女孩,先把屁按钮打开,再输入提示词,把比例调成三比四,然后发送。生成完成之后再把同样的提示词 重新跑一遍,但这一次把 p 按钮关掉。这样一对比,大家通常就会看得很清楚,开启个性化之后,画面的整体色彩倾向、风格调性,人物感觉往往会更贴近你平时喜欢的方向。而关闭之后,它就是 mid journey 的 常规理解和 自由发挥。这里还有一个很值得顺手讲的新版细节,官方现在明确说了,当你开启 personalization, 不 数值会影响它的作用强弱, 也就是说 stylize 越低,个性化风格的介入会更弱。 stylize 越高,你的 personalization 风格感也会更明显。 当前 stylize 仍然是零到一千默认一百,所以大家可以把它理解成 stylize, 决定是不是按我的审美来, stylize 决定这种个人审美发挥得有多强。好到这里,这节课的两个重点就讲完了,最后我帮大家总结一下,第一个 tilde 适合生成无缝重复图案,特别适合做布料、壁纸纹样,但不要再拿 tilde 图去 upscale。 第二个, personalized 是 让 me journey 逐渐学习你的审美偏好,你可以通过 global profile 去训练,也可以进一步用 mood boards 做更明确的风格版,开启方式就是 p 按钮 或者直接提示词后加 p。 课后大家可以做两个小练习,第一个,用 tile 自己做一组重复花纹拼接测试一下。第二个,去 personalize 页面多选一些你真正喜欢的图,然后再回来试试同一个 prompt, 看看开启和关闭 p 之后的区别。 好,那么以上就是本节课的全部内容,如果大家在学习过程中有任何问题,欢迎在评论区留言。从下节课开始,咱们就可以继续进入应用案例部分了, 那我们这节课就先到这里,咱们下节课见!哈喽,各位同学们,从这节课开始,咱们就正式进入到设计应用实践的部分了。 前面大家学了很多参数参考图、风格控制,那从这一节课开始,我们就要把这些知识真正用起来。今天这一节课,我先带大家做一个非常实用的案例,叫做人物换装。 这个案例在电商展示服装上身效果图、模特试穿玉兰里都很常见。如果只是做一些基础款简单服饰的快速展示,用 me journey 来做前期效果图其实是非常方便的,也能节省一部分拍摄和修图成本。大家先在弹幕里扣个八八八,开始今天的学习。 这节课我们整体分成四步,第一步,生成模特图,第二步,准备服装图。第三步,把模特和服装先做一个基础合成。 第四步,再用 midori 把它们自然融合成最终画面。好,我们直接开始。先来看第一步,生成模特图。如果你自己手里已经有模特图了,这一步可以直接跳过。 但如果你只是练习或者手里暂时没有合适的模特,那就可以直接让 midori 先帮你生成一张,来到 create 页面,在输入框里写清楚你想要的模特特征。 比如这里我写的是一个帅气的中国男生,正面站姿摆造型,穿基础上衣灰色背景澎湃人像摄影高细节。这里我建议大家现在做这种案例时,模特图尽量写的简单干净,正面背景清楚, 因为你后面还要给他换衣服。如果一开始人物动作太夸张,或者衣服本身就太复杂,后面融合起来会更麻烦。 提示词写好之后,把尺寸调成一个适合人物展示的竖版比例,比如二比三,然后点击发送图片出来之后,咱们从四张里挑一张最适合的。这个时候大家不要只看脸好不好看,更重要的是要看 站姿正不正,衣服轮廓清不清楚,后面换装的时候好不好贴。挑好之后,把这张图保存下来。 接下来第二步,准备服装图。如果你的手里已经有产品图,尤其是白底图,那最好直接用就可以。 如果没有,也可以让 me journey 先帮你生成一张基础服装展示图。比如这里我想做的是一件黑色西装外套,那我就在 create 页面里输入完整的黑色西装外套,正面展示白色纯背景服装产品图。 这里的重点也很明确,尽量让衣服是完整、正面、白底干净的,因为白底图后面最好处理,也最适合做图层叠加。 这一组图生成出来之后,挑一张最合适的服装图保存下来。好,接下来就是这节课最关键的一步。 以前很多人做这个案例,会把模特图和衣服图先扔到 ps 里,抠图变形贴合一下。这个方法当然还能用,但现在 midori 官网已经有更方便的新功能了。因为最新版官网里的 edit 页 已经支持上传你自己的图片,加图层、移动缩放、擦除局部,甚至用 retexture 做整体融合。所以现在做这种基础换装,完全可以先在 midori 里完成一个初步合成。 我们来操作一下,先进入官网上方导航里的 edit 页面,如果你是从自己生成好的图点进去也可以,但如果你要上传外部图片,直接进 edit 页会更方便。因为官方现在明确写了 edit 页支持直接上传自己的 图片,还支持 layers 图层。先把刚刚保存好的模特图上传进去,上传好之后,在右边或者图层面板里再把服装图加成一个新的图层, 这个时候你就可以用 move 或 resize 把衣服拖到人物身上,缩放大小,调整角度,让它先大致贴到模特身上。 官方现在的 editor 支持移动、缩放、旋转,也可以改画符,这些都在同一个界面里完成。贴好之后,如果有些地方不合适,比如衣领太高、袖子位置不贴合、边缘太硬,这时候可以直接用 paint 擦掉一部分。如果不小心擦多了,也可以用 restore 补 回来。如果你觉得手动擦边缘太麻烦,还可以试试 smart select, 让 midjourney 先帮你做一个选区,再擦出。这一步大家不用追求特别精细,因为它的作用不是直接出最终成品,而是先给 midjourney 一个比较清楚的融合草稿。 也就是说,你先让系统知道人是这个人,衣服大概贴在这个位置,整体轮廓是这样的。调整到差不多之后,我们就可以进入下一步了。接下来第四步,让 midjourney 重新融合这张合成图。 这里现在有两种思路,第一种是把你刚刚在 edit 里合成出来的图直接继续编辑或导出,再拿去做 image prompt。 image prompt 的 作用是让 midori 参考这张图的内容、构图、颜色和整体关系。 官方现在对 image prompt 的 说明也很明确,它会影响内容构图风格和颜色。第二种是直接在 edit 页里继续做,利用它的 retexture 把整张图重新统一成更自然的质感。 retexture 的 作用是保留原图的结构和细节,重新生成整张图。 所以像这种先把衣服贴上去,再让整体更像真实拍摄的情况,其实就很适合 retexture。 但是今天我先讲第一种,这样大家会更容易理解一些。也就是把刚刚合成好的图上传到 midoriin, 作为 image prompt 使用。 然后在文字提示词里把人物描述和衣服描述重新写清楚。比如这里就可以写成一个帅气的中国男生,正面站姿,穿黑色西装外套,灰色背景横拍人像摄影。注意提示词里不要再写原来的白色长袖了,直接替换成新的服装内容。 接着我们再在后面加上 i w 三。 i w 是 图片权重,默认值是一,在当前 v 七里范围是零到三,数值越高,参考图的影响就越大。所以像这种我们已经做过基础合成,想让结果更贴近参考图的情况,用 i w 三会更稳一些。 发送之后,米芝妮就会根据这张合成草稿,加上新的文字提示词,重新生成一组更自然的结果。这个时候大家重点看什么? 重点看两件事,第一,衣服是不是更自然地穿到了人物身上?第二,画面整体是不是比我们自己手动叠图时更统一了?通常情况下, midori 重新融合之后,衣服和人物之间会比单纯硬贴图更自然。当然,它也不是百分之百完美。 如果你的服装结构特别复杂,或者图案非常精细, midori 还是有可能还原的不够准。这种情况下,你可以多 rerun 几次,或者回到 edit 里再规条一轮。 官方也写了 editor, image prompt 和后续修改是可以连续配合使用的。所以大家可以把今天这个案例的核心逻辑记成一句话, 先给 mijiri 一个清楚的换装草稿,再让它把这个草稿生成的更自然,这样你做出来的东西通常会比直接一句提示词给人物换衣服稳定得多。 最后我再给大家一个很实用的小提醒,现在最新版官网里,如果你只是想做简单换装基础服装展示, meiji 的 这套流程已经很好用了,但如果你追求的是特别精准的图案还原,特别复杂的服装结构,或者高一致性的商业精修,那 meiji 目前还做不到。 但没关系,我们可以结合极梦来完成精准换装修图,来达到最终商业交付图效果。那么下一节课我们来学习极梦的一些操作方法,以及后续 me journey 如何搭配极梦使用。好到这里,这节课的内容就讲完了,课后大家一定要自己动手试一遍。 你可以先从最简单的上衣外套开始,不要一开始就挑战太复杂的服装,这样你会更容易看到效果,也更容易建立信心。那么以上就是本节课的全部内容,如果大家在学习过程中有任何问题,欢迎在评论区留言,咱们下一节课再见! 哈喽,各位同学们,从这节课开始,我们就正式进入 cds 的 学习篇章了。如果说前面我们更多是在学 ai 升图,那从现在开始,我们就要把重点转到 ai 视频生成上。 而最近最值得单独拿出来讲的模型就是 cds 二点零,他不是简单的把视频做的更清晰一点,而是从底层能力上把视频生成这件事往前推进了一大步,官方现在对他的定位也很明确, c n s 二点零采用统一的多模态音频联合生成架构,支持文本、图片、音频、视频四种输入,而且重点强化了全能参考和编辑能力。所以这节课我们先不急着一上来就讲很复杂的工作流。 第一步,咱们先把一件事弄清楚, cds 二点零到底强在哪里,以及它和以前那种只靠一句提示词升视频的模型到底有什么本质区别。先给大家一个最核心的理解, cadence 二点零最强的地方不只是生成视频,而是它现在更像一个多模态视频创作工具。也就是说,你不只是可以给他一句文字提示词,还可以同时给他参考图片、参考视频、参考音频,让他综合理解这些素材里的构图、镜头运动、 动作节奏、视觉氛围、声音特征,再按你的要求生成结果。官方把这个能力叫做 all round reference。 全能参考 这件事为什么重要?因为以前很多视频模型参考方式都比较单一,你可能只能给一张图,或者给一句提示词,让它自己发挥。但 cadence 二点零现在的思路已经不一样了,它允许你把导演要表达的不同信息拆开给它。 比如人物用哪张图参考动作参考哪条视频,场景参考哪张图,节奏参考哪段音频。甚至官方还明确提到,他连文字版、分镜、脚本都能直接参考。所以大家学 cds 二点零的时候,一定不要把它只当成一个点一下就出视频的工具。 更准确地说,它现在已经是一个可以做参考混合人物替换、镜头迁移、动作复刻风格延续、视频续写和定向编辑的视频模型。好,讲到这里,我们就正式进入界面。 现在在即梦的视频生成里已经能看到 cds 二点零以及它的全能参考相关入口。官方公开资料里也确认了当前 cds 二点零的重点能力,就是围绕多模态参考和编辑展开。 这节课我们重点先看两个入口,第一个首尾帧,第二个全能参考,因为这两个入口基本已经把 cds 二点零和传统视频模型拉开差距了。 先说首尾帧,首尾帧这个功能特别适合做什么呢?特别适合做单段动作演示、首尾过渡广告镜头的小变化,或者人物从一个状态过渡到另一个状态。 你可以先上传一张图或者首尾两张图,再配合文字提示词,让模型在这两段之间完成一段合理的运动和变化。这里我们先做一个最简单的测试,比如上传一张男生玩滑板的图片,然后在提示词里写男生生完成一系列高难度滑板动作。 这时候我们重点不是只看他动没动,而是要看三个东西,第一,动作是不是自然。第二,人物脸有没有崩。第三,运动过程有没有明显违背物理规律。而这恰恰就是 cds 二点零当前最强的一块, 官方专门提到它在复杂动作、多主体互动、运动稳定性和物理还原上有明显提升,尤其是在高难度动作和连贯运动场景里生成,可用率更高。 也就是说,像滑雪、格斗、跳舞、竞技动作这些以前很多模型最容易翻车的地方, cds 二点零现在已经明显更稳了。所以如果你平时做的是炫技视 频、人物动作视频、体育感镜头、打斗镜头,那你会非常直接的感受到它和旧模型的差距。除了动作之外, cds 二点零还有一个特别值得拿出来讲的点,就是细节保持度。比如你在做产品广告的时候最怕什么? 最怕模型移动起来,瓶身文字糊掉,标签扭曲、细节变形。而官方这一次也明确提到, cdenx 二点零在生成质量上强化了细节稳定性、视觉真实感和指令控制力。我们来看一下上传两张产品图, 分别作为手帧和尾帧,并写好提示词,让它生成一段广告。来看一下生成结果,整体感觉还不错,很优雅。虽然它也还没有完美到百分之百 不出错,但至少在小字瓶身局部细节这种场景里,它比过去那种一动就糊的模型更值得测试。所以像化妆品广告、饮料广告、产品展示这些场景,首尾帧就会特别实用。因为这类镜头本身时长不一定很长, 但对质感、细节和可控性要求很高。而 cds 二点零正好在这三个地方都有提升。好首尾帧讲完之后,我们再来看这节课真正的重点,全能参考。 全能参考其实就是 cds 二点零最核心的玩法。官方对它的定义很清楚,它支持文本、图片、视频、音频混合参考,而且可以同时输入最多九张图片,三段视频、三段音频,再结合自然语言指令去统一生成。 这意味着什么?这意味着你现在做视频不一定非要靠一条视频做完整复刻,而是可以把不同素材的作用拆开。比如说我想要这个人物的脸,我想要那条视频的动作,我想要另一张图的场景,我还想参考一段音乐的节奏感, 这些东西现在都可以一起给到 cds 二点零,他会去理解这些素材各自承担什么作用,然后按你的文字要求去组织成一条新视频。这个能力为什么对大家特别重要?因为现在很多爆款视频本质上都是多素材拼创意, 比如人物替换、网红舞蹈复刻、炫技转场、 ai 角色套、真人动作、剧情短片里的多镜头串联。这些内容过去做起来要么靠剪辑,要么靠多段生成在应聘。 但现在全能参考的思路是尽量在生成前就把参考关系讲清楚,这样模型不是瞎猜,而是按你给的素材逻辑去生成。再比如现在网上很火的那种跳舞视频,我想复刻一条爆款舞蹈视频, 以前这种需求很难,但现在你可以这样拆,上传参考形象,再上传别人跳舞的视频,然后告诉模型图片,人物替换视频、人物参考视频人物的动作、出场方式、运镜和节奏生成视频,然后点执行, 其实就是一个非常典型的人物替换加动作迁移场景。而官方现在对 cds 二点零的说明里,也明确提到了他在复杂人物互动、主体一致性视频编辑、视频续写这些场景里的能力升级。 所以大家学 cds 二点零时,一定要养成一个特别重要的思路,不要一上来只想我写一句提示词让他自己做, 而是要先想清楚我这条视频里哪些东西最重要是人物、是动作、是镜头、是音乐、是场景,然后把这些要素拆开,分别给他参考素材,这样你做出来的视频会稳定的多,可控的多,成片也更容易接近你脑子里的预期。 另外还有两个值得你顺手提一句的新版能力,第一个是视频编辑, 官方已经明确说了 cds 二点零支持对指定片段人物动作和剧情做定向修改,这意味着它不只是生成,后面还可以改。第二个是视频续写, 官方的说法是它支持根据提示词做连续镜头延展,也就是你可以把印条视频继续往下拍, 这对于做一镜到底,剧情续接、广告镜头延续都会很有帮助。好到这里,这节课我们先把 cadence 二点零的核心能力梳理清楚了,大家最后记住五句话就够了。第一, cadence 二点零不是单纯视频生成,而是多模态视频创作。 第二,它的核心优势是全能参考,可以混合文本、图片、视频、音频。第三,它在复杂动作、物理规律、细节稳定和一致性上提升很明显。第四,它支持视频编辑和视频续写,不只是生成,还能接着改。 第五,他已经开始把声音和画面更完整的统一起来,下一节课咱们就可以继续往下走,开始更具体的拆解他的实操玩法。比如首尾真怎么写的更稳,全能参考怎么组织素材,人物替换和分镜复刻,到底怎么写提示词更高效。 好了,那么以上就是这节课的全部内容,那我们这节课就先到这里,咱们下节课见! 哈喽各位同学们,今天这节课要带着大家来做 ip 角色设计,不过这一次咱们要在之前课程的基础上再往前走一步。 前面我们已经学过怎么在 me journey 里设计一个角色,怎么让同一个角色生成不同的姿态和不同的表情。 那从这节课开始,我们要把这些静态设定继续往动态方向去延展。也就是说,今天这节课我们要完成的是 先用 midori 生成同一个角色的不同状态,再结合 sedence 的 首尾真功能,让这个角色真正动起来。所以今天这节课大家主要掌握两个重点,第一个,怎么在 midori 里生成同一个角色的多姿态和多表情。第二个,怎么把这些图接到 sedence 里, 做成一个角色动态展示小视频老样子,大家可以先在弹幕里扣一个八八八。咱们正式开始在做动态之前,第一步永远是先把角色本身定下来。 而且这一次我们不只要拿到一张单独的人物图,而是尽量一次拿到同一个角色的多个状态,这样后面不管是延展动作还是延展表情, 都会轻松很多。我们先来到 midori 的 create 页面,提示词的写法整体思路其实跟之前差不多,还是角色身份描述加外形特征加风格描述加 multiple poses and expressions 这个词组大家可以记一下, multiple poses and expressions, 意思就是多种姿态和表情。比如这里,我想做一个原创 ip 女孩角色,就可以这样写 一个可爱的原创 ip 女孩角色,长发大眼睛潮流穿搭角色设定图 multiple poses and expressions clear line art soft colors, cute illustration style 如果你前面已经有固定的人设,那就直接沿用你之前的人物描述,只需要在主体内容里补上 multiple poses and expressions 这一句就可以了。 接下来还有一个很重要的小细节,因为这次我们想让 me journey 一 次给我们生成同一个角色的多个状态,所以画面尺寸不要太窄。我这里会把比例从之前常用的竖版改成一个相对更宽一点的比例, 比如三比二。这样做的目的就是给角色的多姿态留出足够空间。设置好之后,直接点击发送升图。 稍微等一下图片出来之后,大家会发现 me journey 往往会直接给你一组同一个角色的不同姿态,不同表情。这个时候我们不用急着要求每一张都完美,重点是先挑一张整体角色最稳定、最像同一个人的图。 大家挑图的时候优先看这三个点,第一,角色脸部是否统一。第二,服装和配色是否统一。第三,整体风格是不是统一。只要这三点比较稳,后面延展起来就会容易很多。 比如这里我就挑这一张,把它保存下来。接下来我们要把这一张多姿态角色图拆成单张角色图。为什么要这样做?因为后面不管是在 midori 里 继续做动作延展,还是放进 cadence 做首尾帧,单张状态图都会比整组图更好用。这里最简单的做法就是把图片导入到 ps 或者任何你顺手的截图工具里,把每一个角色状态单独裁出来。 这里不用特别细致的抠图,只要把单个人物大致裁出来,能单独作为参考图使用就可以。处理好之后,把这几张图分别保存下来。这一步其实就是在为后面两件事做准备,第一, 让 midjourney 更稳定地识别这是同一个角色。第二,让 cadence 能直接拿这些状态图做首尾帧。接下来我们继续回到 midjourney, 点击左上角的图片按钮, 把刚刚裁好的这几张角色图上传进去。上传完成之后,选择 image prompt, 也就是图片参考,然后把这几张图都加入到参考区里。 这样做的目的其实非常明确,就是在告诉 me journey, 我 接下来要生成的还是这个角色,不要给我重新画成别人图片。参考准备好之后,我们就可以继续调用刚刚生成这个角色时的那段提示词, 然后把里面的 multiple poses and expressions 替换成你这一次真正想生成的内容。比如说这一次我想让它生成一个新的奔跑姿态,那我就把这里改成 running pose。 如果我想让它生成跳跃姿态,就改成 jumping pose。 如果我想做表情变化,那就可以写成 angry expression 或者 happy expression。 另外,这里还有一个很重要的参数,大家不要忘了,就是减减 i w, 也就是图像权重。 在 mid journey 里,减减 i w 的 范围是零到三。如果你想让生成结果更像参考角色,那这个值可以 调得稍微高一点。比如这里我就先写 running post i w。 二、然后点击发送图片出来之后,如果发现动作变化不够明显,那就说明 mid journey 可能太听原图了,这个时候我们就可以把 i w 稍微往下降一点,让它有更多空间去发挥动作。 同样的逻辑用在表情上也是一样的。比如我现在想做一个生气表情,那就直接把上面的动作词替换成 angry expression, 再重新生成。 这样我们就能在同一个角色的基础上逐步拿到更多动作图和更多表情图了。找到你想要的图,保存下来,接下来就是今天这节课最关键的一步了。 我们已经用 midori 拿到了同一个角色的多个状态,那现在就要把这些静态图接到 cadence 里,让角色真正动起来。打开 cadence, 进入首尾帧功能。 这里的思路非常简单,首帧放角色的起始状态,尾帧放角色的结束状态。比如你想做一个角色从奔跑到站立哭的动态过程,那就可以这样安排,首帧奔跑图,尾帧站立图。 上传好首尾针之后,接下来最关键的就是提示词。这里我要特别提醒大家一点, seedens 首尾针的提示词不要只写结果,要写变化过程。比如你不要只写角色奔跑,更好的写法应该是角色从快速奔跑状态逐渐变慢,最后停下来哭了。 奔跑中头发和衣服随着动作自然摆动,动作连贯,镜头稳定。这样 seedens 才更容易在首尾针之间 出合理的中间动作过程,而不是只知道你想要一个开始和一个结束。这一步跑完之后,通常你就能得到一个 非常适合做 ip 角色展示的小动画了。讲到这里,我帮大家把今天整套流程总结成一句最核心的话, midori 负责设计角色和扩展角色状态, seasons 负责让角色从一个状态自然过渡到另一个状态。 也就是说, me journey 更像角色设定工具, seasons 更像角色动态演示工具。这两个工具结合起来之后,就特别适合拿来做 ip 角色设计和角色动态展示。课后如果大家想自己练习,我建议不要一上来就挑战特别复杂的动作。 你可以先从最简单的三组开始,第一组站立到奔跑,第二组站立到跳跃,第三组平静到开心或生气,因为这三种是最容易看出效果的, 而且只要你把这三种跑顺了,后面再去做更复杂的角色动态展示,比如挥手、转身、回头、出场镜头就会轻松很多。好了,那么以上就是本节课的全部内容。 这节课咱们做成了一件很重要的事情,不再只是让角色停留在静态图里,而是学会了先用 midori 生成同一个角色的多姿态、多表情, 再结合 cedens 的 首尾帧,把角色真正动起来。如果大家在学习过程中有任何问题,欢迎在评论区留言,那这节课就先到这里,咱们下节课见!哈喽,各位同学们,今天这节课咱们继续来做 midori 设计案例,同时结合 cedens 视频实操。 这次我们要做的内容很有意思,也很实用,就是先用 midori 生成一套风格统一的儿童绘本图,再把这些图放进 sedence, 做成一个小短片。 所以今天这节课大家主要掌握两个重点,第一个,怎么用 mid journey 生成风格一致的绘本画面。第二个,怎么把这些绘本图放进 cadence 全能参考,做成一个有故事感的小视频?老样子,弹幕先扣一个八八八,咱们开始今天的课程。做绘本和做普通单张插画不一样,普 通插画你可能想一张图就够了,但绘本一定要有故事场景、顺序和连续性。所以在真正打开 midori 之前,咱们第一步先用 deepsea、 豆包这类大语言模型,帮我们把故事和分镜整理出来。 比如这里,我提前给豆包写了一个需求,我要用 midori 创作一套儿童绘本故事,请帮我设计一个简单的冒险故事,并生成故事简介, 每页画面内容描述,还有中英文对照。这样做的好处特别明显,因为后面你就不用再自己去想第一页画什么,第二页画什么,第三页怎么接,他会直接帮你把故事拆成画面。比如我这里拿到的是一个小松鼠的彩虹种子冒险故事。 简单来说,就是小松鼠朵朵发现能治愈森林小溪的彩虹,收集露珠、花香与 萤火虫光芒,克服小挫折后,成功让彩虹花绽放,让干涸的小溪重现生机,森林恢复活力。这是一段关于勇气与友情的温暖冒险。像这种故事就特别适合做儿童绘本,因为它简单清楚,而且每一段都很好拆成一幅画。接下来咱们 就进入 me journey, 但这里我要提醒大家一句,不要一上来就把所有分镜一起做。最好的方法是先做第一张图,把整套绘本的风格先定下来。 比如豆包给我的第一段画面描述,大概是儿童绘本风格,小松鼠棕褐色蓬松大尾巴,蹲在草地上远眺,好奇触碰泛七彩微光的彩虹种子, 周围三朵白雏菊,背景是光般散落的翠绿森林,远方小山坡,明亮柔和色调,俯视角度,那我就把这一段画面内容提取出来,放到 me journey 里。这里还有一个重点,如果你想让整套绘本都风格统一, 那这一步最好就把你喜欢的风格也带上。比如你前面课程里已经保存过自己喜欢的某一个绘本风格,或者你已经有一张很喜欢的儿童插画, 那这时候就可以把它作为 style reference 风格参考,一起喂进去。接着把尺寸改成更适合绘本的横版,比如三比二,然后发送。这一步出来之后,咱 们就先不急着往后做,先挑一张你最满意的作为整套绘本的机准图。这里挑图的时候,重点看三件事儿, 第一,小松鼠够不够可爱。第二,画风是不是你想要的儿童绘本感。第三,这张图能不能代表你后面整套故事的感觉?如果这第一张选的好,后面会省很多事。比如这里我会先把自己最满意的一张保存下来, 因为后面不只是第一页要用它,第二页、第三页、第四页咱们都要继续参考它。接下来咱们继续往后做第二张、第三张、第四张。 这一步的思路其实很简单,就是从豆包写好的分镜描述里继续复制下一段画面内容, 然后回到 midjourney, 沿用刚刚的风格参数继续生成。最方便的做法就是直接点前一组图下面的 use, 这样刚刚那组图的提示词、尺寸、风格设置就都会保留下来, 然后我们只需要把中间那一段画面内容替换掉就可以了。比如第二张图,豆包写的是老橡树洞旁戴树叶眼镜的灰白猫头鹰捧饭,黄谷书树下小松鼠举彩虹种子仰头 粉色耳朵,小白兔躲在松鼠身后露半脸,藤蔓缠绕树洞挂红浆果暖色调。那我就把这一段替换进去。 然后为了让第二张图里的小松鼠和第一张更像,我还会把刚刚保存下来的第一张图再作为 style reference 放进去。所以这里后面的每一页都尽量沿用前面的风格参考。如果觉得颜色还不够像,那就多跑几次,或或者适当调风格权重。 像这样做下去,我们就可以逐步得到整套绘本的关键画面。这里我建议大家第一次练习,不用做太长,先做四到六张关键图就够了。接下来就是今天这节课的重头戏了。 前面我们已经用 me journey 做好了几张风格统一的儿童绘本图,那现在就轮到 cedens 上场了。 打开 cadence, 进入全能参考,然后把刚刚做好的几张绘本图按故事顺序一张一张上传进去。这里顺序很重要, 因为它会直接影响你后面视频的剧情推进顺序。这样按顺序传进去之后, cadence 才更容易理解,这不是一堆单独的图,而是一段连续的小故事。接着就是提示词,这里很多同学最容易犯的错误就是只写一句,帮我生成视频,这样太笼统了。 更好的方式是把它当成导演提示来写。比如这里可以这样写,根据上传的参考图,生成一段温馨童话风格的儿童绘本短片,按照参考图顺序推进剧情。小松鼠朵朵发现能治愈森林小溪的彩虹种子,在小兔子团团的陪伴下,穿越草地、 森林和山谷,收集露珠、花香与萤火虫光芒,克服小挫折后,成功让彩虹花绽放,让干涸的小溪重现生机,森林恢复活力。 整体保持统一的儿童绘本风格,角色形象一致,画面柔和温暖,镜头轻缓推进,过度自然,像儿童绘本被轻轻翻开一样。这段提示词的重点大家可以记一下, 第一要告诉他按参考图顺序讲故事。第二要强调角色一致,风格一致。第三要告诉他节奏是温和的、绘本感的,不是那种特别炫技的运镜。 因为我们做的是儿童绘本短片,不是战斗片,也不是炫技片,所以镜头越轻越柔和,出来的感觉往往越对。讲到这里,我帮大家总结一下今天整套流程,其实就三步,第一步,用大语言模型生成故事和分镜。第二步,用 me journey 做出风格统一的儿童绘本图。第三步,把这些图放进 cadence, 全能参考,生成一个小短片。所以你会发现,这节课真正重要的 不是某一个工具单独有多厉害,而是他们串起来之后整个创作流程会有一天,小松鼠和小白兔在森林里发现了一颗会发光的彩虹种子,为了让种子开花,他们踏上旅程,收集森林里的彩色能量。旅途中也会有小小的挫折,但好朋友的陪伴会让勇气慢慢长出来。森林从种姓的的岁半下,而他们终于把这场奇遇变成了最温暖的故事。 以前你想做一个儿童绘本短片,你要自己想故事,自己想分镜,自己画图,自己带去做视频,工作量特别大。 但现在你可以让大语言模型先出故事,让 midori 出画面,再让 sedence 把这些画面动起来,效率会高很多。好了,那么以上就是本节课的全部内容。 这节课咱们完成了一件特别有价值的事情,不再只是停留在单张插画,而是学会了先用 midori 做一套风格统一的儿童绘本图, 再结合 cadence 全能参考,把这些图变成一个有故事的小短片。如果大家在学习过程中有任何问题,欢迎在评论区留言,那这节课就先到这里,咱们下节课见!

逼自己一个月学完,比付费强十倍,学完即可就能变现本视频耗时两个月制作,制作时长一百二十小时,带你一口气从零基础小白蜕变成大神!由于视频太长,本套教程会按照顺序依次发布,绝对是目前抖音最良心的入门到进阶的 ai 教程, 哪怕你是零基础,也能学会一天解锁一个 ai 技能。今天咱们专攻奇梦 ai, 明明用的是同一个 ai, 别人做的却乱七八糟,不仅浪费积分,最终效果 还全看运气。今天这期视频全是干货技巧,我手把手带你从零到一,搞定一条优质 ai 短剧。不管你是零基础小白,还是有一定基础的老手,学完都能直接上手,有所收获。全程不藏私不套路。我把压箱底的完整实操流程全部公开分享,还有相关的制作流程、专属提示词 以及配套 ai 工具,感兴趣的兄弟扣六六六!话不多说,咱们直接进入正题。哈喽,各位同学们,从这节课开始,我们就正式进入 cds 的 学习篇章了。 如果说前面我们更多是在学 ai 生图,那从现在开始,我们就要把重点转到 ai 视频生成上。而最近最值得单独拿出来讲的模型就是 cadence 二点零,它不是简单的把视频做的更清晰一点,而是从底层能力上把视频生成这件事往前推进了一大步。 官方现在对它的定位也很明确, cds 二点零采用统一的多模态音视频联合生成架构,支持文本、图片、音频、视频四种输入,而且重点强化了全能参考和编辑能力。所以这节课我们先不急着一上来就讲很复杂的工作流。 第一步,咱们先把一件事弄清楚, cds 二点零到底强在哪里,以及它和以前那种只靠一句提示词升视频的模型到底有什么本质区别。先给大家一个最核心的理解, leads 二点零最强的地方不只是生成视频,而是它现在更像一个多模态视频创作工具。也就是说,你不只是可以给他一句文字提示词,还可以同时给他参考图片、参考视频、参考音频,让他综合理解这些素材里的构图、镜头运动、 动作节奏、视觉氛围、声音特征,再按你的要求生成结果。官方把这个能力叫做 all round reference。 全能参考 这件事为什么重要?因为以前很多视频模型参考方式都比较单一,你可能只能给一张图,或者给一句提示词让它自己发挥。但 cadence 二点零现在的思路已经不一样了,它允许你把导演要表达的不同信息拆开给它, 比如人物用哪张图参考动作参考哪条视频,场景参考哪张图,节奏参考哪段音频。甚至官方还明确提到,他连文字版、分镜、脚本都能直接参考。所以大家学 cds 二点零的时候,一定不要把他只当成一个点一下就出视频的工具。 更准确的说,他现在已经是一个可以做参考混合人物替换、视频续写和定向编辑的视频模型。 好,讲到这里,我们就正式进入界面。现在在即梦的视频生成里已经能看到 cds 二点零以及它的全能参考相关入口, 官方公开资料里也确认了当前 cds 二点零的重点能力,就是围绕多模态参考和编辑展开。这节课我们重点先看两个入口,第一个首尾帧,第二个全能参考。因为这两个入口基本已经把 cds 二点零和传统视频模型拉开差距了。 先说首尾帧,首尾帧这个功能特别适合做什么呢?特别适合做单段动作演示、首尾过渡、广告镜头的小变化,或者人物从一个状态过渡到另一个状态。 你可以先上传一张图或者首尾两张图,再配合文字提示词,让模型在这两段之间完成一段合理的运动和变化。这里我们先做一个最简单的测试,比如上传一张男生玩滑板的图片,然后在提示词里写男生生完成一系列高难度滑板动作。 这时候我们重点不是只看他动没动,而是要看三个东西,第一,动作是不是自然。第二,人物脸有没有崩。第三,运动过程有没有明显违背物理规律。而这恰恰就是 cadence 二点零当前最强的一块, 官方专门提到它在复杂动作、多主体互动、运动稳定性和物理还原上有明显提升,尤其是在高难度动作和连贯运动场景里生成,可用率更高。也就是说,像滑雪、格斗、跳舞、竞技动作这些 以前很多模型最容易翻车的地方, cds 二点零现在已经明显更稳了。所以如果你平时做的是炫技视频、人物动作视频、 体育感镜头、打斗镜头,那你会非常直接的感受到它和旧模型的差距。除了动作之外, cds 二点零还有一个特别值得拿出来讲的点就是细节保持度。比如你在做产品广告的时候最怕什么? 最怕模型移动起来,瓶身文字糊掉,标签扭曲,细节变形。而官方这一次也明确提到, cds 二点零在生成质量上强化了细节稳定性、视觉真实感和指令控制力。 我们来看一下,上传两张产品图,分别作为手帧和尾帧,并写好提示词,让他生成一段广告来看一下生成结果,整体感觉还不错,很优雅。虽然他也还没有完美到百分之百 不出错,但至少在小字瓶身局部细节这种场景里,他比过去那种一动就糊的模型更值得测试。 所以像化妆品广告、饮料广告、产品展示这些场景,首尾帧就会特别实用,因为这类镜头本身时长不一定很长,但对质感、细节和可控性要求很高。 而 cds 二点零正好在这三个地方都有提升。好首尾帧讲完之后,我们再来看这节课真正的重点,全能参考。 全能参考其实就是 cds 二点零最核心的玩法,官方对它的定义很清楚,它支持文本、图片、视频、音频混合参考,而且可以同时输入最多九张图片、三段视频、三段音频,再结合自然语言指令去统一生成。 这意味着什么?这意味着你现在做视频不一定非要靠一条视频做完整复刻,而是可以把不同素材的作用拆开。比如说,我想要这个人物的脸,我想要那条视频的动作,我想要另一张图的场景,我还想参考一段音乐的节奏感, 这些东西现在都可以一起给到 cds 二点零,他会去理解这些素材各自承担什么作用,然后按你的文字要求去组织成一条新视频。这个能力为什么对大家特别重要?因为现在很多爆款视频本质上都是多素材拼创意, 比如人物替换、网红舞蹈复刻、炫技转场、 ai 角色套、真人动作、剧情短片里的多镜头串联。这些内容过去做起来要么靠剪辑,要么靠多段生成在应聘。 但现在全能参考的思路是,尽量在生成前就把参考关系讲清楚,这样模型不是瞎猜,而是按你给的素材逻辑去生成。再比如现在网上很火的那种跳舞视频,我想复刻一条爆款舞蹈视频, 以前这种需求很难,但现在你可以这样拆,上传参考形象,再上传别人跳舞的视频,然后告诉模型图片,人物替换视频,人物参考视频人物的动作、出场方式、 运镜和节奏生成视频,然后点执行。这其实就是一个非常典型的人物替换加动作迁移场景。 而官方现在对 cds 二点零的说明里,也明确提到了他在复杂人物互动、主体一致性视频编辑、视频续写这些场景里的能力升级。所以大家学 cds 二点零时,一定要养成一个特别重要的思路,不要一上来只想我写一句提示词让他自己做, 而是要先想清楚我这条视频里哪些东西最重要是人物、是动作、是镜头、是音乐、是场景,然后把这些要素拆开,分别给他参考素材,这样你做出来的视频会稳定的多,可控的多,成片也更容易接近你脑子里的预期。 另外还有两个值得你顺手提一句的新版能力。第一个是视频编辑, 官方已经明确说了, cds 二点零支持对指定片段人物动作和剧情做定向修改,这意味着它不只是生成,后面还可以改。第二个是视频续写, 官方的说法是,它支持根据提示词做连续镜头延展,也就是你可以把一条视频继续往下拍, 这对于做一镜到底,剧情续接、广告镜头延续都会很有帮助。好到这里,这节课我们先把 cadence 二点零的核心能力梳理清楚了,大家最后记住五句话就够了。第一, cadence 二点零不是单纯视频生成,而是多模态视频创作。 第二,它的核心优势是全能参考,可以混合文本、图片、视频、音频。第三,它在复杂动作、物理规律、细节稳定和一致性上提升很明显。 第四,他支持视频编辑和视频续写,不只是生成,还能接着改。第五,他已经开始把声音和画面更完整的统一起来。下一节课咱们就可以继续往下走,开始更具体的拆解他的实操玩法, 比如首尾真怎么写的更稳全,能参考怎么组织素材、人物替换和分镜复刻,到底怎么写提示词更高效。好了,那么以上就是这节课的全部内容,如果大家在学习过程中有任何问题,欢迎在评论区留言,那我们这节课就先到这里,咱们下节课见!

逼自己一周练完,其实你很会极梦 ai 前一百六十八集存下吧,很难找全的。警告,本视频耗时三个月制作,制作时长三百分钟,陪你系统学习极梦 ai 视频制作。这应该是目前抖音巨良心的 ai 视频了,哪怕你是零基础 也能轻松学会。所有在教学过程中用到的指令呢,我都已经给大家整理完毕,有需要的小伙伴六六六暴走不谢!话不多说,我们开始上课。大家好,欢迎来到本系列课程。 你在学习 ai 视频制作的时候,可能经常遇到一个问题,同样是跟着教程操作,但平台版本更新之后,页面布局会变,功能入口会变,选项名称也会发生变化,导致你学到一半时发现对不上。同时在这段时间, ai 视频 生成质量提升非常明显,无论是画面的细节稳定性以及整体的这个质感都比之前要更好。所以我用一段时间把 ai 视频制作的最关键、最实用、最能落地的一套方法重新整理出来,做成这套从零到一的课程。 我们的课程目标非常明确,从剧本与分镜开始,到素材生成,再到手机端后期剪辑, 最终让你能独立完成一条完整的 ai 视频作品。不管你是刚入门的新手,还是做过一点,但一直停留在生存片段的阶段,跟着课程走, 你都能把作品完整做出来。好,我们开始今天的第一节课。目前市面上可以做 ai 视频的平台也比较多,像国内常见的有我们的这个极萌 ai, 或者是这个可怜 ai 啊,或者是说国外的这个乱位等,都可以进行 ai 视频的制作,那到底我们该如何去选择?我给大家一个课程里的统一原则,我们先选择能稳定产出 加性价比高以及功能覆盖全的平台,用它把基础流程先跑通,等掌握到这个方法之后,再根据不同的 镜头需求去扩展到其他的平台。所以在本系列课程里,我会以激萌 ai 为主平台进行讲解。原因主要有三点,第一,这个平台整体功能它是比较完善的。第二,学习阶段的这个使用成本相对又好。第三,对新手来说 练习和试错成本门槛更低啊。同时我也强调一句,不要把思路锁死在一个平台,当你遇到某些特定动作、特定运境或是特定场景生成不理想的时候, 我们会在后续课程里讲到如何使用不同的模型和平台来补齐效果。今天这节课我们先不着急进行作品的这个界面, 我们先把这个界面熟悉之后,为我们后续的操作做一些铺垫和准备啊。入门 ai 它这个界面呢?它这个设计原则遵循极简操作加这功能分区的原则,核心板块大致分为五个部分, 然后像网页版以及这个 app 端布局逻辑是一致的啊。首先首页 我们呈现的这些东西包含了我们这个呃核心功能入口,像无铅画布、图片生成、视频生成、数字人以及配音生成这些核心功能的一键直达入口好,还有下方哎发现以及短片, 这都是跟我们进行灵感的推荐入口,包含了我们这个热门的创作案例以及爆款的模板等,还有这个官方的教一些教程 好,还有他的这个活动公告啊,等信息。好,然后在最左侧导航栏灵感,我们刚才说了下面是生成,生成的话就是我们进行这个作品制作的入口 下面资产,资产的话就是你制作好的这个作品,以及你上传一些图片,上传视频、音频素材等啊,还有你的这个项目或者是模板啊的一个这个管理保存的一个地方。 好,然后下面的这个画布啊也是进行这个,呃作品创作的地方,后续的话我们会进行这个呃单独的讲解。 再往下就是我们这个会员啊,会员的话啊他包含这个免费啊,免费的话他赠送积分,积分的话可以进行这个呃,呃图片的这个生成和视频的这个生成。好,基础会员的话他有这个包年以及这个包月, 还有这个标准及高级像基础的话,呃就已经足够我们这个进行这个使用了。好,再往下, 再往下就是我们这个通知以及这个个人信息的这个管理。好,这一块我们就先不看了,下面我们来看我们的这个一些这个核心的主要功能, 下面我们回到首页来看一下,我们首先能看到我们这个 agent 模式, agent 模式呢? 呃,它这个模式的特点就是你不需要先进行这个选择,你是做图片还是这个视频或者其他, 呃,只需要通过提示词描述你的需求,呃,自动调用平台的这个,呃一些功能,呃单独使用或者组合使用,呃, 呃根据你的这个格式生成你所需要的内容。我们分别来看一下激萌 ai 它的这几个核心功能,第一个是无线画布, 无线画布的话它是将所有的这个 ai 编辑功能集成在同一个空间, 然后它支持这个像素材拖拽,然后一些这个局部的重绘画面融合,或者说是这个呃需要优化一下细节啊等功能,然后它不需要去切换这个第三方的这一些这个设计工具, 呃,在这个编辑完成之后,呃可以进行这个导出或者是这个保存,这是这个无线画布。 第二个的话是我们这个图片生成,图片生成的话,它其实分为这个两种方式吧? 第一个就是这个,呃纹身图模式,哎,啥意思呢?就是仅通过文字描述,让 ai 根据这个文字去自动去生成对应的高清图片啊。第二个的话,第二种的话就是这个图身图模式,呃就是基于我们上传的这个参考图片 啊,然后结合我们这个文字提词词进行这个修改。就比如说我们要对这个我们的这个证件照,是吧?换个背景,我们要先上传一下证件照,然后给 ai 提词词,让他对我们这个证件照的背景进行一个替换 啊,这是这个图声图模式啊,一般用于这个细节优化啊,或者是这个二次创作 好图层图片生成大致就分为这两种方式。第三个来是我们这个呃积木 ai, 它的这个视频视频生成也是一个这个比较新的一个这个模式,然后 ai 视频生成它是这个核心功能 嗯之一,然后它搭载了这个最新的这个呃 cds 二点零模型啊,支持这个多种创作模式,像我们这个新手的话可以快速上手,专业用户的话也可以实现这个更加精细化的这个控制。 好。他的话大致分为这三种吧,三种方式,三种这个模式,第一种就是这个呃纹身模式,纹身视频就是根据这个呃纯文字描述 去生成一个这个完整的视频,不需要去进行这个任何的这个素材参考啊,然后就相当于这个零基础进行这个创作啊,也是这个最容易的一种方式 啊。第二种呢就是这个首尾针,这种模式啥意思呢?就是呃我们去放一张或者是两张图片生成这个连贯动画, 有这个固定的开头和这个结尾画面,这个的话要比纹身视频稍微复杂一点。最后一种的话,就是这个最复杂一种就是这个全能参考模式啊,我们要根据我们上传图片啊, 我们要去上传这个视频音频文件啊,或者说是文字素材,然后进行这个精准的一个视频生成,然后可以实现这个人物的这个精准控制呀动作以及这个运镜等功能啊,也是这个呃最难的一种,最难一种,好,然后下面的话是这个数字人, 数字人的话它是这个 gmu ai 的 这个啊, dream actor m 一 模型提供的,它支持这个单张图片,这个实现数字人这个呃动作复刻,然后也可以进行这个呃保留人物这个面部特征,或者是它这个画质, 然后适配我们这个口播呀,或者是短视频啊,虚拟主播这个等场景啊。配音生成的话就比较简单了,根据你这个需求去生成对应的配音即可,这是我们这个 g m i 它这几个核心功能。接下来 我们来先来看一个新手最关键的学习方法,不要一上来我们就去从零去写这个提示词,然后去从零去想我们这个风格,我们先去学会复刻,然后再去学会改造。 来我们一起来看一下,在首页的下方有一个发现啊,发现我们可以看到这里有很多啊,这个作者的这个作品,我们去随便点开一个, 我们可以看到在作品的右侧哎会显示它生成这个参数, 而这里我们最使用的一个按钮就是这个做同款按钮,我们点一下就可以把做的的这个参数全部导入到你的这个生成窗口, 而这步的意义是什么呢?我们可以将注意力放在如何去理解参数,去微调节过方面,而不是一开始就被零构思卡住。或者是你也可以只选择其中一部分啊,去选择题词,或者去选择 参考图,或者是两者都去用,再去做这个小幅的修改,这样旋翼速度会非常快。然后平台嘞他的这个风格覆盖也非常广泛啊,有像这个动漫人物风景海报, 你想做哪些内容,基本都可以去找到对应的这个参考模板。在发现的右侧有这个短片按钮, 我们建议大家这个重点使用来看一下,这里展示的是别人把片段剪辑成成片之后的完整作品,你重点看三件事,第一个是转场怎么做, 配音怎么配,节奏怎么卡,以及特效怎么加,因为我们的最终目标就是从生成片段走向完整成片。第二个是活动,在这里 活动在这里有平台的这个主题活动或者比赛,通常讲的比较丰富, 你练到一定水平,参加活动是提升的这个最可方之一。第三个是这个他的这个搜索框,当你不知道某类这个内容怎么设置时,比如说人像风景, 或者说是这个海报风格,你直接去搜索对应的这个关键词,找到效果最好的这个作品,然后进去学习他的这个题词以及这个参考图,呃,从而去提升自己的这个效率。 下面我们来看一下左侧的这三个按钮。第一个是生成,在这里来你可以进行这个生成操作,然后也可以去查看这个生成记录,然后下面是这个资产, 资产来就是你生成过的图片、视频、音乐素材,在这里统一管理,还有我们的这个画布, 画布前面我们说了啊,可以提供这个呃进行这个编辑是吧?比如说剪裁、加字、涂鸦这个擦除等工作,如果你会用这个 ps 或者是其他本地软件优先使用本地画布的话,更适合这个轻量级的。这个处理 好,然后下面我们再来看一下这个会员与这个排队会员和排队来,一般来说学习阶段啊,不用太纠结,我们还是就是用这个接触岗位就可以,然后平台的话他会 这个赠送点数,然后非会员也可以赠送这个点数进行这个生成啊,但是通常这个排队时间会更长一点,不过我们也要认识到这个模型它是有这个边界的,遇到某些镜头生成不理想时,不要在一个模型上进行死磕。 后期课程我们会去讲一下怎么用不同的平台啊,不同的这个模型组合出这个稳定的这个成品,效果 好。这节课我们完成两个任务,第一个是熟悉我们这个建盟 ai 的 这个界面入口,呃与这个功能入口。第二个明确了我们这个学习方法, 我们要先复刻再改造。下节课我们会进入这个整个 ai 视频制作最基础也是最关键的一款。其实词怎么写,你可以把它理解成导演指令,指令越清晰,你的画面质量和可控性就越高。