粉丝262获赞1105

二零二六年, ai 漫剧即将迎来全面风口,目前 ai 漫剧的日付费体量已经突破千万,抖音更是直接入局,全力扶持 ai 漫剧赛道,从剧本创作、画面生成到配音配乐,全流程一个 ai 就 能搞定,无需专业技能,一天就能产出一集。 批量生成内容先撵后复不再是视频平台的专属,只要拿着脑图和这份核心文档,跟着视频一步步操作,就算是零基础小白也能批量做出优质的 ai, 慢距视频,工具软件均可白嫖,纯纯无压力。相关操作文档我已经打包整理好了,感兴趣的宝子一二三直接领 接视频。我们将利用已经生成好的剧本脚本来生成分镜头图片。首先我们需要了解为什么要生成分镜头图片。在大多数时候, 想要制作 ai 视频片段,我们都并非在 ai 视频平台以纹身视频的方式直接生成,因为本身生成一条 ai 视频在资金和时间成本上消耗不低, 使用纹身视频的方式有太多的随机性,极有可能生成十条视频,有五条都是不满意的结果。因此,在大多数情况下 们想要生成 ai 视频片段,采用的方式都是先生成图片,再使用图生视频的方式,以此来更加可控的生成视频片段。所以生成图片是制作 ai 视频作品必不可少的一环, 是最花时间的一环。我们这节课会从前期准备提示词结构、提示词描述技巧以及图片修改技巧四个方面来讲解和分镜头图片生成相关的知识。首先来看生成图片的前期准备,通常来说,一则完整的故事都是需要故事当中出现主要人物或者说主要事物的。 所以首先我们需要对故事当中的主要人物进行造型设计。通常来说,在生成的脚本当中就会包含简单的对人物造型的描述, 比如我们上节课对陌生的描述就是树发浅灰不一。因此如果甲方或者我们自己对生成的主要角色并没有特定的要求,可以直接在提示词中要求根据脚本生成陌生的全身正面角色造型比例是多少?风格是什么? 看到此时,我们就直接获取了关于角色造型上的一个设计。当然,除了根据脚本当中已有的简单描述对角色的造型进行设计之外,我们同样可以根据自身的想法 来单独设计角色的造型。比如人物没有束发,可能是披头散发的状态或者是短发。人物的服装不是灰色的, 能具有更加华丽的设计和其他的颜色。这些内容我们可以直接用正常描述的方式告诉 ai, 都是可以生成对应的结果的。再来看前期准备当中的第二点, 对故事画面的美术风格进行设计。要知道大多数的影视作品在美术风格上都要保持前后的一致性,不能说前期是写实风格,后期就突然变成了三 d 风格。所以这里我们也要预先对将来画面当中的美术风格 进行固定。这里同样是要通过提示词来描述,比如这里在生成角色造型时,我的要求就是高精度三 d 建模风格, 此时生成的角色就不像写实人物那般有着写实的比例和长相特征,而是更像是一个三 d 动画电影当中的人物长相。那么问题来了,如果我们喜欢某一张图片当中的美术风格,但又不知道该如何用提示词描述, 该如何获取这个风格的提示词呢?其实方法也非常简单,例如现在我们来到极梦 ai 的 首页,在这里可以看到很多由其他作者生成的作品,如果喜欢当中的某一个作品的美术风格,我们就可以点击查看大图。 以这张图片为例,可以看到右侧就展示了作者在生成这张图片时所使用的提示词,而我们要做的事情就是直接将这些提示词复制下来,在复制好之后, 回到豆包 ai 当中,直接 ctrl 加 v 粘贴,然后按住 shift 键再按下回车另起一行。此时向豆包 ai 这个大语言模型提出要求, 去除上述提示词中对具体事物和氛围的描述,只保留画面美术风格相关的提示词,然后点击发送。可以看到,这样一来,我们就快速的从其他作者的作品当中提取出了和美术风格相关的提示词。 当然,由 ai 提取的和风格相关的提示词未必都是准确或者说我们需要的,所以在使用时还需要经过一次人工的筛选。 比方说当前所提取的这些提示词中,像全景航拍就并非是对美术风格的描述,而是对景别的描述,在使用时最好先将其删除。我们下面就对刚刚所提取的提示词进行一定的删减, 是配合自己新增的提示词,描述一个古风帅哥在御剑飞行近景特写这样的提示词来生成一组图片看一看效果如何呗。 可以看到最终生成的效果在美术风格上是不是和刚刚我们所见到的那种带有三 d 质感的图片非常的接近呢?当然在很多时候使用这样的方法,由于生成的主题不同, 在美术风格的最终表现上也并非绝对能够完全贴合我们参考时作者生成的图片,大家可以多对提示词的描述,根据自己的理解,结合生成的结果进行修改,以此来满足自己对画面风格的要求。 回到豆包 ai, 我 们继续来承接之前的内容,在设定好角色也就是陌生的形象之后,我们自然要继续设计画面当中出现镜头比较多的 零露的形象。这里我们就继续向豆包 ai 要求用相同的风格生成脚本当中提到的零露,可以看到最终生成的效果也非常出色,成功的生成了零露的形象。当然大家同样可以靠自己的想象来描述零露都有什么样的特征。我们现在已经获取了人物造型的设计, 同时也规定了画面的美术风格。下面要做的事情就是书写提示词,描述来生成脚本当中的每一个分镜头了。这里就要先学习提示词的结构,主要有这六个方面,分别是景别, 比如近景、中景、远景等等。第二个方面是画面当中出现的事物,像人物、动物、环境等等都是画面当中出现的事物。而第三点是时间和光照,白天、夜晚、傍晚的光照是不同, 同时光照也可以来自于不同的方向,像正面光、侧逆光等等,能够表达的人物情绪也有区别。 而色调方面包括冷色调、暖色调,或者可以用某一部电影当中的调色,比如教父的风格等等。而构图方面则包括水平构图、对称构图、 s 型构图等等,可以让生成的画面体现更多的情绪。最后一点是质量词, 像胶片颗粒质感、电影感构图、超高清、十六 k 等等,这些词汇都能提升生成结果的画面质量。例如在设计好陌生和零露的形象之后,我们就开始了第一张图片的生成,这张图片就集合了刚刚 所说的提示词结构相关要素。景别方面要求是航拍镜头远景,而这里的白天、晴天则是在描述画面当中出现的事物。而像胶片颗粒、质感、 电影感构图、超高清十六 k、 三 d 高精度建模则是带描述画面的美术风格以及相关的质量词。可以看到,在这些描述当中,我们并没有描述色调,这里主要是从两个方面考量的。 第一个方面,本身 ai 生成的图片在色调上表现的就足够优秀了,不需要去单独的提及或者调色,即便要调色,也可以用后期的剪辑软件,以更加可控的方式进行调色。第二方面,就是我们在生成图片时 刚刚所提及的各种提示词结构,并不是每一种都要在生成图片时使用,比如说景别,有时候我们不去描述,但要求生成的内容是人物的证件照,通常也会采取近景、取景框、指框选人物上半身的方式来生成人物的证件照。 所以在很多情况下,我们就主观的描述自己想要生成的画面,无需考虑刚刚我们所讲解的提示词结构,也是能够生成很好的效果的。 当然,如果生成的质量不佳,我们自然还是要根据刚刚的提示词结构来了解如何去完善当前所书写的提示词,生成更加令人满意的效果。我们下面再来看生成图片时的提示词描述技巧。 首先第一点,提示词描述尽量直观、客观,和写作文、写小说是不同的。在生成图片时,太多的修饰词可能会导致 ai 误判我们的意图。比方说我们上一节课所展示的说长城蜿蜒的像一条巨龙, 我们的目的并非是要生成巨龙,而是在描述长城本身这个建筑的宏伟景观。但很多时候 ai 是 不会了解这样的华丽的词造的。类似的描述还有 鲤鱼跃出水面飞的很高,就像是长了翅膀一样。用这样的描述来生成图片,也极有可能会让 ai 认为我们要生成长了翅膀的鲤鱼, 而并非在描述鲤鱼飞的很高。可以看到此时生成的结果就当真生成了一条长了翅膀的鲤鱼,因此在描述时要保持直观和客观。第二个技巧,脚本只是参考 画面描述,主要还是要靠自己思考。在很多的 ai 视频生成教程当中,会有一些教程会教大家直接复制粘贴脚本当中的提示词来生成分镜头画面。但事实上,在这些分镜头画面的描述中,会存在很多不合理或者不适合在同一个镜头下生成的内容。 例如我们看第一个镜头陌生有什么样的造型?青石有什么样的造型?同时还描述了陌生身上戴的这块玉玺是长方形的, 有淡白玉色,有简单纹路。但实际上我们都知道,在一个人物的全身,也就是打坐的画面中,人物身上所携带的这块玉玑是基本不可能看清上面有什么样的纹路,甚至看不清它具体是什么形状的。因为在整个画面当中的占比可能非常的小, 所以像这样的画面我们就无法在同一个脚本分镜头中生成,而是至少需要分为两个画面,一个画面是陌生在打坐的画面, 另一个画面才是预觉得近景镜头特写。如果直接复制粘贴这里的提示词生成的画面就会非常的矛盾。所以大家作为导演, 在拿到剧本脚本之后,最好能够先在自己的脑海中形成一个完整的画面,在更多的时候,我们根据自己脑海中所形成的完整画面进行提示词的直观客观描述,这样往往能够生成更好的效果。 第三点就是 ai 目前能力有限,有时需要适当的修改提示词描述的内容,或者在生成好内容之后,我们对剧本和脚本进行一定的更改。举一个简单的例子,例如像当前故事剧本当中的第一句话,他猛的睁眼,将手中的欲绝置在青石上, 欲绝滚落进西间。如果大家有一定的 ai 视频生成经验的话,会发现这一句话当中所描述的人物动作 在 ai 视频片段的生成中其实非常难制作,人物需要先将手中的欲绝抛出,欲绝需要掉落在青石上,同时在青石上还要进行滚落,滚落到西间见其涟漪。 果是真实拍摄视频,这串动作并不难做到,但实际上在 ai 生成时,这种涉及到诸多物理碰撞的内容,想要制作成功是一件十分困难的事情。所以这里我们不妨直接让玉爵丢进水中,同样能够表现人物打坐三日无法引气入体, 内心烦躁的情形。当然,在遇到类似的情况时,可以先尝试按照剧本当中可能更复杂,但表现力也更好的画面去生成,如果做不出来的话,再考虑改为更加简单的画面。第四个提示词描述技巧,就是有角色说台词的画面时,尽量使用近景 正面镜头,这同样是我们将来在给角色对口型时,能否成功的给角色对口型进行考量的。在 在极梦 ai 当中,给角色对口型使用的是数字人功能,它需要我们先上传一段视频或者图片,再添加对应的配音。当我们需要对口型的人物是一个远景人物,且并非正面朝向镜头时,此时对口型要么会失败,要么效果非常不明显。比如说我们来看这段视频,孤独 使我的内心更加坚强。可以看到,虽说生成的画面人物的嘴部依然是有动态的,但整体的表现效果会相对一般,人物的身体也伴随着说话出现了不太自然的动态效果。我们再来看一个人物近景特写,对口型时的画面,古董 使我的内心更加坚强。可以看到,此时生成的画面,人物的口型和台词就十分匹配,且面部的动态表现比较清晰自然,所以当我们遇到有角色在说台词的画面时,就尽量使用近景和正面的镜头,以获取更好的对口型效果。 我们最后来看图片生成之后的修改技巧。在通过纹身图生成图片时,很多情况下并不能一次性就生成让人满意的效果,但也许生成的图片百分之八十是满意的,剩余的百分之二十相比于重新生成一张进行后期的修改是性价比更高的选择。 或者有些时候我们需要表达一个很长的镜头,以此来表现画面的时间流逝或者是人物的一连串动作。所以我们首先来看第一点,固定镜头下长时间事物运动的表达技巧。这里就包含很多方面了,比如我们现在想要表达一年四季的变化, 那么在生成好人物盘腿打坐的画面之后,我们就可以直接让 ai 大 语言模型帮助我们固定画面当中的人物造型和构图,但只改变画面当中的四季。 比如我们首先生成的第一张图片是类似于春季或者夏季,在提示词中,我们要求将上图的季节改为秋季风格,其他部分保持不变,此时就获取了人物在秋天打坐的画面。 同样的道理,我们继续描述将上图的季节改为冬季,其他部分保持不变,那么最终就成功的将图片改为了冬天的季节。 有了这些图片之后,我们使用首尾帧生成或者多帧生成的方式,就可以生成一组人物,从春天到夏天再到秋冬天,一直在这个位置打坐, 以此来表现人物十分勤勉、十分有毅力的镜头片段效果。当然,除了描述季节之外,我们也可以描述将人物修改成某种姿势,在人物的身边添加某些事物, 减少某些事物,其他部分保持不变,相信大家这里都能举一反三,我们就不再赘述。第二个图片修改技巧,就是如何在保持造型和风格一致的条件下修改环境和状态的技巧。其实这一点在大多数情况下不需要我们特意去保持, 因为使用 ai 大 语言模型来生成图片是有上下文关联的功能的。比方说我们在刚刚演示时,提示词中只描述了鲤鱼跃出水面,飞的很高,就像是长了翅膀一样,本身的意图是想单独生成一条 跃出水面的鲤鱼,但得益于 ai 大 语言模型能够关联上下文的能力,他依旧认为我是想要基于上面这张图片来修改新的内容,而且可以看到生成的结果在美术风格上同样保持了上图当中的风格, 所以很多情况下我们不太需要单独的提及要保持画面的风格。但需要注意的是,在实际的制作过程中,偶尔会出现我们上传了一张参考图, 但生成的结果和参考图在造型上美术风格不统一的情况。又像这里是我之前制作了一个 ai 故事短片,在制作的时候,像这张图片是一个已经制作好的角色,造型,是一个三 d q 版卡通形象,但人物整体还是偏向于写实的特征。再上传了这个参考图, 提出了相应的修改要求之后,可以看到生成的结果并不能让人满意,虽说人物在造型的设计上保持了一致,但整个人物的比例和特点都发生了翻天覆地的变化。因此在遇到这种情况时,该怎么解决呢? 最好就要更换一个图片生成平台。在使用不同的图片生成平台生成图片时,其实每一家所使用的生成模型都会有所区别, 那有些模型擅长生成写实的风格,有些模型擅长生成绘画的风格,有些模型这个角度生成不好,有些模型这个风格生成不好,这些都是很常见的情况,所以大家在对图片的内容进行修改时,也不要在一棵树上吊死。 如果时代生成不好,除了用极梦 ai 或者豆包平台之外,也不妨尝试用其他的平台,比如说用可灵 ai, 或者像一些开源的使用 context 的 模型, flex 模型或者 banana 模型的工作流都是可以的。例如现在来到利布利布 ai, 我 们点击这里的在 comfui 运行, 此时就来到了 comfui 工作流的操作页面。这是一个 context 的 模型的工作流,其基本功能就是参考图生图。在左侧的图像输入窗口, 将刚刚未能在豆包上生成成功的人物造型进行上传,在提示词描述当中描述我们的需求,例如这里我们就输入和在豆包上一样的提示词,根据图片生成人物特写,生气,拍桌子、表情愤怒。而比例方面我们修改为十六比九, 然后直接点击开始升图,可以看到一段时间后,图片就生成好了,整体的生成效果还是非常出色的。我们将在豆包上面生成的人物造型放在旁边,同时将原版的人物造型参考也放在旁边。 可以看到在对比之下,显然使用 context 的 模型工作流能够生成人物的造型更加统一的画面效果。当然,在豆包上大多数情况下是直接可以修改的,只是偶尔会出现这样的问题。 对,届时也不妨尝试使用其他方式,在保持人物造型和美术风格的情况下,来修改环境和画面当中事物的状态。最后一点就是灵活的使用参考图升图的功能。要知道参考图升图不光只局限于上传单一的图像参考,目前大部分的图像生成平台都是支持多图参考的。 比如现在我们将陌生的人物形象和零度的人物形象同时上传,在上传好之后,输入提示词生成人物骑着白鹿在丛林中的画面,然后点击发送, 可以看到最终生成的效果。既保留了零度的形象,也保留了陌生的形象,同时也符合了提示词中描述的人物在丛林中的画面的要求。在很多其他的事物无法生成出来或者生成的结果不符合要求时,同样可以使用多图参考功能, 将指定的物品按照提示词的要求进行结合,灵活的使用参考图生图的能力。最后来简单总结一下这节课我们讲解了图片生成的相关知识,包括前期准备、提示词结构、 提示词描述技巧和图片修改技巧。这些知识能够帮助大家在生成分镜头图片时更容易生成出理想的画面。当然,大家在实际操作时遇到任何的问题,我会尽可能帮助大家解决,在操作过程当中遇到的问题, 也会分享相关的课程资料。以上就是本期视频的全部内容,如果觉得本期视频的内容对你有帮助,也不妨点赞、关注、支持一下,我们就下期视频再见!
