粉丝165获赞568



最新一集我消炎重回国漫巅峰,药老再次留在魂店过年,最新一集都看了吧,我总结有三大看点,首先是我为药老闯入魂店分店,里面有着几百名豆豉护法,想当年一个误护法就让我竭尽全力,现在打这些护法就像捏死蝼蚁一样简单,后面出现的豆豉也是轻松拿捏。第二个看点是夺取海星宴, 说起来我还得感谢木古老人,如果不是他联合寒风被吃药老,药老也不会躲到那界里,我也不会有现在这般实力。现在我又抢到海星宴,实力大增,下次可以施展五兽火连了。后面再收集一个禁元妖火小一就要出现了。 第三个看点是魂殿大天尊登场,这家伙的剑魔虽然看着别扭,但魂殿的强者就该是这种稀奇古怪的造型,他的骨刀乃是取万人之骨所断,其中有着无数灵魂技刀,只要被其刀锋侵体, 一家受难浑是深之苦。总的来说,这集特效十分不错,比之前有很大的进步,如果按照今天这个节奏来的话,就算进洞慢点,也不会有那道黑子了。就怕只好这一集,后面又给咱们拉坨大的。

别再死磕剧本了,二零二六将是 ai 漫剧的时代,现在漫剧日付费规模已达千万,抖音亲自下场扶持, ai 漫剧剧本、画面、配音、配乐全 ai 搞定,不用专业技能,一天一集批量生成,先免后付,不再是视频平台的专属。拿上脑图, 结合这两份文档,所有工具全白嫖跟着我来操作,小白也能快速批量的制作出这样的 ai 视频,相关操作文档已打包,有兴趣的六六六。做一个完整的 ai 动画短片 要分为这么几个流程,写故事剧本。写故事脚本,根据剧本和脚本生成图片,然后是根据图片来生成视频, 给视频生成音效,生成人物配音,最后就是后期的剪辑制作,相信作为新手的同学看到这么多流程会感到有些头痛。不过不用担心,从今天开始,我们会从最基础的用 ai 大 语言模型编写故事剧本脚本,再到最后的剪辑 成片,从零开始,非常细致的教大家如何制作一个完整的 ai 动画。这期视频我们就先来讲解第一个部分,如何利用 ai 大 语言模型来编写故事的剧本脚本。同时我们这期视频相关的学习资料也放到了评论区的置顶评论,大家需要的话可以自取。我们大多数人都不 专业的导演和编剧,因此想要获取好的故事剧本脚本,通常就要借助 ai 大 语言模型的生成,例如豆包、 deepsea 等等。这时如何给 ai 大 语言模型进行提问就显得非常重要。在给 ai 大 语言模型提问时,这里有一个通用格式,需要满足三个基本要素,第一点就是 给 ai 设定身份,第二点是给 ai 提出问题,而第三点是给 ai 的 回答设定格式。我们首先来看第一点,给 ai 定身份。来到豆包 ai, 可以 看到这里我一共向他提出了两个问题,第一个问题是假设你是一个导演, 想和大家科普一下什么是动态慢。此时他所给出的回复是动态慢的核心定义,动态慢的关键特征,以及动态慢与动画漫画的核心区别,且这些内容所给出的格式非常的专业。我们再来看第二个问题, 其实这里问题是一样的,同样是请和大家科普一下动态漫,但此时给 ai 设定的身份是假设你是一个脱口秀演员,可以看到这里他所回复的内容就和刚刚有一定的差异,是以更加接地气且通俗易懂的方式来介绍动态漫的,例如什么懒人福音精简版, 原漫画的画稿不动给他俩加 buff, 同时将动态漫漫画和动画做了一个简单的对比,讲述的方式非常诙谐幽默,且更加通俗易懂。这就是我们给 ai 设定的身份不同而 产生的不同的结果, ai 会以不同的角度、不同的专业做出不同的回答。至于第二点给 ai 提问题,这里并没有什么特殊的技巧,我们就直接简单直白地向 ai 提出我们的问题,就好比如这里的 请和大家科普一下什么是动态慢,就是一个简单直白的问题,通常向 ai 询问时,如果没有今天我们所讲解的提问框架,大家大概率也是这么提问的。而第三点给 ai 的 回答设定框架。 现在我们可以看到当前的回答格式是大标题加小标题加内容的方式进行回答的,那么我们现在以第一个问题为基础,将其复制下来,然后粘贴。后面来追加一句,需要从内容基础、制作核心、技术、适配合规与传播这几个方面去分析。现在回车发送 可以看到,此时豆包 ai 回复的内容就是围绕我们所提出的要求进行回复的。从内容基础,以漫画 ip 为核心根基,制作核心, 轻量化动态加生化适配技术适配适配多场景的轻量化技术、合规与传播、版权先行加精准破圈这么几个角度对问题进行的回答,这就是给 ai 的 回答来设定格式。我们下面就回归到本节课的主题, 如何让 ai 来编辑剧本脚本,这里我已经提前准备好了,我们来看一下具体的内容是怎样的。首先要明确一点, 剧本和脚本是不同的,可以看到在这里我分别生成了故事的剧本和脚本。在剧本方面,我们点击查看,可以看到它更像是一则故事的直观叙述,就像阅读一本小说一样,没有非常的杂的解释,只是顺着观众的正常思路来讲述一则普通 故事。而脚本则不同,它的内容会更加繁复,包括了警别场景,对于画面内容的描述、静号以及发生的时间。它更像是一本在制作这个故事完整影视作品时的一个指导规划书,告诉我们在拍摄这一段时应该注意些什么, 应该按照什么样的方式去制作。那么了解了故事剧本和脚本的区别,我们再回到刚刚的内容来看具体的提问方式是怎样的,可以看到这里同样满足了提问的三要素。首先第一点给 ai 设定身份, 你是一个经验丰富的动画电影导演,这一句话就给 ai 设定了一个经验丰富的动画电影导演的身份。下面是题 要求,现在我需要你写一个动画电影短片的故事剧本。这句简短的话就提出了我们的要求,是写动画电影短片的故事剧本。而第三个部分就是给回答来设定格式,要求是情节简单,故事有逻辑,以古 封修炼为题材,以写故事的方式提供给我,以便于我能快速了解故事内容,不超过四百字。而在下面我们生成脚本的时候,可以看到就没有再给 ai 设定身份了,因为通常来说, ai 大 语言模型是有关联上下文的能力的, 我们在第一句话中已经给他设定了一个经验丰富的动画导演的身份,所以默认在后续的提问中,即便不再单独的设定身份,这个身份已经贯彻整个的对话了。 到了这里,大家可能会产生一个疑问,那就是既然我们生成的分镜头脚本能够直接告诉我们在真正制作短片时,该在什么位置,用什么样的描述,设定什么样的时间,为什么还需要先让 ai 生成一个故事的剧本呢? 其实道理很简单,作为一个导演,也就是我们自己,要想制作出完整的故事,就必须要先深入对故事有一个清晰的认识,知道故事当中的出场人物,故事的情节。所以相较于永常的脚本而言,一则故事的剧本 能够让作为导演的我们像阅读一个短片故事一样,快速的了解整个故事都发生了什么,这样在制作时才能够更多的打磨这个故事的细节,了解故事的前后逻辑。其次,我们先行编写了一个故事剧本,也能够十分方便的对故事剧本当中逻辑不通 或者不够精彩需要修改的部分进行提前修改,在修改好之后,再让大语言模型参考修改后的内容来 生成更加完善的脚本,以此来降低后续修改的成本。毕竟修改一个简短的剧本要比修改一个永长的脚本要方便得多。在生成一个 ai 动画故事短片时,大家可以看到开头我们所展示的动画短片在时长上都不是很长, 通常一两分钟,所以这里生成的字数就非常重要。通常来说,四百字的故事剧本对应的是两分钟左右的 ai 动画短片,所以大家可以以此为基础, 在设定 ai 的 回答框架时来设定一下生成的字数。此外,在生成脚本时,我们所要求的回答格式中很多内容其实都是为将来生成图片而服 务的,所以大家在提要求时,尽可能想一想我们将来在生成图片时需要哪些信息。例如这里我的要求是要包括景别、场景出场、事物造型、时间、提升画质的提示词描述,因为在生成图片时, 需要的便是对于这些内容的描述,同时还要求描述尽量直观客观,避免华丽的词造。这句话非常的重要, 大家如果使用过一定的 ai 图片生成工具,你会发现在一些小说当中,比较华丽的对于画面内容的描述, 有可能会误导 ai 图片生成模型。例如在小说当中可能会描述长城蜿蜒的犹如一条巨龙,如果使用这样的提示词让 ai 图片生成模型生成图片,那极有可能生成的不再是长城,而是一条真正的巨龙。所以我们才要求描述时尽量直观客观,避 免华丽词造,以便于后续用于 ai 生成分镜头图片。当然最后我们还需要补充一句,因为本身我们并非是专业的导演编剧,不 知道一个脚本作为基础的要素都有哪些,所以最后补充了一句,同时要具备脚本基本的要素,至少让这个脚本在满足我们要求的同时,它也是一个完整的脚本。我们最后来简单总结一下这期视频都讲解了哪些内容。 首先我们大致讲述了制作一个 ai 动画作品完整的流程都有哪些,这也是我们后续课程当中会逐一给大家详细讲解的内容。而 本节课我们讲解了如何编辑一个 ai 作品的故事。剧本脚本,其重点在于给 ai 大 语言模型提问题时的框架,分别是给 ai 设定身份,给 ai 提出问题以及给 ai 的 回答设定格式。我们通过一个简单的苹果例子 得知了这个框架的重要性,同时也在实践中生成了剧本脚本,并且对什么是剧本,什么是脚本,它有它们都有什么 功能做了详细的区分。下一期视频我们来学习如何根据生成好的剧本脚本来生成分镜头图片,这也是整个制作环节最花时间的部分,因为它不仅要生成图片,还包含了设计故事当中各种事物的形象,以及如何保持角色前后的一致性,如何对生成不满意的图片进行修改等等。 想要继续学习这些内容的同学,如果大家不想在学习时错过这些内容,也不妨点赞、关注、支持一下。在片头我们所展示的 ai 动画短片的制作流程,我也总结成了一个文档资料,放在了评论区的置顶中,大家需要的话可以自取,我们就下期视频再见。 在上一期视频中,我们使用 ai 大 语言模型生成了剧本和脚本,这期视频我们将利用已经生成好的剧本脚本来生成分镜头图片。首先我们需要了解为什么要生成分镜头图片。在大多数时候, 想要制作 ai 视频片段,我们都并非在 ai 视频平台以文声视频的方式直接生成,因为本身生成一条 ai 视频在资金和时间成本上消耗不低, 使用文生视频的方式有太多的随机性,极有可能生成十条视频,有五条都是不满意的结果。因此,在大多数情况下, 我们想要生成 ai 视频片段,采用的方式都是先生成图片,再使用图生视频的方式,以此来更加可控的生成视频片段。所以生成图片是制作 ai 视频作品必不可少的一环, 是最花时间的一环。我们这节课会从前期准备提示词结构、提示词描述技巧以及图片修改技巧四个方面来讲解和分镜头图片生成相关的知识。首先来看生成图片的前期准备,通常来说,一则完整的故事都是需要故事当中出现主要人物或者说主要事物的, 所以首先我们需要对故事当中的主要人物进行造型设计。通常来说,在生成的脚本当中就会包含简单的对人物造型的描述, 比如我们上节课对陌生的描述就是树发浅灰不一。因此如果甲方或者我们自己对生成的主要角色并没有特定的要求,可以直接在提示词中要求根据脚本生成陌生的全身正面角色造型比例是多少,风格是什么 可以看到,此时我们就直接获取了关于角色造型上的一个设计。当然,除了根据脚本当中已有的简单描述对角色的造型进行设计之外,我们同样可以根据自身的想法 来单独设计角色的造型。比如人物没有束发,可能是披头散发的状态或者是短发。人物的服装不是灰色的,可能具有更加华丽的设计和其他的颜色。这些内容我们可以直接用正常描述的方式告诉 ai, 都是可以生成对应的结果的。再来看前期准备当中的第二点, 对故事画面的美术风格进行设计。要知道大多数的影视作品在美术风格上都要保持前后的一致性,不能说前期是写实风格,后期就突然变成了三 d 风格。所以这里我们也要预先对将来画面当中的美术风格 进行固定。这里同样是要通过提示词来描述,比如这里在生成角色造型时,我的要求就是高精度三 d 建模风格 时生成的角色就不像写实人物那般有着写实的比例和长相特征,而是更像是一个三 d 动画电影当中的人物长相。那么问题来了,如果我们喜欢某一张图片当中的美术风格,但又不知道该如何用提示词描述, 该如何获取这个风格的提示词呢?其实方法也非常简单,比如现在我们来到极梦 ai 的 首页,在这里可以看到很多由其他作者生成的作品,如果喜欢当中的某一个作品的美术风格,我们就可以点击查看大图。 以这张图片为例,可以看到右侧就展示了作者在生成这张图片时所使用的提示词,而我们要做的事情就是直接将这些提示词复制下来,在复制好之后, 回到豆包 ai 当中,直接 ctrl 加 v 粘贴,然后按住 shift 键再按下回车另起一行,此时向豆包 ai 这个大语言模型提出要求,去除上述提示词中对具体事物和氛围的描述,只保留画面美术风格相关的提示词,然 点击发送可以看到。这样一来,我们就快速的从其他作者的作品当中提取出了和美术风格相关的提示词。当然由 ai 提取的和风格相关的提示词未必都是准确或者说我们需要的,所以在使用时还需要经过一次人工的筛选。 方说,当前所提取的这些提示词中,像全景航拍就并非是对美术风格的描述,而是对景别的描述,在使用时最好先将其删除。我们下面就对刚刚所提取的提示词进行一定的删减, 同时配合自己新增的提示词描述一个古风帅哥在遇见飞行近景特写这样的提示词来生成一组图片,看一看效果如何呗。 看到最终生成的效果,在美术风格上是不是和刚刚我们所见到的那种带有三 d 质感的图片非常的接近呢?当然在很多时候使用这样的方法,由于生成的主题不同, 在美术风格的最终表现上也并非绝对能够完全贴合我们参考时作者生成的图片。大家可以多对提示词的描述,根据自己的理解,结合生成的结果进行修改,以此来满足自己对画面风格的要求。 回到豆包 ai, 我 们继续来承接之前的内容,在设定好角色也就是陌生的形象之后,我们自然要继续设计画面当中出现镜头比较多的 零露的形象。这里我们就继续向豆包 ai 要求用相同的风格生成脚本当中提到的零露,可以 看到最终生成的效果也非常出色,成功的生成的零露的形象。当然大家同样可以靠自己的想象来描述零露都有什么样的特征。我们现在已经获取了人物造型的设计, 同时也规定了画面的美术风格。下面要做的事情就是书写提示词,描述来生成脚本当中的每一个分镜头了。这里就要先学习提示词的结构,主要有这六个方面,分别是景别, 比如近景、中景、远景等等。第二个方面是画面当中出现的事物,像人物、动物、环境等等都是画面当中出现的事物。 而第三点是时间和光照,白天、夜晚、傍晚的光照是不同的,同时光照也可以来自于不同的方向,像正面光、侧逆光等等,能够表达的人物情绪也有区别。 而色调方面包括冷色调、暖色调,或者可以用某一部电影当中的调色,比如教父的风格等等。而构图方面则包括水平构图、对称构图、 s 型构图等等,可以让生成的画面体现更多的情绪。最后一点是质量词, 像胶片颗粒质感、电影感、构图、超高清、十六 k 等等,这些词汇都能提升生成结果的画面质量。例如在设计好陌生和零露的形象之后,我们就开始了第一张图片的生成,这张图片就集合了刚刚 所说的提示词结构相关要素。景别方面要求是航拍镜头、远景,而这里的白天、晴天则是在描述画面当中出现的事物。而像胶片颗粒质感、 灵感、构图、超高清、十六 k、 三 d 高精度建模则是带描述画面的美术风格以及相关的质量词。可以看到,在这些描述当中,我们并没有描述色调,这里主要是从两个方面考量的。第一个方面,本身 ai 生成的图片在色调上表现的就足够优秀了, 不需要去单独的提及或者调色,即便要调色,也可以用后期的剪辑软件,以更加可控的方式进行调色。第二方面就是我们在生成图片时 刚刚所提及的各种提示词结构,并不是每一种都要在生成图片时使用,比如说景别,有时候我们不去描述,但要求生成的内容是人物的证件照,通常也会采取近景、取景框、指框选人物上半身的方式来生成人物的证件照。 所以在很多情况下,我们就主观的描述自己想要生成的画面,无需考虑刚刚我们所讲解的提示词结构也是能够生成很好的效果的。当然,如果生成的质量不佳,我们自然还是要根据刚刚的提示词结构来了解如何去完善当前所书写的提示词,生成更加令人满意的效果。 我们下面再来看生成图片时的提示词描述技巧。首先第一点,提示词描述尽量直观、客观,和写作文、写小说是不同的。在生成图片时,太多的修饰词可能会导致 ai 误判我们的意图。比方说我们上一节课所展示的说长城蜿蜒的像一条巨龙, 我们的目的并非是要生成巨龙,而是在描述长城本身这个建筑的宏伟景观。但很多时候 ai 是 不会了解这样的华丽的词造的。类似的描述还有 鲤鱼跃出水面飞的很高,就像是长了翅膀一样。用这样的描述来生成图片,也极有可能会让 ai 认为我们要生成长了翅膀的鲤鱼, 而并非在描述鲤鱼飞的很高。可以看到此时生成的结果就当真生成了一条长了翅膀的鲤鱼。因此在描述时要保持直观和客观。第二个技巧,脚本只是参考 画面描述,主要还是要靠自己思考。在很多的 ai 视频生成教程当中,会有一些教程会教大家直接复制粘贴脚本当中的提示词来生成分镜头画面。但事实上,在这些分镜头画面的描述中, 会存在很多不合理或者不适合在同一个镜头下生成的内容。例如我们看第一个镜头,陌生有什么样的造型,青石有什么样的造型, 同时还描述了陌生身上戴的这块玉玑是长方形的,有淡白玉色,有简单纹路。但实际上我们都知道,在一个人物的全身,也就是打坐的画面中,人物身上所携带的这块玉玑是基本不可能看清上面有什么样的纹路, 甚至看不清他具体是什么形状的。因为在整个画面当中的占比可能非常的小,所以像这样的画面我们就无法在同一个脚本分镜头中生成,而是至少需要分为两个画面,一个画面是陌生在打坐的画面,另一个画面才是预觉得近景镜头特写。如果直接复制粘贴这里的提示词 生成的画面就会非常的矛盾。所以大家作为导演,在拿到剧本脚本之后,最好能够先在自己的脑海中形成一个完整的画面,在更多的时候,我们根据自己脑海中所形成的完整画面进行提示词的直观客观描述,这样往往能够生成更好的效果。 第三点就是 ai 目前能力有限,有时需要适当的修改提示词描述的内容,或者在生成好内容之后,我们对剧本和脚本进行一定的更改。举一个简单的例子,例如像当前故事剧本当中的第一句话,他猛的睁眼,将手中的欲绝置在青石上, 欲绝滚落进西间。如果大家有一定的 ai 视频生成经验的话,会发现这一句话当中所描述的人物动作 在 ai 视频片段的生成中其实非常难制作,人物需要先将手中的欲绝抛出,欲绝需要掉落在青石上,同时在青石上还要进行滚落,滚落到西间见其连蚁。 如果是真实拍摄视频,这串动作并不难做到,但实际上在 ai 生成时,这种涉及到诸多物理碰撞的内容 制作成功是一件十分困难的事情。所以这里我们不妨直接让欲绝丢进水中,同样能够表现人物打坐三日无法引气入体、 内心烦躁的情形。当然,在遇到类似的情况时,可以先尝试按照剧本当中可能更复杂,但表现力也更好的画面去生成,如果做不出来的话,再考虑改为更加简单的画面。第四个提示词描述技巧,就是有角色说台词的画面时,尽量使用近景 正面镜头,这同样是我们将来在给角色对口型时,能否成功的给角色对口型进行考量的。在极梦 ai 当中,给角色对口型使用的是数字人功能,它需要我们先上传一段视频或者 图片,再添加对应的配音。当我们需要对口型的人物是一个远景人物,且并非正面朝向镜头时,此时对口型要么会失败,要么效果非常不明显。比如说我们来看这段视频,孤独 使我的内心更加坚强。可以看到,虽说生成的画面人物的嘴部依然是有动态的,但整体的表现效果会相对一般,人物的身体也伴随着说话出现了不太自然的动态效果。我们再来看一个人物近景特写对口型时的画面,古董 使我的内心更加坚强。可以看到,此时生成的画面,人物的口型和台词就十分匹配,且面部的动态表现比较清晰自然,所以当我们遇到有角色在说台词的画面时,就尽量使用近景和正面的镜头,以获取更好的对口型效果。 我们最后来看图片生成之后的修改技巧。在通过纹身图生成图片时,很多情况下并不能一次性就生成让人满意的效果,但也许生成的图片百分之八十是满意的,剩余的百分之二十相比于重新生成一张进行后期的修改是性价比更高的选择。 或者有些时候我们需要表达一个很长的镜头,以此来表现画面的时间流逝或者是人物的一连串动作。所以我们首先来看第一点,固定镜头下长时间事物运动的表达技巧。这里就包含很多方面了,比如我们现在想要表达一年四季的变化, 我们在生成好人物盘腿打坐的画面之后,我们就可以直接让 ai 大 语言模型帮助我们固定画面当中的人物造型和构图,但只改变画面当中的四季。比如我们首先生成的第一张图片是类似于春季或者夏季,在提示词中,我们要求将上图的季节改为秋季风格, 其他部分保持不变,此时就获取了人物在秋天打坐的画面。同样的道理,我们继续描述将上图的季节改为冬季,其他部分保持不变,那么最终就成功的将图片改为了冬天的季节。 有了这些图片之后,我们使用首尾针生成或者多针生成的方式就可以生成一组人物,从春天到夏天再到秋冬天,一直在这个位置打坐, 以此来表现人物十分勤勉、十分有毅力的镜头片段效果。当然,除了描述季节之外,我们也可以描述将人物修改成某种姿势,在人物的身边添加某些事物,减少某些事物,其他部分保持不变,相信大家这里都 能举一反三,我们就不再赘述。第二个图片修改技巧,就是如何在保持造型和风格一致的条件下修改环境和状态的技巧。其实这一点在大多数情况下不需要我们特意去保持, 因为使用 ai 大 语言模型来生成图片是有上下文关联的功能的。比方说我们在刚刚演示时,提示词中只描述了鲤鱼跃出水面,飞的很高,就像是长了翅膀一样,本身的意图是想单独生成一条跃出水面的鲤 鱼,但得益于 ai 大 语言模型能够关联上下文的能力,他依旧认为我是想要基于上面这张图片来修改新的内容,而且可以看到生成的结果在美术风格上同样保持了上图当中的风格。 很多情况下,我们不太需要单独的提及要保持画面的风格,但需要注意的是,在实际的制作过程中,偶尔会出现我们上传了一张参考图,但生成的结果和参考图在造型上美术风格不统一的情况。又像这里是我之前制作了一个 ai 故事短片, 在制作的时候,像这张图片是一个已经制作好的角色造型,是一个三 d q 版卡通形象,但人物整体还是偏向于写实的特征。在上传了这个参考图 提出了相应的修改要求之后,可以看到生成的结果并不能让人满意。虽说人物在造型的设计上保持了一致,但整个人物的比例和特点都发生了翻天覆地的变化。因此在遇到这种情况时,该怎么解决呢? 最好就要更换一个图片生成平台。在使用不同的图片生成平台生成图片时,其实每一家所使用的生成模型都会有所区别, 可能有些模型擅长生成写实的风格,有些模型擅长生成绘画的风格,有些模型这个角度生成不好,有些模型这个风格生成不好,这些都是很常见的情况,所以大家在对图片的内容进行修改时,也不要在一棵树上吊死。 如果时代生成不好,除了用极梦 ai 或者豆包平台之外,也不妨尝试用其他的平台,比如说用可连 ai 或者像一些开源的使用 context 的 模型、 flex 模型或者 banana 模型的工作流都是可以的。例如现在来到利布利布 ai, 我 们点击这里的在 comfui 运行, 此时就来到了 comfui 工作流的操作页面。这是一个 context 的 模型的工作流,其基本功能就是参考图生图。在左侧的图像输入窗口, 将刚刚未能在豆包上生成成功的人物造型进行上传,在提示词描述当中描述我们的需求,例如这里我们就输入和在豆包上一样的提示词,根据图片生成人物特写,生气,拍桌子、表情愤怒。而比例方面我们修改为十六比九,然后直接点击开始升图, 可以看到一段时间后图片就生成好了,整体的生成效果还是非常出色的,我们将在豆包上面生成的人物造型放在旁边,同时将原版的人物造型参考也放在旁边。 可以看到在对比之下,显然使用 context 的 模型工作流能够生成人物的造型更加统一的画面效果。当然在豆包上大多数情况下是直接可以修改的,只是偶尔会出现这样的问题, 所以届时也不妨尝试使用其他方式,在保持人物造型和美术风格的情况下,来修改环境和画面当中事物的状态。最后一点就是灵活的使用参考图升图的功能。要知道参考图升图不光只局限于上传单一的图像参考,目前大部分的图像生成平台都是支持多图参考的。 现在我们将陌生的人物形象和零度的人物形象同时上传,再上传好之后,输入提示词生成人物骑着白鹿在丛林中的画面,然后点击发送, 可以看到最终生成的效果。既保留了零度的形象,也保留了陌生的形象,同时也符合了提示词中描述的人物在丛林中的画面的要求。在很多其他的事物无法生成出来或者生成的结果不符合要求时,同样可以使用多图参考功能, 将指定的物品按照提示词的要求进行结合,灵活的使用参考图生图的能力。最后来简单总结一下这节课我们讲解了图片生成的相关知识,包括前期准备、提示词结构、 提示词描述技巧和图片修改技巧。这些知识能够帮助大家在生成分镜头图片时,更容易生成出理想的画面。当然大家在实际操作时遇到的问题,我会尽可能帮助大家解决,在操作过程当中遇到的问题 也会分享相关的课程资料。以上就是本期视频的全部内容,如果觉得本期视频的内容对你有帮助,也不妨点赞关注、支持一下,我们就下期视频再见。 大家好!在先前的课程中,我们已经讲解了 ai 剧本脚本该如何生成,以及如何根据我们所生成的剧本脚本生成对应的分镜头图片。这节课就到了正式的生成 ai 视频片段的环节了。目前市面上的 ai 视频生成平台有很多,我们该如何选择呢?根据我这些年的使用 经验,综合操作的便利性、生成的效果和平台所提供的功能来看,通常我们制作一个完整的 ai 视频作品,能够用到的平台有三个,分别是可琳 吉梦和 made johnny。 我 们下面就分别对这三个平台进行逐一介绍。首先来讲解吉梦平台的视频生成功能。来 到极梦 ai 的 首页,可以看到在这个页面的最上方我们就能够找到相关的生成选项。其中默认的这个 agent 模式是允许我们输入任意的要求。当前平台会根据已有的功能来尽量满足在提示词中所输入的要求, 但目前这项功能还不算特别智能,生成的效果有时会不符合我们的想象,所以要专门生成视频的话,我们还是使用专门的生成功能比较好。点击左侧的生成分选项, 来到专门的生成页面,然后在左下方将当前的功能切换为视频生成功能。在几乎所有的 ai 视频生成平台中,视频生成都分为两个类型,一个是文声视频,另一个是图声视频。 要强调的是,几乎在所有的情况下,纹身视频都不是一个明智的选择,因为纹身视频在内容上是较为不可控的,无论是画面当中的形象,还是在生成视频时视频中事物可能发生的变化,以及镜头的运镜都存在相当多的未知数, 所以在几乎所有的情况下,使用图声视频才是明智的,更加高效的选择。当然,我们也会简单的讲解一下在文声视频时有哪些注意事项。既然是文声视频,我们所描述的内容就要远比图声视频要多,不仅需要描述画面当中镜头的运动方式和事物的变化, 同时也要描述画面本身有什么。所以我们这里来回顾一下生成图片时的提示词基本结构。可以看到需要非常清楚的生成一幅画面就要描述关于画面的诸多方向,所以这里我们首先描述景别,例如近景,一个少女穿着白色毛衣,在白天走在 街道上,冷色调电影感构图。然后就是来书写质量词,例如胶片颗粒质感、超高清十六 k 等等。在描述好关于图片部分的内容之后,先不要着急生成,我们还需要描述和画面当中的运动以及运镜相关的内容。 首先来描述运镜方面,将人物走路的画面就非常适合使用镜头跟随的运镜,我们就书写镜头跟随人物。而人物方面呢,我们就描述面向镜头向前走,现在生成一个图片时所需要的内容,以及生成一个视频时所需要描述的内容都已经描述好了,就 可以回车发送了。可以看到最终整体生成的视频效果还是不错的。不过像人物的长相,画面的具体内容,街道上有无行人,人物的年龄,这些内容本身我们就没有描述, 所以生成的也比较随机。虽然整体视频生成的质量和动态效果是好的,但在内容上未必都是我们需要的。 这里再次强调,不建议大家使用文声视频功能,大多数情况下就使用徒声视频,那么今天说到徒声视频,我们下面来看一看徒声视频都有哪些功能机制。大多数的视频生成平台这些功能机制都大同小异, 所以我们就只讲极梦 ai 上的主要功能,大家在使用其他平台时注意举一反三。首先是最为基础的手阵图声视频功能,这项功能需要我们通过拖拽或者点击上传的方式将 将图片上传到手针图的预备窗口当中。在上传好之后,接下来就是输入提示词描述了。不同于文生视频,图生视频本身上传的参考图就已经给出了充足的画面信息,因此在图生视频时,我们就只需要描述画面当中事物的运动变化以及运镜即可。 首先来描述运镜,这里我们就描述固定镜头,水在流动,风吹起人物的头发和草地。因为当前的画面我们要展示的 我们在上一期视频中生成的人物在打坐的画面,因此无论是运镜方面还是人物的动态方面,都会相对显得比较静态, 所以我们需要尽量的让画面当中可动的部分进行一定的运动,将画面当中的水流还有草被风吹动的效果都可以在提示词中提及。在写好提示词后就直接点击生成图生视频时会直接根据图片本身的宽高比来 来决定视频生成的宽高比,所以大多数时间就是上传图片描述运镜和事物的变化,然后点击发送就可以了。趁着生成的这段时间,我们来讲解一下相关的参数设置。 首先是视频生成模型,和其他平台一样,在选择视频生成模型时,版本标号越高的模型通常效果就越好,但消耗的点数也会越多,建议大家在使用时都选择版本标号最高的。这里的生成方式在即梦上有首尾真生视频、 智能多帧升视频和参考图升视频三项功能,而宽高比方面通常选择自动匹配,时间方面有五秒和十秒可选,这里不是很建议大家在非必要的情况下选择生成十秒钟的视 频,因为视频生成的时间越长,画面当中的动态以及各种结构的可控性就会变得不可控,极有可能会生成失败。至于运镜方面,目前极梦 ai 上提供了一些运镜的模板, 这些运镜和我们自己手动输入提示词在效果上是一样的,所以如果不太清楚运镜该怎么描述,可以直接使用模板当中的描述,知道怎么描述的话就直接在提示词里面描述。现在视频已经生成好了,来看一看效果如何吧。可以看到整个视频的动态效果还是不错的,水的流动非常的自然, 风也轻微的吹动了,人物的头发槽也在轻轻的晃动。像这样的视频生成,每次的效果都是有一定随机性的, 如果对当前的效果不够满意,可以根据当前的提示词和生成的效果对提示词的部分加以改进,或者适当的修改原图当中的某些内容。当然如果觉得全部都没有问题,就是因为随机性导致生成的效果不好,也可以直接点击下边的再次生成,这样就不用再编辑,直接会重新生成一条新的视频。 我们下面再来看首尾帧生视频,就是字面意思,我们刚刚已经上传了手帧图,用手帧图生成了一个视频片段,通过手帧图生视频,人物在结尾时是如何表现的,画面中的事物在结尾时是如何发生变化的,这些都是未知数, 但首尾帧生视频则不同,我们现在再来上传一张尾帧图的图片到预备窗口当中,此次上传的是这张陌生在秋天的环境中打作的图片, 这样一来我们就可以控制生成的视频在伪真实是有怎样的事物变化和画面表现了。提示词我们同样书写固定镜头,水在流动,风吹起人物的头发和草地。 这里进一步的我们要增加一个对于运镜的描述,叫延时摄影,水快速流动,草快速摇晃,通过这样的方式让画面当中的水流和草的晃动能够更加迅速,以此来表现画面当中从夏季 快速到秋季的效果。至于时长方面,我们这里可以赋予它更长的时长,给整个的移轴摄影效果留出充足的时间,当然这里我们就选择五秒钟,其实也是够用的,现在再次点击生成一段时间后,视频就生成好了,来看一看效果如何吧。 可以看到最终生成的效果,虽然在落叶飘落到地面上的效果时还不错,但整个人物后方的水流效果就显得非常假了, 这也是生成的随机性导致的,可以考虑多生成几次来获取更好的效果。我们继续来看奇梦 ai 上视频生成的下一个功能就是多帧生成,点击这里的下拉菜单,将首尾帧生成修改为智能多帧,此时就会多出一个图片上传窗口。 而我们要做的事情就是在第三个多帧上传窗口再次追加一张图片,将其拖拽到这个位置,此时可以看到在图片与图片之间有一个间隔的位置,点击这个间隔的有摄像机图标的位置 会弹出一个文本输入框,这个位置是用来描述图片与图片之间在运镜和事物变化上的描述的。 们上传的第三张图片是人物在冬季打作的画面,因此提示词描述基本上和上一张在季节上更替的描述保持不变。 当然因为有了前车之鉴,上一条视频生成的并不是很好,所以在提示词里面我们可以追加一个描述,那就是季节快速更替,同时将水快速流动这个选项进行删除,让 ai 自行来决定水该如何流动,然后复制下来。点, 点击确定。同样把上一段图片与图片之间衔接的提示词内容替换为当前的内容,点击确定多帧生成功能。在图片生成时,它的上限不止三张。我们可以继续添加第四张、第五张图片,以此来生成一个连贯的、 时间较长的视频画面,来表现更多更长的画面当中事物的变化动态。例如像先前我就生成过一个使用四张图片 合成的多帧生成的视频,就是这个人物在水中游泳的视频。可以看到整个视频的连贯性,还有人物表情的自然性还是表现的相当不错的。 视频的持续时长长达二十秒左右,不过像这样的长度对四张图片在人物长相特征和环境的一致性上要求就比较高了。我们回到最下方,现在图片和提示词都已经描述好了点 生成,看一看效果如何吧。可以看到,最终在生成效果上表现的依然在水的动态上,不是很尽人意,这也是当前的视频模型本身的机制导致的。在遇到这种情况时,大家不妨尝试更换视频生成模型,以此来谋求更好的效果。所以我们下面来讲解一下其他的 ai 视频生成平台。 在讲解之前,我们来提一嘴最后的主体参考功能。这项功能允许我们上传画面当中事物的参考图, 比如上传一只兔子,上传一个帽子,提示词就书写兔子戴着帽子在做什么事情。这样一来,会使得生成的视频内容在兔子和帽子的造型上保持和上传参考图一致的形象。但这种方法和文声视频类似, 在一定程度上保持了画面当中所出现事物的造型是符合我们需求的,但依然在其他的方面,比如周围的环境、色调氛围上是不可控的,比不上。我们先通过参考图生图的方式,将兔子和帽子生成在同一个画面上, 然后在确保画面当中在色调氛围和周围环境上也是符合我们需求的,再来进行图声视频。因此这个功能我们就不再赘述,大家感兴趣的话可以上传参考图,配合提示词的描述,生成一段视频试一试。 我们下面再来讲解一下关于可灵平台的使用方法。来到可灵 ai 的 首页,需要先说明的是,这些视频生成平台在使用操作和功能上基本上大同小异。在可灵 ai 平台依然是点击左侧的视频生成选项,可以看到同样分为了文声视频 和图声视频,具体的操作也和在极梦 ai 上是一样的,所以我们就不再做过多的演示。唯一多出的一项功能是这里的多模态编辑功能,这项功能能够对视频当中已经出现的事物 进行替换,增加元素或者删除元素。我们就以替换元素为例,这里先前我已经生成过一条视频了, 可以看一看效果如何。就是这条视频当中显示老人在喂狗的画面,其实原视频是展示的老人在喂猫的画面,而参考图是一只狗。那么具体该如何操作能够把视频画面当中的猫替换成狗呢? 我们下面来简单演示一下。首先需要将进行多模态编辑的视频通过拖拽或者点击上传的方式 上传到这个位置,在上传好之后,可令 ai 会分析视频当中都有什么事物,如果分析成功,会自动弹出一个窗口,在这个窗口中,我们的鼠标就变成了一个自动选区工具,可以通过点击的方式选中要进行替换的内容。 比如点击这只猫的部位,此时猫的身体就变成了绿色,如果某些地方没有变成绿色,我们就多点击几下, 绿色能够覆盖猫的全身,当然此时的绿色范围只显示当前我们所见的这一帧画面的内容,那其他真的画面是否也把猫给选中了呢?可以点击这里的预览完整选区选项,可以看到此时视频就开始自动播放,如果在整个播放过程中, 几乎猫的全身都是绿色,那么就说明整个猫在将来会被成功的进行替换。确认无物之后,就点击右下方的确定选项,然后在下方我们需要上传一张去替换这个猫的事物, 可以自己上传一张图片,也可以选择官方所提供的素材。在上传好图片之后,同样会弹出一个窗口,让我们选择参考的是什么?参考的是长相,参考的是主体,或者参考的是服装,通常选择智能参考就可以, 我们点击确认。最后是提示词描述的部分,可以看到这里可令 ai 已经给出了一个书写的模板,我们直接填空就行了。使用图片中的主体 替换视频中的猫,这里之所以写主体,是因为图片里面这个东西具体是个什么也不太好判断,是一只小黄鸭,戴了个兔耳朵帽子,所以直接描述主体就好了。而视频当中我们要替换的这只猫就很明确了,它就是一只猫,所以这个框里面就写猫, 这就是关于替换元素该如何使用。至于增加元素,我们在上传一条视频后,点击这个视频的位置,并不会弹出窗口让我们设定在哪个位置来增加元素,所以全屏提示词的描述,在上传好主体参考之后,可以看到下方的提示词描述框 打好了模板,告诉我们基于视频中的原始内容,以自然生动的方式将图片中的什么,我们就这里写主体融入视频中的什么。这里的这个框是用来描述你要生成的具体位置的,比如猫的旁边,这样一来生成的视频就会在猫的旁边来加上我们所上传的这个事物的造型。 而删除元素的话,和替换元素的操作方法类似,在上传视频之后会自动弹出一个窗口,或者我们点击已经上传好视频的位置,也会弹出这个窗口,通过选区的方式选中要进行删除的元素,点 击确定。而提示词呢,就描述删除视频当中的什么,这里当然是写猫,这样一来新生成的视频这个猫就会被删除了。 就是关于可灵 ai 视频生成功能当中的多模态编辑功能,具体该如何操作,不过具体的效果大家可以看到,像右侧视频当中的这条狗,在替换之后,在清晰度上是远不如视频当中其他的部分的。因为要想使用多模态编辑功能,我们只能使用可灵一点六模型, 而可令最新的是二点五 turbo 模型中间差了很多个版本,所以是否使用这项功能就看大家的取舍了,在更多的时候使用多模态编辑其实更适合去处理在现实生活中拍摄的视频,而非 ai 生成的视频。 近在处理 ai 生成的视频时,与其在视频上处理,不如在源头,也就是在生成视频时所使用的图片上去处理,要来的更加方便。我们在刚刚可令 ai 和吉梦 ai 的 演示中,或多或少都出现了画面质量不佳,或者生成的动态效果不好的情况,这 也是我们此次讲解要讲解多个平台的原因,那就是每个平台的视频生成模型都有各自的优劣,可能在生成某些场景时表现很好,但一旦遇到一些特定的场景,比如像极梦 ai 遇到流水的场景,就生成的不尽人意。所以下面我们来讲解一下关于 made journey 如何生成视频。 相信大家平时生成图片都是使用 discord, 所以 首先我们来到 discord, 在 任意的图片生成结果的右下方点击这个位置,此时就来到了 made journey 的 官网。 如果是第一次通过这种方式打开 made journey 的 官网,我们需要点击左下方的 sagin, 然后选择用 discord 的 账号来登录一下,在登录完成之后,点击左侧的 create 选项,这时就来到了生成页面,在这个页面可以生成图片, 也可以生成视频,我们这节课就只讲解生成视频相关的功能。点击左侧的图像加选项,在这里可以上传首尾帧图片。在图片上传好之后,我们来了解一下相关的参数设置。 先是最上方的提示词输入,这里的描述方式和先前在其他的视频生成平台一样,主要描述的有两个方面,一个是视频的运镜,另一个是画面当中事物的变化。例如这里我们描述人物戴上墨镜,在写好之后,记得将提示词翻译成英文。 通常来说直接上传手帧图描述提示词,然后点击右侧的发送,就可以开始生成视频了。在生成的这段时间,我们再来讲解一下其他的相关功能。可以看到,在上传好手帧图之后,右侧 ending frame 是 上传伪帧图的地方, 它的使用方法和其他的视频生成平台一致,我们就不再重复的演示。但我们可以注意到在下方有一个 loft 选项,我们将这个选项进行勾选,此时手帧图和尾帧图会自动视为同一张图进行使用这项功能。在勾选之后,我们会生成首尾相接的视频, 这样我们生成的视频就能够无限循环,手帧和尾帧之间能够丝滑的衔接。而最右侧的 motion 选项则是在设置视频生成的动态的分为低动态和高动态, 选择低动态的话,视频当中物品的运动就会相对柔和缓慢一些,而选择高动态,视频当中事物的变化就会更加激烈,更加迅速。此外,在提示词输入框的最右侧还有一个 settings 选项,在打开这个选项之后, 可以看到右下方还有进一步的参数设置。首先是视频生成的品质,可以看到这里 sd 指的是标签模式, hd 指的是高清模式,对应的大约是一零八零 p 的 分辨率,而下方有单次生成的视频数量,可以看到当前我们所生成的视频一次性会生成四条视频,而这里在设置数量区域,我们可以选择一次性生成一条或者两条视频。在 在视频生成好之后,将鼠标旋至在生成好的部分这一行就会自动播放预览当前的视频。可以看到在 madejong 上面生成的视频在整体的质量和人物动态的自然程度上还是相当不错的。我们点击打开任意一条视频, 再打开之后,在右侧会有相应的后续选项可选。我们现在将页面进行汉化,来看一看这些后续选项都有哪些。首先是重新生成选项, 在点击之后就会基于当前的提示词和手帧图进行重新生成。然后是下方的将起始帧作为重新生成的参数,或者将提示词作为重新生成的参数。再往下还有自动状态下的低动态和高动态可选。可以看到在这个位置还有一项功能叫扩展视频。 在点击这项功能之后, madeleine 会将我们当前生成的视频作为一项生成参数。我们可以配合着提示词来描述这项视频在结束之后继续发生什么样的事情。例如当人物戴上墨镜之后,再让人物去吃个汉堡, 或者让人物摘下墨镜来做其他事情都是可以的。这项功能不同于极梦 ai 的 多帧声视频,它可以基于视频本身配合提示词的描述来延长这个视频的内容。当然,我们也可以在这个位置追加一个结束帧,来告诉 meghan 延长后的视频人物最终是在做什么。 虽然在操作上有所不同,但是在机制上, made journey 的 视频延长功能和吉梦 ai 的 多帧生成功能在底层逻辑上基本是一样的,只是在 made journey 上可能会更麻烦一些,需要先生成一个视频,再用这个视频加上伪帧图来延长视频。 以上就是关于 made johnny 的 视频生成功能的具体操作。总结一下,我们这期视频讲解了 ai 视频生成的平台选择、文声视频以及各个平台的图声视频功能该如何进行操作。大家日常使用的话通常选择吉梦可灵就可以, 而吉梦 ai 在 生成的性价比上也会更高一些,价格大概是可灵 ai 的 三分之一,同时生成的质量也并不比其他平台差。 当我们遇到极梦 ai 平台生成不好的视频内容时,再考虑使用其他平台,看看能否生成令我们更加满意的效果,这也是我们一次性讲解多个平台的操作方法的意义所在。以上就是本期视频的全部内容,如果觉得本期视频的内容对你有帮助,也不妨点赞关注、支持一下,我们就下期视频再见。 大家好,我们这期视频来讲解如何用 ai 生成配音,像我们常见的可林、极梦等平台,同 样具备生成配音的功能。但需要注意的是,在生成配音时通常分为两种情况,第一种情况就是旁白配音,这样的配音是不需要进行口型匹配的,更像是以第三人称视角在讲述故事时进行的配音。同时这样的配音也不需要太多情感,只要能够清晰的朗读出故事文本就可以。 而第二种类型就是角色配音,这样的配音就需要进行口型匹配,并且在朗读时要根据剧情带有情感。我们首先来看第一种情况,有哪些平台可以使用。其实在我们进行视频剪辑时,在剪映上就 会有将文本转换成音频的功能。首先来到剪映当中,点击左上方的文本分选项,可以看到这里有一个选项叫添加口播稿,在点击之后会弹出一个窗口,我们直接将想要进行配音的文本输入或者复制粘贴到这个位置就可以。例如我们现在输入海星没有大脑和血液, 主要依靠海水循环完成营养输送和呼吸。在输入好之后,点击下方的配音选项,此时在右侧就会展开一个音色选择窗口,点击对应的小图标,就可以对当前的音色进行试听。 海星没有大脑和血液,主要依靠海水循环完成营养输送和呼吸。如果觉得这个音色是我们想要的,就直接点击右下方的添加轨道即可,与之匹配的还有相应的字幕,我们现在点击播放一下,来看一看具体的效果如何。 海星没有大脑和血液,主要依靠海水循环完成营养输送和呼吸,可以听到整体的配音效果还是不错的。当然在剪映上通过这种方式所生成的音频 在朗读方面是没有情感的,因此在大多数情况下就只适合作为旁白来使用。同样的道理,在极梦 ai 或者可灵 ai 平台, 同样具备将文本升成为音频的功能。点击左侧的生成选项,将下方的模式修改为数字人模式,在极梦 ai 当中使用这个模式即可对我们上传的视频片段或者人物图片进行对口型操作。如果我们没有提前在本地电脑当中准备角色说话时的音频的话,在 在上传图片或视频的窗口右侧点击这个位置,即可选择在极梦 ai 上给我们提供的默认音色。点击这个音色左侧的播放按钮,即可对当前的音色进行试听。欢迎使用对口型功能,让你的故事镜头栩栩如生。此外,在这上面的部分音色同样可以选择朗读时的情绪和语速 当前的音色。点击右侧的设置选项,可以看到这个音色是可以设置说话的速度的。而像下方这个抚媚女生的选项可以看到在鼠标旋至在上方之前,其右侧有一个表情加的符号,带有这种符号的音色,再点 级之后,就可以选择在配音时人物讲话的情感,例如现在我们选择愤怒的情感。欢迎使用对口型功能,让你的故事镜头栩栩如生。可以听出这次朗读的语气明显要愤怒了不少。当然,在极梦 ai 上目前具备情感朗读功能的音色有限, 所以除非刚好你需要用到这个音色与人物的造型是相匹配的,否则在大多数情况下,在极梦 ai 上所生成的对口型音色依然不适合用在角色的配音当中。至于文本转音频功能,在可灵 ai 上操作也和其他平台大同小异。 来到可灵 ai 的 首页,我们点击左侧的全部工具选项,可以看到这项功能。在可灵 ai 上同样是数字人功能, 在点击打开之后,左侧是上传人物形象的部分,在这里做了个区分,像左上方的数字人分选项是用来上传图片,让图片开口说话的,而右侧的对口型选项是用来上传视频,让视频中的人物开口说话的。大家可以根据自身的需求来选择合适的方式。 而这里在可令 ai 官方的选项中同样提供了很多音色,我们将鼠标悬置在对应图片的上方,即可试听这个音色。 家人们晚上好,快使用,我来给你的商品带货吧。在选择了一个音色之后,同样的部分音色可以在最下方调节语速和情感,而不支持调节的,将鼠标悬置在上方时,则会提示该音色不支持什么样的感情。 因此我们刚刚介绍的这些软件或者平台,在更多情况下,他们更适合让一个角色形象去播报新闻,这样的情况进行配音不需要太多的情感。 第二种类型,角色配音就需要人物富有情感,且需要进行口型匹配了。那目前市面上有没有好用又便宜的软件能够满足这样的需求呢?答案是有的。这款软件还是一个 windows 电脑通常会自带的本地软件,叫做 clippchamp, 大家可以直接在自己的 windows 系统上搜索这个名字,没有搜索到也没关系。打开任意的浏览器,我们搜索 clippchamp 就 可以找到 clippchamp 的 进入地址。在点击之后就会来到 clippchamp 的 登录页面,现在点击这里的编辑视频选项,在点击之后,如果之前没有登录过的话,会先让我们选择对应的账号来登录,我们可以使用邮箱、谷歌账号或者微软账号来进行登录,这里我们就使用 谷歌账号。在登录完成后,点击这里的文字转语音的试一试选项,此时就正式进入到了 clippchamp 的 操作页面。这个软件本质上是一个剪辑工具,类似于剪映, 所以我们能够看到一个和剪辑工具类似的页面布局。现在点击左侧的文字转语音选项,就会在下方的剪辑轨道上添加一段带录入音频的空白。音频部分可以看到在右侧我们就可以选择语言以及对应的声音了。点击这个选项可以试听当前我们选择的声音, 从各种语音中进行选择,帮助创建值得分享的故事。在这个上面音色的选项非常丰富,展开下拉菜单,我们用鼠标滚轮不断的往下拖动,可以看到这些都是可选择的音色,且每个音色也备注了其特点。 其中大多数音色在设置时都是可以设置朗读时的情感的。例如现在我们点击下方的高级选项,将其展开当前的音色就可以选择声调的高低 及语速的快慢。我们再来更换一个音色,例如现在我们更换为一个名叫云野的音色,在更换好之后,下方就多出了一个情感下拉菜单,可以看到上面提供的情感选项还是非常丰富的,像尴尬、平静、 害怕、高兴、不满、严重生气、难过等等都可以选择。例如现在我们选择高兴这个选项,而声调方面通常要迎合高兴的就选择为高或者超高 速也稍微快一些。在下方的文本输入框输入想要这个音色朗读的内容,例如现在我们输入太好了,今天不用加班,可以按时回家了。点击下方的预览即可试听当前我们输入的文本转换之后的效果太好了,今天不用加班,可以按时回家了。 如果觉得这个效果不错的话,就点击右下方的保存选项,此时这段音频就会被保存到剪辑轨道当中。如果想要直接将这段音频和我们生成的 ai 视频片段相结合并一起导出,也可以直接将我们生成好的 ai 视频片段添加到上方的 添加视频这个剪辑轨道上,然后点击右上方的导出。但并不是很建议大家这样做,因为在点击导出这个选项之后,会需要我们选择导出的分辨率,可以看到四 k 分 辨率是需要充值 clipchamp 会员的, 所以我们现在要做的事情就仅导出音频即可。因为没有视频画面,所以选择最低分辨率的四八零 p, 在 点击之后就会下载到当前浏览器在本地电脑上的默认下载位置。目前 clipp chip 给到的免费配音额度是很多的,正常的使用频率的话根本用不完,所以大家不用担心生成额度的问题。 当然,如果我们今天所讲解的内容在某些情况下依然无法满足我们的使用需求,也可以直接求助豆包 ai, 让他帮我们推荐几个其他的能够带有感情设置的 ai 文本转语音网站。在获取了视频片段和音频文件之后,我们最后一步要做的事情就是来到 ai 视频生成平台, 使用其数字人功能上传视频文件,同时上传已经生成好的本地音频文件,对视频当中的人物进行对口型了, 本身操作逻辑并不复杂,这里我们就不再进行详细的演示。唯一需要注意的一点就是我们所上传的视频片段,人物最好保持正面近景镜头,这样能够获得更好的对口型效果。像一些侧面视角或者是远景视角,通常获得的对口型效果会偏弱一些, 这就是本期视频的全部内容,如果觉得本期视频的内容对你有帮助,也不妨点赞、关注、支持一下,我们就下期视频再见。大家好,我们这期视频来讲解如何使用 ai 生成配乐。目前能够生成 ai 配乐的平台有很多,像我们非常熟悉的可灵 奇梦,甚至是剪辑软件、剪映,包括 ai 大 语言模型、豆包都是能够生成 ai 配乐的。当然在此之前也有很多专门的音效生成平台也能够生成 ai 配乐。而在配乐的分类上,主要分为歌曲、 纯音乐和音效。在本节课的最后,我们来讲解具体的配乐技巧,看一看如何在剪辑软件当中使用现成素材, 生成的素材将配乐与画面相匹配。我们首先来看在可灵 ai 上如何生成音效。来到可灵 ai 的 首页,点击左侧的全部工具选项,可以看到在右侧这个位置有一个音效生成功能,点击进入,此时就可以生成音效了。 在上方有两种生成音效的方式,第一种是文声音效,可以在提示词当中输入对音效的描述,以此来生成对应的声音效果。当然这里的音效指的并非是音乐或者歌曲,而是在日常生活当中比较常见的音效, 比如这里的推荐音效,将鼠标悬置在上方就可以试听这里是木门敲击的声音。此外,上方的分选项当中还有视频声音效的选项,我们可以选择先上传一段视频,然后在下方 描述想要视频当中出现的音效,同时描述想要视频当中出现的配乐,这里的配乐指的就是纯音乐了。 以上就是如何在可灵 ai 当中来生成音效,我们下面再来看在极梦 ai 当中如何生成音效。来到极梦 ai 的 生成页面,点击左下方的下拉菜单, 可以看到在极梦 ai 中并没有专门的生成音效的功能,所以我们只能基于当前已经生成好的视频来生成对应的音效。打开任意一个已经生成好的视频,进入大窗预览状态,可以看到在右下方有 ai 音效和 ai 配乐的选项。我们首先点击 ai 音效, 此时就会自动根据画面来生成相应的音效,可以简单听一下效果如何。 可以听出此时生成的音效几乎微不可见,并没有我们想象当中人物在走路时鞋和地面之间碰撞发出的声音,或者来自周围环境,例如鸟鸣、人声、嘈杂等声音。 这是两方面的原因导致的,一方面是目前的 ai 自动生成音效在模型功能上还不够完善,另一方面就是本 生成带有一些随机性,可以多生成几次。我们再来看这里的 ai 配乐选项,同样点击这个位置,此时会弹出一个窗口,在左上方有两个分选项,一个是根据画面配乐,一个是自定义 ai 配乐。 比如我们现在选择自定义 ai 配乐,可以看到下方有不同的场景可选,比如现在我们选择这里的日常选项,而流派就选择国风与人物的穿搭相匹配, 情感方面就选择宁静,而乐器方面可以不做选择,也可以任选一个。如这里我们就选择长笛,然后点击生成一段时间后,配乐就生成好了,我们点击来看一看效果如何吧。 这里一共生成了三个选项,我们再来看一看第二个选项, 再来看一看第三个选项, 可以听出这三个选项当中对于画面的配乐还是比较符合我们选择的生成配乐的选项的,但在最终效果的呈线上依然算不上精美。 除了我们刚刚所见到的视频生成平台能够生成配音配乐之外,目前在剪映当中一样可以生成相应的配音。配乐 配音方面我们之前的课程当中已经讲解过了,下面来看配乐。点击左上方的音频的选项,在点击之后, 首先来选择生成音乐的类型,有带有歌词的歌曲,还有纯音乐之分。然后在下方的提示词输入框中,我们来输入想要生成的风格,例如这里我们书写未来科技感,以对可控核聚变而诞生的无尽能源的赞颂为主题。 下面点击右下方的生成一段时间后,三首歌曲就生成好了,我们来简单试听一首,看一看效果如何吧。 可以听出,虽然整个歌曲在结构上还是比较完整的,但无论是旋律还是歌词的含义上, 似乎生成的都略显廉价,我们下面再来看豆包 ai, 在 豆包 ai 当中一样具备生成音乐的能力。来到豆包 ai 的 生成首页,点击这里的更多选项,可以看到这里有一个音乐生成的功能,点击这个功能,此时会列出一个输入提示词的框架,我想创作一首歌曲, 用 ai 帮我写歌词,然后在这里我们要描述歌词想要表达的主题,选择这首歌的风格,选择这首歌的情绪,选择这首歌在性别上的音色,在下方还有已经生成过的音乐的试听选项,大家如果感兴趣的话,可以点击试听一下效果。 总的来说,目前想要获取一些简单的配乐是有很多平台都可以实现的。但也不难听出,无论是可林吉梦这样的 ai 视频生成平台,还是像剪映豆包 这样的具备剪辑能力以及 ai 大 语言模型的平台,似乎是因为并非专门生成 ai 配乐的平台,最终生成的效果都不是很专业,甚至可以用差来形容。那有没有一个专门用来生成 ai 音效的平台能够生成效果较好的配乐呢?当然是有的,我们下面就来介绍一款免费的 ai 生成配乐的平 台,叫做 music hero。 点 ai, 大家在任意的浏览器上搜索 music hero, 然后找到这个选项,点击进入,然 然后点击这里的访问 music hero 官网。如果之前没有使用过的话,我们需要在右上方点击登录,用谷歌账号或者微软账号都可以。在登录完成后,我们就来到了 music hero ai 的 生成页面, 可以看到在左侧有很多不同的分选项,我们今天主要用到的就是音乐生成器和音效生成器两种。首先来看音乐生成器,可以看到整个页面的设置非常直观,在歌曲描述这里, 我们可以按照提示来输入音乐的风格和主题,此时 ai 会自动生成歌词,那么如果想要生成自己来书写歌词的音乐的话,就点击上方的自定义设置选项, 此时就会弹出一个新的用来输入歌词的输入栏。如果不太清楚该如何书写歌词的话,其实也非常简单。我们当然可以借助 ai 大 语言模型帮我们来描述音乐的风格和主题以及 相应的歌词,这里我们就输入你是一个音乐专家,现在帮我编写一段有歌词的音乐,主题和风格不限,但是要统一协调。现在回车发送一段时间后,内容就生成好了。我们将生成好的内容 在歌词方面先复制下来,在复制好之后回到 music hill, 将其粘贴到歌词输入框当中。之后回到豆包 ai, 我 们再将音乐风格和主题复制下来,然后回到 music hill, 将主题以及 风格粘贴到对应的输入框中。需要注意的是,这里的主题和风格我们最好将其翻译成英文,因为有时这个网站在中文理解能力上不是很强,只有歌词的部分能 够转换成歌曲,而其余的部分在某些时候可能无法理解其含义。最后在下方输入标题,这里我们就沿用 ai 生成的标题, 然后在上方选择声音,直接点击下方的生成音乐就可以了。值得一提的是,如果想要生成没有歌词的音乐,我们就将上方的伴奏这个选项打开,此时生成的就是没有歌词的纯音乐了,下面点击生成。在等待歌曲生成的这段时间,我们再来讲解一下如何生成音效。 点击左侧的音效生成器,在上方描述我们想要生成的音效就可以了,例如现在我们描述刀切西瓜的声音,同样记得把这些提示词来翻译成英文,然后点击下方的生成声音,一段时间后,切西瓜的声音就生成好了,点击下方的播放来听一听效果如何吧。 可以听到切西瓜的声音还是比较脆的,可以看到在右上方除了我们当前试听的这段声音之外,一次性会生成四段声音,如果对当前的声音不够满意,也可以尝试试听其他的声音来下载一段满意的音频。 我们下面回到剪映,来讲解一下在生成好配乐之后,如何将配乐和视频画面进行匹配。首先是生成的歌曲或者纯音乐,这个部分通常没什么技巧,画面当中展示的是什么氛围, 我们可以直接生成什么样的歌曲或者纯音乐。当然如果不考虑版权的问题,将来视频不做商用的话,也可以直接在剪映上方的音乐库中搜索我们想要的内容,在搜索完成后,点击搜索结果当中对应的标题,就可以试听这段音乐。 如果觉得这段音乐还不错的话,就以拖拽的方式拖拽到下方的剪辑轨道上,让其与视频画面相匹配。至于像音效方面,首先将音乐库取消展开, 看到下方有音效库选项,在点击之后同样可以以搜索的方式来搜索我们想要的音效。比如现在搜索自行车,可以看到在结果中有很多和自行车相关的声音,当前的画面就比较适合使用自行车链条和齿轮摩擦的声音,我们点击试听,听一听效果如何。 可以听到这个效果还是非常适合当前的画面的,我们就将其拖拽到下方的剪辑轨道上,下面来播放一下,看一看整体的效果如何。 怎么样,这个声音是不是很合适呢?再让声音与画面相匹配时没有什么特殊的技巧, 大家结合自身的生活经验与最终的视觉观感,让画面当中该发出声音的位置通过调整音频在剪辑轨道上的位置来进行匹配就好。我们再来说一下如何制作渐入和渐出效果。 在像剪辑轨道上加入音频时,有些音频可能会因为为了配合视频画面的时长而进行裁剪,那么在裁剪时就不免会使得这些音频突然结束,这样的结束方式会显得音频的转换非常突兀。那如何解决这样的问题呢?我们就需要使用声音的渐入和渐出, 具体的操作方式也非常简单,首先用鼠标选中剪辑轨道上相应的音频,可以看到此时音频会出现一条横向的白线,在白线两端有两个小圆点, 其中这条白线我们通过上下拖动的方式是调整音频的大小的。当然在右上方也可以用鼠标左右拖动滑块,或者用键盘输入的方式来调整这段音频音量的大小。至于键入和键出的话,我们将鼠标旋至在下方剪辑轨道上音频的位置,用鼠标向左侧或者右侧 拖动这个白色的圆圈,可以看到此时在剪辑轨道上的这段音频就会多出一个由拖动而产生的黑色区域,这段黑色区域所标记的就是被裁剪掉的部分,或者说音量减小的部分。可以看到越靠近根部的位置,黑色区域就越宽,音量减少的符 幅度也会越大,这就意味着整个音频的播放就会以键出的方式慢慢的让音量变小。键入也是相同的道理,我们拖拽左侧的圆圈向右拖动,此时新加入的音频就会声音逐渐放大,以 渐入的方式进行播放。这样的设置非常适合将那些被裁剪掉的音频以十分自然的方式加入到镜头片段和镜头片段之间的衔接中。那么以上就是本期视频的全部内容,我们最后就以刚刚生成的路灯下的影子这首 ai 歌曲来结束这节课吧。 大家好,我们这期视频来讲解后期剪辑。在 在先前的课程当中,我们已经学习了如何制作剧本脚本,同时根据剧本脚本生成了对应的分镜头图片,进而生成了视频片段,同时也学习了如何对人物进行配音,生成音效等等。 那么在做好了这些所有的前期准备后,最后一步自然就是来到剪辑软件当中,将所有的素材剪辑成片。所以我们首先来学习剪辑软件的基础操作。 次使用的是剪映工具,如果大家有其他的惯用工具,也可以直接用自己擅长使用的,没有的话就简单来了解一下剪映该如何使用。 在任意的浏览器中搜索剪映,找到后缀有官方字样的链接选项,再打开链接之后点击立即下载,将剪映下载到本地的电脑上。在下载好剪映之后,最好先对剪映进行一些基础设置,可以看到右上方有一个齿轮图标,点击这个图标,然后选择全区设置, 要设置的就是缓存的存放位置,例如这里的草稿位置、素材下载位置和下方的预设保存位置,这些默认都是 c 盘的全部更改为其他词盘,不然 c 盘很快就满了,在更改好之后,点击下方的保存即可。此外,剪映官方其实也提供了一个非常全面的软件操作教程, 在最上方的位置,我们今天这期视频就只讲解那些在剪辑 ai 视频片段时常用的一些功能, 以此来提升大家的剪辑效率。我们下面打开剪映的操作界面,再打开之后可以看到当前的页面布局,大体上分为四个区域。首先左上方这个区域是素材选择导入的区域,像音频、视频文件、图片文件,包括像特效、转场、字幕 这些内容都是在这里导入或者选择的。而上方中间这个区域则是剪辑之后效果的预览区域。最右侧则是参数预览或者设置区域,例如在剪辑轨道上选择音频,在这个位置可以调节音量, 选择视频在这个位置可以调节画面效果等等。而最下方则是剪辑轨道,也是我们操作最为频繁的一个区域,我们下面就对这四个区域按照从左到右,从上到下的顺序逐一进行讲解。 先来看左上方跟素材相关的区域,这里自然是用来导入和选择素材的,我们可以将生成好的音频片段、 视频片段,通过拖拽的方式或者点击上方导入加号的方式,在本地电脑当中将文件导入到剪映上。在导入好之后,通过拖拽的形式可以将这段素材片段添加到下方的剪辑轨道上。素材的类型有很多,首先第一个选项自然就是视频素材, 当然除了视频文件 mp 四格式之外,像 png 格式的图片文件也可以在上方进行导入,同样会显示在这个位置,包括一些音频片段同样会显示在这个位置。除了我们在本地电脑上上传的素材之外,我们可以看到在左侧的分选项当中 也有一个 ai 生成功能,分为图片生成和视频生成,本质上就是将极梦 ai 的 图片生成和视频生成功能放在了剪映当中。此外,官方也提供了很多视频片段素材,比如说视频当中可能出现了一些笑点, 出现了一些尴尬的时刻,我们都可以用剪映当中提供的这些比较经典的官方素材来填充画面。不过在剪辑 ai 视频时,这些内容使用频率就很低了。我们下面来看上方的音频分选项。在这个位置较为常用的是音乐库和音效库, 在这里可以搜索相应的我们需要的音乐或者音效,在搜索到结果之后,同样可以通过拖拽的方式添加到下方的剪辑轨道上。如果说我们制作的 ai 作品不用于商用的话,其实完全可以用剪映当中已有的素材。再来看文本选项, 顾名思义,它是给视频画面添加文本内容的,像视频的开头出现的标题,结尾出现的人员名单以及播放的过程当中出现的字幕, 这些都属于文本。我们将鼠标放置在这里的默认文本选项中,同样通过拖拽的形式将其添加到下方的剪辑轨道上。在添加好之后,就可以对文本内容进行编辑了, 看到在右上方可以改变文本内容的具体描述以及字体颜色等等。如果想要字体更加花哨的话,在左侧的分选项当中还有花字库选项,可以看到这里有非常多的花字,能让字体更加花哨,不过通常会用到一些日常或者综艺节目当中使用,在剪辑 ai 视频时,使用频率同样很低。 再来看上方的贴纸分选项,这里同样是一个在剪辑 ai 视频时使用频率很低的功能,在选择好合适的贴纸之后,将其拖拽到剪辑轨道上。比如当前我们拖拽的是一个红圈的效果, 此时它就会以播放动画的形式在我们拖拽的位置来框选画面当中的某些内容。除了这样的红圈,还有像太阳箭头、云朵等等,大部分都是有一些简单的动画效果的, 大家知道就好,通常也用不上。再来看这里的特效效果,这样的效果在剪辑 ai 视频时使用频率就相对较高了。例如这里的模糊效果, 在某些 ai 视频片段当中,可能人物被一棍子敲晕了,我们想要做出人物刚刚从昏迷中醒来的画面时,可能就需要用到这样的模糊效果。还有在整个视频开幕时,可以看到这里还有视频开幕的特效,让整个的画面从黑色逐渐变得显现出视频原本的内容。 想要使用特效方法,同样是通过拖拽的方式将其添加到下方的剪辑轨道上即可。而转场功能同样是一个使用频率非常高的功能, 它负责视频片段与视频片段之间镜头的衔接。在切换到转场选择页之后,我们将鼠标悬置在转场效果上方,通过左右滑动的方式即可预览这个转场效果大致能够呈现出什么样子。例如这里的叠画效果,我们将鼠标向右慢慢移动, 可以看到此时当前的画面就逐渐隐去,而下一个画面就逐渐显现,这就是叠画效果。转场可用的效果有很多,大家需要根据剧情以及画面风格的不同来选择合适的转场效果,否则就会显得很突兀。例如我们之前做的这段人物跳舞的视频,这样的转场效果 虽然说非常夸张,但放在这样的十分动感的视频当中就不会显得那么突兀了。而像当前我们作为演示的这个故事绘本的效果,通常比较常用的效果是这样的翻页效果, 他蹦蹦跳,因为每一张图片都是静态画面,所以像翻书一样的效果能够增强视频的代入感。我们继续来看上方的字幕分选项,这项功能是在剪辑轨道上,人物说话的音频 在相应的位置赋予字幕,像我们当前这则故事显示的字幕就是通过这项功能自动生成的。可以看到,在剪辑轨道当中,虽说我们生成的字幕并不是每一个都连贯的,而是一小节一小节分开的,但当我们选中任意一小节字幕,将其调整位置、缩放大小 或者改变样式的时候,其他部分的字幕调节起来是非常方便的。这是向左上方 剩余的这些功能。智能包装、滤镜、调节模板和数字人都并非在剪辑 ai 视频时常用的功能,大家如果感兴趣的话,可以自行在剪映官方提供的教程当中学习,我们就不再赘述。下面再来看中间的视频预览窗口, 这个窗口可操作的部分不多,首先第一个可能需要操作的就是右下方原画质里的选项,默认是原画质预览, 能够看到比较清晰的预览效果。如果电脑配置不佳,在剪辑时有明显的卡顿,可以考虑切换成清晰度更低的选择。此外就是显示的比例, 当前的比例是按照我们所拖入素材的比例进行自适应的。在点击展开之后,可以看到这里显示的也是勾选了自适应选项,如果想要更改比例的话,就在这个位置直接进行更改。例如想要将视频发布在抖音上,我们就选择了竖版的。 当然与此同时画面也进行了等比例的缩小。如果想将画面铺满整个手机,就势必要对画面进行裁剪。既然显示的比例范围已经固定,我们要裁剪的话,可以直接在选中视频预览界面的视频之后,通过拖拽的方式来改变它的大小, 以此来改变在当前的比例下它所显示的内容占比。不过这样的操作方法并不是十分明智,大家不如直接在生成图片时就生成比例合适的图片, 不要轻易的修改在剪辑时的比例。我们下面再来看右上方的参数调节区域,这个区域可调节的参数会根据我们所选择的内容而发生变化。比如当前我们所选中的是一个视频文件, 可以看到在剪辑轨道上有一个白框,那么右上方能够调节的参数就是大小、缩放、比例、位置旋转 以及和视频处理相关的内容。而如果我们选择的是在剪辑轨道上的字幕文件,可以看到右上方就是和字幕文件相关的参数设置,比如字体、 字号、颜色、样式等等。包括选择特效时,同样就会显示为和特效相关的参数设置。这些参数设置都非常直观,无非就是调节大小、缩放、比例、旋转等等,都是字面意思, 这里就不再赘述,大家根据字面意思的理解去调节就好。值得一提的是,上方有一些分选项,可能有时需要我们使用这个动画功能 来设置当前所选文件的入场和出场。比如说现在我们选择一个视频片段,在选择之后,在右上方选择动画分选项,在这里可以调节当前的视频片段是以什么样的方式入场, 什么样的方式出场的。比如选择这里的便利贴选项,此时这个片段就会像便利贴一样在播放到它时进行出场。不过需要注意这个位置的入场和出场,和转场当中的转场效果可能有时会产生冲突, 最好不要一起使用。我们最后再来看最下方的剪辑轨道。首先来说一下最基础的剪辑操作。说到剪辑,自然就是将视频的长度进行裁剪,或者音频的时长进行裁剪。 如何裁剪呢?我们需要先选中一段要进行裁剪的内容,在选中之后,将这根白色的时针 移动到需要裁剪的位置,然后点击左上方的这个选项,就是分割,这样一来就对当前所选中的片段进行了左右分割裁剪。在分割好之后,想要删除哪一段,就按键盘的 delete 键或者退格键就可以将这段进行删除。 当然这样的操作也是有快捷键的,我们先 ctrl 加 z 撤回一下刚刚的操作,其中的快捷键就是按 ctrl 加 b 键对白色指正的位置进行左右分割,或者按 w 键将其右侧的段落进行删除,或者按 q 键将其左侧的段落进行删除。 此外,在裁剪时还有一个非常方便的选项,就是预览轴功能。可以看到当我的鼠标在剪辑轨道上移动时,会有一根竖向的黄线跟着我的鼠标一起移动,这项功能就是预览轴功能。 在有了这项功能之后,我们无需再去用鼠标拖拽的方式移动这根白色的纸针,只需要将预览轴放置在相应的位置,然后重复和刚刚相同的操作,比如 ctrl 加 b、 w 或者 q, 就 可以对当前预览轴所指向的视频片段位置进行裁剪。当然这样的裁剪只会针对于主轨道。什么是主轨道呢? 就是当前在剪辑轨道上有一个封面标识,右侧对应的轨道,这就是主轨道。在未选中视频片段的前提下,我们使用预览轴功能进行的操作都是针对于主轨道的。当然这里有些说多了,大家剪辑时只需要知道怎么把视频剪长剪短就可以了。 不过被剪辑掉的部分并不是真正的删除消失了,更像是被隐藏起来了,如果想要复原的话也很简单。在选中之后,我们用鼠标拖拽其边缘的部分,即可将其拉长或者缩短,将那些被删除的部分重新变得显现。 特效和音频等其他文件同样可以进行这样的操作。在剪辑时,有时候我们需要非常精细的对画面出现的时长、音频出现的时长或者位置进行操作,这个时候我们就需要放大视图,就像查看一张图片时放大查看一样。具体的操作就是点击右上方的这个滑块,将其往右侧拖动, 此时剪辑轨道的仕图就变长了,方便我们进行更加精细的操作。比如说通过拖拽的方式移动字幕的位置,或者根据音频与音频之间波段的间隔,在那些没有音频的部分选中之后进行裁剪,然后删除。 诸如此类的操作都可以在放大视图之后变得更加精细。有时我们在拖拽剪辑轨道上的文件时,当两个文件之间挨的很近的时候,他们会处在一个自动吸附的状态,就是明明还没有靠近,但只要距离足够的近, 就会自动挨在一起。这项功能有时非常方便,但有时也会给我们的剪辑添加麻烦。遇到这种情况,我们可以选择临时关闭自动吸附功能, 这里有两种自动吸附,一种是关闭自动吸附,即关闭所有轨道的自动吸附,只保留主轨道。而另一种则是主轨道自动吸附,这个是什么意思呢?我们回到刚刚的仕途长短,然后选择主轨道上的一段片段。举 个例子,例如我们现在将这个片段分成两节,然后将左边这一节删除掉,可以看到在删除之后,右边那一节就直接自动吸附到了 靠左的上一段视频上,这就是主轨道自动吸附。在大多数时候,这样的操作都是方便的,但有时我们不希望他自动吸附,就可以选择临时关闭主轨道吸附,此时主轨道片段和片段之间就可以以不相邻的状态存续了。我们再来看一个叫定格的功能,在左上方的这个位置有一个 方框,两侧有两个竖杠的图标,这个图标就是定格。是什么意思呢?当视频播放到结尾的时候,我们首先将白色的时针 放置在结尾的位置,在放置好之后,选中这个视频片段,此时就可以使用这项功能了,它能够以当前视频播放的第一帧或者最后一帧为一个定格的画面,然后将这个画面作为一个图片 生成在剪辑轨道上。比如有时视频播放到结尾,但歌曲还没播放完,为了凑足歌曲的播放,或者给报幕留出一些时间,我们就可以使用这项功能,让原本动态的视频的最后一帧变为静态的画面,延续这个视频的时长。此外还有倒放功能, 名思义就是将我们选中的视频片段倒着播放一遍,这两项功能也是十分常用的剪辑手段。我们最后再来看左下方这片区域,大家如果常用 ps 的 话,会发现这个区域非常常见,有点类似于 ps 当中的图层功能。 剪辑轨道上面文件与文件之间的逻辑也非常类似于图层之间的逻辑及上方的内容会优先于下方的内容进行展示。所以左侧这个区域的锁、眼睛 及喇叭他们是什么功能就很好理解了。例如现在我们将白色时针指向这里来显示这里的画面,此时优先显示的是当前我们所选中这个文件的画面,现在点击左侧的小眼睛 看到这个画面就被隐藏起来了。声音文件同样如此,点击这里的小喇叭就会隐藏其对应剪辑轨道上的声音。当然音频文件之间并非是上层覆盖下层的关系,而是会同时播放,而最左侧的这把小锁就是阻止我们对当前轨道进行任何操作的。 如果你剪辑剪辑到一半,担心有人过来碰你的电脑了,但你又不想关软件存文件,就把这个小锁给点上。那么以上就是关于剪映的基础操作,大家了解了这些操作之后,就能剪出一个作为基本的 ai 视频作品了。不过在剪辑当中一定还会涉及到一些小技巧, 在什么时候用什么样的功能,对于不同类型、不同剧情、不同情节的 ai 视频都会有所不同。如果大家想要学习这些小技巧,不妨查看评论区的置顶评论, 在上面也准备了一些在制作 ai 视频时,整个制作过程的案例,以及制作过程中思路是怎样的,也进行了标注,感兴趣的同学可以在评论区的置顶评论自取。那么到了这里,我们关于 ai 动画制作的系列教程就结束了,感谢大家的观看,我们就下一个系列视频,再见。

二零二六将是 ai 漫剧的时代,现在漫剧日付费规模已达千万,抖音亲自下场扶持 ai 漫剧剧本、画面、配音、配乐全 ai 搞定,不用专业技能一天一集批量生成,先免后付,不再是视频平台的专属。拿上脑图,结合这两份文档,所有工具全白嫖跟着我来操作, 小白也能快速批量的制作出这样的 ai 视频,相关操作文档已打包,有兴趣的六六六,我觉得我没病, 我只是闭眼就可以去到一个诡异的修仙世界,这里有个吃人的赖子头,他杀人如麻,只为成仙。听说你称呼本大爷是个屁, 可有此事?那边都是虚假的,千万别再陷进去了。 说话哑巴了吗?医生说,这一切都是我的幻觉,假的,都是假的,假的火旺你火旺妈,医生,怎么样, 疼不疼?没事的妈,我不疼。如果这一切是我的幻觉也好, 至少我不会被赖子头做成丹药吃了。啊啊,糟了,一时悠悠 醒了,醒了就给道爷们张开嘴,这赖子头为了我什么花儿啊,你有异常不吃黑太岁 压不住啊啊啊,妈没病 啊啊啊啊啊,你没事吧?妈一直在呢啊,对不起, 我是真的看不见了。 大家好,我们这期视频来讲解制作动态漫中的美术设定人物篇一共分三个部分,剧情大纲提炼、 角色美术设定的工具特性讲解以及角色美术设定的实操演示。在开始制作动态漫的时候,我们第一步自然是已经获取了整个动态漫的剧本,这 个剧本可以是由 ai 生成的,也可以是由甲方提供的,或者是由其他作者精心编写的,但无论是使用何种方式,我们获取的剧本,作为导演需要做的第一件事情自然是对整个剧本的剧情大纲进行 提炼,以此来让我们全方位的了解整个故事,包括故事当中都出现了哪些人物,故事的主线剧情是什么?在脑海中对故事有一个清晰的认识和想象,有助于我们将来在进行人物设定生成分镜头、图片时更加的得心应手, 能让故事当中所设定的各种形象和场景更加契合故事内容。在如今 ai 遍地走的时代,我们即便是获取了一个非常长的故事剧本,可能几万字甚至十几万字。其实想要对故事的剧情进行简单的提炼也是一个非常方便的事情。 如果大家有充足的时间和耐心,自然也可以通读整个剧本,对故事有全方面的细致了解。不过在 ai 时代,我更推荐大家使用 ai 大 语言模型,比如 deepsea 豆包来帮助我们对整个故事的大纲进行提炼。这里我们以豆包为例,来演示一下具体该如何操作。来到豆包 ai 的 首页,将提前准备好的故事剧本 以 word 文档的形式上传到豆包 ai 上。在上传好之后,提示词方面我们就这样书写,写一下这个小说的大纲和核心人物的变化与特质,包括项目介绍、项目标签大纲、核心人物变化与特质。可以看到在向 ai 提出要求时,我们 在下方的部分要求了在回复时他所书写的格式,这样能够有助于我们按照自己的习惯来获取由豆包整理好的内容。现在点击发送可以看到。一段时间后我们就获取了这篇小说的核心内容梳理。通过梳理好的结果,我们可以得知故事的主角叫做林彦, 以穿越的方式穿越到了死牢当中,同时融合了原主的记忆,得知他是师傅苏恒的五座学徒,但由于师傅遭人诬陷,自己也将连坐问斩。自然故事的主线就是利用自己的知识来为自己和师傅谋得一线生机。 在了解了人物的大致设定后,我们可以看到下方有人物的变化与特质。在我们上传的文档小说中一共出现了四个人物,所以我们接下来首先要做的事情就是根据人物的性格,以及在小说当中所提 到的人物年龄,对这四个人物做不同的人物形象设定。我们首先来看左侧灵验的设定,可以看到这里我们一共为他设定了三个身份,这也是很多初学者在制作动态慢时比较容易忽略的,那就是随着剧情的推进发展,人物的衣着会由于时间、季节、 时代或是年龄的不同产生不同的变化。这里灵验的设定是从古代从五座变为了囚徒,所以我们需要分别设定三套人物形象,包括灵验在现代时的形象、 灵验作为囚徒时的形象,以及灵验在古代作为煽作穿正装的形象。但我们需要注意的是,虽说现代的形象和古代的形象本身在设定中就不是同一个,长相特征可以有较大的区分,但在设定灵验的古代形象时 们最好能够保持人物的特征,至少在长相发型上是比较一致的,可以看到事实上我们所做出的最终结果,人物在发型上确实保持了高度的一致,在身材比例上自然也不必多说,同样要保持高度的一致性,这往往是我们接取一些商单项目时,甲方会提出的要求。 同样可以看到,像师傅苏恒在人物的设定上也高度保持了在发型、身材比例和长相特征上的一致性,分别设定了苏恒穿正装时的人物造型和苏恒穿球服时的人物造型。 那么像这样的人物形象设定我们是如何生成的呢?下面就来给大家讲解一下。时至今日,能够进行人物形象设定生成的 ai 纹身图工具是有很多的,像豆包、吉梦、 made journey、 stable diffusion 各种各样的平台都是可以进行人物的造型设定的。而对于这样的动态漫形象,这里主要推荐大家使用 stable diffusion 当中的 flux 模型进行制作。因为首先像这样的开源模型在生成时可 操作性是比较强的,我们使用 stable diffusion 配合本地的 ps 工具,可以十分精确地对生成的结果进行局部的修改,相信大家如果使用过 stable diffusion 的 局部重绘,都能够体会到这一点。此外,使用 stable diffusion 在 人物美术风格的确定性上是比较强的,同时选择面也非常的 宽泛。像这些模型如果想要搜索的话,也非常简单,直接来到模型下载网站,这里就以利步。利步为例,我们在左上方的搜索框中,按照我们所需的动态慢风格来搜索相应的关键词即可,例如这里我们就搜索古风小说,可以看到在搜索结果中展示了非常多的和古风小说相关的 堆包 future 模型,这些模型的风格可能会存在一定的差异,我们可以从中选择自己需要的风格进行下载,它们大多数都是 lara 模型。我们就以刚刚在 ppt 中所展示的这个 f 点一古风小说推文模型为例。在点击之后打开 可以看到右上方直接提供了下载选项,可以下载好之后在本地端生成,其中作者在下方也给出了使用这个模型时的注意事项和相关参数的推荐。此外,在右上方的左侧这个位置,我们也可以使用在线版的 背包 de fosun 直接在网页上生成,可以看到在点击之后就直接来到了网页端的生成页面,右侧所示的就是刚刚我们所看到的古风小说推文的模型。我们这里可以对角色的造型进行描述,例如这里我们就描述古风美男子,长发,全身身穿球服,黑色头发, 帅气二十岁少年。而这里的参数方面我们就修改一下生成的比例,想要生成全身的人物,这里我们就选择九比十六的比例,下方可以选择一次性多生成几张来获取不同的结果。下面直接点击右下方的生成,可以看到一段时间后,我们就获取了符合提示词要求的角色造型。 不过需要注意的是,在提示词中我们要求的是全身人物造型,但实际生成的结果在很多时候想要生成全身的人物其实是一件比较困难的事情。 此外,在很多时候,我们可能生成的人物服装不是我们想要的,但人物的长相特征是我们想要的,那么这个时候该如何对图片进行修改呢?方法也非常简单,首先我们将需要的图片下载到本地电脑上,在下载好之后,来到极梦 ai 点, 点击左侧的生成选项,来到生成页面,然后将下方的生成模式切换为图片生成模式上传。刚刚我们已经下载到本地的人物造型图片,而提示词方面,我们就先对人物的服装款式进行修改利用,这里我们就描述将人物的衣服改为白色的古代球服, 其他部分保持不变,现在回车发送可以看到,一段时间后,人物的服装部分就进行了长途的修改,变成了白色球服。进一步的我们需要将生成的结果扩充到全身,所以这里我们直接将鼠标悬置在生成结果的上方 可以看到此时下方就会弹出一个选项菜单,我们点击这里的扩图选项,然后在下方选择合适的扩大倍数, 调整人物所处的位置,调整选框的大小,给人物的下半身留下充足的空间。在选择好之后,就直接点击右下方的生成,可以看到很快的我们就获得了人物在图片扩充之后的结果,整体的效果表现还是非常不错的。 我们刚刚分别用 stable fusion 和极梦 ai 对 图片进行了生成和修改。其实目前市面上能够生成图片和修改图片的软件还有很多,这里给大家简单介绍一下这些工具的特性。 首先是 made journey, 对 于人物和场景的生成都能提供很好的思路和灵感,但由于是国外的平台,生成一些中国元素时会相对差一些,而 stable diffusion 是 可以通过风格 lara 的 加持更好地控制风格一致性的。 而极梦 ai 和豆包 ai 从本质上来讲,它们使用的模型都是一样的,只是豆包 ai 更倾向于大语言模型,在语言的理解能力和上下文的关联能力上会更强。所以大家在制作不同的人物和场景设定时,可以结合不同的 ai 软件的优势,以 此来提升效率,当然也要根据甲方所提供的方向进行制作。我们接下来再来讲一下在设定角色时,角色的三式图该如何制作。我们生成一个人物形象,在整个动态漫中自然会涉及到它的各个角度, 对优先生成好角色的三式图能够很好的保持在将来制作其他角度时的一致性。这里一共给大家提供两个制作思路。第一个制作思路就是一开始我们在生成角色形象时就生成三式图的形象,重新回到利布利布的在线生成界面,除了描述人物的长相和穿着风格特征之外, 我们在此基础上在提示词中输入生成三式图,分别展示人物正面、侧面、背面,要求站姿标准简 单背景、白色背景,同时将生成的比例修改为十六比九,然后点击生成,可以看到一段时间后我们就直接生成了人物的三世图设定,包括人物的正面、 侧面和背面,且在一致性上保持的还是相当不错的。同时在云端利布利布上还可以直接点击右下方的高清放大,以此来提升图像的分辨率和人物的细节。至于人物身上的文字方面,我们可以使用极梦 ai 让文字的生成更加的准确。而三世图生成的第二种方式 是来到吉梦 ai 当中,点击左侧的生成选项。我们此次使用 agent 模式来帮我们自动生成人物三式图。当然首先需要上传一张人物的正面式图,在上传好之后,提示词方面我们就书写生成人物的正面、侧面、背面三式图,姿势标准 简单,背景白色背景。现在点击生成可以看到,一段时间后我们就获取了这个角色的多角度式图,包括正面、侧面和 背面。不过这样的生成会伴随着一定的随机性,我们可以多生成几次,以此来获得更好的结果。或者对人物的姿势进行微调。有进一步的,我们要求手自然下垂,不要放在口袋里。三个角度整合到一张图片上生成。现在点击发送可以看到,得益于极梦 ai 强大的自然语言理解能力, 最终获取的结果也十分符合提示词的描述。至于像其他的角色造型,在制作时也和我们设计这个角色在流程上大同小异,所以这里就不再做过多的演示。以上就是在制作动态慢时关于人物美术设定相关的知识,如果觉得本期视频的内容对你有帮助,也不妨点赞关注支持一下,我们 就下期视频再见。大家好,我们这节课来讲解动态慢制作美术设定的场景篇,一共分四个部分,剧情大纲提炼、 场景美术设定、时操、思路概览、角度切换和人物融合。我们首先来看剧情大纲提炼,在上一期视频中,我们同样进行了这个步骤,主要目的是提炼剧本当中出现的主要人物都有哪些,以及人物是否具备前期和后期的变化,产生的 服装设计上的变化。而我们这节课所进行的剧情大纲提炼,主要提炼的是剧本当中和场景相关的内容。由这里我们所展示的核心场景二,顺天府钱塘。在这个场景中出现的主要人物有林彦、雅逸 一大人,同时我们也成功的提取出了人物在场景当中的位置,以及与场景的交互关系。例如像这里所描述的,林燕原本位于死牢,被衙役从牢中带出,将前往顺天府琴堂,而交互动作则是衙役手持钥匙赶到死牢,极速传召林燕面见府。一、 林燕从被动关押转为主动赴堂,将在人前为师傅洗冤。我们之所以要对剧情大纲做场景方面的提炼,自然是身为导演的我们要快速的获取 在剧本当中都出现了哪些场景,以此方便做后续的场景美术设计,以及让人物出现在剧本当中所描述的场景当中的位置。那么像这样的提炼内容我们该如何获取呢?自然是和人物类似,我们既可以自己通读整个剧本的内容,自己来整理剧本当中所 出现的场景,自然也可以通过 ai 大 语言模型让他帮我们进行提炼。例如来到豆包 ai 当中,首先将剧本上传给豆包 ai, 在 上传好之后, 提示词,我们就要求整理一下这个小说中出现的主要场景,并说明该场景下出现的人物与人物与场景间的位置关系和交互关系。现在点击发送可以看到一段时间后,我们就获取了符 合提示词要求的结果。这里一共整理出了三个在小说当中出现的场景,分别是死牢验尸房和顺天府库 布房。同时在每一个部分也分别交代了出场人物和环境之间的位置关系,以及出场人物和环境之间的交互关系。有了如此详细的描述,我们下一步就可以开始对场景进行美 术设计了。在大多数情况下,这样的美术设计其实并不是十分困难,例如像死牢验尸房并不需要我们具备十分丰富的想象能力和美术设计能力,这些都是在影视剧中非常常见的场景, 所以我们在进行场景设定时,可以看到像在设计牢房时,牢房的外景、牢房的室内景象以及牢房的内部都并没有特别精巧,需要美术功底的设计。所以这些我们在生成时 就直接使用纹身图功能,如实的交代我们要生成的内容即可。但在小说当中还涉及到了顺天府的设计,可以看到在下方顺天府的设计会相对复杂一些,包括了高低错落的中式建筑, 同时还要具备一定的布局设计。像这些内容我们想要直接通过文字描述来生成对应的结果,可能随机性就会比较大了。所以这里我们可以继续借助豆包 ai, 让它帮我们生成对于顺天府的提示词描述,这里我们就这样要求写一段提示词用于生成。小说中出现的顺天府建筑特色、历史背景、 美术风格等都要贴合小说设定。现在点击发送可以看到,一段时间后,我们就获取了非常详细的和顺天府相关的提示词描述。这样的描述非常细致,但我们在生成时很有可能在一张图片当中无法体现这么细致的描述。 进一步的,我们可以让 ai 工具帮助我们对这些提示词做不同区域不同景别的区分。留这里我们进一步提出要求,提示词尽量简洁,要求分别生成顺天府全景大门、室内别院后门的提示词描述。现在点击发送可以看到一段时间后,不同部位的提示词描述就都生成好了, 而我们需要做的事情就是将这些提示词复制下来,然后来到图片生成平台当中将提示词粘贴。同时身为导演,我们有必要对这些提示词进行 进行修改和补充,使其能够生成我们需要的画面。例如这里我们需要增加一个描述,像风格方面,我们增加的是二次元漫画风格,景别方面我们要增加全景这样的描述,而视角方面,我们就增加正面俯拍视角,同时我们使用的是 a g 的 模式,所以这里需要额外提一下生成的比例, 这里我们就要求比例十六比九。现在回车发送可以看到一段时间后,符合提示词要求的图片就生成好了,整体的生成效果还是不 错的。在视角上满足了正面俯拍视角,同时向我们所要求的会出现的前堂后牙、库房、死牢、电视屏院这些区域也都进行了详细的标注,不过这样的生成会伴随着一定的随机性,同时在配色方面我们也可以做进一步的要求。这里既然我们使用 aj 的 模式,想要多获取几个配色和生成方案其实并不是一件难事,所以我们可以进一步的向 aj 的 模式提出要求,多来几个不同的配色方案和天气情况,尽量以晴天为主,建筑更加错落有致一些。可以看到片刻之后,修改好之后的方案就生成好了,分别提供了四种不同的配色方案, 同时也将天气改为了更加晴朗的晴天。我们下面再来讲解一下场景多角度切换的方法。在上一节课中,我们讲述了如何生成人物的三式图, 同样的,在制作动态慢时,人物会在场景当中不断的运动,虽说人物的背景并不需要十分严谨,但我们依然需要尽可能的保持人物在运动之后背景的 一致性和理性。所以这里我们要学习如何制作场景的多角度切换。一共有这么几种方法。首先第一种方法是使用多角度切换的工作流,我们这里是使用的 running hub 上面一 名称为多角度切换的工作流,顾名思义,它的作用就是上传一张图片,然后根据提示词的描述,参考图片的美术风格,场景设计、空间设定,对参考图当中的场景来转换角度。例如这里作者已经给出了一个示意,上传的参考图就是顺天府 正面俯拍视角下的一个画面,在上传好这张参考图之后,我们需要在右下方的位置来书写对应的提示词,描述是将镜头转为俯视左侧式图, 看到最终生成的效果,转换的还是非常不错的,在保留了场景的美术风格以及画面当中各个事物的布局的前提下,成功的转换了风格。尤其是在院落当中有两 颗红色的枫树,在转换角度之后,它们的位置、样式和颜色都与参考图当中这两颗红色的枫树保持了高度的一致。具体这个工作流的网址链接我已经放在本页 ppt 上面了,大家也可以查看评论区的置顶来获取。 除了用工作流来生成不同角度的图片之外,另一类方法我们可以通过视频生成的方式来获取不同角度的场景。例如使用维度的主体库来生成多个不同的场景角度后利用主体库让场景旋转来获得更多的角度。或者使用 nano banana 旋转场景的功能来获取多个视脚下的场景。那么了解了如何获取不同视脚下的场景,我们下面来进行最后一步,就是如何让场景与人物融合。这里的方法就有很多了,例如像一些简单的场景常规的动作, 我们可以直接以参考图生图的方式来生成对应的内容。来到极梦 ai 的 生成页面,我们就以上节课生成的这个人物为例,将其拖拽到生成预备窗口中,使用 ag 的 模式,而提示词我们就输入 生成这个人物坐在牢房地上的情形。二次元国产漫画风格要包含牢房的铁窗户、铁栏杆,人物要光着脚。现在点击发送可以看到一段时间后,符合提示词要求的图片就生成好了。在生成结果当中,人物的造型也和我们上传的参考图保持了高度的统一,且符合了提示词中我们要求的铁栏杆、 窗户这样的描述。一共生成了四个角度,可以说每个角度生成的效果都是相当不错的。除了使用参考图生图来直接生成相应的场景和人物之外,如果说我们有不错的参考图, 也可以使用参考图让图中的人物被我们所设定的人物所替换。例如我们就以这张图片当中的人物为例,这同样是一个牢房当中的场景, 在上传好这张参考图之后,我们再次将人物设定的参考图进行上传,而提示词方面,我们就要求把图一场景中的人物换成图二,保持图一中的场景和姿势, 只替换人物形象,比例十六比九。现在点击发送可以看到,一段时间后,我们就成功的将画面当中的人物造型进行了替换,且保持了视角 场景设计的一致性。当然在很多时候,我们生成的结果可能百分之八十,百分之九十是满意的,只有一些细小的部分还需要后期的调整,或者在人物的比例上也可能会出现大小方面的问题。 在这种时候,我们就放在 ps 中先去手动调整,然后再通过图生图的方式来提升画面当中在 ps 调整后所遗留的不够融合不够合理的部分 即可。那么以上就是本期视频的全部内容,如果觉得对你有帮助,也不妨点赞关注支持一下,我们就下期视频再见。大家好,我们这期视频来讲解剧本与分镜头脚本制作。在前两期视频中,我们分别讲解了人物设计 和场景设计,也学习了如何将人物和场景之间进行融合。所以这期视频来进行前期准备的最后一项工作 就是制作剧本和分镜头脚本。一共有两个部分,剧本的书写格式与产出方法。脚本的书写格式与产出方法我们首先来看剧本要学习这个部分,我们先要了解一下为什么在正式的制作 ai 短片 以及用于生成 ai 短片的分镜头图片之前,要先获取剧本。在先前的操作当中,我们将原本的小说上传给了豆包 ai, 让豆包 ai 帮我们分别提炼了小说当中的人物, 小说当中所出现的场景。这些提炼的内容一定程度上可以帮助我们了解小说发生了什么样的故事,但主要的作用还是帮助我们顺利的做出人物的造型设计和场景的设计。 而在正式的制作视频片段和分镜头图片时,作为导演的我们就需要更加全方位的了解故事的整体走向以及每一个细节。例如像在什么样的场景当中,什么样的人物说了什么,做了什么, 我们都需要做十分详细的了解,这样才有便于在生成画面时关注到每一个细节。因此制作剧本的目的其实就是在帮助我们剔除原本在小说当中一些庸俗的修饰词汇,还有过于华丽的词造,只保留小说当中客观陈述的 什么时间、什么地点,什么人在做什么样的事情,说了什么话。例如我们来看 ppt 当中所展示的这一段,在描述方面是十分精简的, 描述了故事发生的场景、人物、动作、台词和镜头提示。这样一来,无论是实际拍摄还是 ai 生成,作为导演的我们 不能十分快速的在脑海当中想象出拍摄时需要的画面,以便于更好的构注出我们所需要的画面内容。 那我们如何通过小说本身来获取一个剧本呢?其实方法也非常简单,除了自己阅读整本小说,根据自己的理解从中梳理出故事的剧本信息之外,我们自然也可以借助大语言模型帮我们梳理信息。来到豆包 ai 当中, 首先将小说文档上传给豆包 ai, 而提示词方面,我们就要求把小说写成专业的剧本书写格式,里面要求有场景、人物、动作、台词、镜头等。 现在点击发送可以看到一段时间后,我们就获取了十分理想的该小说的剧本内容。而我们要做的事情就是根据这些剧本内容,更加详细的了解故事在什么时间、什么地点,都发生了什么。当然我们当前生成的剧本是以镜头为区分的, 从镜头一到镜头六,这样的以镜头区分的方式可能更便于在拍摄的时候,或者在制作分镜头图片的时候来生成具体的画面内容,但并不是十分适合我们去了解整个故事在什么时间地点,都发生了什么。 在这里我们可以进一步的给出一个参考格式,可以看到,我们将刚刚在 ppt 中所展示的剧本的格式写入了提示词输入框中,然后点击发送。可以看到,片刻之后,豆包 ai 就 与我们所提供的参考格式生成了对应的剧本。 不过我们需要注意的是,生成的剧本在很多时候并非十分严谨,极有可能会出现逻辑不合理或者内容不严谨的部分。这时我们就很有必要 先通读整个剧本,再对不合理的部分进行一定的调整。举个例子,像第一场镜头,在最后的镜头提示中, ai 生成的剧本写道特写林彦布满宝茧的指尖拉远至他蜷缩在石牢角落的全景。我们都知道,在手指的指尖是很难起茧的位置,所以显然林彦在设定当中, 指尖有宝剪,对剧情既没有推动作用,也很难在实际生成中有所展现。所以像这样一个特写镜头并没有太多存在的必要,我们可以考虑将其删剪掉,或者将指尖的宝剪改为指尖的伤口,以表明他作为五座学徒在进行解剖时可能指尖容易受伤这样一个特性。 总的来说,剧本的书写非常重要,因为在获得了剧本之后,我们下一步要根据剧本来获取分镜头脚本,所以我们下面来看脚本的书写格式与产出方法。首先需要说明一点, 以目前 ai 大 语言模型的能力,我们直接通过 ai 大 语言模型所生成的脚本在大多数情况下是无法直接使用的。即便生成的结果十分全面,猛一看是很唬人的存在,但事实上,如果细致观察每一个画面内容,其实是不太经得起推敲的。例如我们来看这里的第四个镜号, 景别是全景,运镜是固定镜头,但在画面描述方面,其实描述了两个画面,第一个画面是死牢窗外电闪雷鸣, 第二个画面是闪电照亮阴暗的牢房。这两个画面是不可能用一个镜头呈现的,但在脚本当中却整合在了同一个分镜头当中,像这样的情况不在少数。例如我们再来看第二个镜号,灵验,眉头紧锁,浑身抽搐,伤口结痂处泛着暗红,缓缓睁开眼睛。像这样的画面描述, 浑身抽搐和缓缓睁开眼睛同样需要不同的景别来表达。在全身抽搐时,我们需要一个远景或者说全景镜头来表现人物的全身,而睁开眼睛则通常需要一个近景画面或者特写画面,才能让观众深切的感受到人物在睁开眼睛。 所以通常来说,我们想要制作一个分镜头脚本,在大多数情况下只能考虑手动转写才能使其更合理一些, 同时还要考虑 ai 在 生成时,某些画面是否异于生成。当然,我们也可以适当地借助 ai 工具,不过在生成之后,就需要大量地在 ai 生成的内容上进行修改,使其变得合理。具体要修改的,我们可以从以下几个方面入手。 第一点是画面的理性。例如像林彦喜欢摸手上的老茧这样一个习惯,我们最好就将这个设定给改写掉。因为使用 ai 生成图片,想要在手上生成一个老茧,并在生成视频时让人物去摸这个老茧,这种细致入微的动作是当下的视频生成模型以及图片生成模型 非常难生成好的部分,然后是时长的理性。在脚本当中,有些镜头的展现可能并不会对剧情产生推进作用, 此时我们就要考虑适当的删减。例如在当前 ppt 页面所展示的脚本中,足足用了五个镜号来表现灵验刚刚穿越 出现在牢房当中的画面。这里像很多特写镜头,其实是没有必要做太多的展现的,会拖慢整个剧情的节奏,例如像窗外电闪雷鸣,再例如像指尖触到粗糙的石墙后猛的缩回,这些部分都可以做出适当的删减, 简单直接的让观众了解到灵验穿越到牢房就可以了。然后就是对话的时间长度是否可以合理的覆盖人物画面,以及镜头的运镜表现是否能够在生成视频时实现等等。想要做到这些,最好的办法就是我们在看到剧本的时候,通过剧本当中讲述的画面描述,能够在脑海当中 想象出一个画面,这样的想象越细致越好,同时具备一定的视频片段生成经验,以此来考量在脚本当中所描述的画面,当前的 ai 模型是否是有能力生成的。至于脚本的获取方面,和剧本的获取大同小异, 我们依然也可以借助 ai 大 语言模型。这里就以豆包 ai 为例,将剧本上传给豆包 ai。 而提示词方面,我们就书写,你是一个经验丰富的导演编剧,我需要你根据这个剧本赚写一份内容详细全面的分镜头脚本,我会借助这个分镜头脚本来生成图片,制作 ai 短片脚本内容需要包括,镜号、 警别、运镜、画面、内容、提示词、人物台词备注。这里为了让生成的脚本更加好用,我们还补充了一句,那就是同时注意不要添油加醋,不要有过于华丽的用词,要严格按照剧本已有的内容来客观编辑脚本。现在点击发送一段时间后,脚本就生成好了, 看到整体的生成效果还是非常全面的,同时也符合了提示词中我们所提到的要求。不过在实际制作当中,如果大家需要给甲方提供一份脚本,最好还是对当前生成的脚本做长足的修改。而在我们实际用 ai 平台 生成每一个分镜头图片,并使用分镜头图片生成对应的 ai 视频片段时,更多的时候以目前的 ai 生成能力是一个可有可无 的东西,相信大家在今后的实际操作中就会有所体会。那么以上就是本期视频的全部内容,有了人物设定、场景设定、剧本和脚本,我们接下来要做的事情就是正式的进入制作环节了。如果觉得本期视频的内容对你有帮助,也不妨点赞、关注、支持一下,我们就下期视频再见。 大家好,我们这期视频来讲解分镜头制作中的景别和视角。我们首先来看景别,简单来讲,景别就是画面的远近取舍,指的是相机与被摄主体的距离或者镜头焦距变化带来的画面范围差异。核 心作用是控制信息呈现,引导观众注意力。像常见的景别有特写,主要用于聚焦局部近景,能够突出事物的上半身中景能够展现事物的动作以及其与环境的关联。 全景能够呈现完整的主体与整体环境,而远景能够强调宏大的场景氛围。我们以先前用来举例子的剧本所制作的动态漫画面来看一看这些场景具体的表现如何。首先是远景, 可以看到当前大家所见的就是顺天府的远景,展现了整个顺天府的全貌。当然,如果画面当中有人物的话,我们自然是能看清楚人物的全身的。不过像远景一般会以环境表现为主, 人物的占比会非常的小,我们很难看清楚人物具体的穿着、长相、发型等细节。通常远景的作用是在故事发生的场地进行变更时,作为第一个镜头给观众一个交代。如果说我们将远景的镜头进一步向前推进,让其所拍摄的范围进一步缩小,最终所得到的就是 全景的画面了。这样的画面刚好可以包括人物的全身,环境会相对减少,人物在画面当中会占据主要位置,可以描述人物与环境的位置关系。在一个全景中包含的细节信息会比较多,比如说我们当前所建的这个牢房,会包含当前牢房所在的空间结构, 以及透过牢房的窗户照射牢房的光线,同时也能够交代牢房当中有什么。如果画面当中有角色的话,还能够交代角色在这个小空间当中的站位和具体的动作。我们继续往前推进镜头所得到的便是中景了。通常来说,中景会表现一个成年人膝盖及以上的部分, 或者场景的局部画面,特别是表现人物的形体运动和情绪交流, 有利于交代人物与人物之间的关系,也能使观众看清楚人物的面部表情和形体动作。这样的景别在影片当中会占据非常多的比例,经常在讲述和推进剧情时使用。比如当前的画面就是展示主角在牢房当中 望向铁窗外的风景,我们继续将镜头往前推进,所得到的就是中近景。相比于中景,中近景所展示的画面范围会更小,通常是人物从头到胸部,同时对环境背景也会经常做一些虚化紧身效果能够更加专注于人物的表情和细节, 同时还能减少背景的显示。所以我们之前讲解过,在场景的美术设计当中,场景的角度转换并不需要十分的严谨,我们尽可能做到让场景在角度转换之后保持统一即可。因为在大多数情况下 们使用的都是中景或者中近景,人物身后的背景,只要在美术风格上能够与全景的画面保持统一,具体的内容其实无需在客观上十分严谨。而中近景使得背景的显示面积进一步减少,能够更有效的使观众忽略场景在转换角度之后的一致性。 我们最后再来看近景,近景通常用来表现胸部以上的范围或者物体的局部画面,在这样的景别下,能够更加清晰的看清楚人物的细微动作,例如人物在摸索指尖或者人物的一些微表情, 都能够刻画的更加细腻。而最后是特写镜头,我们可以回想一下,像先前看过的一些影视作品,在大多数情况下都不会给到特写镜头,特写镜头主要拍摄人物的面部,或 或者是给到单个物体的局部,通常用来引导观众意识到当前的画面是一个细节、伏笔或者整个剧情的关键节点,具有强烈的情绪渲染力,是进入感最强的一种镜头。那么到了这里,在分镜制作中的常见景别我们就讲解完了。 如果说景别可以简单的理解为取景框的取景范围,那么视角我们可以将其理解为相机的拍摄位置和角度,它能够决定观众观察被摄对象的立场,核心作用是传递情绪、营造氛围或暗示关系。常见的视角有平视、 俯视、仰视,还有主观视角或者阅肩视角等等。我们同样使用先前所举案例的剧本所产出的分镜头画面,来看一看视角都有哪些。 首先是平视视角,摄像机与被摄主体处在同一条水平线,贴近人眼日常观察的习惯,画面客观中立,不带有明显的情绪倾向,是影视中常用的视角,比较适合还原真实场景,传递平稳的蓄势节奏。像这样一个镜头,相机的位置 基本上就处在人眼的位置,是一个比较常见的拍摄角度。可以想象一下,我们作为一个摄影师,作为舒适的角度其实就是平视角度。然后来看仰视视角,摄像机会低于背射主体向上拍摄能够突出主体的高大威严或有力量感, 常用来塑造英雄形象、宏伟建筑或者传递敬畏压迫的情绪。像当前我们所展示的画面,相机的位置就会偏低一些,很明显所展示的牢房门口就是一个仰视的景象,能够展现整个牢房的威严感。而俯视视角在相机位置上则高于背射物体, 向下拍摄通常可以展现场景的格局或者空间关系,就像我们在售楼部俯瞰一些楼盘的沙河模型一样,可以快速的了解整个环境的布局,也能够营造疏离感、渺小感, 或者用于表现人物的无助和孤独。很明显,我们当前所展示的画面是十分适合用俯视视角来表现画面的情绪的,表现的是人物在牢房的一个角落思考自己身处此地的原因的情形。我们再来看主观视角,这个视角主要在于模拟角色的眼睛的视角,拍摄画面呈现的 即角色所见的,能够极强的增强观众的带入感,让观众共情角色的情绪,常用于悬疑、惊悚 或者展现角色内心世界场景可以看到当前的视角就是主角在观察毒杀案的相关报告的视角,很明显是一个第一人称下的视角,将观众带入了主角的眼睛。 我们再来看下一个视角。第三人称视角也叫客观视角。摄像机作为旁观者存在,不依附于任何角色,画面呈现全面中立,能让观众清晰的看到角色动作和场景互动, 是叙式中交代情节,展现人物关系的核心视角。像十几年前比较流行的情景喜剧,比如像我爱我家武林外传,有相当一部分机位都属于第三人称客观视角。 我们最后再来看月间视角,可以看到当前所展示的画面,相机为角色的肩膀后方跟随人物拍摄,这样的视角核心作用是强化人物的互动感, 观众仿佛置身于对话现场,能够清晰的感知角色的视线交流和情绪张力,是影视中展现对话对峙情形常用的视角,能够自然推动蓄势节奏, 同时这样的视角也有非常强的代入感。像很多游戏作品目前都会使用阅间视角来让玩家操作核心角色,那么以上就是分镜头制作当中的景别和视角相关的知识,如果觉得本期视频的内容对你有帮助,也不妨点赞关注支持一下,我们 下期视频再见!大家好,我们这期视频来讲解 ai 配音配乐,一共有两个部分, ai 配音配乐平台介绍和 ai 配音配乐平台实操演示。我们首先来看平台介绍,在配音配乐方面,目前比较好用的平台一共有两个,一个叫 mini max music, 它主打的功能是 ai 音乐生成,核心优势是人声逼真,支持多风格演唱编曲专业,五分钟完整歌曲, 多乐器调控,即便没有专业知识也能快速创作。比较适用的场景是短视频 bgm 影视游戏配乐、虚拟偶像单曲,同时还提供 a p i, 方便开发者接入,操作也非常简单,我们甚至无需输入歌词,直接描述一下我们想要生成什么类型的歌曲,就 可以快速的获得原创音乐。而在配音方面,目前比较好的平台叫智声云配,它的核心优势是每种音色在情绪方面都非常丰富,且拟真度很高,没有强烈的机械感,同时还支持声音克隆, 请我们训练好的声音,如果觉得效果不错,还可以放在智声云配上进行售卖,是一个声音交易市场,其功能亮点是语音 歌声转换,同时还支持三轨分离,商用授权齐全,能够跨平台使用,使用场景是影视角色,有声书、广告解说,支持语速情绪调节,其每天都会提供一些免费的试用点数,使用成本非常低。我们下面就分别对 mini max 和置声原配的操作进行简单的演示。首先来看 mini max, 来到首页可以看到整个页面的布局还是非常简单的,在首页当中我们可以快速的选择语音合成或者音乐创作两个选项, 其中语音合成我们只需要在输入框中输入我们想要生成的阅读内容,然后设置相关的参数即可马上生成音频。而音乐创作也非常简单,即便没有歌词,我们可以直接在输入框中输入对歌曲的描述,也能够快速生成我们想要的音乐。 下面来看左侧的分选项。首先是音色库,在点击进入之后,可以在这个位置选择我们需要的音色,同时点击这个位置即可播放这个音色进行试听。例如我们来试听一下这个叫傲娇御姐的音色,我可不是那种会被轻易影响的人,你这点小聪明可不会让我动 摇。如果觉得这个声音效果不错的话,我们可以直接点击最右侧的选择选项,这时就会来到左侧分选项当中的 语音合成页面,在这个页面当中,左上方这个输入框自然是输入我们需要人物所朗读的文本内容的, 例如这里我们就输入可顺天府的人根本没有验尸,直接定了未罪自杀,连卷宗都写的潦草,这也是先前我们所展示过的动态漫当中人物的台词。在选择好之后,来看右上方可以 选择相应的模型。在这个下拉菜单当中也标注了不同模型的不同特性,我们可以根据自己的需求来选择合适的模型。当然在大多数情况下,选择版本标号最高的模型,通常获得的效果也是最好的。 再来看右侧有一个调试台选项,在这个选项当中就是用来设置声音相关的参数的。首先最上方就是音色,我们可以点击最右侧的这个选项来选择合适的音色之外,可以看到最上方有一个搜索栏,在 这里可以根据我们的需求来搜索相应的音色。如果觉得某个音色不错,想下次能够快速找到的话,可以看到在音色的最右侧有一个五角星选项,点击这个选项就可以 收藏当前音色。同时在收藏音色这个分选项当中,能够快速的找到我们收藏过的音色。那么了解好了音色选择,我们继续来看右上方, 这里分别有音色效果调节和输出情绪。我们首先来看输出情绪,这里是一个下拉菜单,可以设置不同的人物在朗读时的情绪,有自动开心、难过、生气、害怕、厌恶、惊讶、中性生动。可以看到这里的情绪选择类型是非常丰富的,几乎包含了日常生活中我们可能会表达到的所有情。 在选择好了情绪之后,我们再来看上方的音色效果调节,再点击之后,整个页面会发生一定的变化,我们可以通过调节滑块的方式,让人物的声音更加低沉或明亮,更有力量感, 会更加柔和,更有磁性或更加清脆。而下方还有一些声音特效效果,比如像空旷回音、礼堂广播电话失真和电音, 我们要根据在设定中人物所处的环境来选择对应的声音特效,当然这些也可以在后期剪辑中再调整。而上方的滑块调节选项则要根据我们刚刚所选择的人物情感来进行适当的调节。例如我们刚刚所选择的情感是开心,那么往往在这个时候声音会显得更加明亮,同时也会更有力量感。 在选择好了这些参数之后,点击这里的返回调试台,返回到刚刚的界面。在最下方的位置还有三个基础的声音参数可选,分别是语速、声调和音量。这里选择的是开心的情绪,所以在语速方面也可以更快一些,而声调方面也可以 更高一些。至于音量,通常保持默认即可。在确定好了参数之后,我们就直接点击下方的生成音频选项,一段时间后声音就生成好了,来点击试听一下,看看效果如何吧。可顺天府的人根本没验尸,直接定了未醉自杀, 连卷宗都写的潦草,可以听出整体的配音效果还是比较完整的,但也不能否认存在一定的音色失真情况且整个人物的情绪在情绪起伏上并没有我们想象的那么贴近自然, 还原真实。所以正如我们刚刚所说的, mini max music 的 核心优势更多的在音乐创作方面,而非文本配音方面, 所以我们继续来看左侧的分选项,可以看到这里是音乐创作的分选项,在点击进入之后,我们就可以在左侧输入自己的任何想法来创作音乐,也可以点击下方的 lakers 选项,在这个位置来添加提前准备好的歌词。继续来看左侧的分选项,可以看到这里在 mini max music 上,我们还可以自己进 音色设计来生成一个全新的音色。而最后一项则是人声提取功能,允许我们上传一段音频,同时只提取音频当中和人声相关的部分。在提取好之后,这样的纯人声音频 更有利于在训练音色时,让音色的训练结果能够更加还原。而至声云配这边则更加擅长文本转语音,来到至声云配的首页,可以看到这里第一个选项就是文本转语音选项,整个的页面布局以及操作流程 刚刚我们在 mini max 上演示的基本大同小异,所以这里就不再赘述,我们直接输入一段文本来试听一下,看一看在智声云配上生成的效果如何,得由这里我们输入。太好了,明天是周五,终于可以休息了。在右上方选 择合适的音色,我们当前选择的音色是在智声云配上官方提供的一个音色,点击右侧的这个选项,打开音色选择窗口可以看到与 mini max 不 同,这里还多出了一个音色市场, 在这里我们可以购买其他作者所上传的音色,当然也可以将自己有版权的音色上传到市场当中进行售卖,而上方的这个分页就是置声原配所提供的官方音色,这些音色就无需购买,可以直接选择使用。点击头像的位置即可对这个音色进行试听。例如这里我们选择包包这个音色, 宝贝你能多陪陪我吗?如果确认我们想要的是这个音色,就点击最右侧的添加,然后再次点击使用。可以看到此时右上方我们所选择的就是名为包包的音色了。在置声原配上所提供的情绪选项非常丰富,可以看到最左侧有常规开心、 恐惧、厌恶、惊喜、生气、悲伤和哭泣,其每一个情绪选项都是有二级菜单的。在二级菜单当中, 我们可以进一步的选择更加细腻的情绪表达。例如在惊喜的二级菜单当中,有小声难得的惊喜,有比较虚弱的惊喜、小声的惊喜、大声的惊喜,这样的选项无疑让整个人物的情绪表达会更加细腻,同时也能适配更多的环境。而下方是常规的强度、语速、 语调和音量,同时在最下方还可以选择语言,除了常规的中文、英语、日文等等,像比较少见的粤语、 韩语甚至地方方言同样可以选择。在参数设置完成之后,我们就直接点击右下方的生成音频,在生成好之后就点击左下方的播放,听一听效果如何吧。太好了,明天是周五,终于可以休息了,我们可以很明显的感受到在置声原配上最终的配音效果 是非常贴合我们所选择的人物情绪的。所以在大多数情况下,我们想要获取配乐通常使用的就是 mini max, 而想要获取配音通常使用的就是置声原配,大家也可以根据自己的需求来选择合适的平台生成对应的 ai 素材。 对于制声原配的其他功能,在制作动态慢时基本上是接触不到的,所以大家感兴趣的话可以自行探索或者在评论区留言,这里就不再做笼鱼的演示。那么以上就是本期视频的全部内容,如果觉得对你有帮助,不妨点赞、关注、支持一下, 我们就下期视频再见。大家好,我们这期视频来讲解如何进行 ai 对 口型操作,一共分两个部分,各个对口型平台的特点,概括主流 ai 对 口型平台的实操演示。 在目前的 ai 对 口型功能中,我们经常使用的平台有三个,可灵、吉梦和 comfui。 我 们首先来看可灵,它的优点是对口型的精准度行业领先,特别是在中文场景下表现犹佳,即便是复杂的发音也能较好的还原唇形。 同时能够支持生成的视频在清晰度上也是比较高的,能够达到一零八零屁,且最长可以支持一分钟的对口型视频生成,使用成本也不是很高。其在匹配结果上,能够通过提示词生成匹配的面部表情与肢体的微动作, 比如提示唱歌就可以生成拿着麦克风的姿势。同时在平台上也有很多官方内置的形象素材,在没有素材的情况下,我们只使用官方所提供的内容也能生成较好的对口型视频。而缺点方面,在非中文的对口型生成时, 部分单词和口型的匹配程度不是很高,同时在可怜 ai 上,如果说原视频当中人物并没有做出任何动作,则生成的结果整体在动态上只会有嘴部产生动作, 同时如果生成的时间过长,可能会出现嘴部的颜色与脸部不协调的问题。我们再来看极梦 ai, 它的优点同样是中文,适配性很强, 同时在生成费用上也相对便宜些,即便是免费版也可以使用大部分的功能,包括对口型功能,且每天都会赠送生成积分。同时新增的大师模式可以实现全身动作和背景动效,还支持多人对口型, 较适配复杂的创作场景。且同为字节公司旗下的产品,在极梦 ai 上所生成的视频可以直接对应到剪映后期功能, 甚至能够直接发布到抖音平台。而在缺点方面,在大师模式下消耗的积分会比较高,例如生成八秒钟的视频就需要消耗六十四点积分,在非会员的情况下很容易就将免费积分消耗掉。同时目前是不支持动物对口型的, 在进行卡通角色的对口型时,牙齿和面部的细节会显得不够自然。我们最后再来看康复 u i 工作流,首先工作流最大的优点自然是使用成本低,在本地电脑配置充足的情况下, 可以说几乎是零成本,同时生成的画面也不会有平台的限制,像一些平台会进行审核,禁止生成的视频或者画面。我们使用本地工作流同样是可以进行对口型,工作流上也存在很严重的问题。 首先是上手门槛比较高,即便是下载现成的工作流,我们也需要手动的去补全节点或者修复报错,对于新手而言是存在一些上手门槛的, 就像漫画这类飞写时的角色,在对口型时往往效果不佳,对电脑的配置也存在一定的要求。当然如果使用云端的话,倒不如使用我们刚刚所介绍的两个在线平台,那么了解了各个平台的优缺点, 我们下面就来给大家简单演示一下可灵和极梦平台该如何使用其对口型功能。首先来看可灵,来到可灵 ai 的 首页, 我们点击左侧的全部工具选项,可以看到在最下方有一个数字人选项,点击之后就来到了对口型的页面,此时在上方会包括两个分选项,一个是数字角色二点零,一个是对口型,分别对应的是图声、视频对口型 及视频对口型功能。而我们要做的事情就是首先在这个位置来上传一个需要进行对口型的图片,除了上传提前准备好的图片之外,可以看到上方有官方的形象库, 在点击展开之后,右侧就是我们可选的官方所提供的人物形象,也可以直接点击这里的 ai 生图来现场生成一个画面,进行对口型视频的生成。在上传好图像之后,下方会进行角色的识别,如果成功的识别可背对口型的形象 图片才会上传成功。而下方的配音内容部分就是我们要输入让人物开口说话的文本了。当然我们也可以点击这里的上传音频选项,来上传一段提前在本地电脑上准备好的音频文件,这段文件通常就来自于我们上节课所讲解的在 mini max 或者是智声云配上所获取的音频文件。不过在可怜 ai 官方也提供了一些 ai 数字人的文本转音频功能。在点击之后会展开一个声音列表, 我们可以从中选择对应的音色,再点击这个播放按键之后即可对音色进行试听。下周的才艺秀我已经迫不及待要在舞台上大展身手了。可以看到在下方我们同样可以调节语速和情感,例如这里我们选择高兴的情感。在选择好之后,输入框中我们就输入 角色说话的内容,在输入好之后,我们可以点击下方进行试听。哎,太难了,明天又要开始上班了。如果觉得这个情感不是我们想要的,也可以更换一个情感,例如这里我们选择厌恶,然后再次点击试听。哎, 太难了,明天又要开始上班了。可以听出这里的情感转变还是非常明显的,且声音效果也比较自然, 在语气上情绪也比较强烈。而在下方的部分有角色表现的选项,其实就是在描述我们生成视频时人物的动作效果,相当于是在配音的同时进行了一次涂声视频。 而在最下方可以选择生成的模式,比如我们当前选择的模式是一零八零 p 三十帧,这也是目前表现效果最好的模式,同时在消耗的点数上也会更高。 如果不需要这么高的标准,可以切换为上方的标准模式,可以看到此时生成需要消耗的积分基本上就减少了一半。在确认无误后,就直接点击这里的生成即可。对于视频对口型方面,我们需要切换上方的分选项到对口型页面,然后在下方这个位置上传我们需要对口型的视频, 也可以从当前可令 ai 的 历史记录中选择一条视频进行上传。同样在上传视频时也需要进行人脸识别,需要先识别到人物才能进行下一步操作。 在识别出人物之后,会弹出一个对口型窗口。我们此次上传的是一段五秒钟的视频,在右上方的位置 同样可以选择有可灵 ai 现场进行配音,或者选择上传本地的音频文件。我们这里就以官方生成配音为例。首先来输入一段文本内容, 在输入好之后,下方和刚刚一样选择合适的音色、语速以及情感,然后直接点击右下方的添加配音,此时相应的音频就会出现在左下方的剪辑轨道上。 相信大家对这样的剪辑轨道布局并不陌生,在剪辑软件中是非常常见的,而我们要做的事情就是将这段音频通过拖拽的方式 让它出现在我们需要对整个视频片段进行对口型的部分,因为当前所配的音频是小于五秒的,而我们上传的视频片段是五秒钟的时间,所以才需要通过拖拽的方式这样左右的移动位置来选择人物说话的时段。而我们最好要确保的是 所生成的音频长度不要长于视频素材的长度,否则生成的结果会出现人物说话不够完整的情况。在确认无误后,就直接点击右下方的生成选项即可。可以看到我们使用视频对口型选项最终消耗的点数是要明显少于 数字人选项的,因为此时我们不需要生成整段视频,只需要让人物的嘴巴动起来,同时与音频匹配即可。我们再来看极梦 ai 这边,来到首页之后,点击左侧的生成选项,然后将最下方的模式切换为数字人模式。相比于可连 ai, 在 极梦 ai 这里 在操作界面上要简洁很多,但功能上基本大同小异。同样的,我们首先需要上传一段视频或 图片,在视频或图片中需要包含一个可被识别的角色,可以看到这里同样在进行角色检测,在检测成功之后,右侧是上传音频的位置,这里即梦 ai 同样自动的为当前的角色形象匹配了一段官方所提供的音色。 如果确定要使用官方提供的音色,我们就要在右上方输入角色要说话的文本,而下方则描述人物在说话时有没有其他的动作以及运镜如何, 相当于是在生成视频的同时给人物进行了配音以及口型匹配。当然,除了使用官方所提供的音色来阅读我们所输入的文本进行口型匹配声视频之外,可以看到在下方还有一个上传音频的选项, 点击这个位置来上传一段本地音频,再配合动作描述和运镜描述,同样可以实现人物的对口型操作。至于视频对口型方面,我们现在将图片替换为视频,在替换好之后,同样可以使用官方提供的声音素材配合我们输入的文本来生成口型匹配的视频 或者上传音频,不过这里就会缺少对人物的动作和运镜描述了,因为本身视频的动作和运镜已经固定下来了。 对于最后的康复 ui 工作流,无论是生成效果还是生成视频的清晰度以及使用的便利性方面都远不如前两者,所以这里我们就不再做荣誉的演示。如果大家感兴趣,不妨到 leibu、 leibu 或者 runnyhab 这样的平台来简单体验一下其他作者 已经提前搭建好的工作流,看一看效果如何。这些平台都是有一些免费的使用点数的。那么以上就是本期视频关于 ai 对 口型的全部内容,如果觉得对你有帮助,也不妨点赞关注、支持一下,我们就下期视频再见!

