普通人用 ai 做慢剧,一个月到手这个数,别再只会刷短视频了,新风口已经吹到你的脸上了,最近爆火了,我在末市开超市就是信号,今天我把完整制作方法一次性讲透,你直接照着做,马上就能做出自己的第一部 ai 慢剧。 ai 慢剧到底是啥?为啥全网都在抢着做? 你肯定刷到过那种动漫的一样的联集一集跟的就是它,为啥这么占米,就两个种方式,要么付费解锁下一集,要么看广告拿分成。 别小瞧这广告,爆率真的很高,一集就七秒就能躺赚,这就是为啥有人越做越上头。好了,废话不多说,我们直接开始今天的教程。首先我们需要一个脚本,也就是剧本, 你可以在豆包里提出你自己的想法,比如我们现在要卧室那种重生的那种来,就是可以尽情发挥你自己天马行空的想象力,其余的交给豆包,然后就得到一个最开始的剧本脚本,接着我们稍微看一下,检查一下这里呢,因为我们接下来要去使用这个脚本去做视频的首尾针,图片生成, 所以我们需要对应的人设以及分镜的提示词,方便我们生成图片啊。得到这个之后呢,再继续我们优化我们的脚本分镜,让每一个分镜头变成五秒钟的镜头,方便我们去生成视频。接着就是激动人心的环节,我们去复制这个人设的脚本, 在极梦 ai 里选择图片生成做一个人物的三式图,要求摆底,这样我们的人设会比较清晰一点。后面去生成画面时候呢,也可以很好的保持整体的人物一致性。 接着依次复制提示词,使用人设图作为智能参考,去生成每个画面的图片。在得到所有图片之后,我们直接利用脚本里的提示词,加上刚刚抽卡图片,选择视频生成,去生成对应的分镜视频。到这里基本上我们准备工作已经完成了, 接下来就是把所有的分镜视频全部拖到剪映里,剪辑配音加转场就 ok 了,我们一起来看一下成品吧! 男主凌野,二十八岁,上一世是普通上班族,性格散漫,缺乏危机意识,末日仓促应对,因物资匮乏,车辆为改装失控翻车惨死,重生后眼神锐利沉稳, 行动力拉满,熟悉末日初期节点与漏洞形势,果断缜密,带着前世死亡的恐惧与不甘。贫先致,优势求生。好的小伙伴们,今天内容就分享到这里,本期视频我会以文档的形式把 ai 视频操作当中所用到的文档提示词整合包,还有创作思路全部记录下来了,感兴趣的六六六。
粉丝62获赞423

清华大学终于把 ai 慢剧制作教程讲明白了,适合所有人学习!警告,本系列视频耗时两个半月,制作共计一百二十分钟,让你从慢剧小白到视频大神, 这应该是目前仅有从入门到进阶的全套系统 s 级 ai 慢剧创作教程。本期视频我会以文章的形式把制作 ai 视频所用到的工具,核心词还有创作思路全部记录下来了,感兴趣的伙伴三连六六。 如何用 ai 制作一部电影,其实非常简单,一部完整的电影至少包含视频台词、配音、配乐这些全部都能用 ai 轻松搞定, 而这里面最难的就是用 ai 做出符合故事情节的视频,以及保持角色的一致性。今天全是技巧,手把手教你一条龙搞定!讲故事、生人物,配音、翻译, 创建一个 ai 电影视频。那我们现在正式开始吧,我这边做了一个流程图,大概分为七个部分,故事的脚本、 ai 图片的生成、视频的生成、配音配乐,视频的剪辑,放大视频字幕。首先第一个就是故事的脚本,我一共把它分成了几个模块, 首先第一个我们先要来去确定主题,我们可以第一个跟客户沟通,第二个自己去设定。就比如这一次的案例就是以七夕的由来为例子,然后呢去做一个动画, 那我们有了这样一个想法之后,就可以去生成剧本,剧本的话我们可以借助大圆模型来去生成。这里给大家推荐的就是 d p k 和豆包文心一言都是我们国内的啊,那我这边就打开网站直接给大家来演示一下。 我们给他这样一段话,告诉他是一个专业的动画故事编剧,深耕三 d 动画领域,因为我现在想要做的就是一个三 d 的 动画,那我们可以看一下这个就是他给我们写的一个剧本, 比如说镜头一,镜头二大概是什么样子的,大家也可以去看一下有没有要修改的地方。像这里的话,他把场景以及画面旁白都已经给我们了,相对来说还比较全面啊, 当然我们肯定还是要去修改的,当我们有了这个剧本之后,我们就可以让他给我们直接生成剧本中每一个人物的角色设定啊,这里其实有人物,有织女啊、牛郎啊,其实都有,但是可能相对来说没有那么的详细。 所以呢,我们还要给他发送一段话,让他给我生成剧本中每个人物的人物设定,需要包括这个角色的外形啊,服装啊、性格啊,行为特点。做这一步的目的啊,就是为了我们人物的一致性, 那我们直接把这个发送给他就可以了,发送完了之后,大家可以看一下,他就把这一个角色的设定都给我们写好了,就比如说织女是一个什么样子的, 他的脸型是什么样的呀?效果不是很好的话呢,我也可以让他去换一下这个服装,都是可以的,但是至少前期我们对整一个剧本都是有一定的了解的,所以这个时候我们的角色设定也就做好了。那现在我们人物设定做完了之后呢,我们就要来出分镜,因为前面的话他其实只是一个剧本, 这个剧本我们可以去修改,修改完了之后,我们现在要去做成 ai 能够识别的提示词嘛,就是要进行图片生成的话呢,我们就要把这一个分镜脚本做出啊, 分镜脚本的话呢,基本上就包含了提示词啊、旁白啊以及音乐这些,那我们后面图片生成的时候,直接拿这一个分镜脚本里面的内容就可以了。那这一个分镜脚本的话,我给的提示词是这样的,就是让他直接帮我把剧本 转变为分镜脚本,然后每一个镜头不要超过三秒钟。角色设定呢,也要把提示词写出来,就是我们之前得到的这个角色啊,其实你也可以直接去用,但是你也可以让他去帮你把提示词都写好,直接复制过去,我们直接复制这个提示词也是可以生成出来的。 然后呢 ai 生图的提示词让它详细一点,不要具体到详细的参数,需要把风格也把它写出来。后面这个其实就是表格的格式,我把这个格式发给他,那他就会直接给我做成表格的样子, 然后呢我们点击发送这个就是它给我们生成的一个脚本,这个脚本的话呢就是按照我们的格式来的,然后它就直接把比如说运镜方式,然后景别是什么样子的, 以及 ai 真图提示词是什么样子的, ai 图声视频是什么样子的都给我们了。当然这个的话我们肯定是要去修改的,我们直接就可以去升图的话,大家可以把这个表格直接下载下来,保存到 excel 表里面, 也可以呢,直接用一个飞出文档把它写下来都是可以的,或者你就直接让它存到这里也是 ok 的, 这个都没关系,只是他这个这个不是很好修改啊,用豆包的话,他就可以直接去修改,如果大家想要后面还要来去用的话呢,最好还是把它放在本地。 那我们也可以看一下他这里一共给了我们多少个镜头,大概的话呢,是八个镜头,然后每个镜头都有两个啊,把它分成了两个,这样的话呢,基本上有十多个镜头,那这样的话,我们把每个图片生成出来,再把视频生成出来,就可以得到一个比较好的效果, 大家也可以去看啊,不是说每一个镜头我们都要完全生成出来,那可能你只要生成一个镜头,然后第二个镜头呢,我们可以直接升视频了,他说他这里讲的是一个织女座在云端之一之前的一个镜头嘛,其实我们可以就直接把这个镜头生成出来, 然后呢上面这一个他是一个特写,我们就可以直接用这个镜头视频生成,让他慢慢推进,然后推到他的特写来就可以了。 所以像这些呢,大家可能要自己去看到底是用一个画面还是两个画面好一点好,但到这里的话,我们前期故事脚本的准备工作就已经全部做完了,那这一节的分享的内容就到这里了,下一节我将继续给大家讲脚本画面的具体生成方法 以及操作步骤,谢谢大家。 ok, 那 我们来讲一下第二个部分, ai 图片的生成,我一共把它分成了四个模块。首先第一个选择平台,平台这一块我推荐给大家的是三个,第一个吉梦,第二个 sd, 第三个 mg, mg 的 话它是最早出来的图片生成的平台,但是它是国外的, 就是除了图片,虽然说很漂亮啊,但是我们要用的话呢,要科学上网,而且呢相对来说也比较贵。然后 sd 的 话,它的可控性会强一点,它是可以本地部署的。 那吉梦其实我觉得它是结合了这两者的优势,首先它的图片也还是比较好看的,然后呢,它对图片的控制一致性都保持的很好,又没有那么难, 所以呢,我这边用到的也是吉梦,那我们选择平台之后呢,接下来我们就要了解一下吉梦提示词的结构。吉梦四点零,它的提示词就是用连贯的自然语言去描述就行了, 就是用大白话去把它讲出来就 ok 了,用短词语来去描述画面的美学,就比如风格啊,色彩,光影以及构图。那我们现在要生成一个动画片,那你要知道你想要生成的是什么风格的,这边我给大家截取了一些即梦里面比较推荐的一些风格啊。首先二 d 卡通的就是平面的, 然后三 d 的 风格,儿童画的风格 q 版, q 版就是比较可爱一点的嘛。再来呢,日漫的风格,这些我们都可以去了解一下, 那你大概脑袋里面应该要有一个想法,你打算什么样子的?比如我们现在做的是七夕的吗?那如果你觉得国漫出来的相对来说是偏卡通的,那你可以在它的基础上再加一个三 d 写实,就是可宁上面的一些风格,我也给他截下来了, 就是让大家了解一下可能不同的平台,他对这种风格的汇总,他的描述词可能不太一样,那大家要记住这些风格是比较难的,那你就去找一找这种国漫风格,大概别人做出来的 是什么样子的,直接去搜索国漫卡通人物,可能他给我们的效果就是这样子的,我觉得这种比较好看一点,对吧?我想要生成这种风格都可以,那可能我现在就选择这个吧,我们可以直接截图或者说保存都可以啊。好,然后我们再来到 ai, 直接让他去反推提示词,这里我们可以直接 ctrl 加 v 粘贴, 粘贴过来之后呢发送给他这样一段话,就是反推提示词,那他就能够给我一些对应的风格,那我就可以直接把这个到时候去发给 ai, 那 再结合我们之前所生成的提示词,像我们上一节课不是已经把这个脚本以及人物的形态生成出来了吗? 我们可以直接我先把这个 ctrl 位复制过来,把这个写在前面,后面再接我们这个描述就可以了。当然这个 ai 给的我们肯定要去修改的,就比如说像这个核心定位啊,这块我们可以不要, 对吧?然后织女这一块要把它要的就是像这种国内的模型啊,他对我们中国的这种词汇的理解相对来说会好一点,所以你去给他 我们所熟知的这些角色,他会生成对应的一个形象啊,那这个就是我们的一个提示词,我就可以直接来到 ai 平台,那就加微发给他,其他的我先把它删除一下,发给他之后我们在这里选择图片生成,然后模型,这里呢选择四点零的模型 比例,这里选择九比十六,然后我们点击生成就可以了。当然如果说刚刚的这一个构图以及它的光影我们也想要借鉴的话呢,大家也可以一起把它拿过来,所以其实有些构图你不太了解的话呢,我们可以去借鉴,这个是学习最快的方式。 ok, 这个就是我们的风格啊, 再往下面看光影这一块啊,我这边也给大家截了一些出来,逆光是什么样子的,侧光是什么样子,逆光是从后面打过来的侧光,那就从侧面嘛,然后还有侧逆光,柔光大概是一种什么感觉,我们都要知道,这样的话你去找图片的时候,你会好找一点。 再就是色彩啊,我们至少要知道,哎,你想要的是一个暖色彩哦,冷色调啊,就是一个暖色啊,就是比较典型的冷色调啊,它就是亮色啊,绿色啊,这种 我们都可以去给他一定的描述啊。再来就是构图啊,其实我更建议大家去找到比较好的图片,比较漂亮图片,然后呢再去学习好, ok, 当我们掌握了这些理论的知识之后,接下来我们就可以去生成人物形象了, 那人物形象的生成这里呢,我们可以给他生成全身像以及半身像,全身像的话,其实我们就是把他的武装定下来,以及他的高矮,然后半身像呢,我们就是 他的五官相对来说会清晰一点。这边我也直接打开景物给大家演示一下,大家可以看一下,这个是我之前生成的,因为我之前想要的是三 d 卡通的风格,所以就这样给他了,这边 我是想让他穿着衣服啊,就不要是露出肩膀的这个样子,所以呢,当我们生成图片之后,整体的感觉对了,就局部不太满意,我们就可以点击进来,进来之后这边可以局部重绘,把你想要重绘的地方发给他涂出来。好,这里我们就可以给他一个关键词,叫做衣服盖住 肩膀,大概就这个意思啊,然后我们再来点击生成,那他就可以给我们生成这一个衣服盖住肩膀了,像这里我们就可以去挑一个,最终我选择是这个形象,那当我们得到这个形象之后,我接下来就要做全身像了,所以呢,我们就可以直接啊,我先把这个 ctrl a 全选删除一下, 直接把他给到他,再描述一下全身像,你就能够比较稳定的出来全身像的感觉,大家可以看一下,这样的话你就可以选一个你自己比较喜欢的衣服,但凡是你要用到这个人物下面这一部分 都会给你重新生成,大家可以看一下这个跟第二个都是不一样的吗?就是前期把这个服装也定好一点,这样的话你前后的一致性他保持的会更好一点。 那当我们把织女定下来之后,就要开始去生成牛郎了吗?大家可以看一下参考图片,风格都要做出牛郎的形象,然后同样的这个风格,什么给他,然后同样的三 d 卡通国漫还是要给他的。 ok, 生成好了之后呢,你就可以选择一个合适的,其实大家可能看我现在这里都只有一个啊, 我其实也是刷了很多图,最终保留下来的一个 ok 之后可能有的地方有一些小的时候, 然后我们再把神牛啊,包括玉帝娘娘所有的人物以及里面会出现的动物都把它生成出来。当然这个神牛你现在不去生成也是可以的,我是直接把它定好, 接下来我们就可以开始生成分镜的图片了,就是现在只有人物的形象已经定好了吗?那接下来呢,我们就根据这个分镜表去出分镜图。分镜图这里要注意的是什么呢? 就是人物的一致性以及场景的一致性。这边我还是打开给大家看一下,就是像这一个,他是一个半身像嘛,所以我直接把半身的这一个照片传给他,传给他之后呢,再给他风格,再直接给他现在的一个场景就可以了。比如这里是织女坐在云端的直击前,因为 ai 现在他可以自己给我们做到了, 包括他的表情,大家可以看一下这里他露出了半张脸的特写,然后呢眼睛瞪的很大,他都是能够去表现出来的。在环境这里我们直接给风格就可以了, 这是单图的一个参考吗?那有的时候你就像这一个桥,我得到这个桥之后,我要两个人站在这个桥上,所以这个时候我们就需要多图的参考,包括像这里的话呢,我是需要这一个牛郎跟我之前生成的牛 到一个场景里面,所以呢我这里给了两张图片的参考,它都是能够很好的识别,并且呢能够非常好的保持它的一致性,包括这一个就两个人坐在这里,像织女的话,在凡间我也给他生成了一个图片的, 有衣服肯定要不一样的嘛,它下凡了之后,那我们就用同样的方式把所有的分镜图片全部生成出来,大家一定要记得去结合这个橡皮皮以及局部重绘, 那这个就是我们图片的生成。那我们接着来讲一下 ai 视频的生成,以及配音配乐视频的剪辑放大视频,如果没有看前面两节的视频,大家可以先把前面两节看完了,再来看这一节的内容。那我们首先来看一下 ai 视频的生成,这一视频的话主要有两种,第一种我们可以使用本地的, 本地基本上就是看 u i 在 线平台,这一块呢我也给大家列举出了几个,然后呢有他们一些对应的优势,像极梦的话是性价比非常高的,它是唯一一个有素质人就是在生成动作的同时来讲话的。 海螺的话对打斗效果比较好,可能这一块呢相对来说比较酷,然后同一万象是唯一一个支持生化同步的,然后呢是国外的需要科学上网,那我这边用到的呢就是极梦, 直接给大家演示一下吧。那我们打开启蒙之后呢,可以直接先把手伸图片传上来,然后呢再把提示词复制给他,提示词的话,其实我们之前的脚本里面,像这边 ai 声视频他都已经给我们了,我们可以直接把这一个 ai 声视频的这个复制 ctrl c, 然后在这里呢直接 ctrl 加 v 模型这一块的话呢,推荐大家选择第二个。第一个效果当然是最好的,但是相对来说它消耗的积分也是最贵的,所以呢我们选择第二个就可以了, 然后再来点击生成,他就能够生成对应的这种动画视频了。那同样的,那后面呢,我们也一样在这个地方直接复制,当然并不是所有的这种视频提示我们直接复制过来都是能用的。这个画面的话呢,我就并没有说直接用他的镜头从左向右平稳的平移,但是 其实 ai 脚本这里他给的是什么呢?就是展示牛郎精心照顾神牛的一个过程,再就是他用手舀起河水,轻轻的倒在神牛的背上,神牛舒适的眯起眼睛,这里其实我省略了一些,我就直接让他轻轻的拍拍手,牛仿佛在跟他说话,把它简化了。 不是说这个镜头就不好啊,因为我之前生成图片的时候就没有去生成,所以这一块呢,就给他简化了,大家可以根据自己的图片,然后适当的去修改啊,然后像下面这个我也没有说完全用到它这一块的提示词。好,我们来看一下刚刚这一个生成的效果,直接回到底部这里来给大家看一下,你看它这里会舀了水,然后拖到这个牛的身上, 所以这个相对来说也是 ok 的。 像这种比较简单的动作,我们都可以用简陋来生成,那如果是稍微复杂一点,或者说有特效的动作,我是建议用海螺来生成。这边呢也给大家看一下我用海螺制作的首尾针的效果。好,那我们可以看一下啊,像这个的话,我就用到了首尾针,最开始啊,他们是两个人坐到这里,然后尾针的话是两个人分开, 那这里用到的提示词就是说我们的镜头绕着主体三百六十度的环绕,然后呢气势磅礴,隔绝天地。这个其实也是我们之前这里他给到我的一些提示词来看一下, 就是这一块,然后这两个给他融合一下,大家可以看一下这里用到的提示词,那像这个镜头的话呢,是自己加的, 我只能把这一块分成两个啊。第一个呢是这个王母划出的金拍的一个画面,就是让他这个轨迹移动,然后第二个呢就是直接他这个金色的轨迹划到这两个人吗?这样两个镜头就拼接起来了,所以我们就把它分成两个。第一个就是这一个王母直接把用这个金钗把整个划出来,那再就是这个划出来的镜头 其实也是取了很多个片段把它结合在一起的,并不是说一个片段它就可以直接形成,大家可以看一下,所以它有时候生成的效果并不是很好啊。你像这个变着变着变成这个变成了一个导弹的样子, 我们也要不断的去刷图,然后呢找到相对来说比较好的把它拼接在一起。嗯,这个王母出来是一个镜头,然后呢它这里出来是金色的,所以那这一块我们就是金色的轨迹,从前面沿着两个人中间往里面分,这个是他之前他想要的,就是画面一分为二吗? 那你要想到怎么让它去一分为二呢?所以这边我给的提示词就是这个样子,大家可以看一下,这样的话就可以分开了,然后呢也实现了沿着主体去转一个一百三十度,然后转成这个样子。 但是像这个效果,如果我们用题目做的话,他是肯定出不来这种效果的,像这些镜头很多都是他需要自己去补充的,包括这种特效的效果,我们都是用很多,会相对来说好一点。然后像这个大家可以看一下,这个给的提示词呢,就是喜鹊,然后从深林山间云层汇聚而来,组成一座桥的宏大场面。 其实这一块这个镜头我是做了蛮久的,最先有桥的几句,反正在前面的时候也尝试过很多啊这种镜头,比如说我只让他先上桥,然后呢让两个人跑过去,我 发现我都没有很理想了,大家可以看一看,所以说可能我最终展示给大家的是一个成品,但是其实他都是有很多各种镜头叠而成的。 好, ok, 那 这个就是视频生成这一块,视频生成之后呢,我们就要开始去配音、配乐以及做剪辑,像我们这个它是没有人物的讲话的,所以配音相对来说比较简单。配 音的话呢,我主要用到的是音浪,因为它的音色相对来说会有情趣一点,就比剪映里面的会有情趣一点,而且呢它还可以自己去生成音色,就是你想要一个什么音色,你可以在这里去给它输入, 因为我们这个是一个旁白嘛,就比如说你看他这里有一个解说员,然后语速快,音量高,你可以自己让他去输入你想要一个什么样子的音色,那因为我们这个旁白比较简单,所以就没有必要去让他再去设计一个音色,这边我找到的是一个抒情男生的音色,大家可以听一下他的这一个音色啊,窈窕明月,映照凡尘万象。 你看天边这轮玉盘,千古未改,我有心事,随风飞散,相对来说还是比较有感觉的,所以呢,我就直接用了他这一个音效,当然我们也可以直接用剪映里面啊,剪映里面这种旁白也是有的,那我们就直接把整个旁白直接复制过来, 然后呢让他直接去脑补就可以了,像这个每个月是有一万个三倍可以去用的。然后如果大家有去充值 vip 的 话呢,在这边可以去输出情绪,就是你可以说开心啊,难过啊,惊讶都是可以的。 当然这种音频的话也有本地的,这边直接给大家打开一下啊,如果说我们是配音配乐的话是一共的话,第一个是我刚给大家讲的这个,还有一个是音带是 t t x 啊,这个是本地的,然后它的文件是比较大的,有十多个记忆,这边就不给大家去演示了啊。然后的话呢,我们再回到这一个视频生成栏,这边我们也可以用 copy 以外,我这边也打开给大家演示一下, 就是直接找到这一个望楚生视频的工作流,然后直接把图甚上传上来,上传上来之后,同样的我们去复制这个提示词,他对提示子的理解是比题目要准确一点的,就比如说我们同样的提示词啊,我这里给的是聚焦在织女飞舞的手指上,那我们可以看一下他是怎么去给我表现的,大家看一下 他确确实实会聚焦在他的手上,因为他是没有去聚焦在手上的,因为我在生成这一个镜头的时候,感觉也不需要他去聚焦到手上,就没有去调整他的一个应用,还至少保留三百个 g 的 空间,然后才去定义使用这个本地的, 那你们也可以去使用在线的这个工作流,其实这一个工作流呢,他就是引用的从亿万象的模型啊,大家也可以直接在他的官网去使用,这样的话就对电脑没有什么要求。 好, ok, 那 我们做完视频生成,然后呢再做完配音配乐之后,接下来就可以去剪辑了。剪辑这块的话呢,大概我们第一个要导入素材,然后呢先对它进行一个初剪,就像有的地方要加速,有的地方要减速,然后不要的片段把它删除, 再来做一个经典,经典的话就给他加入对应的转场了,再加入对应的音效之类的,最后导出。这边我也打开剪映给大家看一下啊, 这边片段的拼接呢,这边我就保留了到这个位置,然后第二个片段把接上来,再到后面这里的话进行了一个变数,包括这一块也进行了一个变速,就是他在有的时候让他变得更慢一点点,再到有的地方可能就需要加速一下,这一块呢做了一个加速的处理,就让他速度稍微快一点点。当然 如果大家觉得需要转场的话呢,也可以加入这样的转场,其实有的时候我们直接用硬切是比较好的,那经典完成之后,我们就在对应的地方给他加上对应的音效, 这里呢就会加入一个魔法的音效的语言,整个画面变得很丰富。配音这一块,我们可以直接在音频这里啊,大家可以直接去搜索,比如说轻音乐啊, 或者说爱情相关的音乐都可以啊,直接去搜索就可以,比如说轻音乐,当然我们也可以借助一下 ai 给我们的,你可以去看一下之前这个大模型音乐,这里是空灵梦幻的影子音乐,所以呢大家直接去搜索空灵 可以了,然后呢再一个一个去听,你觉得比较好的,直接把它放上来就行了。像我这里用到的是空灵之播,然后像音效酷这一块也是一样的,大家也可以去参考 ai 给的也可以呢,自己根据这种效果,然后去加入对应的配乐。大概就是这样一个流程啊, 当我们把所有的做好之后,那我们就可以导出了旁白这里的话,我是给它换了一个音色,因为我之前是用男生正常的嘛, 但是我感觉换成女生可能会更好一点,我就在这个地方去换了一个音色,我们剪映里面出来的这种音色,它是比较平的,我们可以让刚刚讲到的那个迷迷思,让他先去生成一个比较有情绪的音频,再到剪映这里去换上你想要的音,都是 ok。 导出之后,那我们可以对它进行一个高清放大, 这里其实可以不加字幕啊,我们可以等高清放大之后再来加字幕这边高清放大呢,用的一个软件,就是它比较吃配置啊,就是你的配置越高,那它生成的效果就会越快。所以 大家看一下你整个成片是多久了?如果你的成片有六七分钟,或者说四五分钟,那你可以分开去放大,可能你的电脑会带不动,那如果你整个生成的都只有一两分钟,你就可以整个成片都剪好之后,再一起去放大就可以了。这边也给大家演示一下吧,这个软件打开大概就是这样子的, 那我们只需要把自己的视频拖到这个软件里面来就可以了,比如说我这边直接拖拽过来后呢,我们可以在这里把这个珍藏点开,点开之后在这个地方可以选择让它放大到高清四 k, 下面这里有一个参数,我们可以把它起用一下,然后选择手动估计, 那我们再根据他给我们估计的参数去渲染一下,看一下效果。这里我们可以渲染少一点啊,先渲染五针看一下。接下来之后我们打开这个对比,那如果大家觉得这个效果不是很明显的话,我们可以把这个锐化值给他拉高一点点,然后修复压缩值也给他拉高一点点, 改善细节也可以拉一点。就是当我们效果不是很明显的时候,我们可以把它的这些数值稍微拉高一点,然后再来去渲染,现在的话呢整体感觉会明显很多了,那我们可以选择乘这一个展开式图, 然后呢在这里看一下对比,但如果大家觉得这个效果还是不够,那就全部把它拉满,然后再来去渲染看一下。好,这个时候我们再来对比一下,现在应该就非常明显了吧,这个是原来的样子,然后这个是高清放大之后的 他这个呢没有损失细节,还会给你去做一个高清的修复。所以这个呢大家可以去用一下,然后再导出,导出之后最后我们在剪映里面把字幕加上来就 ok 了,直接在剪映里面用那个字幕识别,这是我们整个短片的一个制作流程。

挑战一个视频,彻底教会你 ai 慢距制作!本系列视频耗时两个月,制作共计六十小时,带你一口气从小白顺利进阶大神!由于视频太长,本套教程分期发布,本 期带你搞定指令设计核心操作。最后会给大家一个小福利,课程视频中的所有素材,脚本、分镜关键词等,还有学习计划表,几十上百记素材,电子书和刻件等等,只要你能想到的素材我这里几乎都有,评论留言六六六即可全部免费打包带走。哈喽大家好, 上集我们确定了 ai 软件制作的核心工具,其中大圆模型就像大脑,能够辅助我们生成剧本、角色等内容。 但很多同学用 ai 时会遇到答非所问,输出杂乱的问题,核心问题是还没有掌握指令的精髓。这集我们就聚焦于如何设计精准的指令,来带领大家完成剧本以及分镜脚本的创作。所有在教学过程中用到的指令呢,我都已经给大家整理完毕, 如果有需要的小伙伴呢,记得在评论区输入三三三打包带走。我们在给 ai 设计指令的时候呢,要遵循两个技巧,三个原则。首先我们要给 ai 定身份。什么叫给 ai 定身份呢?就是给他一个指定的身份,明确 ai 的 角色,让他站在对应专业的视角来说出内容。 比如说,你是一名资深的漫剧脚本编剧,擅长玄幻风格的创作,你是剧本创作指导,精准的生成符合制作需求的剧本框架。 这两种身份呢啊,他们都有异曲同工之妙,都和啊创作剧本啊脚本有关。但是呢,如果你拿这两种不同的身份去分别啊,给 ai 来设计指令,那么你得到的这个回答也一定是有不同的。我们的身份越具体呢, ai 的 输出就越贴合专业的需求。第二点, 给输出定结构,定框架,我们要提前规定 ai 的 输出格式和逻辑,避免内容的杂乱。比如说一个完整的脚本,它需要什么样的东西啊?需要什么样内容? 是不是需要啊?人物角色的设定,镜头运动,对话的设计,还有时间等等等等。那它的输出格式是按照表格还是按照台本来格式来输出呢? 这些框架越清晰,后续我们使用起来就会越省心。这就是啊,两个技巧。那三个原则呢,就是遵照清晰、具体、场景化三原则。简单来说就是指令表达要避免模糊表达,要补充足够多的细节,并且明确应用的场景。 接下来我们来看具体的操作过程。这里呢,选择豆包作为演示,我们首先给他输入一个身份,跟着我们刚刚讲过的,你是一名资深的都市玄幻慢剧脚本编剧,再确定一个主题,擅长创作升级流爽剧剧本。 到这里呢,我们就可以给到他一些关键词啊,比如说你的这个剧本呢,他的主题是什么?是什么灵脉修真啊? 是什么气筒啊,哎,是什么灵气复苏啊等等等等啊,这是不同的关键词,然后让他给出我们剧本,那没有灵感, 脑子里很混乱,没有灵感的人,我们就可以让 ai 帮我们给出相关的这些灵感,然后你再去里面选择,所以我这里会加上一个,请让他给出我三版不同的剧本,一共我为慢剧制作进行挑选, 我们来看一下他给出了三版的这个剧本,第一版是叫零脉重启,都市修真狂潮,很这个核心设定啊,很非常的典型啊,全球灵气复苏, 然后主角本来是什么,本来是零脉破碎的废柴,意外获得了上古领域这种机缘,然后就开始了逆袭之路,非常典型的逆袭打脸啊, 然后我们来看第二版,第二版的话就很明显啊,这个是系统啊,系统文。第三版是这个秘境探索,秘境探索主角有特殊的体质,然后进行考古时啊,然后考古时发现了上古王朝的遗迹,然后开始了这个 这个剧情。三版基本上都是不同的核心设定,我们可以看一下主角的这个性格呢,也分别不一样,分别不一样,他给了我们,还给了我们人物小传 看,一个是隐忍啊,一个是乐观,性格乐观,还有一个是什么?还有一个是沉稳冷静,哎,观察力,灵敏,三种的主角连性格都不一样, 除此之外,他还哎根据我们的这个设定哎,已经给我们创作好了前三场的开篇剧情,我们粗略的看一下,粗略的看一下,就可以进行选择了。 那我是觉得啊,我是觉得既然我要进行麦剧的创作的话,肯定是比较抓人眼球啊,一开始就能吸引到观众注意的,像这种打脸啊,这种废柴打脸这种套路其实还是很好用的。所以呢,我就确定了,我选择第一版这个零麦重启啊这个剧本 来进行创作。刚刚我们带领大家完成了剧本的创作,那现在呢,我们就要根据这个剧本的片段来进入慢剧创作的核心环节。脚本的创作 在创作之前呢,我们先来明确一下剧本与脚本它究竟有什么样的区别。首先我们要知道剧本,它是我们慢剧的整体的核心脉络,它是给导演来看的 整个故事情节,故事的发展高潮部分都在其中,能够帮助导演掌握整个故事的走向, 如果有需要修改的地方呢,也能很快的及时的进去修改。那脚本是干嘛的?脚本是给我们制作者啊,执行者看的,他包含的一些东西,更加的细节,其中呢有分镜的编号呀,然后画面的结构, 镜头的类型,时常啊,音效,配乐等等等等。如果是像我们制作 ai 漫剧, ai 动漫的话,它甚至里面还要包含 ai 生成的这个提示词。没有剧本呢,我们就无法把控制作的内容, 没有脚本创作呢,就如同空中楼阁,缺少具体的执行方法,同学们千万要记住别偷懒,一定要先写剧本,再根据剧本来拆解脚本。 如果先写脚本再补剧本的话,就很容易会出现故事逻辑混乱的问题。大家好,今天我们来学习图片的生成。有些朋友可能会想问了,我们不是学 ai 视频制作吗? 为什么还要学 ai 生图呢?我们需要清楚的是,目前 ai 视频生成的三种路径,分别是文生视频、图生视频以及视频生视频。文生视频也就是通过文字描述直接生成视频,它是一个从无到有的过程,有较好的创新性,但难以精确控制,比较适合用来生成一些相对抽象写意风格的视频片段。 图声视频也就是以参考图片为基础,选择性的添加一些提示词,或者通过关键帧的控制,以此来生成一些高完成度的视频。而最后的视频生视频 也可以理解为视频风格的转会,就是把 a 视频的视觉风格迁移到 b 视频上。那在这三种生成路径当中,我们最主要去掌握的就是图声视频,因为在绝大多数情况下,我们是需要对画面进行一定程度的控制, 那在实际的操作中,我们会发现很多时候我们没有办法很快的找到符合我们需求的参考图。因此想要学好 ai 视频的创作,学会 ai 图片生成也是不可或缺的一步。 我们来到图片生成的界面,可以看到在左边的方框这里,我们可以去上传参考图片,然后在右边这个输入框里,我们可以输入我们的提示词,我们首先来试试纹身图,在这里输入提示词,然后生成,稍作等待,我们就得到了一组纹身图的成品, 然后我们再在现有提示词的基础上上传一张参考图片,再来生成看一下,那这就是我们图生图的成品。不难发现,比起纹身图,使用图生图往往能够更好的控制,达成我们想要的效果。 那要想熟练的运用图生图,这里我们要知道一个非常关键的知识点,我们选择一张图片上传,然后我们仔细看一下这一个界面,在图片左下角这里我们可以调节它的一个参考强度,这个数值越高,参考图对于影响最终生成图片的权重就会越大。 然后旁边还有一个抠图的选项,我们继续往下看,这里提示我们选择要参考的图片维度,也就是我们想要参考这张图片的哪一个方面。 第一个智能参考,它是以整张图片的各个元素作为参考对象,然后我们可以通过提示词对图片的局部进行一个修改。比如我们这里上传一张图片,然后在这里输入,把图片上的背包换成浅绿色,那我们就可以得到一组只更换了原图背包颜色的一组图片。第二个 角色特征,他会识别出图片中的角色,然后捕捉一整个角色的特征,这对于我们控制角色的一致性会有很大的帮助。那我们这里也上传一张图片,然后让他在马路上滑滑板。好,那我们可以看到他保留了原本角色的发型以及服饰搭配。 第三个人像写真,他是用来捕捉人物的一个面部特征,比较适合来做一个换脸的效果。比如我们上传一张图片,他自动识别,并用蓝框标出了面部,然后我们给到一组提示词,他这里生成了两张二次元风格和两张写实风格的图片,然后保留了原图人物的五官特征。 第四个主体识别,他会识别到图片中的主体,这个主体可以是人,也可以是动物、物件等,然后把主体和背景分离开,我们上传一张图片,看下效果,输入提示词生成,我们就得到了一组更换了背景的图片。 第五个风格模仿,这个就很好理解了,就是参考图片的艺术风格。同样,我们这里上传一张图片,然后输入提示词,这样我们就得到了与原图风格一致的一组图片。 第六个,边缘轮廓,我举一个例子你就能理解了,想必在座的各位一定有刷到过这种图片的,那这个呢,就是参考了某位哥哥的经典姿势轮廓生成出来的。 第七个,景深会用到这个参考维度的情况,通常我们这张参考图,他会有一个比较突出的层次感和纵深感,通过参考他的景深,我们可以凸显主体并虚化背景,增强了生成图片的镜头感。 第八个,人物姿势,这个也很好理解,就是捕捉出图片中人物的姿势动作。我们上传一张图片,选择人物姿势,然后给到提示词,他就给我们生成了一组与原图人物动作一致的图片。 那在了解清楚图片的不同参考维度之后呢?我们再来看一下这几个生图模型。目前吉梦这里一共是有五款生图模型,分别是三点一、三点零、二点一、二点零 pro 和二点零。我们这里通过同样的一组提示词,分别用这个五款模型生成一次,看看效果会有什么样的一个区别。 那现在五款模型都生成好图片了,我们来看一下。首先是二点零生成的这组图片,就算抛开质感不谈,像后面的行星环也有不同程度的区别。然后是二点零 pro 的 这一组,可以明显感受到的是,它整体的光感会更加突出,但是仍具有较强的塑料感。 接着是二点一的这一组,也是延续了二点零 pro 组较强的光感,但是塑料感得到了一些虚弱。再来看三点零的这组,不难发现这组图在质感上有了非常显著的提升,已经接近电影大片的感觉, 但是部分地方,比如人物投影以及后面的行星还存在不同程度的瑕疵。最后是三点零 pro 这一组,可以看到它不论是在画面质感 还是分为渲染等方面,都要比其他生图模型更加出色。基于这五款生图模型的表现呢,绝大多数情况下,大家直接选用最新的模型即可。 那以上就是本节课的全部内容,如果对你有所帮助,还望多多三连支持一下。下节课我们会开始学习视频生成,感谢你的支持,我们下节课再见! 哈喽,朋友们大家好,这节课我们来学习 ai 视频的精准极速工作流。 现在生成一条 ai 视频并不难,难的是生成一条完全符合你设想,剧情连贯且在短时间内可以完成的视频。那么本节课重点解决的就是 ai 视频在生成过程中的两大问题,可控性 和效率的问题。什么是可控性?你可能有这样的疑问,同样的工具,相似的提示词,别人做出来的 ai 视频呢,令人惊艳,而自己做出来的视频呢,却非常的粗糙。那么为什么会差距如此之大呢? 核心就在于两点,第一点就是我们工具的选择,第二点就是我们提示词的写作。在工具的选择上,它可以决定我们生成视频的下线。而在提示词的写作上呢,它可以决定我们生成视频的上线。因为 每一款不同的 ai 工具呢,都搭载着不同的生视频模型,所以说不同的模型生成的 ai 视频也是天差地别。 提示词呢,决定了 ai 视频生成的意图范围,它是生成的质量、画面内容、修饰节奏、镜头语言的源头变量,所以说它决定了我们生成视频的上限。那如何提升可控性呢?可控性本质上是能否精准的生成自己想要的视频效果。 我们先来看一下市面上都有哪些 ai 视频生成工具,比如我们常见的批卡可零 round 位, 海螺,撸马,最近还有一个后起之秀吉梦,也是非常不错的工具,每一个工具都有他们自己的特点,比如皮卡,他创意玩法最多,生成动漫类的视频会非常令人惊艳。可灵呢,最稳定, 最流畅,支持我们的中文提示词,并且在中国元素上令人惊艳。专为呢,他的视频风格非常丰富,画面有电影质感,适合艺术感的视频。 海螺有多分镜的控制,支持导演式的拍摄,中文创作也非常友好,因为可灵和海螺都是我们国产的模型。好 撸嘛,他可以把真实的场景变成高质量的三 d 视频,空间感比较强。那提示词我们应该怎么写?因为视频是动态的,所以说要比图片多一些动态结构的描述,推荐使用结构化的提示。运镜加场景加主体,加细节, 希望我们表达的简洁清晰,动词优先。例如运镜有相机距离,视角,移动方式。场景可以包括背景环境,如丛林或者都市。主体呢,可以是人物或者物体。 细节方面可以包括风格、色调、光线、运动方式等。举个例子,如果让你去生成这样的一个视频,你会怎样去写题日词呢? 可能很多人会说一颗透明的玻璃球在空中飞,这种表达是不准确的。正确的结构化提示应该是 fpv 镜头跟拍一颗透明玻璃球快速的穿越丛林。这样写 ai 才能理解你具体想要的视觉效果,生成的更加准确,电影感强的镜头才能表达出来。我们的极速工作流程 可以先让 ai 帮我们生成视频脚本,首先将这段提示词发送给 ai, 让它快速生成二十个分镜镜头,此时我们就得到了每一个镜头的景别画面以及音乐音效。 再将画面描述作为文声视频的提示词发送给 ai 视频工具。为了保证文声视频的一致性问题,我们可以用括号限定人物的外貌特征,例如判断者在多个镜头中出现, 为了保证前后一致,我们可以将每一个分镜判断者出现的后边加上他的个人外貌描述。那同理场景也需要补充统一一致性的提示词,让视觉保持统一,那么图声视频可能稍微复杂一点。 我们首先可以用画面描述作为提示, ai 绘画生成手帧图片,选择你心仪的图片之后,将它上传到我们的 ai 生成工具上。此时我们的提示词只需补充画面的运动部分即可, 因为人物以及画面风格是我们图片已经限定的,那么通过这套极速工作流,我们可以在一天之内完成一个完整的一分多钟 ai 视频。从构思到脚本到渲染再到剪辑,全部流程高效可控, 这就是 ai 视频的精准极速工作流。大家好,我们这节课来讲解音效与视频整合,一共分五个部分,音效获取、环境音效、动作音效、转场与特效以及视频审查。我们首先来看音效获取, 音效通常有两种获取途径,分别是 ai 生成和用现有素材。首先来看现影素材,我们最常用的就是在剪映的在线素材库中获取音效。打开剪映,点击左上方的音频选项,可以看到在左侧的分选页当中有音效库,这个分选页在点击打开之后就可以找到不同的音效。 在这里有许多不同的分类,例如像提示音类的、综艺感类的或者是机械类的。当然更多的时候我们会在最上方的搜索栏当中搜索我们想要的音效,例如这里我们搜索火车,可以看到在搜索结果中就出现了和火车相关的音效,例如这里的火车通过闸口的声音 或者是火车轨道的声音, 可以听到这些声音在效果上都是非常不错的。可以说在剪映当中我们可以搜索到大部分 在后期剪辑时所需要的声音效果。此外,想要使用 ai 生成音效的话,目前有不少的 ai 视频平台也可以实现。例如来到可灵 ai 当中,我们点击左侧的全部工具选项,可以看到在这个位置就有音效生成的功能。在点击之后就来到了音效生成的页面, 这里既可以选择上传一段视频,让可连 ai 自动为这段视频根据画面内容来添加音效。也可以在左上方切换到文声音效的选项, 使用文字描述的方式来生成对应的音效,例如这里我们输入切西瓜的声音,在写好之后,直接点击右下方的生成即可。片刻之后,四段切西瓜的声音效果就生成好了,我们可以点击右上方进行试听, 一共会生成四段,如果对某一段不够满意的话,我们可以再试听其他的内容,比如这里 可以听出这段声音内容还是比较贴合切西瓜的声音的。不过在实际的操作中,大部分的声音效果我们都可以在剪映的素材库中找到,只有像一些难以找到的声音效果, 我们才会选择 ai 生成,因为目前在剪映上我们使用音效是可以免费商用的。那么了解了音效该如何获取,我们下面再来讲解一下环境和动作音效。首先来看什么是环境音效, 这里就以我们所制作的动态慢的第一个画面作为例子,可以看到此时像这个画面当中出现的情景有下雨、 风铃、树叶和阴天,给画面搭配相应的音效其实并没有什么特别的技巧,大多数情况下就结合我们日常生活中的经验来搭配相应的音效即可。 像当前这幅下雨、阴天有树叶、有风铃的画面,我们需要添加的音效就与画面当中出现的事物相关,包括下雨的声音、 风铃摇动的声音,风吹树叶的声音,以及像阴天可能会有打雷的声音。那么了解了这些之后,我们要做的事情就是在音效库中搜索相应的与环境相关的音效,比如分别搜索下雨、 枫林、树叶、打雷,在搜索好之后,点击进行相应的试听,寻找一段合适的音效,通过拖拽的方式添加到下方的剪辑轨道当中即可。那么这里我们就简单来试听一下,看一看这段添加了音效之后,画面的呈现效果是怎样的, 可以听到整个的声音表现还是非常细腻的。而像这类音效,我们都称之为环境音效, 核心作用是构注空间感,增强沉浸感,通常不直接匹配画面动作。而我们刚刚所展示的就是属于自然类的音效,像雨声、风声、鸟鸣声。当然除了自然类的音效之外,还有些音效属于生活类音效,这类音效也十分常见, 也是很多同学在制作动态漫添加背景音时比较容易忽略的一点。例如我们来试听这一段,他才勉强给了我和你说几句话的时间, 这里面有父亲平时用的止痛膏。如果说我们不去分析这段画面当中的音频,可能会觉得整个画面当中主要是人物讲话的声音, 但其实整段画面有一个十分重要的背景音,那就是白噪音,也就是我们刚刚所讲解的生活类声音。现在我们将画面当中的背景白噪音关掉,也就是减少了画面当中空气流动的声音,然后再次点击播放。 我托人给牢头塞了些许银子,他才勉强给了我和你说几句话的时间。可以很明显的感受到,当前的画面主要的声音就只有人物的声音和背景音乐的声音了,相比于刚刚有空气流动声音时的观感,在代入感上会差很多,因为他更远离我们在生活中的实际声音感受, 所以大家在后期剪辑制作添加音效时,要格外的注意。给画面当中添加这样在生活中可能容易忽略的白噪音, 除了像牢房当中空气流动的声音之外,像咖啡厅的嘈杂声音,校园里喧哗的声音,或者在街道上车流的声音,比如胎噪喇叭这类声音也属于生活当中的白噪音,是比较容易忽略的。 那么了解了什么是环境音效,我们继续来看动作音效,这类音效是贴合画面中主体动作的顺势音效,核心是强化动作张力,同步视觉节奏, 有像肢体类的,有脚步声、关门声、拍手声,还有像操作类的,像打字声、切菜声、开关按钮的声音,以及像特效类的,像爆炸打斗 或者魔法释放。回到剪映当中,我们依然以刚刚这段视频为例,这里就添加了一个人物打开盒子,拿出盒子里东西的声音,我们来仔细试听一下, 这里面有父亲平时用的止痛膏,还有一些母亲做的糕点, 不难听出,在人物打开盒子拿出盒子里的东西,以及伸出手接过东西时,都是搭配有相应的音效的,而且与人物动作发生的时间也相当契合。这样的契合需要我们在剪辑时进行反复的调试,移动在剪辑轨道上的声音文件, 让其与画面内容相匹配才可以。那么同样的,我们现在将这样的声音给关掉,然后再次点击播放, 这里面有父亲平时用的止痛膏,你手腕磨破了记得涂。可以很明显的感受到,在关闭了这些动作音效之后,整个画面在观感上就逊色了不少,其核心原因和刚刚一样, 画面中所发出的声音并不贴合我们在日常生活中能够实际感受到的声音,所以就会减少了很多代入感和真实感。 当然,除了环境音效和动作音效之外,我们上节课所讲解的背景音乐也是必不可少的。可以看到,在当前的剪辑轨道上,我们同样添加了很多和背景音相关的音效,比如这一段的蓄势略带悬疑的音效,还有这一段的纯音乐 清悬疑的音效,以及最后一段古风悬疑不速之客。正如我们上节课所说的,这些音效在不同的情节中能够给人不同的轻松一些,而主角在长按时音, 音效的悬疑感就会增加一些。我们下面来看转场和特效。转场是衔接两个镜头的过渡方式,核心作用是平滑镜头切换,引导趋势节奏。我们就以这一段为例,主角刚刚穿越到牢房当中,大量的原主记忆开始涌入脑海,我们来看一看这一段是如何用转场效果表现的, 我这头好疼。可以看到,这里的转场效果往往用于回忆 或者是和记忆相关的画面,而我们当前使用这样的波纹转场效果,其实就是在表现大量的记忆涌入主角的脑海的情形。而特效则是对画面音频的修饰加工,核心是增强视觉冲击,渲染氛围。在当前的剪辑轨道上,紫色所表示的部分就是特效的部分。在故事剧本当中, 主角刚刚穿越的牢房会伴随着剧烈的头痛,随后大量的记忆会涌入脑海,为了表现主角头痛的感觉,除了在肢体动作上添加一个主角去揉太阳穴的画面之外,我们同样添加了一些特效效果,例如这里使用的是震动推进,我们再来感受一下 我这头好疼。可以看到伴随着镜头的剧烈晃动,再搭配人物的肢体动作,我们能够十分真切的感受到 主角此时确实头很痛。关于这样的转场效果,我们是无法从日常生活中像音效那样来搜索和添加的。在更多情况下,我们要多观察其他作者已经制作好的作品,看一看在不同情形的镜头切换时,其他作者都是如何使用转场效果的。像比较常见的有淡入、淡出、叠化、闪白, 而特效方面则更多的是滤镜调色、光影叠加,利用在回忆的镜头可能饱和度会更低一些,再从现在的时间线跳转到过去的时间线时, 画面会用闪白这样的转场效果等等。简而言之,转场和特效的添加并没有什么一劳永逸、举一反三的方法, 大家更多的是从其他作者的作品当中汲取经验。我们最后再来看视频的审查,我们当前所展示的视频剪辑工程文件是已经全部剪辑完成的,效果可以看到整个工作量还是不小的,像文字、 特效、转场、配音、配乐的添加都需要反复的调试,耐心的剪辑,而且越是庞大的工程,越是时间长的视频,就需要花费越长的时间。在这种情况下,不免视频在剪辑时会出现一些问题,例如像内容逻辑、故事是否流畅,镜头是否衔接自然,转场是否合理,有没有逻辑断层, 要像字幕旁白,画面主体是否准确,都需要我们进行检查。而像技术层面,包括画面有没有模糊,音频有没有杂音,以及导出的格式是否是可用的。还有最后就是风险审查,像版权方面,在音乐上有没有版权风险, 图片字体上是否可以商用于画面内容,就是来审查有没有违规画面敏感词汇等等。这样的审查并没有什么特殊的技巧, 大家可以根据当前的 ppt 页面所列出的内容、逻辑、技术细节以及合规风险这三个方面对视频内容进行审查, 无非就是反复观看几遍,并根据自己的经验和平台的要求进行审查即可。那么以上就是关于音效与视频整合相关的知识,如果觉得本期视频的内容对你有帮助,也不妨点赞、关注、支持一下,我们就下期视频再见!

二零二六, ai 漫剧新王登基,各大平台猛砸资源扶持,漫剧市场日成交额直接突破千万,每分钟的收益更是从两千飙升到三万。但百分之九十的小白还在瞎摸索,不懂怎么制作 ai 漫剧,坑点没人提醒一座,全是盲区。 今天这条视频,不管你是纯新手小白还是 ai 视频老手,本套课程都能给你带来收获,从零到一,拆解 ai 漫剧的所有知识点,脚本、画面、配音配 四大核心环节出发全程干货,无废话,无需专业技巧也能轻松上手。同时为了能让小伙伴更加系统的学习,我已经把制作 ai 慢剧所用到的工具、工作流和操作步骤文档 全部打包好放在置顶评论区了,欢迎各位小伙伴去领取。话不多说,我们直接开始今天的课程。大家好,在上一节课中,我们已经讲解了如何制作脚本, 以及根据脚本内容来生成分镜头图片。有了分镜头图片之后,我们下一步要做的事情就是使用分镜头图片来生成对应的 ai 视频片段。下面我们就以极梦 ai 为例,来演示一下如何使用各种功能来生成 ai 视频 片段。来到极梦 ai 的 首页,点击左侧的生成选项,然后在下方我们将生成模式修改为视频生成。视频生成也分为文声视频和图声视频,如 果不上传任何参考图,直接在这里书写提示词的话,那么我们使用的就是文声视频的功能。例如这里我们就输入三 d 高精度建模 u e 五质感。一个戴着眼镜的鹦鹉在工厂风格的办公室里看报纸,午后的光照,办公桌前是冒着热气的咖啡暖色调 镜头推进不难发现这里我们描述的提示词非常的详尽,因为在使用纹身视频时,由于没有参考图,是没有任何的画面信息的,所以除了描述画面当中的人物动作以及镜头的运镜之外,我们自然还需要较为详细的去描述画面的各种信息,包括风格、内容、光照以及色调等等。 在描述好之后,我们就直接点击生成在等待生成的各项参数。首先是视频生成的模型, 看到当前选择的是视频三点五 pro 模型,这是目前版本标号最高的模型。和图片生成模型一样,通常来说版本标号越高,生成的效果就越好。大家届时在操作时,如果有版本标号更高的模型, 也不妨尝试使用版本标号更高的。不过也需要注意消耗的成本,像最新的三点五 pro 模型,生成五秒钟的视频就需要消耗四十个点数,相比于我们之前经常使用的三点零模型, 足足提升了三倍。特别是像在生成一些二 d 动画的效果时,在效果的提升上,版本标号更高的模型可能未必有那么明显, 所以大家可以根据实际的效果来自行的决定是否要使用版本标号更低的模型来生成视频。一段时间后,纹身视频的效果就生成好了,可以看到整体的效果表现还是不错的。 那我们也需要注意,纹身视频在画面内容上是存在很强的不可控性的,单纯的用语言,哪怕形容的再确切,使用的字数再多,受限于语言本身的表述能力, 生成的画面也会有很强的随机性,所以在百分之九十九点九的情况下,我们是不会使用纹身视频的。相比之下,图生视频就稳定多了。由于是先生成图片,后生成视频,在图片生成时不仅能够解决人物前后一致性的问题,像美术风格、画面内容、空间布局都能够以极低的成本在 生成图片时就提前处理好。而图生视频又分为手真图生视频和首尾真生视频。例如这里,我们以这一张榛子刚刚爬出电视时的画面为例,将其作为手真图上传到预备窗口当中。而提示词方面,我们就描述画面中的人物,走到镜头面前固定镜头。 可以注意到我们此次生成有了手真图,在提示词的描述上就只描述了画面当中事物的运动以及镜头的运镜。至于其他参数方面,这里可以选择生成的视频,分辨率默认是七二零 p, 如果对质量有更高的要求,可以选择一零八零 p, 然后是生成的秒数,在大多数时候我们选择五秒就足够了。如果生成十秒钟的视频的话,可能会导致人物在做动作的时候出现意想不到的动作,或者是画面当中出现崩坏的部分。所以除非是人物需要更长的时间才能做出一个完整的动作, 非必要的话就选择五秒钟的时长。现在点击生成,在等待生成的这段时间,我们继续来看最后一个参数,就是运镜,这个运镜描述和我们用文字来描述运镜效果是一样的,只是官方给出了一些既定的运镜描述,例如像西区苛刻推进、西区苛刻拉远机械臂等等。再点击之后, 最终实现的效果也和我们在提示词里面描述能够实现的效果是基本一致的。一段时间后,视频就生成好了,来看一看效果如何吧。 可以看到整体的效果还是比较符合提示词的描述的。人物爬出了电视机,走向了镜头,但我们也不难发现,最终女鬼的样貌呈现。由于在手针途中是背对镜头,没有明显的人物样貌特征的, 所以在转过身后,无论是人物的穿着还是人物的长相,都和我们在人物设定当中的贞子形象有着极大的差别。因此对于这样像首帧图中人物是背过身去的情况,或者是镜头的运镜发生了变化,出现了一些新场景的情况等等,我们就不可以使用首帧图生视频了。此时就需要使用首尾帧生视频。 方法也非常简单,我们再上传一张图片,放置在尾帧图的预备窗口当中,而提示词方面就保持不变。现在再次点击生成,可以看到此时生成的结果,帧子在整个转身的过程当中就变得十分自然了, 而且运镜的表现也十分稳定,人物在长相上也没有出现明显的变化。我们下面来看视频生成的另外一个功能,就是智能多帧,在视频模型选项的右侧有一个首尾帧下拉菜单,在点击之后可以看到有一个智能多帧的选项,点击切换到这个选项 时,我们可以在首尾帧的基础上继续上传尾帧图,最多可以上传十张图片。可以看到,在我们提前准备好的分镜头图片当中,榛子的出场是一个十分连贯的画面。在这个时候,我们往往就可以使用智能多帧功能 来生成固定镜头下的连续画面。例如第一张我们上传一张没有榛子的电视里面出现古井画面的图片。第二张我们就上传榛子出场的图片。 第三张,我们就上传一张榛子出场到一半的图片。第四张和第五张依然继续上传榛子在出场过程中出场到一半,最终直到完全爬出电视机的图片。 在上传好每一个分镜头图片之后,分镜头与分镜头之间也是可以添加提示词描述的。例如像第一张和第二张之间,我们就描述人物从古井爬出,固定镜头点, 以及确定其余的分镜头与分镜头之间的衔接,同样描述的是人物的动作和镜头的运镜。当然,如果生成的两张图片在人物行为的时间关系上十分接近的话,即便不使用提示词描述,通常也能生成较为连贯的效果。 我们现在点击生成看一看效果如何吧。在等待生成的过程中,我们再来看一个刚刚没有提到的参数,那就是生成的秒数。在使用首尾帧时,我们只能选择五秒或者十秒,但在使用智能多帧功能时, 两张分镜头图片之间所生成视频的时长,我们是可以自由设定为零到五秒之间的,以避免某些很快就能做完的动作却设定了较长的时间。这一点大家可以在脑海当中预演一下人物做这个动作大约需要多久,以此来设定对应的时间,当然也可以根据实际的视频生成效果 来实时的调整时间,一段时间后视频就生成好了,来看一看效果如何吧。可以看到整体的视频表现还是不错的,画面当中古井的画面出现,女鬼从古井当中爬出来,再到下一步的连贯动作爬出电视, 最终慢慢的走向了镜头 画面。在很多的人物动作表现上可能不是十分自然, 甚至出现了某些动作已经做过了,但为了迎合下一帧的分镜头图片而又重复的做了一遍,这也是使用智能多帧功能时的一个弊端,那就是生成的画面在随机性上比较高,而每次生成的成本可以看到需要消耗六十个点数来生成五张图片所连成的智能多帧视频。 这样的生成成本显然是很难支持我们多次试错的。因此在实际制作的过程当中,更多的时候我们还是老老实实的使用首尾帧功能加后期剪辑 拼接的方式来获取像这样的长时间连贯的一镜到底的画面。可以看到在我专门存放分镜头视频片段的文件夹当中,帧子爬出电视机的画面也是通过首尾帧的功能逐一生成的。那么以上就是关于本节课生成 ai 视频 的相关操作演示,至于其他的 ai 视频生成平台,在功能操作上也基本大同小异,相信大家在学完极梦 ai 这个平台的操作之后,对其他平台也能够举一反三,快速上手,所以就不再做荣誉的演示。如果觉得本期视频的内容对你有帮助,也不妨点赞关注,支持一下, 就下期视频再见。在大多数影视作品中,往往都会出现人物讲话的情节,所以在制作过程中就免不了要进行配音。而在 ai 时代,获取配音的方式自然也有 ai 配音。本堂课一共分三个部分, ai 配音的两种转换类型, ai 配音平台介绍和 ai 配音平台实操演示。 首先来讲解 ai 配音的两种转换类型。第一种类型是文本转语音,顾名思义就是我们将输入的文本直接生成自然可懂的语音, 这种转换方式是无需依赖原始的语音素材的,通常我们使用配音平台现成的音色就可以。而第二种类型是语音转音色,其原理在 ai 软件爆发之前出现的变声器比较类似。这种方法又称声纹转换,核心在于完全保留语音内容韵律 与节奏的前提下,将原说话人的声纹替换为目标说话人的声纹,实现换声不换内容。这里我也制作了一个表, 对比了文本转语音和语音转音色的区别,需要的话大家可以暂停看一下。我们下面就来介绍几个 ai 配音平台,并分别来演示他们的使用方法。这几个平台的网址我也放在了评论区的置顶上,大家需要的话可以去查看。首先第一个平台是 mini max, 来到 mini max 的 首页可以看到在左侧是不同的功能选项,有语音合成、音乐创作、音色设计和人声提取这么几项功能。在大多数情况下,我们使用这个平台主 主要使用的是它的音乐创作功能,特别是在人生歌曲上,这个平台不仅操作简单,而且生成的效果也十分出色,大家感兴趣的话不妨尝试一下。至于它的语音合成功能就会略显逊色。点击语音合成的分选项, 在左侧有一个巨大的输入栏,这个位置我们输入的就是需要进行音频转换的文本,例如这里我们就输入 好了,今天是周五,明天就可以休息了。在输入好之后,右上方可以选择转换使用的模型,自然也是版本标号越高的模型,转换效果就越好。然后在最右侧可以设置各种生成时相关的参数。首先最重要的自然就是音色,可以点击右侧的切换按钮, 打开音色选择菜单来选择合适的音色。比如当前选择的是沉稳高管的音色,可以点击头像图标的位置来试听这个音色。嗯, 出差的事我知道了,下周的会议改成线上好了,就这样,如果觉得这个音色还不错的话,就点击右侧的选择,在音色的命名上还是比较贴合音色本身带给人的感受的。由这里我们再点击试听这个傲娇御姐的音色,我可不是那种会被轻易影响的人, 你这点小聪明可不会让我动摇,可以听出效果还是非常贴合傲娇御姐这个名称设定的。 在选择好相应的音色之后,下方可以选择音色的相应效果,让生成的语音不仅是平稳的阅读, 同时也可以带有一些不同的情绪,不同的语速或者声调。例如在音色选项的下方有音色效果调节选项,在点击进入后,可以通过拖动滑块的方式,让声音更加低沉或明亮,更加具有力量感,或者更加柔和,更加清脆,或者更加富有磁性。 同时在下方有一些环境音效的开关,能给生成的声音附带一些环境特效,不过这样的特效在剪映上会有更多的选项,不是很建议在这里 去选择。点击左上方可以返回刚刚的调试台。继续往下看,这里有一个下拉菜单,可以选择输出的情绪,也就是人物的感情,如果选择自动的话,就是根据当前文本的内容来生成对应的感情。 当前的文本太好了,今天是周五,明天就可以休息了,通常匹配的就是开心的感情,当然也可以手动选择相关的人物感情留这里我们就选择开心。再往下就是非常直观的选择语速、声调和音量的部分,这里我们就保持默认,然后直接点击右下方的生成。太好了, 今天是周五,明天就可以休息了,在生成好之后会自动播放,可以听出最终生成的效果。人物是很明显的带有感情的,为了方便对比,我们再将输出情绪设置为难过,然后再次点击生成。太好了, 今天是周五,明天就可以休息了,在对比之下效果还是十分明显的,这次生成人物的情绪就明显低落了不少。以上就是如何在 mini max 平台使用语音生成功能,不 过相比之下,更多的时候我们选择的配音平台是置声原配,这个平台的功能更全面,效果会更好。当然两个平台只是核心优势不同, mini max music 更擅长生成歌曲, 而至生云配更擅长生成配音。来到至生云配的首页,可以看到在左侧有不同的功能选项。在整个页面布局上,包括 mini max 在 内,大多数的 ai 歌曲生成或者语音合成平台都是大同小异的。首先第一个就是文本转语音功能,我们要做的事情同样是在这里的文本输入框中 输入想要生成的音频文本,例如这里我们输入海星,没有大脑和血液,只要依靠海水循环完成营养输送和呼吸。在输入好之后,右侧选择相关的音色,调整合适的参数。同样是点击这里的转换选项,在弹出的窗口当中选择相应的音色。在支撑云配平台最大的特色 就是它具有一个音色市场的功能,除了官方给定的一些音色之外,在音色市场我们可以通过购买的方式来购买一些音色较为出众,配音效果可能会更好的音色。例如这里会备注,此人是国家一级演员, 通过购买所获得的音色自然是有版权的,可以放心商用。当然我们此次演示就以已有的官方给出的音色进行试听。一觉醒来,他发现自己身处一六三零年的北京 大明王朝的末期,他要想办法活下去,更要想办法回家。可以看到在头像的右侧会显示一个文字,这里显示的是多,而有些头像在右侧显示的是权。这样的标注意味着我们在选择了这个音色之后,能够给这个音色搭配的情绪是否全面。 权就意味着官方所设定的每一种情绪都可以使用这个音色,而多则意味着官方给出的大多数情绪选项都可以使用这个音色, 由这里我们就选择这个音色进行使用。在选择好之后,下方会有一个情绪下拉菜单,在这里可以选择阅读时的情感。可以看到在选项丰富程度上还是非常全面的,不仅能够选择像开心、恐惧、厌恶、惊喜等等,在每一种情绪展开之后,还有相应的二级菜单来选择在这个情绪下 生成音频的更细腻的情感。例如人物惊喜时,可能是正常的很惊喜,也可能是非常惊喜,开心的要喊出来,也可能是小声的生怕别人听见的惊喜。这里我们就选择比较气虚的惊喜,也就是小声的惊喜。而下方的滑块可以调节阅读时的强度、语速、 语调和音量,而在最下方还能调节在阅读时的语言,可以说选项是非常丰富了。在设置好参数之后,就直接点击右下方的生成音频,然后点击左下方的播放进行试听。 海星没有大脑和血液,主要依靠海水循环完成营养输送和呼吸,可以听出这样一个带有惊喜的同时又伴随着小心翼翼的声音效果,是不是既自然又符合我们的参数设置呢? 不过我们要知道,在影视作品当中,人物的情绪是非常多变的,即便当前的音色已经十分全面的给出了不同的情绪,而每一种情绪也十分细腻的 从小心翼翼到大呼小叫做了细分,但可能依然无法覆盖在实际的项目制作中我们所需要的情绪,所以在这个时候我们就需要用到刚刚所介绍的第二种转换方式,就是语音转音色。在置声云配平台同样是具备这样的功能的,我们点击左上方的语音转换,将提前准备好的 由真人所阅读的音频上传到当前的这个页面。例如在我们第一节课所展示的 ai 动态漫中,主角收到的第一条短信会发出这样的疑惑,贞子珍妮姥姥我们就可以尝试在当前的页面来转换它的音色。首先来试听一下由我自己配的原音,贞子 珍妮姥姥搞笑可以听出在这段配音当中是带有一些调侃和不满的情绪在内的,这样的情绪也许在文本转语音时就很难通过参数设置配出相应的效果,但在很多时候,可能我们自己的音色或者所找到的配音演员的音色是无法满足角色的设定需求的, 所以我们就可以使用音色转换功能。我们要做的事情是在上传好音频之后,首先点击选中这个音频,当然如果一次性上传了多条音频,也可以点击左上方的全选,对这些音色一并进行转换。选择好需要转换的声音之后,我们点击右上方 打开音色选择菜单。这里的音色选项同样十分全面,可以在官方所给出的音色以及音色市场当中 选择想要使用的声音。因为我的声音是男生,为了效果更加明显,这里我们在我的音色库中选一个女生的声音,在选择好之后,右侧同样可以调节一定的参数。 如果是男生转女生的话,建议这里把音调稍微调高一些,调节好之后,我们直接点击这里的转换,如果是一次性选择了多条音频,就点击左上方的批量转换。转换好之后,我们就点击这里的试听,贞子 珍妮姥姥搞笑可以听出声音转换之后的效果还是比较自然的,同时也保留了原音的情绪。此外,在进行配音时,除了一些有明确台词的配音,有些时候人物也可能会发出一些没有台词的声音,流向用力时的声音, 紧张时喘息的声音,这些声音想要获取的话,在右下方有一个情绪气声选用,先选择合适的性别,然后根据名称标注,点击选用,此时就可以将这段音频添加到左侧的窗口当中,点击这个位置可以进行试听啊, 可以听出这样的情绪声效果也是不错的,不过这样的声音很多时候是听不出明显的音色的,所以在大多数情况下,这样的声音也可以尝试自行来配或者使用。我们接下来要讲解的第三个工具就是剪映,在剪映当中同样也是有文本转语音功能的,不过这里我们先解决一下刚刚所说 喘息声的问题,想要获得那样的声音,我们可以点击左上方的音频分选项,然后在左下方选择音效库,在音效库里搜索我们想要的效果。例如这里我们搜索女生叹息,可以看到有很多和女生叹息相关的音频,在点击这个音频的名称之后,可以进行试听。 向右侧这个女幽灵的叹息的声音就是在原片当中出现过的声音, 由于这样的气息通常不会明显的显露音色,所以除了刚刚在制声原配上获取或者自己来配之外,在剪映上选择现成的音效也是一个不错的方法。 我们现在把话题回到文本转语音,具体的操作就是点击左上方的文本分选项,可以看到在这个位置有一个添加口播稿的选项,在点击之后会弹出一个窗口。我们要做的事情同样是在这个位置输入需要转换为语音的文本内容,例如这里我们就输入,老虎不发威,你当我是病猫啊! 在输入好之后,我们就点击下方的配音选择选项,此时右侧就会弹出很多音色选项,在点击之后即可进行试听。老虎不发威, 你当我是病猫啊!这些声音是不是大家在刷抖音时会经常听到呢?毕竟剪映和抖音都是出自字节平台。 在部分的音色选项右侧有一个设置选项,点击打开之后可以选择在阅读时的语速,不过在这里就没有选择声音情绪的选项了,所以在大多数情况下, 在剪映上我们使用文本转语音操作,通常用于旁白的阅读。当然一定程度上在剪映当中也可以进行声音的音色转换,例如这里我们将原文当中估计是小区又停电了这句话拖拽到剪映里面,在拖拽好之后,在时间轨道上先选中这个声音, 看到在右上方有一个换音色的选项,点击打开之后同样可以选择不同的音色,例如这里我们选择这个古风美男,估计是小区又停电了,为了方便对比,我们再来听一下原本的声音,估计是小区又停电了, 可以听出在音色转换之后,两个声音还是有比较大的差别的,但也不难感受到声音的语气在感情上会弱化不少,更像是从一个有感情的朗读变成这样的效果。只有少部分音色 会保留原文的感情,更类似于是先识别到这段音频的文本,再进行文本转语音。至于少部分的音色能够保留情绪, 在这上面也没有明显的标注,我们就只能一个一个试了,会相对麻烦一些。所以建议大家想要进行音色转换,还是回到至声原配上进 行转换。那么以上就是关于 ai 配音的相关知识,这些配音平台的网址链接我已经放在评论区的置顶了,大家需要的话不妨查看评论区的置顶,如果觉得对你有帮助,也不妨点赞关注、支持一下,我们就下期视频再见!

错过三年前的 ai 自媒体风口,今年的 ai 漫剧千万别再放过某音,直接上王炸级激励政策,尤其是带打斗特效的 ai 漫剧,观众缘直接拉满。近半年,我花了上万元进行学习和实操,才总结出了这套高校流程。 今天我结合这个由海螺 ai 制作的漫剧打斗片段,带大家从零到一,学习漫剧制作的全流程。从脚本创作、分镜图片的制作,再到视频生成以及视频工具的特点等,只要你跟着做就能学会。全套提示词也给大家整理好了,直接抄作业。 一、脚本和分镜提示词生成,打开 ai 工具,输入创作灵感,加我给的提示词, ai 直接帮你出完整脚本。分镜提示词和视频提示词 全程不用费脑,没灵感也没关系,去短剧平台多刷几部剧,思路立马就来。用这个方法生成的剧本,画面感超清晰,后期制作更不容易,卡壳亲测,比 ai 直接升脚本更高效。二、角色和场景是慢剧的基石,基调定的好,作品成功一半,这部分的提示词也交给 ai 生成。 进图片直接用海螺 ai 搞定。打开海螺 ai 图片生成功能,输入提示词,选择全能图片 pro 模型就行,实测效果完全不输香蕉 pro。 这里画三个新手必看关键点, 一、人物一致信,用角色加场景的三式图或九宫格做参考,人物形象全程不跑偏。二、样式参考,找两个专业参考网站扒素材,比纯靠提示词效率高十倍。三、风格统一。这是我前期踩的大坑,百年了我一次都没。 别直接拿网上的图来生成分镜,很容易风格杂乱,统一用同款风格词分为词,再加上参考图,风格一致性直接拉满。三、视频生成经过上千小时实操测试,海螺 ai 能满足我百分之九十的 ai 漫剧制作需求。核心用二点零首尾真功能加最新二点三模型, 尤其是在提示词遵循、表情、细节等六个核心维度优势,直接拉满,对比其他 ai 完全是降维打击,挨个给大家实测看效果一、 一、提示词遵循精准懂人话,镜头语言不跑偏,我要的是镜头缓慢推进加脸部周边蓝光照射,用来衔接大招画面,海螺 ai 一 次就出片,其他 ai 不 仅没理解镜头节奏,还把蓝光做成了闪电,完全偏离预期。二、表情细节贴合人物性格,微表情超到位,提示词要求扭脖子加嚣张挑衅神情, 海螺 ai 完美还原。其他 ai 不 仅没做扭脖子动作,表情还很滑稽,根本没法用。三、动作特效,打斗丝滑连贯,还会加彩蛋特效,比如骑士被巨人反弹后空中翻滚落地的画面,海螺 ai 不 仅把翻滚动作做的超流畅, 还自动加了能量光波特效质感直接升级。其他 ai 要么做不出翻滚动作,要么动作卡顿,毫无连贯性。四、视觉特效,电影级质感,运镜加画面超有冲击力,巨龙飞行的轨迹,动作丝滑到极致,运镜和视觉效果自带微压感,其他 ai 做出来的效果完全没质感,甚至有点搞笑。五、变身特效 自然逼真,人物一致性拉满,变身过程一气呵成,全程不崩脸不变形,其他 ai 变身效果生硬,最后人物直接变形,根本没法用。六、物理模拟,细节拉满, 贴合真实物理逻辑。重点是粒子特效,海螺 ai 能还原胸口撑大爆炸粒子消散的完整过程,细节超逼真。其他 ai 生成的视频动作奇怪,视觉效果一塌糊涂,完全没法比。讲到这肯定有人问,这么复杂的视频动作奇怪,效果一塌糊涂,完全没法比?讲到这肯定有人问,这么复杂的视频转写的,比如这段提示词, 只要把首尾帧图片上传给 ai, 它直接就能给到。提示词其实要比想象中的简单,你觉得难,只是还没动手尝试。听说海螺一直以亏本算利成本来回馈用户, 体验下来性价比确实很高。而且海螺 ai 最近推出的尊享套餐,让我不用再为积分焦虑,可以在不断抽卡过程中精益求精。 ai 漫剧虽然处于风口,但是高品质漫剧才能把握现在,拥有未来,强烈推荐体验一下!

你有没有刷到这种 ar 漫剧,单个平台能做到四十多万的数据,同城某英版权中心也给到了新的激励,对想做 ar 漫剧的无疑是一个机会。但问题在于,同样是 ar 漫剧,这是不是你做的效果? 这是我做的漫剧效果啊啊啊啊邪锁住心神速杀死魔! 今天就用一个视频给你完整演示我是如何制作 ai 漫剧。相关的制作流程、提示词和 ai 工具我都以文档的形式整理好了, 感兴趣的六六六带走。 ai 视频写脚本要让 ai 起剧情,关键就两步,在 ai 写周这一块,我一般用豆包、 deepseek 都是可以的,工具不限,随便挑一个工具就可以了,诀窍都一样,把它当成一个聪明的导演助理。比如我之前发布的黑神话悟空,由来就是这样给 ai 下达指令的, 第一,给 ai 一个角色,你是一名知名的短视频导演。第二, ai 一个任务,创作一个关于黑神话悟空的神话短片。第三,要结果,需要专业的 ai 视频分镜脚本和旁掰,它就能瞬间达到你想要的专业结果。这道模板我也准备好了,你只需要改改主题就可以使用。 拿到脚本后,我们怎么变成画面呢?那我们把每一段分镜词分别复制,用极梦 ai 去做分镜图片,得到所有图片分镜之后, 接下来就是真正的 ai 创作。在众多的 ai 视频生成软件里,我建议以事结合,一级使用,直接跳过复杂的参数设置。到了最激动人心的环节,打开海螺 ai, 把我们刚刚复制的分镜图丢进去, 然后去复制之前的提质词就可以了。你像这个我之前生成的两个版本,我们可以去一次性生成两组, 然后你在这里去抽一个我们比较满意的,那么这是我抽的第一个,因为我觉得这个效果差了一点,所以我就再生成了一次,就直接把这个体脂值复制粘贴进来就可以了,按照我们这个剧情脚本一次,再把对应的一个视频给它输出来就可以了。这下你总该知道 ai 视频该如何制作了吧? 点未来为何不败 啊啊啊?

挑战一个视频,彻底教会你 ai 慢剧制作!本系列视频耗时两个月,制作共计六十小时,带你一口气从小白顺利进阶大神!由于视频太长,本套教程分期发布,本期带你搞定 ai 慢剧基础篇。最后会给大家一个小福利课程,视频中的所有素材、脚本、分镜关键词等,还有学习计划表,几十上百记素材,电子书和课件等等,只要你能想到的素材 我这里几乎都有,评论留言六六六即可全部免费打包带走。恭喜你点进这个视频,我将通过 ai 即可进行创作。本套课程将从零基础开始,一步步带你解锁 ai 动态慢所需要的各个知识点。那我们废话不多说,现在就跟我一起 来学习吧!那么从这期视频开始,我们就来讲解 ai 动画短片是如何制作的。其实想要制作一部完整的 ai 动画短片,它的核心逻辑和我们的传统动画片制作是一模一样的。那现在最厉害的地方在于有了 ai 的 加持,很多以前需要一个专业团队才能搞定的工作,现在你一个人就能够全部包圆了。那听起来 很高深的一些专业知识,只要你学会借助 ai, 都可以在极短的时间内快速上手。一般来说,做出一个像样的 ai 动画短片,我们要走这么几个流程,第一步是写故事,包括构思剧本和拆解细分的分镜脚本。第二步是出图, 也就是把剧本里的文字变成一张张精美的图片。第三步就是让画面动起来,把图片转化为视频。第四步就是搞定声音,利用 ai 的 环境音效、背景音乐,还有人物的配音等等等等,那最后一步就是 把这些素材放在剪辑软件里,进行后期的合成。我知道很多新手同学看到这一长串的流程,可能觉得有点头大,甚至想退缩啊,但大家千万不要担心,从今天开始,我会带着大家从最基础的如何利用 ai 写剧本开始讲解,一直到最后的剪辑出片,我会把每一个细节呢都给大家拆开了揉碎了,然 你听明白。好,那么咱们今天从零开始,手把手教你如何从头亲手做出一个属于你自己的 ai 动画。这期视频我们先来讲解第一部分,如何利用大圆模型进行编写故事的剧本和脚本。我们都知道,一个完整的影视作品需要的是导演和编剧来帮我们赚写剧本和脚本,但我们 大多数人都不是专业的导演和编剧,因此我们想要获得一个好的故事剧本和脚本,通常需要借助 ai 大 语言模型进行生成,例如豆包、 chat g、 ppt、 jamalai 等等等等。那此时如何向大语言模型进行提问就非常重要了。对于我们新手小白来说,就可以先从这四个基本的要素进行提问,角色设定 要清晰,输入格式、结果质量。像这样公式化的提问才能够得到更有执行性的答案。比如现在我们就想生成一个三分镜的 ai 短视频,一辆赛车在沙漠里飞驰。那根据刚刚的公式呢?我们就可以这样写,你是一个专业的影视分镜脚本转写师,擅长为 ai 短视频设计场景和镜头语言,请你帮我做一个十秒左右的 视频脚本,内容是在广阔的沙漠公路上,一辆赛车在高速的飞驰。根据以下的具体要求,比如三分镜需要包括镜头类型、画面内容、动态描述 等等,要保证主体和风格的一致性。输出格式的要求有,镜头编号、画面描述、 ai 绘画提示词,最终以表格的形式回答。我们先来探讨第一个要点,角色设定。这段提示词我们可以看到给定 ai 的 身份是影视分镜转写师,这是因为我们的核心问题是让它帮我们生成三 三分镜的 ai 短视频,所以要让他在做短视频方面是一个专家,那他擅长为 ai 短视频设计场景和镜头语言。因此我们自己在向大语言模型提问的时候,如何给定 ai 身份,或者给他哪种身份 是要根据我们的核心问题进行设计。那此时我们想要 ai 帮我们去做一个科普动态慢的概念,那我们就可以给他设定。假如你是 世界著名动画影视艺术专家,请你给大家科普一下什么是动态慢,此时他所给出的回复是动态慢的核心定义,动态慢的关键特征,以及动态慢与动画漫画的核心区别。这些内容 所给出的格式是非常专业的。那我们换一种角度问同样的问题,大家可以对比一下差异。假设你是一个脱口秀演员,请你帮我科普一下什么是动态慢,可以看到这里所回复的内容,就和刚刚有一定的方式来介绍动 太慢的。这就是我们给 ai 设定不同的身份,那么 ai 给我们的答案也会有一定的差异,它会从不同的角度,不同的专业做出不同的回答。至于第二点,目标清晰,这里并没有什么特殊的技巧,我们需要做的就是简单明了的把我们的核心问题发给 ai 即可,就比如请你帮我做一个十秒左右的视频 脚本等等。那如果没有今天我们所讲述的提问框架,大家大概率也是会这样去提问,将后边的一些具体要求牵扯到了比较多的专业名词, 如果大家看不懂没有关系,后边我们会给大家一一的进行讲解。我们再来看第三点,格式输出。我们在向大元模型提问的时候,虽然在我们没有进行格式限定的情况下, ai 依然给我们的答案是分条列出, 条件清晰的,但要做脚本,需要输出的类目会非常的多,因此用表格的形式会更加一目了然。我们来做一个对比,请你帮我做一个十秒左右的视频脚本,内容是广阔的沙漠公路上,一辆赛车在高速飞驰,这是我们不做格式限定得到的答案输出。 那如果我们再加上输出的格式要求,镜头编号、警别时长、画面描述、 ai 绘画、提示词旁白,并以表格的形式回答,那这个时候我们的提问方式得到了答案就会更加的专业,并且更具实用性,这就是 ai 限定书 输出格式的作用。我们再来看最后一遍,结果质量。结果质量这个重点对于以上三个点来说呢,显得就没有那么的重要了。在 ai 还没有如此强大的时候,我们每一次的提问都需要提醒 ai 生成一些高质量的回答,比如我们在做图片提示词的时候,需要提醒 ai 生成四 k 的 画质啊,摄影镜头啊等等等等。那 我们在做文案性的工作的时候,需要提醒 ai 回答的简明扼要啊,逻辑清晰啊等等等等。但对于现在的大语言模型来说,我们的这些结果质量提示就显得有些多余了,因为 本来 ai 给我们的答案就已经非常的好了,因此结果质量只有在我们得到了答案不太满意或有所纰漏的时候,再去提醒,再去作答即可。我们下面就回归到本节课的主题, 如何让 ai 来编辑剧本和脚本,这里我们已经提前准备好了,一起来看一下具体的内容是怎么样的。首先要明确一点,剧本和脚本是不同的,可以看到在这里我们分成了故事的剧本和脚本。在剧本方面,我们点击 查看可以看到它更像是一则故事的直观叙述,就像阅读一本小说一样,没有非常隽杂的解释,只是顺着观众的正常思路来讲述一则普通的故事。而脚本则不同 的,内容会更加的繁琐复杂,包括了警别场景等等。对于画面内容的描述以及发生的时间,它更像是一本在制作这个完整故事影视作品时的一个指导规划书,告诉我们在拍摄这一段时 应该注意些什么,按照什么样的方式去制作。那么了解了故事的剧本和脚本的区别,我们再回到刚刚的内容,来看一下具体的提问方式是怎样的。可以看到这里同样满足了提问的四要素。首先第一点给 ai 设定身份,你是一个经验丰富的动画电影制 做导演,这句话就给 ai 设定了一个经验丰富的动画导演身份。下面是提要求,现在我需要你写一个动画电影短片的故事剧本,白鹤仙子的传说。这句简单的话提出了我们的要求,是写动画电影短片 的故事剧本。而第三个部分就是给回答设定格式,要求是三帝国漫风格以写故事的方式提供给我,以便于我能快速的了解故事内容不超过四百字。而在下面我们生成脚本的时候呢,可以看到就 没有再给 ai 设定身份了,因为通常来说呀, ai 大 元模型是有关联上下文的能力的,那我们在第一句话中已经给他设定了一个经验丰富的动画导演身份,所以默认在后续的提问中,即便不再单独的设定身份,这个身份也已经贯穿整个对话了。到这里大家可能会有一个疑问, 那就是既然我们生成的分镜脚本能够直接告诉我们在真正制作短片时,该在什么位置,什么样的描述,设定什么样的时间,为什么还需要让 ai 生成一个固 故事的剧本呢?这个道理其实很简单,作为一个导演呢,也就是我们自己要制作出一个完整的故事,就必须先要深入对故事有一个清晰的认识,知道故事当中的出场人物, 故事的情节。所以相较于永长的脚本而言,一则故事的剧本能够让作为导演的我们像阅读一个短片故事一样,快速的了解整个故事都发生了什么,这样在制作的时候才能够更多的去打磨这个故事的细节,了解故事的前后逻辑。其次,我们先行编的一个故事剧本, 也能够十分方便的对故事剧本当中逻辑不通或者不够精彩的需要修改的部分进行提前修改。那在修改好之后,再让大家用大圆模型参考修改后的内容,再来生成更加完善的脚本,以此来降低后续修改的成本。毕竟修改一个简短的剧本要比修改一个永长的脚本要方便的。 在生成一个 ai 动画故事短片时,大家可以看到开头我们所展示的动画短片在时长上都不是很长,通常一两分钟,所以这里生成的次数也非常的重要。通常来说,四百字的故事剧本对应的就是两分钟左右的 ai 动画短片,所以大家可以以此为基础,在设定 ai 回答时来设定一下生成的次数。 此外,我们在设计脚本要求时,实际上是为未来的 ai 绘画流埋下一个伏笔。很多格式上的约束,核心的目的都是为了让后续的图片生成更加的流畅,所以大家在向 ai 提问时,不妨换位思考,如果我们要用这段话去生成一个图片,那 ai 需要知道些什么?基于此, 我们在指令中强制要求,包括警别警号、场景绘画、提示词等等等等,这些细节直接决定了分镜的还原度。更重要的是,我们仿佛强调 ai 的 描述要客观直观,避免文学化的修饰。如果你深入使用过 ai 绘画工具,你 就会发现那些充满异境的小说话表达往往是致命伤,比如长城宛如巨龙, ai 呢?可能会画出一条龙来,那这就是语义误读导致的翻车现场。为了保证分镜脚本的实用性,我们必须用最平实的语言 去解构画面,摒弃误导性的一些修辞。当然,在追求绘画效率的同时,我们也不能忽视脚本本身的专业属性。即便我们不是职业的导演或者编剧, 也应该要求 ai 输出的内容具备脚本的基本骨架与核心要素,这样生成的作品才不只是零散的描述词堆砌而成的作品,而是一份具备 蓄势完整性、能够真正落地的执行性专业脚本。最后,让我们对本期视频的核心要点进行一次深度的梳理。首先,我们从宏观角度给大家讲解了制作一部 ai 动画作品的全部流程以及炼录。这不仅是本节课的开端,更是我们后续系列课程将要逐一解析深度攻克的技术地图。 本节课的重头戏呢,在于我们详细的拆解了如何利用 ai 大 元模型编写出高质量的故事。剧本与分镜脚本我们重点强调了与 ai 深度对话的一些核心方法论,就是提问的四要素,角色设定、目标清晰、输出格式、结果、质量。那在实战环节中, 我们不仅成功的驱动 ai 生成了可落地的剧本脚本,更从专业的角度对什么是剧本,什么是脚本以及他们的实际创作中各自承载的功能进行了一个深度的分析以及 剧本。那希望通过这些理论与实操的结合,大家能够真正的理解并掌握 ai 创作的底层逻辑,为接下来的分镜生成打下一个坚实的基础。好了,以上就是本节课的全部内容,如果对你有所帮助,还请多多支持三年以下本套教程用到的 ai 脚本、提示词、运镜、关键词库,还有所有免费的 ai 工具, 我都会整理放在下方置顶评论。下期视频,我们来学习如何根据生成好的剧本脚本来生成分镜图片。这就是 整个制作环节中最花时间的部分,因为它不仅要生成图片,还包括了设计故事当中各种事物的形象,以及 如何保证角色前后的一致性,如何对生成不满意的图片进行修改等等等等。那我们就下节课再见!大家好,在上节课中,我们学习了使用 ai 大 语言模型生成剧本和脚本,那么这节课我们就利用已经生成好的剧本脚本来进行分镜图片的生成。制作 ai 视频时 先图后影的图声视频模式是确保创作可控性与成本效率的核心策略。在实际的商业化生产流程中呢,直接利用文声视频往往会伴随着极高的随机性,可能导致半数以上的生成结果都无法达到商用的标准,从而造成高昂的时间成本与 算力资金的浪费。为了避免这种开盲盒式的低效率输出,资深的创作者通常会先精细的打磨分镜图片, 用静态图像为 ai 提供明确的视觉参考、光影构图以及主体特征,再通过图声视频进行动态的一个转化。这种工作流程呢,将创作重心前致此图片生成阶段成为了决定我们视频成败的关键流程,也是我们最值得投入精力的 一个环节。在正式开启 ai 绘画之前,我们必须要建立起角色先行的创作意识,就是说,通过严谨的造型设计来将整个故事注入灵魂。 每一个完整的去式时空呢,都离不开核心人物和事物的支撑。因此,前期准备的第一步就是将剧本中的文字转化为具象化的角色造型方案。在实际的教学案例中呢,生成的脚本通常会给出基础的视觉线索。比如我们上节课提到的角色姚双,其特征呢,被定义为白鹤仙子、 水墨风飘带飞舞、雨光环绕、雪肌银发、东方仙女。此时呢,如果甲方没有给出特定的原话稿,或者我们自己出于创意发散阶段,就可以直接通过精准的提示词指令,要求 ai 按照脚本的逻辑输出该角色的全身 正面视角。在这个过程中,我们需要明确规范角色的造型以及整体视觉风格,从而快速获得一套标准化、可延伸的角色出形象设计。这不仅能够极大的提升我们后期的创作效率,更是为 后续保证角色一致性打下了一个关键的基础。当然,除了根据脚本当中已有的简单描述对角色造型进行设计之外,我们同样可以根据自身的想法来单独设计角色的造型。比如人物 没有发注啊,可能披头散发的状态,或者说是短发这些内容呢,我们可以直接通过正常的描述来告诉 ai, 就 可以生成对应的结果。 我们前期的第二大核心呢,在于必须对故事画面风格进行全景和定调。我们要知道,任何一部成熟的影视作品, 视觉语言的核心竞争力都源于美术风格的前后一致,我们绝对不允许呢,作品在前期呈现的是写实风格,而到后期呢,却用毫无逻辑的突变为三 d 的 风格,那这种割裂的感觉呢,是创作的大忌。因此我们需要在一开始呢,就利用提示词来 来对未来的画风进行永久性的固定。就拿当下这个案例来说,当我们在生成角色时,明确植入高精度三 d 建模风格或者三 d 国漫风格等等这些指令,我们所得到的就不再是那些拥有真实毛孔与写实比例的真人形象了,而是呈现出一种接近 院线级的三 d 动画电影的角色质感。那这种风格化的预设呢,是直观重要的,确保我们在后续的生成所需要的画面都能严格的遵循这 个美术标准。那么问题来了,如果我们看中了某张图片的美术风格,但自己呢又抓不住重点,不知道该用什么词去描述它,咱们该怎么办呢?那其实呢,操作是非常简单的,我们可以直接去抄作业加精细化的一个思路。 比如我们现在来到吉梦 ai 的 首页,这里呢有很多优秀的作者生成的作品,如果我们觉得其中某一张图片的视觉感觉哎,特别符合我们的胃口,就直接点开这张图片看大图。 我们注意右侧,这里明明白白的给我们展示了作者生成这张图时的用的原始提示词,我们直接可以动手把它复制下来,直接来到我们的豆包 ai 对 话框里,给它粘贴上去,记得我们按 shift 的 同时呢,去加上回车键,就可以另起一行, 不然的话我们就直接给发送上去了。这个时候我们给豆包 ai 下一个指令,跟他说帮我把这段词里的具体描写,什么人什么事或者什么环境氛围的话全部删掉,只帮我留下跟美术风格、画面质感相关的关键词。 那我们点击发送大家可以看。这样一来我们就非常丝滑的从别人的作品里把那套风格给提取出来了,直接就可以用到我们自己的创作里。当然了, ai 帮我们提取出来的风格词呢,未必是百分之百的精确答案,咱们拿来用之前呢,先要亲自过一道人工筛选的关卡,比如说我们在刚刚提取出来的那对词里, 可能会混进去一些属于摄影机位的景别描述,跟风格描述呢,其实是没有半毛钱关系的,那咱们在使用之前呢,最好是先把这些干扰项给删除掉。 接下来咱们再来实操一下,把刚刚洗干净的风格词配合上咱们自己新的构思内容。比如描述一个古风的帅哥正在御剑飞行,再加上一些近景特写的描述,一一混在一起生成一组图片,我们一起来看一下这个效果。 大家可以看到最终跑出来的这张图,它的光影质感和三 d 的 味道是不是和刚刚咱们参考的那张大神的图片有些相似了呢?不过这里我们还是要给大家打一个预防针,因为咱们生成的主体变了,有时候美术风格在最终的呈现上很难做到绝对的完美, 所以大家在参考的时候一定要灵活,根据自己对画面的理解,多去微调提示词,不再尝试,直到它完全符合我们脑子里想要的画面为止。 那么回到豆包 ai, 我 们继续承接之前的内容,在设定好角色,也就是姚双的形象之后,我们自然要继续设计画面当中出镜比较多的仙鹤的形象。 这里我们就继续向豆包提出要求,用相同的风格生成脚本当中提到的仙鹤,可以看到最终生成的效果呢,也是非常出色,成功的生成了仙鹤的形象。当然大家同样可以靠自己的想象来描述仙鹤都有什么样的特征。 既然我们已经把人物造型和美术风格这两个基础给打好了,那接下来的重头戏就是如何通过精准的提词词,把脚本里每一个分镜的镜头给实实在在的变出来。想要画面听你的话,我们必须要掌握一套专业的提词词万能公式,我把它归结为核心的六大维度,首先是景别,你是要特写 近景、中景还是远景,这决定了观众看画面的视角远近。第二是主体事物,也就是画面里到底有什么,比如我们刚刚设计的尧霜和仙鹤,还有他们所处的具体环境。第三点非常关键,就是时间光线, 白天黑夜雷雨天气的光是完全不同的感觉,而且你要学会描述光的方向是柔和的,正面光还是很有故事的,侧面逆光,光线选对了,人物的情感瞬间也就拉满了。第四呢就是色调的控制, 我们可以直接定冷光调,或者告诉 ai 要某部电影的经典影调,比如教父的那种身随沉稳的复古感。第五呢,是构图的逻辑, 咱们是选择稳重的对称构图,或者说是灵动的 s 型构图,还是延伸感的水平构图,好的构图能够让画面自己说话。那最后呢,就是画面的质量词,像什么胶片颗粒质感, 电影级光效、十六 k 超清等等等等。这些词呢,就像是画面的磨皮滤镜,能够瞬间拔高生成的结果和我们商业化的质感。 接下来呢,我们来深入探讨一下提示词的描述技巧。这里呢,第一要义就是必须要做到极致的直观与客观。大家一定要扭转一个观念, 写 ai 体式词和我们上写写作文写小说是完全两码事。在文学创作里,我们追求修辞的意境和华丽的词藻,但在 ai 绘画的逻辑里,过多的修饰词往往是噪音的存在,那我们极其容易导致 ai 误判我们的核心意图。 举一个典型的翻车案例,比如上节课我让大家描述的长城宛如一条巨龙,那么在文学意境下呢,这是非常壮观的一个场景,但你让 ai 这种直脑筋,大概率他是听不懂你的比喻的,他很可能呢,就真的生成一条巨龙,盘握在山上,而不是你想要的长城建筑的本质。 再比如我们描述鲤鱼跃出水面,飞的很高,像长了翅膀一样,你的本意呢,是想形容跳跃的高度,但结果呢,大家可以看 ai 直接理解成了字面意思, 给这条鱼真的安上了一对翅膀,生成了一个不伦不类的怪胎。所以说呢,我们在 ai 沟通的时候呢,千万别搞那些花里胡哨的比喻词,要学会最直白最干的物理语言去 描述画面,告诉他画面里到底有什么,而不是他像什么,这样才能保证咱们的费片率降到最低。咱们再来看提示词描述的第二个核心要义, 脚本只是辅助参考,真正的画面拆解必须靠我们自己的独立思考。现在 ai 视频教程满天飞,有些教程呢,会误导大家,直接说把脚本当中的描述文字呢,复制粘贴过去就可以直接出片。那咱们实话实说呢,这种做法呢,其实是非常业余的, 因为脚本的描述里经常会堆积很多同一个镜头下根本没有办法兼顾的信息。咱们就拿第一个镜头做例子,脚本里写了超广角镜头下根本没有办法兼顾的信息。咱们就拿第一个镜头做例子,脚本里写了超广角镜头下根本没有办法兼顾的山峰之上 么?仙鹤优雅的身影呢?穿透金色的晨曦。大家可以动脑筋想一想,如果我们拍的是一只仙鹤的超广角镜头,那像细节处他身体穿透的晨曦,这仅仅是几个像素的事情, ai 怎么可能会在保证远景或者广角的情况下,帮我们把这个透光晨曦的质感给刻画出来呢?这就是视觉上的一个矛盾, 所以咱们在生成时不能当搬运工,还要当一个导演。那像这种情况呢,我们至少要把这个脚本呢拆分成两个画面,第一个镜头呢就是仙鹤飞翔的全景图,第二个镜头呢,才是仙鹤翅膀透光的一个近景特写图, 所以我们要养成一个习惯,拿到脚本之后呢,先在自己的脑海中过一遍,形成一个具体的画面感。更多的时候,我们要脱离剧本的文字束缚,根据自己脑子里的构图,用刚才直观的语言去描述它。只有这样呢,我们才能避开逻辑冲突的坑,生成画面才能够真正具备电影级的修饰质感。 第三点就是 ai 目前的能力有限,有时需要适当的修改提示词描述内容,或者在生成好内容之后,我们根据剧本和脚本进行一定的更改。 这一段让白鹤与妖怪进行战斗,它释放出神圣的能量,画面剧烈的晃动。如果大家有一定的 ai 视频生成经验的话呢,会发现这一句话当中所描述的仙鹤打斗场景,在 ai 视频片段的生成中其实是非常难制作的, 首先它打斗的细节没有描述,其次仙鹤的肢体控制是非常僵硬的,所以这里我们不妨直接让仙鹤化为人形的摇双去和怪物施法, 这样人物施法的动作会非常的流畅,并且呢更加符合逻辑。因此再遇到类似的情况,可以先尝试按照剧本当中可能会相对复杂的表现去生成,如果我们做不出来的话,再考虑更改为更加简单的画面。第四个提日词描述技巧,就是有角色说台词的画面时,尽量 用近景正面镜头,这同样是我们将来给角色对口型进行考量在即梦 ai 当中呢,给角色对口型 用的是数字人的功能,他首先需要我们上传一个视频或者图片,再添加对应的配音。当我们需要对口型的人物是一个远景人物并且非正面镜头时,此时对口型失败率是非常高的,要么效果会非常的不明显。 比如说我们来看这段视频,可以看到,虽然说生成的画面人物的嘴部依然是有动态的,但是整体的表现效果会非常的一般, 人物的身体呢,也会伴随说话而出现不自然的动态效果。我们再来看这个人物近景特写对口型的画面,可以看到此时生成的画面人物的口型和台词就十分的匹配,并且呢面部的动态表现也会更加的清晰。 所以当我们遇到有角色在说台词的画面时,就可以尽量使用近景正面镜头,以获取更好的对口型效果。我们最后再来看图片生成之后的修改技巧。在通过纹身图生成图片时呢,很多情况下并不能一次性生成让人满意的效果, 但也许生成的图片百分之八十是满意的,剩余的百分之二十呢?相比于重新生成一张图片和进行后期修改是性价比更高的选择。或者有时候我们需要表达一个很长的镜头,以此来表现画面的时间流逝 或者是人物的一连串动作。所以我们首先来看第一点,固定镜头下长时间物体运动的表达技巧。这里就包含很多方面了,比如我们现在想要表达一年四季的变化,那么在生成好人物的状态之后呢,我们就可以直接让 ai 大 语言模型帮我们固定画面当中的人物构造和构图, 但只改变画面当中的四季。比如我们首先生成的第一张图片呢,是类似于春季或者夏季。在提示词中,我们要求将上传图片的季节改为秋季,其他的部分保持不变。此时我们就获得了人物在秋天的画面。那同样的道理,我们继续描述将人物的季节呢改为冬季, 其他的部分保持不变,那最终呢,就成功的将图片改为了冬天的季节。有了这些图片之后,我们首先使用首尾帧或者多帧生成的方式,可以生成一组人物从春天到秋天再到冬天,一直在这个位置的景象, 以此来表现人物十分勤勉,十分坚毅的镜头片段效果。当然,除了描述季节之外,我们还可以描述将人物改为某种姿势,在人物的身边添加某些事物,减少某些事物。其他的部分呢,保持不变,相信大家可以举一反三,我们就不再多赘述了。 第二个图片修改的技巧呢,就是如何在保证造型和风格一致性的条件下修改环境和状态的技巧。其实这一点大多数情况下我们不需要特意去保持, 因为呢, ai 大 元模型在升图时呢,是有上下文关联的功能。比如说我们刚刚演示的提示词中,只描述了鲤鱼跃出水面,飞得很高,就像长了翅膀一样。 本身的意图呢,是想单独生成一条跃出水面的鲤鱼,但得益于 ai 大 圆模型能够关联上下文的能力,他依旧认为我们是想要基于上面的画面来进行新的修改, 而且可以看到生成的结果在美术风格上同样保持了上图的风格一致,所以很多情况下,我们不太需要单独的提及要保持的画面风格。但需要注意的是呢,在实际的制作过程中,偶尔会出现我们上传了一张参考图片 生成的结果和参考图在造型上的美术风格不相同的情况,在遇到这种情况的时候,该怎么解决呢?最好呢,我们就更换一个图片生成平台。 那在使用不同的图片生成平台时呢?其实每一家所使用的生成模型呢,都会有所区别,有些生成模型呢,擅长于写实风格,有些擅长于绘画风格,有些模型这个角度生成的不好,有些模型按这个风格生成的不好,这些呢都是很常见的情况。所以说大家在对图片内容进行修改时呢,一定不要一棵树上吊死。 如果实在生成的不好,除了用极梦 ai 或者豆包平台之外呢,我们也不妨尝试其他的平台,比如说可灵 ai, 或者像开源的 context 的 模型, flex 模型或者 banana 模型的工作流都是可以的。 现在我们可以来到 running hub 上搜索 banana 的 模型工作流,其基本的功能呢就是图片编辑在左侧图像输入窗口,将刚刚未能在豆包上生成成功的人物造型进行上传。在提日词的描述当中,我们描述需求, 这里我们就输入和刚刚在豆包上一样的提示词,根据刚刚图片的人物特写生成生气,拍桌子、愤怒的表情。而比例方面,我们修改为十六比九,然后直接点击开始升图,可以看到一段时间后,图片就生成好了,整体的生成效果还是非常出色的。 我们将在豆包上面生成的人物造型放在旁边,同时将原版的人物造型参考也放在旁边,可以看到对比之下,显然使用 banana 的 模型工作流能够生成人物造型更加统一的画面效果。 当然在豆包上大多数情况下也是直接可以修改的,只是偶尔出现一些问题,所以届时不妨尝试一下其他的平台,在保证人物造型和美术风格情况一致的情况下,改变环境和画面当中的事物形态。 最后我们来简单总结一下这节课我们讲解了图片生成的相关知识,包括前期的准备、提日词的结构、提日词的描述技巧和图片修改技巧,这些知识能够帮助大家在生成分镜图片时,更容易的生成出理想的画面。 好了,以上就是本节课的全部内容,如果对你有所帮助,还请多多三连支持一下大家在实际操作时遇到任何问题也非常欢迎在评论区留言,我会尽可能的回复大家所有的问题。课程相关的 ai 资料也已经打包好放在置顶评论区,那我们就下节课再见吧! 大家好,在之前的课程中,我们已经学习了 ai 剧本脚本的生成以及对应的分镜图片,那么这节课我们就来正式的学习生成 ai 视频片段。 目前市面上的 ai 视频生成平台有很多,我们应该如何去选择呢?那在这些年的项目实操中呢?我尝试过市面上绝大多数的 ai 视频工具, 如果综合考量操作便捷程度、生成画面质量以及平台功能的完整性,我总结出一套适合制作完整 ai 视频的方案。目前呢,我建议大家重点关注三个平台,分别是可玲、吉梦以及 mini。 那 在这三个平台呢,并不是相互替代的关系, 而是在不同的创作阶段各有侧重,他们有的擅长动态模拟,有的在审美控制上更具优势。接下来的内容呢,我会根据具体的应用场景带大家逐一进行剖析。 ok, 我 们先进入极梦平台的这个时 超环节,打开积木的主页,最上方最显眼的位置呢,就是 age 的 模式。虽然这个模式呢,支持我们输入任意一段自然语言去自动匹配功能,但在实际的生成环境下,它的智能化程度还是不足以完全理解复杂的创作意图。生成效果呢,往往带有随机性。 所以为了追求更精准的输出,我建议大家绕过这个综合的入口,直接点击左侧导航栏里的生成选项,进入专门的创作控制台。在视频生成逻辑里, 通常分为文生视频和图生视频两条途径。这里我要分享一个非常关键的实战经验,在大多数商业或者正式的作品创作中,图生视频往往是比文生视频更高效、更明智的选择。原因很简单,确定性。文生视频目前还存在较大的不可控性, 无论是画面中主体形象的一致性,还是动态镜头的精准程度,都包含太多的未知因素。而图声视频则不同,它允许我们用图片确定好构图、光影和角色,再让它动起来, 这就把视觉创作和动态模拟分成了两步,极大的提高了我们的出片率。既然我们选择了文声视频的路径,那么 描述信息的密度就要远比图声视频大得多。因为我们不仅要定义画面静态的属性,还要兼顾动态的变量,这要求我们必须回到提示词的底层结构上来。要清晰的构建一幅画面,首先要明确景别和主体, 例如近景,一名身穿白色毛衣的少女。随后呢,是环境和氛围的描述,例如白天的街道、冷色调、电影等等等等这样的一个构图感觉。最后再辅以胶片、颗粒、超轻、六 k 等质量描述词来扼实画面基础。 但请注意,写完这些后,先不要急于生成,因为文声视频还多了一个维度的逻辑,那就是运动的控制,也叫做运镜的控制。 我们需要分别描述镜头的运镜和主体的动作。比如针对人物行走的画面,我们可以书写镜头跟随或者跟随镜头,那么并要求人物在面向镜头或者向前走的方向。 虽然现在我们将画面和动态的内容都交代清楚了,回车生成的视频效果也表现尚可,但问题随之而来,由于缺乏原图像的一个约束, ai 会在人物长相、 行为多寡以及具体的年龄等未描述的细节上进行随机的填充。这些内容呢,它是不可控的,直接导致了我们生成的结果往往会偏离我们的预期。 因此,我们再次向大家强调,在实战的项目中呢,文声视频往往是效率较低的一种方案,为了追求更强的确定性呢,我们还应该优先选择图声视频的功能。 说到图声视频,我们下面来看一看图声视频都有哪些功能机制。大多数的视频生成平台这些功能机制都大同小异,所以我们就只讲极梦 ai 上的主要功能。那么大家在使用其他平台时,注意举一反三。 首先是最为基础的手帧图像生视频,这也是最常用的一个功能。这个功能呢,需要我们通过拖拽或者点击上传的方式将图片上传到手帧图的预备框中。在上传好之后,接下来就是输入题日词描述了。 不同于文声视频,图声视频本身上程的参考图就已经给了充足的画面信息,因此在图声视频时,我们就只需要描述画面当中物体的运动变化以及运镜即可。首先来描述运镜, 这里我们就描述固定镜头,水在流动,风吹起人物的头发和草地,像画面当中的水流和草被风吹起的效果,可以在写好提示词后直接点击生成即可。 生成视频时呢,会直接根据图片本身的宽高比来决定视频生成的宽高比,所以大多数时间就是上传图片,描述运境和事物的变化,就可以点击发送生成了。在等待视频生成的过程中,我们集中讲解一下关键的参数设置。首先是模型选择, 遵循 ai 领域的通用逻辑,版本标号越高的模型,其底层架构和语义理解能力就越强,生成的效果自然更加出色。所以我建议大家选择更高版本的模型,以确保作品的质感。 在即墨的生成方式中,提供了首尾真生成视频、智能多真生视频以及参考图生视频三个维度,而在宽高比上通常设为自动匹配,以确保素材比例的协调。 关于视频时长,目前在五秒和十秒两个档位,我们进行自由选择,这里我要给出一个非常关键的避坑建议, 在非必要的情况下,我们尽量不要直接去选择十秒的生成时长,因为视频的链路越长,模型对画面动态和物理结构的控制就越弱,出现变形和逻辑错误的概率就大幅增加。 至于运镜控制,吉梦内置了一系列标准化的运镜模板,这些模板的底层逻辑呢,与我们手动输入提示词是一样的。 如果你对镜头语言的专业描述还不够熟悉,直接调用模板是最稳妥的选择。当然,如果你已经掌握了精准的运镜描述词,直接在提示词框里边进行自定义书写,灵活性会更加的高。 现在视频已经生成好了,来一起看一看效果吧。可以看到整个视频的过程是动态效果非常不错的,水流动非常自然,风也是轻轻的吹动了,人物的头发,草也在轻轻的晃动。像这样的视频生成,每一次的效果都有一定的随机性, 如果当前的效果不够满意,可以根据当前的提示词和生成的效果对提示词的部分加以改进,或者适当的修改原图当中的某些内容。当。 当然,如果觉得全部都没有问题,都是因为随机性导致的生成效果不好,也可以直接点击下边的再次生成,这样的话呢,就不用再次编辑,直接可以重新获得一条新的视频。我们接下来来深入探讨首尾真生视频的功能, 这在精准控制视频走势上直观重要。刚才我们仅通过手真生成的视频,虽然画面起步很稳,但结尾处人物的表现,事物的变化轨迹本质上是随机的, 而首尾帧模式,它赋予了我们控制终点的能力。现在,我们将一张少年在秋天环境中打作的图片上传至尾帧窗口。 通过这种方式,我们预设了视频结束时的画面结构与环境状态。在提示词的构思上,我们维持固定镜头,并保持水在流动,风吹起发丝和草地。那为了强化季节更替的视觉冲击力,我们需要引入延时摄影的这一专业描述, 要求水流与草地快速地晃动。利用这种加速的动态逻辑,在短短几秒钟内呈现出从夏季向秋季过渡的时间流逝感。我们继续来看极梦 ai 上视频生成的下一个功能就是多帧生成。 点击这里的下拉菜单,将首尾帧生成修改为智能多帧,此时就会多出一个图片上传窗口。而我们要做的就是在第三个多帧上传窗口上再次追加一张图片,将其拖拽到这个位置。此时可以看到在图片与图片之间有一个间隔的位置。点击这个间隔的摄像机图标, 我们会弹出一个文本输入框,这个位置是用来描述图片与图片之间在运镜和事物变化上的描述。我们上传的第三张图片就是人物在冬季打作的画面, 因此提示词描述基本上和上一张季节上更替的描述保持不变,我们也可以将水快速流动这个选项进行删除,让 ai 自行来决定水该如何流动。接下来复制点击确定, 同样把上一段图片与图片之间的衔接提示词内容替换为当前的内容,点击确定 多帧生成功能。在图片上传时,它的上限不止三张,我们可以继续添加第四张、第五张图片,以此来生成一个连贯的、时长较长的视频画面,来表现更多更长的画面当中的实物变化动态。 我们下面来讲解一下其他的 ai 视频生成平台。首先来讲解一下关于可灵平台的使用方法。 来到可令 ai 的 首页,需要先说明的是,这些视频生成平台在使用操作和功能上基本上大同小异,在可令 ai 平台依然是在左侧的视频生成选项,可以看到 同样分为了文声视频和图声视频,具体的操作也和极梦 ai 上是一样的,所以我们就不做过多的演示了。这里我们还要说一个重点功能,就是多模态编辑功能, 这项功能能够对视频当中已经出现的事物进行替换,增加元素或者删除元素。我们就以替换元素为例, 这里先前我们已经生成了一条视频,看一下效果,这就是这条视频当中显示老人在喂狗的画面,其实原视频是展示老人在喂猫的画面,而参考图是一只小狗。 那么具体该如何操作能够把视频画面当中的猫替换成狗呢?我们下面来简单演示一下。首先需要将进行多模态编辑的视频通过拖拽或者点击上传的方式上传到这个位置, 在上传好之后,可令 ai 会分析视频当中都有什么事物。如果分析成功,会自动弹出一个窗口,在这个窗口中可以通过点击的方式选中想要进行替换的内容, 比如点击这只猫的部位,此时猫的身体就变成了绿色,当然此时的绿色范围只显示当前我们所见的画面帧的内容, 那其他的画面帧是否已经把猫给选中了呢?我们可以点击这里的预览完整选区选项,可以看到此时视频就开始自动播放,如果在播放的整个过程中,几乎猫的全部身体都被绿色覆盖,那么就说明整个视频的猫都将会被 完整的替换掉。确认无物之后,点击下方的确定选项,然后在下方我们需要上传一张去替换这只猫的事物,我们可以自己上传一张图片,也可以选择官方所提供的素材。 在上传好图片之后,同样会弹出一个窗口让我们选择。参考的是什么?参考的是长相,参考的是主体或者参考的是服装, 通常呢,我们用智能选择参考即可。点击这个确定最后提日词的部分描述,我们可以看到这里可零 ai 已经给出了书写的模板,我们直接填空就可以了。使用图片中的主体替换视频中的猫,这里是关于替换元素该如何使用的方法。 那至于增加元素,我们在上传一条视频后,点击这个视频的位置,并不会弹出窗口上让我们去设定哪个位置来增加元素,所以全凭提示词的描述。 在上传好主体参考之后,可以看到下方的题日词描述框已经打好了模板,告诉我们基于视频中的原始内容,以自然生动的方式将图片中的什么融入视频中的什么。这里这个框是用来描述你想要生成的具体位置,比如猫的旁边, 这样一来生成的视频就会在猫的旁边来加上我们所上传的这个事物造型。删除元素的话,和替换元素的操作方法类似,在上传视频之后呢,会自动弹出一个窗口,或者我们点击已经上传好的视频位置, 也会弹出视频窗口,通过选区的方式选中想要删除的元素,点击确定。而提日存呢,就描述删除视频当中的什么,这里当然也是写猫咪,那这样的话呢,生成新的视频,这个猫就会被删除掉了。 这就是关于可零 ai 视频生成当中的多模态编辑功能和具体该如何操作。不过具体的效果大家可以看到,清晰度上不如我们直接生成的这个视频。 但想要使用多模态编辑功能,我们只能使用可零一点六的模型,而可零最新的二点六模型中间差了很多个版本,所以是否使用这个功能就看大家的取舍了。 在更多的时候使用多模态编辑其实更适合去处理一些现实生活中的拍摄视频,而非 ai 生成的视频。 所以在处理 ai 视频生成时,与其在视频上进行处理,不如在源头,也就是在生成视频时所需要的图片上进行处理,要来的更加方便。 我们刚刚在可灵 ai 和吉梦 ai 的 演示中,或多或少都出现了画面质量不佳,或者生成的动态效果不好的情况,这也是我们此次要讲解多个平台的原因, 那就是每一个平台的视频生成模型都有各自的优劣,可能在生成某些场景时表现的好,但一旦遇到一些特定的场景,比如像极萌 ai 遇到流水的场景,就生成的不尽人意。所以下面我们来讲解一下关于 middle jerry 如何生成视频。 免圈里的官网网址我已经放在了下方置顶评论区了,有需要的小伙伴可以直接点击跳转即可。在登录完成之后,可以点击左侧的 create 选项,这里我们来到生成页面,在这个页面可以生成图片,也可以生成视频。 我们这节课主要是讲解视频的生成功能。点击左侧的图像加选项,这里可以看到上传手帧图片。在图片上传好之后,我们了解一下相关的参数设置。首先是最上方的提示词输入, 这里的描述方式和先前的其他平台生成完全一样,描述只需要两个方面,一是视频的运镜,另一个是画面当中的事物描述, 比如这里我们描述人物,戴上墨镜,在写好之后,记得将提示词翻译为英文,正常情况下直接上传手针,再加上提示词描述,就可以直接点击右侧的发送生成视频了。那么在生成的这段时间,我们再来详细讲解一下其他的相关功能。 可以看到上传首帧图片之后,右侧 ending from 是 上传尾帧图片的地方,它的使用方法和其他的视频生成平台一致,我们在这里就不重复的演示了, 但我们可以注意到下方有一个 loft 选项,我们将这个选项进行勾选,此时首帧图片和尾帧图片会自动视为同一张图片进行首尾帧的生成。在勾选上之后,我们会生成首尾相接的视频, 让我们的生成能够无限循环,手针和尾针之间能够丝滑的衔接。而最右侧的谋神选项 则是在设置视频生成的动态时,分别为低动态和高动态。选择低动态的话,视频当中的物品运动就会相对柔和,相对缓慢一些,而选择高动态的话,视频当中的事物变化会变得更加剧烈,更加迅速。 此外,在提示词输入框的右侧还有一个 sightings 选项,在打开这个选项之后,可以看到右下方还有进一步的参数设置。首先是视频生成的品质, 可以看到这里 s d 指的是标签模式,而 h d 指的是高清模式,对应的大约是幺零八零 p 的 分辨率。 而下方单次生成视频的数量可以看到,当前我们所生成的视频一次性会生成四条视频,而在这里设置区域,我们可以选择一次性生成一条或者两条视频。 在视频生成好之后呢,将鼠标悬停在生成好的部分,这一行就会自动播放。预览当前生成的视频,可以看到 mini 上面生成的视频整体的质量和人物的动态自然程度是相当不错的。 我们点击打开任意一条视频,打开之后,在右侧就会有相应的后续选项可以选择。我们 现在将页面进行汉化,来看一看这些后续选项都有哪些?首先是重新生成选项, 在点击之后就会基于当前提示词和手帧图片进行重新生成,然后是将下方的起始帧作为重新生成的参数,或者将提示词作为重新生成的参数,再往下还有自动状态下的低动态和高动态可选。可以看到这个位置上还有一项功能叫做扩展视频。 在点击这个功能之后呢, midari 会将我们生成的当前视频作为一项生成参数,我们可以配合着提日词来描述这项视频结束之后继续又会发生什么事情。 例如当前人物戴上墨镜之后,再让人物去吃个汉堡,或者让人物摘下墨镜来做其他的事情都是可以的。这项功能呢,不同于视频本身,配合提日词的描述来延长这个视频的内容。 当然我们也可以看到这个位置上追加了一个结束帧,来告诉 midori 延长后的视频人物最终是在做什么。所以虽然在操作上有所不同,但在机制上, midori 的 视频延长功能和极梦 ai 的 多帧生成功能在底层逻辑上是基本一样的, 只是在 midori 上会更加麻烦一些。首先需要生成一个视频,在这个视频的基础上加上尾帧图来延长视频。 以上呢,就是 mini 的 视频生成功能。具体操作总结一下,我们这期视频讲解了 ai 视频生成的平台选择、文声视频以及各个平台的图声视频功能该如何进行操作。大家日常使用的过程中通常会选择吉梦可灵就可以了, 而吉梦 ai 在 生成的性价比上也会更高一些,价格可能是可灵 ai 的 三分之一,同时生成的质量也并不比其他的平台差。 当然我们遇到极梦 ai 平台生成并不好的时候,那可以再考虑其他的平台,再看看能否生成令我们更加满意的效果,这也是我们一次性讲解多个平台操作的意义所在。 好了,以上就是本节课的全部内容,如果对你有所帮助,还请多多支持。三、连一下大家在实际操作中遇到任何问题,非常欢迎在评论区留言,我会尽可能的回复大家的问题,课程相关的 ai 资料也已经打包好放在这里评论区了,那我们就下期再见,拜拜! 大家好,我们这节课来讲解动态漫制作、美术设定、场景美术设定、时操思路概览、 角度切换和人物融合。我们首先来看剧情大纲提炼,在上一期视频中,我们同样进行了这个步骤,主要目的是提炼剧本当中出现的主要人物的有哪些,以及人物是否具备前期和后期的变化,产 生的服装设计上的变化。而我们这节课所进行的剧情大纲提炼,主要提炼的是剧本当中和场景相关的内容。比如这里我们所展示的核心场景二,顺天府前堂。在这个场景中出现的主要人物有灵验牙医 一大人,同时我们也成功的提取出了人物在场景当中的位置以及与场景的交互关系。例如像这里所描述的,林燕原本位于死牢,被衙役从牢中带出,将前往顺天府前堂,而交互动作则是衙役手持钥匙赶到死牢,极速传召林燕面见辅一林燕从被动关押转为主动复 将,在人前为师傅许愿。我们之所以要对剧情大纲做场景方面的提炼,自然是身为导演的我们要快速的获取在剧本当中都出现了哪些场景,以此方便做后续的场景美术设计,以及让人物出现在剧本当中所描述的场景当中的位置。那么像这样的提炼内容我们该如何获取呢? 自然是和人物类似,我们既可以通过 ai 大 语言模型让他帮我们进行提炼。例如来到豆包 ai 当中, 先将剧本上传给豆包 ai, 在 上传好之后,提示词我们就要求整理一下这个小说中出现的主要场景, 并说明该场景下出现的人物与人物与场景间的位置关系和交互关系。现在点击发送可以看到,一段时间后,我们就获取了符合提示词要求的结果。这里一共整理出了三个在小说当中出现的场景,分别是死牢验尸房和顺天府库房。 同时在每一个部分也分别交代了出场人物和环境之间的位置关系,以及出场人物和环境之间的交互关系。有了如此详细的描述,我们下一步就可以开始对场景进行美术设计了。在大多数情况下,这样的美术设计其实并不是十分困难。例如像死牢验尸房并不需要我们具备十分丰富的想象能力 和美术设计能力,这些都是在影视剧中非常常见的场景。所以我们在进行场景设定时,可以看到像在设计牢房时, 牢房的外景、牢房的室内景象以及牢房的内部都并没有特别精巧,需要美术功底的设计,所以这些我们在生成时就直接使用纹身图功能,如实的交代我们要生成的内容即可。但在小说当中还涉及到了顺天府的设计,可以看到在下方顺天府的设计会相对复杂一些,包括了高低错落的中式建筑, 同时还要具备一定的布局设计。像这些内容,我们想要直接通过文字描述来生成对应的结果可能随机性就会比较大了。所以这里我们可以继续借助豆包 ai, 让它帮我们生成。对于顺天府的提 词描述,这里我们就这样要求写一段提示词用于生成。小说中出现的顺天府建筑特色、历史背景、美术风格等都要贴合小说设定。现在点击发送可以看到,一段时间后,我们就获取了非常详细的和顺天府相关的提示词描述。这样的描述非常细致,但我们在生成时很有可能在一张图片当中无法体现这么细致的描。 所以进一步的我们可以让 ai 工具帮助我们对这些提示词做不同区域、不同景别的区分。由这里我们进一步提出要求,提示词尽量简洁,要求分别生成顺天府全景大门、室内别院、后门的提示词描述。现在点击发送可以看到一段时间后,不同部位的提示词描述就都生成好了。 而我们需要做的事情就是将这些提示词复制下来,然后来到图片生成平台当中将提示词粘贴。同时身为导演,我们有必要对这些提示词进行修改和补 充,使其能够生成我们需要的画面。例如这里我们需要增加一个描述,像风格方面我们增加的是二次元漫画风格,景别方面我们要增加全景这样的描述,而视角方面我们就增加正面俯拍视角,同时我们使用的是 agent 模式,所以这里需要额外提一下生成的比例, 这里我们就要求比例十六比九。现在回车发送可以看到一段时间后,符合提示词要求的图片就生成好了,整体的生成效果还是不错的,在视角上满足了正面俯拍视角。同时像我们所要求的会出现的前堂后牙、 住房死牢、电视屏院这些区域也都进行了详细的标注,不过这样的生成会伴随着一定的随机性。同时在配色方面我们也可以做进一步的要求。这里既然我们使用了 a g 的 模式,想要多获取几个配色和生成方案其实并不是一件难事,所以我们可以进一步的向 a g 的 模式提出要求,多 来几个不同的配色方案和天气情况尽量以晴天为主,建筑更加错落有致一些。可以看到片刻之后,修改好之后的方案就生成好了,分别提供了四种不同的配色方案,同时也将天气改为了更加晴朗的晴天。我们下面再来讲解一下场景多角度切换的方法。在上一节课中,我们讲述了如何生成人物的三式图。 同样的,在制作动态慢时,人物会在场景当中不断的运动,但我们依然需要尽可能的保持人物在运动之后背景的一 质性和理性。所以这里我们要学习如何制作场景的多角度切换,一共有这么几种方法。首先第一种方法是使用多角度切换的工作流,我们这里是使用的 running hub 上面一个名称为多角度切换的工作流,顾名思义,它的作用就是上传一张图片,然后根据提示词的描述,参考图片的美术风格,场景设计、 空间设定,对参考图当中的场景来转换角度。例如这里作者已经给出了一个视例,上传的参考图就是顺天辅正面辅拍视脚下的一个画面。在上传好这张参考图之后,我们需要在右下方的位置来书写对应的提示词描述,例如这里书写的提示词描述是将镜头转为俯视左侧视图 可以看到最终生成的效果,转换的还是非常不错的,在保留了场景的美术风格以及画面当中各个事物的布局的前提下,成功的转换了风格。尤其是在院落当中有两颗 红色的枫树,在转换角度之后,它们的位置、样式和颜色都与参考图当中这两颗红色的枫树保持了高度的一致。具体这个工作流的网址链接我已经放在本页 ppt 上面了,大家也可以查看评论区的置顶来获取。 除了用工作流来生成不同角度的图片之外,另一类方法我们可以通过视频生成的方式来获取不同角度的场景。例如使用维度的主体库来生成多个不同的场景角度后,利用主体库让场景旋转来获得更多的角度。或者使用 nano banana 旋转场景的功能来获取多个视脚下的场景,那么了解了如何获取不同视脚下的场景,我们下面来进行最后一步,就是如何让场景与人物融合。这里的方法就有很多了,例如像一些简单的场景,常规的动作 可以直接以参考图生图的方式来生成对应的内容。来到极梦 ai 的 生成页面,我们就以上节课生成的这个人物为例,将其拖拽到生成预备窗口中,使用 ag 的 模式,而提示词我们就输入生成这个人物坐在牢房地上的情形。二次元国产漫画风格要包含牢房的铁窗户、铁栏杆,人物要光着脚。现在点 击发送可以看到一段时间后,符合提示词要求的图片就生成好了。在生成结果当中,人物的造型也和我们上传的参考图保持了高度的统一, 也符合了提示词中我们要求的铁栏杆、铁窗户这样的描述。一共生成了四个角度,可以说每个角度生成的效果都是相当不错的。除了使用参考图生图来直接生成相应的场景和人物之外,如果说我们有不错的参考图,也可以使用参考图让图中的人物被我们所设定的人物所替换。例如我们就以这张图片当中的人物为例,这 同样是一个牢房当中的场景,在上传好这张参考图之后,我们再次将人物设定的参考图进行上传,而提示词方面,我们就要求把图一场景中的人物换成图二,保持图一中的场景和姿势,只替换人物形象比例十六 b 九,现在点击发送可以看到一段时间后,我们就成功的将画面当中的人物造型进行了替换,且保持了视角和 场景设计的一致性。当然在很多时候,我们生成的结果可能百分之八十,百分之九十是满意的,只有一些细小的部分还需要后期的调整,或者在人物的比例上也可能会出现大小方面的问题。在这种时候我们就放在 ps 中先去手动调整,然后再通过图生图的方式来提升画面当中 在 ps 调整后所遗留的不够融合不够合理的部分即可。那么以上就是本期视频的全部内容,如果觉得对你有帮助,也不妨点赞、关注、支持一下,我们就下期视频再见!

超酷炫的 ai 漫剧制作秘籍,新手必坑轻松做! 首先输入这段提示词,得到手帧图,这是我生成视频的图片,下面是生成视频的提示词,首尾帧和提示词填好之后,点击左下角创作,接着让我们看一下效果, 记得点赞关注哦!

逼自己十天学会 ai 制作视频动画,你会发现你真的很牛逼,纯干货,不废话,存下吧,真的很难找全了。除此之外,在本系列视频中用到的 ai 工具、提示词、速查脚本、参考工作流, 还有目前 ai 视频的热门玩法,我都会整理起来放在置顶作品,有需要的伙伴可以一步获取。各位同学大家好,欢迎来到今天的线上课程。本节课我们聚焦 ai 拍摄脚本的核心技巧,无论是短视频、宣传片还是自媒体内容等等。好的拍摄脚本是成片的关键, 而 ai 能帮我们大幅提升脚本创作效率,优化内容质感。接下来的时间,我们就一步步掌握 ai 拍摄脚本的核心方法,让创作更轻松,明确目标,才能高效学习。同学们,本节课我们要重点掌握这三个内容。第一, 掌握拍摄脚本的核心框架,知道一个完整脚本该包含哪些关键模块,避免遗漏核心要素。 第二,学会运用 ai 工具生成优化拍摄脚本,熟悉 ai 提示词的设计技巧,让 ai 精准匹配我们的创作需求。 第三,能将 ai 生成的脚本结合实际场景调整适配不同内容类型,比如说短视频啊、宣传片啊这种拍摄需求。 这三点掌握了,大家就能独立用 ai 完成基础拍摄脚本创作了。首先,我们先理清楚拍摄脚本的核心框架,这是基础吗? ai 生成的内容也需要基于这个框架优化,不然很容易杂乱无章。 一个完整的基础拍摄脚本包含五大模块,场景设定、镜头描述、时长、画面内容、台词或者是旁白。嘿,境界版,它还可以加上音效、景别备注, 场景设定,明确拍摄地点和氛围。镜头描述说明,镜头运动,什么推拉摇移等等,是吧?时长控制,单镜头节奏,画面内容是核心, 像台词旁白,服务于主题表达。比如我要拍一条美食短视频,场景设定为居家厨房,镜头描述,近景推特写时长三秒。画面内容呢?手捏起饺子,放入沸水旁白,冬至的一碗饺子,从手工揉捏开始,是不是 框架清理后,就轮到我们 ai 登场啦?提示词是 ai 创作的关键,要精准具体,避免模糊表述。 核心公式大家看,内容主题加目标受众加脚本类型加框架要求加风格氛围。比如我们要生成一条居家咖啡制作的短视频脚本,提示词就不能只写生成咖啡脚本,要优化为 生成一份居家咖啡制作短视频脚本,目标受重视,年轻上班族,风格温馨治愈。包含场景设定,镜头描述,时长、画面内容旁白,五大模块。 镜头以近景特写为主,突出啊咖啡香气和制作细节表,旁白简洁,有氛围感。 ok, 接下来我们就来按照刚才的设定,实操演示一下。以常用的 ai 工具,比如说豆包啊, check gpt 为例啊,这边我们就用豆包打开 ai 工具,输入刚才优化后的提示词,等待 ai 生成出稿。 大家看, ai 很 快就生成了包含五大模块的脚本对不对?但是这里有几个需要调整的地方。 第一,剔除容与内容。就是说有些分镜,或者说有一些镜头是我们不需要的,因为 ai 啊,我们前几前几节课也讲到了, ai 只是辅助我们的工具,主要的内容还是靠我们人类去完善它的 对不对?这里就是需要剔除我们不需要的地方,因人而异,看大家自己的选择。 有的时候 ai 可能会生成重复镜头,比如说连续两个特写的咖啡镜头啊,是不是?或者说连续两个重复的场景镜头啊, 我们可以把它们合并为一个精简时长。第二,贴合实际拍摄条件。 ai 可能会设计航拍、咖啡制作这类不切实际的镜头,要替换为大家平时可实现的近景、中景。 这边就是换做我们后续如果要 ai 去制作短视频的话,同理也是一样的,因为有一些镜头我们可能用 ai 做不出这样的效果,那么我们就要去完善它,修改它。 第三,调化风格统一性。若 ai 生成的旁白偏正视,或者说不是我们想要的,这种感觉,我们可以让 ai 再优化为,比如给它加一个温馨口语化呀,或者说适配上班族晨间的场景啊,这种对不对?加以一些修饰或者说修改? 最后给大家补充一个小技巧啊,如果是宣传片脚本,要增加音效备注和画面色调模块儿 提示词,可加上企业宣传片风格色调沉稳大气,音效呢,搭配恢弘背景音乐。如果是巨型类的脚本,要补充人物动作、表情描述等等,让镜头更有画面感。 大家可以根据自己的具体创作要求,灵活调整 ai 提示词和脚本框架。 好,今天我们这节课的干货部分就讲到这里,现在老师带大家快速回顾一下本节课的核心知识点。 第一,记住拍摄脚本五大基础模块啊,场景、镜头、时长、画面、台词以及旁白,这是脚本的骨架。 第二,掌握 ai 提示词公式,内容加受众、加类型加框架加风格,精准提示词才能生成高质量的脚本。 第三, ai 脚本优化要兼顾精简性、实操性和风格统一性,剔除不需要的或者说没用的内容,贴合实际拍摄,或者说贴合我们后续 ai 实际的创作环节。 第四,根据不同场景,短视频啊,宣传片啊,剧情片这种调整脚本模块,适配创作需求这四个要点结合起来,就能高效用 ai 完成拍摄脚本创作了。 最后啊,依然是给大家布置一个课后作业,大家根据自己的时间来进行安排作业内容就是选择一个你感兴趣的主题,比如美食制作、宠物日常产品介绍,或者说你的一天等等等等。 运用本节课学到的技巧,设计 ai 提示词,生成一份一到两分钟的短视频拍摄脚本,然后根据优化要点调整出最终版脚本。大家可以把优化前后的脚本就是多去对比一下,感受一下 ai 的 辅助作用和手动调整的重要性。 完成之后呢,也可以和其他同学进行交流。好,本节课内容就全部结束了,希望大家能把学到的技巧运用到实际创作中,用 ai 让拍摄或者是创作更高效。好,我们下节课再见!

欢迎来到 ai 漫剧制作全流程教学的第一集,很多新手想做漫剧,却卡在不知道从哪里下手,而工具太多选不清的问题上。 这一集呢,我们就帮助大家理清思路,作为整个课程的导航图,核心是让大家明白 ai 漫剧的创作逻辑,知道每个环节该用什么样的工具,快速建立起从零到一的创作框架。 接下来我们就从核心逻辑和工具选型两个关键的维度来帮助大家入门。首先我们要明确,漫剧创作的核心是故事、视觉、声音三大要素的协调, 而 ai 工具的作用就是帮我们降低这三大要素的制作门槛,不管是短漫还是长漫,都离不开现有故事框架啊,图像、动态镜头等等。 最后呢,加声音包装,也就是我们的配音和配乐的基础流程,这也是我们后续课程的核心递进逻辑,新手不用急于求成,我们跟着这个流程走呢,就能少走弯路。 ai 不是 万能的,但是呢,能够精准的解决新手的痛点。主要覆盖在四个关键的环节。 一、创意辅助,用大语言模型生成角色脚本。我们平时用的豆包, deepsea, gemini 啊, gpt 等等这些东西呢,都属于大语言模型,都属于在创意辅助的范畴内。二、视觉创作, 这也是我们用的最多的地方,用图像视频生成工具来制作动态场景纹身图,图身视频呢,就属于这个环节。三、音频制作,用 ai 进行配音来生成音乐音效。四、后期优化, 用剪辑工具的 ai 功能来调整,进行后期方面的制作。简单来说呢, ai 能够帮助我们把创意快速的落地成成品的素材。以往呢,我们需要整个专业团队来协同完成的工作,现在只需要个人使用 ai 就 能完成大部分的工作。闭环 工具呢,不用选太多,一套核心组合就能满足新手的大部分需求。下面我就按照制作环节来分类,给大家推荐相关的工具。明确选型逻辑。创意辅助环节推荐豆包、 deepsea、 gemini、 gpt 等大语言模型。 视觉制作环节推荐豆包、即梦、可林、海螺、 vj 等图像动态生成工具。 音频制作环节推荐使用剪映、苏诺、爱给网等来完成配音和配乐。后期剪辑环节则推荐剪映,功能齐全,新手必选。 综合下来,新手只要掌握好豆包、即梦、剪映这三者的应用结合,就能满足大部分的创作需要。我们的课程也将以这三种工具为主。 下一集呢,我们就从 ai 大 模型的精准指令设计来开始,带领大家完成剧本以及分镜脚本的创作。如果对你有所帮助的话,请多多三连支持一下 本套课程所用到的 ai 脚本提示词运进关键词库,还有所有的免费 ai 工具软件 我都整理放在了置顶评论,我们下节课再见!哈喽,大家好,上一集我们确定了 ai 漫剧制作的核心工具,其中大语言模型就像大脑,能够辅助我们生成剧本角色的内容。但很多同学用 ai 时会遇到答非所问、 输出杂乱的问题,核心问题是还没有掌握指令的精髓。这集我们就聚焦于如何设计精准的指令来带领大家完成剧本以及分镜脚本的创作。 所有在教学过程中用到的指令呢,我都已经给大家整理完毕,如果有需要的小伙伴呢,记得在评论区置顶领取。 我们在给 ai 设计指令的时候呢,要遵循两个技巧,三个原则。首先,我们要给 ai 定身份。什么叫给 ai 定身份呢?就是给他一个指定的身份,明确 ai 的 角色,让他站在对应专业的视角来输出内容。 比如说你是一名资深的系统流修真慢剧脚本编剧,擅长创作升级、刘爽剧剧本的创作,你是剧本创作指导,能够精准的、深沉、符合制作需求的剧本框架。这两种身份都有异曲同工之妙,都和创作剧本脚本有关。 但是如果你拿这两种不同的身份去分别给 ai 来设计指令,那么你得到的这个回答也一定是有不同的。 我们的身份越具体呢, ai 的 输出就越贴合专业的需求。第二点,给输出定结构,定框架。我们要提前规定 ai 的 输出格式和逻辑,避免内容的杂乱。比如说一个完整的脚本, 它需要什么样的东西,需要什么样内容,是不是需要人物角色的设定,镜头运动,对话的设计,还有时间等等等等。 它的输出格式是按照表格还是按照台本格式来输出呢?这些框架越清晰,后续我们使用起来就会越省心。这就是这两个技巧。 三个原则就是遵照清晰、具体、场景化。这三原则简单来说就是指令表达要避免模糊表达,要补充足够多的细节,并且明确应用的场景。接下来我们来看具体的操作过程, 这里呢选择豆包作为演示,我们首先给他输入一个身份,按照我们刚刚讲过的,你是一名资深的系统流修真慢剧脚本编剧, 再确定一个主题,擅长创作升级流爽剧剧本。到这里呢,我们就可以给到他一些关键词, 比如说你的这个剧本呢,它的主题是什么?是都市修真呢?还是灵气复苏呢?等等等等,这是不同的关键词,让它根据关键词给出剧本,没有灵感的话,我们就可以让 ai 给我们提供灵感,然后我们再进行选择。 所以我这里还加上一个,请让他给出我三版不同的剧本,以供我为慢剧制作进行挑选。我们先来看看 ai 给的这三版剧本, 第一版是废柴逆袭签到神尊系统,哎呦,非常典型的逆袭打脸类剧情,主角金手指是签到系统,在不同的地点签到会得到不同的奖励,越危险的地方奖励越好, 可以是不会出错的,能吸引人的设定。第二版叫跨界重生,都市大佬的修真系统,这个是重生类型的主角,前世还是个商业巨恶,都市修真流系统是辅助。再看一下这个第三版,是神魔阵营的设定, 金手指是吞食就能变强行。经常看小说慢剧的同学对这些设定可谓是非常眼熟啊, ai 还是很懂大数据的,我们就用它给的设定。另外, ai 甚至已经帮我们创作好了前三场的开篇剧情, 我们粗略扫一眼,没什么问题就可以进行选择了。为了方便演示,我这里直接选择第一个剧本,废柴逆袭虽然老套,但好用啊,那现在我们就要根据这个剧本的片段来进入漫剧创作的核心环节,脚本的创作 在创作之前呢,我们先来明确一下剧本与脚本它究竟有什么样的区别?首先我们要知道剧本它是我们漫剧的整体的核心脉络,整个故事的情节,故事的发展冲突、高潮部分都在其中, 能够帮助导演把控剧情的大方向,如果有需要修改的地方,也能很快的及时的进行修改。 那脚本是干嘛的呢?脚本能够让创作者具体的执行任务,明确我们要做什么,有很多信息,其中包括了分镜的编号、画面的结构、镜头的类型、时常音效、配乐等等等等。像我们用 ai 去制作 ai 动态漫的话,里面还要包含 ai 生成的提示词, 没有剧本我们就无法把控故事的方向,没有脚本创作就如同空中楼阁,缺少具体的执行方法。同学们千万要记住别偷懒,一定要先写剧本,再根据剧本来拆解脚本。 如果先写脚本,再不剧本的话,就很容易会出现故事逻辑混乱的问题。好,那么明确了这点以后呢,我们就可以继续之前跟豆包的对话。我已经选定了第一版作为我的创作剧本,接下来就要开始用 ai 来高效生成脚本了, 还记得怎样来设计指令吗?首先要给 ai 定身份,你是一名资深的漫剧脚本师,擅长将剧本片段转化为规范的表格式脚本,然后定框架生成表格式脚本,表格列包括镜号、场景、人物、动作、对话、音效。 接着我们还要给 ai 明确基本的核心信息是基于第一版的剧本生成表格式脚本,那么这样呢,我们就可以得到一份以我们第一版的这个三篇的开篇剧情为主要内容的表格式脚本。 可以看一下镜号、场景、人物、动作、对话和音效,基本上都在这里了,我们简单过一遍,看看 ai 给我们生成的内容,那么到这里就结束了吗?当然不是,我们还要将脚本进行可量化的转化来进行分镜的设计。 不过今天我们就不做传统的分镜草图了,而是直接二合一,将分镜设计加上分镜画面的 ai 提示词一起来解决,这样能够将后续的图像创作更加精准,更加高效地直接衔接到我们 ai 图像生成工作中。 首先我们要明确到两个关键的知识点,一是分镜的核心逻辑,二是分镜提示词的必备要素。首先来看分镜的核心逻辑,分镜是镜头的排列组合,核心作用是把脚本的文字内容拆解成一个一个的连续的画面,让顺序更加的清晰。 这里呢主要掌握三个基础术语,第一个是景别,比如说全景、中景、近景、特写,它决定了画面的范围。第二个是镜头的运动,比如说固定镜头、推镜头、拉镜头、摇镜头等等,这决定了画面的动态。 第三个是构图,比如说居中构图、对角线构图、框架式构图,这里决定了画面的美感。这三个术语呢,就是分镜设计的基础。好了解了分镜的核心逻辑以后,我们现在再了解一下分镜画面提示词生成的一些核心要素, 因为我们除了分镜要进行设计,我们还要把它转化成可供我们 ai 工具直接生成的提示词。 那这里我们还要再加上什么东西呢?我们还要加上光影、色彩这些细节,那总结起来就是一个完整的分镜头脚本,至少包含了时间轴、镜号、景别、镜头运动、场景、人物动作、音效对白等等等等的要素。 我们掌握完这些逻辑和要素以后呢,接下来就是实操部分,回到豆包继续在对话框进行对话,还是这个格式,首先定身份,你是一名资深的漫剧分镜师,擅长将故事脚本进行细致拆分,并转化为分镜脚本。然后给框架生成 包括镜号、时间轴、景别、镜头运动、人物动作对白、音效、画面生成提示词的分镜头脚本。 接着给出信息,基于之前已经生成好的脚本来生成。 ok, 我 们现在把它点开来看,这样一个分镜头脚本就已经输出完毕了,我们来看一下这个效果。首先是时间轴 这里看啊,基本上一到二秒就为一个镜号。然后景别呢也非常的细致的给我们拆分了这个镜头运动呢,也在这里写明,固定、跟拍,横摇推进等等等等等等。 看到这边人物动作对白、音效,最后是最关键的画面生成提示词。如果觉得还是拆分的不够细节的小伙伴,还可以像我一样直接在对话框使用自然语言进行修改或者补充你需要的要素。到这里创意辅助的环节就讲解完毕了, 下一集我们将利用这些提示词和这些基本的信息来生成我们人物角色和场景。 觉得这个视频对你有帮助的话,记得点点关注点点赞,我们下节课再见!哈喽,大家好,前面我们已经完成了剧本以及分镜脚本的创作,接下来就进入到视觉创作的环节, 课程里所用到的提示词,运镜的关键词库,还有所有免费的 ai 工具软件,我都整理放在了置顶。评论 记得点赞,评论收藏加上关注来领取。在生成分镜画面之前,还需要有一些准备的工作,我们需要设计故事当中各种事物的形象,具体就是我们要设定我们的主角、配角的外形、人物背景、 服装以及行为模式。除此之外呢,我们还要确定统一的画面风格。 以上两者的最终目的都是为了保证整部漫剧的角色风格、场景的前后一致。这是我们上一期已经深沉好的分镜头脚本。我们来看表格列中的人物这一列 人物,这一列中它包含有每个分镜出场的人物,我们可以根据这个来作为参考,设计出场的人物形象。目前出场的人物有主角林峰、反派赵虎,还有一位长老。 图省事的同学们可以直接让我们的 ai 来帮我们设计角色的形象,给出能够用于生图的文字描述。比如说这里他生成设定好的,就分别给出了每个人物角色的基础设定和详细的纹身图描述。 主角凌风设定成了十六岁的少年,对五官、发型、体型、服装饰品也同样进行了描述。 赵虎设定的是十八岁的皮肤黢黑的魁梧大壮汉,武器是一把厚重铁刀,神情嚣张。 ai 还帮我们把长老和围观群众的设定也做好了,不需要额外的提醒, 那如果说对角色没有特定的需求,就可以直接要求他根据这份设定来生成角色的全身正面造型。当然还要说明一下图片的比例是什么样子的,他的风格是什么样的。 我们来看一下给林峰生成好的设定是一个穿着青涩的门派弟子服的短发小少年,右手还举着青涩的长剑,如果觉得生成效果不尽人意的话,可以让他重新生成。 怎么重新生成呢?也挺简单,我们把鼠标悬停在刚刚生成的这个图片上面,会出现两个选项, 左边的选项就是再次生成。那假如说如果是对角色的形象我不太满意,比如我觉得这种古代背景的修仙剧情,主角应该是长头发的,就可以直接在对话框输入修改他的发型就可以了。 我们还能改成束发,改成半扎,想改发色也可以,都是用自然语言就可以修改。 再来看一下前期准备的第二点,对故事画面的美术风格进行设计。我们要知道一部完整的作品,基本上都能够对美术风格保持前后的一致性。 我们不能说一会是写实真人风格,一会就是三 d 风格,一会又成了漫画风格,所以我们也要预先对美术风格进行固定。这里同样要通过提示词来进行描述, 比如说我刚刚在深沉角色形象时,我们要求的是什么?我们要求的是国风动漫风格,那他深沉的角色就不会像写实人物那样有写实的比例和美术风格。 当然我们还可以尝试其他现有的风格,比如二次原理,也有吉普利风格、星海城动画风格,还有一些卡通漫画风格, 三 d 里有三 d 国漫风格,当然也有皮克斯卡通风格,这些风格都有对应的特定的标签库, 输入相关的指令, ai 就 能很轻易地去理解去生成。那么问题来了,如果我们喜欢一张图片中的美术风格,但又不知道如何用提示词进行描述,它又不是现有的风格标签中的一种, 我们该如何获得提示词呢?我们该如何去生成相应的图片呢?其实方法也不难,甚至可以说很简单, 比如说我喜欢这张图片的美术风格,我可以直接把它上传给 ai, 让他帮我理解这种美术风格,并且参照这种风格帮我生成图片。 那么我就得到了这种美术风格的凌风的人物的设定图,我们用同样的方法去让他帮忙生成其他角色的人设图,我也就很好的得到了赵虎和长老的基于这种美术风格的人设图片, 他的这个效果和我们需要的美术风格保持的都相当的一致,效果非常好。我再教给大家一个比较有用的技巧,就是如果大家不想每次都要说明要参考这个图片的美术风格,就可以直接在对话框里面进行要求, 让接下来所有的图片都按照这种特定的美术风格来生成。这样之后再想要生成同样风格的图片,就不需要再进行额外的说明了,直接输入提示词即可。 到这里为止,前期的这两个准备工作就完成了,后续我们将开始对照脚本来生成分镜画面, 感兴趣的小伙伴不妨点赞、关注、支持一波,我们下期再见!哈喽,大家好,这节课我将带领大家根据脚本来生成对应的分镜头。一个完整的纹身图画面提示词,它应该具备哪些要素呢? 首先是景别,景别又包括了近景、中景、远景等等,这些都是景别。 接着是镜头角度,比如是俯视还是平视、仰视等等,还有构图,居中构图、对角线构图、框架式构图等等。画面主体包括画面中所包含的人物、事物,还有所处的环境 光影。光影有被细分为时间、背景、光源、光照方向,它们共同构成了更有立体感、层次感、更具带入感的视觉效果。 最后是色彩方案,一般对色彩方面有要求的话,需要确定主色调与对比色,还要考虑选择什么样的情绪色,看起来是不是非常复杂, 但我们结合一下分镜表来学习,就会发现其实这就是一个等待我们填入信息的提示词公式。好,我们来看一下第一个分镜, 我已经把这个表格整理出来了。第一个分镜是主角林峰与赵虎在演舞台的一个场景。首先看一下给出的推荐景别是中景,这证明人物虽然是重心,但也要考虑到和整体环境的呼应。那画面中的主体有哪些呢? 我们直接看人物信息里的这一栏,人物有林峰、赵虎围了个半圈的围观弟子,环境是在演舞台。再来看镜头角度和构图,有同学说,老师咋办, 这个表里面看不出镜头角度和构图啊?好问题,我们得把动作细节和 ai 生成提示词结合着来看看这里前景,赵虎 什么意思?就是赵虎的空间位置是最靠近镜头的林峰呢?林峰站在对面,他们是一个对峙的状态,你别管他特地描述什么赵虎眼神不屑, 这都是虚的。我们有一点基础的同学到这里应该就能发现,这个分镜的设计里面就不可能看得到赵虎的正脸。假设这是一张图,赵虎只可能在下半区,也许是这一块,也许是这一块,他不可能跑到左上角和右上角去。为什么? 因为他处于前景,靠我们是最近的,不可能离我们这么远,那我们都知道他只可能靠下,不可能靠上了。处于他对面的凌风在哪,是不是一目了然? 这两人明显面对面准备干架,我们看得到林峰的正面神态,那必然赵虎是背对我们的,那有没有赵虎正对镜头的可能呢?想想刚刚我们分析的,赵虎正面对着镜头,他又是前景,林峰去哪了? 林峰去他正对着的画面外了,坏了,我们成主角了。这么分析是不是挺有意思?那我们再加上围了一个半圈的围观弟子,这个画面的构图直接就清晰的浮现在脑海了。前景是赵虎背对着我们,中景是林峰面色紧张站在他对面, 林峰背后是围了一圈的弟子们,一目了然。这是个三分构图啊,构图都出来了,那么视角还难填写吗?所以同学们,作为创作者,作为导演, 在拿到剧本脚本以后,最好能在脑海中像我刚刚引导的那样,先分析预演一遍,对已有的信息作出取舍,凝练我们需要的,我们预演过没问题以后再进行深沉。现在我们来实操演示一下。 打开豆包,找到我们之前生成剧本脚本人设图的对话,直接填入生成信息,紧别中紧镜头,角度正对镜头平视。构图是三分法, 赵虎在前景背对着凌风对峙于中线,围观弟子围成半圈,接着描述角色的动作和神态,这里直接照搬就行。好场景细节表格里也有的。接着是光影,正五光高对比 强烈阴影,最后标注一下生成比例是十六比九,很快就生成好了,大家看一下是不是我们预想的画面,不是的话我们在这个提示词的基础上进行微调就行。 如果是对图片中的某些细节不满,我们可以点开图片的大图,这个页面的上方有一行工具栏,比如我不想要照虎屁股后头这个地址牌,就可以找到擦除这个选项, 涂抹一下弟子牌的位置,然后点击下方这个擦除所选区域,就能得到我们想要的图片。 对图片的其他地方不满意的,也可以通过这行工具栏进行修改。有同学问,那老师我不想要豆包自带的这个画风,我用了你之前教的方法,找了自己喜欢的美术风格,生成了人设图。 那这样我们怎么升图呢?同样是把这段提示词发给你的大语言模型,不过我们还多了两个步骤,第一个就是把这张图中所涉及到的人物的人设图上传。第二个就是我们要说明参考图的身份,图一是林峰,图二是赵虎, 我要求他根据我上传的参考图来生成符合这些信息的图片,那这样呢,也能够生成我们需要的画面。那讲到这里呢,分镜头生成的要点我们就已经讲的差不多了, 有想进一步学习的同学可以点点赞,点点关注,在评论区置顶就可以领取到分镜头相关的提示词库,我们下节课再见。

欢迎收看最新录制的 ai 视频制作系统课程, 你是不是也想做爆款视频,却被角色不统一、风格混乱、镜头不流畅等问题劝退呢?其实用 ai 从零到一打造这种 ai 短片比你想象中要简单太多。 曾经让创作者头疼的核心难题,现在我们的 ai 呢,都能给出一个完美的解决方案。今天我就把全套的制作流程毫无保留的分享给你。 从脚本拷写、图片生成、视频生成,再到配音配乐、后期剪辑,全环节细致教学,教你如何轻松的产出高品质的 ai 视频。那么福利至上, 课程中用到的所有资料亲测好用的 ai 工具合集,那么都已经打包好了,放在评论区里面,大家有需要的小伙伴们直接自取就可以了。上官今天状态不错,给他们吃个零蛋,哼,全靠我这双篮球鞋! 这双鞋线条是不错,我也蛮喜欢的,哼,尤其是鞋面涂鸦的部分。 喂,你没长眼睛啊,这鞋已经过时了,找个垃圾桶扔了吧, 我给你三秒钟的时间向我的鞋道歉。如何用 ai 制作一部电影?其实非常简单,一部完整的电影至少包含视频、台词、配音、配乐这些,全部能用 ai 轻松搞定。而这里面最难用的就是用 ai 做出符合故事情节的视频,以及保持角色的一致性。今天全是技巧, 今天全是技巧,手把手教你一条龙搞定!讲故事、生人物、配音翻译,创建 ai 电影视频,那我们现在就正式开始。我这边做了一个流程图,大概分为七个部分,故事脚本、 ai 图片生成、视频的生成、 配音配乐、视频的剪辑,放大视频字幕。首先第一个就是故事的脚本,我一共把它们分成了几个模块,第一个可以跟客户沟通,第二个可以自己去设定,那么我们有了这样一个想法之后就可以去生成剧本, 我们可以借助大语言模型来去生成,这里给大家推荐就是 deeppeak 和豆包文心一言都是我们国内的,这里有一个经典的给我的鞋道歉的名场面大概就是这样一个剧情, 剧情确定是核心前置环节,这是不可以省略的,提前确定剧情才可以保障后续分镜设计图像生成环节的连贯性。那我们来到第一步就是故事脚本制作,具体操作有两步。第一部分就是故事脚本制作,具体操作有两步, 实操性较强,新手可以直接参照执行。第一步,素材获取与对话提取,先下载选定的经典影视片段,在提取片段中人物对话。第二步, 补充语气与动作,标注剧情确定。核心逻辑是将视频片段拆解为 ai, 可识别后续可直接附用的清晰文档,明确场景人物对话等等。后面需要先熟悉剧情文档中的场景人物等,再进入下一环节, 利用该文档通过 ai 生成专业分镜脚本。这个剧情一一定是要提前确定好的,剧情的话,可以选择自己下载电视剧,然后反复观看,自己把剧情写下来,或是让 ai 生成一份剧情给你,但是电视剧还原的话,就是自己把剧情写下来会更好一点,然后再大圆模型生成脚本, 模型很快就会生成一个脚本给你,里面会分好镜头,写清楚场景画面和旁白,内容还挺全的,不过大家别直接用,一定要根据自己的想法再改一改, 优化一下细节。因为我们做的是电视剧还原,所以我们可以把影视片段的原素材打开,截取一下每个镜头的首尾帧,然后我们就可以把这些素材拿去生成 ai 漫剧的图片了。 第二部分, ai 图片生成选平台,了解提示结构,确定风格生成跟进图片,核心是保证图片质量好,而且角色的场景前后一致。我给大家推荐三个常用的图片生成平台,各有缺点,大家根据自己的情况选。吉梦这个是我经常用的, 综合了其他平台的优点,生成的图片好看,角色一致性控制好,操作还简单,性价比也高,新手优先选这个 sd 的 话可控性特别强,还能装在自己电脑上使用,适合对细节要求高, 想自己掌控更多的朋友。使用 m j 的 话,国外的平台生成的图片质量确实高,但是得科学上网,而且还不便宜,大家根据需求去选就好了。 用极梦生成图片提示词,不用搞的很复杂,用大白话把你想看到的画面说清楚就行了。另外还可以加几个短词描述一下美学风格,比如国漫风格、暖色调、 逆光光影居中构图这一些,这样 ai 生成的图片更符合你的预期。以第一个场景为例,我们先打开极梦的网站,在这里选择图片生成尺寸的话,选择十六比九二 k 就 好, 然后在这个位置把图片上传好。在对话框里输入这样一段提示词,提示词的格式就是用连贯的自然语言描述画面内容,主体加行为加环境等,用短词语描述画面美学风格、色彩、光影、构图等。 将图片改为三 d 国漫、微微写实风格,天气为白天,去掉水印以及画面中所有的文字。生成好图片后,选择你比较满意的那张就可以了。 不一定要把所有的首尾针都生成出来,像有一些动作幅度不大的镜头生成手针就可以了。某些高度相似的镜头也可以用同一张图片去生成视频,这样就可以节省很多成本。下面就是把静态图片变成动态视频,还要加上声音,是慢距落地的关键环节。 主要分为三个任务,生成 ai 视频,做配音、配乐、剪辑视频,目标是让画面更流畅,声音和画面协调。生成 ai 视频有两种方式,在线平台和本地部署。本地部署的话我推荐 capui。 在 线平台选择比较多,我给大家整理了几个,各有优势,大家看情况选择就好。 吉梦性价比高,还能生成会说话的数字人,动作和语音都能同步,操作简单,新手友好海螺甚至打斗效果比较好,特效做的特别。 国外的平台功能很全,但需要科学上网,操作的门槛也比较高, 本地部署的话有抗比有爱,但是本地部署对电脑的要求比较高,这里就不给大家展示了,我这次用的是吉梦,直接给大家演示一下操作流程。 在极梦主页这个地方选择视频生成,然后来选择你想要的模型,我们就来选择三点五这个模型,因为现在极梦三点五模型是可以支持音话题的,我们就不用像之前那样视频和音效对话分开生成了,大大提升了我们的效率。视频生成模式这里就选择首尾帧, 尺寸还是十六比九,视频的时长可以根据我们实际的镜头和对话的长度调整数值。调整好后,我们就可以开始上传图片了。 把首尾帧上传好,打开对话脚本的文档,复制一下对话的内容和语气动作,用自然语言调整一下提示图,点击生成出来后可以看下效果,如果不满意的话还可以重新再生成一次。 最后就是配音配乐和视频剪辑,把这些片段全部拖到剪映里面,按照顺序排列好。因为这个视频用的是原版影视剧的音频,所以我们需要把所有的片段声音拉到最低,然后再把影视剧的音频导进来, 根据音频的节奏调整一下视频片段的长度、节奏和速度。把所有的片段处理好后,就可以开始给视频配字幕了。我们可以选择字幕或者智能包装给视频配字,字幕这个就是比较正常的普通文字,而智能包装呢,就会生成出很多艺术字体。右下角这里有一个开始识别, 它就会根据音频自动识别字幕,识别完整的字幕可能会有错别字和断句,这一些问题我们需要稍微调改一下,然后再调整一下字体的样式,整个视频就制作完成了。想要提高视频清晰度的话,可以使用 to pass video ai, 感兴趣的小伙伴可以了解一下。

超酷炫的 ai 漫剧制作秘籍,新手必坑轻松做! 首先输入这段提示词,得到手帧图,这是我生成视频的图片,下面是生成视频的提示词,首尾帧和提示词填好之后,点击左下角创作,接着让我们看一下效果, 记得点赞关注哦!

挑战一个视频,彻底教会你 ai 慢剧制作!本系列视频耗时两个月,制作共计六十小时,带你一口气从小白顺利进阶大神!由于视频太长,本套教程分期发布,本期带你搞定 ai 慢剧基础篇。最后会给大家一个小福利课程视频中的所有素材、脚本、分镜、关键词等,还有学习计划表,几十上百记素材,电子书和课件等等,只要你能想到的素材, 我这里几乎都有,评论留言六六六即可免费打包带走。欢迎来到 ai 慢剧制作全流程教学的第一集! 很多新手想做漫剧,却卡在不知道从哪里下手哎,工具太多选不清的问题上,这一集呢,我们就帮助大家理清思路,作为整个课程的导航图,核心是让大家明白 ai 漫剧的创作逻辑,知道每个环节该用什么样的工具,快速建立起从零到一的创作框架。 接下来我们就从核心逻辑和工具选型两个关键的维度来帮助大家入门。首先我们要明确漫剧创作的核心是故事、视觉、声音三大要素的协调, 而 ai 工具的作用就是帮我们降低这三大要素的制作门槛。不管是短漫还是长漫,都离不开先有故事框架,也就是脚本,再做视觉呈现、图像、动态镜头等等。最后呢,加声音包装,也就是我们的配音和配乐的基础流程, 这也是我们后续课程的核心递进逻辑,新手不用急于求成,我们跟着这个流程走呢,就能少走弯路。 ai 不是 万能的,但是呢,能够精准的解决新手的痛点,主要覆盖在四个关键的环节, 一、创意辅助,用大语言模型生成角色脚本啊,我们平时用的都包 deepsea、 gimini 啊, gpt 等等,这些东西呢都属于大语言模型,都属于在创意辅助的范畴内。二、视觉创作, 这也是我们用的最多的地方,用图像视频生成工具来制作动态场景纹身图,图生视频呢,就属于这个环节。三、音频制作,用 ai 进行配音来生成音乐音效。四、 后期优化,用剪辑工具的 ai 功能来调整进行后期方面的制作。简单来说呢, ai 能够帮助我们把创意快速的落地成成品的素材。 以往呢,我们需要整个专业团队来协同完成的工作,现在只需要个人使用 ai 就 能完成大部分的工作。闭环工具呢,不用选太多,一套核心组合就能满足新手的大部分需求。 下面我就按照制作环节来分类,给大家推荐相关的工具,明确选型逻辑。创意辅助环节推荐豆包、 deepsea、 gimini、 gpt 等大语言模型。 视觉制作环节推荐豆包、极梦、可林、海螺、 vdo 等图像动态生成工具。音频制作环节推荐使用剪映、 solo、 爱给网等来完成配音和配乐。后期剪辑环节则推荐剪映, 功能齐全,新手必选作客下来新手只要掌握好豆包、极梦、剪映这三者的创作需要,我们的课程演示也将以这三种工具为主。 下一集呢,我们就从 ai 大 模型的精准指令设计来开始,带领大家完成剧本以及分镜脚本的创作。如果对你有所帮助的话,请多多三连支持一下本套课程所用到的 ai 脚本,提示词、运镜、关键词库,还有所有的免费 ai 工具软件,我都整理放在了置顶评论,我们下节课再见!哈喽,大家好, 上集我们确定了 ai 漫剧制作的核心工具,其中大圆模型就像大脑,能够辅助我们生成剧本角色等内容。但很多同学用 ai 时会遇到答非所问,输出杂乱的问题, 核心问题是还没有掌握指令的精髓。这集我们就聚焦于如何设计精准的指令,来带领大家完成剧本以及分镜脚本的创作。所有在教学过程中用到的指令呢,我都已经给大家整理完毕, 如果有需要的小伙伴呢,记得在评论区输入三三三,打包带走。我们在给 ai 设计指令的时候呢,要遵循两个技巧,三个原则。首先,我们要给 ai 定身份。什么叫给 ai 定身份呢?就是给他一个指定的身份,明确 ai 的 角色,让他站在对应专业的视角来输出内容。 比如说,你是一名资深的漫剧脚本编剧,擅长玄幻风格的创作,你是剧本创作指导,精准的生成符合制作需求的剧本框架。 这两种身份呢啊,他们都有异曲同工之妙,都和啊创作剧本啊脚本有关。但是呢,如果你拿这两种不同的身份去分别啊,给 ai 来设计指令,那么你得到的这个回答 也一定是有不同的。我们的身份越具体呢, ai 的 输出就越贴合专业的需求。第二点,给输出定结构,定框架。我们要提前规定 ai 的 输出格式和逻辑,避免内容的杂乱。比如说,一个完整的脚本,它需要什么样的东西啊?需要什么样内容? 是不是需要啊?人物角色的设定,镜头运动,对话的设计,还有时间等等等等。那它的输出格式是按照表格还是按照台本来格式来输出呢? 这些框架越清晰,后续我们使用起来就会越省心。这就是啊,两个技巧,那三个原则呢?就是遵照啊,清晰、具体、场景化。三原则,简单来说就是指令表达,要避免模糊表达,要补充足够多的细节,并且明确应用的场景。 接下来我们来看具体的操作过程。这里呢,选择豆包作为演示,我们首先给他输入一个身份,看着我们刚刚讲过的,你是一名资深的都市循环慢剧脚本编剧,再确定一个主题,擅长创作升级流爽剧剧本 到这里呢,我们就可以给到他一些关键词啊,比如说你的这个剧本呢,他的主题是什么?是什么灵脉修真啊? 是什么气筒啊,哎?是什么灵气复苏啊等等等等啊,这是不同的关键词,然后让他给出我们剧本,那没有灵感, 脑子里很混乱,没有灵感的人,我们就可以让 ai 帮我们给出相关的这些灵感,然后你再去里面选择,所以我这里会加上一个,请让他给出我三版不同的剧本,一共我为慢剧制作进行挑选。 我们来看一下他给出了三版的这个剧本,第一版是叫零脉重启都市修真狂潮,很这个核心设定啊,很非常的典型啊,全球灵气复苏, 然后主角本来是什么,本来是零脉破碎的废柴,意外获得了上古灵域这种机缘,然后就开始了逆袭之路,非常典型的逆袭打脸啊, 然后我们来看第二版,第二版的话就很明显啊,这个是系统啊,系统文,第三版是这个秘境探索,秘境探索主角有特殊的体制,然后进行考古时啊,然后考古时发现了上古王朝的遗迹,然后开始了这个这个剧情。 三版基本上都是不同的核心设定,我们可以看一下主角的这个性格呢,也分别不一样,分别不一样,他给了我们,还给了我们人物小传 看,一个是隐忍啊,一个是乐观,是吧?性格乐观,还有一个是什么?还有一个是沉稳冷静,哎,观察力,灵敏,三种的主角连性格都不一样, 除此之外,他还,哎,根据我们的这个设定,哎,已经给我们创作好了前三场的开篇剧情,我们粗略的看一下,粗略的看一下就可以进行选择了。 那我是觉得啊,我是觉得既然我要进行慢剧的创作的话,肯定是比较抓人眼球啊,一开始哎就能吸引到观众注意的,像这种打脸啊,这种废柴打脸,这种套路 其实还是很好用的。所以呢,我就确定了,我选择第一版这个零麦重启啊这个剧本 来进行创作。刚刚我们带领大家完成了剧本的创作,那现在呢,我们就要根据这个剧本的片段来进入慢剧创作的核心环节,脚本的创作。 在创作之前呢,我们先来明确一下剧本与脚本它究竟有什么样的区别。首先我们要知道,剧本它是我们慢剧的整体的核心脉络,它是给导演来看的, 整个故事情节,故事的发展、冲突、高潮部分都在其中,能够帮助导演掌握整个故事的走向,如果有需要修改的地方呢,也能很快的及时的进去修改。那脚本是干嘛的? 脚本是给我们制作者、执行者看的,他包含的一些东西,更加的细节,其中呢,有分镜的编号呀,然后画面的结构, 镜头的类型,时常啊,音效,配乐等等等等。如果是像我们制作 ai 慢距、 ai 动漫的话,它甚至里面还要包含 ai 生成的这个提示词。 没有剧本呢,我们就无法把控制作的内容,没有脚本创作呢,就如同空中楼阁,缺少具体的执行方法。同学们千万要记住别偷懒,一定要先写剧本,再根据剧本来拆解脚本。如果先写脚本再补剧本的话,就很容易会出现故事逻辑混乱的问题。 那么明确了这点以后呢,我们就可以打开之前跟豆包的对话, 我已经选定了第一版的这个零卖重启,都是修真狂潮做我的创作剧本,现在要做的就什么?就是用 ai 来高效生成脚本, 还记得怎样来设计指令吗?首先要给 ai 定身份,你是一名资深的慢剧脚本师,擅长将剧本片段转化为规范的表格式脚本。然后哎定框架, 生成表格式脚本,表格列包括信号、场景、人物、动作、对话、音效。 接着我们还要给 ai 明确基本的核心信息,哎,是基于什么第一版的剧本生成表格式脚本。这样呢,我们就可以得到一份 以我们第一版的这个参篇的开篇句型为主要内容的表格式脚本。可以看一下镜号、场景、人物、动作、 对话和音效基本上都在这里了,稍微的过一遍,那么到这里就结束了吗?当然不是,我们还要将脚本进行格式化的转化啊,来进行分镜的设计。 不过今天呢,我们就不做传统的分镜草图了,而是直接啊,二合一将分镜设计啊,再加上啊分镜画面的 ai 提示词一起来解决, 这样呢,能够将后续的图像创作更加精准,更加高效,直接衔接到啊。我们 ai 图像生成工作,首先我们要明确到两个关键的知识点,第一是分镜的核心逻辑,二是分镜提示词的必备要素。首先 分镜的核心逻辑,分镜是镜头的排列组合,核心作用是把脚本的文字内容拆解成一个一个的连续的画面,让绪势更加的清晰。这里呢,哎,主要掌握三个基础术语,第一个是景别,比如说全景、 中景、近景、特写,它决定了画面的范围。第二个是镜头的运动,比如说固定镜头、推镜头、拉镜头、摇镜头等等,这决定了画面的动态。第三个是构图,比如说居中构图、 对角线构图、框架式构图,这里决定了画面的美感。这三个术语呢,就是分镜设计的基础。好了解了分镜的核心逻辑以后,我们现在再要了解一下分镜画面提示词生成的一些核心要素, 因为我们除了分镜要进行设计,我们还要把它转化成可供我们 ai 工具直接生成的提示词。那这里外我们还要再加上什么东西呢?我们还要加上 光影、色彩这些细节。那总结起来就是一个完整的分镜头脚本,它包含了哪些要素呢?包含了时间轴、镜号、景别、镜头运动,场景,人物动作,然后音效对白等等等等, 那这些核心要素我们掌握完以后呢?接下来就是实操部分,我们回到豆包,继续在对话框进行对话,还是这个格式,首先定身份, 你是一名资深的漫剧分镜师,擅长将故事脚本进行细致拆分,并转换为分镜脚本,然后给框架生成包括镜号,时间轴,景别、镜头运动,人物动作对白、音效、画面生成提示词的分镜头脚本。接着给出 信息,基于之前已经生成好的脚本来生成。 ok, 我 们现在把它点开来看,这样一个分镜头脚本就已经给我们输出完毕了, 我们来看一下这个效果。首先是时间轴这里看啊,基本上一到两秒就为一个信号。然后景别呢,也非常的细致的给我们拆分了这个镜头运动呢,哎,也在这里 写明,固定,跟拍,哎,横摇推进哎等等等等等等。看到这边人物动作,对白,音效, 最后是最关键的画面生成提示词。那么到这一步呢,创意辅助这一环节就已经结束了,下一集我们将利用这些提示词和这些基本的信息来生成我们人物角色和场景。觉得这个视频对你有帮助的话,记得点个关注,避免错过 相关的资料。思维导图提示词呢已经打包完毕了,记得评论区六六六领取,我们下节课再见! ok, 我 们看看啊哈,这个姿势可能有点奇怪啊,但是意思呢是这个意思没问题。 ok, 那 么局部重绘呢?我们就先了解到这里,下面我们再换一种玩法,提示词,这里除了直接输入文字以外,还可以上传参考图, 那么上传图片之后,那么季梦会对上传的图片做一个信息的提取,下面我们演示一下,我们导入一张这样的图片,我们注意看在弹出的这个窗口里面, 为我们提供了这样几个选项,那么比如边缘、紧身等等。那么看到这里呢,相信有 s d 基础的小伙伴已经发现了这个部分和 control 操作逻辑非常相似, 那么几乎可以判断啊,纪梦的这个部分呢,也利用了目前最成熟的技术。下面我们选择人物姿势,我可以花一点时间去提取人物的姿势信息。

恭喜你点进这个视频,我将通过这套 ai 动态慢系统教程,带你抓住二零二六年最大的风口,无需任何基础,全程通过 ai 即可进行创作。本套课程将从零基础开始,一步步带你解锁 ai 动态慢所需要的各个知识点。那我们废话不多说,现在就跟我一起来 学习吧!那么从这期视频开始,我们就来讲解 ai 动画短片是如何制作的。其实想要制作一部完整的 ai 动画短片,它的核心逻辑和我们的传统动画片制作是一模一样的。那现在最厉害的地方在于有了 ai 的 加持,很多以前需要一个专业团队才能搞定的工作,现在你一个人就能够全部包圆了。那听起来很 高深的一些专业知识,只要你学会借助 ai, 都可以在极短的时间内快速上手。一般来说,做出一个像样的 ai 动画短片,我们要走这么几个流程,第一步是写故事,包括构思剧本和拆解细分的分镜脚本。第二步是 出图,也就是把剧本里的文字变成一张张精美的图片。第三步就是让画面动起来,把图片转化为视频。第四步就是搞定声音,利用 ai 的 环境音效、背景音乐,还有人物的配音等等等等。那最后一步就是 把这些素材放在剪辑软件里,进行后期的合成。我知道很多新手同学看到这一长串的流程,可能觉得有点头大,甚至想退缩啊,但大家千万不要担心,从今天开始,我会带着大家从最基础的如何利用 ai 写剧本开始讲解,一直到最后的剪辑出片,我会把每一个细节呢都给大家拆开了揉碎了然 你听明白。好,那么咱们今天从零开始,手把手教你如何从头亲手做出一个属于你自己的 ai 动画。这期视频我们先来讲解第一部分,如何利用大圆模型进行编写故事的剧本和脚本。我们都知道,一个完整的影视作品需要的是导演和编剧来帮我们赚写剧本和脚本。但我们 大多数人都不是专业的导演和编剧,因此我们想要获得一个好的故事剧本和脚本,通常需要借助 ai 大 元模型进行生成,例如豆包、 china、 g p t、 桌面等等等等。那此时如何向大元模型进行提问就非常重要了。对于我们新手小白来说,就可以先从这四个基本的要素进行提问,角色设定、 目标清晰、输入格式、结果质量。像这样公式化的提问才能够得到更有执行性的答案。比如现在我们就想生成一个三分镜的 ai 短视频, 一辆赛车在沙漠里飞驰。那根据刚刚的公式呢,我们就可以这样写,你是一个专业的影视分镜脚本专写师,擅长为 ai 短视频设计场景和镜头语言。请你帮我做一个十秒左右的视频脚本,内容是在广阔的沙漠公路上,一辆赛车在高速的飞驰。根据 以下的具体要求,比如三分镜需要包括镜头类型、画面内容、动态描述等等,要保证主体和风格的一致性。输出格式的要求有,镜头编号、画面描述、 ai 绘画提示词最终以表格的形式回答。我们先来探讨第一个要点,角色设定。这段提示词我们可以看到给定 ai 的 身份是 影视分镜渲染师,这是因为我们的核心问题是让它帮我们生成三分镜的 ai 短视频,所以要让它在做短视频方面是一个 专家,那他擅长为 ai 短视频设计场景和镜头语言。因此我们自己在向大语言模型提问的时候,如何给定 ai 身份,或者给他哪种身份 是要根据我们的核心问题进行设计,那此时我们想要 ai 帮我们去做一个科普动态慢的概念,那我们就可以给他设定。假如你是 世界著名动画影视艺术专家,请你给大家科普一下什么是动态慢的核心定义,动态慢的关键特征,以及动态慢与动画漫画的核心区别。这些内容所 给出的格式是非常专业的,那我们换一种角度问同样的问题,大家可以对比一下差异。假设你是一个脱口秀演员, 请你帮我科普一下什么是动态慢。可以看到这里所回复的内容就和刚刚有一定的差异,是以更加接地气且通俗易懂的方式来介绍动态慢的。这就是我们给 ai 设定不同的身份,那么 ai 给我们的答案也会有一定的差异,它会从不同的角度、不同的专业做出不同的回答。 于第二点,目标清晰,这里并没有什么特殊的技巧,我们需要做的就是简单明了的把我们的核心问题发给 ai 即可,就比如请你帮我做一个十秒左右的视频脚本等等。那如果没有今天我们所讲述的提问框架,大家大概率也是会这样去提问,将后边的一些具体要求牵扯到了比较多的专业名词,如 如果大家看不懂没有关系,后边我们会给大家一一的进行讲解。我们再来看第三点,格式输出。我们在向大元模型提问的时候,虽然在我们没有进行格式限定的情况下, ai 依然给我们的答案是分条列出, 条件清晰的,但要做脚本,需要输出的类目会非常的多,因此用表格的形式会更加一目了然。 我们来做一个对比,请你帮我做一个十秒左右的视频脚本,内容是广阔的沙漠公路上,一辆赛车在高速飞驰,这是我们不做格式限定得到的答案输出。 如果我们再加上输出的格式要求,镜头编号,警别时长、画面描述、 ai 绘画、提示词旁白,并以表格的形式回答,那这个时候我们的提问方式得到了答案就会更加的专业,并且更具实用性,这就是 ai 限定输出格式的作用。我们再来看最后一遍 结果质量,结果质量这个重点对于以上三个点来说呢,显得就没有那么的重要了。在 ai 还没有如此强大的时候,我们每一次的提问都需要提醒 ai 生成一些高质量的回答,比如我们在做图片提示词的时候,需要提醒 ai 生成四 k 的 画质啊,摄影镜头啊等等等等。 那我们在做文案性的工作的时候,需要提醒 ai 回答的简明扼要啊,逻辑清晰啊等等等等。但对于现在的大语言模型来说,我们的这些结果质量提示就显得有些多余了,因为 本来 ai 给我们的答案就已经非常的好了,因此结果质量只有在我们得到了答案不太满意或有所纰漏的时候,再去提醒,再去作答即可。我们下面就回归到本节课的主题, 如何让 ai 来编写剧本和脚本。这里我们已经提前准备好了,一起来看一下具体的内容是怎么样的。首先要明确一点,剧本和脚本是不同的,可以看到在这里我们分成了故事的剧本和脚本。在剧本方面,我们点击 查看,可以看到它更像是一则故事的直观叙述,就像阅读一本小说一样,没有非常杂的解释,只是顺着观众的正常思路来讲述一则普通的故事。而脚本则不同, 它的内容会更加的繁琐复杂,包括了警别场景等等,对于画面内容的描述以及发生的时间。它更像是一本在制作这个完整故事影视作品时的一个指导规划书,告诉我们在拍摄这一段时 应该注意些什么,按照什么样的方式去制作。那么了解了故事的剧本和脚本的区别,我们再回到刚刚的内容,来看一下具体的提问方式是怎样的。可以看到这里同样满足了提问的四要素。首先第一点给 ai 设定身份,你是一个经验丰富的动画电影制 做导演,这句话就给 ai 设定了一个经验丰富的动画导演身份。下面是提要求,现在我需要你写一个动画电影短片的故事剧本白鹤仙子的传说。这句简单的话提出了我们的要求,是写动画电影短片 的故事剧本。而第三个部分就是给回答设定格式要求是三帝国漫风格以写故事的方式提供给我,以便于我能快速的了解故事内容不超过四百字。而在下面我们生成脚本的时候呢,可以看到 没有再给 ai 设定身份了,因为通常来说呀, ai 大 元模型是有关联上下文的能力的,那我们在第一句话中已经给他设定了一个经验丰富的动画导演身份,所以默认在后续的提问中,即便不再单独的设定身份,这个身份也已经贯穿整个对话了。到这里大家可能会有一个疑问, 那就是既然我们生成的分镜脚本能够直接告诉我们在真正制作短片时,该在什么位置,什么样的描述,设定什么样的时间,为什么还需要让 ai 生成一个故事的剧本呢?这个道理其实很简单,作为一个导演呢, 也就是我们自己要制作出一个完整的故事,就必须先要深入对故事有一个清晰的认识,知道故事当中的出场人物,故 故事的情节。所以相较于永长的脚本而言,一则故事的剧本能够让作为导演的我们像阅读一个短片故事一样,快速的了解整个故事都发生了什么,这样在制作的时候才能够更多的去打磨这个故事的细节,了解故事的前后逻辑。 其次,我们先行编写的一个故事剧本,也能够十分方便的对故事剧本当中逻辑不通或者不够精彩的需要修改的内容,再来生成更加完善的脚本, 以此来降低后续修改的成本。毕竟修改一个简短的剧本要比修改一个永长的脚本要方便得多。在生成一个 ai 动画故事短片时, 大家可以看到,开头我们所展示的动画短片在时长上都不是很长,通常一两分钟,所以这里生成的字数也非常的重要。通常来说,四百字的故事剧本对应的就是两分钟左右的 ai 动画短片。所以大家可以以此为基础,在设定 ai 回答时来设定一下生成的次数。此外,我们在设计脚本要求时, 实际上是为未来的 ai 绘画流埋下一个伏笔。很多格式上的约束,核心的目的都是为了让后续的图片生成更加的流畅,所以大家在向 ai 提问时,不妨换位思考。如果我们要用这段话去生成一个图片,那 ai 需要知道些什么?基于此, 我们在指令中强制要求,包括警别警号、场景绘画、提示词等等等等,这些细节直接决定了分镜的还原度。更重要的是,我们仿佛强调 ai 的 描述要客观直观,避免文学化的修饰。如果你深入使用过 ai 绘画工具,你就会发现那 些充满意境的小说话表达往往是致命伤。比如长城宛如巨龙, ai 呢?可能会画出一条龙来,那这就是语义误读导致的翻车现场。为了保证分镜脚本的实用性,我们必须用最平实的语言 去解构画面,摒弃误导性的一些修辞。当然,在追求绘画效率的同时,我们也不能忽视脚本本身的专业属性。即便我们不是职业的导演或者编剧, 也应该要求 ai 输出的内容具备脚本的基本骨架与核心要素,这样生成的作品才不只是零散的描述词堆砌而成的作品,而是一份具备 蓄势完整性,能够真正落地的执行性专业脚本。最后,让我们对本期视频的核心要点进行一次深度的梳理。首先我们从宏观角度给 大家讲解了制作一部 ai 动画作品的全部流程以及炼录。这不仅是本节课的开端,更是我们后续系列课程将要逐一解析深度攻克的技术地图。那本节课的重头戏呢?在于我们详细的拆解了如何利用 ai 大 元模型编写出高质量的故事剧本与 分镜脚本。我们重点强调了与 ai 深度对话的一些核心方法论,就是提问的四要素,角色设定、目标清晰、输出格式、结果、质量。那在实战环节中,我们不仅成功地驱动 ai 生成了可落地的剧本脚本,更从专业的角度对什么是剧本,什么是脚本一 以及他们的实际创作中各自承载的功能进行了一个深度的分析以及区分。那希望通过这些理论与实操的结合,大家能够真正的理解并掌握 ai 创作的底层逻辑,为接下来的分镜生成打下一个坚实的基础。好了,以上就是本节课的全部内容,如果对你有所帮助,还请 多多支持三年。以下本套教程用到的 ai 脚本、提示词、运镜、关键词库,还有所有免费的 ai 工具,我都会整理放在下方置顶评论。下期视频我们来学习如何根据生成好的剧本脚本来生成分镜图片。这 就是整个制作环节中最花时间的部分,因为它不仅要生成图片,还包括了设计故事当中各种事物的形象,以及如何保证角色前后的一致性,如何对生成不满意的图片进行修改等等等等。那我们就 下节课再见。大家好,在上节课中,我们学习了使用 ai 大 语言模型生成剧本和脚本,那么这节课我们就利用已经生成好的剧本脚本来进行分镜图片的生成。制作 ai 视频时, 先图后影的图声视频模式是确保创作可控性与成本效率的核心策略。在实际的商业化生产流程中呢,直接利用文声视频往往会伴随着商用的标准,从而造成高昂的时间成本与 算力资金的浪费。为了避免这种开盲盒式的低效率输出,资深的创作者通常会先精细的打磨分镜图片,利用静态图像为 ai 提供 明确的视觉参考、光影构图以及主体特征,再通过图声视频进行动态的一个转化。这种工作流程呢,将创作重心前置,使图片生成阶段成为了决定我们视频成败的关键流程,也是我们最值得投入精力的一个环节。在正式开启 ai 绘画之前, 我们必须要建立起角色先行的创作意识,就是说,通过严谨的造型设计来将整个故事注入灵魂。每一个完整的去式时空呢,都离不开核心人物和事物的支撑。因此前期准备的第一步就是将剧本中的文字转化为具象化的角色造型方案。 在实际的教学案例中呢,生成的脚本通常会给出基础的视觉线索,比如我们上节课提到的角色姚双,其特征呢,被定义为白鹤仙子、水墨风飘带飞舞、 雨光环绕、雪肌银发、东方仙女。此时呢,如果甲方没有给出特定的原话稿,或者我们自己处于创意发散阶段,就可以直接通过精准的提日词指令,要求 ai 按照脚本的逻辑输出该角色的全身 正面视角。在这个过程中,我们需要明确规范角色的造型以及整体视觉风格,从而快速获得一套标准化、可延伸的角色出形象设计。这不仅能够极大的提升我们后期的创作效率,更是为 后续保证角色一致性打下了一个关键的基础。当然,除了根据脚本当中已有的简单描述对角色造型进行设计之外,我们同样可以根据自身的想法来单独设计角色的造型。比如人物 没有发束啊,可能披头散发的状态,或者说是短发这些内容呢,我们可以直接通过正常的描述来告诉 ai, 就 可以生成对应的结果。 我们前期的第二大核心呢,在于必须对故事画面风格进行大局的调度和定调。我们要知道,任何一部成熟的影视作品, 其视觉语言的核心竞争力都源于美术风格的前后一致,我们绝对不允许呢,作品在前期呈现的是写实风格,而到后期呢,却又毫无逻辑的突变为三 d 的 风格,那这种割裂的感觉呢,是创作的大忌。因此,我们需要在一开始呢,就利用题词 来对未来的画风进行永久性的固定。就拿当下这个案例来说,当我们在生成角色时,明确植入高精度三 d 建模风格或者三 d 国漫风格等等,这些指令 我们所得到的就不再是那些拥有真实毛孔与写实比例的真人形象了,而是呈现出一种接近 院线级的三 d 动画电影的角色质感。那这种风格化的预设呢,是直观重要的,确保我们在后续的生成所需要的画面都能严格的遵循这个美术标准。那么问题来了,如果我们看中了某张图片的美术风格,但自己呢又抓不住重点, 知道该用什么词去描述它,咱们该怎么办呢?那其实呢,操作是非常简单的,我们可以直接去抄作业加精细化的一个思路,比如我们现在来到吉梦 ai 的 首页, 这里呢有很多优秀的作者生成的作品,如果我们觉得其中某一张图片的视觉感觉哎,特别符合我们的胃口,就直接点开这张图片看大图。 我们注意右侧,这里明明白白的给我们展示了作者生成这张图时的用的原始提示词,我们直接可以动手把它复制下来,直接来到我们的豆包 ai 对 话框里给它粘贴上去, 记得我们按 shift 的 同时呢,去加上回车键,就可以另起一行,不然的话我们就直接给发送上去了。这个时候我们给豆包 ai 下一个指令,跟他说帮我把这段词里的 具体描写,什么人什么事或者什么环境氛围的话全部删掉,只帮我留下跟美术风格、画面质感相关的关键词, 那我们点击发送,大家可以看。这样一来我们就非常丝滑的从别人的作品里把那套风格给提取出来了,直接就可以用到我们自己的创作里,当然了, ai 帮我们提取出来的风格词呢,未必是百分之百的精确答案,咱们拿来用之前呢,先要亲自过一道人工筛选的关卡, 比如说我们在刚刚提取出来的那对词里,可能会混进去一些属于摄影机位的景别描述,跟风格描述呢,其实是没有半毛钱关系的,那咱们在使用之前呢,最好是先把这些干扰项给删除掉。 接下来咱们再来实操一下,把刚刚洗干净的风格词,配合上咱们自己新的构思内容。比如描述一个古风的帅哥正在预见飞行,一一混在一起生成一组图片,我们一起来看一下这个效果。 大家可以看到最终跑出来的这张图,它的光影质感和三 d 的 味道是不是和刚刚咱们参考的那张大神的图片有些相似了呢?不过这里我们还是要给大家打一个预防针,因为咱们生成的主体变了,有时候美术风格在最终的呈现上很难做到绝对的完美, 所以大家在参考的时候一定要灵活,根据自己对画面的理解,多去微调提示词,不断尝试,直到它完全符合我们脑子里想要的画面为止。 那么回到豆包 ai, 我 们继续承接之前的内容,在设定好角色也就是姚双的形象之后,我们自然要继续设计画面当中出镜比较多的仙鹤的形象。 这里我们就继续向豆包提出要求,用相同的风格生成脚本当中提到的仙鹤,可以看到最终生成的效果呢,也是非常出色,成功的生成了仙鹤的形象。当然大家同样可以靠自己的想象来描述仙鹤都有什么样的特征。 既然我们已经把人物造型和美术风格这两个基础给打好了,那接下来的重头戏就是如何通过精准的提置词,把脚本里每一个分镜的镜头给 实实在在的变出来。想要画面,听你的话,我们必须要掌握一套专业的提置词万能公式,我把它归结为核心的六大维度,首先是景别,你是要特写 近景、中景还是远景,这决定了观众看画面的视角远近。第二是主体事物,也就是画面里到底有什么,比如我们刚刚设计的遥霜和仙鹤,还有它们所处的具体环境。第三点非常关键,就是时间光线, 白天黑夜雷雨天气的光是完全不同的感觉,而且你要学会描述光的方向是柔和的,正面光还是很有故事的,侧面逆光,光线选对了,人物的情感瞬间也就拉满了。第四呢就是色调的控制, 我们可以直接定冷光调,或者告诉 ai 要某部电影的经典影调,比如轿夫的那种身随沉稳的复古感。第五呢是构图的逻辑, 咱们是选择稳重的对称构图,或者说是灵动的 s 型构图,还是延伸感的水平构图,好的构图能够让画面自己说话。那最后呢,就是画面的质量词,像什么胶片颗粒质感、 电影级光效、十六 k 超轻等等等等。这些词呢,就像是画面的磨皮滤镜,能够瞬间拔高生成的结果和我们商业化的质感。 接下来呢,我们来深入探讨一下提示词的描述技巧。这里呢,第一要义就是必须要做到极致的直观与客观。大家一定要扭转一个观念, 写 ai 提示词,和我们上写写作文写小说是完全两码事。在文学创作里,我们追求修辞的意境和华丽的词藻,但在 ai 绘画的逻辑里,过多的修饰词往往是噪音的存在,那我们极其容易导致 ai 误判我们的核心意图。 举一个典型的翻车案例,比如上节课我让大家描述的长城宛如一条巨龙,那么在文学意境下呢,这是非常壮观的一个场景,但你让 ai 这种直脑筋,大概率它是听不懂你的比喻的,它很可能呢,就真的生成一条巨龙,盘握在山上,而不是你想要的长城建筑的本质。 再比如,我们描述鲤鱼跃出水面,飞的很高,像长了翅膀一样,你的本意呢,是想形容跳跃的高度,但结果呢,大家可以看 ai 直接理解成了字面意思, 给这条鱼真的安上了一对翅膀,生成了一个不伦不类的怪胎。所以说呢,我们在 ai 沟通的时候呢,千万别搞那些花里胡哨的比喻词,要学会最直白最干的物理语言去 描述画面,告诉他画面里到底有什么,而不是他像什么,这样才能保证咱们的费片率降到最低。咱们再来看提日词描述的第二个核心要义, 脚本只是辅助参考,真正的画面拆解必须靠我们自己的独立思考。现在 ai 视频教程满天飞,有些教程呢,会误导大家, 直接说把脚本当中的描述文字呢,复制粘贴过去,就可以直接出片。那咱们实话实说呢,这种做法呢,其实是非常业余的,因为脚本的描述里经常会堆积很多同一个镜头下根本没有办法兼顾的信息。 咱们就拿第一个镜头做例子,脚本里写了超广角镜头下展示了一只白鹤在东海附近日出时分翱翔在云雾缭绕的山峰之上。 那么仙鹤优雅的身影呢?穿透金色的晨曦?大家可以动脑筋想一想,如果我们拍的是一只仙鹤的超广角镜头, 像细节处他身体穿透的晨曦,这仅仅是几个像素的事情, ai 怎么可能会在保证远景或者广角的情况下,帮我们把这个透光晨曦的质感给刻画出来呢?这就是视觉上的一个矛盾, 所以咱们在生成时不能当搬运工,还要当一个导演。那像这种情况呢,我们至少要把这个脚本呢拆分成两个画面,第一个镜头呢,才是仙鹤翅膀透光的一个近景特写图, 所以我们要养成一个习惯,拿到脚本之后呢,先在自己的脑海中过一遍,形成一个具体的画面感。更多的时候,我们要脱离剧本的文字束缚,根据自己脑子里的构图,用刚才直观的语言去描述它。只有这样呢,我们才能避开逻辑冲突的坑,生成画面才能够真正具备电影级的修饰质 感。第三点就是 ai 目前的能力有限,有时需要适当的修改提示词,描述内容,或者在生成好内容之后,我们根据剧本和脚本进行一定的更改。 例如这一段让白鹤与妖怪进行战斗,它释放出神圣的能量,画面剧烈的晃动。如果大家有一定的 ai 视频生成经验的话呢,会发现这一句话当中所描述的仙鹤打斗场景在 ai 视频片段的生成中其实是非常难制作的, 首先它打斗的细节没有描述,其次仙鹤的肢体控制是非常僵硬的,所以这里我们不妨直接让仙鹤化为人形的摇骰去和怪物施法, 这样人物施法的动作会非常的流畅,并且呢更加符合逻辑。因此再遇到类似的情况,可以先尝试按照剧本当中可能会相对复杂的表现去生成,如果我们做不出来的话,再考虑更改为更加简单的画面。 第四个题,日词描述技巧,就是有角色说台词的画面时,尽量用近景正面镜头,这同样是我们将来给角色对口型时,能否成功地给角色对上口型进行考量。在极梦 ai 当中呢,给角色对口型 用的是数字人的功能,他首先需要我们上传一个视频或者图片,再添加对应的配音。当我们需要对口型的人物是一个远景人物并且非正面镜头时,此时对口型失败率是非常高的,要么效果会非常的不明显。 比如说我们来看这段视频,可以看到,虽然说生成的画面人物的嘴部依然是有动态的,但是整体的表现效果会非常的一般, 人物的身体呢,也会伴随说话而出现不自然的动态效果。我们再来看这个人物近景特写对口型的画面,可以看到此时生成的画面人物的口型和台词就十分的匹配,并且呢面部的动态表现也会更加的清晰。 所以当我们遇到有角色在说台词的画面时,就可以尽量使用近景正面镜头,以获取更好的对口型效果。我们最后再来看图片生成之后的修改技巧。在通过纹身图生成图片时呢,很多情况下并不能一次性生成让人满意的效果, 但也许生成的图片百分之八十是满意的,剩余的百分之二十呢?相比于重新生成一张图片和进行后期修改是性价比更高的选择。或者有时候我们需要表达一个很长的镜头,以此来表现画面的时间流逝 或者是人物的一连串动作。所以我们首先来看第一点,固定镜头下长时间物体运动的表达技巧。 这里就包含很多方面了,比如我们现在想要表达一年四季的变化,那么在生成好人物的状态之后呢,我们就可以直接让 ai 大 语言模型帮我们固定画面当中的人物构造和构图, 但只改变画面当中的四季。比如我们首先生成的第一张图片呢,是类似于春季或者夏季。在提示词中,我们要求将上传图片的季节改为秋季,其他的部分保持不变,此时我们就获得了人物在秋天的画面。那同样的道理,我们继续描述将人物的季节呢改为冬季, 其他的部分保持不变。那最终呢,就成功的将图片改为了冬天的季节。有了这些图片之后,我们首先使用首尾针或者多针生成的方式,可以生成一组人物从春天到秋天再到冬天一直在这个位置的景象, 以此来表现人物十分勤勉,十分坚毅的镜头片段效果。当然,除了描述季节之外,我们还可以描述将人物改为某种姿势,在人物的身边添加某些事物,减少某些事物,其他的部分呢,保持不变,相信大家可以举一反三,我们就不再多赘述了。 第二个图片修改的技巧呢,就是如何在保证造型和风格一致性的条件下修改环境和状态的技巧。 其实这一点大多数情况下我们不需要特意去保持。因为呢, ai 大 圆模型在升图时呢,是有上下文关联的功能,比如说,我们刚刚演示的提示词中,只描述了鲤鱼跃出水面飞得很高,就像长了翅膀一样。 本身的意图呢,是想单独生成一条跃出水面的鲤鱼,但得益于 ai 大 圆模型能够关联上下文的能力,它依旧认为我们是想要基于上面的画面来进行新的修改, 而且可以看到生成的结果在美术风格上同样保持了上图的风格一致。所以很多情况下,我们不太需要单独的提及要保持的画面风格。但需要注意的是呢,在实际的制作过程中,偶尔会出现我们上传了一张参考图片, 但生成的结果和参考图在造型上的美术风格不相同的情况。在遇到这种情况的时候,该怎么解决呢?最好呢,我们就更换一个图片生成平台。 那在使用不同的图片生成平台时呢,其实每一家所使用的生成模型呢,都会有所区别,有些生成模型呢,擅长于写实风格,有些擅长于绘画风格,有些模型这个角度生成的不好,有些模型按这个风格生成的不好,这些呢都是很常见的情况, 所以说大家在对图片内容进行修改时呢,一定不要一棵树上吊死。如果实在生成的不好,除了用极梦 ai 或者豆包平台之外呢,我们也不妨尝试其他的平台,比如说可灵 ai, 或者像开源的 context 的 模型, flux 模型或者 banana 模型的工作流都是可以的。 现在我们可以来到 running hub 上搜索 banana 的 模型工作流,其基本的功能呢就是图片编辑,在左侧图像输入窗口,将刚刚未能在豆包上生成成功的人物造型进行上传。在提日词的描述当中,我们描述需求, 这里我们就输入和刚刚在豆包上一样的提示词,根据刚刚图片的人物特写生成生气、拍桌子、愤怒的表情。而比例方面我们修改为十六比九,然后直接点击开始升图,可以看到一段时间后图片就生成好了,整体的生成效果还是非常出色的。 我们将在豆包上面生成的人物造型放在旁边,同时将原版的人物造型参考也放在旁边,可以看到对比之下,显然使用 banana 的 模型工作流能够生成人物造型更加统一的画面效果。 当然在豆包上大多数情况下也是直接可以修改的,只是偶尔出现一些问题,所以届时不妨尝试一下其他的平台,在保证人物造型和美术风格情况一致的情况下,改变环境和画面当中的事物形态。最后我们来简单总结一下这节课我们讲解了图片生成的相关知识, 包括前期的准备、提日词的结构、提日词的描述技巧和图片修改技巧,这些知识能够帮助大家在生成分镜图片时,更容易的生成出理想的画面。 好了,以上就是本节课的全部内容,如果对你有所帮助,还请多多三连支持一下。大家在实际操作时遇到任何问题 也非常欢迎在评论区留言,我会尽可能的回复大家所有的问题。课程相关的 ai 资料也已经打包好放在置顶评论区,那我们就下节课再见吧! 大家好,在之前的课程中,我们已经学习了 ai 剧本脚本的生成,以及如何通过所生成的剧本和脚本来生成对应的分镜图片。那么这节课我们就来正式的学习生成 ai 视频片段。 目前市面上的 ai 视频生成平台有很多,我们应该如何去选择呢?那在这些年的项目实操中呢?我尝试过市面上绝大多数的 ai 视频工具, 如果综合考量操作便捷程度、生成画面质量以及平台功能的完整性,我总结出一套适合制作完整 ai 视频的方案。目前呢,我建议大家重点关注三个平台,分别是可玲、吉梦以及 miss jerry。 那 在这三个平台呢,并不是相互替代的关系, 而是在不同的创作阶段各有侧重,他们有的擅长动态模拟,有的在审美控制上更具优势。接下来的内容呢,我会根据具体的应用场景带大家逐一进行剖析。 ok, 我 们先进入极梦平台的这个实 操环节,打开极梦的主页,最上方最显眼的位置呢,就是 a 帧的模式,虽然这个模式呢支持我们输入任意一段自然语言去自动匹配功能, 但在实际的生成环境下,它的智能化程度还是不足以完全理解复杂的创作意图。生成效果呢,往往带有随机性, 所以为了追求更精准的输出,我建议大家绕过这个综合的入口,直接点击左侧导航栏里的生成选项,进入专门的创作控制台。在视频生成逻辑里, 通常分为文声视频和图声视频两条途径,这里我要分享一个非常关键的实战经验,在大多数商业或者正式的作品创作中,图声视频往往是比文声视频更高效、更明智的选择。原因很简单,确定性。文声视频目前还存在较大的不可控性, 无论是画面中主体形象的一致性,还是动态镜头的精准程度,都包含太多的未知因素。而图声视频则不同,它允许我们用图片确定好构图、光影和角色,再让它动起来, 这就把视觉创作和动态模拟分成了两步,极大的提高了我们的出片率。既然我们选择了文声视频的路径,那么 描述信息的密度就要远比图声视频大得多,因为我们不仅要定义画面静态的属性,还要兼顾动态的变量,这要求我们必须回到提示词的底层结构上来。要清晰的构建一幅画面,首先要明确景别和主体, 比如近景,一名身穿白色毛衣的少女。随后呢是环境和氛围的描述,例如白天的街道、冷色调电影等等等等这样的一个构图感觉。最后再辅以胶片颗粒、超轻、六 k 等质量描述词来捍实画面基础, 但请注意,写完这些后,先不要急于生成,因为文声视频还多了一个维度的逻辑,那就是运动的控制,也叫做运镜的控制。 我们需要分别描述镜头的运镜和主体的动作。比如针对人物行走的画面,我们可以书写镜头跟随或者跟随镜头,那么并要求人物在面向镜头或者向前走的方向。 虽然现在我们将画面和动态的内容都交代清楚了,回车生成的视频效果也表现尚可,但问题随之而来,由于缺乏原图像的一个约束, ai 会在人物长相、 行为多寡以及具体的年龄等未描述的细节上进行随机的填充。这些内容呢,它是不可控的,直接导致了我们生成的结果往往会偏离我们的预期。 因此,我们再次向大家强调,在实战的项目中呢,文声视频往往是效率较低的一种方案,为了追求更强的确定性呢,我们还应该优先选择图声视频的功能。那 说到图声视频,我们下面来看一看图声视频都有哪些功能机制。大多数的视频生成平台,这些功能机制都大同小异,所以我们就只讲极梦 ai 上的主要功能。那么大家在使用其他平台时,注意举一反三。 首先是最为基础的手帧图像生视频,这也是最常用的一个功能。这个功能呢,需要我们通过拖拽或者点击上传的方式将图片上传到手帧图的预备框中。在上传好之后,接下来就是输入提示词描述了。 不同于文声视频,图声视频本身上乘的参考图就已经给了充足的画面信息,因此在图声视频时,我们就只需要描述画面当中物体的运动变化以及运镜即可。首先来描述运镜, 这里我们就描述固定镜头,水在流动,风吹起人物的头发和草地,像画面当中的水流和草被风吹起的效果,可以在写好提日词后直接点击生成即可。 生成视频时呢,会直接根据图片本身的宽高比来决定视频生成的宽高比,所以大多数时间就是上传图片,描述运境和事物的变化,就可以点击发送生成了。在等待视频生成的过程中,我们集中讲解一下关键的参数设置。首先是模型选择, 遵循 ai 领域的通用逻辑,版本标号越高的模型,其底层架构和语义理解能力就越强,生成的效果自然更加出色。所以我建议大家选择更高版本的模型,以确保作品的质感。 在即梦的生成方式中,提供了首尾帧生成视频、智能多帧生视频以及参考图生视频三个维度,而在宽高比上通常设为自动匹配,以确保素材比例的协调。 关于视频时长,目前在五秒和十秒两个档位,我们进行自由选择,这里我要给出一个非常关键的避坑建议。 在非必要的情况下,我们尽量不要直接去选择十秒的生成时长,因为视频的链路越长,模型对画面动态和物理结构的控制就越弱,出现变形和逻辑错误的概率就大幅增加。 至于运镜控制,吉梦内置了一系列标准化的运镜模板,这些模板的底层逻辑呢,与我们手动输入提示词是一样的, 如果你对镜头语言的专业描述还不够熟悉,直接调用模板是最稳妥的选择。当然,如果你已经掌握了精准的运镜描述词,直接在提示词框里边进行自定义书写,灵活性会更加的高。 现在视频已经生成好了,来一起看一看效果吧!可以看到整个视频的过程是动态效果非常不错的,水流动非常自然,风也是轻轻的吹动了人物的头发,草也在轻轻的晃动。像这样的视频生成,每一次的效果都有一定的随机性。 如果当前的效果不够满意,可以根据当前的题日词和生成的效果,对题日词的部分加以改进,或者适当的修改原图当中的某些内容。当然,如果觉得全部都没有问题, 都是因为随机性导致的,生成效果不好,也可以直接点击下边的再次生成。这样的话呢,就不用再次编辑,直接可以重新获得一条新的视频。 我们接下来来深入探讨首尾真生视频的功能,这在精准控制视频走势上直观重要。刚才我们仅通过手真生成的视频,虽然画面起步很稳,但结尾处人物的表现,事物的变化轨迹本质上是随机的, 而首尾帧模式,它赋予了我们控制终点的能力。现在我们将一张少年在秋天环境中打作的图片上传至尾帧窗口, 通过这种方式,我们预设了视频结束时的画面结构与环境状态。在提示词的构思上,我们维持固定镜头,并保持水在流动,风吹起发丝和草地,那为了强化季节更替的视觉冲击力,我们需要引入延时摄影的这一专业描述, 要求水流与草地快速地晃动。利用这种加速的动态逻辑,在短短几秒钟内呈现出从夏季向秋季过渡的时间流逝感。我们继续来看极梦 ai 上视频生成的下一个功能就是多帧生成。 点击这里的下拉菜单,将首尾帧生成修改为智能多帧,此时就会多出一个图片上传窗口。而我们要做的就是在第三个多帧上传窗口上再次追加一张图片,将其拖拽到这个位置。此时可以看到在图片与图片之间有一个间隔的位置,点击这个间隔的摄像机图标, 我们会弹出一个文本输入框,这个位置是用来描述图片与图片之间在运镜和事物变化上的描述。 我们上传的第三张图片就是人物在冬季打坐的画面,因此提示词描述基本上和上一张季节上更替的描述保持不变。我们也可以将水快速流动这个选项进行删除,让 ai 自行来决定水该如何流动。接下来复制点击确定, 同样把上一段图片与图片之间的衔接提示词内容替换为当前内容,点击确定。多帧生成功能。在图片上传时,它的上限不止三张,我们可以继续添加第四张、第五张图片,以此来生成一个连贯的、时长较长的视频画面,来表现更多更长的画面当中的实物变化动态。 我们下面来讲解一下其他的 ai 视频生成平台。首先来讲解一下关于可灵平台的使用方法来到可灵 ai 的 首页,需要先说明的是这些视频生成平台在使用操作和功能上基本上大同小异,在可灵 ai 平台 依然是在左侧的视频生成选项,可以看到同样分为了文声视频和图声视频,具体的操作也和极梦 ai 上是一样的,所以我们就不做过多的演示了。这里我们还要说一个重点功能,就是多模态编辑功能, 这项功能能够对视频当中已经出现的事物进行替换,增加元素或者删除元素。我们就以替换元素为例,这里先前我们已经生成了一条视频,看一下效果,这就是这条视频当中显示老人在喂狗的画面,其实原视频是展示老人在喂猫的画面,而参考图是一只小狗。 那么具体该如何操作能够把视频画面当中的猫替换成狗呢?我们下面来简单演示一下。首先需要将进行多模态编辑的视频通过拖拽或者点击上传的方式上传到这个位置, 在上传好之后,可令 ai 会分析视频当中都有什么事物,如果分析成功,会自动弹出一个窗口, 在这个窗口中可以通过点击的方式选中想要进行替换的内容,比如点击这只猫的部位,此时猫的身体就变成了绿色,当然此时的绿色范围只显示当前我们所见的画面真的内容。 那其他的画面针是否已经把猫给选中了呢?我们可以点击这里的预览完整选区选项,可以看到此时视频就开始自动播放。如果在播放的整个过程中,几乎猫的全部身体都被绿色覆盖,那么就说明整个视频的猫都将会被完整的替换掉。 确认无物之后,点击下方的确定选项,然后在下方我们需要上传一张去替换这只猫的事物。我们可以自己上传一张图片,也可以选择官方所提供的素材。 在上传好图片之后,同样会弹出一个窗口让我们选择。参考的是什么?参考的是长相,参考的是主体或者参考的是服装, 通常呢我们用智能选择参考即可。点击这个确定最后题日词的部分描述,我们可以看到这里可零 ai 已经给出了书写的模板,我们直接填空就可以了。使用图片中的主体替换视频中的猫,这里是关于替换元素该如何使用的方法。 那至于增加元素,我们在上传一条视频后,点击这个视频的位置,并不会弹出窗口上让我们去设定哪个位置来增加元素,所以全凭题日词的描述。 在上传好主体参考之后,可以看到下方的提示词描述框已经打好了模板,告诉我们基于视频中的原始内容,以自然生动的方式将图片中的什么融入视频中的什么,这里这个框是用来描述你想要生成的具体位置,比如猫的旁边, 这样一来生成的视频就会在猫的旁边来加上我们所上传的这个事物造型。删除元素的话,和替换元素的操作方法类似,在上传视频之后呢,会自动弹出一个窗口,或者我们点击已经上传好的视频位置,也会弹出视频窗口,通过选区的方式选中想要删除的元素,点击确定, 而提日存呢?就描述删除视频当中的什么,这里当然也是写猫咪,那这样的话呢,生成新的视频,这个猫就会被删除掉了。这就是关于可灵 ai 视频生成当中的多模态编辑功能和具体该如何操作,不过具体的效果大家可以看到, 清晰度上不如我们直接生成的这个视频。但想要使用多模态编辑功能,我们只能使用可零一点六的模型,而可零最新的二点六模型中间插了很多个版本,所以是否使用这个功能就看大家的取舍了。 在更多的时候使用多模态编辑其实更适合去处理一些现实生活中的拍摄视频,而非 ai 生成的视频。所以在处理 ai 视频生成时,与其在视频上进行处理,不如在源头,也就是在生成视频时所需要的图片上进行处理,要来的更加方便。 我们刚刚在可灵 ai 和吉梦 ai 的 演示中,或多或少都出现了画面质量不佳,或者生成的动态效果不好的情况,这也是我们此次要讲解多个平台的原因, 那就是每一个平台的视频生成模型都有各自的优劣,可能在生成某些场景时表现的好,但一旦遇到一些特定的场景,比如像极梦 ai 遇到流水的场景,就生成的不尽人意。所以下面我们来讲解一下关于 middle jerry 如何生成视频。 迷你圈里的官网网址我已经放在了下方置顶评论区了,有需要的小伙伴可以直接点击跳转即可。在登录完成之后,可以点击左侧的 create 选项,这里我们来到生成页面,在这个页面可以生成图片,也可以生成视频。 我们这节课主要是讲解视频的生成功能。点击左侧的图像加选项,这里可以看到上传手针图片。在图片上传好之后,我们了解一下相关的参数设置。首先是最上方的提示词输入, 这里的描述方式和先前的其他平台生成完全一样,描述只需要两个方面,一是视频的运镜,另一个是画面当中的事物描述,例如这里我们描述人物戴上墨镜,在写好之后,记得将提示词翻译为英文, 正常情况下,直接上传手针,再加上提示词描述,就可以直接点击右侧的发送生成视频了。那么在生成的这段时间,我们再来详细讲解一下其他的相关功能。 可以看到上传首帧图片之后,右侧 ending from 是 上传尾帧图片的地方,它的使用方法和其他的视频生成平台一致,我们在这里就不重复的演示了。 但我们可以注意到下方有一个 loft 选项,我们将这个选项进行勾选,此时首帧图片和尾帧图片会自动视为同一张图片进行首尾帧的生成。在勾选上之后,我们会生成首尾相接的视频, 让我们的生成能够无限循环,手针和尾针之间能够丝滑的衔接。而最右侧的 motion 选项 则是在设置视频生成的动态时,分别为低动态和高动态。选择低动态的话,视频当中的物品运动就会相对柔和,相对缓慢一些。而选择高动态的话,视频当中的事物变化会变得更加剧烈,更加迅速。 此外,在提示词输入框的右侧还有一个 settings 选项,在打开这个选项之后,可以看到右下方还有进一步的参数设置。首先是视频生成的品质, 可以看到这里 s d 指的是高清模式,而 h d 指的是高清模式,对应的大约是幺零八零 p 的 分辨率。而下方单次生成视频的数量可以看到当前我们所生成的视频一次性会生成四条视频, 而在这里设置区域,我们可以选择一次性生成一条或者两条视频。在视频生成好之后呢,将鼠标悬停在生成好的部分这一行,就会自动播放。预览当前生成的视频,可以看到 mid jordan 上面生成的视频整体的质量和人物的动态自然程度是相当不错的。 我们点击打开任意一条视频,打开之后在右侧就会有相应的后续选项可以选择。我们现在将页面进行汉化,来看一看这些后续选项都有哪些。首先是重新生成选项, 在点击之后就会基于当前提示词和手针图片进行重新生成。然后是将下方的起始针作为重新生成的参数,或者将提示词作为重新生成的参数。再往下还有自动状态下的低动态和高动态可选。可以看到这个位置上还有一项功能叫做扩展视频。 在点击这个功能之后呢, midori 会将我们生成的当前视频作为一项生成参数,我们可以配合着提示词来描述这项视频结束之后继续又会发生什么事情。 例如当前人物戴上墨镜之后,再让人物去吃个汉堡,或者让人物摘下墨镜来做其他的事情都是可以的。这项功能呢,不同于吉梦 ai 的 多真声视频,可以基于视频本身配合提示词的描述来延长这个视频的内容。 当然我们也可以看到这个位置上追加了一个结束帧,来告诉 midari 延长后的视频人物最终是在做什么。所以虽然在操作上有所不同,但在机制上, midari 的 视频延长功能和极梦 ai 的 多帧生成功能在底层逻辑上是基本一样的, 只是在 midari 上会更加麻烦一些。首先需要生成一个视频,在这个视频的基础上加上伪帧图来延长视频。 以上呢,就是 mini 的 视频生成功能具体操作总结一下,我们这期视频讲解了 ai 视频生成的平台选择、文声视频以及各个平台的图声视频功能该如何进行操作。大家日常使用的过程中通常会选择极梦可灵就可以了, 而极梦 ai 在 生成的性价比上也会更高一些,价格可能是可灵 ai 的 三分之一,同时生成的质量也并不比其他的平台差。 当然,我们遇到极梦 ai 平台生成并不好的时候,那可以再考虑其他的平台,再看看能否生成令我们更加满意的效果,这也是我们一次性讲解多个平台操作的意义所在。好了,以上就是本节课的全部内容,如果对你有所帮助,还请多多支持。三连一下 大家在实际操作中遇到任何问题,非常欢迎在评论区留言,我会尽可能的回复大家的问题,课程相关的 ai 资料也已经打包好放在这里评, 那我们就下期再见,拜拜!哈喽,大家好!在上节课我们详细讲解了几种生成视频的方法路径, 那么有了画面之后,我们还需要给画面的角色进行配音,所以这期视频我们来学习如何用 ai 生成配音。现在用 ai 配音是非常方便的,像平时常用的可灵即梦这些主流平台, 其实都内置了对应的配音功能,不过大家在操作的时候要留个心眼,因为 ai 配音通常会根据你的需求分成两种情况来处理。 首先第一种就是纯粹的旁白配音,这种配音处理起来相对简单,因为他不需要考虑画面里的人物口型能不能对得上,更多的是以一种旁观者的视角进行后期的讲故事,所以对情感的要求没有那么的高,只要声音听起来自然能够清晰准确的把文本内容给读出来,足够了。 而第二种呢,就是对技术要求更高一些的角色配音,这种配音呢,不仅需要让声音和人物的嘴型变化完全同步,还根据故事剧情的走势注入真实的情感,比如愤怒、悲伤或者喜悦,只有这样配出来的角色才有灵魂。 那我们首先来看第一种情况,有哪些平台可以使用,其实最方便的方法就藏在大家平常常用的剪映里边, 它自带的文本转语音功能就非常实用。具体怎么操作呢?大家打开简后,先盯着左上角那个文本选项,点击进去,你会发现有一个专门的功能叫做添加口播稿,点开它之后,屏幕上会弹出一个输入框,这个时候你只需要把准备好的文案直接输入进去,或者从别处复制粘贴过来。也可以 们拿一个纹身图的 prompt 举例子,比如输入电影般的极简主义山景,巨大的红色太阳从中央山峰后升起。这些文字填写好之后,直接点击下方的配音功能,这个时候右侧就会跳出一大堆音色让你去选。你可以挨个点击那些小头像,试听一下效果,看看哪个声音最顺耳。 比如我们试听这个音色,电影般的极简主义山景,巨大的红色太阳从中央山峰后升起。如果你觉得这个声音符合你的视频风格, 那就别犹豫,直接点击右下角的添加轨道,稍等几分钟,音频就生成好了。而且剪映还会非常贴心的帮你把配音的字幕也一并安排好,我们现在点击播放一下,听听效果怎么样?电影般的极简主义山景, 巨大的红色太阳从中央山峰后升起。听得出来,虽然配音的清晰度和节奏感都挺到位,但整体听起来确实没有什么明显的情感起伏, 比较平铺直叙。所以就像刚说的,剪映生成的音效,最理想的是去处理给科普类或者旭日类视频当旁白,效果是完全够用的。 同样的道理,在极梦 ai 或者可灵 ai 平台,同样具备文本生成音频的功能。点击左侧的生成选项,将下方的模式修改为数字人模式。 在极梦 ai 当中,使用这个模式,即可对我们上传的视频片段或者人物图片进行对口型操作。如果我们没有提前在本地电脑上准备角色说话的音频,在上传图片或者视频的窗口左侧点击这个位置,即可选择在极梦上给我们提供的默认音色。 点击这个音色左侧的播放按钮,即可对当前的音色进行试听。欢迎使用对口型功能,让你的故事镜头栩栩如生。此外,在上边的部分音色同样可以选择朗读时的情绪和语速 当前的音色。点击右侧的设置选项,可以看到这个音色是可以设置说话的速度的。而像下方这个妩媚女生的选项可以看到鼠标悬停在上方之前, 其右侧有一个表情加的符号,带有这种符号的音色在点击之后就可以选择在配音时人物讲话的情感。欢迎使用对口型功能,让你的故事镜头栩栩如生。 欢迎使用对口型功能,让你的故事镜头栩栩如生。当然,在吉梦 ai 上,目前具备情感朗读功能的音色有限, 所以除非刚好你需要用到这个音色与人物的造型是相匹配的,否则在大多数情况下,在极光 ai 上所生成的对口型音色依然不适合用在角色的配音当中。至于文本转语音功能,在可灵 ai 上的操作和其他平台大同小异。来到可灵 ai 的 首页, 我们点击左侧的全部工具选项,可以看到这项功能在可令 ai 上同样是数字人功能,在点击打开之后,左侧是上传人物形象的部分,在这里做了个区分,向左上方的数字人选项是用来上传图片,让图片开口说话的, 而右侧的对口型选项是用来上传视频,让视频中的人物开口说话的,大家可以根据自身的需求来选择合适的方式。而这里在可令 ai 官方选项中,同样是提供了很多音色, 将鼠标悬停在对应图片的上方,即可试听这个音色。天气转凉了,我给你织了条围巾,你戴上记得多穿点哦。 在选择了一个音色之后,同样的部分音色可以在下方调节语速和情感,而不支持调节的,将鼠标悬停在上方时,则会提示该音色不支持什么样的感情。因此我 我们刚刚介绍的这些平台软件,在更多情况下,他们更适合让一个角色形象去播报新闻,这样的情况进行配音不需要太多的情感。而第二种类型的角色配音就需要人物富有情感, 且需要进行口型的匹配。那市面上有没有更好用又便宜的软件能够满足这些需求呢?答案是有的。 这个软件还是 windows 电脑自带的本地软件,叫做 clipsham, 大家可以直接在自己的 windows 系统上搜索这个名字,没有搜索到也没有关系,打开任意的浏览器,我们直接搜索 clipsham 就 可以找到它的进入网址, 点击之后就会来到 clipsham 的 登录页面,现在点击这里的编辑视频选项,在点击之后,如果之前没有登录过的,可以先让我们选择对应的账号来登录。我们可以使用邮箱、谷歌账号或者微转账号来进行登录, 这里我们就使用谷歌账号。在登录之后,点击这里的文字转语音选项试一试的选项,此时就可以正式的进入到 k u p m 的 操作界面,这个软件本质上也是一个剪辑软件,类似于剪映, 所以我们能够看到一个和剪辑类似的页面布局。现在点击左侧的文字转语音选项,就会在下方剪辑轨道上添加一段带录音音频的空白音频部分, 在右侧我们就可以选择语音以及对应的声音了。点击这个选项可以试听当前我们选择的声音。在这个上面音色的选择非常丰富,展开下了菜单,我们使用滚轮不断的往下拖动,这些都是可以选择的音色,且每个音色也备注了其特点。 其中大多数音色在设置时都是可以设置朗读时的情感。比如现在我们点击下方的高级选项,就可以选择声音的高低, 语速的快和慢,我们再来更换一个音色,例如现在我们更换一个名为云野的音色,在更换好之后,下面多出了一个情感下拉菜单,那上面提供的情感选项还是非常丰富的,像尴尬、平静、害怕、高兴、不满、严重生气、 难过等等都可以选择。比如现在我们选择高兴这个选项,而声调方面通常要迎合高兴就可以选择高或者超高,语速也可以稍微加快一些。在下边的文本输入框输入想要这个音色朗读的内容,比如 姚双是天上的仙女,有通灵情义的神力。点击下方的预览即可试听当前我们输入文本转换后的效果。姚双是天上的仙女,有通灵情义的神力。如果觉得这个效果不错的话,就点击右下方的保存选项, 此时这段音频会被保存到剪辑轨道中,如果想要直接用这段音频和我们生成的 ai 视频相匹配相结合,也可以直接将我们生成好的 ai 视频片段添加到上面的视频剪辑轨道上,然后点击右上方的导出。 但并不建议大家这样做,因为在点击导出这个选项之后,会需要我们选择导出的分辨率,可以看到四 k 分 辨率是需要充值可以的,所以我们现在要做的事情就是仅导出音频即可。 因为没有视频画面的选择,所以选择最低分辨率的四零八零 p 在 点击之后会下载到当前浏览的本地电脑默认下载位置。 目前 clippix 给到的免费配音额度是很多的,我们正常使用的频率是根本用不完的,大家不用担心生成的额度问题。当然,如果我们今天所讲解的内容在某些情况下依然无法满足我们使用的需求,也可以直接求助豆包 ai, 让他帮我们推荐几个其他的能够带情感设置的 ai 文本语音网站。 在获取了视频片段和音频文件之后,我们最后一步要做的事情就是来到 ai 视频生成平台,使用其数字人功能上传视频文件,同时上传已经生成好的本地音频文件。 对视频当中的人物进行对口型,那本身操作逻辑并不复杂,这里我们就不再进行详细的演示。唯一需要注意的一点就是我们所上传的视频片段人物最好保持正面近景镜头,这样能够获得更好的对口型效果。 像这些侧面视角或者远景视角,通常对口型的效果会偏弱一些。好了,以上就是本节课的全部内容,如果 对你有所帮助,还请多多支持三连一下,那么大家在实际操作时遇到了任何问题,也非常欢迎在评论区留言,我会尽可能回复大家的问题。课程相关的 ai 资料也已经打包好放在这里评论区了,那我们就下节课再见!拜拜!