逼自己一个月练完极梦 ai 制作视频全一百集存下吧,真的很难找全的。请告本视频耗时三个月制作,制作时长三百五十分钟,陪你系统的学习极梦 ai 视频,这应该是目前抖音巨良心的入门到进阶的 ai 视频教程了,哪怕你是零基础也能轻松学会。所有教学过程中用到的指令提示词我都整理好了,直接三三三。 哈喽,大家好,我是林默,今天上线,想跟大家说个事,最近好多人在问, 哎,这极梦三点零 pro 不是 去年才刚上线的吗?怎么二月份又出来一个二点零?这两个到底有啥关系呢?那么作为新手小白的我又该学习哪一个呢? 说实话,我看到他今年二月份刚上线的时候也是一脸懵逼,两个版本相差就隔两个月,名字还是反过来的,三点零在前,二点零在后,听着就像降级了一样。 后面我仔细去扒拉了一下,发现这两个根本就不是一个东西,所以今天想花几分钟跟大家一起来唠一唠这件事,等把这两个模型的底层捋清楚了之后,后面你学什么都会顺的。 我们先说一下去年刚出来的三点五 polo 模型,用大白话一句来概括的话,它最大的功能就是让 ai 视频终于有人味了。 在三点五模型还没出来之前,我们要做一个开口说话的视频,非常的麻烦,要先把片子拖进剪映, 对着视频轴一帧一帧的去对口型,配一个脚步的声音,还得自己找个素材拖到阴鬼中一帧一帧的去剪。 那么出了三点五模型之后,我们就书写一个简单的提示词,让人物开口说上海话,生成出来的人物就自带上海话的口音, 在口型匹配上还能对得上。你要是想生成一个雨滴打在伞上的声音,它也能够完成,自然地把声音过渡到画面中,这就是它最大的能力,音画同步功能。 那么说完了三点零 pro, 再让我们来看一下这次升级的 cds 二点零。 cds 二点零呢,解决了另一个让我们一直头大的问题,那就是为什么我给了参考图, ai 还可能生成另一张脸,又或者是我写了一个慢动作转身,角色却还在原地抽搐。 你有没有发现,这根本就不是画质的问题,这是一个听话的问题,二点零就是来控制这个模型,让他更加的听话。这两个模型他底层的架构是完全重新书写的。 这里大家需要注意一下,我要把这个二点零当成了三点五 pro 的 升级迭代版,它们是发展了两条路线, 最重要的能力就是更加的可控,更加的听话。接下来呢,我给你们举几个实际的例子,你们可以感受一下。 就让我们先来到极梦的首页来进行实操演。从视频中我们可以看出,同样的提示词下, 在使用了带珍珠耳环的少女这一个固定的名称,三点五理解的是这个女孩是一个带着珍珠耳环的少女,她学习到的是这张图的色调光影, 然后画出了一个他理解的少女,深沉的虽然也是个女孩带着珍珠耳环,但是他的五官却是 ai 自己编的。我们再来看一下在二点零模型下, 不难看出,在二点零模型下, ai 在 处理上面更加的智能,它深刻的解析了我们的提示词内容,并根据我们著名的画作戴珍珠耳环的少女这张人物角色的形象特征, 构图视角、人物衣着做了更精确的描述。就如某位大佬时侧说的那样, 二点零模型可以仅凭一张办公室楼的正面照,能精准的还原楼体背面的布局,这已经不是画的像的问题了,这是三维空间的推理能力。 接下来我们再来看下一个场景,在三点五的模型下,如果你想要复刻一个电影命境, 就得用文字进行描述来看,我这里有一个真人写真的图片,一个英俊的侠客少年。我们将图片生成调整为视频生成,然后我们将侠客的图片 拖入我们的手针,此时我们需要进行文字描述,这里我给出的提示词是,男子拔剑之后在院子里练剑。模型上面我们选用视频三点五 pro 生成一个五秒的视频。我们先来看一下生成效果, 我们来看一下三点五 pro 生成的视频, 从视频效果可以看到,人物在进行拔剑运动的同时, 对剑鞘和剑柄还不能很好的理解,以至于画面出现了错乱。接下来我们再来看一下二点零时代,同样的人物会产生怎么样的效果。我们将模型从三点零改成二点零, 这里我们将首尾帧改成全能参考。我们使用同一张人物角色,并上传一段武打视频。 我们可以看出,在二点零模式下,我们可以上传一张竞争图片加一段视频,此时我们先不使用提示词,我们保持尺寸比例的不变, 生成一段五秒的视频,来看一下二点零模型,能否理解我们的意思,我们来生成看一下效果,我们来看一下角色五件的视频, 从视频效果不难看出,他将我们的男主融合到了我们的视频场景中, 形成了一段双人对打的视频,场景跟人物融合的相当完美,没有明显的拼接痕迹,角色的一致性保持的相当不错,和场景进行了自然的衔接过渡,这就是极梦二点零的能力。 第五个呢是分镜的去式能力,在视频三点五模型下,虽然也能做长视频,同时它也支持首尾帧以及视频段落的拼接, 但是它的逻辑是拼接完第一段之后,第二段要接着生成再进行拼接,而二点零的逻辑是分镜驱动, 他支持按分镜脚本逐一生成。我们来看一下他的使用效果。好来看到我这边,我让豆包给我写了一个十五秒的小短片,让他给我出了分镜脚本, 可以看出他这里给了我五个镜号,分别对每个镜头进行了描述。接下来我们对这个表格进行截图, 那么我们将截取的图片放入即梦中, 这里我们使用二点零模型全能参考的模式,我们将五秒的视频转为十五秒。我们来深层看一下效果,我们来看一下它的分镜修饰能力。 从视频的效果可以看出, 他根据我们的分镜脚本进行了故事片段的生成,整体的色调以红色为主基调,生成了角色和场景一致性的连贯视频。 视频中在跨越镜头时依旧维持了角色的外观,并进行了光影逻辑,美术风格的一致性,没有拼接的感觉,视频的整体效果较为流畅。 来看,这里我上传了一张图片,接着我们再上传一段音频,可以看到此时我们有了一张参考图和一个音频,这里我们不使用提示词,我们选用二点零模型,在全能参考这个模式下 来生成一段五秒的视频,看一下效果 好,让我们来看一下这条音频生成, 从视频的效果可以看出,二点零的音频能力是驱动式的,正如我上传的这段音频, 他在保持了我们人物角色一致性的同时,对这段音频进行了故事的联想,让人物在场景下自然的说出这段音频,形成逻辑上的闭环。 从角色的口型和动作以及表情来看,和这段音频的内容相当的匹配。 我们同样使用模型三点零,在视频三点零 pro 模式下对提示词进行描写。接下来我们生成一个五秒的视频来看一下效果。 我们来看一下三点五 polo 模型下音频的能力。从视频效果可以看出,三点零模型下的音频能力是深沉式的, 比如我们写下雨天,他就为我们配雨声,如果我们写的是弹钢琴,他就为我们配钢琴音。如果我们写的是方言,如这里我使用的是日文,他就会为我生成相对应的口型。 如果我们什么都不写, ai 也会给我们进行编排,但是不会像二点零那样 进行更加智能的生成,这就是两者的区别,那这两者谁更高级呢?其实用途不同,但有一点可以肯定,二点零的音频同步是原升级的,而不是后期对轨。 最后我们来讲一下政策关系,二点零模式下暂时不支持输入含真人的照片或视频来作为主体的参考, 目前字节正在针对这一个情况进行紧急优化,期待后面能够更新开放使用。那么这节课我们就将二点零的几大核心和三点五时代进行了对比。 那么我们这门课呢,主要是讲解二点零的几大核心内容,包括我们说的认脸、抄动作、对口型、读表格 等,这几大核心能力一条一条的带你亲手跑通,希望你学会了这个教程之后再去制作自己的视频, 你会发现原来 ai 真的 能听懂人话。好的,那本节课的内容就先学到这里,我们下节课不见不散!
粉丝666获赞2587

逼自己一个月练完,其实你 ai 视频狂爆了,全八百七十四集,存下吧,真的很难找全的!挑战一个视频,让你完全学会 ai 视频!本套视频包含极梦所有基础操作讲解、爆款案例、实操演示,从 ai 技巧到 ai 思维,一口气带你入门 ai 视频。并且为了保证课程效果,课程配套的提示词以及配套脚本我都整理好了,三百三十三字起。哈喽,各位同学们好, 欢迎回到我们 ai 漫剧全乐城教学的第三节课。上节课我们搞定了剧本和分镜脚本,拿到了一份完整的可以直接指导后续制作的文本方案。那么从今天开始,我们就要把文字变成画面了。 但在我们动手出图出视频前,先要把我们剧本的资产库先建立起来。什么是资产?资产就是指在进行生图生视频时需要用到的参考图,包括人物参考、场景参考、道具参考,一些精品的慢剧还会有特效参考。 首先,我们要为每一个出场的角色建立一份详尽的角色档案,这份档案越详细越好,因为它是后续所有图像生成的锚点。我们回到上节课用的 ai 生成的脚本,现在我要在豆包的同一个对话窗口中继续追问, 请你分别为脚本中出场的主要角色输出一份详细的视觉设计描述。每个角色需要包含年龄段与体型、发型与发色、五官特征、服装设计、 标志性配饰或者特征描述呢,要尽可能具象化,方便直接用于 ai 生成图像。好,大家看到了, ai 立马给我们生成出来了,但是呢,主角的生成还是有一些呃,不够详细,比如说这里只用了沈金欢男装时的角色形象,但是呢,没有给出女装时的角色形象,所以呢,我要他为我进行一个补充。那现在补充好的这个角色描述呢,就 更加的详细了。那这份角色档案呢,就是我们后续一切工作的机准线。有了文字描述还不够,我们需要把它变成一张真正的图片,作为后续所有分镜的人物参考机准。这一步非常关键,我把它称为角色定型。 具体怎么操作呢?首先,我们需要对 ai 生成的角色描述做一轮提示词优化。为什么要优化? 用 ai 给出的描述是面向人类阅读的自然语言,但 ai 出图工具呢,更擅长理解结构化的提示词,所以我们需要把这段自然语言改写成适合图像生成的格式。 我个人的做法是直接用 ai 大 元模型来完成这件事情,让它帮助你把描述改写成英文或者中文的结构化提示词。同时加入几个关键的控制词, 比如说,我们要加一些关于风格的提示词,这决定了整体的视觉调性,还要加上全身像,确保生成的是完整的全身图,而不是半身或者大头照。并且呢,还要加上纯白背景, 这一点非常重要。干净的背景呢,可以排除环境因素的干扰,再加上一些角色设计图之类的关键词,能引导 ai 生成更标准的角色参考图。 同时,我们还要删除所有跟场景环境有关的描述,比如在什么样的场景中,什么样的光线照射在角色的脸上,这些跟场景相关的描述通通不要,因为现在我们只是在建立角色的几种外观,不需要任何环境的干扰。 拿到优化的提示词之后,我们就打开吉梦。当然你也可以用 mate, johnny 啊啊, safari fusion 或者任何你顺手的 ai 出的工具。之所以我个人比较喜欢用吉梦,第一呢是因为它啊,生图比较的方便, 性价比比较高。第二呢是因为它在亚洲面孔或者国漫的风格上理解力确实领先一些。把提示词粘贴进去, 然后注意一个比较重要的参数,画幅比例。因为我们要生成的是全身参考图,所以一定要选择竖屏比例, 比如说一比二或者九比十六。如果你用的是默认的一比一正方形比例,很容易出现人物被截断的情况,要么没有角,要么头顶被切掉,然后就可以点击生成了。但是请注意,不要只生成一次就满足了。 ai 图像生成有很强的随机性,每次出来的效果呢,可能差别很大,我建议至少生成五到八次,然后从中挑选一张你最为满意的作为最终的角色。底图挑选的标准是什么呢?主要看三个方面, 一、面部的清晰度,五官必须清晰锐利,不能有模糊或者变形。二、服装完整度,衣服的设计,颜色、细节是否和描述一致。 三、整体协调性,人物的比例,姿态是否自然,有没有多手指,衣服穿帮等常见的 bug。 选定之后呢,建议用极梦自带的高清放大功能,将这张图的分辨率拉到最高, 因为这张图后续要作为所有分镜的参考,分辨率越高, ai 在 参考时能提取的细节就越多, 这样呢,我们就完成了第一个角色的定型。光一张正面的全身像还不够,在后续的分镜制作中,我们的角色不可能永远只拍正面、侧面、背面四分之三侧面,这些角度都有可能用到。如果你只有一张正面参考图, 那么当 ai 生成一个需要侧面的角度时,他只能脑补,这就很容易导致不一致。 所以我强烈建议大家为每个主要角色额外生成一组三式图,包括了正面、侧面和背面。具体怎么做呢?有两种方法。方法一,用极梦的图生图功能,把刚刚定好的全身正面图上传作为参考,然后在其实中加入角色三式图 这类的关键词,就能生成我们需要的三式图了。方法二,使用 banana, banana 之类的专门做角色三式图的工具,操作非常简单, 把你的全身正面图上传,他会帮你推算出其他角度外观。完成三十图之后呢,把它和正面的全身图一起保存到我们的角色素材文件夹里。后续在制作分镜的时候,根据镜头角落的需要,选择对应角度的参考图上传, 就能大幅度提升角色的一致性。上面我演示的是女主角的完整流程,其他角色也需要走同样的流程,文字描述、提示词优化生成全身底图, 挑选放大生成三式图道具和场景的图片生成也是同理,我就不在视频里逐一的重复了,逻辑完全一样,大家可以课后自行的完成。最后一步,也是很多人会忽略的一步,把你所生成的所有的图片素材整理归档, 我建议建立这样一个文件夹结构,这样做的好处是,当你进入后续的分镜制作阶段时,随时可以快速找到需要的参考图和提示词,不用每次都重新翻找,效率会高很多。 好的,这就是第三节课的全部内容,我们系统的学习了从角色描述到角色定型,再到三式图生成的完整流程。大家回去之后一定要把自己故事里所有的角色都按照这个方法处理好, 因为下一节课我们就要正式开始制作动态关键帧了。准备好角色素材,我们下节课见!

逼自己一个月练完,其实你 ai 视频狂爆了,全八百七十四集,存下吧,真的很难找全的!挑战一个视频,让你完全学会 ai 视频!本套视频包含极梦所有基础操作讲解、爆款案例、实操演示,从 ai 技巧到 ai 思维,一口气带你入门 ai 视频。并且为了保证课程效果,课程配套的提示词以及配套脚本我都整理好了,三百三十三字起, 同学们大家好,上节课我们完成了剧本的创作,确定了我们创作的内容和方向。这节课我们趁热打铁,把地基打牢固,继续完成分镜脚本的创作。在本系列视频中用到的相关 ai 工具和操作文档都已打包好,留言三三三,打包带走。 在创作之前呢,我们先来明确一下剧本与脚本它究竟有什么样的区别?首先我们要知道剧本,它是我们漫剧的整体核心脉络, 整个故事的情节、故事的发展、冲突、高潮部分都在其中。它更像是一则故事的直观叙述,就像阅读一本小说一样,没有非常融洽的解释。脚本则不同, 他的内容会更加的繁复,包括了警戒场景,对于画面内容的描述、信号以及拍摄的时间。他更像是一本在制作这个故事完整影视作品时的一个指导规划书, 告诉我们在拍摄这一段时应当注意些什么,该按照什么样的方式来去制作。 到了这里,大家可能会产生一个疑问,那就是既然我们身上的分镜头脚本能够直接告诉我们, 在制作真正短片时,该在什么样的位置,用什么样的描述,设定什么样的时间,为什么还需要先让 ai 生成一个故事的剧本呢?这道理很简单,作为一个导演,也就是我们自己,想要制作出完整的故事,就必须要先深入对故事有一个清晰的认知, 知道故事当中的出场人物、故事的情节。所以相较于融长的脚本而言,一则故事的剧本能够让作为导演的我们像阅读一个短片故事一样,快速的了解这个故事都发生了什么, 这样在制作时才能更多的去打磨这个故事的细节,了解故事的前后逻辑。没有剧本, 我们就无法把控故事的方向。没有脚本创作呢,就如同空中楼阁,缺少具体的执行方法,同学们千万要记住别偷懒,一定要先写剧本,再根据剧本来拆解脚本。如果先写脚本再写剧本的话,就很容易出现故事逻辑混乱的问题。 好,那么明确了这点之后呢,我们就可以继续之前跟豆包的对话。上节课, ai 为我提供了三个剧本来一共挑选,为了便于演示,我选择了主角性格更鲜明的第三版。还记得怎么样按设计指令吗? 首先要给 ai 定身份,你是一名资深的慢剧脚本师,擅长将剧本片段转化成规范的表格式脚本, 然后定框架生成表格式脚本,表格列包括信号、场景、人物、动作、对话、音效。接着我们还要给 ai 明确基本的核心信息是基于第三版的剧本来生成表格式脚本。 那么这样呢,我们就可以得到一份以第三版的剧本为主要内容的表格式脚本。可以看一下记号、场景、人物、对话、音效基本上都在这里了,我们简单过一遍,看看 ai 给我们生成的内容, 那么到这里就结束了吗?当然不是,我们还要将脚本进行格式化的转换,来进行分镜的设计。 不过今天呢,我们就不做传统的分镜草图了,而是直接二合一,将分镜设计加上分镜画面的 ai 提示词来一起解决,这样能够将后续的图像创作更加精准,更加高效的直接衔接到我们 ai 图像生成工作中。我们首先要明确到两个关键的知识点, 一是分镜的核心逻辑,二是分镜提示词的必备要素。首先来看分镜的核心逻辑,分镜是分镜头的排列组合,核心逻辑是把脚本的文字内容拆解成一个个的连续画面,让故事更加的清晰。 这里呢主要掌握三个技术术语,第一个是景别,比如说全景、中景、近景、特写,它决定了画面的范围。第二个是镜头的运动,比如说固定镜头、推镜头、拉镜头、摇镜头等等,这决定了画面的动态。 第三个是构图,比如说居中构图、对角线构图、框架式构图,这类决定了画面的美感。这三个术语呢,就是分镜设计的基础。了解了分镜设计的核心逻辑之后,我们再了解一下分镜画面提示词生成了一些核心要素, 因为我们除了分镜要进行设计,我们还要把它转化成可供 ai 工具直接生成的提示词。那这里呢,还要加上什么东西?我们还要加上光影、色彩这些细节 总结起来就是一个完整的分镜头脚本,至少包含时间轴、信号、景别、镜头运动、场景、人物动作、音效对白等等等等。 我们掌握完这些逻辑和要素之后呢,接下来就是实操部分,回到豆包,继续在对话框进行对话,还是这个格式,首先定身份, 你是一个资深的慢距分镜师,擅长将故事脚本进行细致拆分,并转化为分镜脚本。然后给框架生成包括镜号、时间轴、景别、镜头运动、人物动作、对白、音效、画面生成提示词的分镜头脚本。 接着给出信息记忆之前已经生成好的分镜头脚本来进行生成。 ok, 我 们现在把它来点开看看,这样一个分镜头脚本呢就已经输出完毕了, 来看一下这个效果啊。首先是时间轴,可以看到每一到两秒就被分为一个信号,剪辑也非常细致的给我们拆分了出来,镜头运动呢,也写明了后面就是人物动作、对白、音效。最后是最关键的画面生成提示词, 如果觉得还是拆分的不够细节的话,还可以像我一样直接在对话框里使用自然语言进行修改或者补充你需要的要素。到这里,创意辅助的环节就讲解完毕了, 下一集我们将利用这些提示词和这些基本的信息来生成我们人物角色和场景。如果觉得这个视频对你有帮助的话,记得点点关注点点赞,我们下节课再见!

逼自己一个月练完,其实你 ai 视频狂爆了,全八百七十四集存下吧,真的很难找全的。挑战一个视频,让你完全学会 ai 视频。本套视频包含极梦所有基础操作讲解,爆款案例、实操演示,从 ai 技巧到 ai 思维,一口气带你入门 ai 视频。并且为了保证课程效果,课程配套的提示词以及配套脚本 我都整理好了,三百三十三字起,哈喽,大家好,我是林默老师。这节课我们要来分享如何让 ai 视频中的人物开口说话。一般情况下, ai 生成的原视频是不带音效的,很多时候人物的嘴唇也是动的, 面能动也是跟脚本说话中的嘴型是不一致的。那我们今天就来解决如何让 ai 视频中的人物开口说话,并且口型一致。这里我们会需要用到两个关键步骤,配音和口型 匹配。其实市面上配音的软件有很多,收费的,免费的,在线的、开源的,各种各样的都有。那如何选择一款合适的配音软件呢?我们具体可以从以下四个方面进行选择,发音标准性、音色丰富度、敏感表现力和使用成本。我们以音合成的技术能保证发音的标准,它提供每日免费的积分,在积分范围内 几乎免费。第二个,我们要看音色与情感,它提供超拟真角色演绎方言、男女青年等音色,其生动模式能生成丰富有表情的配音,非常适合角色对话。那么这节课我们就继续在恶龙骑士的脚本上介绍具体的操作方法,我们需要为骑士凯尔的几句 话配上关键的台词。首先我们进入极梦的首页,点击生成按钮,在这个下面我们要选择数字人,这里大家可以提前准备好素材,然后选择上传。这里老师拿出了上节课 ai 为我们写的恶龙骑士的脚本,有几个特定的画面需要给人物配音, 一起来看一下。我们可以看到在第三个镜头中,其实正面并景特写,他直视巨龙的目光,眼睛里没有任何恐惧,只有疲惫的坚定。嘴唇开合清晰,对应的台词是,我渴望终结这漫长的遗忘,为我的家族,也为被困于此的你。我们将这段画面的提示词复制到极梦,我们选择图片生成 先生成一个骑士凯尔的镜面特写照,注意我们选择的是十六比九的尺寸,点击生成可以看到这边已经生成完成,接下来我们选择右边,选择区内的对口型,就可以将这张凯尔的照片复制到数字人。在 生成之前,我们需要注意的是检查人物的图片,尽可能的要保持人物的面部清晰,没有遮挡的情况。系统为我们配了一个自定义的音效,我们点击可以调整声音,我们可以看到这里有很多声音,像我们的主角是一个男生,我们可以选择男青年,点击上面的播放按钮可以试听。欢迎使用对口型功能,让你的故事镜头徐徐不, 你可以根据自己的角色需要配一个合适的音效。我们回到脚本可以看到这里 ai 已经给我们写了提示,坚定的男生,我们回到极梦比较相符的音效,在这个里面沉稳的男音应该是比较合适的,我们点击试听一下,看一下,欢迎使用,感觉还不错。我们在角色这一栏说话框输入我们的提示词,接着我们来到脚本, 我们将骑士的对应台词复制给极梦 ai, 可以 看到提示词是,我渴望终结这漫长的遗忘,为我的家族也未被困于此的你。动作描述这里可写可不写,那么这里我们选择快速模式点击生成。如果你是会员的话,可以选用大师模式,它的效果是电影级表演,会比快速出图效果更佳。我们等待一下,视频已经生成好了,我们来看一下效果吧。我渴求终结这漫长的 遗忘,为我的家族也未被困于此的你。可以看到角色的动作以及口型也完全对得上生成的效果,非常的符合该 镜头的一个镜头语言。接下来我们来看一下第四个镜头。第四个镜头呢,是骑士的上半身照,他低头单膝跪地,胸口前,双手握住龙纹剑,剑锋朝下,写下背景是沙漠。我们来看一下这一条的生成效果,可以看到这个镜头是骑士凯尔正在召唤巨龙的一个场景。这张生成的效果都非常不错,我们寻找一张跟凯尔的形象 互吻合的照片,包括铠甲的形状等等,我们点击超清,超清完成之后我们点击下载。虽然 ai 给我们提供了一个具体的脚本,但是我们自己作为编导还是要思考一下。像这个景别的话,它主要是描写凯尔拔出龙纹剑,然后剑身泛着蓝光。那么从这个镜头来讲,我们需要的是一个凯尔拔剑并开口说话的照片,那么我们可以将镜头从中近景变为近景,我们 可以将这张图片发送到 ps, 然后将这个景调整为中近景模式,我们选择数字人模式,将刚才编辑好的图片导入极梦,导入完成后,我们选择语音,它需要专注的神情去召唤神龙,所以这里我们其实可以使用一个沉稳的男音来看一下这段的台词。 我们可以看到第四个镜头的台词是以龙翼之血呼唤古老之名,我们将它复制到极梦动作描述这里我们可以给他一个露出跪地姿势,照剑高高举起,迅速的插入沙子中。我们来看一下生成效果,我们可以看一下生成结果已经出来了,以龙翼之血 换古老之名,可以看到这个角色在该场景中表现的还不错,我们可以将这个视频进行下载,此时我们就已经生成了两个视频了,如果你觉得效果还 ok 的 话,可以点击上方的下载按钮,然后选择导出。导出之后呢就是一个视频的文件。除了极梦以外,其实可拎弯位或者是剪映都是有 ai 配音的功能的,比如说像旁白或者是记录片的解说, 可以直接使用它们进行配音。最后我们来总结一下极梦 ai 非常的便利,它有着丰富的音色,优秀的情感控制以及成本较低,可以满足大家的 ai 视频配 需求。它尤其适合像恶龙骑士这类需要角色情感注入的短片制作对其配音。这就是我们今天这堂课分享的 ai 视频配音的方法,通过精准的配音和口型的匹配,让 ai 视频的人物真正的火起来,与观众产生更多的情感共鸣。课后大家还需要多多练习,好的作品是离不开耐心的打磨,下节课我们将继续学习 ai 视频,我们下期再见。

ai 漫剧赛道的大结局终于来了!康菲由爱这个工作流的出现,直接宣布了比赛。只需要把小说丢进这里,大模型呢就能自动接管一切,推理剧情,生成脚本, 无需去研究任何复杂的提示词,也可以不用再去拣写智能分镜指令,它能直接生成连贯的电影级分镜剧本。最关键的是,它彻底解决了人物一致性的电影级分镜剧本。最关键的是,它彻底解决人物三式图、场景以及道具, 让主角从片头到片尾长得一模一样,还能一键使用任何想要的画风,古风、赛璐璐、国风三 d 日系动漫全部都应有尽有。全程云端运行,不吃电脑配置,每一个镜头的运镜转场都贴合慢剧调性, 就算是小白也能制作出像这样的大片效果。工作流教程我已经全部整理好了,三个六快速上车!

一天学习一个小技巧,今天要学的是 ai 漫剧,兄弟们这波真破防了,动画专业还在那画关键帧呢, ai 漫剧圈直接就开始丢核弹。说出来你可能不信,三个月前我还在为花呗发愁,现在每天睡醒第一件事就是看后台又进了多少树。不是我有天赋, 是我误打误撞踩中了这个赛道的命门。 ai 漫剧是什么?就是你刷到停不下来的那种动漫短剧,一集七秒剧情上头,他的赚钱逻辑简单到离谱,观众看上头了, 想看下一集,要么付费解锁,要么看广告,你拿分成。关键是做这个 ai 漫剧不需要你懂什么知识,甚至不需要你有多好的操作,只要你会复制粘贴,就能刷出传说级宝藏。本期视频我将会把刷穿 ai 漫剧的三部攻略详细教给大家,第一步,超爆款骨架。第二步, 锁人物参数。第三步,定发布节奏。相关完整的制作流程、工具清单和提示词我都整理成文档了,有兴趣的伙伴。 哈喽,大家好,接下来我将带大家从零开始来制作 ai 动画。那接下来的话就是我们的第一讲啊,我们先给大家讲一下这个剧本的创作,我们的这个 ai 动画,他的剧本是如何来进行创作的? 那 ai 剧本的创作的一个核心呢?其实就是精准的来提问啊。那我们怎么要做到精准的一个提问呢?就要掌握三个点,这三个点分别是什么做什么以及怎么做啊。那他们分别是什么的话,其实就是给我们的 ai 啊一个身份,因为我们的剧本大多数的情况下并不是我们自己本身来写出来的,对不对?那这个时候我们要借助 ai 的 话,首先你要给 ai 一个身份,那我们在提问的时候,明确赋予 ai 一个具体的贴合你创作需求的这么一个角色, 那一旦你给了这个角色,他就会决定 ai 的 思考的问题的角度和专业的一个深度。比如说我们看这里啊, 假设你是一个擅长啊动画的短视频的动画的一个编剧,专注于一分钟治愈的系列的一个动画的创作,那这个呢,其实就相当于给 ai 一个身份。那第二个啊,做什么?其实就是明确 ai 的 一个任务啊,清晰的直接的告诉 ai 他 需要完成什么具体的工作,对吧?啊?千万不要给一些模糊的指令。 那我们来看这个例子啊,请你帮我写一段啊,一分钟的动画的核心剧情要求围绕着陪伴主机,然后主角呢,是一只卡通的小猫, 这个就是明确任务。那第三个怎么做啊?也可以叫限定输出的一个标准,那为 ai 画定输出的格式啊,长度啊,风格啊等具体的一个要求吧。呃,比如说我们要求他情节呢,简单不拖沓,语言通俗,然后适合转化为分镜的画面。最后呢,给出三个关键的一个场景啊,大致的一个描述。 好,那接下来我们来看一下这个万能的题词框架啊,他的一个具体的应用来啊,这个其实就把我们刚才那个给他串联起来啊,假设你是一名擅长短视频动画的编剧,那这个就是给他的一个身份,对不对?然后 请你帮我写一分钟,写一段一分钟动画的核心剧情啊,围绕陪伴主题,然后主节是卡通小猫,情节简单不拖沓,语言通俗,对吧?这个其实就是做什么对不对 啊?适合转化为分镜画面,最后给出三个关键场景的大致描述啊,这个其实就是怎么去做啊?我们去给他一个标准。 那接下来我们来看一下,我们把它如果说发给豆包啊,来看一下,就是我们刚才这段提示词,然后你来看豆包给我们的一个返回啊。呃,我们这块用的是豆包,当然大家可以用其他的这个大模型也是可以的,比如说 dipic 啊,或者说千问其他的一些模型。但是大家对于豆包可能比较熟悉啊,我们就用豆包就可以, 那这个是他的一个主题,然后这是主角,对吧?整体的一个时长,然后核心的剧情,三个关键场景的大致描述,比如说开场的场景是什么,然后相遇的场景,还有治愈的 收尾的场景,每个大概是十五秒钟,因为我们现在应该视频最长的分镜的时间就是十五秒,他可以生成一个十五秒的。 那这个是我们第一个啊,就是一个实力啊,我们的一个提示词啊,那知道了提示词之后,我们接下来看我们具体的这个脚本输出的方式啊,我们给大家讲三种,我们先来看第一个,第一个就是直接来输出完整的一个脚本啊,他是比较适合想快速出稿,节省时间的一个 这个小伙伴啊,那他的一个题词,我们给大家写一个,比如说假设你是一名拥有十五年的视频动画创作经验的编剧,对吧?然后请为我创建一个一分钟治愈的系列的脚本啊,主题呢?卡通小猫,这跟我们之前是一样的,然后,呃, 主角啊,是卡通小猫,主题是陪伴,然后总共设计十八个分镜头,每个分镜头的时长呢不超过七秒,当然这个时长的话,我们其实可以自己去控制,那他给我们生成的画面呢?可能是镜头一五秒,然后镜头二几秒,然后镜头十啊几秒,对不对? 那我们来看一下具体啊,我们把它发给咱们的豆包啊,来看一下,总共呢是十八个分镜,对吧? 然后时间呢?啊,每个每都没有超过七秒,然后景别运镜,还有画面的内容,这个画面内容的话,基本上我们就是直接来生成这个画面啊, 当然我们在生成画面之前,咱要去把这里面所有的画面的内容呢,全部都要去看一遍啊,全部都要去看一遍,为什么呢?因为我们这种直接输出剧本的方式啊,可能有一些他不是特别的好去生成我们的图片, 我们有了剧本,下一步其实是把它变成我们的图片,然后用来涂声视频,对不对?那比如说啊,你看两只小猫依偎靠在这个墙角,然后静静看了一下这个画面,我们脑海里面可能比较容易想出来,但是 可能 ai 在 生成这个图片的时候可能不太好生成啊,包括这个,你看午后光影下,然后两只小猫呢卷成一团啊,意味着我们很容易想象这个画面,但是我们在做图片的时候,对吧?你拿到这个画面去做图片的时候,可能啊它生成出来这个效果呢,没有那么的好,所以说这个就是它的一个缺点啊, 那这种方式的一个优点也很明显,对吧?就是高效便捷,一步到位,生成了包含画面描述的完整的分镜脚本啊,就可以拿来直接去用,对吧? 省去了修改的步骤,然后直接用于 ai 的 这个生图啊,配乐都有,对吧?但它的缺点呢,刚才也跟大家说了,就是它可能会生成一些不合理的这个情节的转折,包括它在落地的时候啊,我们很难去复现它里面的一些复杂的一些画面的一个描述。 那这是第一种方式啊,就是我们直接通过咱们的 ai 输出完整的一个脚本啊,那我们接下来来看第二种方式,第二种方式的话,就是先生成故事,然后再生成脚本,那这种方式他比较适合新手啊,他不至于生成的这个 剧本的后面你要再去修改,那我们第一步的话,就是先生成一个故事的梗爱啊,让 ai 来创作一个逻辑完整,情节简单的短片故事,然后确保每个情节呢,他容易被转化为具体的画面。那第二步的话,就是我们转化为分镜脚本,对不对? 基于故事生成简单的一个分镜描述,然后提示词中加入啊,单镜头不要出现多景别的切换啊,如果说出现了多景别的这种切换的话,我们在生成图片或者视频的时候,他不是特别的好做啊,容易出镜。那我们给大家看一下这个视力啊,假设呢,你是一个擅长短片治愈系的故事啊, 创作者的一个作者,那请你写一个以卡通小猫为主题,然后为主角啊,主题为陪伴的短片故事,就是我们先让他写一个故事,对吧?那可能生成的故事是这个样子,然后我们接下来,哎,再根据我们的提示词,对吧? 把它转换为具体的分镜的一个脚本啊,就是请你根据我提供的这个故事呢,然后生成分镜的脚本啊,单个分镜头不要出现多景别的切换,这个是根据咱们的经验来的,如果说你出现了多个景别的切换,你在生成图片或者视频的时候,特别啊,那个效果基本上是达不到我们满意的那个效果。 好,那这个呢?他接下来就会生成具体的分镜的这个脚本。好,我们刚才给大家讲了一个剧本脚本的一个生成,那我们接下来看一下,如果说这个剧本啊,我们自己不是很满意的话,我们可以去做一个修改啊,那就是剧本的一个修改,那怎么修改呢?其实这个就是仔细阅读,然后根据自己的经验进行一个修改。 比如咱们拿刚才的这个生成的这个故事举例的话,我们来看这里啊,既死安魂啊,救死方啊,救死方是苍生之望对吧? 聚义抗婚对吧?这段的其实不是特别的白话,对吧?如果说我们想,呃,把它变得更通俗一点的话,其实可以把它变成白话,然后包括这段对不对?需要至纯之人自愿以心头血啊为引这个心头血,大家想一个问题啊,我们后面要去制作这个图片或者视频的时候 啊,他能不能画的出来,对不对?而且心头血的话,我们其实可以把它换成什么?以鲜血为引,对不对?不一定要心头血啊,心头血是 就是我们很难表述,是不是?然后还有就是这里啊,取时刃,取次腕取血啊,呃,应该时刃的话,我们可以把它换成什么?换成这种匕首啊之类的,对不对啊?次腕取血,然后把这里再去做一些修改, 然后感动天感动地,终成九离圣,药圣啊,踏遍山川,对不对?这里就是我们看这个故事,然后根据自己的一个需求啊,进行一定的修改,比如说这里心头血啊,然后时任啊,我们可以做一定的一个修改啊,这个就是根据大家的一个经验来去谈,好吧? 好,这个是一个剧本的一个修改啊,剧本的修改的话也不一定说,哎,就是啊,我们完全要去修改,对吧?只是我们有的时候他逻辑不通啊,我们在做视频的时候,或者在做图片的时候,大家要保证基本的逻辑是要通的,如果说你写了这个脚本他逻辑不通的话,你后面做成视频的效果他一定不好,对不对?所以说 咱们的这个模型写出来的脚本,或者说你根据别人写出来的脚本一定要去啊做修改。我们刚才给大家讲了分镜图片的一个生成,我们接下来再来看一下长镜头的一个图片的一个生成啊,那长镜头的话,这里也可以分成什么?有镜头移动和固定镜头,还有就是循环画面, 那他们的难度呢?就是依次的是减小的。我们先来看第一个,就是有镜头的一个移动啊,那我们可能要先生成一个什么先生成一张图片啊,就是拍摄一个人物背景,当然这个大家可以随便找一张图片都可以, 我们为了体现他有这个镜头移动的话,就生成了一个什么人物,走在小巷子中,然后小巷子两侧呢是靠墙的位置,是一排什么小池塘,然后向远处延伸啊,比例十六比九。那大家来看这个图片的一个生成的一个效果, 大家可以可以看到这个还是比较符合我们的一个小吃摊的,对不对?这个也还可以,对吧?那我们选择一张图片就可以了,我们随便选择一张图片,然后我们来去生成什么?生成这个 移动的一个镜头,对吧?来看这里啊,就是镜头紧紧跟随人物向前移动,大家来看一下这个效果,就是用的这张图片啊,我们要上传这张图片, 然后选择视频生成,这里面的话大家注意啊,如果说大家没有开会员的话,你可能要等很久啊,所以说我建议大家还是开一个,如果说你想做这个短剧的话,我觉得这个会员还是要开的,不然的话你一个视频生成可能就要五六个小时啊,对吧? 所以说还是还是会慢一些啊,当然大家在学习阶段的话,你可以用这种模型,就一点零的这个模型,对吧?这个可能就不需要等,然后我们通过的就是首尾帧啊,这里可以选择十秒,十秒,那我们这里啊就生成一个五秒的 来这里整体的效果还是 ok 的, 对吧?没有什么违和的地方,两边的小池塘啊,也是符合这个画面的,对不对?那如果说我想生成一个十秒呢, 对不对?那大家可以选择这款十秒,当然我们还有另外一种方式,比如说他这个最长的话支持就是十秒,对不对?那比如说我想生成一个十五秒的怎么办?那可能一次就生成不完,对不对?那一次生成不了这种十五秒的视频,我们可以采用这种方式啊,就是,呃,我们先把这个, 大家可以把这个视频呢停到最后一针,停到最后一针之后,然后放大一下把这个截个图,截个图之后你把最后一针呢?一定是最后一针啊,他这个图片,然后放到什么?放到咱们这里面啊?放到这里当他的手针,然后我们再去生成一个,大家看啊,这里就是接着上的, 那这样的话大家就可以生成一个时间比较长的一个长镜头的一个移动的,对吧?你看我们,然后我们在剪映里面把这两个素材呢直接拖进来就可以了。拖进来之后呢,大家来看一下效果。呃,我在这里播啊, 你看整体的话,就是他在切换的时候,整体的话还是没有什么太多的尾壳感的,对不对?就是因为我们用的是最后一帧,然后再去截图,再让他生成的话可能就会造成什么, 他在进行切换的时候,大家注意看他在进行切换的时候肯定不会,就会不自然,对不对?你看我们这个切换是不就非常自然,他手部有一个动作啊, 对不对?你看起来就非常自然,他是连贯的,当然有人说,哎,那我这里如果说不适合连贯怎么办啊?大家可以到这个转场里面啊,到这个转场里面,然后去搜索一些,比如说特效啊,觉得这个可以放到中间一些特效的,对不对?比如说我们可以随便我随便点一个给大家看一下这个效果啊, 来这里啊,就是这种特效,对不对?电影里面咱们可能有的时候会看到这种特效,然后大家就可以找一个合适的放到这里面,对不对?放到这里面,然后啊让他达到一个转场,就是更加什么更加丝滑的一个目的, 那这个呢?就是我们的啊,第一种方式就是有镜头移动的,对吧?那如果说人物所有的咱们都在一个镜头里面,他是一个固定镜头的话,那这个时候的话,我们就要用到什么他的首尾针的一个图片,我们这个时候就不能光用到手针的图片,他可能是不够的,对吧?因为我们要在一个镜头里面来完成这个事啊,比如说给大家看一下效果啊, 比如说这个吧,来这个视频,包括这个视频, 你看我的提示词其实只有一句,就是人物蹲下来采药,对不对?然后来看这个就是人物走到药槽旁,然后开始采药,他用的就是什么?就是手针的图片和尾针的图片。 好,我们刚才给大家讲了分镜图片如何来生成,那我们接下来看一下这个长镜头的一个制作,我们会给大家讲三种长镜头的一个制作,那我们先来看这三者长镜头啊,分别有哪些?第一个的话就是一镜到底 相机呢?跟随主体运动,然后呢实现一个什么空间的这个转换。然后第二种就是我们的固定,固定镜头啊,一镜到底机位呢?相对于固定,然后画面中的这个元素,比如说天气啊,人物啊发生一些变化。 然后第三个就是一些循环画面,循环画面的话就是整个画面我是一个无限循环的这么一个状态,那他的制作难度呢?从 高到低啊,就是最难的肯定是咱们的一镜到底的这种,然后接下来是固定镜头的啊,最后呢就是这种循环画面,那我们分别来看一下这几个我们怎么去做? 我们先来看第一个叫镜头移动啊,移动啊,一镜到底,那他就要有一个手帧图片,那我们要生成一个手帧的一个图片啊,我们根据这个图层视频,然后把它做成这种一镜到底的,那我们来看一下怎么去做啊? 我们还是这个时候借助吉梦啊,比如说我们啊先生成一个图片,对吧?摄影机在人物的一个后背,然后呢人物走在小巷子中,小巷子两侧呢,靠墙的位置呢是一排小石滩,然后向远处延伸,比例呢十六比九,这个就是看大家做的那个视频的比例啊, 是多少,如果说你想做十六比九的,那就十六比九啊,当然我们可以做九比十六的横屏的,那这个时候大家就可以选择一张图片啊,比如说我觉得这张图片不错,对吧?大家就可以选啊,看这个时候, 那我觉得这个图片不错,那接下来的话,我就可以啊,来把它做一个视频的生成。好吧,那视频生成的时候,我们这块啊,他会有一个什么参考图,就是大家直接把这张图片啊,把上面这张图片呢哎拖进来,然后写一句啊,镜头呢紧紧跟随人物向前移动, 然后当然他一这块有一些其他选项,比如说这个 sims 发子,就是我们用的是这个,我们用的是模型这个当然大家如果说没有 vip 的 话,呃,可能要排队很久,所以说我们现在用吉梦的话,基本上大家还是要有会员啊,如果没有会员的话,他的视频生成的话会非常慢。 然后他这块有几个模式啊?第一个就是全能参考,第二就是首尾帧啊,你比如说有一个首帧图片和尾帧图片啊,那我们就可以把这个首尾帧呢连成一个视频啊, 如果说没有的话,我们只有一个手针图片的话,那我们就可以选这个,让他去做一个全能的参考。然后还有一个智能多针啊,就是比如说我们的第一个画面,第二个画面,第三个画面、第四个画面,你都有对应的一个图片,那我们就可以啊,用这种智能多针的方式来把它变成一个视频 啊。那我们如果说用全能参考的话,然后这块可以选择它的比例以及时间啊,他现在的时间越长啊,他的这个消耗的积分呢,肯定就越多, 对不对?我们生成一个五秒钟的视频啊,看才五十五,对吧?就是我们如果说用两个五十五的这个两个五秒钟啊,把它变成一个十秒钟,对吧?我们来看一下啊,一百一,对不对? 这个就看大家自己个选择。如果说我们想五秒钟一个啊,就可以生成五秒啊,就看咱们那个你想做的视频是做多久啊?咱们一般的这种长镜头的视频就是五到十秒之间,很少说有十五秒的。 好,那我们有了这个视频之后的话,哎,大家可以看一下这个效果啊,人物向前移动,镜头呢也跟着向前移动,对吧?再一起往前走,那如果说我想针对这个让他继续的来生成,比如说我想生成一个十秒, 那我们除了这种方式之外,就直接在这块选十秒啊,还有种方式的话就是我们可以来在这里啊,我把这个视频放到剪映里面,然后呢导到最后一针啊,导到最后一针后面这个大家先不用看,先把它拖到一边,就找到这个最后一针啊,然后呢他这块有一个叫导出静止画面啊,静止画面 我们把它进行一个导出,那导出完成之后的话,其实我们可以啊在这里,然后呢把它的什么这个参考内容, 我们到桌面上找到我们刚才的最后一张这个图片啊,同样的我们让他这个题词都是一样的,镜头呢,紧紧跟随人物向前移动啊,然后呢这个时候五秒就可以了,或者说啊你选择四秒也可以, 咱们一般的长箭头一般就是五到十秒之间,不会说十五秒啊,人物呢都一直在移动,对吧?没有任何的独白啊,这个一般不会,所以说我们最长就十秒,十秒的话我们可能还要去做一些什么, 那做一些倍数,或者说剪辑我们最终的长视频的话,可能也就是七秒到八秒之间啊,那这个时候大家看到他就会生成啊,接着什么?为什么要这种生成? 就我们生成是一个五秒钟的,对吧?为了延续啊,你的视频的话肯定是在最后一秒钟,他的人物的一个形象啊。哎,我暂停啊,人物形象是这个样子,对吧?你总会啊,他要继续往前走的话,你总要衔接上,所以说我们找他最后一针。如果说你不用啊,比如说我用这个, 那他现在人物走到这了,他要继续往前走,对不对?你这个视频等播到这的时候,然后你再从第三秒再往后接的话,就整个画面呢?就不流畅啊,所以说我们要用他最后一针。

宝宝别怕,妈妈在。听见妈妈的声音了吗?妈妈会一直陪着你,妈妈需要休息,让我再看他一下。宝宝不哭,妈妈在。还没睡啊?不好意思,还坐着不 舒服,你睡吧,妈妈不困 啊,抱紧妈妈马上就到, 抓住自己脚背先给孩子退烧,我马上交。妈妈,你也死了,妈妈没事,你别怕,妈妈在,妈妈,我不想进去, 你看里面有好多小朋友,你会走吗?只要你回头,妈妈就在门口,小朋友该进去了,勇敢一点,妈妈看着你。 妈,你手怎么了?小伤,今天厂里有点忙,你别做饭了,书包坏了吧,妈妈明天给你买新的,我不要了,你读书的东西妈妈不能少,你别管我了。不是想管你,我怕你走错路,你根本不懂我。饭放门口了,羊肉都不好吃, 妈,别塞了,我自己会照顾自己,外面冷,喂药放厕带,我都多大了,车快开了,要是累了就回头,妈妈还在。 妈,我是不是很没用?谁说的,我失败了,我不知道去哪,回家妈妈给你煮面,我怕你失望,天塌下来你先吃饭,回家吧。妈妈在。妈, 你头发怎么白这么多灯光照的。你的腿怎么了?老毛病,不碍事,你饿不饿?从今天起你别一个人扛了,我照顾你。傻孩子, 妈妈不累,妈妈是不是拖累你了?你抱我的时候从没嫌我拖累你,我有点怕。别怕,以后我在。母亲节快乐,爱你老妈。

逼自己一个月练完,其实你 ai 视频狂爆了,全八百七十四集存下吧,真的很难找全的。挑战一个视频,让你完全学会 ai 视频,本套视频包含极梦所有基础操作讲解、爆款案例、实操演示,从 ai 技巧到 ai 思维,一口气带你入门 ai 视频。并且为了保证课程效果,课程配套的提示词以及配套脚本我都整理好了,三百三十三次取。 哈喽,大家好,我是林默,今天上线,想跟大家说个事,最近好多人在问, 哎,这极梦三点零 pro 不是 去年才刚上线的吗?怎么二月份又出来一个二点零?这两个到底有啥关系呢?那么作为新手小白的我又该学习哪一个呢? 说实话,我看到他今年二月份刚上线的时候也是一脸懵逼,两个版本相差就隔两个月,名字还是反过来的,三点零在前,二点零在后,听着就像降级了一样。 后面我仔细去扒拉了一下,发现这两个根本就不是一个东西,所以今天想花几分钟跟大家一起来唠一唠这件事,等把这两个模型的底层捋清楚了之后,后面你学什么都会顺的。 我们先说一下去年刚出来的三点五 polo 模型,用大白话一句来概括的话,它最大的功能就是让 ai 视频终于有人味了。 在三点五模型还没出来之前,我们要做一个开口说话的视频,非常的麻烦,要先把片子拖进剪映, 对着视频轴一帧一帧的去对口型,配一个脚步的声音,还得自己找个素材拖到阴鬼中一帧一帧的去剪。 那么出了三点五模型之后,我们就书写一个简单的提示词,让人物开口说上海话,生成出来的人物就自带上海话的口音, 在口型匹配上还能对得上。你要是想生成一个雨滴打在伞上的声音,它也能够完成,自然地把声音过渡到画面中,这就是它最大的能力,音画同步功能。 那么说完了三点零 pro, 再让我们来看一下这次升级的 cds 二点零。 cds 二点零呢,解决了另一个让我们一直头大的问题,那就是为什么我给了参考图, ai 还可能生成另一张脸,又或者是我写了一个慢动作转身,角色却还在原地抽搐, 你有没有发现,这根本就不是画质的问题,这是一个听话的问题,二点零就是来控制这个模型,让他更加的听话。这两个模型他底层的架构是完全重新书写的。 这里大家需要注意一下,不要把这个二点零当成了三点五 pro 的 升级迭代版,它们是发展了两条路线, 最重要的能力就是更加的可控,更加的听话。接下来呢,我给你们举几个实际的例子,你们可以感受一下。 就让我们先来到极梦的首页来进行实操演示一下,可以在搜索栏中搜索一个带珍珠耳环的少女, 可以看到这里有很多优秀的作品。我们点击进入一张图片,我们使用这段提示词,然后将图片生成改为视频生成,使用这段提示词, 这里我们先使用视频三点五 pro, 比例我们选用九比十六 先来生成,看一下效果。接下来我们再来对比一下二点零的模型,我们将视频三点五 pro 调整为极梦二点零快速模式,同样使用首尾帧,保持比例九比十六不变。我们再来生成看一下效果。 我们来看一下这两个模型生成的效果。先来看三点五 polo, 从视频中我们可以看出,同样的提示词下, 在使用了带珍珠耳环的少女这一个固定的名称。三点五理解的是这个女孩是一个带着珍珠耳环的少女,她学习到的是这张图的色调光影, 然后画出了一个他理解的少女,深沉的虽然也是个女孩,带着珍珠耳环,但是他的五官却是 ai 自己编的。我们再来看一下在二点零模型下, 不难看出,在二点零模型下, ai 在 处理上面更加的智能,它深刻的解析了我们的提示词内容,并根据我们著名的画作,戴珍珠耳环的少女这张人物角色的形象特征, 构图视角,人物衣着做了更精确的描述。就如某位大佬石侧说的那样, 二点零模型可以仅凭一张办公室楼的正面照,能精准的还原楼体背面的布局,这已经不是画的像的问题了,这是三维空间的推理能力。 接下来我们再来看下一个场景。在三点五的模型下,如果你想要复刻一个电影命境, 就得用文字进行描述来看,我这里有一个真人写真的图片,一个英俊的侠客少年。我们将图片生成调整为视频生成,然后我们将侠客的图片 拖入我们的手针,此时我们需要进行文字描述。这里我给出的提示词是男子拔剑之后在院子里练剑。模型上面我们选用视频三点五 pro 生成一个五秒的视频。我们先来看一下生成效果, 我们来看一下三点五 pro 生成的视频。 从视频效果可以看到,人物在进行拔剑运动的同时, 对剑鞘和剑柄还不能很好的理解,以至于画面出现了错乱。接下来我们再来看一下二点零时代,同样的人物会产生怎么样的效果。我们将模型从三点零改成二点零, 这里我们将首尾帧改成全能参考。我们使用同一张人物角色,并上传一段武打视频, 我们可以看出在二点零模式下,我们可以上传一张竞争图片加一段视频,此时我们先不使用提示词,我们保持尺寸比例的不变, 生成一段五秒的视频。来看一下二点零模型能否理解我们的意思,我们来生成看一下效果,我们来看一下角色五件的视频, 从视频效果不难看出,他将我们的男主融合到了我们的视频场景中, 形成了一段双人对打的视频,场景跟人物融合的相当完美,没有明显的拼接痕迹,角色的一致性保持的相当不错,和场景进行了自然的衔接过渡,这就是极梦二点零的能力。 第五个呢是分镜的修饰能力,在视频三点五模型下,虽然也能做长视频,同时它也支持首尾帧以及视频段落的拼接, 但是它的逻辑是拼接完第一段之后,第二段要接着生成再进行拼接,而二点零的逻辑是分镜驱动, 他支持按分镜脚本逐一生成。我们来看一下他的使用效果。好来看到我这边,我让豆包给我写了一个十五秒的小短片,让他给我出了分镜脚本, 可以看出他这里给了我五个镜号,分别对每个镜头进行了描述。接下来我们对这个表格进行截图, 那么我们将截取的图片放入即梦中。 这里我们使用二点零模型全能参考的模式,我们将五秒的视频转为十五秒,我们来深层看一下效果,我们来看一下它的分镜修饰能力。 从视频的效果可以看出, 它根据我们的分镜脚本进行了故事片段的生成,整体的色调以红色为主基调,生成了角色和场景一致性的连贯视频。 视频中在跨越镜头时依旧维持了角色的外观,并进行了光影逻辑,美术风格的一致性,没有拼接的感觉,视频的整体效果较为流畅。 来看这里我上传了一张图片,接着我们再上传一段音频,可以看到此时我们有了一张参考图和一个音频,这里我们不使用提示词,我们选用二点零模型,在全能参考这个模式下 来生成一段五秒的视频,看一下效果。 好让我们来看一下这条音频生成, 从视频的效果可以看出,二点零的音频能力是驱动式的,正如我上传的这段音频, 他在保持了我们人物角色一致性的同时,对这段音频进行了故事的联想,让人物在场景下自然的说出这段音频,形成逻辑上的闭环。 从角色的口型和动作以及表情来看,和这段音频的内容相当的匹配。 我们同样使用模型三点零,在视频三点零 pro 模式下对提示词进行描写,接下来我们生成一个五秒的视频来看一下效果。 我们来看一下三点五 polo 模型下音频的能力。从视频效果可以看出,三点零模型下的音频能力是深沉式的,比如我们写下雨天, 他就为我们配语声,如果我们写的是弹钢琴,他就为我们配钢琴音。如果我们写的是方言,如这里我使用的是日文,他就会为我生成相对应的口型。 如果我们什么都不写, ai 也会给我们进行编排,但是不会像二点零那样 进行更加智能的生成,这就是两者的区别,那这两者谁更高级呢?其实用途不同,但有一点可以肯定,二点零的音频同步是原升级的,而不是后期对轨。 最后我们来讲一下政策关系,二点零模式下暂时不支持输入含真人的照片或视频来作为主体的参考, 目前字节正在针对这一个情况进行紧急优化,期待后面能够更新开放使用。那么这节课我们就将二点零的几大核心和三点五时代进行了对比。 那么我们这门课呢,主要是讲解二点零的几大核心内容,包括我们说的认脸、超动作、对口型、读表格 等这几大核心能力一条一条的带你亲手跑通,希望你学会了这个教程之后 再去制作自己的视频,你会发现原来 ai 真的 能听懂人话。好的,那本节课内容就先学到这里,我们下节课不见不散!

已经八年了,我今年三十一岁。二十三岁,一场车祸彻底改变了我的人生,脊椎损伤的变故让我深陷五年抑郁症, 困在黑暗里无法自拔。上次你教我的那个轮椅转向技巧,昨天终于练会了,太棒了,下次我们可以一起试试坡道练习,我带你走那条新修的无障碍通道,纵环驰域,走出阴霾,成为桐涛老师新疆的日出, 该去看看 看,这样就能和雪山合影。

啊, 要开始了吗?先使用这个模板,然后在这里选做同款,就会自动跳转,在这里我们替换自己喜欢的角色描述词,这里可以改,也可以不改,在这里直接生成就可以了。