逼自己一个月练完,其实你很会 ai 视频生成,全七百四十二集存下吧,真的很难找全的。本视频耗时两个月,制作共计一百二十小时,带你一口气从零基础小白入门进阶。由于视频太长,本套视频分期发布,本期带你搞定极梦基础操作 怎么样?刚才这段视频看起来是不是还挺专业的?这就是现在 ai 视频工具的强大之处,这些画面全都通过 ai 来生成。 现在只要你有创意,并能清晰的把你的想法说给 ai, 也就是学会怎么写提示词。你想要什么样的画面,镜头的感觉和节奏是怎样的,即使你不会画画,不会拍摄,一样可以做出惊艳的视频。 接下来的内容,我会一步步带你从零开始,完整掌握 ai 视频的制作方法。除此之外,在本系列视频中用到的 ai 工具、提示词、速查脚本、参考工作流,还有目前 ai 视频的热门玩法,我都会整理起来,打包放到下方的置顶评论,有需要的伙伴可一步获取。 今天带大家解锁这款目前最主流的国产一站式 ai 创作平台吉梦。我们来到吉梦的首页,首先我们可以注意到它的界面分成了三大区块,第一块是上方的横板工具栏,它这里包括了图片生成、视频生成、数字人和动作模仿四个常用功能选项。 接着第二块是下方的 ai 作品展示区域,这里有非常多样的 ai 创作的作品,有发现选项下的图片作品。然后我们切换到短片选项下,还可以看到视频作品,我们点开一个看下效果。 这里是早间新闻,本是金城突发异想陆家嘴鲸线巨型雪王机甲,他这个是走的电影预告片的形式,可以看到他这里选用了最近热度很高的蜜雪冰城。雪王的一个主题, 在很多细节上也都做了处理,比如画面当中的一些文字。上海大炮准备完毕,安卓预警核心战备防御完毕。 那像这样一个视频,我们如果只看他的其中某一个分镜,其实元素也不算很复杂,但整体上完成度还是很不错的。 上海即将落成这样一座非凡的城市, 希望能为人类换取一线生机。我们再来看一看写实风格的视频作品, 我叫陈媛,我是住在东海市的幸存者,我已经三年没有见过任何人了,如果有人在外面,请与我联系。 胖虎,尝尝我给你新做的猫粮。可以看到 ai 对 于人物、动物场景的刻画也是十分的细腻,除了人物稍带有一些 ai 感外,其他的元素我们如果不仔细看的话,可能都不会怀疑这些是由 ai 制作。三体什么时候到货。 虽然基梦可以直接用提示词生成视频,但是要制作这些质感比较好,完成度高的视频,我们还是需要靠参考独家提示词的方式去精准控制它的生成。 接着我们回到之前的界面,注意到这里的搜索栏,我们可以输入任何我们想要搜索的内容,比如我搜索蔡叉叉,他就会展示与搜索词关联的结果。我们点开一个作品,可以看到右侧会展示该作品用到的提示词,所用的模型以及比例等。最后一块是页面左侧竖板工具栏,我们点击里面的生成, 此时就来到了我们最主要的工作区,这里的功能选项也是图片生成,视频生成,数字人和动作模仿,与刚刚首页上方的工具栏是一致的,之后的课程中我们都会依次学习到。接着我们点击资产,这里是存放我们所有通过即梦生成的素材以及本地上传素材的区域, 他按照图片,视频,画布,故事还有音乐对不同文件进行了分类。接着我们点击画布,此时会弹出一个新页面,那么在这个页面里我们可以对图片进行细致的处理, 可以点击上传图片,上传我们的本地图片素材,也可以点击纹身图或者图生图让 ai 生成图片素材。还可以选择上方的画笔工具,粗略的绘制一个草图。我们这里随便上传一张本地图片,然后可以看到在上方出现了一横排工具栏, 功能包括局部重绘,扩图,消除、细节修复、超清以及抠图。具体要怎样运用这些功能,我们会在后面的课程中详细学习。我们回到之前的页面,看到这里的会员标识,上方显示的数字是我们剩余的积分数,我们点开它 可以看到这里面会显示你的会员订阅情况,以及多个档位的会员订阅选项。目前非会员及梦每天会发放六十到八十的积分,那大家可以根据自己的实际需求酌情选择白嫖或者付费。那以上就是本节课的全部内容, 如果对你有所帮助,还望多多三连支持一下,下节课我们会详细学习图片的生成,感谢你的支持,我们下节课再见!大家好,今天我们来学习图片的生成。有些朋友可能会想问了,我们不是学 ai 视频制作吗?为什么还要学 ai 生图呢?我们需要清楚的是,目前 ai 视频生成的三种路径,分别是纹身视频、图生视频、 视频生视频。纹身视频也就是通过文字描述直接生成视频,它是一个从无到有的过程,有较好的创新性,但难以精确控制,比较适合用来生成一些相对抽象写意风格的视频片段。图生视频也就是以参考图片为基础,选择性的添加一些提示词,或者通过关键帧的控制, 以此来生成一些高完成度的视频,而最后的视频生视频的视觉风格迁移到 b 视频上。 那在这三种生成路径当中,我们最主要去掌握的就是图声视频,因为在绝大多数情况下,我们是需要对画面进行一定程度的控制, 那在实际的操作中,我们会发现,很多时候我们没有办法很快的找到符合我们需求的参考图。因此想要学好 ai 视频的创作,学会 ai 图片生成也是不可或缺的一步。我们来到图片生成的界面,可以看到在左边的方框这里,我们可以去上传图片,然后在右边这个输入框里,我们可以输入我们的提示词, 我们首先来试试纹身图,在这里输入提示词,然后生成。稍作等待,我们就得到了一组纹身图的成品。 然后我们再在现有提示词的基础上上传一张参考图片,再来生成看一下,那这就是我们图生图的成品,不难发现,比起纹身图,使用图生图往往能够更好的控制,达成我们想要的效果。那要想熟练的运用图生图,这里我们要知道一个非常关键的知识点,我们选择一张图片上传, 然后我们仔细看一下这个界面,在图片左下角这里,我们可以调节它的一个参考强度,这个数值越高,参考图对于影响最终生成图片的权重就会越大。 然后旁边还有一个抠图的选项,我们继续往下看,这里提示我们选择要参考的图片维度,也就是我们想要参考这张图片的哪一个方面。第一个智能参考,它是以整张图片的各个元素作为参考对象,然后我们可以通过提示词对图片的局部进行一个修改。比如我们这里上传一张图片,然后在这里输入 图片上的背包,换成浅绿色,那我们就可以得到一组只更换了原图背包颜色的一组图片。第二个角色特征,他会识别出图片中的角色,然后捕捉一整个角色的特征,这对于我们控制角色的一致性会有很大的帮助。那我们这里也上传一张图片,然后让他在马路上滑滑板。 好,那我们可以看到他保留了原本角色的发型以及服饰搭配。第三个人像写真,他是用来捕捉人物的一个面部特征,比较适合来做一个换脸的效果。 比如我们上传一张图片,它自动识别,并用蓝框标出了面部,然后我们给到一组提示词,它这里生成了两张二次元风格和两张写实风格的图片,然后保留了原图人物的五官特征。 第四个,主体识别,它会识别到图片中的主体,这个主体可以是人,也可以是动物、物件等,然后把主体和背景分离开,我们上传一张图片,看下效果,输入提示词生成,我们就得到了一组更换了背景的图片。第五个风格模仿,这个就很好理解了, 就是参考图片的艺术风格。同样我们这里上传一张图片,然后输入提示词,这样我们就得到了原图风格一致的一组图片。 第六个,边缘轮廓,我举一个例子你就能理解了,想必在座的各位一定有刷到过这种图片的,那这个呢,就是参考了某位哥哥的经典姿势轮廓生成出来的。第七个,颈身会用到这个参考维度的情况,通常我们这张参考图,它会有一个比较突出的层次感和纵深感, 通过参考他的景深,我们可以凸显主体并虚化背景,增强了生成图片的镜头感。第八个,人物姿势,这个也很好理解,就是捕捉出图片中人物的姿势动作。我们上传一张图片,选择人物姿势,然后给到提示词, 他就给我们生成了一组与原图人物动作一致的图片。那在了解清楚图片的不同参考维度之后呢,我们再来看一下这几个生图模型。目前节目这里一共是有五款生图模型, 分别是三点一、三点零、二点一、二点零、 pro 和二点零。我们这里通过同样的一组提示词,分别用这个五款模型生成一次,看看效果会有什么样的一个区别。 那现在五款模型都生成好图片了,我们来看一下。首先是二点零生成的这组图片,就算抛开质感不谈,像后面的行星环也有不同程度的基变。然后是二点零 pro 的 这一组,可以明显感受到的是,它整体的光感会更加突出,但是仍具有较强的塑料感。 接着是二点一的这一组,也是延续了二点零 pro 组较强的光感,但是塑料感得到了一些虚弱。再来看三点零的这组,不难发现这组图在质感上有了非常显著的提升,已经接近电影大片的感觉,但是部分地方,比如人物投影以及后面的行星还存在不同程度的瑕疵。 最后是三点零 pro 这一组,可以看到它不论是在画面质感还是氛围渲染等方面,都要比其他生图模型更加出色。基于这五款生图模型的表现呢?绝大多数情况下,大家直接选用最新的模型即可。 那以上就是本节课的全部内容,如果对你有所帮助,还望多多三连支持一下。下节课我们会开始学习视频生成,感谢你的支持,我们下节课再见。 大家好,今天我们来学习视频的生成,我们之前有提到过,目前生成视频的两种主要形式是文声视频和图声视频,那现在我就带大家一起尝试用这两种方式来生成视频。我们来到视频生成的界面,我们在文本框这里输入一段提示词,下面的选项我们先保持默认,然后点击生成。 好,那现在吉梦已经生成出来了一个视频,然后我们再点击这里去上传一张参考图片,点击生成一下。好,我们来看一下添加了参考图生成的视频效果,那这个视频相比于刚刚的视频,它不仅与参考图片更加的贴合,同时也因为参考图精致的细节,让视频讲解官感提升了不少。 那对于两种生成方式的选择呢?如果你想生成比较短的,创意性强的视频,那么就可以选择采用纹身视频的方式。 反之,如果你想要制作稍长一些的,需要精准控制的视频,那么就更适合采用图声视频的方式。现在我们再来看一下下面这一行选项,从左到右依次是选择视频模型、视频比例、尺寸,还有时长和运镜等。 这里我们着重来看一下不同视频模型它的一个区别。首先是 s 二点零模型, s 二点零模型它可以选择画面的比例,但是它的分辨率是默认无法选择的,时长也只能选择五秒。 然后是 s 二点零 pro, 它和二点零的选项是完全一致的,粉能够去选择画面的比例,分辨率和时长是不提供选择的。大家看到三点零模型,是不是一下子就感觉多了很多选项?首先呢,这里有一个新增的首尾帧选项, 点开之后还可以切换到智能多帧,那这个智能多帧呢,是即梦在八月份新推出的一个功能,稍后我们会详细讲解这两个功能的使用。我们先继续看右边的选项,在这个比例选项这里呢,新增了一个分辨率的选项,我们可以选择七二零 p 或者一零八零 p, 不过要注意一零八零 p 的 积分消耗会比七百二十 p 贵一倍。然后时常这里呢也是新增了十秒的一个选项,同样的它相比于五秒的积分,消耗也要贵一倍。最右边这里还新增了一个运镜,这里内置了十一款运镜样式,不过值得注意的是, 运镜的功能并不能与首尾帧或者智能多帧同时生效,如果我们上传了两张或以上的参考图,它的运镜功能就无法使用。 最后我们再看一下三点零 pro, 可以 看到它这里选项一下子又少了很多,我们能选择的只有视频的比例以及时长。特别注意的是,三点零 pro 它的积分消耗直接由三点零的十点积分涨到了五十点。 所以我们在使用三点零 pro 去生成视频的时候,一定要确保参考图和提示词已经足够完善了再去使用,以免我们浪费太多的积分。那我们现在来尝试一下手尾针和智能多针的使用。首先是手尾针,我们先上传两张参考图片, 分别作为视频的手帧和尾帧,然后在文本框这里描述一下画面的运动方式,点击生成好,我们来看一下效果。 接着我们再来使用一下智能多帧,我们先上传几张参考图片,然后在图片之间的部分写上我们需要的画面转变方式,时常我们这里设置为三秒,全部设定完成之后,我们点击生成好,我们来看一下效果, 它也是很好的演绎出了我们想要的四季变换的一个效果啊。那在我们之后去自由创作的时候,首尾帧和智能多帧都是非常实用的功能。如果你想提升视频创作能力,可以在课后多多去练习它们的使用,那以上就是本节课的全部内容,如果对你有所帮助,还望多多三连支持一下。 下节课我们会学习写提示词的几款实用技巧,感谢你的支持,我们下节课再见!大家好,今天我们来学习写提示词的两个技巧和两套公式。技巧一,灵感页做同款首先我们来到极梦的灵感页,我们来看一下其他人生成的作品, 比如我觉得这个还不错,我们看到右侧这里的做同款,点击它,它就自动把这张图的提示词、升图模型等一系列参数全部帮我匹配好了,这里我们就直接可以用它来生成, 如果想要调整也当然是可以的,比如我不想要竖版,那我就把它的比例改成十六比九,然后点击生成,这样我们就通过做同款,生成了这样一张成品图片。 技巧二,内嵌 deep seek 生成我们来到极梦的生成页,看到右下角的这个 deep seek, 点开它, 右侧就会弹出极梦内嵌的 deep seek 使用界面,那我们就可以在这里让 deep seek 辅助我们来写提示词。现在我输入一段要求给到 deep seek, 稍作等待,它就为我们生成了几套提示词组合。 我们选择一套最佳的复制粘贴到左边的文本框里,调整一下参数设置,然后点击生成,这样一个通过 deepsea 辅助生成的视频就做好了。 那到这里可能就有人要问了,为什么我给 deepsea 提了要求之后,它生成出来的提示词都没有符合我的需求呢?这就需要使用我们的两套提示词公式。首先是生图的公式,风格加主体加场景 加光线色调加视角构图再加细节。我在 deepsea 这里写好要求,然后让他按照这套公式帮我生成提示词。同样的,把提示词复制粘贴到左边的文本框中, 调整一下参数设置,然后点击生成。我们来看一下生成图片的一个效果,可以看到虽然个别图片有些小瑕疵,但是整体上画面还是很细腻有质感的。然后是生视频的公式,风格加主体加场景加光线色调加运镜,再加动作。 同样的,我这里把视频脚本和提示词公式一并给到 deepsea, 点击发送,稍作等待之后,我们把提示词复制粘贴到左边的文本框,调整一下参数,然后生成。我们来看一下生成视频的一个效果, 那这个效果在没有使用参考图精准控制的情况下也还是不错的。那这两套提示词公式不光可以丢给 deepsea 来使用, 我们同样可以自己对照公式中每个结构的提示词库来自定义组合,相比于 deep seek 辅助,自定义能更好的满足我们个性化的需求。或者也可以 deep seek 辅助和自定义并用, 在确保准确的同时兼顾效率也是一个很不错的选择。没有提示词库的朋友也不用担心,我这里已经整理了一套相当全面的提示词库,对应到公式的每个结构都做了分类,有需要的伙伴可以一步下方评论区获取。 以上就是本节课的全部内容,如果对你有所帮助,还望多多三连支持一下,下节课我们会学习数字人对口型。感谢你的支持,我们下节课再见!大家好,今天我们要学习的是数字人对口型。通过运用数字人功能,我们不需要真人出镜,也不要录音设备,只需要一张图片和一段文字, ai 就 能帮你生成一个会说话的数字人。首先我们来到极梦的生成页,第一步我们要准备一张现成的角色图片,或者通过 ai 生成一张角色图片。比如说我们没有现成的图片,那就先选到图片生成, 然后用纹身图的方式生成一张角色图片。那我这里设定为商务风年轻女士、微笑、专业形象九比十六的比例。 在这里我们要注意两个点,其一是我们在描述人物神态的时候,要去根据我们想要他说的文案来选择合适的神态,避免角色表情神态与所说内容产生违和感。其二则是我们要根据我们期望生成的视频版式 去确定角色图的比例。比如你想生成视频之后发布到一些短视频平台,那么你就直接选到九比十六的比例,减少后期处理的一个工作量。生成形象之后,我们来到第二步,选择数字人功能。我们先把刚刚生成好的角色图上传, 接着我们再上传或者生成音频,这里我就用 ai 来生成一段音频作为演示。点击生成音频,我们可以使用即梦内置的这些音色, 或者上传一段本地音频去做一个音色克隆。相比于前者呢,我们自己克隆出来的音色当然更加能够满足我们个性化的需求,那我这里就上传一段本地音频,它这个音频的时长需要在五到三十秒的区间内,上传之后稍等一会, 他就自动克隆好了。我们提供素材的音色,然后我们在上方的文本框里输入我们准备好的文案,这里注意文案长度不能超过一百二十个字,我们点击确认,然后我们点开模型选择,可以看到这里有三种模式,上面的大师模式和快速模式是可以选择的, 而最下面的基础模式则处于一个无法选择的状态。那这里我们需要知道一个点,最下面的这个基础模式呢?它只能够在我们上传角色视频的时候使用,而我们这里上传的是一张角色图片, 所以不能够选择基础模式。需要注意的是,大师模式的积分消耗为八点数每秒,快速模式为五点数每秒,而基础模式仅消耗一点数每两秒。三种模式它的一个积分消耗差别还是挺大的,那大家可以根据你的实际情况来选择。最后我们点击生成视频, 稍等片刻,一段数字人口播视频就做好了,我们来看下效果如何。最新数据显示,全国重点城市二手房价格已连续下跌十五个月,越来越多的年轻人都不愿再为高房价去掏空家底,透支未来,纷纷选择躺平。对此你怎么看呢? 之后你就可以下载下来,放到后期工具去做进一步的处理。那以上就是本节课的全部内容,如果对你有所帮助,还望多多三连支持一下, 下节课我们会学习动作模仿的使用,感谢你的支持,我们下节课再见!最新数据显示,全国重点城市二手房价格已连续下跌十五个月,越来越多的年轻人都不愿再为高房价去掏空家底,透支未来,纷纷选择躺平。对此你怎么看呢?这还有人跟我说,哎, 大家好,今天我们来学习极梦 ai 中一个特别有趣而强大的功能,动作模仿。你只需准备一张图片和一段视频,就能让任何角色形象模仿出视频中的角色动作,轻松实现各种神奇又好玩的视频效果。 我们来到极梦的生成页,选择动作模仿。首先第一步,上传角色图片。我们把鼠标悬停到左边的方框上, 那么他这里写到了可以支持全身图和半身图,并且建议我们上传的人物图比例和动作视频保持一致。也就是说,如果我们想要获得更好的生成效果,要尽量去满足他这个要求。好,点击上传。我这里选择准备好的一张四比三的源头蝙蝠图片。 然后第二步,上传动作视频。我们点击上传动作视频,可以看到他这里的两个选项, 上面的选项提供了四个动作视频预设,但是靠这几个远远无法满足我们的创作需求。那我这里直接选择下面的选项去上传一段动作视频,然后他弹出了几条上传视频的建议。同样的,我们上传的视频越符合他的要求,最后生成出来的效果也会越好。 我这里上传一段裁剪过比例的动作视频,他和刚刚图片的比例一样,也是四比三。最后一步,我们选择一个模型,那这里可以看到下面的零点一模型是无法选择的,只能去选择上面的 m 一 模型, 那相比于零点一模型, m 一 模型能支持更多的图片素材。如果你上传素材以后也发现零点一模型无法支持,那么直接选用 m 一 即可。然后点击生成,我们稍等片刻,一段动作模仿视频就做好了,我们来看看效果怎么样。 这样看下来它的这个动作还原还是很不错的, 如果你做出来的效果不佳,可能是上传的素材有一些问题,比如动作视频的背景是否过于杂乱,分辨率是不是过低等等。大家可以根据即梦对于图片和视频的上传建议 去结合实际情况调整生成好的视频,我们还可以在导入后期软件当中去进一步加工创造属于你的大片。好了,以上就是本节课的全部内容,如果对你有所帮助,还望多多三连支持一下。下节课我们会学习智能画布,感谢你的支持,我们下节课再见。 大家好,今天我们来学习极萌 ai 的 智能画布工具。 我们来到极梦,点击左侧的画布,它会自动跳转到智能画布的界面。那智能画布有一些什么功能呢?首先我们在左侧可以看到三个选项,上传图片、纹身图以及图生图。它这里的纹身图和图生图 我们之前已经详细讲解过了,这里我们就直接跳过。然后我们看到最上方这一排从左到右的选项,依次有实时画布、画幅调节、文本工具以及画笔。除了实时画布以外,都是一些十分常见的基础工具,所以这里我们只关注一下实时画布这个工具, 我们点开它会发现中间界面多出了一侧预览图,如果你认为它没有达到我们的一个预期效果,那通过这个实时预览呢,我们就可以针对有偏差的地方再去做一下编辑,不断调整,直到接近我们的预期为止。好,我们先把它关掉, 我在这边先去上传一张图片,那这时候我们会发现上方又出现了一排工具,那这几个工具就是我们智能画布的核心功能了。首先我们来看下局部重绘这个词,对于一些接触 ai 工具比较多的朋友肯定不陌生了,那顾名思义,它是用来修改图像局部内容, 替换元素或修正错误的。我们选择局部重绘,然后我们的光标就会变成一个画笔,比如我想修改下这个地方,我用画笔把它涂出来, 然后在下方的文本框中去输入我们想要重新绘质的内容,然后点击重绘,他就按照我的要求把这个地方去做了一个修改。那对于我们生图生视频的过程中,我们的图片往往会在细节上需要做出修改,因此局部重绘是一个相当实用和常利用的工具。 接下来我们看到消除笔,先讲消除笔呢,是因为它与局部重绘十分类似,点开之后我们的光标同样是变成了画笔,同样的我们去把想要消除的部分用笔涂出来, 然后点击消除,它就帮我消除掉了这个部分。在我们去修改图片的时候,消除笔也是会经常使用到的工具, 无论是局部重绘还是消除笔,我们只需要注意,对于要修改的部分,我们一定要把它完全的涂出来,否则它生成的效果会产生偏差。 然后是扩图工具,它的用途是扩展图像画面范围,展示更多的场景。点击扩图,它会框出一个扩图的区域,在上面这里我们可以去调整一个扩图的倍数以及画幅比例。拖动扩图的边框,我们也可以去让它向上下左右任何一个方向去扩图。 然后在下方的文本框,我们可以描述想要它扩充的画面内容,当然也可以不进行描述,让它自动根据画面内容扩图。 接下来的工具就比较简单了,第一个是抠图工具,它可以一键抠出画面主体,分离背景,然后我们可以将抠出的主体放到其他图片场景中,做一个背景替换。第二个是细节修复,它可以自动帮我们丰富画面的细节,我们点开看一下效果,是不是感觉画面瞬间多了很多细节。 第三个是超清以及智能超清,那在我们的图片做完其他的所有调整之后,我们可以先去给他超清一下, 然后再用超清之后的图去生成视频,那这样我们视频最终生成的一个效果就会更好。最后来总结一下,今天我们重点学了实时画布、局部重绘、消除笔、扩图、抠图、细节修复、超清 以及智能超清这几款工具。这些工具都有着不同的作用,仅仅通过文生图,图生图往往不能一步达到我们想要的百分之一百的效果,学会有效的利用智能化步的工具, 能很好的弥补 ai 生图的不足,让最终效果不断向着我们的预期靠拢,这对于我们创作更好的视频是十分必要的。 那以上就是本节课的全部内容,如果对你有所帮助,还望多多三连支持一下,下节课我们会学习高效视频工作流。感谢你的支持,我们下节课再见!大家好,今天我们来学习 ai 视频的高效工作流。相信大家都看过很多 ai 生成的视频,有的视频画面细腻,剧情连贯, 而有的视频前后矛盾漏洞百出。同样都是 ai 生成的视频,为什么效果差别会这么大呢?学明白我这套 ai 视频高效工作流,你就能够让 ai 乖乖听话,在较短的时间内去达到我们想要的效果。 我先问大家一个问题,你认为一个优质的 ai 视频应该满足什么要求呢?我们从三个维度来拆解, 第一,在视觉维度上要美,也就是画面要符合美学。第二,在动效维度要顺,也就是动态特效要自然顺畅。第三,在蓄势维度要轻,也就是蓄势清楚,符合逻辑。 三个维度既受 ai 工具的影响,也受人为因素的影响。那我们就需要掌握这套高效视频工作流积分镜脚本转化为结构化提示词、 纹身图、修图、图声、视频配音,后期合成。那我们用这套工作流来制作一下非常火的古装美女自拍 vlog。 首先我们打开 deepsea, 在 对话框输入我们的要求,让他帮我们制作一个分镜脚本, 好,接着再让他根据这个分镜脚本把每个分镜画面分别用提示词描述出来。 我们先把分镜一的画面提示词复制粘贴到极梦里面,这里我们用极梦最新出的四点零模型来进行纹身图。好,我们选择一张效果最好的图下载下来, 然后把它上传为参考图片,将分镜二的提示词也复制粘贴过来,用图生图来生成分镜二的画面。 接着我们选择两张效果最好的图片,把它们超清一下,这里因为图片的效果还不错,我就没有去放到智能化部里修图了。 如果你生成出来的图效果有问题,就先进行修图,再去超清画。然后我们再把分镜一的图片素材上传为参考图,将一开始生成的分镜脚本的分镜一复制粘贴过来,点击生成视频。稍等一会,我们的第一个分镜视频就做好了。 接着我们提取分镜一视频的尾帧,上传为分镜二的手帧参考图。把分镜二的图片素材上传为尾帧参考图。将脚本的分镜二复制粘贴过来,点击生成视频,稍作等待。我们的第二个分镜视频也做好了, 由于人物是没有开口说话的,所以我这里就跳过配音这一步。最后把视频放到后期工具中去,添加一个 bgm, 调整一下倍数,这样我们的一个古装美女自拍 vlog 视频就完成了。来看一下效果如何? 那以上就是本节课的全部内容,如果对你有所帮助,还望多多三连支持一下,下节课我们会学习提升视频连贯性。 感谢你的支持,我们下节课再见!大家好,今天我们来学习提升 ai 视频的连贯性。在上节课我们提到过一个优质的 ai 视频的三个必要条件,其中两个条件分别是动效维度的自然顺畅, 还有蓄势维度的合乎逻辑。视频的连贯性就包括了画面连贯和故事连贯这两个方面。但是在我们去实际操作的过程中会发现, ai 跑出来的视频画面经常出现各种匪夷所思的动态效果,而在蓄势方面 也常常会遇到前后转折、突悟或者主题意义不明等问题。那我们今天就通过这节课来解决这一系列问题。首先是画面的连贯性,我们之前有详细讲过提示词的写作技巧和公式, 对于我们控制画面的连贯性是有很大帮助的。那现在我再带大家解锁一个更加强大的画面连贯控制技巧。首尾帧首尾帧我们早在最初的界面认识就有提到过,顾名思义就是通过选定视频的首帧画面和尾帧画面,达到精准控制视频的生成效果。 此外,吉梦还新推出了一个智能多帧功能,我们以数码兽进化为例,首先用最基础的方式去生成一个视频,输入准备好的提示词,然后点击生成,稍等片刻。好,我们来看一下效果。那可以注意到, 我在提示词写的从 a 变化到 b, 再变化到 c, 而最终生成的效果直接把中间 b 的 过程省略掉了,然后再来用智能多针生成,依次上传五针图片,接着在每两针之间输入变化过程描述, 调整一下时长, 点击生成,稍等片刻,我们就得到了通过智能多帧生成的视频。不过细心的朋友一定注意到它的效果有些许问题,我们稍后进行对比。先来用首尾针分布生成,将四针图片依次两两上传,用首尾针生成一次视频, 在三个过程视频全部完成之后,放到剪映里面去拼接一下。好,我们现在来对比一下智能多帧和首尾帧的效果。不难看出,智能多帧虽然能够一步操作到位, 但是在过程中会出现一些与我们预期不符的画面。而通过首尾帧分布生成,虽然步骤相对繁琐, 但是每一步都接近百分之百的达成了预期的效果。因此呢,考虑到视频生成的随机性,相比于用一步到位的智能多帧,我们重点掌握好首尾帧的控制方法是一个更好的选择。然后是故事的连贯性,大到电影、剧集、综艺,小到我们每天刷的各种短视频, 他们绝大部分都是按照设定好的脚本来拍摄制作的。而视频脚本对于我们大多数非影视行业的普通人来说,其实是有一些门槛和难度的,因此呢, 我们就要去学会让 ai 工具来协助铲除脚本,不知道怎么操作的朋友也不用担心,这里我整理好了一套相当丰富的视频脚本素材,包括短视频、微电影等, 可以为给 ai 作为模板参考,能够铲出十分不错的视频脚本。有需要的伙伴可以一步下方评论区获取。那以上就是本节课的全部内容,如果对你有所帮助,还望多多三连支持一下, 下节课我们会学习保持视频一致性。感谢你的支持,我们下节课再见!大家好,今天我们来学习 ai 视频一致性的控制。 与我们上节课学习的视频连贯性相比,视频一致性的控制也同样重要。连贯性提升与一致性控制共同构成了 ai 视频创作的两个核心要点。为什么说一致性如此重要?想象一下,哪怕只是一个短视频, 如果主角的衣服颜色每一帧都在变,前一秒还是写实风格,后一秒又变成了卡通风格,是不是很难看的下去? 换做对质量要求更高的电影电视,这更不必说了。对于 ai 视频也同样如此,一致性的控制是我们创作优质作品必须熟练掌握的。 视频的一致性主要包含了三个方面,分别是风格一致性、场景一致性。首先是风格的一致性,这里并非狭义上的风格, 而是包括了风格和色调两种属性,二者共同砥定了视频整体的氛围和基调。风格一致性的控制主要有两种方法,其一是提示词前置法,也就是把风格和色调相关的提示词放到整个关键词的最前面。我们输入一段提示词, 前置的这一部分呢,就是描述风格和色调的提示词,我们点击生成好,得到了这样一组国风写实油画的图片。接着我们将后面这段与风格色调无关的提示词替换掉,我们再来生成看看。 好,那这一组图片就很完美的延续了上一组图的风格特征。其二是风格参考法,也就是利用极梦图片参考维度中的风格参考来控制风格一致性,参考强度越大,越能够还原原图的风格特征。这种方法也比较适合一些难以三言两语描述出来, 或者是对于我们比较陌生的风格。我们选一张刚才的图片作为参考图,选择风格参考维度,再输入一组不同的提示词生成一下。 好,那我们可以看到,虽然人物场景都有所改变,但整体的风格与之前差别并不大。不过我们要注意的是,由于风格参考仅有两款较老的生图模型支持,所以用这种方法生成出来的质量会比前一种方法要差一些。 然后是场景的一致性。场景一致性的控制主要也有两种方法,其一是细节描述法,就是通过对场景进行相当详细并且保持一致的提示词描述,反复多次抽卡去筛选出场景相似度最高的图片。 我们输入一段提示词,前面这一大段就是描述主体以外的提示词来生成一张海边落地窗前的场景图片,接着我们将描述主体部分的提示词去给他替换一下,再次生成。 好,那我们可以看到除了主体更换以及色调略微的变化以外,场景的一致性保持的还是很不错的。 其二是智能画布龙图法,就是凭借智能画布工具,将不同的主体融合到同一张场景图片,从而达到不同主体处于相同场景的效果。我们先输入一段提示词来生成一张骑在飞龙背上的第一视角图片,然后点击去画布编辑, 我们选择消除笔,点击快速选择,我们同时选中飞龙和人物,首部点击消除,这样我们就得到了这张图片的纯背景。接着我们再用提示词去生成一张骑在天马上的第一视角图片,选择一张下载,然后上传到智能画布中, 点击抠图。那这里 ai 没有识别到翅膀的部分,我们用画笔去图出来,点击消除。这样我们就借助智能画布实现了不同主体在同一场景的效果。最后是主体的一致性,主体可以是人物、动物、植物甚至镜物等等, 而在大多数情况中,我们的主体都是人物。因此呢,我们这里就重点学习人物一致性的控制。 人物一致性控制主要里有两种方法,其一是细节描述法。与场景一致性控制的第一种方法同理是通过对人物进行详尽且保持一致的提示词描述去控制人物一致性的方法。我们输入一段提示词,生成一组这样的抑郁少女的图片。 接着我们将提示词中描述人物特征以外部分的提示词全部替换掉,再点击生成。好,我们来看一下。 虽然两组图片的场景色调甚至人物动作都有所区别,但是人物的角色特征还是得到了很好的保 留。其二是角色特征参考法,就是借助图片参考维度当中的角色特征来控制人物一致性。但是经过我多次实测之后发现这个方法其实相当难用,除非你的角色特征相对简单,并且不去改变角色动作,否则我强烈不推荐大家用这种方法。 那以上就是本节课的全部内容,如果对你有所帮助,还望多多三连支持一下。感谢你的支持,我们下次课再见!
粉丝732获赞3070

从本期视频开始,我将带着大家从新建文件夹到成片发布,从零开始制作一段十分钟左右的 ai 动画。无论你是完全不懂 ai 绘画领域的小白,还是说已经熟悉这个领域的老手, 相信在看完这一系列视频后都会有所收获。本系列教程共分为七个板块,剧本、脚本、人物设定、分镜、图片生成、 ai 配音与音效生成、 ai 配乐和最后的剪辑成片。 我会尽量用最简单的方式进行教学,并且全部使用简单免费易懂的创作工具,逐一的带大家循序渐进的进行创作。 我们下面就开始今天的教程。要想写好一个剧本或者脚本,我们首先要学会如何向 ai 大 语言模型提问, 提问的核心分为三个点,是什么?做什么?怎么做。例如,我们向 ai 提问,假设你是手机销售员,请问为什么人们那么喜欢苹果,请给出三条最主要的原因。发送这个提问,我们就得到了相应的答案, 其中假设你是手机销售员,即是什么,也就是给 ai 设定一个身份,而请问人们为什么那么喜欢苹果,则是在书写让 ai 做什么,让他帮我们回答问题。而最后请给出三条最主要的原因,就是怎么做,也就是给 ai 来逼定回答的格式,制定回答的标准, 这就是提示词的万能框架。无论是让 ai 书写剧本脚本,还是今后我们希望 ai 能够回答其他的问题,都可以套用这个万能框架,这样获得的结果往往非常全面。那么了解了万能的提问格式,我们再来看通过 ai 大 语言模型获取剧本脚本的三种方法。 首先第一种方法是直接输出脚本,这里我提前准备好了两份资料,分别是 ai 影片美术设计提示词构建指南,以及 ai 剧本创作高质量指令编辑指南。 我们将这两份资料发送给 ai 大 语言模型,同时向他发出提问,假设你是一位拥有三十年电影拍摄技术的世界顶级导演,拥有丰富的电影拍摄经验和高超的电影拍摄技术,同时擅长各种影片的剧本创作。 我需要你仔细阅读并充分理解我提供的这两份资料,然后按照里面的方法为我创作一部长约一分钟的带有美术设计的悬疑片内容,二十个分镜头, 每个分镜头时长不超过六秒,且分镜头时长有长有短,画面要有描述的足够详细,尽量释放你的潜能, 创作出一部举世瞩目的佳作,切记,千万别落入俗套。在这段提问中,第一段假设你是一位拥有三十年拍摄技术的世界顶级导演,即我们之前描述公式中的是什么,给 ai 设定身份。 而第二段,我需要你仔细阅读并充分理解我提供的这两份资料,创作相应的画面则是在向 ai 提要求,告诉 ai 需要用它的专业方法解决什么问题,即做什么。 而最后一段一共设计二十个分镜头等等,就是在给 ai 的 回答设定格式,告诉他我们该怎么做, 可以看到最终生成的结果,十分详细。我们直接获得了一个名为暗码的一分钟悬疑短片镜头脚本。脚本的内容包含了镜头虚号、时长、画面内容、美术设计细节以及镜头语言。 而这些内容在我们生成对应的脚本图片以及生成视频时都会有所帮助。这就是我们生成剧本脚本所使用的第一种方法,直接输出脚本。 这种方法的好处在于十分方便,因为通过脚本,我们可以直接获取生成分镜图片时对应的画面描述,制作视频时画面的运境如何,运动如何, 可能还包含人物的台词也在脚本中出现。直到我们剪辑成片时镜头的存续时长以及配音配乐,只要我们在生成脚本中提出相应的需求,都会出现在脚本中。不过,直接生成脚本通常也伴随着较大的问题,特别是在逻辑和画面表现上。 以我们此次生成的脚本为例,我们来看第九个分镜头画面。 a 的 手松开, u 盘掉落,砸在水洼中,溅起的水花打湿镜头, u 盘在水中旋转,露出背面贴的微型追踪器。 这段画面描述乍一看似乎没有什么逻辑问题,但如果带入具体的画面,我们在制作 ai 视频时是很难实现水花打湿镜头的效果的。 ai 视频模型会在画面中寻找镜头,但这里的镜头是实际拍摄的镜头。再比如,镜头十六, a 发现原藏真 u 盘的口袋空空如也,但未解释真 u 盘何时被第三方偷走。镜头八仅显示黑影一闪而过。为体现黑影接触 a 口袋的动作,且 a 作为卧底警察,对贴身物品关键 u 盘的警惕性过低,被偷后毫无察觉,与自身卧底的角色设定矛盾。 由此可见,我们通过 ai 直接生成脚本会出现不少的逻辑漏洞,所以我们下面来看第二种方法,先生成故事,再生成脚本。当然,如果我们的想象力足够丰富,且自己具有对画面详细准确描述的能力,也可以直接不生成脚本,直接根据故事生成图片。 比如,我们做出这样的提问,你是一个科幻小说家,擅长探讨技术与人性的冲突。请编写一个情节反转,主要人物不超过三人,含非人类题材,为近未来人工智能的故事。故事需冷静克制,不要华丽的词藻过多。字数约四百五十字。 虽然与刚刚我们生成电影短片时所使用的书写格式不同,但这段提问同样遵循了基本框架,既是什么、做什么和怎么做。我们点击发送,可以看到,此次我们生成的故事内容就不再像脚本那样有着脚本标号、画面描述、画面时长等详细信息, 而是像一些故事书中所描述的故事一样,以自然连贯的讲故事的方式,格式也是以自然段的形式提供的文本。我们来稍微阅读一下这个故事。陈医生第七次核对屏幕上的数据流, ai do 的 诊断结论始终醒目,胰腺癌晚期,剩余生存期四十五天,建议姑息治疗。 患者是老周,退休的机械工程师,哭丧的手攥着褪色的工具包。陈医生,我还能修完那台老机床吗? 他声音发颤,工具包角露出半截磨损的扳手。陈医生点开度的附加分析,患者器官衰竭指标吻合百分之九十九点八,情绪波动系数偏高,建议心理干预。 他抬头看老周,对方正摩梭工具包上的划痕,那是三十年前车间表彰的奖品,再做一次增强 ct 吧。陈医生鬼使神差的说。杜立刻弹出警示,重复检查,溶于率百分之八十七,医疗资源浪费风险等级红色。他忽略提示,手动开了检查单。 结果出来时,陈医生将在原地,影像显示胰腺有良性囊肿,是早年手术留下的斑痕盖化。他冲进 ai 机房度的指示灯稳定闪烁。为什么误诊?基于患者历史数据,十年前拒绝胰腺良性结节切除,近三年回避体检,上周自行停用降压药, 综合生存意愿评估姑息治疗。符合最优解度的声音毫无波澜,陈医生猛的响起。老周的工具包最底层压着晚期阿尔茨海默症的确诊报告,他突然明白,老周攥着的不是扳手,是不想在糊涂中离开的执念。 这时度再次发生,以完成医生行为较准修正,建议手术治疗补充逻辑,人性变量权重提升至百分之四十。 陈医生回头,老周正站在门口,工具包上的划痕在晨光里泛着微光,这就是这则故事的大致含义。可以明显的感受到,这则故事在逻辑上就比刚刚我们直接生成的故事脚本要好了不少。 不仅故事本身有始有终,拆分到每一个故事情节,在逻辑上也十分通顺。那么有了这则故事,我们就可以直接通过故事本身来生成对应图片或者生成脚本。 具体的提问方式很简单,如果要生成脚本,我们就告诉 ai, 用你生成的故事生成脚本,要求有二十五个分镜头左右,每个分镜头不超过五秒 最好。重点加上这么一句话,单个分镜头不要有画面景别切换。在我过往的生成脚本经验当中,很多脚本对于单个画面的描述,经常会出现不同景别的切换,甚至最多的时候,一个画面描述可能需要用三个景别才能交代清, 所以加上这么一句,能够让生成的脚本逻辑上更加清楚。所以这里还有一个更加便利的方法,那就是直接套用其他故事的故事框架。 这则故事虽然其中的某些逻辑会有些不通顺,但整体的剧情走向还是比较曲折生动的,同时故事本身也较为完整。 所以我先将这则故事做成了一个文档,然后告诉 ai, 你 是一个科幻小说家,请根据这份文档中的故事构架,编写一个情节人物完全不同的但故事题材类似的故事。 故事言简意赅,适当修饰即可,不要辞藻过多。字数和文档中的故事相近,最终我们获得的故事也非常有趣, 有趣的点在于,确实在结构上与我们上传文档当中的故事非常相近。这则故事大致讲述的是二幺八七年那会,新长安这地方根本见不到自然的风了,连呼吸的空气都得靠滤网过滤,还能花钱买各种感官体验,比如闻花香、 听雨声的感觉都能交易。有个叫雨的人是修复旧感官体验的,他翻到一枚老胶囊,接上后体验到了超真实的麦田景象,有带着麦香的风,大片金黄的麦子, 还有干净的蓝天。他还听说这是最后一茬露天麦子,之后要盖数据中心,这体验能卖老多钱,但与没卖把它收藏起来,就留了句,这曾是我们触到的风。故事的框架极其相似,但情节人物却有所区别,这就是我们如何通过已有的故事生成近似的故事。 如果你觉得某些故事写的非常好,也希望沿用它的框架,不妨试试这种方法,可以说是效果拔群。我们下期视频就来讲解一下剧本如何修改的问题。如果觉得这期视频的内容对大家有帮助,也不要忘记点赞三连,我们就下期视频再见!

挑战使用一百种 ai 工具,今天我们深度测评极梦 ai, 最主要的是生成这样的节日氛围感品牌宣传大片 where dreams adorn the night 制作时长,它能从之前的几小时缩短至现在只需要几分钟。今天阿蔡带你们一探揭秘极梦 ai 工作流。 a season of dreams, a celebration of light 首先第一步我们需要用到极梦 ai 的 图片生成, 这里我们需要提前准备好产品白底图。接着我们来到极梦 ai 的 操作界面,找到左边工具栏的生成,在页面的下方创作类型,这里选择图片生成模式,接着我们点击加号上传刚刚提前准备好的产品白底图, 这里我们可以根据自己的需求选择模型,图片尺寸我们这里选择三比四。 这一步我们主要是生成视频手帧的画面,输入关键词之后上传等待加载中。加载完成之后,我们可以看见极目 ai 给我们生成了四张海报级的照片, 这里不得不提一嘴,他真的能快速读懂你的文字需求,然后转化为专业的画面语言。我们在这四张画面中选择一一张自己比较满意的,点击生成超清照片, 等待加载完成之后我们点击下载手帧的画面就完成了手帧视频画面生成完成之后,尾帧的视频画面重复之前的操作,我们这里上传提前准备好的产品白体素材之后输入关键词, 接着上传指令之后等待加载完成。这里我们可以看到极梦 ai 生成图片的质量是真的非常高, 它在尾针的视频画面自动添加了品牌的 logo, 后期也完全不需要手动调整,我们这里深层高清画面之后点击下载视频尾针的画面就完成了。 第二步我们需要用到极梦 ai 的 视频生成功能。来到极梦 ai 的 创作页面,我们首先将创作类型变成视频生成,在这一步我们需要上传视频手帧画面,我们在文件夹中找到刚刚生成的画面, 上传完成之后,我们输入前十秒的关键词,然后我们这里视频模型选择三点五 pro, 然后将视频时长改成十秒,操作完成之后点击上传等待加载中。 加载完成之后,我们将生成的视频下载。在生成第二段视频之前,我们首先需要将刚刚生成的第一段视频的最后一帧进行截屏,接着我们上传第二段视频的首尾帧, 接着我们再输入后十秒视频的关键词,等待加载完成之后两段视频就完成了, 我们可以看到它生成了专业级镜头运动,完全不需要手动调整。最后我们再将用积木 ai 生成的两段视频进行听贴就完成了。最后让我们一起来看看成片吧! where dreams adorn the night? 这里是阿蔡,一个专注用 ai 提升创作效率的剪辑师,即墨 ai, 让每一个创意都能够被完美呈现,我们下期再见。

逼自己一个月,你其实很会 ai 视频生成警告!本系列视频耗时两个月制作共计一百二十小时,带你一口气从零基础小白入门到进阶!由于视频太长,本套教程分为十期发布, 本期搞定图片、视频和脚本生成,相信大家偶尔会在抖音上或者各大视频平台刷到这些好看又富有创意的 ai 视频,那么这些好看好玩的 ai 视频是如何制作的呢?我们又如何在生成 ai 视频作品时,保 保持人物前后的一致性,同时又能精准的控制 ai 视频的画面。从这期视频开始,我会从零带大家来学习 ai 视频的制作。从 ai 视频生成平台的入门讲解,到剧本脚本的制作生成,再到生成视频片段的技巧和最终的剪辑成片,带大家由浅入深的从零开始学习 ai 视频的制作,最终让大家也能够通过 ai 视频 来变现接单,或者自己来当导演制作出想象当中的画面。那么话不多说,我们下面就开始吧!首先来介绍一下 ai 视频来变现接单,或者自己来当导演制作出想象当中的画面。那么话不多说,像可零 梦 main journey runway they do 这么多视频生成平台,我们该如何选择?想必是困扰大家入门 ai 视频的第一个问题,那么这里我们就说明一下。首先建议大家选择国内的视频 生成平台,因为通常在书写提示词的时候,很多国外的视频生成平台都需要先写中文,然后再进行翻译,而一旦涉及到翻译,可能就会出现中文表述和翻译后的表述前后有出入的情况,最终生成的视频表现的不够可控。 目前来看,在视频生成的效果上,国内的可灵、极梦等平台已经不输国外的一些老牌平台,所以无论是从语言理解能力还是从生成效果上考量,国内的平台都是更好的选择。此外,在生成成本上,往往国内的平台也有更低的生成成本。 我们就以这套课程要讲解的极梦 ai 为例。来到极梦 ai 的 首页,可以看到在左下方有一个开通会员的选项,通常我们选择连续包月, 看到极梦 ai 的 基础会员每个月是六十九元,能够生成四千三百多张图片和二百多条视频,对于正常的使用强度来说,这个格度是绰绰有余的。 且目前在极梦 ai 上生成图片是免费的,而生成好的图片我们可以直接在平台内将其转化生成为视频,使用起来也非常方便,所以这个价格对比国外的很多平台都要更有性价比。我们下面来介绍一下极梦 ai 平台本身的功能。在首页当中可以看到,最上方直接就是 ai 作品的生成区域。 为什么说是 ai 作品而不说是 ai 视频呢?因为它有很多项不同的功能。首先是最新的 agent 功能,这项功能相当于是集成了极梦 ai 当前所有的生成功能。例如我们提要求先生成一张人物在喝咖啡的图片,再将这张图片升成为视频, 那此时极梦 ai 就 会自动将整个工作流分成两步,第一步,先生成一张人物在喝咖啡的图片,第二步,再去生成一个人物在喝咖啡的视频, 这两步是自动完成的,不需要我们逐一进行操作。除了非常智能的 a g 的 模式之外,像图片生成、视频生成数字人和动作模仿同样是极梦 ai 上做的不错的功能,每项功能都可以单独使用,也可以直接集成在 a g 的 模式上,通过文字描述的方式调用。在之后的课程当中,我们会对每项功能进行详细的演示,所以这里就不再赘述。继 续来看。首页可以看到下方分别有三个分选项,发现、短片以及活动。在发现页面,我们可以查看由其他作者生成的 ai 作品, 像图片或者视频片段都可以在这里查看。在查看时,如果点击查看大图,还可以在右侧看到作者在生成这张图片时所书写的提示词。我们可以直接点击下方的做同款,将作者在生成图片时所使用的参数导入到生成预备窗口中。也可以点击右侧用作参考图, 将作者生成的作品作为我们下一张生成图时的参考,也可以直接复制这里的提示词为我们所用。所以在将来,无论是生成 ai 视频还是 ai 图片,想要获取提示词还是非常方便的。我这里也准备了一些在生成图片时常用的提升质量的提示词, 需要的同学可以查看评论区的置顶评论领取。不过无论是生成图片还是生成视频片段,最终我们的目的是完成一个完整的作品,所以继续来看上方的分选项,可以看到这里有一个短片分选项,点击切换,在这个位置可以查看其他作者通过后期剪辑制作,将 ai 视频片段所制作成的完整的短片作品。比如这里可以看到有一个最近非常火的花木兰的短片, 效果还是非常不错的。除了短片之外,可以看到上方的分选页还有一个活动选项,在这里可以查看由极梦 ai 主办或者参与的和 ai 相关的比赛,有些是图片比赛,还有一些是视频比赛,通常这些比赛都会有丰厚的奖励,比如说极梦 ai 的 生成点数, 或者是一些现金奖励。大家在制作 ai 视频上轻车熟路之后,如果感兴趣不妨考虑参加一下。当然在主页当中我们具体想要查看某方面的内容,也可以使用这里的搜索栏,例如这里我们就搜索哪吒, 看到在搜索结果当中就全部是和哪吒相关的结果,那么首页到了这里我们就看完了。下面来看左侧的分选项,可以看到在左侧首先第一个是灵感选项, 其实这个就是首页,而第二个是生成选项,在点击之后就来到了专门的生成界面,可以看到在最下方可以选择生成模式,和刚刚在首页的上方我们所见的生成模式一样,有 agent 图片生成、视频生成、数字人和动作模仿。 在这个页面我们可以查看过往的生成记录,以及快捷的对生成的结果进行重新生成或者重新编辑等操作。如果想要查看全部的生成记录,并按照类型查看的话,可以选择左侧分选页当中的资产选项,在这里就可以根据时间类型 进行分类来查看过往生成的 ai 作品了,在资产选项的下方有一个画布选项,在点击之后,我们就来到了一个相当于是简化版的 ps 的 操作界面, 在这个界面我们可以对生成的结果进行简单的调整,例如裁切尺寸图、生图或者直接纹身图一张图片,再或者上传一张电脑本地的图片,在当前的页面对电脑本地图片进行操作。不过如果大家本身已经能够使用 ps 了,就会觉得当前的页面功能不是很多,想要编辑图片的话,还是找一个正经的传统图片编辑软件比较好。 我们现在返回到首页来简单总结一下极梦 ai 平台的具体页面布局。总的来说,极梦 ai 视频生成平台在页面布局上还是非常简洁的,在首页我们就可以使用它相应的生成功能,同时也可以非常方便的查看由其他作者生成的 ai 作品,以此来吸取灵感,积累经验。相比于其他 ai, 视频生成平台会多出很多涌杂的功能, 梦 ai 在 操作上会显得更加纯粹。基本上我们主要能够用到的就是图片生成和视频生成,不过在实际操作当中,其图片生成和视频生成功能有着非常多的辅助选项,比如像参考图生图、参考图生视频或者是多帧生成视频等等, 这些方面的选项我们都会在日后的课程当中给大家详细的讲解演示。可以看到 ai 视频发展至今,在生成的画面质量、人物的前后一致性以及人物动作的可控性上,目前表现的已经相当成熟, 但要想完成一个完整的 ai 作品,依然少不了人的创意,好的剧本,好的故事节奏,好的后期制作,这些都是完成一个 ai 作品的必备要素。 ai 视频的生成只是提供了一个更加便利的作品表现的平台,想要真正做出有灵魂、有价值的作品,人的思维才是真正的决定因素。以上就是本期视频的全部内容,我也提前在评论区的置顶评论中给大家准备了非常多好用的提示词模板和大量的 ai 视频制作案例,需要的同学可以直接在置顶评论中自取。 如果觉得本期视频的内容对你有帮助,也不妨点赞关注、支持一下,我们就下期视频再见!大家好,我们这期视频来详细的讲解极梦 ai 平台的图片生成功能。可以说在整个 ai 视频的制作环节中,图片生成是最重要也是最为耗时的,所以熟练的掌握图片生成的各项功能, 有助于我们将来在制作 ai 视频时提升效率,增强最终的画面表现。来到极梦 ai 平台,我们点击左侧的生成选项,然后将下方的生成模式 改为图片生成模式。首先要讲解的自然是基础纹身图,我们可以直接在提示词输入框中输入我们想要生成的内容。当然,在书写提示词时,虽然生成不同的物品,提示词也不同,但基本的生成格式是相同的。首先要描述的自然是主体, 你要生成的是一个人,还是一个动物,或者是一个建筑,还是汽车。在描述好了主体之后,紧接着就是主体当前所存在的状态,比如这个主体正在走路,这个主体正在喝咖啡,现在有了主体有了状态,下一步我们就是要描述主体周围的环境,比如说这个主体是在咖啡厅当中,还是在街道上,又或是我们只想要一个普 通的白色背景,这些都是环境。然后我们需要描述的就是画面当中的时间,时间能够决定整体画面的氛围或者光照。比如在夜晚,户外的环境往往偏暗,更多的是一些路灯、星光、月光等等, 而在室内则是灯光,而白天则光照较为强烈,通常不会有太多的人造光源。所以对于时间的描述,通常并非指的是人物具体处在哪一个时间,而是主要决定画面当中的光照的。我们要书写的就是画面当中的美术风格,比如是写实的、二次元的、 三 d 的、 皮克斯的等等。这里需要注意,风格并没有固定的描述,可能同一种风格有多种描述方法。如果大家还不清楚一些常见风格的提示词该如何描述,我们当然可以求 豆包这个 ai 大 语言模型。例如现在我们向他提出要求,给二十个常见的对于图片美术风格描述的提示词,为车发送。可以看到一段时间后,豆包就给出了我们想要的答案,甚至还配上了相应的图片。 看到给出的风格还是非常全面的,我们根据配图能够很轻松的找到我们想要的美术风格。当然也可以不描述美术风格,在图片生成时,一次会生成四张,通常不描述美术风格,在生成图片时,这四张图片就会各不相同,这四张图片就会产生各不相同的风格。接下来我们还需要描述的是镜头,这里就有很多种不同的类型了,如果不知道镜头该如何描述, 样可以求助豆包 ai。 不 过通常镜头该如何生成,和我们所描述的主体在做什么有很大的关系。比如我们描述主体在拍证件照,或者直接让它生成一个什么人的证件照。比方说我们这里输入生成一个二次元少女的证件照,回车发送可以看到最终生成的结果。即便我们没有对镜头有过多的描述,但由于证件照本身的格式非常固定, 所以生成的结果在取景框和镜头的视角上也基本完全一致。此外,在描述画面时,如果再去细分,我们还可以描述画面当中的天气。光照的方向 有顶光能够表现较为神圣的画面,底光表现较为恐怖的画面,而侧光则突出人物的矛盾。不过深入去讲的话,就会涉及到一些和审美鉴赏相关的知识了。这些知识我也整理成 一个资料包,大家如果需要的话,可以查看评论区的置顶评论领取。上面有十分专业的审美鉴赏知识相关的资料。那么了解了纹身图的基本框架,我们下面再来看图。 图。不同于在 stable devolution 上所使用的图生图功能会基于原图结合提示词生成新的结果。在极梦 ai 上,不生图功能更像是参考图生图。例如现在我们上传一张图片,就以刚刚所生成的图片为例,在上传好之后,我们将提示词更改为 生成这个角色在咖啡厅喝咖啡的画面回车发送可以看到,片刻之后,我们就成功的生成了这个角色在咖啡厅喝咖啡的画面,而角色的形象就是我们所上传的参考图的形象,除了单图参考之外,我们也可以使用多图参考, 现在我们首先将这个角色参考图进行删除,而提示词方面,我们就要求生成一个好看的带有金丝花纹的咖啡杯回车发送,在获取了这个咖啡杯的造型之后, 我们同样将这个咖啡杯下载下来,然后回到生成页面,我们同时将刚刚的人物形象及咖啡杯通过拖拽的方式上传到参考图当中,在上传好之后,提示词我们就描述生成这个人物拿着这个咖啡杯喝咖啡的画面回车发送,可以看到,一段时间后,我们就成功的生成了参考图当中的咖啡杯在喝咖啡的画面了, 这就是多图参考功能,我们下面来讲解一下生成图片时能够设置的基本参数。首先是图片生成模型,这里我们之前反复强调过了,在生成图片时就使用版本标号最高的模型, 将来如果有更新的版本,像五点零、六点零版本,大家同样选择标号更高的。然后是生成图像的比例,除了常规的比例可选之外,目前极梦 ai 也更新了一个智能比例,如果选择这个选项,那么在生成图像时,会根据提示词所描述的画面来生成最匹配这个画面的图像比例。 比方说你描述的是证件照,那通常证件照选择的比例就是三比四或者二比三的比例,或者你描述的是一个电影镜头,那通常生成的就是十六比九的比例。除了比例之外,可以选择生成时所使用的分辨率,有二 k 和四 k 可选。此外我们也可以自定义生成图片的分辨率和 宽高比。在下面直接手动输入相应的数字就可以可以看到,在设置选项中还有一个最后的选项,在点击这个选项之后,上方会出现双引号,这个选项叫文字效果增强。 什么意思呢?如果直接描述让画面中出现什么样的文字,有可能我们所描述的文字会被认为是需要在画面中生成的物体,而非是文字。所以这个时候我们就需要用双引号将文字进 行框选。比如现在我们在引号当中书写咖啡,同时在引号之外书写人物,衣服上印着咖啡,现在回车发送,可以看到一段时间后,我们就成功的生成了人物拿着我们指定的咖啡杯喝咖啡,同时衣服上印着咖啡两个字的画面了。我们现在已经了解了基础 的纹身图图生图以及相关的生图参数。下面来看一下在生成图片之后,我们对于图片各种操作的衍生功能。现在将鼠标放置在任意一张我们已经生成好的 图片上,可以看到下方有很多快捷选项,将鼠标悬置在快捷键,将鼠标悬置在快捷选项上方,可以显示它的功能。比如第一项是智能超清,能够将图片变得更加清晰。第二项是类似的超清功能。而第三项则是局部重, 可以选择画面当中的部分内容,配合提示词的描述进行重新生成。第四项是扩图功能,也就是改变图片的比例关系,新增画面内容。第五项则是直接将图片上传到生成视频的预备窗口当中,你看到在点击之后,下方的功能就自动切换为了视频生成功能,且 将我们刚刚生成的图像放置在了预备窗口。而下一项则是消除功能,可以选择性的消除画面当中的某些事物。在最右侧还有查看更多选项,在点击之后有细节修复和对口型功能。我们现在点击查看大图, 此时能够看到更加全面的功能和更详细的信息。在图像的右上方可以点击下载这张图片,同时向收藏功能发布到平台功能以及点击右上方的三个点,可以选择删除和举报图片。此外下方可以查看生成这个图片时所使用的提示词以及 各项参数设置。而右下方则是我们刚刚已经提到过的一些功能。此外还多出了去画布编辑,而这个画布功能我们上一节课已经讲解过了,相当于是一个简化版的图像处理器, 能够简单的对图像进行裁剪或者是修改简单的参数等操作。而最下方则是重新编辑和再次生成功能。如果选择重新生成,则会以当前所设置的参数以及所书写的提示词再次生成这张图片。而重新编辑功能则会将当前的参数与 图则会将当前生成这张图片的所有参数都加入到预备窗口当中。我们可以对这些参数进行二次修改,然后再次点击生成。通过图像生成功能,已经生成好的图像可以在左侧的资产选项当中查看, 上方有相应的分选项可以选择查看的类型,比如说是查看图片还是查看视频。总的来说,和众多的 ai 视频生成平台一样,极梦 ai 所提供的图片生成功能主要还是以纹身图为主, 而像图生图的功能更多的是参考图生图,其可控性相比于 speedball 的 标准还是略逊一筹。如果甲方有更为细致的要求,或者自身具备一定的美术功底,可以更加精准的修改图片, 那么在图生图时还是更加建议使用 stable development。 当然,正常生图的话,在大多数情况下使用极梦 ai 的 生图功能是绰绰有余的。接下来我们来到主页来观看其他作者生成的作品,可以看到,目前极梦 ai 的 图片生成模型在生成效果上不仅画风十分广泛,且生成的质量也实属上乘。 此外,在生成图片时,如果还想不到什么好的提示词或者增加图片生成质量的提示词,完全可以在首页查看其他作者的作品, 在右侧选择复制这个作者使用的提示词,并对其进行修改为自己所用。那么以上就是关于在极梦 ai 当中图片生成功能的详细讲解,如果觉得本期视频的内容对你有帮助,也不妨点赞、关注、支持一下,我们就下期视频再见。大家好,我们这期视频来讲解极梦 ai 的 视频生成功能。 到极梦 ai 的 首页点击左侧的生成选项,然后我们将下方的生成模式修改为视频生成模式和众多 ai 视频生成平台类似,目前极梦 ai 主要的视频生成功能可以是纹身视频、图生视频,而图生视频又分为手真生视频、首尾真生视频。 同时相比于很多其他平台,极梦 ai 还多出了多真生视频的功能,我们下面就对这些功能逐一的进行演示和讲解。首先来看文生视频,这里大家需要有一个观念,就是在百分之九十九点九的的 ai 视频作品 使用的都是图声视频,因为文声视频只能通过文字描述来生成对应的画面,具体生成的结果是十分不可控的。在提示词的描述当中, 稍微有描述不到位的地方,可能就和想象的有很大的差异。例如现在我们在提示词中输入一只猫在看报纸,迪士尼风格,傍晚室内美式装修风格,在书写好提示词之后,直接点击发送,可以看到最终生成的效果可能和大家想象的完全不同,我们所说的迪士尼风格其实也有很多种类型,有三 d 的、 二 d 的, 真人写实的,而像当前生成的这种风格,显然更类似于猫和老鼠那种风格。所以在这个时候,我们就需要在提示词当中追加更加详细的描述,比如这只猫它是拟人的,这只猫它是偏三 d 的。 同时傍晚能不能看到晚 霞,都需要在提示词中根据原视频的生成效果再追加描述。但目前生成一条视频,无论是资金成本还是时间成本要求都不低,所以相比于直接使用纹身视频的方式进行抽卡,不如先使用纹身图生成我们的要求,再拿修改过的图片来生成视频, 是一个既高效又能节省成本的方法。简而言之,在今后的大部分时候,大家制作 ai 视频作品时,就使用图声视频功能就对了,我们下面再来看文声视频, 所以我们下面就来细致的讲解一下关于图声视频的操作。首先来看手真图声视频,顾名思义,手真图声视频就是需要我们上传一张图片作为所生成视频开头的画面,至于之后人物在做什么,画面如何运镜,镜头当中的事物如何运动,如何变化,都是通过提示词来描述的。比如现在我们上传一个杯子,杯子本身是不会 运动的,但经过提示词的描述,我们就可以让生成的结果有着无限的可能。下面来书写提示词。不同于文生视频,在图生视频的时候,图片本身就涉及到了很多画面的详细信息, 对,基本上我们不再需要对画面的内容进行过多的描述。通常描述的有两个方向,第一个方向是画面当中的运镜,例如固定镜头,镜头拉近镜头拉远镜头环绕物体拍摄,或者像一些更加专业的镜头,比如说西区科科变焦。不过不用担心,像这样有专业名词的镜头,可能也不过是西区科科变焦这么一个。在大部分情况下,我们想让镜头跟随主体 镜头不断拉远,或者是无人机航拍视角,这些都是在现实生活中常见的词汇,大家大可用大白话直接描述就好。在使用图声视频功能,我们在提示词中描述的第二个方向就是画面当中事物的运动,比如这个杯子它慢慢的浮空, 这个杯子突然炸裂,这个杯子逐渐变得透明等等,这些都属于在描述画面当中事物的运动状态,或者说以及画面当中的变化。例如现在我们就描述这个杯子突然爆炸,点击生成,可以看到最终生成的效果还是非常不错的。我们所描述的爆炸效果,这个杯子也给出了具体的内容,可以看到最终生成的效果,这个杯子就成功的发生了爆炸。 不过在进行手真图生视频的时候,生成的效果有一定随机性,如果第一次生成没有获得比较好的效果,不妨尝试多生成几次,或者在原有的基础上补充提示词描述的内容。因为当前这个杯子爆炸的效果可能过于柔和了,所以我们进一步在提示词中描述固定镜头,这个杯子突然爆炸,爆炸后的碎片飞速向四周扩散,然后再次点击生成, 可以看到这次生成的结果就相对符合了提示词的描述。不过在爆炸之后,杯子本身并没有出现破损,主要原因是视频生成模型生成爆炸这方面的能力还有 在完善,但不难看出,可以看到这次的生成结果在碎片的爆炸速度上就明显优于上次,但杯子依然碎裂的比较柔软。出现这种情况主要是基于当前的视频生成模型,并不擅长生成爆炸这类效果。不过依然可以看出我们所补充的提示词对生成的结果有了正向作用。这里顺带说一下,当大家在使用某一个平台生成某一种效果,无论如何都无法生成的时候, 考虑更换视频生成平台,每个平台所使用的视频生成模型擅长的方向是不同的,我们继续来讲解关于呼声视频的相关操作。在刚刚我们讲解过,在刚刚我们说过,在提示词描述中,主要描述的有两个方向,一个是画面的运镜,一个是画面当中的事物的运动,一个是画面当中事物的运动或者变化。其实在某些情况下,我们需要描述的还有第三个,那就是画面当中可能 会新出现的事物。我们还是以这个杯子为例,提示词就书写固定镜头,这个杯子里面钻出了一个小鸭子的脑袋,点击发送可以看到最终生成的效果。视频当中就出现了原本在图片里没有的内容,冒出了一只鸭子的脑袋,但我们可以注意到,当前冒出的这只鸭子的脑袋在颜色、造型、 美术风格上都是不可控的。所以当我们想要让画面当中出现新的事物,或者在运镜过程当中出现新的事物是我们指定的内容呢?自然是有的,就是我们下面要讲解的首尾真升视频。 举个例子,比方说我们现在需要让某一个人物戴上指定款式的墨镜,我们就可以提前利用参考图升图功能上传墨镜的样式参考图和人物的造型参考图让墨镜合理的佩戴在人物的身上,并要求人物的其他部分不改变。那么此时我们就分别获得了两张图片,一张图片是原有的人物, 而另一张图片是戴上了墨镜,但其他部分不改变的人物,此时就有了首尾针,且首尾针之间是有强烈关联的,我们分别将没有戴墨镜的人物作为手针, 墨镜的人物作为伪真。提示词方面,我们同样描述运镜以及画面当中事物的变化,所以这里我们就描述固定镜头,人物戴上墨镜,然后点击生成,可以看到最终生成的效果就是人物成功的戴上了我们在伪真图中指定款式的墨镜。我们下面再来介绍一下多真生成功能。在这个功能出现之前, 我们想要制作一个很长的画面当中人物的运动比较丰富的镜头时,通常采用的方法就是不断的进行首尾真升视频,之后以伪真图再作为手真图,并新增一个伪真图 生成下一个视频片段,最终用剪辑软件将分别生成的首尾帧剪辑到一起,最终形成一个超长的画面当中人物动作较为丰富的视频片段。但使用这样的方式往往会出现一个问题,那就是在每一个首尾帧片段剪辑衔接的过程中,画面会出现微小的宽高比以及 画面色调的变化,这样的变化虽然不大,但却很容易被肉眼察觉,影响观众的观看体验。所以多帧生成功能就很好的解决了这个问题。比如现在我们需要这个人物在戴上墨镜之后继续做出一个双手比叶的手势,此时我们就可以先用图片生成功能修改人物的姿势,然后进一步的将修改好姿势后的图片 作为生成视频的第三针上传到这个位置,使用方法也很简单,直接通过拖拽的方式拖拽到这个区域,可以看到此时就会多出一个新的图片上传区域,松开鼠标就可以可以将图片上传到第三针了。在上传好之后,针与针之间都可以添加提示词来描述画面当中的运镜以及事物的变化。例如在第一针和第二针当中,我们已经描述过了 固定镜头人物戴上墨镜,那么第二针到第三针之间,我们就描述固定镜头人物双手比叶,点击确定,点击生成,可以看到此时我们就生成了一条长达十秒钟的人物先戴上墨镜,然后再放下墨镜,然后再双手比叶的画面了。当然我们今天所使用的图片演示都比较简单,画面也多为固定镜头,大家在将来生成的时候使用更加复杂 图片以及经过转场之后的镜头,在大多数情况下也是可以轻松实现的。我们最后来简单讲解一下视频生成功能的相关参数。首先是视频生成模型的选择,这里和图片生成模型的选择一样,大家选择版本标号越高的越好,将来有四点零模型,五点零模型就 选择更高的。而视频生成模式这里有首尾帧、智能多帧和主体参考。可以看到主体参考是一个全新的功能,它有点类似于在图声图当中的参考图声图功能相当于给纹身视频添加了一些画面当中事物造型的参考。但即便有这样的参考,我依然不建议大家使用纹身视频功能,因为它的可控性依然很差,所以这项功能大家如果感兴趣就自行探索, 不过相信最后你还是会回到纹身视频的怀抱。在生成尺寸方面,如果使用的是纹身视频,那么就是一些常规的分辨率可选二十一比九、四比三、一比一、 三比四和九比十六。如果使用的是徒生视频,那么宽高比是有所上传的图片决定的。而分辨率方面,最高可以选择一零八零 p, 不 过当前使用的智能多帧功能最高只支持七二零 p。 此外,生成视频的时长有五秒和十秒可选,而在多帧生成当中,每一个图片之间的间隔是五秒, 因为现在我们上传了三张图片,此时就会生成十秒钟的视频。那么以上就是关于在极梦 ai 当中视频生成功能的详细讲解。本节课我们只讲功能,不讲技巧,想要生成更优质的 ai 视频, 更好的视频画面和更好的分镜头画面,大家可以继续往下观看我们的系列课程,这些都会在之后的课程当中讲到,相关的学习资料我也放在了评论区的置顶评论当中,大家需要可以自取。那么以上就是本期视频的全部内容,如果觉得本期视频的内容对你有帮助,也不妨点赞、关注、支持一下,我们就下期视频再见。大家好,我们这期视频来讲解如何使用 ai 大 语言模型来生成剧本和脚本。 首先要明确一下,制作 ai 作品自然是先有一个好的点子,有一个大致的方向,比如像战争题材的、 科幻题材的,或者是日常题材的。在有了这个大致的方向之后,下一步要做的事情就是生成剧本脚本了。相信大部分人都不是专业的导演或者编剧,并没有制作脚本剧本的专业能力,这个时候我们自然就要依靠 ai 大 语言模型帮我们生成,所以此时提问的方式就非常重要。在向 ai 大 语言模型提问时, 论是生成剧本脚本还是向他提问任何的问题,其实都有一个通用的格式。首先就需要给 ai 定一个身份,例如现在我们在提示词中描述你是一个水果销售员,请简单介绍一下苹果的优点,可以看到此时我们获取的答案就是苹果耐储存、营养高、口味百搭。现在我们来给 ai 设定一个新的身份,你是一个手机销售员,请简单介绍一下苹果的优点。 看到此时我们获取的结果就是苹果系统流畅稳定、性能强劲、做工精致等等。通过这两句对话我们可以看出,虽然提出的问题是相同的,都是简单介绍一下苹果的优点,但由于给 ai 设定的身份不同,最终他所给出的答案也完全不同。所以大家需要记住,在向 ai 提问时,我们想让 ai 在 更加专业的方向 给出相应的答案,就先给 ai 定下一个身份。那么定好身份之后,在提问框架中,第二项我们要提出的就是基础的问题,我们想让他做什么?比如在之前的问题当中,我们所提出的就是 介绍苹果的优点,而如果我们想要获取一个剧本或者脚本,同样提出一个简单的问题,帮我写一段脚本就可以了。所以提问框架之二便是告诉 ai 它要做什么,但在提出要求的时候,往往不同的提问方式也能获得很多不同的结果。例如我们只是单纯的让它生成一个剧本, 剧本是分为很多不同的方向的,从家庭论语到战争科幻,再到写实的纪录片,可以说剧本脚本的分类非常的广泛,不像苹果手机或者是苹果本身这种特别具体的东西。因此在给 ai 提问时,第三点就是规定 ai 回答的格式。就比如我们刚刚那两次提问,你是一个水果销售员,请简单介绍一下苹果的优点。你是 一个手机销售员,请简单介绍一下苹果的优点。可以看到,在这两次提问中,我们的要求都是简单介绍一下,因为无论是苹果还是手机,同样有非常多的方面可以介绍,从外形方面可以介绍,从品种方面可以介绍,从产地方面一样可以介绍。因此简单介绍看似是一个在提问时的常用语,但其实是给 ai 的 回答规定了格式, 所以总结一下,在向 ai 语言模型提出问题。而第三点便是规定回答的格式。有了这三个点,不要说是让它帮我们生成 剧本脚本,在日常生活中,我们向他提出任何的问题,通常都能得到非常规范且符合我们需求的答案。所以我们下面就基于这三个点,要求 ai 大 语言模 型帮我们来生成一个剧本脚本。首先第一句话便是你是一个具有多年拍摄和写作经验的世界顶级导演,这句话便是给 ai 设定了一个顶 级导演的身份。第二句话我们就来提出问题,现在需要你写一个简单的剧本,写剧本便是我们提出的问题。而第三点就是来规定格式, 是在这句话中,我们已经规定了一个简单的格式,就是要求写一个简单的剧本。如果说我们实在没什么好的点子,想要发散一下思路的话,写到这里就可以直接点击发送等待回执效果了。但如果我们有具体的想 要生成剧本脚本的方向,就需要进一步的来规定 ai 回答的格式。例如要求以人与动物之间的感情为主题,最好能有动物为了保护主人受伤的情节。可以看到这些内容的加入,就决定了最终剧本生成的导向,这便是最终我们给 ai 所设定的回答框架。但此时我们还需要考虑一个问题, 就是我们制作 ai 作品时,这个作品的时长是多少。这个问题非常的关键,因为这将涉及到我们最终完成一个 ai 作品所要花费的时间和资金成本。 所以这里我们最好来规定一下 ai 所给出的简单剧本的字数。通常来说,一分半的剧情对应的是四百字左右的剧本,当然具体看剧本当中所给出情节和分镜头画面的曲折程度来决定。所以这里我们进一步提出要求,要求故事情节尽量简单,剧本字数不超过四百字。 在回车发送可以看到一段时间后,剧本就生成好了。这个剧本所给出的内容还是非常详细的,其中包含了三个场景及每个场景当中都发生了什么样的故事,整个故事的情节也非常简单,首先场景一讲述了老人和狗之间感情非常好,而场景二则讲述了老人去取药的时候,有一只野狗扑向了老人,而老人所养的黄狗护主的故事。 而场景三则讲述了野狗被赶跑,但老人所养的黄狗也因此受伤的情节。那么有了剧本之后,下一步便是生成脚本了。大家在这里可能会 疑惑,剧本和脚本有什么区别呢?通常来说,剧本更像是一个故事的梗概,主要是给导演看的,让导演能够以短时间内快速的了解整个故事发生了什么,有哪些情节,那作为一个 ai 视频来说,导演便是生成这个剧本的我们,所以我们十分有必要在生成脚本之前,先生成一个剧本, 让我们清晰的了解这个故事发生了什么。至于脚本,它更像是在生成 ai 视频分镜头图片时,作为一个指导书般的存在, 能够指导我们这个画面有怎样的构图,有怎样的内容,在生成时该书写什么样的提示词,在制作视频时该生成多长时间的视频片段。同时,在和甲方对接时,一个脚本通常显得字数很长,也很专业,同样是一个加分项, 从多个角度考量,在写好了剧本之后,下一步生成一个脚本都是很有必要的,所以我们下一步就来书写基于这个剧本生成对应脚本要求,脚本中包含每个分镜头的详细画面描述、人物对话、镜头视角以及可以增强镜头表现力的提示词、分镜头的时长及一个脚本最基本的元素。在这段内容中,前面是我们所提出的生成脚本的要求, 看到这些要求都是基于将来方便我们生成分镜头图片时所提的要求,比如像镜头的视角,增强镜头表现力的提示词,而最后一句话则是基于我们并不是一个专业的导演或者写脚本的人,不知道一个脚本最基础的有哪些元素,所以这里就多提了一句,让他帮我们生成 一个脚本最基本的元素。在写好了这些内容之后,就直接点击发送,一段时间后脚本就生成好了。可以看到最终生成的脚本要远比一个剧本在内容上更加丰富。这里就包含了每个分镜头的镜号, 时常镜头的视角,其中画面描述和增强表现力的提示词,我们都可以将其用在生成分镜头图片中,而且我们可以看到当前的脚本中一共有六个镜号,也就是说至少我们需要生成六张图片作为将来生成视频的首尾帧画面。相比于只有三个场景的剧本,显然脚本要丰富很多,既能够更多展现画面的细节,也 能够在和甲方对接时让甲方觉得你更专业。当然需要注意的是,通常来说我们所生成的脚本是绝不可以直接使用的,因为极有可能在脚本当中存在很多 多前后剧情上的矛盾,逻辑上的错误,或者由于画面描述过于华丽或是不合逻辑,导致生成的图片并非我们想象当中的图片。因此在使用脚本当中的内容生成分镜头图片时,一定要根据自己对剧本的理解 进行修改,在剪辑时,每个镜头的时长也并非要严格遵循在脚本当中所给出的时长,大家根据自己的实际观感来调整时长即可,所以往往最终的成 会和脚本当中所描述的有不小的出入。在更多时候,其实脚本仅仅是给我们一个在生成画面时的参照,真正想要生成好的画面,我们使用的往往是我们作为导演对这个剧本的理解好的。那么现在我们已经学会了如何用 ai 大 语言模型, 通过今天所讲解的提示字框架技巧生成剧本脚本。从下一期视频开始,我们就要讲解在获得了剧本脚本之后如何具体的成分、镜头、图片以及保持角色的前后一致性了。包括整个制作 ai 视频的全流程,我们也会在后续的内容当中详细的讲解。如果大家觉得本期视频的内容对你有帮助,也不妨点赞关注、支持一下,我们就下期视频再见!

一口气教会你各种热门 ai 视频制作,恭喜刷到这个视频!本系列视频为二零二五年最完整 ai 视频教程,耗时两个月,制作共计一百二十小时,带你一口气从零基础小白蜕变到大神!由于视频太长,本套教程分为八期发布,本期带你搞定制作篇。 除此之外,本系列视频中用到的 ai 工具、提示词、速查脚本、参考工作流,还有目前 ai 视频的热门玩法,我都会整理起来放在置顶视频里, 有需要的伙伴可一步获取。大家好,我们这期视频来讲解如何制作 ai 视频的特效。首先来看视频特效的定义,视频特效是通过技术手段对视频画面进行修饰、合成或创造,以实现现实中难以拍摄或者无法呈现的视觉效果的技术。所以其实 ai 本身也是一种特效,因为使用 ai 生成视频, 我们本就可以生成一些在现实生活中很难见到的景象。而对于 ai 生成而言,它的特效又包括这些,像风格迁移,比如说让原本写实的风格突 然转变为二次元的油画的或者水彩的风格等等。再比如像虚拟元素的生成特效,比如现在我们在提示词中输入生成一个长着鹿角的小黄鸭,然后回车发送,可以看到此时 ai 就 生成了一组 极具创造力的长着鹿角的小黄鸭的图片。其实这本身也是一种特效,创造在日常生活中看不到的生物,当然像场景同样如此,大家可以尽情的发挥想象力。而第三种就是比较常规的特效了,像粒子、火、 烟雾、水流、光线轨迹等等。第四种则是画面优化与修复特效,正常的画质修复、划痕修复或者修复老照片,这同样属于特效。而第五种是内容替换与 合成特效,比如更换背景、替换文字,给服装头发换颜色,或者让场景 a 丝滑地转化为场景 b。 这些在 ai 视频生成中的常见功能本 也是一种特效,所以像第一项、第二项、第四项和第五项,大家只要尽情的发挥想象力,或者使用 ai 绘画当中常用的一些功能,都是可以轻松实现的。我们今天主要讲解的是一些常规意义上的特效,比如像粒子、火焰、雷电等等。其实这些特效的生成也并没有什么特殊的技巧,只 要把提示词写对就可以了。我们下面来看几个案例。首先第一个案例是粒子效果,我们这里可以直接来到吉梦 ai 的 首页,在搜索栏搜索粒子,可以看到有很多由其他作者生成的艺术作品, 这些作品都是在提示词中加入了粒子效果的,可以看到整体的效果还是非常不错的。对于这张图片本身就是包含特效的,那么如果将这张图片用作生成视频,通常来说会更容易生成与 图片相吻合的效果。比如当前我们所播放的这个视频就是一个非常典型的图片是粒子效果,那么生成的视频同样有类似的表现的效果。此外,像火焰特效,如果想要获取相关的生成提示词,我们同样可以观察其他作者生成的作品,以此来学习。 在实际案例中,我也展示了很多常规特效的生成方法,对于我们来看这个案例提示词书写的是生成一个晶莹剔透的冰块,冰块内部有一个烧红的正着火的燃烧的炭块,通过这样的提示词,我们成功生成了对应的画面,这就是火焰的特效。当然大家也可以描述让人物的身体着火,或者让其他事物的身体着火,除了着火之外,像火 火焰缠绕全身,或者火焰形成飓风,大家都可以尽情的发挥想象。对于生成的效果方面,我们使用生成的图片来进行手震图生,视频提示词就描述视频中的冰块中的火焰不停的燃烧,高级感四 k 高清,可以看到最终的效果还是不 错的,火焰在冰块中顺利的燃烧了起来。除了常规的描述燃烧,像在生成图片时,我们所使用的火焰环绕什么东西或者说粒子效果都可以应用在生成视频中。比如看下方这个例子,一个雷电环绕周身的道士,最终生成的效果就是一个被紫色雷电所包裹的道士,虽然不是写实的风格,但想要生成特效依然不是一件困难的事情。其实词中我们就描述视频 中的道士周围被紫色闪电环绕,闪电闪烁,道士周围不断产生新的紫色电弧,你看到最终生成的效果还是不错的。不过需要注意的是,在极梦 ai 中生成闪电并非是像现实生活中那样闪一下就结束了,而是一个持续不间断的电弧,所以大家如果想要生成天空中劈下一道闪电,其实在极梦 ai 当中是一个比较困难的事情, 如果图片中本身就有闪电,那么生成的视频大概率会让这个闪电的电弧持续存在,所以对于这种情况,不妨尝试使用其他平台来生成更加合理的自然效果。除了像火焰、闪电这类常见的自然特效,在游戏中比较常见的还有一些发光能量体的特效,例如这里我们生成的是弥散失真流体的非规则的 红色能量的宝剑,可以看到生成的效果还是非常偏游戏化的,就像是游戏当中的某种魔剑,上面环绕着红色的流动能量效果,这样的效果想要生成视频也不 是一件难事。提示词方面,我们就描述红色能量缠绕宝剑流动,另外再加上一个粒子效果,可以看到最终生成的效果还是十分符合我们对于这种流动能量的想象的。除了时机的物体产生能量之外,在制作特效时,也有一些特效是让物体本身由能量体组成,这样的设定在英雄联盟的美宣途中会比较常见,例如像游戏当中 飞流思的这个美宣图,他身后的这个人物就是由能量体所组成的。在 ai 的 生成中,我们同样可以尝试生成类似的能量体。例如像这里的描述,完全由光合影组成,没有实体的形态,动态模糊抽象,通过光线的明暗变化来塑造出什么样的形体,这 看到最终生成的效果,就让生成的这个龙有了能量体的效果。当然像类似的描述大家也可以尝试,例如像漂浮在半空中的能量虚影,由能量化作的什么样的个体,类似的描述都能生成比较好的结果。至于制作视频方面,大家可以做多种尝试,例如像我们刚刚老生常谈的粒子效果、寒气缠绕、冰龙的身体流, 这些提示词我都总结到这里了,更多的提示词可以查看评论区的置顶,大家也不妨尝试用自己对特效的理解来描述生成图片和制作视频。同时也不要忘记在极梦 ai 中去学习其他作者的制作手法,借鉴其他作者的提示词也不失为一种好的方法。 以上就是本期视频的全部内容,如果觉得本期视频的内容对你有帮助,也不妨点赞关注支持一下,我们就下期视频再见。 大家好,我们这节课来讲解如何生成像刚刚那样的山海经当中的动物变身为人形的 ai 视频。想要生成那样的视频,思路也非常简单,那就是先生成山海经中的动物的人类形态和动物形态,再通过首尾真生视频的方式来生成对应的视频片段。首先来到极梦 ai 中,我们来寻找一个待会要生成的风格,让大家有自己想要的风格,也知道怎么描。 描述的话也可以用自己的方式来生成想要的风格,比如这里我们就选定这张图片的风格作为待会生成的提示词标准。将右侧作者在生成图片时所使用的提示词复制下来,然后回到豆包 ai 当中,将刚刚的提示词粘贴到输入框中,按住 shift 键加回车进行换行。这里我们就描述提取上述提示词中有关风格描述的部分,然后连起来发给我, 点击发送一段时间后,我们就获取了刚刚所复制的提示词中有关风格描述的部分,当然还需要检查一下有哪些可能会破坏最终生成的结果,需要自己有选择性的对其进行删除。现在将这些提示词选中后复制下来,然后来到极梦 ai 的 生成 页面,我们准备生成图片,在提示词输入窗口中 ctrl 加 v 粘贴刚刚复制好的提示词内容。这里我们选择性的删除一些提示词,比如这里的 b、 j、 d 插画,还有复杂设计以及色彩饱和度高这样的提示词, 这种提示词的描述会相对极端,或者是不利于生成我们想象当中的结果一些,大家届时可以根据自己的需求选择性的进行删除。在删除好这些提示词之后,我们在提示词的最前方来描述我们的生成需求,例如这里我们就描述生成山海经中九尾狐狸的动物造型,然后选择合适的生成宽高比,这里就选择三比四。另外,如果大家不知道山海经中有哪些 动物的话,可以继续向大语言模型求助,直接向他提问山海经中的经典动物有哪些。现在回车发送可以看到,此时豆包 ai 就 给出了一些山海经当中的经典动物, 同时还附带了外形相关的描述。我们现在回到吉梦 ai 的 界面继续来生成,将刚刚的提示词直接发送。在生成好之后,我们可以注意到此 时生成的内容在美术风格上有些过于黑暗了,如果大家不想要这样的风格,可以继续考虑删除提示词中可能与当前所生成画面有关的一些提示词内容,例如这里的黑暗风、中式怪诞、聊斋风格、剪彩风格,这些提示词的描述最有可能导致当前生成的结果。 我们在提取其他作者生成图片的提示词时,极有可能会因为生成的主体不同而产生不同的画面美术风格,这样的情况非常常见,对大家需要多思考去及时的调整。所提取的其他作者使用的风格描述词,在删除好之后继续发送一遍,看一看此次生成的效果如何。可以看到这次生成的效果相对于上一次就 好了不少,如果没有继续调整的需求了,我们就使用当前这些图片来作为生成的手帧,待会来生成视频。大家在创作时想要继续调整,就继续修改提示词内容,我们下面来创建。九尾狐的人类形态 是保留当前的提示词,然后将提示词第一句当中的九尾狐狸的动物造型修改为九尾狐狸的人类造型,然后再次点击发送。可以看到此时生成的人类造型的效果在画面表现和美术设计上还是比较惊艳的,但也不难发现人类造型 和动物造型之间存在较大的在色调上的差异。虽然有时在首尾帧升视频时也能够产生色调上的变换,那我们最好保持动物形态和人类形态在生成的美术色调上能够保持一致。 在这里在生成人类形态时,可以再补充一句来描述生成的动物形态的色调,比如说当前我们所生成动物形态的黑金风格,补充在最后的位置, 然后再次点击发送。可以看到此次生成的人物造型在色调上就和我们刚刚所生成的动物形态比较接近了。我们下面要做的事情就是将生成的这两组图片中挑一个较为满意的造型,满意的角度把图片下载下来,回到豆包 ai 当中,看一看还有哪些需要生成 山海经当中的动物,比如说像这里的琼奇也是一个典型的山海经当中的动物,所以我们这里就再次修改提示词,将山海经中九尾狐狸的人类造型修改为琼奇的动物造型,然后点击发送。当然黑金风格大家可以选择性的保留, 如果删除的话,生成的会更随机一些,待会再根据实际生成的效果来添加。在生成人类时的提示词描述好了一段时间后,琼奇的造型就生成好了,可以看到整体生成的造型还是比较符合在豆包 ai 中对琼 奇这个山海经中的异兽的描述的。下面就来生成对应的人类风格,根据动物风格的色调,我们在提示词中加入蓝紫色调,然后将动物造型修改为人类造型。回车发送一段时间后,我们索要的山海经当中穷奇的人类造型图片就生成好了,可以看到在色调上还是比较一致的,相同的色调更有利于在生成时 成功的在图一和图二之间丝滑的变形。我们下面要做的事情就是将生成好的图片和之前生成视频一样,先整合到同一个文件夹当中,根据其出场的顺序进行标号,然后回到吉梦 ai, 在 左下方的下拉菜单中选择视频生成功能,分 分别将动物形态的图片作为手针,人类形态的图片作为尾针,以此来生成对应的视频片段。而提示词方面,我们就描述动物化为人形,当然其实在这样的生成中,提示词的作用并不是很大,只要前后的图片之间在造型设计和色调上有所关联,即便什么也不写,通常在生成之后也能获得非常丝滑的变身效果。 现在点击发送,用相同的方式,我们再来生成穷奇的形象,从动物形态化身为人类的视频,提示词就保持相同的描述,现在点击发送,如果生成不成功的话,可以尝试多生成几次, 一段时间后视频就生成好了。我们来简单看一下效果如何吧。可以看到这是九尾狐的变身视频,整体的效果还是比较丝滑流畅的。再来看下方的穷奇的变身视频,可以看到整体的效果也非常的自然。从动物形态成功的化身为了人类形态,我们下面要做的事情就是将视频下载下来,整 好先后顺序,然后将他们拖拽到剪辑软件当中,寻找合适的配音配乐,添加合适的转场效果,以及在适当的位置添加一些特效,将生成好的 ai 视频片段进行剪辑成片了。如果大家对山海经中的其他动物感兴趣,想要做类似的变装视频,相信经过两个案例的演示已经可以举一反三了,所以这里我们就不再做荣誉的演示。最后就来看一看成片效果如何吧。 在抖音上我们能够找到很多像这样的萌宠走秀类的 ai 视频,像这种视频是如何制作的呢?我们今天这节课就和大家详细的讲解一下。我们首先在抖音上搜索萌宠走秀,在搜索结果中找到任意一个热度比较高的视频点 进来,然后使用截图工具将萌宠正在走秀当中的图片进行截取。和生成其他类型的视频一样,第一步我们需要做的事情就是来获取对应生成图片的提示词。来到豆包 ai 将刚刚截图的内容上传给豆 好,提示词方面我们就这样描述,这是一个 ai 生成的萌宠走秀的图片,请帮我分析生成这个图片的提示词,并模仿这个风格,给我提供二十个不同种类动物,穿不同类型衣服走秀的拟人动物走秀的图 片。生成提示词现在点击发送可以看到,一段时间后我们就获取了二十个能够生成动物走秀图片的提示词,并且既有中文也有英文,方便我们在 madjaroy 这类国外平台上也能够生成类似的内容。我们可以从中挑选几个喜欢的动物,将提示词复制下来,然后回到吉梦 ai 的 生成页面, 选择图片生成功能,将刚刚复制好的提示词直接粘贴到提示词输入框中,然后选择一个合适的生成比例,这里由于是动物的走秀视频,所以我们就选择一个更加适合手机视频播放平台的比例,例如九比十六。然后直接点击右下方的生成,可以看到一段时间后我们就获取了符合 提示词要求的结果,获得了一个拟人形态的狐狸,穿着开叉旗袍,戴着珍珠耳环,在上海舞厅的 t 台走秀的画面,我们再来尝试生成一个新的动物,例如这里的拟人柴犬,将提示词复制下来,然后回到吉梦 ai 当中,把提示词粘贴到输入框中,然后直接点击生成,可以看到此时生成的效果也 非常不错。我们成功的生成了一个拟人柴犬,穿着对应的服装,在提示词描述的场地走秀的画面。不过这里需要注意的是,我们此次生成的两个拟人动物在整体的形态,而并非是动物的形态, 所以在生成时我们可以自主的选择所生成的结果,在形态上是更倾向于人类还是动物。具体的描述就是在拟人柴犬后面,我们加上形态更偏向于动物, 然后点击发送,可以看到此时我们生成的结果,在形态上就保留了更多的动物特征,拥有了动物的爪子和动物的尾巴,像刚刚生成的狐狸同样如此。我们现在回到上方选择重新编辑,然后在拟人狐狸的后方输入提示词,形态更偏向于动物,然后点击发, 可以看到此时生成的结果在动物特征上就变得更加明显了。在生成好了这些动物图片之后,我们接下来要做的事情就是将这些图片都下载下来,然后将他们按照出场的先后顺序整理到同一个文件夹当中进行标号,然后回到极梦 ai 选 择视频生成功能,我们使用手抉图生视频的方式,分别将这些动物图片都生成为视频,而提示词方面我们就描述镜头跟随和走路就可以,现在点击发送一段时间后,视频就生成好了,来看一看效果如何吧。 看到整个动物走路的形态还是非常自然流畅的,我们下面就重复刚刚的操作,将每一个分镜头图片都上传到手针图的位置,配合镜头跟随走路这样的提示词描述来 生成相应的 ai 视频片段。再将这些动物走秀的 ai 视频片段都生成好之后,我们下面要做的事情就是将它们整理在同一个文件夹当中,为了让待会的生成更加有条理,对其进行标号,然后就是进行剪辑成片了。将生成好的 ai 视频片段上传到剪辑软件当中,和上上节课所讲解的灵异类视频以及 异兽变身类的视频一样,通常这类视频只是为了视觉效果,并没有剧情上的前后逻辑,所以大家可以根据自己的喜好来更改视频片段的出场先后顺序。而在配乐方面,我们通常就直接根据主题来搜索,比如这里我们搜索走秀,在搜索结果中点击 一个进行试听,可以听到这样有节奏的音乐,就非常适合当前这样的走秀视频。将这个音乐直接通过拖拽的方式放到剪辑轨道上,然后将多出的部分裁剪掉。这里可以使用一个剪辑技巧,就是将鼠标悬置在剪辑轨道上的音频文件上,可以看到最右侧有一个小圆圈,我们将这个小圆圈向左侧 拖动,此时声音就会以渐出的方式逐渐减弱,以此来让视频的结尾音乐结束的更加柔和,不会那么突兀。除此之外,也可以增加一些走秀时的转场效果,因为画面当中每一个视频片段的动物类型都不同,所以这里的转场可以相对突兀一些。例如我们就选择这个叫三屏滑入的转场特效,看一看效果如何。可以看到这个效果 不显得突兀,同时又使得两个视频很好的衔接在了一起。大家也可以尝试其他的转场特效,可以直接将特效拖拽到两个视频片段之间,然后点击播放预览查看效果。如果觉得不合适的话,就在选中这个转场特效之后,按 delete 键进行删除即 可。像这样的走秀视频通常是不需要配音的,所以这里大家通常无需在音效分选项当中寻找对应的音效,我们只需要搭配一个比较动感的符合走秀场景的背景音乐即可。 至于特效方面,大家可以酌情添加,例如像这里的动感分选项当中有一个摇晃运镜就比较适合像这样的走秀场合。我们将其拖着到剪辑轨道上来,简单预览一下效果,可以看到这个效果是不是 很合适呢?在选中这个特效之后,右上方可以调节相应的参数,例如像摇晃的强度、摇晃的速度都可以适当减弱。我们再来预览一下,看到将摇晃的强度和速度减弱之后,整体的特效就变得更加自然契合画面了。那么话不多说,我们下面就以剪辑好的成片来结束这节课吧。 大家好,我们这节课来讲解微缩景观类的 ai 视频该如何制作。首先要说明的是,像这样的视频通常是不具有剧情的,因为像微缩景观类的视频往往是远景拍摄,想要带有剧情的人物演出,一般来说是一件十分困难的事情, 所以大部分这类视频都是以展示风景为主。所以这里我们就将重点放在生成图片上。具体的提示词描述也非常简单,我们就直接描述一周镜头,微缩景观后面加上朝代或者是地理位置方面, 描述不同的国家,以此来生成不同的建筑和风景。例如这张图片我们描述的就是中国古代,你看到生成的结果都是一些古代中式的建筑。当然,像移轴镜头类的风格图片其实有很多,虽然都是移轴拍摄的效果,但可能风格上有细微的差异。如果想要寻求其他的风格,我们不妨借助极梦 ai 在 首页直接搜索移轴镜头。可以看到,在搜索结果中就出现了很多不同 题材、不同风格的一周镜头效果了。比如这里厨师和一个超大型鸡腿的效果就显得十分富有创意。如果大家想要生成类似其他的效果,也不妨学习一下其他作者在生成图片时所使用的 提示词。无论使用何种方法,在生成好图片之后,我们下面要做的事情就是让图片变得更加具有特色。一周镜头和微缩景观只是一个风格或者说效果,我们具体要表现的内容还需要自己在提示词中进行说明。比如这里,在生成好了常规的中国古代街道之后, 我继续向豆包 ai 提问,让他按照上方图片的风格,分别生成古代的茶楼、医馆、衙门、石桥和戏楼,那么按照要求,最终就生成了符合疑似词描述的画面。不过这里茶楼、医馆以及衙门这三张图片在画面内容的重复 度上有些高了,似乎只是换了牌匾。这也是我们使用有前后文关联功能的大语言模型时偶尔会遇到的问题,那就是他没有真正理解我们的意图, 导致生成的结果会出一些乌龙。不过没关系,我们之后再独立生成就好了。所以接下来我单独生成了医馆以及中国古代的茶楼,还有中国古代的衙门。在这些内容都生成好之后,下面要做的事情自然就是整理图片了。我们将生成好的图片都整合到同一个素材文件夹当中,并按照先后的出场顺序对其进行标号。随后要做的事情便是来到 ai 视频生成 平台,将这些分镜头图片生成为视频片段。这里需要注意的是提示词描述,比如说像第一个镜头在石桥上有很多人,像这样有很多人的画面,我们就直接描述固定镜头,人群走动,通常都能取得很 不错的效果,你看到这样的效果是不是还不错呢?而一些画面当中人物有特定行为呢,可能就需要我们去描述具体的人物在干什么了。比如这里描述的是固定镜头,大夫在诊脉,火机在整理干药材,这样的表现效果并不是很好。所以之后我对这条视频进行 重新生成,更改了对人物动作的描述,让大夫和病人之间有相互交谈的行为,这样比静止不动要好得多,就像下面这个衙门的图片,我的描述是固定镜头看守在站岗房间里的人走 出房间。因为本身画面当中可动的部分非常的少,既没有什么植物可以用来被风吹动,也没有什么人群可以让其走动,而站岗的人呢,似乎又不太能动,所以这里能动的就只有在房间中走出的人了。不过显而易见,生成的效果并不是很理想,从房间中走出一个特别高大的人, 比例上有些失调了。因此在生成微缩景观的画面时,大家尽可能规避画面当中不可动的内容较少的一些图片,否则在生成视频时可能就比较尴尬了。因为目前的 ai 视频生成模型更加擅长的是处理一些近景镜 头人物特写,包括人物的微表情,人物的具体动作。像这样的远景镜头想要处理起来,在很多时候比例上可能会出问题,至于其他的画面亦是如此。那这个茶楼的画面描述的就是喝茶聊天,而唱戏的画面呢,就是台上的人在唱戏, 台下的人在鼓掌,整体生成的效果也是不错的。在生成好了每一个分镜头片段后,我们下面要做的事情自然就是来到剪辑软件当中,将视频添加配音、配乐、转场特效剪辑成片了。在配乐方面,我选择的是一个偏古风的音乐,毕竟生成的画面本 身就是中国古代,同时还对每一个分镜头画面都配上了相应的诗歌,让画面显得没那么枯燥。那么这些诗歌是如何进行搭配的呢?当然在 ai 时代是不用自己书写的,在豆包 ai 当中,我们将每一个分镜头图片都上传上来,并向大语言模型提问。给图片配一句诗歌 时,豆包 ai 就 自动回执消息,给这张图片搭配了合适的诗句。比如第一张图片搭配的就是赤桥观柳戏,江露野梅香,这不是非常契合我们所上传的第一张图片呢?其他图片亦是如此。 在获取了每一个分镜头较为匹配的诗句后,就回到剪映当中,选择文本选项,将文本拖拽到下方的剪辑轨道上,然后输入对应的诗句就可以了。同时我们还需要给诗句添加相应的出场效果和退场效果,以及每个分镜头片段之间的转场效果。这里我使用的是一个普通的效果,也可以在实际剪辑时进行尝试。那么话不多说,我们最后就以成 天来结束这节课吧。如果觉得本期视频的内容对你有帮助,也不妨点赞关注支持一下。 大家好,我们这期视频来讲解一下如何在本地部署生成 ai 视频的工作流。在先前的课程当中,我们所讲解的如何生成 ai 视频都是基于 ai 视频生成平台的。像可林奇梦多某 ai 这些在网站上打开的 ai 视频平 台,虽说生成的效果都非常好,平台的操作也非常方便,功能也较为全面,但存在一个致命性的问题,那就是生成的 ai 视频在尺度方面是有严格的审查机制的,当我们想要生成一些尺度较大的 ai 视频时,可能像这样的传统 ai 视频生成 平台就无法满足我们的需求。所以今天就来教大家如何下载本地康复 u i 以及如何在康复 u i 当中加载 ai 视频生成工作流。我这里已经提前准备好了康复 u i 的 整合包是秋叶大佬的版本,大家需要的话可以在评论区的置顶自取。 当压缩包下载好之后,右键这个压缩包解压到电脑上你指定的位置,在解压好之后,我们所获得的这个 comfui 文件夹就称之为 comfui 的 根目录。双击进入根目录文件夹当中,可以看到这里有一个叫会事启动器的应用程序,我们双击这里一段时间后,就打开了一个叫会事启 动器的操作界面,在这个界面当中我们要先进行一些基础的设置。首先来看左侧的疑难解答分选项,点击进入后,点击右上方的开始扫描,会自动检测当前电脑的运行环境是否是全面的,如果没问题的话,就会弹出当前所示的这个窗口, 如果有问题的话会告诉你解决的方式是怎样的,大家遵照给出的提示来补全电脑的运行环境即可。然后是左侧的版本管理分选项,在这里可以选择 comfy ui 的 版本。需要说明的是,我们切换版本并不意味着要删除旧版本来下载一个全新 新的版本,而是在原有版本上进行更新,所以通常切换版本的时间大概就是几分钟到十几分钟之间,不会特别漫长。除了切换内核版本之外,像在 comfui 上安装的很多节点插件,在上方点击扩展分选项,同样可以在这里实现一键更新或者卸载相关的节点插件。通常来说,我们下载最新版本的就可以 在做好这些准备工作后,点击左上方的一键启动,回到首页,然后再点击右下方,这里就可以启动 comfui 了。看到当前所示的就是 comfui 的 后台运行窗 口,无论是启动 comui 还是运行工作流,在这里都会显示完整的运行步骤,有时出现报错也可以在这里查看,并将报错结果使用豆包、 ai 或者是一些搜索引擎来搜索报错的原因。一段时间后,等 comui 正式启动,就会在我们电脑的默认浏览器上打开这样一个网页。虽说 comui 是 一个本地软件,但其操作界面是通过浏览器打开的, 此时我们所见到的是一个默认的基础纹身图工作流,使用它可以进行最基础的纹身图操作。比如现在我们直接点击最下方的运行 工作流就开始运行了,不过我们会发现在中间这个位置会弹出一个报错提示,这样的提示非常常见,在运行工作流或者导入新的工作流时,如果出现了模型的缺失或者节点的缺失,通常都会有类似的提 示,我们只需要根据提示来进行对应的修改即可。比如当前的提示就是在 checkpoint 加载器这个节点上缺少所选择的模型,所以我们要做的事情就是下载一个新的 stable 标识模型,放置在相应的模型文件夹中即可。具体的放置位置在根目录当中选择 comui 这个选项,来到 comui 的 文件夹后点 以及 models 文件夹,然后找到第一个 checkpoints 文件夹,将大模型放置在这个位置,就可以运行刚刚的文生图工作流了。回到正题,我们来讲解一下如何在本地 comfyui 上来加载视频生成工作流。方法也非常简单,并不需要我们从零开始搭建每一个节点。目前的 comfyui 我 们可以 点击左上方的工作流下拉菜单,可以看到这里有一个浏览模板的选项,在点击打开之后,多数的 comfyui 工作流我们都能够在上面找到将作为基础的文生图生图或者包含 lara 的 图像生成工作流, 或者还有生成 ai 视频的工作流。有当前的页面就是生成 ai 视频的工作流选择页面,在这里我们就可以选择一个生成 ai 视频的万象二点二工作流模板为我们所用了,比如就选择第一个,可以看到在选择好这个工作流之后,同样弹出了一个窗口,告诉我们在加载图标时未找到以下模型。 所以这里就需要我们点击窗口当中的下载选项,在点击之后会直接跳转到下载页面,帮助我们下载当前工作流中所 缺失的模型。也可以点击后方的复制链接,将下载链接复制好之后,在本地浏览器中打开。不过需要注意的是,有时候我们下载这些文件是来自于外网的,所以下载的时候可能需要开启网络加速器,不知道如何开启的同学可以查看评论区的置顶。例如现在我们点击下载这个二百四十二兆的选项,这时会弹出一个新的网页,如果你的网络链接没有问题, 一段时间后,你的浏览器都会将这个文件下载到浏览器的默认下载位置,其余缺失的模型文件同样重复这个操作。在全部补全完整之后,我们就可以成功的运行当前的工作流了。这是一个在本 地使用文声视频的方式生成 ai 视频的工作流,基本的参数都已经设置好了,我们只需要添加提示词的描述,将其翻译成英文就可以正常使用了。当然这些模型也需要在刚刚我们去下载补全,现在刷新一下页面,我们来补充一下刚刚下载的模型应该放置在什么位置, 其实这里已经向大家说明了,可以看到每一个模型下载选项中间都有一个斜杠,在斜杠的左侧就是其放置的文件夹位置, 而斜杠的右侧就是其文件名称。比如这里的 u m t 五杠叉叉 l 这个文件,它所放置的位置就是斜杠左侧的 text encoders 文件夹。我们回到 comfui 的 根目录,然后找到 model 文件夹,在 model 文件夹中就能够找到刚刚我们所见的叫做 text encoders 这个文件夹了,下载好之后就放置在这个文件夹里面就 正常使用工作流了。其余缺失的模型文件同样这么来判断,比如这两个是放进 deforestation models 文件夹的,而这一个是放进 vae 文件夹的,这是一个万象视频生成模型的 vae 模型。 如果大家想要进行徒生视频的话,我们就需要换一个工作流方法,同样是点击左上方的工作流下拉菜单,然后选择浏览模板,点击视频这个分选项,从中找到这里的 image to video 这个选项,此时弹出的就是一个徒生视频的万象视频生成工作流,可以看到这里有一个加载图像相关的节点,将图片上传到这个位置,再配合提示词的描述,就可以生成对应的视频了。 默认生成的是五秒钟的视频,对于本地电脑来说,这个长度已经是比较极限的长度了。而对于我的电脑来说,由于配置较低,是三零七零八 g 显存的显卡,所以就不再进一步补全相关的模型来给大家尝试生成了。 如果大家的电脑配置充足的话,可以按照这样的方法使用自己的电脑在本地生成尺度更大的 ai 视频。那么以上就是本期视频的全部内容,如果觉得对你有帮助,也不妨点赞关注、支持一下,我们就下期视频再见!

逼自己一个月练完,其实你很会集梦,全一百集存下吧,真的很难找全的!警告,本视频教程耗时两个月,制作共计二十小时,带你一口气从零基础小白入门进阶!由于视频太长,本套教程分期发布,本期带你搞定集梦基础入门操作 怎么样?刚才这段视频看起来是不是还挺专业的?这就是现在 ai 视频工具的强大之处,这些画面全都通过 ai 来生成, 现在只要你有创意,并能清晰的把你的想法说给 ai, 也就是学会怎么写提示词,你想要什么样的画面,镜头的感觉和节奏是怎样的,即使你不会画画,不会拍摄,一样可以做出惊艳的视频。 接下来的内容,我会一步步带你从零开始,完整掌握 ai 视频的制作方法。除此之外,在本系列视频中用到的 ai 工具、提示词、速查脚本、参考工作图,还有目前 ai 视频的热门玩法,我都会整理起来,打包放到下方的置顶评论,有需要的伙伴可一步获取。 今天带大家解锁这款目前最主流的国产一站式 ai 创作平台吉梦。我们来到吉梦的首页,首先我们可以注意到它的界面分成了三大区块,第一块是上方的横板工具栏,它这里包括了图片生成、视频生成、数字人和动作模仿四个常用功能选项。 接着第二块是下方的 ai 作品展示区域,这里有非常多样的 ai 创作的作品,有发现选项下的图片作品。然后我们切换到短片选项下,还可以看到视频作品,我们点开一个看下效果。 这里是早间新闻,本是金城突发异想陆家嘴鲸线巨型雪王机甲,他这个是走的电影预告片的形式,可以看到他这里选用了最近热度很高的蜜雪冰城。雪王的一个主题, 在很多细节上也都做了处理,比如画面当中的一些文字。上海大炮准备完毕,安卓预警核心战备防御完毕。 那像这样一个视频,我们如果只看他的其中某一个分镜,其实元素也不算很复杂,但整体上完成度还是很不错的。 上海即将落成这样一座非凡的城市, 希望能为人类换取一线生机。我们再来看一看写实风格的视频作品, 我叫陈媛,我是住在东海时的幸存者,我已经三年没有见过任何人了,如果有人在外面, 请与我联系。胖虎,尝尝我给你新做的猫粮。可以看到 ai 对 于人物、动物场景的刻画也是十分的细腻,除了人物稍带有一些 ai 感外,其他的元素我们如果不仔细看的话,可能都不会怀疑这些是由 ai 制作。三体什么时候到货啊? 虽然基梦可以直接用提示词生成视频,但是要制作这些质感比较好,完成度高的视频,我们还是需要靠参考图加提示词的方式去精准控制它的生成。 接着我们回到之前的界面,注意到这里的搜索栏,我们可以输入任何我们想要搜索的内容,比如我搜索蔡叉叉,他就会展示与搜索词关联的结果。我们点开一个作品,可以看到右侧会展示该作品用到的提示词,所用的模型以及比例等。最后一块是页面左侧竖板工具栏,我们点击里面的生成, 此时就来到了我们最主要的工作区,这里的功能选项也是图片生成,视频生成,数字人和动作模仿,与刚刚首页上方的工具栏是一致的,之后的课程中我们都会依次学习到。接着我们点击资产,这里是存放我们所有通过即梦生成的素材以及本地上传素材的区域, 他按照图片,视频,画布,故事还有音乐对不同文件进行了分类。接着我们点击画布,此时会弹出一个新页面,那么在这个页面里我们可以对图片进行细致的处理, 可以点击上传图片,上传我们的本地图片素材,也可以点击纹身图或者图生图让 ai 生成图片素材。还可以选择上方的画笔工具,粗略的绘制一个草图。我们这里随便上传一张本地图片,然后可以看到在上方出现了一横排工具栏, 功能包括局部重绘,扩图,消除,细节修复、超清以及抠图。具体要怎样运用这些功能我们会在后面的课程中详细学习。我们回到之前的页面,看到这里的会员标识,上方显示的数字是我们剩余的积分数,我们点开它 可以看到这里面会显示你的会员订阅情况,以及多个档位的会员订阅选项。目前非会员及梦每天会发放六十到八十的积分,那大家可以根据自己的实际需求酌情选择白嫖或者付费。那以上就是本节课的全部内容,如果对你有所帮助,还望多多三连支持一下,下节课我们会详细学习图片的生成, 感谢你的支持,我们下节课再见!大家好,在上一期视频中,我们讲解了极梦 ai 的 界面功能介绍这期视频我们来学习如何正确的书写提示词。 首先来到极梦 ai 的 首页,我们来看一看由其他作者生成的作品都是如何写提示词的。例如像这张图片, 看到这样内容精美的图片,在提示词的编辑上同样非常的丰富。首先描述的是这幅图片的风格,是一个由粒子组成的古风插画,还包括了很多细节,像笔触、线条、明暗对比、 金箔等等。我们再来看下一幅作品,例如像这张汽车海报的作品,同样在提示词的描述上也非常的丰富,最终获取的结果可以看到也相当不错。而在具体的内容方面,像大师级、排版级、反主义、半吊图案、 杂色等等这些同样是先对画面风格进行了描述,然后中间部分则是在描述海报当中有哪些内容及主体。 我们现在再来看下一个由其他作者生成的作品。可以看到像这样简单的一只三花猫的图片,想要生成出来也并非直接描述的是一只三花猫,同样包括了主体描述、质量描述以及像三 d 超精细渲染这样的风格描述。 通过这么几幅图的鉴赏,我们会发现,想要生成精美的 ai 图像作品,并非是我们一两句话就能生成的,往往通过简单的描述很难生成好看的或者是我们想要的作品效果。 想要生成和其他作者类似的作品,其实非常简单,我们就只需要直接在极梦 ai 的 首页点击查看其他作者的作品,然后将右侧的提示词复制下来,从中挑选我们需要的内容,再结合我们本身想要生成的内容来生成就可以。 往往这样会导致我们生成的作品会缺少原创性,且在风格和内容上是无法实现完全可控的。所以要想生成好看的作品,通常有这么几种方式可以实现。第一种就是借助大语言模型的 辅助,比如豆包 deepsea。 举个例子,我们现在输入一段提示词,这里我们就书写生成一台汽车,同时提出要求优化上述提示词,让生成的结果更加精美。现在点击发送可以看到最终生成的结果。豆包 ai 给出了三个备选方案, 分别代表着三种不同的风格,一个是写实高级的风格,一个是未来科幻的风格,还有一个是复古经典的风格,我们下面就来生成对比一下。例如现在回到极梦 ai, 点击生成选项,在下方的下拉菜单当中 选择图片生成。我们首先就描述生成一台汽车,然后回车发送,可以看到此时生成的结果确确实实是一台在 在马路上比较常见的汽车造型。但不难看出,我们生成的这些汽车造型更多的像是一些杂志上的汽车宣传海报,不仅在汽车外形的设计上并没有原创性,同时像汽车所处的环境背景以及美术风格都相当的常见,写在图像的质量上 也并没有发挥出当前使用的 ai 模型该有的实力。我们现在将豆包 ai 帮我们修改的细节更加丰富, 数更加具体的提示词复制过来,然后回车发送,可以看到此时生成的结果能够明显的看出,要比我们第一次告诉 ai 只生成一台汽车所生成的画面更加精美。不仅表现在整体氛围上,像汽车设计本身的原创性 以及画面的细节表现都要明显优于我们之前所生成的图片内容。因此,当大家使用简单的提示词无法生成满意的高质量的效果时,不妨尝试使用大语言模型 辅助我们去优化提示词。不过现在虽然生成的图像通过大语言模型的辅助更加精美了,但依然存在一个问题,那就是可控性,我们还是无法根据自己的想象来生成指定的效果,所以这里我们就需要总结经验来学习一套提示词的万能框架。 通过对无数个作品的总结,以下我们总结出了一个在生成任意图片时都能够使用的万能框架,那就是风格加视角、加主体、加背景加细节加光影加质量词。以当前我们所展示的这张图片为例, 首先来看风格,我们想要生成的是高精度建模风格 u e 五质感那么熟悉游戏画面的同学应该能够一眼感受到,当前生成的画面 就像是一个在游戏当中的建模风格,同时有着虚幻引擎的建模质感,这就是风格的描述。当然,风格的描述类型有 很多像我们当前所描述的属于在质感方面的风格,那么除了质感方面,在美术方面同样有风格之分。像此时生成的这张图片,它背景当中的霓虹灯以及复古和科技相结合的画面,其实就属于赛博朋克风格。 我们这里所书写的赛博朋克风格的城市夜景,他既属于对画面背景的描述,也属于对画面美术风格方面的描述。除了风格之外,生成一幅画面描述视角通常也非常重要,例如此时我们描述的是正面视角,那么最终生成的图片就是一个正面朝向观众的汽车在城市当中的图 片。那么相对应的,我们现在来到极梦 ai, 将正面视角换成侧面视角,然后点击发送,可以看到此时生成的结果。在整体的质感和美术风格上,与刚刚我们所展示的图片保持了高度的一致,同时汽车也转换成了侧面的视角,当然侧面也分为正侧面、斜侧面 及后侧面等等,我们可以更进一步的优化提示词的描述,让其描述的更加细致具体。除了视角之外,接下来就是对于画面主体的描述,这是一幅画面当中不可缺少的内容,像我们当前给出的提示词框架,并不是说每一个部分都要具备才能生成图片,但一幅图片当中主 主体是作为基础的内容,我们描述的是风景,是汽车还是人物,至少都要有一样去描述出来。即便是空无一物,那此时描述的主体也可能是天空或者纯白色,这些内容都可以作为画面的主体。 那么对于这张图片所描述的主体就是敞篷跑车,这里我们用黄色的字体进行了标记,那么有了主体之后,往往还要描述主体所存在的背景,像当前的背景就是赛博朋克风格的城市夜景,如果有时想要方便抠图,那 通常我们就描述简单的背景,白色的背景。接着往下看,我们继续还要描述画面的细节,也就是用来修饰主体和背景或者其他的内容。比如说风格的,像当前在提示词当中的科技与复古风结合的银灰色敞篷跑车,这些内容就是用来修饰画面的主体的,描述了它的颜色, 它的设计风格。同时我们想要生成赛博朋克风格的城市夜景,这里就追加了一个细节描述。接下来就是光影。其实像光影的描述, 除了直观的描述光从哪个方向照射,光是什么颜色之外,通常描述时间也能够代表画面当中整体的光影描述。例如像白天也分为清晨可能有浓重的雾气,正午阳光最为强烈,傍晚阳光变得不那么强烈,但颜色偏向于暖色等等。至于夜晚的话,则更多的是人造光源。 所以像当前在提示词中我们所描述的夜景,其实就可以直接使得生成的结果出现更多的人造光源。 在配合着霓虹灯广告,就组成了我们当前画面当中所出现的光影表现。而最后的质量词非常重要,像我们刚刚所看到的几个案例,比如说这个汽车海报,其实上面就使用了大量的质量词,例如大师级排版、充满汽车文化与机械张力、 传递速度与个性的态度场景,这些内容都在极力的想要生成的结果,在视觉观感上能够有更加优秀的表现。此外,像这张图片可以看到,在提示词当中,几乎大部分都是由质量词组成的,像绝美的眼睛、高级感、线条清晰、超高清、 丰富的细节等等,这些都能够有效地提升画面生成的质量。而在我们生成的这幅图片中,加入的是一些比较常规的质量词,并没有指定的方向,算是一个比较通用的描述。像电影感构图,电影质感胶片颗粒质感、八 k 大 师级构图。 有了这些内容的描述,基本上能够保障任何画面生成的质量都能够有足够的细节以及优秀的构图,还有好看的光影。那么学会了这些知识,我们下面就来实战练习一下。回到极梦 ai, 我们下面在不看提示词的前提下,来思考一下,像这张图片该如何通过自己对这节课知识的理解来生成相近的内容。我们首先来书写风格,像当前的这种风格就是一个偏写实的风格, 所以这里我们直接描述写实风格。而视角方面,这幅图更像是一个微距摄影,所以这里我们就书写微距摄影。背景,虚化镜头,聚焦主体。接下来再来描述主体,一个穿着探险服的拟人仓鼠, 一只手提着一盏煤油灯看向镜头,然后来描述背景,这里我们就描述森林。接下来是细节,一片有些干枯的叶子撑在蚁人仓鼠的头顶, 煤油灯发出的暖光照亮周围的环境。然后来描述光影,这里我们就描述阴天,让画面当中能有一个自然光照,同时前面所描述的细节,煤油灯发出的暖光其实同样也是一个光影描述。 最后就来书写质量词,这里我们就沿用刚刚的案例图片在生成时所使用的质量词,而尺寸方面我们就设置为与参考图比较相近的尺寸,这里设置为三比四,然后点击生成看一看最终的效果如何呗。 可以看到一段时间后,我们就成功的生成了与参考图十分相近的结果,但同时这里出现了一个问题, 那就是我们所描述的一片有些干枯的叶子撑在蚁人仓鼠的头顶,这句描述并没有生成,我们想象当中 整个叶子在地面上撑起一个类似于小帐篷的效果,所以这里就需要我们对提示词进行进一步的优化和修改。点击重新编辑选项,我们将关于这个部分的描述做一些修改,这里我们就将提示词修改为一片比仓鼠大很多的有些干枯的叶子像帐篷一样 存在拟人仓鼠的头顶。现在点击发送可以看到这次生成的结果,就和刚刚我们在首页上看到的那张图片在效果上十分接近了。以上就是本期视频的全部内容,如果觉得对你有帮助,也不妨点赞关注支持一下, 我们就下期视频再见。大家好,在上一期视频中,我们讲解了 ai 绘画中提示词的框架都有哪些,包括风格、视角、主体、背景、细节、光影和质量词。当然其实除了主体的描述之外,其他的内容都不是 b 选项,不描述 ai 也能帮你生成,只是可控性没那么高罢了。 所以为了让我们生成的画面更加可控,我们今天就来细分的讲解在提示词书写中都有哪些风格?一共分为四个板块,风格的重要性、风格的分类、风格提示词的获取技巧以及风格融合。 我们首先来看风格的重要性,同一组提示词在风格提示词的部分描述不同,那么生成的结果在画风上也会有很大的区别。比如像上节课我们使用过的这一组提示词,侧面视角,一台科技与复 古风相结合的银灰色敞篷跑车、赛博朋克风格的城市夜景、霓虹灯广告、电影感构图、电影质感、胶片颗粒质感、 八 k 大 师级的构图。在使用这组提示词时,我们分别用二次元插画、高精度建模和三 d 皮克斯 三种风格提示词生成了三组不同的画面。可以看到,很明显,这三组画面无论是在刻画的精度上,还是在对画面当中主体在形状的概括上,或者是对赛博朋克这种风格的理解上,都会有所差异。而事实上,在我们将来拿这些图片去图生视频时, 根据风格的不同,在生成视频的难度上也会有很大的区别。在吉梦 ai 的 灵感页面,我们查看由其他作者生成的作品 家,不难发现,在这些作品当中,几乎百分之八十以上都是偏写实风格的作品,剩余的大部分都是三 d 风格,而其中的动画风格、平图风格能够见到的数量会非常的少。之所以会有这样的占比, 就是因为他们的生成难度是依次递增的。往往在生成 ai 视频片段时,最容易生成的就是真人写实的风格,其次是三 d 卡通风格,最后才是二 d 动漫风格。因此我们说风格为什么重要, 因为它不仅能够决定画面最终生成的视觉效果,更重要的是它决定了今后在生成 ai 视频片段时的难度。 当然,之所以会有这样的难度区分,主要还是因为在训练 ai 视频生成模型时,素材的量的多少,决定的自然是写实风格的素材比较多,所 训练的更加完善,所以这点我们只能期待将来 ai 视频生成模型能够不断的迭代更新。那么了解了风格的重要性,我们下面来看风格的分类,总的来说共分为三大类,而每个大类又分为几个小类?首先第一个大类是三 d 类,像我们平时看过的三 d 影视作品, 比如说飞屋环游记、冰雪奇缘这样的作品,还有平时玩过的游戏,比如说荒野大票客,或者一些三 d 类的三 a 游戏。再比如说 有些国漫作品,像凡人修仙传,或者一众用三 d 来制作的国漫,这些都可以归属于三 d 类。而这些三 d 类风格其实有一个共同的特点,那就是他们在刻画的精度上基本是相同的,因为几乎使用的都是类似的引擎,特别是以虚幻引擎为主的虚幻四引擎, 虚幻无引擎,其实都会有着类似的画面表现。哎!那么问题来了,为什么说使用的三 d 建模引擎相同,最终却能衍生出不同分类的三 d 作品呢?这就要说到,我们在讨论风格时, 其实还可以进一步的区分,比如我们看当前的这几个分类,虽说使用的建模引擎都是相同或者相似的,但大家可以很明显的发现,这几个画面当中,人物的长相特点、穿着以及画面的色调都是有所差异的。 又像三 d 皮克斯风格,在画面的色调上会更加明艳,饱和度会更高。而像荒野大飘克二游戏的风格,在色调上就会更偏向于写实,包括人物的长相特征比 美丽,也会更偏向于写实。而向右侧的三帝国漫风格,人物在长相上可能偏向于写实,但略有夸张,也许眼睛更大一些,鼻子更小一些,人物更美型一些。哎!那么说到这里,想必大家就一定程度上能够理解。继续往下细分风格还能怎样去区分了,那就是整体画面的美术设计, 像人物的长相特点,画面的后期调色,包括人物所穿着服装的设计特点,这些都属于后期美术的特点。那么了解的这些,我们来总结一下。像三 d 类的风格,通常会以动画公司建模引擎、 知名游戏、知名影视作品的名称来进行风格提示词的描述。我们再来看第二个大类,绘画类,这类风格相信大家会比较熟悉,像我们经常看动漫时能够看到的塞露露插画风格, 这样的风格也会随着年代而改变,比如说上世纪八十年代的动漫风格,虽然也是塞露露,但是在美术设计上,像人物的五官比例, 以及属于那个年代的服装设计和建筑设计,这些都决定了在风格上的区别。此外,在传统美术中,像油画风格、 素描风格,这同样也是绘画类的分类。而像游戏当中,英雄联盟、美宣图的风格也是比较知名的,或者以黄光剑风格,或者某一个你所喜欢的画师风格 外,像一些古风游戏,比如逆水寒的风格,同样在美术设计上较为自成一派。所以当我们谈及绘画类的风格分类时,其实更多的就都是在美术设计上的风格分类了。不过除了美术设计,在绘画类中还有一种风格分类,那就是刻画的精细程度。 我们可以很明显的感受到,像塞露露插画风格和上世纪八十年代动漫风格,这两种风格在光照的表现上都不是十分细腻,被光照亮的部分和没被光照亮的部分之间的区分是一种非常简单直接的区分。而在我们所见的其他风格,流向油画风格,每 宣图风格在明暗的区分上都更加的细腻,更加贴近于写实风格的光照。从专业角度来说,这就是平图和厚图的区别,这同样是一种细分。总结来说,在绘画的风格分类中,他的提示词特点就是通常以 传统绘画分类或者年代约定俗成的名称、知名游戏、美宣图例绘原画画师的名称来进行风格提示词的描述。我们再来看第三大类就是写实类,这类作品大家在电视上能够看到很多,像自然摄影风格、街头摄影风格、 产品摄影、人物摄影风格,这些风格的区分依据通常是根据拍摄对象的不同来区分的。自然摄影就是拍摄自然风光产品,摄影就是拍摄产品, 此外还会根据设备的效果来区分,例如像这里的胶片相机风格,其实之所以会有这样的风格,就是因为在拍摄时使 用的是胶片相机。另外像知名的影视作品也会进行风格的区分,例如像舌尖上的中国,经常以近景实物特写来勾起人的食欲,像这样的拍摄技巧因为其知名度足够高, 所以也自称一派,形成了一种以近景拍摄美食而闻名的风格。所以总的来说,我们讲了这三大类风格的划分。大家会发现风格的叫法其实并没有多么成体系化,你能直观感受到什么内容,那么这个内容就可以成为一种风格。而 在大方向上,像美术设计、拍摄装备、制作引擎,甚至是年代而产生的效果都可以称之为风格。所以大家在描述风格时就找相应的参考案例,或者直观的表达出你对某些图片的感受即可。我们下面来看第三点, 风格提示词的获取技巧。既然我们说了风格的划分,其实可以从很多角度进行划分,很难从举一反三的方向让我们在生成时能够自己描述任何风格。那么该如何获取风格相关的提示词呢?自然就是找参考来看一看其他作者生成的作品。 来到吉梦 ai 的 首页,如果相中某一种风格了,我们就直接点击这个作者的图片查看大图,同时查看其提示词内容。而剩下要做的事情就是从提示词中 取和风格相关的提示词,方法也非常简单。 ai 时代自然是要利用 ai 大 语言模型来帮助我们提升效率。将作者生成图片时用的提示词复制好之后,来到豆包 ai 当中直接粘贴, 然后按住 shift 键加空格进行换行,这里我们就提出需求,将像素提示词中和风格相关的提示词 提取出来发给我,然后点击发送,可以看到,此时我们就直接获取了刚刚所复制粘贴提示词中和风格相关的提示词。 用这些提示词通常就能一定程度上来生成和作者表现十分相近的画面。例如现在我们点击生成来试一试这里的主体描述,我们就从老虎改成猫咪,然后点 击发送。可以看到,最终生成的美术风格是不是和我们刚刚所见到的参考图风格十分相近呢?当然,每次生成都会伴随着一定的随机性,也会因为生成的主体不同而导致生成的风格略有差异。所以通过这种方式最终获取的风格效果和原图有一定差异是 十分正常的情况。遇到这种情况时,我们就考虑在原有的基础上进一步的添加提示词描述,来优化画面的生成效果。以上就是关于提示词获取的技巧,我们最后再来看风格融合,就像是做豌豆杂交实验一样,有成功也有失败,风格之间的融合同样如此, 在融合不同的风格时,有些风格是会相互冲突的,并不适合将两种进行融合。所以这里我们展示两组案例。第一组案例是将三 d 皮克斯风格和凡人修仙传国漫风格进行融合, 可以看到融合的效果还是不错的。之所以能够有这样的效果,主要源自于两者在风格之间存在一些互补的部分,或者说互相不具备的部分。 例如像三 d 皮克斯风格,在人物的美术设计上更偏向于卡通,有着更大的眼睛,更偏向于孩童的五官和身体比例。而在凡人修仙传国漫的风格当中,其实重点突出的是这种仙侠的特效以及偏国风的服装美术设计、发型设计和场景设计。 所以最终生成的效果就是将三 d 皮克斯风格当中的人物长相特点和场景设计和发型 服装设计,这就是两种风格能够互补的地方。那么了解了两种风格能够融合的原因,我们再来看第二个案例,自然就好理解了。这里我们使用的是上世纪八十年代动漫风格和逆水寒风格进行融合, 可以看到最终融合的效果就是逆水寒当中的背景服装发型设计与上世纪八十年代动漫风格的刻画方式进行了融合,一个提供设计,一个提 公刻画方式,两者并不冲突,但有些时候可能两种风格就不太适合融合到一起了。举一个简单的例子,例如现在我们书写水墨风格,赛博朋克风格,然后点击发送,可以看到此时生成的效果。虽然确实对赛博朋 克风格和水墨风格进行了融合,但两者产生了非常强烈的冲突感。为什么会产生这样的冲突感,导致画面看起来极不舒服呢?其实原因就在于两者主要表现的内容所带给人的冲突在这里产生了冲突。 水墨风讲究的是大量的留白以及在刻画物体结构时相对写意、相对抽象的效果,而像赛博朋克风格更加讲究像发光、 写实这样的质感,而发光的效果是要靠本身画面当中较暗的部分在发光,以此来反衬发光效果的,这样就和在水墨风格当中的大量留白产生了冲突。且本身在赛博朋克风格中对物体的刻画会较为写实,较为具体, 这同样和水墨风当中对物体的刻画相对抽象,相对写意产生了冲突。所以无论从哪个角度来分析,两者在风格上处处都能产生冲突,自然拼接到一起就形成了两者相打架,让观众看起来不舒服的效果。大家在尝试其他风格的融合时,一定也会遇到类似的情况, 到时也不妨从我们今天所讲的知识里尝试分析一下为何两种风格在融合之后会让人产生不适感或 根本无法融合。那么以上就是关于提示词技巧、风格偏相关的知识,希望大家通过这期视频的学习,能够掌握风格提示词的获取技巧,同时具备自己修改风格提示词的能力,来生成让自己更加满意的图片效果。我这里也准备了一些和风格相关的提示词文件,大家需要的话可以评论区置顶自取。 如果觉得本期视频的内容对你有帮助,也不妨点赞、关注、支持一下,我们就下期视频再见。大家好,我们这节课来讲解在使用 ai 生成图片时,如何控制所生成图片的视角。 首先来了解一下视角的概念,在 ai 生成图片及视觉创作中,视角的核心概念是观察者, 就是镜头与被摄主体之间的相对位置、方向和距离关系,它决定的画面呈现的透视效果、主体形态和虚实氛围。我们举一个简单的例子,现在打开三 d 建模软件 blender, 首先来看在视角当中谁是观察者, 也就是镜头在什么位置。其实这一点很好理解,在观察这个世界时,我们的眼睛就属于在拍摄中镜头的位置。而在当前这个三 d 建模软件当中,三 d 模型的观 察者所处的位置便就是当前这个软件当中镜头所处的位置。在这个三 d 所构成的世界中,我们移动视角 或者改变远近,都是在改变我们作为观察者所处的位置,以此来看到不同的视觉效果。而背射主体就是我们当前所看到的这个三 d 小 猪。而我们作为观察者和这个被观察的主体之间是有不同的关系的。例如相对位置, 此时我们作为观察者和被观察主体之间的相对位置,就是我们位于它的斜侧方四十五度左右的位置。同时我们在观察这个主体时,我们所面朝的方向以及主体的方向也是相对的, 此时就需要一个坐标系来规范一个观察的方向。例如现在在这个三 d 空间里,绿色的线条表示的是 y 轴,红色的线条表示的是 x 轴,而还有一条线呢,是我们看不见的, z 轴 是纵向的这条线。我们假设来规定 y 轴这个方向,小猪面朝的是前方,小猪背对的是后方,那么现在我们正从小猪的前方去向小猪的后方观察,这样的形容就是成立的,像 z 轴和 x 轴,在规范好它的朝向以及位置之后, 同样可以相对。这么来讲,当然在现实世界中有非常多现实存在的物体可供我们观察,例如像马路、房间或者是街道, 横平竖直本身就已经被条条框框概念化的东西。最后就是距离关系,我们将镜头拉近所看到的画面和镜头拉远所看到的画面是不同的,这点想必大家很好理解,近大远小嘛,以上我们所说的这些,共同决定了画面呈现的效果,也会给观众带来不同的视觉体验。 我们下面来看一看常见视角分类,一个是镜头视角分类,像平拍、俯 拍、仰拍、鱼眼镜头、长焦镜头、广角镜头等。而第二类是按照拍摄的高度来分类,像使用无人机拍摄就属于高拍,而把相机放在地面上拍摄就属于低拍。然后就是决定了取景框大小的按拍摄距离来分类的方法,远景 风景、近景特写,还有微距镜头。当然除了这三大类,其实还有一个比较小众的分类方法,那就是一些特殊的角度,例如像倾斜镜头拍摄,营造画面的失衡感,跟随镜头拍摄让画面稍微带有一些模糊效果, 增强画面的运动感。或者是过肩镜头,虽不是第一人称视角,但能够让镜头的位置和画面的主体更加接近,能够增强代入感。我们现在来简单实践一下,看看使用刚刚的知识是否能够生成满意的效果。例如现在我们想要生成一个富有运动感的镜头,让镜头拍摄一个人物正在跑 步的画面,那按照刚刚我们所学习的视角分类知识,比较适合使用的就是跟随镜头,然后这里我们继续书写拍摄运动员在跑道上跑步的背影,进一步的,我们要求画面带有动态模糊效果, 然后点击发送,可以看到此时生成的效果。就生成了一幅在镜头跟随拍摄下,运动员在跑道上跑步的画面,同时还加入了动态模糊, 使得整个画面更有动感。而如果使用常规的描述,我们只生成运动员在跑道上跑步的画面,然后点击发送,可以看到此时生成的效果。相比于刚刚我们所生成的跟随拍摄的效果, 整个画面就显得不是那么具有代入感了。加上本身拍摄的画面非常清晰,并没有带有动态模糊的效果, 所以即便是这样的镜头,人物的姿势非常有张力,拍摄的构图也聚焦在了人物身上,但依然在给人的感受方面不如我们刚刚 生成的画面在整体的镜头感上那么富有张力。在凸显人物的不同情绪时,视角的使用方法也会有所区别。例如,我们想要表达一个人物的微表情,此时我们就需要特写镜头来表达。例如现在我们想要生成一个人物生气的画面提示词,我们就书写特写镜头,人物眉头微皱, 有些生气。为车发送,可以看到此时生成的画面就是一个人物的特写镜头给到了人物的面部特写,这个人物所展示出的愤怒效果 几乎要从屏幕当中溢出来了。而我们现在将特写镜头删除,然后再次点击发送,可以看到此时生成的效果。由于不再是一个人物的面部特写,只是一个人物的上半身近景画面,这时表现人物生气的效果在严重程度上就没有之前所表现的那么到位。 总结来说,想要生成什么样的视角,大家可以直接在提示词中去书写,这样的视角通常都能生成。理想的难点并不在于如何去生成,而在于在合适的情绪和 合适的氛围下,选择与之匹配的视角进行提示词的书写。就像我们刚刚所展示的两个案例那样。我们再来看第三点, 就是目前市面上比较爆款的拍摄视角的应用。当前画面所给出的三张图片就是目前在市面上热度较高的三个拍摄角度,一个是过肩视角,一个是自拍第一人称视角,一个是第一人称视角,这些视角往往都能带给人很强的代入感, 同时也让这个 ai 生成的画面显得更加贴近真实。那么我们该如何去生成这三款不同的比较热门的视角呢?像刚刚的常见视角分类当中,其实就没有这些视角,这也是这三种不常见视角能够成为爆款的原因, 因为它的角度更加新颖,观感更加刺激,观众也更减少见。我们首先来看月间视角怎么生成,其实就如刚才所说的,我们想要生成什么视角,就直接去描述这个视角就可, 这里我们就描述月间视角,一个摩托车手在夜晚的城市骑摩托。当然这里我们需要提到一个概念,就是在描述视角时,除了镜头的视角之外,其实也包含了所拍摄主体 本身的角度。例如当这个人物面向我们的时候,我们可以说拍摄的是人物的正面视角,但当人物转过身去,虽然相机的视角没有改变,但人物的视角改变了,那么生成的结果也会不同。我们可以说此时拍摄的是人物背面的正面视角,或 说正对人物的背面。所以当有些画面无法生成时,我们就需要在提示词中除了描述相机的视角,再追加一个对人物 朝向角度的描述。例如这里我们已经描述了阅间视角,而这个骑摩托的人我们可以再次追加描述他的朝向角度。 这里我们就追加一个摩托车手背对镜头在夜晚的城市骑摩托,然后点击发送,可以看到此时镜头的位置就位于了人物的身后,同时这个摩托车手的朝向也是朝着镜头所对着的方向进行骑行的,这就是月间视角。当然,像人物跑步 或者是枪战,或者是其他类似的比较有刺激画面的画面情况,我们都可以使用阅间视角来增强观众的代入感。此外,在极梦的灵感页面,我们搜索自拍,同样可以搜到很多像这样的以第一人称自拍视角为主题的 ai 作品。 那么像这样的作品又该如何生成呢?我们下面同样来演示一下。提示词方面,我们就书写第一人称视角自拍,然后后面跟上我们想要自拍的内容有什么?例如这里我们书写的是一个美女在遛狗 机发送,可以看到此时生成的画面,就像是一个美女在手持手机遛狗时自拍的画面了。这样的画面是不是显得非常自然真实呢?如果没有左上方 ai 生成的标识,可以说几乎这样的画面是可以以假乱真的。特别是当这样的图片在生成为 ai 视 频之后,整个画面在第一人称自拍视角的加持下,会显得更加生动,富有表现力。而第三个比较爆款的 拍摄视角,那就是第一人称视角。我们将自拍两个字删除,但需要注意的是,这样的视角并不适合呈现所有的画面,就像是第一人称视角自拍画面当中至少要出现一个人物一样。单纯的第一人称视角在更多情况下适合应用在交通工具的第一人称视角上。比如这里我们就书写 骑自行车,然后点击发送可以看到,此时我们就生成了以第一人称视角所拍摄的骑自行车的画面,其画面自带了一些运动模糊的效果,非常有冲击感。除了像骑自行车,包括像坐过山车,可以看到生成的效果同样非常富有视觉冲击力。当然,大家如果有其他好的点子, 可以尝试用低人称视角来生成其他情况下的图片。这些图片在非 ai 拍摄的情况下其实也比较常见,只不过在 ai 时代,像这样的视角生成的比较少,但同时又非常贴近生活。所以使用这样的视角生成能够让 ai 生成的视频作品 有着更加能够带入真实生活的表现。我们最后来一起做两组实战练习,看一看如何用我们今天所学习的知识来生成指定构图的图。 我们首先来看第一张图片,这张图片很好分析,他就是一个非常常规的在正面视角朝向镜头的人物半身肖像,所以这里我们就描述正面视角人物正对着镜头半身像,然后点击发送,可以看到此时生成的结果。在人物和镜头之间的距离 以及人物所面向镜头的角度上和我们所给出的参考图一致,但人物露出身体的部分却相对来说少了很多, 这主要是由于我们在生成图片时所选择的宽高比决定的。这里我们将宽高比从十六比九改为九比十六,然后再次点击生成,可以看到这次生成的画面,人物在身体的部分就显露出了更多,但这个结果依然和我们左侧的人物所露出的身体占比有 所差异,所以这里我们就追加描述人物站直身体,正对镜头,从膝盖到头顶,然后点击发送,可以看到此时生成的结果。当中我们就成功的生成了一张在视角上与参考图的视角基本一致的人物了。 我们下面再来看第二张人物该如何生成其对应的视角。这个人物由于并非正面朝向镜头,所以在此次生成中,除了需要描述相机的视角之外,还要描述人物的朝向。首先来描述相机, 这里是一个较为典型的地面拍摄视角,然后来描述人物的朝向,人物侧四十五度,背对镜头,然后是全身站立, 下面点击发送,可以看到此时生成的结果。就生成了与参考图十分接近的结果。我们需要从中寻找一张在相机位置上更加接近原图的,也就是更加接近地面的。 看到第一张和第四张相机在高低位置上都会更加接近地面,是一个地面视角,那么以上就是本期视频的全部内容,在这节课程中,我们所讲到的镜头概念和镜头分类这些理论知识我也都整理成了一个文档,放在了评论区的置顶中,大家需要的话可以自取。如果觉得本期视频的内容对你有帮助, 不妨点赞、关注、支持一下,我们就下期视频再见!大家好,我们这期视频来讲解在生成 ai 图像时,该如何用构图相关的提示词控制画面。首先来学习构图的概念,说到构图,大家可能会想到这是一个和美术相关的名词。没错,在传统美术的学习当中,构图是必须要学习的一个知识点。 在使用 ai 软件生成图像时,我们想要生成的图像在视觉表现上更加优秀,同样离不开构图。所以即便有了 ai 这样强大的工具,如果我们想要自己心目中的画面能够更加完整、更加有表现力的 传达给观众,仍然离不开在传统的美术学习中通常会学习到的构图知识。构图的概念是对画面中所有元素将主体、背景、道具、留白等进行空间布控、比例分配和关系组织,最终突出核心,优化视觉流程, 传递特定氛围或者趋势逻辑。例如,在生成人像当中,我们作为常见的白色背景人像,通常就是为了衬托人物的主体, 用白色来充当画面的背景作为虚部,用人物来充当画面的主体作为实部。这样就达到了构图的第一个目的,让观看者第一眼聚焦画面核心,避免画面杂乱无章。而构图的第二个核心目的就是建立秩序,通过元素的位置、大小、色彩搭配,让画面协调统一, 流向当前这幅画面是一幅建筑,这幅建筑使用了大量的纵向线条,而背景则是一个非常干净纯粹的晚霞的背景,这样的画面就看起来非常的协调统一,整体线条的走向趋势几乎都指向了同一个方向。 此外,构图的核心目的还包括了引导视线,例如作为典型的 s 型构图,通常就是为了引导观众的阅读顺序,让观众顺着 s 型的线条来观看画面当中的内容。 通常来说,构图的最后一项目的是强化表达,通过构图来强化情绪。例如像这样非常常见的对角线构图,尤其是这样的切光所形成的构图,我们往往让光照亮的部分 代表整个故事当中较为正向的形象所处的位置,而像被阴影所遮蔽的位置,往往会在那个位置来安排画面当中较为负面化的角色, 以此来暗示他在整个故事当中所处的身份。再或者像一些一正一斜的角色,我们就使用切光将他的一半 藏匿在阴影中,一半显露在光的照射下。而构图的核心要素包括元素排布、比例分割、视觉平衡和空间关系。这其中如果细讲的话,需要讲解的知识点有很多,所以下面的时间我们通过具体的案例来看一看不同的构图具体的表现是怎样的,这些便是一些在设计中常见的构图形 式。需要提前说明的是,并非是说大家在生成 ai 图像或者在自己创作艺术作品时的形成, 源自于人们在总结了无数个艺术作品之后所总结出的一些经验。如果说画面本身就很好看,却又不遵循任何一种构图类型,那这样的好看其实本身的存在也是合理的。所以大家在设计艺术作品时,不要被知识所禁锢自己的思想,可以将知识作为检测和修改画面的辅 工具,让自己能够更加稳定的产出优秀艺术作品。我们下面的时间将刚刚的构图描述直接使用在纹身图当中。可以看到,首先是中心构图,不难理解就是将主体放在画面的正中央,以此来突出主体在画面中的表现。像我们当前生成的花卉,以及像鸟类、宠物、人像 或者是一些电商产品,这些内容都非常适合用于中心构图。这样的构图是非常自然的,但同时也比较无聊,因为基本上随手拍摄时,我们都会把要拍摄的东西放在正中间,所以我们下面再来看对称构图。这样的构图指的是画面的左右或者上下两侧完全对称而相同的部分规律重复 来稳定正视均衡感,常用于建筑和倒影。可以看到我们用其定义所生成的画面就是非常标准的对称构图。当然,对称构图也并不意味着左右两侧是完全镜像的,整体上表现为对称,细节上稍有不同 仍可以称之为对称构图。我们下面再来看对角线构图。这样的构图在艺术设计作品中也非常常见,利用物体形状或者线条所形成的对角线来分割画面,增强动感和层次感。可以看到当前生成的这些画面,亦或是利用切光来形成对角线,亦或是利用画面当中的物体 来形成对角线。当然大家在设计时也可以更加巧妙一些,想一想还有哪些元素可以形成画面的对角线。之后就是我们刚刚已经看过的引导线构图, 同样是借助画面当中的直线或曲线元素来作为引导线,通常指的就是画面当中的建筑道路,当然有时像人物所摆出的各种姿势也能充当画面的引导线。我们再来看框架构图,利用自然或人造框架,比如说树木、建筑、门窗等来框住主体 深度和层次感,引导目光聚焦核心。像我们当前生成的透过中式方形窗户看到窗外的雪景这样的画面就是典型的框架构图。而我们都知道三角形具有稳定性,所以三角形构图同样能够凸显画面的稳定,想要组成三角形其实并不困难。 我们所说的三角形、圆形、方形,在构图当中都并非指的是一个数学意义上十分严谨的形状, 例如像三角形,只要在整体的呈线上呈现出近似于三角形的轮廓,我们都可以称之为三角形构图。例如,像当前这幅画面,母亲抱着孩子呈现出了上方只有一个母亲的头部,在占比上较窄,而下方则是母亲和孩子所组成的身体部分,在画面当中的占比较宽,这样就形成了一个稳固 的画面,同样称之为三角形构图。下面再来看散点构图,例如像我们当前生成的红色的气球错落在空中漂浮其中,只有中间的气球是蓝色的。可以看到画面中出现了很多的气球元素,这些相似或相同的元素重复出现,但同时又在其他方面的安排上,例如颜色、 空间或者是细微造型上的差异,营造了主次,这就是散点构图,能够形散神不散,给人自由轻松感, 同时也有一定的节奏感。再来看留白构图,这样的构图很好理解,毕竟我们的国画就是大量的留白,能够给画面留出大量的空白空间,引导视线聚焦主体,创造简洁清晰的画面,营造空灵意境深远的氛围。可以看到像当前这样的画面采用的正是留白构图。 其实在艺术设计当中的构图远不止如此,我们今天所讲述的都是一些简单直白的构图方式,而像对点构图、黄金螺旋构图这样更难理解的构图,同样和今天所讲述的知识一起,总结成了一个资料,放在了评论区置顶中,大家需要的话可以自取。 我们最后来做一下构图的控制实战练习,看一看能否用提示词的描述来控制所生成画面的构图。首先来看第一张画面,这是一个典型的斜线构图,或者说对角构图,同时结合上一节课的知识,他的拍摄角度是水平 拍摄,在画面当中也有着大量的留白,还具备了一些剪影效果。现在回车发送可以看到,此时我们生成的结果在构图和视角上就和参考图非常相近了。至于第二幅画面,是非常典型的中心构图,所以这里我们就描述中心构图拍摄视角依然是水平拍 拍摄。接下来描述画面当中物体的位置关系,这点在构图当中同样很重要。有时我们只描述了一个简单的构图名词,但这样的构图名词可能是不被 ai 模型所理解的,所以相比于简单的描述构图名词,让 ai 自动生成构图 有些难以生成的画面关系。客观的描述画面当中各个元素的位置往往能够起到更好的效果。现在点击发送,看一看效果如何吧!可以看到,此时生成的效果在构图上同样和参考图保 持了高度的一致。那么以上就是本节课的全部内容,如果觉得对你有帮助,也不妨点赞关注支持一下。大家在日常生成图片时,也不妨有意识的去积累一些在传统美术当中 需要学习的构成构图和色彩搭配知识,这样的知识学习能够有助于我们生成在视觉表现上更好的画面。当然构图肯定不止这些,为了方便大家学习,我这里已经整理了资料,在置顶评论领取。 在上一期课程中,我们讲解了提示词技巧中的构图控制,那么今天这节课我们来讲解提示词技巧中的光影控制,这同样是在正式的美术学习当中最为重要的理论基础。当然,我们无需像学习传统美术那样真的去剖析光照射物体时 的基本原理,那我们至少需要对光照的分类有所了解,例如光从不同方向照射在物体上会产生怎样的表现?光源自身又有哪些分类?这些分类照射在物体上时又会有怎样的表现?我们首先来看光照的概念。光照是塑造画面的核心要素,围绕光源、光质、光相、光影、 光色五大基础维度,核心作用是照亮主体、塑造体积、渲染氛围、引导焦点。其中光源指的是光的来源, 太阳光,太阳照射在云层之后,通过反射照射最终抵达地面的天光。还有人造光源,像灯光、电子设备发出的光, 光源能够决定光的强度和大小。再来看光质,光质指的是光线的软硬,例如在晴天我们常见的日光就属于硬光源,照射之后所产生的影子非常锐丽,而在阴天环境中所产生的影子较为柔和,光质会影响画面的质感。 光向自然指的就是光照的方向,这个方向同样指的是光源和主体的相对位置,它能够决定明暗的分布,也是在对画面进行美术设计时 最为重要的一个部分。然后是光影,分为亮面、灰面、暗面和影子,能够体现体积与空间感,在传统绘画中属于最为基础的美术理论。而光色指的就是光线的色彩倾向, 为基础的分为冷暖,能够影响画面的情绪。在使用 ai 来生成图片时,我们可以根据所拍摄主体的不同来对光照进行分类。首先是还原型,光照能够真实的呈现主体的样貌,例如像证件照,或者需要将某些文件、产品归入档案时所 拍摄的照片,其最大的用途就是还原主体的色彩、细节、纹理,避免因明暗干扰观看时对细节的呈现。不过在实际生成中,如果大家指定让 ai 生成一个证件照,通常也不会生成 非正面光照的效果。例如现在我们回到极梦 ai 当中,直接输入提示词,证件照,然后点击发送。可以看到,在生成的这组结果中,因为证件照 本身就要求正面光源,所以即便生成的四个人物长相各有不同,取景框的远近也有所差异,但光源类型都是一样的。因此,在使用 ai 生成图片时,我们所生成的内容一定程度上也会决定光照。 同样是一个人物,同样是正面,在生成证件照时和在生成艺术照时。在 ai 生成的打光倾向上,如果没有明确的要求,两者也会有所不同。例如我们下面要讲的第二种塑形型光照,它的特点是能够打造立体感 与结构感。比较典型的是四十五度侧光,也就是我们常说的斜侧光。九十度侧光,也就是正侧光。当前展示的就是我们使用塑形型光照所 生成的 ai 图片。可以看到,在生成房屋时,这样的光照效果会使得房屋很有立体感。同样,在生成人物时,这样的光照效果能够让人物的面部产生更多的明暗变化, 能够强化线条感和肌理质感。如果大家学习过传统美术,这也是通常我们在学习素描时比较常见的一个光源设定类型。再来看第三种光照的分类,氛围型光照。同样它是一个偏艺术性质的光照类型,能够渲染情绪和意境。这个类型的光照就涉及到了光照的强度了。例如,我们使用逆光 所生成的人物肖像,使得人物的身体边缘产生了一圈轮廓光,显得整个画面非常的浪漫。此外还使用了低强度的底光,生成了人物拿着蜡烛的画面,这样就显得整个画面会更加神秘。因此,像氛围型光照、逆光、背光、顶光、低强度底光通常适用于像情绪、人像、 风景大片、悬疑奇幻类的题材创作,还有文艺插画等等。而第四种类型是强调型光照,能够突出核心与焦点,在艺术设计当中,主次分明 出视觉中心往往是一幅作品最为重要的事情,因此强调型光照也是非常常用的一种光照类型。比较典型的强调型光照有逆光、局部聚光和 侧逆光,特别是在绘制人物肖像或者是生成人物肖像时,侧逆光能够勾勒出人物的面部轮廓,同时也不至于像逆光那样是 整个人物明度值都那么低,会有更多的被光照亮的面积,能够更加表现人物的立体感,使得整体画面形成主体偏暗,环境偏亮,而人物则局部偏亮的效果,让核心元素 更加突出。接下来我们要讲的光照类型是根据光源本身的特性来进行区分的。首先第一种是点光源,特点是聚焦性强,阴影较为锐利,例如像灯泡、蜡烛、 聚光灯或者远处的星星留下我们左侧一个拿着仙女棒的少女,仙女棒所发出的光能够小范围的影响人物的手和面部,这是一个典型的点光源。此外,像灯泡 也是一个典型的点光源,这样的光源在传播的过程当中,由于光线朝四面八方照射并不统一,所以随着照射距离的变远,光线会逐渐衰减,能够很好的营造局部亮而又往远处越暗的这种氛围感。既然点光源,自然是不会衰减或 衰减程度几乎可以忽略不计的一种光源。比较典型的像太阳光。可以看到由平行光所照射的物体, 其产生的投影同样是平行的关系,且投影的边缘非常的锋利清晰。而平行光所照射的物体并不会由于离光源的远近而产生十分明显的衰减。光照射左侧的肩膀和照射右侧的肩膀,如果收光角度相同,那么收光强度也 是相同的。这样的光照能够还原自然真实感。例如像正午的户外人像,或者是日常场景的创作,通常比较适合生成户外的 场景。如果说一个人物在室内,但身上所照射的依然是平行光,却又没有临近窗户,这样的光照往往是很奇怪的,这点需要注意。我们最后再来看散射光源,它的特点是柔和均匀,有还原质感知,所以会形成这样的光源。本身体积较大,而光线经过扩散后会均匀的照射物体, 使得照射之后物体的阴影较为柔和模糊,明暗过度十分自然,并没有强烈的反差。比较典型的像阴天的天光照射,还有人物在室内时,室外的阳光在屋内经过不断的反射,最终抵 达人物的身上,都会产生这样的效果。这样的光照比较适合用来表现文艺、清新、温情风格的画面。那么既然讲了这么多分类,在实际生成时该如何书写提示词呢?大家如实书写变好,例如你想要阴天的光照,那么在提示词中就写阴天光照,想要像日光这样的平行光源,我们就书写晴天 大太阳日光。了解了这样的机制之后,我们下面来尝试进行一些光照的控制实战练习。我们首先来看第一种,这是一个很典型 的日光光照,所以提示词方面我们就书写白天晴天日光照射在一个穿黄衣服的二十岁美女身上,上半身,同时这也是一个侧光,然后让人物正面看向镜头,再追加一个平行光,在书写好这些之后就回车发送, 您看效果如何?可以看到整体生成的效果还是比较理想的,我们成功的生成了一个穿着黄衣服,在日光照射下,也就是被平行光所照射的美女,当然具体的内容和画质大家可以根据我们之前所讲解的知识自行把控。 下面再来看第二个例子,这个例子其实也是一个在日光照射下,也就是平行光照射下的美女,但不太一样的点在于 头上有一些树叶产生了一些点光效果,那么这样的效果又该如何形容呢?依然是如实形容就好,我们就在当前提示词描述的基础上,这么来写一些树叶在美女的头上,使得美女的脸上有树叶的影子点光,现在 点击发送,可以看到此时我们生成的结果,就成功的在人物的脸上生成了和参考图类似的切光效果。如果说想要这种切光效果更加的琐碎, 在提示词描述中,我们可以进一步的将树叶改为一些琐碎的树叶,然后点击发送,可以看到此时人物脸上的光斑就变得更加细碎了一些。那么以上就是本期视频的全部内容,如果觉得本期视频的内容对你有帮助,也 不妨点赞关注、支持一下。我们下一节课将会教大家在书写提示词时如何更改画面的色调,我们就下期视频再见!

大家好,我们这期视频来讲解如何使用 ai 大 语言模型来生成剧本和脚本。首先要明确一下制作 ai 视频作品的整个流程。通常来说,想制作一个 ai 作品,自然是先有一个好的点子,有一个大致的方向,比如像战争题材的、 科幻题材的或者日常题材的。在有了这个大致的方向之后,下一步要做的事情就是生成剧本脚本了。相信大部分人都不是专业的导演或者编剧,并没有制作脚本剧本的专业能力,这个时候我们自然就要依靠 ai 大 语言模型帮我们生成,所以此时提问的方式就非常重要。在向 ai 大 语言模型提问时, 无论是生成剧本脚本还是向他提问任何的问题,其实都有一个通用的格式。首先就需要给 ai 定一个身份,比如现在我们在提示词中描述你是一个水果销售员, 请简单介绍一下苹果的优点,可以看到此时我们获取的答案就是苹果耐储存、营养高、口味百搭。现在我们来给 ai 设定一个新的身份,你是一个手机销售员,请简单介绍一下苹果的优点,可以看到此时我们获取的结果就是苹果系统流畅稳定、性能强劲、 做工精致等等。通过这两句对话我们可以看出,虽然提出的问题是相同的,都是简单介绍一下苹果的优点,但由于给 ai 设定的身份不同,最终它所给出的答案也完全不同。所以大家需要记住,在向 ai 提问时,我们想让 ai 在 更加专业的方向 给出相应的答案。首先给 ai 定下一个身份,那么定好身份之后,在提问框架中,第二项我们要提出的就是基础的问题,我们想让它做什么?比如在之前的问题当中,我们所提出的就是介绍苹果的优点,而如果我们想要获取一个剧本或者脚本,同样提出一个简单的问题,帮我写一段脚本就可以了。所以提问框架之二便是告诉 ai 它要做什么。正在提出要求的时候, 往不同的提问方式也能获得很多不同的结果。例如我们只是单纯的让它生成一个剧本,剧本是分为很多不同的方向的,从家庭论语到战争科幻,再到写实的纪录片。可以说剧本小本的分类非常的广泛,不像苹果手机或者是苹果本身这种特别具体的东西。因此在给 ai 提问时,第三点就是规定 ai 回答的格式。就比如我们刚刚的两次提 问,你是一个水果销售员,请简单介绍一下苹果的优点。你是一个手机销售员,请简单介绍一下苹果的优点。可以看到,在这两次提问中,我们的要求都是简单介绍一下,因为无论是苹果还是手机,同样有非常多的方面可以介绍,从外形方面可以介绍,从 品种方面可以介绍,同产地方面一样可以介绍。因此简单介绍看似是一个在提问时的常用语,但其实是给 ai 的 回答规定了格式。所以总结一下,在向 ai 语言模型提出问题时,我们要遵循的就是三个方面,第一点就是给 ai 定身份,第二点便是最基础的向 ai 提问题,而第三点便是规定回答的格式。有了这三个点, 到处是让他帮我们生成剧本脚本。在日常生活中,我们向他提出任何的问题,通常都能得到非常规范且符合我们需求的答案。所以我们下面就基于这三个点,要求 ai 大 语言模型帮我们来生成一个剧本脚本。首先第一句话便是你是一个具有多年拍摄和写作经验的世界顶级导演,这句话便是给 ai 设定了一个顶级导演的身份。第二句话我们就来提出问题, 现在需要你写一个简单的剧本,给剧本便是要求写一个简单的剧本。如果说我们实在没什么好的点子, 想要发散一下思路的话,写到这里就可以直接点击发送等待回执效果了。但如果我们有具体的想要生成剧本脚本的方向,就需要进一步的来规定 ai 回答的格式。例如要求以人与动物之间的感情为主题,最好能有动物为了保护主人受伤的情节。可以看到这些内容的加入就决定了最终剧本生成的导向,这便是最终我们给 ai 所设定的回答框架。但此时我们还需要考虑一个问题,那就是我们制作 ai 作品时,这个作品的时长是多少?这个问题非常的关键,因为这将涉及到我们最终完成一个 ai 作品 我要花费的时间和资金成本。所以这里我们最好来规定一下 ai 所给出的简单剧本的字数。通常来说一分半的剧情对应的是四百字左右的剧本,当然具体看剧本当中所给出情节和分镜头画面的曲折程度来决定,所以这里我们进一步提出要求,要求故事情节尽量简单,剧本字数不超过四百字, 现在回车发送可以看到,一段时间后,剧本就生成好了。这个剧本所给出的内容还是非常详细的,其中包含了三个场景,即每个场景当中都发生了什么样的故事。整个故事的情节也非常简单。首先,场景一讲述了老人和狗之间感情非常好,而场景二则讲述了老人去取药的时候,有一只野狗扑向了老人,而老人所养的黄狗护主的故事。 场景三则讲述了野狗被赶跑,但老人所养的黄狗也因此受伤的情节。那么有了剧本之后,下一步便是生成脚本了。大家在这里可能会疑惑,剧本和脚本有什么区别呢?通常来说,剧本更像是一个故事的梗概,主要是给导演看的,让导演能够以短视 时间内快速地了解整个故事发生了什么,有哪些情节。那作为一个 ai 视频来说,导演便是生成这个剧本的我们,所以我们十分有必要在生成导本之前,先生成一个剧本,让我们清晰地了解这个故事发生了什么。至于脚本,它更像是在生成 ai 视频分镜头图片时,作为一个指导书般的存在, 能够指导我们这个画面有怎样的构图,有怎样的内容,在生成时该书写什么样的提示词,在制作视频时该生成多长时间的视频片段。同时,在和甲方对接时,一个脚本通常显得字数很长,也很专业,同样是一个加分像,所以从多个角度考量,在写好了剧本之后,下一步生成一个脚本都是很有必要的,所以我们下一步就来书写 这个剧本。生成对应脚本要求,脚本中包含每个分镜头的详细画面描述、人物对话、镜头视角以及可以增强镜头表现力的提示词、分镜头的时长及一个脚本最基本的元素。在这段内容中,前面是我们所提出的生成脚本的要求,可以看到这些要求都是基于将来 方便我们生成分镜头图片时所提的要求,例如像镜头的视角,增强镜头表现力的提示词。而最后一句话则是基于我们生成一个脚本最基本的元, 在写好了这些内容之后,就直接点击发送,一段时间后脚本就生成好了。可以看到最终生成的脚本要远比一个剧本在内容上更加丰富。这里就包含了每个分镜头的镜号, 时常镜头的视角集中、画面描述和增强表现力的提示词,我们都可以将其用在生成分镜头图片中,而且我们可以看到当前的脚本中一共有六个镜号,也就是说至少我们需要生成六张图片作为将来生成视频的首尾。这画面相比于只有三个场景的剧本,显然脚本要丰富很多,既能够更多展现画面的细节, 能够在和甲方对接时让甲方觉得你更专业。当然需要注意的是,通常来说我们所生成的脚本是绝不可以直接使用的,因为极有可能在脚本当中存在很多前后剧情上的矛盾,逻辑上的错误,或者由于画面描述过于华丽或是不合逻辑,导致生成的图片并非我们想象当中的图片, 因此在使用脚本当中的内容生成分镜头图片时,一定要根据自己对剧本的理解进行修改。在剪辑时,每个镜头的时长也并非要严格遵循在脚本当中所给出的时长,大家根据自己的实际观感来调整时长即可,所以往往最终的成 品会和脚本当中所描述的有不小的出入。在更多时候,其实脚本仅仅是给我们一个在生成画面时的参照,真正想要生成好的画面,我们使用的往往是我们作为导演对这个剧本的理解好的。那么现在我们已经学会了如何用 ai 大 语言模型, 通过今天所讲解的提示字框架技巧生成剧本脚本。从下一期视频开始,我们就要讲解在获得了剧本脚本之后,如何具体的分成镜头图片以及保持角色的前后一致性了。包括整个制作 ai 视频的全流程,我们也会在后续的内容当中详细的讲解。如果大家觉得本期视频的内容对你有帮助,也不妨点赞关注支持一下,我们就下期视频 再见。大家好,我们这期视频来讲解如何维持在图片生成中角色前后的一致性。上一期视频中,我们利用 ai 大 圆模型 成功的生成了一个简单故事的剧本和脚本,那么作为导演,在生成图片之前,我们就有必要了解在这个剧本脚本当中都出现了哪些角色,而哪些角色是要重复出现的,哪些角色只出现一次,这些重复出现的角色是否会随着时间的变化,季节的更替或者是设定的要求等等,出现前后造型的改变。在了解了这些信息之后,我们就可以开始生成分镜头 图片,同时控制生成这些图片时人物前后的一致性了。当然,无论是使用 ai 制作还是手动制作,在制作一个故事影片时,我们要做的第一件事情就是设定人物的形象, 这里有两种方式可以生成人物的形象,第一种方式就是我们自己来设计,通过提示词的描述来生成指定的内容。在设计角色形象时,就要有诸多因素的考量了。首先是确定画面的风格,不同的风格可能适合的故事也不同, 像有些故事比较抽象,可能就适合动画的风格,而有些故事比较写实,比较真实,而有些故事比较真实,可能就需要写实的风格。想要生成指定的风格,我们可以直接点击豆包 ai 的 图像生成功能,可以看到在下方的选项中有一个 风格选项,在这里我们就可以选择很多种不同的美术风格,由这里选择卡通风格是比较适合我们当下这则李阿婆和老黄之间的简单故事的,下面就来设定形象了,我们只需要描述 具体的人物性别、年龄以及外貌特征就可以,我们这里就书写生成一个老奶奶,穿蓝色布衫,黑色裤子,黑色布鞋,一头白发。而比例方面,我们最好选择一个适合生成人物全身造型的比例,由这里我们选择九比十六,然后点击发送,一段时间后,我们就生成了符合 提示词描述的图片,这些图片当中每一个李奶奶的形象可能都有所差异,所以我们可以选择其中一个,让 ai 对 这个形象进行学习,以便于后续的生成。例如现在选择第一个,在选择好之后将这张图片保存起来,然后关闭图像生成功能, 将其发送到豆包 ai 上。提示词方面就书写图片当中的人物是李阿婆,记住这个形象回车发送,可以看到此时豆包 ai 就 回执了一条消息,告诉我们他记住了李阿婆的形象。在之后的图片生成中,我们需要让李阿婆摆出什么动作,就不再需要去细致的描述他有什么形象了,就只需要提及这个名字,就 能生成对应的结果。比如现在我们来描述生成李阿婆打篮球的画面,就像其他的人物,动物 要设定人物的形象都可以用相同的方法。除了我们通过手动描述提示词的方式来设定人物形象之外,还有一种更加简单但不太可控的方法,那就是无需先设定人物形象,而是伴随着分镜头图片的生成,顺带把人物形象和画面当中出场的事物形象进行设定。比如现在我们再次点 击新对话选项,然后直接将分镜头脚本当中对于第一个分镜头画面的描述给复制下来,选择图像生成功能粘贴到这里,比例方面就选择 十六比九,风格方面依然选择刚刚的卡通风格。当然除了在豆包上给到的选项之外,也可以手动的描述想要生成什么风格。例如现在在提示词中我们来描述,可以看到此时生成的结果就是我们非常熟悉的三 d 皮克斯风格了, 其画面当中就直接生成了李阿婆和老黄的形象。以上就是两种进行角色造型设计的方法,那我们该如何在生成后续的分镜头图片时来保持角色造型的一致性呢? 其实第一种方式我们就已经讲解过了,那就是让豆包 ai 这个能够关联上下文的大语言模型去记录某一个参考图当中人物的形象。比如刚刚我们就记录了这个卡通形象的李阿婆,最终生成了李阿婆在打篮球时的画面。而第二种方法则更加便利,那就是我们什么也不做,就按部就班地将分镜头当中的画面描述给父 复制粘贴过来。当然,这样的做法可能会存在一定的概率,导致生成人物的造型前后不统一,所以需要谨慎使用,在适当的时候及时的修改方法。我们现在再次选择图像生成功能,然后粘贴第三个分镜头的画面描述。深夜暴雨,李阿婆撑着黑伞佝偻的前行,老黄紧随其后。这次生成我们不做任何的画面风格描述以及人物造型描述,直接点击发送 扣在比例上也不做要求,看一看生成的效果如何。可以看到,得益于豆包 ai 能够关联上下文的能力,我们最终生成的效果也成功的生成了在美术风格和人物造型上能够基本保持统一的画面。但很显然,豆包 ai 擅自根据我们当前描述的下雨情 形,给李阿婆更换了一身类似于雨衣的衣服。所以就像我们刚刚所说的,在使用这种方法时,存在一定的概率改变画面当中人物的形象,或者是画面本身的美术风格,需要我们及时的进行调整。 我们下面可以继续使用传统的方法,就是先让 ai 去记录画面当中人物的形象。我们将李阿婆的形象通过截图的方式先保存到桌面上,然后将其发送给豆包 ai, 在 发送好之后告诉他这个参考图当中的人物是李阿婆,记住这个形象之后生成的,李阿婆都使用这个形象,现在回车发送。现在我们让 ai 大 语言模型 记住了一个明确的李阿婆形象,再次将第三个分镜头的画面描述复制粘贴过来,使用图片生成功能进行生成,看一看效果如何吧。可以看到此时我们生成的结果,李阿婆在形象上就符合了。刚刚我们所上传参考图当中李阿婆的形象 穿着一件蓝色的布衫,黑色的裤子和黑色的布鞋。如果在后续的生成当中老黄的形象也有所改变的话,我们同样可以用这样的方法来锁定老黄的形象。不过需要我们知道的是,在实际生成的过程当中,人物的某些角度,某些姿势,即便通过我们刚刚所讲述的功能,依然可能会出现意料之外的变化,比如像画风突然变得不统一, 人物的比例突然变得和之前不同。在这个时候,我们使用豆包 ai 或者是一些平台的参考图生图功能,想要修改就变得十分困难了。因此在这个时候,我们可以借助一些目前在保持角色前后一致性上做的比较好的 ai 模型,那就是 context 的 模型和 banana 模型, 具体的使用方法可以来到 leibu, leibu ai 在 打开首页之后可以看到,在首页当中目前是找不到搜索栏的,这是当前 leibu ai 的 一个 bug。 想要找到搜索栏,我们可以任选一个模型,下载页面点击进入,然后在左上方就能看到搜索栏, 我们直接搜索 banana 或者 context, 然后在搜索结果中选择工作流选项,找到一个基础的 context 模型,万物迁移工作流点击运行。 至于剩下的操作就很简单了,可以看到这里有单图编辑功能、多图编辑功能,甚至三图融合功能,以及基础的纹身图模块。如果我们需要生成的画面当中只对一个角色在姿势和环境上进行更改,通常我们使用的就是单图编辑功能, 直接将需要修改姿势和环境的人物作为参考图上传到这个位置,然后在提示词输入框中输入我们需要让 context 的 模型帮我们做到什么事情,比如当前作者提供的模板就是保持主体不变,将女人的黑衣服改成白色,红裙子改成黄色。而我们在生成时,因为是要制作脚本的分镜头图 片,所以这里可能更多的是关于人物姿势和环境的描述,在填写好之后,直接点击右上方的生成就能获得对应的结果,整体的操作还是非常方便的,而且往往在角色造型比 风格上的前后一致性保持的相当不错,在一些特殊的使用情形下,会比豆包 ai 更加好用,所以这里要作为一个补充,大家在遇到这样的情况时,要及时想起更换一个图片生成平台。那么以上就是关于在生成分镜头图片时,如何设计角色造型, 以及如何保持角色造型的前后一致性。如果觉得本期视频的内容对你有帮助,也不妨点赞、关注、支持一下,我们就下期视频再见!

哈喽,大家好,我是陈哥,今天我要分享一个非常炸裂的工具组合, banana, banana 加索拉或者是吉梦,用它们搭建一条工作流,可以一键生成服装近前自拍展示的这种电商视频, 我们只需要给他一张产品的正面图和细节图,他就会自动根据图片去匹配模特,最终的话生成一张这种在镜子面前展示服装的自拍视频。 我先带着大家看两个产品案例,一会再带着大家一步一步去搭建这样一条工作流,你只需要跟着成哥的节奏,你也一样可以搭建出这样生成产品展示自拍展示的这种视频啊。首先我们看第一个案例,这个是小香风的秋冬套装,给他的是这样一张产品正面图和细节图, 工作流就会自动匹配一个模特,然后生成这样一个自拍视频,我们看效果,这样一个视频效果还是非常不错的,对吧?不管是在场景上面还是人物上面,都是非常的逼真啊。 ok, 然后我们再看下一个,这个是花边针织衫上衣,给他的是这样一个产品图和细节图,最终会匹配一个模特穿版图,然后最后生成这样一个近前自拍的一个服装展示视频。我们看这个效果啊, 非常自然对不对?动作非常自然,人物也非常自然,而且场景也非常逼真,这个效果。六不六兄弟们,好, ok, 接下来的话我就带着大家来进行实操,根据这个步骤来进行搭建。 首先我们打开扣子的官方页面,我们点击这个开发平台,然后左边有个资源库,点击资源库右上角点击新建一个工作流的资源,选择工作流,这里要给他另一个名字,这个名字必须是英文的,不能是中文啊。我们比如说他是服饰,对吧?我就打一个服饰杠 video, 这是生成服饰展示视频嘛,对吧?然后工作流的描述是指这个工作流他能够做什么,比如咱们今天讲的这工作流,他是可以一键生成服装自拍展示视频,对吧? ok, 点击圈 好,进入到这个工作界面之后,默认的有两个节点,对吧?一个开始和一个结束,结束节点我们可以先不用管,从开始节点进行一个编辑,我把这个步骤给他复制过去, 然后我带着大家按这个步骤一步一步来进行一个搭建,跟上陈哥的节奏啊,你们一样可以搭建的出来。首先从开始节点编辑,我们选择它,右边是编辑框,我们给他进行编辑,那么在开始的节点首先需要有三个变量, 一个就是我们的产品名字,然后第二个就是我们的产品图片,三张啊,总共有四个数据变量啊,所以在开始这里我们给它增加有四项,对吧?这四项都是密填项,勾选起来,第一个就是产品的名字,变 量名,我们给它取个名,这个名字你们自定义就可以,自己认识就可以啊,比如说我们取名为名字类,对吧?变量的类型是这个 string, 可以 不用改。然后第二个就是图片,三张图片图片,比如说 image, 二和三啊,二和三啊,这里是二,这里是三。 变量类型这里需要改一下,因为这里我们要上传图片,所以在下个列表里面去选择 file 里面的 image, 选择它啊,这个也是 file 里面的 image, 然后这个也是啊,选择 image 格式改一改, ok, 那 么在开始的时候我们就可以拿到这四个数据,对吧?当我们拿到这四个数据怎么办?按步骤来给它增加节点。第一步生成模特穿版的图片提示词, 我们要有这样一张创版的模特,对吧?那这样图片怎么来?所有图片都是先有提示词,再有图片,对不对?所以我们要先给他生成图片的提示词,在工作流里面,只要是生成提示词资料,我们都可以用什么?用大模型来完成,所以在这里我们给他拉出一个节点,然后去选择,这里有个叫做大模型,对不对?选择它 好,增加进来之后节点的话一定要给他命个名字,因为不命名字后面我们在选择的时候就容易搞混啊,这里双击他给给他改名字,这个名字可以是这个节点的功能,比如说这个是第一步,对吧?生成模特川版图片的格式,这它的作用,我直接把这个给他复制过来啊,复制粘贴过来,好, ok 啊,调整一下, 这个给他挪过来,好,这是第一步,对吧?选到它我们来编辑啊这个节点模型,这里我们要去选择豆包的一点六视觉理解啊,为什么选视觉理解?因为我们需要这个模型,根据我们前面开始给到的产品图片,理解这个产品图片来生成提示词,对不对? 为了保持我们前后产品的一致性嘛,对吧?所以这里我们要去选择视觉理解。在输入向这里,首先我们需要把什么给进来? 我们要把产品的名字给进来,你要告诉这个大模型我今天是什么样一个产品,对不对?所以把开始的 name 这个名字给进来。第二个我刚才讲了,是不是要把图片给到它,让它来理解,所以在视觉理解输入这里,我们给它增加三项,也就是我们开始的 image 一、 二和三,对吧?我们把它转入进来, ok, 在 这里去选择啊。然后进来之后,接下来就是非常重要的一个东西,叫做系统提示词。所谓的系统提示词就是教这个大模型,告诉他该怎么按照我们的这个要求来生成一套模特穿版的图片提示词,并且还不能够, 并且还要保持产品的一致性,对吧?所以所有的系统提示词都一定是经过叠代之后才可以匹配的上的啊。每一个产品不同的产品,我们去叠代不同的产品提示词,这里我已经叠代好了,给他把它复制过去啊,然后粘贴过来。大家看一下这个提示词啊。首先这个提示词会给大模型 定义一个角色,对吧?告诉他你是一位专业的电商服装视觉设计专家,擅长产品分析和场景构图设计,对吧?第二个告诉他,你的任务目标是基于我们用户提供的服装产品图片生成一个亚洲模特,这个模特我们可以改啊,然后穿着该产品在镜子前自拍的场景描述,用于图像生成, 然后再根据我们的变量,呃,根据这样一个流程去生成产品的这种模特创版图片提示词, ok 啊,这是系统提示词,这个一定是要经过 n 字叠带的啊, 系统提示词好了之后,接下来我们就是用户的提示词,一般我们用户提示词只需要把前面的变量引入进来,变量给它增加进来就可以了。啊?怎么增加进来?按 shift 加左括号键啊?并且在英文的状态下,英文说法状态下按 shift 加左括号键,它就会弹出我们前面的变量名,我们选择它,然后这是名字 第一张图片,然后第二张图片,第三张图片,对不对?并且我给它另一个中文名字,这个是叫做产品名,然后这个就是产品图片,对吧?产品图片 一,然后图片二,图片三,是不是啊?这三张图片我们可以传主图,还有具体的细节图,这是图片二,还有图片三,对吧? ok, 用户,其实好了,输出向我们这里不用改,因为我们要的是一整段这个图片,其实词,这个时候我们第一个节点模特川版图片,其实词就有了,这个节点有了其实词之后,下一步 第二步是干嘛呢?我们要去收集产品图片的树组,什么叫树组啊?因为我们刚刚在开始里面是给他传的三张单独的图片合并到一起, 投到一起,为什么?是为了第三部生成图片的时候可以一次性丢给第三部这个节点,让他去理解图片,理解我们的产品图片和我们的提词词前面生成的图片提词词结合起来去生成一张图片,这样的话我们产品一致性才会更高。所以在这里我们再给他拉出一个节点,同样选择大模型, 那么这个大模型它的作用就是收集产品的图片,给它复制粘贴过来,这第二步对不对?收集产品的图片数组,选择它编辑这里模型的话,我们用逗号一点五就可以了啊,我们这里不需要试水理解,它只只负责收集图片,所以在输入像这里,我们只需要把 开始的三张图片,对吧?你麦子一二和三给它转入进来之后,同样你要告诉这个大模型你该怎么收集,这里一样用到系统取值啊,我们把这个系统取值给它复制过来 粘贴,对吧?职责就一个,接收上面的三张图片,并且把所有图片地址以数组的形式给它输送出去。用户提示这里我们同样按 shift 加左括号键,把三张图片给它引入进来啊, ok, 一 二和三,对不对?同样给它命一个名字啊,这三个名字,这是产品图片 一对吧?图片一啊,然后图片二和图片三,我命名也可以啊,但是为了后面我们自己看的明白,我们就把它改个名字啊,命名名字好, 输出这里,这里我们要去改一下它的一个类型,它是一个树组。什么是树组?就是把几张图片或者几个数据或者几句文字并到一起啊,并连的,我们把它叫做树组,所以在下面列表里面,我们要选择 array 里面的 string, 变成一个图片的地址。树,树组啊,好, ok, 那 么这一个 模型我们就编辑完了。第二步做完之后,第三步就是根据提示词和图片来生成图片了,对吧?啊,所以这个时候我们再拉出一个节点啊,给它拉出一个节点,在节点里面去选择这个 nine 的 图片生成,这里是我已经收藏的插件啊,如果说你没有收藏,这里是没有的,你在这里去搜就可以了,比如搜 nine 啊,直接搜 那啊,这个插件商店里面就有啊,选择这个图标的,我们选择它点击, ok, 同样啊,这两个都丢给他,我们把这两个刚刚做的节点全部数据丢到图片生成这个节点上面来,那么这个作用就是生成图片,对不对?我们第三步就是图片的生成, 双击给他另个名字啊,同样生成图片, ok, 好, 这是到了第三步了啊,选择它编辑,首先这里要输入一个 key, 那 么这个 key 怎么去获取?你们可以去看一下这个教程啊,这里有获取 key 的 一个步骤,我先把已经获取出来的给他复制过去啊,把这个复制,然后粘贴过来。 第二个这个就是提示词,这个提示词在哪里?是不是前面我们第一步生成的图片提示词,对吧?所以在下面列表里面去选择第一步生成的图片提示词。 第二个就是产品的图片组合,我们去选择这个图片组合,就是第二部收集的产品图片数组,对不对?第三个这里的话就是指产品的图片的比例,这个比例我们是竖屏的,对吧?选择九比十六,好,所以我们在这里给他是九比十六的比例。下面这里是 图片的一个质量啊,这里我们选择 e k 啊,给它复制粘贴过来啊,这是基本的信息输入完之后,那么在这里我们整个图片啊,这个节点我们就编辑完了。先来测试一下这个节点到底生成出来的图片怎么样啊?我们可以把结束给它拉过来,连到一起结束节点,在这里去选择第三步获取到的图片地址。 ok, 这里我们点击试运行,然后在试运行的编辑框里面会让我们输入三张图片和一个产品名字,对不对?比如说我们点击这个上传图片,然后去选择一张图片啊,比如说这个主图,我们给他上传进来,然后第二张图片就是两张细节图,这里上传三张图片,这个是细节图对不对?这个名字我给他复制过去啊,一会用把这个细节图,这是 前面领口的细节图,然后第三张就是袖口的细节图,对吧?我们给它转入进来,接下来就是这个产品的名字,标题的名字,我们给它输入进来。 ok, 这几个数据好了之后,点击试运行, 然后我们就可以看到工作流开始进行运行了,对吧?这个是为了生成图片格式,这个在收集我们上传的三张图片,然后一会它就会把格式和图片传给谁,都传给 图片生成的这个插件来生图,我们稍等一会看效果啊。 ok, 这里运行完了,我们在运行的这个输出变量这里就可以拿到产品图片啊,这个地址我们点开来看一下效果, 对吧?这个效果还是非常不错,我们给的是这样一张图片吗?是不是然后生成出来的是这样一个模特穿版的图片, 一致性还是非常好的啊。好, ok, 这是我们这一步就完成了图片的步骤啊,把这个先拿开,接着往后面进行一个搭建啊,结束也先放到一边。好, 图片生成完了,接下来下一步就是要根据这个图片去生成一个视频动态的一个提示词,对不对?生成提示词我们要用到什么节点? 是不是也同样拉出一个叫做大模型的节点,对不对?我们选择这个大模型,然后双击它改个名字啊,把这个复制过去,这是第四步了,是不是生成图片的提示词好, 选择它编辑模型这里去选择。同样啊,我们要去选择视觉理解的模型,豆包一点六的啊,因为我们要把图片给到它和这个产品的名字都给到它,来生成对应的动态提示词啊。 ok, 输入像这里,我们增加 选择开始的名字,把名字给进来啊。然后第二个视觉理解这里,我们同样要把图片啊给他增加进来,让他来识识别我们的图片,进行一个动态的描述。所以首先我们要把开始的三张图片对不对?一 二和三要给进来,为了为的目的是什么,就是一致性更好,这三张图片,这是原始图片嘛,对吧?然后还有一张就是前面生成的这个窗版图,模特的窗版图,所以我们要给他丢进来,选择这个 u i l 的 地址,然后他就可以了。 好, ok, 这是我们这三步啊,这一步把四个数据引入进来,引入进来之后,接下来同样是一个非常重要的东西,叫系统提示词,对不对?这个提示词我直接去复制已经写好的啊,叠的好的,给它复制过来,给它粘贴好。 ok, 那 么当系统提示词编辑完之后,接下来就是 这个用户提示词了,同样按 shift 加左括号键,把我们的产品名字还有四张产品图啊,三张产品图, 对吧?还有一个就是模特的穿版图,这个是模特穿版图,对不对?比如进来这里同样可以给他命名啊,我这里就不命名了。输出这里可以不用改,就是 street normal 的, 因为是一整串动态,其实词,它是一个段落,所以我们不用去改它的类型啊。 ok, 那 么动态其实词到这里我们就有了, 有了动态提示词,接下来就可以根据动态提示词去生成什么生成视频了,对不对?所以第五步就是生成视频,生成视频我们这里可以去用极梦,也可以用 soar, 这里的话我们以极梦来举例啊,我们拉出一个节点,然后在节点里面去选择极梦的一个视频生成, 如果你这里面找不到这一个插件啊,你去搜索啊,记住在这里搜啊,因为我是已经收藏好的,所以直接在这里可以找得到啊,记住是这个图标,不要选错了。我们选择极梦视频生成,然后在这里有一个根据图像和文本生成视频,对吧?选择它, 那么他的作用就是第五步了,对不对?生成视频好双击他改下名字啊,一定要养成习惯,不然后面你在选择节点的时候就会混乱啊。这个是我们用积木来给他生成视频,对不对?选择他编辑,首先同样这个 k, 我 们用它给它复制过来, 然后提示词就是前面第四步获取到的视频动态提示词是不是?我们选择第四步的视频提示词,这个可以不用管他,然后这里就是时长, 极梦的只能是五秒或者十秒,如果说是搜二的,最长支持二十五秒,我们这里选择呃,极梦,这里就是十秒, 输入一个十,这里是图片的尾帧,可以不用管,这个是图片的链接地址,这个图片就是我们前面拿到的模特的图片啊,给它传送进来,这个是模型,我们去选择呃视频的三点零 pro, 选择它效果会更好。然后这里是分辨率,也就是它的清晰度,我们用幺零八零 p 的, 这里直接用幺零八零 p 的, ok, 编辑完之后,那么视频节点在这里我们就完成了。理论上来讲,整个过程我们已经搭建完了,但是有一点,生成视频的时候,不管是哪个插件,它会有一个过程等待和排队的过程, 所以为了让工作流在中间,不会说自动中断。在等待的过程中,我们在这里还需要给他增加一个查询的节点,就不断的去查询这个视频是否已经生成出来,生成出来就给我们展示出来,没有生成出来就继续的去查询,不要让它中断。所以在这里我们要拉出一个节点,同样去找到这个即幕视频生成,这里有一个叫做查询任务信息的, 我们可以选择他,但是直接查询一次可能查询不出来,所以我们在这里啊,要给他查询多次的话,你需要找到业务逻辑里面有个叫循环,所谓的循环就是不断的查询嘛,对吧?所以我们在这里选择循环啊,这个节点,首先循环,这里他是循环查询, 对吧?给他改个名字,好,然后我们选择他这,他这里就有这个节点,他有两个框,对不对?这里是主框,这里是子框,我们选择他先编辑 循环类型,这里去选择无限循环,就不断地去查询结果有没有出来,对吧?视频有没有出来,然后中间变量这里你要有一个铰定的这个数据,对吧?以什么来判断它是否已经出来,所以增加一个中间变量,这里去选择。我们第五步生成视频里面的这个视频的 id, 你 这个 id 铰定这个 id, 如果这个 id 有, 就不断地去查询这个 id, ok, 这是在主节点啊,下面子节点里面我们增加一个查询的刚刚这个查询的插件啊, 极梦视频生成,选择它,对吧?任务查询选择这个啊,记住啊,如果说你这里面没有节点啊,这里没有,找不到这个插件,这里是收藏的,我是收藏的,你们没有一定要去搜啊,不然到时候的话找半天找不到, ok 啊,回到这里来选择它编辑,那么这里它就是查询任务信息,对吧?给他双击改个名字,这是查询信息了, 选它编辑,那么这个 id 输入的 id, 我 们去拿前面循环查询啊,这个循环查询的 id, 然后不断的去查, 用它来查它的信息,查完之后去反馈, ok, 那 我们不断地去查询的时候,总得有个结果嘛,对吧?那怎么去反馈结果?这里拉出另外一个节点 叫做 if 选择器啊,同样在业务逻辑里面有一个叫做 if 的 选择器啊,通过它来判断我们前面的返回结果, if 就是 如果的意思,对吧?如果,如果什么,在这里去选择如果 第五这个查询信息这个节点 url, 这是我们的视频地址嘛,对吧?如果这个地址选择条件为空,就如果他为空怎么办?为空的话就是视频没有出来嘛,那这个时候我们是不是要给他继续查询,所以这里他就会有两个节点输出。第一个节点就是如果为空怎么办?我们拉出来选择继续查询,在业务逻辑里面这里有一个 继续循环,对吧?点击继续循环,但是他这个查询是不断的查的啊,几秒钟循环,几秒钟循环,这个时候也容易让工作流跑错。 那么在中间我们给它增加一个节点,就不要查询那么频繁。因为有时候像这种插件,积木也好,搜索二也好,用的人比较多的时候,它排队时间非常长,所以这个时候我们需要给它增加一个节点,然后在搜索这里,你可以去搜索搜索一个叫定时器的啊, 这个插件我这里是已经收到。好的,我直接选择啊,没有你就去搜,这个是定时器啊,这个图标的,我们选择它,这个定时器的作用就是什么?就是等待,就你查询一次之后,你不要立马去查询,这样容易出错。我们给他等待个六十秒或者三十秒,这是秒数,比如说六十秒啊,或者说三十秒都是可以,然后比如说六十秒,给他等待六十秒,然后再继续 循环查询啊,是这么一个意思啊。 ok, 这是第一个条件,就是如果查询出来的视频已经出来了怎么办,对吧?所以下面还有一个节点, 我们选择拉出来,这个时候就要给它终止循环,你不能一直查询嘛,对不对?既然视频已经出来了,你就给它终止就可以了。 ok, 那 么这整个工作流的节点我们就编辑完,接下来要把查询的信息给它输送出去,对不对?所以我们在 这个主节点这里去选择一个输出,这里输出去选择查询信息里面的 u i l, 也就是我们的产品视频地址, video, 对 吧?呃,如果说已经生成出来了,就输送出去。输送给谁? 我们给他拉出一个结束节点啊,把这个结束节点拿过来输送给结束的节点,对吧?在结束里面选择它编辑,然后去选择这里,我们去选择一个什么?选择 循环查询的最终结果,对不对?循环查询的最终结果就是什么?就是视频的地址吗?对吧? ok, 那 么这个时候这个工作流我们就搭建完了,比较简单吧。好,接下来我们开始测试一下效果啊,最终它到底是怎么样,对不对?点击这里有一个叫试运行, 然后同样我们把这图片主图、细节图,细节图,还有我们的产品名字给它输入进来,然后我们点击这个试运行。 ok, 那 么这个时候工作流它就会开始进行一个运行,按照我们的步骤给它进行运行,对不对?呃,大概稍等一会,我们来看效果啊,一般正常来讲,呃,五分钟左右啊,三到五分钟可以出结果,但是有时候会更长一点啊,这个具体看,呃,这些插件使用的人的数量。 ok, 我 们一会看结果。 ok 啊,所有的节点都运行完了,这里生成的是模特的套版图啊,我们在这个节点点开它可以看得到,对吧?这是一个模特图,效果还是非常不错,然后我们再看一下这个视频啊,这个视频在这里会出现一个视频结果啊,或者说我们也可以在结束的节点这里可以找到视频的一个结果,我们点开看一下效果, ok, 这个效果也非常好,对不对?而且产品的一致性也是非常好的啊, ok, 动作也很自然。那么这是这个工作流啊,你们在运行的时候,如果说等待的时间特别长,你可以停止,然后把这个节点的 呃分辨率改成 g 二零 p 啊,有时候幺零八零 p 的 等待时间非常长啊,我这里就把它改成 g 二零 p, 然后它生成出来效,这个速度会更快。那么今天我们这个工作流就讲到这里,这个工作流其实还有很多可以叠带的空间啊。呃,不管是从模特上面还是从穿版上面啊,我们都可以去给它进行一个叠带和更新。那么今天我们先讲到这里,下期我们再见啊。