康复 ui 实现首尾真丝滑动画终于来了,完全开源免费。这套工作流我钻研了很久,只要按照我一会课程的步骤走,他的成功率是非常非常高的,媲美碧源的 k 某和 j 某。 哈喽,大家好,我是 ai 小王子。这次的 ai 视频工作流使用的是通易万线万二点一的开源模型,制作的非常强大,同学们一定要学习一下。首先还是先获取一下本节课程的工作流啊。浏览器搜索 running hop 首次注册的用户填写 k o l 零一杠大写的 r h 幺四五邀请码,可以获得一千的 rhb。 找到工作流。这边搜索 ai 视频首尾针,点击回车就可以看到我了,目前是只有我一个人啊。如果这里有很多,请认准左下角 ai 小王子的头像啊。 点击进去之后呢,同学们记得先点击一下收藏,以免下次找不到。如果想要下载呢,就点击这边的下载,这边是支持免费下载的,或者是在线运行工作流都是可以的啊。 ok, 这个下载好后呢,我们打开本节课对应的网盘,下载万二点一所需要的模型啊。之前我是讲过万二点一这节课的,可能大部分同学都已经下载好模型了, 不过如果你没有下载也不用担心,跟着我网盘文件夹内的名称去走即可。给大家举一个例子啊,比如说第一个文件我们要放在哪里啊?进入之后把它放入到根部路 models clip vision 文件夹内即可,以此类推,相信大家一定可以把模型放入到正确的位置。同时呢,老师也为大家准备了一些首尾人的素材供同学们去使用啊,当然了,如果能使用自己的, 尽量使用自己的。 ok, 这些全部完成后呢,打开我们美丽的 comfi ui, 主要是讲解一下这里的模型,这里模型呢,主要是用 image two video 的,这里边有两个,一个是 g g u f, 一个是普通的原模型啊。 同学们,如果你的显存不好啊,我们就使用 ggwf。 什么叫做显存不好?低于十六 gb 或者低于十二 gb 的,在 ai 视频领域中都可以称为显存不好。那么老师,我只有四 gb, 我还是想要跑出像你这样的工作流,怎么办呢?就用刚刚在线运行工作流的 running hop 去跑机, 回到我们美丽的康 c u i, 很多扩展呢,之前万二点一讲课的时候也跟大家去讲过了,如果同学们是第一次听到我的课呢?拉入这个工作流会发现,哇,怎么缺失这么多节点啊?不要担心,不要害怕,要去管理器这边去搜, 做一个叫做 one video rapper 这个节点,点击安装重启你就可以发现,哇,没有报错了,简简单单, ok, 看一下这个工作流如何去使用啊。首先还是为了方便大家去使用,我这里放了一个全局变量, 我们只需要去改变全局变量,看一下这边下方上传首帧图片哦,什么是首帧图片呀? 手针图片就是你整个视频开头的第一个画面,就叫做手针图片,右边是下方上传尾针图片。那老师,什么是尾针图片呢?尾针图片就是你整个视频的最后一个画面,就是尾针图片。如果同学们手上有个手针图片,有个尾针图片,想通过 ai 视频的技术让他展示出 如何从第一个画面转换到另一个画面的循序渐进效果的话,就是使用这个工作流手针和尾针。 明白了, ok, 看一下下面这个边,注视宽度等于总针数,并且总针数必须是四加一的倍数。这里不好意思同学们,我这里写反了,必须是四的倍数加一啊,宽度就是这个值,看到没有空图像的宽度,这里我填了六十一。 六十一代表什么呀?代表着最终这个视频会有六十一帧,那么为什么不是六十帧呢?老师,因为这里帧数必须是四的倍数加一。 同学们想弄六十针也可以,不过很有可能会报错。那么如果同学们非要去征求那一针的区别的话,建议同学们放入到视频剪辑的软件里面,把最后一针或者中间哪些针给抽掉, 这样子来去完成。然后其次是高度。高度是什么?高度就是分辨率,分辨率我们要通常去使用四八零或者 七二零,为什么?因为万二点一的模型目前只有四八零 p 和七二零 p 的模型,这里具体取决于型号。我这个工作流呢,给大家用的是四八零 p 的视频,那同学们如果想要七二零的视频怎么办啊?第一步,先把高度改成七二零,其次往右边滑, 找到这边的 one video model loader model。 model 是什么? model 就是模型的意思,快速精准定位到这个 model 这个单词,在这边的 model 里边选择我们的七二零 p, 选择这个 b f 十六或者 f p 八的都可以, b f 十六的精度会更高一些。这个工作流用的是四八零 p 十四 b 的 b f 十六模型。 ok, p 四大小不要去动,颜色也不要去动。这个空图效主要改变宽度和高度,那同学们记住啊,在使用的时候假如说,哎,我过了一段时间好久没有使用, 不知道怎么去办,一定要去看一下老师给这里留的注视啊。 ok, 再看一下下方填写关键词,关键词怎么写?要多用动词,主要表达左边和右边的图片,比如说这个效果啊, 大家看一下左边恶灵骑士的手阵图,然后一个稳阵图就可以生成。恶灵骑士往前走,骑着摩托车,然后后边有几个摩托车大队跟着他去走,用到的关键词就是 恶灵骑士头上冒着火,冒着火是不是一个动词啊,要表现出他的头部,他火焰是在动的动向,其次是骑着帅气的火焰。摩托车 骑着是不是也是动词啊,要多用动词,他就可以识别到。这个不灵骑士往前走会找到一个摩托车也是冒着火焰,摩托车丝滑转场。关键词就这么简单,没有那么复杂的,就是你想让他怎么变,你就用你的文字去 表达即可。并且这里是支持直接书写中文文字的,记着啊,同学们,这个是同一万像万二点一模型,完全支持中文,不用害怕。 ok, 接下来再看一下这边下方是步数,然后建议啊,又是个错别字啊,建议是二十到四十之间,我这里呢,工作流默认弄的是二十五,什么时候用二十,什么时候用更高的呢?当我们在做测试的时候啊,同学们,测试只是主要去看效果,先让他跑通,再去提高他的步数, 因为测试耗的时间比较久,步数越高,耗时越久,明白吧?那么当我们测试完之后,哎,这个效果真不错,怎么办呢?把种子固定,然后把步数提高即可。再看一下这边下方 was 是总帧数, has 为分辨率。这个节点的目的啊,是为了往后边去串联的, 要确保整个工作流的节点,他的尺寸是统一的, ok, 接下来再看这边。第一步,手尾针图像尺寸处理,我们刚刚想的这里用的是四八零 p, 对吧?但是我的手针尾针并不是四八零 p, 这边的节点是为了让我们的尺寸为四八零 p, 同时自适应另一个宽度或者高度的比例。 比如说这里啊,我定位了是宽度是四八零 p, 经过了按宽高比例缩放这个节点呢,他就会自适应的把高度弄到为同比例的四八零 p 的效果,高度就是 八六四,首针弄一个,尾针弄一个, ok。 第二步就是关键词处理了,这里不需要去动啊,这里调好了是负面关键词啊,前面是正面关键词,大家自己去填写表达即可,所以这边是不用去动的。接下来第三步就是采样生成处理了,这面大家一看,哇,好多好多好复杂呀,好害怕。不用害怕, 你什么都不用去管啊,一动都不要去动,因为我给大家已经调到了最优的参数,几乎是每一步后边都加了一个,清理 cpu 占用啊,降低同学们的现存压力。如果真的要改的话,就是我刚刚讲到了这边的 one video model, loader model model 就是我们的模型, 想要改到七二零 p, 那么我们就选择七二零 p 的模型,这两个都可以啊, ok, 接下来就是成品展示了,最后导出的是一个技术的版本, gif 技术版本的好处就是它可以一直循环 mp 四格式,也可以啊,同学们自己去选择。老师,我想要 mp 四的格式,那么我们找到这边的格式,把它选择为 h 二六四或者二六五都行啊, m p 四格式即可啊。后面是一个对比啊,对比这里用到的主要节点是这个图像对比简易,我加了一个 呃字体,然后字体大小,然后写什么呀?上面写 first frame, 下面写 last frame 啊?同学们,如果我们有中文字体的话,这里是可以填写中文的,但老师这里先用的英文去表示, first frame 代表什么,就代表我们的手针, last frame 代表我们的尾针,然后最右边是一个展示的效果,看一下是不是非常好啊。我们再看下其他案例出来的效果, 手针从一个火圈出来,然后脖子上冒火,像被脖子上被施了魔法一样,最终这个老虎战胜了一种效果,哎,这个做的非常好,我们看一下这个用到关键词是一只凶猛的老虎,穿着盔甲,那就挥拳,镜头拉远 这个样子,再看一下这个,在他走路的时候,看这边衣服自动慢慢缓和的变化,像是做了一个魔法的 效果,对吧?这次我做了工作流,效果是非常非常好的,那么在使用的时候,老师怎么样才能让我们的成功率更高呢?记住啊, 第一点,这里的参数其实都是不重要的,谁最重要,最重要的就是你的首针和尾针,如果同学们既然找到首针和尾针,他俩根本就没有任何关系,那么你让他去转变其实是有一定难度的。特别是如果两张是完全不同风格的,不同场景的,让他去做过渡 是很有难度的,所以同学们一定要找好首尾针。那么老师首尾针怎么找?记不记得上节课我在讲 as 加加的时候提到过,那里边的那个 subject 模型很适合做首尾针啊。 如果同学们不知道怎么做收尾针,可以到我们的上节课 s 加加那篇内容看一下收尾针制作, ok, 刚刚讲的是免费的制作方式。那么第二种方法 更高效,就是使用我们的 me journey, 他怎么去做呢?很简单,只需要把同一个关键词一直去生成就可以了。比如这个关键词生成呢?他每次会生成四个,那么这四个是不是很像, 是不是有关系的,对吧?都是根据我们关键词去走的,但是是不同的角度,面部场景等等等等,是不是很像,是不是完全可以拿来用首尾针呢?像老师在这做的时候,看这张是不是这张用的是尾针呢? 然后再往下走,这张用到的是手针。其实老师这个例子用的就是蜜汁里,方法有很多,但同学们一定要找到能够给你们很多解决方案的老师去帮助你们去做。 ok, 首尾针搞定了,第二步最重要的就是关键词了, 关键词怎么去写,其实就是用大白话去描述就好了。比如说这两张图片,我们肯定是想让这个恶灵骑士骑着摩托,对吧? 那么怎么骑着摩托?我们这里可以表达恶灵骑士走向摩托,对吧?走向是一个动词,然后骑着摩托往前走,往前走也是个动词,往前冲啊,都可以。除了往前走,我们其他细节要做的更生动啊,比如说头发, 头上冒着火对吧?比如说手把这个包包提起来等等,踩着油门往前冲,这些都是不错的关键词哎,视频写关键词最重要的就是多写动词, ok, 这是第二点最重要的,第三点最重要的其实就是我们的运气了。那么为什么小王子老师每次生成的图片都这么好呢?同学们在刷图的时候觉得,哎,为什么每次刷图效果都不那么好呢? 就请你一定要给王子老师的视频点赞关注一键三连,这样子呢,同学们的运气一定会砰砰砰砰的往上涨,这个是有科学依据的啊,同学们,不信你也可以去试一试, ok, 想要从零到一深入学习 come fiui 的小伙伴们,可以到哔哩哔哩平台上面找到课堂,然后找到 comeiui 从零到一商业应用系统课。我的 comeiui 系统课是 b 站职业职场榜排名第一的课程,同时也是全站 ai 课程榜的第一,感谢同学们的支持与认可。 如果你想了解 ai 如何商用,在学习时遇到问题都有随叫随到的老师帮助你答疑解惑。想认识更多学习 ai 的小伙伴们,也有班级研讨群和海量付费工作流等, 这些都包含在服务内,课程永久观看,答疑服务也是永久的,这是一套一定不能错过的二零二五康菲 ui 课程,老师在班级学员群里等你哦!菠萝蜜让你轻松掌控 ai!
粉丝2.5万获赞8.0万

今天搭建视频首尾帧工作流,五秒钟的视频两分钟生成。先来拆解这个工作流, 他跟图上视频工作流差不多,可是增加了几个新的节点,一个图像短视频编码,可 f 视觉编码,那个图像缩放节点是因为两张图片他的宽高不一样,所以才用到现在搭建这个工作流,双击空白处,输入 one 视频模型, 选择视频模型加载器, ctrl 加 c, ctrl 加 v, 复制一份,双击空白处 number one 视频快交换,选择视频快交换,点击它, 在快参数这里拖出来,选择视频设置交换,复制一份,把模型连接上,在视频快这里模型插槽拖出来,选择 one 视频挪拉, 两个是一样的,在挪拉插槽这里拖出来,选择 one 视频挪拉,选择两个是一样的。 双击空白处,输入 one 视频文本编码,选择视频文本编码缓存, 双击空白处,输入 one ve, 选择视频 ve 加载器,前面打点的节点跟图片生视频一样,后面就有点区别。双击空白处,输入 one 图像短视频 编码,选择万图像短视频编码。在图像短视频编码这里克利普拖出来,选择克利普视觉编码,在克利普视觉编码这里拖出来,选择克利普视觉加载器, 在四驱编码这里图像一加载图像图像二加载图像,选择好首帧和尾帧, 它两个像素是不一样的,不一样的话会报错,那么只能在图像这里加载一个节点图像缩放,选择这个节点图像缩放 v 二,把图像连接上, 调整它的宽高比,调整跟图像一一样, 起始图像连接到一,结束图像连接到二, 把 ve 连接上,在图像短视频这里图像切入,拖出来,选择这个万视屏采样器,选择两个 连接模型,上面是高照,下面是低照。连接好模型,连接好文本,输入 传感器这里有个样本,把上面的样本连接到下面,在下面样本这里拖出来,选择万视屏解码, 选择万视频解码。视频解码这里有个 v a e, 把 v a e 结点,连接上 图像这里拖出来,输入合并,选择合并为视频,这样之后工作表就打剪完成,打剪完成之后我们加载大模型, 这是万视屏的大模型,我们选择纹身视频,下面是高照,下面是低照,按对比,纹身视频是二点二 lv, 图身视频是二点二 lv, 所以 区分这两个。在注意力模式这里选择前者,注意 两个模型一定要选的好,洛拉也是,上面是高照,洛拉洛拉模型名字也一样。二点二 lv, 下面这个是 d 照,一定要看清楚模型 v e, 这里选择二点一的 v e 可立谱视觉,这里默认的,这就是帧率,视频的宽高比 可以采样器,这视频采样输入四步,高照的,其实步数是零,结束是二 d 照的,其实辅助是二结束,没有合并为视频,这里输入名字格式这里选择 n t 四, 任意可以输入十六,这样这个视频的打剪完成了,运行一下,出现了一个报错,还是一样的老问题,何必都把这里取消掉,再次运行,运行成功。我们看一下对比, 这个是尾灯,这个是手灯,看一下烧尾灯是否一样,一样没有问题,控制条灯运行完成。

你使用这个工作流,只要你能跑一秒的视频,那么你就能跑一千秒的视频,你甚至能跑一万秒的视频,真正做到了无限时长。 这期视频我们来讲一下万象二点二图声视频无限时长工作流和万象二点二图声视频无限首尾帧工作流。大家看视频的时候一定要记得一键三连,大家的热情越高,我更新的速度就越快,能拿出更多更好的工作流与大家分享。 这两个工作流从理论上来讲是可以允许你跑出无限时长的视频的。首先我来演示一下无线首尾针工作流的一个使用方法,在这里的话,我演示的时候我使用了十二个节点,所以说我需要准备十二张尾图,这时候我是使用了 艾尼玛的提示词,用艾尼玛纹身图的基础工作流一次性生成了十二张图片, 下面我就用这十二张图片做一下无限首尾帧工作流的一个演示。在这里我是预设了十二个组,每一个组都是相同的节点,完全相同的节点, 这十二个节点唯一不同的是就是第一个节点他是需要你手动去输入一个起始的图片的,也就是说我们的首帧图片在这个节点手动选一个图片作为首帧, 然后在节点内部选择伪真的图片,选择完了以后,在这里输入你需要这个视频运行的一个提示词,提示词越详细越好,像我的话演示的话都是一般不会输入提示词或者输入一个很简单的提示词,只是看一下效果。 大家输入完提示词以后,第一个节点点生成了以后,他会把视频传到第二个节点,第二个节点他会自动去读取前面一段视频的尾帧作为他的首帧,最后我们在第二个节点再输入一个尾帧,以此类推, 这十二个节点就循环成为了一个视频。那么节点的输入和提示词的输入大家了解了以后,我们来看一下前面的部分构成,前面部分构成的话是由 左上角的一个模型选择左上角的这个节点组,第一行我们选择高噪模型,第二行选择低噪模型,第三行选择可立普,第四行选择 ve, 然后第五行和第六行是我们 高噪和低噪的一个 c g a t。 加速的一个档位的选择,正常的话你选择内置模式,或者你根据之前 c g a t 加速的 自定义参数选择一个属于你的自定义参数也可以。最后一行是选择模型分块的数量,你可以选择不分块零,也可以选择最高到四十,因为外线二点二最高支持分块到四十。那么再往下看 左边这个就是选择我预设的组数的,你只要打开开关,那么右边的组数就会打开,关闭就会关闭。 第一次运行这个工作流的时候,你只要开第一组就可以了,你打开第一组以后,如果说工作流能够正常运行,然后你的显存没有爆掉,生成的时间你也能够接受的话,那么接下来你可以将十二组都打开,你甚至可以再添加十二组都是没有问题的。 然后就是一个视频参数的设置,画幅的比例,然后分辨率,帧数和帧率需要着重要讲的就是这个帧数,它不是总帧数,不是你生成视频的总帧数,而是每一个节点的帧数,也就是说像现在我选了三十三帧,那么生成的就是两秒,也就是说 我们选一组就是两秒,选两组就是四秒,以此类推,选十二组就是二十四秒。然后是视频参数总线,这个节点上面输入的就是负面提示词,所有的节点组都共用一个负面提示词。 下面的话就是 ve 编码和 ve 解码的分块数量,以及需要重叠的画面数量和时间分块。这个最前面的基础工作流已经介绍过了,这里就不再赘述了。然后就是总步数,总步数就是说每一个节点它运行的高噪和低噪的总共步数,然后下面选择高噪的步数 是二,那么总步数减去高噪步数,剩下的就是给低噪步数的,低噪步数你不用选它会自动匹配的 高噪步数,选择一低噪步数那就是三。引导系数是一,彩样器和调度器一般都使用默认就可以了,随机种和生成以后的控制大家自行选择下面的这个去除手帧接力点, 这个可开可不开,但是一般推荐大家打开,这个的作用就是说在第一段视频和第二段视频拼接的时候,要不要去除掉一帧, 这样的话可以让你拼接的视频看起来没有一个明显的卡动。当然你也可以在下面选择两针三针,这个主要是取决于你观察视频的流畅度,如果说他还是有明显的接缝的话,那你就选择二。 前面的参数你都已经设置的没有问题了,你去跑第一组,你跑第一组的时候,如果你的显存没有爆掉,然后运行正常的话,理论上来说你就可以开所有的节点去跑, 时长都是叠加的,因此来说的话,只要你使用这个工作流,只要你能跑一秒的视频,那么你就能跑一千秒的视频,你甚至能跑一万秒的视频,真正做到了无限时长。 下面我们来看一下图身视频无限时长的工作流,这个工作流其实跟前面的工作流几乎是一样的,唯一不同的就是他的每一组节点他是不一样的,在这个无限长接力点上面,他只允许你输入手帧图片, 并不允许你输入伪真图片。也就是说你用一个图片输入给第一个节点,第一个节点生成视频了以后,接下来往下传第二个,第三个,第四个,以此类推,一直传到最后一个,最后生成到了一段完整的视频。 至于前面的参数设置,跟我们刚才讲的无线首尾帧视频是一模一样的,大家第一次跑这两个工作流的时候,一定 要只开一组去跑,在运行第一组生成视频的时候,大家观察一下显存的变化和 gpu 的 运行情况, 然后在下面根据你的实际情况调整分辨率,调整每一个节点的总时长, 还有调整 ve 分 块的一个参数,等你第一个节点跑的很顺畅了以后,你就可以无限的去拼接了。需要注意的是,视频参数总线,还有首尾帧接力点和无限时长接力点,这三个节点是经过刚刚优化过的节点里面的参数和逻辑进行了一定的修复, 使用管理器里面下载的老款小白工具箱是没有办法使用的,一定要从网盘下载了最新款的小白工具箱,覆盖到你的本地去,这一点非常重要啊,看到视频最后的人一定要注意这一点, 那么今天的视频就讲到这里了,大家一定要一键三连,再次感谢大家的观看,我们下期视频见。

昨天讲的 ai 慢剧、短剧拼接片段之间首尾针不连贯,紧别衔接问题的解决方法,有朋友说不知道怎么获取视频的首尾针,今天来给大伙说一下。其实方法有很多, 第一种是通过我们 windows 电脑自带的功能,我们右键视频有一个打开方式,选择用图片打开进度条,拖到视频首尾右侧有三个点,我们点击后有一个保存针,这样就可以直接保存。然后是借助我最常用的在线工作流打开 running hauber 网站,第一次用的小伙伴可以通过我评论区的邀请链接注册 会免费送大家五百算力点,每天登录领取。幺零零点,我们寻找 t 八大佬制作的 c 段四二点零手帧及尾帧获取,直接搜名字就行,点击进入这里上传你的两个需要拼接的视频, 直接点击运行,稍等一会手尾帧就被提取出来了。还有个最原始的方法就是直接截图,倒也可行。那这期就简单聊到这里,因为有人问我就回答一下,我们下期视频再见!拜拜!

今天我们搭建这个 lts 二点三扫尾增工作流双击空白的画面,这里输入 u n e t。 这有两个加热器, 一个是 nik 加载器,一个是 g g u f 加载器,他们两个用的 clip 是 不一样的,双击空白处输入双 clip, 下面的 g g u f 输入双重 clip。 如果你要使用瑞特加载器的模型,这个 f p 八亮化版,那么你一定要使用它这个加载器装克利普加载器,那么在克利普这里你就要选用这个克利普 和这个克利普,两个克利普选完之后,在类型这里选择这个 lts 的 me。 如果你要用 guf 模型,一个 q 四,一个 q 六, q 四的版本是更低的显存 在这个 g g u f 这里,它的 clip 是 这个 选择这两个 clip 类型选择这个,所以你要用上面的 unik 模型,这要搭配它的 clip。 你用下面的 u g u f 模型,要搭配它的 clip, 两个使用是不一样的。我们可以在 clip 这个节点这里点击它的模型下载个 clip, 我 们编码器复制一份 这个编码器,上面是正向提示词,正向提示词下面是负面提示词,可以在负面提示词这里随便选几个 正向提示词,这里就根据你的图片去写就好了。然后我们连接的是这个 g g u f 模型的, 如果你想使用上面 unique 模型的话,就把这两个 clip 模型的线按 ctrl 键点击它之后点击到上面的 clip 就 好了。现在我们在这个节点点击它的模型,输入权重洛 拉加载器,这个加载器能一次性加载好几个洛拉,加载好两个洛拉之后, 可以设置它的值,如果你找不到这个权重洛拉加载器,你就可以在上面输入洛拉,选择这个洛拉加载器,剪模型,粘贴,复制一份,把上面线连到下面就 ok 了。 去加载它的洛拉,上面是这个洛拉,下面加载这个洛拉。 这两个 logo 有 强度设置,跟这个是一样的,一般就零点五,这个一或者零点五都行,像这样设置模型,连接 logo, 再连接下一个 logo, 再连接下一个,这样连接后深层的图像是没有问题的, 可以调他们的参数,不一样的参数生成的视频是不一样的,我们先把这个零点五调成一,这个调成二,生成好视频,我们看一下, 它是跟上一个是有区别的,上一个我们这个调的是零点五,这个调的是一,这个 logo 是 保持视频自信,这个是转场 logo, 根据自己需要去调就好了。如果没有这个节点就加载这个。 如果你的显存是五零系或者四零系,那么可以使用这个 unik 加加器的节点,使用这个模型和这个颗粒谷,它的生成速度会比 g g u f 快。 g g u f 它生成的时间是五分钟, uniq 它生成的时间是三分钟,那这个节点可以用也可以不用。但是如果你是低显存,八 g 显存,我是建议你用这个 g g u f 的, 在加载这个节点,在这个节点后面拖出来 lts, 选择这个更快激活。如果你是八 g 显存,这里就填四,下面填二零四八。如果你是十六 g 或者十二 g, 就 填二,这里填四零九六。 如果你不使用这个补丁,就直接在这里拖出来,滚入基础, 选择这个基础调度器,要把这个给删掉也行,如果你使用这个就在模型这里做出来,在调度器这里我们选择这个步数这里选择八步,这个八步和降噪值有什么区别?这个是八步降噪仪运行出来的视频, 我们现在测试十二步降噪,零点五点击运行,运行完了之后我们可以看一下左边是手针,右边是尾针, 这个降噪的强度我们可以理解为原图的保留强度,如果这是一是保留全部的原图,如果是零点五是保留一部分步数的,调整时候让画面更优质, 但是会增加深层的时间,一般是八步就合适了。我们在可立普文本编码器这里有个条件,点击条件,输入 l t s 条件,选这个条件,设置 正向条件连接正向,负向条件连接负向,在这个负面条件这里拖出来是 l t s。 二,选择这个标准化注意力引导,把负面条件连接上这个节点,就是连接负面条件的节点, 把这个模型连接上,在这个模型这里。 lts 彩样,选择这个彩样预览,这个的作用就是你在运行的时候开彩样器这里下面会有一个预览图像, 你可以用也可以不用。在这个预览图像这里有个模型被拖出来,输入制定彩样器, 如果你不使用这个节点,就在注意引导这里模型拖出来,选择是一样的,再给它删掉是一样的 这个字。精灵采药器有正面条件,负面条件, 把这个条件设置的正面条件和负面条件连接上 这个基础调度器,它有一个绿色的点,这点引采暖器也有一个绿色的点,把绿色点相连,它只能连接绿色的点,你去连接别的点,它是连接不上的,是对应的。 采暖器这里拖出来,选择开采暖器,选择选择这个采暖器 是电影采样器,这里还有一个输出口,我们输入 lts 音频,选择这个音频,视频分离 来一个画面,画面拖出来输入 ve, 我 们选这个 ve 剪码分块,这些都不用调整,把时间尺寸调整成最大,这个最大和默认六十四还有什么区别? 我们现在可以测试一下。把这个最大设置完后,我们可以看一下, 它中间会有闪,就在这里它中间会闪了一下,如果把这个分块解码调到最高, 它就不会出现这种情况,因为分块解码调到最高,它会一次性把这个降噪图片运行完成,你分小块运行,它会出现闪烁,我们可以在分块解码这里六十四选择最高,在图像这里戳出来输入选择锁影, 在缩影值这里零冒号减这里可以输入数字,我建议输入十,这个十代表的是时针, 比如这个视频我在后面输了十,就说这个视频运行完了之后,我会把后面的时针给裁剪掉,我看视频最后 它是定格住的,它和我们的原图保持着一致,如果不要这个节点把它屏蔽掉,那么运行运行完成之后,我们看一下这个视频, 可以看到在最后一针的时候很明显的卡顿崩坏的效果,所以说这个可以打开,如果你察觉不到的话,就不用管它, 一般输入十就好了。图像这里拖出来,这里输入创建, 有个创建视频,创建视频,有个视频,视频,这里选择保存视频格式,选择 mp 四, 上面是名字,在模型加载器的下方,这里输入 ve 加载,选择这个 ve 加载程序,上面这个是音频,下面这个输入视频, 在这个程序的下方输入加载,选择加载图像,图像有一个叉槽,这里输入第二,选这个图层工具框高笔缩放。第二, 在四英子里,我们选择裁剪倍数,输入三十二,缩放至边长,我们选择最长边,倍速幺二八零,这里有个图像插槽,点击图像插槽, 点击 s 视频,选择这个选择这个将图像转为视频的节点,它这有个一,我们选择这个二,然后增加一份,返回这里点一, 然后这里有个图像插槽,凸出来垂直缩放,选择这个图像缩放。缩放方法,这里选择这个固定宽高笔这里选择裁剪边数,这里除以三十二, 这里还有一个图像插槽,戳出来就是加在图像,可以看到这是一,这是二,那么这个代表手针,这个就代表尾针,所以说我们在这里要输入手针的图片, 那么这里要输入尾针的图片,输入完成之后,把它的宽和高连接上, 上面的宽比下面的宽比下面的高,然后在手针这里它的宽拨出来。悟空 lts 对 着这个重力显示屏,它的宽度和高度连接上, 现在连接它的时长在空白的地方数整数长量 复制一份,上面这个是帧数,上面这个是秒数。 帧数这里输入二十五秒数,这里输入五秒,因为我们要控制好多个节点,所以把它规划一下,在这个值这里,这里输入剪映预算 减一位数,复制一份。下面这个值连接到 a, 上面这个值连接到 b 到,我指这里输入 a, 然后下面指这里输入这个 a 乘 b, 加一, 下面这个输入成秒数,下面是帧率,把秒数的整数连接到时长。把 lincoln 连接到这个画面的 lincoln 上, 这个图像短视频有个 later, 点击它这里输入 ltsv 合并,选择合并为视频,这有个音频 later, 音频内存拖出来 ltsv 音频,选择音频空内存,音频空内存一个 v e, 一个帧数一个帧率, 把它移动到下面,把上面的帧率连接到帧率下面这个秒数连接到帧数,最后还有个 v a e, 这个,这个是音频 v a e, 这个视频 v a e。 把这两个连接上音频的连接,这是视频。 把这个合并为视频的 laten 拖上去,连接到自定义裁剪器这里, laten 连接上,把那个自定义裁剪器的种子,随便输入几个数字,然后选择固定 cf 句子一或者二都行。 自定义裁剪器这里一个音频分离。把音频这里拖出来,入 ltsv 音频的 v e 解码,把这个音频连接到创建视频这里现在有个视频 v e 和音频 v e 没有连接。 把这个音频连接上这个视频连接上创建视频这里还有个帧率, 这个 b a e 不 用连接,因为你可以不用它也行,这有个帧率,这个帧率。把帧率的浮点连接上, 再检查一下工作流,检查到没问题之后,在正向提示这里输入你的提示值,尽量输入中文,来测试一下这个工作流是否能运行, 运行成功,看一下用时三分钟,这是手针,这个是尾针,看一下这个视频,声音和画面都没有问题。

你这个阶级的人会极力阻止你刷到这条视频,因为他们不想让你知道 ai 已经发展成这个样子了。像这样的,首尾帧过度虚拟电子模特、一键室内设计、渲染等三三零加工作流都出自最近重磅更新的 comfy。 和那些满是套路的平台不同,本地一键即可启动, 无需排队,更不要模仿老规矩,验个牌试试,后面跟着实操教程学习吧!整套课程共分为两个部分,一到六节为基础部分,其中包含了 comfy 的 配置要求以及如何安装与部署 面导览与原理介绍文声图以及提示词的语法,之后还会聊聊 ai g c 的 相关网站以及模型下载,最后还有突声图以及高清修复的过程。那么从第七节课到第十三节课属于进阶部分,先后会讲解 cos 内及其诸多预处理器的使用方法以及使用场景,之后还会教大家 ipad pro 及其强大功能的应用。 最后我们还会学习最基础的 ai 视频生成原理,而在最后,我们将结合前面所学的全部知识,一起来做一个 ai 视频换脸、转会。这些这些这些都是 ai 生成的。 自二零二三年以来, ai 绘图软件 stupefaction 的 发展势不可挡,各种各样的衍生模型插件百花齐放,现如今生成像这样的 ai 视频完全不在话下。那么 我们就一起跟随着时代的脚步,一起探寻 stableview 的 康复 ui 到底该如何使用吧。大家所熟知的 web ui 和康复 ui 其实都是属于 stableview, 而 web ui 主要是基于规则库开发的浏览器界面,康复 ui 则是使用图形、节点、流程图设计和用于稳定扩散的用户界面。这边我们将康复 ui 和 web ui 的 优缺点列出来,方便大家做个对比。首先我们来看 web ui 和 web ui 的 优缺点列出来,方便大家做个对比。首先我们来看 ui 这块,它的优点是简单易学,并且操作较为基础与简易, 它的缺点是不利于长期管理。那么这是什么意思呢?当你在深度学习完 web ui 的 高阶内容后,你会意识到,如果使用的是康复 ui, 那 么将节省两到三倍甚至更多的时间。其次,在插件过多时, web ui 会显得非常的臃肿, 机操作费时。那么接下来我们看一下康菲 ui。 这边我们可以看到康菲 ui 对 配置的要求较低,这同时也意味着降低了 ai 绘画的门槛,方便更多的小伙伴加入进来。那么它的优点极致是节点更易于管理,有较强的自主性,我们可以根据个人需求来组装属于自己的工作流。 并且在未来,康菲 ui 将逐渐与微软在应用层面拉开距离。比如前段时间的 sd 三或者国产最新的克林大模型, 都是第一时间在康复 ui 里可搭建工作流并使用的。而对于 web ui, 这些最新的模型与插件往往得过一阵子才能失状,甚至直接不失状。所以使用康复 ui 也意味着你能够更早的使用到最新的模型与插件。而 康复 ui 的 缺点是初期不好上手,但我相信在你学完了本套课程后,一定能够完全掌握康复 ui 的 基础操作。除此之外,过去我们知道有许多软件,比如 blender、 达芬奇、 ue 等等都是使用节点式工作流, 因为他没有极强的自主心与可模块化,许多头部公司的顶级团队使用的都是节点式软件。那么康复以外,除了上述优点之外,我们在使用时还可以非常方便的套用他人分享的工作流,即刻便可实现相同的效果,节省了非常多的节点部署思路的思考时间 及从单个节点构建成工作游的部署时间。哈喽,各位小伙伴大家好,欢迎来到 cf ui 系列教程的第二节课。那么在本节课中,我们将介绍 cf ui 的 配置要求以及安装与部署的过程。那么首先是电脑配置以及系统环境的介绍。首先是显卡方面, 最低要求是拥有四 g 级以上显存的英伟达显卡,如果显存不足,可能会影响到绘图过程的流畅度。接下来是 cpu, 关于 cpu 要求不高,英特尔十代 i 三以上就可以使用,但推荐使用性能更强的,如英特尔十三代 i 五幺三六零零 kf, 以获得更好的性能。接下来是内存,内存至少需要十六 gb, 推荐三十个 gb 以上,以确保可以加载和运行较大的模型。最后是硬盘,关于硬盘呢,至少需要两百 g 的 空余空间,推荐使用大容量的固态硬盘,因为 ai 绘图过程中会下载和生成大量的模型以及图像数据。那么接下来我们详细介绍一下 comfuly 的 下载以及部署方式。 我们先安装资源包里面附带的启动器运行依赖,接着打开解压之后的 comfui 文件夹,在文件夹内找到被会式启动器,随后点击一键启动即可。锁匙启动时可能会安装一些必要的环境依赖。 稍等片刻后,我们便来到了 comfui 的 主界面。接下来介绍第二种安装方法,官网资源包的安装。当然关于官网的资源包,我们也可以在评论区内获取。我们解压完资源包后,在文件夹内找到这个项目, 双击运行,等待片刻后,我们便可以来到最原汁原味的康复 ui 界面了。这个版本的康复 ui 是 没有装任何非官网的插件的。 此外,康复 ui 完全离线工作,对 gpu 的 要求相对较低,但是也有 cpu 模式,不过在 cpu 模式下绘图速度极微缓慢。如果小伙伴们之前有使用过 vpi 或其他类型的 stupefaction ai 绘图应用, 都可以通过修改 comfui 的 配置文件来实现。在不同的 ai 绘图应用间共享大模型以及 logo 等等,依次减少对硬盘内存的占用,那么接下来我就向大家演示一下,如果将我们的 comfui 大 模型以及 logo 的 加载路径修改成 vibui 的, 如果小伙伴们没有玩火 vibui, 那 么这一段可以直接跳过。好的,那么我们打开 comfui, 接着我们找到这个文件, isht 打开。好的,那么打开之后我们找到这一项 basepass, 我们要做的是把 bash 后面的这一串改成我们 web ui 文件夹的路径。比方说我们打开了 web ui 的 文件夹后,我们可以单机上面的这个栏目,随后 ctrl c 复制。接着我们回到刚才的记事本内,将我们刚刚复制的路径粘贴到此处,随后我们保存并关闭记事本。接下来的一步很重要, 我们需要将 example 以及这个点给删除,也就是将我们的文件名后缀改成点 y a m l, 随后点击确定即可。那么接下来我们打开 comui 来确认一下。 好的,我们这边看一下 check point 加载器里面的大模型,点开后我们可以看到多了,非常多啊,那么这就证明我们成功把模型路径合并到了 vip ui 内。好的,那么以上就是关于本期的全部内容了, 欢迎来到 comfui 系列教程的第三节,那么在本节课中我们将一起了解 comfui 的 主界面以及各种参数到底代表了什么。最后我们将学习 stableview 生成图片的根本原理。好的,我们打开了奇威大佬的会使启动器后点击一键启动。 经过一段时间的等待后,我们便来到了 comforion 的 主界面。那么我们在面对 comforion 这个完全陌生的软件时,我们要做的就是初步了解每一个模块的大体含义。那么接下来我带着大家过一遍。首先是操作方式,我们可以通过鼠标的滚轮来控制画面的缩放, 按住鼠标左键,我们可以拖动我们的仕图。点击鼠标右键,我们可以看到有非常多的栏目,这边我们可以试着点击新建节点,随后我们可以看到有非常多的节点可以供我们选择。好的,那么之后我们再来说一下快捷键,顺从图片的快捷键是 ctrl 加 enter 框,选节点的快捷键是按住 ctrl 加鼠标的左键。移动框选目标的快捷键时,按住 shift 加鼠标的左键, 这边我们在框选完后,如果不按住 shift 直接进行拖动的话,我们可以看到此时只有单一节点进行了移动,剩下的快捷键我都放在这了,小伙伴们可以暂停观看。 好的,那么接下来我带着大家一起来解读一下这个默认工作流。首先在这边我们可以看到有个叫区块过滤加载器的东西,这个节点的主要作用是加载扩散模型,也就是我们常说的大模型。此外该节点还提供适当的 ve 以及 kf 模型,具体它们是什么我们带回讲。 我们顺着车控加载器的节点连线,可以看到这里有两个 clip 文本编码器,在这里我们可以看到它们的输入都是 clip, 和它们的输出都是条件。那么究竟什么是 clip 模型呢? clip 全称为 contrast language image programming, 是 由 open ai 公司在二零二一年发布的一款多模态与训练神经网络模型。 clip 模型的作用是理解我们输入文字的意思, 如我们输入弯钩生成的是一个女孩,而不是太阳,这就是 k 赋的作用。接着我们顺着 k 赋文本编码器的条件输出看过来,连接到了 k 采阳器上。这边我们可以看到 k 采阳器拥有两个关于条件的输入,一个是正面条件,另一个是负面条件,那么这代表着连接着正面条件的文本编码器内的提示词为正面条件提示词, 也就是我们常说的正向提示词,从里下面的则为负面条件提示词,也就是我们常说的负面提示词。好的,我们把目光重新回到 k 采阳器内, 我们可以看到除了正面条件以及负面条件外,还有两个输入,分别是模型以及 latent, 那 么模型则是连接着刚才的这个 pos 接收器,也就是我们的大模型。那么这个 latent 究竟是什么意思呢? latent 通常是指前空间,可以理解为 stability function 内部流程中的图像格式。如果将图像作为输入,则需要通过 v a e 编码将其转化为 latent 数据。在最后输出时,也需要通过 v a e 解码将其转化为像素工具,也就是我们最终看到的图像。这边我们可以看到 k 才阳气的 latent 连接着一个叫做空 latent 的 节点,这个节点内共有三个参数, 分别是宽度、高度以及 p 四大小。宽度和高度决定了我们最终生成图像的尺寸,而 p 四大小则代表着每生成一次将出多少张图。比如说我们将 p 四大小改为三,高度改成七百六十八。 最后我们按 ctrl 加 enter 进行生成。好的这边我们可以看到一次性生成了三张图像,也就是我们 p 四数目的图像。接下来我们继续看 gaussian 的 其他参数。 首先是随机种,随机种的值我们一般称为种子值,每张图都有专属于它的种子值,我们也可以理解为种子值,就是图片的 id 号码。接下来是运行后操作,点开后我们可以看到用了四个选项,分别是固定、增加、减少以及随机。如果选择固定,则在你生成完后种子值会保持不变, 方便你进行其他的调整与操作。那么接下来就是采样部署,采样步数越多,计算器的运转时间越长。在大多数的情况下,我们的采样步数该值的意思是及时引导系数。 cf 句子越高则代表着生成图像与提示词之间的联系越紧密。 cf 句子越低,则代表着提示词对生成结果的影响越小。不过过高或过低的 cf 句子都会给图片带来不好的影响, 所以我们一般保持适中的 c f 锯齿即可。接下来是采暖器和调度器,我们可以理解它们为图像的生成方式。如果我们将其他参数比作是食材,那么它们则是烹饪方式。不同的烹饪方法当然会带来不一样的结果。比如我们点开采暖器后,可以看到有非常多的选项,这里我们目前最好的一般是选择这个 d p n 加二样或者 d p n 加二样 s d e 这两个都是挺不错的。接下来点开调度器,我们也是可以看到有非常多的选项,这里我们一般选择的是 chaos。 最后我们可以看到还有个降噪参数,由于该参数是跟图生图有关的,我们以后再说。接下来我们看一下右边有个叫做 v e 解码的东西,那么我们可以看到这边也有两个输入,分别是 lateen 以及 v e late 刚才我们已经解释过了,也就是晴空间图像。那么物业 e 究竟是什么呢?物业 e 全称变分字编码器 blake 宣布 autodrill 的 缩写,它是一种深度学习模型,主要用于无间断学习任务,特别是在生成模型领域。物业 e 结合了神经网络和概率图模型的特点,而它在康复以外的作用是将我们的晴空间图像编码成像素空间图像, 或是将像素空间图像编码成晴空间图像。除此之外,我们还可以双击屏幕上的空白处,随后就可以搜索节点,比如说搜索加载图像, 或者我们也可以双击搜索预览图像。这边再多说一嘴 v a e。 解码之后的图像节点,我们也可以直接连接到预览图像上, 比如说我们现在把这个保存图像节点给删去,如果这么操作的话,那么我们生成的图像不会被保存,接着我们再生成一次。这边还要注意的一点是,在我们搜索节点的时候,我们也可以输入英文,比如说加载图像的话,那么就是 load image, 那么我们可以看到这两个节点是完全相同的。接着我们再来说一下,比如说当我们输入英文的时候,同样的也是 load image, 但是这个时候我们加了一个空格,好,我们可以看到 这里面并没有出现加载图像的节点,那么这也意味着在我们搜索节点的时候,我们要注意区分节点的名称是否有空格好,比如说我们需要搜索加载图像节点,那么我们删除 load image 之间的空格时候,我们可以看到,哎, 是不是加载图像节点就出现了?好的,那么以上就是关于默认工作流的全部解释,接下来我们来看下界面还有其他哪些模块。首先我们点击左上角,这里有个文件夹, 点开后我们可以看到我们的工作流都保存在这,这边可以点击新建,那么我们就新建了一个新的工作流,当然我们也可以点击这个 import, 也就是输入我们的工作流,或者说是输入我们的文件夹。 最后我们点击 models, 我 们可以在这里找到并且下载相关的模型。接着我们来看一下右边的栏目,首先是该栏目的左上角,我们按住后可以进行拖动, 然后是这个齿轮标志,点开后我们便来到了 ctrl u i 的 设置界面,在这里我们可以设置语言,点开后我们可以看到有中文,繁体中文,英语以及日语韩语等等。我们往上翻可以看到有其他的功能,比如图像面板顺序,图像面板的位置等等等等。我们往下看,这有个文本补全,这个 enable 我 们一定要勾选上,这代表着它的起用。 文本补全的意思就是在我们输入提示词的时候,会有这些英文短语的提示,我们往下看,有个添加提示词对列,这个是生成的意思。 接下来我们可以看到一个保存的选项,点击该按钮,我们并可以保存当前的工作流以及加载,那么就是加载工作流,同样的意思。接着是重刷新,比如说我们下载一个新的大模型之后,那么我们点击重刷新便可使用。接下来还有个重点就是管理器,这个是 com 文档里面最重要的节点,点开后我们可以看到非常多的功能, 比如说这边有数据库以及频道方式,预览方法,表情等等等。这边预览方法我们一般选择的是名称 也是标签,名称选择了之后,我们可以看到节点的右上方一般会出现一个小狐狸按钮,而小狐狸按钮则代表了的是它是官方节点。比如说我们加载一个新节点,那么我们可以看到该节点是属于 any money 贝贝拉克节点组的。接着我们回到管理器第 六个 cosmo 编辑,点开后,我们可以看到有非常多的节点,在这里我们可以查找以及安装我们想要的任意一个节点。在今后的学习过程中,我们会频繁使用到这一个模块, 接着我们看到 model 命令诀,在这里我们可以安装我们想要的任意一个模型,注意模型不是节点,他们是分开来的。至于干模块,我们今后也会频繁的用到好的。在接受完康复以外的逐阶面以及各种参数后,我们来了解一下 cbd 的 内在运行原理,就可以方便我们理解并掌握进一步的学习内容。 在我们输入完体数词之后,文本编码器的 get 模型会将体数词转化为特殊向量,然后再由业 e 编码器将这些特殊向量 翻入到前空间内,这些特征向量在前空间内不断的降噪,最后再由 ve 解码其将这些经过降噪之后的特征向量解码成由一个个像素所组成的图片。好的,那么以上就是本期的全部内容了, 哈喽大家好,欢迎来到 comfui 系列教程的第四节课,那么本节课我们将一起学习纹身图的相关知识 以及体式词的语法。在第三节课的结尾,我们一起学习的 stable fusion com for ui 的 技术工作原理。那么现在我将结合默认的文胸图工作流来讲解其中的工作流程。首先第一步,在我们输入完正负象体式词后,文本被码期内的 clip 模型会将我们的体式词转换为特征向量输送到 k 彩阳期内。 我这边有个疑问,就是文本编码器的克利普模型从哪来呢?我们顺着这个节点往下看,可以看到它来自于 jiffy 加载器,而这个加载器主要是加载各种各样的大模型,也就是说文本编码器内的克利普模型是属于各个大模型的内置克利普模型,而不同的大模型之间,克利普模型也可能会有所差异。 那么接着我们可以看到这块加载器的输出有个 ve, 那 么也就是说他提供了 ve 模型,我们看看连到哪哦,连到了 ve 解码这里,而 ve 解码的作用就是将 k 太阳器内经过了降噪之后的前空间图像解码成像素空间的图像,也就是我们肉眼可以看到的图像。这边我们可以做个实验,先将种子组固定,最后断开 ve 的 连接, 然后我们生成,我们可以看到这边是直接报错了,而这个报错的意思是缺少了 ve 的 输入,那么接下来我们重新将 ve 模型给连上, 随后开始生成。这边再提一嘴,生成的快捷键是 ctrl 加 enter, 非常的实用,请牢记。如果说你想调节生成图片的尺寸,那么我们可以在空内存这里, 比如说我们将高度调成七百六十八,所以这个数字一定是八的倍数,宽度也一样,这一批次的话则是控制单次生成的图片数量,比如说我们设置成二好的,我们摁 ctrl 加 enter 开始生成 图片,生成后,我们是不是可以看到他的比例已经成功变成了竖屏的比例,并且他一次生成了两张图像?好,接下来我们一起学习提速词的相关语法。首先我们来聊聊书写规范, 不论是正向提速词或者是副向提速词,我们在书写的时候一定是英文以及英文的标点符号,不然系统可能会识别错误。比如我们输入 one go 嘎等, 还有 yellow dress, 黄色的裙子。这边再提一嘴,生成的快捷键是 ctrl 加 enter。 好 的,我们得到了一个穿着黄色裙子在花园中漫步女孩的图片。那如果说我们用中文来输入,结果会是什么样呢?一个女孩花园以及黄色的裙子, 我们这边可以看到,不能说是毫无关联吧啊,他们至少图片中都有女孩,但是黄色的裙子以及花园很明显没有在图片中出现。接下来我们来讲一讲提述词的权重。在做之前,首先我们要理解什么是权重。对于权重概念模糊的小伙伴,我们可以理解权重就是比重 分量,那么一个提词尺的权重越高,它的分量就越高,它的比重就越高,它在整体中的地位就越高。比如现在一个提词尺的权重是一点二,而另一个提词尺的权重是零点九,那么当然是一点二的提词尺会占更大的比重。 那么接下来我们做个演示,比方说我们输入 one go golden one go 的 权重是一点二,而该等的权重是零点八,那么画面会更侧重于 one go 的 展现。那如果说我们 one go 的 比重是零点八,而该等的比重是一点二,那么画面会更注重于描述花园是怎么怎么样的。 好的,接下来我们来讲一讲我们该怎么去控制提速词的权重。首先是重括号,重括号代表着零点九倍的权重,也就是说给提示词加上中括号后,提速词的比重会变小,会降低它的重要性。 接下来是小括号,小括号代表着一点一倍的权重,比如我们给一个体式词加上小括号后,那么该体式词在画面中的比重就会增高。最后是大括号,大括号代表着一点零五倍的权重,算是一种微调。当我们给某位体式词听这两个中括号时,那么就相当于为这个体式词加上了零点九乘以 零点九倍的权重。零点九乘以零点八一,那么就相当于给这个体式词加上了零点八一倍的权重。那么同样的,当我们给个体数词加上两个小括号时, 那就等于一点一乘以一点一倍的权重,那也就是一点二一,相当于我们给这个体式词加上了一点二一倍的权重。大括号语,同理,那么有的同学可能会问,关于这个权重的变化有没有什么快捷键呢?哎,这个还真有。比如我们将光标移动到某一体式词上时, 打个比方说,该的按住 ctrl 加上键,那么就是给他加权重,我们可以看到他的权重在不断的增加,那么 ctrl 加下键,那么就是减少他的权重,是不是很方便呢? 不过我们要补充的一点是,关于权重,我们要多低都行,但是不可过高,因为过高的话,图片就会过拟合,换句话说,图片就会变形,会 失真。接下来我们来讲短句和长句。我相信不少小伙伴都有这么一个疑问,为什么我解提示词的时候一定是一个一个词这样去听写, 而不是用一句话去描述我们想要生成的内容呢?那么这边我可以很明确的回答你,其实两种都行,但是就目前而言, 用一个一个的词组据生成,效果会更加的准确,更能表达出我们提示词独含的意思。另外一点,使用一个一个的词的时候,也方便我们进行权重的调整。比如刚才我们有提到,将光标放在某一提示词上, 按住 ctrl 加上或下就可以调整该题词的权重。那么如果说这一句话的话,你想调整某一题词词,那么可能就得着重去除括号,进行相关的权重调整。而当然现在全世界的 a i g c 从业者也在不断的去研究该怎么样让自然语言,也就是我们的长句能达到媲美短句的效果。接下来我们来讲一讲 提示词的整体长度。这么要注意,比如我们在输入正向提示词的时候,并不是说越多就越好,多可能会让你的表现更加糟糕。那么我们最好把提示词控制在什么数量之内会效果最佳呢?经过众多 a i g c 玩家的经验以及研究表明,提示词控制在七十五个之内 是效果最精准的,超过了七十五个提示词的话,可能会对提示词的识别不精准,整体的表现会降低。正向提示词如此反向提示词也是一样的,记住最好不要超过七十五个。 接下来我们来讲一讲骑手势,那么什么是骑手势呢?在 stable dev 选各个大模型训练的过程中,会加入许多的,比如四 k, 八 k 或者 masterpiece 各种各样高质量的图形去训练。 那么当我们在输入提示词的时候,比方说输入四 k masterpiece, 那 么就可以使我们生成的图像更加的精美。反向提示词的话,那么就相反,比如我们输入模糊 字纹,不想要模糊吗?那么相当于也是会让图片变得更加的清晰。或者说我们在反向提示词内输入文字 text, 那 么在画面中就会减少文字的出现。这边我们可以来看一下这几组的对比,差异还是很明显的。 接下来我们来讲讲提速词的顺序,或许有小伙伴会有疑问,以为提速词在整体的前部或者是在整体的后部会有什么影响吗?答案是会有影响,在一组提示词中,约靠前的提示词权重会有所增加。那么在我们书写提示词的时候,我们尽量按如下格式进行书写, 首先是书写那些可以提升画质的,或者说可以改变画风的些词汇,比如 masterpiece, high quality, high detail s 这些词汇。第二步是描述我们画面的主体,比如我们可以说 one girl rougeous, 一个女孩,蓝色的裙子。那么第三步就是描写环境,场景,灯光或者说构图,比如我们可以说 ungarden 背景吧该等,或者说是 white background, 白色的背景,或者说是 soft light 柔和的灯光类似于这些。那么最后我们可以在这项提示词的结尾添上我们想要加的 laura, 关于 laura 和各种模型的下载,我上期视频也有介绍,感兴趣的小伙伴可以回去观看。接下来我们来讲一讲提出词污染。那首先我们要知道 什么是提示词污染。我们可以看一下这一组图片,未经处理时,在多个提述词同时书写的情况下,各个提述词的意思可能会相互渗透。那么为了避免这种情况,我们可以用 break 来隔开提述词, 尤其是防止颜色污染。之后我们来聊聊提述词融合。比如我们写 one girl, kid 这边我们可以看到生成了一张猫在女孩身上的图片。好的,现在我们在 one girl 和 kid 之间添加上 end, 所以这里的 end 必须是大写,全部大写。这边我们可以看到生成了一张猫粮的图片,这个 end 的 作用就是将两个提示词融合在一起。同样的,下划线也有和 end 类似的作用,也是将两个提示词结合在一块。 除此之外,隔一组提示词用中括号括起来,中间再用竖线隔开,也有类似与融合的效果。那么这个的原理是,第一步画前面的关键词,第二步画后面的关键词,以此类推。最后我们来讲一下控制生成的时间段, 比方说现在的叠带步数是二十步,在这过程中,我想让前百分之三十生成森林,后面百分之七十生成一个女孩。那么我们可以试着这么书写大括号, boris 在 街上冒好 one girl 在 街上冒好零点三,最后以大括号结尾。那么这一长串 代表着是在百分之三十的时候叠数画 boris, 开始画 one girl。 那 么如果说我们把零点三改成零点七,那么意思就是前百分之七十画 boris, 后面百分之三十画 one girl。 好 的,那么以上就是本期的所有内容了。

ai 慢剧赛道的大结局终于来了, comfy 这个工作流的出现直接宣布了比赛结束,只需把小说丢进这里,大模型就能自动接管一切推理剧情,生成脚本,无需去研究任何复杂的提示词,也无需书写智能分镜指令,它能直接生成连贯的电影级分镜剧本。最关键的是,它彻底解决了人物一致 性的千古难题,一键生成人物三式图、场景以及道具,让主角从片头到片尾长得一模一样,还能一键使用任何想要的画风,古风、赛璐璐、国风三 d 日系动漫全部应有尽有,无须复杂操作,无需专业基础,彻底解决 ai 千古难题。就算是小白也能制作出像这样的大片效果,相关资源也能制作出 像这样的大片效果,相关资源也按合规方式准备。 欢迎来到我们的 comfy 视频生成系列课程,我们将学习使用 comfy 进行视频生成的相关技巧。那么这节视频呢?我们开始来介绍我们六种视频生成方式的第一个,纹身视频。那么纹身视频呢?在我们日常使用当中并不多,但是也值得尝试一下, 那么这款工作流是我认为最实用最方便的一款纹身视频工作流。那么首先,为什么说这个是最实用的纹身视频工作流呢?因为这个工作流非常的简洁, 没有什么多余的节点,所以说他容易上手。其次,他对于我们的显存要求非常低,即便是我们那些硬件没有那么好的同学们,也可以来进行一个深层来感受一下纹身视频的快乐。 整体就是这些节点,其实这个节点跟我们的最基本的纹身图非常的相似,这个主要就是因为我们使用的是卧英文模型, 就是简单来说它将我们的模型颗粒维 e, 甚至包括我们的加速方式,我们平时经常使用的加速 lora 也集成到这个模型里面了, 这样子就省去了很多多余的步骤,我们可以直接只使用这一个模型来进行生成,就是一个这么意思。 我们来看一下具体一个使用体验,我输入了一个现代女性在博物馆拿手机拍照,得到了一个这样的结果,整体的效果还是不错的。至于他为什么是一个外国人,是因为我们默认是生成外国人,当然你可以自己在提示词里面书写, 比如说亚洲人、中国人这样子我们来具体看一下工作流中有哪些需要我们注意到的地方。首先就是我们使用的模型,我们选择的是 t 二 v, 也就是纹身视频模型 rap 代表我们使用的是加速模式, ai o 指的就是 y and y 模型,后面的是它的版本型号。我们来到了提示词部分,副象提示词不需要填写什么,我们主要是在正向提示词当中填写我们想要让画面出现的内容, 然后就到了我们的一个视频生成尺寸,这里面大家可以自己来设置, 其中注意我们的长度指的就是我们的视频生成时长,我们还要结合后面的这个帧率来进行一个考虑。将这些节点连接好之后,我们直接在 k 彩样器当中连接上这些条件,然后输出我们的 latent, 然后通过我们的解码器最后生成我们的视频,其中注意帧率,这里面建议是十八或者二十四,因为这样子至少能够保证视频是一个流畅的感觉。 至于视频时长则是我们的八十一,除以一十八,因为帧率指的就是一秒钟有多少张图片的意思,那么最后就会生成这样的结果。那么我这边生产总共花了一百四十七秒,也就是两分来钟,速度还是非常快的,那么也推荐大家去使用这款工作流。

大家好,我是香酥幻想,今天给大家带来一个投身视频和收尾征的视频工作,有何解? 用到的模型就是这个肥猴大佬的 remax 三点零,这个模型我测试下来,不管是从它的动态以及提日词遵循度来讲,这效果都非常棒。 因为这个大模型里面它也融合了那个 v b v r, 所以 它生成的视频它动效会更加符合真实的物理逻辑。听肥牛大佬讲,这个三点零应该就是这个模型的最后一版了,所以如果 y 二点二系列的模型后面再没有其他大佬更新的话,那这个模型应该算是一个完美的收官之作了。 今天的工作流很简单啊,就是常规的万二点二的视频工作流啊,只不过就这两个节点,不是官方的,用的是这个绘画小子大佬开发的这个节点,这个具体有什么作用,后面会跟大家讲。除了这个工作流讲解之外,再跟大家说一下手尾针的玩法。 收尾蒸这个东西其实不算什么新鲜的,但是我考虑到看我视频的小伙伴有很多都是才接触咖啡源,这个东西对他们来讲还是有点难度,所以这期视频就把这个收尾蒸的玩法也跟大家再说一下。包括这个视频开头展示安利的所有的提示词都会跟大家分享, 同时这个工作流我也部署到了 rng 汉堡。 rng 汉堡也是我平时常用的在线云平台,比如说像这期视频开头的展示案例,因为我需要跑七二零分辨率的,我本地电脑跑不了,所以这些案例都是在 rng 汉堡跑的,在 rng 汉堡我们就可以跑更高的分辨率,更高的帧率,更多的步数,所以它生成的视频质量肯定也比我本地跑出来的要好。 如果你电脑配置不好,可以到 rng 汉堡来玩,现在通过视频下方的链接注册会免费送一千点, rh 每天登录也会送一百点。 好了,咱们再回到本地,从头开始看一下这个工作流,咱们还是分块来讲啊。首先这一块就是模型加载和参数设置,模型加载就是万二点二的常规的高低噪,上面这个是高噪模型,下面这个是低噪模型。 这四个绿色的就是 k g 的 加速节点,用到了 c 者泰森,如果你运行的时候 c 者泰森报错,你可以把这四个节点选中之后 ctrl b 给它屏蔽掉,一样能生成啊。就是速度稍微慢一点,然后到这边把它放进这个 set 节点,就是发送我们到后面再接收, 用这个节点的目的就是省得让这个连线显得太乱。下面这个 d 燥模型是一样的,一个就是这种 um 点二的叉叉 l 的, 还有一种是 k g 的 工作流专用的就是这个 e n c 的, 这个是官方工作流,所以我们要用这个,经常有人因为选错这个模型报错。 ve 就是 二点一,二点二通用的这个 ve, 这个没什么可多讲的,下面这个就是分辨率,四八零八三二, 这个是宽,这个是高,这里这个就是总部数,这个是分布数,具体是怎么用的,后面讲到采暖器的时候会跟大家说。 然后这个就是总帧数,这个是帧率,这里还需要多提一嘴,因为万二点二的视频官方推荐的时长就是五秒,这个视频时长是不需要你去写的,它是通过这两个值来计算的, 总真数是八十一,真真率是十六就是十六,乘以五加一就是八十一。如果你想要真率高一点,比如说二十四,你上面的总真数就要改成一百二十一就是二十四乘五加一就是一百二十一,如果你要改真数和真率,你就在这改就行了。 然后就是图声视频这边上传图片,这里接的是图像缩放,我们把这边设置的宽和高,从这接收之后给他放到这里,然后再把这个图传给吉尼斯小助手。用的反推规则就是图像到视频,这个规则 在这里你可以写你的额外要求,也可以不用写在这你什么都不用写,他经过这个节点反推之后,他就会给你生成一段这个视频提示词,如果你对这个视频的生成有什么要求,你这里可以自己写上,你在这里写上之后,他这里反推出来的提示词就会根据你这个要求来。 我们来看一下,我这边写的是镜头后拉女人往前走,那这边的提示词就是镜头往后拉,然后女性从静止状态开始向前行走。所以这个提示词如果你有具体的要求,你可以在这里写,如果要是没有的话,就直接让他生成, 生成数学题词词词,把它接到这里,看清楚这个线是接的这个文本框的,这里要说一下,当这个文本框这里接的线的时候,这里面所有的内容都是不生效的,同时也是不能编辑的,也就是说如果你要自己写题词词,你可以把这个线给他断掉,然后到这里去写题词词, 然后就视频开头讲到的这个节点,用这个节点替换了这个,替换了这个头像到视频的这个官方节点,这个节点的作用就是可以让视频的动态效果更好。我们可以看一下这个插件的说明,这里都有作者的对比,这个是官方的节点,这个是他自己的节点,你看这个效果,这对比就很明显,对吧? 然后这里这个数值作者也有推荐,这下面也有这个使用技巧,每次增加或减少零点零五,最大可以增加到一点四,然后就到踩样节点,踩样前面的这个是高噪,这个是低噪,总部署和分布数接受过了之后就同时传到这个地方。 我们前面设置的总部数是六,分布数是二,意思就是高噪这边从零开始跑到第二步结束,剩下的四步就是由低噪来完成, 然后下面就是首尾针了,首尾针其他的这些设置都是跟上面一样的,只不过这里需要传两张图片,这个是首针图,这个是尾针图。 我们依然是用这个节点替代了官方的这个节点。嗯,他的输入输出都是一样的,只不过这里增加了一个动态增强的数值, 到时候这两个插件的链接我都会放到视频页去,大家如果没有的话,自己安装一下就行了,好吧?然后我们来聊一下手尾针。手尾针这个东西说难也难,说简单也简单,他其实挺考验大模型能力的,就比如说我上传这两张图, 他主体都是一个女孩,我这里提示词什么都没写,就直接让他生成的,就能达到这种效果, 你看他这个过渡还是挺丝滑的,对吧?但是如果你手针和尾针差异巨大,就是没有任何关联的话,就像视频开头展示的案例那样,从一个城市到另外一个城市,那就需要通过提示词去告诉大模型怎么来完成转场。 如果那种差异巨大的首尾人,你不写题时词的话,他大模型他也会偷懒,他就直接给你硬切。其实这个片头展示案例我也抽了蛮多次卡的,我们可以看一下 ryan 汉堡的记录,你看如果你题时词写的不好,他就会这样, 你看还有这些硬切导致这个效果的原因有两个,一个就是提示词的原因,还有一个就是时长不够,如果你提示词写的相当复杂,他在这个五秒的区间,他完成不了这么多,过度他就会硬切。所以我说提示词你要写的不好的话,大模型也会偷懒,就这个原因, 当你的首尾针图有关联的时候,比如说你用这张图去做一系列分镜,最起码他这个主体保持一致的话,他首尾针过渡就会非常丝滑。 如果是像开头展示案例这种差异巨大的,就只能通过运镜的方式去完成这个转场。下面我们看一下模拟无人机飞行的这个视频是怎么做的。首先第一步用这段提示词,然后他就会给你生成这样的分镜提示词。 这个提示词生成好了之后,我是用吉梦生的图啊,因为涉及到一些地名啊,包括这些知名建筑啊,就用吉梦啊,然后 nintendo 生成的图会更加好一些,把这些图生成好了之后,选出符合你自己要求的,然后我们上传到这个手尾针工作流手针尾针 第一段就是这两张,这个是手针,这个是尾针。第二段这个是手针,这个是尾针。然后第三段这个是手针,这个是尾针,就这么串联起来,我们再放到剪映里面,给他拼到一起,再稍微做一下微调,这个视频就搞定了。 然后就是这个提示词了,这个提示词其实也就是给你一个大概的参考,具体生成的效果怎么样,还得你自己去测试抽卡。关于提示词这块,我还给大家提供了两个方案, 一个就是用豆包,你把这段提示词发给他之后,你再把你的首尾针图在这里点击上传,然后告诉他第一张手针,第二张尾针,然后他就会给你出来这样的提示词。 还有一种就是直接用这个可否幽暗里面的反推让你看,我接的就是这个节点一样的,这里用到的规则也是刚才发给豆包的这个,只不过结尾这做了个修改,就是直接让他输入提示词,不需要额外的任何说明的内容和文字,这个提示词 你可以用他给你的这些提示词,也可以用这种方式去生成。这里我是用豆包的,你也可以用 excel、 gpt 啊之类的都可以, 要么就直接在 copy 源里面调用这个视觉模型,让他给你反馈这个七十次。这些分段的视频生成好了之后,你把它放到剪映里面,按顺序给他排列一下,加一个变速之类的,找一个合适的音乐,就能实现这种一镜到底的效果。 这里有个小技巧跟大家说一下,就是你两段视频拖进来之后,他这个第一段的结尾跟第二段的开头这一块一般都会有那么一到两针的溶于针,你需要手动把这个溶于针给他删掉,这样他过渡的时候就没有那种刹车感。 视频剪辑这块基本上就这点东西,其实说给人视频最难的就是做图,只要你的图做的好,你写不写提示词他都能有不错的效果。因为我着急发视频,所以这些图我也没有专门去研究,生成之后我就随便选了几张,就测试了几段之后,我感觉,哎,这个模型确实还不错。 然后就是工作流啊,我们可以看一下软件汉堡跟本地这边是直接接了个大模型的反推,本地这里我是没有接, 如果你在本地玩的话,我还是更推荐你单独的用其他的 ai 去生成,生成好了之后粘贴到这,根据你自己的想法再修改一下,直接去跑,这样的话会更好一些。但是说你看过这篇,你要想写提示词的话也没有问题, 你把这个线断掉之后,把这俩节点给他 ctrl b 屏蔽掉,你这里就可以写提示词了。那今天视频到这里就结束了,我们最后再看一下网盘,网盘里面应该没什么东西,就三个文件夹, 这俩大模型,这个就是可立幅模型,然后这个是 v 一, 你需要注意的就是大模型这块高低燥不要放反了,上面是高燥,下面是低燥,然后这个可立幅模型注意选对,其他就没什么了。大家后面有什么问题给我发私信留言,或者加我的交流分享群,我是像素幻想,咱们下期再见。

二零二六年了,所有人都在说 ai 时代已经到来,但核心软件康复又爱最重要的东西,却没人教你,软件在拿下操作,有哪些模型装在哪?衣服怎么换?接下来我将会带你从下载安装开始到 ai 声图,再介绍六款常用的 ai 视频工作流,让你看完就可以产出第一个作品。 ai 升图点一下就好,生成视频也是输入提示词上传参考,然后点一下的事,不烧积分,更不用排队。所有运行均在本地,想生成什么就生成什么,搞创作的验验牌。 话不多说,开始教程将介绍 comrade 的 配置要求以及安装与部署的过程。那么首先是电脑配置以及系统环境的介绍。首先是显卡方面,最低要求是拥有四 g 级以上显存的英伟达显卡, 如果显存不足,可能会影响到绘图过程的流畅度。接下来是 cpu, 关于 cpu 要求不高,英特尔十代 i 三以上就可以使用,但推荐使用性能更强的,如英特尔十三代 i 五幺三六零零 kf, 以获得更好的性能。接下来是内存,内存至少需要十六 gb, 推荐三十二 gb 以上,以确保可以加载和运行较大的模型。最后是硬盘,关于硬盘呢,至少需要两百 g 的 空余空间, 建议使用大容量的固态硬盘,因为 ai 绘图过程中会下载和生成大量的模型以及图像数据。那么接下来我们详细介绍一下 call ui 的 下载以及部署方式。在文件夹内找到 a 会式启动器,随后点击一键启动即可。 首次启动时可能会安装一些必要的环境依赖。稍等片刻后,我们便来到了 comui 的 主界面。此外, control ui 完全离线工作,对 gpu 的 要求相对较低,但是也有 cpu 模式,不过在 cpu 模式下 绘图速度较为缓慢。如果小伙伴们之前有使用过 y b u i 或其他类型的 stable fusion ai 绘图应用,那么可以通过修改 control ui 的 配置文件来实现在不同的 ai 绘图应用间共享大模型以及 loa 等等,以此减少对硬盘内存的占用。那么接下来我将向大家演示一下 如何将我们的 kui 大 模型以及 loa 的 加载路径修改成 y b u i 等。如果小伙伴们没有玩过 y b u i, 那 么这一段可以直接跳过。好的,那么我们打开 comui, 接着我们找到这个文件 extra model path y a m l 点 example, 接着我们用记事本打开。好的,那么打开之后我们找到这一项 base path, 我 们要做的是把 base path 后面的这一串改成我们 y b y 文件夹的路径。比方说我们打开了 y b y 的 文件夹后,我们可以单机上面的这个栏目, 随后 ctrl c 复制。接着我们回到刚才的记事本内,将我们刚刚复制的路径粘贴到此处,随后我们保存并关闭记事本。接下来的一步很重要,我们需要将 example 以及这个点给删除,也就是将我们的文件名后缀改成点 y a m l, 随后点击确定即可。那么接下来我们打开 ctrl y 来确认一下。 好的,我们这边看一下 checkpoint 加载器里面的大模型,点开后我们可以看到多了,非常多啊,那么这就证明我们成功把模型路径合并到了 web ui, 那 么接下来欢迎欢迎到我们的康复与 i 视频生成系列课程,我们将学习使用康复与 i 进行视频生成的相关技巧。 那么这节视频呢,我们开始来介绍我们六种视频生成方式的第一个纹身视频,那么纹身视频呢,在我们日常使用当中并不多,但是呢也值得尝试一下,那么这款工作流是我认为最实用 最方便的一款纹身视频工作流。那么首先为什么说这个是最实用的纹身视频工作流呢?因为这个工作流非常的简洁, 没有什么多余的节点,所以说他容易上手。其次呢,他对于我们的显存要求非常低,即便是我们那些硬件没有那么好的同学们,也可以来进行一个生成, 来感受一下纹身视频的快乐。那么整体呢就是这些节点,其实这个节点跟我们的最些本的纹身图非常的相似,这个主要就是因为我们使用的是 v n v 模型,就是简单来说,他将我们的模型具类为, 甚至包括我们的加速方式,就是我们平时经常使用的加速 word 也集成到这个模型里面了,这样子呢就省去了很多多余的步骤,我们可以直接只使用这一个模型呢来进行生成,就是一个这么意思。 然后就是我们来看一下具体一个使用体验,那么我输入了一个现代女性在博物馆拿手机拍照,然后呢得到了一个这样的结果,整体的效果还是不错的。那么至于他为什么是一个外国人,是因为我们默认是深沉外国人,当然你可以自己在提示词里面书写, 比如说亚洲人,中国人,这样子我们来具体看一下工作流中有哪些需要我们注意到的地方,那么首先呢就是我们使用的模型,对吧?我们选择的是 t to v, 也就是纹身视频模型,然后 rap 代表我们使用的是加速模式, a i o 指的就是 y n y 模型,后面的是它的版本型号。然后呢我们来到了提示词部分, 副向提示词不需要填写什么,然后我们主要是在正向提示词当中填写我们想要让画面出现的内容, 然后就到了我们的一个是视频生成尺寸,这里面大家可以自己来设置 集中注意啊,我们的长度指的就是我们的视频生成时长,我们还要结合后面的这个帧率来进行一个考虑,然后将这些节点连接好。之后呢,我们直接在开强器当中呢,连接上这些条件,然后输出我们的 later, 然后通过我们的解码器,最后生成我们的视频。其中注意帧率这里面建议是十八或者二十四,因为这样子至少能够保证视频是一个流畅的感觉。至于视频时长则是我们的八十一,然后除以一十八,因为帧率指的就是一秒钟有多少张图片的意思呢? 那么最后就会生成这样的结果,那么我这边生成呢,总共花了一百四十七秒,也就是两分来钟,其实这款是非常快的,那么也推荐大家呢去使用这款工作流,然后像这个视频里面所需要的一些模型内容,我都已经在网盘里面整理好, 你打开进去之后呢,会发现有我们的工作流,包括我们的模型,一个是我们的正常模型,然后另外一个则是我们的 n s f w 模型,那么根据大家的需求来, 然后就是这个视觉模型,按照我上面的提示,然后放进去即可,那么这个视频就到这里了,我们下个视频见,拜拜。欢迎来到我们的 comfy 视频生成系列课程,我们将学习使用 comfy 进行视频生成的相关技巧。 哈喽,大家好,那么今天这节课我们继续来学习我们六种视频生成方式之中的第二种,图声视频, 那么这种生成视频的方式呢,也是目前最常见最实用的,那么 up 主这里也给大家带来了一种我目前最推荐的一种生成方式,一个是因为它的生成速快,其次呢就是节点简单,易于操作, 尤其对于我们新手入门的小伙伴们来说,更是如虎添翼。那么话不多说,我们来看一看这个工作流到底是怎么样的。那么像这里面我们导入进去了一张图片,是一个女生,然后在他的房间里面, 我们提供一段提示词,为让画面中的女人转起来,那么整体来说运镜动作是非常流畅的,没有明显的卡顿,然后动作的幅度也是比较大的, 个人认为这样的效果已经是比较好的。那么我们来看一下这个是怎么来运行的吧,这样我们把生成的视频关掉,然后看一下工作流。首先在模型上的选择,我们要选择我们的望爱奇艺模型,也就是图声视频, 然后这个是我们的无优化模型,和上一个视频当中提到的纹身视频是同一类型的模型,当然他也有我们的 n、 s、 f w 模型,那么可供大家选择。 然后这是两个提示词,然后负面提示词和正向提示词,我们只需要在正向提示词当中输入我们想要画面呈现出来的内容,然后在下方的加载图像,这里面上传。我们想要生成视频的图像, 那么他会通过一个图像缩放节点呢进行缩放,因为有时候我们的图像尺寸非常大,你拿这样的一个图像来生成视频,很明显是不可取的,他需要非常好的电脑,我们在这个地方呢设置一下他的深层尺寸, 那么这个节点呢指的就是缩放长度,那么他是将我们的最短边缩放到四百八,也可以看到我们的最短边,是不是就是四百边,就是这个位置, 那么他缩放好之后呢,会将这个图像输入到我们的图像到视频当中,在这个位置我们要注意了,这地方长度指的就是我们生成视频的一个时长, 然后拿这个八十一和后面的这个帧率他有一个除的关系,然后最后生成了我们一定时长视频呢, 大差不差,因为我们的 c、 s、 t 值包括部署什么都是已经设置好, 那么这些参数你可以不用动,就按照我设置的来就可以了,那么生成的效果也是很不错的。大家拿到这款工作流之后呢,也可以自己试试一试,然后这个工作流和模型呢都放在这个网盘里面,大家自己去拿即可。像这地方有模型, 然后我们需要把这个模型放到这个文件夹里面,以及这个都给大家标注好了,那么大家自己放置就可以了,这个是没有什么难度, 那么这节视频就到这里了,我们下个视频欢迎来到我们的康复又爱视频生成系列课程。哈喽大家好,那么今天我们要继续来学习的这款工作流呢,是我们的一个 one 视频首尾帧的工作流,同时它也是我们六种视频生成方式中的第三种。那么我们进入到这个工作流界面呢,我刚才已经跑过一遍图了,我们输入一个手帧图,一个尾帧图,然后呢就可以看到生成的结果, 那么这样的一个变装效果,个人认为他的一个人物动态以及姿势都是比较生动的,然后他的服装以及细节保持的都是很不错的。那么具体我们要如何来进行使用呢?首先我们看到有很多这样的节点,那么不要慌, 我会非常详细的为大家讲解每一块都有什么样的功能。那么我们首先来看一下它使用的哪一些模型,模型呢自然是使用我们的一个 g g u f 模型适配我们的低配置用户, 然后再添加一个加速罗拉,能够更加有效的提升我们的视频生成速度,然后通过我们的一个视频输入以及 c 加速,能够实现一个进一步提速的效果。然后最终呢将这两个高低噪生的模型条件输入到我们的传感器当中, 然后就要注意到我们需要输入一下我们的采暖器的正负相条件,这时候就需要上传我们首尾针的一个图像,通过一个图像缩放节点来进行一个输出,那么这个图像缩放节点呢?主要就是为了避免我们的图像过大, 找就是报显存的现象出现,那么就会导致我们的工作的无法生成。我们将首尾针的图像进行一个输入, 那么这个时候就可以看到我们的一个采样器是不是模型正负这样的一个条件,然后都有,同时由于我们在这个位置输入了我们刚才缩放后的图像宽度,那么我们的视频生成尺寸也有,最后通过我们的采样器这一部分实现了我们图像的生成, 然后我们再添加一个补帧和图像放大节点,那么主要就是为了进一步提升我们画面的一个质量。那么有的小伙伴这时候就要问了,那么我们如何来找到这些模型呢?你只需要打开我分享给你的链接之后呢,你就可以看到这些内容, 比如说我们的插件,我们的 copyvision, 包括我们的放大模型 lora 和我们的望模型,以及整体的一个工作流文件,那么你想要哪个就用哪个,非常的方便 具体使用你就看上面的这个简介嘛,像这个汪二点二模型放到我们的 diffusion models 文件夹里面就可以了,那么具体呢?整体的一个工作流就是这样使用的, 大家可以你自己去动手试一试,尝试一下。那么我们这节视频就到这里了,对你有帮助的话不妨关注或者点个赞支持一下 我们的下个视频见。欢迎来到我们的 qq 爱视频生成系列课程,哈喽大家好,那么这一节课呢,我们来学习我们六种视频生成方式之中的第四种,也就是动作迁移工作流,那么我们只需要上传一张图片,然后再上传一个视频就可以了。那么首先我们来看一下我们刚才导入, ok, ok, 然后再来看一下我们生成的结果, 整体的一个动作,包括人物的音质性都保持的还是很不错的, 同时呢他会将我们原来的视频当中的音频自动与我们的视频进行一个结合,然后直接一键生成。 那么像这一种我们图片可以模仿视频当中的人物动作,然后进行一个视频输出的工作流,是如何实现的呢?我们来看一下怎么使用。那么首先呢我们依旧要明白,第一步就是确认我们的模型使用, 这对于我们生成任何视频或者图片都直观的重要。像这里面我们依旧选择 t g u f 的 模型 以及添加一个对应的加速轮啊,由于这里面我们使用的是一个动作迁移,所以我们还需要加一个安得美的的加速流的来进一步对这个进座流进行一个加速。我们加载好我们的这些模型之后呢,就可以直接输入到我们的彩样器当中, 这个时候就注意到我们彩样器还依旧缺少了正负相条件,那么正负相条件其实指的就是我们视频当中的人物运动部分,这个时候我们需要加载我们的一个视频进来,那么这个视频呢会拆分成很多张的图像, 然后传入到我们的姿态与处理器这里面,然后通过这个处理器呢分别对我们的一个姿势以及面部来进行一个识别,最后将生成的这些图像呢输入到我们的动画短视频当中, 我们需要提供面部视频和姿态视频,那么续集都是通过我们的育处理器来得到的结果。同时这里面我们还需要输入我们的一个参考图像,也就是最后我们视频生成中的主体人物图像, 通过我们的视觉编码器呢进行一个编码,然后一同输入到我们的一个转视频节点当中,然后这样子就提供了他的一个转视频节点当中,然后这样子就提供了他的一个转视频节点当中,然后这样子就由于我们的参考图像可能尺寸比较大, 所以这里面呢我们直接对整体的一个图像呢设置一下生成的视频宽高,那么像这里面这张图像呢是一个竖向的比例,所以我们最后设成一个宽四八零,然后长度为八三二的一个图像尺寸,然后在这个地方我们进行一个设置, 最后呢我们的彩样器上面的条件我们就都连接好,然后再直接输入到我们的解码器当中,进行一个生成即可。之后呢就能得到这样的结果,这里面我们想要这个视频呢更流畅一点,也可以添加一个补帧节点, 又或者想让视频变得更清楚一点,可以添加一个高清放大节点。那么这两个节点呢,在我上一节课讲收尾帧生成的时候都已经提过了,那么整体的工作流所使用到的文件我都已经为大家准备好,比如说我们的插件, 包括我们的 g j s, 我 们的视频转模型,包括我们的视频 n t r, 再比如说我们的所需要的模型以及工作流,那么大家在拿到这样的文件链接之后呢, 就放到对应的文件夹目录即可,那么这个视频就到这里了,感谢大家的观看,如果对你有帮助的话,不妨点赞加关注,支持一下,我们下个视频再见,欢 迎来到我们的 comfuly 视频生成系列课程。哈喽,大家好,那么这一节课呢,我们继续来学习我们的 comfuly 视频生成,那么这一节是我们的第五节视频高清放大,那么为什么需要视频高清放大呢? 我们不能够一次性生成高清视频吗?答案是不能的,因为那样子对于我们的设备性能要求非常的高,所以我们就采取了一种折中的办法, 我们先生成低分辨率的视频,然后呢再对我们的低分辨率视频呢进行一个高清放大,这样子就能够非常有效的缓解我们生成视频的压力。 那么今天带来的这款工作流呢,也是目前最新的 cvr 视频修复工作流,效果是非常的给力,使用方式也非常的简单,我们上传这个视频之后,通过这一系列的节点就能够得到一个更高清的视频了,那么这个是我们的原视频, 然后再对比一下我们生成好的新视频,可以看到画质有明显的提高, 然后呢我们来看一下该如何继续的使用,在这个选择视频上传里面,上传我们想要高清放大的视频,然后呢这面有一些参数我们可以自己设置。首先强制帧率, 那么我们对于视频高清放大原理其实就是对于图像进行放大,因为每一帧是由非常多张图片构成的,那么像这里我们强制帧率为十六, 那么这个意思就是说即便我们原来的那个视频,他一帧有四五十张图片,但是这样子我们强制帧率之后呢,那么我们依旧只会修复十六张,就相当于减少了我们的工作量。然后至于下面的这些内容呢,我们暂时是不用管的,我们来看到我们的缩放图像, 为什么我们要进行缩放图像呢?就是有时候我们可能这个视频他的分辨率很高,但是并不清晰,他只是单纯的这个分辨率高,所以说我们这个时候就要对他进行一个缩小再放大,才能够增加更多的细节。 然后我们通过这个比例缩放之后呢就来到了我们的一个放大模型夹在这里面,我们一般来说设备比较差的呢,就选择这个三 b st 八的就可以了,然后你的性能比较好的话,我们可以选择 sp 十六,或者直接选择七 b 的 一个模型, 那么根据大家的设备进行一个选择,我们加载完这个 bid 模型之后呢,就来加载这个 v e 模型,那么这里面我们只有一个可供选择,所以这个不是我们的重点,重点我们要看这里面在视频放大器这里面有一个最大分辨率为一九二零, 那么这个的意思就是说我们生成好的视频,他的最长边就是一九二零,那么也可以看到我们最后生成的一个效果,是不是一九二零,然后通过这样的方式呢?我们进行一个输出,途中呢我们也加载了一个清理 gpu 的 一个节点,然后我们进行输出,最后能够得到结果, 那么这样子我们的一个视频高清放大就生成好了,效果也是非常的给力的,因为我们会将原本模糊不清的视频呢生成为高清视频。那么具体这款工作流需要的哪些模型呢?我这里也给大家整理好了,像这里面有我们的一个 工作流,包括我们的模型,同时呢也包括我们的一个插件都为大家提供好了, 那么大家自己下载好安装就能够用了,对你有帮助的话,不妨点赞加关注,支持一下我们下个视频,欢迎来到我们的康复 ai 视频生成系列课程。哈喽大家好,那么这一节课呢,就是我们六种 ai 视频生成方式中的第六种, 那么就是我们的视频换脸该如何进行使用。我们首先依旧来看到我们的整个工作流界面非常的简单,那么这个呢就是我们导入进来的原视频,我们先看一下效, 然后我们再看一下他换了一下安妮海瑟薇之后的脸,我们来看一下他的一个效果, 可以看到效果非常的真实,人物面部表情一致性非常的好,那么这种效果 就是通过我们的这个工作流来进行生成的,那么这款工作流有几个特点,那么就是它的一个节点非常的少,说明我们的工作流运行的并不复杂,同时需要的显存要求也比较低,那么对于我们设备不好的同学们可以说是非常的有利的。那么具体这几个节点做什么作用呢?我们来看一下。 首先是一个加载视频的一个节点,主要就是为了上传我们的一个原始视频图像,然后我们通过上传完这个图像之后呢,就会来到这个 rei 换脸节点,这里面同时加载一张我们需要替换的一个人物面部表情比较清晰的图像给他延进来, 同时我们注意到这节点里面有很多参数要调整,让我们来看一下有哪几个值得我们注意的,那么这里面这几款模型呢?经过实测下来,还是这几款效果最为不错。然后这个面部修复模糊,你开的越高呢,人物的磨皮就会越好,开的越低呢, 人物的那个面部就有点坑坑洼洼的感觉,那么这个权重呢,指的就是替换后人物的相似度过高呢或者是过低呢,都不好,保持一个中间值即可。 像这里面有检测性别,包括一些面部锁影,如果是单人的话是不需要考虑的,如果是多人的话,像这里面目标面部所指的就是,假如说这里面有两个人一左一右,那么左边这个人呢?他的锁影就是零,右边这个就是一, 那么我们就是零对零一对一的关系。那么通过这个节点把我们的脸部图像替换之后呢,可以加入一个咔针节点,能够让我们的视频画面更加的流畅。 那么这个时候就有小伙伴要问了,说,那为什么我们不直接生成针数比较高的一个视频呢,因为那样子会提高我们的运行要求,所以我们一般会先生成一个低帧率的视频,然后再通过插针的手段让它变成一个高帧率的视频, 那么整体呢,这款工作流就是这样子进行的,效果非常强,但是他的节点很简单,那么这款工作流所需要的模型文件呢,也给大家准备好了,那么就放在我们的这个网盘文件里面,像这里面我们依次将里面的这些文件啊, 按照我的提示要求放好,那么你就可以流畅的进行使用了,那么这节视频就到这里了,我们下一节视频。

教我发刘德华的, 呵呵,很搞笑啊。这个视频来讲一下,就是 f u i 的 首尾针的首尾针,两个图片给到之后,然后生成。视频 可以看到这边是给到一个,给到两个图片,给到两个手针和尾针, 呃,然后下边的话呢,是宽和高 width 和 height, 然后这边是 length, 是 它的时间长度,是一秒十秒,这边它的帧数, 嗯,这个生成了十,用十二分钟生成的,是用了,是用的四,呃,六十帧的,那前面的这些做成了横屏,动作很慢,这是用了二十四帧 啊。那这个流程整个流程呢?在网上下的,别人分享的,但是遇到了很多问题,因为我是今天算是刚下载完之后第二次啊摸索这个 一开始呢,就是这边这个是选择不了东西,那它会提示一个错误,就这边你选择不了,然后我就问了,哎,然后我就问了这个 kimi 啊,呃,这个 unit 啊, unit, 这个加载器选择不了模型,就这里面选择不了,它是一个红色的, 出现一个,就好像是 miss 什么吧。好,那这边讲呢,就是把这个大模型要放到这个 unit 里面一份 啊,讲的是这个 y 二点一,但是我用的是 ltx 二点三嘛,我要给到他他,他给我讲的就是,呃,官方推荐呢,是放到 check point, 呃,部分社区呢,也支持这个 deformation models, 然后最后呢,这个主模型还要放到这个 unet 里面啊,显存不足的话呢,就下载这个,有时候就是我们的这个 models 里面这个 unet 里面要放一个这个主模型 啊,那解决办法就是 这样子,你找到你的 config 的 文件夹,然后 models 找到 unit, 把你的主模型复制进来啊,当然我的是 在这个里面 ltx 二点三,然后新建了一个 unit, 这里面放了一个这个大模型 啊,这个大模型 好,这样就能识别到了。这是第一个问题,出现的第一个问题,然后问了 kimi 帮我解决了。 之前就是这样的 on file 呢,这个 unit 加载器找不到, 就在这个复制到这个 models 的 unit 里面就可以了, 因为我用的是这个便携式的。然后我是在这个压缩文件里面配置的 啊,压缩文件上上个视频我讲过,就这样新增一些配置,就你省得去复制了。但是有时候会有些错误。呃,比如说 这边你少一个空格,看后面它就报错了,这是红色的,所以说建议用 vs code 来打开,它有这个自动提示错误, 然后如果说用那个文档打开的话,它就没有这种报错,然后登录的话就会出现错误。 好,这是第一个问题,然后我又出现哪些问题啊?好看,把这些模型加载来大概讲一下啊。第一个呢,这个就是由 net 里面的刚才复制过去的一个啊,主要的大模型,这个 f p 八的, 然后这边的话是 laura, 就是 蒸馏,这里面的话我用的是三八四的这一个,然后它两个 laura 啊,这个我随便选了一个,选的这个 trushen 啊, trushen 这个 都是 ltx 的 啊,然后它们连接到这个设置 model, 然后这里面又有一个放大器这个模型,然后有两个用的是二 x 二杠一点零的。呃 啊,这边是文本提示的,双文本提示用两个,之前我两个用的同一种,然后报错,然后就各用了一种,用了这个,嗯,捷马三杠十二 b, 还有一个 test projection b f 十六这个, 嗯,这边的话后来也报了一个错误,这边 v i e, 比如说在我的这个这里面 v i e, 然后这边是一个五月三十一号晚上新更新,新下载一个,呃,之前那个其实也没错,呃, 用这个 ve 就 可以了啊,因为这边是加载 ve, 就 选择一个这个 l t s 二点三 video ve 的 下面呢就是音频,音频就用 ideo ve 啊,在下面的话 ve 名称还是用的那个 ve 模型,然后这下面的话刚刚讲过,就是宽高啊,时间和帧率, 然后这边就正向提示词和啊负面提示词, 就做了这些更改啊,其他的就没有,没有做什么更改了, 其他也没有细看啊,主要就是把前面的大模型先加载。对,然后最后呢还出现了一个错误,马上弄完了之后 啊,就是有些错误呢,我就是呃这个错误,他让我 呃之前按我那么讲就不会有这个问题了,但如果和 ai 对 话之后,他让我自自己添加一个节点,我这个节点里边只有三个东西,他说不,他说是要安装一些东西,但我没用这个解决方法, 有的时候也不能全部信这个,呃,大家讲的东西啊,我看一下还有什么样问题啊?他说我这个模型可能不太正常,然后我重新下了,其实没问题的, 然后下载这个东西找了半天也没有找到,国内镜像也没有, 然后把错误信息我就整整个的复制过来,比如说你出现了一些错误的时候,在这右边的话会有一一些信息,你全部把它复制给这个,呃, ai 就 可以了,它会给到你正确的解决方法。 嗯,出现了,又出现两次,最后呢出现的是一个这个 f f m p e g 这是视频解码的一个,好像也是一个开源工具吧?应该是开源 的,是开源的是点 o r g 的 这个网站,它是开源的,之前 了解过一点这个,把这个下载下来之后添加到你的环境变量就可以了,然后重新重启一下,就可以解决掉 这个这个流程的所有问题了。这就我从头到尾呃,操作当中出现了问题,然后通,哎,通过和这个 kimi 对 话来去解决,这边就没有再去新的对话,这边也生成了 我的这些视频, 生成好几个。 好,那这个视频就到这里,接下来我还会继续学习其他的。嗯,像这些打开之后都会有些错误啊,像这个就是根本就没有这个模型啊,这种就你选都选不了啊。这个是 可以,可以运行一下,他会说一些错误哈。有节点错误的话呢,就要点这个 安装缺失的节点。嗯,节点这个会比较慢。 模型错误的话就去安装模型,一般来讲首先大的错误就这两个,一个是模型,一个是节点。

好,大家好,今天来给大家讲一个 l t x 二点三的一个导演工作台,这个工作流到底能做什么东西啊?我觉得是非常强大,比之前的一些 图声视频呐,或者是手绘真动画或者图,嗯,都要精进了不少,它增加了一些控制面板啊。呃,比如说它的核心主要是集中在这个导演台上啊, 他是怎么去用的?首先呢,我们可以去看一下我们左手边这边啊,我们可以上传了四张照片啊,针对四张照片,每张照片都会分个颜色区块啊,可以针对这个去去写题的词,然后去导入我们这边导源台,然后 就可以生成我们相应的视频,我们可以看一下设置啊。呃,大家呢,这个工作流一定要注意,就是说你看啊,这个是我们的一个帧数,这个帧数和这个一定是要对应的,如果说不对应上就是会报错。比如说这是第一张图啊,这个是一百八十一帧, 这里设置一定是一百八十一啊,然后这边对吧?一百五十二,对应的这边一定是一百五十二,好吧,这个点不能搞错,一搞错的话工作流是跑不通的啊。 然后下面这里啊,就是我们的视频宽高以及我们的一个帧率,每秒钟的帧率的设置和总时长,这个的一个设置都在这里啊,这个点呢就是我们的补点预算, 那就相当于你需要完全遵从我们这个参考图吗?如果不需要的话,你可以把这个数字给小一点,呃,如果说你需要完完全全的跟着参考图走,那你就填一就行了,好吧,好,然后我们看一下我们的一个成品动画。

哎呦喂, t 八那瓜娃子开始更新 l t x 了,今天先上真王炸,是从精确控制,直接对标闭源模型,效果好,大家点个赞,效果不好,直接四十米大托伺候耍起。 好美丽的地方 好美丽的地方啊, 好美丽的地方啊。 大家好,我是提拔。那今天呢,给大家更新一下 ltx, 那 在我们四月二十二号的时候呢,给大家更新了 prompt relay, 它呢对于我们现在的一个开源视频的控制啊,是非常有效果的。那之前呢,作者是在玩的基础上开源的, 但是 kj 直接把它复现到了 ltx 上,那在这期视频里呢,给大家展现了它的一些能力。 kj 这个节点一直在更新中,我们看一下,目前还在啊进行中。那之前呢,它更新了这个节点,包括新的 smart 节点,这两个节点呢,一直没给大家介绍,那今天呢,顺手给大家说一下, 同时呢,今天还要介绍一个罗兰,这个罗兰呢啊,实际上是三月多分就发了啊,我是用过了,但是我之前 做 ltx 的 视频就比较少一点。那最近呢,也给大家补一下,因为我确实觉得啊,现在 ltx 无论生态还是效果都非常不错了,确实是值得去做这个教程的。那首先我们来到 runnyhab 啊,这是我最常用的 ai 工作台,每天都会更新最新的工作流,包括模型,节点等等。 那今天呢,这几个新的工作流呢,我已经上传了,那我们一会儿可以来体验一下,我们先从最简单的一个开始。首先我们来到工作流看一下啊,那之前呢,我们 prompt relay 我 们有两种方式,一种呢是用竖线,一种呢是秒的方式去控制它大概的一个时间。 那现在呢啊, k j 做了一个 smart 节点,这个节点也就是说啊,它是会自动去控制的,就是非常简单,我们只要提示词按照顺序去写,它呢就自动可以控制。 然后呢我们来看一下啊,这次更新以后呢,效果也非常不错,我这边呢还加了 v b r v r, 而且呢没有权重开到一,我们来对比一下它的一个动作。首先 啊,女人在街道上漫步,天空下起了雨,女人用手啊捋了头发,镜头慢慢上移,聚焦脸部,女人转身丢掉伞,挥手,女人朝远处走去,镜头逐渐拉远 啊,现在我们来看一下他这个镜头的遵从程度啊,这边我设置没有加这个时间戳,我们直接看 第一个镜头啊,女人在街道上漫步,天空下起了雨,女人捋了头发,镜头慢慢上移到脸部, 女人转身丢掉伞,挥手,女人朝远处走去,镜头逐渐拉远。不说百分之一百复现了,我们的提示词 起码有百分之九十五以上,而且呢现在的脸部的一致性也保持的非常好。那下面我们来看第二工作的,第二工作的呢是多针,首尾针在 ltx 二点零的时候呢,给大家有做过,那在 ltx 二点三呢,一直没有给大家做,那目前呢,今天呢,给大家把这工作的都完善了一下, 但是呢,这边多加了个罗兰,这个罗兰呢刚才给大家看过了,是三月份出的,这个罗兰呢,它是可以平滑,也就是我们多蒸的时候的一个效果啊,可以让它更加丝滑,哪怕啊三张图它本身不是那么连贯的情况下,它依然可以得到一个比较好的效果。 我们看一下多针首尾针,我们在 r h 设置的时候一定要注意啊,这个节点一定要注意,跟我们本地是有区别的,我给大家解释一下啊,这个要怎么设置?我们把这几个拉过来给大家看一下, 我们看一下啊,首先来说在 r h 上这里的 index e 好, 我这边设置零,什么意思呢?就是从第零针开始, 那中间呢?第一张图,也就是第二张图啊,它是一百八十一帧,也从一百八十一帧开始是第二张图, 那负一呢?就一直到结束是第三张图,然后呢给到他们一个权重,这权重你是可以调的,但如果说你设置零的话,它就不起作用啊,有的人可能在 i h 上一直出问题,就是因为设置不对, 大家注意一下啊,在本地的是不一样,本地呢是有一个 switch 的 一个按钮,就是我们可以去调整啊,就是你要几个 index 好, 然后呢我们刚才也给大家看过啊,它这个效果了,我们看一下啊,对吧?在多镜头的时候啊,它非常丝滑,可以看到,对吧?可以完整的进行一个过渡,这个呢就是一个很好的一个啊,多帧,首尾帧就是加上我们罗拉以后, 我们在提示词写的时候也非常简单,可以看到我们开始写了下大概的一个人设,然后呢面向镜头,然后呢我这边特别写的啊,四个画格,所以说他这边直接出来了一个四宫格,对吧?然后慢慢聚焦两步,然后呢说后面的地方 慢慢移动到啊与人侧脸定格镜头像,这种情况下呢,我们实际上还可以加上,就说 v b vr 啊,就是你不要权重太高了,我们可以加上跟它一起发挥作用,那它的动作的提示词呢,就会变得更加好,那在我们现在做首尾帧 手中尾帧的时候呢,都是非常有用的,尤其呢它是支持音画同步的啊,我们可以在这边加上我们要的这个文字。 下面呢来给大家说一下,我们通过多针首尾针加上 prompt relay 啊,同时发挥作用,我们去怎么设置啊?这工作流看着稍微有点乱啊,有点复杂,没有关系,我给大家稍微解释一下。首先来说呢,这边是四张图,也就是啊首针,尾针以及中间两个针, 那这里呢我们可以设置它的一个总帧数啊,这个呢就是要给大家说一下啊, kj 的 第二个啊,它这个 prompt relay 的 一个用法,它一共有三个节点啊,第一个节点呢,我们在上期视频给大家说过了,我们看一下上面呢它还是一个总的提示词 啊,总的提示词,那这是四张图呢,我是怎么生成的呢?给大家看一下。这个呢就是最近给大家一直在完善的真正的本地 啊整合包,那这里呢我们只要输入简单的,它自动会把这个四宫格的每个镜头给生成,到时候我只要复制过来就可以了。生成图像以后呢,我们点一下自定义剪裁,然后呢它就可以自动生成四张图,然后我们传到我们的 control 里面,就非常啊丝滑的这样一个操作, 然后我们来说一下这个节点的使用,这个节点呢同样的啊,一个呢就是我们啊在总提示词写一下啊,他大概在干什么,就比如说他一些服装啊等等,我们稍微写一下, 然后呢下面呢啊他这里是可以添加的,可以艾特,也就是添加这一块一块的,我们在这里呢设置了总帧数三百八十五帧。 那然后呢我们每个啊就是每一段提示词,他动作呢,我们是可以手动调整的,如果说你这个特别大的情况下,我们会看一下啊,后面呢他就会减少时间,这个注意一下啊, 就说我们可以先大家调整好,如果说不够的话,我们可以再把这个整体的长度稍改一下,每一段可以看到都可以单独的设置,然后也可以添加新的段落 啊,这个呢就是比较方便啊,就是我们在工作流里面是比较方便的,当然肯定是没有刚才 smart 自动那么简单。 然后这个 prompt relay 的 节点呢,在之前的教程给大家说过啊,它本身是一个即插即用的,也就是说呢啊,它是直接可以连上我们的模型管道, 你任何的工作流实际上它都是可以去参与的。只是说呢,我们现在啊通过多帧我们看一下,我们这边有两个多帧的节点,跟刚才一样的也是啊,这个是第零帧, 然后呢这个是我们第二张图片的帧数,第三张最后是负一,我们对应的这里四个啊,零八是一百六十一,负一,也就是最后的一些。那最后我们生成的视频呢,我们可以看一下啊,这呢就是他的一个动态, 这个动态我们会发现啊,因为这四张图呢,我没有把这个他们的联系啊写的非常清楚,也就是非常简单,比如说让摄像头闪一下,然后呢拍一下侧面,聚焦我们的脸部,所以说呢,他有一种啊贴近的感觉,那整体呢还可以, 对不对?那如果说我们希望啊他的动作呢更加的顺滑,也就说每个镜头之间衔接更加好,我们要怎么处理呢? 那这就又来到我们第四个工作流了,在第四个工作流中呢,我们除了用了 ltx 啊一点一的这六模型以外,我们加上了 vbb 啊,那可以更好地控制它的动作,同时呢为了让过渡更加丝滑,也就刚才我们说的啊,手中尾帧或者说多帧的一个罗拉, 然后呢把它也加进去,同时呢我们用上了 front ray, 让它很好地进行动作的控制, 最后呢我们再通过这个多帧的这个节点来控制它每一个部分啊它的一个动作,那最后呢,我们就来看一下啊,加上以后它的一个效果,好美丽的地方啊, 这里呢也有它的一些提示词的要求,包括我们镜头的闪烁,我们看一下啊,对吧,比刚才啊整体的这样一个流畅度好了非常多,除了第一个镜头有一点贴近, 当然虽然还有一些地方可以进一步的控制,那在后续的视频中呢啊,再给大家进行教学,今天视频呢,我觉得长度已经差不多了, 那我们可以尝试一下啊,因为根据有的朋友他就有希望有更多的这样一些切近,有的人希望他更加的一个连贯,那通过多种模型包括节点提示词的方法, 包括啊, kj 最新的 smart 节点,我们可以很好地进行控制,甚至达到一个币源的质量,大家可以多多尝试。那今天教程到这里了,谢谢大家,记得给提拔点个赞。 另外我们公司 a x 开发的无线画布呢,大家也可以来玩。点击右上角输入绑定人一零五六二啊,可以领取三百 minus。