大家好,我是陈旭,今天继续分享 comui 的 基础知识。上一期我们介绍了 comui 的 工作界面,这一期我们介绍 comui 的 工作流模型文件 以及常用的插件。好,我们启动了我们的 comui, 来到我们 comui 的 左侧菜单列表里面最下面这个模板,我们点击模板,我们通过模板可以找到我们所需要的工作流, 比如说图像,这里我们点击图像,在图像这块我们用的最多的也就是纹身图和图像编辑模型,例如这个 zimituber, 它就是一个纹身图的工作流 千万二五幺二,也是一个纹身图的工作流千万二五幺幺,它是一个图像编辑工作流。我们还有一个图像编辑工作流,就是这个 flex two klingon 九 b 的 图像编辑模型,然后低显存用户是可以用到这个 klingon 四 b 的。 其 其实这个模板里面不仅仅有我们的开源模型工作流,还有我们的闭源模型,例如这个 banana banana, 但是当我们选择它以后,它是需要通过调用 api 进行实现生图的。 那么接下来是我们视频模型的工作流,我们点一下,这里我们可以选择万向二点二,还有我们的 l t x 二点三,目前 l t x 二点三还是比较好用的,尤其是在数字人方面,它的表现还是不错。再就是我们的音频工作流,音频工作流主要是用的 ace step, 其他的大多数都是 apa, 还有我们的三 d 模型,三 d 模型这块可以用宏源二点一, 如果大家有兴趣可以去研究一下。然后再就是我们往下翻,包括我们的这个千万三 d 模型,这块可以用宏源二点一,如果大家有兴趣可以去研究一下。然后再就是我们往下翻,包括我们的这个图像和视频放大的一个工作, 但是这些工作流只有我们安装了他的相关插件以后,他才会在这里显示。好,现在我们随便调用一个工作流去看一下,比如说点击图像来到我们的纤维二五幺二的工作 流,我们点一下,这就是我们纤维二五幺二的一个官方工作流。现在的官方工作流看起来是非常简洁的,因为他把所有的节点都给打包起来了,只要我们点击这里就会查看到我们整个工作流的一个细节 退出也很方便,只要我们可以把它的子工作流的一个细节退出也很方便,只要我们可以把它的子工作流就可以了。 然后接下来是我们的模型从哪里下载他的官方工作流,左侧会给一个模型下载的地址,同时他给了我们模型的存放路径,只要我们按照他的路径进行存放就没有问题。好,现在我们可以尝试用它生成一张图片去看一看 效果,因为是我的工作习惯,我是喜欢把他的子工作流给他解压出来,右键解包子工作流,然后我们去调整一下我们的工作流,调整完了看起来其实也是挺清爽。当然大家如果不喜欢他的连线,可以点击右下角这里隐藏连线。然后我们现在可以随便给他一组提示词去生成我们的图片,我们就用这组, 我们调整一下它的分辨率,这个分辨率的列表是我们纤维二维二推荐的一个分辨率。假如我们要生成一张竖屏的图片, 我们可以选择十六比九幺六六四乘九二八,我们输入了我们的宽度和高度,现在点击运行,它已经生成完毕,我们看一下效果,它这个效果还不错,细节也浪漫。放大一下,我是让豆包随便写了一组提示词丢了进来。刚才我们测试了纹身图,现在我们再找一个图层视频,测试一下我们的工作流。 对于我们的 l t x 二点三图像视频,我们点进去,这就是 l t x 二点三的一个工作流,左边是他的模型文件下载,还有他的模型文件存放地址一样,我们还是把他的一个子工作流给他解压出来,右键解包工作流,这就是他的所有工作流。我们调整一下,我们加载刚才我们生成的那张图片,做一个图像视频, 我们随便给他一组提示词,而且对他的工作流程没有任何更改,我们直接生成看一下他的效果。现在我们点击运行好,我们的视频也生成出来了,我们看一下效果怎么样。我乃武林至尊,谁敢与我争雄? 好,这就是我们 l t x 二点三官方的工作流,它的这套工作流是没有进行任何的改造,实际上当我们要达到我们的一个效果,我们这套工作流有很多需要调整的地方。好,现在我们的工作流介绍完了,接下来介绍我们的常规插件。我们先来到我们的这个 manager, 点击一下,然后上面这个是节点管理, 我们点进去,然后在这里显示我所有已安装的插件,这就是我当前的咖啡员所安装的所有插件。好,我们可以往下翻哪些常规需要的插件,可以 告诉大家,这个插件是非常有用的。如果我们的电脑配置不够,我们需要用到 g g u f 模型的时候,我们必须要安装我们的这个 g g u f 插件,然后才可以加载我们的 g g u f 大 模型去做纹身图,图身视频之类的。然后下面这个是 l t x video 的 一个插件,这个也是必须要安装的 这个 confluence, 这也是很有必要的,其实我们很多的节点都是基于它的。还有下面这个 confluence use, 这个插件也是很重要的,希望大家都来安装 confluence studio, 没得说,这是音频的。然后这个 one video 的 这个插件,它是我们万象二点二的一个插件, c 的 vr two 这个也是要安装的,它是我们视频放大的,然后这个万象二点二的 m o e, 这个也是需要安装的。好,这就是我们大概需要安装的一些常规插件。当我们平时拖进了一个工作流的时候,如 如果他有一些插件依赖,那么我们可以通过这个安装缺失节点去查找他。假如我们拖进来了一套工作流,但是我们不知道他需要安装哪些插件,我们只需要点击安装缺失节点, 然后他会在这个地方显示我们需要安装的一个插件列表,我们只需要进行安装就可以了。好了,我们今天的分享就到这里,感谢大家观看,我们下期见。
粉丝9047获赞2.0万

如何用 coffee ui 等开源软件完成一部 ai 短剧的制作?大家好,我是程序,欢迎来到第九期。今天我们详细讲解一下 ltx 二点三的工作流,包括纹身视频、头身视频、音乐声视频和手尾帧等, 同时讲解它对电脑配置的要求,必要插件和工作流优化等内容。内容比较长,请大家先点赞、收藏加关注。好,现在我们来到 coffee ui 的 界面, 还是一样,我们依然是选择官方的工作流。首先我们点击左边的模板,然后点进来以后找到视频。好,第一排最右边这个是他的图声视频,这个是他的音乐声视频,再往下拉,这是纹身视频, 这边这个是首尾针。那么今天我们主要以这个音乐声视频来详细讲解一下,我们点击它的工作流,大家看到左边这里是它的模型文件,包括 check point, 其实这个是颗粒布,这个是他的一个放大模型,他的工作流是采用双彩样,下面这是他的模型文件存放地址。好,我们现在看到这个工作流,他把 所有的工作流全部隐藏了,那么我们只需要把它进行解压出来,先把它拖到边上去,然后在这里右键选择解包工作流,这个时候才是他的整个工作流的真面目。好,我们现在看一下,这是他的一个图像加载区域,这个是他的音频加载区域, 这里整个是他的模型文件加载区域,毕竟他是有音频的,所以说他要比我们平常的工作流要复杂一些。这里可以输入我们的提示词, 这里设置我们的尺寸,包括这是这里是帧数,这里是时长,但是呢他这个工作流啊还是需要改造一下才能用,那么我就不展示我们的改造过程,我们直接展示我们改造结果。好,这就是我们改造的结果。 大家可以看到这个红色的节点要么是替换的,要么是增加的,比如说第一个,第一个这个是我们的音频裁剪,比如说我们输入一整段的音乐,他长达四分钟,实际上我们的视频也只能出二十秒或者三十秒,那么这个裁切工具就特别有意思,比如说我这一段视频结束时间是五十三秒, 那么下一段视频我们可以从五十二秒开始,然后再跑二十秒,然后以此类推,直到把我们这个四分钟的音频全部给他跑完。然后这个节点是预览,是用来展示我们当前所裁切的这个部分,然后这个节点就是图像压缩的节点,它这个节点还是比较好用的。 再来到上面是两个 lra, 第一个 lra 是 vbvr, 它是一个奖励, lra 对 我们视频生成这个动作是有很好的引导作用。然后后面这个 lra 是 一位大佬所开发的,它是专门解决我们 ltx 二点三 在生成视频,当在讲中文的时候,他有可能出现字幕,而且字幕还是乱码,那么这个解决方案有三个。第一个方案就是我们所有的提示词可以用英文来写,再加上我们叫仙侠的这个 lo ra, 然后再加上 k j 的 这个强制负面提示词, 因为我们这个工作流它的 c f g 值是一,所以在当 c f g 为一的时候,它的负面提示词是不生效的,我们加这个节点是强制它负面提示词生效。所以说我们一共用三种方案去解决它带字幕的问题,这里是模型加载区域,然后这里是 参数区域。这两天我在测试过程中,我发现我们尽量用幺二八零乘七二零的这个尺寸去生成我们的视频,这样的话能够保证我们的视频画面不会崩,当它的尺寸越高,它的效果越好。 然后这里是我们的彩样器,我是选择这个 c f g 的, 好像效果还是比较好的。现在我们来看一下之前我测试的时候生成的一段 mv, 就是 这个视频,它是直出七二零 p 的, 我没有进行任何的再次放大,大家先看一下它的效果, 这是一个二十秒的视频,效果还是很不错的。这个二十秒的视频用时是十分钟,过一点六百三十四秒,那么上一段生成他的结束时间是五十三秒,那么我们再生成下一段二十秒的视频,我们可以在这里把它写成五十二, 这里设成一分十二秒,刚好二十秒。那么当我们把整个视频伸出来,我们剪辑的时候,实际上我们要把它的原声关闭,用我们自己加载的原声,这样的话我们能够保证我们的音效不被污染,但是我们可以听一下我们这个原声效果怎么样。好,我们把它拉到三十三秒,然后我们听一下原声的效果是怎么样的, 非常不错,我们原声效果要比他刚才输出的效果是怎么样的,我们再对比下他刚才输出的效果, 音质确实有污染。现在我们在生成下一段的时候,我们再添加一个加速节点,双击,然后这里输入 set 好, 我们添加这个节点,这就是我们之前安装的 set 的 touch 二点二,他对我们的视频加速也是有效果的,但是我之前为什么不用呢?因为我的配置还是够的,所以说任何加速他都有可能对本身的画质有所影响。所以说我之前是没有添加,但是现在为了提速,我们可以尝试用它一下, 然后我们可以选择 cedar tension f p 十六库达的这个,然后我们把线给它连上,它就连到这里, 就连到这里,这样的话我们的连接生效。对了,我们这里还有一个非常重要的节点,就是这个东西,它这个节点就非常厉害了,尤其在这个工作流程链路生成过程中, 当工作里有完成某一段工作的时候,把它的这个模型文件和它所占用的内存显存全部给它卸载掉,然后再进入下一阶段的一个工作,这样的话减少我们的电脑负荷,甚至如果没有它可能到下一段,比如说这个 ve 在 解码分块的时候 有可能就爆掉显存或者爆掉内存。好,现在我们开始运行,看我们加了这个散热器以后,它的运行是多长。在它生成过程中,我来给大家介绍一下我们的内存和显存占用情况。大家可以看到这个内存已经爆到五十三 g, 而它的显存也只是二十二 g, 如果大家内存和显存不够高的情况下,可以适当降低它的分辨率,比如说这里可以设置九六零乘五四四,整个生成完成以后再进行一次高清放大,实际上目前我们直出的七二零 p 也是需要再一次进行放大,发达到幺零八零 p, 然后我们才可以用 好。在它的生成过程中,我们介绍一下它对我们的电脑配置的要求。它这个 f p 八的模型文件接近二十七个 g, 如果选存 小于二十四 g, 基本上是没有办法跑的,但它专门有一个针对五零系显卡的,只有二十个 g, 那 么那个模型文件我们的 十六 g 显存也是能跑的。其实内存我感觉至少要有个六十四 g, 要不然这么多模型文件根本加载不下。那么当我们显存比较低,比如说十六 g 或者十二 g 的 时候,那我们可以选择它的这个 g g u f 量化模型, 只需要在对应的位置输入它的 g g f 模型文件,然后把它的线给它连上,把这个加载器和替换掉就可以了。 包括下面这个克里普加载器也一样,我们可以选择 g g f, 但是无论显存多大,我觉得内存都应该超过三十二 g, 这样的话跑它应该没有什么压力,包括我目前跑这个工作流,我的六十四 g 内存也是勉强够用,如果我去跑三十秒的视频,可能也会包内存 好。生成完毕,我们看到是五百七十六秒,看来加了这个三者胎神,他只是提升了一分钟,比原来六百三十四秒提升了不到六十秒。我们现在看一下它的效果,这是紧接着前面一段音频的,后续的二十秒我们听一下, 大家可以看到我们这个是没有字幕和乱码的,看来我们的策略是行之有效的。好,接下来我们讲一下我们的核心的插件,要想运行这个 ltx 二点三,有几个插件是必须要安装的,我们点开 manager。 好, 现在看一下我们所有安装过的, 这里输入一下 l t x。 好, 这两个插件是必须要安装的, l t x video, 再加上它的这个插件,然后再看一下,我们还会遇到像电脑显存较低的情况下,要用到 g g u f, 这个必须要安装,还有这个 layer style 也是需要安装,包括 k g n l 子。 好,基本上就这些,那么现在这个音乐生成视频我们基本上都讲完了。 ok, 接着我们去看纹身视频,还是一样点模板视频。这里,好,这是我们的纹身视频,我们先把它的这个工作流解压出来,我们直接按照他的默认提示词。好,我们点击运行。好,生成结束,我们看一下效果,用时一百七十秒,不到三分钟, 挺不错,那么我们这样找豆包给我们一段提示词,把时间设置成十秒,它的时间在这里。十,好,我们现在得到了一组提示词,直接给它粘贴进来, 但是生成之前我们这还要加个东西,就是这个东西是防止它报现存给它连接上,然后我们开始运行。 这个工作里,我目前除了他没有进行任何改造,实际上我只是演示给大家看一下效果,这里面要改造无非就是给他夹老软,再就是限制他在输出的时候有这个中文的乱码字幕。这里还有一个细节啊, 当我们直接托官方的,无论是图声视频还是纹身视频,或者是这个音乐转视频的工作流,他不能够直接使用,我们要用的时候,我们要在这里把这个帧率的这根线给他连到这个 b 点上,然后我们的工作流就正常了。 好,出来了一个十秒的视频,我们现在看一下它的效果。 还可以,因为没有加这个 v b v r 这个奖励老软,所以说它的效果好像不是很好。 好,接下来我们看一下我们的图示视频,还是在模板里面找,这是图示视频,我们点进去一样给他工作流程解压出来时间,我们设十秒吧, 加载一张图片,随便输入一段提示词,一个男人在说话,这是他要说的话,然后我们点击生成。好,生成结束,用时是二百八十五秒,我们再看一下它的效果。大家好,我是陈旭,我们是博主的 ai 扎势产, 因为是十秒的视频,我给的话术太短了,然后导致他的语言混乱。好,我们又重新给他写了一些话术,再次运行一下。好,这就结束,我们再听一下它的效果。大家好,我是陈旭,一个 ai 形象,我还有一个搭档,他叫希然, 他这次是动作夸张,还有字幕,不过整体效果还不错,因为他脸一直没有崩,环境也没有崩。好,现在还有一个工作流没有讲,就是我们的首尾针,工作流好,点进来。好,我随便加载了两张图片提示词,我们改一下,他端着咖啡走到窗前, 一样工作流我们就不去更改了,直接用他试乘,这里有做一个十秒吧,五秒太短了。好,试乘完毕,我们看下效果, 这是在没有加任何奖励 lara 情况下跑成这样的一个状态,我觉得也还能接受,而且我们的提示词特别简单,什么都没有,那么真正要跑出好的视频还是需要在提示词下功夫 好。我们今天一共介绍了 ltx 二点三的四套工作流,第一个是纹身视频,第二个是图腾视频,第三个是音乐声震视频,第四个是首尾针视频, 而且他的能力是可以做到三十秒左右的一个视频主要是看我们的电脑配置,其实如果内存够大,我估计跑个一分钟视频应该也是问题不大。然后接下来就是我们的小浅层,用户可以选择把它两个替换成 g g f, 然后再就是我们的生成字幕的一个限制,再加上我们的一些奖励 l r, 让他动作更加连贯 和更加符合逻辑。然后再就是一些细节上的调整,比如加上一些我们清华村的一个节点,还有包括可以裁剪音频的一些小的节点,这些东西都很有用的。我们整个 coffee ui 的 全流程到这里也基本上讲完了。 接下来每一期我会给大家做一些具体的,包括视频呀,包括音频呀,包括图片的一些效果,然后给大家展示,那么今天的演示就到这里感谢大家观看,我们下期见。

最近有挺多粉丝问我这个康复 u i 怎么安装,现在我出一个教程,首先你要准备一个康复 u i 的 秋叶整合包,没有的在评论区扣六六六。 其次你就要准备这四样东西,第一个是解压工具,因为这个康复 u i 的 整合包它的容量还是蛮大的,所以需要用到这个工具去解压, 解压完之后他就是这个文件夹,接着就依次安装这三个环境依赖,没有环境依赖的也在评论区扣六六六。然后打开解压出来的整合包,在里面你会找到一个启动器,双击打开, 那么你就会进到这个启动器的页面。打开启动器之后,第一件事先点击设置, 再找到代理设置,右边有几个开关,如果你是没有魔法的,那你就不用设置了,这下面默认开着就可以了,如果你是有魔法的,那这下面就关掉,上面开了, 简单的说就是魔法用上面,没有魔法用下面。接着找到版本设置, 在右边这里选择最新日期的版本,点击切换,再点击确认,可以把 ctrl y 更新到最新版本, 然后来到左上角点一键启动,再点击右下角的一键启动,启动过程中会在启动器这里显示这一些启动的过程, 等到完全启动之后,他就会弹出这一个最基本的纹身图。工作流,那么你可以尝试运行,会发现报错了, 所以在这里给大家提个醒,你的康复 u i 安装成功了,并不代表你就可以运行所有的工作流,接下来你要做的是学习最基本的工作流的使用方法,比如查看报错,刚才报错之后,这里显示了红框,说明这里出了问题, 其实就是没有选择模型,现在我随便选择一个模型再尝试去运行,你会发现,哎,就可以了。 在后续的 com 加使用当中,其实还会遇到其他的问题,比较常见的就是显存不足,那对应的方法就是设置虚拟显存。 还有环境冲突,这个冲突一般是指环境依赖的版本冲突,那你就要去学会怎么看他们的环境依赖版本, 以及如何去安装和卸载相关的依赖环境。最后就是各种不同模型在不同工作流当中的运行逻辑以及搭建思路, 入门相对痛苦,但也因为痛苦入门之后你相比其他人会有更大的优势,特别是在未来 ai 时代。

这个工作流网上已经有大神做出来了,最简单的办法就是把这个工作流下载下来,然后啵往那一放就行了,就跟你学 ae, 学什么剪辑,会有一些模板给你套用一样,这个就是最简单的方法。但是 comfy ui 这个东西,没玩过的人是对他比较陌生的, 所以想套模板,你也得先对他有一个最简单最基础的了解。我的学习过程是这样的,我跟他说我知道不可以直接套模板,我也不是教大家,国内的这些教程抖音 b 站上都教了,但是他们讲的非常的不详细,就感觉就不想把你教会一样,就想着等你后台私信他们,让他们把你拉到一个麦克。 我现在呢也是一个刚入门的阶段,就是边学习边分享吧,专业玩 ai 的 朋友就别看我这个视频了,我就单纯分享给像我一样的这种新手小白朋友。点进去之后 看它这个页面还挺好看的。点击下载,这里有 windows 版和 mac 版。还有一个方法是从 github 上安装好,安装完直接点击完成,它会运行 这边跳出来的英语是我们没在设备里找到 git, 在 继续安装这个 confluence 桌面之前,请下载并安装 git。 我 们来打开 git 的 下载页面, 它就直接跳转了这个下载页面。啊,我们这个是 windows, 就 选 windows 下载, click here, 点击这里下载,下载成功,跟着它这个步骤去安装这个 git, 反正就一路默认 自动更新,让它自己安装。还有一种下载方式是在这个 github 里面下载的,网址是这个,点进来之后找到这个 release, 点进去 这里面这几个下载方式就是你是 amd 的 就下 amd, 这个英伟达的就下英伟达, 我这个台电脑下了的是这台。好,我已经下完了,下完之后就解压安装,我现在拿我这台 amd 显卡的电脑给大家演示下载 amd 这个版本就是这个压缩包,解压之后长这样。好,双击进来会看到这个东西,跟我们往常看到的软件不太一样,没有那个什么一个程序两个字, 它都是这种一 kb kb 的, 这个结尾是点 bat, 看到这两个就都试一下,如果这个打不开,那就再打开这个,因为这是跟你的显卡配置有关。点击运行它,跳出来一个类似终端一样的东西。 软件下载完之后,它界面就是这个样子的,打开这个界面之后是一个画布,先别管,直接点这个 templates, 这个就是一个模板,这个 templates 里面有很多 其他人已经做好了,这些工作流非常适合新手过来研究学习,但这些工作流都比较简单,比较 low, 就 没有那些网上的那些博主也于 top 大 神做出来的那么厉害,这些都比较简单。好,我下了一个一个最简单的纹身图的工作流,就在这儿点这个 templar 词, 然后比如这边这边是 a 妹纸,就是图,纹身图,视频、音频,这还有三 d 模型的这些大语言模型,这也不管的好点,一个最基础的纹身图模型,这边有 a、 p、 i 三个字母了,不要碰再多是要花钱的,就用千万的吧,二五零九重新下一下这个 一点,他就直接把这个工作流跳转进来了,这每个小方块就是一个节点,这个界面是我认为非常舒服的一种界面,你看拿鼠标一拖抓手就出来,用这种模板非常简单,因为他所有的东西都告诉你了,这个工作流他能干什么?我们现在不知道,因为没没做测试吧。 我们先看这个工作流的作者,他跟我们说了什么,他说这些是链接,你现在要去下这些东西,一二三四五,每一个链接里面都有每一个这个大标题,下面都有一个链接,点上去就能下了,我们待会儿就要挨个下,下完之后还有这个就是放摆放的位置,这个 diffusion model, 放到这个 diffusion models, 放到这个,这个里面都在 comui models 这个里面啊,这是作者或者官方吧给的一个 下载公告,根据这个做就行了,很简单,全是傻瓜式的。好,这下载的时候跟你说一下这些节点都是干什么的?首先我们要理解这个节点流程,他就是他为什么叫工作流, 其实我是跟流水线一模一样的一个原理,每一个小方块就是每一个节点吧,他就执行一件事情,一步一步一步一步把最终这个活给完成。这每一个小方块就是这些东西,这个有字的就是他的节点名称,这个节点是干什么的? load image 就给你加载图片的,这个节点是干什么的? save image 就 保存图片了。又有一个开头,一个结尾,然后中间呢?就它的整个生产过程,这个工作流,它是把它给 打包了,大家看到有这么一个标志,就是作者把它打包了,我不知道它是怎么打包的,然后点这个点这个标志右边的这个标志就能进去,然后我们就能看到这里有一个哎主文件夹,一个子文件夹,这里就它中间的这个生产过程,每一个小方块,一二三四,这四个小方块给作者 弄成了第一步,第一步是加载模型,然后第二步是干嘛干嘛嘞?就你看到这些牛逼的作者弄出来的工作流,你又觉得非常的赏心悦目, 非常的舒服,强迫症患者的福音,你要是自己没事一个人自己去答,那你答的乱七八糟了,我在前两天尝试过自己答,到后面我才开始用这些 typeface, 用这些模板以及在网上下别人下的工作流 typeface, 它只是一个平台,你要是想生成更多的视频,生成更多的更好的效果,你也自己疯狂的去下这些模型,下这些配件模型。 这个 laura 呢?我的理解就是它的配件模型,比如说你现在下的是一个图神图的,那它这边给你一个 lightings for steps, 就是 这个 laura, 它能够通过四个步骤,就四步闪电版的给你深图。 然后还有这个什么 b 十六,可能是一个氢氧化版的这个 laura, 在 我的理解下,它就是一个辅助的模型,然后这个 text encode 是 文本编辑器,文本编码器,每一个模型都有一个属于自己的 文本编码器吧,或者说某一类的模型有一个属于自己的文本编码器。像这个它就是像的,是千问的模型吧,这个 q w e n 是 千问哎,也挺厉害的,最近也出了很多开源的这种大模型。好,下面这个 v a e v a e 有 点像是 你图片画完了之后,它开始给你上一些颜料之类的吧,我觉得就是让你的一个画质的真实度或者干嘛的变得更好,这是我的理解,这些东西都不重要,就你完全不需要搞懂他们是干什么的,你就会用就就行了。 好,现在已经点击下完了,这个下载呢,很简单,你一点就跳转了,你要么用浏览器下载,要么迅雷下载,我一般都是用迅雷下的,下的比较快。 这一二三四四个东西,打开文件夹所在的位置,然后我们把这四个东西按照人家说的这个方法给他剪切到或者复制到相应的文件夹里,在这个安装的文件夹里找到一个 mod。 四文件夹,基本上所有的下载下来的东西都是要放到这个里面。 第一个文件夹 models 里面, diffusion models。 好, 我们找 diffusion models, diffusion models, 找到在这下的是这个 q w e n r sift and sensor, 我 们记一下这个 e 四 m 三这玩意儿,这玩意儿给它拖进去, 然后再看下一个文件夹 l 找找找找找 l 开头了,在这儿把这个也给放进来,放到这个 l 文件夹里,剩下的就一步一步按照它的这个东西 放。下面是 ve 和 textincode, 在 model 里面找, ve 在 下面在 ve 可不是许嵩呢,加一个 textincode 文本编码器,千万二点五。好, 也已经抽过了。 ok, 那 现在这个就是一个目前已经下载了东西的一个工作流啊。他说让我们上传一个图片看一看,遇到不知道怎么解决的问题的时候,先跑一下,跑完之后他会告诉你哪里出问题,就非常简单,不需要自己排查 任何问题,他直接给你指出来,然后去解决就行。在这一看,哎,题词进来之后也没办法编辑,那怎么办呢?那是不是出问题了?不是,我们往前往前倒,看到这个题词前面还有一个节点,这个题词前面还有一个节点,顺着这根线走,走走走 看,哒哒哒。啊,原来这个作者在这弄了一个单独的题词放到这里。好,那作者还是 非常良心的,就是整个节点流程看着很很赏心悦目。就我刚刚生成的一个提示词,很简单,让这个帅哥的头发变成白色,咚,他变成白色,我可以给他直接放到这个位置来,这样的话就可以并排看。那继续修改。 这个就是简单的让你去熟悉一下,了解一下这 ctrl u i 的 效果是什么样的。 他的身图的快慢呢?取决于你电脑的算力,我现在弄一个复杂一点的提示词。好,我自己手敲了一个简单但是比刚刚要稍微复杂一点的提示词,看下他能跑多久,让他变成一个带盔甲的钢铁侠的盔甲, 再给他来一个眼镜。现在这个是近景吗?我要一个全身景,我看他能不能理解啊。好,点击这个 run, 就是 运行,就是跑嘟跑, 这里能看到一些净度,我们还可以点进这个里面来,然后我在这听不到风声啊,因为这电脑不是我的,我在远控,我朋友的电脑,那我们能在这里看到他不停地跑,在现在跑到这个节点了,我不知道怎么读啊,应该是 case app。 好, 跑完了,我们在这看一下预览 全身图,他给我的也不是全身图,但总体上来说还行。这个工作流用来 p 图我觉得是已经足够了,这里可以看到他跑的这些时间,三十多秒,二十多秒正常,我的四零九零 d 跑这种的话应该也就十几秒, 应该像素不是很大,八百八。他这里有一个问题啊,就是你给的原图尺寸其实挺大的,你看 我这是二 k, 然后它生成呢?就是很小,你如果说想在这个里面去修改它的尺,输出的尺寸也可以,但它跑的会很慢。好,现在我们对这些节点有个大概的了解了,就是它是通过这些线一个个连出来,然后最终生成一张 你想要的这个效果图。那我们回到刚刚一开始我说的怎么样给一张图,然后通过这个摄影机的调整,让它生成你想要的角度的图片呢?好,我们把这个保存一下,保存按钮在这儿,这里有三道杠, 点击 save 或者 save as 都行,点确认,你也可以把它下载下来,点这个下载好,下载到某个地方,它导出来是一个这个东西,这个 json 格式的, 你就可以把这个工作流直接丢给你朋友他那边接收到了之后,他再拖进来,拖到自己的这电脑上,直接往画布上一拖,因为我左右都已经改变了,关掉,我新建一个空画布,好一拖拖到这个画布上,非常简单,不松手。出来了, 这工作流出来了,这个没办法,多角度不好玩,我们去找多角度的, 别人做好了这样的工作流,还给它保存成了 json 格式的,那我们下载下来,拖进去,然后再去下载一些东西。那我看到的就是这个国外大神,我不知道这个是不是他最开始的原创啊?总之他这里的信息是最全面的, 他告诉你这个模型在哪,多角度的插件在哪,还有这个加速 laura, 这些都是要下载的,下下下下啊,这,这个是他做的广告,就不下啊,这个是节点, 这个是参考工作流,那我们就先把它这个参考工作流下下来,点击进来之后跳转到了一个 github 页面,点击这个下载, 在这好一下它就下完了。我习惯上是喜欢把这些工作流给放到一个文件夹里的,这样的话自己找起来比较方便, 那尤其是你做好的,或者你调试好的工作流,这个就是我们刚刚下的二五幺幺的这个前面这个是演示的二五零九的工作流,这个二五幺幺 multi angle 就是 多角度嘛,它每一个名字其实写得很清楚。 好,我们跟刚刚一样也是拖进来,往这一放,我就说嘛,它会告诉我们遇到了什么问题,那它就有什么问题呢? 他说 missing models 缺失模型,当加载这个图片的时候,下面的这些模型找不到,所以我们要把找不到的这个模型给下载一下,这个模型有点大了,二五幺幺 b f 十六三十八个 g。 好, 点击下载。 这还有一个加速 lara, 给它下一下八百多兆,这个不是很大,所以你要玩本地部署的这些 ai 模型,你的电脑 存储一定要够大,否则这十几个模型下来,那你的电脑就已经塞满了。这个下的有点慢,那我们等它下一会网址没法贴,之前贴被限流了,大家只能自己去英语网站里搜了这个关键词,官方版的它也有一个下载链接, 当然我们就以官方版为主,他这边没有报错的,我们就先不管他,就等他跑起来,哪里报错了改哪里,让他后台先自己下着。我们要先去下另外一个非常重要的东西,就是这个插件,找到这个插件把它下下来,就是这玩意。 这个网站叫 github, 可以 在这点下载这个扣的,这里点一个这个,然后这里有下载 download, 这个插件就很小,直接下这是个压缩包,给它解压一下。下载的这个网站我们改成中文,看的更清楚一点,它这里有安装的方式, 进入到四点一节点文件夹里,这里有两种方式,一种是克隆,一种是直接把它放进去,这两种我都跟大家演示一下。第一个下载刚我们已经下载好了,现在就去找到 comfyui custom notes, 把刚下的这个给它拖进来。 还有一种是 git 克隆,这个 git 克隆就是一个什么东西呢?这整个网页就是一个可以下载到它的一个网页,那么这个 git 克隆 就是你把这个这段代码也不是代码了,这段东西给它复制过来,找到相应的这个文件夹里,刚就是这个自定义节点文件夹, custom notes 这个里面右键 在终端打开,然后它这里会出现那么一个终端,黑色的就不要害怕,这东西根本就不是什么很高深的代码,就按照它一步一步去来就行了。粘贴, 然后按回车键,他就会在后台克隆这玩意,但是现在我们已经下好了啊,我不知道他会不会再克隆一个,现在他就在克隆,就等待他就行了。这个东西呢,我的理解他就是一个插件,然后同时他又是一个 独立的节点, computer ui 里面是没有这个节点的,没有这个节点我们就得自己去下,下完节点之后还得安装。刚刚我跟大家说的就是这两种安装的办法,现在它正在克隆 好,这个没克隆好,它这显示是 unable, 经常会出现这种没办法克隆的情况,不过无所谓,如果你碰巧克隆好了,那就行了, 这两种方式都可以体验一下。我一般都是下载先让它下着,然后我们再去看一下这个工作,大家没看到吗?它作为一个 j s o n 格式的东西,它很小很小是因为 这些东西它就是表面的那个说明书,你做一个东西,光有说明书是没用的,这说明书里面只有文字,但没有实质性的工具。我来告诉你,你要用电钻去凿一个洞,这个洞的大小是这么大, 但是现在你手上没这个电钻,你就得去网上把这个电钻下载下来,你还得把它安装到合适的位置里面。玩这个工作流的时候,很多很多东西都是需要下载,需要更新的,大家看到这里有个大大的叉,是因为我们还没有刷新这个界面,然后中间的这个 被它打包的点进去看,就它中间的这个过程,作者用好多这些节点,不同的模型,不同的 lora, 不 同的 clip 和 ve, 组建成了这么一个工作流。下载的时候再跟大家介绍一下啊,如果你想了解,你就可以简单了解,这边就是 models, models 就是 模型, 就是各个大公司,比如说字节,阿里,他们会弄很多很多个这种模型,这些开源模型就是免费大家用的。 这个 diffusion models 是 一个扩散模型,它跟另外一个模型叫,就这个这种类型叫 checkpoints, 都是以这个玩意儿 safe tensors 作为结尾的,本质上差不多,但是把它们分成了两个类别嘛,这个是 lora's, 这个已经说过了,这 ve, 这个 text encode, 然后这个是 diffusion models, 这个是 clipvision, clipvision 也是跟文本编码相关的东西。剩下的这些我就不太了解了,这个用的也不是很多,用的最多的就这几个。大家玩这个熟悉了之后就会发现,每次下载都是无非是下载这个,要么下载这个,要么下载它, 要么就全下,下完之后剪切或者复制到相应的文件夹里,然后再重启, ctrl v i。 我 的学习之路就是这样的,用人家的工作流,在这个工作流上面自己去调试,并不是他每个工作流,你把这些东西下载好了, 就能生成跟它参考图一样的东西了,你还得自己去调试的。不同人的电脑也不一样,进去这个里面去调这些参数,最主要的一个参数节点就是这个 saplla 这个节点,这是一个 k saplla 节点,还有别的一些节点也是,反正都是这个 saplla 类型的,它就是主要的这个 核心操作工具,反正这些东西大家自己去弄一弄,就是这些东西它并没有我们想象中去做那种 调色软件或者剪辑软件那么直观,你去改一个东西,你立马就能看到你得在这改完之后,你再跑个一分钟、两分钟你才能知道到底改了什么。 然后等你跑完之后,你又发现,你又忘了你之前改的这个东西是什么,所以只能自己去琢磨一下。但我觉得这这些都不重要,这些都不重要,我们理解他的整个逻辑是最重要的。你跟我说这个节点 说不定下周就淘汰了,这个工作流说不定再过两个月就会被新的工作流,被新的模型取代,还有可能节点更少,效果更好。所以我们现在去纠结他这个什么意思,这些东西没意义,就去理解他整个工作流。就是我 目前看来,你说这些东西会不会变化,那肯定会,但是他的这种运行逻辑,包括你去工作的这个逻辑是不会变的。因为这个工作流节点就是人类发明的一个效率最高、最容易 让大家去执行的一个东西。就从福特当年做出汽车流水线之后,人类的工业化快速生产东西,就靠这套东西。好,我已经下载好了,找到下载的这个位置, 看是不是他说的这几个,这个二五幺幺 b f 十六下好了,还有这个也是 v 一 点零, v 一 点零的也下好了, 都下好了,我们就要去安装,安装的时候要把它给擦掉,或者说你安装完再把它擦掉重启。我这个所谓的教程尽量慢一点,让大家陪着我一起做, 因为最讨厌的就是你自己一个人漫无目的的去搜,去问豆包,去问 jamie 奶,去问 groot。 很 烦,跟着我一起做就可以直接慢慢来了,所以我废话会比较多一点。主要就是这个 v a e 很明显就放到 ve 里了,跑到 ve 里给它一粘,看它这里都写了 put ve here, 把 ve 放到这个里面看,这人家都已经写好了,非常有意思,就生怕我们不知道这个很长的 four steps, 你 看到这边有个什么 lighting four steps, 这就是一个 lora, 这就是我说的它是一个辅助型的模型,就能够让它用尽量短的步骤 给他跑完找 lars。 哎,在这就像我现在已经熟练了,我就能很快的找到他们了。就一开始看完的时候还是挺两眼一抹黑的。这个清亮画板有意思就有意思,在这就是得自己放,放进去, 在放的这个过程当中,你就已经基本上熟悉了整个流程,它是有哪些东西弄出来,这两个记不得放哪了,我们再打开工作流,再看一眼就行了。工作流上面人家写的清清楚楚的,双击一下,打开它后台运行一段时间, 就会自己跳转到一个网页上,所以这个东西为开头了。你看,刚已经装了两个了,还有这两个刚我们不知道在哪了。好,这两个分别是 diffusion models 和 text in code, 这个放到 diffusion models 里面, ok, 进来了,进来之后得再重启一下网页关一下,后台也关一下。可能是我习惯了这么用啊,当然我也用了一下单纯的软件版,其实都是一样的, 继续双击它,它跑后台的时候你能看到它的后台,在跑报错的时候,你把这个一截截给豆包 jamie 奶什么的, 他们就能帮你分析出来,现在没有再报错了。上传一张图看一下,测试一下行不行。这个是第一个节点,上传图片的第二个节点就是 can 问 multangle camera, 我 们在这点击一下这个蓝色的运行,它就单独运行一到二这个两个节点, 它这一运行就把这个图片给加载过来了,加载过来的目的是方便我们调整摄影机,这个摄影机摸一摸就知道了, 当然这个并不是真正的摄影机,它的逻辑并不是说一个无级的摄影机,我们可以任意调整角度,它其实是有九十六个机位,我不知道设计这个的人是怎么想的,反正就 弄了九十六个位置,然后你弄到不同的位置,每个位置对应着一个提示词,它其实还是通过提示词去改变图片的角度的,并不是那么神奇的一个什么三 d 的 效果来看一下,我把它相机往它右侧面高居位往下打一点,拍一条看看。哎, 好,非常 nice, 非常 nice。 一 跑红了,红了,我们就点进去看一下是哪里有问题,有问题的地方 compeg 就 会给你用红的给你标出来。哪里有问题呢?其实是因为作者用的时候他用的就是这个 safensils, 但是我们下载下来的并不是,所以我们得找到我们下载的这个 再跑一遍看看。运行到现在为止,只要它是绿的就舒服啊。没报错,好,已经跑完了,我把这两张图给挪过来了, 可以看一下。这跑的效果还是挺不错的啊,我摄影机的角度是放在了高机位俯拍的一个角度, 然后他就是高级辅助拍的,这个效果基本上是没什么问题,他也把这个豆包水印也给放进来了,非常搞笑。那这个小教程基本就这样了, 大家有什么问题可以私信我,我看到的话就会回大家,大家通过这么一个工作流的简单学习,也基本上能够会用这些工作流了。就是怎么套模板吗? 无非就是遇到报错,然后去解决,去下载,下载完之后就去安装这几个东西,如果你用的是官网下载的那个版本,你都不用进这些后台这些文件夹里,就可以直接下载出来了,更简单。 就这个东西我玩下来我才觉得就是一个信息差,你在之前不了解,你觉得,哇,这个玩意好高深啊, 大家怎么这么牛逼啊,都弄弄出来这么厉害的东西。实际上当你开始研究这种所谓技术性所谓 ai 工具的时候,你会发现 使用这些工具其实并不难,关于作品,关于怎么样生成好内容方面,难的其实更多是想法。就我个人觉得,现在单纯的生成这种好看的图片,什么科幻特效的这些效果已经意义不大了,就不足为奇了。剩下的就是 这个工具有了。大家怎么样去讲一些故事,再讲一些好玩的故事。就像我大概在一个月前刷到的一个特别牛逼的 ai 生成的视频,抖音上两百多万赞,我想大家应该都刷到过,就是那个讲 emoji 表情的那个 ai 视频, 太牛了,这类的东西我觉得才是我们使用 ai 进行内容创作的意义所在,因为这类的内容你没办法用实拍或者说一般的特效给它实现出来。好,这期视频已经够长了,如果你能观看到这里,那证明你的学习能力真的非常强,谢谢大家。

百分之九十九的人学习匡费的第一步就已经走错了,还有人甚至因此白白浪费了好几万。你是不是也还在考虑该买什么配置的电脑来本地部署匡费? y, 我 劝你赶紧停下来。 上期视频已经非常详细的给大家介绍过本地部署使用的方式了,然而对于所有新手来说,本地部署并不是最好的选择。想要用上 com p y, 你 完全没必要非得花大价钱去配一台电脑,你家里现在十年前的老电脑也可以直接用,那么解决方法就是云端在线使用。 说直白点就是在云平台租一台高性能电脑来部署使用 comfyui, 你 可以直接在自己的低性能电脑上操作这台云电脑,完成 comfyui 里的所有工作。 这样做最大的优势就是你可以省下大几万的购买电脑的费用,而且不用把软件固定安装在某一台设备上,任意台设备只要能上网就可以使用 comfyui, 而且功能和本地的完全一致。 但缺点就是云端使用租用显卡需要按时间收费,一般来说在每小时一到三块钱左右随用随停。这个费用相比于你直接去买一台高性能的电脑要便宜太多了。 不信你可以自己算笔账。按照一天使用六小时计算,你买一张五零九零的显卡所支付的费用足够支持你在云端租用相同显卡使用四五年左右的时间。 五年之后呢,你自己的显卡已经旧掉了,而你在云端完全不用考虑损耗,一直都可以用最新的显卡,所以该如何选择就很清楚了吧, 接下来教大家如何操作。首先是平台选择,这里大家只需要考虑两个点,一个是平台的显卡储备够不够,要保证自己随时都有显卡可以用。第二就是价格要尽量低一些, 这种云平台有很多,我就不一一给大家举例了,今天我就用自己平常用的比较多的成语之云给大家做演示,其他平台的操作方式都是差不多的。 进来之后先完成注册登录,然后进入到控制台,找到左边的账号管理,在这里完成实名认证,然后选择账户充值,充值记住一定要少量多次,防止你忘记关机一下把钱全都扣光了。 这里我还给大家准备了一个福利,使用我给大家申请的这个优惠码,购买算力卡可以三十抵四十五。然后回到应用商店,在搜索框中输入我的名字,蓝天,找到我提前给大家部署好的这个云端 com 镜像, 这里千万不要选错了版本,默认选择最新版本,按照你的自身需求选择使用一张显卡,一般我用的最多的是四零九零 d, 然后点击立即使用,等它启动好之后,点击这里的 web ui, 就 可以进入到 com p i 界面开始工作了,是不是非常方便呢?这里还要给大家强调一下,使用完之后一定要记得回到这个我的实体界面,点击这里的销毁并关机选项,这就相当于是你在网吧开机玩电脑是一样的, 只有关机了才会停止计费,不然你就相当于一直占用着这台电脑,他会把你卡里的钱全都扣完,才会自动关机,这是很多新手会踩的坑,也是我前面为什么让你们少量多次充值的原因。 confire 的 安装部署是大家学习过程中遇到的第一大拦路虎,很多人连 confire 界面都还没有打开就已经早早放弃了,原因就是不知道该怎么装。我上一期给大家分享的本地解压急用满血版整合包,还有今天讲的云端在线使用方式,就是为了帮大家解决这个拦路虎, 让大家能少走弯路,少踩坑,特别是不要浪费钱,让大家能快速打开软件,第一时间体验上矿泉水的操作使用。如果觉得本期的视频对你有所帮助,别忘了点赞、关注、收藏,我们下期再见!

地表最强开源 ai 工具 comfyui 来啦,可以免费调用所有大模型,以实现文胸图图声图文胸、视频音频克隆、 ai 模特换装、影视人物替换等所有 ai 功能。今天老八出一期 comfyui 最详细的安装教程,让宝子们也能在本地一键部署。 我们首先进入 comfyui 的 get 补官网, 点击右下角 releases, 目前最新的版本是零点二,一点一 点开下面的 asus, 如果你是 amd 显卡,就下载后缀带有 amd 的 整合包。如果你是核显,就下载后缀为 intel 的 整合包。如果你是 n 卡用户,且为最新的五十线显卡,选择后缀为 nvidia 的 整合包。 老版本的 n 卡用户选择后缀为 c u 一 八二六的整合包,点一下即可下载。这里老八就选择后缀为 nvidia 的 整合包了。 当然嫌麻烦的用户可以到老八的公开群或视频简介链接领取。博主也把本期用到的所有工具都打包好了,下好之后用 bandits 皮解压工具解压到英文路径下面,注意不要带有中文。 这里博主也准备了解压软件的安装包,双击安装即可。 然后我们安装 get 工具,打开博主给的这个包,双击里面的 get 安装包,一路默认安装即可。 然后我们把这两个 comfyui 必备的节点管理插件和汉化插件放到 custom nodes 文件夹下面,插件路径一定要放对呀,不然加载不出来, 这样这两个插件就安装好了。 然后我们来到 comfyui windows portable 文件夹路径下面,双击 run nvidia gpu 启动程序, 初次启动会自动安装相应环境,耐心等待即可, 如果没有自动跳出这个界面,可以来到控制台这里,找到这个网址,复制到浏览器里即可。 现在我们就来到了 comfyui 的 工作界面了,我们点击左下角简单设置一下。首先我们点击画面,这里可以选择连线样式,大家自行选择。 然后来到节点这里,把这三个全部改成显示全部,这样节点信息就好显示在工作流里。 老八现在就给大家简单演示一下 comfy ui 的 纹身图功能。我们来到 liblib 这个工作站点,选择图片模型,右边筛选和老八一样就可以了。 找到一张你们比较满意的图片。首先点击右边的下载按钮,下载对应模型, 选一张你们想复刻的图片, 这里是正面提示词, 这里是负面提示词。将提示词复制到工作流里面, 照着这个推荐参数调一下彩样器, 然后把下载好的模型放到这个文件夹下面, 然后进入 comfyui 工作台,点击左上角菜单编辑,刷新节点,自定义,这样模型就加载进去了。我们选择模型,点击生成这样一个简单的纹身图,工作流就跑通了, 点击左边资产右键即可下载到本地。 好了,这期教程就到这里,麻烦宝子们点个关注支持一下。后续老八也会做一些声音克隆、人物替换、人物转会、视频生成等的工作流供大家使用。大家先来安装一下 comfy ui 吧,本期视频用到的所有工具也已经准备好了,进我公开群或视频简介领取。

今天给大家录制一期 ctrl e y 复制部署的教程, 下载这两个,一个是整合包,还有个是前端部署资源,还有就是我们的 c 盘至少五十 g b 这个解压软件啊。首先我们这个前端部署资源先没有把,先把这个整合包给它,打开 它这个就是 comfyui 的 整个包,就打开此电脑,点击一盘可以解压到一一盘里面啊,我直接把它拖过去就可以了。 找到一盘里面的前置部署资源,双击打开,我们先把这个先给它部署好,双击运行继续好。在安装好之后,我们单机这个单个组建, 输入 m s b c 好,找到 ms bc 之后往下滑,拖到最下面一个之后我们再输入 win, 它在有些电脑是 win 十,有些是 win 十一, 我们的话就选择 win 十一就可以,因为 win 十一它是可以向后兼容的。然后点击这个之后我们就点击安装就可以了。 嗯,有些已经安装好了显卡驱动的,可以点击右键打开 app, 在 这个驱动程序里面将它更换为这个,点击这个就行了,如果没有安装的重新安装下就可以了。 好,接下来是酷的安装,找到前置安装包,对,它这里面就有酷的安装,你电脑对应的版本是哪一个就双击哪个运行,我们直接一直点 ok 安装就行了。 这个文件我建议直接将它放在 c 盘里面,加安装的话会比较方便,因为它的路径是不能带有中文的,这对主播自己就已经直接将它已经放到 c 盘里面了。双击找到 c 盘 fm bin 第一个文件,将它的路径给它 复制下来好,复制下来之后打开环境 好,找到环境变量,控制好,找到环境变量控制的点这个环境变量, 找到这个 p a t h, 随后双击它,这里主播提前也布置好了,这里有将它给删除,重新布置一遍给大家看 看,点击新建截下来的粘贴就行了。好,粘贴好的之后点击确定,确定,确定好,接下来是 python 的 环境,你布置,首先 找到我们已经布置好了的, ctrl y 打开,找到 python 以后找到这个复制,随后打开设置,输入文件的页面,控制好,跟刚才一样, 找到这个 p a t h, 然后新建展览的位置粘贴, 粘贴好之后点切定,切定,切定好了,在酷达 windows 叉八的这个软件双击,可以直接在这个页面加载整个文件剪切,随后找到我们的 这个,在这个 took 里面直接把它粘贴替换目标文件, 这样的话我们整个康复 u i 前置环境就已经部署完毕了。好在我们所有的准备工作都做完之后,我们可以找到我们的康复 u i 在 那个启动, 在启动之前我们设置如果没有梯子的小伙伴,可以先将自己的灯先关掉,任何人的效底,只有找到版本管理, 将自己的版本更新到最新版本,点击切换确定,然后等待下载就可以了。

五月最新的秋叶 comfyui 整合包已经更新了,不用复杂的环境配置过程,只需三步一下载,二解压,三双击打开即可使用。支持 win mac 和 a 卡,最低幺零六零显卡显存八 gb 即可本地部署运行。和那些花钱还要排队的网站不同, comprise ui 这次的更新诚意拉满,内置三百加模型,工作流,图片和视频直接本地生成,无惧审核压力,不用积分,不用排队,也没有暗此暗月的计费套路。无论是做最近很火的漫剧分镜,还是工作需要的电商产品详情页, 还是创意十足的三 d 建模渲染,都是点一下的事,想试试的。老规矩,验个牌,现在开始教学, 各位同学好,我们这节课呢,来教大家如何第一次搭建工作流。相信大部分来学习 confluence 的 同学都是对 stable diffusion 的 操作有一定理解的,所以我们下面呢,就对比一下 stable diffusion 当中不同的操作模块,来帮助大家更深刻的认识 confluence 的 流程。是这样的, 我们先选择一个大模型文件,选择好之后呢,输入正反面提示词,然后设置输出尺寸。必要的时候呢,我们会选择一个插件模型, 选择好插件模型之后,我们点击生成,最终呢,在右下方就会生成一个我们符合提示词要求的内容。那么其实像大模型 ve 模型正反面提示词,生成图片时所使用的彩样器,以及生成时的输出尺寸插件,还有生成结果 在 confui 当中也是对应有相同功能的节点的,只不过这些节点呢,在 confui 当中,我们可以对其任意的移动位置删减或者复制或者新增一些其他功能的节点,来强化我们生成的结果。 所以相比于 stable diffusion 不 可动的模块, confui 当中的节点呢,它的灵活性会更强。至于在生成效果上,两者并没有特别大的区别,甚至它们使用的模型文件都是相同的。大家可以将 confui 呢理解成开发者版本的 stable diffusion, 它的自由度呢会更高一些。 我们下面来简单的介绍一下 ctrl y 的 基础操作。我们首先点击右下方的清除,将当前默认的工作流呢进行清除。清除之后,我们就得到了一个空白的操作台,我们右键界面当中的任意位置,然后点击新建节点, 就可以从中呢选择我们想要创建的功能节点,例如我们现在点击新建节点当中的彩样,点击创建 k 彩样器节点,那么这样一个具备 k 彩样器功能的节点就被我们创建好了。 相信从这个节点当中呢,大家不难看到在 stable devolution 当中,我们熟悉的参数,例如彩样器选项,提示词,相关性以及迭代部署。 我们在节点当中呢,还能看到很多颜色不同的小圆点,此时我们拖拽其中的一个小圆点,例如拖拽紫色的模型圆点, 拖拽后松开,可以看到此时就弹出了一个选项菜单,其中下方这个区域呢,是我们拖出这个圆点之后经常会创建的节点选项。因为我们拖拽 k 彩样器当中的模型圆点,通常呢会创建一个 checkpoint 加载器,简易的节点, 此时呢, checkpoint 模型加载器与 k 参照器这两个节点就以相同颜色的模型原点进行了相连,其他位置的原点呢,也是相同的逻辑。我们拖拽之后呢,选择我们需要创建的对应节点,那么两个节点当中相同颜色的原点就会进行相连。 此外,我们双击所创建节点的名称,可以看到此时它的名称呢,就变为了可编辑的状态,我们就可以对其名称进行重命名,比如我们给它起一个名字叫模型, 然后回车确定,这样名字就改好了。当然通常是没必要刻意修改这些节点的名称的,但有些时候呢,可能两个节点是相同的节点,只是功能不同, 所以需要对其修改名称。例如在 k 采集器当中,我们拖出正面条件,这个源点会创建一个叫做 clip 文本编码器的节点,这个节点是用来输入正面提示 词的节点,这两个节点是相同的节点,这 是一个连接正面提示词,一个连接负面提示词。所以有时候呢,我们就要对这样的情况对应的节点去修改名称。比如说把连接正面条件的这个节点呢,我们改名为正面提示词。把连接负面条件的这个原点的节点呢,我们改名叫做负面提示词。 不过平时自己用的话,即便是这样的情况,其实也没必要修改。我们点击之后可以选中这个节点, 选中之后呢,这个节点的周围会多出一些白圈来显示我们已经选中了这个节点。选中之后,可以对当前的这个节点呢进行拖拽,或者呢 ctrl 加 c 复制, ctrl 加 v 粘贴,再或者呢按 delete 键删除,跟我们在电脑上操作文件呢是非常类似的。 我们最后来简单介绍一下 confy 右下方的这个操作位置。首先最常用的就是点击添加提示词队列来开始运行工作流。我们创建好完整的工作流之后呢,点击这个位置就可以开始运行当前的工作流,这跟我们在 stable default 当中点击生成是一样的。 我们创建好一个完整的工作流之后,如果确定运行无误,你想保存的话呢,就点击这个模块当中保存的按键。点击之后呢,给这个工作流起一个名字,比如说我们起名叫 abc, 然后点击确认,此时我们这个工作流啊就会作为一个工作流文件下载到本地, 可以看到此时我浏览器的右上方呢,就已经成功的下载了这个工作流文件,拖拽到我们当前的浏览器 comui 的 操作页面就可以了。 另外就是我们刚才演示过的清除当前所有的工作流节点,我们点击清除,点击确认画面就清空了。当然我们同样是可以通过 ctrl 加 z 撤回刚才的操作的,或者呢按 ctrl 加 y 去重新执行刚才的操作。至于其他的功能不是特别常用,我们就不再赘述。 下面话不多说,我们来开始演示如何从零开始搭建一个完整的纹身图。工作流通常呢从原点最多的工作流节点开始搭建, 就是 k 彩样器,我们右键画面当中任意的空白处点击新建节点,点击彩样这个选项,从中呢点击 k 彩样器,我们创建一个 k 彩样器节点, 这个节点上面的原点是最多的,所以我们先创建它,将来创建其他的节点呢,调理会更加的清晰。我们下面拖拽 k 彩样器节点当中的模型原点, 拖出之后呢,松开我们点击创建 checkpoint 加载器简易这个节点,然后我们再次拖拽 k 彩样器当中橙色的正面条件源点,松开之后呢,点击创建 c l i p 文本编码器节点,负面条件源点呢,也重复刚才的操作。拖出之后呢,创建 c l i p 文本编码器节点, 然后我们继续对 k 彩样器这个节点上的源点呢进行拖出操作。首先拖出左侧的这个粉色的 lighten 的 源点, 拖出之后呢,我们点击创建这个叫做空 lighten 的 节点,这个节点呢是用来输入输出图片的尺寸的,那么最后呢,就只剩下一个原点没有拖出了,就是 k 彩样器右侧的这个粉色 lighten 的 原点,我们点击拖出,然后点击选择创建 ve 解码这个选项。 最后呢,我们点击拖拽 ve 解码这个节点当中图像的这个节点拖出之后呢,我们点击创建保存图像这个节点, 这样一来我们纹身图工作流所有的节点呢,就都已经创建完成了,但如果现在我们点击添加提示词队列来运行节点的话,可以看到 ctrl u i 呢会给我们一个十分明显的提示,告诉我们哪些节点是出问题的, 包括这个节点上面的哪些原点是没有进行连接的,所以我们就可以根据提示呢来继续补全我们当前的工作流。首先是两个 c l i p 文本编码器当中左侧的 c l i p 原点, 我们需要将其与 checkpoint 加载器节点当中的 c l i p 原点进行连接,连接好之后呢,我们再将 ve 解码器当中的 ve 这个原点,将其与 checkpoint 加载器当中的 ve 原点进行连接, 这样的连接逻辑其实很好理解,相同颜色的原点连接相同颜色的原点就可以了。最后我们选择一个合适的模型,写下我们需要的内容, 比如说 one go, 我 们点击生成可以看到此时我们就成功的生成了一个符合提示词描述的内容。那么至此呢,我们文生图的工作流就搭建完成了,相信各位同学只要跟着我们的视频一步一步的操作,都是能够搭建成功的。 即便在搭建过程当中出现了原点没有连接全的问题, comui 在 运行之后呢,也会给出一个明显的提示。 那么我们最后呢,来对康飞 y 的 工作流搭建进行一个总结。首先大多数情况下呢,我们从零开始搭建节点,都是要先创建一个 k 彩样器节点的,因为这个节点上面的圆点最多,我们创建好它之后呢, 将 k 彩样器节点上面的圆点拉出之后,往往只需要创建一个节点就可以,所以调理会比较清晰。各 同学可以把 ctrl y 的 操作理解成搭建台式电脑,像左侧的 c l i p 文本编码器, check point 加载器,还有 comlight 的 输入尺寸的节点,就相当于我们的键盘鼠标,我们将它们插在电脑的主机,也就是 k 测量器上面,通过 k 测量器进行运算,最终呢再输出到显示器上面, 这样来类比呢,相信各位同学对 control ui 的 节点连接逻辑就有了更贴近生活的体会。至于我们 stable default 的 操作逻辑非常的相似,也就是先选择模型,再输入提示词,再选择采用方法, 然后设置输出尺寸,最后点击生成,这是一个十分正常且完整的生成顺序。而在 control ui 当中呢,也遵循这样的顺序,例如此时我们更换一个随机种子,然后点击添加提示词队列, 我们可以看到绿色的位置啊,就是标注在生成过程中工作流运行的一个顺序。会先从 checkpoint 模型加载器开始 获取我们使用的模型信息,然后进一步的获取正反面提示词和输出尺寸,最后呢,将它们都集成在 k 彩样器,整合这些信息之后呢,由 ve 解码器进行解码,最后呢留下我们的保存图像这个工作流节点。 不过相信大家第一次接触 cfui 的 话,即便工作流能够搭建完成,其实对工作流运行的逻辑呢,也处在一个比较懵懂的状态。不过根据我的学习经验,大家学习 cfui 最好呢,能够本着先操作后理解的方式来进行学习。 我们前期从零开始教大家搭建工作流,也并非是为了今后你一直从零开始搭建,而是为了在不断的搭建当中愈发的理解 cfui 的 运行机制。 像在将来获取了其他作者所创建的完整工作流之后,我们也可以更加灵活地对其加以改进,使其符合自己的需求。对此呢,我也专门制作了一套课件,上面不仅展示了 stable diffusion 不 同的功能模块去对照 comfy 当中的节点的一个对照图, 同时也包含了我们课上所讲解的 comfy 基础操作知识以及工作流搭建流程,还有最后的总结。各位同学如果需要本节课的课件的话,也非常欢迎在评论区留言,我会尽可能的帮助大家解决在操作过程当中遇到的问题,同时也会发放这套课件。那么以上呢,就是本节课的全部内容, 各位同学如果觉得本节课的内容对你有帮助的话,也不妨点一个免费的一键三连支持一下,我们就下节课再见!各位同学好,我们这节课来讲解 confui 精细化纹身图工作流的第一部分。我们首先来说明一下什么是精细化纹身图工作流。 我们首先打开 stable diffusion, 相信熟悉 s d 的 同学呢都知道 stable diffusion 是 只有一个正反面提示词输入窗口的 们,此时在正面提示词窗口当中输入 one go 还有 right here, 然后选择一个合适的负面提示词模板,点击生成,可以看到此时我们就生成了一个符合提示词描述的结果。那么如果我们想要在画面当中生成两个人物,其中一个是红色头发的少女,一个是蓝色头发的少女, 正常的思路呢就是在提示词当中再追加对于另外一个少女的描述,也就是 one go blue hair。 剪好之后呢,我们再将画布的生成尺寸去拓展一倍,再次点击生成,我们可以看到此时生成的结果呢,并不是十分理想, 我们明明想要生成两个少女,但是画面当中却只有一个,而头发的颜色呢,是以红色和蓝色拼接形成的。 我们现在回到 confui, 打开我们预设好的工作流,也就是精细化纹身图工作流。相信此时部分同学已经猜想到了,既然 confui 相比于 stable default 能够更加灵活地去部署模块儿,也就是节点,那么我们就可以同时部署两个提示词的输入窗口, 来分别描述我们想要生成的两个人物,最后再通过一定的方法呢,将两个人物合并在同一个图像上,以此呢来避免 stable default 当中因为提示词无法做分割 而导致两个人物的特征同时出现在一个人物身上的情况。例如此时我们在 confui 当中,第一个正面提示词输入窗口呢,我们输入红色头发的少女,而第二个提示词输入窗口呢,我们输入蓝色头发的少女。 这些都输入好之后呢,我们点击添加提示词对列,可以看到我们此时生成的结果呢,左侧的人物就是红发的少女,而右侧的人物就是蓝发的少女。 由于这两个人物的提示词都是独立成一个节点的,所以并没有出现颜色之间相互混合,特征之间相互混合的情况,这就是精细化纹身图工作流的优点。 那么话不多说,我们下面就从零开始教大家如何搭建精细化纹身图工作流。我们首先新建一个空白的工作台,点击左上方的文件加图标,点击这个加号,新建好这个默认工作流之后呢,我们清空当前的工作流节点, 下面的操作就与我们之前所讲解的纹身图工作流操作十分类似了,我们依然在任意的空白位置,右键点击新建节点,点 击采样,然后点击 k 采样器。回想起我们上节课所举的类比, k 采样器呢,就好比电脑的主机,我们下面要把键盘,鼠标还有显示器都接到这个主机上,所以我们下一步呢,拖出模型这个圆点 松开之后呢,创建 checkpoint 模型加载器。与基础纹身图工作流不同之处在于,我们这次呢,从 clip 这个圆点上面拖出的内容一共有三个,也就是两个正面提示词输入窗口,以及一个负面提示词输入窗口。 当然如果各位同学想要拖出两个负面提示词输入窗口也是可以的,但通常负面提示词是通用的,所以我们只拖出一个负面提示词窗口就可以。 我们回到 k 彩样器这个节点,从 latent 源点当中呢,我们依然拖出一个节点,叫做空 latent, 用来输入输出图片的尺寸。大家在拖出节点之后呢,最好整理一下它们摆放的位置, 这样将来在拖出其他节点时,调理会更加清晰。然后我们继续从 k 彩样器右侧的 latent 源点当中拖出,选择建立 ve 解码,然后再从 ve 解码这个节点当中拖出图像,选择保存图像这个节点, 然后我们回到 ve 解码这个节点,将 ve 源点与 checkpoint 加载器当中的 ve 源点呢进行相连,这两个是相同的颜色,都是红色的, 我们下面要创建一个之前的课程当中没有提到过的节点,它的名字叫做条件采样区域节点。对于这样的节点呢,我们可以直接双击画面当中的空白区域,打开搜索选项,在搜索选项当中搜索它的名称,我们就搜索条件采样 区域。值得一提的是,旧版的 comui 是 不支持搜索中文的,各位同学需要更新到新版的 comui 才能搜索中文。 我们选择搜索结果当中的条件区域彩样这个选项,这个节点呢,一共要创建两个,所以我们复制当前创建好的条件彩样区域节点, ctrl 加 c, 然后 ctrl 加 v, 粘贴一个一样的, 然后我们分别将条件采纳区域两个节点上面的条件左侧的条件呢,与 clip 文本编码器右侧的条件相连,就连接到两个正面提示词 clip 文本编码器右侧的条件原点上。 连接好之后呢,我们再次双击空白的区域,搜索一个叫做条件合并的节点,搜索到之后呢,我们点击创建,然后我们将两个条件采纳区域右侧的条件一,条件二原点相连,它们的颜色也是一样的。 连接好之后呢,我们的所有节点就都已经创建完毕了,剩下要做的操作就是将那些没有连接好的原点进行相连,逻辑也非常简单,相同颜色的原点连接相同颜色的原点。首先将条件合并当中,右侧的条件原点连接到 k 采集器的正面条件原点上。 最后呢,再将我们要输入负面提示词的 c、 l、 i、 p 文本编码器节点右侧的条件源点连接到负面条件源点上。这样一来我们康复 ui 精细化文声图工作流的第一部分就搭建完成了,我们现在点击添加提示词队列来测试一下, 可以看到我们整个的工作流呢是没有出现报错的,但是生成的结果呢,并非我们一开始所演示的那样的结果,其原因在于我们并没有设置合适的参数。所以我们最后呢来讲解一下如何设置合适的参数,让我们想要生成的内容出现在合适的位置。 首先我们要设置的是最终所生成的图像的宽高,在空 light 的 这个节点上面,我们将生成图片的宽度呢,从五百一十二的默认宽度改为一零二四。当然这个参数呢要根据大家的需求来决定,我们测试的话就设置的稍微小一些。然后我们要设置的是条件参照区域节点上面的参数。 各位同学可以把精细化纹身图工作流理解成我们分别生成的两张图片,生成之后呢,再将这两张图片合并为一张图片,其中传统的 konlighten 这个选项呢,设置的是总图片的尺寸,而两个条件参照区域节点上面设置的尺寸呢,则是合并之前两张图片各自的尺寸。 所以我们首先来设置第一张图片的尺寸,我们就设置为五百一十二乘五百一十二,第二张图片的尺寸呢也是相同的,五百一十二乘五百一十二,这样两张图片加起来的尺寸呢,就可以满足一零二四乘五百一十二的尺寸。 其次我们要设置的是第二张图片在画面当中的坐标,由于第一张图片生成时默认的坐标就是从左到右,从上到下,从零 零开始这样一个坐标,因此第一个按默认的坐标就可以,也就是 x 零 y 零。各位同学可以在脑海中构建一个坐标轴,只有两个方向, x 和 y。 那 么第二张图片呢,就要摆放在第一张图片的顺位位置,与 其相连。那么首先第二张图片在高度上是没有进行移动的,两张图片的关系呢,我们设置的是横向摆放,所以第二张图片的 y 呢,和第一张图片是一样, 都为零。但是第二张图片需要向右平移一个图片一的身位,所以此时第二张图片的条件采用区域 x 值呢,我们就设置为五百一十二, 然后点击确定。这样两张图片呢,就是从左到右依次摆放,横向摆放的关系最终生成后合并在一起。提示词方面呢,我们就套用之前所使用的提示词,也就是第一张图片生成红色头发的少女,我们输入 a girl 还有 red hair。 而第二张图片呢,我们来生成蓝色头发的少女,输入 a girl 还有 blue hair。 写好之后呢,我们再次点击添加提示词队列,可以看到此时我们生成的结果呢,就是一个总尺寸为一零二四乘五幺二,左侧五幺二乘五幺二的尺寸为一个红头发的少女,而右侧五幺二乘五幺二的尺寸为一个蓝头发的少女,他们之间紧密相连的关系了, 并且两张图片的人物造型呢,互不影响,独立存在,这都要归功于我们创建的两个独立的正面提示词窗口。 当然各位同学在创建的时候呢,也不推荐去死记硬背,可以跟着我们的视频一步一步的来创建精细化纹身图的工作流。 我们再次强调,教大家逐步创建工作流的目的并不是为了让你去死记硬背,而是为了让你在不断的练习当中能够理解 comfyui 的 运行机制,能够在将来获取到一些其他作者现成的工作流之后,更善于自己加以改进,为自己所用。 不过话说回来,各位同学可以看到我们当前生成的两个人物,虽然说彼此独立,互不干涉,但他们的融合程度也非常的低,两个人物呢,并非处在同一个背景上,有着非常强烈的割裂感, 那我们该如何既能保障两个人物的造型相互独立,互不亲染,同时又能保障人物处在同一个背景上,让他们相互融合的自然呢?这个知识就留给各位同学思考,我们在下一个视频当中呢,会详细的讲解如何将精细化纹身图工作流当中人物的背景在生成时变为统一的背景。 同样针对于本节课的知识呢,我也制作了一套完整的课间,这面不仅说明了精细化文生图工作流的逻辑,同时也有详细的精细化文生图工作流搭建的过程, 还有最终搭建好之后的全貌展示。同时本节课的康复 ui 搭建好的工作流文件呢,也会发放给大家,各位同学有任何的问题非常欢迎在评论区留言,我会尽可能的帮助大家解决问题,同时也会发放本节课的相关资料。那么以上呢,就是本节课的全部内容, 各位同学如果觉得本节课的内容对你有帮助的话,也不妨点一个免费的一键三连支持一下,我们就下节课再见。各位同学好,我们这节课呢,来讲解 cfui 精细化纹身图工作流的第二部分。 相信各位同学通过上一节课的学习呢,已经掌握了如何从零开始去创建一个完整的精细化纹身图工作流。通过这个工作流,我们一共创建了两个正向提示词输入节点,这两个节点的提示词内容不同,我们最终生成的结果也通过合适的参数设置, 使得两个提示词输入节点生成的角色出现在了同一幅画面上,同时也在设计上并没有相互的亲染和干扰。 但在我们上一节课的结尾呢,也发现我们生成的这两个人物呢,他们虽然在设计上并没有相互的干扰,但与此同时在背景上也毫无关联。所以我们今天这节课的目的就是来教大家如何去对我们上一节课所设计的工作流加以改进,使得我们的人物在背景打光和氛围上能够更加的和谐统一。 我们下面就来讲解一下如何去对我们上一节课的工作流进行改进,来新增一些节点,使我们获得更加理想的效果。 我们首先在上一节课工作流的基础上,在 check point 加载器这个节点上拖出 c l i p 原点,拖出后松开,我们新建一个 c l i p 文本编码器节点。需要说明的是,我们建立的这个新的 c l i p 文本编码器节点,就是用来负责描述这两个人物同时出现的统一背景的 说,我们希望这两个人物都出现在一个街道上,那我们新增的这个节点内容呢,就填写街道,然后我们复制当前工作流当中的条件合并节点,复制好之后粘贴,然后将我们刚才新增的 c l i p 文本编码器右侧的条件源点连接到我们刚刚复制粘贴的这个条件合并节点当中的条件一源点上。 之后,我们将原本连接在 k 彩样器正面条件的这条线设为取消状态,也就是点击拖拽之后松开,然后将原本的条件合并节点右侧的条件源点连接到我们新增的条件合并节点下方的条件二源点上, 我们稍微调整一下这些节点的位置。那么此时呢,各位同学不难看出,在原先工作流的基础上,我们通过这样增加节点连线的方式, 我们描述红色头发女孩的正面提示词节点与描述蓝色头发女孩的正面提示词节点在进行条件合并之后,并不会直接传输到 k 彩样器,而是先与描述背景的正面提示词节点进行了一次合并。最终呢,我们才将整合后的信息连接到了 k 彩样器的正面条件源点上。 就相当于我们先炒了两盘菜,我们生成的红色头发的少女呢,就好比番茄炒蛋生成的蓝色头发的少女呢,就好比烧茄子。在上一节课我们所创建的工作流当中,我们将番茄炒蛋和烧茄子炒好之后,仅仅是装在了同一个盘子里就端上了桌。而我们今天所创建的工作流 在上一节课的基础上,将番茄炒蛋和烧茄子重新倒回了锅中,加入了新的作料,最终呢才端上了盘子。这样我们的生成结果,两个人物的背景呢就会更加融合。 那么话不多说,我们来尝试一下。现在的工作流呢,已经完全连好了,我们在新创建的正面提示词工作流当中写入街道 street 以及夜晚 night。 写好之后呢,我们点击添加提示词队列。那么此时各位同学可以看到, 我们改造之后的工作流就成功的将两个造型特征不同的少女既进行了造型上的区分,两个人的设计完全独立,同时让他们都出现在了同一个背景当中。当然我们可以追加一些负面提示词,以谋求更好的效果。那这里呢,我就沿用 stable diffusion 当中的负面提示词,我们重新生成一遍, 看到有了更好的负面提示词的加持,我们就获得了生成人物更好的效果,并且两个人物的背景依然是和谐统一的。当然生成的结果是随机的,各位同学可以更改随机种子,以谋求更符合需求的效果。 那么到这里呢,我们的精细化纹身图工作流,它的完全体版本就搭建完成了。当然如果我们想要在画面当中不仅生成两个人,而是要生成三个人,四个人,各位同学可以举一反三,在我们当前的工作流基础上,进一步的去增加描述人物所用的正面提示词节点, 并且用条件采样区域以及条件合并工作流节点去将它们整合,最终连接到 k 采样器上。具体的创建方法呢,我就不再演示了,各位同学自行尝试之后如果遇到问题也非常欢迎在评论区交流,我会尽可能的帮助大家解决在操作过程当中的问题。 我们下面对先前没有提到的康复 ui 的 基础操作知识做一些补充,我们之前只讲解了点击右下方的保存,将当前所操作的工作流保存到电脑本地。 但是各位同学会发现,我们点击左侧的文件夹图标在这里呢,我也创建了很多在 comui 操作界面就可以直接选举的工作流,比如我们选举这个换脸的工作流就可以直接打 开。那我们该如何将当前操作的工作流保存到 comui 上面,让我们直接打开工作台就可以选择自己想要操作的工作流呢? 方法也非常简单,首先我们点击左上方的文件加图标,将其展开,然后我们点击这里的加号键,就可以新建一个工作流。这个工作流呢是默认的纹身图工作流, 如果你不需要的话,可以直接按住 ctrl 键不要松开,然后拖拽工作台,将这些工作流全选,然后按 delete 键删除,再重新从零开始建立或者拖拽新的工作流, 我们撤回一下。就以当前的纹身图工作流为例,例如此时呢,我们已经对当前的纹身图工作流进行了一定的修改,那么此时各位同学可以看到,在这个位置就出现了一个保存图标,叫做 save work flow, 我 们点击这个图标就可以保存当前的工作流。 此时我们再次点击左上角的文件夹图标,展开下拉菜单,可以看到在这个位置呢就出现了一个叫做 united flow two 这样一个名称,这个名称呢就是我们当前正在操作的工作流的名称,我们也可以点击这个名称去进行重命名, 比如说我们给它起一个名字叫做 abc, 然后点击 save, 那 此时我们再次展开左上角的文件夹图标,可以看到当前呢就有一个名为 abc 的 工作流被保存到了我们左上角的展开图当中。那么我们现在先切换到其他工作流,然后再次点击左上角的文件夹展开, 再次点击 abc, 此时我们就可以看到我们刚刚所保存的名为 abc 的 工作流了。除此之外,各位同学可以看到这些工作流当中某一些呢是带有预览效果图的,甚至还有一些是动图,那么这些图片是如何产生的呢? 其实也非常简单,我们选择一个合适的模型,然后直接点击添加提示词队列去生成一张图片,那么生成好之后呢,我们再次点击左上方的保存图标,此时我们再展开左上角的文件夹,可以看到我们当前名为 abc 的 工作流就多出了一个我们现在所生成的预览图。 我们再来补充一下对于工作流节点的相关操作。首先是如何一次性选中多个工作流节点,方法非常简单,我们按住键盘的 ctrl 键不要松开,然后用鼠标点击工作台当中的任意空白位置 进行拖拽,那此时会出现一个白色的选框,选框内所含盖的节点呢?我们在松开手之后都会被选中,可以看到是有选中的效果的, 那么此时呢,我们进行任意的操作,都可以对我们当前选中的工作流节点进行操作,比如按 delete 键可以看到我们当前选中的所有节点呢就都被删除了。 如果我们不想选中相邻的节点,想要跳跃的进行选中的话,就按住键盘的 ctrl 键,不要松开,依次的点击我们想要删除或者操作的节点,因为我们先选择 checkpoint 加载器,再选择保存图像节点,可以看到此时呢,这两个节点也被同时选中了。 我们最后再来讲解一下如何对节点赋与颜色,以及如何对功能相似互相搭配的节点进行分区。想要给节点赋与颜色,我们只需要右键点击这个节点, 点击之后呢,我们在右键菜单当中选择颜色,然后在颜色展开菜单当中,我们选择自己需要赋予的颜色就可以了。例如我们现在点击红色,可以看到此时 checkpoint 加载器这个节点就被变为了红色。当然我们在操作时,由于是多选的状态,所以保存图像这个节点呢也被变为了红色。 我们现在右键工作台当中的空白处,然后点击新建框这个选项,点击之后呢起一个名字,例如这个名字呢,我们就叫提示词,写好之后回车确定,此时可以看到我们新建的这个框,它的名字呢就被改为了提示词。 我们可以通过鼠标拖拽的方式改变这个新键框的位置,通过拖拽其右下角的方式改变它的尺寸,此时我们将这个新键框拖拽到 c l i p 文本编码器的下方,那么当我们再次拖拽这个蓝色的新键框时,各位同学可以看到,但凡是出现在这个新键框上方的节点呢,都会被随着一起 拖动,但如果我们此时所拖动的是节点本身的话,那么这个新键框是不会为之所动的。利用这个特性呢,我们将这个新键框拖拽到合适的大小,以涵盖我们想要的内容。 给我们拖拽到这个大小,再将 c l i p 文本编码器下方的这个框拖拽到合适的位置。这个新建框功能呢,就相当于给我们的工作流当中同类型的节点做了一个区域的划分,让操作者或者说使用者在编辑当前工作流时, 能够更容易的判断这些部分的工作流它的用途是什么。其实并没有什么实质性的功能作用,各位同学平时自己做工作流的话,没有必要做这些。 那么针对于本节课的内容呢,我也制作了一套完整的课件,上面以图文教程的方式讲解了我们本节课所讲解的相关知识点, 同时也包含了我们刚刚所提到的康复 u i 基础操作知识的补充。各位同学如果需要本节课的课件的话,也非常欢迎在评论区留言,我会尽可能的帮助大家解决问题,同时也会分享这节课的课件。那么以上呢,就是本节课的内容,对你有帮助的话,也不妨点一个免费的一键三连支持一下, 那就下节课再见。各位同学好,我们这节课呢,来讲解 confui 当中文声图 controlnet 工作流的搭建。在 stable diffusion 当中,我们使用 controlnet 的 时候,不仅要选择 controlnet 的 模型,同时也要选择对应的 controlnet 与处理器。因此我们在 controlnet 当中,我们要想搭建具备 controlnet 功能的工作流,同 同样要先搭建 controlnet 预处理器的工作流节点,那么我们下面呢就新建一个空白的工作台,新建好之后呢,将默认的工作流进行清除。然后首先呢来搭建一个 controlnet 的 预处理器,方法呢也非常简单,我们双击工作台空白的位置, 然后从中搜索我们想要搭建的预处理器名称。比较熟悉 stable definition 的 同学都知道,我们常用的模型预处理器呢,通常就是 canny 边缘检测、 deep 深度检测以及 line art 线稿检测, 有时做室内设计时呢,还会用到 m l, s d 直线检测。如果记不起这些名字的话,可以回到 stable default 的 ctrl n 的 插件看一眼, 然后我们回到 comui。 比如我们此次呢来建立一个 kenny 线稿检测的预处理器,我们就在搜索栏当中搜索 kenny, 然后选择搜索结果当中的 kenny 细致线预处理器,点击之后呢创建这个节点,创建好之后,我们将左侧的图像源点拖出,然后点击创建加载图像节点, 这个位置呢是我们用来放置现稿参考图的,同时我们将 kenny 细致线域处理器节点右侧的图像源点拖出。我们创建一个保存图像节点,这个节点呢是用来放置提取现稿之后的预览效果图的。 六、此时呢,我们直接点击添加提示词对列,就可以看到在保存图像节点当中出现了左侧我们所上传图像的现稿提取结果 么?创建好了与处理器相关的节点,我们下面就从您开始搭建一个纹身图的 control net 工作流。我们首先搭建一个正常的基础纹身图工作流, 那么就直接双击空白处,然后我们搜索 k 彩样器来创建一个 k 彩样器节点。创建好之后呢,按照我们第一节课所教授的流程, k 彩样器当做主机,我们从上面的圆点当中呢去接触键盘鼠标显示器,拖出模型圆点之后,我们点击创建 checkpoint 模型加载器节点,然后分别拖出正面条件源点,创建 c l i p 文本编码器,拖出负面条件源点,创建 c l i p 文本编码器。 然后左侧的 lighten 的 源点拖出,我们创建空 lighten 的 节点,用来设置输出图片的尺寸。而右侧的 lighten 的 源点我们拖出后呢,创建 ve 解码器节点, 最后再将 ve 解码器节点右侧的图像源点拖出,我们创建保存图像节点。最后呢,将 ve 解码节点当中的 ve 源点与 checkpoint 加载器节点当中的 ve 源点两个相同颜色的源点相连。 最后适当调整一下这些工作流节点的位置,让他们看起来呢更加整洁好看。调整好之后呢,我们基础的纹身图工作流节点就全部创建完成了。我们下面要考虑的事情呢,就是将 control night 以及我们刚刚创建的与处理器相关的节点都融入到我们当前的纹身图工作流节点当中。 这里建议大家不必有过多的思考,跟着我们的视频教程边暂停边做就好,等做完之后呢,我们再去尝试理解其中的逻辑。我们首先双击工作台空白处任意的位置,然后搜索 content 应用,然后点击搜索结果当中的 content 应用这个选项,创建 content 应用节点。 当然 controlnet 应用这个节点呢,有很多种不同的版本,但是其中包含的源点都是相同的,因此各位同学在观看视频教程时,只要保障自己创建的 controlnet 应用这个节点包含了我们视频当中所提及的源点内容,就可以 多出的部分呢,可以暂且不管,我们下面将 controlnet 应用当中左侧的正面条件源点连接到正面提示词的 c l i p 文本编码器节点右侧的条件源点上,而 controlnet 应用节点右侧的正面条件源点,我们则连接到 k 彩样器的正面条件源点上。 此时原本正面提示词 c i p 文本编码器节点当中的条件源点与 k 彩样器正面条件源点的相连关系就断开了。这就意味着我们的内容生成之前,会先经过 controlnet 应用这个节点,使我们的 controlnet 能够发挥效果后再抵达 k 彩样器。 我们下面将 controlnet 应用节点左侧的 controlnet 圆点拖出后松开,然后在弹出的窗口当中,我们点击 defcontrolnet 加载器这个选项,创建 defcontrolnet 加载器这个节点。这个节点的功能呢,就是用来设置 controlnet 模型的,我们点击这个节点的内容后呢,会出现一个下拉菜单 们此次要使用的 control net 功能是线稿检测,所以我们选择 kenny 这个模型。我们下一步呢,将 control net 应用这个节点左侧的图像原点连接到 kenny 与处理器这个节点右侧的图像原点上。这一步操作之后呢,我们的参考图就与 control net 之间发生了关联, 我们的 control 相关的节点能够读取到参考图的内容。我们最后一步呢,就是将 diff control 加载器节点左侧的模型原点拖出之后呢,连接到 checkpoint 加载器节点当中的模型原点上。这样一来,我们的文声图 control 工作流就搭建完成了。 我们现在选择上传一张线稿作为参考图,然后选择一个合适的大模型。因为是二次元的线稿,所以这里呢,我选择一个二次元风格的大模型。提示词方面呢,就尽可能描述贴合线稿的内容,我们就书写 one go 还有狐狸耳朵 fox ear。 对 于负面提示词呢,我们就将 stable diffusion 当中的负面提示词模板直接粘贴过来。全部设置完成之后,我们点击添加提示词队列, 可以看到此时我们的工作流当中呢,出现了一些报错。很明显,我们的正面提示词与负面提示词左侧的 c l i p 并没有与模型这个节点相连, 所以我们现在根据提示呢,将这些缺失连接的原点进行相连。其中负面提示词 c l i p 文本编码器右侧的条件原点与正面 c l i p 文本编码器提示词的右侧条件原点相连的思路是类似的, 我们先将其连接到 controlnet 应用这个节点左侧的负面条件源点上,然后再将 controlnet 应用节点右侧的负面条件源点连接到 k 彩样器的负面条件源点上。最后我们点击添加提示词对列,可以看到此时呢我们就成功的生成了一幅根据我们所上传的现稿参考 而得到的一幅有着狐狸耳朵的二次元动漫风格的人物。这里图片尺寸呢,我们可以设置的稍微高一些,将高度呢设置为六百,然后再次点击添加提示词对列,这样我们就获取了一幅更加完整的生成结果,可以看到效果还是相当不错的。那 那么以上呢,我们的 comui 纹身图, controlnet 相关的工作流就全部搭建完成了,我们最后来补充一些关于下载节点相关的知识。其实从我们上一节课开始呢,我们就用到了一些当前我们所使用的 comui 版本并不具备的插件节点, 那么这些新增的插件节点如何下载呢?这里提供三个下载方式。首先第一个下载方式呢,就是我们打开会事启动器,然后点击版本管理, 在上方的分页当中,我们选择安装新扩展这个选项,在这里呢搜索我们想要下载的节点插件的名称,然后点击安装,就可以在会式启动器当中安装新的插件。不过需要注意的是,某些版本可能会出现异常的 情况,导致我们无法在这个位置加载相应的插件,比如说我当前的版本这个功能就失灵了,各位同学呢,可以尝试更换版本。第二种方式呢,是比较稳妥的方式,我们直接在 github 上面来手动的下载相关的插件节点, 我们抵达对应的页面之后呢,点击绿色的 code 选项,在下拉菜单当中,我们选择 download zip 下载压缩文件,最后解压到 confui 根目录当中的 custom nodes 专门放置节点插件的文件夹当中就可以。不过这个功能呢,需要大家有一个特殊的用网 环境,如果你不了解如何使用特殊的用网环境,也非常欢迎在评论区留言,我会尽可能帮助大家解决这个问题。第三种方式呢,就是在 confui 的 操作页面当中,我们点击右下方的管理器, 在弹出的窗口当中,我们点击节点管理这个选项,然后在左上方的下拉菜单当中,我们选择所有这个选项,这样就可以展示出我们当前所有可下载的插件节点,在这个位置呢,搜索相应的名称便可以获得对应的结果。例如我们搜索 control night, 可以 看到直接呢就蹦出了跟 control night 相关的选项,对于那些没有安装的插件节点,我们直接点击这里的 instyle 即可安装,安装成功之后呢,重启一下就可以使用了。 对于本节课的内容呢,我也制作了一套完整的课件,课件上以图文教程的方式讲解了我们今天课上所讲解的全部知识。各位同学如果需要本节课的课件的话,也非常欢迎在评论区留言,我会尽可能的帮助大家解决问题, 同时会分享本节课的课件。那么以上呢,就是本节课的全部内容,各位同学如果觉得本节课的内容对你有帮助的话,也不妨点一个免费的一键三连支持一下,我们就下节课再见! 各位同学好,我们这节课来讲解 comfui 图生图工作流搭建我们都知道在 stable default 当中是有图生图的功能的, 我们将图片导入到图生图的预备窗口,写上合适的提示词,调整合适的生成尺寸与重绘幅度,然后点击生成。生成的结果呢,就会根据我们当前所书写的提示词以及重绘幅度,根据所选模型的风格 原图为蓝本进行重新生成。生成时我们所选的重绘幅度越高,那么生成的结果呢,就越与原图相去甚远。反之,生成的重绘幅度越低,生成的结果呢,就与原图越相似。 同样在 comui 当中,我们在文生图工作流的基础上,加入图片上传节点 v a e encode 节点、蒙版节点、尺寸设置节点 control net 节点,即可创建一个相对完整的图生图工作流。同时我们本节课也会讲解一下,除了局生成之外,如何在 comui 当中创建局部重绘的工作流, 也就是我们可以通过选区笔选择我们需要重新生成的部分,然后再次点击生成。此时我们生成的结果只有在原图当中所选择的区域会受到影响发生改变,而未选择的部分则会维持原状,与原图保持相同。 那么话不多说,我们下面就来详细的演示一下。首先打开 comui, 我 们新创建一个工作台。由于在先前的课程当中,相信大家已经非常熟悉基础文生图工作流该如何从零创建了,所以我们这次就不再从零开始, 我们以当前默认的纹身图工作流为基础来添加相关的节点创建图生图工作流。首先我们双击工作台的空白处,然后搜索加载图像,点击创建加载图像节点,这是用来专门上传原图的节点。我们将加载图像节点当中的图像原点拖拽后松开,然后点击创建 v a e 编码节点, 然后我们再将 ve 编码节点当中的 laten 的 原点拖出后,连接到 k 彩样器左侧的 laten 的 原点上,这时我们原先的空 laten 的 节点就处在不可用的状态,因为我们此次创建的工作流是一个全局生成,工作流生成的结果在尺寸上将与原图保持一致,因此不需要设置输出尺寸的大小。 我们下面将 ve 编码节点左侧的 ve 原点拖出,连接到 checkpoint 加载器当中的 ve 原点上。这样一来,我们的图生图工作流就创建好了。 我们现在选一个合适的模型,例如原图是写实风格的,我们就选择一个偏二次元风格的模型。选择好之后呢, k 彩样器当中最后一个选项降噪,对应的就是 stable diffusion 当中的重绘幅度,我们通过调整降噪这个属性的大小来控制生成的结果与原图的相似程度。 例如此时我们将降噪调整为零点三,然后点击添加提示词对列,可以看到我们再次将降噪选项调整为零点九, 然后点击确定添加提示词对列,可以看到我们此时生成的结果呢?虽然有原图的影子,但是更多听从了提示词当中的描述,生成了包含有瓶子内容的结果。如果我们在生成的时候想要调节生成的尺寸, 也可以将编辑尺寸的节点添加到我们当前的工作流中,相信经过之前的练习,各位同学对这个 laten 的 节点已经非常熟悉了,通常呢,它就是用来连接设置尺寸的节点的,但是我们可以看到原先的空 laten 的 节点,它只有一个 laten 的 原点,也就是单向的。 而我们加入了加载图像节点之后,需要有一个双向连接的 latent 节点,才可以保证加载图像会经过图片尺寸设置节点再抵达 k 采集器。所以我们此时双击空白的工作台, 然后搜索 latent, 我 们从中选择 latent 的 缩放这个选项,创建 latent 的 缩放节点,可以看到此时 latent 的 缩放节点上面有两个 latent 的 圆点, 我们将左侧的 latent 原点连接到 ve 编码节点当中的 latent 原点上,而右侧的 latent 原点连接到 k 采集器当中左侧的 latent 原点上。 此时我们不难发现,在加载图像这个节点当中的数据抵达 k 采集器之前,会先经过我们创建的 latent 缩放这个节点去进行图片尺寸的分割,最终才会输出对应的结果。我们现在再次点击添加提示词对列, 可以看到此时生成的结果,在尺寸上就是符合 lin 的 缩放节点当中所输入的五幺二乘五幺二的正方形尺寸。我们现在将降噪调整为零点一,然后点击确定,点 击添加提示词对列,可以看到当前对于原图的缩放模式呢,是以拉伸压缩的方式进行缩放的,如果我们需要对原图进行裁剪后输出结果, 我们可以将 laten 的 缩放这个节点最下方的裁剪这个选项,点击之后呢选择中心,然后再次点击添加提示词对列,可以看到我们此时生成的结果就是以裁剪的方式对原图进行分割,并根据参数输出对应结果。那么以上就是我们如何搭建一个图生图全区生成的工作流, 我们下面再来讲解一下如何搭建图生图局部重绘工作流,我们就以当前搭建好的内容为基础进行搭建, 要想在我们当前工作流的基础上加入局部重绘的功能,我们只需要替换当前工作流的一个节点就可以,也就是 ve 编码这个节点,我们双击工作台的空白处,然后搜索 ve, 从中我们点击创建 ve 内部编码器节点,有了这个节点呢,我们就可以对原图进行局部重绘的操作, 具体的连接方式呢,就是将图像这个原点连接到加载图像当中的图像原点中,而内部编码器节点当中的 ve 原点就连接到 checkpoint 加载器当中的 ve 原点上。内部编码器当中的遮照原点我们就连接到加载图像的遮照原点上, 最终 laten 的 原点呢,就连接到 laten 的 缩放左侧的 laten 的 原点上。此时原先的 ve 编码节点我们就可以进行删除了, 我们下面调整一下各个节点的位置,使他们的调理更加清晰。我们下面就来演示一下如何进行局部重绘操作来使用局部重绘工作流。首先右键加载图像节点当中的图像,我们从右键菜单当中选择在遮罩编辑器中打开, 此时会弹出一个新的窗口,而我们的鼠标呢,也会变成一个画笔工具,用来选择需要重绘的区域。在左下方的滑块当中,我们可以选择画笔的大小。 选择好合适的大小之后,我们按下鼠标选择需要重绘的部分,比如我们当前选择人物的脸的部分。选择好之后呢,点击窗口右下方的 save to node。 此时我们加载图像窗口,当中的图像就被替换为了一个有遮照的图像, 选中的区域就是人物脸的部分。我们下面调整合适的重绘幅度,例如调整到零点三左右,然后点击生成。可以看到此时生成的结果呢,就与之前的局生成有了些许区别。但 值得注意的是,我们生成的结果并不理想,这是由于我们当前 k 彩样器的默认重绘方法为浅空间去噪,所以使用局部重绘,重绘幅度呢,需要在零点八到一之间,因此我们将当前的降噪选项改为零点八。然后重新点击添加提示词队列, 可以看到此时我们生成的结果呢,才符合了提示词的描述。我们将提示词更换为我们想要生成的一个女孩的提示词, 然后重新点击生成。可以看到这次生成的内容呢,就更加倾向于一个与人物的身体相契合的脸了。当然这样的结果也并非十分理想,这也得益于浅空间去造的特性,并不会基于原图来生成对应的结果。生成的图像呢,完全是根据周边未选中的环境进行生成的, 所以我们最后来讲解如何在图生图当中加入 control 节点,以此呢来保持生成的结果,即便在浅空间去造的模式下,依然能够维持与原图的高度统一,或者说参考原图, 我们依然以当前的节点作为蓝本,在此基础上创建新的节点。已完成 controlnight 图生图局部重绘工作流。首先双击空白处,我们搜索 controlnight 应用,然后点击创建 controlnight 应用节点, 这个节点在我们之前文生图 controlnight 工作流当中创建过,相信大家还是比较熟悉的。具体的连接方法呢,就是我们将 controlnight 应用节点当中的正面提示词 c l i p 文本编码器右侧的条件源点 连接到负面提示词 c l i p 文本编码器右侧的条件源点上。对应的 controlnet 应用节点右侧的正面条件源点以及负面条件源点均连接到 k 彩样器当中的正面和负面条件源点上。这样一来,正反面提示词在抵达 k 彩样器之前就会先进行 controlnet 的 处理。 我们下面将 ctrl nite 应用节点当中的 ctrl nite 圆点拖出,松开。之后呢,我们创建 def ctrl nite 加载器节点,这个节点是用来选择 ctrl nite 模型的。我们此次使用的模型呢是线稿检测模型,所以选择 line art 或者 kenny 都可以,为 这让生成的结果更加柔和。我们此次选择 line art 创建好之后呢,我们将 diff control net 加载器节点左侧的 model 原点连接到 checkpoint 加载器当中的 model 原点上。我们现在还缺少两个原点没有进行连接,那就是 control net 应用节点当中的图像原点和 v a e 原点 中。图像原点呢,我们连接到加载图像当中的图像原点上,这样我们的参考图呢,就导入了 control net 当中,而 v a e 原点呢,我们就常规的连接到 checkpoint 加载器节点当中的 v a e 原点上。其实到了这一步, control net 节点已经可以发挥其效果了, 但是并不具备输出检测图的功能。如果各位同学想要预览一下是否对原图检测成功,我们还可以加入一个预处理器节点。 我们现在双击工作台的空白处,然后搜索 line art, 点击创建 line art 艺术线预处理器节点,我们将这个节点当中左侧的图像原点连接到加载图像当中的图像原点上。而右侧的图像原点呢,我们可以直接拖出后松开,创建一个预览图像的节点。这个节点呢,是用来放置检测图。 那么我们现在万事俱备,点击添加提示词队列来生成一下,看看效果如何呗。那么此时各位同学可以看到,有了 line in art 现稿检测的加持,我们最终的生成结果,人物的五官特征是相对契合原先的身体的,但生成的效果呢,并不是很明显。 我们可以尝试更换模型以谋求更好的效果。例如,我们将当前的模型呢,更换为一个生成效果较明显的模型。同时为了确保更好的效果,我们将 stable fusion 当中也粘贴到 comui 当中。不, 图片的生成尺寸呢,也尽可能与原图保持一致。我们修改一下输出的尺寸,最后再次点击添加提示词对列。此时各位同学可以看到我们这次生成的结果,人物的面部就根据我们当前所选的模型进行了二次原画风格的转变,而身体的其他部分呢,依然保留了原图的内容。 与此同时,面部的生成与身体之间的契合度呢,也远远高于我们之前未创建 control 的 工作流时的契合度。这就是由于我们添加了一个线稿检测,它会检测原图人物的面部线条,以此来更加规范的生成我们所选区域脸的位置, 以避免我们之前出现的脸生成的方向与身体并不契合的结果。这样一来,即使我们的 k 彩样器使用的是浅 充铅降噪,也不用担心生成的部分与原图的身体毫无关联的情况出现了。针对于本节课的内容呢,我也制作了一套完整的课件,上面以图文教程的方式讲解了我们本节课的相关知识。各位同学如果需要本节课的课件的话,也非常欢迎在评论区留言,我 会尽可能的帮助大家解决在操作过程当中遇到的问题,同时也会分享这套课件。那么以上呢,就是本节课的全部内容,各位同学如果觉得本节课的内容对你有帮助的话,也不妨点一个免费的一键三连支持一下,我们就下节课再见!

注意,这并不是标题党视频,而是实打实的 ai 干货教程。为了方便大家学习,教程内涉及到的相关资料和学习案例我都给大家整理好了,老规矩,验个牌试试。首先找到你下载好的压缩包,用鼠标右键点击它, 在弹出的菜单里选择解压软件解压,然后点击解压到当前文件夹,等着解压完成就好。解压后的文件夹里,之前有使用过 s、 d、 y、 u i 的 小伙伴会看到,同样的 a 会四启动器的标识, 双击就能运行。启动器第一次启动时等待时间会稍长,因为启动器需要自动配置环境文件和基础依赖,大家不用着急,等进度条跑完就行。启动器主页左侧有几个关键功能区, 我们快速过一遍,避免后续操作踩坑。文件路径区,这里会显示 ctrl u i 的 根目录自定义节点输入图片和输出图片的保存路径,后续找文件、存作品都靠它。 高级设置,重点看生成引擎默认会选择电脑的独立 gpu, 一 般不用手动感,要是识别错了,手动换成自己的独显 gpu 就 行。疑难解答与版本管理疑难解答这里,如果大家后续出现整合包有问题,可以通过这里进行排查。问题版本建议选稳定版, 开发版虽然功能新,但可能有报错风险,大家隔一到二个月来切换一次版本就够。小工具区是不怎么用的,所以暂时用不上限阶段,我们先聚焦核心功能, 然后确认设置没问题后,点击启动器右下角的一键启动。等环境配置完成, comui 会自动在浏览器里打开运行界面,好的,进入 comui 后,我们会看到一个有几个方框和线交叉连接的东西,这个就是我们最基础的纹身图工作流节点, 然后工作流的语言默认是中文,不用额外切换,要是不小心切到英文,点左下角的设置图标,找到语言一栏,在里面切换就好。然后配置模型这一块 comui 是 没有自带的模型文件,大家可以将下载好的模型安装至根目录 checkpoints 文件夹中。 将下载好的模型放入文件夹后,小伙伴们还要记得重启一下我们的启动器,打开后台,点击右上角的中指进城,然后再点击一键启动,这时我们就可以将之前的网页页面进行关闭,重新等待跳转进去 模型。放入文件夹后,我们来简单测试一下,感受下 comfuse 的 基础流程。首先我们先选模型,在 checkpoints 加载器里挑一个你常用的模型, 然后写提示词,找到文本编码器,也就是提示词输入区,在正向提示词里输个简单需求,比如 one girl solo round here, 反向提示词可以暂时空着,点击下方运行按钮,也就是我们的图片生成按钮, 等进度条跑完,第一张图就出来了。首先打开进入 comui 后,你会看到的纹身图,完整工作流,一些交错相连的线和几个黑色方块,这些其实是将几个核心节点串联起来,构成了一个完整的生图流程。 咱们首先把每个节点的作用和逻辑理清楚,我们从左往右说起。首先 checkpoint 加载器,这是整个工作流的开始,专门用来选大模型,点开下方选项后,可以看到我们下载安装的模型,相当于给 ai 定好画画的风格基础。 clip 文本编码器分两个,一个是正向提示词,你想画什么?比如你想要一个女孩动漫风格长发,一个是反向提示词,也就是你不想出现的画面,比如模糊低质啊。 所以文本编码器的作用就是负责把文字需求转成你还能懂的信号。看到 k 裁样器,它是整个纹身图工作流的核心绘图工具,负责在前空间中形成图片,这里能调三个关键参数。看到第一栏的随机种,也就是 c 的 值。固定种子会生成相同基础图, 随机种子每次都不一样,也能手动输数字。日常的话,固定和随机会经常使用,其他的很少有应用场景。然后是迭代步数,数值越高,细节也就越足,常用二十到五十步。 c、 f、 g 值,就是提示词相关性越高,越贴近提示词,太低会跑题,会与输入的提示词相关性变差,常用的话在七到十二。另外还有彩样器,比如 l a, d, p, m, p p 二 m 和调度器 carrots, 这几个都是常用的参数,然后时降噪,也就是重绘幅度, 数值越低,原图的相似度越高,反之则越低。通常默认为一有特殊场景,我们再去调整,再看到空、累等节点。它的作用是负责定图像宽高,直接调宽度和高度,还能设批次大小,负责控制一次生成几张图。 看到 ve 解码器,他把 ai 在 内存潜在空间里画的图,转成我们肉眼能看清的像素图,最后连接预览图像或保存图像。保存的图会存在启动器、 oppo 文件夹里, 咱们可以先测个简单效果,选个常用模型,比如麦局写实模型、正向提示词书 one go, 点击右上角的运行等绿色进度框跑完,一张基础图就生成了。 光看懂还是不够的,咱们自己动手搭一遍,记得按节点需求一步步来,避免露脸。第一步,首先加 k 彩样器,我们把上面的工作流节点都清除掉, 双击空白处,搜索 k 彩样器,选 k 彩样器,普通版就行,高级版后续再讲。这个节点可以说是整个工作流的核心枢纽, 前面所有的节点最终都需要通过 k 采样器去形成 latent 前空间的图片。第二步五, checkpoint 加载器简易点, k 采样器的模型按住不动,往空白处拖去,在显示出来的菜单栏中选择 checkpoint 加载器,这样 ai 就 有画画的基础风格了。 第三步,加文本编码器,分别点击 k 采样器的正面条件和负面条件,往空白处拖,选择两个 clip 文本编码器, k 彩样器的正面条件和负面条件,然后就能在编码器里输提示词了,比如正向 windows 反向提示词中输入 e c 的 get f。 第四步,加空 letton, 接点,点 击 k 彩样器的 letton, 按住不动,往空白处拖去,在显示出来的菜单栏中选择空 letton, 然后调宽度,比如七百六十八,高度,比如一千零二十四 t 四,大小设为一。 第五步,加入 ve 解码器,点 k 采氧器的 matrix 输出,往空白处拖,选 ve 解码器,再把 ve 的 图像输出拖出,连接预览图像或保存图像。这样做的目的是为了能够实时观看生成的图像和保存到文件夹, 看完后可以再优化一下,比如给节点改名字,左键双击节点标题并输入正向提示词,下方文本编码器同理,输入负向提示词,这样后续找节点更方便。 复制节点也有快捷键,选中节点按 ctrl 加 c, 空白处按 ctrl 加 v, 比重新建节点快多了。 然后采样器这里其实并没有哪一个会更好,它的一个采样方法没有一个固定的选项,每个模型所采样的都不同。我觉得大家如果是在网上找的模型式可以看到,模型作者一般会推荐采样器,根据作者建议选是不会出太大问题的。当然我们也可以稍微灵活运用一下, 通常的话可以选择 d p m 加加二 m, 还要加上调度器的参数。然后 calllab 文本和 ve, 这里不要忘记连接到模型加载器和 ve 解码中了,然后来尝试一下能否跑通本次的纹身图工作流。点击运行,我们稍等一下, 好的,深层的图已经出来了,这说明工作流是没有问题的,能够正常的去运行。今天咱们重点拆解图生图基础工作流,手把手教你,哪怕是刚接触 comfyi 的 小白 也能跟着搭建起来。好的,回到我们的工作流当中。其实图生图和文生图的核心逻辑是一致的,一个是通过文字描述进行生图,一个是通过图片参考进行创作,前者更加适用于去进行创意构思, 而图生图更加适合对自己喜欢的图片进行二次创作。我们首先来到基础纹身图的页面,首先我们需要一个加载图像的节点,双击空白处搜索加载图像节点,这个节点是负责将图片上传至工作流当中,那么接下来我们需要把节点连接至 k 彩样器中, 但这里有个问题,如果直接将节点拖到彩样器中是没有反应的,所以我们首先需要将空来腾先删除掉。这里的图片分辨率是可以直接用我们上传的图像分辨率的。 除此之外,我们还需要一个 v a e 编码作为图像与彩样器的转接口。之所以这样,是因为原图是像素格式, ai 是 看不懂的,得转成在前空间的图像。把节点都放置出来后,我们就可以进行节点连接了。点加载图像的图像输出 与 ve 编码器的图像相连接,再把 ve 编码器的 laten 输出连 k 彩样器的 laten 输入,同时记得把 checkpoint 加载器的 ve 输出连到 ve 编码器的 ve 输入,这样 ai 才能用模型的 ve 来解析原图。 节点之间相连接之后,那么图生图工作流的搭建就完成了。我们先上传一张图试试看效果提示词可以都删掉,用来做效果演示。点击运行, 点开生成好的图片,我们看到它与原图几乎没有什么关联,基本没有任何相似的地方。所以这里我们就需要去调整彩样器中的降噪,也就是重绘幅度。这里我大致说一下不同参数对图像的影响程度,比如降噪零点五到零点六,保留原图大部分细节,只微调风格, 降噪零点七到零点八,改变更明显,同时保留原图构图,降噪一点零,相当于完全重绘,只参考原图的大致风格。当然具体适合的参数还是需要 根据模型或不同工作流来观察的,我们还是选择一个常用的 check point 模型。那么这里我将降噪调整为零点五,尝试一下, 我们会发现除了一些细节,基本与原图的相似度还是非常高的。我们再试试零点七的参数。稍等一下, 我们会发现这次生成的图改变会非常的明显,但是它仍旧为我们保留了其风格和构图。当然大家也可以去多尝试一下其他不同参数生成的图片。

哈喽,大家好,这期视频呢,我们来给大家介绍一下目前最新的万物迁移工作流,哎,它在当前的这个商业项目里面的一个使用方法。 这个工作流呢目前在市面上很多的设计项目里面,包括,呃室内设计,包括电商,哎,包括还有一些游戏角色啊等等等等的这一些项目上面都有非常大的 商业应用潜力,以及非常直观的一个落地效果啊。比如说这里我们可以先来看一下我们今天会讲到的两个案例。首先第一个是对电商产品啊进行迁移,我们这里有一张电商产品的这样一个美妆产品的实拍图,然后呢我们要把这个实拍图添加到 人物的这个手上去,哎,我们要把这个模特图里面他手中拿的这个绿色的瓶子给它替换掉,然后通过这个工作流就可以实现一键替换 啊。包括在一些室内场景里面,我们想把某一件家具添加到一个室内效果图里面去,也是可以通过工作流去实现一件家具添加,那这些效果呢都是我们可以在工作流里面去快速完成的。好,那接下来我们先来看一下啊,这个工作流要怎样去使用, 那在这里我们已经把这个工作流以及它所需要的这些模型节点都已经给大家整理好了啊,大家拿到这个资料包之后,可以看到我们已经把对应节点的这个文件夹都已经给大家分好了,那你在使用的时候在 ctrl y 里面帮助面板,然后点击这里的打开模型文件夹, 在模型文件夹里面呢,你去对应的找我们资料包里面的这些文件夹的名称啊,比如说我们第一个 clip 文件夹,你找到啊 comforion 模型文件里面的这个 clip, 把它点开,然后呢把我们这里的模型给它复制粘贴进去,或者你直接拖动进去就可以啊,就是把我们 这个资料包里面的文件啊,都对应的上传到你 comfort ui 本地的文件夹里面去啊,把它们一个一个的都这样拖拽进去。好,把所有的文件都拖拽进去之后,我们再来到啊 comfort ui 的 这个操作页面,在这个操作界面就可以开始去打开并运行工作流了。 好, ok, 我 们来看一下这个万物千亿工作流的第一个案例啊,我们来对这张呃模特图啊,对这张图里面的产品瓶子进行替换, 你进来之后它会给你呃进入一个默认的工作流啊,这我们不用管它,点击左上角的加号,我们创建一个新的工作区,然后呢把我们准备好的这个万物迁移工作流的文件拖拽进来,拖拽进来之后啊,可以看到所有的节点我们已经搭载好了,在这个工作流里面,我们来到最左侧 啊,最左侧两个会有两个植入图片的面板,在这两个面板里面啊,其中上面的这个面板呢,是用来植入模特图的,那这里我们把 啊大家打开之后,这里应该是空白的,那你直接把产品图按住左键拖拽啊,拖拽到这个位置,然后松开左键就可以植入进来产品啊,这个模特图也是一样,按住左键拖拽,然后植入到下面这个模块,两张图都植入进来之后,我们来看一下在下面的这个模特图,这里我们要点击右键, 然后下面会有一个开启,开启遮罩啊,我们点击开启遮罩,进入到遮罩编辑器里面,在编辑器里面我们需要把要替换的这个部分按住左键把它涂抹掉 啊,这里如果是这个画笔比较大的话,在右侧可以调整画笔的粗细硬度之类的,但我们要做的就是把你要添加产品,或者说你要替换产品的这个位置,用遮罩把它完全盖住, 在这里你覆盖的面积可以稍微大一点点,你不用完全的就是像抠图一样沿着这个边缘去抠,你可以给他稍微大一圈啊,让他在替换物品的时候有更多的发挥空间。好,现在遮罩选择完之后,点击保存, 好像这个遮罩已经保存好了,然后中间的所有节点都是已经被搭载好的状态。那我们这里唯一要修改的呢,就是升图流程中的这个提示词啊,这里可以看到他给的是默认的提示词,我们把默认提示词删掉,然后 啊修改成我们需要的这个场景的描述,比如说我们这里,对吧?是一个模特拿着瓶子的这样一个展示图,那我的提示词就写一个,呃,一个玻璃化妆品瓶被拿在手中啊,这样去简单描述一下画面就可以。好,现在写完之后我们点击运行。 哎,这个时候工作流就开始自动的去跑起来啊,工作流启动之后呢,你在上方能看到当前的升图进度,这个进度跑完之后图片就会显示在最右侧的啊,这个,呃,导出区域 好,现在生图流程跑完之后呢,我们就可以来到工作流的最后啊,来看一下啊得到的图像结果啊,这里是我们迁移完成之后的图像,包括往下滑,哎,下面这个节点你能看到迁移前后的图像对比图, 我们来看一下前后对比的时候,你能发现人物的姿态啊,人物的形象是基本没有变化的,然后在保持人物不变的前提下呢,他能非常完美的把我们的产品迁移到这个模特的手中, 同时产品琴子上的这种光影变化和这个产品拿在人手中的这个姿势都是非常自然的,哎,这个就是万物迁移这个工作流的一个强大之处,哎,能够一键完成这样的物品迁移好得到这个图像呢,我们在上面可以点击右键啊保存图像,让我们再去重绘跑画风了。 好,那这个就是我们工作流里面需要重点去关注的一些节点。好,那这里我们再来看一下第二个案例啊,这里我们有一张室内设计的效果图啊,我们第一个案例是去替换产品。第二个我们来看一下怎样去在画面里面添加物体 啊,在这个在这张室内设计效果图里面,假如说我们想给他添加某一件家具进去,哎,那这个时候我们的使用方法基本上也是一样的,首先把我们要添加的这个加载图像的节点,然后呢再去把被替换的这个场景, 然后添加到下方的这个加载图像节点,然后同样我们在啊这个室内场景的节点里面,右键打开遮罩编辑器 啊,然后你看这里是我们添加一个新的物品进去,那你这个物品想添加在场景里面的什么位置,我们就把什么位置涂上遮罩。比如说我想把我的这个椅子放在沙发的前面,放在这个地毯上, ok, 那 我就把这个地毯的位置用遮罩编辑器给它糊上。 哎,在这里你可以根据你添加的物品的大小决定这个遮罩有多大,遮罩的面积比物品稍微大一圈就可以。好,这样添加好之后,同样点击保存, 然后在这个克里普编码器里面,我们把提示词去调整一下,好把提示词替换一下啊,然后我们直接点击运行,让工作流开始工作。好, ok, 现在图像已经生成了,我们来看一下生成之后的效果。 哎,可以看到是把我们需要的这个家具,哎,直接添加到了场景里面去啊,包括在下面这张图,我们也可以看到添加前后的,哎,一个效果的对比。 ok, 那 这个就是我们用这个万物皆宜工作流去做产品图,以及做一些室内设计图的一个基本的方法。如果对这个工作流有兴趣的,留个三,然后看我主页的介绍,点击 ai 工作室自行获取。

我是王展乐展, 我是王展乐展。

很多人至今都不知道,现在的 ai 技术已经能够实现如此自然的人脸替换动作迁移效果。你看到的所有画面效果都是我使用 comfyui 这款软件生成的,它的逼真程度相信你已经感受到了。更重要的是 comfyui 完全免费,甚至不需要联网就能运行。 有了它,我们可以轻松制作出任意想要的视频内容。正因为这项技术效果非常强大,我们必须合法使用,请大家把正能量打在公屏上,共同遵守底线。无论你是做短视频带货打造 ip 分 身,还是需要虚拟演员,无论你是不方便真人出镜,想降低拍摄成本,还是单纯对 ai 充满好奇, 这个能力你迟早都会用的上,而且即使是新手小白也能轻松上手,那使用方法也是超级的简单。接下来给大家分享所用到的几个工作流。 第一步,我们先把这个文件进行解压,解压之后我们再次点击一下一键启动这个按钮,然后只需要将我们的工作流文件拖入到软件界面当中,再上传一下这个视频文件,点击运行就可以了。那么视频当中所需要用到的安装包文件还有工具的文件,我都已经放在评论区里面了,大家可以自行领取。 那么这个工作流啊也是非常的简单,可以看到它这里只需要用到五个节电。那我们这里呢是上传一段你需要换脸的视频,在这个位置点击上传即刻。那上传好这个视频之后呢,下方就可以预览刚才上传好的视频,也就是前面跳舞的这个小姐姐。 第二步呢就是我们可以直接上传图像,那图像就是你想要去换脸的这个人物,那么第三步就是点击上方的运行按钮,这样子一个视频就生成出来了,那上传的人物和这个 图像生成的效果呢?还是比较相像的,那么它的一个原理就是通过 react 这个换脸节点进行换脸, 比如说我们的这个视频前面是三十帧的话,那么相当于每一秒就有三十张图片,然后通过我们的一个换脸节点,对于这三十张图片都进行一个换脸处理, 最后呢再用这个合并为视频这个节点对于每张图片进行一个合并,那这样呢就能够生成好非常完整的换脸视频了,那小白呢,也是可以轻松上手的,那即便你对这款软件之前完全没有了解过,那也是能够开箱即用,不用担心。那本期内容呢到这里分享就结束了。

各位小伙伴大家好,我是初级 a, 最近由于工作的原因实在是太忙了,没有空跟大家分享新的工作流,所以今天也抽出点时间跟大家分享一下实用的工作流。今天的工作流也是干货满满的,希望小伙伴们耐心看完视频。 那今天分享的就是克莱因的小物品精准迁移工作流。克莱因编辑模型编辑能力是十分强大的,对一些物品的迁移效果还是非常的不错的,但是对一些小物品的迁移,克莱因的效果就稍微差一点点,不能做到指哪打哪, 所以今天的工作流是针对小物品精准迁移,真正做到指哪打哪,效果是十分的不错的。 直接开始今天的分享工作流的搭建是在 running hub 平台上,新用户用我的链接注册送一千点。现在大家看到的是克莱因的单图编辑工作流,我们直接在这个工作流的基础上,把它调整为小物品精准迁移的工作流。 物品迁移属于双图编辑工作流,那我们直接复制加载图像和控制图像的尺寸节点, 然后把图像连接起来,然后复制一份 reference latent 节点,把 condition 的 条件串联起来,再把 condition 连接到正面条件上。复制一份 va e 的 编码, 把 latent 连接上,然后把 va e 也连接上,再把图像连到第二个 va e 编码节点上,克莱因的双图编辑工作流就基本搭建完成了。 其实我们可以用更简单的节点去替换这些节点的,比如我们搜索 fluximage edit, 就 可以用这个节点代替这些节点。主要我发现很多小伙伴第一是不会装这个节点,第二是装完之后不会设置,因为线上的节点和最新线下是不同的,很多小伙伴不会设置,所以我就不用这个节点, 这些都是默认的节点,也方便使用。个人是比较喜欢这个节点的,因为使工作流更加简洁,那我们就直接把这个节点删除掉吧。 那我们接下来测试一下基础双图编辑的迁移能力。先上传两张图像,图像已经上传完了,先简单测试下,把这个佛珠迁移到女模特的手上,接下来写一下提示词, 提示词写,把图二的佛珠替换到图一女孩手部上,那我们直接运行看一下它的效果。 小物品迁移已完成,我们一起看下效果。佛珠虽然完美地迁移过来,但是我们看到它两只手都带了佛珠。 另外佛珠的比例有点小问题,感觉有点大,图像左右的佛珠看起来不够协调,虽然能完美地迁移过来,但是效果还是有点差强人意的,不能做到指定位置迁移。接下来我们调整一下,让它能做到指哪打哪,精准迁移,而且比例大小适中。 那直接搜索局部重绘节点,然后我们把图像和遮罩传输进来, 然后再把图像的遮罩连接上,再把图像连接到第一个 v a e 编码节点上,从局部重绘的接缝拉出它的局部重绘接缝节点, 然后再把输出图像传输进来,拉出图像保存或预览。 ok, 工作流我们已经搭建完成了,接下来我们调整一下这里的参数模式,这里我们选择强制尺寸, 意思是要把图遮罩这块区域放大成一千零二十四乘一千零二十四,然后遮罩模糊,这里我们填零,其他参数不用调整。接下来我们涂一下遮罩,遮罩简单圈下 点保存图遮照区域这块把它放大成一千零二十四乘一千零二十四, 我们这里可以拉出它的预览图像提示词,不用调整,直接点运行。 图像已经生成完成,我们一起来看下。通过增加节点,这次物品迁移的效果是比较完美的, 第一佛珠的比例是比较适中的,佩戴的效果也不错,真正做到指哪打哪,可以说迁移还是很不错的。 现在佛珠迁移后,唯一有问题是除了遮罩区域出现色差问题,为什么会出现色差?这个也是克莱因底膜的问题,模型对图像编辑重绘后都会出现色差情况,克莱因模型色差问题是一直存在的,出现色差其实也挺好解决的。我们直接搜索图像调色, 现在插件的更新后,节点名字有可能会有变动,图像调色的节点也可以用另一个节点替换,也可以用图像颜色匹配节点,这两个节点用法是一样的,那我们直接用第一个就行了, 那我们直接把参考图像传输进来,再把输出结果连接到目标图像,再传输到这个接缝节点的图像上, 这里的强度我们可以适当调低点,调到零点九,如果还是出现色差很大的情况,可以继续调整这个值,也可以调整调色的方法,那我们直接点运行,看一下这次的效果会不会出现色差。 图像生成完成,我们一起看下。通过新增图像的调色节点,大大减少色差情况,整体小物品迁移效果是非常 ok 的, 能真正做到迁移指哪打哪,解决迁移的痛点,没有出现色差和比例问题。 大家觉得这个效果如何呢?个人感觉已经完全没问题了,我们继续测试迁移其他的小物品。先上传图像,这次迁移是金色的手链,那我们改一下提示词,把佛珠改成金手链遮罩,不用调整,直接点运行。 ok, 我 们来看一下,现在手链也是完美地迁移过来的,没有出现色差的和比例失调,迁移效果是非常不错的。大家觉得这个效果如何呢? 那今天的工作流分享就到这里了,希望大家继续一箭三连支持,下午你的支持就是我最大的动力,谢谢大家了,再见!

哈喽,大家好。忙了好几天,今天才更新,我前几天的话一直在学习如何训练 lol, 呃, s d 一 点五, s d s 二 low 的 跟 flag 都有。 呃,可以给大家看一下,这个就是我训练 s d 一 点五的这个 low 了。呃,我用 用的,我新电池是一个这个 y 歌,所以我输入这个关键词,他就给我新生成出这样子的,然后 flag 也是有 flag, 就 我只只是一个单个的给大家看一下。嗯, 这因为现在有很多现成的可以用的,所以我就不更新那一节课的内容。那我们今天来讲这个图声视频,就是表情的一个迁移, 我我刚开始学空投 u i 就是 奔着声视频来的,但是学到这里 遇到很多问题,要不就决定安装不成功啊,要不就安装成功了,跑工作流他还是一直报错,后面我去云端用,还挑了一个最好的配置,一个小时六块多, 但是也是一样的问题,而且就是我们用云端还要一直在等等啊,我都搞的我都不想学了。 后面我问了一个网友,他教我怎么弄,我才解决了这个节点的问题,他这个工作流程跑了起来,你看就是参考的视频,这就是图片,然后 就是就是就是因为就是呃,手动,手动安装嘛,他才能把这个文件给加载完,不然他那个 呃靠魔法可能网络不稳定什么之类的什么原因吧,他就没下完,没下完他工作又又跑不动, 他就直接报错了。后面我就自己手动安装的那一些,我在网上也有看到很多很多人安装这个节点也出现问题。 呃,我就也说一下,就是要去下载这五个,自己手动下,我看一下在哪个文件夹里面, 就这个文件夹里面这五个要自己手动下载,不要自动安装,把它安装错误就跑不动了。 那进入我们今天的课程,那我们今天课程就是学的就是图转视频的工作流嘛。那就给一张图,这个图的话背景要干净。 呃,我这个图是 ai 生成的,所以也不是很好,最好的话就是背景要白色,白色的背景布,然后人物的话要正面, 正面的话,然后五官要看清楚,这样子再做参考。视频的话他可以可以比较好的模仿下来吗? 那我今天就带大家把这个搭建的过程给过一遍。首先我们要先安装三个扩展嘛。呃,第一个是 did you help a suite, did you help a suite。 第二个是 advanced life portrait, advanced life portrait 第第三个是 frame interpolation, frame interpolation 好, 英语不会,只能这样子,就安装这三个扩展。 那接下来我带大家一起把这个工作流给走一遍吧。 首先,呃,我们要先加载图像,加载这个图像。 第二个就是这个表情,表情的编辑器啊,我就是这个在这个节点遇到问题了,因为他就走下又没下完,走又走不动。 第三个节点就是加载视频,这是图像连图像,然后 高级,这个高级 light po light po portrait 不 会读啊, 这个连过来,连过来这些, 这这插卡部位就表情嘛,然后这些都不用动,没事啊,然后这边的帧率我就改成二十四帧,二十四帧就代表,呃,一秒他有二十四张图在变化, 一秒钟有二十张二十四张图嘛,然后这些都不用改,然后这边 这个参考的视频就连接在这个参考图像, 然后接下来我们就给它合并视频嘛,这个连这个,然后这边有音频的话就给他连过来,没有就不用连, 然后这里也改成一样的二十四帧,这个保存为 h 二六四的 n p 四,这些都直接默认的,然后保存的话这边就改成输入,就这就是输出的意思, 这些可以都不用改啊,只要改成整理一下来跑看看哈。 因为我已经有试过很多次了,所以我跑的话会相对快一点,如果是第一次安装的话,然后你模型又没有自己下载,他就会跑的很慢很慢,所以所以 还是要自己手动下载一下。出来了就就这一个人物模仿他的表情, 我我们来弄一个,就是让他对比的两个放在一起,让他对比 出来了,这样子你就可以对比两个表情像不像,看到没有?这挺像的,但是就是呃会会会多多少少, 呃变形了,不怎么真实,然后然后就感觉就是这个速度很不丝滑,视频感觉在放慢动作, 如果我们单单调针率的话,他就会减少秒数,然后会很快,那我们就要插针进行他的插针跟补。就是也可以叫补针吗? 它会在原来速度完全不变的时情况给视频加更多的帧数,那帧数它提高的话画面就会更丝滑嘛。就是用这个这个节点, 这个直接拉过来, 直接打过来,然后这边连这个,然后音频的话就直接打过来, 有音频的话就直接打过来,然后直接生成,然后这边要改一下。呃呃,这边是乘以两倍二十四,乘以两倍就四十八,然后这边改成 视频的啊?就就改这样子就可以了。这样就生成好了嘛?他整体就感觉,呃,比较表情就比较自然一点,视频也比较丝滑的。 然后给大家看一下,我在学习当中,然后用这个照片去写,挺搞笑的, 那我今天的课程就到此为止。

这可能是抖音最好的康复 u i 教程,存下吧,很难找齐的警告!本视频耗时四个月制作,共一百七十八集,从零开始系统学习康复 u i 制作视频, 这应该是目前最详细的 ai 视频教程了,哪怕你是零基础,也能轻松给你学会。所有在教学过程中用到的指令, 我都给大家整理完毕。七七七常常闲待本套课程共分为两个部分,一到六节为基础部分,其中包含了康复以外的配置要求以及如何安装与部署、界面导览与原理介绍、文声图以及提示词的语法,之后还会聊聊 a i g c 的 相关网站 及模型下载,最后还有图生图以及高清修复的过程。那么从第七节课到第十三节课属于进阶部分,先后会讲解 control 内及其诸多预处理器的使用方法以及使用场景,之后还会教大家 ipad 及其强大功能的应用。随后我们还会学习最基础的 ai 视频生成原理,而在最后,我们将结合前面所学的全部知识, 一起来做一个 ai 视频换脸转会。这些这些,这些都是 ai 生成的。自二零二三年以来, ai 绘图软件 steve diffusion 的 发展势不可挡,各种各样的衍生模型插件百花齐放, 现如今生成像这样的 ai 视频完全不在话下。那么我们就一起跟随着时代的脚步,一起探寻 steve diffusion 的 comfui 到底该如何使用吧。大家所熟知的 webui 和 comfui 其实都是属于 steve diffusion 和 webui, 主要是基于数据库开发的浏览器界面, kufui 则是使用图形节点、流程图设计而用于稳定扩散的用户界面。这边我们将 kufui 和 webui 的 优缺点列出来,方便大家做个对比。首先我们来看 webui 这块,它的优点是简单易学,并且操作较为基础与简易。 它的缺点是不利于长期管理。那么这是什么意思呢?当你在深度学习完 web ui 的 高阶内容后,你会意识到如果使用的是康复 ui, 那 么将节省两到三倍甚至更多的时间。其次,在插件过多时, web ui 会显得非常的臃肿 以及操作费时。那么接下来我们看一下 comfui。 这边我们可以看到 comfui 对 配置的要求较低,这同时也意味着降低了 ai 绘画的门槛,方便更多的小伙伴加入进来。那么它的优点其实是节点更易于管理,有较强的自主性。我们可以根据个人需求来组装属于自己的工作流。并 且在未来, comfui 将逐渐与 webui 在 应用层面拉开距离。比如前段时间的 s、 d 三,或者国产最新的颗粒大模型, 都是第一时间在 comui 里可搭建工作流并使用的。而对于 webui, 这些最新的模型与插件往往得过一阵子才能时装,甚至直接不时装。所以使用 comui 也意味着你能够更早地使用到最新的模型与插件。 而 comui 的 缺点是初期不好上手,但我相信在你学完了本套课程后,一定能够完全掌握 comui 的 基础操作。除此之外,过去我们知道有许多软件,比如 blender、 达芬奇、 ue 等等都是使用节点式工作流, 因为他们有极强的自主性与可模块化。许多头部公司的顶级团队使用的都是节点式软件,那么 comf 以外,除了上述优点之外,我们在使用时还可以非常方便的套用他人分享的工作流,即刻便可实现相同的效果,节省了非常多的节点部署思路的思考时间 及从单个节点构建成工作流的部署时间。哈喽,各位小伙伴大家好,欢迎来到康复 ui 系列教程的第二节课,那么在本节课中,我们将介绍康复 ui 的 配置要求以及安装与部署的过程。那么首先是电脑配置以及系统环境的介绍。首先是显卡方面, 最低要求是拥有四 g 级以上显存的英伟达显卡,如果显存不足,可能会影响到绘图过程的流畅度。接下来是 cpu, 关于 cpu 要求不高,英特尔十代 i 三以上就可以使用,但推荐使用性能更强的,如英特尔十三代 i 五幺三六零零 kf, 以获得更好的性能。接下来是内存,内存至少需要十六 gb, 推荐三十二 gb 以上,以确保可以加载和运行较大的模型。最后是硬盘,关于硬盘呢,至少需要两百 g 的 空余空间,推荐使用大容量的固态硬盘,因为 ai 绘图过程中会下载和生成大量的模型以及图像数据。那么接下来我们详细介绍一下 cf ui 的 下载以及部署方式。 我们先安装资源包里面附带的启动器运行依赖,接着打开解压之后的 comfort ui 文件夹,在文件夹内找到 a 会式启动器,随后点击一键启动即可。首次启动时可能会安装一些必要的环境依赖, 稍等片刻后,我们便来到了 comfort ui 的 主界面。接下来介绍第二种安装方法,官网资源包的安装。当然关于官网的资源包我们也可以在评论区内获取。我们解压完资源包后,在文件夹内找到这个项目, 双击运行。等待片刻后,我们便可以来到最原汁原味的 kufui 界面了。这个版本的 kufui 是 没有装任何非官网的插件的。 此外, kufui 完全离线工作,对 gpu 的 要求相对较低,但是也有 cpu 模式,不过在 cpu 模式下绘图速度较为缓慢。如果小伙伴们之前有使用过 webui 或其他类型的 step defusion ai 绘图应用,那么可以通过修改 kufui 的 配置文件来实现在 不同的 ai 绘图应用间共享大模型以及 loa 等等,以此减少对硬盘内存的占用。那么接下来我将向大家演示一下如何将我们的 comui 大 模型以及 loa 的 加载路径修改成 webui 的。 如果小伙伴们没有玩过 webui, 那 么这一段可以直接跳过。好的,那么我们打开 comui, 接着我们找到这个文件, extra model pass yaml 点 example。 接着我们用记事本打开。好的,那么打开之后我们找到这一项 base pass。 我们要做的是把 bash 后面的这一串改成我们 web ui 文件夹的路径。比方说我们打开了 web ui 的 文件夹后,我们可以单机上面的这个栏目,随后 ctrl c 复制。接着我们回到刚才的记事本内,将我们刚刚复制的路径粘贴到此处,随后我们保存并关闭记事本。接下来的一步很重要, 我们需要将 example 以及这个点给删除,也就是将我们的文件名后缀改成点 y a m l, 随后点击确定即可。那么接下来我们打开 comui 来确认一下。 好的,我们这边看一下 checkpoint 加载器里面的大模型,点开后我们可以看到多了,非常多啊,那么这就证明我们成功把模型路径合并到了 ruby ui 内。好的,那么以上就是关于本期的全部内容了, 欢迎来到康复 ui 系列教程的第三节,那么在本节课中我们将一起了解康复 ui 的 主界面以及各种参数到底代表了什么。最后我们将学习 stable fusion 生成图片的根本原理。好的,我们打开了奇瑞大佬的会事启动器后,点击一键启动, 经过一段时间的等待后,我们便来到了 cf ui 的 主界面。那么我们在面对 cf ui 这个完全陌生的软件时,我们要做的就是初步了解每一个模块的大体含义,那么接下来我带着大家过一遍。首先是操作方式,我们可以通过鼠标的滚轮来控制画面的缩放, 按住鼠标左键,我们可以拖动我们的仕图。点击鼠标右键,我们可以看到有非常多的栏目,这边我们可以试着点击新建节点,随后我们可以看到有非常多的节点可以供我们选择。好的,那么之后我们再来说一下快捷键,生成图片的快捷键是 ctrl 加 enter 框选节点的快捷键是按住 ctrl 加鼠标的左键。移动框选目标的快捷键是按住 shift 加鼠标的左键。 这边我们在框选完后,如果不按住 shift 直接进行拖动的话,我们可以看到此时只有单一节点进行了移动,剩下的快捷键我都放在这了,小伙伴们可以暂停观看。 好的,那么接下来我带着大家一起来解读一下这个默认工作流。首先在这边我们可以看到有个叫 check point 加载器的东西,这个节点的主要作用是加载扩散模型, 也就是我们常说的大模型。此外,该节点还提供适当的 v、 i、 e 以及 clip 模型,具体它们是什么我们带回讲。我们顺着去控制加载器的节点连线,可以看到这里有两个 clip 文本编码器,在这里我们可以看到它们的输入都是 clip, 而它们的输出都是条件。那么究竟什么是 clip 模型呢? clip 全称为 contrasted language image pre training, 是 由 open ai 公司在二零二一年发布的一款多模态与训练神经网络模型。 clip 模型的作用是理解我们输入文字的意思,比如我们输入 one go 生成的是一个女孩,而不是太阳, 这就是 clip 的 作用。接着我们顺着 clip 文本编码器的条件输出看过来,连接到了 clip 源器上。这边我们可以看到 clip 源器一共有两个关于条件的输入,一个是正面条件, 另一个是负面条件。那么这代表着连接着正面条件的文本编码器内的提示词为正面条件提示词,也就是我们常说的正向提示词。同理,下面的则为负面条件提示词,也就是我们常说的负面提示词。好的,我们把目光重新回到 get 函数器内, 我们可以看到除了正面条件以及负面条件外,还有两个输出,分别是模型以及 layer。 那 么模型则是连接着刚才的 checkpoint 加载器,也就是我们的大模型。那么这个 layer 究竟是什么意思呢? later 通常是指前空间,可以理解为 stability fusion 内部流程中的图像格式。如果将图像作为输入,则需要通过 v a e 编码将其转化为 later 数据 在最后输出时,也需要通过 v a e 解码将其转化为像素空间,也就是我们最终看到的图像。这边我们可以看到 k 太阳器的 later 连接着一个叫做 comlater 的 节点,这个节点内共有三个参数, 分别是宽度、高度以及 p 四大小。宽度和高度决定了我们最终生成图像的尺寸,而 p 四大小则代表着每生成一次将出多少张图。比如说我们将 p 四大小改为三,高度改成七百六十八。 最后我们按 ctrl 加 enter 进行生成。好的这边我们可以看到一次性生成了三张图像,也就是我们 p 四树目的图像。接下来我们继续看 k 太阳器的其他参数。 首先是随机种,随机种的值我们一般称为种子值,每张图都有专属于它的种子值,我们也可以理解为种子值,就是图片的 id 号码。接下来是运行后操作,点开后我们可以看到拥有四个选项,分别是固定、增加、减少以及随机。如果选择固定,则在你生成完后,种子值会保持不变, 方便你进行其他的调整与操作。那么接下来就是裁量步数,裁量步数越多,计算机的运算时间越长,在大多数的情况下,我们的裁量步数保持二十到三十步即可。接下来是 c f 锯值,该值的意思是提示词引导系数。 c f 锯值越高,则代表着生成图像与提示词之间的联系越紧密。 c f 锯值越低,则代表着提示词对生成结果的影响越小。不过过高或过低的 c f 锯值都会给图片带来不好的影响, 所以我们一般保持适中的 c f 居中即可。接下来是采暖器和调度器,我们可以理解它们为图像的生成方式,如果我们将其他参数比作是食材, 那么它们则是烹饪方式。不同的烹饪方法当然会带来不一样的结果。比如我们点开采暖器后,可以看到有非常多的选项,这里我们目前最好的一般是选择这个 d 片加加二 a m 或者 d 片加加二 a m s d e, 这两个都是挺不错的。接下来点开调度器,我们也是可以看到有非常多的选项,这里我们一般选择的是 carrots。 最后我们可以看到还有个降噪参数,由于该参数是跟图生图有关的,我们以后再说。接下来我们看一下右边有个叫做 v i e 解码的东西,那么我们可以看到这边有两个输入,分别是 laten 以及 v i e。 至于 laten, 刚才我们已经解释过了,也就是前空间图像。那么 v i e 究竟是什么呢? v i e 全称变分字编码器 variation auto encode 的 缩写,它是一种深度学习模型,主要用于无监督学习任务,特别是在生成模型领域。 eve 结合了神经网络和概率图模型的特点,而它在康复以外的作用是将我们的前空间图像编码成像素空间图像,或是将像素空间图像编码成前空间图像。除此之外,我们还可以双击屏幕上的空白处,最后就可以搜索节点,比如说搜索加载图像, 或者我们也可以双击搜索预览图像。这边再多说一嘴, ve 解码之后的图像节点,我们也可以直接连接到预览图像上, 比如说我们现在把这个保存图像节点给删去,如果这么操作的话,那么我们生成的图像不会被保存,接着我们再生成一次。 这边还要注意的一点是,在我们搜索节点的时候,我们也可以输入英文,比如说加载图像的话,那么就是 load image, 那 么我们可以看到这两个节点是完全相同的。接着我们再说一下,比如说当我们输入英文的时候,同样 上的也是 load image, 但是这个时候我们加了一个空格,好,我们可以看到这里面并没有出现加载图像的节点,那么这也意味着在我们搜索节点的时候,我们要注意区分节点的名称是否有空格好,比如说我们需要搜索加载图像节点,那么我们删去 load image 之间的空格之后,我们可以看到,哎, 是不是加载头像节点就出现了?好的,那么以上就是关于默认工作流的全部解释,接下来我们来看下界面还有其他哪些模块。首先我们点击左上角,这里有个文件夹, 点开后我们可以看到我们的工作流都保存在这,这边可以点击新建,那么我们就新建了一个新的工作流,当然我们也可以点击这个 import, 也就是输入我们的工作流,或者说是输入我们的文件夹。 最后我们点击 models, 我 们可以在这里找到并且下载相关的模型。接着我们来看一下右边的栏目,首先是该栏目的左上角,我们按住后可以进行拖动, 然后是这个齿轮标志,点开后我们便来到了康复以外的设置界面,在这里我们可以设置语言,点开后我们可以看到有中文,繁体中文,英语以及日语韩语等等。我们往上翻可以看到有其他的功能,比如图像面板顺序,图像面板的位置等等等等。 我们往下看,这有个文本补全,这个 enable 我 们一定要勾选上,这代表着它的起用。文本补全的意思就是在我们输入提示词的时候,会有这些英文短语的提示, 我们往下看有个添加提示词对联,这个是生成的意思。接下来我们可以看到有个保存的选项,点击该按钮我们便可以保存当前的工作流以及加载,那么就是加载工作流,同样的意思。接着是重刷新,比如说我们下载一个新的大模型之后,那么我们点击重刷新便可使用。接下来还有个重点,就是管理器, 个是 com 浏览器里面最重要的节点,点开后我们可以看到非常多的功能,比如说这边有数据库以及频道方式,预览方法,表情等等等等。这边预览方法我们一般选择的是这个 eight, two r, g b, 然后表情这一栏我们一般选择的是名称, 也就是标签名称选择了之后,我们可以看到节点的右上方一般会出现一个小狐狸按钮,而小狐狸按钮则代表的是它是官方节点。比如说我们加载一个新节点, 那么我们可以看到该节点是属于 animate develop 节点组的。接着我们回到管理器这六个 custom node manager, 点开后,我们可以看到有非常多的节点,在这里我们可以查找以及安装我们想要的任意一个节点。在今后的学习过程中,我们会频繁使用到这一个模块。 接着我们看到 model manager, 在 这里我们可以安装我们想要的任意一个模型,注意模型不是节点,他们是分开来的。至于该模块,我们今后也会频繁的用到。好的,在介绍完 comf 以外的主界面以及各种参数后,我们来了解一下 stpd 滤镜的内在运行原理,就可以方便我们理解并掌握进一步的学习内容。 在我们输入完体数词之后,文本编码器的 clip 模型会将体数词转化为特征向量,然后再由 v a e 编码器将这些特征向量 传输到前空间内,这些特征向量在前空间内不断地降噪,最后再由 v a e 解码器将这些经过降噪之后的特征向量解码成由一个个像素所组成的图片。好的,那么以上就是本期的全部内容了。

警告,本视频耗十四个月制作,制作时长五百分钟,陪你系统学习康 b u i 制作视频!这应该是目前最详细的 ai 视频教程了,哪怕你是零基础,也能轻松给你学会!马上暑假了,有人愿意每天花一小时学习 ai 慢剧制作吗?不用,对, 不用魔法,它就是最近重磅更新的 comforsee 破线版,本地一键启动,你就可以实现纹身图图生视频一键室内渲染设计、古风真人 ai 视频虚拟模特、做电商服装等三百加工作留模板, 老规矩,验个牌试试吧!本套课程共分为两个部分,一到六节为基础部分,其中包含了 kufui 的 配置要求以及如何安装与部署、 界面导览与原理介绍文声图以及提示词的语法,之后还会聊聊 ai g c 的 相关网站以及模型下载,最后还有读声图以及高清修复的过程。那么从第七节课到第十三节课属于进阶部分,先后会讲解坑深内及其诸多预处理器的使用方法以及使用场景,之后还会教大家 ipad pro 及其强大功能的应用。 随后我们还会学习最基础的 ai 视频生成原理,而在最后,我们将结合前面所学的全部知识,一起来做一个 ai 视频换脸、转会。这些这些这些都是 ai 生成的。 自二零二三年以来, ai 绘图软件 stupefaction 的 发展势不可挡,各种各样的衍生模型插件白花起放,现如今生成像这样的 ai 视频完全不在话下,那么 我们就一起跟随着时代的脚步,一起探寻 stableview 的 comfui 到底该如何使用吧!大家所熟知的 webui 和 comfui 其实都是属于 stableview, 而 webui 主要是基于规则库开发的浏览器界面, comfui 则是使用图形节点、流觞图设计和用于稳定扩散的用户界面。这边我们将 comfui 和 webui 的 优缺点列出来,方便大家做个对比。首先我们来看 webui 这块,它的优点是简单易学,并且操作较为基础与简易, 而它的缺点是不利于长期管理。那么这是什么意思呢?当你在深度学习完 vbu ui 的 高阶内容后,你会意识到如果使用的是康复 ui, 那 么将节省两到三倍甚至更多的时间。其次,在插件过多时, vbu ui 会显得非常的臃肿, 机操作费时。那么接下来我们看一下康菲 u i。 这边我们可以看到康菲 u i 对 配置的要求较低,这同时也意味着降低了 ai 绘画的门槛,方便更多的小伙伴加入进来。那么它的优点其次是节点更易于管理,有较强的自主性,我们可以根据个人需求来组装属于自己的工作流。 并且在未来,康菲 u i 将逐渐与未必 u i 在 应用层面拉开距离。比如前段时间的 s d 三或者国产最新的可棱大模型, 都是第一时间在康复 ui 里可搭建工作流并使用的。而对于未被 ui, 这些最新的模型与插件往往得过一阵子才能失桩,甚至直接不失桩。所以使用康复 ui 也意味着你能够更早的使用到最新的模型与插件。康 复 ui 的 缺点是初期不好上手,但我相信在你学完了本套课程后,一定能够完全掌握康复 ui 的 技术操作。除此之外,过去我们知道有许多软件,比如 blender、 达芬奇 ue 等等都是使用节点式工作流, 因为他们有极强的自主心与可模块化,许多头部公司的顶级团队使用的都是节点式软件。那么 comfuly 除了上述优点之外,我们在使用时还可以非常方便的套用他人分享的工作流,即刻便可实现相同的效果,节省了非常多的节点部署思路的思考时间, 以及从单个节点构建成工作流的部署事件。哈喽,各位小伙伴大家好,欢迎来到 cf ui 系列教程的第二节课。那么在本节课中,我们将介绍 cf ui 的 配置要求以及安装与部署的过程。那么首先是电脑配置以及系统环境的介绍,首先是显卡方面, 最低要求是拥有四 g 级以上显存的英伟达显卡,如果显存不足,可能会影响到绘图过程的流畅度。接下来是 cpu, 关于 cpu 要求不高,英特尔十代 i 三以上就可以使用,但推荐使用性能更强的,如英特尔十三代 i 五幺三六零零 kf, 以获得更好的性能。接下来是内存,内存至少需要十六 gb, 推荐三十个 gb 以上,以确保可以加载和运行较大的模型。最后是硬盘,关于硬盘呢,至少需要两百 g 的 空余空间,推荐使用大容量的固态硬盘,因为 ai 绘图过程中会下载和生成大量的模型以及图像数据。那么接下来我们详细介绍一下康菲 u i 的 下载以及部署方式。 我们先安装资源包里面附带的启动器运行依赖,接着打开解压之后的 comfui 文件夹,在文件夹内找到 a 会使启动器,随后点击一键启动即可。锁匙启动时可能会安装一些必要的环境依赖。 稍等片刻后,我们便来到了 comfui 的 主界面。接下来介绍第二种安装方法,官网资源包的安装。当然关于官网的资源包,我们也可以在评论区内获取。我们解压完资源包后,在文件夹内找到这个项目, 双击运行。等待片刻后,我们便可以来到最原汁原味的 cf ui 界面了。这个版本的 cf ui 是 没有装任何非官网的插件的。 此外, cf ui 完全离线工作,对 gpu 的 要求相对较低,但是也有 cpu 模式,不过在 cpu 模式下绘图速度极微缓慢。如果小伙伴们之前有使用过 vpu ui 或其他类型的 stupefaction ai 绘图应用, 我们可以通过修改 comfui 的 配置文件来实现在不同的 ai 绘图应用间共享大模型以及 logo 等等,依次减少对硬盘内存的占用。那么接下来我就向大家演示一下如何将我们的 comfui 大 模型以及 logo 的 加载路径修改成 vibui 的。 如果小伙伴们没有玩过 vibui, 那 么这一段可以直接跳过。好的,那么我们打开 comfui, 接着我们找到这个文件, s 三 model pass yaml 点 big example, 接着我们找到这一项 base pass, 我们要做的是把贝斯帕后面的这一串改成我们 web ui 文件夹的路径。比方说我们打开了 web ui 的 文件夹后,我们可以单机上面的这个栏目,随后 ctrl c 复制。接着我们回到刚才的记事本内,将我们刚刚复制的路径粘贴到此处,随后我们保存并关闭记事本。接下来的一步很重要, 我们需要将 example 以及这个点给删除,也就是将我们的文件名后缀改成点 y a m l, 随后点击确定即可。那么接下来我们打开 comui 来确认一下。 好的,我们这边看一下 check point 加载器里面的大模型,点开后我们可以看到多了,非常多啊,那么这就证明我们成功把模型路径合并到了 v b u i 内。好的,那么以上就是关于本期的全部内容了, 欢迎来到 comfui 系列教程的第三节,那么在本节课中,我们将一起了解 comfui 的 主界面以及各种参数到底代表了什么。最后我们将学习 stableview 生成图片的根本原理。好的,我们打开了七位大佬的会式启动器后,点击一键启动。 经过一段时间的等待后,我们便来到了 comfui 的 主界面。那么我们在面对 comfui 这个完全陌生的软件时,我们要做的就是初步了解每一个模块的大体含义,那么接下来我带着大家过一遍。首先是操作方式,我们可以通过鼠标的滚轮来控制画面的缩放, 按住鼠标左键,我们可以拖动我们的仕图。点击鼠标右键,我们可以看到有非常多的栏目,这边我们可以试着点击新建节点,随后我们可以看到有非常多的节点可以供我们选择。好的,那么之后我们再来说一下快捷键,顺从图片的快捷键是 ctrl 加 enter 框选节点的快捷键是按住 ctrl 加鼠标的左键。移动框选目标的快捷键是按住 shift 加鼠标的左键。 这边我们在框选门后,如果不按住 shift 直接进行拖动的话,我们可以看到此时只有单一节点进行了移动,剩下的快捷键我都放在这了,小伙伴们可以暂停观看。 好的,那么接下来我带着大家一起来解读一下这个默认工作流。首先在这边我们可以看到有个叫 shift 烹饪加载器的东西,这个节点的主要作用是加载扩散模型, 也就是我们常说的大模型。此外,该节点还提供适当的 v、 a、 e 以及 clip 模型,具体它们是什么,我们带回讲。我们顺着缺空位加载器的节点连线,可以看到这里有两个 clip 文本编码器,在这里我们可以看到它们的输入都是 clip, 而他们的输出都是条件。那么究竟什么是 k 服模型呢? k 服全称为 control language image programming, 是 由 open ai 公司在二零二一年发布的一款多模态预训练神经网络模型。 k 服模型的作用是理解我们输入文字的意思,比如我们输入 one go 生成的是一个女孩,而不是太阳, 这就是 clip 的 作用。接着我们顺着 clip 文本编码器的条件输出看过来,连接到了 k 采阳器上。这边我们可以看到 k 采阳器拥有两个关于条件的输入,一个是正面条件,另一个是负面条件。那么这代表着连接着正面条件的文本编码器内的提示词为正面条件提示词, 也就是我们常说的正向提示词。同理,下面的则为负面条件提示词,也就是我们常说的负面提示词。好的,我们把目光重新回到 k 采阳器内, 我们可以看到除了正面条件以及负面条件外,还有两个输入,分别是模型以及 latent。 那 么模型则是连接着刚才的这个 pos 接收器,也就是我们的大模型。那么这个 latent 究竟是什么意思呢? latent 通常是指前空间,可以理解为 stability fusion 内部流程中的图像格式。如果将图像作为输入,则需要通过 v a e 编码将其转化为 latent。 数据 在最后输出时,也需要通过 v a e 解码将其转化为像素空间,也就是我们最终看到的图像。这边我们可以看到可以采洋气的 laten 连接着一个叫做空 laten 的 节点,这个节点内共有三个参数, 分别是宽度、高度以及 p c 大 小。宽度和高度决定了我们最终生成图像的尺寸,而 p c 大 小则代表着每生成一次将出多少张图。比如说我们将 p c 大 小改为三,高度改成七百六十八。 最后我们按 ctrl 加 enter 进行生成。好的,这边我们可以看到一次性生成了三张图像,也就是我们批次数目的图像。接下来我们继续看 k 太阳系的其他参数。 首先是随机总,随机总的值我们一般称为种子值,每张图都有专属于它的种子值,我们也可以理解为种子值,就是图片的 id 号码。接下来是运行后操作,点开后我们可以看到用了四个选项,分别是固定、增加、减少以及图片的 id 号码。接下来是运行后操作,点开后我们可以看到用了四个选项,分别是固定则,在你生成完后,种子值会保持不变, 方便你进行其他的调整与操作。那么接下来就是裁量部署,裁量步数越多,计算机的运算时间越长,在大多数的情况下,我们的裁量步数保持二十到三十步即可。接下来是 c f 句子,该指的意思是 提示词引导系数。 c f 句子越高,则代表着生成图像与提示词之间的联系越紧密。 c f 句子越低,则代表着提示词对生成结果的影响越小。不过过高或过低的 c f 句子都会给图片带来不好的影响, 所以我们一般保持适中的 c f 制即可。接下来是采阳器和调度器,我们可以理解它们为图像的生成方式,如果我们将其他参数比作是食材,那么它们则是烹饪方式,不同的烹饪方法当然会带来不一样的结果。比如我们点开采阳器后,可以看到有非常多的选项,这里我们目前最好的一般是选 择这个 g p n 加二 m 或者 d p n 加二 m s d e, 这两个都是挺不错的。接下来调度器我们也是可以看到有非常多的选项,这里我们一般选择的是 keras。 最后我们可以看到还有个降噪参数,由于该参数是跟图胜图有关的,我们以后再说。接下来我们看一下右边有个叫做物业 e 解码的东西,那么我们可以看到这边也有两个输入,分别是 laten 以及物业 e。 至于 laten 刚才我们已经解释过了,也就是擒控件图像,那么物业 e 究竟是什么呢?物业 e 全称变分字编码记 ruby 炫的 ootlin 格式的缩写。它是一种深度学习模型,主要用于无间断学习任务,特别是在生成模型领域。 维 e 结合了神经网络和概率图模型的特点,而它在康复以外的作用是将我们的前空间图像编码成像素空间图像,或是将像素空间图像编码成前空间图像。除此之外,我们还可以双击屏幕上的空白处,随后就可以搜索节点,比如说搜索加载图像, 或者我们也可以双击搜索预览图像。这边再多说一嘴,维 e 解码之后的图像节点,我们也可以直接连接到预览图像上, 比如说我们现在把这个保存图像节点给删去,如果这么操作的话,那么我们生成的图像不会被保存,接着我们再生成一次。 这边还要注意的一点是,在我们搜索节点的时候,我们也可以输入英文,比如说加载图像的话,那么就是 load image, 那 么我们可以看到这两个节点是完全相同的。接着我们再来说一下,比如说当我们输入英文的时候,同样的也是 load image, 但是这个时候我们加了一个空格,好, 我们可以看到这里面并没有出现加载图像的节点,那么这也意味着在我们搜索节点的时候,我们要注意区分节点的名称是否有空格。好,比如说我们需要搜索加载图像节点,那么我们删去 load a m h 之间的空格时候,我们可以看到,哎, 是不是加载图像节点就出现了?好的,那么以上就是关于默认工作流的全部解释,接下来我们来看下界面还有其他哪些模块。首先我们点击左上角,这里有个文件夹, 点开后我们可以看到我们的工作流都保存在这,这边可以点击新建,那么我们就新建了一个新的工作流,当然我们也可以点击这个 import, 也就是输入我们的工作流,或者说是输入我们的文件夹。 最后我们点击 models, 我 们可以在这里找到并且下载相关的模型。接着我们来看一下右边的栏目,首先是该栏目的左上角,我们按住后可以进行拖动, 然后是这个齿轮标志,点开后我们便来到了康复 ui 的 设置界面,在这里我们可以设置语言,点开后我们可以看到有中文,繁体中文、英语以及日语韩语等等,我们往上翻可以看到有其他的功能,比如图像面板顺序,图像面板的位置等等等等,我们 往下看,这有个文本补全,这个 in a b o 我 们一定要勾选上,这代表着它的起用。文本补全的意思就是在我们数几十次的时候,会有这些英文短语的提示, 我们往下看就会添加提示词对列,这个是生成的意思。接下来我们可以看到一个保存的选项,点击该按钮我们便可以保存当前的工作流 以及加载,那么就是加载工作流,同样的意思。接着是重刷新,比如说我们下载一个新的大模型之后,那么我们点击重刷新便可使用。接下来还有个重点就是管理器,这个是康复余额里面最重要的节点,点开后我们可以看到有非常多的功能, 比如说这边有数据库以及频道方式,预览方法,表情等等等等。这边预览方法我们一般选择的是这个 a, ten, two r, g, b, 然后表情这一栏我们一般选择的是名称, 也就是标签名称。选择了之后,我们可以看到节点的右上方一般会出现一个小狐狸按钮,而小狐狸按钮则代表了是它是官方节点,那么我们可以看到该节点是属于编辑一个新节点组的。接着我们回到管理器 这六个 custom node 命令键,点开后我们可以看到有非常多的节点,在这里我们可以查找以及安装我们想要的任意一个节点。在监考的学习过程中,我们会频繁使用到这一个模块, 接着我们看到 model manager, 在 这里我们可以安装我们想要的任意一个模型,注意模型不是节点,他们是分开来的,至于干模块我们今后也会频繁的用到好的。在接受完 cf 以外的主界面以及各种参数后,我们来了解一下 stability 的 内在运行原理,就可以方便我们理解并掌握进一步的学习内容。 在我们输入完提速词之后,文本编码器的 get 模型会将提速词转化为特征向量,然后再由 ve 编码器将这些特征向量传入到前空间内,这些特征向量在前空间内不断的降噪,最后再由 ve 解码器 将这些经过降噪之后的特征向量解码成由一个个像素所组成的图片。好的,那么以上就是本期的全部内容了, hello, 大家好,欢迎来一道 comforui 系列教程的第四节课,那么本节课我们将一起学习文生图的相关知识 以及提述词的语法。在第三节课的结尾,我们一起学习了 stable fusion comforui 的 基础工作原理,那么现在我将结合默认的文生图工作流来讲解其中的工作流程。首先第一步,在我们输入完正负象题后,文本编码器内的克里普模型会将我们的提示词总后的特征向量输送到 k 彩阳器内。 那么这边有个疑问,就是文本编码器的克利普模型从哪来呢?我们顺着这个节点往下看,可以看到它来自于这个库页加载器, 而这个加载器主要是加载各种各样的大模型,也就是说文本编码器内的克利普模型是属于各个大模型的内置克利普模型,而不同的大模型之间克利普模型也可能会有所差异。那么接着我们可以看到这个库页加载器的输出有个 v a e, 那 么也就是说它提供了 v a e 模型,我们看看连到哪 哦,连到了 v a e 解码这里,而 v a e 解码的作用就是将 k 彩阳期内经过了降噪之后的前空间图像解码成像素空间的图像,也就是我们肉眼可以看到的图像。这边我们可以做个实验,先将种子轴固定,最后断开 v a e 的 连接, 然后我们生成,我们可以看到这边是直接报错了,而这个报错的意思是缺少了 vue 的 输入,那么接下来我们重新将 vue 模型给连上,随后开始生成。这边再提一嘴,生成的快捷键是 ctrl 加 enter, 非常的实用,请牢记。 如果说你想调节生成图片的尺寸,那么我们可以在空内存这里,比如说我们将高度调成七百六十八,除以这个数值一定是八的倍数,宽度也一样,这一批次的话则是控制单次生成的图片数量。比如说我们设置成二,好的,我们按 ctrl 加 enter 开始生成。 图片生成后,我们是不是可以看到他的比例已经成功变成了竖屏的比例,并且他一次生成了两张图像。好,接下来我们一起学习提速词的相关语法。首先我们来聊聊书写规范, 无论是正向提示词或者是副向提示词,我们在书写的时候一定是英文以及英文的标点符号,不然系统可能会识别错误。比如我们输入 one go gong 还有 yellow dress, 黄色的裙子。这边在提一嘴,生成的快捷键是 ctrl 加 enter。 好 在我们得到了一个穿着黄色裙子在花园中漫步女孩的图片。那如果说我们用中文来输入,结果会是什么样呢?一个女孩花园以及黄色的裙子, 我们这边可以看到,不能说是毫无关联吧啊,他们至少图片中都有女孩,但是黄色的裙子以及花园很明显没有在图片中出现。接下来我们来讲一讲提述词的权重。 在做之前,首先我们要理解什么是权重。对于权重概念模糊的小伙伴,我们可以理解权重就是比重 分量,那么一个提示词的权重越高,他的分量就越高,他的比重就越高,他在整体中的地位就越高。比如现在一个提示词的权重是一点二,而另一个提示词的权重是零点九,那么当然是一点二的提示词会占更大的比重。 那么接下来我们做个演示,比方说我们输入 one girl garden, one girl 的 权重是一点二,而 garden 的 权重是零点八,那么画面会更侧重于 one girl 的 展现。那如果说我们 one girl 的 比重是零点八,而 garden 的 比重是一点二,那么画面会更注重于描述花园是怎么怎么样的。 好的,接下来我们来讲一讲我们该怎么去控制描述词的权重。首先是重括号,重括号代表着零点九分的权重, 也就是说给提示词加上中括号后,提示词的比重会变小,会降低它的重要性。那接下来是小括号,小括号代表着一点一倍的权重, 比如我们给一个提示词加上小括号后,那么该提示词在画面中的比重就会增高。最后是大括号,大括号代表着一点零五倍的权重,算是一种微调。当我们给某位提示词听这两个中括号时,那么就相当于为这个提示词加上了零点九,乘以零点九是零点八一, 那么就相当于给这个提示词加上了零点八一倍的权重。那么同样的,当我们给一个体数词加上两个小括号时,那么就等于一点一乘以 一点一倍的权重,那也就是一点二一,相当于我们给这个提示词加上了一点二一倍的权重,大括号也同理。那么有的同学可能会问,关于这个权重的变化有没有什么快捷键呢?哎,这个还真有。比如我们将光标移动到某位提示词上时, 打个比方说该的摁住 ctrl 加上键,那么就是给他加权重,我们可以看到他的权重在不断增加,那么 ctrl 加下键,那么就是减少他的权重,是不是很方便呢? 不过我们要补充的一点是,关于权重,我们要多低都行,但是不可过高,因为过高的话图片就会落,你以何? 换句话说,图片就会变形,会失帧。接下来我们来讲短句和长句,我相信不少小伙伴都有这么一个疑问,为什么我姐提示词的时候一定是一个一个词这样去拼写, 而不是用一句话去描述我们想要生成的内容呢?那么这边我可以很明确的回答你,其实两种都行,但 就目前而言,用一个一个的词组去生成,效果会更加的准确,更能表达出我们提示词独含的意思。另外一点,使用一个一个的词的时候,也方便我们进行权重的调整。比如刚才我们有提到,将光标放在某一提示词上, 然后摁住 ctrl 加上或下,就可以调整该提示词的权重。那么如果说是一句话的话,你想调整某一提示词,那么可能就得手动续出过号,进行相关的权重调整。当然现在全世界的 a i g c 从业者也在不断的去研究该怎么样让自然语言,也就是我们的长句能达到媲美短句的效果。 接下来我们来讲一讲提示词的整体长度。这边要注意,比如我们在输入正向提示词的时候,并不是说越多就越好,多可能会让你的表现更加糟糕,那么我们最好把提示词控制在什么数量之内会效果最佳呢?经过众多 ai g c 玩家的经验以及研究表明, 提速词控制在七十五个之内是效果最精准的,超过了七十五个提速词的话,可能会对提速词的识别不精准,整体的表现会降低。正向提速词如此反向提速词也是一样的,记住最好不要超过七十五个。 接下来我们来讲一讲骑手势,那么什么是骑手势呢?在 step 第五选各个大模型训练的过程中,会加入许多的,比如四 k, 八 k 或者 master piece 各种各样高质量的图形去训练, 那么当我们在输入提示词的时候,比方说输入四 k masterpiece, 那 么就可以使我们生成的图像更加的精美。反向提示词的话,那么就相反,比如我们输入模糊 就是文不想要模糊嘛,那么相当于也是会让图片变得更加的清晰。或者说我们在反向提示词内输入文字 text, 那 么在画面中就会减少文字的出现。这边我们可以来看一下这几组的对比,才艺还是很明显的。 接下来我们来讲讲提速词的顺序,或许有小伙伴会有疑问,以为提示词在整体的前部或者是在整体的后部会有什么影响吗?答案是会有影响,在一组提示词中,约靠前的提示词权重会有所增加。那么在我们书写提示词的时候,我们尽量按如下格式进行书写。 首先是书写那些可以提升画质的,或者说可以改变画风的些词汇,比如 masterpiece, high, quality, high, detail, as 这些词汇。第二步是描述我们画面的主体,比如我们可以说 one girl u g s, 一个女孩,蓝色的裙子。 那么第三步就是描写环境,场景,灯光或者说构图。比如我们可以说啊 garden 背景嘛, garden 或者说是 white background, 白色的背景,或者说是 fall fly 柔和的灯光,类似于这些。那么最后我们可以在正向提示词的结尾添上我们想要加的 lora, 关于 lora 和各种模型的下载,我上期视频也有介绍,感兴趣的小伙伴可以回去观看。接下来我们来讲一讲提速词污染。那首先我们要知道 什么是提示词污染。我们可以看一下这一组图片,未经处理时,在多个提示词同时书写的情况下,各个提示词的意思可能会相互渗透。那么为了避免这种情况,我们可以用 break 来隔开提示词, 尤其是防止颜色污染之后我们来聊聊提示词融合。比如我们写 one go cat, 这边我们可以看到生成了一张猫在女孩身上的图片。好的,现在我们在 one go 和 cat 之间添加上 end。 注意这里的 end 必须是大写,全部大写。这边我们可以看到生成了一张猫娘的图片。这个 end 的 作用就是将两个提示词融合在一起。同样的,下划线也有和 end 类似的作用,也是将两个提示词结合在一块。 除此之外,给一组提示词用中括号括起来,中间再用竖线隔开,也有类似与融合的效果。那么这个的原理是,第一步画前面的关键词,第二步画后面的关键词,第三步又在画前面的关键词,以此类推。最后我们来讲一下控制生成的时间段, 比方说现在的迭代步数是二十步,在这过程中,我想让前百分之三十生成森林,后面百分之七十生成一个女孩。那么我们可以试着这么书写大括号, forrest 在 街上冒号 one girl 在 街上冒号零点三,最后以大括号结尾。那么这一长串 代表着是在百分之三十的时候叠数画 forest 还是画 one go。 那 么如果说文把零点三改成零点七,那么意思就是前百分之七十画 forest, 后面百分之三十画 one go。 好 的,那么以上就是本期的所有内容了。