粉丝2.2万获赞7.8万

你是否想训练一款能保持人物一致性的 lora, 却又不知道怎么去做完整的训练级?别怕一分钟教会你 如何生成用于训练 lora 的 完整训练级。首先,找到一张你非常满意的人物图片,打开 comfyui, 将图片上传到我提前准备好的工作流, 把图片尺寸最长边设置为八百四十八像素,短边会自动等比缩放。第二步,配置核心,加载一个三百六十度旋转的 logo 模型, u m t 模型选择忘二点一图声视频一四 b 模型。 第三步,在绿色框中输入提示词,点击执行后,等待几分钟就会得到旋转视频和黑白蒙版,从关键帧里挑十五到二十张,就得到完整训练级了。相关工作流和模型我已经调配好了,想体验的小伙伴来抄抄作业。

大伙好啊,呃,应小伙伴的要求哈,出一期这个千问二五幺幺骨骼参考图片编辑的工作流,然后说几个千问二五幺幺常用的 rola, 效果非常不错。那么先说这个骨骼参考啊, 这个工作流呢,就是比较简单的千问二五幺幺图片编辑的工作流,那么骨骼这块怎么处理呢?大家看好,首先工作流在这里上传参考图片,然后在这里上传呃,生成图片的宽和高, 然后呢,上传一张这个骨骼参考的图片啊,那么在后边这里呢,我们要提取图片当中的骨骼知识,那么这里边用的是这个 sdpos, 是 comewy 官方啊,支持的这么一个骨骼参考啊,呃,它的效果是非常不错的,比之前那个 dwpos 啊, 比这个 dwpos 和 openpos 效果都好哈。然后呢,这个模型呢,各位可以参考一下我之前的一期视频哈,专门讲这个 sim 三和这个 sdpos 官方支持的这么一期视频 啊,这个就不多说了啊,就是用它提取骨骼姿态,之后,大家看啊,提取的姿态复杂动作也能提取的出来哈。然后呢,在提示词这里边写参考图二的知识,保留图一的人物特征,然后生成图片,当然大家也可以在后边写这个人物的一些穿着呀,或者是背景都可以哈。 然后呢,生成的图片,大家看这个是生成的图片,这个是参考的骨骼,好吧,效果是还是比较不错的哈。然后呢,再说几个千万二五幺幺常用的几个 lora, 大家看哈,我列取了一个表格,首先第一个 lora 叫这个名, 呃,叫做 anything to real 是 吧?呃,就是转真实的这么一个 lora, 然后呢,作者在后边儿哈。呃,提示词呢?在这里,好吧,这个 lora 怎么用哈?就是用我们常用的这个二五幺幺工作流,然后加上这个 lora, 好 吧,加上这个 lora, 哈, 然后呢?提示词,把这个话粘进去,好吧,把提示词粘到下边儿这里边儿,然后上传参考图,然后呢,就可以看到效果了哈。呃,很简单,大家看哈,这个是上传的参考图,我放大一点儿, 好吧,这个是上传参考图,然后这个是加上转身时的这个 lora 效果,好吧,大家可以看到哈,效果是比较不错的,那么这个是无 lora 的 效果,大家先忽略背景图哈,就干看这个人物。无 lora 的 这个生成之后,第一个画面有点油。第二,呃,第一个画面有点油哈,第二个呢,这个人物有点像三 d 风格, 对吧?但是你看有 rola 之后的这个效果是不是比较真实啊?然后呢,第二个 rola, 大家看啊,叫这个三 d style, 作者仍然是这个哈,然后呢,提着词,在这里,大家直接粘过去就行。把 rola 放上,大家看好原图 是一个卡通人物,是吧?然后呢?转三 d 之后的效果,这个是没 rola 的 效果,明显有 rola 要比没 rola 的 好,对吧?然后呢,再往下看,第二个是一个 cosplay 啊,这么一个 logo, 这个 logo 怎么用呢?大家看这个啊,首先呢,我们要上传两个参考图,第一个参考图就是我们的主角人物,第二个是主角人物需要 cosplay 的 这么一个动漫人物,好吧。然后呢, 把这个 laura 加上之后啊,就是两张参考图,一个是主角,另一个是需要 cos 的 这个动漫人物,然后大家看好加上 laura 之后,然后提示词这么写啊,图一,人物 cosplay 图二的角色,好吧,然后呢,这个强度要给到零点八哈,各位,这个强度要给到零点八,大家先看这个,我给大家演示一下, 先来一个工作流,然后把第二张图打开双图啊,然后呢,上传一张图片,好吧,然后呢,这个 laura 这里啊,这么加载, 然后呢,它的强度我们给到零点八哈,这样呢,我们再把这个提示词粘过来,是吧?图一,人物 cos 图二的角色,然后点击生成就行了,但是啊,这里边哈,大家注意生成之后的这个人物哈,它相对来说清晰度和细节没那么高哈,大家看哈, 参考图是它,然后让这个女性角色去 cosplay 它,好吧,大家看,效果是这样的,这个是没料的效果,基本上就不可用哈, 好吧,那么呢,大家看啊,这个图片 cos 完之后呢,它的,呃,第一个清晰度不高哈,第二个它可能会有一些噪点,所以呢,我们需要后期处理一下,比如说我们用 zeemis 细化一下,再加放大处理,那么怎么去做呢? 我们找到这个工作流啊, zeemis 图片细化的这个,这个就是很普通的 zeemis 工作流啊,然后呢,大家看,我们把需要 处理的这张图片上传上来,在这里哈,上传上来,大家看啊,刚才 cos 的 结果确实不太清晰,对吧,而且噪点也比较多,那么这个时候我们上传这张图片,将它编码,然后传到我们的空前空间当中,内存当中哈,然后大家注意看啊,这里边的降噪我们给到零点二或者零点二五哈,各位别给高了,给高了人物就不像了。 然后呢,提示词这里边我们可以写一下,是吧,一个美女在干什么?好吧,可以简单写下提示词,然后最后再加一个 rts, 这个图像放大当然放大的呃,这个模型和节点有很多啊,大家可以随便选一个,最后呢,大家看出来的效果就是这种的,这个是四 k 的。 好吧,各位大家也可以换一下放大模型哈,那么这个 any to cosplay 啊,这个 lora 我 们先说完了哈,大家注意一下是吧,这里边需要上传两个,一个是主角,另外一个是需要 cos 的 这个二 d 图像,然后呢,提着词这么写 啊,强度给到零点八,但是后期需要处理一下哈,然后再往下看啊,这里边有一个千问啊,这个转卡通风格的这么一个 lora 作者呢?还是这位作者哈,然后呢,他也仍然需要后期放大处理啊,提着词这么写, 好吧, transform into 啊,这个卡通风格大家看啊,这个 logo 我 感觉挺好的,先看啊,上传一张原图,这是一个美女在舞剑是吧,大家看,用这个 logo 之后的效果 是吧,这个卡通风格可以吧,然后呢,这个是没加 logo 的 卡通风格,明显的区别对吧,所以这个 logo 还是可以的啊, logo 的 名字呢?是这个,大家所有的 logo 都可以在这里找到啊,老规矩好吧,老规矩啊, 然后呢,下边还有一个万物皆可 q 啊,皆可 q 化的这么一个。这个 rap 挺有意思啊,作者仍然是这位作者啊,挺有意思。然后提示词这么写,我们加载完 rap, 写完提示词之后,各位大家看好上传一个图片,这个是 q 版之后的效果,是不挺好玩的,那么这个是没 rap 的 效果,这个 rap 效果还是比较不错的啊,再往下啊, 这个呢,是千问二五幺二哈文生图的这么一个 logo 啊,转 ip 首办的题旨词,后边加上这些,然后前面可以写你要生图的题旨词好吗?大家看好,这个是有 logo 的 生图效果,大家看一下。 然后呢,这张图呢,是没 lora 的 这个生图效果,没 lora 的 这个生图效果啊,大家看,好,有点像这个三 d 风啊,它是不太像卡通啊,但是呢,不太像这个手腕风啊。然后呢,再往下看啊,这个 lora 不 解释了。然后呢,提示词这么写, 好吧, lora 的 名字。提示词这么写,大家直接看效果啊,这个呢,是这个风格 lora 啊,修图之后的效果,好吧,这个是不加 lora 的 效果,这是原图,好吧, 然后呢,下边还有一个 logo, 这个 logo 我 就不解释了,这个 logo 不 解释,也不方便展示,大家看一眼就行了。好吧,再往下看啊,这里边有一个也是转真实的这么一个 logo 哈,然后呢,作者是这位,好吧,然后呢, 题是这么写, convert to realistic style 是 吧?转真实,然后大家看哈,原图是一个卡通图像啊,这个是生成之后的效果,是比较真实的,这个是不叫 logo, 就是 比较油,好吧,那么推荐这几个 logo 啊,大家呢,可以在这里边找到。

哈喽,大家好,那么今天这个视频呢,我们来看一下最近一款比较火热的模型,那么它主要的功能呢,就是为了提供这 image 模型 更强大的观影效果,那么我们来到它的爆联网里面,我们翻译成中文,那么我们可以看到它是一款针对这个 z e m g tab 模型的 roura, 那 么它能够显著的提升我们照片的观影效果以及整体的图像质量,这里面有它的一个演示的效果。 那么左边呢是我们的原来的 tab 模型,右边则是加了 roma 之后的,这两者的区别就是左边的整体色系非常的冷淡,然后右边的色调会暖一点,然后色彩会丰富一点, 但是我们也可以看到这样带来的结果就是他的一个图像上面有非常多的噪点,但是相较于左边这张图而言,右边这张图要明显更鲜明一点,其实有一点像是给左边的图像加了个滤镜的效果。刚才这一张人像上面其实 难分不重,但是在这一张场景里面的话,我觉得右边这张图的效果是远高于左边这张的,那么这种蓝色的这种色调,整体图像的一个美感上面是比左边这张要好很多的。再看一下这一张, 怎么说呢,左边这张图明显感觉你会觉得它精致一点,但是整体的一个特步模型,它生成的图像都具有一个非常鲜明的特点,就是它的色调比较冷淡,所以导致图像的冲击力不是那么强。 但是右边这张的话,反而由于它具有一些噪点,导致这张图像你看起来会感觉要真实不少,所以这也是它的一个优点, 那么通过这种方式呢,我们就能够进一步提升我们的对杠以及模型生成图像质量还是很不错的。对于人像上面,我反而会觉得左边的这种效果会更好一点,因为你看到右边这种人像啊,他使用了我们的 roulette 之后呢,感觉老了很多, 包括皮肤的一些细节上面,整体是不如左边这张好看的,再比如说这一张,左边这个就是明显磨皮过的,然后右边这张就是 因为通过这种噪点的增加,给他增加了一些细节,会让右边的这张图像显得更丰富一点。我们也可以不断的看一下这两种, 这些都是他的模型上面提供的对比图,那么也是有不同的结果。那么具体到我们的康复 u i 中 使用效果怎么样呢?那么这里面我们用一款最基础的 z 杠一妹子的纹身图工作流来测试一下。那么上面的这一部分生成的内容是我们刚才取消了这个 u r 作用的, 下面这个则是添加了 logo 生产的效果,然后用了一组提词来对它进行生产,那么我们采用了相同的提词 及相同的种子树来进行 logo 测试。我们可以直接来对比一下左边这一张冷淡, 但是他的皮肤细腻,右边这张色调浓烈,但是增加了一些噪点。第二个则是一个景观的, 可以看到在景观上面,我觉得右边这张要明显超过左边这张图很多,左边这张图其实有一种很强烈的 ai 感,那么右边这张图要好很多。再比如说这一张,这一张图像带来的最大的观感就是他的图像过于光环,反而没有真实的, 那么右边这张呢,给他增加了一些这种噪点,反而会让这张图像看的更加的真实。再比如说这张的话,感觉左边要明显要好很多。 这一张是我们原来的太空模型的,它整体会非常的光滑,反而有点脱离了现实的感觉,那么这就是整体的这款柔软的一个使用效果,那么这个就是整个视频的全部内容, 我们主要讲解了一下有关这一款提高模型质量的柔软该如何使用,那么我们下个视频见,拜拜。

哈喽,大家好,今天给大家带来纤维 id 二五幺幺这个新模型,它所使用的系列工作流,那么我们这节课会去讲解这个单图双图以及三图编辑的工作流,后续还会去进阶一个一键多角度的一个分镜工作流。那么首先我们先来去看一下这个 二五幺幺 edit 单图编辑,那么这个单图编辑其实跟我们之前所去了解的二五零九,包括普通的 edit 其实用法都差不多,只不过工作流程里面,它这里会有一个专门的二五幺幺的一个四步加速的一个 laura, 还有去加上我们这个伊蒂特 f two p, 这个其实是锁定人脸像素的一个 lora, 如果用上这个 lora, 我 们如果是去进行一些角色的编辑,比如说改动作,改服装, 那我们的一个画面控制,或者说人物一致性它会控制的更好,这个就是一些模型的介绍,不然其实单图双图或者说三图编辑,其实它用的一个底层架构都是一样的, 因为千问它最多支持三张图片的一个控制,所以说其实单图双图和三图它是有一定区别的。我们先来去看一下单图编辑,单图编辑其实这工作流使用起来是很简单的,我们这里只上传一张图片,经过这个宽高比说放之后,就直接把这个图像去上传到这个千问 edit plus 专用的提示词识别的一个节点,这里我们连接负面的一个 image, 那 负面提示词这里其实大家可以写,就算不写千问他其实这个模型在训练过程中已经是融入了一些负面提示词,包括一些画面, 所以说基本上这个画面是不会崩的。我们图片上传进去之后,我给的提示这个女生放下了伞,因为她本身是举着这把伞的, 所以说我去做一下这个图片编辑,相当于我就直接去改图了。如果我们之前去用 t s 去改,其实是非常难的啊。但是我们用上这个图片编辑的模型,它也可以看到我们这个效果。首先手部是没有崩坏的,那手部崩坏其实是之前一些 ai 模型它经常会出现的问题, 现在基本上不会出现了,包括它的放散的位置也是 ok 的。 这个就是一个单图编辑,其实它本质上还是用的跟之前的千问编辑模型是一致的。那么双图编辑其实就是单图编辑的一个进阶哈,其实基本上的参数都不变, 只是说我们在图一的旁边多去增加一张图片上传到或者说连接到我们的这个节点,那你就需要去写这两张图片的一个 结合,或者说组合的一个提示词了。那么组合的提示词其实不用去写太麻烦,你可以把它称之为图二, 图一对于图二做了什么样的动作就可以了。其实这个图片其实写法是很简单,我这里接了一个整数长量,其实这个整数长量就相当于是我们最后生成图片的一个最长边, 比如说我们最后的图片肯定是以这个女生作为底图的,所以说最后我们的图片肯定是以幺二八零去作为最长边。大家也可以看一下我们这张图对不对?幺二八零乘以这个七六零,这个女神抱着这个小猫的一个一致性其实还是不错的,这个颜色也没有问题, 品种也没有问题,不会说这个突然变成了一个银渐层,或者说其他的梨花猫是不会有变化的啊。这个就双图的编辑,其实就是在单图的编辑上加了一张图,最后这个工作流程里面我们还要去讲一下这个三图编辑,三图编辑其实就是在 双图编辑的基础上再去增加一张,这个也其实到了千万这个图片编辑的一个极限了。那么我们再来去看一下这个三图编辑,他跟这个双图编辑有什么不一样呢?其实大家有没有发现,其实到了三图编辑之后,千万图片编辑的识别性他会降低一些,包括色彩他会弱一些, 因为图片一多对于模型处理的一个能力其实比较大的一个考验的。其实不管你是去用衣服或者说还是其他的一些内容,你但凡是要加到第三张图之后,他就会更加的不稳定。 所以说在这里我们其实也去加了一个参考 later, 对 于我们的图三去加了一个参考 later, 加了个参考 later 之后,这个图片它会进入到正负面条件里,画面理解能力就会更加的强,或者说这个图像不管是衣服还是说其他场景,它的一个相似度会更高, 所以说呢,我们加这个参考 later 还是很有必要的啊。如果你觉得图二的这个小猫咪不像了,你同样可以在图二这里去加参考 later, 就 比如说把这两个给复制下来之后进行串联,就相当于是我们每一张图都有一个参考的 later, 你可以串联到这个工作流程里面,大家也可以去注意一下,我们这个工作流程其实只是串联了图一和图三,所以说如果大家有兴趣也可以串联图二的,那你这里只需要去接一个 v 编码,那就可以了,记得把这个 v 给它连接上, 这样你小猫的一致性会比较高。那么这个三图编辑我们讲完了,我们再来去讲解一下这个千问 a d s 二五幺幺的一键多角度分镜的工作流, 其实这个工作流程就是基于我们刚刚去讲的流程进行的一个升级,那我们现在要去使用的其实也是这一个女生,但是我们要做他的一个不同角度的一个分镜图, 其实就是这个女生不动做这个动作,但是我用相机在不同的一个视角上去对他进行一个拍摄,比如说从他的一个头顶,从他的一个后方,从他的一个背部去 进行一个拍摄,这个就看他自己的一个提示式书写了。那么在这里需要注意的,首先在模型加载的一个区域,建议大家可以用满血版二五幺幺模型, 那么满血版和我们刚刚用的这个半学霸有什么区别?其实它的一个模型的理解能力,包括训练素材的一个什么精度也会更加的高,所以说它就更好用。其他都一样。 clip 模型,包括 ve 模型,还有说我们的洛尔模型,我们这里用的是四步加速的,这个是没问题。 还有一个必须要有千万二五幺幺的多角度的一个镜头模型,如果你不用你的这个画面,他还是会不给你去按照你的提示词准确的去生成, 所以说这个 lora 是 非常重要的,这个取决于你能不能够生成这些多角度的一个画面,那么我们这个 lora 去选择好之后呢?图片已上传,这个跟我们刚刚的单图编辑是一样的,来到了我们的提示词文本, 提示词文本这里其实我接的是一个提示函,也就是相当于我们可以一次的去生成多段的一个提示词,包括对应的画面, 所以说在这里大家也可以根据我底下给的注是你们想要去写比较精准的,比如说想写多一些,把这个画面也变成什么广角的,仰视的,或者说旋转多少度,就不是简单的,我上面写的俯视的你们也可以去用,但是这一个提示词的模板 是不能改的,因为这个东西就相当于是这个模型的一个识别指令,你如果不是按照这个要求,或者说这个格式,它还是不能够去生成你想要对应的一个指定的视角的。 那么来到了提示词横这一些区域啊,有些同学可能会看到这里要不要改,其实是不用改的,我们要改的其实这块区域而已,包括这个展示任何他其实给大家去看一下我们每一段提示词都是什么内容,大家也可以发现他这后面是没有连什么东西的,最后去接到我们的什么图片,这里 就这个提示词的一个输入框,最后接到 k 前器,最后去生成,大家也可以看一下我们这个效果,这个就是一个什么按顺序来的嘛?当镜头往下移动,将镜头往左旋转四十五度,往右旋转四十五度,就从右边去拍它,对不对?还有从将镜头转成俯视,转镜头转成仰视,那我们 都可以去完成的了,人物的一个一致性是不是保持的也不错?所以说工作流他可以简单的给我们一键生成多角度的分镜,在我们这节课的一个单图、拴图、删图、编辑,加上这个一键多角度分镜的工作流,我们就讲解到这。

一次性生成视频,无剪辑,免费。 ltx 二点三徒生视频效果来了, 这海滩也太好看了吧,等会下去拍几张。可以,你负责拍美一点。那你负责长得配合一点。你还是追来了。为了一个不存在的真相,值得吗? 值不值得由我手里的枪说了算。把芯片交出来,哈哈哈哈。 ltx 用了没?效果怎样? 刚才大家看到的这些效果都是一次生成出来的,没有剪辑,没有复杂,后期也不是一帧一帧硬拼出来的。它是一个基于 ltx 二点三训练的图声视频。 laura singleton 预览版主要解决几个问题,角色肢体不稳定、 分镜不听话、 ai 感太重、神情僵硬,还有提示词遵从度不够等问题。就是让 ltx 二点三的图声视频更稳一点,更像正常镜头一点。使用方法也不是很复杂,我们只需要上传一张图片,然后按时间段写提示词, 比如零到五秒,角色做什么说什么,五到十秒,镜头怎么切,动作怎么变。如果是话外音或者内心独白,不想让角色嘴巴动,就直接写话外音和台词。这里有个重点,台词可以写中文,但画面描述最好用英文。 不过这种分段提示词写起来确实有点小麻烦。不过没关系,在工作流里加了千万三点五图像反推节点,你只要简单写一句场景,比如两个角色坐在车上聊天,剩下的英文描述动作和镜头可以让模型帮你扩展。 另外,这个工作流还支持首尾针视频,通过 kj 的 首尾针节点,你可以控制图片在第几针出现。比如视频是二十四针每秒,第七十二针就是第三秒,也就是说你可以让第二张图精准出现在第三秒,用来做角色切换、镜头转场或者更明确的分镜控制。 目前这个新歌来瑞奇 laura 还只是预览版,原作者只训练了百分之十的进度,在非高动态视频里他已经比较稳定了,但高动态动作还没有完全拟合,所以这版更适合测试人物对话、镜头切换、轻动作、剧情分镜这类场景。 不过原作者说完整版也已经安排在路上了,那么好的小伙伴们,今天的内容分享就到这里了,视频中演示用到的工作流节点和相关模型,我以网盘的形式打包好了, 想要研究学习的小伙伴可以在评论区置顶位置自行领取,如果没看到的话也可以在评论区回复个六六六,我看到了会直接发送给你。好的小伙伴们,那我们下期再见,拜拜!

网上随便刷到一张好图,直接拖进这个工作流,一键就能生成这个人各个角度的照片,真人三 d 卡通全都能轻松拿下。再用这些图训练个模型,想让人物摆什么 pose, 出现在什么场景随你控制,甚至还能替换影视片段里的人物,过一把当主角的瘾。 那具体怎么玩?今天分享几个工作流,手把手教你搞定。那我们先打开这个工作流,我们一起来看一下它怎么使用的。那这个工作流的大模型呢,主要用到的是千问二五零九 f p 八的一个大模 型。那这里呢,我是直接用到了一个八步的一个 laura 加载器,以及呢会用到一个多角度循环的一个 laura 加载器。那关于这个工作流呢,我都已经打包放在我的学习文档当中了,如果有需要的小伙伴呢,可以在我的评论区留言。 那我们来看一下。那这个工作呢,主要还是进行一个纹身图的一个工作,但是呢,我这里会加入了一个循环的一个节点,也就是说只需要把一张图片上传到这里,就可以自动的为我们生成多个角度的一个图片了。那这里呢,会有一个上传 提示词的一个节点,那这个节点呢,如果说你的这个形象,他是全身图的,那这个节点你可以不用去填写。那如果说你上传的图像是这种半身图, 你在这里呢,可以去补充你这个图像的一个下半身,比如说我现在生成的这个小姐姐呢,他的这个图像是一个上半身的,于是我在底下这里写的是一个百褶裙,还有一个小皮鞋的一个提示词,那么他给我生成出来的一个全身照呢,就要按照我的这个提示词给我进行生成了, 那如果说你不想去书写也没有关系,他也会给我们自动的一个生成图像的,那我们这个工作怎么使用呢?那我们先拿这个小姐姐来作为一个视力,我们直接把 我们的模特小姐姐进行上传,那上传之后呢,你其他地方都不用去改动这里呢,我们直接把这个提示词给删掉,因为我这一组的图像呢是一个真人模特,他是不需要我们去描述啊,下半身的一个穿搭的,我们直接点击运行, 点击运行之后呢,我们这里就会出现多个角度的图像了啊,如果说你对于这个角度要求的会更多的话呢,你也可以来这里去修改我们的一个提示词,那在这里呢,我是设置好了我们的一个正视图,半身图还有特写的一个正视图, 那这一对提示词呢,相对来说是比较好用的,那如果你还有其他这种视角的需求,你也可以在这里去进行修改,也是没有问题的,其他的数值你都不用去改动,使用起来呢也是非常的 方便。大家可以看到啊,我们的这个图像生成它还是非常清晰的,不管是说你是想要生成二次元的多角度图片,还是真人的多角度图片,那你这一个工作完完全全可以搞定, ok, 我 们现在呢图像就生成好了,如果说我们想要大图的话呢,也可以直接点 这个小姐姐的图像,比如说我们想要这个测试图直接点开,那这里呢就是放大的一个大图了,这些都是可以分别去保存的。那以上呢就是的这个工作流的使用方法了,如果你对于这个工作比较感兴趣,那我都会给大家分享的。

大伙好啊,呃,之前呢,有小伙伴给我留言哈,问我有没有这个奶油风格的这个工作流生图的和生视频的,这个我想了一下啊,小伙伴指的应该是这种风格 好吧,就是我把它定义为这个偏二点五 d, 然后有点油油的这种风格啊,因为我不知道这种风格的学名,如果有小伙伴知道的可以给我留个言哈,我也学习一下。 这个风格呢,是我用这个 j e m s turbo 哈,然后本地训练的一个风格哈,我把它起名是二点五 d 好 吗?大家知道这个学名的可以给我留个言啊,我也学习一下。然后呢,大家看一下,这个是升图之后的效果,然后呢,复杂一点的动作呢,可能需要抽一次卡哈。呃,整体上还是还行好吧。呃,这是女生的图片 啊,跑步的啊,打招呼的,然后呢,这个是坐着的啊,这个知识。然后呢,呃,之前呢也录过几期视频啊,关于这个 j e max turbo 啊,它的风格 lora 以及人物 lora 的 训练啊,大家感兴趣的也可以到视频下方去看一看啊,就是因为 j e max turbo 这个模型在本地训练的成本并不是特别大哈, 而且训练风格或者人物 lora 的 时候是吧,呃,时长也不是很长,这个是能接受的啊,大家感兴趣可以看一下啊,我已经上传到 running hop 了,大家可以在 running hop 上先去试一下哈,如果如果可以的情况下呢,大家可以到网盘当中去下载哈,然后呢,还有一个是 lts 二点三的这个纹身视频的,这个所谓的奶油风格的啊,这个 lora 是 我在其他博主那里下载的,那具体哪位博主有点忘了哈,时间有点久了。然后呢,大家看一下它生成视频的效果是这样的。 好吧,应该是满足要求的哈。然后呢,这个工作流呢,我也上传到 running hip hop 了。然后呢,大家也可以在网盘当中啊找到这个 lts 二点三,是吧?在这里哈。

警告,本视频耗十四个月制作,制作时长五百分钟,陪你系统学习康 b u i 制作视频!这应该是目前最详细的 ai 视频教程了,哪怕你是零基础,也能轻松给你学会!马上暑假了,有人愿意每天花一小时学习 ai 慢剧制作吗?不用,对, 不用魔法,它就是最近重磅更新的 comforsee 破线版,本地一键启动,你就可以实现纹身图图生视频一键室内渲染设计、古风真人 ai 视频虚拟模特、做电商服装等三百加工作留模板, 老规矩,验个牌试试吧!本套课程共分为两个部分,一到六节为基础部分,其中包含了 kufui 的 配置要求以及如何安装与部署、 界面导览与原理介绍文声图以及提示词的语法,之后还会聊聊 ai g c 的 相关网站以及模型下载,最后还有读声图以及高清修复的过程。那么从第七节课到第十三节课属于进阶部分,先后会讲解坑深内及其诸多预处理器的使用方法以及使用场景,之后还会教大家 ipad pro 及其强大功能的应用。 随后我们还会学习最基础的 ai 视频生成原理,而在最后,我们将结合前面所学的全部知识,一起来做一个 ai 视频换脸、转会。这些这些这些都是 ai 生成的。 自二零二三年以来, ai 绘图软件 stupefaction 的 发展势不可挡,各种各样的衍生模型插件白花起放,现如今生成像这样的 ai 视频完全不在话下,那么 我们就一起跟随着时代的脚步,一起探寻 stableview 的 comfui 到底该如何使用吧!大家所熟知的 webui 和 comfui 其实都是属于 stableview, 而 webui 主要是基于规则库开发的浏览器界面, comfui 则是使用图形节点、流觞图设计和用于稳定扩散的用户界面。这边我们将 comfui 和 webui 的 优缺点列出来,方便大家做个对比。首先我们来看 webui 这块,它的优点是简单易学,并且操作较为基础与简易, 而它的缺点是不利于长期管理。那么这是什么意思呢?当你在深度学习完 vbu ui 的 高阶内容后,你会意识到如果使用的是康复 ui, 那 么将节省两到三倍甚至更多的时间。其次,在插件过多时, vbu ui 会显得非常的臃肿, 机操作费时。那么接下来我们看一下康菲 u i。 这边我们可以看到康菲 u i 对 配置的要求较低,这同时也意味着降低了 ai 绘画的门槛,方便更多的小伙伴加入进来。那么它的优点其次是节点更易于管理,有较强的自主性,我们可以根据个人需求来组装属于自己的工作流。 并且在未来,康菲 u i 将逐渐与未必 u i 在 应用层面拉开距离。比如前段时间的 s d 三或者国产最新的可棱大模型, 都是第一时间在康复 ui 里可搭建工作流并使用的。而对于未被 ui, 这些最新的模型与插件往往得过一阵子才能失桩,甚至直接不失桩。所以使用康复 ui 也意味着你能够更早的使用到最新的模型与插件。康 复 ui 的 缺点是初期不好上手,但我相信在你学完了本套课程后,一定能够完全掌握康复 ui 的 技术操作。除此之外,过去我们知道有许多软件,比如 blender、 达芬奇 ue 等等都是使用节点式工作流, 因为他们有极强的自主心与可模块化,许多头部公司的顶级团队使用的都是节点式软件。那么 comfuly 除了上述优点之外,我们在使用时还可以非常方便的套用他人分享的工作流,即刻便可实现相同的效果,节省了非常多的节点部署思路的思考时间, 以及从单个节点构建成工作流的部署事件。哈喽,各位小伙伴大家好,欢迎来到 cf ui 系列教程的第二节课。那么在本节课中,我们将介绍 cf ui 的 配置要求以及安装与部署的过程。那么首先是电脑配置以及系统环境的介绍,首先是显卡方面, 最低要求是拥有四 g 级以上显存的英伟达显卡,如果显存不足,可能会影响到绘图过程的流畅度。接下来是 cpu, 关于 cpu 要求不高,英特尔十代 i 三以上就可以使用,但推荐使用性能更强的,如英特尔十三代 i 五幺三六零零 kf, 以获得更好的性能。接下来是内存,内存至少需要十六 gb, 推荐三十个 gb 以上,以确保可以加载和运行较大的模型。最后是硬盘,关于硬盘呢,至少需要两百 g 的 空余空间,推荐使用大容量的固态硬盘,因为 ai 绘图过程中会下载和生成大量的模型以及图像数据。那么接下来我们详细介绍一下康菲 u i 的 下载以及部署方式。 我们先安装资源包里面附带的启动器运行依赖,接着打开解压之后的 comfui 文件夹,在文件夹内找到 a 会使启动器,随后点击一键启动即可。锁匙启动时可能会安装一些必要的环境依赖。 稍等片刻后,我们便来到了 comfui 的 主界面。接下来介绍第二种安装方法,官网资源包的安装。当然关于官网的资源包,我们也可以在评论区内获取。我们解压完资源包后,在文件夹内找到这个项目, 双击运行。等待片刻后,我们便可以来到最原汁原味的 cf ui 界面了。这个版本的 cf ui 是 没有装任何非官网的插件的。 此外, cf ui 完全离线工作,对 gpu 的 要求相对较低,但是也有 cpu 模式,不过在 cpu 模式下绘图速度极微缓慢。如果小伙伴们之前有使用过 vpu ui 或其他类型的 stupefaction ai 绘图应用, 我们可以通过修改 comfui 的 配置文件来实现在不同的 ai 绘图应用间共享大模型以及 logo 等等,依次减少对硬盘内存的占用。那么接下来我就向大家演示一下如何将我们的 comfui 大 模型以及 logo 的 加载路径修改成 vibui 的。 如果小伙伴们没有玩过 vibui, 那 么这一段可以直接跳过。好的,那么我们打开 comfui, 接着我们找到这个文件, s 三 model pass yaml 点 big example, 接着我们找到这一项 base pass, 我们要做的是把贝斯帕后面的这一串改成我们 web ui 文件夹的路径。比方说我们打开了 web ui 的 文件夹后,我们可以单机上面的这个栏目,随后 ctrl c 复制。接着我们回到刚才的记事本内,将我们刚刚复制的路径粘贴到此处,随后我们保存并关闭记事本。接下来的一步很重要, 我们需要将 example 以及这个点给删除,也就是将我们的文件名后缀改成点 y a m l, 随后点击确定即可。那么接下来我们打开 comui 来确认一下。 好的,我们这边看一下 check point 加载器里面的大模型,点开后我们可以看到多了,非常多啊,那么这就证明我们成功把模型路径合并到了 v b u i 内。好的,那么以上就是关于本期的全部内容了, 欢迎来到 comfui 系列教程的第三节,那么在本节课中,我们将一起了解 comfui 的 主界面以及各种参数到底代表了什么。最后我们将学习 stableview 生成图片的根本原理。好的,我们打开了七位大佬的会式启动器后,点击一键启动。 经过一段时间的等待后,我们便来到了 comfui 的 主界面。那么我们在面对 comfui 这个完全陌生的软件时,我们要做的就是初步了解每一个模块的大体含义,那么接下来我带着大家过一遍。首先是操作方式,我们可以通过鼠标的滚轮来控制画面的缩放, 按住鼠标左键,我们可以拖动我们的仕图。点击鼠标右键,我们可以看到有非常多的栏目,这边我们可以试着点击新建节点,随后我们可以看到有非常多的节点可以供我们选择。好的,那么之后我们再来说一下快捷键,顺从图片的快捷键是 ctrl 加 enter 框选节点的快捷键是按住 ctrl 加鼠标的左键。移动框选目标的快捷键是按住 shift 加鼠标的左键。 这边我们在框选门后,如果不按住 shift 直接进行拖动的话,我们可以看到此时只有单一节点进行了移动,剩下的快捷键我都放在这了,小伙伴们可以暂停观看。 好的,那么接下来我带着大家一起来解读一下这个默认工作流。首先在这边我们可以看到有个叫 shift 烹饪加载器的东西,这个节点的主要作用是加载扩散模型, 也就是我们常说的大模型。此外,该节点还提供适当的 v、 a、 e 以及 clip 模型,具体它们是什么,我们带回讲。我们顺着缺空位加载器的节点连线,可以看到这里有两个 clip 文本编码器,在这里我们可以看到它们的输入都是 clip, 而他们的输出都是条件。那么究竟什么是 k 服模型呢? k 服全称为 control language image programming, 是 由 open ai 公司在二零二一年发布的一款多模态预训练神经网络模型。 k 服模型的作用是理解我们输入文字的意思,比如我们输入 one go 生成的是一个女孩,而不是太阳, 这就是 clip 的 作用。接着我们顺着 clip 文本编码器的条件输出看过来,连接到了 k 采阳器上。这边我们可以看到 k 采阳器拥有两个关于条件的输入,一个是正面条件,另一个是负面条件。那么这代表着连接着正面条件的文本编码器内的提示词为正面条件提示词, 也就是我们常说的正向提示词。同理,下面的则为负面条件提示词,也就是我们常说的负面提示词。好的,我们把目光重新回到 k 采阳器内, 我们可以看到除了正面条件以及负面条件外,还有两个输入,分别是模型以及 latent。 那 么模型则是连接着刚才的这个 pos 接收器,也就是我们的大模型。那么这个 latent 究竟是什么意思呢? latent 通常是指前空间,可以理解为 stability fusion 内部流程中的图像格式。如果将图像作为输入,则需要通过 v a e 编码将其转化为 latent。 数据 在最后输出时,也需要通过 v a e 解码将其转化为像素空间,也就是我们最终看到的图像。这边我们可以看到可以采洋气的 laten 连接着一个叫做空 laten 的 节点,这个节点内共有三个参数, 分别是宽度、高度以及 p c 大 小。宽度和高度决定了我们最终生成图像的尺寸,而 p c 大 小则代表着每生成一次将出多少张图。比如说我们将 p c 大 小改为三,高度改成七百六十八。 最后我们按 ctrl 加 enter 进行生成。好的,这边我们可以看到一次性生成了三张图像,也就是我们批次数目的图像。接下来我们继续看 k 太阳系的其他参数。 首先是随机总,随机总的值我们一般称为种子值,每张图都有专属于它的种子值,我们也可以理解为种子值,就是图片的 id 号码。接下来是运行后操作,点开后我们可以看到用了四个选项,分别是固定、增加、减少以及图片的 id 号码。接下来是运行后操作,点开后我们可以看到用了四个选项,分别是固定则,在你生成完后,种子值会保持不变, 方便你进行其他的调整与操作。那么接下来就是裁量部署,裁量步数越多,计算机的运算时间越长,在大多数的情况下,我们的裁量步数保持二十到三十步即可。接下来是 c f 句子,该指的意思是 提示词引导系数。 c f 句子越高,则代表着生成图像与提示词之间的联系越紧密。 c f 句子越低,则代表着提示词对生成结果的影响越小。不过过高或过低的 c f 句子都会给图片带来不好的影响, 所以我们一般保持适中的 c f 制即可。接下来是采阳器和调度器,我们可以理解它们为图像的生成方式,如果我们将其他参数比作是食材,那么它们则是烹饪方式,不同的烹饪方法当然会带来不一样的结果。比如我们点开采阳器后,可以看到有非常多的选项,这里我们目前最好的一般是选 择这个 g p n 加二 m 或者 d p n 加二 m s d e, 这两个都是挺不错的。接下来调度器我们也是可以看到有非常多的选项,这里我们一般选择的是 keras。 最后我们可以看到还有个降噪参数,由于该参数是跟图胜图有关的,我们以后再说。接下来我们看一下右边有个叫做物业 e 解码的东西,那么我们可以看到这边也有两个输入,分别是 laten 以及物业 e。 至于 laten 刚才我们已经解释过了,也就是擒控件图像,那么物业 e 究竟是什么呢?物业 e 全称变分字编码记 ruby 炫的 ootlin 格式的缩写。它是一种深度学习模型,主要用于无间断学习任务,特别是在生成模型领域。 维 e 结合了神经网络和概率图模型的特点,而它在康复以外的作用是将我们的前空间图像编码成像素空间图像,或是将像素空间图像编码成前空间图像。除此之外,我们还可以双击屏幕上的空白处,随后就可以搜索节点,比如说搜索加载图像, 或者我们也可以双击搜索预览图像。这边再多说一嘴,维 e 解码之后的图像节点,我们也可以直接连接到预览图像上, 比如说我们现在把这个保存图像节点给删去,如果这么操作的话,那么我们生成的图像不会被保存,接着我们再生成一次。 这边还要注意的一点是,在我们搜索节点的时候,我们也可以输入英文,比如说加载图像的话,那么就是 load image, 那 么我们可以看到这两个节点是完全相同的。接着我们再来说一下,比如说当我们输入英文的时候,同样的也是 load image, 但是这个时候我们加了一个空格,好, 我们可以看到这里面并没有出现加载图像的节点,那么这也意味着在我们搜索节点的时候,我们要注意区分节点的名称是否有空格。好,比如说我们需要搜索加载图像节点,那么我们删去 load a m h 之间的空格时候,我们可以看到,哎, 是不是加载图像节点就出现了?好的,那么以上就是关于默认工作流的全部解释,接下来我们来看下界面还有其他哪些模块。首先我们点击左上角,这里有个文件夹, 点开后我们可以看到我们的工作流都保存在这,这边可以点击新建,那么我们就新建了一个新的工作流,当然我们也可以点击这个 import, 也就是输入我们的工作流,或者说是输入我们的文件夹。 最后我们点击 models, 我 们可以在这里找到并且下载相关的模型。接着我们来看一下右边的栏目,首先是该栏目的左上角,我们按住后可以进行拖动, 然后是这个齿轮标志,点开后我们便来到了康复 ui 的 设置界面,在这里我们可以设置语言,点开后我们可以看到有中文,繁体中文、英语以及日语韩语等等,我们往上翻可以看到有其他的功能,比如图像面板顺序,图像面板的位置等等等等,我们 往下看,这有个文本补全,这个 in a b o 我 们一定要勾选上,这代表着它的起用。文本补全的意思就是在我们数几十次的时候,会有这些英文短语的提示, 我们往下看就会添加提示词对列,这个是生成的意思。接下来我们可以看到一个保存的选项,点击该按钮我们便可以保存当前的工作流 以及加载,那么就是加载工作流,同样的意思。接着是重刷新,比如说我们下载一个新的大模型之后,那么我们点击重刷新便可使用。接下来还有个重点就是管理器,这个是康复余额里面最重要的节点,点开后我们可以看到有非常多的功能, 比如说这边有数据库以及频道方式,预览方法,表情等等等等。这边预览方法我们一般选择的是这个 a, ten, two r, g, b, 然后表情这一栏我们一般选择的是名称, 也就是标签名称。选择了之后,我们可以看到节点的右上方一般会出现一个小狐狸按钮,而小狐狸按钮则代表了是它是官方节点,那么我们可以看到该节点是属于编辑一个新节点组的。接着我们回到管理器 这六个 custom node 命令键,点开后我们可以看到有非常多的节点,在这里我们可以查找以及安装我们想要的任意一个节点。在监考的学习过程中,我们会频繁使用到这一个模块, 接着我们看到 model manager, 在 这里我们可以安装我们想要的任意一个模型,注意模型不是节点,他们是分开来的,至于干模块我们今后也会频繁的用到好的。在接受完 cf 以外的主界面以及各种参数后,我们来了解一下 stability 的 内在运行原理,就可以方便我们理解并掌握进一步的学习内容。 在我们输入完提速词之后,文本编码器的 get 模型会将提速词转化为特征向量,然后再由 ve 编码器将这些特征向量传入到前空间内,这些特征向量在前空间内不断的降噪,最后再由 ve 解码器 将这些经过降噪之后的特征向量解码成由一个个像素所组成的图片。好的,那么以上就是本期的全部内容了, hello, 大家好,欢迎来一道 comforui 系列教程的第四节课,那么本节课我们将一起学习文生图的相关知识 以及提述词的语法。在第三节课的结尾,我们一起学习了 stable fusion comforui 的 基础工作原理,那么现在我将结合默认的文生图工作流来讲解其中的工作流程。首先第一步,在我们输入完正负象题后,文本编码器内的克里普模型会将我们的提示词总后的特征向量输送到 k 彩阳器内。 那么这边有个疑问,就是文本编码器的克利普模型从哪来呢?我们顺着这个节点往下看,可以看到它来自于这个库页加载器, 而这个加载器主要是加载各种各样的大模型,也就是说文本编码器内的克利普模型是属于各个大模型的内置克利普模型,而不同的大模型之间克利普模型也可能会有所差异。那么接着我们可以看到这个库页加载器的输出有个 v a e, 那 么也就是说它提供了 v a e 模型,我们看看连到哪 哦,连到了 v a e 解码这里,而 v a e 解码的作用就是将 k 彩阳期内经过了降噪之后的前空间图像解码成像素空间的图像,也就是我们肉眼可以看到的图像。这边我们可以做个实验,先将种子轴固定,最后断开 v a e 的 连接, 然后我们生成,我们可以看到这边是直接报错了,而这个报错的意思是缺少了 vue 的 输入,那么接下来我们重新将 vue 模型给连上,随后开始生成。这边再提一嘴,生成的快捷键是 ctrl 加 enter, 非常的实用,请牢记。 如果说你想调节生成图片的尺寸,那么我们可以在空内存这里,比如说我们将高度调成七百六十八,除以这个数值一定是八的倍数,宽度也一样,这一批次的话则是控制单次生成的图片数量。比如说我们设置成二,好的,我们按 ctrl 加 enter 开始生成。 图片生成后,我们是不是可以看到他的比例已经成功变成了竖屏的比例,并且他一次生成了两张图像。好,接下来我们一起学习提速词的相关语法。首先我们来聊聊书写规范, 无论是正向提示词或者是副向提示词,我们在书写的时候一定是英文以及英文的标点符号,不然系统可能会识别错误。比如我们输入 one go gong 还有 yellow dress, 黄色的裙子。这边在提一嘴,生成的快捷键是 ctrl 加 enter。 好 在我们得到了一个穿着黄色裙子在花园中漫步女孩的图片。那如果说我们用中文来输入,结果会是什么样呢?一个女孩花园以及黄色的裙子, 我们这边可以看到,不能说是毫无关联吧啊,他们至少图片中都有女孩,但是黄色的裙子以及花园很明显没有在图片中出现。接下来我们来讲一讲提述词的权重。 在做之前,首先我们要理解什么是权重。对于权重概念模糊的小伙伴,我们可以理解权重就是比重 分量,那么一个提示词的权重越高,他的分量就越高,他的比重就越高,他在整体中的地位就越高。比如现在一个提示词的权重是一点二,而另一个提示词的权重是零点九,那么当然是一点二的提示词会占更大的比重。 那么接下来我们做个演示,比方说我们输入 one girl garden, one girl 的 权重是一点二,而 garden 的 权重是零点八,那么画面会更侧重于 one girl 的 展现。那如果说我们 one girl 的 比重是零点八,而 garden 的 比重是一点二,那么画面会更注重于描述花园是怎么怎么样的。 好的,接下来我们来讲一讲我们该怎么去控制描述词的权重。首先是重括号,重括号代表着零点九分的权重, 也就是说给提示词加上中括号后,提示词的比重会变小,会降低它的重要性。那接下来是小括号,小括号代表着一点一倍的权重, 比如我们给一个提示词加上小括号后,那么该提示词在画面中的比重就会增高。最后是大括号,大括号代表着一点零五倍的权重,算是一种微调。当我们给某位提示词听这两个中括号时,那么就相当于为这个提示词加上了零点九,乘以零点九是零点八一, 那么就相当于给这个提示词加上了零点八一倍的权重。那么同样的,当我们给一个体数词加上两个小括号时,那么就等于一点一乘以 一点一倍的权重,那也就是一点二一,相当于我们给这个提示词加上了一点二一倍的权重,大括号也同理。那么有的同学可能会问,关于这个权重的变化有没有什么快捷键呢?哎,这个还真有。比如我们将光标移动到某位提示词上时, 打个比方说该的摁住 ctrl 加上键,那么就是给他加权重,我们可以看到他的权重在不断增加,那么 ctrl 加下键,那么就是减少他的权重,是不是很方便呢? 不过我们要补充的一点是,关于权重,我们要多低都行,但是不可过高,因为过高的话图片就会落,你以何? 换句话说,图片就会变形,会失帧。接下来我们来讲短句和长句,我相信不少小伙伴都有这么一个疑问,为什么我姐提示词的时候一定是一个一个词这样去拼写, 而不是用一句话去描述我们想要生成的内容呢?那么这边我可以很明确的回答你,其实两种都行,但 就目前而言,用一个一个的词组去生成,效果会更加的准确,更能表达出我们提示词独含的意思。另外一点,使用一个一个的词的时候,也方便我们进行权重的调整。比如刚才我们有提到,将光标放在某一提示词上, 然后摁住 ctrl 加上或下,就可以调整该提示词的权重。那么如果说是一句话的话,你想调整某一提示词,那么可能就得手动续出过号,进行相关的权重调整。当然现在全世界的 a i g c 从业者也在不断的去研究该怎么样让自然语言,也就是我们的长句能达到媲美短句的效果。 接下来我们来讲一讲提示词的整体长度。这边要注意,比如我们在输入正向提示词的时候,并不是说越多就越好,多可能会让你的表现更加糟糕,那么我们最好把提示词控制在什么数量之内会效果最佳呢?经过众多 ai g c 玩家的经验以及研究表明, 提速词控制在七十五个之内是效果最精准的,超过了七十五个提速词的话,可能会对提速词的识别不精准,整体的表现会降低。正向提速词如此反向提速词也是一样的,记住最好不要超过七十五个。 接下来我们来讲一讲骑手势,那么什么是骑手势呢?在 step 第五选各个大模型训练的过程中,会加入许多的,比如四 k, 八 k 或者 master piece 各种各样高质量的图形去训练, 那么当我们在输入提示词的时候,比方说输入四 k masterpiece, 那 么就可以使我们生成的图像更加的精美。反向提示词的话,那么就相反,比如我们输入模糊 就是文不想要模糊嘛,那么相当于也是会让图片变得更加的清晰。或者说我们在反向提示词内输入文字 text, 那 么在画面中就会减少文字的出现。这边我们可以来看一下这几组的对比,才艺还是很明显的。 接下来我们来讲讲提速词的顺序,或许有小伙伴会有疑问,以为提示词在整体的前部或者是在整体的后部会有什么影响吗?答案是会有影响,在一组提示词中,约靠前的提示词权重会有所增加。那么在我们书写提示词的时候,我们尽量按如下格式进行书写。 首先是书写那些可以提升画质的,或者说可以改变画风的些词汇,比如 masterpiece, high, quality, high, detail, as 这些词汇。第二步是描述我们画面的主体,比如我们可以说 one girl u g s, 一个女孩,蓝色的裙子。 那么第三步就是描写环境,场景,灯光或者说构图。比如我们可以说啊 garden 背景嘛, garden 或者说是 white background, 白色的背景,或者说是 fall fly 柔和的灯光,类似于这些。那么最后我们可以在正向提示词的结尾添上我们想要加的 lora, 关于 lora 和各种模型的下载,我上期视频也有介绍,感兴趣的小伙伴可以回去观看。接下来我们来讲一讲提速词污染。那首先我们要知道 什么是提示词污染。我们可以看一下这一组图片,未经处理时,在多个提示词同时书写的情况下,各个提示词的意思可能会相互渗透。那么为了避免这种情况,我们可以用 break 来隔开提示词, 尤其是防止颜色污染之后我们来聊聊提示词融合。比如我们写 one go cat, 这边我们可以看到生成了一张猫在女孩身上的图片。好的,现在我们在 one go 和 cat 之间添加上 end。 注意这里的 end 必须是大写,全部大写。这边我们可以看到生成了一张猫娘的图片。这个 end 的 作用就是将两个提示词融合在一起。同样的,下划线也有和 end 类似的作用,也是将两个提示词结合在一块。 除此之外,给一组提示词用中括号括起来,中间再用竖线隔开,也有类似与融合的效果。那么这个的原理是,第一步画前面的关键词,第二步画后面的关键词,第三步又在画前面的关键词,以此类推。最后我们来讲一下控制生成的时间段, 比方说现在的迭代步数是二十步,在这过程中,我想让前百分之三十生成森林,后面百分之七十生成一个女孩。那么我们可以试着这么书写大括号, forrest 在 街上冒号 one girl 在 街上冒号零点三,最后以大括号结尾。那么这一长串 代表着是在百分之三十的时候叠数画 forest 还是画 one go。 那 么如果说文把零点三改成零点七,那么意思就是前百分之七十画 forest, 后面百分之三十画 one go。 好 的,那么以上就是本期的所有内容了。

comfui 二零二六年最强辅助来了!宽二点五大模型配合这个可示画插件,彻底终结了抽卡式构图。 不管你是要上帝视角还是怼脸特写,动动鼠标就能搞定。你只需要丢给他一张参考图,不管原图是什么角度,有了这个神仙插件,你面前就出现了一个虚拟的摄影机摇臂。想看头顶,直接把绿色的原点往上拖,这就是顶式图。 想看侧颜,把摇臂往左或者往右一滑,完美侧拍。甚至连背影正脸特写也就是动动手指的事儿。 这套工作流的背后,其实是利用了 quid edit 二五幺幺编辑模型。我们在 confule 里并没有直接去写那些枯燥的方位词, 核心就在这个多角度控制插件上。当你拖拽圆球调整滑块时,插件会在后台自动把你的动作翻译成最精准的提示词,然后喂给千万模型。 为了让出图更快更准,我还特意挂在了一个加速 lower 和一个多角度控制 lower。 除此之外,为了快速批量得到不同角度的图,我们可以直接复制几个控制节点,并把控制节点生成的那些方位提示词连接到提示词列表当中, 最后把这个列表连上正向提示词,点击运行。稍等片刻,一套包含了正侧、背、远中近的全方位套图就直接跑出来了。这一套工作流我已经帮大家全整理好了。