粉丝1.5万获赞5.7万




只需要上传一张角色的参考图,我们就能得到他们的正面,背面以及测试图。只需要上传一张角色的参考图,我们就可以让这一个去变化不同的动作,不同的姿态,并且保持人物的一致性。只需要上传一个动作姿态,我们就可以对这个 角色进行衣服服装上的改变,并且保持其他内容不变啊。只需要上传一个动漫或者真实的画面,我们就能对它进行性稿的提取,保证画面结构的不变。 那么这个就是我们近期爆火的千问 a d t 的 图片编辑模型。那么今天这节课的话呢,我来教大家这个工作流的搭建使用方法,以及我们称 参数调节和提示值的一个书写方法了。那么本节课用到的工作流模型以及参数都会放在评论区啊,朋友们 自行评论进行领取啊。好,那么首先的话呢,我们来看一下这个工作流的整体是怎么样的一个形态啊,其实的话呢,它代练起来非常的简单啊,首先的话呢,跟我们图生图的工作流是非常类似的啊,我们先加载一个最基础的什么 图,深图的工作流对吧?啊好,那么这个图深图的工作流的话呢,我们需要改的地方其实非常的少,就是把我们的什么呢,这 point 的 加载器呢,改成我们 u n 的 加载器, clip 加载器以及什么以及 v e 加载器呢,给分开了啊,分开了这三个, 然后在这里的话呢,老师建议同学们是使用一个加速的 lara, 因为加速的 lara 呢,可以帮我们去辅助这个深图啊,提速好 lara 加载器仅模型这个就 ok 了啊,那我们进行一个连接啊,连到这个模型这里, 那么连好之后的话呢,我们需要去啊,选择一下我们的模型,那么在这里的话呢,要选择千万英美 g 底层啊,这一个带 edi 七的这个模型,那么这个薄情的话呢,它翻译过来就是编辑,专门用来去编辑我们图片的模型。 那么有了这个模型之后的话呢,我们记得选择一下颗粒的一个模型,其实就是文本识别的模型,为什么我们的纤维医美菌呢,可以直接用中文进行时呢,就是因为它的一个功劳啊,那么 ve 的 话呢,记得使用这个纤维医美菌专用的 ve 进 行一个连接啊,在这里的话呢,我们模型这一栏啊,需要多连接两个节点啊,就跟之前不一样啊,一个是彩样算法 啊,这个的话呢,相当于是新来的一个节点啊,才能算法。 那么这一个彩样算法的话呢,就是在我们画面啊,模型彩样过程中呢,引入动态的造声调整的一个机制,让我们深层的画面更加丰富和多样化啊,那么我们这个偏移值如果去增加的话呢,就相当于 可以去让我们细节更多啊,但是如果啊,一旦我们细节多,那个叫声可能会多啊,所以说随机性可能也会高啊,所以说如果朋友们想要去增加细节啊,那你就可以提高一点啊,如果增加的太多,画面随性比较高啊,或者说叫声 添加的是你不想要的,那你就降低一点,我们这里的话呢,默认是三点零左右啊,这一个数值大家可以从三点零开始去计算啊, 那么第二个节点我们要添加的呢,也是算是一个新出的节点了啊, cfg 啊,这个的话呢,也是属于一个新加的节点,那么这个节点是相当于是会提高我们的模型生成的稳定性啊,那么大家加了之后呢,直接用这个默认的一点零的参数就可以了啊, 那么其实天降完之后呢,我们这个工作流就已经快答完了啊,那么唯一需要注意的就是两个 click 编码器呢,要换成专用的啊,千问的啊,编码器 就是这一个啊,那么我们需要复制一层啊,因为他有两个记得把参数进行一个对应的连接, 然后这负面条件记得进行一个链接,对吧?好,那么其实负面提示词的话呢,如果,呃都可以不用写啊,因为我们现在与模模型越出他越厉害了啊,训练的时候呢,就加了一些负面提示词啊,他的画面肯定是会很好看的。那么在这里的话呢,我们记得把这一个 进行图像缩放之后的图片呢,进行连接到这个正面提示时和负面提示的框这里啊,不然的话呢,他无法对我们这个画面呢进行 一个视边,把千万英美句图片编辑的工作流就已经搭建完成了,我就来教同学们怎么去使用啊,比如说我们来一个简单的啊,画面提取现稿的工作流啊,把这一个动漫的画面啊传入到导入到这个工作流里面之后啊, 我们要记住这个图案收放啊,图案收放这里,它像素数量其实就相当于我们收放的一个比例啊,如果零点二五的话呢,就是 相当于说说的只有原来的四分之一啊,那么看一下我们的尺寸啊,七六八乘以幺二幺六啊,其实差不多的一个尺寸,我们就正常默认就好了,如果同学们要去提高这一个像素比例的话,那你就提高啊,要降低就降低。 ok, 在 这里提高了之后的话呢,我们开检查一下模型,我们选择好啊,那么在这里的话呢,这个加速的模型这里啊,我们记得选择这个八步的比较好啊, 就这个加速的模型啊,那么其实还有一个四步的模型,那么四度的四步的模型虽然说快吧啊,但是他是精度损失的会比较高,所以说八步是一个性价比比较高的已加速 round 了, ok, 那 么在这里填了八步之后的话呢,我们步数也要填八 步数,填八之后,相应呢,我们 c f g 值也要调低,默认的值是二点五啊,那么这个 k 传感器这里呢,它指的是普通的图升图的 r c f g 值,所以说我们默认 二点五,二点五是针对于二十步的部署,所以说我们如果八步的话呢,要适当降低啊,不然的话呢,画面可能会出现太鲜艳的一个情况, 包括画面出来的效果也会不好啊。我们在这里的话呢,彩烟器的掉入器这里有一个推荐的值啊,丢了啊,然后掉入器的话呢,我们选的这个 simple 还用的比较多,然后这个降噪值是填一啊,那么最后一步就是来到我们最重要的就什么提示时的书写,那么我们提示词的书写这里呢,其实, 呃,就是用我们大白话去书写就行了啊,比如说我们你看老师在这里去写的就是将这一张图片提取黑白线稿,那么如果同学们想要让这个画面更稳定一些的话呢,可以在这个画面加一个什么啊?保持 画面叠构不变,对吧?你可以去加一些这样的一个参数啊,去表达, ok 啊,这样的话呢,我们去来深层一下啊,这里提示我没有去进行 ve 的 一个连接,那我们进行一个 ve 的 一个连接啊,记住同学们这个 啊,连线不要忘记,对吧?我们这个画面的话呢,同学们也看到了啊,他这个黑白线了除除的是非常的 ok 的, 他鬼是很好,是不是好,那么我们还看一下他还能去做什么效果呢啊? 比如说我们这一个单传一张你角色啊,全能展示,那我们就可以让他去出正视图啊,去出我们那一个测试图啊,包括我们那一个背时图啊,都是可以的啊,那么老师这里就 不去做工作流一一的去跑了,但是是可以做的,只需要的话呢,我们提示词去填写什么啊?获取这个女生或者说这个角色的一个正面 图啊,侧面是图,或者说背面是图啊,其他画面内容保持不变,画面构图不变,保证角色全身展示的一个效果,对不对?其实题词词的话呢,就有点像我们给这个 ai 的 一个自然的语言,一个大白话,让它去控制就可以了,包括我们还可以做什么 短变风格啊,让这个女生去转成啊,吉卜力的这种动漫风格啊,他保证的一致性,包括画面的一个构图都是很完整的,对不对啊?这吉卜力的风格也很好看啊,那么还有什么呢啊,我们上传一个产品也能让他去 啊,某个角色啊,拿着这个产品进行一个动作啊,包括我们的这个什么啊,上传一个角色的啊,全程展示啊,那么这个啊,去用提示持续改他的衣服,包括裤子啊,包括服装搭配啊,都是可以的啊,将 女生的衣服替换成白色衬衫,黑色丝袜,后面其他内容保持不变,对不对啊?一致性也保持的是非常好的啊,我们同样可以看一下这个脸部,是不是是同一个人呢,对不对?好,那么还有什么呢?还可以去做我们的这个啊,一整套的服装搭配啊,比如说啊, 你可以指定一个一位漂亮的中国啊,或者欧洲啊,欧美的一个女模特穿上这个衣服的一个套装,对吧?然后坐在咖啡厅里面去喝咖啡,你看眼镜背心啊这一个,然后包括我们的这个标带啊,裤子啊,其实都是参考到我们这个套装的平铺图里面的, 只不过的话呢,我们给的动作就是啊,基本上展现不出全身啊,那么如果让他进行全身展示的话呢,也是 ok 的, 那么这个就是我们的千万英美学一笔图片编辑工作流能做的部分内容啊,那么其实的话呢,他还可以进行 图片文字的一个修改啊,不同 i b 形象的样式图啊,那么其实现在 ai 的 发展是越来越快了啊,也有我们说能够去快速掌握这些新技术的迭代啊,我们才能说在 ai 的 乱草里面走 的更远。好吧,这就是本节课的一个内容啊,那么如果有同一需要我们这个工作流,我们呢使用到的模型的话呢,可以在评论区留言领取我们的资料。好,那我们下期视频再见了啊,拜拜。