上期分享了 comfy ui 纯净版整合包,不少小伙伴私信问我具体怎么用,今天这条视频一步步手把手教大家上手,还没有整合包的朋友可以回看我上一条视频,目前整合包已经更新到三百三十七套,工作流全部开元免 f, 不 用积分,没有门槛。话不多说,正式开始教学。 哈喽,各位同学们大家好呀,我是咱们看不 u i 全系列学习课程的老师,很高兴认识大家,今后的一段时间呢,也是由我陪伴着大家进行看不 u i 的 全面学习,咱们这个课程是目前最系统最新最全面的一套看不 u i 学习课程, 那么老师会详细并且系统的教大家从零到一去搭建我们的工作流,直到大家都能拥有商业落地的一个能力。那么课程的话呢,也会在后期讲解一些大产商业落地的一个案例,那么接下来我们就正式开始看 py 的 一个学习吧。 好,那么大家可以先看一下我们的一个先导片,就是说我们学习了这个系列课程可以达到什么样的一个效果,包括我们的一个产品换背景啊,包括我们的一些 plus 的 工作流啊,万物迁移, 包括我们的一个字体海报设计,包括我们的一个室内设计,包括我们大厂落地的一个 工作流的一个搭建,都是能够学习到的。好吧,好,那么我们首先开始,我们的最基础就是我们的一个看五 u i 的 一个安装和本地部署,那么今天的话呢,我们主要是讲解这一个内容。 好,那么这个时候呢,大家先去下载我们这个链接的一个文件啊,那么大家好,两个文件之后呢,主要是注意这个启动器运行一个安 好,那么在这个时候的话呢,我们就可以双击找到我们的这一个会使启动器啊,双击它,然后点击一键启动,其实就 ok 了,就可以 等待加载进入我们的抗服,抗服 u i 的 一个界面了啊,然后大家打开这个界面之后呢,你看啊老师的话呢,已经提前打开了,那么大家就可以看到老师这里已经升了一张图, 那么如果大家没有啊,就说第一次使用的话呢,一定是这样子,对不对啊?一定是这样子的,那么怎么样去生一张图呢啊,怎么样去生一张图呢?很简单啊,首先 这个工作流啊,我们就看到左边左左前方这个节点啊,我们随便找一个模型啊,那么这个模型的话呢,大家一定要有啊,一定要有一个模型,那么这个模型的位置的话呢,我可以告诉大家在哪里啊,模型安装位置就是在 models 啊,就我回到我们的目录,找到 models, 然后 checkpoint 啊,我们点进来啊,在这里的话呢,大家看到老师已经放了三个模型啊,三个模型都有对应的一个图片啊,可以显示看到这个模型的效果啊,大家一定要把我们的大模型放进去,好, 进去之后的话呢,点击一下刷新你的一个大模型,就能显示在这个 com ui 的 界面里面了啊,你可以在这里选好,那么这个时候呢,老师选一个这个啊, aw 的 这一个动漫大模型,好,然后写上我们的提示词啊,这个提示词是默认的提示词,我们在这里写一个 one girl, 点击一下弯歌对不对?或者说你自己打字也可以。好,其他什么都不用管,其他什么参数都不用调,点击右上角的添加提示词对联啊,我们点击一下,这个时候呢,你就会发现已经可以出图了,对不对? 这一张图片你就已经生成完毕了,好,那么这个图片生成完毕之后呢,就代表着你的康复 u i 成功的进行一个安装是没有报错的 啊,如果你的安没有安装成功,他是出不了这张图的啊,这个大家就一定要注意好,那么这一节课还要教大家一个什么东西呢?就是我们的一个界面认识和怎么样去安装我们的一个插件 啊,插件怎么安装,怎么卸载啊?好,那我们先来去讲一下我们的界面认识吧,那么这个界面的话呢,工作流我们下一节课会给大家去详细解解释啊,这个工作流到底是什么样的一个原理啊?怎么来深图的?那么我们先来介绍一下这个界面啊,那么先看一下左上角, 那么左上角这一个东西呢,它相当于我们工作流保存的一个啊位置啊,你看现在的话呢,是只有两个默认的工作流,对不对?如果大家之后啊进行一个保存,比如说我们把这个工作流想要保存到这个文件夹里面之后,随时可以调用的话呢,我们点击一下这个保存的按钮, 然后随便打一个,比如说幺幺幺幺幺已经被保存了,那么如果我们随便 这样的一个工作流老师以前的工作流是这样的,一个工作流的话,我想调用回我的幺幺幺,只需要点击一下啊,就可以进行一个调用了啊,嗯,那么大家之后保存的工作流都可以这样进行一个保存好,那么左上角就是一个保存工作流的一个嗯, 区域了,对不对?那么右上角这一个啊,类似一个啊,长斑条的这一个主键,这个是个什么东西呢啊?老师拿那个 嗯, ppt 来去给大家介绍一下啊。那么首先的话呢,大家看到没有,上面的这个就是一个设置啊,有个小齿轮的这个就是设置啊,那么在这个设置里面,大家就能 看到有非常多的一些调整的参数啊,大家可以呃,打开一下这个网页翻译啊,如果这是英文的话啊,那么就等他翻译好,那么在这个设置这里呢,其实新手同学们啊,不用去怎么调整啊,不用怎么调整,因为啊学到后期的话呢,我们可能才要去调整一些这个, 嗯,需要的东西啊,那么我们先暂时先关掉啊,我们后期会讲好,那么这个第二个节点啊,第二个参数就是添加提示队列,大家可以把它理解成生成两个字啊,就是生图,我们点击一下这个 就能生图了啊,那么他就是这样的一个作用。好,那么中下面的这一块区域呢,就是生成的一个状态啊,比如说我们上一个,上一次生图生成了,一秒钟啊,就搞定了,对不对?好,那么下面这一块区域呢,就是指的是我们 电脑的硬件的使用情况啊,比如说第一个就是 cpu 啊,它这里翻译成了中央处理器,对不对啊?大家应该都知道这个意思啊,那么我们点击一下,那么 cpu 的 话呢,占用到了百分之十,对不对?最高那么内存啊,显卡呀,显存呢,硬盘啊等等的一些占用,它都会显示在这块区域 啊,好,那么底下的这一个更多选项是什么意思呢?更多选项是大家如果要批量升图的时候就可以勾选,然后写上你想要升几张啊,升几次。 好,那么这个自动执行呢,就是你一旦修改了这里面的一个参数,他都会给自动给你去跑。好,那么这个执行队列呢,也是跟生成一样的 啊,点击一下他,他就生成了,就这个意思。好,那么这个显示队列呢?就是假如你点击了很多次执行队列,他这里就会有几个任务 啊,那么在这里的话呢,你就可以取消你的任务啊,比如说有一个任务正在跑了,但是你后面两个任务之前点了,但是不想要他,那你就点击清除啊,这个后面有个清除的,就这个点击好,那么在底下呢,就是保存,就是保存我们工作流的啊,保存单纯的页面的工作流到你的本地电脑, 那么这个加载的一个意思呢,就相当于是我们如果有工作流要加载进来,那么就可以点击这个工作流的加载好。刷新的话呢,就相当于是刷新你的这个后台啊,如果大家有那个模型刚刚放进来,那么你可以点击刷新 啊,点击一下这个剪切空间,就是可以把你复制的裁剪的那一个东西给贴过来啊,就这个意思啊,这明确的意思呢,就相当于是清除啊,这里翻译的不准确啊,是清除你的工作流这个界面啊,加载默认就是加载我们的这个默认的工作流,就是这个纹身图的工作流, 那么重置试图就是把你的这个试图的这个界面啊,然后给他定位到一个合适的一个位置啊,比如说我们之前是这样子的,对不对啊?我们还要拖过来,那我们点击一下重置试图,他就回到了我们的这个呃,画面的比较偏中心的一个位置好,那么 底下的这块区域呢啊,比如说什么这个 max library 啊,这个节点啊,和这个浏览器啊,我们就不用去先先去管好,我们只需要去注注意这个啊, manage 啊,它翻译成经理啊,其实它的一个 啊,翻译成管理器,更加的一个准确啊,我们点击下这个管理器,那么在这个管理器这里,我们就要讲到我们今天的第二个知识点了啊,第二知识点就是怎么样去安装我们的一个插件啊?安装插件的一个方法有两个啊,第一种就是直接去从我们的自定义节点管理器这里面去找 啊,那么大家可以看到啊,老师这里已经安装了很多插件了,对不对啊?那么如果大家有一个在网上看到的一个插件啊,觉得它比较好用,那么自己的 com 又没有的话呢,你就可以在这里去搜索啊,比如说我们搜索一个换脸的插件 reactor, 对吧?我们搜索一个 react 啊,就是一个换脸的插件,那么大家看到没有啊,这里就会出现任何有关啊,名字带了这个 react 的 插件的这个英文名字啊,那么它在它后面的话呢,有个安装对不对啊?那么大家也可以看到这个星号后面啊, 新号后面就是大家的一个安装量啊,安装数值或者说叫收藏量啊,那么安装的越多就代表用的人越多啊,用的人越多还可以看到他的更新时间啊,尽量选择更新最新的啊,就是一看啊,离我们的一个 时间就比较近的啊,一个更新日期啊,我们这个时候点击一下安装啊,那么等待它的一个啊,左下角它会出现一串啊,安装成功,然后叫你去重启 comui, 那 么这个时候你去重启的话呢 啊,你就可以进行一个,嗯,这个节点就安装上了啊,那么这个插件就安装上了,对吧?啊,好,那么如何卸载这个插件呢?假如我们还是同样这个插件,对不对?我们先删除啊,那我们随便去拿一个插件来去举个例子啊,我们看一下, 嗯,就比如这个插件吧。啊, taylor 的 这个插件,如果我们要卸载怎么办?我们就直接点击一下这个卸载,然后点击确定, 这个时候的话呢,你这个插件就会被卸载掉了啊,那么这个就是我们的一个安装方法了啊。安装方法,那么还有一个安装方法呢,是如果大家有一个工作流啊,工作流 啊,那么从别人那里拿到的工作流,那么你这里有缺失节点怎么办啊?就是有爆红对不对啊?他会提示你,你有些节点没有,那怎么办呢?你就点击一下第二个安装缺失节点的一个英文啊, 或者说你把它翻译过来,它就安装趋势,你看老师的话呢,这里是没有的,对不对啊,因为我这些节点都有啊,如果大家有的话呢,你这里就会出现一个安装的标志,那么你就安装,然后把所有的趋势节点安装好之后呢点再点击一下重启 就 ok 了啊,明白吧?好,那么这个就是我们怎么样去安装插件和怎么样去安装缺失节点的一个方法了啊,那么今天这节课的话呢,主要是给大家去讲解我们康府 yy 本地部署以及我们的 界面大致的一个介绍啊,还有怎么样去安装我们的插件啊,安装缺失节点的一个方法。那么下期带大家深入的学习汉普 ui 纹身图的各种节点参数的一个含义,以及基本的深图原理。 hello, 同学们,大家好,欢迎来到 comui 全系列课程的第二节课,那么在这一节课呢,我将带领大家一起去深入了解 comui 纹身图以及背后的深图逻辑。 好,那么我们现在就开始我们第二节的一个课程了啊,首先大家看到我们的一个啊,工作流老师打开的这一个界面啊, 那么这个工作流的话呢,是我们用上了一个 laura 啊的一个组合生成出来的一个效果,大家觉得还不错,对不对?好,那么我们先不管这一个界面啊,我们先加载一个新的界面啊,然后加载一个默认的工作流出来啊,加载一个默认的工作流 啊,这个默认的工作流呢,其实就是我们要讲的这一个,嗯,最基础的这个纹身图的 啊,工作流了,好,那我们先来去理解一下每个节点的一个含义吧。啊?每个节点的一个含义,首先呢我们左边的这一个节点啊,左边这个节点呢,它就是 checkpoint 加载器,那么这个加载器呢,它其实就相当于我们 选择大模型的一个节点啊,那么在汉服 ui 中呢,我们基本上每一个参数啊,比如说大模型的选择, laura 的 选择, v a、 e 的 一个选择,都是通过一个节点来去选择的啊,等下我们可以去了解到,那么在这里的话呢,大家就可以选择我们需要用到的一个模型,比如说我们用一个白领啊,白人的这一个模型,叉 l 的 一个模型,对不对?好,那么这个的话呢,就相当于是大模型的选择,对不对? 那么除了大模型的选择,我们还需要什么呢?还需要提示词的一个书写,对不对啊?那么这两个节点啊,那么我们都叫它节点啊,那这两个节点呢,它分别是我们的 正向提示词的一个输入,以及负面提示词的一个输入,那么在上面的这一个输入呢,就是正面提示词, 那么怎么样分辨他们两个哪个是正面呢?其实就取决于他们后面的这一个线条啊,或者说叫这个参数的这个条啊,他是连到哪个的啊?连到这个 k 传感器,他是连到正面条件,他这个宽里面的就是正面条件, 如果我们把他给反过来,那么这个宽的话呢,他就会变成负面条件,明白吧?不管你这里面填的是什么啊,不管你里面填的是什么 啊,然后这个就会变成正面啊,他就这样反过来,所以说大家一定要在前期的时候呢,注意好我们的这一个参数信息的这个连接啊,正面条件记得连哪里啊,负面条件是连哪里,不要连错了。好, 那么我们这两个是文本的输入框对不对啊?它叫 clip 文本编辑器啊,等一下我就会给大家去解释,为什么它叫 clip 文本编辑器。 好,那么这个 call late 这个节点呢,就相当于是我们图片的尺寸调节,以及我们 p 四大小啊, p 四大小的意思呢?其实就是我们生成图片的张数,你想生成一张,那就是 选一,那么如果你想生成两张呢?选二啊,这样的话呢,我们就可以生成两张图的意思啊。好,那么这个 k 传感器呢,其实就相当于把我们前面所有的一些信息 集合出,集合到他的这个节点里面,然后在这里呢进行我们的一个图片生成啊,大家可以理解成这个意思啊,然后里面有一些参数,我们等下会讲解, 那么这个 ve 解码呢啊,等一下我们会专门去讲一下这个 ve 解码它的一个作用,然后最后的话呢,我们就保存一下图片,那么我们这几个节点其实都已经出来了啊,他们每个节点的个用法 啊,然后的话呢我要去讲解一下,就是我们的这个线条的一个连接啊,大家可以看到我们大模型这里有个模型对不对?模型它代表的一个啊,参数的颜色就是紫色的,对不对?所以说它一定要连到 跟紫色有关的一个节点上啊,大家看到没有,你这一个模型啊,如果你不连这个模型,你连正面条件是连不上的啊,同学们一定要注意啊,连不上的,所以说我们一定要注意这个, 嗯,对应差错的一个连接,就说信息不能错啊,黄色的就一定是啊,跟提示词有关的啊,你看这个红色的就是 v e 啊,你红色的是连不到黄色的上面的啊,就是这个意思。好,那么 我们了解了这一个每个节点他大概是什么样的一个作用之后呢,我们就来拆解一下他的一个真图原理啊,那么在这里的话呢,我们先升一张图啊,比如说一个弯钩儿啊,我们先升成一张图,对不对?我们其实选好大模型之后,我们只需要来一个提示词啊,点击一下生成, 他就给我们去升一张图啊,然后这里我们尺寸的话呢,应该是调错了啊,我们这里填一,然后一零二四等于一零二四 啊,我们在这里去点一下生图,对不对?他这样的话呢,就会给我们生成一张啊,女生的一个图片,对吧?啊,很好看的一个女生图片,那么他是怎么样做到这一步的呢?那我们就来到了怎么样去 拆解这一个纹身图,他的一个厚涂的原理了啊,好,那我们就来到我们的这个 ppt, 我 们首先的话呢,呃,我们刚刚的那个步骤,其实就是这一个 ppt 的 一个作用啊,就是我们输入一个 wiger 就 能得到一个女孩,对吧?啊,那么他的一个后台到底是怎么样运行的呢?首先我们要讲一下大模型, 就说大模型它里面是什么东西啊?它里面有什么?它能这样子生成图片对不对?大模型,它其实就是把我们在训练的过程中啊,把我们很多真实的图片,就比如说它训练了很多女生,他把很多女生的一个图片,以及 女生图片对应的一些提示词,比如说这个女生可能是个黑色头发啊,然后呢棕色的眼睛,对不对?白白的皮肤,他把这些提示词呢,变成每一个图片都有的一个标识啊,大家看,大家看到没有这张图 你就能看到啊,在这一个空间里面,这一个我们每一张女生的图,他都会变成这样的招生图啊,就像这种马赛克的啊,像那个电视没有信号的那种图片,对不对?那么在底下呢,有一些小字啊,但其实这些小字呢,其实就是 就是图片所对应的那些词转化成的一些参数啊,大家可以这么理解,然后呢,每一张图都有他对应的一些啊提示词的参数,所以说他这样子啊,素材多了,然后在这个浅空间里面,他就能当做是一个大模型 啊,大模型里面就是有这么多参数啊,有很多张图片,以及有每一张图片对应的一些参数的一个提示词。好,那么这个就是大模型的作用啊,他储存了很多参数,对不对?好, 那么 clip 是 什么意思呢啊?大家可以看到,在我们大模型里面啊,大模型的一个输出里面,除了有模型对不对?那么这个紫色的模型其实大家就能理解了,这里面就是纯属了一些图片的数据。好,那么这个 clip 呢?是什么意思呢? clip 呢?其实就相当于把我们输入 出,输入进去的英文翻译成 ai, 它能听得懂的 talk 啊,那么大家可以理解成向量啊,那么 因为 ai 它是听不懂,比如说我们一个 one girl 啊,或者说一个蓝色头发啊,棕色眼睛这样的一个提示词的,对不对? ai 它是听不懂的,它只能听得懂它属于它的语言啊,所以说 clip 这个东西就是帮助我们去翻译给 ai 听的啊,让 ai 能知道我们真正想要去出什么图啊,然后呢,去大模型里面找对应的一些噪声图啊, 明白吧?这个 clip 就是 这样的一个作用。好,那么 ve 是 什么用呃的一个用法呢? ve 它的一个用法就相当于把我们的图片可以变成噪声图, 因为我们的 ai, 或者说这个 stable default 在 浅空间里面只能理解这个造声图这种形式,所以说我们的 ve 它的一个作用就是把我们的图片变成 这一个造声图,或者说把它生成出来的造声图解码成我们的一个真实图片啊,那么 ve 它的一个作用就相当于图片的一个翻译官 啊, clip 就 相当于我们文本的一个翻译官,那么它翻译进去的都是属于在浅空间里面进行计算。好,那么这个 k, 那 么这个浅空间里面到底是在干什么呢?其实我们的深度流程就是通过我们的一个浅空间在浅空间里面进行计算的好,那么它具体的一个步骤是什么呢?就是 我们输入一个提示词啊, click 就 会把它翻译成 一个项链啊,那么 ai 他 能听得懂,那么他能听得懂之后呢,就会在我们的大模型里面找到对应的啊,跟弯歌对应的那一个造成图里面的照点 啊,然后这个时候呢空 later 就 会确定一个招生图的尺寸啊,因为我们是随机生成一张招生图吗?那么那个招生图里面呢,就会带有这个弯个的一个属性啊,那么好了,那么得到了这个招生图之后呢,我们就会这个招生图就会经过我们这一个 k 产气 啊,来到这个 k 传感器里面,那么 k 传感器呢,就会把那个噪声图不断的把那个噪点给去除,那么具体去除多少步啊,以及去除的效果怎么样?那就是取决于我们里面的参数了 啊,我们里面的一个参数的话呢,就是通过调节我们的一个步数,或者说 c f g 值啊,以及我们的采暖器和调度器,那么采暖器和调度器呢?它其实就相当于我们怎么样把那个噪点去除啊?它的一个方法是什么样啊?那么其实 去除的差不多了,那个照点去除的差不多了,那么我们图片就会变成这样子,对吧?啊?但是呢,还不能够达到我们这一种画面的效果,对不对?这种画面就像真实的图片一样,那么我们就要通过 v e 烂吧烂塌这一个 接近我们真实真实的图片的一个带照点的一个图转成,或者说解码成我们这个图片,那么其实我们的这个工作流程大家就能明白了啊,对不对啊?那么我再给大家去讲一遍, 大模型提供所有图片啊,造成图的一个数据集 click 文本帮助我们去翻译我们的提示词啊, ai 他 就能知读的懂,我们想要什么画面,他就可以在大模型里面去找 啊。好,那么这个空内存呢,就负责是我们那张图片的一个大小和尺寸啊,以及我们的一下生成几张,那么所有的参数收集完成之后呢,就会在空内存 啊,就会在 k 产生器里面呢进行把我们那个噪声图呢啊,对应那张图像去降噪啊,最后的话呢,通过 ve 的 一个解码就能把我们这张图片给它真正的生成出来了, 那么这个图片的这一个流程的话呢,就是属于我们真正的一个生图的流程了啊,这样大家应该都能明白了,所以说大模型他的一个非常关键的啊,如果没有他的这些数据啊,你是不可能能生成出一个 很好看的一个效果的啊。然后再举个例子呢,就是如果我们的大模型他只训练了动漫的一个画面,对不对?他这里面所有的一个参数啊,都是属于动漫, 那么你想让他去生成真实的一个图片就是不可能的,对不对?因为他根本就没有这个对应的数据级啊,那么你再给他写详细的提示词,他都不能够给你去生成很好的画面。好,那么我们讲完这个生图原理之后呢,大家就能明白了,我们这个 嗯背后的原理到底是什么样的啊?那么我们再来去讲一下这个纹身图怎么样去加 lara 啊,我给大家进阶一下,那么纹身图想要添加 lara, 那 么我们首先要理解 lara 它到底是个什么东西? lara 其实就相当于大模型的微调模型,因为有些大模型啊,他不能够,虽然说他训练了很多图片对不对?但是呢他不能针对某一种风格或者说某一种角色去深沉, 比较精准的啊,不知道大家能不能明白,就比如说我要生成一个路飞的形象,虽然说这个大模型可能训练了一张或者说两张路飞,但是呢不够多啊,所以说他可能去生成路飞,他就不够像啊,那么这个时候呢,我们就要需要去专门用一个 啊,很精准的一个路飞的 lara, 因为路飞的 lara 他 就相当于你可能有二十三、五十三专门训练路飞的一个图片啊,那么训练出来的这个小模型就叫 lara 模型啊,那么我们就可以很精准的生成路飞了。那么 在这个这里的话呢,我们去讲解一下这个怎么样去添加我们的 lara, 那 么 lara 大家都知道喽,刚跟大家说了, 我们这个 lua 相当于一个小的模型,那么模型是在所有的一个参数的一个输出啊,它是作为所有参数的一个输出的,所以说它一定是要连到前面的,不然的话呢,你前面 你后面的这些节点,它都是接收不到数据,它就没有办法进行一个生成啊。我们这个时候呢找一下啊,双击这一个空白的区域,我们找出 lua 加载器这一个名称啊, 啊,找出这个节点,然后呢怎么连接呢?大家看到没有,有一个很好的连接方式,就是说看它的左右的一个输入和输出的信息。 好,我们在这里看到呢,它左边的一个输入啊,那么必须是有一个模型和 clip, 对 不对?那么大家看一下,哪一个节点呢?是可以直接给到它 这两个参数的呢?只有这一个节点对不对?那么我们就进行一个连接好,那么连接好之后呢,怎么样再连出去呢?其实大家就能一看就能明白了,那肯定是经过这个节点之后呢,再连给我们后面的一些节点的,对不对?那么 klipp 也是进行一个连接,其实这个东西就像一个串联一样, 对不对啊?就像一个串联一样,好,那么在这里的话呢,我们用一个魔法阵的一个 lala 啊,魔法阵的一个 lara 啊,我们去深图。好,那么在这里的话呢,老师给到大家推荐的一个提示词啊,那么包括我们推荐的一个啊,大模型啊, lara 啊,我们都是给了参数的啊,所以说大家可以去参考一下我们的这一个,嗯, 提示词啊,提示好,我们这个时候呢,点击一下生成,大家就可以看到我们生成的一个效果喽, 对不对?有了 loa 之后呢,我需要得到的一些画面效果,它就可以很精准的给我表现出来啊,如果我们没有用这个 loa, 那 么它的一个魔法阵的效果肯定就是不太好的啊,效果不太强烈的。 我们这一个大模型,包括我们的一个 lua, 以及我们这节课会用到的工作流呢,都会放在我们的一个评论区,好,那么我们这一个工作流就是搭完了,然后我们再来讲一下啊,这里面有没有什么需要注意的地方啊?其实就是这个 k 传感器喽 啊, k 传感器这里呢有啊,步数的意思就相当于是他降噪了多少步啊,我们这里默认填二十到三十步就可以,三步距值呢就相当于我们的提示词的听话程度, 如果你想让他听话一点,那你就调高,如果想让他没那么听话啊,你就调低一点,但是呢太高的话呢,会导致我们的一个画面的一个质量降低啊,这个大家一定要注意,然后呢彩样器和调度器我们就选默认就好了, 降噪值在纹身图的一个过程中一定是要填一的。好,那么我们今天的一个纹身图的 啊讲解包括我们那个纹身图加拉拉啊以及我们生图原理的一个课程的话呢,我们就讲到这里了啊,下一期会带大家继续的去深入了解 comui 图生图的各种参数节点的含义以及背后的一个原理啊,还有使用方法。
粉丝2.2万获赞7.8万

如何用咖啡 ui 做出这种电商服装 3 d 效果展示?关注点赞,一分钟教会你。首先我们打开二五幺幺的模型,我们这套流程是基于千问二五一一 b 一 六的模型,这套是基础的图声图的模型, 你如果没有,可以到模板这边看一下,然后在这边搜索一下就可以了。好吧,然后我们讲一下几个比较重要的点,第一个从这边开始讲吧, 提示词,提示词这边一个重要的地方就是你用我这个提示词就可以了, 然后它这个是官方的,然后你这个 laura 一定要这个 fit 三 d, 这个 laura 如果不带这个名字,它的 laura 是 不起效果的,然后负面提示随便了。然后还有一点比较重要的点就是你这个四部 laura 一定不要开,记住了,开出来就是这个效果。 四步 laura 效果很差,一定要把这个加速 laura 给它关掉,关掉以后我们把这个步数调到三十步 确定,然后我们来再来跑一下,看最终的效果,看看如何,我们对比一下,把这个留出来吧。 然后这边图已经跑好了,我们来看一下整体的效果还是很好的,记得关注点赞,咱们下期再见。

警告,本视频耗十四个月制作,制作时长五百分钟,陪你系统学习康 b u i 制作视频!这应该是目前最详细的 ai 视频教程了,哪怕你是零基础,也能轻松给你学会!马上暑假了,有人愿意每天花一小时学习 ai 慢剧制作吗?不用,对, 不用魔法,它就是最近重磅更新的 comforsee 破线版,本地一键启动,你就可以实现纹身图图生视频一键室内渲染设计、古风真人 ai 视频虚拟模特、做电商服装等三百加工作留模板, 老规矩,验个牌试试吧!本套课程共分为两个部分,一到六节为基础部分,其中包含了 kufui 的 配置要求以及如何安装与部署、 界面导览与原理介绍文声图以及提示词的语法,之后还会聊聊 ai g c 的 相关网站以及模型下载,最后还有读声图以及高清修复的过程。那么从第七节课到第十三节课属于进阶部分,先后会讲解坑深内及其诸多预处理器的使用方法以及使用场景,之后还会教大家 ipad pro 及其强大功能的应用。 随后我们还会学习最基础的 ai 视频生成原理,而在最后,我们将结合前面所学的全部知识,一起来做一个 ai 视频换脸、转会。这些这些这些都是 ai 生成的。 自二零二三年以来, ai 绘图软件 stupefaction 的 发展势不可挡,各种各样的衍生模型插件白花起放,现如今生成像这样的 ai 视频完全不在话下,那么 我们就一起跟随着时代的脚步,一起探寻 stableview 的 comfui 到底该如何使用吧!大家所熟知的 webui 和 comfui 其实都是属于 stableview, 而 webui 主要是基于规则库开发的浏览器界面, comfui 则是使用图形节点、流觞图设计和用于稳定扩散的用户界面。这边我们将 comfui 和 webui 的 优缺点列出来,方便大家做个对比。首先我们来看 webui 这块,它的优点是简单易学,并且操作较为基础与简易, 而它的缺点是不利于长期管理。那么这是什么意思呢?当你在深度学习完 vbu ui 的 高阶内容后,你会意识到如果使用的是康复 ui, 那 么将节省两到三倍甚至更多的时间。其次,在插件过多时, vbu ui 会显得非常的臃肿, 机操作费时。那么接下来我们看一下康菲 u i。 这边我们可以看到康菲 u i 对 配置的要求较低,这同时也意味着降低了 ai 绘画的门槛,方便更多的小伙伴加入进来。那么它的优点其次是节点更易于管理,有较强的自主性,我们可以根据个人需求来组装属于自己的工作流。 并且在未来,康菲 u i 将逐渐与未必 u i 在 应用层面拉开距离。比如前段时间的 s d 三或者国产最新的可棱大模型, 都是第一时间在康复 ui 里可搭建工作流并使用的。而对于未被 ui, 这些最新的模型与插件往往得过一阵子才能失桩,甚至直接不失桩。所以使用康复 ui 也意味着你能够更早的使用到最新的模型与插件。康 复 ui 的 缺点是初期不好上手,但我相信在你学完了本套课程后,一定能够完全掌握康复 ui 的 技术操作。除此之外,过去我们知道有许多软件,比如 blender、 达芬奇 ue 等等都是使用节点式工作流, 因为他们有极强的自主心与可模块化,许多头部公司的顶级团队使用的都是节点式软件。那么 comfuly 除了上述优点之外,我们在使用时还可以非常方便的套用他人分享的工作流,即刻便可实现相同的效果,节省了非常多的节点部署思路的思考时间, 以及从单个节点构建成工作流的部署事件。哈喽,各位小伙伴大家好,欢迎来到 cf ui 系列教程的第二节课。那么在本节课中,我们将介绍 cf ui 的 配置要求以及安装与部署的过程。那么首先是电脑配置以及系统环境的介绍,首先是显卡方面, 最低要求是拥有四 g 级以上显存的英伟达显卡,如果显存不足,可能会影响到绘图过程的流畅度。接下来是 cpu, 关于 cpu 要求不高,英特尔十代 i 三以上就可以使用,但推荐使用性能更强的,如英特尔十三代 i 五幺三六零零 kf, 以获得更好的性能。接下来是内存,内存至少需要十六 gb, 推荐三十个 gb 以上,以确保可以加载和运行较大的模型。最后是硬盘,关于硬盘呢,至少需要两百 g 的 空余空间,推荐使用大容量的固态硬盘,因为 ai 绘图过程中会下载和生成大量的模型以及图像数据。那么接下来我们详细介绍一下康菲 u i 的 下载以及部署方式。 我们先安装资源包里面附带的启动器运行依赖,接着打开解压之后的 comfui 文件夹,在文件夹内找到 a 会使启动器,随后点击一键启动即可。锁匙启动时可能会安装一些必要的环境依赖。 稍等片刻后,我们便来到了 comfui 的 主界面。接下来介绍第二种安装方法,官网资源包的安装。当然关于官网的资源包,我们也可以在评论区内获取。我们解压完资源包后,在文件夹内找到这个项目, 双击运行。等待片刻后,我们便可以来到最原汁原味的 cf ui 界面了。这个版本的 cf ui 是 没有装任何非官网的插件的。 此外, cf ui 完全离线工作,对 gpu 的 要求相对较低,但是也有 cpu 模式,不过在 cpu 模式下绘图速度极微缓慢。如果小伙伴们之前有使用过 vpu ui 或其他类型的 stupefaction ai 绘图应用, 我们可以通过修改 comfui 的 配置文件来实现在不同的 ai 绘图应用间共享大模型以及 logo 等等,依次减少对硬盘内存的占用。那么接下来我就向大家演示一下如何将我们的 comfui 大 模型以及 logo 的 加载路径修改成 vibui 的。 如果小伙伴们没有玩过 vibui, 那 么这一段可以直接跳过。好的,那么我们打开 comfui, 接着我们找到这个文件, s 三 model pass yaml 点 big example, 接着我们找到这一项 base pass, 我们要做的是把贝斯帕后面的这一串改成我们 web ui 文件夹的路径。比方说我们打开了 web ui 的 文件夹后,我们可以单机上面的这个栏目,随后 ctrl c 复制。接着我们回到刚才的记事本内,将我们刚刚复制的路径粘贴到此处,随后我们保存并关闭记事本。接下来的一步很重要, 我们需要将 example 以及这个点给删除,也就是将我们的文件名后缀改成点 y a m l, 随后点击确定即可。那么接下来我们打开 comui 来确认一下。 好的,我们这边看一下 check point 加载器里面的大模型,点开后我们可以看到多了,非常多啊,那么这就证明我们成功把模型路径合并到了 v b u i 内。好的,那么以上就是关于本期的全部内容了, 欢迎来到 comfui 系列教程的第三节,那么在本节课中,我们将一起了解 comfui 的 主界面以及各种参数到底代表了什么。最后我们将学习 stableview 生成图片的根本原理。好的,我们打开了七位大佬的会式启动器后,点击一键启动。 经过一段时间的等待后,我们便来到了 comfui 的 主界面。那么我们在面对 comfui 这个完全陌生的软件时,我们要做的就是初步了解每一个模块的大体含义,那么接下来我带着大家过一遍。首先是操作方式,我们可以通过鼠标的滚轮来控制画面的缩放, 按住鼠标左键,我们可以拖动我们的仕图。点击鼠标右键,我们可以看到有非常多的栏目,这边我们可以试着点击新建节点,随后我们可以看到有非常多的节点可以供我们选择。好的,那么之后我们再来说一下快捷键,顺从图片的快捷键是 ctrl 加 enter 框选节点的快捷键是按住 ctrl 加鼠标的左键。移动框选目标的快捷键是按住 shift 加鼠标的左键。 这边我们在框选门后,如果不按住 shift 直接进行拖动的话,我们可以看到此时只有单一节点进行了移动,剩下的快捷键我都放在这了,小伙伴们可以暂停观看。 好的,那么接下来我带着大家一起来解读一下这个默认工作流。首先在这边我们可以看到有个叫 shift 烹饪加载器的东西,这个节点的主要作用是加载扩散模型, 也就是我们常说的大模型。此外,该节点还提供适当的 v、 a、 e 以及 clip 模型,具体它们是什么,我们带回讲。我们顺着缺空位加载器的节点连线,可以看到这里有两个 clip 文本编码器,在这里我们可以看到它们的输入都是 clip, 而他们的输出都是条件。那么究竟什么是 k 服模型呢? k 服全称为 control language image programming, 是 由 open ai 公司在二零二一年发布的一款多模态预训练神经网络模型。 k 服模型的作用是理解我们输入文字的意思,比如我们输入 one go 生成的是一个女孩,而不是太阳, 这就是 clip 的 作用。接着我们顺着 clip 文本编码器的条件输出看过来,连接到了 k 采阳器上。这边我们可以看到 k 采阳器拥有两个关于条件的输入,一个是正面条件,另一个是负面条件。那么这代表着连接着正面条件的文本编码器内的提示词为正面条件提示词, 也就是我们常说的正向提示词。同理,下面的则为负面条件提示词,也就是我们常说的负面提示词。好的,我们把目光重新回到 k 采阳器内, 我们可以看到除了正面条件以及负面条件外,还有两个输入,分别是模型以及 latent。 那 么模型则是连接着刚才的这个 pos 接收器,也就是我们的大模型。那么这个 latent 究竟是什么意思呢? latent 通常是指前空间,可以理解为 stability fusion 内部流程中的图像格式。如果将图像作为输入,则需要通过 v a e 编码将其转化为 latent。 数据 在最后输出时,也需要通过 v a e 解码将其转化为像素空间,也就是我们最终看到的图像。这边我们可以看到可以采洋气的 laten 连接着一个叫做空 laten 的 节点,这个节点内共有三个参数, 分别是宽度、高度以及 p c 大 小。宽度和高度决定了我们最终生成图像的尺寸,而 p c 大 小则代表着每生成一次将出多少张图。比如说我们将 p c 大 小改为三,高度改成七百六十八。 最后我们按 ctrl 加 enter 进行生成。好的,这边我们可以看到一次性生成了三张图像,也就是我们批次数目的图像。接下来我们继续看 k 太阳系的其他参数。 首先是随机总,随机总的值我们一般称为种子值,每张图都有专属于它的种子值,我们也可以理解为种子值,就是图片的 id 号码。接下来是运行后操作,点开后我们可以看到用了四个选项,分别是固定、增加、减少以及图片的 id 号码。接下来是运行后操作,点开后我们可以看到用了四个选项,分别是固定则,在你生成完后,种子值会保持不变, 方便你进行其他的调整与操作。那么接下来就是裁量部署,裁量步数越多,计算机的运算时间越长,在大多数的情况下,我们的裁量步数保持二十到三十步即可。接下来是 c f 句子,该指的意思是 提示词引导系数。 c f 句子越高,则代表着生成图像与提示词之间的联系越紧密。 c f 句子越低,则代表着提示词对生成结果的影响越小。不过过高或过低的 c f 句子都会给图片带来不好的影响, 所以我们一般保持适中的 c f 制即可。接下来是采阳器和调度器,我们可以理解它们为图像的生成方式,如果我们将其他参数比作是食材,那么它们则是烹饪方式,不同的烹饪方法当然会带来不一样的结果。比如我们点开采阳器后,可以看到有非常多的选项,这里我们目前最好的一般是选 择这个 g p n 加二 m 或者 d p n 加二 m s d e, 这两个都是挺不错的。接下来调度器我们也是可以看到有非常多的选项,这里我们一般选择的是 keras。 最后我们可以看到还有个降噪参数,由于该参数是跟图胜图有关的,我们以后再说。接下来我们看一下右边有个叫做物业 e 解码的东西,那么我们可以看到这边也有两个输入,分别是 laten 以及物业 e。 至于 laten 刚才我们已经解释过了,也就是擒控件图像,那么物业 e 究竟是什么呢?物业 e 全称变分字编码记 ruby 炫的 ootlin 格式的缩写。它是一种深度学习模型,主要用于无间断学习任务,特别是在生成模型领域。 维 e 结合了神经网络和概率图模型的特点,而它在康复以外的作用是将我们的前空间图像编码成像素空间图像,或是将像素空间图像编码成前空间图像。除此之外,我们还可以双击屏幕上的空白处,随后就可以搜索节点,比如说搜索加载图像, 或者我们也可以双击搜索预览图像。这边再多说一嘴,维 e 解码之后的图像节点,我们也可以直接连接到预览图像上, 比如说我们现在把这个保存图像节点给删去,如果这么操作的话,那么我们生成的图像不会被保存,接着我们再生成一次。 这边还要注意的一点是,在我们搜索节点的时候,我们也可以输入英文,比如说加载图像的话,那么就是 load image, 那 么我们可以看到这两个节点是完全相同的。接着我们再来说一下,比如说当我们输入英文的时候,同样的也是 load image, 但是这个时候我们加了一个空格,好, 我们可以看到这里面并没有出现加载图像的节点,那么这也意味着在我们搜索节点的时候,我们要注意区分节点的名称是否有空格。好,比如说我们需要搜索加载图像节点,那么我们删去 load a m h 之间的空格时候,我们可以看到,哎, 是不是加载图像节点就出现了?好的,那么以上就是关于默认工作流的全部解释,接下来我们来看下界面还有其他哪些模块。首先我们点击左上角,这里有个文件夹, 点开后我们可以看到我们的工作流都保存在这,这边可以点击新建,那么我们就新建了一个新的工作流,当然我们也可以点击这个 import, 也就是输入我们的工作流,或者说是输入我们的文件夹。 最后我们点击 models, 我 们可以在这里找到并且下载相关的模型。接着我们来看一下右边的栏目,首先是该栏目的左上角,我们按住后可以进行拖动, 然后是这个齿轮标志,点开后我们便来到了康复 ui 的 设置界面,在这里我们可以设置语言,点开后我们可以看到有中文,繁体中文、英语以及日语韩语等等,我们往上翻可以看到有其他的功能,比如图像面板顺序,图像面板的位置等等等等,我们 往下看,这有个文本补全,这个 in a b o 我 们一定要勾选上,这代表着它的起用。文本补全的意思就是在我们数几十次的时候,会有这些英文短语的提示, 我们往下看就会添加提示词对列,这个是生成的意思。接下来我们可以看到一个保存的选项,点击该按钮我们便可以保存当前的工作流 以及加载,那么就是加载工作流,同样的意思。接着是重刷新,比如说我们下载一个新的大模型之后,那么我们点击重刷新便可使用。接下来还有个重点就是管理器,这个是康复余额里面最重要的节点,点开后我们可以看到有非常多的功能, 比如说这边有数据库以及频道方式,预览方法,表情等等等等。这边预览方法我们一般选择的是这个 a, ten, two r, g, b, 然后表情这一栏我们一般选择的是名称, 也就是标签名称。选择了之后,我们可以看到节点的右上方一般会出现一个小狐狸按钮,而小狐狸按钮则代表了是它是官方节点,那么我们可以看到该节点是属于编辑一个新节点组的。接着我们回到管理器 这六个 custom node 命令键,点开后我们可以看到有非常多的节点,在这里我们可以查找以及安装我们想要的任意一个节点。在监考的学习过程中,我们会频繁使用到这一个模块, 接着我们看到 model manager, 在 这里我们可以安装我们想要的任意一个模型,注意模型不是节点,他们是分开来的,至于干模块我们今后也会频繁的用到好的。在接受完 cf 以外的主界面以及各种参数后,我们来了解一下 stability 的 内在运行原理,就可以方便我们理解并掌握进一步的学习内容。 在我们输入完提速词之后,文本编码器的 get 模型会将提速词转化为特征向量,然后再由 ve 编码器将这些特征向量传入到前空间内,这些特征向量在前空间内不断的降噪,最后再由 ve 解码器 将这些经过降噪之后的特征向量解码成由一个个像素所组成的图片。好的,那么以上就是本期的全部内容了, hello, 大家好,欢迎来一道 comforui 系列教程的第四节课,那么本节课我们将一起学习文生图的相关知识 以及提述词的语法。在第三节课的结尾,我们一起学习了 stable fusion comforui 的 基础工作原理,那么现在我将结合默认的文生图工作流来讲解其中的工作流程。首先第一步,在我们输入完正负象题后,文本编码器内的克里普模型会将我们的提示词总后的特征向量输送到 k 彩阳器内。 那么这边有个疑问,就是文本编码器的克利普模型从哪来呢?我们顺着这个节点往下看,可以看到它来自于这个库页加载器, 而这个加载器主要是加载各种各样的大模型,也就是说文本编码器内的克利普模型是属于各个大模型的内置克利普模型,而不同的大模型之间克利普模型也可能会有所差异。那么接着我们可以看到这个库页加载器的输出有个 v a e, 那 么也就是说它提供了 v a e 模型,我们看看连到哪 哦,连到了 v a e 解码这里,而 v a e 解码的作用就是将 k 彩阳期内经过了降噪之后的前空间图像解码成像素空间的图像,也就是我们肉眼可以看到的图像。这边我们可以做个实验,先将种子轴固定,最后断开 v a e 的 连接, 然后我们生成,我们可以看到这边是直接报错了,而这个报错的意思是缺少了 vue 的 输入,那么接下来我们重新将 vue 模型给连上,随后开始生成。这边再提一嘴,生成的快捷键是 ctrl 加 enter, 非常的实用,请牢记。 如果说你想调节生成图片的尺寸,那么我们可以在空内存这里,比如说我们将高度调成七百六十八,除以这个数值一定是八的倍数,宽度也一样,这一批次的话则是控制单次生成的图片数量。比如说我们设置成二,好的,我们按 ctrl 加 enter 开始生成。 图片生成后,我们是不是可以看到他的比例已经成功变成了竖屏的比例,并且他一次生成了两张图像。好,接下来我们一起学习提速词的相关语法。首先我们来聊聊书写规范, 无论是正向提示词或者是副向提示词,我们在书写的时候一定是英文以及英文的标点符号,不然系统可能会识别错误。比如我们输入 one go gong 还有 yellow dress, 黄色的裙子。这边在提一嘴,生成的快捷键是 ctrl 加 enter。 好 在我们得到了一个穿着黄色裙子在花园中漫步女孩的图片。那如果说我们用中文来输入,结果会是什么样呢?一个女孩花园以及黄色的裙子, 我们这边可以看到,不能说是毫无关联吧啊,他们至少图片中都有女孩,但是黄色的裙子以及花园很明显没有在图片中出现。接下来我们来讲一讲提述词的权重。 在做之前,首先我们要理解什么是权重。对于权重概念模糊的小伙伴,我们可以理解权重就是比重 分量,那么一个提示词的权重越高,他的分量就越高,他的比重就越高,他在整体中的地位就越高。比如现在一个提示词的权重是一点二,而另一个提示词的权重是零点九,那么当然是一点二的提示词会占更大的比重。 那么接下来我们做个演示,比方说我们输入 one girl garden, one girl 的 权重是一点二,而 garden 的 权重是零点八,那么画面会更侧重于 one girl 的 展现。那如果说我们 one girl 的 比重是零点八,而 garden 的 比重是一点二,那么画面会更注重于描述花园是怎么怎么样的。 好的,接下来我们来讲一讲我们该怎么去控制描述词的权重。首先是重括号,重括号代表着零点九分的权重, 也就是说给提示词加上中括号后,提示词的比重会变小,会降低它的重要性。那接下来是小括号,小括号代表着一点一倍的权重, 比如我们给一个提示词加上小括号后,那么该提示词在画面中的比重就会增高。最后是大括号,大括号代表着一点零五倍的权重,算是一种微调。当我们给某位提示词听这两个中括号时,那么就相当于为这个提示词加上了零点九,乘以零点九是零点八一, 那么就相当于给这个提示词加上了零点八一倍的权重。那么同样的,当我们给一个体数词加上两个小括号时,那么就等于一点一乘以 一点一倍的权重,那也就是一点二一,相当于我们给这个提示词加上了一点二一倍的权重,大括号也同理。那么有的同学可能会问,关于这个权重的变化有没有什么快捷键呢?哎,这个还真有。比如我们将光标移动到某位提示词上时, 打个比方说该的摁住 ctrl 加上键,那么就是给他加权重,我们可以看到他的权重在不断增加,那么 ctrl 加下键,那么就是减少他的权重,是不是很方便呢? 不过我们要补充的一点是,关于权重,我们要多低都行,但是不可过高,因为过高的话图片就会落,你以何? 换句话说,图片就会变形,会失帧。接下来我们来讲短句和长句,我相信不少小伙伴都有这么一个疑问,为什么我姐提示词的时候一定是一个一个词这样去拼写, 而不是用一句话去描述我们想要生成的内容呢?那么这边我可以很明确的回答你,其实两种都行,但 就目前而言,用一个一个的词组去生成,效果会更加的准确,更能表达出我们提示词独含的意思。另外一点,使用一个一个的词的时候,也方便我们进行权重的调整。比如刚才我们有提到,将光标放在某一提示词上, 然后摁住 ctrl 加上或下,就可以调整该提示词的权重。那么如果说是一句话的话,你想调整某一提示词,那么可能就得手动续出过号,进行相关的权重调整。当然现在全世界的 a i g c 从业者也在不断的去研究该怎么样让自然语言,也就是我们的长句能达到媲美短句的效果。 接下来我们来讲一讲提示词的整体长度。这边要注意,比如我们在输入正向提示词的时候,并不是说越多就越好,多可能会让你的表现更加糟糕,那么我们最好把提示词控制在什么数量之内会效果最佳呢?经过众多 ai g c 玩家的经验以及研究表明, 提速词控制在七十五个之内是效果最精准的,超过了七十五个提速词的话,可能会对提速词的识别不精准,整体的表现会降低。正向提速词如此反向提速词也是一样的,记住最好不要超过七十五个。 接下来我们来讲一讲骑手势,那么什么是骑手势呢?在 step 第五选各个大模型训练的过程中,会加入许多的,比如四 k, 八 k 或者 master piece 各种各样高质量的图形去训练, 那么当我们在输入提示词的时候,比方说输入四 k masterpiece, 那 么就可以使我们生成的图像更加的精美。反向提示词的话,那么就相反,比如我们输入模糊 就是文不想要模糊嘛,那么相当于也是会让图片变得更加的清晰。或者说我们在反向提示词内输入文字 text, 那 么在画面中就会减少文字的出现。这边我们可以来看一下这几组的对比,才艺还是很明显的。 接下来我们来讲讲提速词的顺序,或许有小伙伴会有疑问,以为提示词在整体的前部或者是在整体的后部会有什么影响吗?答案是会有影响,在一组提示词中,约靠前的提示词权重会有所增加。那么在我们书写提示词的时候,我们尽量按如下格式进行书写。 首先是书写那些可以提升画质的,或者说可以改变画风的些词汇,比如 masterpiece, high, quality, high, detail, as 这些词汇。第二步是描述我们画面的主体,比如我们可以说 one girl u g s, 一个女孩,蓝色的裙子。 那么第三步就是描写环境,场景,灯光或者说构图。比如我们可以说啊 garden 背景嘛, garden 或者说是 white background, 白色的背景,或者说是 fall fly 柔和的灯光,类似于这些。那么最后我们可以在正向提示词的结尾添上我们想要加的 lora, 关于 lora 和各种模型的下载,我上期视频也有介绍,感兴趣的小伙伴可以回去观看。接下来我们来讲一讲提速词污染。那首先我们要知道 什么是提示词污染。我们可以看一下这一组图片,未经处理时,在多个提示词同时书写的情况下,各个提示词的意思可能会相互渗透。那么为了避免这种情况,我们可以用 break 来隔开提示词, 尤其是防止颜色污染之后我们来聊聊提示词融合。比如我们写 one go cat, 这边我们可以看到生成了一张猫在女孩身上的图片。好的,现在我们在 one go 和 cat 之间添加上 end。 注意这里的 end 必须是大写,全部大写。这边我们可以看到生成了一张猫娘的图片。这个 end 的 作用就是将两个提示词融合在一起。同样的,下划线也有和 end 类似的作用,也是将两个提示词结合在一块。 除此之外,给一组提示词用中括号括起来,中间再用竖线隔开,也有类似与融合的效果。那么这个的原理是,第一步画前面的关键词,第二步画后面的关键词,第三步又在画前面的关键词,以此类推。最后我们来讲一下控制生成的时间段, 比方说现在的迭代步数是二十步,在这过程中,我想让前百分之三十生成森林,后面百分之七十生成一个女孩。那么我们可以试着这么书写大括号, forrest 在 街上冒号 one girl 在 街上冒号零点三,最后以大括号结尾。那么这一长串 代表着是在百分之三十的时候叠数画 forest 还是画 one go。 那 么如果说文把零点三改成零点七,那么意思就是前百分之七十画 forest, 后面百分之三十画 one go。 好 的,那么以上就是本期的所有内容了。

设计行业完蛋了,你敢相信这张图是我只用了一分钟生成出来的吗?或者让他生成一张电商详情页?这就是目前最强的电商详情页生成工作流。今天这条视频我就手把手教你 如何用 comu 轻松拿捏专业级电商详情页。同时我也把所有用到的提示词和图片案例都整理成了文档。感兴趣的小伙伴, 那么我们先来看看今天的主角,就是这份电商详情页生成的工作流。大家不要看节点好像很多的样子,其实总共只分三个模块,图像加载模块、提示词生成模块和图片输出模块。 我们先了解图像加载模块,这个模块可以理解成是给 ai 看产品图,让它后续可以基于产品图像电商视觉总监一样思考。接下来是第二个核心提示词生成模块,这个模块使用了两次 l l m a p i 节点,这个 l l m 节点就是这个工作流的大脑。 我在这里输入一段非常专业的系统提示词,赋予了 ai 顶尖电商视觉总监的身份。它通过视觉识别读取产品图, 并根据你的指令分析受众痛点,提取视觉元素,并输出包含海报、排版风格在内的详细策划方案。在提示词生成模块的后半部分, l l m 再次介入。这次他的任务是翻译和精简,将上一轮的长篇大论严格按照你的要求,提炼出最终用来生成图片的精准提示词。 记住,不要让 ai 鲁奔如果不给他设定规则,他就会像个无头苍蝇一样瞎猜乱画。这里的系统提示词为了教学使用的是删减版,完全版包含了详情页的各种生成需求。最后是图像生成模块,根据处理好的精准指令,正式渲染出专业级详情页。 当然,想要 ai 输出百万级质感,咱们给的底料不能太糙。产品图必须要做到两点,一是纯净无背景,不给 ai 添乱。 二是画质足够清晰,避免 ai 理解错误导致升图翻车。考虑到大家对出图效率和商业落地的极高要求,我直接帮你们把整套外围装备都备齐了。前面两个是智能抠图工作流和画质无损放大工作流,他们能帮你搞定前置准备,把最完美的高清纯净图位给 ai, 极大地提升升图成功率。 第三个更是后期杀手锏,图片自动分层工作流。 ai 生成出来的详情页,它能按照要求自动帮你精准拆解导出为一个个独立的高清 png 图层。你只需要把这些分层图片统统拉进 ps 里,无论是单独修改某个产品的细节,还是重新调整背景和排版,操作空间极大,极其高效。 我们来简单看一下这个抠图的工作流,很简单,只需要单纯的将需要扣除背景的图片放入加载图片的模块,点击运行即可。工作流会自动输出黑底、白底和带有透明通道的图片, 参数已经调好,无需变动,等待出结果即可。然后是高清放大的工作流,一样也是将需要放大的产品图拖入图片记载节点中,根据需求调整,要放大的大小就在这个节点里调整。 如果要二 k 放大,这里的两个数值就填两千零四十八。如果要四 k 放大,就填四千零九十六,其他参数如果不懂的话可以不用调节,如果出现内存不足的报错,就更换这个节点,你加载的模选切换从三 b f p 八或者 f p 十六就可以了。 最后是负责分层的工作流,还是一样,先将要修改的详情图放入加载图片的节点中,然后在这个节点确认要输出图片的最长边,填多少的数值,就看自己上传图片的最长边是什么数值即可。另外要设置的参数是分层数,这里有注示, 这里的两个数值相乘后加一得出来的数值分别对应要分的层数,数值为五就是分一层,数值为九就是分两层。我这里只打算分两层,那我就上下分别填二和四,其他就可以维持不变了。 出来的结果就是这样,哪怕你是零基础,只要搭配上这套完整的工具包,从前期处理到后期精修都能一气呵成,直接输出拿来就能用的专业级电商详情页,你看,不讲虚头巴脑的理论,只给你拿来就能落地的实战经验,有了这套逻辑,一个人就是一只顶尖的视觉团队。 视频里用到的这四大核心工作留言文件,我已经帮大家整理成了一份完整的工具箱,需要的小伙伴。

今天我们来学习这个六月份新出的大模型,他对于海报设计类能生成很好的画面,这些是我生成的作品,可以直接生成两 k 的 照片。他对于海报上的中文有很好的理解, 比如说这个他不会出现乱码,就算修改了,其实词内容他生成的风格一致性还是挺高的,这是这个模型,其实词的结构可以分层次去写。接下来我们搭建这个工作流,我们双击空白的地方,它这里属于 unit, 选择这个加载器,它需要两个 unit 加载器, 两个分别加载不同的模型,第一个是这个模型,第二个是这个模型 id and 两个模型有什么区别?第一个模型就负责提示的内容,比如写一只猫,他就负责生成这个猫,但是他不理解猫长什么样,那么就会用到第二个模型,这个模型就负责这只猫他在现实中长什么样,所以这两个模型是必须的。第一个负责提示词的内容,第二个负责这个提示词在现实中他是什么样。 现在我们加载 click, 双击空白的地方,输入 click, 选择加载 click, 它有两个模型加载,第一个是谷歌模型, 第一个是千万模型,我们使用这个千万模型就好了。然后类型这里选择 id 二点四,这个千万模型对中文理解能力很强,左边是中文,其实是生成的,右边是英文,其实是生成的,大家可以看一下对比。然后我们再加载一个 v e, 双击空白处,输入 v e, 选择加载 ve, 这个加载是 plus 二的 ve, 现在我们四个模型都加载完成,然后这些是模型的下载和存放,左边直接点击就能下载,下面是模型存放的位置,现在我们加载可离谱版本编码器, 左边这个是体字词的模板,右边输入体字词,我在这里输入了一个苹果海报的体字词,这是深层的苹果海报,这个模型它不需要负面条件,所以说我们在这里输入个条件零化,就把它负面条件规避掉,然后在这里输入自定义彩样机高级 第一项,这里需要一个照波,我们选择随机照波生成,这里可以改成随机或者固定。固定种子和随机种子的区别,如果觉得这个固定种子的排版好, 生成的效果好,我可以把它固定住,然后去更改,其实成内容,比如说第一个生成的苹果,我把它图片内容改成菠萝,它可以固定种子去生成,那么随机种子它会生成另一张图片。在引导这里我们需要加一个专用的节点, 在对话框这里输入 e u a、 l, 选择这个专用的节点,如果没有这个节点就需要去更新,去下载,这个节点要连接两个 model 模型,我们先把第一个模型连接上,连接下面这个模型 cf 句子,我们选择是七,然后把两个文本编码器连接上,调节零化 跟正面条件,然后这还有个模型插槽,我们在这里输入 cfg, 选择这个,这个 cfg 指,这里选择三,在降噪指这里我们选择零点七,然后把这个模型连接上,这里需要有个彩样器, 然后这个细格码反应,这里,这里输入这个魔仙的名字,选它专属的 laten, 这里加载一个 flash 的 alt laten, 这些传感器的一个输出口,这里输入 ve, 我 习惯用这个 ve 分 块解码, 这里输入最大值,我把这个 v e 连接上图像,这里,这里可以输入清理,选择清理 gpu 占用,这是 k j 链接点,如果没有的话可以不用输入,这里我们选择预览图像, 这一条线是搭完了,我们在空的地方,这里输入分辨率选择器,选择这一个这个分辨率选择器,它有很多个选择,很多选择像素,我们在高度,宽度这里拖出来,之后输入整数 整数这里拖出来,再输入数学,选择这个数学表达式, 然后在对话框输入这一串数字,然后把上面这个整数连接宽度,下面的整数连接高度,上面这个也是一样,整数连接宽度,整数连接高度。然后下面这行就是官方工作楼自带的,直接选择默认就好了,因为这个是最好的。然后这工作楼搭建完成, 这里就是模型的下载存放,这里选择模型,然后按照这个体字词文本去输入体字词,这个体字可以修改,在我用起来觉得这个文本输入很方便, 它可以细调,能调每个阶段的颜色,能调每个阶段的排版。然后这里可调整的地方,比如说你的照薄和分辨率,还有 cf 句子,如果觉得不合适就去调整一下, 现在我们生成一个图片看一下,现在好了,看一下对比,左边是中文生成,右边是英文生成的,大家可以根据自己喜好去用。

一分钟教会你们怎么样搭一个这样的最基础的纹身图。工作流,首先我们要在菜单里新建一个空白的工作流, 双击空白的地方,在下拉的菜单里选择加载器,这个加载器呢,里面下拉里有你安装的所有的大模型,选择一个自己喜欢的,用鼠标左键点击这个橙色的按钮,不放,往上一拉 会出现文本编码器,然后再拉一个,选择文本编码器,然后在这个黄色的按钮上用鼠标左键拉一下,选择 k 裁样器, k 裁样器我们可以看到这里有一个正面条件和一个负面条件,把下面这个黄色的连上后面条件, 正面条件呢就是你想要什么成什么样的图片,可以在这里输入。后面呢就是你不想要什么,可以在这里输入,如果一开始你搞不明白,就输这个就好了。然后在这里蓝色的点一下,选择 va 一 解码,这个蓝色点一下,选择保存图像,然后在这里再拉一下,选择图像,这个呢宽度和高度就是你想生成的图片的宽度和高度,可以在这里设置 批量大小,就是你想生成几张图,生成的越多呢,会越卡,速度会越慢。好,然后这个地方有模型,模型是连接这个 p 传感器的模型,还有一个 va 一 连上这个 va 一 解码, 基本上这个模型就搭建好了。然后我们自己要想生成什么样的图片,我们可以在这里输入,比如说我想生成一只小狗,然后我们点击 运行它就生成了一只小狗。工作流里有一些特定的规律,我们可以看一下,像这个橙色的点,就连橙色的点, 然后紫色的、蓝色的,你可以观察一下,它们颜色都是相同的,然后包括这个文字也是相同的。那我们现在可以看一下我们纹身图一共需要几个节点呢?七个,七个节点就可以,基本上就是这样了,下课。

不需要真人出镜,不需要请模特,成本低至几块钱,怎么复合爆火的电商带货视频? 第一步,我们对原视频中的图片进行反推,我们可以通过截图等方式截取原视频中的一帧图片,然后呢通过我们的喜图工作流对图片进行喜图放大,我们只要在工作流的这个地方点击这个按钮,上传我们刚才截取的这个图片, 然后点击我们工作流右上角的运行图片,就可以对图片进行反推。我们看一下这是原图和我们起图后的一个对比效果, 如果你想对模特的衣服进行替换的话,我们可以事先找到一张自己想要的模特图片,通过我们这个一键拆一的工作流,我们就得到了这个衣服的平铺图。 然后呢我们再通过这个虚拟换衣的工作流上传我们洗好的这个模特图片,再上传我们刚才 拆好的这个衣服,点击右上角的运行按钮就可以得到我们化完妆的模特图片了。模特素材准备好之后呢,我们还要对原视频进行拆解, 只要我们点击这个地方上传我们的原视频,然后点击我们右上角的运行按钮,就可以对原视频进行拆解,我们这里边可以对原视频的各个分镜进行拆解,这个地方就是我们拆解出来的原视频的分镜提示词。 我们在有了新的模特形象以及原视频的分镜提示词之后呢,我们要制作自己的分镜以及对应的分镜提示词,我们通过这个工作流程制作, 首先呢在这个地方上传我们刚才制作好的新的模特形象,然后在这个地方上传我们刚才拆解出来的原视频的分镜提示词, 输入我们的时长以及我们的分镜数量,点击我们右上角的运行按钮,我们就会得到我们自己的分镜以及和这个分镜相对应的分镜提示词。这个地方是我们新的分镜提示词,从这个 k f 一 往下去就是我们对应的我们的新的分镜的提示词, 他这里边每个提示词对应着一个分镜,比如这个 k f 一 他对应的就是第一个分镜,那么 k f 二对应的就是我们第二个分镜的提示词。 我们在有了我们自己的分镜以及我们对应的分镜提示词之后呢,我们还要制作 rts 二点三专用的全局提示词和分镜提示词。来到 rts 二点三 promise 类提示词工作流。我们在这个地方上传我们新生成的分镜, 在这里输入我们这个分镜对应的提示词,输入我们的分镜数量, 输入我们的时长,点击我们右上角的运行按钮,就可以得到我们 rts 二点三专用的提示词了。最上面是全句提示词,下面是对应的每一个分镜的提示词,有了它可以让我们更方便的在 rts 二点三导演工作台中制作我们想要的视频。 在制作视频之前呢,我们还需要最后一步需要操作,我们要将我们的分镜图切换成一个一个的单独图片, 我们只要在这个地方上传我们刚才制作好的分镜图片,在这里设置好我们的分镜数量,点击运行就可以将我们的宫格图分割成一张一张独立的图片了。 最后一步来到我们 rts 二点三,导演台工作流,这个是一个升级版本,我们来到导演台阶点, 在这里上传我们的九张宫格图,并且呢,设置好我们的时长以及全局提示词,还有每张图片对应的分镜提示词, 然后点击右上角的运行,大概五分钟左右就可以得到我们的视频了。整个视频的生成费用非常低,大概成本两块钱左右。好了,这是今天视频的所有内容,如果对你有帮助的话,点个赞呗!

各位电商朋友和内容创作者们,你们是否还在为找不到合适的模特,拍不出满意的商品图而发愁?烦死了?或者觉得每次产品上新都要在模特摄影后期上投入巨大的成本?今天这期视频教你一招无中生有的黑科技,我们将一起学习如何利用 ai 动作迁移、 ai 换装和图声视频技术,打造一个专属你的虚拟模特, 让他随心所欲的更换服装背景和姿势,甚至让他动起来。我们只需要他的一张高清正面照,这张照片就相当于我们模特的数字 dna, ai 会记住他的脸,他的身材,他的一切特征。接下来找到一张你觉得特别棒的参考图, 我们不关心这张图里的模特是谁,穿的什么,我们只偷他的姿势和他所处的这个高级感十足的影棚背景。我们把专属模特和姿势场景这两张图同时喂给 ai, ai 就 会精准读取姿势骨架信息,然后让你的专属模特完美复刻出一样的动作和神态,并出现在新场景中。 最关键的是脸和服装都保持不变,这就是固定人物的动作迁移。如果我不但想换姿势,还要想让他换身衣服怎么办?我们只要把另一个工作流加载进来, 分别上传我们的服装图和模特图,然后在模特图这里,鼠标右键选择在遮罩编辑器中打开,调整一下画笔大小,涂抹需要更换衣服的区域,然后点击保存。最后我们点击运行,稍等一会,服装就换到了模特身上了。 接着再把换装好了的模特完美的复刻进了另外一个全新的场景里,感觉怎么样?是不是很简单?这时又有小伙伴说,想让商品展示更进一步,从静态图变成动态视频,安排必须安排!我们打开一个新的工作流,只需要在图像夹在这里上传我们的模特图,然后输入一段相对应的运镜提示词, 然后我们点击直行,稍等一会,视频就制作完成了。大家感觉怎么样呢?同一个模特,同一个你,却能拥有无限的背景、无限的服装和无限的姿势, 你等于拥有了一个七成二十四小时待命,永不疲倦、风格百变的专属虚拟模特。这项技术对于我们做服装电商、产品设计、市场营销的朋友们来说,简直就是降维打击啊!朋友们,所以别再为模特徒发愁了,与其到处找模特,不如动手为自己创造一个专属的虚拟模特。 怎么样?这个虚拟模特生成指南你学会了吗?好的小伙伴们,今天的视频分享就到这里,视频中演示用到的工作流和操作文档,我已经打包整理好。

哈喽,大家好,今天我讲一下如何生图,通过边缘深度和姿态的控制,生成一张精确控制的一个图片,达到逼真的效果,获取整体的一致性。向下一张的话,它是通过边缘控制像画笔一样的形式勾勒出了像嗯,主要重点的一些部位, 然后展现出来的一张效果图。这张图呢,可能还是要去抽卡,这个瓶子不见了,效果图还差一点,但是可以看出人物非常的逼真,手上的水珠跟水滴也是非常逼真的像。最后一张图的话是姿态控制, 从这里就可以看出他只提取了人物的一个动作的模式,还有手指头提取的都是非常的精确的。然后这一张呢,因为他只提取了姿态像,人物的形象外观特征是没有拿到的,这是一张新的图,只拿了人物的一个状态, 这个是非常适合想生成一张比较好达到理想的效果和一个工作流程。我大概讲一下他整个整体是怎么搭建的。首先我们先加载图片, 我还是拿我前面的那张图做举例,图片获取了之后,我们可以再缩放一下它图片大小, 缩放图像的像素,然后我们将它连起来,这里我们可以不用动它,后面呢我们就获取获取图像,获取图像的尺寸,要获取它的宽高,或许的话我们可能就要用,所以我们设置一个设置点,这里给他设置一个宽度, 然后再设置一个高度, 这里完成之后,我们就可以看到我们这张图片已经可以去加载了。接下来我们就要去提到,去做我们刚才提到的三种操作,一个边缘,一个深度,一个姿态。我们用到的是 a u s 的 机身处理器, 它可以去加载我们刚才提到那三种三种处理的方式控制方式,第一个我们要用深度,用用六二八吧。 然后第二个用到的是边缘检测,边缘检测是 kenny, 也是一样。然后第三个我们刚刚提到的是行为动作的姿态处理是 d w, 然后我们将刚刚这张图像给他连起来,要对他进行控制, 但是这三种我只想随意切换,我有的时候可能只想用到深度的,有的时候可能想用到这种自带的处理,我不想让他们三个同时都用到。这时候我们用到一个交换的节点 切换,我们把这个节点全部输进去。现在我们可以看一下这个效果图, 预览一下,就通过简单的这个模型,这里可以看到我们通过深入图提取到了他的明暗成分的一个,嗯,就是明暗交加的一张图片,能看出这个人的大概的轮廓。然后我们可以再看一下第二张 边缘图,这也可以看到我们用画笔把整个人物的形象像像笔一样的给它画出来了。然后我们可以看第三个姿态的图片, 我们也能看到把整个姿态的状况给他拿出来了。像我们姿态检测的话用的是优优,优优是个比较好的一个行为检测的模型,然后还有个姿态检测的,呃,这个是个姿态的 dw 的 一个模型, 我们就只用第一个,然后我们就能得到我们想要的。接下来我们拿到了图片的,因为我们现在已经获取到图片的一个基本的行为控制的一个方式,现在我们就要开始去创造它,用我们的加载器,然后还需要一个文本处理器, 这个是需要让计算机去识别到文本,还有一个是 b a e 级加载。 好,暂时我们就先用这三个模型,用 it 的 话我们现在用,我前面用的是 the image, 这个是阿里出的一个模型,还是比较逼真的,刚才出来的最终效果图主要用的就是 the image, 然后 link 的 话就用千万的, 这里要改成新闻 v a e, 加载器的话我们也用 z e m g, 跟我们这个模型要用一样的。接下来我们就开始写提示词,想要写里面有什么一些内容,我就复制一下我刚刚里面的提示词, 这个提示词里面提到了长裙、森林、花朵、蝴蝶,然后它是需要面对观众的,然后有光泽的皮肤细菌性的一个,所以我就还是附用这一张这个提示词。 然后我们这一块的话也处理完了,我们就开始拿一个加载器,需要把我们输入的文字和图片进行整整体的结合在一起,最后输出一个最终的结果。我们需要加载图片和文字,然后让他进行一个计算。但是我们这边只因为像千万和 嗯它的模型嘛,这两个的话其实本身不需要后面提示词的,这模型还相对比较强大,这也没事,不连也没关系。 然后还需要一个空的图像,空的 little 图像这个生成,如果要生成图,这个是必须的,你想给它生成多大宽度跟高度?刚刚我们已经设置了,我们只要获取点就行了,我们这里已经有了,我们获取一个高度,然后还有一个宽度, 接下来就是模型,模型的话我们不能直接连,不然的话我们这边就没有办法给到我们的提示词,让他去结合在一起,所以我需要一个千万的, 千万的一个这种控制,控制整个我们的提示词,再加上我们图片的控制结果状态结合到一起,让他变得控制性更强一点。首先先把模型连在一起,然后 编码 v a e 的 编码器也给他连上图像的话,就连我们前面输出的一个控制好的结果图,还有一个模型补丁,模型补丁的话也很重要, 也用 z e m g 就 可以了,这个补丁呢?它跟 lala 有 点像,但其实它们不太一样,主要是用于增强某种模 能力。然后是修改模型的一个行为,像降噪过低啊,改善颜色,它是主要是减少些崩坏和提高稳定性的。 loa 它是处于一个训练好的角色风格和它已经训练好的权重给出结果的。但这种的话它是直接修改底层模型的一些参数,让运行的方式发生变化,所以 这个还是比较好用的。像这里的话,我们就默认写七点五,像零点六到零点八之间是最适合的一个范围,如果大于零点八的话,它整个就是太依赖于提示词, 可能生出来的结果就会差一点,意思就是我可能想要的那个姿态可能就会偏失,如果这个提示这个数字太小的话,他提示词像有些那些我提到森林啊蝴蝶,他可能就会消失,他的创造力可能变得更强,就不太受控制。然后我们把这个模型给他加载过来,最后 最后我给他进行一个解码,就输出图片,我给大家预览一下, 还没有加载 v e, 你 也可以像加个条件立方,让它这个变成空,或者是这个拉一个什么都不写的一个文本给它连上去也可以。 人物是出来了,诗词不是很好看一下,问题啊,这里还要改一下,数值太高了, 这里数值过高的话,他可能像题词的这些东西他可能就没有办法输出了,他依赖于我们的一些图像了,图像跟那些行为检测。像我们这些模型的话,千万和这种大 trouble, 他 们本身就是比较好的模型,所以步数要稍微降低一点。 ok, 这个结果就出来了,整体话还是很好的,这生成人物的图片。然后一定要注意用这种模型的话,它的数值一定不能太高。 然后我们用的是一,用的是深度的,所以它出来的效果是这样子的,它跟圆形我们原来的话大,至少是会比较相似。整体就讲完了,谢谢大家观看。

先来看段视频,欢迎新进直播间的姐妹们看我这个皮质纹路真的出油细腻,背上的特别显气质,东心百搭, 左下角直接带走啊。刚才我们看到的那个视频是通过 rts, 二点三是通过一张图片就生成的视频,这个工作流的核心就是这个节点, power 是 relay 节点, 它可以将我们的图片分割成多个分镜,从而实现更加精确的控制。我们来看一下这个工作流具体的使用方法。首先在我们的左侧上传我们的参考图片, 这里设置它的时长单位是秒,帧率是二十四帧,我们不需要改它这个地方设置视频最长边的尺寸。然后最核心的就是 promenade 类节点,我们来看一下。首先上面是它的全局的提示词,下面是它的分镜提示词, 全局提示词和分镜提示词我们待会再讲,我们来看这几个参数,我们先来看一下这个最大帧率,怎么写这个最大帧率呢?它有个公式 就是他的时长,所以帧率再加上一,我们这个视频时长是十秒,加上帧率是二十四帧每秒,然后加一,所以是二百四十一。这个地方这个数值如果是一的话,他每一个帧之间的切换就越平滑,数值越小的话,他就相当于硬切。 然后这个地方的针速率要和我们刚才的统一,二十四针在这个地方是设置,我们要分成几个分镜,我们可以通过加和减来进行分镜的调节,我们在每个分镜的地方可以通过拉拽来控制每个分镜的一个时长, 也可以在这边直接输入,比如说是二十针,这个地方我们选择,比如说一百针 也可以进行拖拽,或者呢我们选择平均,把每个针进行平均一下子, 它每个针的提示词呢,我们点击之后可以在这个地方选择每个针的提示词。好了,这个节点的话我们介绍清楚了,下面我们看一下这个全局提示词和下面呢这个分镜提示词具体应该怎么写? 我这边专门做了一个 rts 二点三 command 类提示词。工作流,我们只要在这个地方上传我们的图片,然后写下你这个视频的主题, 比如我这里写着美女在直播间介绍女士包包,一边介绍一边展示手中的包,时不时的和观众互动,你帮我设计台词,如果说你有台词的话,你自己可以写台词是什么什么什么,不知道怎么写台词的话,你就让这个 ar 帮你写,也可以 下面写一下你希望的分镜数量,我们十秒钟呢,那个四个分镜就可以了,视频是十秒钟,你可以设置长一点,这 r t s 二点三呢?嗯,二十秒、三十秒的视频都是可以生成的。好了,这些设置好之后,我们点击工作流右上角的运行按钮,我们就可以看到 这边我们生成出来提示词,这个提示词呢,它首先分成中文和英文两个版本,这边有全句提示词,还有四个分镜的提示词,我们直接把它复制粘贴过来就好了。我们建议呢用英文提示词,因为 lts 二点三对英文的知识更加好一点。 我们选择这个地方的全句提示词里边把它选择,然后 右击把它粘贴过来,这是我们再把分镜一的提示词把它复制过来,点击分镜一 把它粘贴过来,我们可以看一看,这里边的提示词是英文的,但是他说话的这个台词一定要是中文的,而且用引号引起来, 不然的话他生成的视频发音是英文的,这个地方一定要注意,你想让他说中文的话,台词一定是中文的。 同样的文法,第二、第三和第四分镜的提示词,用同样的方法文法,分镜二,分镜三还有分镜四的提示词 全部粘贴到我们的对应的地方来。粘贴完之后呢,我们点击右上角的生成按钮就可以了啊。补充一点,在工作流的左上角有一个按钮,我们把这个按钮呢,把它移到右边来, 这个按钮是什么作用呢?我们点击它,我们发现啊,点击它可以把第二阶段的彩样进行开和关, 为了节省时间呢,我们可以把它给把第二阶段给关掉。如果你想获得更高新的视频的话,可以把第二阶段打开啊,就这么简单。好了,就是今天视频的所有内容,喜欢的话点个赞呗。

ai 创作圈的性价比天花板,康菲 u i 九点五新版本重磅上线,这次更新聚焦高清创作需求,将视频与图像生成质量推向新高度, 更坚持永久免费开源的核心优势,让普通创作者无需花费一分钱就能轻松产出媲美专业团队的高清作品,彻底打破优质创作必付费的固有认知。生成的图像细节丰富立体色彩还原精准, 动态视频流畅丝滑,无锯齿模糊。无论是商业级海报设计、短视频创作,还是创意特效制作,都能呈现出影院级的高清质感,完全不输付费工具的输出效果。那么该如何使用呢?首先将我们的 v 九点五整合包下载到电脑上, 下载好之后,用鼠标右键点击这个压缩包,在弹出的菜单里选择解压软件进行解压。这里有一个非常重要的点,请一定要将文件解压到一个没有中文的目录下,也就是你的硬盘路径里不能出现中文字母,以免后续运行出现报错, 静静等待解压完成就好。解压完成后,咱们就可以准备打开了,在解压出的主目录里找到并双击那个粉色头像的会式启动器图标, 双击打开后,电脑会首先为你弹出一个图形化的秋叶启动器控制台。在这个界面里,我强烈建议大家先点开左侧的高级设置看一眼,确保系统已经准确识别,并且选中英伟达独立显卡。 确认无误后,点击右下角的一键启动按钮,点击之后,后台会弹出一个黑色的代码窗口,开始狂飙数据。 这期间,系统正在为你自动唤醒底层环境,并加载内置的五十多个精选插件。大家只需要耐心等待几秒到几十秒,他就会自动唤醒你的电脑默认浏览器,直接把你带入康复 ui 节点操作区。 当浏览器成功弹出带有网格和各种连线的深色界面时,恭喜大家,你已经正式推开了 ai 创作的大门。咱们这个 v 九点五整合包最大的魅力就在于把复杂留给底层,把简单教给你, 你完全不需要从零开始去学习怎么连线,直接在界面里点击加载预设好的最基础纹身图。工作流,咱们来简单跑个测试看看效果。 你只需要找到一个在上方的文本框,输入你想描绘的画面,比如简单敲上一句一个女孩毛衣白色背景,然后在下方文本框里填上如模糊、低质量、畸形之类的排雷词汇。 接着点击界面上的运行按钮,这时候你会看到屏幕上的节点开始依次亮起绿色的光效。得益于咱们非九点五底层强大的环境优化,仅仅几秒钟的功夫,一张光影细腻、质感拉满的美女照片就会在最终的图像节点里生成出来, 整个过程丝滑流畅,完全不需要你懂任何深奥的代码原理。当然,这种基础的纹身图仅仅是个热身, 咱们这个 v 九点五整合包真正的核心资产是里面为大家精心预制的两百多个大师级精品工作流。这 些工作流的特点可以用四个字来概括,那就是开箱即用。以前大家在网上找工作流,最怕的就是导入进去后满屏飘红,告诉你缺这个节点,少那个插件,折腾半天都跑不通。而在咱们的整合包里,几十个核心插件早就为你配置的明明白白。 不管你是想做高清的图声图,局部重绘,还是想玩点高级的 ai 换脸,数字人对口型,甚至是去挑战目前最前沿的视频生成模型,这里面都有现成的模板供你直接调用,那么你赶紧去自己动手试试吧。 欢迎来到我们的 comfy 视频生成系列课程。哈喽,大家好,那么这一节课呢,我们来学习我们六种视频生成方式之中的第四种,也就是动作迁移工作流。那么我们只需要上传一张图片, 然后再上传一个视频就可以了。那么首先我们来看一下我们刚才导入, ok, 然后再来看一下我们生成的结果, 整体的一个动作,包括人物的一致性都保持的还是很不错的, 同时呢,他会将我们原来的视频当中的音频自动与我们的视频进行一个结合,然后直接一键生成。那么像这一种我们图片可以模仿视频当中的人物动作,然后进行一个视频输出的工作流,是如何实现的呢? 我们来看一下怎么使用。那么首先呢,我们依旧要明白,第一步就是确认我们的模型使用, 这对于我们生成任何视频或者图片都直观的重要。像这里面我们依旧选择 g g u f 的 模型, 以及添加一个对应的加速 laura。 由于这里面我们使用的是一个动作迁移,所以我们还需要加一个 animate 的 加速流来进一步对这个工作流进行一个加速,我们加载好我们的这些模型之后呢 就可以直接输入到我们的彩样器当中,这个时候就要注意到我们彩样器还依旧缺少了正负相条件,那么正负相条件其实指的就是我们视频当中的人物运动部分, 这个时候我们需要加载我们的一个视频进来,那么这个视频呢会拆分成很多张的图像, 然后传入到我们的姿态与处理器这里面,然后通过这个处理器呢分别对我们的一个姿势以及面部来进行一个识别,最后将生成的这些图像呢输入到我们的动画短视频当中, 我们需要提供面部视频和姿态视频,那么这些都是通过我们的育处理器来得到的结果,同时这里面我们还需要输入我们的一个参考图像,也就是最后我们视频生成中的主体人物图像, 通过我们的视觉编码器呢进行一个编码,然后一同输入到我们的一个转视频节点当中, 然后这样子就提供了他的一个副像条件。同时由于我们的参考图像可能尺寸比较大, 所以这里面呢我们直接对整体的一个图像呢设置一下深层的视频宽高,那么像这里面这张图像呢是一个竖向的比例,所以我们最后设成一个宽四八零,然后长度为八三二的一个图像尺寸, 然后在这个地方我们进行一个设置,最后呢我们的彩样器上面的条件我们就都连接好, 然后再直接输入到我们的解码器当中,进行一个生成即可,最后呢就能得到这样的结果,这里面我们想要这个视频呢,更流畅一点,也可以添加一个补帧节点,又或者想让视频变得更清楚一点,可以添加一个高清放大节点。 那么这两个节点呢,在我上一节课讲设为真生成的时候都已经提过了,那么整体的工作流所使用到的文件我都已经为大家准备好, 比如说我们的插件,包括我们的 g g f, 我 们的视频转模型,包括我们的视频 c t r l, 再比如说我们的所需要的模型以及工作流。那么大家在拿到这样的文件链接之后呢, 就放到对应的文件夹目录即可,那么这个视频就到这里了,感谢大家的观看,如果对你有帮助的话,不妨点赞加关注,支持一下,我们下个视频再见。

逼自己一周练完,其实你很会 ai, 存下吧,全一百七十八集很难找,全的警告,本系列视频耗时两个半月,制作共计一百二十分钟,让你从康复 ui 小 白到 ai 大 神,这应该是目前抖音仅有的从入门到进阶的全套系统康复 ui 教程。 ai 界最全能的软件来了, 一款软件就承包了所有的 ai 需求,关键是官方正版完全免费,它就是康复 ui 工作,留意打包,还没试过的直接抄作业。 哈喽,朋友们大家好啊,欢迎来到 comui 全系列课程的第二节课,那么在这一节课呢,我将带领大家一起去深入了解 comui 纹身图以及背后的深图逻辑。 好,那么我们现在就开始我们第二节的一个课程了啊,首先大家看到我们的一个啊,工作流老师打开的这一个界面啊, 那么这个工作流的话呢,是我们用上了一个 laura 啊的一个组合生出来出来的一个效果,大家觉得还不错,对不对?好,那么我们先不管这一个界面啊,我们先加载一个新的界面啊,然后加载一个默认的工作流出来啊,加载一个默认的工作流 啊,这个默认的工作流呢,其实就是我们要讲的这一个,嗯,最基础的这个纹身图的啊,工作流了。好,那我们先来去理解一下每个节点的一个含义吧啊,每个节点的一个含义?首先呢,我们左边的这一个节点啊,左边这个节点呢,它就是 checkpoint 加尔器, 那么这个加尔器呢,它其实就相当于我们选择大模型的一个节点啊,那么在 函数 ui 中呢,我们基本上每一个参数啊,比如说大模型的选择, laura 的 选择, bay 的 一个选择,都是通过一个节点来去选择的啊,等下我们可以去了解到,那么在这里的话呢,大家就可以选择我们需要用到的一个模型,比如说我们用一个白菱 啊,白人的这一个模型,叉 l 的 一个模型,对不对?好,那么这个的话呢,就相当于是大模型的选择,对不对?那么除了大模型的选择,我们还需要什么呢?还需要提示词的一个出现,对不对啊?那么这两个节点啊,那么我们都叫它节点啊,那这两个节点呢,它分别是我们的 正向提示词的一个输入,以及负面提示词的一个输入,那么在上面的这一个输入呢,就是正面提示词, 那么怎么样分辨他们两个哪个是正面呢?其实就取决于他们后面的这一个线条啊,不说叫这个参数的这个条啊,他是连到哪一个的啊?连到这个 k 传感器,他是连到正面条件,他这个宽里面的就是正面条件, 如果我们把它给反过来,那么这个宽的话呢,他就会变成负面条件,明白吧?不管你这里面填的是什么啊,不管你里面填的是什么, 然后这个就会变成正面啊,他就这样反过来,所以说大家一定要在前期的时候呢,注意好我们的这一个参数信息的这个连接啊,正面条件记得连哪里啊?负面条件是连哪里,不要连错了。好, 那么我们这两个是文本的输入框,对不对啊?它叫 clip 文本编辑器啊,等一下我就会给大家去解释为什么它叫 clip 文本编辑器。好,那么这个 collate 这个节点呢,就相当于是我们图片的尺寸调节,以及我们 p 四大小 啊, p 大 小的意思呢,其实就是我们生成图片的张数,你想生成一张,那就是选一,那么如果你想生成两张呢,选二啊,这样的话呢,我们就可以生成两张图的意思啊。好,那么这个 k 采集器呢,其实就相当于把我们前面所有的一些信息 集合出,集合到他的这个节点里面,然后在这里呢进行我们的一个图片生成啊,然后里面有一些参数,我们等下会讲解, 那么这个 ve 解码呢啊,等一下我们会专门去讲一下这个 ve 解码它的一个作用,然后最后的话呢,我们就保存一下图片,那么我们这几个节点其实都已经出来了啊,他们每个节点的一个用法啊,然后的话呢我要去讲解一下,就是我们的这个线条的一个连接 啊,大家可以看到我们大模型这里有个模型对不对?那模型它代表的一个啊,参数的颜色就是紫色的对不对?所以说它一定要连到 跟紫色有关的一个节点上啊,大家看到没有,你这一个模型啊,如果你不连这个模型,你连正面条件是连不上的啊,同学们一定要注意啊,连不上的,所以说我们一定要注意这个, 嗯,对应参数的一个连接,就说信息不能错啊,黄色的就一定是啊,跟提示词有关的啊,你看这个红色的就是 v e 啊,你红色的是连不到黄色的上面的啊,就是这个意思,好,那么 我们了解了这一个每个节点他大概是什么样的一个作用之后呢?我们就来拆解一下他的一个真图原理啊,那么在这里的话呢,我们先升一张图啊,比如说一个弯钩儿啊,我们先升成一张图,对不对?我们其实选好大模型之后,我们只需要来一个提示词啊,点击一下生成, 他就给我们去升一张图啊,然后这里我们尺寸的话呢,应该是调错了啊,我们这里填一,然后一零二四乘以一零二四 啊,我们在这里去点一下生图,对不对?他这样的话呢,就会给我们生成一张啊,女生的一个图片,对吧?啊,很好看的一个女生图片,那么他是怎么样做到这一步的呢?那我们就来到了怎么样去 拆解这一个纹身图,他的一个厚涂的原理了啊,好,那我们就来到我们的这个 ppt, 我 们首先的话呢,呃,我们刚刚的那个步骤,其实就是这一个 ppt 的 一个作用啊,就是我们输入一个 w 就 能得到一个女孩,对吧?啊?那么他的一个后台到底是怎么样运行的呢?首先我们要讲一下大模型, 就说大模型它里面是什么东西啊?它里面有什么?它能这样子生成图片,对不对?大模型它其实就是把我们在训练的过程中啊,把我们很多真实的图片,就比如说它训练了很多女生,他把很多女生的一个图片,以及 女生图片对应的一些提示词,比如说这个女生可能是个黑色头发啊,然后呢棕色的眼睛,对不对?白白的皮肤,他把这些提示词呢,变成每一个图片都有的一个标识啊,那大家看到没有这张图 你就能看到啊,在这一个空间里面,这一个我们每一张女生的图,他都会变成这样的招生图啊,就像这种马赛克的啊,像那个电视没有信号的那种图片,对不对?那么在底下呢,有一些小字啊,但其实这些小字呢,其实就是 就是图片所对应的那些词转化成的一些参数啊,大家可以这么理解,然后呢,每一张图都有他对应的一些啊提示词的参数,所以说他这样子啊,素材多了,然后在这个浅空间里面,他就能当做是一个大模型 啊,大模型里面就是有这么多参数啊,有很多张图片,以及有每一张图片对应的一些参数的一个提示词。好, 那么这个就是大模型的作用啊,它储存了很多参数对不对?好,那么 clip 是 什么意思呢啊?大家可以看到,在我们大模型里面啊,大模型的一个输出里面,除了有模型对不对?那么这个紫色的模型其实大家就能理解了,这里面就是纯属了一些图片的数据。 好,那么这个 clip 呢?是什么意思呢? clip 呢?其实就相当于把我们输入出,输入进去的英文翻译成 ai, 它能听得懂的 talk 啊,那么大概可以理解成向量啊,那么 因为 ai 它是听不懂,比如说我们一个弯钩啊,或者说一个蓝色头发啊,棕色眼睛这样的一个提示词的,对不对? ai 它是听不懂的,它只能听得懂它属于它的语言啊,所以说 clip 这个东西就是帮助我们去翻译给 ai 听的啊,让 ai 能知道我们真正想要去出什么图啊,然后呢去大模型里面找对应的一些造声图啊, 明白吧?这个 clepe 就是 这样的一个作用。好,那么 ve 是 什么用呃的一个用法呢? ve 它的一个用法就相当于把我们的图片可以变成造声图, 因为我们的 ai 或者说这个 stable definition 在 浅空间里面只能理解这个造声图这种形式,所以说我们的 ve 它的一个作用就是把我们的图片变成 这个造声图,或者说把它生成出来的造声图解码成我们的一个正式图片啊,那么 ve 它的一个作用就相当于图片的一个翻译官 啊, clip 就 相当于我们文本的一个翻译官,那么它翻译进去的都是属于在浅空间里面进行计算。好,那么这个 k, 那么这个浅空间里面到底是在干什么呢?其实我们的深度流程就是通过我们的一个浅空间在浅空间里面进行计算的。好,那么它具体的一个步骤是什么呢?就是 我们输入一个提示词啊, one two, 那 么这个提示词啊, clip 就 会把它翻译成 一个项链啊,那么一下他能听得懂,那么他能听得懂之后呢,就会在我们的大模型里面找到对应的啊,跟弯戈尔对应的那一个造成图里面的照点 啊,然后这个时候呢,空 late 就 会确定一个招生图的尺寸啊,因为我们是随机生成一张招生图吗?那么那个招生图里面呢,就会带有这个弯个的一个属性啊,那么好了,那么得到了这个招生图之后呢,我们就会这个招生图就会经过我们这一个 k 产气 啊,来到这个 k 传感器里面,那么 k 传感器呢,就会把那个噪声图不断的把那个噪点给去除,那么具体去除多少步啊,以及去除的效果怎么样?那就是取决于我们里面的参数了 啊,我们里面的一个参数的话呢,就是通过调节我们的一个步数,或者说 c f g 值啊,以及我们的采暖器和调度器,那么采暖器和调度器呢,它其实就相当于我们怎么样把那个噪点去除啊?它的一个方法是什么样啊?那么其实 去除的差不多了,那个照点去除的差不多了,那么我们图片就会变成这样子,对吧?啊?但是呢还不能够达到我们这种画面的效果,对不对?这种画面就像真实的图片一样,那么我们就要通过 v e 烂吧烂它这一个 接近我们真实真实的图片的一个带照点的一个图转成,或者说解码成我们这个图片,那么其实我们的这个工作流程大家就能明白了啊,对不对啊?那么我再给大家去讲一遍, 大模型提供所有图片啊,造成图的一个数据集 click 文本,帮助我们去翻译我们的提示词啊, ai 他 就能知读的懂,我们想要什么画面,他就可以在大模型里面去找 啊,好,那么这个空内存呢,就负责是我们那张图片的一个大小和尺寸啊,以及我们的一下生成几张,那么所有的参数收集完成之后呢,就会在空内存 啊,就会在 k 产生器里面呢进行把我们那个噪声图呢啊,对应那张图像去降噪啊,最后的话呢,通过 ve 的 一个解码就能把我们这张图片给它真正的生成出来了。 那么这个图片的这一个流程的话呢,就是属于我们真正的一个生图的流程了啊,这样大家应该都能明白了。所以说大模型他的一个非常关键的啊,如果没有他的这些数据啊,你是不可能能生成出一个 很好看的一个效果的啊。然后再举个例子呢,就是如果我们的大模型他只训练了动漫的一个画面,对不对?他这里面所有的一个参数啊,都是属于动漫的, 那么你想让他去生成真实的一个图片就是不可能的,对不对?因为他根本就没有这个对应的数据级啊,那么你再给他写详细的提示词,他都不能够给你去生成很好的画面。好,那么我们讲完这个生图原理之后呢,大家就能明白了,我们这个 嗯背后的原理到底是什么样的啊?那么我们再来去讲一下这个纹身图怎么样去加 lara 啊,我给大家进阶一下,那么纹身图想要添加 lara, 那 么我们首先要理解 lara 它到底是个什么东西? lara 其实就相当于大模型的微调模型,因为有些大模型啊,他不能够,虽然说他训练了很多图片对不对?但是呢他不能针对某一种风格或者说某一种角色去深沉 比较精准的啊,不知道大家能不能明白,就比如说我要生成一个路飞的形象,虽然说这个大模型可能训练了一张或者说两张路飞,但是呢不够多啊,所以说他可能去生成路飞,他就不够像啊,那么这个时候呢,我们就要需要去专门用一个 啊,很精准的一个路飞的 lara, 因为路飞的 lara 它就相当于你可能有二十三五十三专门训练路飞的一个图片啊,那么训练出来的这个小模型就叫 lara 模型啊,那么我们就可以很精准的生成路飞了,那么 在这个这里的话呢,我们去讲解一下这个怎么样去添加我们的 lara, 那 么 lara 大家都知道喽,刚跟大家说了,我们这 lara 相当于一个小的模型,那么模型是在 所有的一个参数的一个输出啊,它是作为所有参数的一个输出的,所以说它一定是要连到前面的,不然的话呢,你前面你后面的这些节点,它都是接收不到数据,它就没有办法进行一个生成了。好,我们这个时候呢, 找一下啊,双击这个空白的区域,我们找出 lua 加载器这一个名称啊, 啊,找出这个节点,然后呢怎么连接呢?大家看到没有有一个很好的连接方式,就是说看它的左右的一个输入和输出的信息。 好,我们在这里看到呢,它左边的一个输入啊,那么必须是有一个模型和 clip, 对 不对?那么大家看一下哪一个节点呢?是可以直接给到它 这两个参数的呢?只有这一个节点对不对?那么我们就进行一个连接好,那么连接好之后呢,怎么样再连出去呢?其实大家就能一看就能明白了,那肯定是经过这个节点之后呢,再连给我们后面的一些节点的,对不对?那么 klipp 也是进行一个连接,其实这个东西就像一个串联一样, 对不对啊?就像一个串联一样,好,那么在这里的话呢,我们选用一个其他的一个 lala 啊,那么在这里的话呢,我们用一个魔法阵的一个 lala 啊,魔法阵的一个 lala 啊,我们去申图。好,那么在这里的话呢,老师给到大家推荐的一个提示词啊,那么包括我们推荐的一个啊,大模型啊, lala 啊,我们都是给了参数的啊,所以说大家可以去参考一下我们的这一个,嗯, 提示词啊,提示好,我们这个时候呢,点击一下生成,大家就可以看到我们生成的一个效果喽, 对不对?有了 loa 之后呢,我需要得到的一些画面效果,它就可以很精准的给我表现出来啊,如果我们没有用这个 loa, 那 么它的一个魔法阵的效果肯定就是 不太好的啊,效果不太强烈的。我们这一个大模型,包括我们的一个 lua, 以及我们这节课会用到的工作流呢,都会放在我们的一个评论区。好,那么我们这一个工作流就是搭完了,然后我们再来讲一下啊,这里面有没有什么需要注意的地方啊?其实就是这个 k 传感器喽 啊,黑铲器,这里呢有啊,步数的意思就相当于是他降噪了多少步啊,我们这里默认填二十到三十步就可以,三步距值呢,就相当于我们的提示词的听话程度,如果你想让他听话一点,那你就调高,如果想让他没那么听话 啊,你就调低一点,但是呢太高的话呢,会导致我们的一个棒面的一个质量降低啊,这个大家一定要注意,然后呢踩样器和调度器我们就选默认就好了, 降噪值在纹身图的一个过程中一定是要填一的。好,那么我们今天的一个纹身图的啊讲解,包括我们那个纹身图加拉拉啊,以及我们深图原理的一个课程的话呢,我们就讲到这里了啊,视频用到的工作流插件模型 啊,也可以在评论区留言啊,老师都会一一分享给同学们的啊,好了,大家一定要关注我啊,老师下一期会带大家继续的去深入了解靠谱 ui 图深图的各种参数节点的含义,以及背后的一个原理啊,还有使用方法。 哈喽,各位同学们大家好呀,欢迎来到本期靠谱 ui 全系列教学视频的课程, 那么这节课的话呢,我会带领大家去学习一下我们图深图的深图原理以及工作的搭建。好,那么我们就正片开始啊,好,首先的话呢,我们要去来了解一下这一个纹身图 和图深图他的一个深图原理的一个差别啊,其实他们是很接近的啊,大家可以看一下右下角的老师给出来的这一幅图啊,如果我们不看 这块区域啊,那我们打开一个形状啊,我们假如用这个形状把这个给遮挡啊,假如给把这个给遮挡好,那么把这个遮挡之后呢,其实 我们不看这块区域啊,那么这个流程就是我们看不出来纹身视频的一个流程了啊,纹身图的一个流程,那么大家可以看一下啊,纹身图的流程是什么?我们输入一个 text 提示词啊,就是文本的提示词,然后经过 clip 文本编码器,对不对?那么 ai 它才能理解到我们的提示词对不对? 提示转化为 talk 之后呢,再通过我们的这一个,呃,在潜空间里面,对于我们这个大模型,对不对啊?生成成一个随机的图,那么这个图的话呢,不断的进行叠代之后呢,就会生成我们的一个接近于真实画面的一个 带有照点的一个图片啊,然后通过我们的一个 ve 的 一个解码,对不对?然后呢,就能生成我们的一个真实的一个图片啊,然后如果我们图生图是怎么样? 图生图我们是不是想法是什么?有一张参考的图片,你要根据我这一张参考的图啊,或者说输入给 ai 的 一个图啊, 来让 ai 知道啊,我是要基于这张图去生成的,对不对?那么这个时候呢,图片怎么输入给 ai? 其实就是图生图工作流里面最大的一个 问题了,对不对啊?怎么样输入给 ai 呢?那么我们可以先知道啊,怎么样从噪声图转化成我们的图, 对不对啊?就是通过这个 v e 啊,它解码对不对?那么 v e 它能不能帮助我们把我们的原来的图片啊,就是一张真实的一个图片,然后能转成招生图呢?因为 static 选的模型在浅空间里面只能识别招生图, 所以说我们需要把我们的图片啊,就真实的图片,不管你是什么图啊,只要你你能看得懂的图 啊,通过 ve 的 一个编码器啊,跟这个解码器不一样啊,编码器,然后呢把我们的图转成造声图, 对不对?然后这一张造声图就会替代我们纹身图之前学习到的那张随机的图啊,那么对于这一张图呢,进行不断的降噪啊,不断去叠代降噪,这样我们就完成了我们图生图的一个生图流程了啊,其实很简单, 就是纹身图,他是生成一张随机的造型图,然后去叠带,对不对?那么图腾图的话呢,就是不是随机的,是我们给他一张图,然后呢他转成造型图,然后对于那张 我们转成的造成图再进行一个降噪叠带,所以说就能够去形成我们的图生图的一个效果了啊,那么这个东西的话呢,其实就是我们刚刚说的图生图的一个生图原理啊,好,那么具体的一个降噪啊啊,或者说去噪的一个过程中是什么样的呢?其实大家可以看一下我们左边这样图, 那么首先我们图片输入进去肯定是从右边开始的啊,从右边开始的啊,就是说我们的图如果是一张照相图的话啊,我们纹身图 一张照相图对不对?那就是最右边那么不断的去叠带成清晰的图片,就是从右到左啊,那么这个照点越来越少,越来越少啊,慢慢的去消失啊,就会成为我们这样的狗狗。那么如果我们是图生图呢, 真图的话呢,就是先输入一张狗狗,对不对?那么输入这张狗狗之后呢,他就会在我们从左到右,先把它变成一个造型图,再从右到左变回来 啊,这个东西的话呢,从左到右,再从右到左,其实就是我们的一个图生图的一个流程啊,这个大家能看的明白,好,我们就进入下一个啊,那么我们的图生图的工作流怎么样去搭建呢 啊?其实很简单,我们先去来啊,导出导入一个纹身图的工作流程吧,大家看到没有,这个就是最基础的纹身图的流程,对不对啊?我们输入一个 one boy, 他 就给我们出来一个男孩,那么我们如果想要去把它变成图身图怎么办? 其实就是从我们的空垒腾这里入手嘛,因为在浅空间里面,这个空垒腾会帮助我们创建一个随机的马赛克,对不对 啊?这个时候呢,我们把它给删掉,或者说断开这个 laten 的 连线啊,不要让这个空 laten 是 连到我们的潜空间里面,对不对?不然的话它又生一个随机的好,这个时候我们点击一下拉出来,这里有一个 ve 的 一个编码器 啊,那么 ve 的 一个编码器的话呢,它其实就相当于可以让我们上传一个图片啊,加了一张图,对不对? 那么加载完这一张图之后呢,我们需要注意了哦,这一个 v e 的 一个连接啊,一定要连上去,不然的话呢,他 v e 进行编码的时候呢,是没有模型的 啊,没有模型的,所以说一定要有模型,不然的话他会报错。好,这个时候的话呢,我们再输入一个对应啊,比如说一个弯歌,因为我们的图是弯歌吗?啊?点击一下生成, 这个时候大家有没有发现,我们这个女生跟这个这个女生完全不一样啊,对不对啊?效果完全不一样啊,为什么呢? 其实这个就跟我们的降噪有关了啊,就是这一个值,那么我们现在降噪填的是一对不对啊?那么在图升图的一个过程中呢,降噪就是我们 k 产生器里面最重要的一个值 啊,他相当于 web ui 里面的重绘幅度,其实大家就可以理解成重绘幅度啊,他写的这一个降噪是属于我们深度原理的一个,嗯,概念啊,那么 这个如果是重绘幅度那么一的话呢,是不是最大的,那就相当于你是百分之百对我们这张画面进行重绘了,那么他肯定跟左边的这个图是不一样的,他是会去参考,或者说他只会根据你的大模型以及你出的提示词 啊,什么意思呢?就是你输一点零,他其实就相当于纹身图啊,因为你完完全就跟你这个没有任何关系了,所以说如果我们想让这个画面生成出来,这个画面比较接近于我们的原图的话呢,你一定是要降低我们的降噪值的 啊,比如说零点五,对不对啊?我们降到一半这个时候呢,你就会发现这个图啊,他是会比较接近于左边这张图的,对不对啊?零点五就比较接近了,那么如果我们再调低呢啊,想让他无限的接近,我只想让他去刷一遍图,那么零点一其实都 ok, 对不对啊?零点一都是可以的啊,零点一之后呢,你就会发现这张画面基本上是没有什么太大的一个变化啊,除了这个人物细微的表情会有点变化,是不是啊?这个的话呢,就是我们图声图它的一个作用了,那么图声图它主要是用来干嘛的呢?其实我们用到最多的是什么? 就是我们的图片的转会啊,转风格嘛,啊,我真实的一个女生啊,转成一个动漫的女生啊,对不对? 动漫的一个男生,转成真实的一个男生啊,就是转会啊,我们就叫他转会不同的风格的进行的一个转换好,那么转会的话呢,怎么样去操作呢?其实很简单啊,老是拿一个,比如说我们拿这个女生,对不对啊?一个真人的一个小姐姐啊,那么我如果想把它转成一个 动漫的一个效果怎么办呢?首先其实最重要的就是把我们的一个大模型,你就换什么风格吗? 对不对啊?或者说你自己去添加一个 loa 加气啊?上一节课的话呢,我们已经讲过了,对不对?如果大家有兴趣听我们上一节课纹身图的一个原理的话呢,记得一定要关注我们的一个账号啊,然后呢,这样的话呢,大家就可以学习到整一套的康复 u i 课程了啊,然后 如果大家已经填好这一个啊,我们的大模型之后的话呢,就是我们的提示词了啊,那么提示词的话呢,你首先有两个方法啊,两个方法,一个是反推 啊,反推,怎么反推呢?其实很简单啊,我们双击空白区域啊,鼠标左键双击啊, w d 啊,一四反推标烟器,如果用过外部 y 反推的同学应该是知道这一个节点的啊,然后我们拉一个展示文本出来啊,也可以把这个展示文本直接连到我们的这个 文本编码器的这里啊,你这样的话呢,他输入出来的这个文本他就会直接变成我们的一个正面提示了啊,大家能明白这个意思吧?好,那么我们这个时候的话呢,最好就是不要接啊,不要接啊,我们把它转换为主键, 我们先把它的这个提示词给它进行一个反推出来,出来之后呢我们再去添加我们自己需要的,比如说加一些动漫的一个提示词,对不对啊?我们点击一下生成啊,先让它反推 好,返回出来之后呢,它是不是已经在跑我们的一个流程了啊?我们先不管它对不对啊?我们先不管它,我们先把这个提示词给它去复制啊,然后呢就粘贴一下啊,到我们的翻译的一个场景啊,我们转成中文对不对?它这里的提示词你就会发现它这里有什么现实主义啊 啊,或者说其他一些提示词,你你不需要,对不对?我们是要动漫的一个风格,所以说我们这个时候呢一定要改一下我们的提示词,比如说动漫风格对不对?二次 二次元效果是吧?然后呢再加一些高质量画面啊,或者说再加一个四 k 啊这种我们补充一下提示词,让提示词写的更好,是不是啊?这样的话呢,我们画面也会更好, 那么这个时候呢,我们把我们的题词给它去复制上去,然后我们就不需要这个反推了,不需要的话呢,我们可以把它删掉啊,你去按住 ctrl 键,然后选择这两个节点之后呢按 delete 啊,或者说呢啊宽选它之后呢按住 ctrl 加 b 啊,那么就可以把它给隐藏了啊,隐藏不是删除的意思啊,那么这个时候呢,我们提字词也写好了,对不对?我们点击一下生成, 我们会发现这一个画面啊,好像没有什么太大的变化啊,他没有太动漫化对不对啊?只是感觉脸型有点变化,也就是因为我们的降噪不够嘛,啊?重绘的一个值不够,那我们就调高一点零点五啊,点击一下生成 这个时候你就会发现零点五的一个效果,他就已经我觉得还是不错的,对不对啊?你看这个女生,他已经转成动画化了,但是呢他整一个画面也没有太大的一个变化,是不是啊?这样的话呢效果就是比较好了。好,那么如果我们想让他再动画化一点的,那就可以继续调高,比如说零点六 对不对?一点六啊,零点六的一个效果的话呢,我觉得也还是不错的,只不过他可能重回幅度大了之后啊,他就会更加的 啊,在画面里面添加一些我们原本没有的一个内容,比如说右上角他出现了一个窗帘,对不对啊?现在的话没有啊,那么如果我们再继续调高呢 啊?零点八呢,我们可以看一下他的效果啊,零点八的话呢,大家可以从预览图啊现在生成出来的一个图片可以看到啊,基本上他就跟左边这个图啊,差距有点大了啊,但是呢他会跟我们的一个提示词越来越接近 啊,提示词越来越接近,你调到一的话呢,就基本上是个纹身图了,明白吗?啊?为什么他还是坐在船上?因为我们提示词肯定是写了什么坐在船上,因为我们是通过这个反推出来的,对不对?所以说 具体你要达到什么样的一个效果啊?你想让他像一点原图,那么你就调低啊,那么就调低,比如说零点五,对不对?如果你想让他去,呃,没有那么像,只是参考一点点,那么就调高,是不是啊?但是你的题字词一定要写精准 啊,那么就这个意思好,那么我们这个工作流就已经给大家去讲完了啊,那么回到 ppt 给大家去再说一下啊,就是说 我们的一个降噪值 k 传感器里面的这个降噪值越高啊,画面是不越不接近原图的啊,然后呢,我们的降噪值越低,是越接近原图的提示词的影响,它就会越来越小 啊,因为你重会幅度就根本就没那么大吧,画面你都跟改变不了多少,你怎么去?呃,影响就提示词的影响呢,对不对啊?那么你只有在降噪值高的时候,也就是重会幅度高的时候呢,你这个画面改变的幅度才大 啊,你这个幅度改变大,你的这个画面才能去接近提示词啊,你提示词才能生效啊,那么这个的话呢,就是我们图升图的一个 啊,需要注意的一个点啊,其实最重要的就是这个降噪好吗?啊,然后今天这节课的话呢,我们就讲到这里,视频中使用到的这一个工作流啊,包括我们的一个模型插件啊,都 可以在评论区留言啊,我会一一分享给大家。好了,关注我下一期带同学们继续从零到一,搭建我们的高清放大和细节修复的工作流啦!

这可能是抖音最好的康复 u i 教程,存下吧,很难找齐的警告!本视频耗时四个月制作,共一百七十八集,从零开始系统学习康复 u i 制作视频, 这应该是目前最详细的 ai 视频教程了,哪怕你是零基础,也能轻松给你学会。所有在教学过程中用到的指令, 我都给大家整理完毕。七七七常常闲待本套课程共分为两个部分,一到六节为基础部分,其中包含了康复以外的配置要求以及如何安装与部署、界面导览与原理介绍、文声图以及提示词的语法,之后还会聊聊 a i g c 的 相关网站 及模型下载,最后还有图生图以及高清修复的过程。那么从第七节课到第十三节课属于进阶部分,先后会讲解 control 内及其诸多预处理器的使用方法以及使用场景,之后还会教大家 ipad 及其强大功能的应用。随后我们还会学习最基础的 ai 视频生成原理,而在最后,我们将结合前面所学的全部知识, 一起来做一个 ai 视频换脸转会。这些这些,这些都是 ai 生成的。自二零二三年以来, ai 绘图软件 steve diffusion 的 发展势不可挡,各种各样的衍生模型插件百花齐放, 现如今生成像这样的 ai 视频完全不在话下。那么我们就一起跟随着时代的脚步,一起探寻 steve diffusion 的 comfui 到底该如何使用吧。大家所熟知的 webui 和 comfui 其实都是属于 steve diffusion 和 webui, 主要是基于数据库开发的浏览器界面, kufui 则是使用图形节点、流程图设计而用于稳定扩散的用户界面。这边我们将 kufui 和 webui 的 优缺点列出来,方便大家做个对比。首先我们来看 webui 这块,它的优点是简单易学,并且操作较为基础与简易。 它的缺点是不利于长期管理。那么这是什么意思呢?当你在深度学习完 web ui 的 高阶内容后,你会意识到如果使用的是康复 ui, 那 么将节省两到三倍甚至更多的时间。其次,在插件过多时, web ui 会显得非常的臃肿 以及操作费时。那么接下来我们看一下 comfui。 这边我们可以看到 comfui 对 配置的要求较低,这同时也意味着降低了 ai 绘画的门槛,方便更多的小伙伴加入进来。那么它的优点其实是节点更易于管理,有较强的自主性。我们可以根据个人需求来组装属于自己的工作流。并 且在未来, comfui 将逐渐与 webui 在 应用层面拉开距离。比如前段时间的 s、 d 三,或者国产最新的颗粒大模型, 都是第一时间在 comui 里可搭建工作流并使用的。而对于 webui, 这些最新的模型与插件往往得过一阵子才能时装,甚至直接不时装。所以使用 comui 也意味着你能够更早地使用到最新的模型与插件。 而 comui 的 缺点是初期不好上手,但我相信在你学完了本套课程后,一定能够完全掌握 comui 的 基础操作。除此之外,过去我们知道有许多软件,比如 blender、 达芬奇、 ue 等等都是使用节点式工作流, 因为他们有极强的自主性与可模块化。许多头部公司的顶级团队使用的都是节点式软件,那么 comf 以外,除了上述优点之外,我们在使用时还可以非常方便的套用他人分享的工作流,即刻便可实现相同的效果,节省了非常多的节点部署思路的思考时间 及从单个节点构建成工作流的部署时间。哈喽,各位小伙伴大家好,欢迎来到康复 ui 系列教程的第二节课,那么在本节课中,我们将介绍康复 ui 的 配置要求以及安装与部署的过程。那么首先是电脑配置以及系统环境的介绍。首先是显卡方面, 最低要求是拥有四 g 级以上显存的英伟达显卡,如果显存不足,可能会影响到绘图过程的流畅度。接下来是 cpu, 关于 cpu 要求不高,英特尔十代 i 三以上就可以使用,但推荐使用性能更强的,如英特尔十三代 i 五幺三六零零 kf, 以获得更好的性能。接下来是内存,内存至少需要十六 gb, 推荐三十二 gb 以上,以确保可以加载和运行较大的模型。最后是硬盘,关于硬盘呢,至少需要两百 g 的 空余空间,推荐使用大容量的固态硬盘,因为 ai 绘图过程中会下载和生成大量的模型以及图像数据。那么接下来我们详细介绍一下 cf ui 的 下载以及部署方式。 我们先安装资源包里面附带的启动器运行依赖,接着打开解压之后的 comfort ui 文件夹,在文件夹内找到 a 会式启动器,随后点击一键启动即可。首次启动时可能会安装一些必要的环境依赖, 稍等片刻后,我们便来到了 comfort ui 的 主界面。接下来介绍第二种安装方法,官网资源包的安装。当然关于官网的资源包我们也可以在评论区内获取。我们解压完资源包后,在文件夹内找到这个项目, 双击运行。等待片刻后,我们便可以来到最原汁原味的 kufui 界面了。这个版本的 kufui 是 没有装任何非官网的插件的。 此外, kufui 完全离线工作,对 gpu 的 要求相对较低,但是也有 cpu 模式,不过在 cpu 模式下绘图速度较为缓慢。如果小伙伴们之前有使用过 webui 或其他类型的 step defusion ai 绘图应用,那么可以通过修改 kufui 的 配置文件来实现在 不同的 ai 绘图应用间共享大模型以及 loa 等等,以此减少对硬盘内存的占用。那么接下来我将向大家演示一下如何将我们的 comui 大 模型以及 loa 的 加载路径修改成 webui 的。 如果小伙伴们没有玩过 webui, 那 么这一段可以直接跳过。好的,那么我们打开 comui, 接着我们找到这个文件, extra model pass yaml 点 example。 接着我们用记事本打开。好的,那么打开之后我们找到这一项 base pass。 我们要做的是把 bash 后面的这一串改成我们 web ui 文件夹的路径。比方说我们打开了 web ui 的 文件夹后,我们可以单机上面的这个栏目,随后 ctrl c 复制。接着我们回到刚才的记事本内,将我们刚刚复制的路径粘贴到此处,随后我们保存并关闭记事本。接下来的一步很重要, 我们需要将 example 以及这个点给删除,也就是将我们的文件名后缀改成点 y a m l, 随后点击确定即可。那么接下来我们打开 comui 来确认一下。 好的,我们这边看一下 checkpoint 加载器里面的大模型,点开后我们可以看到多了,非常多啊,那么这就证明我们成功把模型路径合并到了 ruby ui 内。好的,那么以上就是关于本期的全部内容了, 欢迎来到康复 ui 系列教程的第三节,那么在本节课中我们将一起了解康复 ui 的 主界面以及各种参数到底代表了什么。最后我们将学习 stable fusion 生成图片的根本原理。好的,我们打开了奇瑞大佬的会事启动器后,点击一键启动, 经过一段时间的等待后,我们便来到了 cf ui 的 主界面。那么我们在面对 cf ui 这个完全陌生的软件时,我们要做的就是初步了解每一个模块的大体含义,那么接下来我带着大家过一遍。首先是操作方式,我们可以通过鼠标的滚轮来控制画面的缩放, 按住鼠标左键,我们可以拖动我们的仕图。点击鼠标右键,我们可以看到有非常多的栏目,这边我们可以试着点击新建节点,随后我们可以看到有非常多的节点可以供我们选择。好的,那么之后我们再来说一下快捷键,生成图片的快捷键是 ctrl 加 enter 框选节点的快捷键是按住 ctrl 加鼠标的左键。移动框选目标的快捷键是按住 shift 加鼠标的左键。 这边我们在框选完后,如果不按住 shift 直接进行拖动的话,我们可以看到此时只有单一节点进行了移动,剩下的快捷键我都放在这了,小伙伴们可以暂停观看。 好的,那么接下来我带着大家一起来解读一下这个默认工作流。首先在这边我们可以看到有个叫 check point 加载器的东西,这个节点的主要作用是加载扩散模型, 也就是我们常说的大模型。此外,该节点还提供适当的 v、 i、 e 以及 clip 模型,具体它们是什么我们带回讲。我们顺着去控制加载器的节点连线,可以看到这里有两个 clip 文本编码器,在这里我们可以看到它们的输入都是 clip, 而它们的输出都是条件。那么究竟什么是 clip 模型呢? clip 全称为 contrasted language image pre training, 是 由 open ai 公司在二零二一年发布的一款多模态与训练神经网络模型。 clip 模型的作用是理解我们输入文字的意思,比如我们输入 one go 生成的是一个女孩,而不是太阳, 这就是 clip 的 作用。接着我们顺着 clip 文本编码器的条件输出看过来,连接到了 clip 源器上。这边我们可以看到 clip 源器一共有两个关于条件的输入,一个是正面条件, 另一个是负面条件。那么这代表着连接着正面条件的文本编码器内的提示词为正面条件提示词,也就是我们常说的正向提示词。同理,下面的则为负面条件提示词,也就是我们常说的负面提示词。好的,我们把目光重新回到 get 函数器内, 我们可以看到除了正面条件以及负面条件外,还有两个输出,分别是模型以及 layer。 那 么模型则是连接着刚才的 checkpoint 加载器,也就是我们的大模型。那么这个 layer 究竟是什么意思呢? later 通常是指前空间,可以理解为 stability fusion 内部流程中的图像格式。如果将图像作为输入,则需要通过 v a e 编码将其转化为 later 数据 在最后输出时,也需要通过 v a e 解码将其转化为像素空间,也就是我们最终看到的图像。这边我们可以看到 k 太阳器的 later 连接着一个叫做 comlater 的 节点,这个节点内共有三个参数, 分别是宽度、高度以及 p 四大小。宽度和高度决定了我们最终生成图像的尺寸,而 p 四大小则代表着每生成一次将出多少张图。比如说我们将 p 四大小改为三,高度改成七百六十八。 最后我们按 ctrl 加 enter 进行生成。好的这边我们可以看到一次性生成了三张图像,也就是我们 p 四树目的图像。接下来我们继续看 k 太阳器的其他参数。 首先是随机种,随机种的值我们一般称为种子值,每张图都有专属于它的种子值,我们也可以理解为种子值,就是图片的 id 号码。接下来是运行后操作,点开后我们可以看到拥有四个选项,分别是固定、增加、减少以及随机。如果选择固定,则在你生成完后,种子值会保持不变, 方便你进行其他的调整与操作。那么接下来就是裁量步数,裁量步数越多,计算机的运算时间越长,在大多数的情况下,我们的裁量步数保持二十到三十步即可。接下来是 c f 锯值,该值的意思是提示词引导系数。 c f 锯值越高,则代表着生成图像与提示词之间的联系越紧密。 c f 锯值越低,则代表着提示词对生成结果的影响越小。不过过高或过低的 c f 锯值都会给图片带来不好的影响, 所以我们一般保持适中的 c f 居中即可。接下来是采暖器和调度器,我们可以理解它们为图像的生成方式,如果我们将其他参数比作是食材, 那么它们则是烹饪方式。不同的烹饪方法当然会带来不一样的结果。比如我们点开采暖器后,可以看到有非常多的选项,这里我们目前最好的一般是选择这个 d 片加加二 a m 或者 d 片加加二 a m s d e, 这两个都是挺不错的。接下来点开调度器,我们也是可以看到有非常多的选项,这里我们一般选择的是 carrots。 最后我们可以看到还有个降噪参数,由于该参数是跟图生图有关的,我们以后再说。接下来我们看一下右边有个叫做 v i e 解码的东西,那么我们可以看到这边有两个输入,分别是 laten 以及 v i e。 至于 laten, 刚才我们已经解释过了,也就是前空间图像。那么 v i e 究竟是什么呢? v i e 全称变分字编码器 variation auto encode 的 缩写,它是一种深度学习模型,主要用于无监督学习任务,特别是在生成模型领域。 eve 结合了神经网络和概率图模型的特点,而它在康复以外的作用是将我们的前空间图像编码成像素空间图像,或是将像素空间图像编码成前空间图像。除此之外,我们还可以双击屏幕上的空白处,最后就可以搜索节点,比如说搜索加载图像, 或者我们也可以双击搜索预览图像。这边再多说一嘴, ve 解码之后的图像节点,我们也可以直接连接到预览图像上, 比如说我们现在把这个保存图像节点给删去,如果这么操作的话,那么我们生成的图像不会被保存,接着我们再生成一次。 这边还要注意的一点是,在我们搜索节点的时候,我们也可以输入英文,比如说加载图像的话,那么就是 load image, 那 么我们可以看到这两个节点是完全相同的。接着我们再说一下,比如说当我们输入英文的时候,同样 上的也是 load image, 但是这个时候我们加了一个空格,好,我们可以看到这里面并没有出现加载图像的节点,那么这也意味着在我们搜索节点的时候,我们要注意区分节点的名称是否有空格好,比如说我们需要搜索加载图像节点,那么我们删去 load image 之间的空格之后,我们可以看到,哎, 是不是加载头像节点就出现了?好的,那么以上就是关于默认工作流的全部解释,接下来我们来看下界面还有其他哪些模块。首先我们点击左上角,这里有个文件夹, 点开后我们可以看到我们的工作流都保存在这,这边可以点击新建,那么我们就新建了一个新的工作流,当然我们也可以点击这个 import, 也就是输入我们的工作流,或者说是输入我们的文件夹。 最后我们点击 models, 我 们可以在这里找到并且下载相关的模型。接着我们来看一下右边的栏目,首先是该栏目的左上角,我们按住后可以进行拖动, 然后是这个齿轮标志,点开后我们便来到了康复以外的设置界面,在这里我们可以设置语言,点开后我们可以看到有中文,繁体中文,英语以及日语韩语等等。我们往上翻可以看到有其他的功能,比如图像面板顺序,图像面板的位置等等等等。 我们往下看,这有个文本补全,这个 enable 我 们一定要勾选上,这代表着它的起用。文本补全的意思就是在我们输入提示词的时候,会有这些英文短语的提示, 我们往下看有个添加提示词对联,这个是生成的意思。接下来我们可以看到有个保存的选项,点击该按钮我们便可以保存当前的工作流以及加载,那么就是加载工作流,同样的意思。接着是重刷新,比如说我们下载一个新的大模型之后,那么我们点击重刷新便可使用。接下来还有个重点,就是管理器, 个是 com 浏览器里面最重要的节点,点开后我们可以看到非常多的功能,比如说这边有数据库以及频道方式,预览方法,表情等等等等。这边预览方法我们一般选择的是这个 eight, two r, g b, 然后表情这一栏我们一般选择的是名称, 也就是标签名称选择了之后,我们可以看到节点的右上方一般会出现一个小狐狸按钮,而小狐狸按钮则代表的是它是官方节点。比如说我们加载一个新节点, 那么我们可以看到该节点是属于 animate develop 节点组的。接着我们回到管理器这六个 custom node manager, 点开后,我们可以看到有非常多的节点,在这里我们可以查找以及安装我们想要的任意一个节点。在今后的学习过程中,我们会频繁使用到这一个模块。 接着我们看到 model manager, 在 这里我们可以安装我们想要的任意一个模型,注意模型不是节点,他们是分开来的。至于该模块,我们今后也会频繁的用到。好的,在介绍完 comf 以外的主界面以及各种参数后,我们来了解一下 stpd 滤镜的内在运行原理,就可以方便我们理解并掌握进一步的学习内容。 在我们输入完体数词之后,文本编码器的 clip 模型会将体数词转化为特征向量,然后再由 v a e 编码器将这些特征向量 传输到前空间内,这些特征向量在前空间内不断地降噪,最后再由 v a e 解码器将这些经过降噪之后的特征向量解码成由一个个像素所组成的图片。好的,那么以上就是本期的全部内容了。

这一期带来的详情页题材是精华液,那我们先来看一下这一个呢,就是今天的一个产品,然后呢这边是它对应的一些需求以及文案,这个东西我们可以直接发送给 giftseek, 然后呢将这一段关键词直接复制给他,就是告诉他我要用极梦 ai 来生成一份详情页, 然后呢让他去给我写关键词。这边产品外观这个描述我们可以怎么来呢?就是打开豆包再给他发一段这样的文字,就是让他去给我们概括一下产品的外观设计。 好, ok, 那 这个就是他所去概括的,我们可以 ctrl c 复制一下,这边我直接替换一下吧,但是豆包他所生成的这一个呢,也会有一定的随机性,所以的话这个也要看啊,这个我们可以把成品名给它弄出来啊,它的成品名是那一,嗯,精华液。好, ok, 这个时候我们生成一下, 好, ok, 我 们可以看一下他有时候可能只输出两瓶啊,这边我们可以让他写完哈,好,这边我们就先把这两瓶拷贝一下吧, ctrl 加 c, 那 我们可以拿一个记事本过来, ctrl 加 v, 先把这两瓶复制过来先,然后呢在上面这里我们可以先告诉他这是一个详细页的设计, ctrl c, ctrl v 一下啊,然后呢再把我们的产品外观也告诉他一下,那其实下面如果说啊描述这里有这个产品外观了,我们也其实也可以不去写他了, 就是看一下对应的画面描述吧。好, ok, 如果觉得没什么太大的问题呢,我们就可以直接 ctrl 加 c, 然后呢打开极梦 ai, 这边我们 ctrl 加 v, 这边模型的话选择三点一的模型比例,这里呢选择标签一 k, 然后这个锁头可以把它解锁一下,我们给一个五幺二乘二零幺六的一个大小, 然后点击生成。好, ok, 我 们可以看一下大概的一个感觉啊,这个色调其实跟我们产品的色调有点不是很像啊,那我们也可以试一下,把这一个产品 描述,产品外观给他复制过来看一下效果吧,再来生成一下,也可以多刷新几个看一下效果啊,像这种详情页的话,可能我们需要多刷一点才能得到想要的效果。 ok, 我 们可以来看一下这个色调,我觉得还可以啊,然后产品的话跟我本身产品也相对来说像一点,标题这块可能还要修改一下,像这种有逗号的呀,我们都给他给个空格,这样的话他就会自动给我们换行,会相对来说好看一点啊。 ok, 我 刷了几个啊,相对来说我觉得这个还可以啊,所以往下面去做。那接下来呢,我们就用同样的方法把这边替换一下,把第一瓶,第二瓶替换一下,然后呢给他一个整体的色调,就可以去生成别的了。 好,我们这里直接第三屏第四屏给它复制过来啊, ctrl c, 然后呢 ctrl v 这边给一个整体色调,深绿色和白色线格。 好, ok, 我 们可以来深层看一下效果吧,我们来看一下我深层的一些效果吧,这个的话呢,对应的是第三屏,我们可以来看一看对应的一些文案啊。 第三瓶的话呢,他的一个文案是这样子的,有机修复一点机密,那这个的话也是能对上的,包括下面的画面描述啊,可以看一下,就是围绕三个简约的图标,他这里放在下面呢,我觉得这个排版也是 ok 的, 再来往下面看的话,动态低落的精华液,这个也是 ok 的。 好,第四瓶的话呢,就也主标题,这都没有问题, 但是这里的话呢,一样的,就是我要把这一个逗号给它改一下,没有改啊,大家可以自己去改一下,或者说我们自己把它变成上下排版。我所以是 ok 的 啊,直接把这个去掉,就不要它就可以了,然后再往下面走呢,这个也是能完全对上的,但这个产品不对产品的话,我们也可以自己把它换掉嘛,所以我觉得这个是没问题的。 好, ok, 再往下面走的话呢,是这一瓶,这一瓶的话也基本上能对上啊,我就不一一给大家去看了。好,最后的话呢,就是这一个 ok, 这就是他给我们生成的一些参考啊,那接下来我们来讲一下动图是怎么制作的吧,这边我们可以选择第一瓶啊,直接把它下载下来, ok, 下载一下啊,下载之后呢,我们直接用 ps 打开这一个图片,然后呢用裁剪工具给它裁剪一下, 确定确定之后,用这一个移除笔啊,把上面这一个给它移除一下吧,然后呢我们把这个产品图也要给它消掉一下,就是要把它换上自己的一个产品,先给它移消除。 ok, 再把自己的产品给它丢过来,抠下图。嗯,好, ctrl 加勾拷贝层放到这里来,这一块再给它移除一下吧。 好, ctrl shift, alt 加 s 保存一下,然后呢我们打开这一个在线溶图的工作流,把刚刚保存的这个产品传上来,传上来之后给它开始升图,让它自动给我们做一个融合。 好, ok, 我 们可以看一下效果啊,这样的话它就给我们做了一个产品的融合啊,我们把它右键保存一下, 保存之后呢,我们再来打开极梦 ai 来去做动画,动画的话这边我们可以把这个产品上传上来啊, 传上来之后呢就给它这样一个关键词,因为我刚已经试过了啊,就是加入一个小松鼠,然后一个小松鼠让它露出个脑袋来,大概是这个意思啊,我们可以看一下效果啊。

这是一张模特照片,这是一张电商产品图,我想要把这套服装穿在这个模特身上,应该怎么做呢?今天三十秒教会大家, 首先打开我们花两个小时搭建的工作流,把工作流拖入到工作台。把工作流拖入到工作台之后,大家会发现有图一、图二这两个功能,在图一位置上传模特图,在图二位置上传服装图。第三步,在提示词内输入我给大家准备的提示词。 第四步,点击运行,无论你是服装厂家还是个人卖家,工作流一键可以让模特穿上你的产品图。话不多说,我们直接看效果。 相关的模型已经给大家整理好了,只要有台电脑,你也能轻松上手。