有一个二十四小时帮你办事的 ai 助手 openclock, 还有一个最强的开源模型调用工具 comui, 两者结合就能这样你通过手机发送需求, 然后 ai 在 你自己的电脑上自动加载模型,完成图片、视频、音频的生成,并最终将成品发送给你。 那就可以把 aigc 做到完全私有,本地部署,并且免费不限量。本期视频演示的就是真正意义上可落地的数字员工和数字生产力。 openclaw 和 comui 的 联动就是给极致的大脑装上了最强的开源模型,从会说变成会干活。它可以根据要求自动生成图片、克隆声音、合成数字人口、播跑首尾帧视频, 还能批量执行工作流,把原本需要坐在电脑前一步步点击的操作,变成你随时随地发消息就能完成的自动化流程,这就是最有价值的实战方向。那么本期内容我就会带你从实际演示出发, 看这套联动到底能做到什么程度,又能怎样接入你真正的生产流程。接下来的很长一段时间,我将会陆续开始在星球更新 openclock 教程以及最新的 comui 教程。 想要从零开始系统入门并逐步进阶提升的小伙伴,欢迎加入小黄瓜的知识星球。 open call 和 complain 联系起来之后,它的过程是非常稳定的, 就是它能稳定调用我们使用到的那些工作流,而且它可以稳定的去设置相应的一个参数,能够正常的按照我们的要求去完成图片或者视频的生成,然后以及音频、数字人,这些都是可以的啊, 可以看到我们这后台呢,已经在运行了,我们的硬件呢,现在可以看到已经开始有活动了哈,内存在逐渐的上升,就是在加载对应的模型, 然后图片生成,我给他配置的是用的 z image turbo 的 模型哈,所以说内存现在在上涨的阶段,说明模型正在往内存里面加载, 加载完毕之后呢,我们的 gpu 就 开始运行,也就是开始完成我们正常的图片生成。生成完毕之后呢,这个 openclaw 就 会通过飞书把消息给我们发送过来啊啊,可以看到这里已经生成了,也就是这个生成的过程是他自己做的, 然后生成完之后呢,他就会把这张图片发送给我们,然后包括人物的着装姿势,配饰背景,然后包括姿势形象,这些全都是他自己给我设计的啊, 可以看到这里已经生成了,那等待他把消息发送给我哈,可以看现在已经给我生成了,在飞书里发送给我了,这就是他给我生成的一个男生哈,然后我们把控制台打开哈,把 com 约的后台打开,能够看到他运行的过程哈, 然后显存呢,就是我们的性能占用还放在这边,我建议你能时刻的观看自己的硬件占用状态,了解模型现在运行到什么样的过程,然后这里给我们生成了,我们就可以让他再给我们生成一段音频啊,用小黄瓜的声音生成一段音频,小黄瓜。再说 这里是广州市中心,大家向后就能看到广州塔,欢迎大家来广州游玩,然后说天气比较热,建议多往室内有空调的地方去。 好吧,就这样,那么这两句话大概也就是四五秒的时间吧,然后我们发送一下,现在呢,我们是让他用本地的 com 给我们生成音频,然后等待他把音频给我们生成完, 生成完之后呢,我们让这个男生用我的音频再生成一段视频,也就是数字人哈,可以看到这里,我们的音频已经生成了,我们来听一下啊, 这里是广州市中心,大家向后就能看到广州塔,欢迎大家来广州游玩,天气比较热,建议多往市内有空调的地方去, 可以吧,这个声音没问题吧,跟我的声音是一致的啊,我们再听一遍。这里是广州市中心,大家向后就能看到广州塔,欢迎大家来广州游玩,天气比较热,建议多往市内有空调的地方去。好的,这个音频也没有问题啊, 我们说用刚才生成的这个男生形象,根据小黄瓜的声音做一个数字人的视频,视频时常控制在十秒钟吧,每秒二十四 fps 吧,然后视频分辨率呢 为一二八零乘以七二零吧,好吧,就这样。然后呢,他现在就开始给我们做一个数字人的视频啊,这里面我给他配置了七个工作流, 这就是我给他配的,所以说大家如果要用的话,你想给他配什么就配什么,我这里配了一个首尾,真的配了一个数字人的,配了一个声音设计的,还有一个声音克隆的,就是让他可以用我的声音去生成音频,声音设计的话就是他可以自己设计声音去生成音频, 然后还有 ltx 二点三的图声视频的,然后以及一个图片编辑和一个纹身图的,就文本到图片生成的那纹身图的模型,你配置完之后,你就可以让他给你做一些,比如说封面设计,然后 其他的内容哈,可以在上面看一下。我有做封面设计啊,你就像这个,在最开始你跟他交流的时候,比如说我这里说给我设计一个视频封面,关于 openclaw 和 compui 的, 然后想把它做成我的封面,然后是十六比九,主要是国内人看,所以说我们的封面标题呢要用中文,然后这是他给我设计出来的第一版封面啊,很明显这是不醒的,对吧?然后呢就给他做了一些个额外的干扰,我说要有标题, 然后呢标题写的清晰一点,有设计感。然后这是他给我的第二版封面,这个也不行,然后我说文字都粘到一起了,要有排版,然后这是他给我的第三版,这版其实还行,但是受限于大模型,也就是我本地部署的这个图片生成模型的能力, 所以他后面的很多文字呢是毁掉的,然后呢就给他说封面文字有误,然后让他重新修改,然后这是他又修改完的一版,看起来还行哈,然后呢我就给了他一张图片参考,我说你把这张图片给我复现出来,当然了 这个生成图片的能力取决于你部署的那个模型,就像我给它配的是 z image turbo, 所以 说这个能力并不是因为 openclock 不好,或者说因为 comfui 不好,只是因为这个模型我们目前用的不好,但是呢模型它是会进步的, 对吧?你像最开始我们用 sd 一 点五叉 l 的 时候,那个时候生成的图片质量是很差的,但是呢,随着模型的进步, comfui 甚至可以什么都不做,就只是适配一下这个模型,它的功能呢就会提升, 因为 comui 的 能力不取决于 comui, 它取决于模型。然后这是他给我的第三版哈,也就是参考刚才的图片生成的,然后发现文字都毁到一起了,然后又让他给我改, 最后生成了这个,所以说限阶段,如果你想用可以,但是他并不会到非常智能的程度。我这里接的是拆的 gpt 的 五点三的模型,所以说能力还是很强的。这里视频生成了,我们看一下哈。这里是广州市中心,大家向后就能看到广州塔,欢迎大家来广州游玩。天气比较热,建议多往室内有空调的地方去, 后面因为音频没了,所以说就没声音了。在这里是广州市中心,大家向后就能看到广州塔,欢迎大家来广州游玩。天气比较热,建议多往室内有空调的地方去,可以看到它调用的是我本地的,而且我们的显存呢,确实刚才有在运行啊,然后内存的占用现在还在这一百多 g, 这是演示的一个小功能啊,还有我们的首尾针什么的都可以。 之前的话,我们是需要在 cfui 里面跑工作流的,对吧?现在跟 openclaw 配属完之后呢,我们可以你拿着手机,任何时间,任何地点,你只要给它发送消息,它就可以给你制作。主要是这样的一个过程,而且呢,它可以有自己的设计,比如提示词当中可以让大模型自己写,也就是让 openclaw 接的这个大模型自己写,不用我们写,你 甚至可以让它批量的生成图片。以前如果说你在 cfui 要批量生成图片,是需要自己搭建一些工作流的,对吧?比如说设置种子值自增, 然后让他一个一个的生成。现在我们可以直接让他生成哈,比如我们这里给他说让他生成二十张真实男青年的照片,然后人物配饰、长相、背景,让他自己设计分辨率,在这里写一下。比如说我在一盘哈, 给他重新创建一个文件夹,叫做男生,然后粘贴到这里,然后二十张图片放到这个文件夹,然后名字从零一开始到二零结束。好吧,那这个时候呢?我们就等他给我们生成就行了。 你像以前我们还需要去处理工作流,对吧?然后自己或者说一张一张生成,但现在我们不需要了,批量给我生成了二十张,大家可以在这里看到哈,我们来看看这些图片哈, 怎么都是这种呢?他是他生成的是这种合集,好吧,他生成的是这种合集,我再给他说一下算了,我说把刚才的二十张图片删了, 我要一张图片只有一个人物的,就这样让他再给我做一下哈,可以看这里,我们二十张图片已经生成完了哈,大家可以大概看一下二十张这些还像同一个人啊,对吧? 他是给我们生成了五次啊,这是第一批,第一批当中像是同一个人,第三批像是同一个人,对吧?可以看一下,还挺帅的,对吧? 我们让他这样用第五张和第八张图片,把这路径复制一下, 给我们生成一个视频啊,生成一个五秒的吧,五秒的首尾帧视频,让他用一二八零乘以七二零的分辨率,每秒二十四帧吧,然后让他给我们生成一个首尾帧视频啊,看一下视频啊,这是我们做的首尾帧视频,六秒, 好吧,这个质量还是可以的,这个质量取决于 ltx 二点三,也就是我们给康复 ui 配的这个模型的能力。好吧,这点大家能理解,我们让他给我们做个海报吧,但是海报的话,我们可能需要让模型有一些提示词哈, 或者说写一些比较详细的提示词,我们去搜一个海报的案例的这张吧,这张好看,我们让他说给我设计一个罐装可乐的海报,可以参考这个提示词,文字内容你自己考虑加什么分辨率,我们要个一零二四乘以一五三六的,就这样 我们试一下哈,让他给我们设计一个海报哈,然后给他提供了一些参考提示词,如果直接用这个提示词生成,你生成的就是这样的内容。但是呢,我很明显不对啊,因为我们要做一个可乐的海报嘛, 所以说你自己要去想这上面的字我们改成什么,这两个字改成什么,哪些字要改,哪些字不能改的,现在我们交给大圆模型,让他去想,我们就不想了,不动脑袋了。这他给我们设计的海报哈, 并没有出现可乐哈,但是文字、排版这些都没有问题,画面的质量也没问题,这个质量呢,是因为 the image turbo 的 质量比较好哈,所以说这个呢,不行,我说再给他说一下, 就说图片里要出现可乐,这是一个产品海报这样的这一个产品海报对吧?看起来还不错,但是我们可以让他加一些英文文字,设计一个标题,大字标题, 白色文字啊,手写体最好,然后文字内容为 c o o l, 就 这样,然后放在图片的最上面,我猜测它可能会用到编辑模型的,因为这张图片的话是用 z 生成的嘛。 这里你看它已经在思考了,并没有直接生成,所以说它应该会切换工作流哈,切换到 flex clean 模型,当模型的能力再一次提升的时候,我们现在流程的能力就会再一次提升哈。 所以说现在大家其实可以去接触 open club 了,我觉得因为他们的能力不取决于他们本身哈,取决于他们用到的模型。模型的能力提升呢,不取决于个人, 取决于那些走在前面的那些大厂。好吧,所以说你现在学和以后学都是学一样的。稍微等待一下哈,不知道他现在思考到什么程度?我看一下哈,我们能在 open club 的 后台看到他 思考到什么样的程度啊?哦,他已经加好了吗?我们看一下。靠,他加了一个这样的文字哈,可以看这个,这俩基本上没问题啊,这两张图片除了文字之外的没区别啊。这个文字是他自己加的, 如果说我们有自己的提示词的话,让他去做海报就更简单了哈。比如说像这个,我们直接把这个提示词给他,用这个提示词给我制作一个海报,就这样直接把提示词给他就行了,然后他就会自动给我们生成哈, 等待一下,我推断他加的这个文字啊,是他自己通过脚本加的,并不是用了我们的模型哈,看一下,这是在后台啊,我们跟他交流的过程在后台都能看到。我们看看刚才说的让他加文字这件事情上,他做了什么,哈, 它用了一个工具调用哈,然后在这里可以看到,它是通过代码给我们加的文字哈,并不是用模型给我们加的,它这里用了一个 python p i l 库哈,这个是对于图片设计的,用了一个 image, image draw, 还有 image font 这几个类哈,然后去做了一个图片上面加文字的操作, 所以说呢,它并没有调用我们的 comui 哈,它选了另外一种方式,然后就生成了,所以说我们的 comui 呢,也没有运行。 然后这里他还下载了几个字体文件, ttf 是 字体文件哈,然后就加了几个文字哈,这是他的一个刚才加文字的那个过程,并没有用我们的编辑模型哈, 这里生成了哈,这个怎么说呢,文字排版不太行啊,这个海报如果把这么多中文直接交给模型生成,基本一定会出现错字、粘字、排版乱,所以我还是按更稳的方案来, 先生成了海报底图,然后再把文字排版进去。我说不要这样,直接用提示词生成就行,你看,这就是他自己的一个思考,但是他的思考是不对的,如果直接用提示词生成就会更好,反而他自己写的排版乱了, 对吧?所以说他自己想的,他先生成了一个底图,然后自己又加了一些文字,但是自己加的文字明显排版是乱的,还不如直接让模型生成,所以说这个呢,没办法,你在跟他交流的过程中就会遇到这些问题啊,所以说大家装完之后,最主要的是跟他的配置和交流的过程,可以看这次就直接生成了,这就没什么问题啊, 对吧?这次这个海报就没什么问题,所以大家以后用的时候,你想啊,当你看到了这个问题的时候,你能不能分析出来这个机器人他是在哪里出了问题, 然后让他给你改成合适的。如果说对康复 ui 了解不多的同学,可能看到这里就觉得康复 ui 的 能力也就那样了,对吧?其实是因为模型在中间做了一些事情, 然后导致了这个海报不太好。好吧,现在他的能力确实是有的哈,但是取决于我们给他配置了什么样的工具以及工作流,我来配置一个哈,这里有个图片放大,我觉得是需要的,我们让他直接给我装个插件哈,看这个工作流是不是这个 see the vr two 高清放大我搜一下哈, 我们一定尽量的把指定的插件路径给他哈,让他确定是装的这个插件,比如我们复制给他,然后说帮我安装这个 comui 插件,然后重启 comui, 然后把地址给他就行了,接下来他就会自己帮我们装了哈,可以看一下哦,还是在这里看哈, 一会的话,我这个网速的话就会开始提升啊,说明他已经准备下载了,下载完之后呢,他会处理环境,然后把环境装在 comui 对 应的环境里面,然后呢再给我们启动,可以看现在网速已经上去了,就是在给我们下载插件啊。好吧,他说重启了,我们试一下哈,我们看看这个插件有没有装上啊, 可以看,这里已经有了哈,这个节点没问题。所以说前面的这些呢,是 c 的 vr two 的 插件哈,看一下。所以说还得再装一些插件啊。已经给我们成功装上了一个插件,然后我看一下那个工作流哈,他好像把我的康复 ui 装到了 c 盘里面哈,看一下这个插件里面的视力工作流哈。 插件比较少, seedvr2, 然后找到对应的工作流,这里面缺失几个节点,然后我自己给他装一下吧。手动装一下吧。这是什么?有两个插件装失败了吗?我们重启一下看看啊,好像没问题啊,这几个都是装上的,现在在重启 comui 哈, 这些操作大家应该不陌生了,如果说啊 comui 已经学过一段时间的话。好的,有个插件没有装上,不对,应该不是没装上哈,是这些节点应该过时了哈。 get image size, 这是 c 的 vr two first pass, 不是 这个节点哈。看来这个插件还是没装上,选择最新的版本,看一下后台有没有在下载哈。哦,现在是在正常的下载,等一等吧,我把这个图片放大的工作流也给他,给他之后呢,他就可以批量的去完成图片的放大了哈, 我们刷新一下。好的,已经启动了,我们看看有什么报错哈。哦,载入成功的哈。插件在这里啊, see the vr two video upscaler 在 这里哈,这个节点。所以说把它替换掉啊,这里是 block swap。 然后这个呢,不管它了哈,直接把它从中间给它替换一下就行了。第一个阶段的放大, 这是第一个阶段的图片,第一个阶段有个 block swap 参数,现在不需要了,我们把这个删掉就行了。然后 d i t 就是 它的模型哈,我看看我本地的模型有哪个哈工作流要提前给它配通哈,配通之后再让它去运行 seed v r two 在 这里哈,本地有七 b lp 十六的模型,我是有的。那就直接选这个哈, 选完之后选我们的库达林 block swap, 直接在这里可以设置哈,给个二十吧,不给太多哈。然后这个也连过来 v a e 模型,这是 c 的 vr two 的 v e 模型,然后选上,这是分块放大,我们就按默认参数就可以了,把这个也连过来 v e 模型,那这个时候就相当于我们配置好了模型, 然后来测一下这个工作流的运行哈。等一下啊,我把这个工作流先保存一下,重新命名,然后把刚才这个工作流拖入进来。拖入进来之后呢,我们看看它是怎么做的,参数是怎么连的,做一个替换哈。 open floor 里面, 把 the vance 拖进来看一下哈,这个节点就连出来了一个最短边的参数哈, shortest side longest 最短边的参数应该是连到了这个 resolution 上面啊。好的,那这个工作流基本就没问题了,我们上传一张图片,让他给我们放大一下试试啊,我们就用刚才他给我们生成的这张男生的图片吧, 复制一下,粘贴到这里 set, 因为就给他连过来啊,把这个节点删了,然后第一阶段的话,放大到两千就可以了吧。第二个阶段呢,我们放大到四千吧, 这个指的是它的最长边哈,我们把它的最长边放大到四千,就相当于做了二点多倍的放大哈,二点五倍的放大了基本上,然后我看一下这个参数哈, seed 给它改一下 tailing upscale 放在这里, 然后看一下他的参数有问题啊,也就是插件更新导致了节点出现了问题,所以说我们是需要把节点删除重建一下的,原来他的过程呢,做一个替换就可以了,连到这里,所以说这个节点可以看他已经没有输出了,所以说这个节点对我们当前工作流没用,删掉就可以了, 现在应该没问题了。 new resolution, 把连上放在这里吧,运行一下试试啊。运行吧。好吧,现在这个呢,就是图片高清放大的工作流哈,这个节点有错啊,我们看一下错误是什么? block swap 是 无效的哦,我懂它意思了,它的意思是呢,你的模型放在了显卡,如果你做 offload 的 话,也就是显存卸载,做 block swap, 你 需要把它卸载到另外一个设备上,所以说这里呢,我们得选 cpu, 不 然的话它卸载不了哈,我试一下不做 block swap 它能不能跑哈,因为我想让它尽可能的把我显存占用多一点嘛, 如果我的显存不够的话,那我就去做 block swap。 现在的话可以看在做第一阶段的放大,然后我们的显存占用只有九个 g 是 没问题的,九个 g 占用很少哈,但是等到第二阶段放大就开始大了哈,图片放大对显存的占用很多,所以说这些工作流的配置你一定是要清楚的,不然的话,你没办法把它交给 openclock, 让它给你运行, 因为你需要选择其中的参数,让 openclock 去修改的。你比如说这里的模型的名字,你肯定不能让它修改,因为这个模型是你自己固定好的,放在本地的。还有这些呢, device 这些它没必要修改,所以说你就不要暴露给它,如果你暴露给它了,它就可能给你改,一改的话,工作流就跑不了了, 那个时候问题就大了。但是这个呢,就取决于你康复 ui 学的怎么样。如果说拿到一个工作流,你都不知道提示词在哪写,或者说都不知道你在哪里设置图片的尺寸,那你怎么去让模型配置呢?对吧?所以说这个呢,可能需要就是你学完了康复 ui 之后呢,你再学 openclip 加康复 ui 会更方便一点哈。 好的,放大完了,我们来看看,右边是原图,左边是放大之后的,大家可以看一下哈,看看他的衣服哈,还行吧,衣服质量还不错啊,看这个扣子, 这个扣子原来是扭曲的啊,现在已经到正常了。还行,这个放大质量不错的哈, 对吧,他多少会有点修改哈,百分之九十九相似。还行哈,这个质量没问题,工作流也没问题,那我们就直接把它 导出开始封装吧,导出一下,但是要把它导出成 api 格式哈,图片高清放大命名一下。 api 命名完之后呢,我们就把这个工作流导入进来哈,然后这里有个描述,说明我们要给它写上哈,就是图片高清放大可以,这应该就行了, 这俩节点我们不用管,所以说主要给的就这仨参数就可以了,一个是一百四十八号节点,一个呢是一百零四,一个是一百二十五。 我们先把一百四十八号节点给他暴露出来哈,一百四十八号在这里打开,然后描述一下,就是需要被放大的图片位置,然后生成必须给他勾选上,然后呢还有一百零四和一百二十五啊, 你找到一百零四,一百零四,一百二十五,这俩都给他打开啊,一百零四的话,这是啊 number, 也就是第一步放大的最长边长度 建议在两千以内,然后这是我们的第二步哈, number 二,给他起个 number 二吧,就是最终图片的最长边的长度建议大于第一步放大图片的最长边, 就这样,一个两千,一个是四千,这样的话就应该已经够了哈。第一步放大的最长边长度建议在两千以内,不要超过 number 二的大小。好吧,就这样保存一下, 我们来试一下哈,就像现在我们就已经配置完了,你可以问问这个 openclock 你 现在可以用的工作流都有哪些?可以看到他已经给我们说了他现在可以用的工作流这有八个,然后再加上我们刚才给他配置的这个图片高清放大的, 然后他说刚才装的插件已经装成功了,那我们给他,让他生成一个真实人物,女生在二十五岁左右吧,然后衣服风格,背景装饰,长相你自己设计, 然后分辨率呢在一五三六零二四左右,然后再把这张图片放大到,我们让它放大小一点嘛,不要太大了,最长边放大到三千,不改变原始比例。我们先让他把生成的人物发给我,然后呢再放大发送给我, 然后呢再把这张图片最长边放大到三千,不改变原始比例,放大后再把放大后的图也发给我。 好吧?就这样这个时候他就会去做了哈,然后现在可以看我们的图片已经生成了哈,这个是一五三六乘以一零二四的分辨率吗?然后这是他设计的给我们生成的一个真实的女生,然后包括他的长相啊,然后以及穿着啊, 然后装饰包括背景全都是自己设计的哈,他用提示词设计的。然后设计完之后呢,现在就开始做图片放大了哈,等他把图片发给我了哈, 这确实是放大后的图片啊,这是我们放大前的,这是放大后的 是吧?确实是啊,是放大后的图片。
粉丝1.8万获赞4.6万

逼自己一个月练完,其实你很会 ai, 存下把权,一百九十八集真的很难找全的警告,本系列视频耗时两个半月,制作共计一百二十分钟,让你从坑爹 u i 小 白到 ai 大 神, 这应该是目前抖音仅有的从入门到进阶的全套系统坑爹教程。 ai 界最全能的软件来了!一款软件就承包了所有的 ai 需求,关键是官方正版完全免费,它就是匡复 u i, 仅需三个步骤,下载、解压、双击打开,连模型都全部为你准备好了,真正实现零门槛,学会下载就能用!哪怕你从来没有接触过 ai, 再匡扶 u i 也能化身成 ai 达人。无论你是想绘制惊艳作画,还是想打造火爆全网的创意短片, 通通都是点一下就能完成。而且有了空府 u i, 你 用它就能够体验国内最新最前沿的 ai 功能。作为全球公认最全面、生态最丰富、最贴近生产力的 ai 软件,空府 u i 堪称免费开源 ai 软件当中的王者。 哈喽,大家好,本节课我们来讲空府 u i 界面布局的深度认识与功能解析。我们打开空府 u i 界面之后呢,你会发现界面非常的干净,什么都没有。 如果我们需要在空浮圆里面进行创作,那么我们就需要在空白处进行添砖加瓦,这一大片的空白处,你可以把它理解成它就是我们的创作区。接下来我们就在创作区进行简单的创作, 大家现在所看到的这个画面就是官方的纹身图工作流,我相信很多小伙伴呢都听过,如果是要把空浮圆学好,就一定要把节点的功能,节点的各个连接的原理把它搞明白。那么什么是节点呢?我们现在所看到的这些小方块, 这些这个,这个,这些全部都是节点,各个节点串联组合起来就能形成一个完整的工作流。我们只需要在这个文本编码里面输入一段提示词, 选择一个大模型,注意了,这个提示词一定要是英文,那么这个提示词写的是一位年轻女性双手捧着一束鲜花, 点击运行,通过这些串联起来的节点运行之后,一张一位年轻女孩捧着一束鲜花的照片就生成了,是不是很神奇?中间的创作区我们了解之后,接下来我们来看左边的布局。首先来看一下队列, 我们点击队列,这个队列指的是什么呢?很好理解,这队列里的内容就是你渲染输出的图像,这个绿色代表的就是你渲染输出的时长, 我渲染第一张照片的时候,花的时间是一百零六秒,第二张图片画的是六秒,这张图片画的是十秒。选中这张照片,点击一下,我们就能够看到这个照片的全貌, 当然你也可以对这些图像进行删除,点击删除功能,那么所有的照片就全部删掉了, 这个就是队列的功能。接着我们来看这个节点库,点击一下这个节点库顾名思义就是节点的仓库,这里面全是节点,你想要用哪一个节点,那么你就直接在这里面进行搜索即可,比如说我现在要用变异解码器,那我就直接在这里进行搜索变异解码器, 那么这时候呢,我们就可以选择这个 v 解码,点击一下这个解码就进来了。除了这种添加节点方式之外,我们还有其他的添加节点方式,我们可以在空白处进行单右键来到添加节点节点库,里面的这些节点对应的就是这些节点。 我们看一下这个 select 高清放大,里面有十个文件。我们再来到这个 select 高清放大,这里的节点对应的就是这里面的这些节点, 你想用哪一个节点,那么你就选择哪个节点即可。那么除了这种方式之外呢,还有一种非常便捷的方式。除了以上两种方式添加节点之外,还有另外一种最方便的添加节点方式,直接在空白处进行双击, 你想要哪个节点,直接搜索哪个节点,比如说我现在要添加 k 采暖器,那我就直接搜索 k 采暖器,点击添加 k 采暖器即可。 再看一下这个模型库,每一个文件夹代表一种模型类型,这里有几十个文件夹,代表空腹 u i 的 模型有几十种类型, 可以看到有些文件夹它是带有数字的,数字代表的就是你自己本身安装了多少个模型。比如 point 文件夹里有四十个模型,那么它对应的就是我本地部署当中的 point 文件夹里的这四十个大模型。 lala 文件夹里有六十五个模型,对应的就是我本地部署当中的 lala 文件夹里的这六十五个大模型,其他的文件夹同理。 再来看一下这里的工作流,点击一下这里的工作流对应的就是这里的工作流,只要你保存了它就能够在这里进行显示,比如说这个工作流, ctrl 加 s 保存一下 这个工作流,保存之后他就进来了。再来看一下这里的节点语组,这里的节点对应的就是我们工作流里面所设计的节点,十七 k 采集器对应的就是这个十七 k 采集器,三十 k 采集器对应的就是这个三十 k 采集器。 那么还有一个节点组没有组怎么办?我们可以自行创建节点组,按住鼠标的滚轮键,我们可以随意挪动整体的工作流。怎么进行创建节点组呢?按住键盘上的 ctrl 键 框选一下,然后 ctrl 加 g 打个组,给他命个名,图像输出,那么在这个图像域组里面,我们就能够看到这个图像输出组了,点击展开,我们就能够看到这个图像输出组里面有两个节点, 微解码、预览图像对应的就是这两个节点。我们再来到模板界面,点击进去,这里的模板其实就是官方已经做好的工作流,有图像生成、视频生成、音频生成等众多工作流,你想用哪个工作流,那我们就点击哪一个, 这时候呢,他提醒你缺少模型,此时你需要下载安装模型,你可以直接点击下载,也可以复制链接到浏览器进行下载, 然后把模型安装在本地,部署对应的模型文件夹,接着重启空腹以外就能够使用了,涉及到当下最新的一些工作流,有时候呢你需要花点米才能使用,以这个视频模板为例, 这里显示我们生成一次视频是零点四九美元,折人民币是三点五块钱,大家可以根据自己的需求去选择使用。接着我们来到帮助中心, 这个就是匡辅 u i 的 更新版本,有些插件或者节点需要匹配当下最新的版本才能使用,有必要的时候呢,我们就选择更新。再看这个 get up, 点击进去,这个就是匡辅 u i 的 官方节点插件库,我们所使用的外置节点插件都是源自这个网站,具体怎么使用我们待会会讲到。 接下来我们来到键盘快捷键,这里对应的就是我们在操作空腹液的时候对应的快捷键,如果你对官方设置的快捷键不满意,你可以自己在这里面进行设置。 左边的界面布局大家都已经了解了,接下来我们来了解下面的界面布局,我们选择这个工作流,这里的复制标签指的是复制这个工作流,点击复制我们就得到了一个同样的工作流,这里的关闭标签指的是关闭工作流, 现在我们就把这个工作流关掉了,关闭右侧标签,关闭其他标签就非常好理解了,在这里我就不多讲了。接着来看这个图标,登记一下,这个新建指的是创建一个新的工作流,接着我们来到文件,选择打开, 打开指的是我们可以通过这种方式可以打开我们的工作流,除了这种方式可以打开我们的工作流之外,我们可以直接把我们的工作流直接拖拽进来也是可以的。 关于这个保存呢,就很好理解,大家养成一个习惯,隔几分钟保存,如果我们的电脑突然崩溃了,那么很可能我们花了几小时做的东西全部复制动流。再来看这里的导出, 导出指的是导出我们的工作流,给他们个名,界面布局讲解二,这时候呢会跳出一个保存的路径,我们点击保存即可。再来看这里的编辑,这里的撤销指的是返回上一步,这个是清除工作流,说白了就是删除工作流, 这个呢就是刷新节点,有时候我们卸载一些节点之后,或者是修复一些报错问题之后,我们需要重新刷新一下,才能让矿务员正常运作,这时候呢就用到这个功能。接着来看这里的释放模型,释放模型和节点缓存, 手机用久了之后呢,会产生很多垃圾,导致手机卡顿,这时候呢我们就得时不时的清理我们手机缓存,那么空浮元也是一个逻辑,你的节点多了,或者是你用久了,他也会产生很多垃圾,导致我们在运行的时候呢,会出现卡顿的一些情况,或者不顺畅。那么这时候呢,我们就可以使用这两个功能来释放这些垃圾,这两个功能 对应的就是这下面的两个功能。清理垃圾缓存的时候呢,我们也可以点击这两个功能。再看这里的主题,现在是深色,点击一下它就变成了浅色, 这个浏览模板对应的就是我们刚刚所使用的工作流。我们再来看一下这里的设置,这里的设置呢就是一些界面的设置,基本上呢你可以不用动它, 比如说像这个新菜单,现在是在底部,我们点击一下,那么它就到了顶部,我们现在呢把它切换回来。这里的设置主要就是去调节这个框辅 ui 界面的一些布局,感兴趣的小伙伴呢,大家可以去调节一下,我使用的都是默认的,再看下面的这些功能, 看一下这个拖拽,这个巴掌图标对应的就是我们鼠标的滚轮键,这个是自适应式图,点击一下他就会回到一个自适应的视角,这个是缩放控制,就是去控制你这个画面的大小,我们可以通过鼠标的滚轮键去滚动来调节这个画面的大小。去看一下它的数字是在变的, 这个是专注模式,点击专注模式之后呢,整个界面它就只有我们的节点,其他界面全部消失了,点击回来,这个呢就是隐藏链接,也就是隐藏这些线条,一般情况下我们都不会用到。 接着我们来讲本节课的重点内容,学习空辅 u i 必备技能,如何安装节点,这时候呢我们就得用到这个管理器,我们需要安装插件节点,或者更新版本的时候通常会用到它。接下来来讲三种安装节点的方式。 首先第一种方式,我们通过这个节点管理器进行安装节点,我现在需要安装一个 bashnet 重绘节点,在框里输入 bashnet, 跳出 bashnet 节点之后我们就选择安装, 因为我是已经安装过了,所以是这样的,显示点击安装,等这个节点安装完之后,切记一定要重启酷狗 u i, 这样才能正常使用这个节点。接下来我们来讲第二种安装节点的方式, 我们通过酷狗 u i 来到 gitup 官网,在输入框里面输入我们要安装的节点 slash net, 接着我们选择酷狗 u i slash net 这个文件,我们来到 code 复制一下这个链接,接着再来到管理器,通过 gitr 进行安装, 输入我们刚刚复制的链接,点击确认也可以进行安装。如果这种方式我们还安装不上,那么我们就采用第三种方式,我们把这个节点下载到本地,下载好之后呢,再把它进行解压,解压之后把这里的后缀名杠 m a i n 删掉,再拷贝这个节点。我们来到 custom node 这个文件夹,把我们刚刚拷贝的节点放到 custom node 这个文件夹,这个文件夹就是专门用来放置我们的节点,放置好之后重启 custom node, 这时候我们就能够正常使用这个节点了。好了,以上就是本节课的内容讲解,咱们下节课再见,拜拜!本节课我们来讲匡府 ui 的 工作原理, 如果我们真正要掌握匡府 ui 这个工具,让它变成我们的创作利器,我们必须要了解它的运行逻辑,只有真正掌握了运行逻辑,才能够大大的提升我们的生产和学习的效率,给我们带来更多的创作源泉。 大家现在所看到的工作流是匡辅 u i 官方最基本的纹身图工作流,一个基本的纹身图工作流主要就是由以上七个节点组成,那么什么是节点呢? 我们现在能够拖动的这些方块,它就是节点匡辅 u i 的 运行逻辑,它是从左边进行计算,我们可以把这工作流分成三个板块,按住 ctrl 键拖拽鼠标就可以框选这些节点, ctrl 加 g 就 可以对这些节点进行打阻。 左边的板块是前期输入板块,中间的板块是核心生成板块,也就是浅空间像素,最右边则是后期输出板块,这样就构建了一个最基础的纹身图工作流。我们只需要在输入板块当中的 kelpie 文本编码当中输入一只小狗,点击运行, 这样一只小狗图像就有了。接下来我们来逐步详细讲解每个节点的作用。首先来看最左边的 checkpoint 加载器,我们能够看到加载器里有三个节点,分别是模型节点、 clip 节点、 v a e 节点。 这里的模型节点的作用就是用来加载我们的大模型,它的主要作用就是根据文本描述和随机造声逐步生成图像的潜在表示。通俗一点,它的作用就是控制图像生成的风格。我们点击这里的模型选择框, 我们就能够看到这里有非常多的模型类型供我们选择。这里的模型选择对应的就是我们安装在 cf ui mod 这个 pos 文件夹里面的这些大模型。大模型的作用呢,就是用来控制图像生成的风格。 比如我现在选择一个真人写真类的大模型,因为它是一个菜鸟模型,我们就把分辨率改成一零二四乘以一零二四,点击运行, 这样一张真实写真类的小狗图像就有了。再来看这里的 clip 节点,它是 stable diffusion 模型的一个核心组成部分,由 track point 节点加载出来的一个关键模块。 它的核心角色就是将用户输入的自然语言,也就是提示词翻译成 ai 图像生成模型能够理解的条件指令, 简单来说,它充当的就是一个翻译官的角色,让采集器能够理解你你想要什么样的画面。这就是为什么我们刚刚在文本框里面输入一只小狗,它就能生成一张小狗图,而不是一只小猫图的原因。 接着再看下面的 ve, 它是一个负责将图像在像素空间和浅空间像素之间进行转换的核心组建,你可以把它理解成它就是整个 ai 绘画流程当中的翻译官和显隐器。常用的 ve 有 两个,一个叫 ve 编码, 它的作用就是将像素空间,也就是把图片转换成裁样器,能够读懂理解的浅空间像素。这个节点一般用于图生图,到后面讲图生图内容的时候会进行详细讲解。另一个就是 ve 解码,也就是我们现在用到的这个 ve 解码, 它的作用就是将浅空间像素转换成我们肉眼可见的像素。我们了解完加载器模块之后,我们再来看这个 clip 文本编码,一条完整的工作流,一般有两个文本编码,上面的文本编码我们一般用来写正面提示词,也就是我们想要什么样的画面。 下面的文本编码用来写负面提示词,也就是我们不想要什么样的画面。在正向提示词里输入一间教室, 点击运行,现在我们就得到了一张教室图,我们能够看到教室里面有黑板、桌椅、电灯、窗户。如果我不想让生成的图像有黑板,那我们就在负面提示词里加入黑板,再次运行, 这样再次生成的图像就没有了黑板,黑板变成了投影布。如果我不想让图像中出现窗户, 那么就在负面提示词里输入窗户,点击运行,再次生成的图像中就不会出现窗户,这就是可 leap 文本编码的作用。我们再来看这里的 comlaten 图像,它是一张在浅空间中由随机噪声构成的空白图像, 为 k 采集器提供初时的可逐步雕刻的造声数据。简单来说,你可以把它理解成,它的作用就是决定生成图像的分辨率。这里的批量大小决定一次性能生成多少张图像。我们在正向提示词里输入一个男孩,此时的宽高分别是五幺二、五幺二, 那么生成的图像大小自然也是五幺二乘以五幺二。如果我们把画面的宽高设置成五幺二乘以七六八, 此时我们就得到了一张五幺二乘七六八的图像。我们把批量大小设置成四, 这样就能一次性得到四张五幺二乘七六八的图像。那么我们可不可以将宽高随意进行设置呢?比如宽高设置成两千乘两千, 此时你会发现生成的图像根本没法看,与我们的提示词描述有天壤之别。那么原因是什么呢?生成的图像画面是否合理,不光跟 limit 大 小有关, 而且它还跟我们的大模型相关。如果我们选择的模型是 sd 一 点五的模型,那么分辨率就设置成五幺二乘五幺二。 因为 sd 一 点五的大模型在训练的时候用的就是五幺二乘五幺二的图像进行训练,所以宽高设置成五幺二乘五幺二的分辨率,这样生成的图像质量就正常。 人家只有生成五幺二乘五幺二的能力,你却硬是让人家超常发挥,所以只能天马行空地进行会制,生成的图像不尽人意。 如果我们的大模型是 sd 叉 l 模型,那么我们的分辨率呢,可以设置成一零二四乘一零二四,因为 sd 叉 l 模型是基于一零二四乘一零二四的图像进行训练的。 好了,以上呢就是空来的图像节点的用法。我们了解完输入板块的各项功能原理之后,接下来就是核心生成板块 k 采氧器。 k 采氧器的作用就是负责执行,他接到前面的指令,然后严格按照参数设定,一步步的执行去造, 将噪声图塑造成符合指令的最终图像。简单来说, k 采集器就是负责动手把它画出来。我们在正向提示词里输入一个男孩正在踢足球,点击运行 一张男孩踢足球图像就有了。我们再来看这里的种子数,你可以把它理解成他就是我们的身份证编号,每一张图片都有属于自己的编号。再来到下面的生成控制后, 我们选择增加,那么种子数就增加一个单位,刚刚数值是四十二,现在的数值是四十三,如果是选择减少,那么数值将会降低一个单位,变回四十二。 如果选择随机,那么这个种子数将随机。如果我们选择生成后固定种子数,我们将这个种子数进行复制,再随机生成一张图, 接着再把种子数粘贴回来,我们又回到了刚刚那张照片。我们再来看一下这里的采用步数,它的作用就是控制去噪迭代的次数。为了方便大家看得更加直观,我选择一个 sd 叉 l 大 模型,分辨率设置成一零二四乘一零二四。 在其他参数不变的情况下,我们分别把步数值分别设置成五十、 十五、二十二十五。我们再一起来看一下这五张图整体的对比。 仔细看你会发现,随着步数越多,整体的细节越来越精细,当然运行的时长也更长,通常这个数值二十到三十步是质量与速度的平衡点,这就是采用步数。 我们再来看这个 c f 基值,它的作用就是用来控制关键词与生成画面的匹配程度。我们在提示词里输入,一个女孩坐在草地上固定一随机种子, c f 基值设置为一,采暖器设置为 m p p 二 m 调度器设置为 kalas。 点击运行,我们能够看到,当 c f 基值为一的时候,这个画面很脏很乱,没有太多的细节,最基本的人物轮廓都看不清。 我们再把 shift 机制调整为五,点击运行。现在这个画面就清晰很多了,人物的体态样貌我们都可以看得见,但是颜色还并不是很丰富,女孩的手旁边有一个像包,但又不像包的东西,还是缺乏创作力。我们再把这个参数设置为十二, 我们能够发现整体的颜色又丰富了很多,生成的东西呢也更加符合逻辑。刚刚草地上的小花现在就有了更多的颜色,服装包包也有了更多的细节。我们再把 cf 机制调整为二十, 此时生成的图像质量就更高了。所以我们可以得出一个结论, shift 值数值越低,传感器越不能理解你要什么生成的,质量越差,反之,参数值提高,生成的画面会更加符合提示词所想表达的内容。 shift 值一般控制在八到二十之间。 再看下面的裁样器名称,裁样器和下面的调度器,它是结合使用。裁样算法和调度器的结合会直接影响结果的质量,生成的速度以及风格样式。通常情况下,裁样器我们就选择 dpmpp, 二 m 调度器选择 kalas, 这两个模块的结合对应的就是 webui 当中的 dpm 加加二 m, 只不过在框副 ui 当中把它们独立出来了。接着来看降噪功能, 它的作用就是控制对初使造成的去除程度。现在的数值是一,如果我们把数值调整为零点八,你会发现画面的人物形态、脸部的轮廓质量明显就降低了很多,色彩的饱和程度也降低了不少。参数设置为零点五, 画面的色彩还原程度接近复古色调,效果很差。参数设置为零点二,可以看到基本上就没画面了。所以如果是纹身图,那么数值通常设置为一。如果是作为图升图,这个降噪功能的用法又稍微的有点不一样。到后面的图升图我们会讲到, 接下来我们来看这个 ve 解码,它的作用就是将 k 传感器处理的浅空间像素转换成我们肉眼可以看得见的像素。 预览图像节点的作用很好理解,它的功能就是显示画面,如果你想保存这张图像,选择图片单右键点击这个保存图像即可,这个图像就保存下来了。各个板块的各项功能原理我们明白之后,接下来我们就一起来手动搭建一个完整的纹身图工作流, 在空白处我们进行双击,就会出现一个搜索栏,我们就可以在搜索栏里输入我们想要加入的节点。我们先加入一个采集器,通过采集器进行拓展,选择模型的小节点进行拓转,就会显示其他能够连接的节点。我们选择 trackpoint 加载器, 这样模型加载器就有了。再拖拽 clip 小 节点,我们就可以加入 clip 文本编码,选择 clip 文本编码,按住 alt 键,拖动一下 clip 文本就能够进行复制。 拖拽一下 link 图像,我们就能得到一个空 link。 拖拽一下 link, 我 们就可以在里面选择 v 一 解码,再通过 v 一 解码里面的图像再拖拽一下,我们就可以创建预览图像, 这样我们就得到了一个基本的纹身图框架。接下来我们需要将它们连接起来,具体怎么连接呢?并不是盲目连接,我们需要进行对应连接。这里的模型节点不能与 clip 文本节点连接,它只能与采集当中的模型连接, clip 也只能连接 clip。 v e 只能连接 v e 正面提示词的条件,连接正面条件,连接负面条件, 这样一个基本的纹身图工作流就搭建好了,我们来运行一下这个工作流,在正向提示词里输入一个美少女, 再转换成英文,这个中英转换插件在后面的课程内容当中,我会教给大家怎么安装,刚学习的小伙伴可以使用有道翻译进行翻译,把翻译好的提示词输入到正向提示词, 再选择裁样器和调度器,点击运行一个美少女就有了。最后我们再来理一理这个工作流的运行逻辑, 通过加载器把大模型的信息给到 click 文本编码,通过文本编码进行下达指令,把指令给到 k 采集器,告诉 k 采集器我具体需要什么。 k 采集器接到指令之后呢,进行执行,进行作图,产生浅空间像素,也就是大家现在在采集器这里能够看到的这个图像。 k 采集器把生成的浅空间像素信息给到 v 解码, 让 v e 解码对浅空间像素进行处理,处理成大家肉眼能够看到的图像。 v a e 解码,把转化好的图像信息给到预览图像进行展示出来。 好了,相信大家对匡府 ui 的 运行原理都已经掌握明白了,客户呢自己去实践领悟,咱们下几个再见,拜拜!本节课我们来讲匡府 ui 的 图声图功能,图声图功能从字面上面就很好理解,我们需要一张参考图, 通过一张参考图结合空腹与爱的流程进行计算,生成我们想要的视觉效果图。在这里呢,我就已经准备好了一个基本的纹身图工作流,那么在空白处呢,我们进行双击,我们在这里添加一个加载图像,加载图像的作用呢,就是用来上传我们的图片,把我们已经准备好的图片素材呢透露进去。 接下来我们要做的就是把图片信息给到采暖器进行处理,生成我们想要的视觉效果。在这里我们能够看到 k 采暖器里面呢,没有跟这个加载图像节点能够联系的节点, 这里没有图像,也没有遮照,接下来我们需要通过一个节点,把这个图片信息转换成 k 采暖器,它能够理解能够读懂的数据。我们在空白处进行双击搜索, v a e 编码加进来, 那么这个 v 编码节点的作用是什么呢?用专业术语来讲,就是把我们肉眼可见的像素空间信息, 也就是这个图片信息转换成浅空间像素信息。用大白话来讲,就是把这个图片信息转换成就 k 彩样器,它能够理解能够读懂的信息。我们直接把这个图像连接像素,这个 laten 连接 laten v 连接 v 一, 那么基本的这个图生图工作流就已经完成了,那么这个大模型呢?我选择的是通用的 sd 叉 l 模型, 这时候我们只需要在这个文本框里面输入相关的提示词,它就能够生成相关的内容。比如我现在我需要把它转换成游戏动漫人物风格,那么我们就在这个提示词里面输入游戏动漫人物风格,再把这个中文呢进行转换成英文, 这个非常强大好用的中文翻译节点,后面呢我会教大家怎么去安装,怎么去使用,接下来把这个彩样器呢改成 m p p 二, m 调度器呢改成卡拉斯。我们再来看一下效果, 这时候你会发现我们现在得到的图像跟原始参考图像可以说是差之千里,主要原因是什么呢?他有很多的因素,第一个因素就是他的一个降噪值,降噪值参数越大,那么生出来的效果呢?他越偏离主体,降噪值参数越大,那么生图出来的效果呢?他越偏离主体, 我们现在尝试把这个降噪值呢降低调,准备零点八,再来看一下整体的效果,这时候你会发现,最起码这个人物的头发变长了,人物的风格呢也开始接近了,再降低一下降噪值, 把这个降噪值呢调整为零点六五,再来看一下整体的效果,我们现在得到的这个画面,他有白头发,那么这个白头发他参考的就是这个白头发,那么这里的灯光他参考的就是这个月光。这块柱子的构图匹配的就是这根柱子的构图, 那么整体来说这些参数它是没有太大的问题的,但是呢,为什么生出来的效果还是这么的差呢?有一点非常重要,大家注意看, 我们所使用的大模型是 sd 叉 l 模型, sd 叉 l 模型它训练的是幺零二四乘以幺零二四的图片, 所以我们要想办法把这个图片素材呢变成幺零二四乘幺零二四,再导入到彩样器里面去进行计算,有两种方式,第一种方式就是常规的方式,直接输入一张幺零二四乘幺零二四的图像,这方式在之前就讲过,接下来就教大家第二种方式, 在这里呢给它加上一个图像缩放,我们就选择这个 r g 节点的图像缩放,这个节点是一个外置的节点 r g three, 也就是说我们要去进行安装,这些节点到底是内置的还是外置,需要进行安装的,怎么去辨别呢?注意看一下这个节点,它的右上角上面写的是 r g three comfor, 再看一下这个加载图像右上角,它是小狐狸加载器,小狐狸文本编码也是小狐狸,也就是说,也就是说带了小狐狸这个标志,它就是代表内置节点, 没有小狐狸代表的是外置节点。那么这个 r g switch 怎么装呢?我们来到管理器里面,点击这个管理器,我们只需要安装这个 r g 节点,安装好之后呢,我们就能够使用这个节点,因为我是已经安装过了,所以呢我在这里我就不重复安装了, 退出。刚刚教大家如何去安装这个节点,退出来之后呢,这个电脑就直接卡住了,我就重新启动了控制 u i, 所以 大家会发现这画面呢发生了改变,但是呢,这里的各项参数我没有做任何的更改。接下来呢,继续来讲解 这个图像缩放具体该怎么用,它的作用是什么?那么图像缩放节点呢,是需要把它放到加载图像的后面来的图像连接图像,这里图像连接 v a e 编码里的图像,我们可以把这个宽度呢调整到一零二四, 高度呢调整到一零二四,其他属性一概不变。我们可以通过图像缩放节点,可以把加载图像里的这张图片处理成幺零二四乘幺零二四的大小,再通过 v 编码把这个幺零二四乘幺零二四的像素空间传给 k 传感器, 通过图像缩放节点作用,你可以把它理解成这张图片现在就是幺零二四乘幺零二四的大小了。接下来呢,我们就点击运行来看一下效果, 现在我们得到的效果就很符合我们提示词的需求了,长头发、箭月亮、树林这些元素的形成都是参考的原素材,那么如果你觉得这个效果还并不是很满意,我们可以去调节其他的参数,比如说 c、 f、 g 值, 我们把这个参数呢调整为十五。再来看一下整体的效果,看一下会不会有一些其他的变化。通过 cf 机制的提升,我们能够发现这里呢又多了更多的细节,我们也可以把这个降噪值呢,接着再调整这个 cf 机制呢,尽可能的把它控制在八到十的样子。再来看一下整体的效果, 调节了降噪值之后呢,你会发现又一些元素发生了一些变化,手里的键没有了,那么这个降噪值具体控制在多少合适呢?你就把它控制在零点六五到零点八的样子。 降噪值的参数过大或者过小,那么留给 ai 发挥的空间呢?更大,生出来的效果很多时候它是不尽人意的,那么我们也可以在这里呢继续生成, 选择随机这个环节呢,就是不断的抽卡,看一下哪张图片符合我们的诉求,接着我们给他再换一个风格,接着我们给他换一个宫崎骏的风格,再来看一下效果, 现在我们就得到了一个宫崎骏风格的效果,如果你想把这里的人物放到一个特定的环境里面,也是可以的,比如给他一段提示词,动漫宫崎骏人物风格,女孩手持一把剑,站在开满小白花的草地, 天空中有大片的白云,天气晴空万里,看一下我们又能够得到一个什么样的一个效果,那么现在呢,我们又得到了另外一种风格,大家注意了,接下来我多抽几张卡来看一下它有什么特点。 我抽了这么多张卡,不知道大家有没有发现一个共性,无论是从人物的姿势、样貌上面去分析,它都有所改变,每张图里面所设计的元素它都生产出来了, 无论是小花、草地、白云他都有,但是唯一个不变的共性就是整体的色调他都是偏向于晚上,原因是什么呢?就是因为我们的参考图他是晚上,所以会导致生产出来的效果都是偏向于暗色, 偏向于晚上的效果,哪怕是你的提示词里面告诉他我要的是白天天气晴朗的效果,但是他还是没办法实现。那么如果把这张参考图换成白天呢?再来看一下效果, 这时候你会发现所有生产出来的效果它都是偏向于白天的光线。当然我也尝试过很多其他的 sd 叉 l 模型,结果都是有这样的共性,那么这个呢,就是匡福 u i 的 图像图。 接下来我们来讲第一种放大方式, sd 放大,搜索 sd 放大节点,然后进行安装节点,因为我是已经安装过了,所以不需要再安装了,然后进行返回重启旷辅 ui, 重启之后,我们来到旷辅 ui 安装好之后呢,我们就可以搜索出 sd 放大节点,我们需要选择第一个 sd 放大。 大家看到这个 sd 放大节点之后呢,是不是感觉它特别像我们的彩样器?接下来我们再创建其他的节点,拉出图像节点,加载图像,再把我们需要修复提高画质的素材放进来,再拖出来一个大模型。 这个大模型呢,我们就选择 sd 叉 l 模型,再创建一个文本编码, 按住 alt 键拖拽这个节点,我们就可以复制一个节点负面提示词连接负面条件,这里的正向提示词呢,我们就写这个高质量,细节丰富。负面提示词呢,我们就写这个质量差,模糊杂乱。 v 一 连接 v 一 再拖拽出放大模型,添加一个加载大模型, 这两个加载放大大模型我会提供给到大家,这个是两个模型放置的位置,然后再拖拽一个图像节点,添加预览图像,为了更加的直观,能够看清放大前跟放大后的对比,所以呢我们可以给他加上一个图像对比节点, 放大,把分辨率为五三三乘八百的原始图像拖出来给图像 a、 s、 d 放大的图像拖出来给图像 b。 接下来呢我们去调整这里面的参数,放大系数其实很好理解,就是你要放大多少倍,我们就把它放到四倍, 那么随机种子呢,不用管它,这个彩样器呢,我们就选择常规的彩样器 mpp 二 m 调度器呢,就选择卡拉斯这模式类型呢,不用管它。那么这个分块宽度指的是什么意思呢? a c 放大节点在对你这张图片进行处理的时候呢,它会把你的这张图片拆分成很多个模块来进行处理, 这个分块宽度的参数越小,那么也就代表着他要处理更多的快速,那么计算的时长呢,也就更久。待会呢,我们一起来看一下他是怎么处理的。下面的这个参数呢,也可以不用动,接下来呢我们就点击运行即可,这时候他提醒我们忘记连接 clip, 关掉连接下 clip, 再点击运行。我们一起来看一下 sd 处理的细节。我们能够发现 sd 放大节点把这张图片拆分成了非常多个小模块进行处理处理,每个模块的大小对应的就是分块宽度的大小,处理的快越多代表时间越久, 当然效果更好。好了,我们现在所看到的这个图像就是经过 sd 放大节点提升画质后的图像。再来看一下图像对比节点,这是提升画质之前, 这是提升画质之后,从整体的角度来看的话,提升画质效果非常的明显。在提升画质之前,很多的元素都是模糊不清的, 尤其是头上的小花和人物的脸庞,他都没有较好的突出表现,但是在提升画质之后,我们能够看到小花人物的脸表现非常清晰,包括一些人物的细节, 像人物的手,衣服表现也是非常不错的,尤其是他的一个发丝处理的非常的好。当然经过 sd 放大节点处理之后呢,还有一些小瑕疵,比如说像人物的头发,注意看一下这个地方,他的 ai 感非常的严重, 这个地方处理的也不是很好,人物的肩上皮肤这块处理的也不是很好,但是从整体上来说,他的表现力还是非常不错的,这个就是 sd 放大的表现力。接下来我们来讲第二种方式。 接下来我们来讲第二种提升画质的方式, supreme 节点放大。首先我们需要在节点管理器安装这个节点,因为我已经安装过了,所以我就直接退出。接着在空白处进行双击添加 supreme 放大节点,拖拽图像节点引路加载图像节点。这时候呢,我们就可以把我们刚刚那张图片导入进来, 拖拽图像节点,添加一个预览图像,为了方便观察放大前跟放大后的对比,我们需要添加一个图像对比节点, 原始图像连接图像 a 节点,经过 supreme 放大节点处理过的图像连接到图像 b。 接着我们需要选择 supreme 大 模型, 这里要注意的是, supreme 模型我们就必须要对应 supreme 模型,我们就选择 supreme u f f p 十六精度的模型。 supreme 放大节点呢,还有一个特点就是我们需要引入 sd 参数模型,这里呢,我们就选择一个通用的联想 sd 参数模型,接着继续调节下面的参数。 这个缩放系数呢,很好理解,就是你要放大多少倍?我的电脑呢是四零七零的显卡,十二 g 的 显存,我就把它放大三倍,放太大容易崩。正向提示词我们就写高品质,细节丰富。负面提示词呢,我们就写质量差,模糊杂乱。接着再看下面的功能, 仔细一看的话,你会发现它跟 sd 放大节点呢有一些共性,它都有分块尺寸,分块不长。其实从这里就不难看出 spare 放大节点的特点呢,同样的,它也是把我们的原始图像进行拆分成多个模块进行处理,然后把处理好的板块再拼接起来。 那么如果你的电脑配置在不够的情况下呢,你可以打开下面的两个功能,在你显存不够的情况下,它会调用你的运行内存。 那么这个彩样器呢,我们就选择默认的彩样器,接下来就点击运行等待结果好了,经过五分钟漫长的等待,这个图片呢就生产出来了,这个呢就是经过 supreme 放大后的图像,我们一起来看一下,整体来说效果还是可以的,我们再来看一下前后的对比,这是放大前, 这是放大后,这个小花他处理的还是非常到位的,之前是模糊的,现在呢我们能够非常清晰的看到这些花的细节, 还有就是它的一个头发丝,注意看它头发丝这个地方,这个地方它处理的非常的好,它不会像我们之前所使用的 sd 放大的这个效果一样,它有严重的 ai 感。 supreme 放大节点还有一个啊, supreme 放大节点还有一个特点,让我比较满意的是它对衣服细节的处理,可以说处理的非常的到位,注意看一下现在的衣服是模糊不清的,你看不出什么质感,也看不出什么纹理,再看一下经过处理后的纹理, 它非常的清晰。还有再看一下这个肩膀处,是不是也是处理的非常的好。再看一下这些发丝,也是处理的非常自然,非常的好, 这些发丝也是处理的非常的自然,非常的好。当然呢还有一些小不足就是对于这个脸部的一些细节的处理,当然我们可以尝试性的把这个分辨率再提升一个档次,把它放大四倍试一下,相信一定会有一个不错的表现力,是大于 sd 放大的表现力, 这个呢就是 serbia 的 强大之处。好了,接下来我们来讲第三种方式,接下来我们来讲第三种提升画质的方式,阿拉萨节点放大,这个节点是外置节点,需要进行安装,首先我们添加阿拉萨放大节点,拖拽图像节点,添加一个加载图像,接着再导入人像图, 添加预览图像,为了方便观察,老规矩我们添加一个图像对比节点,放大图像,对比节点原始图像连接图像 a, 经过阿拉萨放大节点的处理,拖拽到图像 b, 接下来我们来了解里面的功能,阿拉萨模型呢,我们就选择第一个模型,这个 model 指的是你要放大多少倍,我们就选择放大四倍,选择第二个。 这个功能翻译成中文叫重新用透明度,你打开即可,下面这个翻译成中文叫快批量处理大小,这个指的是你要把张图片分成多少块进行处理,如果你想得到更高质量一点的画面,那么你就把这个参数呢调小一点,那么默认值呢是八,或者是你也可以把它调成到十六。 这个指的是你用什么渲染,那么你可以选择 cpu 渲染,你也可以选择 gpu 渲染,选择好之后呢,我们点击运行即可,经过一分钟的等待,这张图呢就处理好了,我们一起来看一下对比效果, 这是放大前,这是放大后,从整体来看的话,它虽然有放大的效果,但是呢整体来看它还是有较强的 ai 感,在整体上呢,它加了一些绿化的感觉, 而且人物脸型的质感可以说完全变了。那么哪些地方处理的还是比较好的呢?尤其是他对衣服细节的处理,质感处理的是比较到位的,当然对发丝的处理呢,也还是可以的, 但是呢对于皮肤的处理还是不太友好,如果是需要对人物进行放大修复处理,我不建议使用这种方式。接下来我们来讲第四种方式,也是我个人很喜欢的一种方式。第四种提升画质的方式呢是 cvr 节点,它是一个外置节点,需要进行安装。接下来呢我们就添加 cvr 视频放大节点, 拖拽图像节点,添加一个加载图像,还是导入那张人像图,再给它添加一个加载文件, 那么这个参数呢,选择十六即可,这个功能翻译成中文叫做要交换的快速,说白了就是你要把这张图片拆分成多少块进行处理,如果你想让画质高,那么你就把这个数值呢进行加大,你可以把它加到三十二, 我在这里呢就选择默认值。接着我们需要添加大模型,大模型的选择呢跟你输出来的质量有关系,大模型的精度越高,那么输出来的质量呢也越高,我们就选择这个大模型,这个呢代表的就是它的一个分辨率,这个呢就是分辨率的输出,我们可以把分辨率呢调整到二零四八。下面这个参数呢我们可以不用动。 接下来呢我们添加一个预览图像节点,再添加一个图像对比节点,原始图像连接图像 b, 点击运行看一下效果,经过两分钟的等待,图像就已经生成好了,那么这个呢是生成好的图像,二零四八乘以三零七零。我们来看一下放大前跟放大后的对比, 这是放大前,这是放大后,放大后的画质效果,你会发现无论是从发丝小花,还是从皮肤的质感,尤其是你能从皮肤的质感看到它有一个质的飞跃, 可以说 c d vr 从皮肤质感的处理放大细节来看,它可以吊打前面三种方式,你能够发现它的嘴唇,它非常的细腻,它有了非常多的一些纹理的细节,包括它皮肤纹理光泽,阴影的一些细节都非常的到位。 还有他的衣服的质感也是处理的非常的清晰,非常的好像这个肩膀处也是处理的非常的好。好了,以上就是四种高清修复放大方式,喜欢的小伙伴记得点个赞哦。本节课我们来讲学习控辅 u i 必须要掌握的 control net 节点, 接下来呢,就跟着我一起来学习 control net 的 三种高频用法,接下来我们就来讲 control net 的 第一种用法, openpos 控图在这里呢,我准备了一个基础的纹身图工作流。首先呢,在空白处添加一个 control net, 我们能够看到这里呢,有两个 controlnet, 我 们能够看到这里呢,有两个应用 controlnet, 一个是旧版高级,一个是旧版,我们都一起添加进来对比一下,很明显旧版高级比旧版它多了一些元素,旧版高级呢,它有正面条件,负面条件,而旧版呢,它只有正面条件,旧版高级多了一个 va 节点, 还多了一个开始百分比,结束百分比,这两个功能呢,我们待会会讲到把它删掉。 controlnet 我 们是要把它放在 k 传感器前面进行运行的,正面条件连接正面条件,负面条件连接负面条件都连接一下。 接着我们再添加一个 controlnet 加载模型,拖拽一下添加加载模型,我们能够看到这里面呢有非常多的加载模型,但是呢这些加载模型并不是乱用的,它是需要根据你的处理器进行匹配使用, 我们现在要做的是人物姿势控图,这时候呢我们就得在这里呢添加一个 openpos 加载模型,它的种类呢也非常的多,那我们就选择一个 sd 一 点五模型, ctrl delete 模型,它是一个 sd 一 点五的模型,那么我们加载器里的大模型同样也必须是得一点五的模型。我们再添加一个加载图像添加进来, 接着把我们已经准备好的人像参考图拖拽进来,接下来我们要做的是把它的人物骨骼姿势把它调出来,这时候呢我们就得用到一个节点, a u x 集成处理器,这个节点管理处就能够下载加载进来图像,连接个图像,点击这个预处理器, 点击进来之后呢,我们都看到这里呢有非常多的处理器,那么这里呢有非常多的处理器,这些处理器的作用是什么呢?就是调出你这张图片里面的一些信息,比如说我需要调出它的姿态信息,那么我们就选择 openpos 姿态预处理器, 如果要调出它的深度信息,那么我们就选择深度信息预处理器,我们现在要把这个人物的姿态信息调出来,这时候呢我们就得选择 openpos 姿态预处理器,我们得到这个姿态信息之后呢,再把这个姿态信息给到 controlnet 进行处理。在图像节点里面,我们拖拽一个预览图像放大一下, 接下来呢我们调节一下整个板块的布局框,选一下,打个组,给它命名个名, ctrl shift 板块,这个板块呢给它命名叫图像信息,下面这个就很好处理了 啊。最后连接一下这里的 ve, 再给它一个提示词,宫崎骏动漫风格,点击运行,我们来看一下效果, 这里提示我们没有连接大模型,再连接一下大模型,点击运行。现在我们就得到了一个宫崎骏的动漫人物风格,但是呢,我们能看到这个人物的头没有,所以呢,我们需要放大它的一个高度,再来看一下效果。好了,现在这张图呢就已经生成出来了,我们一起来对比一下它的一个姿势 原始参考图,经过集成预处理器进行处理,我们就能够得到一个人物姿势骨骼信息,这个人骨骼信息,再经过 controlnet 的 处理,再把这个信息呢给到 k 采集器, 我们就得到了这个人物信息了。骨骼信息跟人物的姿势是不是保持一样的?那么为什么这骨骼图像跟原始参考图,它的姿势上面呢会有一点变化,原因是因为它是一张图像, 图像经过预处理器处理,有时候呢,他不能得到一个非常精准的人物骨骼姿势图,通过集成预处理器结合 controlnet 的 用法,我们得到的只是人家的姿势,那么我们就可以在文本编码里面输入我们需要呈现的画面,比如我需要的是宫崎骏动漫风格,这个女孩在长满鲜花的草地上奔跑, 多抽几次卡。现在我们就得到了保持姿势一致不同效果的图,这就是 openpos 预处理器结合 controlnet 的 用法。接下来我们来讲解第二种用法,接下来我们就来讲解 controlnet 结合另外一种集成预处理器模型的使用方法。 在这里呢,我们导入一张动漫图,我们在这里呢选择 kenny 硬边缘预处理器。注意了,集成硬处理器里面的文件,它要对应 controlnet 里面的模型, 那么前面我们选择的文件是 kenny 加载 control 模型里面的文件呢?同理也得选择 kenny。 这里的 kenny 呢有非常多种类型,第一个对应的是 sd 小 模型,二三四对应的是 xl 模型, small 模型代表的是体积最小, mid 体积大一点。 for 呢,体积是最大, 也就意味着如果你想要更高的质量,那么你就选择第一个加载器里面的大模型,我们也得选择 sd 叉 l 模型。 我们点击运行来看一下 kenny 的 使用方法。现在我们没有加入任何的提示词,现在呢就已经生成了一张图像出来了。经过 kenny 硬边缘硬处理器对这样图像进行处理,我们就得到了这张图的线条信息。接下来我们就可以在这个线条里面去填充我们想要的画面。 我们来到文本编码,给他写上提示词。一位黑发少女,身穿绿色的衣服和白色的裤子,手里呢拿着一朵蒲公英,背景是蓝天白云和一片花海。再来看一下效果, 这张图呢就已经生成出来了,当然你也可以去调整他的风格,比如说信海城风格,他的背景呢改成一片麦田。再来看一下效果, 你发现这个效果呢,就比之前好看多了。这个就是 k 里硬边缘结合 controlnet 的 用法,接下来我们来讲第三种, controlnet, 结合集成预处理器当中的 deep anything 深度信息的用法。我们在这里选择 deep anything v 二预处理器,先停用,其他节点裁剪器呢,也停用,点击运行来看一下效果。 现在呢,我们就能够看到这张图的深度信息了。关于素材,一般我们选择一些紧逼比较大的,这样呢,深度信息比较明显, 越暗或者是月亮的区域,那么留给爱发挥的空间呢,他就越大,比如像这张深度信息,越靠近镜头的地方,他就越亮,天空呢,他也是很暗,这样呢,他就能够实现重绘的多样化,像建筑的轮廓呢,他就很明显了,所以基本上呢,我们就只能改变他的外观。接着我们再使用这些节点, ctrl delete 加载模型,我们也得选择 deep 模型。大模型呢,我们也选择 sd 叉 l 模型。接着输入提示词,告诉他这是一座现代建筑,有瀑布。外表呢,它是玻璃材质,有很多的绿色植被,有树山丘。这是一个秋天,天气很好, 我们再启动采集器,点击运行,再来看一下效果。我们再添加一个图像预览节点,点击运行,再来看一下效果。 这张图呢,就已经生成了,提示词里面写到的花绿色植被树、玻璃建筑都体现出来了秋天的呈现形式,它是把一些树和植物处理成了落叶的颜色。但是提示词里面写到的丘里没有实现,原因是因为这张图的整体轮廓还是比较明显的, ai 觉得在生成丘里不太合理,所以呢,没有给咱们生成,我们再给他另外一组提示词,这组提示词呢我想看到大海,白云还有瀑布, 再来看一下效果,那么现在呢,我们就能够看到这里的瀑布了,同时呢我们也能够看到这里的海水,那为什么这里的植物这么茂密呢?原因是因为我写的提示词里面是春天啊, 这里的白云,它其实能够非常好的给我们进行呈现,因为这块地方呢,它全是黑的,那么既然是黑的,那么 ai 呢就能够更好的去进行发挥,再把春天改成冬天,再来看一下效果。 现在呢我们就能够看到这个植物上面呢覆盖了非常多的雪,这个呢也是雪,远处的山呢也蒙上了一层雪,可以说 ai 是 已经把冬天的氛围渲染出来了。 好了,以上就是本节课的内容,那么课后呢,大家一定要自己拿着素材好好的去实践,去练习一下,然后呢自己去领悟。好了,这节课呢就讲到这里, 当我们看到一些好看的画面效果的时候,我们自己呢也想做一个类似的风格,那么如何进行画面的迁移呢?今天我们就可以使用空浮 ai 当中的 bash net 节点,结合相关提示词进行临摹同样的风格。下面我们就打开空浮 ai, 先创建一个纹身图框架,双击空排出,先创建一个裁样器, 通过彩样器呢进行拓展,拖拽一下模型节点,创建一个模型加载器,拖拽一下 clip 文本,创建一个 clip 文本, 再复制一个 clip 文本,再拖拽一下 edit, 创建一个 v a e 解码器,拖拽一下图像,创建一个预览图像。 现在最基本的纹身图框架就已经搭建好了,这些节点呢,我们现在先不连接,那么如果是我们要对我们的产品添加背景,那么肯定是需要用到一个局部重绘,那么既然是局部重绘,我们需要用到一个非常好用的节点叫 blashnet, 在 空白处进行双击把 blashnet 加载进来。 blashnet 节点的作用呢,就是专门用来做局部重绘,那么 blashnet 呢,它是要放在采集器的前面进行使用的,我们再拖拽一下这个 blashnet 加载器, 那么既然是局部重绘,那么我们肯定是需要导入我们的图像,在空白处双击给它添加一个加载图像,把我们需要进行局部重绘的素材导入进来。这时候呢,把我们的瓶子素材放进来。 我们的产品图呢是带有通道的,接下来我们需要把这些节点呢连接起来。图像连接节点图像,把这个瓶子的信息给到 flash net 大 模型的模型连接 flash net 的 模型 v 一 连接 v a 一 clap 连接 clap 文本正向提示词连接正面条件负面提示词连接负面条件 bracket 的 模型连接传感器的模型 正面条件连接正面条件负面条件连接负面条件 lent 连接 lent。 下面的步数我们就选择二十,这里的步数指的是采样二十步,一般情况下这个参数呢,控制在二十到三十之间的样子就可以了。 cf 基指呢,我们也选择默认的八 f 基值的作用就是为了让 k 彩样器能够更加读懂提示词。当然这个参数呢,并不是越高越好,一般情况下控制在八到十之间的样子,这里的彩样器呢,我们要选择某 pp 二 m 调度器呢,我们选择 class v 连接 v 一。 那么现在初步的图生图框架呢,就已经搭建好了,但是呢,我们这里还少了一个遮罩节点,我们要知道 bashinet 它的运行逻辑其实就是重绘你的遮罩部分, 也就是说我们接下来要重绘的是这个瓶子以外的部分。接下来我们要做的呢就是把这个瓶子以外的部分变成遮罩。有两种方式,接下来呢就来讲第一种方式,把这个加载图像呢再复制一个, 我们上传一个瓶子的黑白图,黑色部分代表的就是瓶子部分,也就是被扣掉的部分。白色部分代表的就是我们需要进行局部重绘的部分,这张图片它只是一个图像,它并不是所谓的遮罩。 接下来我们要做的就是把这张黑白图处理成 blackinet, 它能够理解识别的遮罩,黑色就是抠掉的部分白色,那自然而然就是需要进行重绘的遮罩部分。这时候呢,我们需要用到一个节点叫图像倒遮罩,把这些节点挪动过来,调节一下它们的位置。 图像连接图像遮罩,连接遮罩,通过图像倒遮罩这个节点的作用,就可以把这张黑白图变成 blackinet, 它能够理解的遮罩。 现在图上图局部重绘的框架就已经搭建好了,接下来呢,我们需要选择适当的大模型和结合相对应的合适的提示词来生成我们想要的视觉效果。因为我们的产品是一瓶香水,所以我们选择的大模型尽可能的是电商类的大模型, 我现在所使用的是电脑运 lucky 哈本,这里呢有海量的模型供我们进行选择。我需要使用的大模型呢,是电商 类的大模型,我就选择这个叉 l 真实写真的电商类大模型,点击使用即可。 最后一个环节就是提示词的描写,这个提示词直观重要,这个提示词具体该怎么写?我们想要什么样的一个产品效果风格?这时候呢,我们可以来到 leible leible ai, 我 们需要根据你自己的产品图找到合适类型的产品图, 比如我想要的是这种风格,那我们就可以点击这样图片,我们可以参考一下他的提示词,复制下他的提示词,可以使用翻译工具读取他的提示词,复制下这段提示词,把这段提示词有关产品的描述全部删掉,把我们想要的提示词翻译成 copy 文本,他能够读懂的英文,我们再复制这段文本,再黏贴进来, 我们再点击运行,再一起来看一下效果。我们运行之后呢,出现了一个错误提示,什么意思呢?它指的是你的基础大模型,是 sd 叉 l 模型,但是呢,你的 bashnet, 它是一个一点五的模型,所以我们需要把加载器里的模型呢也改成叉 l 模型,我们就选择这个叉 l segmentation 模型, 再次点击运行,经过几秒的等待,我们这张产品图的洗图就完成了。整体来说效果还是不错的,不管是光影的处理,还是环境的融合交互,都是做的非常的不错。如果你想让康复 u i 有 更多的发挥空间,你还可以去尝试调节降噪值来达到我们想要的视觉效果, 这个是降噪值为零点八, cf 值为十的视觉效果,这个是降噪值为零点七, cf 值为八的视觉效果。 卸负基值呢,你尽可能的就控制在八到十五之间。降噪值呢尽可能的控制在零点七到一之间。 我们现在所讲的是第一种局部重绘,给我们的产品添加背景。接下来呢来讲第二种局部重绘的方式,把这两个节点呢删掉。接下来我们要用到一个非常强大的插件叫 l style, 那 么 l style 里面呢,有一个非常常用非常强大的一个节点,我们找到这个节点, 来到图层遮罩,这个节点就 segment anything ultra vr。 那 么这个节点的作用呢,就是用来抠图,把这个香水的图像呢取消掉,我们把产品图的图像连接给他。接下来我们要做的呢就是把这个瓶子抠掉,所以呢我们在这里输入 bottom, 下面呢我们要知道以下功能的具体用法。首先来看一下 sim 模型,这里面呢有非常多的选项,这个内存越大,代表的是它抠出来的效果,越精细,越精致,升图的质量呢也越高,升图时间越长, 当然对你的电脑配置要求呢也越高。如果你的电脑配置在不高的情况下,比如说你的显存是八 g, 那 么你就选择第三个大模型,它的体积很小,运算速度呢也非常快,像我的电脑是四零七零的显卡,显存是十二个 g, 一 般情况下我就选择这个 格洛里模型呢也是一样的,模型体积越大,生图质量呢也越高,一般情况下我们选择第一个就行,再看一下这个细节处理方法,一般情况下我们选择第一个就好了,第一个模式相对于以下几个模式生图质量最高,细节消融,细节膨胀,他处理的都是一些细节性的一些东西, 那么由于这个素材呢,它的轮廓非常的清晰明显,那么这个参数哪怕是你加的很大,它的效果呢也并不是很明显。关于这个细节,笑容,细节膨胀,郁卒等以下几个参数呢,我后面呢会专门的用一个案例来进行讲解这些参数的功能属性,具体怎么去用 上面这参数呢?我们可以默认的调整到实参数越大,那么细节他处理的越精细。细节处理呢,很好理解,就是如果你想要我的细节更加的丰富细腻,那么你就把这个功能打开。 提示词呢,很好理解,就是你要抠掉什么,那么你在这里呢就填写什么,比如我现在呢,我要把这个瓶子抠掉,那我在这里就输入 bot。 这里的设备呢有两个选项,一个是显存运行,一个是 cpu 运行,那我们在这里呢就选择显存运行, 这个最大尺寸呢,先不用管它,下面这个 cancel model 指的什么意思呢?就是如果你的显存不够的情况下,你打开这功能,它会用你的运行内存来进行计算。接着呢再把这个图像连接到图像,接着遮罩,连接遮罩,点击运行来看一下效果。 现在剩下的图并不是我们想要的结果,仔细一看的话,你会发现现在局部重绘的是瓶子部分,但是我们要重绘的是瓶子以外的部分,也就是说明我们在遮罩这里出了问题。 刚我们讲了 sigman anything ultra, 这个节点的作用呢就是进行抠图,让图生成遮罩,我们一起来检查一下这个遮罩,在这里呢加上一个遮罩到图像,遮罩连接遮罩,图像呢连接预览图像, 再次点击运行。通过这个预览图像,想必大家都已经看明白了, sigman anything 把这个瓶子扣下来之后呢,瓶子变成了遮罩。 前面我们也讲了 blacknet, 它的运行逻辑就是重绘白色遮罩,所以我们得到了现在的结果。但是我们要重绘的是瓶子以外的部分,也就是说接下来我们要把瓶子变成黑色,瓶子外面的黑色变成白色。这时候呢我们就用到另外一个节点,我们在这里呢加上一个遮罩反转节点, 遮罩连接遮罩,这个先删掉遮罩,再连接遮罩。通过遮罩反转节点,我们就可以把遮罩的颜色调换过来,我们给它添加一个遮罩的图像,一起来观察一下, 再点击运行,看一下效果。现在我们能够看到这照的颜色反转过来了,剩下的图呢也正常了。以上就是本期视频内容,通过两种局部重绘的方式给我们的产品更换背景。好了,如果本期视频对你有用,千万不要吝啬你的小爱心,咱们下期再见。

地表最强开源 ai 工具 comfyui 来啦,可以免费调用所有大模型,以实现文胸图图声图文胸、视频音频克隆、 ai 模特换装、影视人物替换等所有 ai 功能。今天老八出一期 comfyui 最详细的安装教程,让宝子们也能在本地一键部署。 我们首先进入 comfyui 的 get 补官网, 点击右下角 releases, 目前最新的版本是零点二,一点一 点开下面的 asus, 如果你是 amd 显卡,就下载后缀带有 amd 的 整合包。如果你是核显,就下载后缀为 intel 的 整合包。如果你是 n 卡用户,且为最新的五十线显卡,选择后缀为 nvidia 的 整合包。 老版本的 n 卡用户选择后缀为 c u 一 八二六的整合包,点一下即可下载。这里老八就选择后缀为 nvidia 的 整合包了。 当然嫌麻烦的用户可以到老八的公开群或视频简介链接领取。博主也把本期用到的所有工具都打包好了,下好之后用 bandits 皮解压工具解压到英文路径下面,注意不要带有中文。 这里博主也准备了解压软件的安装包,双击安装即可。 然后我们安装 get 工具,打开博主给的这个包,双击里面的 get 安装包,一路默认安装即可。 然后我们把这两个 comfyui 必备的节点管理插件和汉化插件放到 custom nodes 文件夹下面,插件路径一定要放对呀,不然加载不出来, 这样这两个插件就安装好了。 然后我们来到 comfyui windows portable 文件夹路径下面,双击 run nvidia gpu 启动程序, 初次启动会自动安装相应环境,耐心等待即可, 如果没有自动跳出这个界面,可以来到控制台这里,找到这个网址,复制到浏览器里即可。 现在我们就来到了 comfyui 的 工作界面了,我们点击左下角简单设置一下。首先我们点击画面,这里可以选择连线样式,大家自行选择。 然后来到节点这里,把这三个全部改成显示全部,这样节点信息就好显示在工作流里。 老八现在就给大家简单演示一下 comfy ui 的 纹身图功能。我们来到 liblib 这个工作站点,选择图片模型,右边筛选和老八一样就可以了。 找到一张你们比较满意的图片。首先点击右边的下载按钮,下载对应模型, 选一张你们想复刻的图片, 这里是正面提示词, 这里是负面提示词。将提示词复制到工作流里面, 照着这个推荐参数调一下彩样器, 然后把下载好的模型放到这个文件夹下面, 然后进入 comfyui 工作台,点击左上角菜单编辑,刷新节点,自定义,这样模型就加载进去了。我们选择模型,点击生成这样一个简单的纹身图,工作流就跑通了, 点击左边资产右键即可下载到本地。 好了,这期教程就到这里,麻烦宝子们点个关注支持一下。后续老八也会做一些声音克隆、人物替换、人物转会、视频生成等的工作流供大家使用。大家先来安装一下 comfy ui 吧,本期视频用到的所有工具也已经准备好了,进我公开群或视频简介领取。

最新出的 comui 九点五版本它来了,搭配了各种好玩有趣的模型和工作流,可以说是对新手小白非常好上手。 那么为什么要用 comui 呢?首先它是一款免费使用的 ai 工具,搭配着节点化的工作界面,使用起来非常高效,拒绝死板化的工作流程。 其次就是所能使用的功能非常多,无论是生成图像或者生成视频都有着非常好的体验,社区中已经有了很多好的作品可以欣赏,具有良好的社区生态。 那么该如何使用呢?首先将我们的 v 九点五整合包下载到电脑上,下载好之后,用鼠标右键点击这个压缩包,在弹出的菜单里选择解压软件进行解压。这里有一个非常重要的点, 请一定要将文件解压到一个没有中文的目录下,也就是你的硬盘路径里不能出现中文字体,以免后续运行出现报错,静静等待解压完成就好。 解压完成后,咱们就可以准备打开了,在解压出的主目录里找到并双击那个粉色头像的会式启动器图标, 双击打开后,电脑会首先为你弹出一个图形化的秋叶启动器控制台,在这个界面里,我强烈建议大家先点开左侧的高级设置看一眼,确保系统已经准确识别,并且选中英伟达独立显卡。 确认无误后,点击右下角的一键启动按钮,点击之后,后台会弹出一个黑色的代码窗口,开始狂飙数据。 这期间系统正在为你自动唤醒底层环境,并加载内置的五十多个精选插件,大家只需要耐心等待几秒到几十秒,他就会自动唤醒你的电脑默认浏览器,直接把你带入康复 ui 节点操作区。 当浏览器成功弹出带有网格和各种连线的深色界面时,恭喜大家,你已经正式推开了 ai 创作的大门。咱们这个 v 九点五整合包最大的魅力就在于把复杂留给底层,把简单教给你,你完全不需要从零开始去学习怎么连线, 直接在界面里点击加载预设好的最基础纹身图工作流,咱们来简单跑个测试看看效果。你只需要找到一个在上方的文本框, 输入你想描绘的画面,比如简单敲上一句一个女孩毛衣白色背景,然后在下方文本框里填上诸多模糊、低质量机型之类的排雷词汇。接着点击界面上的运行按钮, 这时候你会看到屏幕上的节点开始依次亮起绿色的光效。得益于咱们非九点五底层强大的环境优化,仅仅几秒钟的功夫,一张光影细腻、质感拉满的美女照片就会在最终的图像节点里生成出来,整个过程丝滑流畅,完全不需要你懂任何深奥的代码原理。 当然,这种基础的纹身图仅仅是个热身。咱们这个 v 九点五整合包真正的核心资产是里面为大家精心预制的两百多个大师级精品工作流。这些工作流的特点可以用四个字来概括,那就是开箱即用。 以前大家在网上找工作流,最怕的就是导入进去后满屏飘红,告诉你缺这个节点,少那个插件,折腾半天都跑不通。而在咱们的整合包里,几十个核心插件早就为你配置的明明白白, 不管你是想做高清的图生图,局部重绘,还是想玩点高级的 ai 换脸、数字人对口型,甚至是去挑战目前最前沿的视频生成模型,这里面都有现成的模板供你直接调用, 那么你赶紧去自己动手试试吧,最适合新手小白入门的 ai 视频生成入门教程准备好了,你是不是还在想入门 ai 视频, 但是却被各种充值订阅拦住了脚步,花钱购买的订阅压根生成不了几次。今天这款免费的视频生成软件 comfy, 无论是获取软件还是使用软件,绝对是完全免费的,要收费是完全不可能的, 同时还是国内使用人数最多的开源 a 软件,包含图像视频、音频、模型生成等等功能,掌握了这款应用,你将对 ai 生成了如指掌。而今天我就给大家准备了一套完整的 ai 视频入门教程,让我们来看看里面有哪些功能, 就比如说最基础的文声视频、图声视频、首尾帧 视频、动作迁移视频、高清放大视频换脸这些功能都非常的实用。 那么这款软件的安装包和模型工作的文件在评论区里面自己去拿就行了。像这里如果你得到的是一个这样的压缩文件的话,我们直接右键点击 将这个压缩包呢进行解压,位置呢最好选择在比较空的硬盘里面,解压好之后呢,我们直接点击这个启动器,然后点击一键启动即可。其实要注意我们的软件路径里面最好不要包含中文,这里为了一个演示的话, 我就没有进行调整,那么他就会在我们的默认浏览器里面弹出这样的一个界面,然后你再按照我的课程视频要求,将模型插件工作流下载好,就可以放心使用了。更多内容就等着你体验,不要忘记在评论区领取资源哦!

经过几天的不懈努力, amd 显卡专用的 comui 机制整合包终于成功了, 今天来讲两点,第一个就是关于机制整合包的简单介绍,第二点就是通过视频演示告诉大家怎么样去安装这个机制整合包。首先来看一下安装手册,这个手册我会也上传到网盘,大家到时候下载。 大家在网盘里面记得把之前所有转存过我网盘里的文件全都删掉,之前的工作流也全部都删掉。工作流的话,我的整合包里面已经带了二十四个全新优化过的 工作流,然后的话模型的话我也做了一些调节,你把之前下载过的也就算了,如果说你在网盘里面转存过的话,直接全都删的干干净净,重新转存就可以了。 讲一下机制整合包的简介,机制整合包告别了之前繁琐的安装步骤,一键安装就可以了,不需要你再去安装那些小的插件呀,或者说联网去安装一些什么东西了。 它自带了二十四个最新优化过的 md 专用工作流,这些工作流我在之前已经拍过视频都讲解过了,可以看一下之前的视频这些工作流怎么样使用,而且内置了测试的图片,每个工作流的测试图片我也已经内置到里面了, 整个安装过程的话全部不需要微网的支持,而且安装完了以后,如果说你要在一个离线的电脑上使用的话也是可以的。然后是尝试科普, 第一,你的整合包安装完毕了以后,你先去跑一个图片,测试一下整个 comfui 是 否是正常工作, 如果正常工作的话,你再去跑别的东西。这整个 comfui 的 整合包我是在 win 十一的系统下分装和测试的,如果是其他系统的话,你要自行去测试。 整个机制整合包安装的话, comui 只是个工具,我在里面虽然配套了工作流,但是里面所需要的模型你还是需要去自己下载的,如果说第一次使用的话,模型怎么样安装,安装到什么位置,工作流怎么样使用的话,还是去看我的教程。 第四点也是最重要的一点就是不要盲目的使用网上的这些工作流。如果说你拿到了一个工作流以后,你先要看一下它里面要让你补全的是哪一些节点, 因为现在很多工作流的节点他都是在 n 卡的基础上写的,他有一些节点 a 卡是不支持的,等你安装完这些节点,你的整个 comfui 也就坏掉了,因为有一些依赖已经被替换掉了,这个大家一定要注意。 最后的话就是机制整合包的整个安装步骤,第一点的话要下载最新的机制启动器,这个的话我会在网盘里面上传,然后下载整合包的话,一定要看一下整合包的名称,你是什么样的显卡,就下载配套的整合包,如果说你下载错的话,安装的话也是会报错的, 那么正式开始教程,首先下载最新版的机智启动器,五点一点二,然后的话下载整合包,像我的话是 r d a 三,因为我是七九零零叉 t 叉下载这个整合包。整合包下载完了以后是一个没有图标的文件,你右击整合包, 然后选择打开方式,在打开方式里面选择其他应用, 然后往下拉,在下面在电脑上选择应用,我们选择桌面,选择我们刚才放的机制启动器,选择打开,这时候我们选择始终, 这样的话,机制启动器就等于是跟我们的机制整合包已经匹配完毕了,匹配完毕以后,我们关掉机制启动器,找到你需要安装这个整合包的硬盘,在硬盘的根目录新建一个文件夹, 比如说叫 arwork, 打开文件夹,将我们的整合包剪切进来, 剪切完毕了以后,我们打开机制启动器, 在本地局设置右上角选择主目录,选择我们刚才新建的那个文件夹。 arwork 选择完毕了以后,这时候点击机制整合包,他就会侦测到机制整合包,这时候我们选择覆盖安装,这个过程可能比较慢,取决于你的硬盘读写速度和你的 cpu 运行速度,我们一直等他安装完毕,中途不要乱操作, 等到下面提示你安装成功了以后,我们点击退出,点击完退出以后点左边的刷新环境, 刷新完环境验证通过,这时候我们点一下我的显卡,记住我们的独立显卡的编号,像我的话就是一,如果说你没有开通集成显卡的话,大部分人都是零,记住点击启动参数设置,在这里修改显卡的编号, 效果是一大家的话是零的话就修改为零。最后面服务与通讯里面勾选自动打开网页,这两点勾选完了以后,第一次我们只勾选这两个参数,选择显卡自动打开网页,其他都不选,点击保存脚本, 然后点击一键启动, 网页已经自动打开,说明我们的整合包已经安装完毕,这时候我们可以看到下面有很多黄字,这些黄字呢?还有这些黄字都只是一些提醒,我们在误报屏蔽里面把它屏蔽掉,这里面有一些是节点的通知,有一些是官方 comui 的 通知, 屏蔽掉,屏蔽掉,这时候的话我们停止 comui 选择模型目录,在本地全区设置 文件夹管理模型目录这个地方,这个时候你有两个选择,第一个就是把你已经下载好的模型移动到康维恩目录里面来,这个是不太推荐的。 还有一个就是选择目录,选择你现在存放模型的目录,选择完了以后选择一键转移,这样的话以后就算康维恩被你删了,他也不会把你辛辛苦苦下载的模型删掉。等移动完了以后,我们重新启动康维恩, 打开网页了以后,我们首先来进行一个纹身图的基础工作流的使用,在前面选择好自己的模型,然后点击运行, 没有任何报错,已经跑成功了,这就证明我们的整合包已经在本地完美的安装,完美的适配。 现在来讲一下这里面匹配的二十四个工作流,工作流的话我在这里面放了二十四个,这二十四个工作流都是之前我已经拍视频都讲过的一些基础的工作流, 大家可以正常使用,全都是对 amd 显卡进行过优化的。然后下面这里有个模板,模板里面大概有几百个工作流,但是这些工作流的话, 有一部分你是可以使用的,有一部分你可能不能使用,还是我刚才讲的那一点,你选择了这些工作流以后,一定要去看一下这些工作流是不是适合于 a 卡,他有些节点补充的时候,千万不要到时候把你的那个环境给搞坏掉了, 这里面的工作流有成本上千个吧,这也就是很多整合包骗人的地方,他就说他内置了几百个工作流,其实这个根本不是他内置的这些工作流都是康非 u i 官方做的一些工作流, 所以说大家一定要谨防上当受骗,说什么内置了几百个工作流,什么一 g 险从,两 g 险从爽玩的那些都是骗子啊, 卖课给大家的,大家千万不要去花钱去买课,那些课都是骗人的,如果实在要花钱的话,就闲鱼一分钱去买,一分钱也能买得到。那么讲完这个我们再来看一下整合包, 现在的整合包的话,我做了五个版本,其中三个版本就是六系显卡专用,七系显卡专用、九系显卡专用,还有一个就是通用的,如果说安装这三个专用整合包,有的人会出现报错的话, 下载这个通用整合包,这个通用整合包安装完了以后,直接再去手动安装 l、 c、 m 就 可以解决报错的问题。大家安装完整合包以后,一定要在评论区里面给我反馈你是什么显卡,你安装成功了没有?你安装的时候有没有遇到什么问题? 因为我现在这个整合包是第一代的整合包,里面肯定有一些瑕疵和不完美的地方,为了第二代和第三代整合包的完整和完美性,大家的意见我一定会广泛的采纳的,这一点非常重要,一定要积极的反馈。那么今天的视频就拍到这里。

只需要输入一句话,就能一键生成视频上传图片,再搭配提示词也能快速成片。更厉害的是,随便一张人像照片都能自动开口说话,表情和嘴型都特别自然,画面流畅不卡顿,导出画质也非常清晰。关键是不用注册,不用登录,没有次数限制,随便创作。 不管你是拿来做短视频素材创意剪辑,还是平时剪视频备用都特别合适。那么你是拿来做短视频素材创意剪辑备用都特别合适。那么你第一个想拿它做什么呢?赶快在评论区回复六六六尝尝咸淡吧! 在这节课中,我们将深入探索纹身图的奥秘以及提示词的语法规则,让你在使用 ctrl u i 时能够更加得心应手的创作出理想的图像。 课程我会以笔记的形式整理记录下来,这里我把它分为图片加载、模型加载工作区和视频输出区。我们只需要拖入图片,输入你视频要呈现的画面关键词,接着点击执行, 稍等一会儿就会得到你想要的视频了。本地部署的操作空间很大,小伙伴们可以自行研究更多玩法。

如果咱们有大量升图升视频的需求,一般是建议上 pro 六千的方案,因为它不仅是可以装 one 二点二以及 l t x 二点三这样的一些升视频的模型以外,它还可以支持一个多人的并发去 使用,所以它的整体的效率和效能是非常高的。但是现在奈何 pro 六线涨价真的太离谱太夸张了,整套机器下来怎么造也要十万往上加,所以我在研究有没有一套便宜和性价比高一点的方案,输出视频质量也要非常的 ok。 接下来给你们看一下五零九零这套本地大模型去生成视频,他的质量到底怎么样?这是我用 rtx 五零九零跑出来的视频,这套康费 u i 工作流几分钟就能生成,本地无限制批量输出, 像这样复杂的人物动作也不会变形,可以模拟真人与物体的交互,支持 low 训练模型,可以让你的想法完全被实现,而且没任何后期消耗, 使用起来都是傻瓜,操作基本没任何难度。然后就是根据这样一张图片给他去生成一个视频,这是现在我们正在给某个咖啡厅的一个老板做的这样的一个 ai 的 一个视频生成,到时候我们所有的这一些, 嗯,结构和他的这工作流是直接给到你的,直接把你自己需要的照片和产品替换进去,就可以生成像我这样的一个视频, 全程下来的话也就是一到两分钟左右 pk 跑一百条完全没有任何问题。另外还有像这种有很多 sku 的 产品,像手表、衣服、包包、鞋子,那我只需要给这张衣服拍一个高清图,那么根据这张图我就可以给他配不同的背景,不同的模特,不同的姿势 场景,全部都可以去自由的去匹配。而且很重要的一点就是后期是没有其他任何费用的,他是不消耗任何一分偷看的,因为所有的模型都只在你的这台机器里面直接去跑。不过你也想实现视频自由,那这套方案可以尝试一下。

兄弟们, z m h 是 一款拥有六十亿参数的完全免费的高性能图像生成模型,升图速度快到飞起,而且支持无内容神查和 n s f w 内容,画质达到专业级,以中文提示词理解也是非常到位。 我们打开看一下它的升图速度和质量,可以看到仅仅在一千零二十四的分辨率,无论是速度、画面细节一次成 下水准都是相当不错的,覆盖人物、动物、汽车等多领域。生图我现在用的是 kufy 整合版本,即开即用,非常方便。我已经将工作流和学习文档都打包好了,想体验的小伙伴暗号抱走哦!
![[VibeCoding大赏]手搓一个本地免费AI影视工厂 #vibecoding大赏 #ai新星计划 @抖音科技
还在为AI影视的高成本和复杂工作流头疼❓
我自己VibeCoding了一个「Film Studio」工具,把ComfyUI、大模型、视频生成全流程打通了。
✅ 核心优势:
支持本地跑模型,不花一分钱
不用学复杂的节点和连线
从剧本、人设到分镜视频,一键生成
甚至还能做电商带货视频
推荐12G以上显存设备,8G能跑
#AI影视 #AI工具](https://p3-pc-sign.douyinpic.com/tos-cn-p-0015/oIriQoFaudaCFi2HBDDAQ6Rw7yUAfCZBmfEaf7~tplv-dy-resize-origshort-autoq-75:330.jpeg?lk3s=138a59ce&x-expires=2096607600&x-signature=7BfKgDUqL4%2BtJBAZKIRWdkocwHk%3D&from=327834062&s=PackSourceEnum_AWEME_DETAIL&se=false&sc=cover&biz_tag=pcweb_cover&l=202606121527180CFDD22BE68B9E72BCC4)
张伟老师,要不咱们还是用第一版吧,我刚翻硬盘翻到了那份原始文件,真的好喜欢那种感觉。 好的好的,听你的就行。哈喽,大家好,我是凡同学, 今天给大家展示我东国外部定制做出来的一款用于制作 vr 影视作品的一个小工具,目前暂定为 film studio, 启动的话就比较简单,直接点这个 start bet 就 可以。我制作它的目的主要是为了降低我们制作 ai 影视短剧的一些成本。 目前有的制作 ai 影视作品的工具大部分都是调用的第三方 api 来实现,然后特别像什么 cds 啊这些价格提高之后,对于质量要求没有那么高的用户,它的性价比就下来了。那我这款产品主要是为了通过本地的 comuai, 要用开源的大模型来实现一个本地的图片还有视频的生成,这样就可以极致的压缩我们的成本。首先我们在设置里面可以设置一个大模型的配置,这个主要是通过那种大域源模型, 让他来帮你生成各种各样的提示词。第二块是 cfui 的 一个连接,目前我支持的有三种方式,一个是运行这个产品的设备同时在运行 cfui, 那 我们这边就直接可以写 localhost 就可以了,端口和你的康复 ui 保持一致就行。我这边一般使用的是秋叶的启动器,我们可以在高级选项里面 监听设置里面可以看到它的端口。此外我还支持了局域网,也就是说处于同一个局域网下的设备可以互相调用,我们只用把这里的 host 地址填为运行康复 ui 的 台地址的 ip 就 可以,下面是一些工作流的验证。 康复与 ai 的 问题主要是在于他的学习成本会比较高,各种连线还有各种插件,调试起来特别复杂,那通过我这款产品的话,就相当于是我把这些东西调好,然后通过我们的产品直接调用就行了。 首先我先讲一下我这个产品的第一个核心功能叫快速创作,这是一个比较简约的功能,我们可以直接在这里和 ai 进行沟通,比如我们可以简单的说一下我们的需求,让他做一个这种海报, 这个时候我们可以让 ai 来生成两组提示词,这里是我们选择的视觉风格,我这边已经预制了一些风格,当我们调研大模型来生成提示词的时候,他会参考这些,这里要展示我们的任务队列,让我们知道他的一个运行状况。好的,现在他已经生成了两个方案, 可以随便选择一个,选择完之后你也可以在提示词这边进行一个修改。下面是我调试好的一些康复 ui 的 生图,工作流我们选择默认就可以,然后这边可以设置尺寸,在这样点击生成的时候,他就会调用我们康复 ui 的 工作流来进行一个图片的生成。 相比起去学习康复 ui 的 这些参数设置,还有连线还有工作流,咱们这个产品的设置像就会少很多,大家都应该看得懂, 可以看到他已经生成过来了,然后同时会把我们生成的图片保存到本地,这里除了图片以外,还支持着生成视频, 一样的,也是可以在这里写我们的需求,然后在这边获取提示词,然后进行修改。你如果有一个比较合适的提示词,也可以直接在这输进去,然后进行生成。 下面是一些设置条件,然后针对一些搞电商的朋友们,我单独的做了一个电商视频的流程。电商视频的话,我们第一步其实是上传商品图, 比如我上传这一张图,我需要的是他的上衣,然后我们刚刚上传的那张图片其实不是白底图,所以我们需要提取他的上衣。这里可以写一下你对你创作视频的一个简单描述,比如你想把它卖到欧洲去的话,那么我们肯定是把模特要改成欧美的人,我们就写简单一点, 这里也可以设置我们的分辨率,还有帧率和时长,这边设置完成之后,直接点击生成就行了,因为这个产品他调用的是本地的康复 u i, 所以 说他的生成效率是跟你的电脑设备有关系。 推荐的话,十二级以上的显存的设备都可以正常的运行,因为我自己就是用这样的设备来进行调试的,如果你的设备更好的话,他的效率会更高。 大家可以看到我的提示词里面其实没有写一些具体的场景描述,但是我预制的系统提示其实都已经加入了一些场景的描述。这个是我上传的原图,这个是生成的图片, 首先它会生成一个手针的图片,大家可以看下效果,如果不太合适就重新生成,如果确定没问题,你就可以点击确认并生成视频。当然你也可以对图片进行一个编辑, 我们这边可以再描述一下你想对图片进行一个怎样的编辑,比如说这样没问题的话,我们就直接确认笔生成,大家可以看到我们这边生成的手印图和我们的服装是比较一致的, 但是颜色有点不一样,主要是因为他这个光影会融合到这个环境里面。如果说你有些特殊的要求,你可以直接在提示词里面写的更详细一些。现在生成好了,他的速度比较慢,主要因为我开了一些录屏的软件, 会占用不少的一些内存和显存。如果说你通过局域网来调用一台专门跑 comui 的 设备的话,它的整个效率会提高很多。我们来看一下效果, 可以看下效果,还可以上传好的视频会存到 quick video 里面。快速创作是这个工具里面的一个小功能,这个产品的核心功能还是辅助我们来创作 ai 影视作品,我可以新建一个项目给大家从头演示一下, 我现在也没什么想法,然后直接让 deepsea 帮我生成了一个小故事,这些字段可以不填,但是填了会更精准一些。填写完成之后,我们直接来点一下 ai 完善故事。好,现在已经完善好了,我们再去看一下剧本, 在剧本页里面,我们直接点击 ai 生成剧本就可以,因为我们生成是比较短的故事,所以它剧本就只有一场。 这边我们可以对剧本进行修改,也可以插入新的场次。当我们插入新的场次之后,你也可以直接在这边输入一个大致的内容,然后让 ai 帮你润色一下。现在有了故事和剧本,下一步就是要设置我们的风格,我在项目里预设了这几种风格, 上面是真人的,下面的是一些动画,还有其他的风格。如果你觉得这些风格不太合适的话,你也可以去选择自定义风格,这个时候你可以按照你自己的需求来选择这些类型,由 ai 来扩写一下风格提示词, 当然你也可以自己来写提示词,写完之后你这边可以生成样图,就是按照你的那个风格提示词, 就可以看一下他的风格效果是否合适。一般的话我们就用预设风格就够了,现在就直接选择这个。选择完风格我们就可以来获取一下元素,也就是我们这个短剧的一些资产,包含人物、物品和环境,可以一键生成。 他会从剧本里面提取一些觉得比较关键,或者说重复出现的一些元素出来,如果觉得不满意,你可以重新生成。 这些东西其实并不是必要的,只有那些出现频率比较高的,你才有必要去把它单独的设计出来,那比如男主这样的话,肯定是需要单独的设计。 首先我们需要先选中里面的人物,然后点击为选中,像生成提字词和声音,当生成完成之后,这个地方就会填入他的提字词,有了提字词我们就可以来生成他的人物图片了,可以直接点击生成,也可以点击批量生成。 这个这个有点太夸张了,我们调整一下提字词吧, 因为贴纸里面有这个长期熬夜眼袋和明显黑眼圈,这里改成轻微的吧, 现在生成好了,有了这个二宫格的图片之后,我们可以再生成多视角图片,但是为了方便看的更清晰,我们可以他进行一个裁切,一个是正面全身,另一个是面部特写。 好,现在它生成好了,可以看到一致性保持还是挺不错的,服装啊,外貌啊,脸型都还行。然后这里有一个整合参考图, 我们后面生成的时候可能是以整合参考图发过去,让他进行一个参考,我们可以自动整合,也可以手动编辑,建议是手动编辑吧。 像这个已经裁切过了,所以我们就不用裁了,可以直接把它全图添加就行,脸部也是,我们自己就在这个画布上,把它摆到合适的位置就可以了。侧面图我们可以再裁切一下,框选出来裁切后添加点这个,他就会裁切过来。 像这一张我觉得是比较不错的,可以把它放大一些, 这样就生成了一个人物多视角的参考图,这边会同时生成他朗读的文案,我们可以把它改短一点,然后点击生成设计音频, 可以听一下他的声音。这版又没过客户说再大气一点,可我连自己都快撑不住了,感觉声音还可以。同样这个人物是没有出镜的,但是他有声音,所以我们这边也可以设计一下,也改短一点,可以听一下 张伟方案。客户那边又催了,明天早上九点前必须交哦。加油加油,你最棒的吗?大家自己做的时候可以再调整一下这里面的提示词。 接着我们到分镜脚本这边,可以直接生成分镜脚本,因为分镜脚本生成的比较慢,我这边就提前生成了,然后我们需要选几个场景生成提示词。可以这个按钮是从剧本来同步台词,但我后来已经优化过了,所以说这个之后会把它去掉,不太需要这个 分辨率,咱们可以调成幺二八零,如果你的设备比较好的话,配置比较高,你可以选幺九二零,可以看一下它的提示词。 像这种纯场景的镜头,我们就可以用直接像这种纯场景的镜头,我们可以直接用纹身视频就行,不太需要用图片来控制, 那我们就直接用他的这个提示词来试试。生成视频,这里可以选择不同的生成视频方式,这里的描述就是镜头的描述。好,现在已经生成好了,我们可以打开看一下, 如果没什么问题的话,这个视频就会在这里视频管理里面展示出来,可以直接打开目录就会生成到这个文件夹里面,当然你也可以重新生成,重新生成一个新的视频, 换一个镜头试试。一般有男主的话,我们就尽量使用图生视频,或者说首尾帧生成视频,这样控制能力会更强一点。我们先生成一下参考图看一下, 我们可以看到这个里面的人物和我们自己所需要的人物是不一致的,所以我们选择生图的时候,除了纹身图还可以选择这个参考图,这里可以选择我们之前生成的那个多视角的参考图,先把它删除一下, 然后这里再点击生图,这样他就会尽量生成跟我们参考人物一致的人物出来,这样他就会尽量生成和我们参考人物一致的那种人物图片出来,这个人物和参考图的人物相似性还是比较高的。另外一种做法就是我们直接进行纹身图, 你看生成了这样一张图片之后,我们进行一个人物的替换, 这里可以说把人物的脸部替换过来,我们选择这张图是图二,原来这张图是图一,然后再点击生成图片, 可以看到已经替换过来了,那我们确认替换原图就可以,就变成了我们的那个一致的人物。这里包含一个音频,我们可以生成一下那个音频, 然后生成音频,好的好的,听你的就行。我把这里的台词改了改,然后把时间拉长一点,拉到四秒,我们看看这个好的好的,听你的就行。现在我们可以看到 好的好的,听你的就行。其实后面是有对上嘴型的,想了想主要原因可能是因为我们这张图片他是一个闭着嘴的,然后他还没有对上前面的这个这两个词的时候,时间就已经结束了。 所以这种情况下,我们可以把那个旁白前面可以多加一些省略号,让他留出一点时间出来,然后再加好的好的, 这样时间可以拉的长一点,他就有更多的时间去调整他的那个嘴型。看一下刚才的幺九二零乘幺零八零的,这个质量就挺高的了,看这个清晰度和质量就可以直接拿来用了。好的呢, 这个也是幺九二零的。好的呢,这个是幺二八零的。好的,听你的就行。 其实幺二八零的也还可以,这个清晰度好,那现在演示了纹身视频,还有图生视频,还一个是首尾针来生成视频,其实差不多,我们把这里改成首尾针,首尾针的话你就需要再设置一张图片, 把它设置为尾帧,然后生成就可以了。后面就是你所有生成的那些视频,会按照分镜来给你分类,这边叫分镜一生成的吧,这是分镜六生成的,有多个你就会展示出来,你也可以直接把它删除。那这个产品所支持的功能就是这样的, 这个产品目前已经打通了整个流程,从故事的设计到剧本的生成,接着就是视觉风格的选择, 后面是里面关键人物物品环境的一个设计,到下一步的分镜脚本,里面包含了图片的生成,还有还有各个分镜脚本视频的一个生成。 所以我的这个产品对于想降低 ai 生成视频或者说图片的成本的朋友们来说,应该还是比较容易上手的。当然由于我们这个产品嗯可以支持本地跑那些模型的话,那么你还是需要了解一些康复 u i 的 一些配置, 至少你要知道 cfui 的 模型和插件怎么下载,后续我也会考虑是不是把它整合到我们这里面来。当然整合整个 cfui 可能不太现实,但是我可以包一层,把模型的下载插件的安装集成到里面来,这样的话应该能够让大家更加容易的使用这款软件,感谢大家收看。

哈喽,大家好。为什么觉得学 comfy ui? 嗯,就是现在去学 comfy ui 可能并不是那么划算。嗯,大家可以看一下,就前段时间中国爆出那个六代战机嘛,然后我就,哎灵机一动,我就想能不能用这个爆出来的图来想象一下它真实的样子是什么样,然后它给了我这样的结果。 对,呃,就大家如果了解开源模型的话,可以去想象一下,如果说你要达到这样的效果要花多长时间,我大概花了十分钟不到,我就拿到了这样的结果, 就我觉得时间的效率是非常重要的。当然有些朋友在说有些平台不能过时的内容,那我觉得你生产那样内容也没有商业价值啊,对吧?就是为什么要去生产这样的内容,所以我就我是没有这个需求。 对,包括有些朋友说什么批量化的去生产内容,他觉得,嗯,用本地比较合适。那确实比较合适,但是我是一个用想要用 ai 做视频的人,我没有批量化的需求,我是一个个性化的,就是创作的需求,所以我觉得闭眼比较的方便。那有朋友就是问了,那我应该怎么去学习呢? 哎,首先我我也在学习当中,所以我好像没有那么强的资格来说,但是如果硬要问我的话,我觉得就是去用,然后去 去用它,去做你想做的东西。其实我也跟朋友交流过,他觉得其实 ai 时代来了之后,感觉好像这个事情变简单了,其实这个事情是变得更难了,因为你需要去自己搭建出整个故事的世界观,你要去 懂美术啊,知道什么是好看,你要懂剧情,然后就是因为所有的东西都变得可以让你控制,那你就要把一这些所有东西就跟木木桶一样吗?就是你把每一个版都不能做的很短,那最后才能拼出来一个比较优秀的作品, 所以其实这个对人的要求是变得更高了,我们以前是拿到素材去处理加工就可以了,作为一个剪辑来说,至少那 现在是你的素材是你自己创创造的,你的世界观是你自己创造的,然后你还要去把这些剪辑成一个片子,那这中间需要用到的技能,如果说你想用它做视频,或者说作品品牌宣发视频, 那你你想这个里面需要的技能难道是怎么用模型吗?难道不是你的想象力,你的文学功底,你的 嗯,审美,对吧?就是是是这个这方面的综合能力,而不是说我要去学这个模型怎么用,当然你要知道它应该怎么用,比如说, 呃,你要知道每个模型的长处是什么,它有什么特点啊?那我要实现这个效果的时候,用哪个模型来的效率最高,以及呃,模型会有哪些短板?我在写剧本的时候我就需要去避免这样的长板,那是不是能利用这样的长板? 呃,比如说有些模型它能实现的功能是在以往的我们的创作中是完全不可能实现的,那现在变得可以实现了, 那是不是我们可以用这些长板,呃,来实现一些之前从来没有过的效果,对吧?这这这个地方就完全发挥你的想象力,所以我觉得我们应该去了解模型,了解模型有什么样的功能,以及它的能力边界在哪?我们取其所长,然后弃其所短。 我觉得这个是我现在探讨下来我觉得性价比比较高的一个方案,或者说去学习的。我自己的一个学习的方法论, 对,就是去拿它去做作品,然后拿到结果。而至于很多还还还有些朋友说,什么面试的过程中需要一个什么能力啊?在工作中我觉得更加是如此。其实说写了那么多能力,最终还不是想拿到结果吗?如果说你已经把结果摆在他面前, 呃,你有什么样的能力还重要吗?对吧?就是你就用这样的工具去创作出你想要的东西,以及为什么。还有朋友说,呃,觉得 花钱买课什么这方面我我提了一嘴嘛,当然不是否定所有的课程,还是有些还不错的课程,但是就 ai 这件事情实在是太新了,其实对于很多老师来说,他也是自己在学习的过程当中,呃, 所以与其这样,不如去看一些其实优秀的开源的作品,已经就是开源的,这些教程已经很好了,而且,呃,也有很多一部分 up 主有有这样的开源精神,我觉得做的挺好的。你如果想要去花那个时间去考古, 你就去考古。但是我觉得开源的模型,嗯,不要花太多时间在上面还是去考古,但是我觉得开源的模型,嗯,不要花太多时间在上面创作,包括我接下来我就会,呃, 包括我接下来我就是会利用这个,比如说这个战斗机的一个元素,一些我做了一些人物的形象以及一些场景,那我会在后面的过程中持续去更新我自己创作的一个情况,也也会在这样一个平台来进行发布。那我最后我已经做好了这个 吹乐视频的啊,一个预告片一样的视频的一个脚本的架构,我已经基本写好了,所以接下来的过程中我会去一步一步再借助这样的工具去去实现我脑子里想的东西。我其实我也不知道最终效果会怎么样啊,所以如果大家感兴趣,可以持续关注我的频道。

开源免费多图多分镜,然后中间可以穿插文字,可以直接上传音频,超解码版的这个导演台工作流来了,非常的方便啊,用了这个之后可以省略到之前好多好多的一些节点,然后我跑了一下这上面的一些案例啊,我们先可以看一下他的案例啊,怎么样,最近好吗? 嗨, bro, 你 又来了,这次要多少?先买这么多,后面的会再加。这里都是我一步一步的样子啊, 有点够你喝。我这个火箭筒能不能便宜点,卖给你再说。还有字幕啊,子有万岁啊,不要吃,我给你这个,这是我带的零食给你吧。 嗯,这是处理过图片,改成一九二零乘幺零八零的版本。不是这个,这是我带的高上牌零食,比我好吃。看我最后这个调试的啊, 给你按上这个,一会儿我出去玩,你有点重哦,我们去去大草原好不好,呵呵。哇, 那接下来讲一下咱们这条工作流啊,前面这个板块啊,模型加载区啊,模型的话用的是这个原版模型啊,这个原版模型我发现效果是最好的,用一些蒸馏的是效果不行, 然后这个,特别是这个 lua 啊,这个 lua 非常好用啊,这个 lua 的 话,他是一个去字幕的 lua, 本来这个 lts 二点三不是总爱出现字幕吗?然后我就把这个 lua 挂这了,挂这之后呢,他现在可以起到一个去字幕的效果, 然后走到这边来,是他的加速区啊,就是能让一些比较低的显存,比如我的,我的电脑为什么跑得动啊,很高的,比如说六十的视频呢?就因为有这个加速区啊,主要是来讲一下咱们这个导演台的这个插件啊,咱们先看最上面,上面这里代表是你的秒数,你从这里输入多少秒啊,他就可以生成多少秒, 然后这里是他的帧数六十帧啊,我这现在因为我这个视频做的是六十帧的嘛,所以说就是六十,然后幺二八零乘以七二零,然后我测试了,其实效果最好的是一九二零乘幺零八零,有点容易爆显存,然后最好还是七二零幺二八零吧,如果和我这个配置差不多的啊, 然后这个的话就是他的一个裁剪方式啊,这个不用管,主要是看这里,这里的话是直接可以上传图片的啊,你比如说想上传几张图片,直接从一复制啊,就可以上传上去啊,上传上去,然后这个删除呢,就是 delete, delete 可以 直接删除掉啊,这边是可以加文字啊,其实在文字的话,我们这里也是可以加的啊,你就删删除, 删除之后这就没有了是吧?没有之后你点点这个小加号,你无论是上传图片还是上传文字都可以啊,你想写文字的话点一下,然后你从下面直接就开始写文字啊,如果说你想上传图片的话,就直接点一下,把你的分镜图片直接加加到这里啊,就算是加完了, 非常的方便并且随意的拖动啊,这个东西可以随意的拖动,随意拖动呢,它的长度也可以,长短也可以随意的拖动啊, 包括这些文字也是啊,你把那个鼠标啊,这里有个小细节,你把鼠标放在这呢,它可能往这拖拖不动,对吧?然后你要把它变成这个形状,把它变成这个形状,它就可以两边拖动了啊,这是一个小技巧啊,其实说实话这个东西和剪映非常像啊,变化这里还可以直接上传音频,在这啊,直接可以上传音频啊,这个 这上面这三个按钮全都是可以上传多张图片,或者是多段文字,或者是多段音频的啊,这三个在这里点这种加号来上传呢?它是只能上传一段,你只能选取一段,你再想选第二段的话,不让你选啊,只能选取一段点这种加号。还有这里如果这里你现在是 off 的 话,他现在的话这音频是不起作用。如果你把它点成啊, 点上 on 之后,它现在音频就可以起到作用了啊,音频就可以起到作用。这个问号是它的直接就能进入它的这个主页啊,这是它的这个插件的这个作者啊,放在呃, github 的 一个主页,它这个主页有它这个插件的一些介绍啊,一些介绍,以及它的一些详细的一些教程。当然你听完我的教程,其实它那个教程就不用去听了啊,因为我这就简化版了。 然后点这个齿轮,这里是可以把它去掉这个上面的秒数,这个这个东西我觉得没什么用啊,不用管他啊。然后主要是这里这里的话是可以改变他的过度的啊,改变图片与图片之间的一个过度,数值越小,他的过度越生硬,数值越大,比如说最大可以调到零点九, 那过渡他就越自然啊。什么叫越自然呢?就从这张图片到这张图片,他不会给你切分镜啊,不会给你切分镜啊,这是他的这个作用,当然也得看你的提示词啊,这个东西也得看你提示词怎么写。我为什么在图片和图片之间爱加文字,就是因为我要有些地方我要让他过渡,有些地方要让他切分镜啊,或者运镜之类的啊,这三十二和十八这两个数值是不要动的啊。这里的话是将你的 你的这个整体题词给它放出来啊,就这里可以填整体的题词,整体风格的,那整体题词和之前一样啊,不要去填一些名词,什么人物的形象啊,或者说是呃里边的物品啊,或者是建筑物啊,这些东西都不要有啊, 这里只填一些你的风格啊,色调啊,反正也是给整个小片子去定调的啊。所以说如果你填就填,你看我的话我就没填,因为我觉得我的我的图片做的够好,然后我在贴在这上面只写针对图片提示就好了啊,特别是要注意的是这里啊,就是你点每一张图片,或者是你这里空,比如现在我这个加号是空白的,如果你去跑它会报错的啊,这里会百分之百报错的, 如果你必须从这里要输入东西的,要不输入图片,要不输入文字啊,就是不能有空空白的地方。还有你每一张图片对应的都要有这个提示词,提示词在这里写啊,你要如果提示词不写的话,他也会报错啊,也会报错。告诉你你的图片搭配的没有提示词啊,也一样会报错的,这个一定要特别注意啊, 然后讲一下这个音频,这里你看我这里啊,我就可以给他对应上,但是我想给他多留一块,我想给他多留一块,因为我这块音频应该是你看听一下啊, 给你安上这个我们出去玩我觉得这个时候应该给大猫一点反应,所以说我可以留一点啊,留一点,哪怕说是一个猫的叫声,到时候我剪辑的时候再把那个声音给它加进去,对不对?所以说给它留一点,而不是说让它快速的去转场,或者说从这里可以啊,直接添加文字,然后这里打开有道啊,直接这里写大猫 你就可以把它填到这里啊,你把它填到这里之后也是给他留,也算是给他留一个空间,回头一个反应就是小女孩说完话他大猫给他一个反应啊,然后这里啊这里的话大猫可能说了一句话,你好肿嘛啊什么之类的啊?是这样的 啊,这就是他的一个用法。那这些音频我们可以从哪里来呢?我这次特意给大家啊,从这里留了一段,一个一个输入啊,我这里一共留了三个。这个的话可以设计语音啊,一个这里可以去设计一个一个人类的语音,就是你可以给他设计成什么解说类啊,或者说女孩啊什么,反正你设计他的情绪类啊,都行啊,在这里去给他设计 啊。但是我现在我觉得用的最最好的还是这个吧,因为这个的话我可以在下面可以去写他的呃情绪,呃,可以去改啊,首先这里可以选择他的人物啊,男性女性啊什么之类,是谁的,哪个人的音色,选完音色之后这里可以写他的文本,写完文本之后这里可以去改变他的情绪啊,改变完情绪之后, 拿着这个创建好的音色,拿着创建好的音色第一句,然后直接可以上传到我们这里的加载音频啊,从这里可以去加载这个啊,你刚才做好的音频,比如说啊,比如这个我可以把它加载到这里边,加载这里边之后调整好你的音频时长啊,调整好你的音频时长,这上面输的是秒数啊,秒数, 然后直接就可以克隆,然后但是使用这个,使用这几组节点的时候,他都需要加载模型啊,你比如这啊,一点七还是零点六啊,或者是这个啊,是把你的语音转成文字的,这个需要去加载。一般情况下你选完它之后,你去跑一下,去运行它啊,去运行它一下,运行的时候正常来说 他都会自动下载这个这个这个模型的就但是前提最好是你要一定要有网啊,一定要有魔法,你有魔法的话,他能自动去下载啊,他能自动下载,包括这个也是啊,他如果你选好了之后,他一般自动下载,如果不自动下载的话,你就根据这几个插件啊,去找他的这个 github 的 原液啊,去直接去下载他的模型啊,或者是哈根 face 的 那个原液啊,直接去下载他的这个模型就行啊,这是他这个语音的用法 啊,这语音制作完了之后,你就可以保存好你的文件夹之后,你就可以直接往这里边导入啊,导入的话你就可以使用了吗?后面的点就没有什么好讲的,就是传感器啊,并且这次我只用了一次采样啊,就是 我只用了一次采样,我觉得一次采样效果既方便又快。只要你把前面这块啊,只要你的电脑配置够的话,把前面这块啊拉好就行,反正我我我的显卡是四零六零钛啊,十六 g 显存, 我的内存是三十二 g 啊,我昨天晚上跑一九二零乘以幺零八零的时候,我这个是爆了的啊,我这个是爆了的,但是一九二零乘以幺零八零,我我改成幺二八零乘以七零二零的时候,十秒六十帧,我测了一下,呃,测了一下,一共跑了两千三百多秒啊,我这电脑确实有点太差了,然后但是没有爆啊,并且我觉得效果还可以的啊。效果还可以的啊, 这个的话我是用那这个我是用云端跑的啊,这个我是用云端跑的,所以说这个是一九二零乘以幺幺零八零的六十针啊,我觉得这个效果非常好了啊,整个的动作的顺畅度啊,很舒服,比我好吃。嗯 啊,很舒服的一个一个状态啊,这就是整个工作流的一些用法。还有上一期视频,有些朋友说我,我那个发给你们的工作流,有些朋友说有些节点缺失啊,或者说怎么着报错什么之类的,我发给你们。我一般讲解一个工作流时候,我都会只会把最关键的那个插件,包括这次。我也是啊,我只会把最关键的插件给你放进去啊,给你放进去 那些本来正常就应该有的那些插件,我不会给你全放的,因为有时候我一个工作流可能上百个插件,我不可能每个都给你放。好啊,需要你自己去安装或者去下载下来啊, 比如说你不会安装的话,比如说这个插件啊,这个插件有两种安装方式,第一啊,你可以把我这个复制到你们那里啊,把我这个直接复制到你的 customnotos 啊,复制到这个文件夹。第二呢,可以直接在这里搜索啊,搜 索这个插件啊,就这个名称啊,就这个名称直接搜索它就出来了啊。你从你如果跟我学习的话,尽量都要用这个官方的包啊,都要用官方啊,这个这个包来来学习啊,因为这个比较方便啊,也不容易去报错啊,有报错的问题他随时都会提醒你了,这个插件的安装就是这个样子的啊,就是这个样子非常简单啊, 他安装他不需要对环境有什么高多高的要求啊?很简单的一个,你基本上复制到你的卡斯他们闹多词里就行啊,非常简单。那 这就是整个视频的一个教学啊。呃,抖音这边的朋友啊,抖音这边的朋友,我会把这个东西依然还是分享到群里啊,我会将这一套工作流全部分享到群里,到时候你们没加群的赶紧把群加一下啊,把群加了之后都会分享到群里。

这是一款可以无限生成视频的 ai 软件,它完美解决了大部分新手 comfyui 安装困难和报错的问题。输入一段中文就可以生成这样的 ai 视频,而且没有次数限制,它无需积分,而且完全免费。这就是全新 comfyui 秋叶中文版,生成的内容也无需审核, 唯一缺点就是需要独立显卡,内置了三一八款风格模型,搭配工作流即可实现批量生成。电脑一般的选择 base 基础版电脑配置好,选 large 大 型版,感兴趣的铁子幺幺幺低调修炼。

五月重磅更新,圈内大佬都在用的最强 ai 工具 comfyui 九点五新版本正式来袭!这次升级直接颠覆 ai 创作体验,绿色免安装解压就能用极简中文界面,上手毫无门槛。新版本内置海量精品模型,搭配现成成熟工作流,新手零基础也能 一键跑通流程,轻松就能做出质感拉满的爆款作品。他之所以成为 ai 创作圈主流首选,优势真的太顶了!全程开源零收费,没有会员订阅,没有隐性消费,本地离线运行,既能保护创作数据安全,还能彻底摆脱平台各种限制。 独有的节点式可释化创作模式,顶替死板、固定模板,每一个制作步骤清晰可见,画面、参数、风格、细节全都自由调控,创作自由度直接拉满。 功能更是全能无短版,高清出图、动态视频、慢剧、短剧、创意特效全部轻松拿捏!还没上手新版的朋友别再落伍,完整工具我已整理齐全,带你轻松吃透这款顶级 ai 创作工具!

如果你想要使用各种声图或视频模型,但是又不想切换各种平台,而且很多平台单价又太贵, 甚至你想要学习或者使用 comfy ui, 但是你又无法跑动,本地模型也不会部署,甚至你想说直接使用别人的工作流。最后,你想要使用特定的效果, 要用别人的 lora, 甚至训练自己的 lora, 那 么这条视频对你有用。西瓜中间给你吃,我吃西瓜皮,我们开始吧。今天要讲的平台是 leibleible, 这是我第一个开通年费会员的 ai 平台,它可太适合新手了,也适合进阶。首先它接入了各大模型,你反正用就可以了,每日也有免费的积分,比如 nano banana pro, 比如最近很火的 z image, 如果你觉得不够用,付费的话,价格也十分的亲民。其次,最大的特点就是下面茫茫多的 lora 了。不清楚什么是 lora 的 小伙伴,我简单说一下, 就是针对了某种深图形式风格做了加强训练的模型,比如说人像类,比如说文字特效,比如说风格啊,漫画风格,写实风格,电商的抠图等等。 这就是 liblib 区别于其他所有平台的地方,上面有各种训练好的 lora, 你 都可以直接拿来用,比如你直接搜索宫崎骏, 你就能得到所有训练好的宫崎骏漫画风格的模型,你随意任意点击一个进去, 就可以在 web ui 中直接使用。除了 web ui 之外, liblib 最强大的一个功能就是它提供 comfy ui, 你 只要点击左侧的菜单栏 comfy ui, 稍等片刻,你就获得了这样一个免费的 comfyui, 而且你可以把刚才的 laura 直接接入这个 comfyui 中使用,非常的方便。最最最最关键的是,你返回首页,可以在下方的工作流中 直接看到许多大神已经做好的 comfyui, 比如说这个高清放大,你只要点击进去, 然后在 comfy ui 中运行,稍等片刻,你就能获得它完整的工作流,并且使用了,非常的方便,你再也不需要去付费购买甚至求别人分享了,上面直接搜索就可以。 为什么会有那么多的 laura 跟工作流呢?因为你只要分享就可以得到创作者收益, liblib 会根据你的 laura 或者工作流被其他人使用的情况给到你一定的奖励。 如果小伙伴想要训练自己的 lora, 只要在侧边栏中选择训练 lora, 然后把你的图片上传上来就可以训练了,非常的简单,小伙伴们赶快去试一下吧。那么今天的内容就到这里了,我们下期见。

兄弟们,千呼万唤使出来多图多分镜生成长视频工作流。详姐,他来了!这个工作流一共分为两大板块,第一个板块呢是一个 多图升视频的板块,第二个板块呢是一个多图加音频升视频的一个板块啊,这个工作流我会无偿的分享出来,看完我这个视频的话,基本上拿到手之后就可以使用啊,到时候无论是工作流还有这个模型,我都会放在网盘里去领取啊。我们先展示一下这个工作流做的一些案例啊, 你看我这里我做的分件啊,有一个是一张图片生成二十五分件,这个都是我拿一米纸做的,然后这个是生成了六图,我们先看这个六图了。别走,我知道你恨我。恨你,你也配?我姐死了三年,你手机密码还是他的生日? 你你,你怎么知道?因为我怀了你的孩子。如果你们自己来做的话,你们这些分镜都弄好的话,我这个分镜做的很烂啊。我没,我都没怎么抠啊,正常来说是不能带字幕的,字幕这些东西都是要自己写的提示词啊,所以说你看我这比较烂,所以他出了很多乱码, 然后你们要是自己去做的时候,这些分镜一定要做好,做好之后把那个提示词也写好的话,效果会比我这个好很多倍啊,表哥,我是因为没办法,我没有那么多时间去扣这个东西啊,因为我做教程的话没那么多时间,又是无聊的周末, 嗯,我手机怎么了?你看这乱码都是因为我上传图片有问题。我手机怎么了?细从这什么情况啊?分辨率太低了,我就不上传图片,这什么情况啊? 还有免费的无限出海来吧。怎么给我吸进来。现在这个弄个数字人唱歌。这个啊 好 ok 啊,案例展示完了,本来我这个工作流我测试了极,我测试我这个电脑极限,我的电脑是四零六零泰十六 g 啊,然后三十二 g 内存,然后我测试我这个电脑的极限,我当时 其实理论上来说这个工作流它是可以放无限张图片的,你想放多少张图片都可以,但是我测了最多的,我因为我这就生成二十五张分镜,我就测了最多就二十五张分镜。然后呢,我本来想测两分钟, 两分钟吧,失败了保险存了啊,跑不动,然后呢?后来我又去调调调,最后测着我只能跑得动一分钟,但是一分钟加上二十五个分镜,把二十五个分镜放在一分钟里的话它的效果特别的差啊,特别的差,所以说后来我就把它 变成这个十个分镜啊,这个十张分镜来生成,然后我觉得如果是你们真的是自己在做慢剧的话去把提示词写好,把分镜做好的话,那十个分镜我这个配置啊,先说好是我这个配置啊,是绝对是没有什么压力的,会出来效果不会太差,就是哪怕差无所谓,抽卡就好了是吧,毕竟他的速度还是很快的。你像我现在以这个为例吧,因为那些的话已经生成过了, 哎,看不了了。以这个为例的话现在是十五秒,呃,用了才三百二十九秒啊,并且你们看这个画质也不会太差啊, 如果说不行的话之前我不还发了一个呃,那个高清放大的工作流吗?低的分辨率去跑完,跑完之后再给他放大,不一样的啊,放大速度比较快,对不对啊?这就是工作流这个作品展示,接下来咱们就开始详细的教学啊,详细的一个教学。 首先我们来看看,我把它分成了这几个板块,第一个是模型彩样区啊,第二个是你要输入,要输入东西的,比如图片文那个文本啊,就是题词啊,以及他们的些分辨率啊,这些帧率这些东西。然后呢?还有个数学表达是这个最后讲啊,然后还有就是这个音频这边的输入啊,首先我们先来看这个模型,这边 模型的话这边就是一个大模型搭配了。呃,我这边一共是放了两个 lara, 第一个 lara, 这个 lara 的 话 v b v r 是 一个咱们国内的一个大佬啊,他做的一个 lara, 他 这个 lara 做的就是属于一个物理 lara, 就是 能让你生成的视频更遵循物理效果啊,然后他设置个零点七就行,然后我就把它连到这来了。 这个 logo 是 干嘛?这个 logo 就是 一个过渡转场,我为啥刚才这个视频放这没有动啊?你们看一下区别就知道了。一张分镜和下张分镜的时候,你是把它切开呢?还是说让它自然的转场过去?这个 logo 就是 负责这个的,就是它能让你自然的过度,还是直接切下一个分镜?有一些地方它必须得切分镜才好,你要过渡过去就很生硬。你比如说现在这个案例,就是 你看他没有切分镜就切到这上来了,但是其实有点别扭的啊,有点别扭,特别是如果场景不统一的话,那就更别扭了啊,那就特别的别扭啊,所以说这是他的,如果你需要这种啊,这种自然过渡的话,你就把他这个 logo 直接连到这上面啊,然后把它打开, 选中它, ctrl 加 b, 然后它就开启了啊,可以开启了,然后你要不用它的话, ctrl 加 b, 把它隐藏掉,然后把它忽略掉,然后把这个线连好啊,就 ok 了啊。剩下的这个是可 delete 和 ve。 这边都不要动啊都不要动,我都已经设置好了,到时候我给你们上传的网盘里的时候,这些模型我也会给你们告诉你们该放的什么路径啊,都有的啊, 往下看的话是这是一个加速,如果说你们那有 second 啊,有 second 的 呢,你就用,你要没有的话,直接 ctrl 加 b, 给它忽略掉,照样也能跑啊。 ctrl 加 b 给它忽略掉也能跑,你要有的话就不用忽略了。然后下面这边啊,这边是就是裁样区了啊,就是正常的一个一个 l t s 二点三的一个裁样区啊,主要要讲的是下边这里啊,需要讲解一下啊。首先说这个插件啊,这个插件的话 到时候我也会放在我的网盘里啊,把这个插件我也会放在网盘里的,把它直接复制粘贴到你自己 comui 里的 ctrl u i 里面。 custom models 啊,直接粘贴到这里边,然后重启 ctrl u i, 然后它就出现了啊,它就有了啊,变它特别好用啊,这个这个键啊,上面这些宽度高度你们也不要动啊,下面这些也都不要动,你们只唯一要动就是上传图片,你看 app update 一 枚指向这就是上传图片。 然后这里的话,你比如说,哎,我上传几张图片,我直接一复制夸他就上来了啊,直接就上上这里边来了,你这些图片都是可以调位置的,你想把它放在位什么位置什么位置,你都可以自己手动去调它啊,你想它在前面还是它在前面,都可以,调完之后呢?你会发现之前的时候都是需要一个一个的去把这个线给它连好啊,把这个, 把这个节点的线连好,这边现在这边呢只需要一个点直接连过来,你这边有多少张图片,那你对应的你这边就有多少个可以设置的东西 啊,不像之前你得要手动的去搞这些东西了啊。这里,并且你看我这里应该是十六张图片了,那我这里因为为什么我知道,因为这里显示着十六这个数字啊,我去掉这里一个, 那这边就变成十五了啊,对不对?你看它就变成十五了,这个节点的一个非常好用的一个一个点啊,就是不用再像之前一样那么连了啊,这个节点剪完了就是上传图片,以及你可以摆随便摆你的位置,包括刚才我那个位置,所以他才会有那些比较炫酷的一些运镜啊,一些炫酷的运镜。 然后这个节点说完之后呢,咱们再看这个节点,这个节点还是比较关键的啊,他算是这个工作流里比较关键的一个点,上面这块是输入你的总提示词,就说你这个片子的整体的一个提示词, 就是他的风格,这上面不要写名词,不要写什么人物啊,或者说是建筑物,或者说你什么物品类的东西,这样不要写指定调啊,他只用来定调,下面来写你配合每一张分镜,配合每一张分镜的题词,比如这个分镜啊,比如说我现在第一张,是吧?那现在这里就是第一个,第一个的话,那他就是人物在唱歌, 哎,然后动作自然就完了啊,第二个的话,你需要他干嘛?哎,然后你就这里第二个在写什么,第三个写什么,第四个写什么。那他的这些用法怎么用呢?先输入这里啊,这里是最重要的啊,这里是代表你总帧数,整个视频的总帧数在这里输入啊,这里写三百八十五,那就是三百八十五帧。那这个三百八十五帧从哪得出来的呢?我们在这里看 下面,这里啊,你想生成多少秒?那你这里想输入,我想生成一个十秒的, ok, 你 点这个获取总帧数,这里点一下这个小三角, 然后这边就会获得十秒的总帧数,这里应该是二百四十六啊,二百四十一啊,对,二百四十一,因为是二十四的帧率嘛,然后他也要加一嘛,所有 l t s 二点三也好还是万二点二也好,他们的帧数都是总帧数都要加一的啊,都是要加一的,所以说这是帧率 乘以秒数,这个数学式算完之后他就二百四十一帧啊,你们不会算简易算这个数学表达式的话,你们就直接就按我说的办,这边填秒数帧数,帧数的话尽量不要动,二十四帧就好了。如果说你的电脑配置高的话,你可以加高一点啊, 然后这边就是你这个视频的宽和高,这个你你的电脑配,如果跟我这配置一样的话,可以弄高一点啊,可以弄高,我这为了做教学快一点出视频,所以说我弄的比较低啊,这边的话给你配置的都有啊,都有有哪些分辨率啊?可以选择啊?都可以选择,这里都有。然后这边这个帧数得出来之后,你需要把它复制,复制完之后,哎,把它复制到这,然后点一下回车, 那你这里就变成二百四十帧的一个一个板块了。二百四十你会发现什么?你看这边都被拥挤掉了哈,拥挤把它都变小了啊,你可以点一下直方图的均衡,他们就变成一个平均值了啊,就变成一个平均值了, 然后变成平行值呢?上面这个地方啊,这个地方其实有点和那个 logo 有 点像啊,就这个地方调这个值,现在默认是零点零零一是吧?然后他正常你也可以给他调到零点五,你调到零点五有什么效果呢?其实他和这个 logo 是 有一点相似的效果,就是一个自然过渡,还是说直接切分镜啊?他属于一个这么个东西,这边就 fps 的 针数,这个不要管,这个都已经我已经连好的。 然后这边是干嘛呢?选择你是分针,就是下边这边是以针为单位还是以秒为单位啊?你先这就切换成针 啊,其实如果弄成秒为单位的话也是可以的,那这边也得相应的改啊,那个我就不做过多的一些介绍了,反正你就知道他是这两个是对应的就好了。剪辑的时候发现啊,这段录讲了,然后下边这里啊,这里是可以加啊,可以加这里有多少块,你这里有多少张照片,你这里就要加到多少块。你比如这里有十张照片,那你这里就要一直加,加到十个 啊,就有十个色块,对吧?然后给他平均值一下,然后可以去调,然后这个东西 delete, 就是 减嘛,啊,减掉啊,就是他的英文单词的这个意思啊,减掉啊,你看这都是减掉啊,这个操作不要忘了啊。然后这里的话可以直接设置他的秒数,比如这里我设置一秒啊,他就变成一秒了,你看啊,这里设置五秒啊,六秒啊,他就变成一个六秒啊, 这是他的一个基础操作啊。然后这边切完针之后呢,你要给每一个你的分镜,要计算好,你自己感觉,比如说这里边有台词的话,你自己去念那句台词,自己用嘴去念,念完之后之后你去估算他的秒数,然后给予他多少多少秒或者多少针。你看一开始我像我来做的话,我一开始我会先设置一个他的秒数, 我先试着好他那秒数,之后我根据他那秒数先做好,先把这个东西先做好,做好之后我干嘛呢?我再给他切换成帧,然后这个时候就是秒数那边我已经计算差不多了,是吧?切换完这个帧,这个帧是干嘛用的啊?你把这里对应的每一帧,你比如这里有六张图片,对不对? 输入到下边第一针,那这里是多少?这里是四十二,后边这个括号四十二啊,第二个三十九,那你这里就要输入 三十九啊,然后这里四十,你这就说四十,就以此类推,如果说你的电脑可以的话,你要想跑的图片很多的话,你就根据这个数字往上填, 往上填,往这下边填。我下边预留了很多啊预留很多,你可以根据这个数字往下边这里边去去填。填只动这个啊,不要动这个,这个数学表达式不要动啊,数学表达式我都已经弄好了,不要动。然后你填完之后呢?你要对应的是什么东西啊? 这里是个有点有点小难度啊这有点小难度,一定要仔细听啊一定要仔细听啊,因为有一些我是默认连着的,有一些他没有连着的啊,如果没有连着的,你就需要自己去连一下啊,因为我之前我为了做测试我有些没有给他连上, 因为这里啊,我这里现在到第多少张?第十张了是吧?第十张。 ok, 那 我现在找第十一张,我的第十张在这啊。呃,这里这个整数啊, 连过去连到这个数字这个点这里啊,依次往下连啊,依次往上十,第十张,这这里的十,这里要加一连的,就是加一,就是十一,然后这边呢,你看十一的话连到这边的话就是十二啊,第十二,然后这边 连上,这就是第十三。然后这个地方怎么设置啊?教一下这边怎么设置这边其余的我因为我用过数学表达式了,所以说你们就不用太多的去思考了,但是我给你们讲一下基本的逻辑啊,首先他的第一步前面是零,上面最上面这一张是零针起手,对不对?那最下面这张呢? 那就是负一,那负一就等于是最后一张嘛。啊?中间这些应该是怎么填入啊?正常来说如果不用数学百万式的话应该是怎么填入?比如我把这个线断开, 我把这个线断开,那这里的话就该是零到四十八啊,就是你的第二针就是第四十八啊,零到四十八啊,四十八的时候就切换到这张图片上了 啊,就是四十八针的时候这张图片就该出现了啊,是这个意思啊,所以说那下面是多少呢?那就是四十八加多少, 加上这个四十就是四十八加上三十九,不是应该说是四十二加上三十九啊,就依次往下逆推,就这边有多少针,这边这边应该是填多少数,就第多少针的时候出现,哪张图片就这样一次一次往上加。但是我,我为了你们不太会的话,我做了一个这样的数学表达式,你们只需要把这里对应的数字 填到这些蓝色的框框里就 ok 了,他自己会算好了数,并且填入到这里边啊,并且填入到里就自己不用再去计算他了啊,这是一个我做的一个一个一个数学表达啊, 我会让你们直观的能看懂的,所以说我都把它打开了,要不然的话很多的话我就会把它隐藏起来啊,我就怕你们看不懂,所以说我就直观打开,让你们看到这个东西啊,这就是起到一个这样的作用的。还有这里边啊,还有一个点啊,这个工作留的这个零点七,看到这个零点七了吗?这个零点七干嘛的呢?如果你把它设成一, 那他就会很生硬的夸就切了这张图片可能会很生硬,但如果你把它设置到零点一的话,他会是一个自然的,就是给模型一个发挥想象的空间 啊,让模型发挥想象空间就是不是说直接一刀切的那种推过来啊,然后你上面的手真的是一就好了,然后最下边的这个也是一就好了,中间的话你都可以给它设置成零点七,这样的话它是一个很比较舒服的一个过渡啊,不会切的那么生硬啊,不会切那么生硬,这就是一个多图多分镜生成视频的一个一个一个过程啊, 唯唯一的有点难的难点就是我觉得这个部分提示词的分配与时间的分配,就是你对于每一张分镜,你自己脑海中要有一个大致的一个时间,一个估算,然后你把这个分镜写好,把这个提示词写好,那你一般的话你的效果就会能跟得上啊, 效果就能跟得上。这段已经用法已经讲过了啊,用法已经讲完了,然后咱们就讲第二个板块啊,第二个板块的话只需要改三个点啊,只需要改三个点,怎么让音频配合他?比如说你要做一些慢剧,人物的声音是否要统一啊? 你要是人物声音要统一的话,你就需要自己先把音频做出来,对吧?你把音频做完之后啊,以后我会给你们出一个关于音频制作音频的一个课啊。今天的话主要先讲这里,假如你已经有音频了,你已经做好音频了,你只需要把音频和人物这些分镜对得上就 ok 了啊,好, ok, 现在我们打开它, ctrl 把它全括起来,然后 ctrl 加 b 打开它, 你只需要打开它之后呢要做一件事,第一你先学会这个这个东西的使用,这个东西怎么用啊?你比如我上传这段音频,这个段歌声的音频这个调是从这里设置,你比如我设置二十秒,刚才录制的时候我这里卡了啊,然后这里我重新给大家教一下啊,这里比如说你设置二十秒, 那你这个条就会变成一个二十秒的选举啊,二十秒的选举你任意可以拖动任意位置,然后你从这里呢点一下播放,你看就可以选择选择你要选举的那个那个片段就 ok 了。上面这个,上面这两个啊,你不用管啊,上面这两个不用管啊,你只需要把音乐从这里上传上去啊,点这里啊,点这里上传, 把音乐上传上去啊,或者是把你的音频上传上去,选好了你这段音频之后,你搭配好你自己的这些分镜啊,搭配好你自己的这些分镜,然后你要干什么呢?第一步咱们之前是这边连着这个数学表达式,对不对?哎,点错了,这边连着这个数学表达式,我们只需要把这个描述 连到它这个 a 上啊,把这个描述连到这个 a 之后呢,我们再点这 运算出他的这个总帧数,相当于现在你连了这个东西之后的话,你接下来你这个视频有多少秒,完全取决于你这里选择多少啊,选择多少秒,把它算完之后,把它直接也一样啊,复制粘贴到这里 啊,把它直接粘贴着点回车就 ok 了。还有两个事你要连好的啊,这里有两个点啊,第一,你看这里这里的选择, 你若是音频 latent, 那 就是没有音频输入的,他自己创造 latent 的, 如果你要音频输入的,那把这里切换成音频输入啊,这里要切换成音频输入,然后还有一个点,你要把这个音频参考这个线连到这个音频上,然后他这边就会断开了啊,这边就断开了,然后你把这里 ctrl 加 b 打开啊,打开,那他就是有这个音频参考了,这样的话你就可以做到一个数字人的音频的带音频参考的多分镜了,他的操作方式就是这样的啊,其余的都是一样的啊,其余都是一样的。只有说这三个点啊。第一,你把秒数确定好了,连好了,把这个秒数算出来 放好,放好之后呢?把这里切啊,一个是音频编辑,那个是什么?就是浅空间嘛,噪波嘛,对吧?然后你把噪波不要了,我直接输入了,对吧?我输入一段,然后再把这个下边的那段参考的直接连到连到这个音频上啊,这里就断开了。如果说你想恢复成原样呢,你就把这里还到这个音频编辑,把这里给它连好,然后下边这里呢? 把秒数,哎,直接给他连到这个 a 上啊,把秒数直接连到 a 上,然后把他一一屏蔽好,他又不干活了啊,他又不干活了,然后你就继续从这边做你的啊,就 ok 了啊啊?我再想想还有什么难点吗?啊?后面再啰嗦一嘴啊,就比如说这个工作流啊,他其实也可以做单张的啊,就是单张, 你就是只剩一张图片,剩了一张图片之后呢?你是用这个插件利用这个节点啊,一样用这一个分镜,用一张图片 利用这个插件的,他这些秒数啊,你这段他干嘛这段干嘛这段干嘛这段干嘛啊?也是一样的啊,就是单图也是可以生成视视频的,抖音这边的兄弟们如果需要这个工作流的可以进我的粉丝群啊,然后我的这个一群已经满了,现在还有二群和三群没满,我会把这个工作流和模型还有那个插件放在网盘上分享给大家啊,后天解封之后我会直接发。

今天这一期视频给大家讲一下 zamjet turbo 十八种风格一键切换的工作流。这个工作流的原作者是 martin, 大家拿到工作流了以后,先看说明说明,这里除了我关于模型和一些工作流的介绍,还保留了原作者之前的说明文档和它的主页信息。 我对这个工作流进行了汉化处理,将里面所有的英文部分翻译成了中文。因为 zmi 这模型的话是中国的模型,所以说对中文的支持特别好,所以不需要英文的一些东西也是能够完美运行的。 我在这个工作流照样也融入了之前一直极力推荐的 cgi 智能的加速。如果说你没有安装 cgi 的 话,你就屏蔽掉或者删除掉这个节点。如果你已经安装了的话,正常可以使用内置的四种模式。 如果你使用小白工具箱已经抓取了你本机最佳的参数,写入到自定义模式的话,那你就使用自定义模式,速度提升的话大概有个百分之五到百分之二十不等,根据你自己的显卡情况。 然后接下来我来详细介绍一下这个工作流的使用方法和一些注意事项。先来演示一下这个工作流的特色吧。 这个工作流的话里面内置了十八种风格,也就是说你可以通过左边的控制按钮来切换各种不同的风格。除了切换不同的风格以外,下面还可以选择插画模式,或者说是照片模式以及生成步骤的选择以及尺寸的切换。 这下面还有一些额外的,比如说让图片更加精细化,或者超峰放大切换彩样器或者图片的分辨率,横向和竖向的一个切换 提示词的话,跟之前的入门级工作流讲的是一样的。关于入门级工作流,这里讲一点,大家在机智启动器点击蓝色的字就会跳到我的主页,我的主页里面大家点合集,合集里面我分了几个合集,像机智启动器的, 像进阶工作流的,以及之前的入门工作流。入门工作流的话点击查看更多,就能看到之前拍摄的各种入门级的工作流,包括 zmi 指 flex 以及提示词反脱呀什么的。后续入门级教程的话,我还会持续更新,一边更新这个入门级的教程,一边更新进阶的教程。 那么现在回到工作流来说,首先这一张图片就是我在关闭了风格以后生成的效果。那我们现在回到工作流来说,首先这一张图片就是我在关闭了风格, 这个就是赛博朋克雨夜风格,再来切换一个像素风格,这个就是像素风格。然后三 d 风格, 现在演示的图片使用的是四八零乘八,四八的,所以说比较模糊,大家只要看一下这个工作流的十八种风格切换的效果就可以了。再来一个日系二次元, 再来一个美式的漫画风格,然后再来一个儿童的风格,儿童手画的风格。 大家可以看到这每一种模型的切换风格是发生了天翻地覆的变化,所以说这十八种风格切换能让你在使用同一段提示词的情况下,不需要再去额外的做一些说明,就可以生成不同风格的图片。最后来演示一下广角, 接下来讲一下这个工作流使用的一些注意事项,比如说你要附带一个 lora, 我 现在使用的这个 lora 就是 说将人体或者说是物体转换成一个玻璃的材质,或者说是褶皱的这种材质,那么我们运行一下工作流, 大家可以看到人物的材质就变成了这种玻璃材质。这里的小尺寸如果取消掉的话,生成的图片尺寸会变大, 现在就生成了一个七二零乘一二八零的图片,那么尺寸的大小切换,大家回到这个位置, 这个位置就是用来设置两组参数的地方,宽度高度,这是大的一组,下面是小的一组的宽度和高度。大家设置好自己需要的参数了以后,回到我们的这里, 点开小尺寸就会使用小的那一组,关闭的话就会使用大的那一组,那么左侧的话这里还有一个图片方向的切换,当你打开的时候,竖向就会变横向,比如说刚才的七二零乘以一二八零,就会变成一二八零乘以七二零,关闭的话就会恢复你默认的设置。 你勾选了超峰放大,那么你生成的图片就会在你原来设置的分辨率的基础上放大百分之一百五十。我们勾选一个小尺寸,四八零乘以八四八,然后运行工作流, 大家可以看到放大了百分之一百五十以后,变成了七二零乘以一二七二,这个就是一个超峰放大方向转换也演示一下吧,竖向变横向, 精细化的话增加图片的细节。最后来讲几个比较重要的地方,第一个就是拿到工作流了以后, 模型的选择,你的 clip 以及 ve 不要动选择这两个就可以了,你的模型可以选择 f p 八模型,或者可以选择其他的,我在网盘提供的这几种模型大家都可以看一下,我在网盘提供的四种模型,大家按需选择。 然后就是一个随机种的问题,现在的话随机种的话选择的是固定,大家在生成的时候选择随机或者增加减少就可以了。固定的话他用同样的提示词,每一次生出来图片都是一模一样的,没有任何变化。 lara 的 话大家一定要注意后面的这个 lara 的 强度,有的时候强度过高可能会影响你生成的画质,强度过低可能会影响 lara 的 效果,这个平衡点在哪里?你首先要看你使用的这个 lara 的 推荐指数是多少, 像我刚才使用的这个玻璃材质的,它推荐的话就是从零点六到一点二之间,根据 lara 对 图片的影响程度自行调节。 那么其他地方的参数的话,我就不推荐新手去动它了,像这些参数,新手的话就不推荐大家去动它了。如果说你对工作流这一块的各种参数已经玩的很溜了,大家可以根据自己的需求去修改里面的一些核心参数,让这个工作流更加适合你平时的使用。 最后再来讲一下模型和工作流的一个放置,我的每条视频简介里都会放网盘的下载链接,你把模型目录和工作流全部下载下来了以后放置到一个地方, 工作流的话全选工作流,不管他是几个复制或者剪切都可以。然后点开机智启动器,选择左侧的工作流管理,在右上角选择本地 comui 工作流, 点开了以后,你选择一个你需要放置工作流的地方粘贴进去就可以了。工作流必须要放到工作流的目录里才能识别,放到别的地方是识别不了的。 模型的放置的话,点开这个 model 文件夹,一定要点到里面进去,不管这里面有多少个文件,多少个文件夹, ctrl 加 a, 全选复制或者剪切,然后回到 comui, 然后在左下角选择模型目录,点击进去了以后,选择空白的地方,右击选择粘贴。 如果这时候提醒你替换目标中的文件,大家直接选择替换目标文件就可以了,因为有的时候他有同名的文件,但是他可能里面的东西不一样的,这种情况偶尔也会发生, 大家选择替换文件保存即可。保存完了回到 comfyui 的 页面, f 五刷新。大家一定不要偷懒说这,我电脑里有几个其他的版本的,我能不能试一下版本有的时候一字之差,可能出来的效果就完全不一样了, 所以说模型或者可离谱这些东西混用的话,会导致你的工作流无法运行。如果有什么想要看的工作流的话,在我的视频下面留言,我会广泛采纳大家的意见,拍摄一些大家需要看的工作流的介绍和使用方法。

全球最顶尖最强的 ai 核弹级软件 comfyui, 它从头到尾都是完全开源,彻底免费! ai 圈真正的王炸来了!全新升级的 comfyui v 九点五中文整合包震撼发布!如果说之前的版本是降维打击, 那这次的 v 九点五版本简直就是宇宙大爆炸!为什么?因为这次的内置模板数量直接暴增到了三百七十七个!而你只需要三步就可以搞定一、下载。二,减压三、双击打开,不用装插件,不用配环境,连三百七十七个主流模型我都帮你提前放好了,直接就可以用! 哪怕你完全不懂 ai 是 啥也没关系,照样能轻松玩起来!想画图点一下就行,想做视频再点一下就好。想创作音乐还是点一下的事,具体什么味道?老规矩,垫个牌!

二零二六年学设计的千万别放过这个软件!康福 ui, 这不是一个普通的 ai 工具,而是能帮你高效提升效率和质量。不管你是做电商美工,还是建筑设计、平面设计、风格绘画,甚至是电商产品视频,康福 ui 都能精准地输出作品, 不要担心学不会。康福 u i 最新整合包汉画版,更适合中国宝宝体质。本地部署,无隐藏收费,普通电脑就能跑。一键生成图片,一键生成视频,以前一天的工作量,现在一小时搞定,直接就能省下百分之九十的时间。感兴趣的宝子直接验牌就好了。