超级变态的康复 y 教程来了,打死也要学!相信刚接触 ai 的 你,在网上经常刷到各种炫酷的图片和视频,是不是心里早就想做出同款 ai 内容?无奈没人教,没人替你踩坑?今天我将一条龙服务式教会你!首先你需要拥有这款强大的生成工具! 装包教程已经打包好了,新手小白一键安装!没有基础的小伙伴,我也已经将小白学习文档与提示词大全全都整理好了,有需要的小伙伴老规矩,五六七,尝尝咸淡。
粉丝1.2万获赞3.4万

今天分享一下怎么安装 cf ui, 复制好这个链接,在跨客浏览器里输入,点击回车,它会跳转至这个界面,我们点击它可以看到有很多包, 我们选择我们需要的保存就好了。我们点击这个包,双击它有两个文件夹,第一个是模型,这个模型很大,有需要才下载,点击下面这个,点击下面这个入门包,点击保存, 保存好了,他会出现在你的跨客网盘里,点击下载,等他下载完成,下载完成后,点击已完成,可以看到他在我们的包里,点击右边的,打开本地文件位置, 右键点击解压它,解压完之后点击进去就可以看到这是整个 com 文件夹。先安装这个,点击安装它这里你只要一直下一步,下一步,下一步就好了,我安装过的 第二步,我们安装这个软件,双击它,点击安装我这个是已经安装好的, 点击安装之后它会出现这个界面,我们点击桌面开发,只用打勾这个桌面开发就好了,其他的不用理。然后看到右边,按照右边这些打勾, 你的操作系统是 win 十的就打勾 win 十, win 十一就打勾 win 十一,其他的不用打勾,打勾一个就好了, 然后再打勾下面的二零一九,打勾完之后他下面有个安装,我这里就没有了,你点击安装这个软件,安装完之后我们去设置自己的环境变量,点击吸盘,点击这个文件夹, 在对话框输入 cl, 找到 cl 文件,右键点击打开所在位置,有的后面是没有后缀的,你需要加后缀,点击查看,在显示这里有文件后缀名,点击它它就会显示后缀名的, 然后按住键盘上的 shift 右键,选择复制文件地址,再点击系统高级设置, 在这个界面里点击环境变量,我们在下方的系统变量这里设置, 点击这个文件,双击打开,你们可以点新建,然后复制地址,他复制之后他有双引号,后面的引号去掉,再把前面引号去掉,点确定就好了。 我们需要设置两个变量,再点击界面,回到刚才的那个界面,点击上方的 x 六四,点击下面的 x 八六, 同样的 shift 右键复制地址,回到系统设置,放进文件,点击新建粘贴,去掉后面的引号,去掉前面的引号, 点击确定就好了,这样环境变量设置就完成了。还有就是设置虚拟内存,可以看到我的虚拟内存是一百个 g, 有 的关键说设置虚拟内存会减少你的硬盘寿命,就看需设置就好了。点击性能 点击高级,下面点击更改,第一次打开会显示这个界面,我们把这个打勾给取消掉,然后选择你的硬盘,选择硬盘之后选择字体大小,输入幺零二四零零 就点击设置,点击确定就好了,这样有内存就设置好了,一百个 g 我 们选择关闭就已经设置好了,然后我们打开我们的 comui, 要记住 comui 一定要设置在固态硬盘上,你设在机械硬盘上的话,它会导入很慢,就成倍的增加。 打开我们的 comui, 这两个运行脚本,第一个是 cpu, 第二个是显卡, cpu 运行是非常慢的,我们选择显卡运行, 双击它,等它加载完成,它运行完之后就能打开康复 ui 了,然后我们看到这个运行界面往上回它,这里全是加载好的,它没有显示报错就没问题。那我这是康复 ui 的 界面了, 点击它,点击设置设置这里它有中文、英文的,那可以选择中英文繁体,什么都有,这样就安装完了 comui 完美。

最近有挺多粉丝问我这个康复 u i 怎么安装,现在我出一个教程,首先你要准备一个康复 u i 的 秋叶整合包,没有的在评论区扣六六六。 其次你就要准备这四样东西,第一个是解压工具,因为这个康复 u i 的 整合包它的容量还是蛮大的,所以需要用到这个工具去解压, 解压完之后他就是这个文件夹,接着就依次安装这三个环境依赖,没有环境依赖的也在评论区扣六六六。然后打开解压出来的整合包,在里面你会找到一个启动器,双击打开, 那么你就会进到这个启动器的页面。打开启动器之后,第一件事先点击设置, 再找到代理设置,右边有几个开关,如果你是没有魔法的,那你就不用设置了,这下面默认开着就可以了,如果你是有魔法的,那这下面就关掉,上面开了, 简单的说就是魔法用上面,没有魔法用下面。接着找到版本设置, 在右边这里选择最新日期的版本,点击切换,再点击确认,可以把 ctrl y 更新到最新版本, 然后来到左上角点一键启动,再点击右下角的一键启动,启动过程中会在启动器这里显示这一些启动的过程, 等到完全启动之后,他就会弹出这一个最基本的纹身图。工作流,那么你可以尝试运行,会发现报错了, 所以在这里给大家提个醒,你的康复 u i 安装成功了,并不代表你就可以运行所有的工作流,接下来你要做的是学习最基本的工作流的使用方法,比如查看报错,刚才报错之后,这里显示了红框,说明这里出了问题, 其实就是没有选择模型,现在我随便选择一个模型再尝试去运行,你会发现,哎,就可以了。 在后续的 com 加使用当中,其实还会遇到其他的问题,比较常见的就是显存不足,那对应的方法就是设置虚拟显存。 还有环境冲突,这个冲突一般是指环境依赖的版本冲突,那你就要去学会怎么看他们的环境依赖版本, 以及如何去安装和卸载相关的依赖环境。最后就是各种不同模型在不同工作流当中的运行逻辑以及搭建思路, 入门相对痛苦,但也因为痛苦入门之后你相比其他人会有更大的优势,特别是在未来 ai 时代。

最新版的 comfyui 来了,界面支持中文,不用再去到处找翻译了,里面内置几百个模板,文声图图声图,高清放大、 ai 视频、 文声视频图声视频、首尾帧、过度动画音效等。接下来教大家怎么安装。二零二六年最新环境的 comfyui 安装包已经放在群内置顶,大家根据需要进群领取下载。 打开官网,点击下载 comfui, 进入下载页面,我们下载 windows 版,大家根据需要下载。双击下载好的安装包,选择安装路径,点击安装 直接运行,点击 get started, 点击 next, 选择路径,点击 next, 接着点击 next。 安装完成之后会出现这个默认界面,试试点击运行。当你看到绿色的节点依次亮起 并成功生成第一张图片时,意味着部署成功。点击左边的模板图标,这里有各种各样的工作流,纹身图、图、生图、视频音频、运动控制等等。工作流, 点击视频,选择一个纹身视频的工作流,这时会弹出一个提示框,提示模型缺失,挨个点击下载就可以了,下载完成之后就可以使用了。

新手小白本地安装 comfyui 保姆级教程 本期视频呢,我们来讲解一下 comfyui 的 本地安装详细流程。由于是本地安装,所以对我们的电脑配置要有一定的要求,最好呢我们的电脑的显卡的显存在十六 g 以上,才能够正常地去运行我们的一些工作流。 其次呢,一定要安装在固态硬盘上面,不要安装在机械硬盘上面,那么你只需要按照如下的七个步骤, 详细的把我们的流程走一遍,你就可以成功的安装完成好。第一步,我们要安装一个解压软件, 那么这个解压软件呢,它支持一些比较大的文件的解压,那么有可能你电脑上装有其他的一些解压软件,会解压失败,因此呢,我们第一步先来安装解压书软件,双击点击安装 即可。然后第二步呢,我们要安装好的解压软件来对压缩文件 copy u i 进行解压,所以我们选中压缩包 copy u i, 右键找到我们刚才安装好的压缩软件,点击解压文件。 然后呢选择一个路径,这个路径呢也是最终我们的软件安装目录,所以我们一定要选一个硬盘大一点的空间,比如说我这里选择 d 盘, 选择好之后呢,直接点击确定即可进行解压,因为我这里已经解压完毕,所以不需要再次解压好。第三步呢,我们要安装一个 git, 那 么这个呢,是我们要从这个 git 上去获取一些资料,所以呢,我们要安装这个 git, 同样双击运行, 直接点击下一步安装就可以。好,安装完毕之后呢,我们可以把这个页面关掉好,其他的两个软件同样双击安装即可。 好,全部安装完毕之后,哎,我们要进行第六步,就是将我们的 models, 也就是哎提前下载好的资料给它,右键选择我们的复制或者是剪切。 然后呢直接找到我们安装软件的根目录,点进来,再找到这个 ctrl u i, 然后右键找空白的地方进行一个粘贴好,最后呢找到我们的 ctrl u i 安装位置,找到会事启动器双击。 好,这里呢需要我们重新启动 windows 电脑。重新启动之后呢,我们再找到刚才安装目录, 找到我们的惠式启动器双击,然后我们就可以成功打开我们的启动器。好,这样呢,我们整个的安装步骤就全部完成了,然后我们需要点击一键启动,让软件自动运行,这里呢弹出界面,点击允许 之后呢,就会自动弹出我们的 comfort ui 界面,我们可以看到这里给我们提供的非常多的模板供我们选择,当我们想要创作图片或者视频的时候,可以选择相关的模板,直接点击应用即可。 好,那么本期视频关于我们 comfort ui 的 安装就全部讲解完毕了,之后呢我们会讲解如何使用我们的 comfort ui。

comfy 整合包最近又更新了,想生成破线视频点一下就行,想渲染点一下就行,想生成带音频的电影还是点一下的事情,就算是搞 ai 漫剧也只是点一下的功夫。 那如果说你是第一次接触到 comfy 的 话,我已经把咱们需要用到的安装包以及会用到的一些模型插件都打包好了。想体验的 宝子暗号暴走这是领取到了资源文件,我们把这个 config 的 压缩包右键解压到当前文件夹里,其中我们要注意我们的文件夹路径,一是不要过长,二是不要出现中文,我们等待解压完成,打开这个文件夹,再双击这个启动器图标就可以了。 那么我们就来了解一下它的一些实用性的功能。首先就是这个一键启动 config 的 按钮,还有左边针对不同玩家电脑配置的专属设置,特地为了帮助大家摆脱网络的困扰,避免无法流畅的从 get up 和 hiding face 下载模型插件依赖的窘迫, 现在只要这里的配置设置成国内的镜像网站,就可以流畅使用了。然后就是最下面这块内容,可以方便大家打开不同的目录,比如 如常见的插件以及工作流文件。当然你要是不喜欢这个启动器,老版本的启动方式依然保存着,大家可以按照自己的需求来下载,最重要的是里面增加了很多工作流,都是开箱即用的。这里面我就拿几个经典的举例子,比如说制作电影级画质的 zamechat, 动态慢视频制作的破线模型 one 二点二 d c 网,擅长动作迁移和角色替换的 one 二点二 animate, 专门用于口型同步的 infinite talk, 更多内容就等着你体验。

万象二点二已经开源有段时间了,那么相信也有很多伙伴已经进行了尝试,当然我们有几种不同的尝试方式,第一个是可以到万象的官网上来进行体验啊,每次登录呢都可以有一百点的灵感值, 那如果你的设备是 ok 的 话,那也可以通过 comui 的 方式来部署到你的本地计算机上面去。那接下来的话呢,我就带着大家来从 comui 最初时的部署开始来部署我们的万象二点二这个模型。 那我已经把咱们需要用到的所有的一些配件啊,这个配件的东西都已经打包好了,同时的话呢,有一些主要的命令也会给到大家需要的保子暗号报走。 那如果你是第一次接触到 cfui 的 话,那就可以跟着我的视频一步一步来进行。那么在我们部署 cfui 之前呢,首先我们还需要去检查一下咱们系统的配置啊,我们可以通过右键点击 windows 的 菜单栏,然后的话呢点击我们的任务管理器, 打开任务管理器之后,我们点击到性能的这一个列表当中,我们就可以看到自己设备的整个的一个情况啊,包括 gpu 的 显存,然后包括的话自己的内存 ok, 好 的,那么这个的话呢是第一步我们要检查一下咱们的一个设备,这是 comfyui 的 推荐配置啊,那当然如果你想要跑的更好一些的话,内存的数量要更高,或者是显存的数量更高才可以, 同时的话呢,硬盘最好能够控于有三百 gb 以上的这样的一个空间啊。那么在检查完了系统配置之后,我们就来安装一下必要的软件哈, 我这边推荐的是 comfyui 官方的一键安装包,它是一款用拖拽节点的方式轻松创建图像、视频等生成工作流的 ai 工具,支持 windows、 mac 和 linux 多种系统和硬件环境。 我这边就以最简单的桌面板为例,带大家一步一步的安装到自己的本地电脑上。这里我就以 windows 电脑安装为例,给大家演示一下安装过程,非常适合新手朋友。 打开我给大家准备好的 comfyui 官方安装包文件夹,鼠标双击一下这个程序图标,接着按照提示一步一步的安装就可以, 它会弹出一个选定安装程序位置的弹窗,在这里我们选择一个宽裕一点的磁盘进行安装就可以。以我这里为例,我就安装在地盘了。安装路径选好了之后,我们接着点击这里的安装,它就会显示 comfyui 正在安装,请稍等。最后等待它安装完毕,我们点击完成就可以了。 这个时候呢,我们来到电脑桌面,双击一下 configui 的 这个图标,它就会跳出一个 configui get started 的 界面,这时我们点击一下 get started, 接着会出现这么一个窗口,我们选择 nvidia cuda, 接着点击下一步,这个时候我们还是选择刚刚安装 configui 程序的那个的位置路径 到这里很多小伙伴们会疑惑,这是要安装什么呢?其实这一步就是要部署 configui 真正运行起来的环境依赖。 接着我们点击下一步,这里我们直接保持默认就可以,它就是一个保持程序自动更新和反馈你在使用软件过程中遇到的问题,方便 cfui 官方改进产品,其实就是对新手习惯的功能自动帮助更新, 我们点击下一步到这里, cfui 就 会自动帮你安装运行程序所要所有环境依赖,等待它安装完成就可以。 在这里我要做个提醒一下哈,就是你的电脑全程要有魔法哈,这样在安装过程中软件要用到的环境依赖才能顺利下载到你的电脑本地,否则可能会遇到下载失败或者卡住等问题。 最后安装完成之后会出现这么一个界面,这些都是 comfyui 官方在里面内置的一百多条经过社区和广大用户验证,拿到过巨大成果的工作流,其中包括图像、视频、音频、三 d 模型等等等等。那么到这里恭喜你,你已经把 comfyui 成功部署到你的本地电脑了, 是不是很简单? comui 部署成功之后,我们该怎么用起来呢?接着我们来到这边点击一下这个模板的图标,也就是一开始安装成功时弹出来的界面,我们点击视频生成,这里面很多都是通用万象视频开源模型的一些好用的经过广大社区大佬验证过的工作流, 我们选择其中一条来体验一下哈,这里我们找到外向二点二图声视频来带大家来体验一下,找到这个 one 二点二十四 b 图像到视频工作流点击一下,这时我们会看到一个缺失模型的一个提示弹窗,小伙伴们不要慌哈,我们挨个挨个的点击下载就可以了, 你不用管它具体放置在哪里,直接点击下载就可以了,等待模型下载完成之后,我们就可以愉快的玩耍了。怎么样,小伙伴们是不是 so easy? ok, 那 么现在的话呢,我们回到工作流,我们可以看到这里有两条工作流,我们选择其中一条来使用就可以了。看到这里有的小伙伴会问了,这里面的两条工作流有什么区别呢?我该选择哪一条来使用呢? 我来给大家讲解一下哈。其实就是使用加速和没有使用加速的区别,其中上面这条是载入了两个加速 lora 配合使用的,然而下面这条就是没有搭配加速 lora 的 原声。工作流 就是速度上面的一个区别,不过当我们在追求速度的时候,可能会损失一些效果,上面的一些细微的细节不过也是可以接受的,不然官方也不会把它搭载进来,存在即合理。哈哈, 好的,接下来我就给大家讲解一下工作流的使用方法。其中万象二点二和上个版本的万象二点一的使用上会有一点不同, 他分别要加载两个大模型搭配着使用,分别是一个 f p 八量化过的高噪模型和一个低噪模型,其中的原理我给大家讲解一下哈。我们可以想象,在拍一部电影的时候, 高噪模型像是导演初步勾勒出场景的大概轮廓,先把画面的大框架、人物位置、大致动作和镜头走向定下来。 低噪模型则像是化妆师和细化镜头的精修团队,在这个大框架之上逐步打磨细节、质感、光影和色彩,让画面变得真实生动, 协调在一起工作会比万象二点一单独一个模型要高效和稳定,因为大结构和小细节的优化,分工清晰,效果也就更加可控。 在这里首先经过这里的高噪模型,在 k 彩样器跑过一遍后,接着传递到第二个彩样器进行彩样,这时低噪模型就介入进来打磨细节。最后出来一个完整的视频成品, 接下来我给大家演示一下它具体是怎么操作的哈。来到加载图像,这里加载一张用来图声视频的图片,我这里就拿我桌面的这张壁纸来给大家演示一下哈。这是我在做案例时用 ai 生成的一张图片, 图片上存好了之后,我们来到右边的这个节点框框,这里设定一下视频的尺寸,我这里把它的宽度设置值为一千零二十四,高度为五百七十六,也就是说这是一个十六比九的一个横屏比例。 横图竖图小伙伴们根据自己的实际情况来就可以了哈。但是有一点要注意的是,我们生成的这个视频最长边的尺寸尽量控制在一千零二十四以内,小伙伴们根据自己的显卡性能量力而行哈。来到下面的这个长度,这里我设置的八十一, 它代表的是我们生成的这个视频的总帧数,就像一部电影从头到尾一共拍了多少张静态照片。 来到这边还有一个关键的参数,我给大家讲解一下,它就是帧率,它代表着单位时间内显示的画面数量,通常以每秒多少帧来表示,也就是说每秒播放多少张画面。 我这里帧率设置的是十六,也就是说我们要生成的是一个五秒长度的一个视频。接着我们在绿色的这个框框这里描述一下视频的运镜提示词, 最后我们点击执行,稍等一会儿,视频就会生成出来,小伙伴们感觉这效果怎么样呢?在视频最后呢,由于好多小伙伴在评论区跟我吐槽说视频生成最让人头疼的是完全不知道 prompt 提示词该怎么写,最后生成的视频要么内容乱七八糟, 要么风格完全不是自己想要的,非常影响创作热情。所以呢,我最后也给大家专门准备了一份万象二点二的完整实测文档,里面包含了视频生态内所有模型的下载地址,实测有效的视频运镜提示词公式,直接往里套就能用,不用自己从零琢磨。 同时也筛选了一批美学质量特别高的案例,可以直接参考着改,也可以当灵感库用。这些资料我都打包放在了视频评论区的置顶位置,小伙伴可以自行领取,谢谢大家。 哈喽,第一站的小伙伴们,大家好,我是你们的大鱼老师,那么欢迎来到我的二零二六最新康复 ui 系列基础课堂的第九课,那么本堂课呢,我们就来正式讲一下我们的康复 ui 里面呢,我们最常用到的视频生成模型就是我们的万象二点二模型。 那么我们万象二点二的一个基础模型呢,主要有三个,第一个就是 test to video, 也就是我们的文本生成视频。那么第二个呢,就是 image to video, 也就是 i 二 v 模型。呃,图片生成视频,那么第三个呢,就是我们的一个 呃图片生成视频加文本生成视频的混合模型的一个五 d 的 模型,但是这三个模型呢?呃,我们最常用的就是前两个 tab to video 以及 image to video, 那 么我们这一个模型的下载呢,我们同样的可以来到我们 hackin face 官网主页。那么首先我们先来到我们 hackin face 这一个万象二点二 tab to video 的 一个官网,看一下这个模型的一些特点。那么我们万象二点二的模型特点呢,主要有四个,第一个就是它是有效的 mo e 架构,那么 mo e 架构是什么呢?就是专家模型,它不同于我们的混元模型,或者说我们的万象二点一的模型, 我们这一个外加二点二模型呢,有两个模型进行驱动,分别为高导旋模型和低导旋模型,所以我们待会再加载我们的大模型的时候,至少就需要两个 u n 的 加载器,然后它既有我们极强的电影及美学的一个构图色调方面的画面展示。 然后其次呢,它也可以生成复杂的运动,但是这里呢就要提到我们的语义啊,就是说我们在填写提示词的时候,如果你提示词填的越详细的话,那么你生成的视频的一个运动效果肯定就是越好的。那么其次呢,就是我们刚刚讲到了它有高效高清混合的 t i 二 v 模型, 那么这一款模型呢,它是属于一个五 b 的 一个模型,但是这里我们需要知道的是,它这个五 b 的 模型呢,属于单独的模型,并不是双模型,驱动 是五 b 的 模型,我给大家试过了,他的生成效果比较差,所以说我们一般都直接用他的独立模型,也就是我们的 mo 架构模型。 那么这里的 mo 架构模型呢,他每一个模型都有十四 b 的 一个参数,也就是十四亿的参数,那么他支持生成的最高分辨率呢,是幺零八零 p 的是比较高的,那么这里呢也有一定的视频展示,我们可以看一下。 好,那么这里我们就可以看到它的视频设置效果都是非常不错的,然后其他的呢就基本上没有什么改变了。然后我们可以来到呃 hackin face 这里的 模型栏目,模型栏目这里呢,我们同样的要找到我们 comforu i o r g 万向二点二的这一个栏目,我们给它点击进去,点击进去之后呢,同样的找到我们的文件这里, 然后找到这个文件夹,点击进去。然后呢我们可以看一下,这里面已经给我们罗列出来了一些模型,那么 diffusion model 呢,就是我们的大模型所在,那么大模型可以看到官方企业开发了非常多的模型,有 enemy, 有 fun 对 吧?也有 ad 模型。当然了,那么最基础的呢,就是我们的 lv 以及 t 二 v 的 模型啊,也有 t i v 的 一个整合模型。在这里我建议大家是不要下载这个 t i v 的 整合模型,因为它生成视频的效果真的很差,所以我们直接去下载它的 t i v 模型和 l v 模型即可。那么这里啊, t i v 模型和 l v 模型也分成了 f d 幺六模型以及 f p 八模型,那么这里我们就用 f p 八模型就可以了,因为 f b 幺六模型我们可以看到一个就需要二十八点六 g b, 那 么更何况它还分成了高噪声和低噪声,我们要下就要下一整对才能够去使用它, 我们这里呢就下载 f p 八的,那么这节课呢,我们先讲到我们的纹身视频模型,所以我们只需要在下面这里下载万象二点二 t r v low noise f p 八模型以及万象二点二 t r v high noise f p 八模型就可以,那么单个模型呢是十四点三 g b, 那 么把这个模型下载完之后呢, 我们就需要把这个模型放在 model 文件夹下面的 diffusion model 文件夹里面,然后接着我们就去下载我们 ted in code 模型,那么 ted in code 模型呢,同样也分成了 f p 八模型以及 f p 幺六模型,那么这里我也是建议大家下载 f p 八模型,可以看到 占用的内存也是挺多的,对吧?六点七四 g b, 那 么这一下载完之后呢,最后我们再下载 v a e 模型,那么 v a e 模型包含了两个,一个是外向二点二,一个是外向二点一的模型,那么这里呢我建议大家下载外向二点一的模型,因为其实这两个模型它是通用的,但是外向二点一模型所占用的内存会更少一点, 并且它带来的效果跟外向二点二模型就可以了。然后除此之外呢,我们可以看到这里还有 logo 模型以 及这一个 adio 接口的模型,对吧?这一个模型呢,主要是我们的音频模型,一般是用在 s 二 v 的 一个数字人生城里面的,但是这里我们不进行讲解, 那么 lala 模型呢?这里面我们主要要下载的 lala 模型是下面这四个,那么下面这四个模型呢?同样的跟我们前面的千维音频 addy 模型的加速模型是一样的,它也属于 lite 叉二 v 的 一个加速模型。 那么我们这里呢,就先下载我们 t l v 的 两个加速模型,把它下一下来,每一个是一点二三 g b, 然后放在我们的 log 文件夹里面就可以。那么这些呃模型都下载完之后呢,我们就回到我们 comforoui 的 这一个 操作页面,然后回到这一个操作页面之后,我们先来解析一下这整一套工作流,那么其实这一整一套工作流呢,它的底层逻辑跟我们的纹身图工作流没有任何的区别,那么我们的纹身视频工作流呢,其实跟我们的纹身图的工作流它是呃互通的,基本上那么基本上包含的主 键也是一致的,首先是模型加载,然后是可列的文本编码器,然后是 k 长器,然后呢就是我们的功能毯,然后 v a e 解码,最后生成视频。 但是这里我们需要注意的是我们的大模型加载,这里它要加载两个 unit 加载器,也就是我们刚刚讲到的高噪声模型以及低噪声模型。那么这里可以看到我已经加载了 t 二 v high noise 以及以及 t 二 v 的 一个 low noise 模型,也就是高低噪声的两个 ve 架构模型。 然后我们的 clip 加载器里面加载的模型呢,也是单模型即可,不需要双 clip 啊,这里这里需要注意,然后用到的是我们 um t 五叉叉 l 的 一个模型,那么类型呢?一定要改成 one, 如果不是 one 的 话,它肯定会报错。这里我们再重申一遍,一定要改成 one, 不 然它肯定会报错。 然后 ve 呢,就用到我们的呃,二点一的 ve。 然后由于我们用到了高道声模型和低道声模型,两个模型驱动我们工作流去生成视频,所以我们去加入,我们加速罗拉的时候也要用到两个罗拉加气。但是这里我们一定要分清 luna, 也分高噪声和低噪声,我们可以把这一个节点给它放大一点,把它全名弄出来,可以看到它也是 t 二 v lite 叉二 v 四部 luna, 然后 high noise, 对 吧?那么下面呢,也是一样的,就是 t 二 v lite 叉二 v 四部 luna, 应该是 low noise, 也就是低噪声, 所以说 luna 也要配比成功。那么你去用其他的一些 luna 模型,比如说一些风格化的 luna 都给下载下来,不然的话它可能会运行不了。那么这里呢?呃 呃,也要用到我们的模型,采用算法主要是为了让我们视频生成的,呃更稳定,呃,不会说出现一些抽象的一些现象。然后紧接着就是我们的 k 长器, 那么 k 长器呢,也是要两个,那么这 k 长器用到的是 k 长器高级,因为,呃他需要分布处理嘛,对吧?高噪声,低噪声。然后这 k 长器里面的参数呢?我们需要注意的是第一个高噪声的 k 长器添加噪波,这里我们需要把它打开,因为我们在 首先进行第一步降噪的时候,我们就需要把要用到的噪声全部冲入,然后要冲入多少呢?我们主要就是看步数了,因为我们用到的是呃四步的一个加速多少,所以我们这里就是四步,对吧?然后这里就冲入大概四步能够用到的一些噪声, 然后充入完之后呢,不要忘记 c f g 也要改为 e 哦,因为一般来说低步数对应的也就是低的一个 c f g, 但是这里我们也需要注意的是,为什么这一个斯布鲁拉可以加速第一个,除了它的步数可以减少之外,它也可以把 c f g 给它降下来,那么 c f g 呢,就代表了一个高的提示的遵循度,对吧? 那么提示是遵循越高的话,你就会发现它所要渲染的内容也会越多,那么渲染的内容越多呢,它所要占用的时长和 gpu 也就越多,所以 c f g 下降是一个降低显存的一个效果,可以这么去理解。 然后采暖器的调度器呢,就用到官方普通的 u r 和 signal。 那 么这里的开始降噪步数以及结束降噪步数呢?我们也要注意, 因为我们总步数是四步,所以一般是零步开始,对吧?然后降噪到两步,高噪声就降噪完成了,然后再返回照波,然后把返回的照波呢再给到我们的 k 长器,第二个也就是低噪声的一个降噪,通过 k k 长器高级第一个的一个 lincoln 给它连接下来,把照波输入到我们第二个 lincoln, 然后这里我们就肯定不需要添加了照波了,对吧?因为我们第一步已经添加了照波嘛,然后由 lincoln 把它传输进来, 然后这里呢我们也要用到我们一个四步啊,这一种步数是不变的,也是四步,然后 cfg 不 变是一步, 然后开始降噪步数和结束降噪步数呢,我们这里就需要哎把它从第二步开始降噪,然后啊第四步结束,当然这个四步这里你也可以改成一万,因为他总步数只有四步嘛,所以他在第四步的时候就会停下。那么最后的结束 步骤呢,你不管改的多大都是可以的,没有任何的一个问题。然后这里呢我们需要注意的是我们两个可立的文本编码器,一般来说提示词官方会给到,我们可以不变,然后这一个正面提示词呢, 我们就可以用中文去进行一个书写,都是没有任何问题的。然后我们可以看到这里有一个像空人腾一样的东西,这里用到的是混元一点零的一个人腾,但是 没有任何的区别,反正功能都是一样的,然后宽高就由我们自己去设置,那么这个小伙伴们肯定知道他是怎么用的,对吧?然后这里有个 length 一个长度,那么这个长度呢代表的是总帧率,那么总帧率呢,也就是说我们生成视频一一共要生成多少帧,那么这里就是八十一帧的意思。 然后下面这里有一个 batch size, 也就是基本的一个渲染尺度啊,渲染的一个参数,我们可以这么理解,如果这里是一的话,那么他每次生成图像就生成一张, 如果他这里是二的话,那么他每次同样的一体生成的张数就是两张,但是这样子速度会增加,但是他对你的显存压力会有所增大,如果说你电脑显存不是很好的话,我们就用默认为一就可以了,这里不需要任何的更改。 然后我们把这里设置完之后呢,就需要一个 v a e 解码,那么这里的 v a e 解码,他总共解码了多少张图片?是不是八十一张图片,然后把八十一张图片呢,统一输给我们的帧率为十六,也就是说 十六张图片为一秒,那么八十一张图片,它就总共会有五秒的视频产出,最后再把视频保存下来。 那么这里呢,如果你不用到这两个节点,你也可以用到其他的一个节点,叫做合并为视频,这一个节点呢就比刚刚那个节点要更加方便一点,它是属于一个呃统一的节点,但是你要用这个节点,你需要去下载一个插件,叫做 video helper, 那么这一个插件呢,我们可以来到 manager, 然后节点管理,然后直接在这里搜索 video, 然后就可以去找一下啊,看一下有没有 video helper 这一个插件。那么这里呢,不妨在后面打多几个 h e l 这一个三就直接出来了,你直接安装这个插件,然后重启 com ui 即可,非常的简单。 那么这里弄完之后呢,我们就把最后这里 v a e 解码的图像解到我们这一个节点,然后这里面有一些参数需要设置一下,第一个是帧率,那么同样的我们把它调为十六帧, 那么最后呢,也是以呃一秒十六张图片的一个规格进行合并,然后这里的格式我们需要修改一下,可以看到现在是 g i f 的 格式,也是动态图的一个格式,那么我们选择 个 mp 四的一个格式就可以了,然后这里 mp 四选择哪个呢?呃,就看你自己其实选择哪个都一样,反正都是 mp 四嘛,对吧?然后选择完之后呢,我们就可以去生成我们要的视频了, 这里我们用到的是十四 b 的 一个模型,所以我们最高的一个帧率可以生成到幺零八零乘以幺九八零的一个尺寸,也就是幺零八零 t 的 一个尺寸。那么这里呢,我就简单用七二零的来代替,也就是七二零乘以幺二八零,那么是一个横屏的,然后我们的提示词我简单的书写一下,比如说, 呃,那么我这也就填写了一辆自行车在路面去骑过的一个倒影, 然后我们简单的点击生成,看一下他所消耗的一个时间。好,那么视频生成出来了,我们可以看一下效果,哎,效果还是非常不错的,对吧?非常的高清,当然这个还只是一个竖屏呢,我们可以把它改成横屏的效果会更好。因为他训练的时候训练了很多电影级别的参数吗? 所以我们把上面改成幺二八零,下面呢改成七二零,那么刚刚呢,加上模型加载的一个时间 的时长是三百四十二秒,还是挺快的,但是这一次呢,他不需要模型加载时间,我们可以看一下他的一个时长。 ok, 我 们可以看一下他的一个效果啊,我觉得没有任何问题,可以看一下这个,呃,脚踏的位置, 对吧?还是蛮好的,当然我们也可以在后面再加上,嗯,电影级别镜头啊,非常的简单,对吧?然后前半部分呢,我们可以再改一下,嗯,一个 女人啊,坐坐在坐在坐在车上流泪啊,就这样子,然后我们点击生成,再看一下他的一个效果,我们可以看一下他视频的一个呃, 生成,呃,效果上还可以吧,对吧?不算太好,也不算太坏,可能是这个镜头表达有问题,有可能是我节食迅速的有问题,但是这些都怎么说呢?反正还行吧,整体来说对吧?那么其他的一些镜头呢,大家就自己去测吧。那么,呃, 本节课的内容有那么多啊,如果小伙伴们觉得大家讲的不错的话,不要忘记一箭三连喽,我们下期再见,拜拜。哈喽,第一章的小伙伴们,大家好,我是你们的大鱼老师,那么欢迎来到我的二零二六最新康复 u i 基础系列课堂的第十课, 那么本堂课呢,我们主要讲解一下我们万象二点二 i r b 工作流以及模型的一个应用。那么上节课呢,我们已经简单的讲完了我们 t r b 的 一个工作流应用,并且去加入了一个加速多了,然后看了它 简单的一个身图质量。那么这里呢,呃,我们要用到 i 二 v 的 一个呃,生成视频的模型呢,我们就需要来到我们 hackin face 这一个官网主页,那么上节课也是来到 comforion 的 这一个 呃,官网主页里面,我们可以先来到 diffusion model, 然后把你需要的 i 二 v 的 模型给它下载下来。那么跟上节课一样呢,我们只需要下载 s t 八的两个模型即可,一个是 high noise, 一个是 low noise, 然后再来到我们的 laura 这里面去下载我们的 i 二 v 的 两个加速模型,那么下载完之后呢, 我们就把它放置到对应的文件夹里面,回到我们的 comforu i 里面,然后在 comforu i 操作页面里面我们看一下。首先 i 二 v 的 一个工作流的一个分解,那么工作流呢,其实跟上节课 t 二 v 的 工作流应该来说区别不大, 它主要也是由模型驱动板块以及 lora 加载板块以及 k 长 t 板块去进行驱动的。最后就是我们两个的可列软文本编码器, 那么这里面呢也是要注意,一定要把 high noise 和 low noise 给它放对位置,并且要放置是 i 二 v 的 模型。这里再重申一遍,是 i 二 v 的 模型,不要放置到 t 二 v 的 模型,不要把模型搞乱,如果你把模型搞乱了之后,你没有生成出好的视频的话,你再来问我,我就干干干你 好。然后可瑞的模型呢,也是不变的,用到 umt 五叉叉 l 的 模型,那么 ve 模型呢,也是二点一模型,完全没有任何的变化,但是这里的 low 模型呢,我们一定要注意,这里也是要用到我们万象二点二 i 二 v lite 叉 two v 的 一个 high noise, 下面呢就是 low noise, 但是这里也要注意,要用到的是 i 二 v 的, 然后偏移值呢,也跟上节课 t 二 v 的 工作流一样是偏移值 v 五,那么这个呢,也是官方给到的一个参数啊,基本上保持不变就可以了, 那么 k 长器上节课也已经讲过了,那么不变的是四步啊, cfg 为一,然后零到二是我们高噪声模型的产生器,那么低噪声模型的产生器呢,也是四步幺点零,然后两步到四步,当然四步上节课也说到了,可以把它搞到一万步,对吧? 都是没有任何问题的。然后这里面的一个提示词的一个填写呢,我们也可以进行中文的一个填写, 那么这里的核心节点就是我们的 one image 图 video 啊,然后这里的加载图像我们也需要注意,可以加载横屏和竖屏的,那是横屏和竖屏所对应的尺寸,我们这里限制的时候就要把对应的尺寸填写进来,那么这里的尺寸呢,也是分成了三个的,你 可以填写四八零乘以八三二,也就是我们四八零 p 的 一个视频生成尺寸,你也可以填写七二零乘以幺二八零的一个尺寸,也可以填写幺零八零乘以幺九二零的一个尺寸。但是这里呢就要量力而行呢,根据你的 一个本地选存的一个大小进行一个匹配,如果说你本地选存不是很大的话,就用四八零乘以八三二的一个尺寸进行生成,那么可以生成的质量也是蛮好的。那么这里同样的, 呃,如果说你不想手动设置的话,你也可以在这里加入到另外一个节点,叫做按宽高比例缩放,或者一个 resize image v two 的 这一个节点,那么这一个节点呢,还是比较好用的,我们可以先让图像经过 resize image v two 的 这一个节点, 然后再把图像传给我们 start image 这里去识别我们这一个图像,但是这里我们可以看到它有宽高的一个点数,可以拉出来线连接下去,那么这里呢,我们就可以在这里强行把它设置到,比如说我想要来一个横版的,它就是幺二八零 乘以七二零 p, 然后它的算法结构呢,我们这里就可以选择一个裁剪啊,这也是从中心开始拓展,然后这里的算法结构我们可以选择到裁剪, 那么这样子呢,我们通过上传横版的图像,他就会帮我们裁剪到七二零乘以幺二八零,那么裁剪是怎么裁剪?他从中心往外扩,那么扩到最外边,如果说哎超过了我们的七二零或者幺二八零呢,他就把外面的不要了,直接截取, 那么这样子就可以很好地保存到我们中心的一个画面。那么比如说这里呢,我就上传了一个呃横版了,是一个乌鸦与蛇的好像要争斗的一个画面,那么我们通过这里 image 可以 预览一下这个图像,可以看一下它的一个运行 机制,那么我们就可以看到它可以把图像裁到幺二八零乘以七二零,对吧?很好地保持了这一个呃图像的一个大小,然后最后大小要传给我们 one image 图 video, 通过这个节点 作为一个呃核心的一个内容。然后这里呢,我们需要知道的是,这一个节点除了可以读取我们图像的一个宽高之外,它还可以对我们首张图片进行一个 v a e 的 编码,可以看到这里也有 v a e, 对 吧? 然后编码完之后,它会把所有的信息传输出去,分别把它传输到我们的文本条件以及 lincoln, 那 么 lincoln 呢?就 这用于我们的第一个 k 长器的一个降噪了,然后这里我们需要注意长度,我们跟上一课一样,也是设置到八十一帧,当然更多的一个帧率 也可以,这里我们就不做限制,但是更高的一个总帧数呢,它所带来的显存占用肯定是更多的,那么下面这个比特率 size, 也就是我们的同时渲染帧,这里你也是保持为一即可。 那么这里我们可以看到它有一个 cleave vision 凹凸的一个选项,那么这里你可以选择不连接我们的 cleave 的 视觉编码器,当然你也可以选择连接,那么这里如果你选择连接的话,你就可以把 cleave 的 视觉编码给它弄出来, 然后图像的话也是连接到我们 design image 的 这样图像,然后 cleave 的 视觉呢,我们就需要拖出来另外一个视觉加载器,在这里面的这个模型我们最好就用到我们 cleave vision h 的 这一个模型,当然了,如果说,嗯,你 不去用这个的话,他也能够对图像进行编码,但是我觉得用了这个之后,对图像进行的编码会编码的更加的完全一点,读取图片的信息可能会读取的更好一点,所以这里我一般都会加入,但是官方的工作流还是没有加入的啊,你也可以学习我,然后把这些东西都设置好之后呢,最后就是呃,通过我们的 一解码把图像解码出来,然后创建 video, 然后最后把我们的 video 给它展示出来,当然这里也可以用到我们上节课用到的合并为视频,那么我最常用的呢,也是合并为视频这一个节点了,因为我觉得这个节点蛮好用的,然后我们可以把图像上传,然后把帧率改到十六, 然后这里呢,我们把呃,这里改成 mp 四的即可。那么这里的提示词我们可以简单书写一下,可以大胆的去想象你的画面,比如说那么这里呢,提示词我就写了乌鸦和蛇正在争夺蓝色的宝石,然后乌鸦不断的拍打翅膀,那么蛇呢,则是不断的甩动尾巴。 那么这里呢,简单的把这个提示词填写完之后,我们可以生成一下这个画面来看一下。好,那么现在视频生成出来了,我们可以看一下它的质量,其实质量整体来说还是蛮不错了,对吧?那么这种质量呢,我觉得,呃, 拿来做一点点,比如说那种小说的解说是没有任何问题的,那么除此之外呢,这种图像视频的模式,我们也可以把它转换成为首尾帧的一个模式,我们就要用到另外一个工作了,我们可以看一下, 那么这个工作呢,其实也很简单,它用到的模型也是我们 i 二 v 的 一个 f p 八的模型,跟刚刚的模型是不进行改变的,那么这两个呢,都是一样, high noise 和 low noise, 然后加速器呢,也是用到了我们的一个四步的一个 loa, 那 么跟刚刚用的也是一致的两个 loa, 所以 说基本上不进行改变。唯一进行改变的呢,就是我们 one 编辑图 video, 然后这里变成了呃, one first last, 然后 more to video 这一个节点,然后这一个节点呢,我们可以看到它就是可以上传我们两个图片的,对吧?作为首帧和尾帧分别为 start image 和 end image, 那 么这里呢,我们同样要用到我们的 reside image, 然后我们可以把它复制两个出来,那么复制两个出来之后呢,我们先把呃首帧图片给到它, 把它限制在七二零乘以幺二八零啊,幺二八零乘以七二零吧,哎,算了,还是七二零吧,用个竖版的。然后下面这一个呢,也是一样的,把它限制到, 嗯,七二零乘以幺二八零,那么我们只需要用到一个的宽高,输入到我们下面的宽高点就可以了,然后这里呢我们可以看到,哎, 他也是需要把伪真图进行一个怎么样进行一个就是中间的一个裁剪的,对吧?但是不要忘记,一定要把首先图的伪真图给到这一个节点,如果不给到的话,他会进行一个错误的一个视频生产。 然后这里我们可以看到这一个方式呢,我们肯定也是选择裁剪了,对吧?然后这一个方式呢也是选择裁剪,那么这样子呢,就能得到一个比较好的比较统一的两张图片 给到我们这一个节点,那么这个节点的运行机制呢,也是非常简单的,它主要是利用这个节点对于开始的图像和结尾的图像进行一定的编码,编码完之后呢,它会在这个节点里面去识别两张图片的一个过渡阶段,然后生成中间的一个补全信息,给到我们的 两个 k 长器,进行中间图片的生成,生成完之后你就会看到一个连贯的一个过程了,然后就形成了首尾帧的一个效果,然后通过高地声噪声把视频渲染出来之后就给到我们的 v a e 解码,然后 delete video, 加上我们的 set video, 而这里我们也同样的把它改成 定为视频的节点,然后我们可以简单的把这个图片连接过来,一样的帧率改十六,一样的格式改成 mp 四,这里一定要注意啊,一定要改对,如果改错的话,那生成出来的东西那就不成样子,那就怪我了啊, 自己自己注意,自己注意就好,然后可以简单的把这个节点放大一点,然后这样子呢就得到了我们简单的首尾真的工作流,然后这一两个图片你也可以简单的进行一下摆放,那么这里呢,我上传两张竖屏的图片。好,那么这里呢,我上传了两张统一模特的不同姿势的姿态图, 那么这里我们需要注意的一点是,在我们上传首尾张首尾真图片是有关联的,不要说两张图片风格差异太大,或者说 你让他同一只猫,然后变成一只不同风格的狗,那么他中间生产的针率肯定就是很跳的,所以我们最好就是用这种有一种连贯性的两张图片给到他就好, 然后我们可以看到这里是半身的,对吧?这个是全身的,那么我们写提示词的时候可以怎么样去写?那么你就可以简单的去描述一下这一个过程,比如我这里的提示词写一个穿着白色上衣,蓝色牛仔裤的这一个 女生,缓慢的抬起脚就可以了,简单的进行一下描写,然后我们可以点击生成看一下他的一个首尾针的一个效果,那么我们视频可以看到,虽然出来了,但是这个视频有点问题啊,可以看他脚的这一部分,不知道为什么会有一层袜子,但是从这里看可以看到好像手针就已经存在袜子了。 我们看一下原图的图像啊,确实是原图的这个图像有问题啊,我们可以换另外一张姿态图上来,那么比如说这里呢?我上传这张图像,然后我再次点击生成看一下它的一个效果。 现在视频上出来,我们可以看一下它的一个效果,其实整体上的效果还是不错的,一次性保持的也不错,对吧?后面那两个凳子他不知道是什么东西,所以他给它撕开了。当然我们也可以描述一下,比如说他可以先推走这个凳子,然后再做相应的一个动作, 我觉得就可以做到一个准确五五吧,那么本节课的内容有那么多,如果你觉得戴老师讲的不错的话,不要忘记一箭三连喽,我们下期再见,拜拜! hello, 小 伙伴们,大家好,今天这期视频主要给大家带来的是一个 one 二点二的图声视频新模型,它是 one 二点二视频大模型的系列魔改微调版的 unit 模型, 由创作者 d c y 制作的优化版本,主要用来生成二次元风格和 c g 二点五 d 为主的 n s f w 图声视频,支持一张或者多张图片生成,连续保持角色和画风一致性,特别偏向翻剧、漫画构图方面的理解。 因为我们都知道 war 二点二在动漫这一块的模型其实很少,所以呢,在看到这个模型时,就想做一期视频专门给大家分享一下。 同时为了方便小伙伴们研究和学习本期视频用到的所有模型和工作流,我也打包好上传网盘了,你只要下载下来就能用。 接着我们回到工作流,我给大家讲解一下哈,这是我刚刚跑出来的一些小 demo 案例。整体来说,这个无限模型在 c、 g 二点五 d 方面的表现还是很不错的,你们会发现它生成的一些片,它的动态效果是特别特别好的,对吧? 左边的这两组这是 d、 c、 y 单图的动漫图声视频,右边的这两组是 d、 c、 y 的 首尾真动漫图声视频,其实它分别就是一个 y 二点二的图声视频。接下来我就给大家讲解一下工作流的使用方法。 其中万象二点二和上个版本的万象二点一的使用上会有一点不同,它分别要加载两个大模型搭配着使用,分别是一个量化过的高噪模型和一个低噪模型, 其中的原理我给大家讲解一下哈。我们可以想象,在拍一部电影的时候,高噪模型就像导演初步勾勒出来的场景的大概轮廓,先把画面的大框架、人物位置、大致动作和镜头走向定下来。 那么低噪模型就像是化妆师和细化镜头的精修团队,在这个大框架之上逐步打磨细节、质感、光影和色彩,让画面变得更加真实生动, 协同在一起工作,会比万象二点一单独一个模型要高效和稳定,因为大结构和小细节的优化,分工清晰, 效果也就更加可控。而我们今天只要把 one 二点二的高噪和低噪模型换成 daisy world 的 高噪和低噪模型就可以了。旁边的是 one 二点二的高噪和低噪的加速 laura, 左边这个它也是一个 like x 二维技术的加速 laura。 为了进一步的提速,我在下边这里也加入了 stage attention 和 torch 的 加速技术。如果你的工作流在跑起来的时候出现 stage 或者 torch 这类的报错的话,你也可以点击下面的忽略多框的这个关闭按钮,把它关闭掉就可以了。 如果小伙伴们想了解更详细的望二点二本地部署和更多的操作内容,小伙伴们可以看我之前分享的另外一篇视频内容,里面有更多详细的细节讲解哈。 ok, 那 么我们来到左边这里上传一张我们要用来图生视频的 c g 或者二点五 d 图像,接着什么都不用管了, 工作流会自动根据我们上传的这张图像自动分析角色构图、环境、背景、情绪等等信息,自动反推出我们要生成视频的运镜提示词。 我们可以在展示任何这个文本节点这里看到,如果你也想加入一些你自己的想法的话,可以在下面的这个空白的文本编码框这里填写进去就好了哈。给大家也讲解一下这里我们运用的文本反推技术, 它就是阿里千问三的大语言文本模型 m 四 b instruct 模型。最后我们只要点击一下运行就可以了。由于跑视频花费的时间会稍微的比较长,我这边就不演示了哈,我们可以过来这边详细的看一下它的具体效果哈。 小伙伴们觉得这个运镜和角色的表现效果怎么样呢?跟我们的曾经的国漫一哥比起来,能不能比上一比? 我们再来到右边这里,看一下他的首尾帧效果表现到底怎样,我用到的也是刚刚的角色,生成了两张不同场景的首尾帧图片,接下来也是什么都不用管,直接点击运行,最后的得到右面的这么一个效果。 其中的视频运镜和美学提示词都是 ai 自动生成的。大家觉得这个模型的可玩性效果怎么样呢? 模型的作者说了,也支持 as f w 和它的极其多样化,出于稳妥一点,我也跑了两个稍微保守一点的案例给到大家。如果你在做 c g 或者二点五 d 风格的动漫内容,这个模型值得试一试。 好的小伙伴们,本期视频的分享就到这里了,视频中演示用到的工作流模型和操作文档,我也打包上存网盘了,有需要的小伙伴可以在评论区置顶位置自行领取,赶紧玩起来吧,谢谢大家! 如果看到这里对你有帮助的话,那请给老师一个免费的一键三连吧,让更多想要学习 ai 绘画的小伙伴看到这个视频。