粉丝3202获赞2.4万

哎,千盼万盼以为能开源一个编辑,结果等来的还只是一个生图模型 z e image 啊,不要这样消耗社区的耐心了好吗?难道说,难道说你真的打不过克莱因? hello, 小 伙伴们大家好,那么终于啊,这一 made 的 base 模型呢发布了,但是比较遗憾的是这次它不带编辑啊,只有一个升图模型 啊,那么这个模型呢,我们看一下它的一个基本的一个特点啊,首先呢,它的需要更高的一个步数和更高的 c f g 啊, 但是光康菲尔官方这边推荐的呢啊,比如说 c f g 等于四到七啊,我试了一下,四到七的话,它会有点过你和啊,会造成画质的一个怎么讲会有这种色块啊,奇怪的色块啊。 那么这个的话,我们可以适当的降一下 c f g 啊,目前我这边跑了一组是二点五啊,那么推荐步数呢,是 三十步到五十步,那么其实我试了一下,二十步也是能出图的啊,二十步也能出啊,也能完成离合, 那么这个模型呢,他的多样化会更好啊,意思是什么呢?就是说如果换不同的种子和不同的彩样器啊,那么他的这个变化会很大,我们又能重新找回这个抽卡的乐趣了,能够找回抽卡的乐趣了,所以说,呃,这也是一个比较优势的啊, 你看这样同词的,然后啊,不同种子它的变化是非常大的,变化非常大 啊,这也是一个好处啊,那么这个时候呢,我们就把这个 turbo 的 模型呢,还有这个我们新的这个 z minus 的 base 模型, 跟我们的克莱因的九臂的模型啊,同场竞技一下啊,跑了十组提示词,那这十组呢,包含了我们这个时尚的一个摄影啊,还有我们这个刘亦菲的自拍, 二次元的这个,还有我们中式的一些元素的,还有一些建筑的图,还有一个特写,面部特写啊, 小清新,日系的一个写真,还有就是说一个风光啊,还有我们日常的一个这种写实的这种摄影,还有一个就是平面设计的,我们看一下他的一个对比的一个表现啊, 首先从第一组开始啊,这个就是我们的一个时尚写真的,这个我们靠的这个画质啊,明显的就是说,呃, 贝斯模型呢,比这个 turbo 模型呢,它的对比度和饱和度啊,包括色彩更加的浓一些啊,更强一些, turbo 呢,就是相对来说稍微清淡一点啊,但是贝斯呢,它的这个对比的质感就更强一些啊, 那么克莱因呢?克莱因的话,它的美感就是不如这两个啊,毕竟,对吧。呃,这这个模型是非常符合我们国人口味的,但是克莱因呢, 它就不太行,不过克莱因也不是毫无优势啊,克莱因的这个像素的密度就是有效像素,它比这个 z 的 两个模型都要高一些啊,都要高一些,我们分辨率是一样的啊, 我们看一下,你这的话,稍微放大一点就能看到,对吧?他的边缘也好,就是没有那么清晰啊,贝斯会好一些,贝斯会好一些,但是克莱因呢,我们可以看到啊,即便放大我们这个边缘,包括肌肤的质感也是比较清楚的,这也是克莱因的一个优势的点啊, 但是说这的这两个模型已经足够我们用了,我这边分辨率都是幺五三六乘以幺零二四的哈,好。第二组刘亦菲的写真,那么 对吧,我们看了以后,这个其实两个 z 的 模型表现都很好,是不是啊?那么 base 呢,感觉更加的真实化一点,他没有像那种就少了一些小红书那种滤镜那种感觉啊, 但是对吧,克拉因啊,就比较油了啊,比较油,而且他也不认识刘亦菲,对吧?但是克拉因还是像我说了,他的边缘啊,包括这种像素点的这种质感啊,更加清晰,更加结实啊,比这个 turbo 的 包括这个贝斯都要结实。我们看这衣领的位置能看出来啊, 就是更清楚,说白了就是更清楚,这个图更锐利啊,更结实啊。那么二次元二次元的话,其实贝斯的话我觉得表现会更好啊,为什么? 因为就像我们刚才说的,它的这个饱和度和对比度都会更强一些啊,都会更强一些,那么其实对二次元来说,这个对画质反而是一个提升哈,因为 turbo 的 话,它都会有一点点的,就是说比较稍微清淡一点, 那么对二次元这种需要这种强烈的画风表现的呢,就反而是不是一个优势啊,那么 face 模型这时候反而就有优势了, 那克莱因这个就不行了啊,克莱因一个是肢体崩了啊,二是他的这个,呃,怎么讲呢,也不是日漫啊,有点像美漫欧漫那种感觉啊,这个风格有点问题。 那么中式这个也是啊,中式还是啊,这个不知道为什么手有点点崩,可能是有些像素不够啊, 同样的也是明显的一个饱和度和对比度都要更强一些,就是图片看起来整体的更加锐利,更加结实一点啊,包括色彩的对比度也是。那么当然, turbo 还是很讨喜啊, 这种这个很适合摄影的风格,那么 colour 就 没办法了。 colour 你 不认识中式元素对吧?你无论你的画质再怎么结实,边缘处理的再清晰,你不认识就是不认识,你不会就是不会啊,那没办法。 呃,这个建筑,这个我反而觉得克莱因的表现会比较好啊,我们看贝斯这个呢,他就是相对那个色彩更加浓艳一些啊, turbo 呢,就更加的那个 稍微低饱和度那种感觉,而且就是细节会相对缺失一些啊。对,贝斯,那么这组我们看克莱因的表现是最好的,无论是材料的质感啊,细节的表现,包括色彩的一个把控啊,我觉得都不错,都更加像我们的一个建筑的摄影作品, 我们这个角色的一个面部特写啊,这个就能看出 face 一个特点了,它这种肌肤的质感纹理啊,比这个 turbo 要高的多啊,毕竟 turbo 它怎么讲是我们蒸馏过的,相当于摄影专门 强化了一个模型啊,理解为他做了一个美颜哈,专门做了个美颜,这个就对吧,很欧美啊,虽然说非常清晰,但是说太欧美了,就说审美,跟我们这个中国的审美是有点冲突的。 那么这个也是啊,这个日系小清新的一个摄影前任哎,很有味道是吧?他不像说这个 turbo, 他的这种滤镜风特别强啊,滤镜感特别强, 他是很自然的一个抓拍的感觉是吧,就是这一点也是一个优势啊,那么克莱因这个反而表现的让我有点惊讶哈,他那个表现还不错,实话说,包括这个颜色,包括这个质感啊,画质都不错。呃, 挺好哈,只能这三个我觉得各有特色啊,那么这个风光的也是很明显,我们能看到啊,就是 base 的 模型,它的这个饱和度啊,明显要高一些,这还是我在降了 c f g 以后啊,如果你 c f g 调高的话,它的饱和度会更高啊,对比度会更高。 那么 turbo 呢啊,也是一如既往的比较清淡,那么这张我觉得 flux 的 克莱因表现的会更好一些,他的还说因为风光嘛,风光的图片,大家玩摄影,能够照风光的照片就是要一个锐啊,就是要锐,对吧? 啊,光圈开的尽量小,那么克莱因这个就做到了,包括这边缘这些树啊,远处这个山峰的边缘,对吧,都比这个 turbo 的 要结实啊,比这个 base 也要结实一些,对吧? ok, 那 么这个生活,这个写实的这种场景呢,这肯定就是我们国产的模型的一个主场,无论是 base 也好,还是 turbo 也好,表现的都非常棒,包括这个文字写的也都很好啊,但是这个茶叶蛋十五块钱一个,太贵了,少了个点 啊,中文也是,对吧,这个就没办法啊,我们国产模型就这个优势。科莱因这个呢,就差很多啊,就是很像那种有点儿 chad g b d 四 o 那 种黄不拉几的感觉,对吧,而且这些吃的也好, 呃,文字也好,都没有那么多的重口味啊,因为我们提示词里边有烟火气这三个字,那么克莱因很直白的给你把火点着了,冒了一股浓烟,但是我们国产模型他就很理解烟、火气这三个字的含义啊, 就是说这个,但是这个豆浆好大一桶,好大一桶。这个我觉得贝斯的表现很好啊,表现特别像一个计时摄影,那么 turbo 呢,就更像我们手机拍的一个, 那么这个一个,呃,我们中式的一个讲二子平面设计啊,关于马年的这样一个 看文字的表现,哎,这个 base 的 文马 base 的 文字呢,写的应该是更好啊, 写的应该更好,包括上面这几个字啊,表现的更好一些,但是 turbo 呢,就稍微差一点点,虽然它图片看起来更规整啊,但是文字写的就差一些,下面这些因为字太小,它已经崩了。单纯看这几个字主题的这个字啊,这个贝斯表现会更好一点, 那克莱因就没办法了,对吧?克莱因就是你不认识,你不会啊,你怎么样都没有用啊,这就是简单我们这几几组其实词的一个对比啊。那么,呃,个人感觉总结下来就是说,呃, 从这个升图时间上来讲啊,这个 base 模型,因为我需要更高的步数,对吧?更高的 c f g, 它必然是很慢的,大概是我们这个 turbo 模型的十倍的这样一个速段,像我 turbo 模型生成这十张的话用了五十四秒,那么 base 模型呢?差不多用了五百九十九六百秒啊, 那么克莱因是最快的,克莱因大概只要三十多秒啊,因为他只需要跑四步,然后其次呢,就是说,呃,就像我们官方这边也提示了 base, 他的生图呢,就是,呃, 应该从美感来说是不如这个 turbo 的, 因为 turbo 相我们理解为一个摄影专门的一个强化模型啊,强化模型啊,那么但是我这次跑一下,如果按照这个参数设置呢,其实效果也不错啊,就是一个慢一些,慢一些, 只能说各有各的味道, turbo 呢,像是一个风格强化的这样一个模型, 但是呢,这个贝斯呢,这次也提供了一个更好的一个多样化啊,我们大家可以正常的去抽卡了啊,不会像这个呃, turbo 模型锁的这么死啊,同时呢, ai two kiss 啊,也就是在第一时间已经支持了这个 我们的这个贝斯的一个训练啊,大家可以看一下,我们今天晚上我就把这个炉子再装上啊,感受一下这个训练的速度怎么怎么样啊, 这就是整个的这样一个个人的一个使用感受啊,目前来说,我,嗯可能主力模型就是生图模型,还是会用这 turbo 啊,毕竟又快嘛,对吧,超级快,又快又好啊。克莱因呢,可能是我拿来做编辑用的啊,毕竟 这次他只发了一个生图模型,没有放编辑模型啊,也是有点小遗憾,期待一下编辑模型能够尽快的放出来,这样的话我们的整个生态呢就可以连接上了。 ok, 那 就给大家简单分享这里啊,模型呢,还有工作流我都会上传到网盘啊, running hip hop 现在也已经支持了啊,大家也可以在线上去体验。好,就这样,拜拜。

最近除了大火的 nano banana pro, 还有一款模型的表现同样非常亮眼,它就是通域最新发布的 gimage 图像生成模型,最重要的是完全开源免费 支持 n s f w 输出的纹身图,模型参数量仅为六十亿,绝对属于轻量级选手,显存消耗只需约十六 g, 大 幅降低了本地部署门槛,让更多人能够轻松上手体验。 从官方视力中可以看出, g e m g 能够生成高度逼真、具备专业极致感的图像,美学表现也相当出色,无论是图片质量还是生成速度,他都交出了令人满意的答卷。 接下来学姐就带大家一起安装部署,并进行一些案例测试。如果你有独立显卡,并且显存超过八 g, 那 就跟着我一起部署吧! 打开 comui 官网,点击下载,找到与你系统对应的版本进行安装。接着打开 comui, 让它自动开始安装。部署完成后,可以直接在模板这里搜索 gmail。 以往安装过 comui 的 朋友在这里没找到的话,可能是 comui 的 版本不够, 在网页搜索 gmail, 进入这个界面往下滑,在这里下载智信工作流文件, 接着就能直接将文件拖进 comui, 它会弹出弹窗提示,缺少模型,按照它的指引下载即可。模型下载完成后,就可以开始你的 ai 创作之旅了。直接在文本框里输入自然语言,或者是将你准备好的提示词复制过来。 comlitent 这里用于控制图片大小以及一次的生图数量,其他参数保持默认。 接着就可以点击运行,稍等片刻,一张图像就生成出来了。如果你觉得本地部署麻烦或电脑配置不足,也可以直接前往哈丁 face 体验在线生图。输入提示词,在这里可以选择图片尺寸, 点击生成。生成速度真的非常快,两三秒就能得到一张图像,而且完全免费使用。 首先测试一下它的文本生成能力,这是我在网上找的一段 ai 绘画提示词,一张手绘风格的英文海报,即使提示词中包含大段英文 z image 也能准确生成文字内容,就连细小文字也能清晰呈现。接着测试中文生成能力, 海报审美在线的同时,中文文字生成毫无扭曲。我现在用的显卡是四零九零 d, 这张幺零八零乘幺九二零的海报十六秒就生成出来了。继续来看看中英文混合的海报生成效果。 油画风格有了,画面壮阔又孤寂的氛围也准确的表达出来了。生成的中文、英文均按提示词准确呈现。这三组海报测试下来,生成出来的文字都是清晰无扭曲。 接着再测试一下他在人物摄影方面的能力,即使你不会写提示词,仅用自然语言描述场景,校园草坪、 jk 少女长发、黄金时刻逆光 也能生成出非常不错的效果。发丝在阳光下的细节、皮肤质感都表现得细腻真实。再来试试电影胶片质感的梦幻少女写真。亚洲人物面孔生成的还蛮有记忆点, 从这几组亚洲人像案例可见,即每只生成的面孔具有多样化,避免了以往某些模型输出面孔相似度高的问题。 再来一组提示词,看看特殊镜头的生成能力,以眼仰拍镜头轻松拿捏,还能多生成几次,即使在大透视下,人物形体也未出现畸形。再来试试微距镜头, 小猫的眼睛、毛发等细节处理到位,我不说谁知道这是我用 ai 生成的。即使输入非常长的提示词, z image 也能完整理解并准确输出对应画面。 以上的案例测试,我基本上都是一次性得到想要的画面效果,避免反复凑卡。今天的 z image 模型就讲到这里,感兴趣的小伙伴快去用起来吧!

我认为本地部署这一 made 是 目前入门康复 u i 最好的时机,因为它精准抓住了小显存用户的痛点,它有媲美闭元模型的出炉质量,生成速度快,而且原声支持中文。 大家好,我是王德发。这期视频,我们来丛林跑通这一面,并聊聊开源绘画模型的改革。在往期视频的评论区,被高频讨论的话题往往是康帝 ui 的 硬件配置和入门门槛。 过去我会劝大家,内存小于三十二 g, 显存小于十二 g, 你 就别折腾本地部署了,因为在 ai 绘画领域,一个复杂的工作流不仅要大显存,还要大内存。 就拿 flex 模型为例,它原版主模型就要二十三点八 gb, 加上 vae cleveland 文本编码器啊,尤其是那个 t 五叉叉 lfp 十六的版本,哈完它自己就快十 gb 了。 那这一套全家桶下来呢?显存开销直奔三十二 g, 那 我们十六 g 的 用户呢?还得用量化手段,使用 f p 八的量化精度,把显存开销降到十六 g 以内那所以我之前一直觉得十六 g 显存才是一个甜点配置。 那如果你用极致的量化,比如 n 叉酷的硬件四精度,这样主模型能压到六点五 巨币,只有原版模型的四分之一。但能跑跟好用其实是两回事,体验并不会很流畅。对于小鲜醇用户来说,这确实是一个无奈之举。在一个月前,阿里旗下的通一团队开源了这一 mate 之后, 事情就变得有趣起来了,他直接打破了我刚才说的这种硬件门槛。我们来看一下任务管理器, 这是这 mate 加载后的显存占用,我用的是 f p 八新度的版本,主模型只有五点七 g, 配合量化后的文本编码器,整套跑起来显存占用仅在十二 g 左右。 那如果你用的是 g g u f 格式的量化模型,比如说 q 四 k s 版本,这一套加起来不到八 g 的 显存开销,意味着几年前的老显卡现在也可以流畅的跑起来了, 这在以前简直是不敢想的。很多观众怕本地部署就是因为装环境爆错,这些问题太复杂。但这一类的工作流其实很简单,你只需要更新到最新版的 comfy ui, 在 模板界面就可以直接找到这一类对应的工作流, 他不需要安装额外的复杂的插件,那官方模板还直接给出了模型的下载链接,你把模型下载下来,放到对应的文件夹里,那这时候如果你显存有十六 g, 建议你用原版的模型。配置好之后,我们来看一下效果。它是国产模型, 直接就能识别中文,所以你可以自己写中文提示词,也可以让 ai 帮你写。点击深层,大家看一下这个速度,再看一下这个质量,手部的结构,光影的质感,摄影味特别浓, 完全没有早期模型的那种塑料感,而且他一步到位,不需要像 sd 叉 l 那 样,还需要去修手修脸。 这一魅就证明了一件事,只要优化做得好,小模型也可以出大片。这就是阿里团队带来的开源改革,以前我们认为模型越大越好,现在是效率为王。 最后我们总结一下, comfyui 的 技术门槛确实有点高,本地部署有两大拦路虎,找模型、装插件解决报错。那如果你看不懂代码的情况下,或者硬件配置跟不上啊,你完全可以去用云端,这不丢人啊。未来的 ai 创作,云端化会是主流, 本地部署会变得越来越小众和硬核。坚持本地部署的一般是两类人,一种是喜欢折腾技术的极客,本身解决这些暴躁呢,他就乐此不疲。另一种呢,就是有特殊需求的,需要搭建保密性高、定制化工作流的 专业用户,所以大家根据自己的需求去选择本地部署或者是云端。那如果你想要尝试本地部署 comfyui, 我 很推荐拿自己妹子来入门。那在跑通工作流的过程中,如果你遇到了什么难题,可以看我晚期的视频,也可以直接跟我交流。 呃,如果是下载模型的环节,你还可以使用我开源的模型查找器 comfyui model 翻的,他可以帮你省下不少的时间。 相关的工作流和资源我会放到抖音粉丝群里。这期视频呢,如果对你有帮助,请帮我点个赞,我们下期再见。

哈喽,大家好,今天这一期呢,给大家带来的是康复与 y 电影 级纹身图和图声视频教程,无需你再找导演,只需要轻松一点就可以让你的作品堪比电影级大片。那拿到这个工作流之后,直接丢进操作台就可以使用了。那拿到工作流之后呢,我们直接在这里进行上传,我们需要变成动态效果的一个图像,那这底下呢,可以直 直接去反推出这个图像的一个提示词,并且生成电影级别的运镜提示词。那旁边这里就是 ai 帮我们生成好的一个提示词了,关于每一秒呢,它都会细致的描述出来, 可以看到我们最后生成出来的一个效果,画面还是非常的细腻的,而且呢效果也是十分的突出,动作衔接非常的自然和真实,光影也是恰到好处的, 绝对不输于你看到的任何电影级场景。如果你正在尝试制作 ai 视频,可以拿这个工作去试一试,那我们下期再见。拜拜。

刚才展示的就是最新的开源模型 g major prodo 的 效果,可以看到这套模型最强的地方就是这种摄影级别的真实感。说实话,在目前的纹身图模型里,这种表现力绝对是天花板级别的。 大家仔细看,他生成的人物皮肤质感和光影细节处理的非常细腻,完全没有那种 ai 常见的塑料味或者过度磨皮感。而且他对真人的生成效果十分真实,无论让人物穿上什么衣服,摆出怎样的姿势,他都能完美生成。但最离谱的是,跑出这种照片, 它竟然只需要八 g 显存!相比于隔壁 flux 二动辄三十二 b 的 庞大参数, zee major turbo 用区区六 b 参数就实现了四两拨千斤。而要想复刻这种效果,工作流其实非常简单,还是采用最基础的纹身图工作流。最重要的是三个模型文件的加载。第一, unit 模型选择 b f 一 六版本,这是保证画面的基础。第二,文本编码器搭配 q n 三杠四 b, 中英文理解全靠它。 第三, v a e 挂载 a e 模型。只要这三件套配置好,你基本就是拥有了一台极速印钞机。我实测了一下,生成一组四张七百六十八乘一千三百四十四的高清大图,总耗时也就三十秒左右,用更低的配置,更少的时间,这才是今年真正的国民 级模型。以上就是我们今天的内容了,有需要视频用到的工作流和整合包的小伙伴可以到评论区获取哦,我们下期见!

小伙伴们大家好啊,昨天等了一天啊,这个,嗯, z e m g 的 避暑模型终于开园了,其实还是有点失望的,因为大部分人都在等它这个 id 模型啊,要不然说实话,它根本就没法和这个克莱因对打,克莱因的效果确实是太好了, 开了一个避暑对练 low 啦是有用的,但是它实际对我们纹身图或说图像是图生图的效果提升有限, 只能说在这个质感上确实是比 turbo 稍微好一些啊。再就是大家终于可以快乐筹卡了, 因为之前这个 turbo 模型,因为之前这个 turbo 模型说实话相同提示词出来的图基本变化不大,虽然说我们用了很多其他的方法去控制他这个出图的多样化,但是他本身底膜这样后期任何的方法都是就说 并不是太那么稳定,因为他本身素质就在这摆着。也是给大家简单测评一下,大家看一下他和 turbo 模型,还有以及这个最火的这个克莱因模型做对比啊。 其实以我现在来以我来看啊,如果说后期的话,他肯定是比不了克莱因的,毕竟克莱因第一带 b s 模型,第二,克莱因本身这个模型他就有这个图像编辑模式, 这个 z e m g 的 edit 图像编辑模式一直没有出来啊,我们看一下我这边做的一个工作流啊,就是把它们三个做一下横向对比,大家可以看一下这边是跑了十组的提示词 啊,像第一个,然后一个老人的,对吧?这个,嗯,说实话啊,如果说看质感的话,还是这个克莱因会稍微好一些,因为这个更加真实,对吧?但是他这舌头稍微有点崩啊,自己买着的特特步模型呢,他有点 过于就说美感增强,因为他本身训练了大量的美感图片吗?还有这个,这个是 b 四模型, b 四模型稍微有点过爆啊。 第二张这个艺术感的,这个说实话差不多少啊,我觉得这个特步模型会稍微好一些。还有这个小红书风格的,这两个都是差不多少的。嗯,只不过这个克莱因模型啊,他会细节上更多一些。但是啊,你到二次元这一块,其实我就觉得 这个 b 四模型就比较好了,因为他比较符合这个风格。而这个就 turbo 模型稍微有一些涂抹感过重,总感觉滤镜感过重。而这个 floss 模型就典型的美曼特征啊,并且这个图案稍微有点崩,这个美曼特征反正我是不太喜欢的, 线条感太厚重了。然后我出了一张图啊,这基本都没有崩的啊,但这张图就是崩了,这个必死模型出来的太诡异了。大头模型。而这个啊,这是我们经常刷到的这个特步模型的底。就说时尚感的人物,其他的都差不多啊。 然后你像这个提示词啊,就能明显看出这个 turbo 模型训练了大量的,就说呃,摄影风格图片类似于这个,其实这个本身是服饰会的一个提示词, 但是你像 turbo 模型出来就是完全真人化了,跟提示词有点不太相关啊啊,这个就是艺术感稍微浓一点的提示词 好。还有像这个啊,微距的,这个说实话, turbo 的 我感觉是最好看的,其他的大家可以自己做一下对比试一下啊。其实我感觉这个必死模型啊,就说没有太多的惊喜,但是它开源之后,我们后期训练 lola 会更方便啊, 因为现在说实话,用 turbo 训练出来的 z e m g lola 它怎么的它都是差点意思啊,还是差很多还是差很多的? 本期对应的工作流呢?我这边同步上传到了 r n 哈普这里,大家在 r n 哈普点开就可以直接使用了。 我这边只上传了一个 z e m g 的 必死,就说初步的一个模型,因为这个做对比的我没有上传啊,因为大家用也只是用这个必死模型吧,如果说其他的,也只不过是把三个 工作流给合成一个了,所以说上传呃上,没必要去上传占位置啊。大家如果对这个淘宝模型感兴趣,体验一下就行啊。再就是官方他给的参数, 再就是这个必死模型官方给的参数是推荐五十步,但是我这边感觉二十多步他就能收敛了,所以说参数给改成三十五步的,大家如果不嫌慢,也可以出五十步试试效果,我感觉效果都差不多啊。 还有一点需要提的,如果大家本地使用,一定要把这个康菲约更新到最新版,好多小伙伴呢,不管是用秋衣还是用什么,他的裤是乱的。更新完之后呢,这些工作流一跑,要不就克利普报错,要不就模型报错,这都有问题。 怎么判断你是否更新成功呢?你更新完之后点这里,然后点浏览模板,然后点图像这里,你看这边有官方的示意的定义 maker 纹身图,这就说明你更新成功了,这就是官方的最新版啊, 包括模型什么都在这里有下载,这其实就是官方流程,只有出现这个就不管,你是因为很多小伙伴也问啊,克莱因又怎么报错,其实大概率都是你这个更新失败的,你需要在这里看一下官方给的这个模型到底出没出来, 给的这个工作流到底出没出来。你比如说像是,呃,克莱因这个对吧?他有了这个你跑克莱因才没有问题,呃,要不然官方代码都没有更新,你跑肯定是有问题的。 关于怎么更新,我一直推荐大家手动去更新啊。然后咱就不再反复赘述了,因为这个问题说好多遍了,太占用时间了。 关于模型和工作流呢,我都同步放到网盘里啊,大家在网盘里点开直接就可以使用了。网盘里放了这三个合一的工作流,也放了这个单独一个的工作流,大家自己下载试玩一下吧。好,谢谢大家,再见!

the mage 模型以 mage to laura 的 技术的更新,这样情况下我们进行一个 laura 模型的训练呢,会需要耗时几个小时甚至更多。 那么以 mage to laura 这样的一个技术,能够让我们在至快十几秒钟之内呢,生成一个可以附用的 laura 模型,尤其适用于风格类型的参考。那么在这八张图像当中呢,第二列所使用的这个快速 laura 生成的图像可以看到,尤其是对于风格的腹泻呢,还是有一定的保障的。 上一版本是基于 q 问 image 视频没有做更新,一月三十号的时候更新了 the image 的 版本,个人 觉得还是非常实用的,如果与我们的 c n 体系结合在一块的话,我们就可以在有控制情况之下进行一定的风格迁移。当然现在这么做,其实我们需使用图像编辑模型并不是什么特别困难的事情, 只是说多提供一种方式,对于某些风格,我们还是在小训一下,也许能识别的更好。接着我们来看到工作流,我这里使用的是全球最大的在线康复游戏平台 running hard, 也是最前沿的开研 ai 技术应用平台。那么这个插件来自于问, 并且已经开源,所以这是一个可以完全在本机根据指引进行安装,得以完全离线运行的项目。那么这个 z 与 mate 主要是基于的模型呢?是 base 模型,那么特步模型根据表述的话,是使用了我买密码器 v, a, e 和其他一些东西, 所以我们流程的构建也是基于 z 一 妹子的 base 体系来进行构建,一般锤炼到最后呢,我都会锤炼出一个复杂流程,那么我这里是制作了一个高低噪的渲染流程,为什么这里还要区分高噪和低噪,并非是在大模型处是进行区分,而是说让 c n 的 作用只在高噪进行发挥, 最后再过一个分块放大就比较完美了。等会儿就会儿视频相对的流程已经同步更新,可在线运行。 那么现在人看到快速启动,快速启动这个地方的话,我们需要去加载几张图像以作为我们的训练机,官方给到的建议呢是一至六张,所以我认为这个地方呢,放到六张的话是一个比较充分,我们新增部分的 z 引擎的引擎,去 laura 部分其实非常的简单,就是这样的一个独立节点 加载模型,生成一个 rol 模型,这个 rol 模型是可以从任务列表当中进行下载的,在线上是可以的,如果是本机会保存到本地,后面我们就可以插入流程当中,直接去使用这个 rol 模型,前方加载 z e 内置的 base 模型, 但模型 clip 这个地方是只需要去接到正向就可以了,不要去接到负向,负向这个地方呢非常明确,从 note clip 后面粘过来 正向这个地方需要过一下洛尔模型,并且官方有指定副向提示词,在这里说的是非常明确的,并且呢推荐 cfg 为四,那么 sigma shift 为八, 所以后面我们也是用的对应的四和八设置一下提示词。如果我们要去应用 c n 的 话,需要加载一张图像以作为控制,那么这里使用的是深度进行控制。 流程上来说,我这里是一个纹身图的流程,使用的是按照像素来进行缩放,输送宽和高,这里跑了五十个步,高噪为二十五步,低噪为二十五步, 后面我们就进入到分快放大,几乎是一个完全自动的流程。那么在 click 链接返回的地方,我们还是保持前方一致的原则,可能需要去调节的地方在于这里呢,我们要设置一下尺寸的约束。 接着我们来看到测试的一些其他结果,这样一个用力,我做了一个简单纯粹的纹身图,这里就是加载了六张图像,以作为我们的训练级,后方直接过纹身图,这个结果呢,可以说是呢保持了风格的一致。 那么从以前到现在都非常清楚,把训练级当中的元素与风格完全剥离开来是非常的困难的。这一结果当中其实还是参考到了训练级当中的元素, 我们来看到另外一些用力来印证这一观点,当我加载的训练机当中有过多的面部的时候呢,我们所得到的人物结果也会受到影响,当我们撇开人脸的元素之后的话,这样的影响将会显著降低。 另外一个一公里的接入了 c n, 实际上就是使用的我们上一个视频当中接入 c n 的 那一套高低噪的流程,只是说这一次我的低噪呢换成了 z 一 妹子的 bass 模型,而不是使用 top 模型,并且呢不经过 c n, 不 去抑制风格效果的发散, 为什么要这么干呢?因为这个模型经过我的测试,它是不适用于 top 模型的,只适用于 bass 模型,可以看到这个效果呢,也是完全正确的。

兄弟们,这就叫一点点细节还在发愁, ai 生成的图只有光影,没有质感,或者手里的照片皮肤纹理不够清晰。今天这套 z image 工作流专治各种模糊病和塑料感,特别是修脸和头发,这效果真的绝了。原理其实特别有意思, 简单说就是先给你的原图加料,主动加上锐化和噪点。你可能会问,这不更糊了吗?这可是给 ai 的 提示词, 这些噪点 ai 在 除灰的时候就有东西可抓,能脑补出超级真实的皮肤毛孔和纹理。虽说虫会幅度越高,细节越多,但是如果你贪心,把虫会幅度直接拉满到一点零。大家看,虽然人变美了, 光影也好了,但是画面中出现的噪点十分明显,这要是发给甲方,甲方得顺着网线过来打你。所以这套工作流的精髓就在于控制虫会幅度, 我们要把这个虫会强度狠狠的压下去,直接降到零点五,如果还不够,再降到零点三。你看,这时候也还是那张脸,衣服还是那件衣服,但那种真实的颗粒感,发丝的细节,哪怕是衣服的褶皱,全都回来了。最后再教大家一个防爆显存的小技 巧,输入图片千万别太贪大,二 k 以内刚刚好,让 ai 在 二 k 的 分辨率下把细节数全, 最后再连一个 c 的 vr 二放大节点,一键冲到四 k, 既不卡顿画质又顶。这套流程虽然不算惊天动地,但绝对实用,我也算是抛砖引玉,希望能给各位兄弟们更多的好思路。教程中用到的工作流和 coffee icon 包我都打包好了,大号抱走尝尝咸淡。

hello, 小 伙伴们大家好啊,那么最近呢,就是关于这个 z mate 啊, 就是包括它其实撬动了很多这个图声视频的这样一个工作流啊,实现这个迭代,虽然它只是个图片模型,但为什么它能撬动图声视频呢? 就是因为他生的图效果非常好啊,效果非常好,但是我发现就是很多小伙伴也在问我啊,无论是后台私信还是说评论区都在说怎么去用 z 生成一个 你讲我,我理解为专业一点的图,就说光影啊,质感啊,都很到位的一个图。那么我这边也是今天就从这样一个美丽的女孩开始看,我们一步一步给他加提着词 啊,所有的种子我们就全部都锁定啊,条件都是一致,然后看它能达到什么样的效果啊,我们都是利用摄影的一些技巧去给它加这些提示词, 那么最基本的,我们看这两组啊,无非就是控制一个视角,因为 z 呢, z 里面这个模型啊,它本身对摄影的理解就非常好 啊,所以说我们一旦写这个最基础的美丽的女孩啊,他会默认形成一个虚化的啊,大光圈虚化的这么一个中长焦拍摄的这么一个照片 啊,但是这个照片如果是玩摄影的,其实能看出来他是很平的啊,没有任何构图啊,或者是光影啊这方面去讲 啊,同样的,我们只要给他提示一个全身照,他就会生成这样一个全身的啊,但是同样的也能看到他是有背景虚化的,那么我们一步一步来啊,我们先从这个开始啊,呃,光影最基本的一个,那么拍女孩老法师都知道啊,逆光发丝光是一个 利器啊,你找到一个逆光的地方去拍,那就不会差了哈,那我们第一步先把这个女孩我们给他加上一个逆光,是不是同样体式词,同样的种子,对吧?一下子这个人就突出出来了,立体出来,因为勾了一个边吗?对吧?被光影勾了一个金边,相当于啊, 那么很多时候啊,很多小伙伴喜欢那种亮的片子啊,就是高调片子,那么其实呢,真正有质感的是种暗调片子啊,我们还是这回加上一个暗调摄影,对吧?暗调摄影,然后直接的呢?还是同样的这个词啊,种子 一下子,对吧,这个人物的质感又上了一层,因为按下来图片按下来以后,他的质感其实就会增加啊,这个是个一个摄影的一个理论,就是 大屏光,大屏就是亮的,其实对摄影来说不友好啊,真正的摄影的那种有质感的片子都是比较暗的暗下来啊,所以说我们看这个蓝色东老何老哥他也经常说,就是他想努力把这个片子去暗下来啊,其实就这个道理, ok, 那 么我们这回再来从视角上进行一点点调整啊,半身特写,那么其实这种也叫半身特写,但是说我们这个更近距离一些啊,更近距离一些,拉近一些,然后呢?啊,这个不是汉服啊,这个,这还是美丽的女孩啊, 我们再给他拉进到一个面部特写,又会发现一些不一样的特质了,对吧?啊,他虽然说是面部特写,但是他还会带一些肩头啊,肩膀这些东西啊,但是光影质感,对吧?啊,保证这几个提示词写出来 啊,这个也是啊。然后呢,我们再来看一下近距离面部特写,因为我觉得这个还不够近,我想给他一个近距离啊,但是发现其实这两个变化不大, 那么我又尝试着去给他写一个超近距离,那么我发现确实拉近了一点点,肩膀消失了啊,但是仍然达不到我要的一个需求。那么这个时候其实就有一点什么问题呢?因为我们这个题的词写了一个美丽的女孩,对吧?美丽的女孩呢,他会尽量去 模型,会体理会到啊,他觉得是啊,我要把这个面部都给他展示出来,那实际上我们有时候可能是要局部的,对吧?那我们这个时候就可以不要写这个美丽的女孩,我们只写女孩逆光暗调式,这个时候我们可以强调下面部的具体的位置啊,嘴部特写, 还有眼睛特写啊,你看了没有?我同样还是美丽的女孩,逆光暗调摄影,眼睛特写啊,他这个时候就会出现什么呢?就还是会把脸描述出来,因为他还是觉得,哎,要保持保持美丽嘛,对吧? 这个时候我也试了啊,超近距离特写,同样他也会有这么一个面部在里边啊,那眼睛超近距离特写,微距摄影啊,又拉近了一点点, 然后呢,瞳孔,我写瞳孔超近距离的摄影,那么我们看到因为有美丽的女孩这几个字在这影响,所以他仍然会把我们脸进行描述,这个时候我们就极端一点啊,我直接写的微距摄影,逆光暗调摄影,瞳孔超近距离摄影, ok, 瞳孔超近距离特写,那么我们就得到一张,对吧? 一个瞳孔的啊,非常近距离的一个微距的这么一个片子啊,同样我们可以拿它来写我们其他的部位啊,鼻子、嘴唇、耳朵啊,脚趾,或者神奇的其他部分啊, 那么这就是通过这个一个视角的提示词,这个控制还有一些基础的光影呢,我们来给他 进行一个摄影化的一个处理啊,从这样一张图,我们可以其实做到很多很多啊,就是通过简单提示调整就可以,那么还是同样的,我们再来看看一个镜头语言啊,镜头语言,我们这边还是一个全身照,正常的全身照啊,那么就像我刚才说的,他是一个 中长焦拍摄的,因为我们看这个人并没有并没有比例的一个变化啊,那么我们这时候来一个什么呢?超广角,超广角镜头拍摄啊,超广角我们就会发现腿变长了,对吧?啊?人的头比例变小,这是广角镜头的一个特性啊,他会把你的腿部拉长, 那么如果还想更拉长怎么办呢?啊?我们还可以用鱼眼镜头啊,我们看看鱼眼镜头,他对这种视觉冲击力表现的更强了,腿拉的更长,对吧?啊,就是他他 他的那个焦距呢,又短了啊,比如说我们这个可能是二十四毫米的,那么这个就是十四毫米啊,对吧?十四毫米的, 那么我们还想再增加视觉冲击力,还有还有一个词可以用什么呢?就是低级低级位仰拍啊,这种现在很流行的这种,就是 city walk 那 种拍摄方式呢,就这种感觉哈,对吧,美的女孩全身照,低级位仰拍鱼眼镜头拍摄,那这个视觉冲击力跟这个对吧?我们把它拉过来哈, 对吧?就完全不一样了,是吧?这个就比较淡啊,比较平淡,那我们接着把它丰富我们的提示词,我们再把我们的光影的描述刚才描述上啊,就是逆光啊,对吧?我们这个是没有逆光的啊,那我们看它背景就有太阳了,对 吧?啊?人物可能会更立体,但是我觉得不够啊,我们头发这些还不够,那么我们再加上刚才我们说的发丝光, 哎,是不是一下子又给他就是人物更活了一些啊,更生动了,更生动了,这个头发虽然也还不错啊,但是我们家这个发丝光一下子那个味道就出来了, 我们这时候再加上一个轮廓光啊,我们看看啊,这个是加了轮廓光的轮廓光的贴纸,呃,他这个其实就变化没那么大了啊,因为跟对这个跟这个对比变化的没那么大,因为发丝光本身他也是轮廓光的部分啊。 ok, 这个时候我们再加上什么呢?暗调摄影,对吧?我们让他再按下来,让他从人物从背景中再脱离出来啊,我们看这一下子就有有味了,是吧?更加有味道啊, 那么我们还可以加什么呢?加上一个动态模糊啊,他头发飘起来,我们可以看到啊,更多的增加了一个动态模糊, 这个时候我们可以给他强化一个动态啊,让他跳起来,但是我们会发现他的脸按下来了,是吧?那这个其实很多我们玩摄影的小伙伴在夜间的话拍这种 会发现这种情况,那么其实我们可以给他用闪光灯给他补个光,那么简单,我们就给他来一个闪光灯拍摄啊,注意这个闪光灯拍摄可以放前面一点啊,跟我们这个即位描述呢,放在一起,那这个时候, ok, 我 们看到了啊, 人物也亮起来了,那背景呢?哎,轮廓光这些法术光都有了啊,这个就很接近那种商业片子了啊,大家如果看过很多商业广告的话,他都是这种质感,对吧?都是这种人,面部也清晰,那么又有同样的一个辅助光啊,轮廓光、法术光都有, 那我们这个时候再增加一个什么呢?增加一下视觉冲击力,我们就写个强烈的视觉冲击力啊,那他的动态会更强一些,我们看到啊,包括鞋的这个动态模糊,对吧? 是吧?那么这个时候我们还可以再说什么呢?请鞋构图啊,我们让他这个动态更强一些,看跟他对比一下啊,这个是正的啊,这个比较平,地平线比较平,那么我们来个请鞋构图,那就 ok, 他就歪过来了,是吧?那这时候我们拍些时尚类的啊,就像我这现在这个提示词啊,这个女孩蹲在街头啊,城市街头,我们就可以描述他这个服装 啊,国籍,还有这个环境啊,这个就一下子,你发到某书也好,发到什么也好啊,就跟 这种完全又不一样了,对吧?跟这种完全不一样了,我们把这个拿过来就对比啊,那么如果我们再加上一个服装描述,比如说汉服女孩站在古代的我们的街头啊, dj 为氧拍闪光灯拍摄鱼眼镜头,拍摄逆光发丝光轮光光暗调,摄影动态模糊,强烈的视觉冲击性结构,我们把这些元素全部给加进来得到的片子,对吧? 是吧?啊,这就更接近我们专业摄影的一个片子了,就是说,所以这一妹子我我觉得它对我们的摄影师来说非常棒啊,我们可以把很多摄影的知识直接用在它上,它能得到一个非常好的一个回馈啊,基本相当于我们在 comf i 里边搭出了一个我们自己的一个, 对吧?一个虚拟摄影棚啊,我们能够在这边控光,控制摩尔的话,我们还能控制 模特的一个面容,真的是摄影师梦寐以求的那一个模型啊。以前的模型不是说不行,但是说 flex 时代他的很多视角,像那种超广角以及仰拍这种他出不来哈啊,那三点五能出来,但他的质量又不好,这一枚把这些优点全融合到了 啊,所以说咱们还是社区大佬里边这些这个有摄影相关的这些大佬参与的这个模型呢,所以说咱们还是社区大佬里边这些这个有摄影相关的这个大佬参与的这个模型。 ok, 那么这个简单的这样一个分享呢,从这个拍摄的一个角度到我们的一个光影的简单描述呢,就 大概聊到这里,当然你也可以,比如说再加上提示词,比如说背景中有很多烟雾啊,我们可以加上增加一点那种质感,对吧? 是吧?整个的片子又上了一层,就是你想加什么就加什么啊,你可以让他站在雪地中或者怎么样的都行啊,对吧?啊,这个一下子就出来了,效果非常好啊,就给大家分享到这里啊,拜拜。

那今天呢,我们给大家介绍一个 z e 妹纸的特殊的工作流,那我们先来看它生成的这些图片,那这些图片呢,我们大致可以分成五个维度啊,第一个就是东方美学的呈现, 这两张图片啊,这两张图片在表现东方美学上啊,做的是非常到位的。那你注意啊,天上飘的这个雪花啊,包括人物皮肤的质感,衣服上的细节,头饰以及背景的呈现, 基本上都符合东方人的这种美感。那第二个维度呢,就是构图和氛围,这一些图片呢,整体都非常的清亮,尤其是大家现在看到的这张,表现了一个美女在水中的一个场景, 大家看一下它整体姿态的表现,包括周围的水花,那它既有这种真实感,也有特殊的这种写真式的美感,我们几乎在两者之间呢找到了一个平衡。第三个呢就是光影艺术, 那我觉得这种特殊的工作流呢,对于光影的呈现呢,表现也是非常棒的啊,把人物的发丝,面部的这种高光表现的都非常的到位,不管是冷色调啊,还是暖色调的这种光影,他表现都非常的极致。 另外就是在表现人物上边,在这种皮肤质感上啊,我觉得做的也是非常到位的,那我们可以看一下这张图片啊,如果我放大去看他脸上的这个汗水, 包括身上的这种出汗的感觉,其实非常真实的,他整个皮肤的表现虽然非常的光滑,但是呢也不是那种塑料质感,包括有一些细节的呈现,我觉得做的也是非常棒的。那这个呢,就是我今天给大家介绍的这个工作流所能达到的一个效果, 那这个工作流的灵感呢,来自于 tweet 上的一个帖子,那它最核心的理念是什么呢啊?其实是将 the image tab 和 the image base 给它结合起来来用,它最初的想法是要将这个步数给它缩小,而且呢不影响图片生成的质量。 那所以说呢,它用 z image tab 来进行构图,用 z image base 来进行细节的优化。而从另外一个维度,我们都知道 z image tab 呢,其实呢是缺乏细节的,但是生成的人物会比较漂亮, 而 z e m g base 拥有丰富的细节,但是由于过于真实,人物呢,往往美观度是不够的啊,所以说呢,两者呢,我们需要找一个平衡,那这就是这个工作流它最出彩的一个地方。那在图片生成和视频生成领域,我们最怕的呢就是环境报错和显卡带不动。 其实呢,只要思路打开,云端运行才是一个最高效的解决方法。那 readyhub 是 我一直在用的一个在线的工作平台,因为只要有新的模型和新的扩展出现,它都会第一时间跟进。那下面呢,我们就详细来介绍一下这个工作流呢是如何构成的。 那这个工作流从结构上来讲呢,就是一个标准的 the image 的 工作流,但是呢,我们用到了两个模型啊,第一个呢就是 the image base, 那这两个怎么去用呢?我们下边呢就具体来看一下。首先呢,我的第一个部分是公用的模型啊,这里边包括我们的文本编码器 ve 以及我们的 empty latent。 这儿的分辨率呢,我设的是幺零二四乘以幺五三六, 提示词呢,其实是描写了一个美女在水中的一个场景,包括对于他的姿势,衣服的状态都有着非常详细的描述。 那反向体式词呢,我这简单写了一下啊,大家呢可以根据自己的喜好去添就可以。下边呢,我们看一下这两个模型在整个工作流当中的作用。首先呢第一个我们先看一下 z image turbo, 那 首先大家应该明白, z image turbo 它的优点就是可以快速的生成图像,但是呢,它在细节生成方面呢,能力是不够的, 所以说大家在 z e mage turbo 出来之后呢,第一感觉就是生成的人物呢,看上去很漂亮,但是不能细看他皮肤的细节啊,基本上是缺失掉的,所以说呢,我们可以用它来进行构图,那基本的用法呢,跟之前是一样的,我们这儿设置一下它的 model shift 值呢是三点零。下边呢我们使用了一个彩样器,大家一定要注意,我们不能使用普通的彩样器啊,必须要使用一个高级的彩样器啊,为什么这么讲,因为呢,我们现在是一个两段式的彩样, 所以说呢,前一个 latent 要送到后一个彩样器进行彩样,所以说呢,我们必须能控制它的总体的彩样步数,然后呢 对 sigma 进行一个分割,所以说呢,这我们要使用高级的采样器,那这里边呢,有一些公共的配置,首先大家需要注意的就是我们尽量的保证呢,它的种子是共用的, 因为一致性的种子会导致它的 noise 的 分布是基本上差不多的,因为呢, z image turbo 和 z image base 本身呢还属于同一个系列的产品,所以说我们建议大家种子呢应该是一样的。另外呢就是采样步数, 采药总步数啊,我们设定的是二十步,不管是前一个采药器还是后一个采药器啊,都是二十步,所以说呢,我们也把它提出来,做成了一个公共的节点。另外呢就是这个 end and step, 也就是我们在第几步停止, 那说白了我们要进行一个两段式的采样,那前一阶段呢是由 z e mage tab 来进行的,那后一个呢是由 z e mage base 来进行的,那它中间的分界点就是这个 end at tab, 我 们现在设置的是五步,也就是从零到五步,现在进行的是构图的阶段, 那再往后边就是细化的阶段,那这个是从第五步到第二十步。那另外还要注意的一个地方,其实就是我们的这个 add noise, 那这个呢和 one 二点二的视频生成的工作流呢不太一样,那在这个工作流里边呢,我们前一个是要加噪点,后一个呢是不加噪点的,但是呢这个呢就必须都加,如果你不加的话呢,可能细节是没有办法添上去的。另外呢就是 c f g 的 配置, 那由于呢前一个是一个特步模型,所以说按照惯例 c f g 呢应该是一点零,而后一个它是一个标准的全参数的模型,所以说呢, c f g 呢,现在我们按照官方的设置是四点零,当然你也可以设的稍微的大一点, 那生成的最终的结果呢,就是大家现在看到的这个样子。那我们首先看一下整体的动态,人物的姿势, 包括细节的呈现,我觉得都是没有问题的。当然呢,我们看一张图片,往往呢可能不会有这么多的细节,那就是我们第一眼看上去感觉很漂亮,这个就可以了。那这个呢,我也给大家做了很多的尝试, 就像刚才我们给大家介绍的,分了五个维度,然后生成了二十张图片,然后我觉得每一张呢,其实都不需要重复抽卡,都可以得到一个比较好的效果。那我也希望呢,大家可以自己尝试一下。好,今天呢,我们就说这么多,关注我,做一个懂爱的人。