hello, 小 伙伴们大家好,那么昨天 flux 二克拉音发布以后呢,就是好多小伙伴觉得,哎,它声图好像没那么好,对吧,特别是 base 模型, 那这里要说一点啊,那 base 模型其实跟 z mage 的 base, 它的功能应该是类似的,它就是为了方便社区进行微调的一个原材原原素材,那么一个模型啊,原材料啊,它是个原材料,所以它的声图呢,应该是不如蒸馏版的哈, 那么这个先澄清一点,那么第二个呢,今天又深入的玩了一下这个,呃,我们这个 fox 二开音的这样一个编辑模型啊,那么这次呢,我没用那个四 b 模型,而是用这个九 b 的 模型做了这个编辑处理,那么深玩了一下下,包括跟我们之前这个重新的这个摄像机转视角这个 节点,还有我们那个重新打光的节点进行了一个适配啊,也是配合看看他的效果怎么样,我发现他的其实效果比二五幺幺还要好啊,在这个这些项目上面,他的比二五幺幺还要好,还要进行那个换头啊,换头的,换脸的一个处理哈, 那我们分别看看这几个效果啊,第一组就是摄像机转视角啊,这个的话,我们看看为什么说他比二五幺幺好,那么我们用过二五幺幺都知道啊,像这种模糊的图片啊,如果用二五幺处理的话来做的话,他可能仍然很模糊,包括可能会很油 很油哈,但是我们看到这个 flex 二碳烟九 b 这个模型呢,它就没有这个效果哈,没有那种油的感觉,而且呢,它因为是蒸馏版的,同样只要四步啊, c f g 等于一,那么速度又很快,对吧?速度又很快哈, 那么再配合我们这个打光的这个节点,我们来看一下啊,我们看一下,那这里其实就有个惊喜啊,也不是惊喜,就是他几乎是零偏移啊,不能说他没有偏移,他几乎是零偏移,而且他对这个角色的肤质进行了一个 我们讲一个高清化啊,高清化的一个处理,配合我们这个光源,对吧?是吧?这个是不是比二五幺幺就要强一些了,对吧?我们看看这些肌肤质感的一个变化,虽然是有点油啊,但是他确实对这个 细节的一个强化啊,是增强了很多,而且这个偏移控制的非常好,对吧?这个偏移控制的非常好啊, 那么我们再来看看其他的一个任务,这个是一个画风参考的,我让这个呃,根据图二风格生成图一女人的一幅作品啊,保持图一角色的动作,穿着打扮和角色样貌,只替换风格, 对吧?那他做的也是很到位的啊,就没说任何具体的风格,他就把这个水彩画的这个就给他迁移过了,其他的风格我都试了,都可以啊,下午在群里边,包括康福耀的官方群里面都发了很多这种作品啊,效果非常棒啊。那么还有一个就是换头, 换头的话,那么提示词就是什么呢?把图一的角色面部替换到图二的角色面部啊,就这么一句啊,我们这张图就是我们的底图,那么就把我们刘亦菲的脸替换过来了,对吧?替换过来了 效果也是非常好啊,那么我相信就是说大家深挖一下这个模型,特别是九 b 的 这个,无论是编辑也好,生图也好,他其实很多玩法的哈, 包括他对二五幺幺的这种优势,优势就我觉得就优势在哪?第一就是他的一个几乎是零偏移的这样一个哈, 几乎是零偏移,第二个就是他对这种呃图片的一个细节的一个增强啊。第三呢,就是他对这个镜头语言的理解也是很到位的,而且会强化我们这个就相当于对我们图片进行了高清化的一个处理一样啊。 然后就是它对这种换头的这种处理也非常到位,包括风格迁移都很好,都很好。你基本的基础的功能,比如说两个人一起合影啊这种东西,那我觉得就更没什么问题了啊,我就试了一些比较特殊的一些玩意儿哈, 啊,非常好啊,这个其实不要小看这个九 b 模型,我觉得甚至有可能哈,如果 z mate edit 它六 b 的 版本出来以后, 嗯,可能跟他差不多,甚至还不一定能打得过他哈啊?现在还不知道,因为毕竟模型没出来,对吧?至少在这个像素偏移,还有这个图像细节优化上面,我觉得是已经达到,甚至说某种预想超出我的预期了,因为他这个速度超级快啊,速度超级快,我们做这样一个编辑的话, 只需要十来秒,几秒钟,这样一个哈,就是秒级的出这个。那么我们如果用二五幺幺呢?不加这个 lo r 大家都知道啊,不加 lo r 的 话,那五十步跑下来的话,可能一分钟两分钟都是他啊,在我这边 如果就算加了 lo r 的 话,也不会有这么快啊,而且不会有这种的质量啊,不会有这种质量啊,就是这种一个画面细节的一个优化,这个质量啊, 大家其实可以多尝试一下这个九 b 这个编辑啊,我觉得效果还是很不错的,玩法很多样,而且跟我们之前的这些节点兼容性都没什么问题啊,都没什么问题。好,这个也给大家分享到这里啊。
粉丝1.1万获赞6.1万

哈喽,大家好,今天一觉醒来, ai 绘画的开源社区又变天了,很少这么迫不及待的要给大家更新一个新的技术,因为最近说实话没有什么太好玩的东西,但是这个模型非常非常的厉害,一定要去玩一玩。昨天黑森林悄悄的放出了一个 小小小小的模型 clay, 应该是这么读,不是那个 clay 啊,它是代表小的意思,一个生图和编辑为一体的模型,这个模型的底膜能力就非常非常的强,已经玩了从昨天晚上玩到现在了,尽管现在还没有很多微调的模型出来,但是它的底膜能力已经非常能打了。 之前所有的开源编辑模型,第一时间我都会拿服装去测一下,像之前的二五幺幺,其实做其他方面还可以,但是一旦到了换装,这些细节特征,质感呃就会损失的比较严重。 但是呢,今天这个模型我感觉在服装这个领域基本上可以算是一个小橡胶来使用啊,而且呢,它是把训练模型训练框架是一块放出来的,所以应该马上就会摄取有大量的各种增强抑制性各种功能的全部出来。这个目前只是底膜的能力图,我就不给大家一一看了,大家自己去下载上去尝试一下,一定要用用。 说一下它几个特点,模型很小,速度非常快,如果是跑一 k 的 图,在我的四零八零上面只需要六秒钟就编辑完成,六秒钟大家没听错,如果是二 k 的 图,大概在十八秒钟,然后显存占用的话,我用的是九 b 的 f 一 八模型,占用是实际显存四 b, 我 也试了四 b 的 效果其实没有差太多,在大部分场景下都是一样的, 如果大家显存不是特别特别小的话,其实都建议下九 b 就 ok 了。然后呢,这个使用的模型这里除了 ve 是 不变的,如果当我们换九 b 模型的时候,底下的 clip 就 要用千万三的八 b, 如果我们是用四 b 模型的话,底下就得用千万三的四 b。 流程其实非常简单, 单张图呢,我们就直接把图像经过一个像素的控制,通过唯一编码给到这个参考 laten, 然后给到政府采样器的 laten 呢?是直接给一个新的节点啊,叫 plus 二的 laten, 那 这个地方不能给原本的空 laten 呢,否则尺寸会是原来的二倍。然后呢,它的尺寸出到二 k, 我 觉得质量还不错,如果再大的话,应该受到 训练级的影响,就会有些奇怪的地方出现了。如果是两张参考图呢,那就再复制一份这个参考 laten 的, 跟第一张图的参考 laten 的 给它串联起来, 一块送到太阳器当中。但这个流程官方就有啊,大家想要使用这个流程,首先要更新一下软件的本体, 那如果大家用秋叶的启动器,在启动器的这个版本管理里面,你发现一直是一月六号更新不了,这种时候我们就手动更新一下两个方式,第一个方式直接在管理器当中保证你管理器最行,把这个选到夜间版本,然后更新 cfui, 更新完之后重启,当你在模板当中能看到 flex 二这个工作流之后,我们就可以正常使用了, 或者就需要我们在软件的根目录之下手手动输入代码,这个代码大家直接去问问豆包就可以了,你告诉他我要更新康复药的本体,手动需要在根目录之下输入什么代码来更新,他就会教给你,我们复制粘贴一下就可以。然后呢模型我放了一份到我的网盘里面,大家可以直接暂停一下,看这个链接识别,把它拿走就好了,因为抖音上面不太方便分享这个, 那或者大家直接去 hackinface 上面在这里搜索 k l e i n 我 们现在一搜,它肯定是排在最前面的,来这个官网这里直接下载它的模型也是一样的。那更简单的方式,大家直接打开官方的模板,进来之后呢,左侧官方直接给了点击就可以下载的方式啊。但这个模型是纹身图跟编辑一体的,但是纹身图我觉得一般般, 不算是特别厉害,编辑里面我们尽量选择,我们直接选择这个蒸馏的啊。常规的版本要贝斯模型需要跑二十步,那质量方面几乎我觉得没有什么差别,贝斯模型可能更多给大家拿来训练多一点,所以模型方面大家直接下载非贝斯版本的九 b f p 八就可以使用。那整个模型最后说一说它的缺点,缺点就还是体量小,体量小的模型 就没有办法真正像香蕉模型那样那么的聪明,包括它的文字能力也是有问题的,我们很难拿它去改变海报或者出一些带文字的内容,这是它的缺陷。其他方面我觉得都非常非常的好,过几天再加上开源社区的 lowra 之后,完全可以作为一个香蕉的本地平替来使用,所以大家赶紧去尝试一下。

大家好,今天分享最新的 flex 二 client 图像模型,它不仅支持图像生成和图像编辑,还兼顾快清、潜能等特点,不仅支持在消费级显卡上流畅运行,还能以秒级为单位急速生成和编辑。首先下载软件, 双击启动 上传需要编辑的图像,最多支持同时编辑四张图像。 输入提示词及编辑的具体内容,选择模型设置参数。最后深沉, 接下来我们用案例演示 提示词将裙子颜色改成红色,直接点深沉。 支持更新的 g 显存加十六 g 硬存的设备,选择 g 模型。 接下来用质量更好的九 b 模型来演示,这里注意,四 b 和九 b 模型分别对应不同的文本编码器 提示词,让图一的女人手持图二商品做介绍姿势, 同时支持编辑后的图像高清放大, 其他大家自行操作。本期视频到此结束,感谢观看!

大家好,这里是社恐的知识树。 一月十五日晚,黑森林官方又推出了重磅开源模型 flux 二 klein。 上次 flux 二刚发布的时候被 z 精准狙击,本以为会继续沉寂下去,没想到不声不响在憋大招呢。 klein 的 图像编辑能力我愿意称之为最强。这次的模型有几大特点,第一个就是速度快, 蒸馏版四部秒级生图,质量也有所保证。从贝斯版到蒸馏版,从九 b 参数到四 b 参数全部放出,为后续开源社区训练提供强力支持,模型未来的发展值得期待啊!模型下载地址,如果上不去抱抱脸,也没网盘会员,那么直接来摩搭即可。 这是黑森林的摩达官方仓库,模型分为九 b 版、四 b 版、 f p 八精度、 f p 四精度,一共十二个模型,下载链接我会直接发在评论区或者去康费官方仓库下载,整理好的也行。 本期视频使用的是云端租卡平台优云智算,进入官网,点击镜像社区,输入 flux 二,找到 up 主制作的镜像,点击部署。经测试,三零九零和四零九零都能流畅运行。 工作流演示环节,我使用的是官方模板的工作流,稍微改了下,用同一个提示词,上面运行的是贝斯版纹身图,下面运行的是四部蒸馏版文本编码模型,这里要注意下,如果模型是四 b 可以 撇,同样选四 b。 贝斯版负面提示词可以填写下常用的部署这里经过测试,二十、四十、五十步,差距还是挺明显的,我就设置的五十,看看效果 设置图片分辨率 latent, 这里要用 flex 二档,下面蒸馏板的设置都一样,就替换下主模型 c f g 设置一四步即可查看下提示词。 开始生成测试的时候把工作流连在一起了,后面我会单独拆开四 b 模型的效果,左侧是贝斯版,右侧的是蒸馏板,下面小字有时候会多写,需要抽卡尝试使用四 b 贝斯版。不同步数的区别对比 依次是二十步、四十步、五十步,二十步的时候能明显看出来下半部分近景的图像细节还没用完全去造,到五十步结束,图像细节才算完整呈现。九 b 多图编辑工作流模型夹在这里有两种,一种是半精度的, 一种是 f p 八的。看显存,选择文本编码模型,记得切换对应的千问三八。 b, 上传第一张图片,最终生成的图片尺寸以这张图片为准。上传第二张图片,这里用一个 ai 生成的汉服裙子为例, 暂时用不到的三和四上传图像可以先忽略,这是每个图像后面的缩放输出,忽略的时候按照对应一二三四的来。多图编辑的时候要写清楚提示词, 明确图片之间的关系,采用设置保持默认。看看换装融合的效果咋样?细节方面是否还原,先看最容易变形的花纹,从前襟、袖子、腰带到裙子下摆都还原的非常到位, 服装穿到模特人物身上后感觉也很自然。不同元素的多图融合,这里用了四张图进行融合演示,图一为人物主体,图二一件裙子, 图三一副太阳镜,图四一个可爱海报的现稿形象。图片融合的越多,提示词越要写清楚前后关系和拼接逻辑,裙子这里不强调,开叉也能还原,但是要抽卡。 我这么写为了方便,虽然是多图编辑,但是推理速度也是飞快。生成完成海报纹身可用提示词纹在整个胸口,也可以纹在左胸,右胸都是可以调整的。 去掉海报纹身,换一条项链,戴上融合的项链,细节也保持得很好,或者五图融合,有纹身又戴项链。

hi, 这里是阿边一个普普通通的设计师黑森林今天凌晨扔出了一枚重磅炸弹。就在今天, fox 二的 kling 版本正式杀回战场,这次不是进化,简直是复活赛直接夺冠的级别。 这里更新一个信息,我练了一个两千五百一十一的一件装厚图梦幻动漫风格的 lora, 有 兴趣也可以在我的 running hap 尝试。 lora 下载地址已放在简介处了。回到正题,这个全新版本带来了四 b 和九 b 两个尺寸,还提供了可用于训练 lora 的 face 模型。 最厉害的是,无论是 b 还是九 b, 都原生支持纹身图图像编辑,并且完美兼容中文提示词。实际使用下来,它的表现堪称王炸,速度惊人,比之前的 z 英妹举模型还要快。配置亲民,九 b 模型仅有十八点二 g 大 小, 功能全面一套模型搞定纹身图和图像编辑。当然,我们直接上一段硬核对比。第一轮是纹身图 flex 二 k 零 vs 千问两千五百一十二, 写实风格两千五百一十二稍胜一筹,动漫和二次元 kling 完胜,细节和色彩明显更出色,中文提示词支持良好,但深层含中文制服的图片仍有提升空间。第二轮是图像编辑 fox 二 kling vs 千问两千五百一十一, 部分场景效果优于两千五百一十一,色彩控制的更好,针对动漫风格片编辑效果更好, 但一次性比两千五百一十一差。总体来看, fox 二 ken 在 动漫二次元领域展现出了巨大潜力。考虑到这 emoji 的 face 和编辑模型尚未开源, ken 很 可能在接下来成为许多创作者的新宠,包括我, 未来肯定有更多开发者寄予他训练专用 lora 效果绝对值得期待。模型工作流在线使用链接我已放在简介处,欢迎大家自取 本地部署。用户请注意,记得将康飞 y 更新至最新版本,使用秋叶整合包的同学记得在设置中暂时关闭 get 国内镜像,重启后切换回官方原再进行更新。 如果这个复活归来的模型让你心动,请务必点赞、投币、收藏三连支持!你们还希望我训练他的哪些功能?欢迎在评论区告诉我,我们下期再见!

小伙伴们大家好,那么 flux 二跌落神坛 还历历在目,对吧?啊,大家一直在玩这一辈,这段时间啊,阿里的编辑和 base 呢,又迟迟不放啊,不知道为什么哈,很奇怪,阿里最近很喜欢拖延,从万象以后就开始喜欢拖延,我不知道为什么啊,啊,我不知道为什么, 那么这个时候你不放就有人放了,对吧? flex 二这次开始了一场帝国反击战,放出了他们全新的模型,就是这个克莱因, 而且一次就放了四组模型啊,那么其实是两个主模型,一个是我们这个呃,九 b 版本的,一个是四 b 版本,那么这两个模型里边又分别有就是有两对啊,一对是什么呢?就是一个是蒸馏版的,还有一个是 贝斯版啊,而且这两个模型都支持编辑啊,不光支持升图,还支持编辑, 那么 comfy 也在第一时间进行了一个支持啊,那么注意一下啊,这两个模型它用的这个 textencoder 不 一样啊, textencoder 不 一样,就是九 b 模型,它用的是千问三八 b 的 textencoder 哈,对吧?啊,阿里被人被人夺舍了对不对?你不开源,你在这托就有人用啊。 然后它的四 b 版本呢,用的跟这一位是一样的,是个千万三四 b 的 这样一个模型啊,只不过需要在这边选择一个 flex 二就可以了, 那么 ok, 我 们就感受一下它的一个效果,这边我们分别感受一下,就是说它的纹身图能力,还有这个编辑能力啊。哦,这边先跑的是这个蒸馏版的啊,呃,感受一下,就说主模型呢,就是 base 版呢,我也在下啊, 然后我们看一下啊,这个纹身图的,我们分别写了十组提示词啊,包括人像啊,包括风光啊,包括产品摄影,包括时尚杂志啊, 还有我们这个二次元啊,还有我们的美食摄影,还有赛博朋克风格的,还有一个中式元素的,还有一个就是奇幻风格的,还有一个就是说,呃,带文字内容的,特别是中文内容的, 那么 ok 啊,当然这个对比稍微有一点点不公平,为什么?因为 zimiash, 特别 zimiash turbo 啊,他是对我们这个摄影还有这个,呃,中式元素有一些的优化的,专项优化的,这个我们大家应该都知道了。 ok 啊,那我们就看一下,先从最基本的人像来对比来写啊,那最右边的是 zimiash 的 话,很讨喜对吧?啊,是我们国内大家都喜欢那种,那么中间的是个九 b 版本的,九 b 版本呢,会 还是有点油啊,但是四 b 版本就没那么油了,没那么油了啊, ok, 再来看下一组风光的啊,风光,我觉得这个还是自己妹子更讨喜一点啊,但是,呃, flax 二,这个克莱因呢?克莱因也还不错啊,也不错了。实话说啊, 我们再来看看第三组产品摄影啊,蓝牙耳机,这个这个我觉得就没什么太大区别啊,这个声图质量都很好,都很好啊,包括 z 的 啊,对吧,都很好。我们再来看看第四组一个时尚杂志封面的,就说这个四 b 的 模型,实话说, 我觉得他有点强,实话说的有点强啊,跟九 b 的 其实差异没那么大啊,当然 z 的 话对摄影进行优化了啊, 然后我们再来看看二次元啊,放大一点啊,二次元的话其实是各有风格啊,但是我觉得这两个都看大家的一个喜好了啊,喜好了,美食摄影,美食摄影的话,我觉得,嗯,这个也不好评,效果都挺好啊,都挺好啊。 然后我们再来看一个就赛博朋克风格的,赛博朋克风格的也是一样,但是说这里面能看出来,就是说,呃, flex 二这个克莱因呢,他对这个光影会更多的一点点细节啊,这个应该是训练上面有一些特性的啊,会多一点细节,就特别像这种反光啊,无论是四 b 还是九 b 的 这种反光都比这个 z 的 要更加的丰富一些啊, 这可能是个个例,也跟我们 t c 有 关啊,但是我觉得这个两个效果都挺好,特别是呃, flex 这个啊,我觉得效果很好啊,很有味道。 我们再来看下一组,就是中式的,这个其实不用说了,这个是 z 的 主场啊,这种的话,这是 z 的 主场。但是 flex 二克莱因的表现呢,我觉得也不错啊,至少它有中式的很多东西了,对吧?啊,包括角色的表现都挺好啊, 你再来看看奇幻风格的,奇幻风格这个也是,我觉得就没太大差异啊,表现的都比较到位啊,提示词基本都复制出来了。 那我们再来看看最后这个就是说你早点摊,然后他的这个带中文的啊,我这边还是写的多少多少钱,多少多少钱多少钱啊。那么这个肯定 flux 要吃亏啊,他对中文的这个表现能力啊,第一就是会差一些,第二呢就是 我们看他很多元素,对吧,就不像这一妹子这么本土化,他比如说油条啊,这些东西啊,就是变成西班牙油条了,哈哈,变成西班牙油条了,然后喝的豆浆呢,也是用这种 杯子啊,像那种星巴克的咖啡杯子一样去喝的啊,我们这个这一妹子呢,他就是像我们中国早餐那种常用的那种杯子对吧,还有包子这些对吧,这一妹子呢,就表现的很到位,但是呢, flax 这两个模型就稍微差一点,但是啊,如果我们抛开这个不说啊, 整个光影质感我觉得差异比以前已经缩小了哈,已经缩小了啊,这的话更偏这种写实随手拍的感觉,但是呢,呃,两个 flex 二的模型呢,效果也不错啊。 ok, 我 们再来看看它的生成速度啊,生成速度的话我这边记录了一下,我首先说一下我们的图片呢,十张七二零乘幺二八零的 z 呢,用了二十九秒啊, flux 二克莱因九臂的蒸馏板呢,用了十五秒啊, flux 二克莱因四臂的蒸馏模型用了十一秒就是它的速度。这两个模型的速度都比 z 位置要快一倍以上啊,就相当于只相当于 z 的 二分之一 只相当于 z 的 二分之一啊,因为它只需要四步啊,无论是这个,呃,这个四臂板还是九臂板啊,都只需要跑四步就可以啊,就是 完成这个图片的生成, ok, 那 我们再来看一下这个编辑能力啊,我这边就随便找了两张试了一下它的功能啊,一个是高达的 啊,这个是这样的哈,还有就是说这个我们这个繁华的一个句照啊,句照里边我们拿来做测试, 首先第一个是单图编辑啊啊,单图编辑的话分别试了几个?第一个就是把我们高达变成这个磨砂玻璃的四臂的啊,这个是四臂的啊,四臂的蒸馏板没问题啊,然后让它燃烧起来也没问题。 然后呢,这个就是我让他变换光源啊,我告诉他左上角是我们这个四十五度的日落时分的暖色太阳光,对吧,完成的非常好啊,完成的非常好,而且图片保质保证的也非常好啊,细节保证的非常到位。 那么还有一个双图编辑,那么第一个呢,就是让这个两个站在一起啊,这个因为人物有点变化了啊啊,因为就是,怎么讲呢?还是说像素不太够啊?第二个就有点意思,第二个是我是让着让第一张图参照第二张图的光照去, 呃,复现他的一个光影效果,那么 ok, 实现了啊,就是说实现了,因为这个图是从右边打的光嘛,对吧?右边打的光,而且是个暖光啊,算实现了啊。 那么第三个就是让这个女人拿着我们这个高达这个呃,玩偶啊,模型在咖啡厅里啊,然后光影是参照图二啊,参照图二, ok, 那 么也没问题啊,也能实现哈 啊,这就是个四 b 的 小模型,那么 base 版的模型我也在下啊,我也要体验一下,就是说我感觉 flex 二这次是非常的有针对性,为什么这么说?因为它你的 z 内置的 base 不 开元,对吧?你只开了个 turbo 啊,我们理解为蒸馏版对吧, 但是你的 base 和 id 一 直不出来,那么 flux 二就做出来了,对吧?你不出就有人突出啊,我还是那句话,开源社区从来不缺好模型,你不开就有人开,那你现在你还在等什么呢?我不知道为什么阿里最近这半年在开源政策上变得 这么对吧,我不客气的说,这么保守或者是这么对社区的一个呃,不重视吧。啊,我还是得说句说点题外话,万象的二点一和二点二当时是很多的社区的技术 去反补的,可以说是发展的十分蓬勃啊,但是你看二点五和二点六,二点五和二点六那个质量在在币源里边,你能做什么?你能做什么?你,你打得过谁对吧? 你再看看别的,现在视频里边 ltx 二出来了是吧?那么图片呢? flux 克莱因又出来了, ok, 那 么就给大家分享。这里啊,吐槽比较多啊,确实是哀其不幸怒其不争啊,这么玩下去的话,眼看着一个 元神就这样没落了啊,心里还是有点不甘的好。那么对应的模型工作流呢,我也会上传到网盘啊,大家可以去试一试感受一下啊。 comfy y 官方的话也有一个模板都提供了。好,就这样,拜拜。
![黑森林开源FLUX.2 [klein] #ai #aigc #ai绘画](https://p3-pc-sign.douyinpic.com/tos-cn-p-fd6e84/o0EiixI6JitxwQQ0E4C30IW0xCBdmcxatW6Pp~tplv-dy-resize-origshort-autoq-75:330.jpeg?lk3s=138a59ce&x-expires=2084760000&x-signature=N9Bl0Pdjmdxyalq79J7aq9dXyok%3D&from=327834062&s=PackSourceEnum_AWEME_DETAIL&se=false&sc=cover&biz_tag=pcweb_cover&l=2026012612373032DF6C1F617CC27EF712)
黑森林工作室终于有开眼新的 flex 模型了!这次 flex 二 pro line 打破 ai 图像生成的速度天花板,零点五秒内就可以完成专业级图像生成与编辑。这是什么概念?比眨眼还快!更惊人的是九 b 参数模型,性能媲美五倍体积的巨型模型, 四 b 版本仅需十三 g 显存就能在三零九零显卡上流畅运行。纹身图、图中图多图融合,一个统一架构全搞定,感兴趣的兄弟快去试试吧!关注我,每天都有 ai, 第一手自选!

黑森林工作室最近发布了一个名为 flux 点二 client 的 图像模型,主打一个字,快。具体体现在两个方面,一是生成速度快,二是修改速度快。在理想的硬件环境下,这个模型可以做到压秒级的推力速度, 能够在零点五秒内完成图像的生成和修改,接近于实时反馈。替大家试了一下这款模型,确实挺快的,但可能受限于网络和硬件的问题,虽然没有感受到零点五秒那么快,但基本上也就是一两秒就出来了。特别是在点击修改风格这里, 一下就能出好多张图,并且图片的质量并不低,无论是风格转换还是改变场景,画面效果看起来都很不错。 flat 点二 colorine 有 九 b 和四 b 两个参数的版本,四 b 版本支持 ipad 二点零许可,允许商业使用和本地开发。并且四 b 版本对于显卡的内存要求较低,可运行在 rtx 三零九零和四零七零等消费级 gpu 上。 目前可以到这里在线体验,或者直接到哈根父子上进行部署。对升读速度有特别要求的朋友,或者想在自己的 pc 上玩玩的朋友,可以尝试一下这小瓜推荐第四百八十二个神器,我都放到 ai 星空岛了,上岛解锁更多 ai 工具!

是 a i t z, 去年是阿凯空游还在一月十五号更新的一个 flex 二 klein 的 模型,一点是它的身图或者是便利图像的能力 很快。第二点是它的一个对你的显卡要求很低,三零九零或者是四零七零都可以。这个型号它一共两个版本,一个是九 b 的, 一个是四 b 的, 那究竟有没有他说的是那么好呢?今天阿凯带大家来简单的体验一下。那首先的话,先说第一个问题,就是就如果你想使用最新版本的 client 的 话,是需要把你的 qq id 更新到最新版本, qq id 它自己的,把它一个官方仓库迁移了,就导致现在有个 bug, 就是 你需要按照我的步骤打你的 qq id 文件夹隐藏项目,选择这个 get 文件夹, 然后找到这个文件,然后用记事本打开,然后把这个网址换成这个网址就可以了,可以看到我把这网址换了之后能直接更新到 呃,一月十七号的最新版本。至于 k n 的 模型,它,呃深度效果是如何的呢?我们先看一下官方的一个指南啊。首先是它有个四 g 版本,它有工作流,是这个点击右键纯属为就可以直接下载这个工作流, 然后这有他几个模型啊?四 b 的 模型,呃,以及一个九 b 的 工作流也是一样的,那我是按照按照官方的流程把这个东西下载下来。男模特,左边是 z 音乐局,右边是最新版本的 kant, 四 b 版本的真牛版,第一眼看上去感觉还行啊,但是 在做女士的时候就出现一个问题,就是头发毛躁没法解决,就是 z 音乐局,就是 z 音乐局,可以看到 可以看他头发这个纹理非常的清晰啊。那可以的,问题在于这头发非常毛躁啊,毛边非常多。然后不光是四 b 版本,就四 b, 他 是个比较小的模型,我也用过他最好的就是九 b。 九 b 的 针灸版也是。还是有这个问题,头发毛躁,中文题词跟英文题词甚至会有区别,特别是这个多出一个手就很奇怪,有一条 ai 味。头发毛躁以外还有个问题就是对中文字体不支持,可以用中文直接生成海报,但是它没法识别标题字是什么。

今天分享这刚发布的 fpx 可莱因的模型,全套的都在这,我先简单的介绍,等下再详细的介绍。首先就是它的速度已经达到亚秒级的速度,有这个工作没有 运行的话,基本上就是一秒就出图了,非常快。因为我这边是用的是端老鹰的在线镜像,所以他需要加载图片,实际上他运行的话就一秒 刷过去了,非常快,速度非常快。这个是四 b 的, 九 b 的 话就一秒多一点,反正就是秒级的,非常牛,而且图像的质量非常高, 我感觉个人感觉比呃 fox 二三十二 b 版的效果还要好。 等一下我会一一的介绍这个详细的使用教程。这每个工作没有全套,都在这里面,我先把它揭开,简单的介绍, 我这边有个对比图,等一下是对比 fx 二三十二 b 版的一个介绍, 比方先看这边用的是五枚九枚,这是用时的对比上面时间,这是四比的话,用时一秒,这个是九比的话,用时两秒,九比的话效果会更好一点,有饱和度 更正常一点,这个饱和度不太正常。这个是 fox 二 dv 的 版本,三分钟,细节是很细,但是他有一种模糊的感觉,所以, 嗯,个人还是感觉这个克莱因的这个快速版缩小版反而效果更佳。 时间那就没得比了,因为一边是一二秒级的,一边都是三分钟的。 然后这个是产品精修,我觉得这个九 b 的 精修的效果,个人感觉比这个呃三十二 b 的 f x 二精修的效果更佳。 不同风格吧,可以大家可以参考使用。我觉得科美英的这个模型效果更加精修。然后这边是 他用认识十五秒,这个也要三分钟,这是图像混合生成,这个效果明显更好一点,这个就有点变形了,而且有一种模糊的感觉,虽然他很细,但是个人感觉还是这边好一点,正常一点, 底下也是混合深涂的一个效果。 fos 二是比较高清,但是就是很模糊,而且五官保持的非常差。而这个九臂的可耐因四臂的我就不介绍,因为效果比较差,所以直接用九臂的 他时间差不了多多少,就差几秒,所以无所谓,这个保持的就非常好, 非常完美,然后这个九十八秒就搞定。这边是满粘土的那种局部充沛的效果,个人觉得也是久必会更深一层。 这边的话就有点变形了,基本上都变,而且有有一种模糊的朦胧感,效果不是很好。这次这种呃小版本的方案效果更佳,一次性保持的更强, 他只需要九秒,等下我会一一介绍。这整套的工作没有使用方法,从第一个到最后一个, 这个四 b 的 我就不介绍,不用了,把它删,从这里边删除,因为四 b 的 话效果就不太好,直接都用九 b 的 就可以了。 首先介绍一下,我这边用的是端老鹰在线进线,大家不嫌本地不熟的话,想即开即用就点开我的进线,我现在用的就是在线进线, 这个工作没有我放在旁边这个 fx 二单图和多图编辑里边, 这样子他就一整套都在这里边了。前面这三个是 fx 二的一个圣图集多图编辑,还有单图编辑这些是新增的,就是这个最新刚发布的这个克莱因版本, 这个对比图我就删掉了,没有,刚才介绍过。 然后我这里边还有其他很多工作没有最常用的,而且最近刚更新的 mot 叉,二点零纹身图或者是所谓针等等都在这里边,也是全套的,还有二五幺二的,还有这一枚的都是全套, 还有二五幺幺的。最新的工作没有,我都会放在最外边这些,然后里边有份视频图线与视频类就很多以往比较实用的工作没有都放在这里面。 图像类就更多了,有三百个工作没有,都放在这里面,也是比较实用的,都放在这里面。 语音美的就是比较实用,常用的一些深层音乐或者深层语音,或者风靡音频提取纹身,纹身语音或者是一句话声音克隆,还有歌曲变声,声音克隆加歌曲变声比较常用。 用在线进线的好处就是你可以一键复制我所有的这个进线,就所有,包括这些工作没有,还有这些部署模型等等,一键复制属于你自己的,而且你看到我能用的你们也就能用。 而且镜像的好处就是都在一个 com 里边,你可以自由组合各种模型及工作去完成你的工作, 而且每一个工作没有我都对应的一个视频教程,你可以现学现用或者边学边用,等于是一站式搞定。而且镜像的话他的 他有安装设置,可以自己去打开安装文件,添加模型或者修改模型等等,等于是一键复刻了我整个镜像属于你自己的,这个更适合专业用户去使用吧。 然后如果想本地步数的话,可以点开我的笔记,点开滚屏原教程,它会跳转到最底部工作位位置, 这个工作没有,我放在图像类里边,跟工作没有名称一样。 fox 二单图和多图编辑里边里边就有。呃,这个安装教程 上面是 fx 二的安装教程,这个是 fx 二克莱一模型的安装教程。九 b 四 b 安装的下载链接,截图还有放置位置都详细的都注解在这里面,还有这个呃, 文本的模型都有,还有底下有里边工作没有的所有截图,每个截图都可以看清上面的数字参数,这样子有时候就不需要去打开工作没有查看,直接点开这个就可以查看到 底下是视频教程及工作没有下载,这个就适合本地不熟的人去使用吧。 好了,回到我们这个镜像,现在开始介绍,从第一个开始吧,第一个就是纹身图,我这里边都有,如果你想更快的话,用四 b 摸完的话,我就选九 b 完整版的,它的效果最佳。这边还有呃,九 b 的 f p 八版本还有四 b 的, 这里边有有个问题要注意,如果你选九 b 的 话,底下的文本模型要选择八 b, 如果这边选四 b 的 模型的话, 那底下要对应的选择到这个四 b 的 模型前文上四 b 的 模型,这个呃详细设置我都有注解在这上面,大家不懂的话查看这个记事本这个备注就可以了。 然后这个就是一个默认的一个工作没有了就纹身图这边就是设置尺寸,大家注意,如果你设置了,在这边设置了一个尺寸比例,那上面的长框设置就等于是作废,他会以这个为准, 如果你想以上面为准,这个这个设置记得选择空就好了,这个就会以上面为准。如果你这边设置了一个,选择了一个快捷的一个尺寸的话,他上面就默认就取消以这个为准,这个简单 了解一下就可以了。然后这个深图的话,九臂的话跟四臂效果比较差,我就不介绍,直接用九臂,他生成的速度非常快,也就一秒多一点, 而且生生层的质量非常高,如果呃效果你觉得不满意,可以高清放大,用这个去高清修复,就可以把这个细节啊都高清放大, 都增加了锐化这个设置的话没有在这里边,你不懂的话直接看这个柱节就可以了。 想要锐化更高的话,选择这个版本七 b 的 s 开头的这个它就是锐化比较强的一个模型, 这个是高新款的,如果需要的话,你都可以把这个复制到底下,每一个工作的都行,只要把这个图像的连接接到这上面就可以了。 这个墨纹的深纹身图我就不介绍,底下是局部重绘,其实上面也是一样,只不过增加了一个修复的节点, 然后右键去涂抹这个,打开折上涂抹你想要呃修改的部分,然后填写提示词。因为他这次用的是千万的这个文本模型, k 盘模型,所以支持中文, 但是他这个模型不支持深层中文字体,所以中文字体就算了,不去折腾,深腾的出错率极高,没什么意义。 然后这个就是修改尺寸,这个是最最长的边,可以设置最长的边他的图像大小,然后这个只不过是模糊一下这个车罩的区域, 这这些默认就可以了。只要上传图片,涂抹修改的部分,填写修改的内容,然后生成出来即可。 它生成的效果就非常完美,最重要是它速度快,一秒秒就完成了。 然后这边就是单图编辑,就不用涂抹的方式,直接没接进去的。这个只不过是一个图线 大小的一个设置,最常见设置乘以幺五五多少,反正你自己看的设置。然后提供一张图让他去精修,精修的提示词也是用中文就可以了,一样都是用九 b, 然后他只要四步,也就是呃,一秒秒就出来了 啊。这个好像是要十秒左右,因为是编辑的一个处理,而且他精修的效果,嗯,反正挺完美的,比 fx 二精修的效果更完美一点。 然后底下是连图编辑,就多了一个这个而已,多了一张图片,每多一张图片都要附带这三三个,记住就可以了。 然后他是没接在一起的,比如前面,没在这后面,一般情况你就呃用两张图去融合,如果有更多的话,你可以一步一步的去模糊,比如说我这添加完了,我还还要再添加一张,那我把这张 拷贝一下,粘贴到这边,然后再粘贴 第三张,再去生成这样子。只用两张图编辑的话,它的效果是最好的,更多的内容可以一张张用这种方式去增加增加,增加满意之后再去移到这边,再添加 双图编辑的话效果最佳,如果删图的话,那他的出错率概率就大很多,而且记住这个参考图最好是白色背景的,当然有时候不需要白色背景也行,就是最好是干净一点。 嗯,白编辑底下这个是三图编辑,就没什么好说的,只不过是增加了一个图片而已,他最多可以支持十张图片,但是没什么意义,他处理效果最前也就两张,超过三张他的出错率很高,就没什么必要,所以一般用 满粘就行了,一次一次去叠加即可。然后这边要注意的就是,呃,图一图二要对应清楚,不懂的话可以看这个提示词, 比如第一章,第二章的名称对应的产品,第四次写的时候要注意,这是图二的衣服,不要写图二的包,上面也是一样,图一图二分清楚,呃,名称跟顺序。 最后一个是扩展,扩展也没什么好做,增加的一个节点是这个外扩的一个节点,这个英文上下左右,你设置一下左右的 大小,他就会把左右增加一个空的尺寸出来,这样子,然后我们用提示词把灰色去去填充,他就可以完美的填充, 完美的去扩图,其实就是一句提示词就搞定了,这个就没什么可介绍了。然后这边只不过是图线转换角度,我们用这个转换角度的节点 控制它的水平,垂直旋转,还有镜头的远近,这样子去控制旋转, 这个等于是你的镜头,你可以控制到这,然后高度你可以从上往下看,你可以看的近一点或者看的远一点,自己在这设置,这个就是黄色部分,就是你的镜头, 其他只是控制这根杆旋转垂直的跟水平的 啊,这个也是设置图像的大小而已,这样子就可以轻松的呃,提取到这个控制镜头角度的一个提示词,输入给这个文本材料去生成 一样,生成出来也是很完美,一次性保持的非常强。我觉得他这一次性保持的比 这边三十二 b 的 f 二的 dv 的 三十二 b 版本效果更佳。这个深图细节是很细节,但是, 嗯,一次性挺差的,而且色彩啊有一种朦胧的感觉,有点糊, 所以现在直接用这个就好,我觉得他更实用,最重要是他速度非常快。好,这期就分分享到这,大家去玩吧。

先说结论,强烈推荐大家下载安装款,功能非常强大,像是我之前训练过的熔图、去光、打光等功能,模型原声都支持宽,而且非常难训练的精修模型也具备能力,还自带换色、白底图转场景等功能。 大家好,今天给大家分享这克莱的这个工作流,这次的非常非常强大。首先直接运行图,一是直接对图片进行编辑, 比方说我们现在是去除现有光影,使用阴天柔和光线对图片重新照明。好,我们看一下这个效果,比之前训练的 lowra 的 效果要好了非常非常多,这个效果可以说非常非常惊艳, 所以我今天测试了一下之后,立马就录一期视频,因为太强了,我们先打开这个工作流右边的局部重绘,然后打开左边的这个遮罩,编辑 好稍微框选一下,然后提示词改一下,现在提示词改成移出蝴蝶,改为小熊发卡。这次这个速度是非常非常的快,就可以看到我们这个局部编辑的这个已经好了,而且是没有偏移的, 这个比二五幺幺幺好了非常非常多。然后现在用的是 f p 八的模型,步数是四步,基本上五零九零是坐在三秒钟出图,效果非常非常的惊艳。好,我们关闭局部重绘,嗯,这个图片改为一个室内的, 然后打开这个线条,现在我们提示改成根据图中的线稿生成欧式装修的客厅,这个效果就已经出来了,效果非常非常的好。这个细节是非常非常丰富的, 我们关闭线条,使用深度控制,可以看到这个深度控制的效果也是非常非常的炸裂,这个效果生成的比二五幺幺要好了非常多,所以强烈推荐大家使用,而且速度非常的快。 好,我们关闭深度控制,打开扩图节点,然后这个提示词就需要改一下,现在我们提示词改成根据图片中的客厅扩展两侧空白区域,因为我们的这个扩图现在是加的左边跟右边。好,我们看一下 左边跟右边基本上是没有什么问题的,没有那种交界的,呃,那种违和感,也没有缝隙,总体是非常不错的。好,我们看一下姿态控制,姿态控制的话就需要打开图二。 好,我们这图二传了一张模特图,然后图一传了一个模特的全身图,我们提一次改善,将图二的模特按照图一的姿势站立在客厅中,这个姿势还原的非常非常的精准,而且这个质量相当的高, 可以看一下人物的细节,非常的好。现在跳过姿态控制,打开纹身图,这里只需要改一下宽度跟高度就行了,比如说现在是幺九二零乘幺零八零, 第二次改成一个火车,在高架桥上可以看到这个处图相当的好,这个图片美学已经超过了二五幺二,可以跟 z 一 美肌对打了,非常的不错。现在关闭纹身图, 打开图二和图三,图一还是模特图,将提示词改成将图一的模特穿上图二的 t 恤和图三的裤子,他这个有的时候不是很稳定,现在的模型他其实有点笨, 他特别吃提示词,比如说刚才说将图一模特的衣服换成换成图二的,他就只换了衣服,他的裙角会有一些问题没有处理干净, 然后这里你如果说图三的裤子也是会有问题,你必须要指定是短裤,像现在图三是短裤,现在换出来的结果就就比较好,他比较吃提示词,你要描述的非常清楚才可以, 其他的功能非常非常的强大。好,我们现在上传一张非常糟糕的图片,他有水印, 然后有锈迹,乱七八糟的东西很多,我们第一次改成使用摄影棚白色艺术光线,因为你如果不加白色的话,他默认出来的光线是偏黄,所以我们最好要加上这个颜色, 然后突出产品的质感和去除瑕疵和水印,让金属反射变干净。好,我们看一下这个是模型自带的能力,就已经修的非常非常的好了。我们看一下细节, 我们试一下这个换色,这里上传一张汽车的车漆, 图二,上传一张这种复杂的荧光渐变的这个颜色提示词改成参照图二的渐变颜色和质感, 将图一的车漆换成图二的效果。呃,这个模型非常吃提示词,所以你如果想要让它做的好,你这个有渐变的话,你必须要说渐变这个词,它就跟橡胶很类似,我们看一下效果偏移非常非常的不错, 但是放大看还是会有一些小问题,不过这个可以靠后期重绘解决。图一,再传一张白底的图片,然后这个提示改成保持产品位置大小这些都不变。 然后把产品放在欧式现代装修的客厅中,我们运行看一下结果,可以看到他这个有的时候会去改这个产品的细节, 这需要多抽几次卡,但是深沉的这个场景美学素质相当的高,而且细节非常的丰富,我们现在试一下,把这个白底图传到图二,然后图一把线条打开, 提日词改成,将图二的产品放在欧式装修的客厅中,保持位置大小跟图一的线条一样,相当于是用 ctrl 键去控制这个 图像的位置不变,基本上可以看到这个产品的位置是没有变动的,整体这个背景也生产的相当的好,细节非常的丰富。总体这个模型我给的评价是非常非常高。现在出的二零四八的尺寸相对来说会有一些问题,他这个边缘这些不是很好, 二零四八就把下面这个缩放的尺寸改到四就好了,但是效果不是很好,可以改到二,然后出到幺幺四八这个尺寸,我们可以看一下幺幺四八的这个尺寸还是相当不错的, 非常推荐大家升级。最后就是模型的选择,九 b 跟九 b f p 八出图效果几乎一样,而四 b 全量模型就差的有点多了,推荐大家使用九 b f p 八。

hello, 大家好,我是乡村幻想。昨晚上 flex 二的可链模型发布了,它一共是发布了两个模型,然后这两个模型又各分为两个版本,一个是蒸馏版,一个是 base 版, 那我这边就做了个大概的测试对比跟 zedge turbo。 我 们先看一下这些图吧,一共是跑了十五组 一样的提示词,可以先看下人像,人像这边的话依然是自己妹子的强项啊。然后这边的两张呢,给人的感觉就是想强行去增加皮肤质感,反而会不好看,你看像这些地方,你看 那汉字这块,他依然是不认识,虽然提示词可以用中文写。这边也是像产品摄影这块就看大家的喜好了, 像这个美食摄影,大家再看一下这张图啊,实际上 zy 们也是对汉字的支持,他也不是那么的好这个水墨画,这是日式的塞露风格,建筑奇幻风格,这边的还有这个, 然后我们再看一下模型这边吧,这边是四 b 的 正流模型,大家需要注意的就是这个 clip 需要用到千分三的四 b 的 clip 类型,选 flex 二就行了。下面的 v a e 就是 flex 二的 v a e, 大家看到这个 flex 的 模型配千万的这个 clef, 是 不是有种很奇怪的感觉?那我们一直在等自己妹子的艾迪特模型和贝斯模型,他一直不发布,然后现在有人用了九币,我下了 f p 八和他那个原版, 我担心我电脑跑不了,因为这个原版的体量本身就比较大,再加上这个千万三八 b 的 这个 clef, 你 看一下光这个文件就有十五点二 g 了,我就下了个 f 八的, 但是我后面又试了一下这九 b 的 原版呢,我电脑也可以跑,就是速度稍微慢一点,那剩下的这个就一样的。下面的 v 妹子咱们就不讲了,已经说了很多次了。 另外他这个四个版本的模型,我们就只需要下蒸馏板就可以了,因为蒸馏板只需要跑四步,他速度非常快,你要是下贝斯版的话,那这个就没什么必要了,他都需要跑五十步的。刚才这些对比图九 b 的 我是用 f p 八跑的,在这边软件汉堡上面我也跑了一个九 b 的, 就是完全版的 rnihab, 也是我平时常用的一个在线云平台,他的模型更新速度非常快,你看昨晚上刚发布的模型,他现在这里就有了,就已经支持了。我们可以看一下这个 rnihab 这边跑的对比结果。 你看人像这块还是一样的,九臂的,你看他这些纹理,就是给人一种想强行增加细节的感觉。这张稍微好一点,但这个全身的就不太行了,汉字依然是一样产品,摄影 基本上就是大差不差吧,如果大家想玩的话,有九 b 的, 像 f b 八的也可以。 好,那我们再看一下这边的工作流,这边就是纹身图,图身图和编辑,因为它这两个模型本身就支持编辑功能,我这里还是用的全句输入啊,大家如果要换模型的话,就直接在这换就行了。四 b 的 用这个千分三的四 b, 如果你要用九 b 的, 切记把这个就改成八 b 前卫三的芭比就可以了。其实词这块还是用的其实词小助手的优化,大家可以看一下这个人像这块感觉就还是 flex 的 传统大油皮,那下面就是图人图,图人图用,其实词小助手反推到这边,他出来的图,咱们看一下对比,这是原图, 这是 flux 二出的图,原图是 z e m g 出的,然后下面就是图像编辑了,就是给了个稍微有点难度的,让这个女的坐到沙发上。 这张图我是用九 b 模型跑的,用四 b 跑了一下,感觉不太好,所以我用九 b 试了一下, ok 了。所以图像编辑这块我还是推荐大家用九 b 模型。 下面的这个双图我是用,我是通过这种方式,就是图一图二加个头像连接,然后把它编码之后传过去 啊,让图一和图二合影,这基本上就没什么一致性了,大家可以看一下这个对比,你看人像一致性差很远。好,我们来看一下换装行不行啊,就是让图一的女人穿上图二的衣服,这个我还没测试好的,结果出来了,我们看一下 这个换装好像还行,可以看一下彩样,这边用了二十四秒,我用的是九 b 的 模型,所以图像编辑这块就是推荐大家用九 b 的, 咱们再看一下单图编辑这块,把衣服变成白色,咱们看一下。 好的,结果出来了,他还是有点像素偏移的啊,你看,但是人脸的一致性保持的还可以。这边彩样是用了十八秒,原本这个工作的我是想删掉的,那后面还是保存下来吧, 大家可以自己下来玩一下试试。大家需要记住的就是,九 b 模型用前文三八 b 的 clive, 四 b 模型用前文三四 b 的 clive 啊,记住这个就行了,其他的就都 ok 了。那这次工作流也很简单啊,咱们看一下网盘,网盘里面这是三个模型,九 b、 九 b, f p 八和四 b, 这个就是两个 clip, 千万三四比和千万三八比,这是 flex 二的 ve 啊,就这些东西。那今天的视频就到这里,大家有什么问题给我发私信留言,或者加我的交流分享群,我是香酥幻想,咱们下期再见。

黑色领实验室也是猛追猛赶发布了这个四 b 和九 b 版本的可莱恩的系列模型,而且可莱恩系列的四 b 和九 b 版本都对应着一个 b s 模型和加速模型,也就是说一共四个模型, 现在的深度模型其实就已经非常多了,所以这个视频呢,我们在后一部分呢,会看到非常详细的与现在主流的深度模型的对比测试,包含二五幺二模型,包含 flex, 包含 z e m g 以及新出的四个模型,混在一块呢进行对比测试。 先说结论,那么对于真实感的东西,尤其是与人像相关的东西,还是推荐使用 z e mage 模型。如果做风格化的东西,也推荐 z e mage 模型,这是 z e mage 模型的两大强项。 如果想让我们的绘图模型非常的能够遵循指令,我们可以选择二五幺二的系列模型,可以使用赖在 suv 的 加速,也可以使用物理的加速。如果文字这样的东西要为画面主体的话,还是推荐二五幺二模型, q 位以内就是很适合做海报了。 如果追求极端的 tvs, 遵循这种极端场景,我们就可以应用 flex two 模型, 他的指令的遵从度是非常非常的高的,近乎于开源的四号级别。在这一次的可拉印系列当中,四 b 的 被子模型呢,建议直接手撕掉 四 b 带加速的这个模型呢,可以插入到我们日常的使用当中,尤其是对于显存较低的用户,显存再高一点的话,我们就可以用这个九 b 的 加速。 九 b 的 被子模型在很多场景下就有一点特别的过度的用力了,有可能在某些场景下是有成像的, 因为之前我们也测过一些真实感很强的模型,他就是会有这样的一个缺陷,真实感的增强会产生一定的带长的缺陷,尤其是在画面上会有一些奇怪的尾影,或者说过分的用力。 但如果有 z e m g 这样的模型,我们就能明显的明白真实并不是这样的。所以对于 carlin 系列的模型,我只推荐去使用四 b 和九 b 的 版本,而不要使用 base 模型, base 模型加速了反而结果没有那么特别的尽如人意。 z e m g 模型和二五幺二模型都是有强项的, 也就是这一次 carlin 四 b 九 b 更新的劲敌嘛。具体就这个四 b 九 b 的 版本,未来日后能否得到广泛的 应用了,还是得看社区的生态了,但这至少为 flex two 提供了一种可能,也为 z 一 妹子呢提供了一个竞品。那么我其实个人觉得它的 face 模型也不会特别的出彩, 先不说它开不开园,因为有些效果根据我的观察来看的话,就是特步模型,它的深图的速度可以达到惊人的一秒钟,这么快, 非常的快,为 flux 二的推广呢增加了一份助力。接着我们来看到对比测试的工作流,我测试依旧使用的是全球最大的在线 comfy 平台 running hard, 也是 comfy 专家和爱好者们最常用的在线工作台。我这里只去测试它来模型的纹身图的能力,而不去测试它的图像编辑能力。工作流的话,非常的基础就是一个加载的大模型,克里普文本编码器和 ve 的 流程, ve 使用的是 flux, 二的 ve 未经改变,也就是 demo 模型,那个 ve 可以 直接拿过来用,那么文本编码器的话是要分开的,四 b 对 应四 b 的 文本编码器,九 b 就 要对应八 b 的 这个文本编码器。 导航去 running app, 意思呢?这里没有什么特别的,我把工作流也放到 running app 上面,可以在线运行,大家可以感兴趣去测一下。输入提示词设置一下,我们要测试图像的宽高, 最后呢会出一张合并在一起的图像,对于不同的模型生成图像,我都做了简单的标签,不用担心监管,去测就行了。接着我们就来看到非常详细的对比测试的部分,那么一共有二十三组的对比测试, 每一张图像都包含八个结果,如此顺序的进行排列,那么第一行有组,只有依次是二五幺二的 light x two v, 二五幺二的物理模型,二代 client 四 b 的 base 模型,二代 client 九 b 的 base 模型。第二好呢是 z image 模型, flux 二代模型, flux 二代的 client 四 b 模型, flux 二代的 client 九 b 模型,不带 base 的, 就是加速模型了。第一组结果呢,海边涌上人像, 主要是在测试人体姿态的稳定性,腿胯和手部皮肤细节,光影等等。那么 q 问 z 莓和 fox two 之前有一个视频已经充分的评价过了,这一次我们主要的是看到新的四个模型, 四 b 的 face 模型呢,精度略弱,九 b 的 face 模型呢,细节呢,非常的充足,那么充足到甚至到了这个过度,而且这个年龄的话感觉很不对劲啊,容易把人坐老后面我们看到评测也会有这样的状况出现,下面两个加速后的模型,可按四 b 模型,这是加速后的结果,明显的话,肢体出了问题啊。 plan 九 b 模型长出了第三只手,那么这里的话,我们非常能够确定,它继承了 flux two 的 话一贯的风格。这里的 flux two 指的是那个超大体积的图形,如果我要说人像的话,那从以前到现在的话,还是 z image 会更强一些, 尤其是我们看到真实感,还是说风格化。 z image 的 弱项在于它不听话,它无法很好地去解析题。而词 第二组测试是在测试多物体同框的一致性,那么数量呢,不要少,颜色不串的基础之上的材质最好能区分开来。我们来看到题日词,绿色轿车,蓝色皮卡,黑色摩托车,白色厢式车,红色跑车,黄色踏板摩托车。四 b 的 base 模型呢,缺了一位, 当然有可能随机抽卡一下就可以获得结果,但是在这一次测试当中,它确实是缺了一位。可莱恩四 b 模型加错后的模型,这个摩托车显然已经不对劲了。 九 b 模型还算正常,但是这个九 b 的 贝斯模型呢?这辆车感觉有点像是混合的风格,它不像是一个纯粹的厢式货车。所以对于可莱恩这一体系来说的话,它的四 b 模型 贝斯模型呢,尽管未经加速,但它出来的图像的质量呢,是不如这个加速后的结果的。 九 b 的 贝斯模型有的时候也不如这个加速后的九 b, 这确实很奇怪,事实就是这样,简单评测一下,左一列二五幺二模型就是水桶模型,之前我们已经有过结论了,那么 flex two 的 话确实也就是顶级模型, flex two 货车的话就出了问题。 第三组测试,马卡龙圆环主要的还是看颜色分配呢,是否按照我们的指令,包括勺子位置的空间关系,勺子的位置基本都是对的, 大理石台面背景在 klein 体系当中的九 b 的 base 呢,做的是最好的,也是最真实的, 其实都差不太多,对于马卡龙的形态并未做严格的约束要求,所以他这样放也是对的,只是说我们感觉竖着会更好一些。第四组测试呢,洗衣机加电视呢?加猫。这里主要是在测空间逻辑与叠放关系,一台老式的木质外壳的洗衣机, 洗衣机上放着一台老式的 crt 电视,一只橘猫呢,又要睡在这个电视的顶部, 窗帘半透,那旁边有一盆绿植和小板凳,凳子上放着蓝色的杯子。在这个结果当中最离谱的就是这个贝斯模型,他往往会丢失细节,很奇怪。贝斯模型的测试过程当中,我是完全符合要求的, 给到了我的 c f g 和二十个步九臂,在今天的实现来看,他就是过度的。如果说他在加速的状态之下的表现呢,我觉得还是尚可的。如果我们要用九臂的代加速的模型, 凳子底下多余的出现了一个茶杯,四 b 的 加速呢,其实是比较合理的状况。这里唯一不太难用的反而是 bass 模型呢,在 client 体系当中,我觉得不太适用的就是 bass 系列,因为 bass 系列的话它慢了,而且它给我们的效果过度的缺失,细节要不就是过度的过度。 二五幺二是水桶模型,没有什么好说的。 flex two 的 话不太对劲了,这一麦就发挥正常。第四组测试呢,水果碗,那么这里的测试我们要得到的结果当中呢?理解否定提示, 不要在这个果盘当中呢出现相交二五幺二的物理加速,其实出了问题,其他的话均是一种正确的结果。而且我们可以看到这个九臂的结果又更加的趋近于真实了。如果我硬要在可莱恩体系当中选一个的话,我会选这个九臂的 base。 这里的过渡起到了一种真实的效果。 第六个测试,三人雨伞的属性。这个绑定要求的是人雨伞衣服不串色的不太好约,等于是在斩首了, 用这个雨伞呢,穿过了人的头部,没有雨伞会这样的二五幺二体系的也不太行。在这一测试当中,反而最好的是 z e m g 啊,至少雨伞还是合理的。第七个测试呢,走廊玻璃放块五个完全相同的透明玻璃立方体呢,沿着中轴线呢, 一条直线向远处延伸,最正确最为接近的结果呢是二五幺二二五幺二的这个 nice suv, 刚好五个方块走到远处一条直线,然后呢向远处延伸,其他的话是全部不对的。 第八个玻璃罐子,那么这个左边呢装的是这个糖,右边呢装的是这个盐,实际上这里把东西呢和他们的名字呢给倒置了,而且呢装有糖的杯子呢,要放这个粗笔眼里,先看文字,除了四 b 的 杯子几乎都不太对, 那么右侧呢,要是这个粗的颜力二五幺二的这个 light xu v 是 不对的,其他的话都还尚可。那么这个粗颜力是什么样子呢?可能不同的模型有不同的理解,那我个人判断我是比较接受 flex 二的这个粗眼力的。第九个超宽的这个城市场景最喜欢的这个结果呢,就是这个 flex 二代模型的这个结果,它是最棒的,它与其他图像几乎都不是一个风格的东西。迪瑞斯要求有三座特别高的,这个大楼 高于其他的所有建筑物。对了,四 b 的 这个 client 模型就不太对了,需要有桥,这是很明显的要求, 多艘船泊。那么这个 z e 妹子的话没有理解到这个内涵,只有一条,加上远出了两条,其他的话差距不大。二五幺二的话还是水桶模型,到现在来说,我觉得基本可以淘汰掉的模型就是这个四 b 的 贝斯模型。 第十个结果,三个球体,三个立方体,三个金字腿。按这个数量来说的话,我觉得光束必须穿过其中四个物体后再射出, 我个人觉得二五幺二会更好一些。第十三个结果,玻璃加液体加胶散,这里的九臂呢,是要赢的,体积比较大嘛。如果说最符合我的这个要求的是呢, z 魅智的圆杯明显已经不对了,已经漂移了啊。 flocks two 的 这个超大体型呢,是一个最真实可能说我认为是最对的结果,二五幺二有点太戏剧化了。 第十四个测试,如果我们直接去选的话,我会直接去选择 z e m g, 原因也非常的简单,不是说中国人外国人的区别了。 可莱恩二五幺二他们的这种感觉上的细节呢,并不是对的细节。其他模型其实都带点怪异,因为现实生活当中我们的衣服 最正确应该就是这个状态的。那四 b 的 贝斯模型简直是不能理解他为什么会是这样的一个脱离于他这一代母型当中都不太一样的结果呢?他还跑了二十个步。这里的话我在线上和线下都已经测过了。 第十五个,霓虹雨月的文本和水中的文本的倒影,在这个地方二五一二模型拼写的基本是对的。四 b 的 贝斯模型呢,其实少文字了。 九 b 这个地方就对了,哪怕是加速后的四 b 模型也都要强于这一个未加速的贝斯模型。 z 以内着的话,稳定发挥,这不是他的强项啊。 第十六个结果,巴洛克近物测试,在这个测试当中我们能够明显的看到四 b 模型简化了其中的物体,看到提瑞兹,三个银质的酒杯,两个剥皮橙子,一个切开的石榴,四个玻璃瓶,一块折叠的丝绒布, 一条珍珠项链,两本书。除了四 b 之外呢,其他的差距呢,并不大。第十七个测试,贝论楼梯啊, 二维二这一系列结构空间构造呢复杂,而且呢相对比较合理,人物的取作用呢,与楼梯的关系呢,还是比较可信的。四 b 模型更切像线稿,概念图加速版本也是一样的问题,可能是联想到某些特殊的风格了。 flex 给的一个比较真实的结果, z 一 妹子仅仅是给的一个简单的楼梯的堆叠。第十八个结果,头盔加红丝绒加金属盒, 主要是在看这个镜面反射的干净度,材质,金属盒和光影。四 bbs 模型呢,却有细节九 bbs 模型反射的更像真金属, 但是忍不如前面 q 问二五幺二的利落。 z mate 直接没有盒子了,那么 flex two 的 话依旧是稳定发,更像是抵达一级的产物。 四 b。 九 b 加速后,这个头盔的话就已经非常的玄学了。第十九个测试,水下发光的生物。这里提瑞斯就是要求几乎是一个全黑的场景,几乎呢是完全黑暗,然后呢,一个青红色的水母在这个地方,四 bbs 模型直接淘汰掉。 claire 系列对于几乎完全黑暗还是非常有自己的感知的,我认为四 b 的 这个版本就是不错的版本。第二十个测试,唯一聚下来的一个钻戒。 四 bbs 模型呢,更加变成了一个塑料的亮片。九 b 的 bbs 模型要好上很多,但是在微距下的这种锐利的这种程度呢,感知上是不如 q one 的。 四 b 模型加速后呢,依旧不稳定。九 b 模型仍不像真钻, flex two 的 话其实要好上很多, z 一 妹子的话差的明显,二五幺二其实就是偏 c g 的 感觉。第二十二个测试背后的招牌呢,要显示 c t l lights 说这里就人像上来说啊,非常奇怪的是完全没有表明这个人物的年龄。九 b 的 被子模型呢,总是会做出老人啊。 那么文字放置合适的位置,我认为四 b z 妹子和二比二模型都是比较合理的,字的话有可能是看不清,但是我感觉几乎是都没有错误的。 总的来说二五幺二这个地方呢,更像是海报,可莱恩。四 b 却是细节,九 b 的 话直接过渡,左下角的这个 z e 妹子呢,美感度比较高,镜头感呢也比较的强,这就到达了 z e 妹子的舒适区了。 四 b 九 b 的 文本并非强项,还是要回到二五幺二模型第二十三个结果,那么这里的话其实要体现的是一个刺绣,那么这个刺绣呢,应当是什么样的呢?我们可以以二五幺二模行为一个机制,这里是比较接近于刺绣的感觉的。 到了四 b 当中,就更相应是印花贴图,到了九 b 当中,我不能说他不是刺绣吧,就有点过度了, 现实生活中也没有人会印这样的刺绣了。第二行的 z 一 妹子,画面非常的干净,刺绣呢是比较层次上不太足够, flex 当中的刺绣的这种密度呢,也就是礼服的结构呢比较均衡,材质与光照呢,也算是比较的自然,整体我认为还是一个比较中上的水准。到了四 b 这个地方,四 b 就 不对了,这里完全不是凤凰,也不搭边了。

只要你有八 g 显存,就可以使用 flex 二昨天刚刚发布的 clone 四 b 蒸馏版大模型,去生成一张具有复古朋克风格的黑猫海报。最关键的是, flex 二 clone 大 模型还支持图像编辑,跟它说一句,让猫咪戴上粉色墨镜就可以得到这张照片了。 今天来讲 flex 二 client 大 模型,这个是 flex 二系列中最快的图像生成和编辑大模型,它提供四 b 和九 b 的 两种参数, 另外每个参数里还有 base 和 distil 的 两种版本。我们对这四款模型进行了计算速度和使用显存大小的测试,其中计算最快的和使用显存最小的版本是四 b distil 版, 在五零九零显卡上只需要运行一点二秒,占用八 g 显存就可以生成一张图片了。现在呢,跟着我去搭建一下 comfui 工作流,去体验一下 flash 二极速版生图的能力。 首先,打开 runninghub, 搜索电磁波 studio, 点击工作流,找到 flash 二 client 四 b 工作流,点击运行工作流,就可以跟着我学起来了。 进入到 com 以外工作流页面之后,我们先看左上角,这里有个开关,你想运行哪个工作流,你就开启哪个。那我们先看第一个工作流, flash 二 client 四 b 纹身图极速版, 你需要在 load developer model 节点加载 flash 二 client 四 b 大 模型。另外呢, clip 模型选择加载的是千问三四 b 大 模型 v a e 加载 flash 二 v e 大 模型, 你需要按照最左侧的说明,把这些模型文件放到对应的文件夹里就可以了。之后呢,在 text in code 界面输入提示词, fraser client 支持中文和英文提示词,我在这里偷点懒,直接写的英文提示词,大致意思是生成一张具有复古朋克风格的黑猫海报,点击运行,等待一两秒,你就能得到一张特别酷的海报照片了。仔细看一下细节是不是真的超级好。 除了图片生成 flash 二 client 还支持图像编辑。我们先看单图编辑工作流,你需要在 load in mage 节点上传你要编辑的照片,我在这里呢,把刚才生成好的海报照片直接上传到了这里。 经过这三个节点,把上传的图片转成 later, 传给大墨镜进行图像编辑。接下来你只需要输入提示词,我写的是给这张猫戴上特别酷的粉色反光墨镜, 点击运行,你只需要等待一秒钟,就能得到一张戴着粉色墨镜的海报照片了。除了单图编辑,还支持双图编辑,其实很简单,就是把 load image 节点加上这么几个转成 latent 的 节点,再复制一遍,就变成了双图编辑。 接下来呢,在第一个 load image 节点上传一张海报图,第二个 load image 节点上传 com 的 logo。 最后呢,在 text in code 节点输入提示词, 我写的是将图二的 logo 印在图一的白色水杯上,点击运行,等待一秒钟,就可以得到这张照片了。注意看,这个白色水杯上是不是印上了 comfui 的 logo。 看到这里,还等什么,赶紧跟着视频学起来吧!很明显, fls 二 client 这次是直接对标 z 隐内置的。如果你想问,现在我们应该选择 z 隐内置的。如果你想问,现在我们应该选择 z 隐内置呢? 我的答案是,全部都要 z 隐妹子生成速度和图像效果都是一流的 frace 二考拉案编辑模型的速度真的很快,将这两个大模型搭配起来用,我相信你的效率会得到一个质的提升。 如果本期视频对你有所帮助,请关注、点赞、收藏,三点走一波,这里是电磁波 studio, 我 们下期视频见!

hello, 朋友们大家好,我是土豆,本期视频的内容我们将给大家分享 flex 二克莱因这个模型,那本期视频的内容呢,我并没有给大家去跑一些图片素材的演示, 因为我打算在视频内容中在线的给大家去跑素材,给大家去测这个模型,因为这个模型呢,它是非常非常的快啊,官方的一个介绍是我们来看一下,官方的一个介绍是不到一秒钟它就能出一张图片,那算是一个毫秒级的一个出图模型了。 我们本期的视频内容呢,也会做一个合集,我我是做了一个大合集,纹身图,然后图身图以及多图编辑的一个合集,然后放到了我们的 running up 上面, running up 呢是我常用的一个 com 外工作平台,然后没有复杂的一些环境配置,你们直接开箱起用啊,到我的这个主页下面点这个,然后打开以后呢在这边就可以使用。使用方式呢,我这边做了一个开关,如果说你们要用哪一个就把把哪一个打开就行了, 同时呢我这边也会把一键启动的整合包提供给大家,大家拿到这个整合包以后,就直接使用这个 star 的 bat 双击它就能够使用了。但是这个整合包下面呢是不带模型的,所以说你们需要把模型啊下载下来以后,把它放到我们的 comui 的 这个 models 下面, 然后再进行对它启动,不然的话你们在运行这个生成的时候就会出错。稍后呢我会详细的对我们的这个整合包的使用方式呢去做一个介绍。 接下来我们来看一下 runnyhop 上面的一个大合集,这个大合集的一个搭建方式呢,我这边是使用的这个模型加载就是公共的,我会把它存放到这个 set 下面,这三个模型会存放到这个下面,所以说在下面的三个工作流当中呢,我们只需要取啊,取到这个模型,然后就能够使用了, 这种方式呢就是说我在这个位置改的话,下面的啊这三个工作流呢,都会共用这样一个模型,我们来看一下模型加载部分,模型加载部分的这个 clip 模型啊,它的名字很奇怪,是千问三, 他的推理引擎呢是 flex。 二,然后我们来看一下他的官网介绍,这是他的一个拓客,拓客介绍里面呢,他说了该模型是基于九十亿的流模型和八十亿的千万三文本切入器构建的,那这一块大家看完以后呢,是不是就不意外了啊,这个地方是千万三。好, 然后我们在模型使用的时候,大家要注意啊啊,在漏的这个 diffusion model 的 时候呢,我们这块使用的四 b, 那 在克利普加载的时候呢,我们所以说在这个位置也要用四 b, 那 如果说把它换成九 b 的 话, 那这个地方呢,我们就要使用这个千万三杠八 b 的 这样一个 clip 模型,那下面的 ve 呢,就不变,这个是要注意的,否则的话你们会在采集器当中呢,就会出现错误,它的一个张量不匹配的一个错误。 好在呃,这个官网当中呢,他同时也给我们提供了贝斯九 b 和贝斯四 b, 但是我这边的网盘呢是没有给大家提供的,网盘当中呢,只给大家去提供了四 b 的 f b 八和四 b 的 一个技术模型和九 b 的, 然后九 b 的 f b 八 这四个模型,那对应呢是四 b 和八 b 的 这样一个 clip 的 呃模型啊,对应的是这样这样一个, 那大家在使用的时候呢,比如说我这个位置四 b 的 f p 八,大家呢在这块就选四 b, 然后呃九 b 的 话,我们就选择千万三的八 b 这样去匹配,不然的话如果说不匹配他可能就会出错,那这是重复给大家去说了一遍。 首先我们来看到这个大合集当中的纹身图,纹身图的话在 t d 分 辨率选择器当中呢,你们在这个位置去选择,然后在 这个地方呢是提示词在单图编辑的位置呢,上传图片以后,在这个地方可以进行对它呀图片的一些操作。那这个地方我得着重的去说一下,我没有使用千纬三的一个 vq a 的 一个反推那而是使用的这种方式, 我着重的给大家去讲一下这个东西。在这个 clip test 这个编码以后,我们知道是把自然语言编码成我们的张量数据了,而这个张量数据呢,它分了 啊,分了我们的正向提示时和负向提示,所以说呢,我这边呢就把正向提示时使用这样一个节点把它进行了一个融合,这个地方融合的是什么呢?大家可以看这个地方有两个参数,第一个融合参数是我们的 自然语言语言的一个条件条件数据,而下面的这个 laten 的 呢,是我们的参考图的一个数据,这个参考图的一个数据的话,是通过这个 ve 解码出来的一个 laten 的 数据,那通过 这个节点,我们就能得到一个正向的并且带有我们的图片的这样一个条件的数据,给到了 这个彩样器进行彩样。那负面呢?我使用的是一个零化条件,这个零化条件以后,同样的也需要通过它把它我们零化条件加上这个图像的一个数据进行获得一个融合过后的一个副象题的词给到它以后呢,我们这样就能够做到图片参考了, 这样就能做做到图片参考了,那下面的多图编辑了,同样的原理啊,同样的原理, 我们首先要拿到第一张图片主图片的这个正向和负向的这个融合过后的一个条件的数据,然后呢把它跟我们的图二进行融合, 然后最后把它存下来,正负相的融合过后的这个条件的数据存下来,然后丢给我们的传感器当中,这个这个里面的数据呢,就是包含了这两个的这两个的数据,所以说呢,我们在融合的时候呢,它能够保证我们的这两个图片的一致性了, 那这是对工作流的一个介绍,那这个多图的使用方式呢?就是在这个地方写上我们的提示时,比如说让图一手中拿着图二的瓶子,那这个图一拿着图二手中的这个瓶子,我们就能得到最后的这样一张图片了。这是多图的编辑, 单图的编辑的话也是啊,在这个地方写提示时,那这个是工作流的一个使用和它的一个重点地方,我给大家去讲的 好,接下来呢我们来看一下整合包的使用,大家拿到整合包以后呢,解压下来就需要把这个 models 粘贴复制到我们的这个 comewy 的 models 下面,把它粘贴复制进去,粘贴复制进去以后呢直接双击它,然后呢它会自动弹出来一个这样的网页, 这个网页当中呢我们要去做选择,首先选择 u n t 模型,我们使用 f p 八,或者是啊如果说是使用四 b 的 话,我们这个地方的 clip 模型就要选择四 b, 如果说选择 九 b 的 话,我们就要选择这个千万三八 b 的 这样一个 clip 模型,当然呢我们在做第一次加载的时候呢,会很慢,那我这边呢使用四 b f p 八给大家去做一个加载,那这边我直接点击生成, 我们来看一下。好,然后是十六秒,然后我们点击第二次,时长 差不多是六秒啊,它是在五秒钟左右的啊,因为我本地呢也是开了录屏软件,它也会占用一点显存的,那大家如果说在本地去测的话,八 g 的 显存就够了,它的一个速度呢是非常非常快的, 但是在人像上面啊,我个人感觉他是没办法跟这一媒体突破比的,因为这一媒体突破的一个啊,真实感是很强的。那这边的一个分辨率呢,大家可以自行的去做选择啊,这个地方我给大家提供了一个列表,然后也可以点击这个自定义分辨率,你们可以选择他的宽高。 我这边呢再说一嘴的是九 b 的 话,可能在第一次加载会要久一点,第二次的话也是,呃,有热加载的话,我们就是十秒钟左右,也不是很长,单图的编辑我们还是使用那我们已经加载过的这个四 b 的 f p 八。然后我这边呢就直接 比如说找这样一件事情,就是把红色衣服换成黄颜色, 换成黄色,然后我们点击生成,大家可以看一下它的这个产量速度啊,一共是六步的速度呢,也是非常的快,我们就可以把衣服的颜色换成这样一个黄颜色。那这边呢,我们再用纹身图呢去跑一下他的一个海报 啊,这个海报的一个设计稿啊,提示时我们拿过来以后到纹身图当中直接点击生成, 那其实呃如果说我本地跑的话,差不多三秒钟,我是十六 g 的 显存,五零七零太四十八 g 的 内存,然后跑的话差不多在三秒钟左右啊, 然后这边大家可以看一下它的一个中文识别能力还是很差的,但是呢它的一个英文,你看大家这边有一个 happy travel, 也是能够去帮我们去出来的,但是它的中文识别能力呢很差,但是这一 mate turbo 它是能够去识别很好的一个中文的, 那其他的一个效果呢?感觉还是不错啊。海波海报的话,那我们拿到这个图以后呢进行做一个编辑,看一下, 就是把呃故事,我们打上双引号,把故事改成中国, 然后点击生成,看看他能不能把这个故事呢改成一个中国这样一个字样啊,这个中文的识别能力还是不行啊,不行。然后接下来我们来看一下多图的编辑,多图的编辑的话,我们还是使用之前我们加载过的案例, 比如说我们有这样一个人物加上一个产品图,然后我想让他把他啊图一中的人物 拿着图二中的瓶子,然后我们点击生成,就是在双图的这样一个编辑能力下面,他的一个速度呢,也是非常非常快的。 那这边已经加载完了啊,七秒钟左右,七秒钟,那按道理的话采药速度应该是四秒钟左右,那这样一个效果他是能拿着的,但是他的手部细节呢,我测过,不是很理想啊,不是很理想,那这样一个模型的话,他的其实优势就是一个快,然后不停的去做抽卡。 那大家如果说拿到这个整合包以后呢,也可以这样去测测试一下,那这个速度呢?还是非常非常快的。如果说我因为我测试下来,我去用的我的整合包测的话,基本上纹身图的话在五秒以内,单图和多图编辑之前是跑到过三秒 是能够出的。那官方哪个介绍呢?他是说了,我们来看一下,他是用的 啊,五零八零啊,五零,在五零八零和五零九零的这样一个测试纹身图的情况下,分辨率是幺二幺零二四这样一个分辨率,他们测下来的一个结果是毫秒级的,就是说一秒钟以内是能够跑完的。 那大家可以看一下啊,端到端的一个推理速度啊,低到啊,低至不到一秒钟就能够进行推理完, 这是这个模型呢,是它的一个优势。那后续呢?可能会有一些贝斯模型练习练出来的一些 lora, 能够去解决一些中文啊,或者是人物的一个油腻啊,还有他的一个皮肤质感的一个 缺陷啊,我们到时候呢可以看看社区里面有没有这样一个 lora 出现。那本期的视频内容呢?就到这了,如果说大家有什么问题的话,可以加入我们的讨论组进行讨论,或者是在评论区中留言,那么我们下期再见,各位,拜拜拜。

这期呢给大家介绍一些 plus two client 的 一些高级玩法,主要是图像编辑这个模型里面的多多参考一些内容。那么在玩的过程中呢,我发现它其实是可以使用千万的一些节点的,这样的话使用起来会更加的方便。 那么咱们一起看一下,如果是多图参考的话,如何把它的工作流给修改一下。咱们直接把这三个节点复制一下,然后粘贴,粘贴完之后把这控制帧顶直接串联过来,然后把这个再传回给彩样,这就行了,再把这个 ve 传到 v a e, 再上传一个照片,比如说这个小熊,这样的话就可以了,这就是一个简单的双图参考,直接在这里面输入题的词就可以了。那如果是三个图参考呢,也很简单啊,直接再复制一份,再粘贴,然后呢把这个 ctrl shift 再串联进来, 再把这个 v a e 接上就可以了,再上传张照片,直接这样穿帘下去就可以,那么这是第一种方法,但是呢我觉得如果是这样的话,它其实是有点乱的啊,而且呢很麻烦,所以说我就发现了另一种方法,大家可以看一下啊,把这个节点 image edit, 这节点应该大家都比较熟悉,是纤维 image edit 里面的节点,咱们直接把这个普通的 clip 删掉,把这对应的一些节点都连上,然后这 clip 这一些呢就不需要了啊,直接把这个删除掉, 把这个图像传进来,这样就可以了。那么如果是多个图像的话,就直接把这个也传进来,传到图像二这儿就可以了。 这维 e 结码呢,可以把它放过来啊,这样的话更整洁一些,就说他可以兼容这个节点的,那这样的话就非常方便,但是呢他也有缺点,就是他最多支持三个图像,那么如果使用之前这个方法,你可以接着再传下去啊,接着串连到四个,这个都是没有问题的, 这个就看大家如何进行选择了,我是觉得刚才那种方法呢更方便,那对应的工作流已经上传到了 roland hob, 大家可以直接在上面搜索,遇见 ai 就 可以找到。 roland hob 是 一个在线的 cosui 创作平台,能在线编辑和运行工作流,最新的模型也都会第一时间进行更新。 大家通过我视频介绍区的链接注册 roundtable 会获得一千点的积分,并且每天登录都会额外赠送一百点积分。工作流我也放到了视频的介绍区,大家可以在 roundtable 上尝试一下,那么咱们一起来看一下它编辑模型的一些效果。 首先第一个这个呢是一个去水印的工作流,这个直接是上传图片,然后在这写入,把图片中的水印去掉就可以了,这就是一个普通的图像编辑的工作流,那么咱们可以看一下出来的效果, 可以看一下它效果还是很不错的,但是呢,不知道大家有没有发现啊,它其实也是有一些图像偏移的,把它放大看一下,看到这位置还是有图像偏移的问题的,它水印去除的效果还是很不错的, 这是它去水印的一个效果。然后呢再看一下第二个效果,是图像的一个重绘,也就是说二次元的一个照片转成真人,看一下效果,二次元的照片转成真人效果, 这效果呢也是很不错。然后呢第三个是把这个真人转成二次元啊,再提示词写了一个宫崎骏风格,看一下它出来的效果, 效果呢也是很不错。第三个就是姿势惬意,这个效果呢,挺意外的,因为它效果很差,我们看一下出来效果, 然后这个是使用的千问的 kipp, 图片一中的人物摆出图片二中的姿势,可以看下这两个图片,但是呢,他出来的效果并不是很好,可以看一下这四张图都没有很好的展现出来,这个可以看着有点像啊,但是他的腿并不是这样的,可以看一下他这个腿的位置, 把这个挪过来,看一下他腿的位置,其实并不是一样。为了测试呢,我直接出了四张图片,发现都是不太好,所以说他这个功能其实并不太好。 那么我又换了一个其他的姿势,看一下这个姿势,同样出来的也是这样的啊,乱七八糟, 也就是他字片仪的效果其实是很差的,那么我也把他做成了一个谷歌图,传到图形二里面, 直接识别骨骼,看一下效果呢,看一下也是很差的,因为这几个方式呢,我都是使用了枪的,可以跑。后来我说是不是因为这个节点的原因呢,我又给他做了一个副线,然后呢使用这个节点连接起来,发现他也是不能很好实现的,所以说他这个就是模型的问题, 也就是说他这个模型其实对于姿势的欠,一是效果很差的。然后呢,咱们继续,这是个一致性啊,图像一的人物拿着图像二的瓶子展示,这是出来效果, 效果呢也是很好的,咱们继续看一下下一组,这个是三图的,三图也是用的这个节点啊,图片二中的人物坐在图片一中的沙发,手里拿着图片三中的玩偶小熊,然后呢,再看一下出来的效果, 它的一致性呢也是很高的啊,这是三个图的效果,那么如果是四个图的,它就没有节点了,所以说就使用传统这种方式了, 这种串联的方式,现在呢是四个图片,图像二中的人物坐在图像一中的沙发,手里拿着图像三的小熊,然后旁边再坐着一只猫,看一下,出来效果 的一致性同样保持的很好,但是呢,如果是参考物多的话,他的成功率就会降低啊,这个呢是很正常情况啊, 这就是 flash to client 的 一个情况,如果是你只需要两张图的话,我直接把这些删除啊,这就是两个图的一个工作流,总体来说其他的都可以,主要是这个资质迁移不论是哪种方式都是不是太好。

ok, 大家好,我是飞雪,那么这期视频给大家带来的是最新的一个 flex 的 一个 client 的 版本啊,那么这个模型是昨天凌晨发布的,那么其实昨天凌晨的时候我就基本上看到它的一个效果了, 然后这次的话, flex 团队对于我们开源社区的支持力度也非常大,他直接把所有的被子模型都放了出来啊,那么对于我们后续的一个 lara 的 一个 训练是非常有帮助的,因为它本身的模型速度非常非常快,所以我们练 lara 的 话速度也非常快,而且它的实际速度可能比 z major 都要快, 所以的话,接下来可能在一个礼拜到两个礼拜左右的时间的话,整一个模型那个生态会有一个很大的发展啊, 那么前提啊,前提是我们的这一枚角在这半个月中没有开圆啊,那么如果开圆了我们另说啊,至少在我们假定他半个月内没有开圆的情况下,那么这半个月的时间足够把一个 flex 的 一个生态建立的,因为他的训练的 lua 速度肯定非常非常快,因为我们在本地跑的时候,我跑的是一个 九 b 的 一个 f p 八加一个八 b 的 一个都是 f p 八的模型的情况下,基本上是在四十秒左右吧, 那么因为我的配置比较低啊,并且我跑的还是一个相对分辨率不算特别低的一个分辨率的情况下,并且我还加了一些清理显存的情况下,才 需要跑四十多秒。那么如果我把这些清理显存啊,包括我把模型换成一个四 b 的 一个模型的话,那么速度基本上也就在二十秒左右了,那么二十秒左右 是什么概念?一个十二 g 显存的一个配置,如果能跑十二,那个二十秒左右的话,基本上已经回到了我们 sd 时代的一个速度了,那么像很多十六 g 显存去跑的话,那么基本上是会跑到十秒左右了,就 非常非常快。他的一个速度就如果我们跑一个相对低配一点版本的话,可以可能像最快的,你如果用四零九零,五零九零去跑的话是几秒钟啊?那么只需要他后面的 lara, 我 们在社区当中练那个训练出来之后,配合他的生态,加上他的一个生成速度,那么这个模型对于社区的意义是非常非常大的啊。 那么这一次的工作流呢?我已经上传到了 runnyhop 上面了,那么 runnyhop 是 我最常用的一个云平台啊,你们第一次注册的话是会送一千点,每天登录都会送一百点啊,那么刚刚其实已经很多人在我直播的时候已经看过它的一个效果了,但是因为我还在摸索阶段嘛, 所以一开始的操作其实是有些问题的。那么我们一部分一部分开始讲啊,那么首先在纹身图部分呢,那我实话实说啊,它的整体的细节能力是比我们的那个 z major 更强的。你们在开头 demo 当中其实也看到了,但是啊,它对于人像照相的能力的确是不如的, 这个是毋庸置疑的,目前来说没有模型打得过 z e m j 的 一个照相能力好吧,那么在细节方面的呈现能力呢,的确是比 z e m j 更强的,但是呢它的美学能力也是不如 z e m j 的, 所以它需要我们的生态有个支持。对,在社区当中,只要后期它的 laura 出来之后,那么他的能力会很快提升上去的好吧,所以你们不用着急,在人一枚就没有开源的情况下, flex 的 生态是非常非常快建立的,这个是可以打包票的好吧。 然后在单图编辑方面呢,目前跑了一些案例啊,那么如果是单图,其实它整体的压力非常小,就它整体都能完成一些我们日常的一些编辑的,目前来说我没有遇到单图编辑出来会有问题的好吧,他不像我们那个 那个那个千万的那个版本,还需要做一些那个设置才能导致他不偏移,他目前的话生成出来就是没有偏移的好吧, 所以这一点是非常让人惊喜的。然后在双手编辑这一块呢,你们其实也看过一些 demo, 但是呢,你们在使用过程中呢,其实需要注意的,他的编辑能力其实不弱的,甚至说非常强,但是啊,由于他的模型的限制, 我们在使用编辑能力的时候一定要上传单独的物体,比如说我们要让他戴个帽子,那我们就需要把帽子放过来,就单独的一些物体放过来,而不是说我们想要说,比如说这里是一个人,这个是,比如这里是个 那个一号人物,这是二号人物,我们不能说直接把二号人物的头上的帽子那个带过来,那是不行的,他肯定生成不了,他会两个图片会变成一个融合的状态,所以你们在进行这些这些迁移的过程当中呢,一定要是单独的物品把它放上去,那基本上也是没有任何问题的,我们可以看一下, 对吧?哪怕是帽子、墨镜都没有问题的,这我可以保证。然后在三图编成三图的那个编辑过程当中呢,其实方法是一模一样的,我们一定要把物体变成单个的状态,把它放过去,而不是说一张张图 那个完整图片的情况下把它放过去,不然的话他是没有办法识别的。那么实际上呢,他的三图如果只是简单的换,比如说穿衣服或带东西,或者说简单的换一些东西,那是没有问题的。但是呢,我测试出来发现,三图如果是你要把它,比如说 图一一一号人物,二号人物到三号场景当中,那么他的一致性是有问题的,好吧,那么这个一致性问题呢,其实哪怕是在那个二五幺幺的 i o 版本当中,其实我也发觉他也是不行的, 所以这个倒是差不多打平,但是呢他对于整体的颜色的还原度,我认为是比 i o 好 的,我们可以看一下他一个还原度,包括衣服的一些质感上面也是相对不错的,我们可以看一下, 对吧?所以这个模型反而我觉得他的他的目前来说,他的编辑能力是比较让人惊喜的,但是呢,他是有一些技巧的,就是我刚刚跟大家讲的,你们一定要把单个东西放上去,而不是 简单的说放两个人物上去,然后直接让他变成一个,比如说衣服进行迁移,或者说其他的一些东西,那他是做不到的,只要你们掌握一些小技巧之后,他的经营能力是非常强的。好吧? 那么这个其实在最初使的那个 flex two 的 那个版本当中,其实我们也发觉了它的迁移的方法呢,跟我们的那个千万稍微有点不一样,但其实千万的话,你也需要这样子做一个迁移。千万如果你是两个人物让他做一个迁移的话,其实他也是做不到的,对吧?这个这个其实一样的, 那么整体的情况其实就是这样子。那我讲一下工作流当中呢?其实四个工作流其实是一模一样的, 就在至少在加载区这一块几乎是一样的,除非就是有些地方需要加载图片的数量不一样而已。有一些像纹身图是不需要加载图片,其他都是一模一样的。 那么像这边的话是固定的,我建议大家全部用这个模板去套就好了。最多啊最多你们在大模型当中把它换成一个四 b, 我 认为 你们可以自己去调,因为四 b 跑出来之后发觉它的饱和度会稍微有点高,然后四 b 的 话会相对饱和度低一些, 所以你们根据自己的审美审美去挑选就可以了。其他的话我建议你们都不要动,像可立普的话,我们就用一个八 b 的 f p 八的一个模型大小就可以了,并不大的,只有八个 g 左右,所以我觉得压力完全不大。 然后正常这里加载个 v e 就 可以了,模型非常非常简单,只需要这三个模型。然后无非就是在大模型当中,你们选择一个九 b f p 八,或者选择一个四 b 的 模型就可以了。然后在提示这边的话,你们反正跟使用前文道理是一模一样的,输入那个 跟千万道理反正一模一样嘛,你们正常输入一些中文题词就可以了。然后这边是一个分辨率的修改,那么在 纹身图这一块的话,我们的分辨率是通过这边更改的,那么在图片编辑这一块的话,你们需要注意啊,他会根据我们上传的这个图片去做一个最长边的一个生成。那么如果你们不想要这样子根据我们参考图生成呢?你们就需要把这个东西接到这边, 那这样子的话,他就会根据我们设定的一个宽和高去做一个生成了,好吧,这个你们稍微注意一下,其实我这边也写了这个注意的一些方法,因为正常情况下的话,我们基本上就是按照我们原图的一个比例做一个生成嘛,对吧? 那么双图跟单图包括三图,其实他在这一块内容一模一样的,我们只需要注意一下这块宽和高的一个修改就可以了,其他你们都不需要去动的,好吧? 模型还是非常简单的,流程也是非常简单,整个流程其实非常非常简化,所以我搭建其实很快,包括测试其实群里都知道,其实主要是今天二区有点卡,但我早就测试完了。 然后再跟大家讲一下网盘这边吧,那网盘这边的话,这边是一个工作流,也就是我们这整一个工作流工作的比较内容比较多啊,我做了一个纹身单图、双图、三图我全部给他做好了,所以看一下有点庞大,但是其实反正简单是简单,但是我尽量给大家做全了,好吧,你们这样子的话,使用起来像一些新手使用起来会比较方便一些。 那么讲下模型这一边啊,模型这边的话,就刚刚我跟大家讲的一个是我们的那个可立本模型,就是个八 b f p 八的,然后这边的话是三个模型,一个是我们的九 b 的 一个圆模型, 然后这边是一个 f p 八的,你们我们可以看一下,其实四 b 跟九 b 的 f p 八大小几乎差不多,对吧? 我随便你们选择,这个真的没有没有关系,这两个模型最大的区别可能就是色彩上面的一些区别,其他内容其实跑出来其实差别不太大,可能九九 b f p 八的细节会更多一些些,四 b 稍微会少一些点,但就是很细微的差别,好吧。 然后在我们的那个 ve 这块就一个模型,那么其实模型内容就这么点点了,包括我们这些插件其实都不需要设计什么插件,官方你们只需要把康复 ui 升级到最新之后就可以正常使用了,好吧, 那么这些工作流就会这样子啊。那么不管怎么说啊, flex 这一次的诚意还是非常非常足的,包括这一次它整体的速度跟它的能力其实都完全是对标我们的 z e m j 的, 那么 在 z e m j。 没有开元的情况下,我相信只需要给社区一点点时间,整体的生态环境就会非常非常繁荣的,好吧,我们多一点宽容,多一点时间给我们的那个 client, 这个模型。

啊,前面展示的那些效果就是这个工作流生成的,然后这个是一个 flash two glide in 识别的一个换头工作流,呃,它是一个简单的一个基础编辑工作流,然后两个图片输入底膜,就是一个 flash two glide in 识别的一个底膜啊,这个底膜很强大 啊,大家才能实现一个好的一个好的换头效果啊。单啊,除了一个底膜强大之外,还有就是一个提示词的一个精准啊,好的提示词啊,这个提示词虽然简单,但是他经过我一个昨天花了很多时间的调整调试,才有一个好的一个稳定的一个换头效果啊,就是这里 他这个换头的一个效果,你看一下他换头的时候他的头发也会完全换过来,而且,呃,他原来一个黑黑色的头发啊,长的头发,他在那个手臂后面那个头发,他也会很智能的去修除他,你看, 呃,就是这样的一个效果啊,太让人惊讶,太强大了。还有就是呃,他那个皮肤啊,虽然我上面也写上了个自动匹配啊,人脸皮肤色啊,他那个四肢的一个皮肤,这样的话,整体换过来的话,他那个整体的那个肤色就很很 啊,都是统一的整体的,这样就会比较自然强大的一个换头的一个效果,这个底膜很强大啊,当然他的底膜很强大,他换头他他不仅是真人上的一个换头啊,还有就是他这个啊,那个真人和动漫绝世的换头,你看 啊,真人换到动漫绝世身上,还有一个就是动漫绝世之间的一个换头, 呃,还有就是哈,那个变成一种呃,搞怪的一种换头啊,派大星啊?不是派大星啊,是那个,呃,海绵宝宝的一个例子。 呃,就是这个换头的话,它的一个应用范围还是挺广的啊,这是它的一个不同的一个时间的例子,然后你们有兴趣的话,我会把工作流分享在视频简介下面啊,里面有,呃,就是一些动漫的一些提示词啊, 还有一些这些搞怪的提示词啊,在这边。呃,我看一下。呃,搞怪的在哪里 啊?搞怪的提示词在这里啊啊。然后今天的分享就到此为止,谢谢大家的观看。