粉丝9625获赞37.1万

ai 时代,你是不是也总刷到各种鬼畜视频?甄嬛和胖菊齐鬼火,林黛玉端着加特林扫射,这时估计你也脑洞大,开心痒难耐, 只差一个好用易用的 ai 神器。最近阿里千问 app 上线了一个王炸功能, ai 小 剧场玩法的多样化,不输 solo 二,直接把 ai 视频创作的门槛凿穿地心。不仅能让你随心调用悟空、黛玉、川普、钢铁侠等老演员,还能让你和你的导演体验卡已送达。 大家好,这里是超前实验室,今天我们就来聊聊千问,如何让一句话整活成为现实。首先打开千问,依次点击 ai 小 剧场右上角加号开始创作。你可以通过录制为自己生成一个惟妙惟肖的数字版分身, 也可以调用海量现成的经典形象。然后在输入框内告诉 ai, 你 的剧本如果没灵感,官方推荐的神题诗词随手就能用。比如让财神给用户送金元宝,让林黛玉倒拔垂杨柳,李白在一旁作诗。让钢铁侠在古战场淡定吃拉面, 让兵马俑泛朱瘾,吃游客手中的爆米花。让你和你闺蜜在海底打麻将。如果你不想从头创作二创功能,会让你发现新大陆。在 ai 小 剧场的非主流里,看到任何有趣的视频,你都可以点击 ai 翻拍,把人物替换掉一件为我所用。比如刷到三火和特朗普在打拳击的搞笑视频, 动动小手就能一键把三火换成熊二,让川普迎来新对手,一不做二不休。再把这条视频中和科比打篮球的人也换成熊二,还能一键让唱歌的猫咪转行跳舞。 再比如,将视频中的人物换成现代装的蒙娜丽莎。当然,独乐乐不如众乐乐。这时就不得不提及邀请好友这个玩法。即便好友村通网还没有创建自己的数字形象,你也可以发链接蛊惑他授权,然后合拍各种魔性视频 一起整活,让人人都是导演梦想照进现实。先问有哪些黑科技,台上一分钟,台下十年功。据了解,背后是阿里新一代视频生成模型万象二点六的多重能力支撑。首先是智能角色与音色参考能力的大幅提升,你通过手机简单录制一段视频 模型,不仅能复刻你的形象,还能学习你的音色,解决了 ai 整活时形象与声音割裂的难题。其次, one 二点六具有更强的指令遵循能力,更真实细腻的画面质感与美学表现,让生成作品精致度大幅提升,十五秒的时长也为启程转合的小故事提供了空间。最后是多镜头叙述与长视频生成能力。 one 二点六能根据简单的提示词智能拆解分镜头,保持镜头间关键信息一致性。用户无需关心复杂的运镜、灯光和剪辑逻辑,只需专注于天马行空的创意本身。 小白也能轻松上手,一句话总结,好玩上瘾出片,快快喊上你的闺蜜或者上班搭子一起五 g 冲浪体验一下吧!

只是想要一车香喷喷的肉。大家好,这个画里的帅哥就是我 哈哈哈。这个雪人的肚子可真圆啊,别忘了给他戴上我的帽子。这才够绅士。 哇,宝宝你好棒啊。成年人的世界崩溃往往真的就在那一瞬间。 放过自己也是在放过别人。这么近那么美。周末来河北,我在河北省保定市白石山景区等你。

看,下面就是我的复制页,只用豆包刻有一张图片,就能实现表情、眼神、口型、动作完全一致。只需要三步,打开豆包, 粘贴我们已经准备好的提示词,让豆包先生成一张图片。这里选择九比十六,选择人像摄影,再从生成的图片中选一张下载。 第二步,打开同一万象官网,选择数字人角色替换功能,上传自己事先拍摄的动作、表情、视频, 再上传从豆包生成的图片,设置为专业模式后点击生成。生成完成后下载视频就能实现表情、眼神、口型、动作。打开剪映,导入生成的视频, 右键分离音频,然后在右上角选择换音色,挑选喜欢的音色即可。 放香烟就是玩速写员,请用豆包克隆一张图片,三步搞定口型、表情、动作,一比一复制复制人。到时如果你只想要改变服装和柜子更简单,只需要 豆包改图加勾一万下三十秒就可以生成。关注我主页还有更多的 ai 免费工具加玩炸工具,下期见!

秋叶首测,三个超绝的工作流,小伙伴们入门了!康复 ui 有 没有感觉工作流很爽呢?自己搭建出来的工作流或者自己解决报错都能获得巨大的成就感。好了,今天带来三个超强的工作流,外加新手出村的图文教程,六七八尝尝。第一个, ai 漫剧工作流,先看看片 墨法时代,诡异入侵,诡异以人血精华为食,全球人类陷入危机,关键时刻神奇降临, 人类与神明节气便可获得神明。目前的漫剧市场已经突破千万,相信明年这个赛道还是有点说法的。第二个, comfyui 的 full 视频对应音频生成,这个工作流生成出来的视频能够直接对其音频, 是不是大大方便了各位玩家的创作呢?第三个,千万三,无敌分镜加视频生成工作流在创作出分镜的同时,保持画面多角度一致性,还能生成视频。这三个工作流够不够你恰饭呢? 不妨六七八常常显淡。接下来还有康复 ui 的 基本操作。 hello, 大家好,这节课我们一起来学习如何搭建纹身图工作流以及具体参数都有哪些?那么这个工作流我们上节课也稍微了解了一下,不过还没细说, 现在我们就来看一下这其中都会涉及到哪些参数,以及是如何控制我们生成的图像呢?首先我们看到最左边的这个节点叫做 checkpoint 加在其, 那么它是放置大模型的地方,大模型我们可以非常简单的理解为他就好像一位厨师,那么有的厨师做的是中华料理,有的厨师做的是东南亚菜系, 有的厨师做的是日料,不管之后这些参数再怎么调,主体基调都是和我们的大模型息息相关的,那么我们点开来之后,可以看到,有的大模型是真实系,有的大模型是动漫系, 有的大模型是全能系,各有所长,当然除了这几种大模型之外,还有千千万万的大模型, 我们待会会提到,这边我们就先试验一下,比方说咱们先来一个真实系的大模型,接着点击右上角的执行,现在咱们可以看到最终的生成图像,很明显是写实风格。那么如果我们来到 checkpoint, 把大模型替换成一个动漫类的大模型, 随后再一次点击执行,那么此时我们能够明显的感觉到最终的画面呈现出了一种动漫的色彩。咱们讲完了大模型,就顺着 trip point 加载器的输出往后看,那它一共有三个输出,分别是模型输出、 clip 输出以及 ve 输出。 咱们先从它的模型输出讲起,顺着这条线咱们往后看,可以发现,哎,这个模型输出啊,连接到了 k 彩钢漆上,那么这个节点我们可以看到它属于整套工作流的核心节点, 咱们可以把它简单的理解为中央处理器,它就是整个工作流的核心大脑在这个节点里会进行各式各样的运算,然后在 通过解码输出成我们的最终图像。接着我们再看 print 加载器的 clip 输出,那这 clip 输出连接在了两个节点上,分别是这两个 clip, 文本编码器。好,那现在问题又来了,啥是 clip 呀?要解决这个问题, 我们也可以顺着文本编码器的条件输出,哎,我们不难发现,它也是连在了 k 三二七上,那分别一个连接到了正面条件,而另一个文本编码器连接在了负面条件上。如果说有学过 y b y 的 小伙伴应该就知道, 上边的这个啊,我们称它为正面提示词文本框,而下边的这个就是负责输入 负面提示词的文本框,因为它连接的是负面条件嘛。那么什么是正面条件呢?很简单,就是我们想要啥,咱们就输入啥。比方说我现在想生成一个女孩,那么就输入 one girl, 比如这个女孩在森林里,那么咱们就在 one girl 的 后面加一个逗号,紧接着输入森林的英文,也就是 forest。 当然语言这一块有任何不懂的小伙伴,我们都可以打开翻译器,比方说像这一个有道翻译 挺便捷的,我觉得非常适合康复意外。比方说我们想让他翻译一个水手服,那么就可以直接把这个英文给复制一下,接着再粘贴回我们的正面提示词文本框,注意 词汇与词汇之间要添加逗号。 ok, 现在我们编辑好提示词,大体就是一个女孩穿着水手服在森林里,咱们点击执行,可以看到最终图像也是成功生成了, 并且完全符合我们的提示词意思。但是我们可以发现啊,这张图片有非常多的瑕疵, 比方说他的手,或者说他的面部非常的粗糙,确实太多细节了。想要完善这一点,我们会在之后的图片高清修复中一起去学习该如何解决这一系列问题。那接下来我们回到刚才的话题, 在我们知道了正面提示词之后,咱们就来聊一聊负面提示词,那这一个也很简单,就是我们不想要什么,咱们就 输入什么,比如说我们现在啊把正面提示词给输入花园,哎,一座花园,咱们先点击直行来看一下一座花园它能长什么样,我们可以看到图中的花非常的多, 当然我们也可以多生几张,我们可以看到基本上每一张花园关键词所对应的图像花朵都是非常多的,如果我们想让这些花朵的比重 下降的话,那么咱们就在负面提示词这边输入花朵,也就是 flower, 代表着我们不想让画面出现花朵, 输入完之后点击执行,现在可以明显的感觉到图片中花朵的比重大大减少了,我们可以多跑几次,是吧?能够明显的感觉到花朵占比没这么多,但是还是存在,这也正如刚才所说,负面提示词它根本的原理, 我们可以理解为降低提示词的权重,也就是花朵在这一整幅画面中的比重, 但并不是完全消失啊,如果是想要做到完全消失,那么我们可能得提高关键词的权重。怎么提高呢?看到文本编码器, 比如说我现在想提高这个花朵的权重,也就是我想更进一步的降低图片中花朵的元素,那么我们把光标放在 记住词上,然后摁 ctrl 加上键,哎,我们可以看到数字是不是变成了一点一哎,继续摁上,然后就变成了一点一五,一点二,一点二五, 那么这个一点二五这个值,这个数字越高代表着权重越高,大家只要记得快捷键是 ctrl 加上键或者 ctrl 加下,那么就是降低权重嘛,我们可以试一下,对吧? ctrl 加下我们先可以看到后面的数字一直在减小,代表着权重在降低, 比如说我现在啊把这个权重给调成一点六,接着我们再跑一次,能够明显的感觉到花朵的元素占比 非常非常小,已经几乎消失不见了,那么如果我们把这个花朵摁 ctrl 加下,哎,我们降低它的权重,比如说降低到零点五吧,此时我们再点击生成,我们可以看到画面中又出现了花朵的元素, 那这就是正负面提示词以及权重的使用方法,没听懂的小伙伴可以回去多看几遍。接下来看到下边有一个叫做空内存的东西, 哎,啥是内存呢?我们看看它的参数自然就明白,可以看到它一共有三个参数,分别是宽度,高度还有皮尺大小,很明显它是一个控制我们图片比例以及分辨率的地方,比方说高度我们设置为 七百六十八,相当于此时的宽高比二比三,点击执行,哎,那么最终图像也是瞬间就变成了竖屏比例,那么这就是 konlayton 的 作用。还有个皮尺大小 则是控制单次任务会出多少张图片,比方我们把 p 四设置成四,点击执行,那么此时可以看到保存图像这边多了一个交叉按钮,点击一下我们就可以发现哦,一次性啊生成了四张图片。 接下来我们看到 k 采集器,那么刚才我也说了,他就好像整个工作流的核心大脑,负责处理一切事物, 其中它也是有非常多的输入以及参数。首先看到随机种,我们可以把它理解为图片的身份证号,那么相同的参数以及相同的随机种出图会保持一致。 有同学可能还不太理解,我们这边先把 p 四大小设置为一,随后点击执行,哎,我们第一次生图是长这个样子,接着我们再点击执行,可以看到图片立马换了个样。细心的小伙伴可以发现呢, 这两张图片每次生成的时候,随机种也不一样,但是其他参数我们变了吗?比方说关键词我们有改变吗?模型有改变吗?或者狂高有改变吗? 很明显没有。那这就是随机种子的作用,能让我们相同参数生成各式各样的图片。同时只要我们约束随机种,我们也能保持出图的一致。比如说我们看到运行后操作,哎,把它设置为固定,那么代表着我们 生成完这张图片之后啊,随机种子会保持不变。那么既然随机种保持不变,此时我们再点击执行,可以发现工作流直接不动了,那么因为啊,我们的所有参数都没有发生变化,代表着如果我们能跑起来, 那么最终结果也还是这张图片,所以说康复以外会直接不动。接下来我们看到步数,那么这个值我们可以把它想象成 毛巾擦拭一块脏玻璃的次数,哎,很迷是吧?我们的 stupefaction 生图过程啊, 其实是不断的为一张噪声图像降噪,降噪最终生成而成,那么步数也就是降噪的次数,当步数过低时,可能这块脏玻璃还没有擦多少下,上面全是灰尘或者说扭曲的色块, 我们一起来直观的看一下。比方把步数设置为三,接着点击执行,可以看到这段画面,啥玩意啊, 根本看不清。而此时我们把步数设置为七,然后点击执行,可以发现,哎,画面稍微清晰了一点,但是好像细节没这么多。大家想象一下, 我们为一块脏玻璃,如果说只擦七下跟擦一百下,那呈现的效果肯定是不一样的。比如我们此时啊,把步数设置为四十,哎,这个时候脏玻璃上的灰尘基本上都被擦干净了吗?可以看到细节就多了很多,图片的质量也 相应的有所提高,但并不是步数越高就越好,哎,什么意思呢?一块玻璃啊,擦一百下跟擦两百下有区别吗?区别不大,因为当我们擦到一百下的时候,可能玻璃上的灰尘都被擦光了,继续擦下去只是在浪费自己的力气。 我们可以实验一下,把步数从刚才的四十设置为八十,接着点击执行,我们一起来看一下,两者之间的差距会有多大。我们可以发现, 升图时间其实是多了一倍,因为八十是四十的两倍嘛,而我们最终图像的变化连百分之五都不到,所以就显得非常没有必要。因此一般情况下,我们的步数设置在二十到三十之间即可,所以我们这边可以取个中值二十五, 那么下边有个叫做 c f g 值的东西,又是一个新参数,那么它也很好理解, c f g 值越高,代表着我们最终生成图像和关键词越相符, 咱们也可以理解为 c f g 就是 对关键词的约束力,当我们的 c f g 为一时, 则代表着我们约束力非常的弱。咱们的最终图像啊,就好像脱缰的野马,将和我们的关键词 没多少关系,不信的话点击执行,一起来看一下。我们能看到这生成的是一坨啥呀,所以一般情况下 c f g 保持在五到八之间即可,我这边设置为六点五。那么接下来有一个叫采集器以及调度器的东西, 这两个可以简单地理解为图片的降噪方式,图片的生成方式,我们彩样器一般选择的是 d p n p p 二 m, 而调度器我们一般选择 tars, 点击执行可以来看一下生成效果。那么最后还有一个降噪值, 有关这个值的解释我们会放在下节课图生图中再详细讲到。那么我们终于把 k 采暖器的所有参数都讲完了,现在一起来看看它的 laten 输出。那这个东西是什么啊?不太懂哎。我们看到 它后边连接着一个叫做 ve 解码的,而这个 ve 解码的作用就是让我们的 laten 图像能够转变为最终的像素 空间图像。我们可以简单地把这个 later 或者说 later 图像比作一盘刚炒出来的菜,但这菜还没有摆盘看的乱糟糟的嘛,不忍直视。而后边经过微解码之后,哎,这一个 服务员把这一盘不忍直视的菜优雅的进行摆盘设计,最终端在我们面前的就是这一个像素空间的图像,也就是被优雅精心摆放过后的菜品。而其实像这个 layton 以及 lighten 空间,我们也翻译为浅空间,在这里面的图像我们是看不见的,而咱们平时能看得见的所有图像,包括你所看的本视频都属于像素空间。那么关于这一点,咱们了解一下就好。还是来说一下维 e 解码的运用吧。 我们能够明显的感觉到,咱们刚才啊生成的这些画,感觉是不是都灰蒙蒙的,不太对劲啊 啊,没感觉到也没关系,总之啊,他们其实都有点灰。比方说我现在把种子纸给稍微修改一下,然后点击执行,看一下新生成的这幅画,哎,是不是能够感觉到色彩没这么的鲜艳饱满?那这和 ve 有 关, 不同的 ve 会带来不同的解码效果。想要改善这个 ve 节点,先给断开,然后在 ve 解码的这个 ve, 咱们点注拖出来选择 ve 加载器。那之后我们在这个 ve 名称点击一下,可以看到目前一共有三种 ve, 当然有更多的我们可以自行安装。 我们要生成的是动漫类图像,所以选择的是 anime ve, 那 现在我们再点击执行,哎,图片是不是立马变亮了,立马变得鲜活了,那这就是 ve 解码的作用。 好的,那么以上是关于本期纹身图的具体参数以及工作流讲解,下节课我们将进一步探讨 图生图,并用图生图简单的做一个风格转变,那我们就下期再见,拜拜。好,大家好,这节课我们一起学习如何制作真人转动漫风格图片,那其中我们涉及到了叫做图生图流程, 接下来咱们就一起看看吧。那首先我们进入到 com 与 i 的 默认工作流界面后,咱们先把 comlater 这个节点给删去, 之后在 k 太阳器的 later 输入,我们摁住拖出来,接着选择该选项。 v a e 编码器可以看到 v a e 编码一共有两个输入,分别是图像以及 ve。 那 首先看到图像,同样的,我们按住这个蓝色的小圆圈拖出来松手,接着选择加载图像节点。随后我们在 ve 编码的 ve 输入应该连到哪呢?放眼大局,只有一个节点有 ve 输出,那就是 朋友交代其。当我们很迷茫不知道连哪的时候,一个很简单的方法就是红色连红色,蓝色连蓝色,粉色连粉色嘛。不过这个方法并不是绝对的,咱们先连接在 v a e, 那 么我们把这两个红色节点先连接一下,这么一来,我们的图生图工作流就构建完了,是不是 非常容易啊?接着我们看到 k 测量这个参数,但是当时没讲,因为啊,这个参数是针对于 无声图的专属参数。当降噪值为一时,我们最终生成图像将和我们原图一点关系没有。比如说咱们这边先随便选择一个大模型吧,然后点击执行, 我们可以看到最终图片和原图有一丝关系吗?完全没有。但如果我们把降噪值设置为零点, 接着再点击执行,这个时候我们就可以发现最终图像和我们原图哎,有一些相似,那这就是图生图的魅力所在了, 非常直观。最终图像将会根据我们降噪值来以一定程度的模仿各位所 输入的图片。注意一点,当我们降噪只为零时,会发生什么呢?我相信有的小伙伴应该已经猜到了,那就是直接输出我们的上传图片原图,这两者可以说是百分之九十九点九九九的相似,但是它们并不完全相似, 这句话怎么理解?其实啊,我们经过了这一大串哎,可以看到咱们的原始图像是不是先经过了什么 click 编码器,然后又导入到了什么 k 采暖器,最后 k 里哐啷, k 里哐啷经过一顿操作,最终在解码输出为我们的最终图像。而我们的这一个最终图像实质上 是有一丢丢的画质损耗的,但是这一点损耗我们肉眼比较难发现,关于这个知识,咱们知道就好,而当我们需要进行图片参考的时候,我们啊一般把降噪值设置为零点四到零点七五之间, 比如说,当降噪值为零点四到零点六之间时,那么我们的最终图像就会和原图更为近似,而 将降噪值为零点六到零点七五时,比方说咱们设置一个零点七五吧,我们就可以看到 此时的图像就已经有点飘了。比方说,我们把正面提示词书写一个一个女孩红色的头发,随后把降噪值设置为零点五,接着点击执行,随后我们就可以发现最终图像呈现出了一种橙黄色的头发,当然发梢带着点红 是因为我们的原图啊,会尽可能的朝关键词方向去靠拢,但是呢,由于我们的降噪幅度为零点五,所以并不是完全靠拢,只是有那个趋势,我们能够明显的感觉到,而同时我们不难发现咱们这张最终图像是真人,哎,这是怎么回事呢? 说到这个,我们就不得不提到大模型,因为我们这一套工作流输入大模型是这一个真实系写实风格的大模型。那么我在上节课也提到过大模型,就好像一位主厨,不管你加了什么调料,那么最终的菜系 都是围绕着中华料理或者东南亚风格,日料是有一个很明显的倾向的。而在我们这案例中,很明显,真实系大模型最终的图像必然会尽可能的靠向真实系嘛,我们也是借此 来完成角色风格的转变。那么现在我们是不是非常轻易的就把这张图像变成了写实风格?但是他们两者之间还是有点差距,因为这张图片很明显是一个金黄头发。那我们该如何更为准确的把 输入图像来进行一个风格转会呢?非常容易啊,咱们关键词只需要编写一些质量词汇即可。 有同学可能会说, up 主啊,什么是质量词汇?完全没听过啊,哎,我们知道上节课介绍了咱们的正面提示词以及负面提示词作用是什么呢?正面提示词就是想要什么就输入什么, 而负面提示词就是我们不想要什么就输入什么。那如果我们在正面提示词这边输入的是高清极致的细节杰作,完美的五官类似于这些词汇,那么最终 ai 就 会知道,哎呀, 我输入的图片应该要保持高质量,高细节,高清晰度,尽可能的不出现变形的肢体, ok, 那 对于反面题的词也是一样的,如果我们在这边输入的是 模糊、扭曲、不清晰,那么 a a 就 知道,哦,原来啊,他不想要扭曲的,他不想要不清晰的,他不想要低质量的图片,那么最终也是间接的提高了我们的升图质量。所以这边大家可以跟着我一起输入, 咱们先调出一个翻译器吧,杰作,高质量,极致的细节,高清晰度,我们就先写这么多,然后再把这些给复制一下,粘贴在正面体式词。 那么关于负面体式词也一样,我们可以编写扭曲的,低质量的,模糊的。不过有人把这些词汇啊都编写进了一个词组包,叫做 easy negative, 大家可以跟我一起拼 哎,拼到一半我们就可以看到有这个选项,点击一下即可。那么这个东西就是包含着各种各样的负面质量词汇,目的呢,也是为了提高我们最终生图质量了。此时我们再点击执行就可以看到,那么我们的最终生成图像也是尽可能的与原图靠拢,当然我们不满意可以重新生成了, 比方说把降噪值设置为零点四,这样子可以与原图的细节更为贴切,然后再把步数设置为三十,采暖器用的是 d p n p p 二 m, 调度器为 cover, 点击执行。 那这一次是不是细节更为还原呢?当然如果我们继续降低降噪值会发生什么,我们可以一起试验一下,比方说调成零点二五,接着点击执行, 我们就可以发现,由于降噪值过低的缘故,最终图像受到大模型以及其他参数的影响太少太少了,并且还会发生一些变形, 我们可以看到他的眼睛发生了一点点变形,那如果我们把降噪值设置为零点三五又会怎么样呢?一起来试验一下。不出所料发生了面部的变形,当然我们也可以多次跑图来看一下一个综合效果,那这一张也是发生了变形, 所以这就是为什么我刚才建议的临界值是零点四到零点七五之间,这不是没有理由的,因为零点四再往下的话,图片坏图率实在是太高了。 ok, 在 了解完降噪值之后,我相信大家应该已经学会了如何进行风格转变,那么这种转变方法是借助大模型来进行完成的。 如果我们大模型是一个动漫系,又会发生什么呢?来,我们先把大模型给替换为动漫系, 然后咱们再上传一张写实图片,比方说这张吧,接下来把降噪值调成零点四五,随后点击生成。那么此时我们可以看到最终图像非常轻易的被我们变成了动漫风格。 但是我们可以发现生成图像漏了一个重要细节,就是原图它有一个口罩。哎,想要还原这一点,那我们就来到正面提示词, 咱们输入一个女孩带着口罩,随后点击生成,那么现在口罩这一细节是不是被成功添加上去了?好的,那么以上就是关于本期的真人转动漫动漫转真人图生图工作流案例, 我希望大家在本节课中学习到了如何运用图生图以及降噪的具体使用方法,那咱们就下期再见,拜拜!好,就好,这一课我们一起学习细节超清修复。 咱们先看这两张图片,他们有什么不同啊?主体形象是不是一样,但是仔细看就可以发现他们的清晰度,他们的纹理,他们的细节完全不在一个档次。 那么这究竟是如何实现的呢?咱们就打开康复以外,先来到默认工作流,比如说我们只用默认词汇生成一张图片看看,那么不出所料,我们会得到一张瑕疵较多,细节严重缺失的图片, 那么我们该如何对它进行升级改进呢?那么为了让接下来图片更为统一,我们得把种子值给固定一下,接着我们的宽高也稍微设置一下吧,比方说宽度七百六十八,高度我们就设置为幺零二四。 关键词我们替换成一把朝在石头上的剑吧。那么在输入主体内容之前,先要输入质量词汇。注意,我们一般在书写正面提示词的时候,要遵循质量词汇主体加氛围词汇这一个书写结构。那么我们打开翻译软件,输入杰作高质量极致的细节,高清晰度。 然后就是输我们的主体,一把苏格兰长剑插在直头上,荒原背景长剑散发着魔法的光芒。异世界,奇幻世界风格, 真实质感。而我们后面输入的奇幻世界风格以及真实质感就属于氛围词汇。咱们把刚才的这一些给翻译一下,然后再复制到正面提示词,那至于负面提示词,我们还是用 easy negative 选择该选项,点击生成试试看。很明显这不是我们想要的,咱们把 p 四大小设置为十,来筛选一下,比如说这张图片吧,可以看到生成了一把非常酷炫的 长剑,咱们乍一看感觉它哎,还不错,但仔细一看可以发现它非常多纹理细节都有缺失,而我 我们该如何提升这一把剑的整体质量呢?那画面看起来更为华丽,过程非常简单,我们在 ve 解码的图像输出拖出来,按住 shift 键,随后就可以弹出一个搜索框,我们在这个搜索框内搜索作放图像,看到该节点作放图像 比例,点击一下就可以看到,哎,它自动的连接在了 ve 解码的图像输出。接下来我们把这个节点的系数设置为一点五, 相当于待会儿啊,我们希望出图的像素是原图的一点五倍。最后我们要复制一个 k 采暖器,这边我们先摁 ctrl c, 先把它复制一下,然后再点击空白处,摁 ctrl shift 加 v, 此时我们就可以看到 人工粘贴了一个带连线的 k 太阳器节点,那这就是 ctrl shift 加 v 的 意思,带连线的粘贴可以省下我们非常多的,咱们就不需要一个一个的去连接了嘛。那接下来我们把这个 later 给断开,然后豁出一个 v a e 编码器, 大家可以想想看我们这个编码器的图像输入连哪?答案就是刚才的图像按系数缩放的图像输出了,因为我们希望的是 把这一张图像作为参考图片传入到 k 采集器里,但是又不完全是它,因为我们还进行了按系数缩放嘛,它的像素会扩大一点五倍,意味着它有着更多的空间去填补细节 纹理。具体是怎么回事,我们待会就知道。咱们把 v e 解码的 v e 输入连接在 p r 接收器上,随后我们在 k 采集器的降噪设置为零点五,然后把 light 拖出一个 v e 解码器, 同样的 v a e 输入啊,我们也是连在 trip point, 接在其上,最后添加一个预览图像节点,点击执行。那么此时我们就可以看到,咱们第一次 高清修复的图片就这么出来了。放大对比一下,不难看出,我们经过一次放大,图片细节多了非常多,比方说剑柄,剑格,还有剑刃,新增了一些贵族纹理,当然还有剑柄的末端,相比于原来也是新增了一些纹理。 除此之外,石头也变得更有质感了,大家也可以看到,那这就是高清放大的优势所在。基本上,如果我们想生成高质量图片,优质的图片,这一个步骤是必不可少的。如果我们只想上来玩玩,那只用前面的这一个基础纹身图和图生图模块就得了,那很明显我们不满足于此。 我知道啊,有些小伙伴可能会说, up 主啊,如果我觉得这张图片它还是不够精细怎么办?别急,咱们还有二次放的哈。没错,我们还能让这张图片变得更加精细。 但是在此之前,我们回看刚才的工作流,可以发现,节点是不是越来越多了呀?为了让我们工作流看起来更为简洁,我们在空白处右键一下,这里有一个添加组,点击,哎,就出现了一个蓝色的框框,我们可以给这个组命名,比方说基础 生成,那命名完之后,我们先把它放在这里,然后右下角有一个小小的三角形,点击一下拖动,哎,那这样我们就可以把咱们想编组的内容 放进来,方便我们在节点越来越多的时候,区分各模块的主要功能,比如说像我这个组名字叫做基础生图,那么里面放着的内容我希望当然就是与我们最基础第一次生图有关的内容。那同时我们可以看到,只要我们拖动这个蓝色的框框,那么框框内的所 所有内容都会跟着一起活动。又或者我们可以右键蓝色框框这边可以直接停用该组的所有节点,或者直接忽略该组所有节点,当然我们也可以起用组内的所有节点,那这就是组的一个主要功能。同样的,我们为后边这一个依次放大流程,也吸 新增的组别,摁右键点击添加组,咱们就命名为依次放大。 ok, 在 我们整理完之后,我们就来添加二次放大节点,我们双击空白处搜索 alt me s d upscale, 那 么它被翻译为 s d 放大。不过啊,有时候如果我们直接搜索 s d 放大可能会搜不到,所以我建议大家还是输入 alt me s d upscale。 咱们在这我们可以看到也是有非常多的参数以及输入,咱一个一个慢慢连。首先图像必然就是连接在刚才的 ve 解码图像输出上,那模型呢?我们应该连接在最开始的 trip point 模型输出, 我们可以看到这个线是不是要连非常长啊?怎么办?有没有办法可以简化这一根长长的线? 还真有,比方说我现在把这根线在空白位置松开鼠标可以看到这边有叫路由节点,点击一下,那么他啊就是一个小小的转换器,他是个中转站,他存在的目的也非常简单,就是为了 让我们工作流更为整洁,那么我们可以把这个节点当做模型输出的代理人,接下来我们把它的 紫色输出连接在 s d 放大即可。那同样咱们放大看看 s d 放大还需要正负面条件,我们也是把 clip 编码器的正负面条件都拖出来,添加一个 we route 中转转换减点,然后再把它们两个都 拖过来。哎,这样一来我们连接是不是稍微方便了一些?那至于这个 v a e 我 们也是同样嘛,直接拖出来添加 reroute, 然后再连接到 s d 放大上,那最后这有个放大模型需要添加,我们拖出来添加一个放大模型加载器选择默认选项即可。 之后我们可以把这个运行后操作设置为固定,新增一个预览图像节点,我们就可以点击执行了。 经过了一分钟,我们得到了二次放大图像,那此时我们再把它和一次放大图像做个对比,咱一起来看看。首先是二次放大图像,放大之后基本没有较模糊的色块,比如说像这个煎饼的细节非常非常的 丰富写实。而我们再看一下一次放大图片,那稍微往近看就可以看到还是较为模糊的,与我们的二次放大有一段距离。当然如果说我们为了省时间一次放大图片,其实很多时候都够用了。如果说我们为了是得到最棒的图 片,那二次放大很明显会比一次放大要提升百分之十五到百分之三十左右。那有小伙伴可能会说,啊,不如啊, 有没有三次放大?嘿,还真有,我们可以在二次放大的 sd 放大图像输出后边拖出来,摁住 shift 键搜索,使用模型放大图像,看到该节点,那这个节点非常简单,只有两个输入以及一个输出。 我们在放大模型拖出来添加一个放大模型加载器,同样的使用默认选项即可。然后我们在图像输出拖出来添加一个预览图像节点,那么我为了更直观的对比一下最终图像和我们的第一张基础生图, 它们两者的巨大差距。我打算添加一个图像对比节点,双击界面搜索 compare 看到该节点 image compare, 随后把三次放大的图像输出连接在图像 a 选项,那这个图像 b 我 们就连接在最开始的基础生图图像输出, 先添加一个转接点吧,然后再把转接点拖过来,连接在图像 b 上,那这么一来,点击直行即可。 经过一分钟不到,三次放大也是成功跑出来了,注意三次放大的运行时间往往会比这个 s d 放大要短一半左右。咱们先把这个最终的图像对比 给放大一些,方便大家观看,那么我们可以看到这个是基础生图的原始图像,接着我们再慢慢的向左滑就可以看到,哎,变成了三次放大的最 最终,这个细节的添加不是一星半点的,我相信有部分小伙伴最开始啊看到这张原始图片已经觉得哎呀非常不错了,但是此时再把它和三次放大进行对比,那简直是天差地别。接着我们再仔 细端详一下这三次放大图片,我们可以试着放大一下,接下来大家不难发现,无论我们放的多大,图片的纹理都是非常非常的清晰, 我们仿佛感觉到这把剑上的金丝以及铁锈,还有这些石头上的纹理都被刻画了出来,那这就是我们三次放大的最终结果, 成功的把一把稀有品质宝剑变成了史诗品质。好的,那么以上啊就是关于本期的全部内容了,在本期内容中,我们一共学习了三次放大,一般情况下我们只需要用到一次放大即可, 当我们对最终图片质量有要求的时候,才需要用到二次放大乃至三次放大,而这三次放大最终图像大小也是非常夸张的, 足足有一百六十五 n b, 接着我们来看一下它的像素,那么宽高分别是九千二百一十六乘以一万二千二百八十八,大多数场合都用不到这个尺寸的图。 好,那么以上是关于本期的全部内容了,那咱们就下期再见,拜拜。好,大家好,这个视频我们一起来学习 control, 那 这 control 也是整一个康复语言中不得不品的一环,因为它功能实在太强大了,可以实现线条控制、姿势控制、 深度控制、面部参考、局部重绘等等功能,而这些功能目的都是为了更好的去帮助我们进行图片的控制,从而让我们的 ai 绘画 更多可以商业落地的可能性。如果说咱们 ai 绘画一直处于非常不可控的阶段,那么提供的主要部分肯定集中于创意以及设计灵感,但是如果说像引入了 control 键之后,他就可以投入到真正的生产流程中。 好的,我们来到康复预热的界面后,那么首先我们腾出一些位置吧,把可以采暖器以及后面的节点给 活动一下,然后在空白处双击界面搜索 controlnet 空格 a d v, 接着我们选择应用 controlnet 旧版高级, 那么这一个啊就是有关 controlnet 的 核心节点了,接下来我们要介绍的像什么 open pose 啊, line on, soft h 等等 ctrl 内有关模型都是搭载在这个节点上的,而由于我们有关 ctrl 内的内容比较多,所以我们一共分了上下两节课,那么本节课我们就一起来学习能够进行线条控制的有关 ctrl 内模型,那么咱们第一个案例 就是利用 ctrl 内来进行线稿上色,哎,这个过程其实是非常容易的,大家跟着我操作就好, 我们先把这个 ctrl 内应用的输入给连接一下,那么正负面条件当然就连接在文本编码器上吧。接着这个 ctrl 内输入啊,咱们就拖出来加载一个 ctrl 内 loader, 然后在 ctrl 内加载器里边选择 line on, 看到这个选项 sd 一 点五 line on, 那 么这个 ctrl 内它对应的大模型底膜就是 sd 一 点五, 如果说我们用的是 s d 叉 l 的 底膜,那么就得换成 s d 叉 l 的 有关 control, 待会我们再做个示范,咱们就先用这一个 s d 一 点五的 line on control, 接着我们看到下边的图像输入,我们拖出来按住 shift 键搜索 line on, 接着选择这个 standard line on, 也就是标准线稿,那么这个节点的作用啊,就是为了预处理我们的上传图像,把我们上传图像的 图片先加工一下,然后再传入到我们的 control 内核心节点中,所以说我们这个 line on 艺术线预处理器 的图像输入,当然连接的就是我们的输入图像,哎,我们在这边上传一张动漫线稿图, 注意线稿咱们最好上传的是白底黑边的图像,如果说是黑底白边的,我们就直接忽略这一个艺术线预处理器,让黑底白边图像 直通我们的 control 内核心节点即可。好,我们接下来在这个预处理器的图像输出再连接一个预览图像节点,这样一来我们待会就能看到 预处理之后的图像长啥样,然后就是把这个 control 内的正负面条件输出给连接在 k 渲染器上,这个也是非常容易。好的,接下来我们工作流已经构建完毕了,还需要修改的就是提示词以及 k 渲染器的相关参数。还有大模型, 咱们先从大模型看起吧,因为我们要做的是动漫上色,所以说我们最好选择一个动漫线稿图, 动漫大模型,那么这边用的是 primex, 然后我们把这个最终的 ve 解码的 ve 输入啊,我们自己添加一个 ve 模型节点,选择这个,哎,看到了吗? anime ve, 这个 ve 是 对于动漫图像解码较为擅长的, 那么同样的,我们把这个 ve 的 输出也连接在这个 controller 核心节点上,哎,给连过来,接下来我们就可以放心的编写提示词了。那怎么编写呢?肯定就是先输入质量词汇嘛, masterpiece 啊, 杰作,然后就是 high rest 高清晰度, best quality 最高质量,然后我们才编写人物的主体,那么就来一个 one girl 以及火红头发, right here, 红色的头发,然后他有着一双金色的眼睛,那么就 golden eyes。 接着他的背景是大森林,我们可以输入 forest, background 以及动漫风格嘛, animate style。 好的副项提示词,我们还是一如既往来一个 easy negative 选择 embedding easy negative。 这样一来,我们是不是只剩下 k 太阳气了?咱们就把这个迭代步数给设置成二十五步,可以增加部分的细节,然后 cf 值为六点五 彩样器呢? d p m p p r m 调度器窗口。随后咱们摁 ctrl 加 enter 执行一下,看一下我们初次的出图效果究竟咋样。哎,我们可以发现啊,这张图片怎么样?是不是和我们的线稿做到了百分之九十九的吻合? 但是我们能发现个问题,啥问题啊?哎,我们把这张图片给稍微放大一些,怎么回事?这张图片的比例好像和我们的原图尺寸不太对啊, 怎么是一张正方形比例的图片对吧?你看他的手臂以及他的这头顶都不见了,这是怎么一回事呢?那么这边我们就要看到空内存了,那么咱们之前也学过空内存就是控制图像的尺寸,对吧?不过问题又来了, 我们怎么才能知道这张图像的尺寸呢?难不成我们每一次进行类似的生图流程,每画一张新的图片,都需要去查这张图片是 a 啊,五幺二乘七六八,还是幺零二四乘以幺五三六? 查完之后呢,咱们再输入进来,其实非常麻烦,所以说我们需要构建新的节点,新的流程,来把这一过程进行自动化。接下来就跟着我一起操作,咱们在这个加载图像的图像输出后边拖出来,按住 shift 键搜索 size, 也就是尺寸的意思,然后选择 get image size。 注意这个节点是 essential 节点包的,当然也有很多同样功能的节点,比方说下面这一个 stability 节点包的 get image size 也是有相似的作用。好,我们选择第一个,然后就可以看到这样的节点,它是什么意思啊?一共有三个输出嘛,分别是 width、 宽度、高度以及 count 数量。比如小伙伴就会问,啊,啊,不住,我要这些东西来干嘛呀? 你说我们怎么匹配到这空内存的数据上呢?哎,这边我教大家一个方法,咱们在这空内存的节点上摁一下右键,随后看到将控件转化为输入。在这边我们可以发现,一共有转化宽度为输入,转化高度为输,以及转化批次大小为输入。 所以我们就只需要把宽度以及它的高度都设置成输入,就可以和我们的这个获取图像尺寸节点进行匹配。怎么匹配呢?那必然就是宽度对宽度,高度对高度嘛,咱们连接一下, y 连接到宽度上, height 连接到高度上。 这样一来啊,我们每一次上传的图像都能够自动匹配相应的尺寸,从而进行我们的线稿上色流程。 好,咱们构建完之后,再次点击执行,来看一下此时啊,经过了我们自动化流程之后,图片的生成效果咋样?哎,是不是这张图片啊,成功变成了竖屏的比例, 证明我们刚才所做的一切是有用的,对吧?而同时我们也能看到这一张预处理之后的图像就变成了黑底白边图, 这也正如我之前所说,哎,如果我们的基础的上传图像就已经是像这样的黑底白边图,那么我们就不需要这个玉处理器可以直接连接到这了。 ok, 我 们玉处理器在这的主要只能 就是把我们的上传图像给变成黑底白边,从而方便我们的 ctrl n 来进行处理。好的,那么以上就是我们的第一个 ctrl n 叫做 line on, 接下来我们来讲第二个 ctrl n, 它同样也是针对于线条控制, 名字就是 soft edge 软边缘,而不同 control layer 的 流程其实非常的近似我们,其实啊,只需把这个预处理器给替换成 soft edge 的 预处理器,以及把我们的 control layer 模型给替换成 soft edge 模型,就可使用上我们的 soft edge 功能, 所以我们在这儿先搜索 soft edge, 哎,咱们可以看到一共有两个,分别是 s d 一 点五以及 s d 叉 l 的, 我相信呢,有的小伙伴可能对咱们 s d 一 点五模型还有 s d 叉 l 模型的区别不太了解, 我这边简单的描述一下, s d 一 点五用的是五幺二乘五幺二的训练级,所以说它的升成幺零二四乘幺零二四的图片 就会非常的古怪,而因为我们 s d 叉幺是用的幺零二四乘幺零二四的训练机,所以说它可以直出幺零二四乘幺零二四的图片,也就是说它的基础比 s d 一 点五要牢,能够直出的图片细节的上限也更高。好的解释完毕,我们重新回到刚才的 ctrl 点模型,那么在这边因为我们的大模型啊, 是 s 一 点五嘛,所以说我们选择的是 s 一 点五的 off, 接下来我们就替换一下这个预处理器吧,咱们先把它给删去,然后我们在这个 controlnet 图像输入按住 shift 键 拖出来,然后搜索 off。 我 们可以看到一共有两个,分别是 h e d 的 预处理器,还有一个叫做 p d net 的 预处理器,咱一般选用的是 h e d, 然后再把这预处理器的图像输出连接在 control 链上,随后我们再把这个预处理器连接一个预览图像节点。 ok, 这样我们就成功完成了从 line on 到 soft h 的 转变。咱们点击执行来看一下此时的效果,我们可以发现个事,什么事情呢? 上预处理图像是不是和刚才的 line on 区别非常大呀?哎,刚才的 line on 非常的细致,而此时的 soft edge, 也就是软边缘,它是较为模糊,给予了 ai 更多的自由发挥空间,对吧? 那同时呢,我们可以看到它生成出来的最终图像,哎,感觉到效果是不是也挺不错的?虽然说没有非常一比一的还原我们的原始线稿图, 但是呈现出给咱们观众的视觉效果也有别样的风味。而我们这个 soft 软边缘一般匹配的使用场景是什么样的?那就是进行风格转会,或是基于原图的线条特征来对它进行大体不变,细节改变的目标需求。 比方说我们这边上传一张蒙娜丽莎,哈,好吧,接着我们点击执行。嘿,我们现在是不是可以看到成功的把我们的蒙娜丽莎匹配上咱们的正向提示词,哎,我们书写了啥呀?叫做红色头发以及身处森林之中,对吧?怎么样? 我们最终生成的图像是不是非常有意思啊?并且它的整体轮廓和我们的原图是非常相近的,因为我们也可以看到它预处理之后的图像怎么样,保留了我们脸部以及身体上主要的线条特征。但是咱可以发现个问题,什么问题呢?咱们最终生成图像的手指是不是 什么情况?怎么只有四根手指啊?这很明显不对,因为我们都知道蒙德利莎他不是个残疾人吧,对吧?我们来看看一二三四五五根手指。所以说该如何去改进这一点呢?那么我们的下一节课就会提到有关人物姿态控制以及面部控制的 control 类,类型 叫做 open pose, 而不同的 control 内之间是可以同时一起在工作游中运用的。那么除此之外,其实还有其他的线条处理,比方说像 kenny, 而这 kenny 我 一直不太推荐使用。大家可以看一下它们的对比图片,大部分情况下能用 kenny 的 场景,咱们用 line on 即可, 而需要更多的 ai 艺术性,那么我们就使用 soft edge 软边缘嘛。好吧,那么以上啊,就是关于 control 上半部分的内容,我们下节课继续来聊一聊下半部分内容,咱们就下期再见了,拜拜。 好,大家好,我们承接上节课内容,一起来讲一下除了线条控制之外的重要 control 模型。那么首先我们还是从末端节点开始, 一起温习一下咱们的 ctrl net 基础构建,咱先给它腾出点位置,然后双击空白处搜索 ctrl net 空格 a d v, 接着选用这个应用 ctrl net 旧版高级。 虽然说它叫旧版高级,但其实这个节点基本上算是最好用的 ctrl 内有关节点了,那咱们选择了这个核心节点之后,接下来我们就要连接它的输入嘛,正面条件连正面条件,负面条件连负面条件。然后我们在 ctrl 内输入这边拖出一个 ctrl 内模型加载器。 接下来我们要介绍的第一款 control 内叫做 open pose 姿态控制,那么这款 control 内啊可以控制人物的骨骼乃至面部表情。我们先在 control 内名称这边搜索 open pose, 然后选择这一个 s d 一 点五底膜的 open pose, 然后在图像输入拖出来,按住 shift 键 搜索 d w post, 那 么这一个就是咱们 open post 的 预处理节点,我们可以看到它的名字叫做 d w 姿态预处理器,对吧?那么接着我们就在这一个的图像输入加载一个加载图像节点。好的,比方说我们上传一张还是和上节课一样的吧, 蒙娜丽莎,哎,我们想参考这幅画的姿势以及面部表情,那么接下来我们可以在这个预处理的图像输出连一个预览图像节点,待会我们就可以看一下具体的预处理图像长啥样。然后我们还需要规范尺寸吗?那么我们上节课是不是提到了有关尺寸的规范流程, 那我这边再带着大家一起回顾一下。首先咱们输入图像的尺寸咱肯定是不知道的,哪怕知道了我们手动去输入,不断的去调整也是很麻烦的一件事情。 为了自动化这个流程,我们可以在这个加载图像的图像输出拖出来,按住 shift 键搜索一个节点叫做 image size, 然后选择 get image size 获取图像尺寸,那接着我们要把这一个节点的宽高输出连接在 nulllaten 上。为了达到这一点,我们就需要把 空阶的宽高转化为输入嘛。那具体方法我们上节课也提到了,直接右键该节点选择,将控件转换为输入,然后把宽度跟高度就这么哎,水灵灵的变化成了输入,然后再与刚才的获取图像尺寸节点相连即可。 这么一来,我们的基础节点构建就这么完成了。然后咱一起来挑选一个大模型以及正向提示词吧。那至于大模型,我们就来一个摄影写真大模型, 哎,这很明显是一个真实风格的大模型。然后我们正向提示词还是老样子,先写起手势 masterpiece 杰作,然后 high rest, 高清晰度,最高质量 best quality ok。 接下来就写主体, 比方说我们来一个男孩吧,然后他在微笑 smiling, 他 穿着蓝色的衣服, blue clothes。 接着我们再来一些氛围词汇吧,比方说他的背景是 playground 啊,操场背景,然后写实风格 realistic style。 接下来边写负面词汇还是选用 easy negative。 未来我们只剩下这一个 k 采暖器了吧。那首先我们要把这个 control 内的正负面条件连接在 k 采暖器上,随后我们编写一下迭代步数吧,设置成二十五步, 然后 c f g 值为六点五,采暖器 d p n p p 二 m 调度器窗口,接着摁 control 加 enter 快 速生成。好的,我们来对比一下这张生成图像与咱们的输入图像之间的差异。哎,我们可以发现怎么样了, 人物的姿势以及他的眼睛朝向是不是做到了百分之九十九的一致?那么这究竟是怎么实现的呢?很明显是通过我们的骨骼绑定来完成这一空图流程。我们在这张骨骼图中可以看到像人物的肩部宽度 及手臂长度,还有这些手指的具体位置,乃至整张脸的面部表情,眼距、嘴巴动作,全都给咱规定好了,对吧?那么这就是 open pose 的 强大之处。而我们在使用这个 ctrl n 的 时候,一般情况下都会搭配着其他一同使用, 比方说我们上节课是不是介绍了一个叫做 soft h 的 节点,那么接下来我们就一起来学学如何把两个 ctrl n 给串联在一起同时使用, 从而达到更强大的控图效果。那么这边我们先把开散器往后拖一些,腾出一点位置,然后我们把刚才的 control 那 部分咱们先稍微整理一下给移过来,接着 把这一些节点呢全部都给复制一下,摁 ctrl c, 随后我们在空白处摁 ctrl shift 加 v。 哎,这样一来, 我们刚才所复制的所有节点就这么带着连线被我们给粘贴过来了,那么我们稍微整理一下工作流吧。我们把第一个看车内新建一个组, 叫做 c n 一, 代表着一号 control 链,不然待会节点太多可能会造成连线混乱。那么我们把第二个 control 链同样的也新建一个组别,命名为 c n 二,代表着二号 control 链。好,这样一来咱们就可以专心修改一下这二号 control 链里面的内容了。 咱们先把正负面条键给连接在 k 传感器上,随后在 control 链模型这儿选择的是 zone h, 记得模型类型要与我们底模类型一致, 就是 s d 一 点五,那么至于怎么用 s d 叉 l 的 模型,咱们待会再学。接着我们肯定要把预处理器给替换一下吧。我们在这个图像输出按住 shift 键搜索 soft edge, 然后看到 h e d soft edge, 把它的图像输出连接在核心节点上。至于我们的加载图像,用蒙娜丽莎也行,用其他的也行, 但是如果我们要选用其他的图片,最好它的整体姿势要和我们的第一个 ctrl 键点,也就是 open pose 这个骨骼图的姿势相近,不然的话图片肯定会造成错乱。那么具体我们待会再演示。 先刨一张正确的图像吧,我们在关键词这边最好稍微修改一下,因为有 soft edge 缘故,如果让男孩变成长发就看起来有点怪怪的,所以说还是改成一个女孩。但是它的发色我们可以自行添加嘛,比方说来一个绿色头发 green hair。 好的,我们接下来就直接点击执行,我们一起来看看。哎,咱们可以发现这张图片的线条,比方说我们可以看到它领口的这个位置,还有这个披肩的外轮廓,都是和我们原图,也就是蒙娜丽莎的服装轮廓大体相似。 当然如果我们想让咱们这张图像的线条细节与原图做到百分之八十甚至百分之九十的近似的话,那么我们只需把这个 soft 软边缘给替换成线稿 control 内模型即可。 当然预处理器摇晃,那同时我们也可以看到咱们最终生成图像的手指以及面部表情,还有他眼神所聚焦的地方,都是和我们原图高度近似的,虽然说这张图片看起来笑的很诡异,那是因为我们提示词里面加了一个 smile 对 吧? 如果我们把这个提示词给去掉,接着再跑一次的话,我们就可以看到这张图的笑脸肯定会变自然很多,对吧?我们可以发现是不是瞬间变严肃了。 那么我们在实际的使用过程中,可以用咱们的 open pose 姿态控制来规避坏手或者坏脚的问题。 当然如果说你生成了图片哎还是坏手怎么办?那么我们就做一次高清放大,只不过与咱们之前所教的不一样,加入一个刚刚建立的姿态控制镜里边即可。好, 那么接下来我们来讲一下下一个 control 内,我们先把一号 control 内给忽略,这样他们就不再发挥作用。咱们在二号 control 内这边 先替换一下相关模型,我们呢用的是一款叫做 deep 深度控制的 control layer 哎,那么这一款 control layer 它的主要作用就是可以保持生成图片与参考图片的空间关系一致,那具体是什么意思?我们接下来慢慢看。那我们先把这个预处理器给删去,然后再 在图像的输出搜索一个节点,叫做 d e p t h dips, 选择这一个 z o e dips map, 也就是 z o e 深度预处理器。那接下来当然就是把这个图像输出连接在核心节点上,然后再把这个预处理器给连接一个预览图像节点,这么一来咱们的 dips 就 构建完成了, 只需点击直行就可以看一下具体效果。好的,那现在图片也是生成了,我们一起来看一下,小伙伴肯定会觉得,哎,这张图像好像和之前的跟真的也没什么太大的区别, 我们来看看这一个黑白图,就是经过 z o e 深度预处理之后的图像越亮的地方则代表着离咱们镜头越近,那 越黑的地方则代表着离镜头越远。而我们的 tips 就是 通过这种方式来识别咱们原图的空间关系。我这边可能人物体现的效果不够明显,怎么把它给替换成一张教堂大厅?那同样的,我们要为规范尺寸的这张上传图像也设置为教堂大厅, 然后点击直行, ok, 我 们可以看到现在这张图片是不是非常明显的一种空间关系,我们可以看到教堂里的一排排椅子以及 他们的窗户都做到了与原图高度一致。那比方说我们现在想生成一张紫色的教堂图片吧,那么就把关键词给替换一下,我们直接开启翻译,然后输入紫色的教堂神圣风格, 真实质感, ok, 把这些词给粘贴进我们的正向提示词文本框内,随后直接点击执行,我们可以看到此时的教堂非常完美的变成了另外一种风格, 那么这就是 tips 的 一个运用。而在我们的实际工作流程中,像刚才介绍的这一个一号 control 内,也就是 open pose, 还有此时的二号 control 内,也就是 tips, 这两个 control 内啊,算是非常通用的。也就是说,基本上无论你是做什么案例,只要你的目的是为了参考某张图片,那么基本上都可以带上这两个 control 内,以确保更多维度的去约束我们的生成图像。而这张 control 内,我们可以思考一下它们是不是都是属于 空间关系,哎,控制的都是我们图片的空间关系,而在我们的后续案例中,可能会频繁使用这些 ctrl 键,所以我们最好把它们给保存成个工作流,方便我们每一次的套用。那么怎么保存呢?看到左上角这边啊,我们点开工作流三个字之后,可以点击保存, 那么这样一来,我们就可以在这个文件夹,也就是工作流里边看到刚刚保存的工作流,点击导出, 然后咱给它编几个名字吧,比方说 controlnet, 接着我们就可以看到这么一个文件,那具体它该怎么使用呢?比如说我们现在新建个工作流吧,点击浏览模板,然后选择默认工作流,如果我们想套用刚才的工作流程的话,直接把刚刚的追悼文件拖进来,哎, 咱们就可以看到自动加载了我们所保存的工作流程。好的,那么以上就是关于本期的 ipad adapter 吧,咱们就下期再见!拜拜!

新型 ai 工具,千万带你玩转 ai! 最近啊,咱们的网上出了一款全新的 ai 工具,它是阿里巴巴集团研发的,它同时拥有 beautiful、 豆包、吉梦三款工具的功能,非常的强大,而且呢它最近更新了一个二点五的大模型,所以说现在呢非常好用, 我也是抓紧时间把它学习了一下。今天呢,我就出期视频给大家讲一下咱们千万工具里面的最基础的一个功能。好了,废话不多说,我们直接进入教学。 首先呢,我们这边先来把我们的千问工具给打开,打开千问之后,我相信经常使用豆包和 d f ck 或者吉梦同学,你们应该能发现咱们这个界面呢,看起来是不是非常眼熟,有点像豆包,有点像 d f ck, 当然了,它还有我们吉梦的一些视频生成功能,我们点开 右上角这个标志,你们记住点开你会发现这里面的功能呢,跟吉梦啊非常相像,有这种生视频的,有生人像的,有生动漫的,各种各样都可以生,无论你是做图片还是做视频,都是可以用我们的千问一键帮你做的。而且呢我今天要给你们演示的功能就是做视频,我们在下方这里点击开始创作, 点过之后你看上方呢有两个选项,一个是 ai 生图,一个是 ai 视频。 ai 生图顾名思义就是我们可以一句话改图,也可以直接输入文字,让咱们的千问帮咱们去凭空生成一张图片,那具体应该怎么做,我给你们操作演示一遍, 咱们这次呢就不打字,这里有个语音按键,用这个更加方便。打开语音,我们按住直接给千问进行对话。 千问,你好,请帮我生成一个小狗在菜地里种菜的图片。好的,我们这边去提出咱们的一个要求,发给千问,千问这边呢就会帮咱们去生成图片, 而且它的生成速度呢,一般来说呀,也是比较快的,大概呢也就一到三分钟,一口气会帮咱们做四张图片,待会四张图片哪一张效果好,我们就选哪张就行,来看一下,这是第一张, 这是第二张,这是第三张,这是第四张,怎么样?是不是非常神奇,凭空就帮咱们用文字生成了图片了对不对?那现在学会第一个功能之后,咱们紧接着学习第二个, 第二个才是我们的重头戏,因为第二个呢是可以用 ai 帮咱们把一张图片去变成视频的,下方呢,点击这个 ai 生视频,就是我们刚刚刚刚的那个玩法,点一下, 点过之后呢,点击开始创作,咱们这次选 ai 视频玩法导入图片,首先呢把我们手机相册里面的一张图片,你给他导入进去, 图片导入过之后他会识别,然后会智能的帮咱们推荐效果,这些效果里面如果说有你喜欢的,大家可以直接用,你要是没有的话,你自己呢打开语音自己去描述就行了。那我这边给你们演示一下 谦问,你好让照片里面的人物抬头给我们打个招呼,然后低头继续写字。好的,这边去提出我们一个要求发给谦问。谦问这边呢,他首先会进行思考,他如果说这边有这个标志,说明他正在思考中,等他思考完成之后,你看 就会帮咱们用他这个万象二点五的模型帮咱们去生成视频,生成视频的时间已经帮你们算好了,两到五分钟左右对不对?每天呢有十次免费机会,所以说大家如果说你刚刚使用的,我建议你呢把这个机会把握住,每天去做十个视频也是非常不错的。那我们现在耐心等待,等 等视频做好之后,我给你们看一下视频效果。好。同学们,我们的视频已经做好了,你看一共是一个五秒的视频,现在呢我们打开看一下,有没有按照我们要求帮咱们去把这个照片变成了我们想要的视频,来大家一起欣赏一下。你好让照片的人物抬头给我们打个招呼, 哎,你看怎么样?他抬头给咱们说过话,然后呢还又继续帮咱们写字了,怎么样?是不是非常真实?他顺便呢帮咱们呀,把我们的这个语音呢也输入进去了,让我们的人物也学会说话了,非常的真实,对不对?那稍后呢,我会把这个视频放到结尾,给大家去详细的看一下效果。 你们今天如果说学会了,老师我教你这两个技巧之后一会呢就可以尝试一下,请问你好让照片的人物抬头给我们打个招呼。

千万 app 上线 ai 小 剧场玩法,国内首次实现角色合拍能力,用户可轻松与朋友或名人同框出演 ai 短片。千万 app 推出了一项名为 ai 小 剧场的全新玩法,引领国内 ai 技术进入新的应用领域。 通过这项功能,用户不仅能创建自己的专属数字分身,还能与好友或平台内的公开形象共同出演由 ai 生成的短片。 只需输入一段简单提示词,千问 app 便能自动生成剧情丰富、多镜头切换的 ai 短剧,并同步匹配台词和音效,为用户提供前所未有的创作体验。这一创新功能不仅提升了用户体验,也为短视频创作开辟了新的可能性,或将重新定义用户与 ai 之间的互动方式。

先看 vcr, 这个是我在千万里面跟动物城做的一个互动视频, 怎么样?真的想不到 ai 已经进化成这个程度了吧?你还在用 ai 套 ai 公式做视频的时候,千万已经可以自动生成视频, 唱歌跳舞各个形式都可以。最近千万新上线的阿里万象模型真的强的可怕,咱们首页找到 ai 生视频,郑欣文同款动物城的模板,上传自己的照片就可以了,视频很快就能帮咱们生成好, 怎么样?就连最近很火的 ai 禁止 ai, 采访 ai, 千万马上就能帮咱们生成。给大家看一下我生成的家人们,我强烈建议禁止 ai, 还禁止吗? 上面还有海量的热门精美特效模板,直接免费使用。我刚把生成视频发给我室友看,我室友以为是我真的去拍了,这个效果真的很牛,而且是零成本,姐妹们赶紧去试一试。

千万 app 上线,玩二点六视频生成模型上线国内首个 ai 小 剧场玩法,想演什么就演什么,在这里你就是主角, 所有角色听你指挥。在这里你就是导演, 想和谁拍就和谁拍!在这里你就是大咖! 千万 ai 小 剧场,满足你的万千奇思妙想, 心中好戏,人人开眼!

最近这 ai 二 c 赛道乱成一锅粥了啊,先说豆包啊,豆包呢,有先发优势,抖音创作者的一个庞大的生态优势,然后是元宝它的流量入口优势,卫星生态优势也是非常强的。 这么一来呢,这个灵光千问他作为后发者,其实挑战难度是非常大,首先就面临一个获客成本高的一个问题啊,动辄就是几十上百。这个去年 ai 六小虎烧钱大战的时候,我们也都见识过了,这钱烧的很快,经不起烧啊, 那怎么办呢?这后发者肯定得想妙招巧招啊。昨天我发现这个千问 app 推出了一个叫 ai 小 剧场的一个功能,就在那个输入框的上面啊,往后拉有一个按钮 进去呢,有很多那个短视频的模板里面呢,有圆圆啊,洋洋这些花旦小鲜肉撒狗粮的一些片段。那用户呢,就对着镜头念一句话啊,他你就有个脸的一个框,你给你对牢了,你念一句话, 他呢,根据你的长相和你的声音啊,就能生成一个手搓板的一个数字人,然后就可以你用这个数字人啊,去替换掉短视频模板中的某个人物,比如说某个偶像剧的一个 场景,我呢,就把我把那个小鲜肉给替换掉,变成我跟那个软妹子在那恩爱了,对吧?那这个还是比较好玩的啊, 呃,至少我做了之后呢,我比较愿意分享到这个群里,跟兄弟们乐呵一下的。那当然,也不是每个模板都很真呢,毕竟他是个简易的一个数字人,但确实有几个呢,效果不错,也挺好玩的, 比如这个啊,这味道真能下咽吗? 妙哉妙哉呗。那 ai 小 剧场对千问 app 的 价值是什么呢?那就是我刚才讲到的,它其实有很强的一个自传播的一个能力,大家会通过社交渠道去转发。 哎,朋友们看了好玩就会问啊,你这用什么做的?是用千问做的,如果这个运营成功的话呢,其实加上一定的转化率,最后的成果应该是非常可观的。 呃,用产品的能力去拉新促活呢,这是聪明的做法,也是长久之计。

不是千问,你又又又背着我偷偷升级是吧?升视频功能,视频最大长度提升至十五秒,终于不用再被五秒限制卡住!创意微电影也能自由发挥剧情了!全新万象二点六模型强势上线,一次生成即可输出多镜头画面,转场丝滑,节奏稳当,故事感瞬间拉满。打开千问 app, 点击升视频 功能,然后直接语音输入你的剧本想法,不一会成片就自动生成微电影成片周末去吃火锅不?必须去,还要加双倍辣! 一言为定,无需剪辑,不用拼接,连镜头逻辑都帮你理的明明白白。关键是这一切还是免费的!文字拍电影的时代真的来了!你就说给力不给力?

走你!最近你有没有刷到过这种视频?就是两个完全没关联的人,突然同框开始对话,看着特别像平行时空才会出现的画面。他已经不是传统的拍视频模式,而是利用强大的 ai 能力,把真实的、虚拟的,甚至不存在的人都拉进你的视频里一起玩。 别让司马懿看穿了,气氛燥起来。大哥,我来了, 这可比骑马快多了。我叫技能五,我叫紫琪,我们的组合叫技能吴紫琪。我最近在用的是 千问 app 里的 ai 小 剧场,可以一句话生成 ai 大 片,就是不用剪辑,不用配音,直接生成一段两个人互动的视频,或者你能想到的任何创意场景。这些画面能跑的这么顺,是因为背后用的是万象二点六,他会一次性把画面和声音都给你生成好,你只用管一件事,想创意或者拉谁进来一起玩。 这个玩法其实特别简单,只要一句话说出你的脑洞,既能让你的数字分身拍大片,也能让你选择不同的角色在同一个画面里互动。比如有这些玩法,你把贾宝玉拉进来,再换成容嬷嬷,整个画面的味道立马就变了。同一张图 换一个人,效果完全不一样。除了用自己的形象,你还可以邀请你的好朋友拍同一个 ai 大 片,想拉谁进来,你自己决定。那我问你一句,如果是你最想拉谁跟你一起拍,一段评论区告诉我。

有没有想过不用买机票,,不用等雪季,也能一秒闯进圣诞乐园,,和会动的雪人一起跳舞?? 我这些圣诞大片啊,全靠一个 ai 神器,阿里千万 app 真冷啊,没去拍过,全靠它换进去的。 操作呢,也是巨简单,三步啊,就能把你自己啊送进任何的场景里。。首先第一步啊,在千万 app 的首页就能看到那个神奇的 ai 升视频入口,然后啊,上传你的一张清晰的照片,比如一张普通的半身照,设置好你要的比例、时长、清晰度。。 然后呢,才是魔法时刻,用文字告诉 ai, 你想要什么。你可以照着这样说,,请把我换到夜晚的圣诞主题乐园。我穿着红色毛衣,带着绿色围巾,身边要有发光的圣诞树,微笑的雪人和经过的麋鹿。。天上飘着雪花,而我呢,,在雪地里轻轻转身,朝镜头挥手。 接下来, ai 就会智能的识别出照片里的你,把你稳稳的抠出来,,天衣无缝的放进那个梦幻圣诞夜里,连动作和飘雪的氛围都给你一起升升好!不用懂剪辑,更不用真的跑去哪搭载万向二点六大模型的千闻 app 啊,让你心中的创意落地。 而且啊,他是免费的,你敢信一张照片,一句话,你就能出现在任何想象的画面中??如果你也想生成自己的圣诞奇迹,只要在评论区留言圣诞,,我就会把这条详细的指令模板发给你。你只需要替换穿搭和场景关键词,专属你的奇幻视频啊,立马就能到手!!

疯了,全网都疯了,上千万人在玩抽象。房价太高,作诗都难写进人间剧,买不起一间屋。 这星空该属于沉默的战士,朕的兵马怎能蓝瘦香菇陛下美阿里千位新上线的 ai 小剧场,彻底把 ai 视频的门槛给踢碎了,而且操作简单,免费使用,一键生成片子!下方点击 ai 小剧场。 再点击右上角的加号,点击艾特,找到一个喜欢的角色,然后输入你的想法。 还可以艾特另外一个角色,让他们两个一起出演剧情。想法输入完成,点击开始生成,本次生成使用万象二点六模型,好看效果,你看,月亮本来就是一朵向日葵。 你酒驾把天象都带歪了,你就只管脑洞大开的提要求,点一下按钮,几十个热门角色就跨次元表演段子了,这么好玩的功能,赶紧用千万去试试吧!!

大丈夫身居天地之间,岂能郁郁久居人下?大丈夫之志,应如长江东奔大海,何苦怀恋于温柔之乡?现在这视频效果真不输影视大片了,下面上交称,打开千问爱吧,点击爱生视频,再点开始创作。先导入一张曹操图片 这里选择万象二点六专业版,它是阿里目前最强的多模态视频模型,支持多余种音画同步,清晰度选择超清,时长选择十五秒。店这里可以用语音输入提示词下面看下效果。 若天下没有我曹操,还不知会有几人称帝,几人成王,有人见我权重,怀疑我有一心,我所做一切都是为了汉室, 你们谁人能懂我心?下面再演示一个双人对话,上传双人图片这里时长选择十五秒语音输入提示词,看下效果。你到底喜不喜欢我?三年了,你准备什么时候娶我, 再给我点时间,等我办完这件事,拿到钱我就回来娶你。我最服的是视频会自带环境音效,比如这个汽车的声音,同时会自动给我们匹配 bgm 音效完美融合,是不是非常真实,每人都能体验当导演的快乐。另外,这个在创作页面中还有大量创意视频模板,有自动对口型、变瘦、变疯狂等多种热门特效玩法,免费玩,宝子们快去试试吧!