我敢说让位这四点五是全球目前最好的视频模型,但是不知道为什么国内用的人不多。这四点五真正厉害的就是展现的是连贯的去式逻辑。我们只需提供一张图片,我们随便写一些提示词点生成,多出几个你想要的镜头。 这里不需要太多花哨的提示词,细节是由我们的参考图定义,根据参考图生成出来的人物场景,看风格一致性还是很不错的。 我们挑选好想要的图,现在我们将图片动起来,我们前往视频按钮,并确保选择的是帧。四点五,把刚才生成好的图上传过来,提示词可以不加或简单的提示词就可以。 接下来就是合成一下之后,我们会得到这样的成片,一个人就是一个制作团队的时代真的来了。
粉丝2.8万获赞19.3万

现在只需要创建一次角色, ai 就 能牢牢记住他的形象。你可以随意生成不同角度、不同场景的视频,并保持主体形象高度一致。先来看一个大佬级案例, 华纳音乐和无志气共创的 ai 侠女 mv, 整个视频全程不变脸,背后的关键是用可灵主体库来锁定角色特征。下面就教你用可灵做出可长期附用的一致性角色。 首先在 maker 里创建一个角色形象,确定基础五官、年龄、风格特征。接着进入可灵模型,选 o 一, 先给这个角色生成多角度参考图, 继续添加主体,把刚才准备好的角色图按不同视角依次上传,填一个主体名称标签。选人物描述可以先用智能生成,再根据你的想法调整细节。到这里,一个稳定的主体形象就创建好了。 之后你只需要在生成视频时选择这个主体,无论换角度、换场景、换动作,形象都不会跑偏,快去试试吧!

二点九八版本更新,这次更新对智能识别资产逻辑进行了优化,同时新增了几个功能,由于最近不少用户在热诺 a 参考音频上碰壁,这里我特意修改了一下识别上传的规则。先说新增功能,功能开关里面新增了一个智能润色提示词开关,这开关打开后会在上传完提示词后去点击一次热诺 a 自带的 ai 提示功能。 由于人太多了,忘记之前是谁给我提的这个建议了,这次顺带加进来了,不过大多数作剧的应该用不上这个功能。接下来是智能识别资产菜单里面新增了一个全任务首位上传和首位即梦按钮,因为全任务一键上传老容易把下面不需要的角色图识别进来。 新增的全任务首位上传点击过后是指识别第一段落里面的提示词对应的资产,只要换行过后,下面的提示词里面的资产都不会去识别, 比如我这个提示词就只会识别这第一个段落的提示词。张三,比如我在这里加入这个王二的图片,如果用全任务一键上传,就会把王二的图片也识别进来,但是用新增的全任务首位上传,就不会识别除去第一个段落以外的其他提示词的资产。 同时本次还修改了识别资产的上传逻辑,之前的版本是先提示哪些任务,视频、音频、图片超限,但是不会直接上传进来,现在是先把资产上传进来,如果不把多余的清空,则无法开始任务,使用起来更加灵活, 因为热挪 a 不 支持直接使用音频,必须用插件自带的格式转化功能后才能识别音频,我这里只需要把这个音频文件移除即可。正常开始任务 可以看到这个王二是没有被识别进来的,这就是新增的首位上传公功能,配合插件自带的资产标记功能,无需按就能完美解决人物一致性的问题。全任务首位极梦按功能则是给极梦用户使用的,保留了首位上传的功能和极梦的按功能,只按第一段落的资产 确定没问题后就可以开始执行任务了。出现这个页面是正常现象,点击确定关闭插件后,再点一下激活就好了。这是网络波动引起的验证失效,如果激活不成功,可以检查一下本地网络,或者关闭浏览器后再进来激活一下,现在就可以正常执行任务了。

如何保持这种真人短剧里的人物形象一致性?这是做短剧时必须掌握的一个基本功。方法其实很简单,就是先创建一个固定的角色资产,利用这个自由设计画布, 输入下面这段提示词,选择最新的深图模型 g p t image 二,很快就生成了一张人物影视定妆照。 接下来,在这张人物图的基础上,继续输入人物三式图提示词,就可以得到一张人物三式图。为了后期视频效果更清晰,还可以点击上方的高清按钮,把它高清处理成四 k 版本。 你看,有了人物的脸部特征,正面、侧面和背面,这个人物的整体形象就基本固定下来了。你还可以给同一人物换上不同的服装,方便在不同场景中进行调用。 后面做短句时,我们就可以反复使用这套人物角色资产。比如把人物三式图和空境画面结合起来,生成有人物占位的分镜画面。 如果想要更多角度的分镜画面,也可以在图片上方点击多角度功能,调整主体角度和相机角度,快速得到不同视角的分镜图。 最后再把这些分镜图转成视频,或者直接用人物三式图加空境画面生成视频。 核心就一句话,先固定角色资产,再反复调用同一个人物去生成不同的视频片段,这样真人短剧里的人物形象一致性就能保持住了。你学会了吗?快去试试吧! 爸爸回来了?嗯,爸爸回来了,咱们吃饭去。学校今天又发消息了,培训费这两天该交了。 这一杯熬过深夜,天亮了,生活还得继续。

插件最新兼容了热诺艾的自动脚本,有需求的自行测试。首先打开插件,创建一个剧本,然后点击剧本导入,把 提前准备好的 tst 或者 excel 剧本导入进来。如果你不知道导入什么格式,可以点击右下角的剧本模板导出,选择一个 tst 或者 xlsx 表格模板导出,对照着放提示词就行,我随便导一个 tst 的 模板, 然后格式的话就现在这种剧情一剧情二,剧情三,这种哈后面一定要加一个冒号,然后换行,下面就是放提示词,这里也可以直接把提示词复制到插件里面,或者直接导入到插件里面,也可以, 也可以直接拖拽进去啊。导入进来后,点一下确认解析文件,有几个剧情就能解析出来几个任务保存, 然后这里就识别三个就行了,就分别代表三个任务好。然后剧本导入进来过后,点击下面的打开资产库, 这里面有一个全区资产和剧本资产库,全区是所有剧本都能看到,建议大家把图片都传到剧本资产里面,上传之前提前在本地给文件命好名,图片的名字必须和提示词里面的一致。这里可以新增分类,如果说你要用视频用来做音频参考,可以把它上传到这个音频转视频的分类里面, 这右上角有个剪辑音频功能,打开后他会自动把你上传的音频裁剪到四秒以内,按照自己的需求选择开关。 最后我们在这里选择一下方案,方案选择好后,只要不切换其他方案或者新增剧本,那就是可以一直不用改动的插件安装包里面放了一个乐诺微方案,选择这个脚本或者拖拽进去都可以,因为我已经导入过了,就把重复的先删掉,选择这个乐诺微的方案,然后点击应用就行了 啊。然后应用好过后,我们要做一个参数检查,首先就是这个点展开这里的参数设置, 然后这里的延时设置,延时,延时里面的话笨,有两个需要改一下,就这个任务间隔和生成等待,这个是根据你们自己的网速啊, 让他跑一遍,如果说默认的这个能跑的话就用默认的,因为他这个上传图片他会卡很久,他不像吉梦那样很快,所以说这里的延时的话,这个生成等待可以给他改成十秒以上, 根据你实际情况。然后这个任务间隔也是改长一点,如果说没问题的话就用默认,我建议的话改长一点,反正都是挂机。然后这里接下来就是功能开关,功能开关确定跟我一样就行, 设置完后保存设置,接下来是设置模型参数,根据你自己的需求去设置比例,默认我设置的十六比九,你可以手动改成九比十六,点击保存。最后我们再点击顶部的保存按钮, 把现在设置好的参数保存为自己的方案,随便取个名字,保存好后就可以在方案选择里面看到刚刚保存的方案,后面新建的剧本进来,只需要点击一下应用方案,就不用再设置其他参数了, 默认的方案一般只用于第一次使用,后面你都可以用自己的方案到这里就设置好了。接下执行任务前,我们先识别一下资产, 点击下面的智能识别资产按钮,里面有很多功能都是吉梦的,热陌也只需要用这里的全任务一键上传功能即可完成资产识别。这里要注意一下,新用户第一次安装这里的自动全任务,静默绑定开关是打开的,我们需要手动关闭,这是吉梦那边用的这个关闭过后才能点击全任务一键上传功能, 点击过后就会自动把所有任务的资产上传好,如果绑定错了,也可以点击智能识别资产里面的全任务撤销,可以撤销刚刚上传的资产,我们直接点批量执行任务,它就可以自动去跑任务了, 现在已经在自动执行了。还有一点注意的就是上面这里有个网页并发默认是二,也就是执行完两个任务后会自动检测,直到有任务完成后才会开始执行第三个任务。这里如果以后调整成一了,你也得改成一,比如国内疾梦就是一。 然后再说一下提示词和资产的识别逻辑,提示词和图片的名称一定要一致,一个都不能错,优先识别更长的。比如你同时有笔记本和笔记本电脑,那么会优先在提示词里面去找笔记本电脑,然后提示词里面只要是双引号里面的资产是不会去识别的,所以请不要把整段提示词放到双引号里面, 否则一个资产都识别不到。最后就是单个任务的上传图片是有上限的,即梦是九,我插件也是设置的九,如果超过了也无法识别。 然后就是时长识别,默认是十五秒,但是如果你的提示词里面有五到十三秒这种提示词,那么就会智能识别成十三秒的时长,以最后出现的这个为主。现在在执行第二个任务了,发送出去过后,插件就会去检测并发了, 然后第三个任务,好,现在已经看到它已经发了两条了, 第三个任务的话,他就会出现这个东西,就检测到已经病发超过两条了,他就不会去执行了,他会一直轮询检查,直到其中一个跑完才开始下一个。 这里要注意一下,这个病发检测只有在批量执行的时候才会检测,执行单个任务是不会检测的。然后必须切换成我这种填资格的视窗才能检测列表那种无法检测请自行切换后再执行任务。 然后我演示一下这个智能识别时长功能,我设置了一个零到十二秒,这里格式可以是零到十二 s 大 小写也可以十秒。好,我先执行单个任务试试,这时候它是不会做并发症检测的, 现在是零杠十二秒, 看一下能不能切换成十二秒, 这里已经自动切换了九比十六,然后时长也切换了,已经上传好图片和提示词了,没问题了。最后提醒一下,提前在本地给图片命好名,和剧本提示词一致,这里面是不需要的,它能自动识别到对应的图片名称和角色。


二点八六版本更新了热陌陌的方案预设点击方案选择,除了默认的极梦国内版和国际版方案,新增了一个热陌陌专用方案,热陌陌用户直接点击应用即可。方案选择好过后,只需要设置一下比例和延时设置即可。先点击模型比例参数, 把视频比例改一下,如果你本身就是用十六比九的,可以不用改。保存好后再点击参数设置这里的展开进入延时设置,根据实际网速适当调整任务间隔和生成间隔的等待时长,任务间隔就是任务执行完后刷新后等待多少秒开始下一个任务。鼠标悬停任意按钮都会有个简介, 时间短了会遇到的就是页面没加载好,没识别到并发或者没切换比例时长这几种情况。生成等待则是每次图片和参考音频上传完过后,等待多少秒才去点击生成按钮,时间不够的后果就是图片或者参考音频没上传完就点了发送,最后漏掉资产,根据自己的网速设置即可。 然后这个版本我们对智能识别资产里面做了新的自动全任务上传开关,在选择了默认的热门方案过后,这个开关默认会打开,也就不需要手动去点击全任务一键上传了。当然如果用不习惯的老用户可以关掉这个开关,继续手动点击, 这个开关对应的就是这个全任务一键上传功能,只是省去了手动点击直接执行任务,它就会自动上传好资产。 注意,只有润位或者不需要的急梦用户才用这个开关功能,需要的急梦用户请还是用上面那个静默绑定开关模式,这里有朋友反馈润位自带的这个下载全部功能就能自带标记,所以大家可以不用插件的下载功能了,用官方的下载即可。本次还更新了资产库的批量改别名以及查找资产功能, 这里输入资产名字,点击查找或者回车,可以快速定位到对应资产,可以看到这个资产明显不叫张三,那是因为查找功能对别名也生效,本次更新修改了别名的模式,变成了更简单的标签格式,输入别名,点击确定,则可新增一个别名,可用于电商的代替。诗词绑定。多图 对于做电商的用户非常友好,比如一个产品多个图都可以用一个提示词加别名给上传进去。别名在上传资产的时候就可以批量添加,在批量改别名这里输入别名,然后点击后面的按钮即可, 别名就设置好了。假设这是四件 t 恤,那么就可以通过提示词的 t 恤意见上传四张进去。资产名字也可以命名为体恤。批量改名也支持多个别名添加,点击执行任务,它就直接识别到了。

姑娘自己在这喝酒会不会太寂寞了?像这样有人物对话、多人场景的十五秒以上的 ai 视频,如何通过一个画布快速生成,且保持人物场景音色的一致性? 今天我用一个视频全流程演示制作步骤,并重点讲一下制作十五秒以上 ai 视频的三大难点应该如何解决。感兴趣的小伙伴欢迎先点赞收藏!在进入制作流程前,我们先看看制作这样一个完整的视频前期需要准备哪些物料。 看完这些所需的物料,接下来我就一步步演示这些物料以及视频应该如何生成。首先是资产图的制作,这一步是保持人物场景风格一致性的关键。资产图分为角色图、环境图、物品详情图等。 主角的角色图为了保持人物的一致性,建议单独生成且遍布占比要超过三分之一以上。整体的资产图我现在一般是这样的,制作流程 参考主角图、前序视频的截图和剧情设点,先生成一张完整的资产图,接着挑选满足自己要求的部分,裁剪并高清放大。重复操作几次,一组包含的配角环境场景图、物品图的资产详情图就生成了。 为了方便后变容图和更好的保持场景一致性,建议再生成七百二十度场景图,并点击生成多视角图。 完成这些资产物料的准备工作,我们就进入下一步场景铰定图的生成。这一步是为了后面在视频生成阶段 固定人物的关键位置,如果缺少这部视频,生成的时候就会增加很多的不确定性。这部使用自然语言描述,将人物融进对应场景图即可。也可以使用 tv 的 画笔功能,将人物的位置具体标记出来,再点击生成, 能大大降低 ai 的 理解成本,溶读成功率更高。如果这是第一段十五秒视频,以上的参考物料基本就满足生成了。 如果这个视频是延续视频,需要保持人物环境音色的一致性,需要额外再增加两个参考物料,一个是前序视频的关键帧,这个很简单,直接点击这里截取即可。另一个是参考音色文件,用来确保人物音色的一致性。操作步骤也很简单, 我们将前序视频人物讲话的片段裁剪出来,接着提取该片段的音频,一个音色文件就生成了。接着新建视频生成器, 将这些物料依次连接到一起,输入对应的提示时,加入这段描述,选择吸电式全能参考模式完成视频生成。相同的方式完成多段视频的制作,最后完成剪辑和后期制作,一个完整的短片就生成了。 觉得此类教程有价值的,欢迎点赞、收藏加关注,我们下期见!

你是否想训练一款能保持人物一致性的 lora, 却又不知道怎么去做完整的训练级?别怕一分钟教会你 如何生成用于训练 lora 的 完整训练级。首先,找到一张你非常满意的人物图片,打开 comfyui, 将图片上传到我提前准备好的工作流, 把图片尺寸最长边设置为八百四十八像素,短边会自动等比缩放。第二步,配置核心,加载一个三百六十度旋转的 logo 模型, u m t 模型选择忘二点一图声视频一四 b 模型。 第三步,在绿色框中输入提示词,点击执行后,等待几分钟就会得到旋转视频和黑白蒙版,从关键帧里挑十五到二十张,就得到完整训练级了。相关工作流和模型我已经调配好了,想体验的小伙伴来抄抄作业。

每天一个慢剧制作小教程,今天我们学习 ai 慢剧本套教程包含 ai 核心工具, ai 提示词、脚本创作技巧、分镜头动态实现保持人物一致性等。整套教程已经打包,评论区六百六十六名剧。 话不多说,上干货。那么今天这节课的话呢,给大家讲两个方法,可以尽可能的保持人物的一致性。那么比如说我们这个画面中的话呢,是一个什么卡通猫啊,那么这个卡通猫的话呢,如果我们想要给他换一个场景该怎么办呢? 那么基于这一点的话呢,其实,呃,目前有不少软件都是可以做到的,那这一块的话呢,我给大家演示一个 sd 和一个呃,极梦 ai 的 一个使用方法啊,告诉大家两种方法的话呢,去进行保持人物尽可能的一致性, ok, 那 么基于这一点的话呢,呃,首先的话呢,我先干什么呢?先给大家看一下该怎么做, 那么第一步的话呢,我是使用的 xtgpt 啊,那么使用 xtgpt 的 话呢,我先给他一个 o 三 mini, o 三 mini 的 话呢,是用来主推什么呢?主推一些文案这些啊,如果你要做图的话呢,四 o 和四点五啊,这些你可以用,那么我们先推理它的这个图片啊,首先的话呢,我是先固定了一张图片, 看到没有,我将一张参考图呢去上传给了 chat gpt, 然后使用 o 三的话呢,去对它进行一个反推,那么这一块的话呢,大家稍微等待一下啊, ok 啊,那这个时候的话呢,我们干什么呢?基于这一点,我直接对它进行的是一个要求,就比如说我需要这张图中 干什么呢?关于卡通猫的详细描述词, ok, 那 么这个时候的话呢,我们直接发送就行了,发送之后的话呢,哎,图片上传失败对吧?啊?重新刷新一下啊,先复制一下这句话,重新刷新, ok, 然后的话呢重新发送一下,那么这个猫的话呢,就是我需要的是这个猫的整体的这个形象,包括它的尾巴,它身上的斑纹,以及它穿的这个围巾, 还有他戴着帽子,背着书包这些,我需要他的一个这个人物特征,所以呢,嗯,但是我们自己写的话呢,肯定写不了那么详细,对不对?所以我们希望 chat gpt 的 话呢,帮我们写, ok 啊,大家这一块的话呢,看哈他正在这个帮我们去加载这个关于这个猫的啊,我这一块的话呢,给大家稍微翻译一下, 看到没有,这个猫的所有的穿着呀,衣服啊,这个以及特征啊,都帮我们去加载上去了啊,那么刚刚的话呢, 我还是重新回到了四 o 里面去给大家的啊,刚刚一开始我不是说用 o 三吗?但是 o 三的话呢,它老是加载失败,所以我就直接又跳转到了 gpt 杠四 o 里面啊,大家这一块的话呢,如果也是跳转失败的话呢,你也选择一下啊 gpt 杠四 o 的 这个吧。啊? 那么选择这个之后的话呢,我们干什么呢?我们基于这张图像的话呢,给他一个需求,那么这个需求的话呢,就是,呃,比如说重新 生成三组不同的场景,重新生成 三组不同场景的卡通猫, ok, 然后呢保持衣服不变,输出完整的提示词给我, ok, 那 么就是这么一个要求,就是我们需要什么的话呢,直接要求 chat gpt, 它的理解能力是非常强的,那你这个时候的话呢,直接点击发送就行了,那么发送完毕之后的话呢, 我们来看一下他现在是帮我们怎么出这个,稍微等待一下 哎,他这里的话呢,帮我们使用这个帮我们出图了,但是的话呢,我是不希望有出图的,所以你看这个下方的话呢,这里有一个什么呢?有个切换模型对不对?我们还是一样切换 o 三 mini 来试一下 啊。那么这个时候的话呢,我们这是文案了,对不对?那基于这个文案的话呢,我们看一下他能不能帮我们出, ok, 你 看这个时候的话呢,就非常好了哈, 以下是三组不同体式词的完整的体式词, ok, 你 看包括卡通猫、宝石服饰不变的什么什么什么,他都帮我们总结出来了 是不是?那如果说你想这个自己总结这句话的话呢,可能没有人家总结的好,对不对啊?那我们看第一个提示词啊,第一个是雪山冒险的, 雪山冒险的这个的话呢,和我们的这个原图可能稍微有点像,但是第二个的话呢,就是热带海滩,那么这个的话呢,就和我们的不是那么的像了,还有个都市夜景,对不对?那基于这些的话呢,我们可以干什么呢?我们可以比如说哈,我给大家举个例子, 首先的话呢,我们打开这个啊,我直接用第二个和第三个哈,因为他这个和雪山不一样了,就这是第一个。然后呢我打开 sd 纹身图,那么基于纹身图的话呢,我将这段话的话呢,复制到这里来,这个引号的话呢,去掉,去掉之后的话呢,基础算法就是 f 点一算法,然后的话呢,这个模型这个 lala 使用的就是这个 小餐台 f 点一网红大胖橘猫的这个 lala, 那 么这些参数哈,采用方法和迭代步数, 如果是 flex 点一的模型的话呢,我们基本上都是优了,保持在三十左右就可以了啊。迭代步数,关于宽度和高度的话呢,这一块的话呢,我们目前可以保持这样啊,九二八幺二三二啊,可以的啊,直接点生图, 升图之后的话呢,他会将我们的提示词转化成英文,那么转化成英文之后的话呢,我们等待他的出图就行了。这是什么呢?这是第一个方法啊,那第二个方法的话呢是什么呢? 是找到极梦 ai, 那 么极梦 ai 的 话呢,这个需要大家稍微可能呃,就是稍微注册一下哈,然后注册完之后的话呢,干什么呢? 我们这里的话呢,有个图片生成的这么一个功能,基于这个图片生成的话呢,我们直接将文字 直接复制过来就行了啊,这个的话呢,就完全不需要什么呢,不需要翻译成英文。那么这个时候的话呢,也有两个方法,第一个的话呢就是你的纯文字, 那么纯文字的话呢,我们可以使用他的三点零的出图,那这个的话呢,其实是非常强悍的。呃,还有一种的话呢,是导入参考图,那么导入参考图这个的话呢,呃,我们直接将这个参考图拖过来, 稍微等待一下啊,参考图的话呢,就是我们找到的一张图,对不对?那么你这个时候的话呢,你可以说要求参考主体 啊,要求参考角色,要求参考这个人物站姿这些都可以啊,那么基于这一点的话呢,我们选择参考主体就行了啊,因为这个主体的话呢,是我们要的, ok, 保存, 保存之后的话呢,这里的话呢是中文加参考图啊,图片的话呢,自动帮我们降到了二点零 pro 的 这个版本,然后呢这个尺寸的话呢,比例选择二比三就可以了啊,二比三然后点生成, 生成之后的话呢,大家会看到这个区域哈,这个区域的话呢,总共一次性帮我们生成四张图啊,那么这个时候的话呢,我们回到我们 sd, 回到 sd 之后的话呢,大家看一下哈, 这是一个橘猫对不对?它身上的斑点条纹几乎是很像的啊,它也是背着一个小鸭子,背着一个书包,然后带着这个耳机墨镜啊,这个围巾的话呢,围巾可能有一点变化,对不对?嗯,这个时候的话呢,我们来去看一下这个哈, 是吧啊,围巾有一点变化,但是基本上其他的这个还算是比较像,是不是这是第一个?那么我们再看哈,再看看这里 啊,基于我们吉梦 ai 的 话呢,我们这个地方点开这个吧啊,我觉得这个还挺好, 这个的话呢,围巾保持的也很像书包小鸭子啊,包括他戴的这个耳机这些基本上算是什么呢?算是将我们这张 呃主体的话呢,直接迁移了一个背景出来啊,所以这个吉梦哀的话呢,其实保持人物一致性的话呢,还是挺强大的啊,那么这个时候的话呢,我们只是生成了一张图对不对? 所以我们没有办法去做对比,说下一张图它会不会一样啊?就是保持我们的人物一致性,那么这个时候的话呢,很简单,它不是有个都市夜景的场景吗?你将这个直接复制,复制之后的话呢,我们同样的在这里 把它给翻译了啊,就是发送在这个文声图这里,发送之后的话呢,你也可以点一下翻译为英文 啊,那么这个时候的话呢,直接点开始升图就行了啊,当然了,我使用的版本是在线版本,大家的话呢,可以去使用这个本地部署的版本啊,如果你电脑配置高的话啊,因为我电脑配置的话呢 啊,带起来这个 flex 版本的话呢,有点困难,所以这一块我使用在线版本,但它所有的界面的话呢,都是一样的啊,所以这一点的话呢,大家去只要找到大模型和 lala 就 完全可以升图,你看 这是什么呢?这是我们这个 sd 升图的哈, sd。 那 么这个时候的话呢,我们再回到吉梦 ai, 改变什么呢?改变它的一个中文就行了,复制,复制之后的话呢,我们将这个中文 ctrl v 粘贴一下,粘贴完毕之后的话呢,我们二比三的比例图片尺寸这个生成, 那么这个时候的话呢,我们等待他的效果,等待效果的时候的话呢,干什么呢?给大家去做个对比哈, 这是什么呢?这是我们的刚刚出的图,这是我们沙滩的图,你看清楚哈,这两张图的话呢, 严格上来讲的话呢,除了围巾上有那么一点不一样,实际的出图的质量啊,很高清了,对不对?然后的话呢,图像的 整个人像呢,保持的话呢,也是相似度非常高了啊,相似度非常高了,所以基于这一点的话呢,就是大家想要出这种图的话呢, sd 是 一个出图的方法, 然后吉梦 ai 的 话呢,也是一个出图的方法啊,比如说这个时候呢,我打开给大家看哈, 看这只猫,这只猫的话呢,虽然是在这个夜景下哈,虽然在夜景下,但是的话呢,我们来对比这两张图哈,就是我们上下去对比的话呢,呃,其实大家可以发现,吉梦 ai 的 这个 参考人物主体之后哈,他的这些围巾的话呢,几乎都可以保持一样了啊,因为他这一块的话呢,呃,按照我的理解的话呢,大概率就是把我们这张主体的话呢,扣下来放在了不同的背景上。所以基于这一点, 这个吉梦艾艾的话呢,这一块做的是相当的可以。只不过有一个地方我要给大家讲一下哈,就是吉梦艾艾的话呢, 他确实出图比较好一点,但是他没有那么多风格啊,就是你要求他是一个城市夜景的,对吧,但是的话呢,他可能就是出只能出这种类似的城市夜景的,但这个 sd 不 一样啊, sd 的 话呢,可以添加不同的唠啦。 那么大家基于不同的 lala, 或者说基于不同的效果的话呢,你完全可以生成出来任何你想要的各种各样的场景的哈,所以这个优点和劣势的话呢,都给大家简单的分析了一下, 这一块的话呢,就是告诉大家你想要什么样的你就是你想要改变程度,就是想要风格上的改变程度, 然后这个场景上改变程度的比较大的话呢,呃,我建议大家使用 sd。 那 么如果说你只是想要生成一系列的关于这个橘猫的不同的场景啊,那你可以用什么呢? 你可以用极猛 ai 啊,极猛 ai 的 话呢,可以尽可能的帮你保持主体的一致性啊,这是这一点啊。当然了,这一块的话呢,大家也可以去使用什么呢? 也可以去使用三点零版本啊,那么三点零版本的话呢,也可以帮你尽可能的保持啊这个人物的这个一致性。 ok, 以上的话呢,就是我给大家提供了两个呃,这个借鉴的方法吧啊,就是在保持人物一致性上面 重新给大家回顾一下哈。一开始的话呢,我们是在 chat gpt 里面,然后呢对图像的一个场景和主体进行了反推,反推之后的话呢,呃,我们要求他帮我们出三个场景啊,那三个场景的话呢,我们分别去发送在了 spotify fusion 的 sd 里面,然后的话呢又发送在了极梦 a i 里面来给大家做了这个对比啊,经过对比的话呢,会发现极梦 a i 的 话呢,会保持人物一致性更好一点,但它的画质的话呢,需要大家再次编辑高清 进行什么呢啊?进行一个高清的一个图像生成,然后其次的话呢,就是它的风格上,呃,其实没有那么多的风格啊啊。然后这个 spot fusion 就是 sd, 它可以生成高清质量的图,又可以保持 图像的多种化和多样化,风格的多样化,但是的话呢,它在这个某种人物主体的细节上的话呢,会有一点不一样啊, 所以基于这一点的话呢,大家知道这两个方法就行了啊,剩下的就是大家自己去选择的问题了。 ok, 那 么本节课的话呢,就给大家去分享到这里,大家有遇到问题的话呢,欢迎大家在评论区沟通,那我们下节课见,感谢大家的关注。