还在为 ai 生图扭曲发愁吗?跟我做三步修复加高清。步骤一,打开 evi 建筑大师,选择 ai 对 话改图,把模型切换成 pro 模型,上传底图,输入提示词, 生成精准线稿,打好基础。步骤二,上传线稿和原图,输入这段提示词,点击生成,可以看到从线稿过渡到清晰效果,图 扭曲消失了。最后一键下载四 k 高清图,细节直接拉满,前后对比效果是不是很绝?今天的教学到此结束。我是 ai 画师人浩哥,专注于建筑室内 ai, 希望大家一键三连!
粉丝1.3万获赞4.7万

做真人 ai 短片最崩溃的不是渲染慢,而是人脸崩坏。明明做好了精细的角色资产图,一进场景人就变样,尤其是针对亚洲面孔的还原, 很多模型依然会水土不服。今天和一个朋友聊天,他就遇到这样的问题。后来我用手机拍了几张他的脸部照片,重新做了三式图,但是带入场景中效果还是不太好。最后发现两种实测有效,且能在 cds 和可林中通用的 可控一致性方案。第一种,纹身视频也模型一个角色资产展示图,输入你的提示词,其他的让 ai 自由发挥,缺点是场景不可控。第二种, 再把图片带入场景前,先在 ps 里把人物头部完全模糊掉。这样做有两个核心优势,绕过审查,完美解决部分平台对真实人脸识别过严的问题。辅助计算,让 ai 在 识别场景的同时 不再受底图崩坏五官的干扰,从而更精准地调用你投喂的角色资产。实测下来,人脸相似度能稳定在百分之八十到百分之九十以上。 最后给大家推荐一个目前最好的视频超放工具, topaz video ai, 让你的视频质感飞跃。它可以把 cds 二点零生成的七二零 p 视频轻松拉到四 k 电影级画质 追求极致的小伙伴可以尝试它的星光模型,除了本地跑得慢,效果真的没话说。

ai 生成的图扭曲成这样还能用吗?别急,二十秒教大家一个实用技巧。首先输入这个提示词,提取建筑线稿,然后使用摘在风格分析按钮,分析原图复制结果作为线稿图的渲染提示词,一张清晰的图就好了。再点击高清按钮,还能八 k 高清。一起来比较一下更多 ai 技巧,加入摘在交流群。

m i t。 博士只靠 j p t 外加两个拍丧脚本,就解决了 ai 生存游戏角色一致性的问题,姿势扭曲、画面乱闪、大小跳变通通搞定,一个人手搓出一支美术团队的活儿。以前用 ai 生存游戏素材就是开盲盒,第一张是红发海盗,第二张变个姿势就成这样,一致性非常难保持。 m i t。 博士用这四步把 ai 虫只能画个大概的玩具就成这样,一致性非常难保持。 m i t。 博士用这四步把 ai 虫只能画个大概的角色图。首先拿一张以上线的游戏角色图做种子, 锁定脸部、身材比例、色彩搭配等。接着写个拍像脚本,把种子图最临近放大到二五六乘二五六,并放到透明大号部左上角,给 ai 一个精准的参考地稿,保证深度时绘图且位置也一致。把深层的图传到 gpt, 说这段提示词,你就能得到一整套连贯动作。 要逐帧深沉,因为一致性非常难保持。接下来要把深沉的动画带变成真实的游戏针。如果直接用 g p t。 深沉的动画带,会因为人物姿势动作不一致导致角色出问题。所以我们用另一个拍像脚本算整个动画的全景,统一缩放比例, 并且无论是做哪个动作,最后都回到上线的第一帧。有了这套方法论,不少网友复刻出了好玩的游戏资产。还有人探索出了新玩法,直接给一张角色图让哥克来做动画,效果也不错,你想去试试吗? 关注机器之心,探索 ai 世界!

ai 小技巧,后视扭曲工具,选中文字,右键创建轮廓 路径查找器,分割文字, ctrl 加 g 编组,选择自由变换工具,透视扭曲, 调整颜色,增加明暗投影细节, 这样效果就做好了。 记得点赞收藏!

大家是不是也经常遇到生成初都是奇形怪状的面部?今天跟大家分享一个专门针对面部修复的一个插件,他的工作原理是把人物的脸部放大到五百一十二乘五百一十二的尺寸进行重绘,利用图生图功能创建一个新面孔的一个图像, 从而达到脸部修复的效果。这个插件叫 face idea, 我们用老方法进行下载, 下载回来后把他需要用到的模型也进行下载,大家没有这个模型的可以留言跟我要哦。如果用的是秋叶大佬的整合包,最新版就已经默认放了这个模型的,我们去到扩展下载 face idea 脚本 安装 成功后,回到文声图界面下面脚本这里就有这个插件啦, 大家私下可以多试几次,就可以知道各个功能出来的效果图,我调用一下上一次的纹身图,看看出来的脸部问题, 出来的脸部效果很多问题,点击图声图使用 face ad 二插件试一下默认出来的效果, 出来的效果脸部表情明显好了很多,大家赶紧去试试吧,记得关注我哦,每天分享个人的 ai 使用心得。


缝里钻出来,顺着江清婉的手臂往上爬,江清婉发出一声撕心裂肺的尖叫,拼命甩手,我招招手,蜘蛛跳回到我手上,都说了不用拿,这是我养的宠物。江清婉跌坐在地上哭, 姐姐,你就这么讨厌我吗?我翻了白眼,还有完没完了?自己提着行李箱找到了房间,打开箱子,取出里面四五个密封的瓦罐,藏到床底下。


今天呢,我们将会提供一个万二点二的工作流,那这个工作流可以让你生成的视频更加符合逻辑,或者更贴近现实世界的规律。那我们来对比两个视频,这两个视频呢使用了相同的提示词,相同的参考图以及相同的种子, 大家会发现左边这个视频他其实呢不太符合逻辑,而右边这个视频对于物理规律的表现呢,会更加准确一些,可能很多人看的不是特别清楚,那下面呢我们来给大家分析一下,那我们来看一下这个画面, 那这个画面对于很多的视频生成模型来讲呢,是非常头疼的,这就是我们常说的翻身或者是转身的这个动作, 左边这个呢就是 y 二点二原声工作流展现的效果,那我们可以清晰的看到腿和脚的朝向感觉是向后的,而身体和头部的朝向呢,感觉是向前的,那这个就有点诡异了。那我们再看右侧的这个动作的展现,其实呢就要自然很多, 那在右侧的工作流里边,我们使用到了一个新的模型,叫做 v b v r, 这个模型呢可以让视频生成更加符合逻辑,那到底怎么去做呢?那为了方便演示呢,我将工作流也构建到了 runnyhop 上。首先呢我们需要解释一下 v b v r, 它到底是一个什么模型呢? 这个 v b v 二的含义叫做 a very big video reasoning suit, 它是一个推理的套件或者是推理的框架。我们可以简单来理解, v b v 二呢,提供了大量的训练数据,用于增强视频生成模型的推理能力。 训练数据的种类呢也有很多,第一大类呢,就类似于俄罗斯方块的这种形状匹配,那第二大类呢,是模拟流体力学, 那第三大类是根据特征锁定目标物体,那第四大类呢,是三 d 物体的旋转,第五大类呢,是将物体移动到指定位置。那经过这些训练数据的调优,可以有效地增强 模型的推理能力。官方呢,也发布了首个 one 二点二的 v b v r 模型,它官网呢,有一个排行榜,调优后的 one 二点二模型,它的推理能力呢,仅次于人类。比我们看到的很多 b m 模型,比方说 sorry 啊,其实呢,它的推理能力都要高。那官方呢,有很多例子,那我们来看其中的一个,这是一个多米诺骨牌的例子,这个模型呢,需要检查骨牌 之间的间距,找出这个多米诺的链条会在什么时候断掉。那在动画当中呢,我们需要先模拟第一块骨牌被推倒,并且显示每块骨牌依次倒下,直到由于这个间隙过大, 阻断了链条的推进。那我们可以看到这个视频生成模型可以非常精确的找到链条断裂的位置。那之前很多博主呢,也介绍过这个模型,但是他们更多的是设计了一些 首尾针的工作流来检测这个模型的推理能力。那我觉得让 confui 工作流里边的 v b v r 模型来做推理啊,其实有点难为它了,因为它必定不是一个全量模型。另外呢,我觉得很少有人会用视频生成模型直接做这种推理, 那它的用途应该是什么呢?应该是帮助我们的视频生成模型,生成的视频呢,更加符合逻辑。下面呢,我们就给大家演示一下如何正确的使用 one 二点二的 v b vr 模型。 如果你想在 confui 当中使用 one 二点二的 vbvr 模型的话呢,这个有两种方法,第一种方法呢,是使用 k 神提供的 vbvr lara, 第二个是使用 lincoln studio 里边儿提供的 one 二点二的 vbvr 模型。第一种方式呢,非常简单,当然呢也很 粗暴。 k 神呢,提供了 one 二点二的 vbvr 的 lara, 但是你要注意这个 lara 呢,只有高噪模型的 原因很简单,我们都知道 y 二点二呢,采用两段式的采样,高噪模型呢,负责构图,低噪模型负责优化,而生成的视频是否更符合逻辑? 其实更多的呢,是由高噪模型来决定的。如果你想简单地尝试一下 v b v r 模型,那你使用 k 神提供的这个 lora 就 可以了。那如果你想获得更多的 v b v r 的 推理能力 啊,可以使用 lincoln studio 提供的模型。由于这是一个模型,而不是一个 lara, 所以 说它整体的能力呢,就要强很多。如果你去看它的豹纹脸的仓库的话,你会发现这个模型呢有两种,那我们应该下载哪一个呢?大家一定要下载这个 snr 模型, 虽然 s r 的 模型更小,但是大家注意它的推理效果会更好。原因是什么呢?是因为这个模型在量化的时候呢,采用了更加实用的策略, 是在将全量模型转化为 f p 八模型的时候, s r 模型是将信噪比大于三十一点五的这个层给它转化成了 f p 八,所以说这个 s r 模型应该是更多地保留了全量模型的灵魂和它的核心能力。 好,下面呢,我们来展示一下这两个方案的一个效果。首先呢,我们来使用啊, k 神提供的 one 二点二的 v b v r 的 lora。 大家现在看到的这个工作流呢,其实就是一个 one 二点二的图声视频的工作流。那我在这个工作流的基础上呢,稍微做了一些调整。 首先呢,我在高噪模型之后串联了 v b v r 的 lores, 而低噪模型呢,没有改动,原因我们刚才解释过了, k 神只提供了高噪模型的 lores。 另外为了方便对比呢,我设计了两个采样的工作流。这两个采样工作流的主要区别就是高噪模型使用的不同, 上面那个使用的是原生的 y 二点二的图声视频的模型,而下边这个呢,其实加入了 v b v r 的 l r, 这样的话,可以让我们非常方便的看到它们生成视频的差异性。 另外还有一个内容大家需要注意,就是提示词的编辑,如果你用一些常规的提示词,可能很难看出来它们之间到底有什么区别,尤其是当你的动作写的太过泛化或者强度不够更多的时候呢,这两个模型生成的视频呢? 差不多在之前的这个视频当中,我们给大家讲解过如何让模型生成的视频更加具有动效。那我们的策略是在五秒钟的视频当中放入五个连续的动作。如果大家想详细了解这个提示词的写法, 可以仔细看一下这个视频,为了方便测试的话呢,我也给大家准备了对应的提示词工程,使用这个提示词工程,你就可以用任何的大圆模型来帮你啊生成对应的提示词, 那为了让大家更加直观的看到效果,我这设计了五个测试用力。第一个例子是一个摄影棚里的美女, 我们给他打了一束光啊,非常的漂亮,所以说整体的这个图片的美观程度呢,也非常的棒。那我们为他设计了五个非常复杂的动作,那这五个具体动作是什么?我们不用管,我们只需要看一下他最终生成的这个效果。左边这个是万二点二模型生成的效果, 而右侧是我们加入了 v b v r lra 之后生成的效果。经过仔细的分析,我们会发现啊,右侧的效果呢要好很多,主要体现在两个方面,首先呢是动作的流畅性,这个女孩呢有一个向后起跳,然后落地的动作, 那你会发现右侧的表现呢就比较的优雅,而左侧呢就感觉非常的生硬。还有一些细节,比方说左侧的这个美女的手套是两种颜色,蓝色和粉红色,它是不一致的, 那你再看右边的他生成的都是粉红色的手套,所以说呢更加的符合我们的逻辑。那第二个例子呢,其实就是我们一开始给大家展示的那个原图呢,是一个女孩慵懒的躺在沙发上,然后呢我们为他设计了很多的动作,其中最关键的一个动作就是空翻的一个动作, 那我们都知道模型在直行翻跟头这类动作的时候呢,大部分呢都会翻车弯,二点二呢也不例外。大家注意左侧这个,他在翻跟头的时候,其实你很难分辨出他的身体是朝前的还是朝后的,因为呢,你在看他上半身的时候,他好像是朝前的,但是你要看他的下半身, 你的感觉却是朝后的。但是我们会发现,加入了 v b v r 模型之后,那则不存在这样的问题。而且右侧的模型整体动作的流畅程度和美观程度也比左侧这个要好很多。那第三个例子是一个喝可乐的女孩, 在介绍 v b v r 模型的时候,那我们着重提到了她对流体力学的模拟呢,进行了专门的训练。所以说我们设计了这样的一个动作,就是这个女孩呢,呃,拿着可乐瓶子,然后呢开始摔。 大家会发现啊,这两个模型生成的质量总体呢都还是不错的。左侧这个视频在呈现可乐液体状态时呢,稍微有些问题,比方说可乐摔到沙发上,飞溅出来的液体呢,更像是泡沫,而且体积都非常的大。 另外,当可乐被重重的摔在地上的时候,整个可乐的喷溅效果呢,其实表现的不是特别的到位。那你再看一下右侧这个视频, 尤其是最后瓶子摔到地上的时候,你感受一下可乐喷溅出来的状态,是不是和实际的状况呢,是非常相似的。在第四个例子当中呢,我们测试了一个弹钢琴的女孩,她向后摔倒了。两个视频生成的效果呢,其实差不多, 但我个人觉得呢,使用了微背 vr 模型之后呢,女孩摔倒的动作和姿势呢,会更加的优雅,而传统的 one 二点二的模型里边啊,那个女孩显得似乎更加狼狈一些。那第五个视频呢,我们涉及了一个女孩捉迷藏的场景,最终生成的两个视频呢, 差异比较大,所以说可比性呢也不强。因为 v b vr 模型在中间增加了一个动作啊,就是有一个障碍物啊,是一个桌子,旁边放着一个椅子,然后这个女孩呢,正好要从这个路线上经过去,所以说呢,她有一个动作就直接跳过了这个桌子, 但是在左侧的视频当中呢,就没有这个动作,我觉得总体上来看,这轮应该是原生的 one 二点二模型的表现呢,更加的自然一些。 那我们经过了五个场景的测试,其中四个场景当中, v b v r 的 模型的表现呢,都优于 y 二点二模型, 所以说那我们也可以确定 v b v r 模型在优化视频方面呢,它是有效的。那下边呢,我们再来看一下使用 v b v r s n r 模型的效果。对于工作流的改造呢,这个非常的简单,我们只需要将高噪模型和低噪模型 从原始的 y 二点二模型替换成 v b v r 的 s n r 模型就可以了。大家一定要注意啊,我们一定要保留 lightning 的 加速 lora, 因为呢,这个 v b v r 模型本身并没有加速的性质,那工作流的其他内容呢, 不需要做额外的修改。那我们从上面的五个场景当中选了三个场景来测试 v b v r 的 s n r 模型, 总体上来看呢,会更加的美观,在细节的呈现上呢,也会很棒,但是呢也会有些问题,比方说在第二个场景里边,女人在空翻的时候呢,给人一种悬浮的感觉, 另外就是美女在摔可乐的这个场景里边,可乐瓶子的一致性的保持呢,不是特别的好。那我个人建议,如果你想简单尝试一下 v b v r 模型, 直接使用 k 神提供的这个 lara 就 可以了。那最后呢,我们来总结一下,总体来看呢, v b v r 模型呢,实用性非常的强, 因为呢它从根源上尝试解决视频生成的质量问题和合理性问题。当然目前的这个版本呢,我觉得还有很多的改进空间,但是呢视频的效果提升也是非常明显的,所以说呢,我个人非常推荐大家去尝试一下。好,今天呢,我们就说这么多,关注我,做一个懂爱的人。

哈哈,别唱了,省点力气吧, 快到了, 他在金丝猴隧道了。 不行了,大山我真的走不动了,这背篓越来越沉,像是装了石头一样。是啊,肩膀好痛,这山路什么时候是个头啊? 大家看看周围,你们知道吗,当年山里的前辈们就是在这条路上运送粮食和物资,那才是真正的重担,我们现在背的不过是几斤山货。 可是,可是 我真的抬不动脚了,我帮你分担一点。记住,我们是一个团队,就像当年的中国红军,从来不会丢下一个人。我们一起走, 加把劲,快到了,走,我们比赛,看谁先翻过这个崖口。雄关漫道真如铁,而今迈步从头越。

嗨,大家好,今天的话想录一些关于用豆包或者集慢来进行那个文字生成视频或者涂山视频的时候,大家遇到的一些呃, 真人脸部那个版权问题,著作权问题,然后不容易被那个生成通过,会会遭到拒绝。 然后一般出现这种问题的话,大家在这个描述,如果说是由文字生成那个视频的话,你可以在这个文字描述中,第一是先去掉一些就是咱们中文常用的一些修饰词,比如说窈窕淑女啊,或者说一些那个射人心魄呀 啊,或者说一些那个呃,比较就是偏那个意向的一些这样类型的描述词,然后让他更精准的描述人的 动作表情,还有人物的长相还有穿着就可以了,不要加入太多的这种我们理解那种的对人的那种长相的修饰词,这样的话会相对来说好一些。第二的话就是大家在 这个画面中,如果你提到某个国家,某个年代的某一个著作,哪怕这个东西是你通过 ai 创作的一个虚构的东西, 但是在现在的检测情况下,他也会出现这个版权的问题,可能不予通过这种类型内容。所以说你在这个 描述中不要出现具体的这个国家跟书名或者一些著作的名字,或者某个道具的一些名字,然然然后他是带有一个很明确指向的这样的一些名字,比如说你可以说某某个地方的欧洲的一本书就可以了,或者说 呃,某个欧洲国家的这样的这样的一个大概的一个东西就行。但是你如果说描述他是有书名号,带一个什么书的名字,或者这个画的作品,对吧?或者一些其他的车的品牌之类的,这个就可能遭到拒绝。然后就是关于这个人脸这个这个 描述,如果说你直接通过这个呃豆包,即便生成了一张就是真人的一个图像,然后去生成的时候,他也是不行的。所以说你如果说 想直接生成真人的话,那你就直接在刚才我提到第一点里边,在描述中就直接不要给他加任何的画面风格,就先加上这个 呃这个人物的整体描述,还有动作,还有这个运镜这些基本的元素,然后去掉刚才我说的那些呃过多的修饰词,还有一些涉及到版权问题的 国家书名或者一些品牌名称,还有这样的一些东西,还有些比较容易在这个英文翻译中可能出现的一些不太好的词词汇,比如圣洁感呀或者之类的, 这样这样的话都不太呃可能会通过。然后你通过这样的一些调整你的提示词,也可以直接生成这种真人感的视频。然后的话如果说你图声视频其实有时候会比较麻烦的话,不不太符合你这个其实具体的这个测试的需求的话, 其实你更多的通过这个文字生成视频的话,有时候他的生成的视频你测试下来以后,其实人物的变化是不大的, 其实他对这个提示词的这个理解要比我们想象中要深,所以说建议大家可以就是有些如果不是特别长的短句的话,或者说一些长的视频,然后你只需要做一个十五秒呀,或者说一分钟以内的这样的一个短视频,你可以 直接做好,做到这个用文字直接生成,然后你把他的人物的形象,穿着打扮, 还有他的表情各方面的提示词都各种备一份。在不同的镜头切换中,你需要他换衣服以后,或者说有穿搭上的变化,或者有表情的变化,你在这个人物描述中只需要修改这个地方,然后其他的地方你不用去修改。然后你可以测试几个视频,看他生成的是否一致,这样的话我觉得也能 在你整个制作这个视频的过程中也能给你一些比较好的帮助。今天的话就简单分享这些,这也是我最近发现的一个比较有用的一些那个借鉴和参考吧。 嗯,回头的话我如果有新的一些,就更好的创作的一些经验的话,也会分享给大家。

ctrl 键我用了一次, shift 键用了一次,然后 shift 键和 alt 键组合用一次,那你就会想到了,那我就不能说 ctrl 键加上 alt 键单独用一次吗?能理解吗?这个推导的逻辑, ctrl 键都用了, shift 键 alt 键组合的一起用了, shift 键自己单独用了,那就不能 alt 键单独再用一个吗? alt 键什么作用?刚才写了吗?对称作用吗? 这个时候我们按住 ctrl 键加 alt 键得到这个东西是什么形?李毅还说菱形不对,谁能说一个最准确的说法,这不能叫菱形,他在某一刻有可能是菱形,但是大多数情况下他不叫菱形,是吧?谷歌领着大家学 ps, 把初中的数学又复习了一遍,啊 哈哈哈,这个应该叫对称扭曲啊,我记错了,对称扭曲啊,原来我起个名对吧?就是按 ctrl 键加 alt 键,拖脚点也是 alt 键起到一个对称的作用,对吧?我们通过推导得出来的对称扭曲。那这个东西我告诉大家啊,我们现在按出来这个东西啊,我可以告诉大家,负责任告诉你们啊, 在这里面的话,你是永远也得不到的。就这种平行四边形的变形的话,没有去掉缩放,去掉旋转、斜斜、扭曲和透视没了,就这仨。所以如果想得到这种平行四边形的这种变形的效果,你只有用快捷键。