这个东西是什么?给大家三秒钟时间思考,三二一 看不出来这是正常的,因为我也看不出来,但如果我这样子给你看,可能你就知道他可能是个发夹。那么今天我们要讲的就是这个问题,有的时候我们生成出来的东西不是我们的产品怎么办?拿这个案例来说, 相同的一个参考图,相同的一个产品素材,相同的提示词,但是生成出来的图片跟我们的产品没有任何相关系,不是我们自己想要的产品,这情况下怎么办?来解决?怎么办?之前我们要先知道为什么,那么这个结果的原因是什么?是因为模型它没有识别到你这个产品 是什么。当然呢,我这边也已经写了是一个棕色的发卡,但他还是没理解到,因为他不知道这个发卡的真正使用场景是什么,所以我们进行了第二次测验。为了更好的看出对比效果,我这边用 copy y 的 画布去给大家做了三次测试的结果对比啊。第一个就是左上角,这里是一张参考图, 下面这里是产品图,白色底的,当然很多时候白色底其实是更好的一个素材。紧接着是一个结果图啊,生成结果刚刚给给大家看到了,他的结果图跟我们的产品是完全不一样的, 但是他的风格确实是参考的,比如说他的版式,还有文字的位置,包括他的风格,基本上都是一比一去复刻出来的,但是生成出来的产品看得出是毫不相关。 我第一次测试结果失败,第二次测试结果,我们尝试把这个发卡竖起来看一下能不能够让模型进行一个识别,得告诉模型这个发卡是这样用的,但是实际上这个发卡并不是竖着用的,我是后来也才知道。那么第二次做了实验之后,我们发现它出来结果依然跟我们的产品毫不相关, 这个时候你要做出正确的调整,怎么去调整,也就是我们要讲的第二个部分怎么办?我们最好是提供一个产品的实际使用场景这样的一个产品图,这样子模型,它可以根据你提供的产品所在场景去分析一个产品应该是怎么样去用的。那么我们做了第三次测验, 相同的一个参考图,以及另外一张带有使用场景的一张产品图,这个发卡原来是这么用的,我也是后来才知道,在这种情况下,我们最终生成的结果图就是这样子的,跟我们产品其实是一模一样,包括这个发型可以说也把它复刻进来了。 下面就是我截图的一个放大的效果,拿来做对比,我们看一下最终生成的复刻图, 这里的排版有所变化是正常的,但是他的产品,他的场景,比如说第一张是在卧室里面,我们这边复刻出来的图片也是在卧室里面。第二张是瑜伽背景啊,复刻出来也是瑜伽背景,甚至还更好看一些排版。那么下面一张呢,是在车上面,也是完整的复刻出来, 下面的一个细节图,我们也来对比一下。这张是原本我们给的一个产品的使用场景参考图,这张是他生成出来的结果图,可以说产品上也没有任何的变化,也是一比一复刻的,那么今天要讲的就是这些内容,在我们遇到生成的结果图跟我们的产品不一致的情况下,要怎么去处理?就是 拿出我们有具体使用场景的一张产品图上传上来,最终会得到跟我们产品非常接近的一个效果图。
粉丝3916获赞8683

哈喽,大家好,我是帅,用 image 二加 cds 二点零做 ai 视频。我现在最推荐的不是一口气生成一大堆的复杂风景,因为像 cds 二点零这种主流大模型的单条生成时间极限就是十五秒,你给它塞一堆的镜头, ai 根本无法理解并生成出对位的连贯画面,本质还是在瞅卡。 所以我今天将向大家分享一套我自己在用的可以生成连贯剧情,同时保持人物和场景一致性的 ai 视频。工作流教程中用到的提示词和步骤我都整理好了,让我们开始吧。 这套方法的第一步,需要先把我们的角色和场景定下来。比如这条片子里,我的灵感是一个女猎手在沙漠废墟中和一个男反派决战的故事。我们需要给 是先设定好场景和人物,所以我先生成了女猎手、男反派,还有沙漠废墟的场景图。第二步,把这些人物和场景图一起上传, 使用 gbt image 二模型,让它基于这些参考生成四乘三的电影分镜图。这里提示词不需要很复杂,重要的是要写清楚剧情和整个段落的节奏。 比如我这里写到的就是,这是沙漠中的最终决斗,女猎手来到男反派所在的废墟城镇,利用高低错落的建筑结构,完成一场节奏紧凑、见招拆招的对攻。 分镜出来以后,我不会只看哪一张图好看,而是先判断他有没有试听语言的逻辑。比如第一镜是远景,用来建立沙漠空间和人物进入。第二镜用过肩,是为了建立两个人的方向关系。第三镜给反派特写是为了让观众先感受到压迫感。 第四镜让你猎手拔剑是进入动作之前的节奏点,所以大家拿到故事版以后不要直接拿去生成,而是主要看三个东西,空间关系是不是清楚,动作方向有没有延续,紧别,有没有推进。如果有需要修改的镜头,可以再次对话让他去修改故事版。 建议大家在创作的过程中始终保持让自己去判断分镜的习惯,这一点会很重要。 接下来请注意,这张四乘三的分镜不能直接整张丢给 cds, 因为 cds 二点零单条最长就是十五秒,所以我会把它按行裁切。一次只用四个关键镜头去控制一段十五秒的视频, 然后我们就可以开始写图声视频的提示词了。选择全能参考模式,把我们已经才切好的故事版和人物图上传并引用后,我会把十五秒拆成几个三秒左右的段落,每一段都写清楚景别、角度、运镜和人物调度。 基本上大家就沿用分镜头中生成的镜头描述,并稍作修改即可。生成完以后我们会发现从一致性和镜头语言上来说,这条十五秒的视频都有很出色的表现。 接着同样的方法就是做第二段、第三段,第一段建立战斗关系,第二段进入胶水,第三段升级冲突,最后三条放到时间线,就能形成一条四十五秒左右的完整片段了。 讲完了基础用法,我再和大家补充几个使用上的关键点。如果我们需要视频有很强的人物一致性,比如说大范围的镜头运动或者是激烈的打斗,那在前期的时候,我们可以先去生成人物设定图,并把它加入到我们的全能参考阶段。 大家会发现无论镜头角度怎么变,人物都能够去保持一致性。另外段落之间的衔接也很关键,比如有时候前一组十五秒的视频和后一组十五秒的视频,由于是单独生成的,所以镜头无法很好的衔接。 那解决方法就是我们在第一段视频生成完以后,截取这个视频的最后一帧,然后把这一帧高清放大,再作为下一段视频的首帧参考上传, 并在提示时中强调画面开始与这张图片,这样第二段视频的开头就能衔接上一段的人物位置、动作方向和画面光线。 这里还有一个导演思维的抉择点,尾帧我们可以不用截在动作完全结束的时刻,而是截在动作即将要发生的瞬间。比如说我们的最后一个镜头是武器即将碰撞, 角色刚要转身的时刻,我们就可以选择它来作为我们的伪真,因为一个未完成的动作会给下一段一个继续发生的理由,这也就是我们剪辑当中常用的动式剪辑。 最后,当你生成完十二个镜头,如果你还想继续往下做,我们可以上传第一张分镜图和人物设定图, 让 emh 二继续生成下一页,四乘三分镜续写故事。这里的关键是,如果有新的场景,我们需要同步上传新的场景图片,这样我们就可以保持人物场景和镜头的风格一致性,无限的去延伸我们的故事。 所以这套流程的重点还是把 ai 视频拆回了导演的基本工作,角色设定、场景构思、分镜设计、人物调度、段落内容剪辑点等等。 视频模型在我看来肯定会越来越强,但是不变的还是试听语言的底层逻辑。我们还是要去判断这个镜头为什么存在,我们的人物关系有没有建立,动作方向能不能接住,以及我们的节奏有没有在推进。 好了,这就是本期视频的所有内容了,这套流程的工作文档和提示词我已经都整理好了,免费分享给大家。评论区打上 ai 工作流,分享给你。我是单专注于分享导演视角下的 ai 影像心得,我们下次见啦,拜拜!

我用刚发布的 image 二,短短几句话,就可以轻松做到以前不敢想象的效果了。生图,别再硬写那些长得像代码一样的提示词了,欢迎来到四零四,我是七七,就在一周之前,人物资产图还需要长篇大论,结果 image 二发布后,我直接用几个极简词就做出了这样的资产图。 你看看这几组人物,不管是文字还是人物,都有着极强的一致性,从正面、多角度、侧面到背影,甚至连瞳孔的细节和发簪的配饰都能高度统一。这是对其他模型极致的降维打击。用它生成故事版,直接放进视频模型,就可以直接得到这样的视频, 住手, 谁懂它?不只是影视方面,这是用它生成的海报、直播截图、老照片,这恐怖的文字渲染能力和逻辑推理能力,都把 ai 生图推向了一个全新的高度。 现在的 ai 已经进化到真假难辨,眼见也不一定为实的程度了。除去这些,我还整理了一昧之二更多的用法和提示词。这里是四零四,关注评论,来我粉丝群学习!

宝子们今天还是更新长视频分镜故事版,每十五秒为一个故事版,这里我只是用了一张图片做成,全场四十五秒,采用了 emage 二加 cds 二点零这种组合简直就是神,效率非常高,基本上不需要手动调节 emage 二,它就像一个真正的导演拍摄指南, 要拍摄什么,如何构图,主体应该放在哪里,摄像机如何移动,镜头传达了什么情感,以及如何剪辑训练。一妹之二让一切都发生了改变,让普通人不再去分析审美构图。镜头调度。 只需要一个简单的提示词指令,就能出一个完整的多镜头电影系列,无需任何繁琐的编辑,完整提示词已经整理好了,需要自取。只需要一个简单的提示词指令,就能出一个完整的多镜头电影系列,无需任何繁琐的编辑。接下来看成品 不祥怎么了?半月前,青天间夜观星象,见有克星犯地,作光芒相破,此乃不祥之兆。主有诸侯谋逆,翻王不轨而北离,朕是最大的诸侯!

现在一句话就能生成这样的 ai 视频,以前的 ai 视频人物一致性无法保证,人物动作也不连贯不自然,现在只需要提前准备一个这样的故事版,就能完美解决这些问题。我们先用一妹这二输入一组简单的提示词,生成一个这样的故事版,拿着这样的故事版直接去生成视频,然后你就得到了。

今天更新这条操作流程,可能会改变我们之前的游戏规则,颠覆传统 ai 视频的所有工作流。主爆一开始也不相信这套流程能跑通,结果视频出来的那一刻,我才知道,我们都低估甚至限制了 ai 的 能力。 image 二的更新将 ai 视频工作流程推向了极致, 只需要生成这样一个故事版,丢给 cds, 二点零就能出一条视频,再也不用一张一张的调整,绞尽脑汁出一大堆人物资产图和场景角度,做到了既省钱又省事。 完整提示词已经整理好了,需要自取。从想法到故事版,再到最终出视频的速度比以往任何时候都快,这是一个巨大的转变。最令人惊讶的是,它不仅仅是一张排版好看的图片。 amygd 二,它就像一个真正的导演。拍摄指南,要拍摄什么,如何构图, 主体应该放在哪里,摄像机如何移动,镜头传达了什么情感,以及如何剪辑训练。 amygd 二让一切都发生了改变, 让普通人不再去分析审美、构图、镜头调度,只需要一个简单的提示词指令,就能出一个完整的多镜头电影系列,无需任何繁琐的编辑这条视频如果大家喜欢,后续我将持续分享行业内部 ai 底层玩法,只讲干货,不玩套路,不藏私。

让你给婴儿扭扭车换个背景,做成主图,你就直接把它放到素材上,用画笔画上投影。那我问你,这效果能看吗?嗯,你回答我, 你就选中扭扭车,打开这个 ps 插件,用 gpt 生图,把它获取上传修图需求,你就写给扭扭车设计电商图,要有一个中国一到三周岁的女宝宝坐在上面,室内场景简简单单一句话,比例换成主图,比例全选画布,点击生成。 你看这样扭扭车背景是不是就做好了?文字排版?卖点全都给我们做好了,扭扭车也保持了一致性,这些小字也没有变形,很清晰。当然,这些卖点文案你也能用插件直接来修改,主图是不是就搞定了?你学会了吗?

如何保持这种真人短剧里的人物形象一致性?这是做短剧时必须掌握的一个基本功。方法其实很简单,就是先创建一个固定的角色资产,利用这个自由设计画布, 输入下面这段提示词,选择最新的深图模型 g p t image 二,很快就生成了一张人物影视定妆照。 接下来,在这张人物图的基础上,继续输入人物三式图提示词,就可以得到一张人物三式图。为了后期视频效果更清晰,还可以点击上方的高清按钮,把它高清处理成四 k 版本。 你看,有了人物的脸部特征,正面、侧面和背面,这个人物的整体形象就基本固定下来了。你还可以给同一人物换上不同的服装,方便在不同场景中进行调用。 后面做短句时,我们就可以反复使用这套人物角色资产。比如把人物三式图和空境画面结合起来,生成有人物占位的分镜画面。 如果想要更多角度的分镜画面,也可以在图片上方点击多角度功能,调整主体角度和相机角度,快速得到不同视角的分镜图。 最后再把这些分镜图转成视频,或者直接用人物三式图加空境画面生成视频。 核心就一句话,先固定角色资产,再反复调用同一个人物去生成不同的视频片段,这样真人短剧里的人物形象一致性就能保持住了。你学会了吗?快去试试吧! 爸爸回来了?嗯,爸爸回来了,咱们吃饭去。学校今天又发消息了,培训费这两天该交了。 这一杯熬过深夜,天亮了,生活还得继续。

你们是不是还在用这样的角色三十图来控制人物一次性?那你真的已经过时了,这种三十图不仅容易卡审,而且生成的视频人脸总是会变。现在用的都是这种人物角色版。人物的基本信息,脸部特征,三十图,不同表情、脸部细节、服饰特征,全部都给你标注出来, 有了这一张图,就能精准控制人物一致性了。这段视频就是我用这一张角色版做出来的,效果是不是非常不错呢?提示词和生成方法都已经给大家整理好了,点赞、关注、收藏评论区 ai 角色版直接拿 接下来教你具体操作方式,在框 p i 中添加一个深度节点,记得模型一定要选择这个,前面连接一个加载图像节点,上传你的人物形象图,输入我提前给你们准备好的这段提示词。人物的基本信息你可以根据设定自己填写 比例,选择三比四四 k 高清大图,后面再连接一个预览或者保存图像节点点进行,等待运行完毕,就可以得到这种专业的角色设定版了, 你可以把它保存下来,作为你的人物角色卡反复使用。你还可以继续添加一个 cds 二点零视频生成节点,把这张角色版作为输入连接给它 提示词输入任意的短剧视频拍摄脚本,后面连接保存视频节点,这样就可以让这个人物作为演员参演任意一部短剧了,视频中的人物全程都能保持高度一致性,学会这样的方法,就再也不用担心视频中的人物样貌跑偏了。好了,今天就讲到这里,别忘了三年难文章,我们下期再见!

你现在看到的这条短片是我用 libovie 使用一张图生成的草图分镜之后一次性生成出来的十五秒视频,人物动画表演流畅,主体一致性也能够完美保持。让我来告诉你是怎么做到的。 第一部,生成角色模型,我选择的是 mid journey niki 七,用来生成角色的质量非常高,而且可以在 libovie 里面一键直出角色的三式图, 然后鼠标往右左拽,新建一个图片节点,这里我们选择最新的图片模型 leap image, 它拥有超强的语音理解能力。接下来输入下面这段提示词,就能够产出完整的九宫格草图分镜,记得选择使用二 k 或者四 k 图像,一 k 的 分辨率可能会有点低,影响我们出图的质量。 提示词在这里我标记红色的部分尽量不要删改。我现在用的生图工具是 leb, 是 目前市面上非常强的视频生产率工具,连短距公司都在用, 很多成熟高质量的 ai 作品都来自立步 tv, 是 目前国内 ai 视频创作的优先选择。画布工具非常实用,操作流畅,工具齐全,新手入门非常友好。第三步,生成一首广告歌曲,我们打开 jimmy, 输入这段提示词,生成一段歌词,待会我们就可以让角色直接唱出这首歌。 最后一步,新建视频节点,把角色参考图连接进去,选择 c、 d、 s 二点零模型,时常直接拉到十五秒七百二十 p 分 辨率,然后输入下面这段提示词,就可以直接生成视频了。 最后来看一下动画效果是不是非常不错,这是我目前用下来最省算力的触变方式画布我已经公开了,感兴趣的朋友可以直接复制使用离谱 tv 上面公开的画布,这对我们学习效率的提升有非常大的帮助,你也来上手试试吧!

一米七二多宫格出分镜画面确实可以降低抽卡费用。我这次用快乐马做了一条丧尸来袭的预告片,上来我就直接用剧本加风格提示词,加一米七二进行多宫格分镜。纹身图我本来升了故事版,感觉效果不太好,还是去跑分镜九宫格了。三毛一张跑了八张,最后选了这个,我觉得是最合适的质感和色调,然后再用这张图去细画分镜版。 我一般会用九宫格功能里的首尾针连上两张图,加这段的句型,选十二宫格直接出出来的图,再标注编号,用提取出来都可以擦清了,这样就能省一笔。 we thought prayers would work。 然后同理再去考其他的画面,提取出来的分镜画面加剧本考五秒一个的视频。像这种图图不错,好像要被一样的,我都会点击下面的图稍微 p 一下, 然后拿到满意的图片再跑视频。这个功能简单,调色还挺好用的,也不用下载图片切出去换软件做了,最后再用一米 g 二跑一张封面图,全球用了挺多自用省米小技巧,如果你也有说法,可以评论区交流下。

你买这模型除了能生成高质量图像外,现在还能生成像,这可自由编辑移动、放大、缩小元素、分色图线,甚至就连文字也能随便修改,这无疑又将延伸度可信推向又一高度。那今天就带来买这有三种核心玩法,第一个,第二套图, 我们通过自己的第二产品参考图,那我这里呢,用到新六等词,直接选择正图片 v 二模型,在我亲测下来,这个模型就相当于买这接着直接插入第二模型,可直接插入第二个详情页就有了。 记着按下自己的编辑元素,这时你就可以对按下这个图像进行自由编辑,无论是放大缩小还是移动位置,都可以点击编辑文字,还可以对图像的文字进行自由编辑。 第二个,品牌全案,在电脑框输入这段提示词,那这段提示词呢?是我在反复测试下来生成图像质量比较高的,你也可以在基础上进修改、替换或是微调。点击发送后, c 六 ai 因为内置专业设计等词,就可以一次性生成一整套二十张甚至更多的品牌全案,可以看到质量也很高。第三个,毕业季经典海报, 上传一张自己的毕业照片,接着输入这句提示词,只需要听完这部分内容,为自己的信息,点击发送后,这样一个读属于自己的毕业纪念海报就有了。按下自己的放大后,就可以对图像进行最高八 k 的 画质增强,完美解决原生模型生成图像不高兴的问题。这里小鱼同学 c a 时代保持理性,也起爆抄袭,我们下期再见!

现在一句话就能生成这样的 ai 视频,以前的 ai 视频人物一致性无法保证,人物动作也不连贯不自然,现在只需要提前准备一个这样的故事版,就能完美解决这些问题。我们先用 amg 二输入一组简单的提示词,生成一个这样的故事版,拿着这样的故事版直接去生成视频,然后你就得到了。

百分之九十的人控制不好人物一致性,都是因为你没有把人物做成资产,只会用最简单的三式图模型,很难在所有情况下都稳定记住这个角色。那今天阿叔推荐你这四种角色资产卡,青色可以明显减少角色漂移。第一种,角色设定总图, 包含全身三式图、面部特写三式图,再加上角色常用道具。第二种,脸和身体组合图,一张半身照,配合人物全身三式图。 第三种,半身情绪三式图,同一个人物同一个角度,分别做开心、严肃、惊讶等表情。第四种,多宫格角色卡, 正面找,加上表情宫格用来固定脸气质和表情范围,因为你不是只给模型一句描述,而是给了他一整套能看懂的角色资产包。这四类提示词和对应势力我都给大家整理好了,我是阿叔, ai 时代,别焦虑,慢慢来,我们下期见!

做漫剧的第一步是什么?写剧情?写脚本? no! no! no! 先要生成人物的三式图,为什么?因为只有生成好自己的人物三式图,才能保证后期自己做分镜。漫剧的时候,人物在各个场景下都不会变脸、崩脸以及穿模的问题, 因为好多人生成自己的角色,只生成女主的一张正面图。但是你有没有想过,只有正面图的话, ai 是 识别不到你在其他镜头下的脸部信息,他不知道你的这个女主的侧脸是长什么样,面部轮廓大致走向是什么, 所以一旦换了一个镜头,换个角度,女主的形象就会变了。所以呢,我们展开一部漫剧,首先就要生成好我们的人物三世图。现在生成三世图最好的 ai 工具就是一魅之二, 它这里面接入了一魅之二,还有 nano banana、 吉梦这些 ai 工具,一站式搞定,再也不用来回的切换各种软件。而且 还有你们最关心的问题,价格怎么样?以魅之二生成一张图片只需要两个积分,也就是两毛钱不到的价格,直接把人物的基调定好了,不满意再抽卡也不心疼。具体操作呢,首先在 ai 模型这里选择以魅之二,采用纹身图的效果,我们随便输入几个提示词, 你们看生成的效果就这么好,把人物的正面、侧面以及背面都已经给你展现出来了,而且你们看他正面和侧面的人物完全是长得一致的,面部没有崩坏,也没有穿模和多汁的这些问题, 仅仅是这么简单的话语就能生成这么高质量的照片,那我们把体字词详细一些,生成出来的人物效果是什么样子呢? 你们看生成的效果,有真人的,有动漫的,而且生成的细节都非常的好。我们看这个真人的三式图,完全是没有那种 ai 的 味道,给人一种很自然的感觉,所以我们这样的人物三式图就已经做好了,很简单吧。后续呢,一键去生成视频,给他一段提示词,我们来看一下他的生成效果, 这样视频生成出来的效果呢,就能很好地解决令我们烦恼的人物一致性问题。我是新月小丸子,对 ai 视频感兴趣的可以点赞关注私信我。

现在不会有人还在花钱请模特拍视频做版图吧,我做的这个工作流呢,只需要点击运行这个按钮,那么十分钟之后就可以生成像这样的视频和版图。 怎么样?不仅是效果很不错,和我们上传的这个服装的一致性呢,保持也是很好的。 那接下来呢,我就一步步拆解这个看起来复杂,但是也是很好上手的工作流。那现在呢,就拿上我们的大纲开始搭建,我们来到一个新的开发界面,点击下方的注是把我们的大纲给它粘贴过来。这个大纲呢,我们之后的搭建会更加的清晰一些。我们先把结束节点放在后面,不用管它, 我们来看到开始节点的一个配置,我们需要场景产品图和我们的散里需要的用到的 a、 b, i、 k。 那 这里还缺少两项,我们给它添加上,把它们的变量名呢,都给它改掉 一个场景。第二个是产品图,第三个就是我们的 api k, 这里的场景呢我们是用文字进行描述的,那产品图呢,就是要让我们上传我们的产品图,那这里的变量类型呢,就需要更改一下,我们滑到下面的 file, 找到 image, 这样开始界面就配置完毕。 那我们就先来看到第一步,因为上传产品图件和这个模特场景是我们在试运行的时候需要用的,我们现在就不需要管它来看。第二步,这里我们要生成正某人民图片十张,以及不同角度的图片提示词,那这里呢就需要一个大模型节点来帮助我们点击添加节点,找到大模型, 连上之后我们给他先改个名字,好,这里我们配置一下。模型呢, 我们要选择带有图片理解的,这里我们选择这个二点零 pro。 输入呢,我们要拿到一开始的场景,这个是用文字输入的,可以直接拿到我们开始的场景 自学理解书呢,我们这里加上一下。拿到我们开始的产品图片,下面的系统提示词呢,也是最重要的一款,因为它决定了我们初读的好坏,这里呢,我们把校好的提示词给它复制进来,可以看到我们这里使用的是英文,因为使用英文呢,对于我们后面生图的用的 e, m, g, r 比较友好,所以呢我们就采用英文的方式。 用户提示词,这里呢我们按住 shift 加左花括号键,注意是在英文状态下,这样直接可以看到它弹出来了两个,我们把这两个都给它引入进来,然后给它稍微备注一下, 好输出,这里呢我们一共要输出两个,一个是我们正面人物图片的提示词和十张不同角度的照片的提示词,那么这里我们要再加上一下,第一个我们就拿到 不同角度的提示词吧,这里呢因为是十张,所以呢他要以一个组合的形式输出,所以这里呢我们需要字母上数组的形式,我们点击 找到而瑞再找到这个 string, 下一个呢就是我们正面图片的一个提示词,因为这里只有一张,所以我们保持原来的样子就可以了。最下面的异常处理呢,我们把它设置为六百秒,同时两次呢备选模型,我们也选择一个带有图片理解的就可以了, 到这里这个大模型的节点就配置完毕了,我们看到第三步要根据提示词呢生成正面图片和生成不同角度的图片。对于我们要添加身图的插件,我们在插件里面搜索, 我们找到这个 gt 二桌面生成,把它添加进来。在这个插件之前呢,我们还需要另外一个插件,我们需要一个格式转换的一个插件,用来适配我们这个图片链接数组的,也就是参考图片的一个格式。这里呢我们点击添加节点,点击插件也是在这里搜索, 我们找到这个剪辑小助手,因为这里我已经收藏过了,所以呢我就直接在这里使用。在这里我们把它点开,找到 s t r to list, 好 把它添加进来,先给他改个名字, 然后都给他连上。这里呢就拿到我们开始的一个产品图片,因为要把它的格式给他转换掉,这个深图插件呢,我们也给他改一个名字。 配置这里 k, 我 们拿到最一开始的 a p i k。 提示词呢,拿到我们的 大模型给我们的正面提示词这一项,就不需要管它。这个参考图片呢就拿到我们之前图片格式转换后的个输出,这里的比例呢根据自己的需求进行设置。这里呢我就用九比十六异常处理这一块,给它改成六百秒, 按住他这个处理超时,然后进行报错。正面图片生成之后呢,我们还要十张不同角度的图片,所以这里呢我们需要一个批处理的节点,这里有一个批处理,可以让他批量的把我们生成图片。 在这之前呢,我们还需要一个代码节点,使用它的目的呢是可以把我们之前上传的产品图片和我们后面生成的这张正面图片进行一个整合,然后呢再让我们后续的十张不同角度的图片进行参考, 在这里我们先把它都连上代码节点这里呢我们先给他改一个名字。 配置这里我们要拿到开始的产品图和我们的生成正面图片,所以这里还需要一项填加上一项,第一项拿到我们开始的一个产品图, 第二项拿到我们生成图片的一个链接,然后在代码节点这里,我们点击这个编辑,把原来的这些代码都给它去掉,把我们写好的代码复制进来。这下面的输出呢,我们只保留一项, 把这个变量名呢给它改成我们这里的这个名字,这样就可以了,因为我们聚合了两张图片,所以变量类型这里呢我们也要使用字母串的数字的形式, 这里 array 这样设置就可以了。好,那我们现在来配置批处理节点,先给它改一个名字, 好在 p 处理体这里的内部呢,我们也是需要这样的一个节点,我们把刚才收藏的给它添加进来,两边给它连上,然后就给它先改个名字, 好,这里呢 p 出一体的上部,这里我们变形运行数量给它改成三,如果太多的话呢,它可能会出现报错。输入这里呢,我们拿到之前生成正面和不同角度记事词的一个记事词 输出,这里呢拿到生成十张图片的一个链接,接下来配置一下这个图层的节点, k 依旧是拿到开始的 k 提示词呢,这里就要注意拿到批量生成的一个输入,也就是第一个参考图片呢,拿到我们刚才图片聚合的一个结果, 然后比例呢和我们之前设置的比例一样就可以了,异常处理依然改成六百秒, 同时次数呢改成两次,在这里呢我提上一点,在开始节点,这里呢产品图其实是可以上传很多张图片的,我们只需要把变量类型给它改成, 点击 array, 点击 file, 再找到这个 image, 这样就可以上传我们多张图片,有很多的细节呢,它也是能复现的, 那下面我们就看到第四步,要根据正面的图像生成九宫格分镜图片的计时词,这个九宫格分镜图片呢,是我们后来准备给这个视频生成需要用到的东西,所以这里呢我们要再添加一个大模型节点, 这里我们先给他改名字,然后给他配置一下,这里呢我们使用这个快一点的也是可以用的,用这个一点六极致速度。 因为这里呢我们只参考一个正面图像,所以这里的文字输入我们是不需要的,只要加上一个视觉理解输入就可以。然后拿到我们的生成正面图片的一个链接, 那这里我们也是把最关键的系统记事词给他复制过来,那用户记事词这里也是按照刚才的方法设置,加左括号键,拿到这个链接异常处理,这里我们也改成六百秒。 好,下面呢看到第五步,要根据这个九宫格的图片记事词呢,生成九宫格的分镜图片,那这里呢我们依然用到这样的一个插件,把这个 m g r 给它添加进来,先改个名字, 配置呢和我们之前都是一模一样的,这里呢我就快速操作一下, 这里第五步也就结束了,这个大纲有点挡了,我们把它拿过来,好看到第六步,参照九宫格的分解图片呢,生成一个视频提示词,因为我们后续的这个 cds 二点零呢,也是需要一个提示词的,所以这里呢我们还是需要一个大模型节点, 我们添加节点,然后把刚才的线给他连上,依旧呢先改一个名字, 好,我们配置一下,因为这里的输入也是只有我们的九宫格的一个分镜图片,所以这里的文字输入我们是不需要的。在视觉理解这里加上一项,拿到我们刚才的生成的九宫格分镜图, 下面的系统提示词呢,我们也给他粘贴过来,用户提示词依然用刚才的方法, shift 加左滑括号键,拿到这个链接,然后改最后的异常处理就可以了。 好,这里第六步就完成,我们看到第七步,根据视频提示词使用 cds 二点零生成视频,在这里呢我们就需要添加一个插件,在插件里面搜索,找到这个快速版,这个呢就是我们的 cds 二点零,我们把它添加进来,依旧先改个名字, 配置呢和前面的图片提示词。这边提示词的一个输出 时长呢,我们设置一个十秒钟吧,这里最好不要低于十秒,如果设置时间多呢,后期我们可以多跑几个,然后进行剪辑也是可以的。这个参考素材拿到我们刚才的九宫格分镜头的一个链接模型,我们保持默认比例, 我们和刚才的是一样的,用一个九比十六,这里我们也保持默认就可以了, 那这里第七步也就完成了,我们来到第八步,因为这个视频时间是有点长的,所以我们要查询他是不是这个情况,所以这里呢我们要添加一个循环节点,先连上之后我们这里呢使用无限循环,因为要不断的查询他的视频到底有没有生成出来,中间列表,这里呢我们加上一下, 因为我们用通过查询他 id 的 方式可以知道他有没有生成出来,所以这里我们拿到这个设置视频节点的一个 id 循环体,这里呢我们需要一个查询任务的一个节点,在插件里面找到我们刚才的快速版,这里点开之后把下面这一项添加进来, 先改个名字,这里的 id 呢就拿到循环刚才传进来的一个 id。 那 么在这个查询任务这个节点的后面呢,我们还需要添加一下这个选择器,因为我们要让他判断,如果他生成出来了,我们就让他终止循环,如果他没有生成出来呢,我就让他继续循环, 所以在这里拿到我们刚才查询任务的一个链接,如果链接是空的话呢,那我们就让他继续查询, 在继续查询的时候呢,我们不能让他一直一直的去查询,因为这样的话他也是会报错的,我们让他隔一段时间去查询一次就比较好。所以这里呢我们也还要一下在插件里面搜索电视机, 这个呢就是我们的计时器,把它添加进来,改个名字,这里的时间我们设置为六十秒,等他一分钟查询一次,如果说他没有查询出来呢,就让他继续查询,那如果选择器这里他查询出来了呢,这里我们就要加上一个,哎,中指,中指循环这个节点, 这样就没有问题了,那循环这里的输出呢?我们拿到查询任务的一个链接,这样呢我们整个的工资流也就打印完毕了,我们把结束结链也拿过来, 连上之后,他需要拿到两个东西,一个呢是我们生成的十张图片,第二个呢就是我们生成的一个视频,所以这里我们先拿到我们生成十张不同图片,再加上一下, 拿到我们循环出来的一个输出,也就是刚才查到的一个链接,这样就完完全全的配置完毕。这里如果有认真看的朋友呢,可能会发现一个细节,这个生成图片的这个节点呢,他的这里是黄色的,还有生成这个视频,这里呢也是黄色的, 这里呢其实是让我们在这两个节点前分别各加一个图片格式转换,我们依旧添加上格式转换, 这个就要拿到正面图片的一个链接,这里还需要一个同样的先改一个名字, 好,这里呢拿到我们刚才九宫格分镜图的一个链接,这样做呢是为了可以适配他这里的参考图片,所以这里我们生成视频,这里就拿到 刚才的格式转换三的一个输出看,这样他就没有问题了,这个也先给他改一下格式转换二的,如果不这样设置的话呢,那么在他传入的时候,他得到的就会是一个控制, 那现在我们就点击试运行,那么这里呢?我已经上传好了几个参数,用的是这样一个图片,配上一个咖啡馆的街景,我们点击试运行,看一下他的结果怎么样。 那这里呢,可以看到我们的结果已经出来了,我们的图片和视频也就在这里,但是因为这个图片实在有点太多了,我就把它们都下载下来,统一放给大家看一下 怎么样,效果是不是非常的好。现在有了版图和视频,那么再搭配上相亲页的话,宣传也就是一步搞定了。那么好,今天的工作的分享到这里就结束了,我们下期再见。

hello 大家,我是太阳 openai 的 emoji 二绘图模型前阵子正式发布了,我呢也是从灰色开始一直在研究它的用法。在深度体验之后得到一个结论,设计师的工作流程真的可以改变了,再也不需要像原来一样在 ps 或者其他修图软件中反复改图和甲方拉扯,而是只需要聚焦在审美上, emoji 二模型就可以帮你把所有的繁琐细节全部搞定,设计师也更像设计师了。而这里呢,我也为大家总结了 emoji 二模型的二十种超强用法,大家只需要直接使用我的提示词就可以得到。这样这样还有这样的效果,目前来说,它没有平替,都是独家能力。 ok, 我 们现在开始吧。 首先我来总结一下 emoji 二模型的能力。一句话来说,它支持图像生成、图像边界以及基于图像理解的辅助创作。在官方的文档说明中, emoji 二可以帮助我们做到图片的局部修改、整体重绘、风格迁移、文字替换、产品图优化、信息图生成等等很多效果。 在哪里可以用到 excel 二呢?只需要你有一个 check 的 gpt 账号,就可以直接在网页版中使用了。因为现在这个模型是全量测试,所以即使是普通账号,每天也是有少量的生成额度的,而随着订阅的等级提升,生成的额度也会增加。那这里我们要如何调用这个模型呢?非常简单,只 需要在 check 的 gpt 网页版中说明要生成图片即可。这里也有标准的提日期模板,我们只需要遵从场景到主体到约束再到用途的这个结构去书写提日期即可, 这里我也会放上标准的格式模板,大家也可以参考这种写法去把自己的想法告诉 ai, 让它基于这个结构做二次修改就行了。 ok, 当讲清楚了如何使用模型之后,接下来我们再来说说 emoji 二的一些独特用法,这里我将会按照设计领域的不同去做介绍。首先第一个是通用领域,也就是对图片的处理、编辑和重构。 emoji 二可以对图片做到局部修改、整体重绘、风格迁移以及多图合成的效果。 比如这里,我想要将这张参考图中的汽车改成保时捷九幺幺,那么就可以直接用我这组提示词能看到出来的结果,完全还原了原图的构图角度,整体的氛围和光影。 只是汽车变化了这一块在一些编辑场景中是非常实用的。同时模型还可以做到整体重绘,比如我想让这张参考图全部变成水彩画的风格, 那么只需要使用我这一组提示词就可以做到这个程度。并且呢,如果我们看上了一些好看的绘画风格,想要迁移到我们自己的图像上,比如这里,我想让图二的这种莫奈油画的风格迁移到图一上,那么就可以用我这组提示词可以看到整体的氛围和笔触呢,就完美延续到了参考图的那种质感了。 在做一些图片的艺术化处理的时候,它也非常好用。同时除了做这些基础的图片处理之外,我们还可以利用 emoji 二做到多图合成的效果,再做一些视觉主图的时候,它也会非常的强大,比如这里我在网上找到了这三张图片,我希望把它们结合在一起去做成类似在公园里随手一拍的画面质感, 那么就可以用到我这种提示词,可以看到模型就会给到这样的结果,整体元素之间的融合度和氛围处理的非常不错,基本上也看不出什么 a i v ok, 以上就是一些基础的图片处理方面的势例了,而除了这一块呢, emoji 二在海报领域的效果也是非常炸裂。在传统的流传中,做一张海报大家都知道是非常的复杂和消耗精力的,经常需要做很多版以及经过多次修改,很多时候还需要和甲方改来改去。 不过如果能够巧妙使用 emoji 二,那这些都将不在话下。比如这里我想要给胖东来的这款啤酒做一个海报主图, 我们只需要随手拍一张产品的实物照片,接着再使用这一组提示词就可以得到这个结果。可以看到整个成品的完成度非常的高,如果使用人工处理可能需要做个两三天,而这里我们只需要等待十几秒就可以得到了。再比如呢,我还想给阿迪达斯去做一个海报,那这里就更简单了,连参考图也不需要, 只需要用上这一组提示词就可以得到这样的结果。或者我们要给食品店的某一款食物做海报,那这里也是一样,直接用上这组提示词就可以得到这样一张看起来非常诱人,同时还能指出各个部分的食物名称的高品质海报了。 或者这里大家如果还想要给自己的城市创建一张海报的话,那么则可以使用我的这组提示词,就可以做出这样的双重曝光的海报效果,看起来是不是也非常好看呢?而页面卷除了对真实质感的海报处理的非常到位之外,在动漫风格上做的也非常的不错。 比如这里我想要给明朝的新角色飞雪做一张角色海报,那么只需要给到模型一张基础的角色设定图,然后再加上这一组提示词,最后就可以得到这样的角色海报效果。 这一块我相信已经不输任何的专业设计师了,看起来整体的感觉非常的棒。 ok! 以上就是 image 二对于海报方面的使用方法了, 接下来我们再来说说品牌设计方面,这一块也是 image 二的一个超强能力。在有的时候我们在做一些品牌 logo 或者样机的时候,手动去想构思或者整个品牌体系,以及对 logo 进行样机贴图的话,会非常的累和浪费时间。而这里我们只需要善用 ai, 这些都可以得到很大的改善。 比如这里我想去做一个品牌 logo, 同时对它做一些延展,去得到一个完整的设计系统,那么就可以使用我的这一组提示词,让 ai 帮我们全盘考虑, 从 logo 的 造型到整体的设计规范,再到最后的落地效果, ai 都可以帮我们搞定。可以看到最后它给了我五张图,它们都是我在提示词中讲到的不同部分, 从 logo 的 造型设计体系,线上的 app 和网页 u i, 再到线下的展台和各种小物件的品牌规范, ai 全部帮我们一键搞定,并且最重要的是其中的一致性非常的高,基本不用担心前后不一致的问题。 通过这种方式呢,我相信设计师在创建品牌标识系统的过程中,难度将会直线降低,只需要把时间全部用在创意上就行了。同时除了这个之外,我们还可以对 logo 做一些其他的创意性的处理,比如使用这一组提示词去做到 logo 的 毛绒效果,在做一些创意性工作的时候也会非常的实用。 而除了品牌设计之外, emoji 还有一个最大的优势能力,那就是它在图文内容的结合以及对于文字表现的准确度上,相比之前的所有绘图模型有了一个断档式的领先。 这个能利用在电商详情图或者一些信息图上就会非常的合适。比如这里我想给这款自行车做一个电商网站的相亲图, 那么只需要提供产品的基础图片,同时再用上这一组提示词,就能够得到这么多的电商详情页。可以看到在主图拆解图以及参数数据的设计上,整体的水平都达到了一个不错的地步。同时除了电商详情图之外,有 mag 二的图文能力,用来做一些教育图解也非常的合适。 比如这里我想为大家讲解内燃机的工作原理,那么就可以用这一组提示词,最后就可以得到这样完整的内燃机工作原理的图解。可以看到其中的文字密度非常的高,但是呢它并没有出现渲染错误,整体非常的规整,插头的设计也非常的合理,看起来非常不错。或者呢,这里我还想去讲一讲剑齿虎的一个完整信息图, 那么则可以用上这一组提示词,就能够得到这样的完整清晰图。同样的,其中的主题也可以换成任何我们想知道的领域,比如这里,我想让 ai 帮我梳理一下第二次世界大战的指尖线,那么就可以直接用这一组提示词,最后就可以得到这样的信息图效果。 巧妙运用这些模型能力呢,在教育行业将会产生意想不到的效果。 ok, 以上就是 image 二在信息图上的用法了, 不过呢,这里还有一个更加进阶的用法,那就是对生成的图像进行拆分。在有的时候,我们可能会需要对生成的图像再做一些二次处理, 这里我们就可以继续只会模型对生成的图像进行主体元素的拆分,并且让它输出为 psd 格式。是的,你没听错,页面 g 二可以直接输出 psd 格式的文件,只不过呢,这里我们需要做一些小小的设置, 我们只需要在网页端点击侧边栏的更多按钮,接着在出现的界面内点击这个 ps 的 图标,点击链接, 这样就可以得到生成 psd 文件的能力了。这里呢,我也是准备了一张咖啡的风味信息图,我想把其中的元素都拆分一下,并且输出为 psd 文件,那么只需要使用我这一组提示词,最后就可以得到这样的 psd 文件结果。通过调整其中的图层,可以看到所有的元素也都是分层的, 这样对于想要调整一些局部的效果或者调色来说将会非常的方便,同时模型除了支持 psd 之外,它还支持 svg 格式的输出,这个也就是矢量的路径格式。比如我们有些时候使用 ai 做了一个 logo, 这里我就用之前的那个品牌规范图举例,如果想要将其中的 logo 转换为矢量的 svg 格式呢? 只需要用上这一组提示词哎,就会直接将其中的图像转换成为矢量路径的 svg 格式,这样在一些网页或者设计稿上就可以直接把它作为资产使用了,非常的方便。 ok! 以上就是 image 二我总结的一些超强用法了, 大家看完之后是不是会有所启发呢?通过这些独特的用法,我相信完全可以颠覆目前现有的设计工作流,将 ai 融入到设计当中,进而提高效率。而在目前这种 ai 技术日新月异的时期,我们能做的就是去尝试了解并且将它们融合到自己的领域,这样才可以将生产力最大化的提升。 ok! 以上就是本期视频的全部内容了,如果有帮到你的话,可以上联加关注支持一下,你的支持就是我更新的最大动力。同时本期的所有案例提示词和视例图片我将会免费分享给喜欢 ai 的 同学研究,如果有任何问题的话可以随时私信我,我们下期再见!

最近 image two 爆火,然后对于它的身图呢,是真的提升很多,原本很多用香蕉的一些场景呢,我现在都用 image two 来代替,比如说它的中文生成能力很强,比如说香蕉它生成的这个图片,它的中文是有错位的,我就直接让 image two 帮我去优化,它的效果呢,我觉得是非常好的,也是非常方便的。 然后呢,最近很多小伙伴呢,都用它来做这个 ppt, 因为它可以生成 svg 格式,就可以在 ppt 中进行编辑,但是真的有那么好用吗?首先呢,我们可以用这个 ai 生成的 ppt 脚本, 这个呢我上一期有讲过,大家也可以去参考。然后呢,利用他的脚本,你可以让 emoji 去生成一个统一的风格,你只需要让他去生成一页,然后如果你不满意,你可以让他换一个风格,直到你确定以及你喜欢的这一个风格形成。以后呢,你可以把剩下的这个所有的脚本的投喂给他,让他一次性生成 接下来的图。我实测下来几个版本呢,也是发现它生成的不仅是从图文的排版结构啊,都是非常满意的。但是如果说你有不满意的,你让它生成 svg 格式或者是 ppt 格式呢,我觉得实测下来还是会有一些错位的问题, 所以我觉得这里比较好的方案呢,是我们先去找源头你,你可以先去确保你的这个脚本是没有问题的,你脚本的每一个文案,每一个字都是没有问题的,然后你再让它去统一生成一套 ppt, 那 这样 这个初稿生成出来呢,你改动不大,针对于你需要去改动了,你可以让它再去生成这个 svg 或者是 ppt 编辑格式。这里呢建议大家多生成几遍,你可以把你觉得生成不好的地方直接再次投喂给它,让它根据不好的这个图片,然后再去重新优化。 我测试下来呢,到第三遍左右呢,它可以保持着比较好的排版,相对来说我们的改动也会比较少。但如果你需要这个一次性一键去改动,我还是比较会选择上一期这版的内容,拜拜。

这是做动画效率最高的一集,只用了一张图片,我就在 live tv 搞定了人物角色图,现搞分镜图,最后,主体一致性也表现得很自然。 oh my stars yes, you must give me the recipe, it's all about balance madam now, what is this the grand finale? 关键是所有流程都出现在一张画布上, 今天一个视频教会你做出同款效果。首先呢,我们先确定人物角色,输入这段提示词,把整体主要的两个角色风格确定下来。这里呢,我选择的是 image 二。 同时呢,我们可以在这里调用工具箱里的角色脸部三式图以及角色三式图功能,把人物的形象饱满度确定下来之后呢,对保持角色的一致性很有帮助。 第二步,生成分镜图。根据故事脚本,配合我给你的这段提示词,就可以调用 image 二生成一个故事版 分镜图。仔细看,有了前面多视角人物图的积累,在分镜图的人物表现一致上就表现的很自然。最后,我们再拉动这个节点,调用视频生成功能,选择 cds 二,让它严格按照生成的分镜图生成效果视频我们来看看效果 啊,整体来说非常连贯,完全跟我们平时看到的皮克斯动漫风格一模一样。 而且啊,最重要的是,整体流程都在一张画布上进行,不需要来回切其他三方工具,就能把各种热门模型囊括使用,使用起来效率真的很高。那感兴趣的朋友赶紧去试一下吧!