粉丝7.1万获赞49.5万

逼自己一周练完 ai 制作漫剧视频,纯干货,无废话,存下吧,前一百集完整版真的很难找齐了!警告,本视频耗时三个月制作,制作时长三百五十分钟,陪你系统的学习 ai 漫剧制作,这应该是目前抖音最良心的入门到进阶的 ai 视频教程了,哪怕你是零基础也能轻松学会。 哈喽,大家好,这节课我将带领大家根据脚本来生成对应的分镜头,那么在教学过程中用到的指令呢?我都已经给大家整理完毕, 如果有需要的小伙伴呢,记得在评论区输入三三三,打包带走一个完整的分镜头。它应该具备哪些方面呢?首先是景别,景别,又包括了近景,中景,远景 啊,特写还有全景,这些都是景别。那么还有画面主体,画面中所包含的人物事物,还有所属的环境光影。光影就包括了,比如说现在处于白天还是在夜晚,他的主光源有什么?副光源又是什么? 氛围光有无?然后它的光照的方向又是往哪边,这些都是光影色彩,色彩包括了主色调是什么,有没有对比色呀,有没有情绪色,还有构图,包括了居中构图,对角线构图, s 型构图等等。然后还有我们的一个镜头的角度, 比如说第一人称视角啊,哎,我们的一个无人机视角啊,鱼眼镜头啊,过肩镜头啊等等等等,非常的丰富,需要更多专业提示词的同学们可以在评论区置顶来找我领取。 好,我们来看一下第一个风景,我已经把这个表格整理出来了,第一个风景呢,是仓库的一个场景 啊,无人物我们就可以直接使用它给到的画面描述进行生成,帮我生成图片,远景 工业风装修,高档的货架,贴满菱晶箱,灰色的防滑地砖啊,这里都是跟刚刚描述是一样的,还要说明一下,生成的图片的比例是十六比九,看一下它生成的这个效果, 虽然这个景别里面他是标注了愿景的,不过呢,大家对 ai 生图这方面比较熟悉的话,就知道有时候我们不去特意的描述,但是他生成的内容是像这种室内环境的,这种啊,他通常也会采取合适的景别生成的效果呢,也会比较合乎我们的心意, 这个风景很好做,我们直接来看一下第二个风景啊,中景画面的人物里面有林晨,林晨抱着仓库里的这个林经箱往货架的方向走去,往货架方向走去,然后呢,同时这里的画面描述还有他的一个身形啊, 面容的神态,哎,衣服上的灰尘,箱子表面的光泽可谓是十分细致。 那么问题来了,有经验的小伙伴都知道,凌晨抱着箱子在仓库,这个画面很好解决,现在这个大部分的 ai 声读工具他都能用,多读参考。 我们就直接把刚刚的一个仓库的场景图加上凌晨的这个人物设定图,我们把它都上传给 ai, 要求他用图图 图一中的少年和图二中的少年弯腰抱起什么什么东西,然后处于这个图二这个场景中的这个角落中去,这样子描述很好解决, 你看这个画面就很好生成,但是他在一个人物在画面中占比这么小的时候,大家可以看一下这个人物呢,在画面中占比才三分之一不到,人脸在画面中的占比更小, 那我们来仔细看一下他的这个画面生成提示词的描述啊,额角有细小的汗珠,在人脸占比情况下,这么小的时候,怎么能连额角上这个细密的汗珠都能看清呢? 所以像这样的一个生成画面,我们就无法在同一个分镜头中实现,我们至少要把它分成两个画面,一个画面呢是凌晨工作时候的画面, 另一个画面才是去特写他的面部神态,以及他额头上细密的汗珠这种细节上的画面。所以同学们作为创作者,作为导演, 在拿到剧本脚本以后,最好呢能在脑海中先预演一遍我们预演过后的合理镜头,往往更贴合剧情的需要。还有就是大家在深圳分镜的时候呢,也需要对分镜做出取舍和修改。比如说我们来看一下第三个镜头, 凌晨又是放下箱子身体微颤,又是擦汗后眼神放空,然后变得坚定。这个镜头呢,明显是为了表达出主角的辛苦和隐忍,但是我们前面已经有主角啊,他很疲惫的镜头了, 那就显得非常的重复。后面呢,大家看过前面的这个剧情呢,也都知道他后面呢,还有被羞辱的环节, 那他也有一段啊,表现出隐忍和决心的镜头,那这是否呢,就会显得过于迂杂,这都是我们要考虑到的。以及我们第四个镜头中哈反派三人组,他组团登场的这个画面。照恋呢,他穿着什么样的这个精英制服,他的身后跟着两个跟班,然后 一起出场了,然后这个时候凌晨他正准备继续搬箱子,然后反派呢,又过来故意的撞了他的肩膀,短短的一句描述啊,又要实现反派的出场,又要看到主角在干苦力,又要有肢体的碰撞, 那么实际上这一段也是要分成两到三个画面来实现的。我们可以先思考一下这一段画面能用什么样的方式来实现。这里不仅要考虑到的是静态的分镜图,还要考虑到生成视频的实际可能性,那这就要求我们对各个视频生成软件的特点了解透彻了, 这是我们下节课要讲到的内容,刚刚我们说到对分镜的取舍,那我们再来往下做啊,先跳过第三个镜头,直接来看这个第四个镜头, 他这个画面中啊,第一个是要实现的是反派三人出场,这里呢还是要用到多图参考的功能,我们要上传仓库的场景图 以及反派的人设图,我们要求他生成图一中的这个男子带着两个跟班从图二中的这个仓库环境的大门这外面走了进来, 要求他生成这个图片。因为我想要显得这个反派很有气势,所以我额外的要求他使用低视角的这个仰拍镜头来展现这个反派的压迫感, 然后生成出来的效果啊,就是这个样子的。同学们可以看一下同样的画面内容,他在不同的镜头角度的对比,这个是原图片,他属于是平视偏仰视的镜头, 这个是平行镜头,这是俯视镜头。三种镜头角度给观众传达的情绪是不同的,首先是原图, 他的视角为仰视,能够更加突出角色的强势,让角色显得更加高大,还更加有掌控力。平行镜头呢,他更能拉近角色之间的距离,能显出他的亲和和宽容。还有这个俯视镜头, 俯视镜头则更加突出出这个场景的压抑,虽然他也能体会到来者不善的感觉,但更多的是有一种哎风雨欲来,要出事了的感觉,而不是,而不是焦急于这个角色本身的表现,我们仔细想一想是不是这样? 那么当然,如果大家不想去专门塑造反派的更加立体的形象,而是单单的想表现出来啊,大事不好了,主角要倒霉了, 那这张俯视的镜头反而是更好的选择。一切呢,全看我们导演的个人思维,在创作之中没有作妖之解,每个人学到的知识是相同的,但是对于作品,我们都会有个人的一些魅力,一定要去多加的去思考。现在呢,我们有了反派三人组走进仓库的镜头了, 我们还要思考一下他们走进来这个动态怎么表现,不同的导演也会有不同的做法,哎,有导演呢,会再生成个反派的脚步行走的特写,预想一下,脚步声一响,反派登场,哎,对不对? 有的导演呢,直接把这张图作为尾针,哎手针不要了,去描述这三人从大门外哎走进来的这个画面,然后把这张图作为定格的视频的最后一幕,那我们还有更加稳定的方法,我们对这张图片进行智能编辑啊,在这里的 这个左上角有一个智能编辑,大家看到了吧,然后在这里描述呢,让他去掉图片中的这三个人物的角色,去掉以后是这个样子,那我们把这张被去掉人物以后的这个大门的这个场景 作为手帧,哎,再把我们刚刚的原图作为尾帧,这样首尾帧一相连,让他来一个画面外面啊,画面这个门外突然走进来这三个人,这样是不是更加稳妥,更能减少抽卡的次数了? 我直接给大家来展示一下这个效果,看一下是不是我们想要的。那讲到这里呢,分镜头的生成就已经讲的差不多了, 哈喽,大家好,在先前的课程中,我们已经讲解了 ai 剧本脚本该如何生成,以及如何根据我们所生成的剧本脚本生成对应的分镜头图片。这节课就到了正式的生成 ai 视频片段的环节了。 通常我们制作一个完整的 ai 作品,能够用到的平台主要有吉梦、可林、微度海螺。 我们以可林和极梦为主来挨个讲解。首先我们来讲解极梦平台的视频生成功能,来到极梦 ai 的 首页,可以在这个页面的最上方找到相关的生成选 项,其中它这个默认的 a 帧的模式,它能够允许我们输入任意的需求。然后平台呢,会根据已有的功能来尽量的满足在提示词中我们所输入的一个创作。我们来演示一下,我想要制作一个关于植物生长的 ai 动画, 展现出一株植物一年四季的生长变化。我们把这个要求发送给这个 ag 的 模式,看看它会有什么样的说法, 非常有意思啊,他直接帮我们分析了我的这个创作的意图,我先制作一个 ai 动画,主题是植物生长,要展现出一株植物一年四季的生长变化过程。 所以呢,他直接给我们开始了任务的规划。第一步呢是调用纹身图的工具,创造四张呃,在不同季节的这个植物的不同的状态 的这个图片。然后第二步呢,还是调用了视频生成的工具,使用了一个智能多帧的生成模式,把这四张图片的分别作为第一针,第二针,第三针、第四针, 然后针与针之间进行了一个连贯的一个生成。我们可以看到这四张图片呢,确实已经生成好了,确实也是展现的植物在不同季节的这样一个变化, 但是它的一致性不是很高,我们甚至感觉不出它是同一植物 啊。所以呢,其实啊,这个 a 制的模式它还是有很多不足,它是给我们生成内容,很多时候都并不能达成我们想要的效果。那如果我要去做一个植物生长,我肯定是要展现出同一株植物它的这个生长变化过程,那它的一个变量就 不能太多,起码比如说,哎,第一张图片他是一个发芽的一个苗,他在一个盆栽里面,那后面是不是后面的所有的其他季节的图片?这个盆栽他就 一定不要有变化,盆栽一定不要有变化,变化的是什么?变化的是他的光线,然后这个幼苗的状态,然后背景的这个季节,这才是变化的,所以他根本就啊还达不成我想的效果。 那我们看一下他给我们制作这个智能多帧的视频哈,这个效果呢,呃,确实连贯的很自然,很生动, 但是呢,也确实达不到我心目中的这个效果。所以呢,如果我们要制作 ai 慢剧的话,我们还是要使用专门的啊生成视频的这个功能,我们点击左侧的这个生成的分选项,就可以来到我们刚刚的这个生成的界面了。 然后呢,我们可以在下面对话框的左下角把这个功能呢切换成视频生成的模式。在所有几乎的这个 ai 生成平台中,视频生成都分为两个类型, 一个是纹身视频,另一个是图声视频。纹身视频不仅需要描述画面当中镜头的运动方式和事物的变化,同时也要描述画面本身所拥有的信息。我们来回顾一下生成图片时的一个提示词的结构, 我们要生成一张比较符合心意的图片,其中的信息呢,就要尽可能的准确啊,他就包括了这些,呃,提示词,就景别 画面中出现的一些事物,人物,然后所处的环境,然后画面所处的这个时间是白天夜晚,然后有什么样的光线,画面的色彩,画面的构图, 以及这个画面他的一个镜头角度。但纹身视频呢,和图上视频不一样,纹身视频呢,需要我们自行的去描述这个视频中的一些人物形象 发生的事情。图声视频呢,则是基于图片本身的信息去描述我们想让这个图片出现的一个事物的变化和运动,还有镜头的这个运动。那所以呢,我们在进行纹身视频的时候,就要尽可能的像生成图片一样,对它所拥有的一些信息和要素 进行更加精准的描述。一个三 d 形象的小男孩在公园滑滑板,这是这个平台他给我们的一个视力,我们可以直接采用一下。 现在呢,一个小孩在公园滑滑板的画面就生成了,我现在往这个提示词中输入更多的更细节的元素, 加上了时间光照,加上了景别,现在我们再来看一下 生成的效果会不会和之前有不一样。好,又生成了一个小男孩在公园滑滑板的这个场景,但是男孩的这个形象,还有这个画风, 跟先前已经是完全不一样了,我们只需要稍微的修改一下体式词中间很细节的部分,甚至呢,我们点击他下方这个再次生成,让他重新根据这个体式词再生成一个视频,他出现的这个内容可能跟之前的视频就完全不一样。 对于 ai 慢剧创作来说,不可控随机性就是纹身视频最大的缺陷。那么说完纹身视频,再来说图声视频, 我们下面来看一下图生视频都有哪些功能机制。大多数的视频生成平台这些功能机制都大同小异,所以我们就只讲极梦 ai 上的主要功能,大家在使用其他平台时,注意举一反三。这项功能需要我们通过拖拽或者点击上传的方式,将图片上传到手帧图和尾帧图的预备窗口当中。 大多数时候呢,我们会单独使用手帧来生成视频,对画面主体的运动方向有特定的需求时,才会使用到首尾帧的生成视频。比如说上节课我们说到那个反派三人组出场的分镜,那么在上传好之后,接下来就是输入提示词描述了。 不同于纹身视频,图生视频本身上传的这个参考图就已经给足了充足的画面信息,因此呢,在图生视频时,我们只需要描述画面当中事物的运动变化以及镜头运动即可。张图片是凌晨在搬动林金香的一个场景,我直接使用固定镜头, 然后画面运动的话,我就想展示一下凌晨吃力的搬动临近箱,把它放上货架的这个场景。在需要提示词之后呢,我们就直接点击生成就好。 视频生成时,会根据图片本身的宽高比来决定视频生成的宽高比,所以大多数时间我们就是上传图片描述运镜和事物的变化,然后点击发送就好了。 不会写运镜的同学呢,可以看一下极梦自带的这个运镜模板,不过呢,要把这个视频模型调整到视频三点零模型,我们才能看到这个运镜的模板哈,他跟我们自己手动输入在效果上是一样的。那趁着这段时间呢,我们来讲解一下相关的参数设置。 首先是视频生成模型,和其他的平台一样,在选择视频生成模型时,版本标号他越高的这个模型,他生成的效果也就越好,但是呢,使用的点数也就会越多, 但是呢,我们建议都选择版本标号最高的这个视频模型,即梦除了首尾帧模式以外,还有智能多帧模式和主体参考功能。而视频生成的宽高比方面,通常呢是自动匹配的, 这个刚刚也给大家说过了,时间上呢,只有五秒和十秒可以选择,当然到三点五 pro 模式还有一个十二秒,我们简单的这种镜头运动呢,只需要使用五秒就够了,时间太长的效果反而不好。 来看一下刚刚生成的凌晨搬这个箱子的这个画面啊, 像这样的视频生成,每一次的这个效果都是有一定随机性的,如果对当前的效果不够满意,可以根据当前的提示词和生成的效果对提示词的部分加以改进,或者适当的修改原图当中的某些内容。 如果只是觉得因为随机性导致生成的效果不好,我们也可以直接点击这个视频下方的这个再次生成, 这样呢就不用再编辑,直接会重新生成一条新的视频。除了大多数时候会使用到的手针生视频功能,我们还会使用到手尾针相连的生视频的这个功能,就以我们上节课讲到的三人组出场的片段来演示。 运镜上呢就不描述了,直接说明需要它生成的这个运动效果。 作为时长方面呢,我们这里可以赋予给他更长的时长哎,给整个的一周摄影效果留出充足的时间。当然呢,选择五秒钟其实也是够的,现在再次点击生成一段时间后,视频就能生成好了,来看一下这个效果吧, 这个反派造孽,看起来走起来特别的嚣张,特别的有气势,我们还可以考虑多生几次来获取更好的效果。 好,我们继续来看极梦 ai 上视频生成的下一个功能,点击下面的这个下拉菜单,然后呢就会出现一个智能多帧,此时就会多出来一些图片上传到这个窗口,哎,这里会显示第三帧,那我们要做的事呢,就是再追加一张, 我要做的是再追加一张图片,将其拖拽到这个位置啊,当然我们还可以再往后追加,此时可以看到在图片与图片之间呢有一个间隔的位置, 点击这个间隔位置会弹出一个文本的输入框,在这个呃文本框的下面,这一点呢还可以弹出一个时长,这个时长的标志是可以更改的,可以把它改到 零点零秒,零点五秒,一秒、两秒,然后甚至可以把它往后延,但是最多只能延长到八秒,就让各位导演在进行创作时会更加的得心应手。我们刚刚使用的那个 a j 的 模式, 他为我们生成这个四季生长变化的这个 ai 动画制作,实际上使用的就是这个智能多帧的 这个视频生成模式,大家可以看一下这个视频提示词,这里镜头一和镜头二之间的这个描述,镜头二和镜头三之间也有过度描述, 镜头三和镜头四之间呢也有过度描述,这个呢就是智能多帧的模式。那我们还有一个主体参考的模式,其实主体参考功能是一个比较省事的功能, 因为我们可以直接上传反派盗猎,再上传我们女主苏清月,哎,他们两个人的人设图,我们再随便上传一张场景图片,就找一下这个仓库的场景, 接下来我们就对这个主体之间进行描述,我们说图一和 图二中的角色在图三的仓库内 盘膝而坐练功,直接生成一下试试看看一下这个效果。赵烈和苏新月呢,确实是已经在这个仓库中打坐而在修炼了,但是大家可以仔细看一下他们的肢体, 然后他们的这个神态都是属于比较僵硬的,他并没有我们先生成图片再去生成视频的效果好,但是他这个人物的一致性不得不说还保持的还不错。那么到这里为止,吉梦的这些 ai 视频的生成功能就已经讲解的差不多了, 我们稍后呢就给大家来讲解一下可灵的操作。 嗨,讲完了极梦 ai 的 视频生成功能,现在我们再来说说可灵 ai 的 和其他视频生成平台一样,可灵的创作工具栏呢,也分布在这个界面的左侧侧边栏, 可林的这个 o e 模型是他的平台特色,我们直接从这个左边侧边栏中点进到 o e 模型的这个界面,在这个输入框的上方呢,有四个选项,大家可以看一下,比较低调,如果不仔细看的话,可能会忽略到这个东西啊,分别是 图片主体参考指令变换、视频参考首尾帧,这个首尾帧升视频没什么可说的,跟其他的视频创作平台啊,基本是差不多的功能。 我们这里呢先来讲一下用图片和主体参考生成视频,和极梦 ai 之前的这个参考生成视频相同,我们都可以使用拖拽和点击上传的方式,将我们需要的人物、事物、环境、场景等等上传到这个参考栏中。 比起极梦 ai 呢,可能 ai 还多了一个主体库的功能,我们点击到主体这一栏,然后它的右边就会出现主体库, 除了官方给了一些主体库以外,我们还可以自己上传我们想要生成的主体。这里呢我就以离尘为例,把他的这个人物角色的设定图上传上去, 上传好之后,人物角色设定图的旁边呢,还有一个添加其他视角这个选项,他就可以在里面添加凌晨的其他的一些视角,比如说侧面啊啊仰俯视啊,仰视啊这种视角都可以,如果没有的话,我们就可以让 ai 来帮我们智能补全, 可以看一下 ai 智能补全的这个角色的人物形象和他的这个画风基本上都是能保持一致的。我选择第二组,然后我们点击确定。 接下来我们还要再补充一下关于凌晨这个主体的其他信息,比如他的主体名称,我这里呢就直接啊输入凌晨这两个字, 我们还要确认一下这个主体的类型,他是属于人物呢?还是场景呢?还是物体呢?还是特效。下面呢还要写一下我们上传的主体的一个描述,比如说他的长相是什么样子的,他的衣着有哪些细节 不会写的,我们还可以让 ai 帮我们生成,这样他就会智能识别出图片,生成我们需要的这个描述了。 除了可以上传人物作为主体外,我们还可以上传动物道具、服饰、场景特效,其他哎等等等等。在某些情况下呢,这个主体生视频呢是一件非常便利好用的方式。我们来看一下我之前生成的这个视频作为视例啊, 是不是很炫酷,他这其实就是用到了这个主体参考的方式来生成的视频,点击下这个编辑呢,就能看到我们生成这个视频的基本信息。 首先我是上传了男主的图片和女主的图片,然后上传了法拉利的图片,然后再上传了后方的机器人的图片,然后我采用这个格式,我是采用让女主这一主体哈坐在 图一的这个法拉利的副驾驶,男主呢,哎,按照图一的这个构图的角度,正在驾驶法拉利, 后面图二中的机器人和车辆在追逐他,然后我们还描述了一下其他的一些细节,那这样的一个比较炫酷的镜头就生成好了。 除了可林 ai 和极梦 ai 以外, v d ai 也有参考生视频的这个模式,也有主体库这个功能我们就不过多的赘述了, 很多 ai 生成平台都有参考生视频这个模式,但是呢,我们还是更倾向于先生成比较精细的这个分镜头图片啊,再去生成视频,这样的慢剧创作呢,才会比较的稳妥。就以我们之前说到的这个第四个分镜为例, 我们要展现的第一个画面就是赵烈带着他的两个跟班出场啊。第二个画面呢,就是凌晨正在搬箱子,然后赵烈故意去撞他,把他撞倒了, 那这个画面呢,按理说我们就可以用参考上视频来生成,我们只需要上传凌晨的人物形象,再上传赵烈的人物形象,哎,最后再上传一个场景图,就可以生成我们想要的视频, 但是结果呢,其实并不太尽人意哎,我就用可林吉梦微度分别做了一个对应的试验,并且都用了同一套提示词。我们来看一下这个效果, 这是可林生成的人物一致性做的确实还不错啊,场景也不错。所以这个时候呢,我还觉得是我的提示词结构写的不太对,所以我重新又修改了一方案,让他再给我生成了一版。 这个效果呢,大家也看到了,这个是吉梦的, 最后呢是 vdo 的, 我们对比一番后,吉梦 a 确实在参考上视频的这个表现力没有可林和 vdo 强,但是它们三者都还达不到我们生成漫剧需要的这个效果。 讲完这个参考式视频以后呢,我们再来讲一下指令变换。指令变换实际上就是多模态编辑的这个模式,它能够对视频进行修改,比如说它可以替换视频中的角色,增加视频中的角色, 或者是删改视频中的角色。他还能更换场景的元素,比如说把视频中的形象从春天变成夏天,变成秋天,变成冬天,还可以给视频中一些局部的事物增加特效。那我们就先演示下大家在创作中可能会用到最多的地方,就是对角色进行替换。 我们以这个视频为例,我想要把这个视频中林晨的这个人物替换成苏青月的形象,于是我就先上传完原视频,再上传苏青月的这个角色形象,然后在我的呃这个树框中写明要求。 最后我们来看一下生成的效果是怎样的。可以看到凌晨的这个角色已经被替换成了苏青叶的形象,而且呢,对苏青叶的一些呃形象特点也保持的比较不错。 总体来说,多媒体编辑的功能其实很强大,但他的缺陷也很明显,和原视频相比,替换后的清晰度和画面质感下降了很大一截,我们也不难发现还会有扭曲变形的这个现象产生。 在更多的时候,使用动漫太编辑其实更适合去处理现实生活中的实拍或者一些三 d 的 场景,而非像这种 ai 生成的一些二次元啊动漫风格。 所以我们在进行视频创作的时候,与其在视频上进行修改处理,不如在源头也就是在生成视频时所使用的图片上去处理更加方便。 我们在刚刚可林 ai 和吉梦 ai 的 演示中,或多或少都出现了画面质量不佳或者生成的动态效果不好的情况,这也是我们此次讲解要讲解多个平台的原因,那就是每个平台的视频生成模型都有各自的优势,都有各自的特点,我们无法生成自己想要的效果时,就可以选择换平台来继续尝试。 那以上呢,就是本期视频的全部内容,如果觉得本节课对你有帮助的话,不妨点点关注点点赞,支持一下,我们下节课再见!

为什么二零二六年视频创作者必须要学会 ai? 刚好最近字节呢,也是杀疯了,他们上线了一个超级厉害的视频模型, c 档是二点零,有多强呢?这种慢剧广告, 这是短剧,怎么还没出来?四根全是阳性,什么 vlog 都是用它一句话生成的, 接下来我给大家用几个案例测试一下啊。然后最近这种仙侠漫剧不是特别火吗?然后呢,我上传了三张图片,让他帮我生成一个十五秒的仙侠高燃战斗视频,最终出来的效果呢,是这样的, 哼, 动作呢,其实是非常复杂的,但是它也能够非常流畅的去完成它,它能够自动去生成风景音乐音效,在特效上呢,也非常高级,而且镜头的切换,全景中景特写啊,这些都有 c 杠子。二点零呢,目前可能是 ai 界最强的视频模型。然后呢,我就拿出了人类最强打斗分镜鸟山明的龙珠出战, 让他参考分镜,生成一段大斗视频,看下效果啊, 你看到分镜切换非常流畅,节奏把控到位,音乐音效呢,也很合适。然后呢,我又翻出了龙珠的动画对比了一下, 不愧是人类最强动漫,打斗情绪渲染力,还有打斗的力量爆发感呢,也是 ai 目前没法比的,所以我觉得 ai 还需要再卷一下下,但如果你要做二改或环外篇呢,我觉得是够了, 虽然离人类最强还有距离,但是像这种真人感的短剧怎么还没出来? 四根全是阳性,什么?天呐,我们怎么养得起四个孩子?其实从质感上面来看啊,你说他的画面还是声音是真人的,我都会相信。其实这一段我只是在网上找了一个段子,然后直接让他帮我生成一个短句就可以了, 以后你刷到的短剧可能都不一定是真人,我连本带利全部拿回来。然后呢?我想试试他到底能不能一句话做商业广告。我上传一张图片,然后一句话让他帮我生成一个 t v c 自改的广告,而且必须是快节奏, 快节奏,慢节奏他都能听得懂。 我数了一下,一共是差不多十八个镜头,这让我真的感觉到 ai 的 进化真的太快了,学习能力、复刻能力远远超于我们人类, 包括剪辑上的卡点都是由他自己来完成啊。用了我们专业剪辑,里面的跳切质感和我们平时看到的 t v c 广告其实已经差不多了。关键是它只需要一句话呀,一句话,甲方都不止对你说一句话。 回到我们最开始的问题,为什么二零二六年视频创作者必须要学会 ai 呢?因为技术门槛儿正在降低,审美门槛儿正在重建。这一反逼着我们去思考我们要做什么。未来的超级个体呢?是一个人,就是一支队伍。那这期视频呢?先到这里,下期视频再见。拜拜。

这条视频我前后花了一千多算理,整整测了三天,现在你只需要两分钟就能学会我这几天总结的关于 cds 二在电商领域的真正玩 法。 cds 二真的是一个能够重构电商内容生产流程的宝藏。首先它的常规玩法,我们直接快速跳过纹身视频看这里, 徒身视频看这里, ok, 接下来我要讲重点了,真正拉开大家使用差距的是 c 档十二的全能参考模式,它这个功能真的强的离谱。首先玩法一,同款产品换颜色。比如说,哎,你有一件爆款的 t 恤,它有很多种颜色,但你目前只有白色的。实拍视频, ok, 打开全能参考,直接上传原视频,然后告诉他,视频一中模特身上的服装颜色跟后面藏蓝色,其他完全保持不变,他就直接给你生成这个藏蓝色的版本。无论你这款衣服到底有多少种颜色,对他来说就是一句话的事情。做店群的商家看到这里,哇, 天都亮了。玩法二,一键出专业分镜很多人不会拍视频,是因为脑子里没有镜头结构。现在你直接上传一张模特图,然后告诉他,根据电商视频的分镜,包含远景、中景、特写面料、细节、模特走动镜头来生成视频, ok, 直接一键成片,而且效果还非常赞,这太夸张了,哪怕是脑袋空空的小蠢蛋也直接起飞。 玩法三,模特替换。比如说你现在只有一个亚洲模特,你可以告诉他,替换成欧美男模,保持服装版型不变,呈现真实上升比例,他可以在不改变产品一致性的前提下大变活人跨境商家直接被香哭了!玩法四,也是最狠的一个多款式换装视频一键直出什么意思?那这种视频快速切换穿搭的一键直出 怎么操作?直接输入图片一里的女孩分别换上图片二里的衣服,并且整体动作逻辑正常, ok? 城边直接出来了, 是不是很夸张?都不需要做分镜了,直接一键生成换装博主的天都塌了。 我们再看玩法五,视频延长。哎,这个就切中电商视频的一个老毛病了,比如说你的视频太短,然后投流效果不理想,或者说你这段视频里面想要再续几个镜头,但是你又没有办法再去重拍了。 现在你直接上传视频,然后告诉他将这个视频延长十秒,模特继续做动作展示,保持节奏一致,他会直接锁死模特形象,服装结构、场景环境、光影关系、镜头运动节奏,然后在原有时间轴的基础上继续去延伸这条视频效果你们自己看。太离谱 了,这个时候某些聪明的小脑瓜马上就转起来了,哎,他能干什么呢?第一,延长爆款视频的生命周期。第二,将一条爆款视频拆分成多个爆款视频, 怪不得人家能赚钱呢,你瞧瞧这记忆力。再看他的第六个玩法,自动根据音乐卡点生成视频。我不说你肯定意识不到,这是百分之九十九的人都会忽略,但是超适合短视频平台的功能。 看我操作,上模特图,上服装图,上卡点音乐,然后告诉他根据音乐节奏生成模特穿上该服装的卡点展示视频,动作自然,节奏匹配古典,他会自动分析音乐节拍,然后生成跟音乐节拍相匹配的视频效果。你们自己看, 剪辑博主的天都塌了,你还在这苦哈哈的剪辑,人家直接一键生成。讲完了上面这些玩法,你是不是以为就结束了?我再讲三个他更高级的能力,但这些能力已经超出了电商层面了。 第一,环境逻辑与声音联动什么意思?他这个不是简单的贴音效,他是在跟人一样做环境判断,并且附上相匹配的音效,就这种效果,音效师的天都塌了。不管你是干什么的,就这个能力,他都会让你的视频质感提升好几个 level。 第二个我觉得比较夸张的能力,复杂创意动作的执行能力 能复杂到什么程度?我选择了首尾帧模式,并且直接给他来了一篇一千多字的小作文,内容包含了每个分镜的相机参数,镜头角度、景别,运镜方式,场景样式,场景音效,整体色调,人物打光,妆容,服装特效,动作,就这么一整套。不夸张的说,詹姆斯卡梅隆来了都得懵逼, 但你看他的完成度,不说百分之百精准,但百分之九十的准确度还是有的。导演的天都塌了,就这种语义理解能力,不管你的理解你的要求并且完成, 最后再看第三个运镜视频的一个复刻能力,就这种视频节奏好,运镜炫我直接上传,连提示词都不怎么起,他直接附用运镜逻辑节奏节拍动作关系,然后来给我生成视频。运镜博主的天都塌了, 我苦哈哈的拍半天。不如你们直接拿成熟视频做结构参考,然后生成属于自己的版本,说不定你们生成出来的效果比我实拍的还要好。 好了,如果你能看到这里,那恭喜你,在对 cds 二的理解以及应用上,你已经打败了百分之九十九点九的人了。接下来自己去实操和应用就好了。如果说你也对用 ai 去生成电商内容或者说服装内容感兴趣的话,可以给我点个关注。我是牧童,目前正专注于用 ai 为电商以及服装去提供一些解决方案。我们下期视频再见。

这两天有个叫 cds 二点零的家伙迈着六亲不认的步伐走来了,所以他有那么强吗?把这个视频里的角色换成小猫和小狗。楼上三二二住的是马冬梅家吗?马什么马冬梅什么冬梅啊 马冬梅呀马什么梅呀!去掉视频里的人物,把这个视频的运镜应用到这个产品里,用嘴 p 视频的时代真的来了,那这期视频我将教会你 cds 二点零全部玩法。 在小梦梦里,选择视频生成模型,选择 cds 二点零,选择全能参考,再上传宠物玩手机的图片,输入这段提示词,告诉他在规定的时间内做出指定的动作。点击生成, 继续给他一张产品图,再输入这段提示,交代好在规定的时间内做出指定的内容,你就会得到这样的商业大片, 用色彩唤醒活力年轻色彩活力全开, bg 色彩年轻活力无限。先准备一段参考视频,再把要替换的角色和视频都上传进来,输入这段提示词,点击艾特,选择视频,告诉他把视频里的人换成图片里的人物,并模仿视频中的运镜和动作背景换成古代街头 怎么样? 同样给他一段参考视频和产品图,让他把这个产品参考这个视频的运镜,就能得到这样的视频效果。 像这样的广告大片现在也能轻松的复刻出来。 当然你还可以上传一段自己拍摄的视频,再输入这段提示词,你就可以得到。这样 给他两张角色图片和场景图片,再输入这段提示词,你就可以得到一段打斗的片段。 那这是我提前生成好的一组九宫格分镜图片,现在只需简单的描述,你看他竟然能自动切换镜头。总之以上玩法都可以结合使用。对面几个人 是表哥吗?呃呃呃,是表弟呀啊表哥。哈哈哈哈你不要过来呀。 ai 创作虽便捷合规,底线不能越文明玩 ai 创作更精彩,拒绝滥用肖像,尊重影视版权,魔改有风险,创作需谨慎。

如果你一觉醒来发现自己穿越回了六千六百万年前,那么请先不要慌,因为虽然叫醒你的是一只货真价实的恐龙,但他对你并不构成威胁。这是一种名叫扎摩希斯龙的直食性恐龙,他们不仅不吃肉,极限个体也才两米多。 而站在你眼前的很明显是一只亚成年个体,也就跟你家的狗子差不多大。你们现在所处的位置是风暴肆虐之后,一块从大路上被剥离出来的土地。 而像这样的临时救生阀,海面上比比皆是,且大小不一。突然,刚才还情绪稳定的小恐龙一口咬住了你的鞋子,似乎是有求于你,你很快意会并向着他拖转的方向望去。 原来他的好伙伴也在风暴中幸存了下来,只不过找到的漂浮物太小,稍有不慎便会落进水里。攻读过悉尼大学的你立马意识到六千六百万年前的海洋里存在着一种极其可怕的群体, 苍龙家族即便是最小的品种也能轻易要了这头扎摩西斯龙的小命。与其坐以待毙,倒不如放手一搏。 在求生本能的驱使下,他朝着最近的更为安全的大漂浮岛游去,也就是你现在站住的地方。在你可有可无的帮助下,这对年轻的小情侣终于得以重聚。正当你的单身狗看的津津有味的时候,远处的高空中传来了一声可怕的异响。 这是哈特兹戈翼龙,一种一展超过十米,身高约五米,体重大小,一直与风神翼龙存在争议的超大型翼龙。 此刻他正在这片被风暴搅乱后的餐桌上寻找可口的美食。而你们所在的这块漂浮小岛面积够大,不仅非常的显眼,也很满足他的降落条件。就目前的情况来看,你们已经被他锁定为目标,理论上成为一顿午饭的可能性为百分之一百。 但剧本给了你一个憨到爆炸的设定。 这个来自未来的高科技装备叫做宇宙超级无敌雷霆,酷炸天之,要啥来啥。万能按钮在触碰能量盾的一瞬间,哈特兹戈翼龙直接虎躯一阵。 当一头滑翔机般大小的巨兽一头栽进距离你仅十米的海里时,你最好祈祷他不会游泳。 好消息是他的确不会说,但坏消息是,由于哈特兹戈翼龙的骨骼内部成蜂窝状的中空结构异常的轻盈,再加上面积巨大的异模,所以他也很难沉入水中。 只要他在力竭之前爬上来,你们仨就完蛋。但正如我之前所说,在本番的剧本里,你是死不掉的一头。霍夫曼苍龙注意到了海面的动静,他体长十五米,仅需一秒便可以将十八吨重的身体以三十公里每小时的速度发射出去。 眨眼之间,一切都结束了。尽管你和两只扎摩西斯龙还沉浸在侥幸活下去的懵逼中,但你得明白,在六千六百万年前的生存法则下,刚才的一幕可能是每天都会上演的再正常不过的戏码吧。 现在,你得趁着苍龙吃午饭的时间抓紧逃离这个是非之地,而带着这对情侣一起上岸,将对这个族群的延续起到了至观重要的作用。为了确保万无一失,你决定抚养并保护他们,直到他们的后代形成稳定的群落。 而在危机四伏的密林深处,还会有哪些挑战在等着你?我们下期再见。

首先这不是一个广告,这个视频录的也很突然,因为字节跳动刚刚发布了一个叫做 cds 二点零的模型,那正常面对 ai 模型,我的态度就是,哦哦,又发布了,然后会吵一堆很厉害的概念,然后实际体验不怎么好,然后翻篇。但是这个模型一开始我看到也是视频,就让我觉得啊,这个也能做到。比如你看这个 蜜雪冰城大战外企咖啡店,那重点在于它的精细度,对吧?这个真的很厉害。然后我看到网上的人都开始产出内容,比如这个, 比如这个,那我不说它完美无缺,但是你能明显感觉到比以前的 ai 视频要强很多,对吧?那这个时候我就觉得这个模型有点不简单了。 然后就是我们公司自己的人开始生产内容,我自己也试了,我的感受就是你真的得自己去试一试。假如二零二六年初视频生成模型已经是这个水平了,那我感觉传统影视流程距离被 ai 海潮冲走,已经彻底进入倒计时了。我没有危言耸听,我们一起来看看视频生成模型在今天是什么 样。 其实过去的视频生成模型已经很不错了,看着都挺像回事,但是有几个点你是能让他破功的,那就是大范围摄像机的运动, 分镜的连续性,还有音画的匹配度。那么从这三个痛点来看一看 cds 二点零的表现。那首先大范围的运动,我们请公司的 ai 导演转载了这样一段文本,还有图片,没有给别的任何的信息,这是我们产出的结果, 哼, 这个不震撼吗?这种运镜是现在 ai 能够生成的了什么?你想改个更离谱的运镜?没有问题,我们改下提示词再来看一眼, 反正应该不用多说了。过去我们鉴别 ai 视频是看摄影机运动假不假,这种方式已经基本上确定是失效的了。 那我们现在进入第二个点分镜,以往的模型是可以生成分镜,对吧?但是以前的分镜是这样的,它就有点为了切而切,最多给点特写,然后再给个全景。它的运镜本身是接不上的,至少和真人就我们人做的视频语言是有区别的。 那么好,我们接下来来看看这个模型最震撼的地方,我们来看看一句话,让他生成的视频,他的分镜设计, 这个我不知道你有没有注意到,他不是只给了特写,他是有明确的角度的切换, 而且他是有一个导演的意图在的,而且人物也没有走形。可能我这样讲听起来不够明确,我们用一个俯视图来模拟,看一下他的滋味的变化,你看这个切景, 这个切近,这个切近,他就像是真人导演一样,在不断的改变摄影的位置还有视角,为的就是让观众你能够对于重要内容有一个更好的理解,这是一个导演的思维存在,他这里有一个专注点,就以前我脑子里想的是 ai 生成一个视频,能够一段的生出来,然后剪辑式把它剪起来,变成一个厉害的作品。 但是现在就是我们得意识到这种模型一旦成熟,将来是不需要剪辑式的。他没有筛选或者废片的概念,他所有的东西都是有用的,只要深沉的风景够好。我为什么需要剪辑?就我过去真的一直以为剪辑是一种情感表达,你插几针,你的情绪会变得不一样, 所以必须得人来做。但现在我们必须得面对这这个问题,就是你怎么确定你插的这几针?你的思考比 ai 插的这几针更好,尤其是它可以给你无数个版本, 而且很快就能给你。那我们现在进入最后一个点音画的匹配,如果一个视频没有声音,那会大打折扣。过去 ai 最大的问题就是配的声音很假,尤其是人说话加上环境音加音乐混在一起就不自然。那我们再来看一下这个模型的效果,啊啊, 我们现在在图书馆需要小声点,还不错,对吧?你要知道以前做音效和混音需要人手工一个个贴上去,要一天或者更久的时间,现在一键就完成了。但是声音模型现在行业里面你要说吧,优秀的也不少了。我觉得这个你不会觉得很震撼, 但我想讲一个有点我们意外发现但是比较恐怖的事情,就是我发现一个点,只要把我就我本人的脸传到 cds 二点零上面,这个 ai 它会自动用我的声音说话,呃, 我不确定你有没有听明白我在说什么,就是在没有给任何提示,任何词语、任何信息的情况之下,我也没有给我的声音文件,只是把我的脸传上去,这个 ai 居然知道这张脸的声音是 我的这个声音。我给你们演示一下,这是我们用一句话加上我的照片生出来的结果。正常面对 ai 模型,我的态度就是,哦哦哦,又发布了,然后又会炒一堆很厉害的概念,然后实际体验不佳,然后翻篇。但是这个模型一开始我看到的演示视频就让我觉得 这个你不觉得恐怖吗?而且最恐怖的也是不只是我的声音,而是我们上传的照片,是这样的,对吧?只有楼的正面,但是你看他的运镜,他可以转到楼的另一面,那现实中我们的楼的另一面是什么样呢?是这样, 这不恐怖吗?他知道我背后的东西是什么,即便我没有告诉他。这基本上可以确定一件事情,就是 cds 二点零很大量的训练了我们公司的视频。那你肯定会问 tim, tim 他 们有没有问你要版权, 那我简单来说,平台的用户协议里面我不知道,可能隐藏了类似的授权的一个条款,但是我个人没有收过钱,也没有被联系过授权,也许他们在法理上是合规的,但是 这有点恐怖,对吧?就是更恐怖的是,我们测试了别的博主,比如何同学,你会发现人物形象的一致性超级高,我们平时看到的沙子都是由石头经过漫长的风化形成的,都是时间赠予我们的礼物 啊。不过可能何同学的视频音质还有一些空间啊,可以提升。结果我们发现 c 单词这次选择了用我的声音来附魔给他,然后还有很多人也都莫名其妙的有了我的声音,反正这个有点好笑,但是我觉得笑完得回归严肃。我真心觉得我们大家现在得警醒, 因为我们算得上是一个案例,就是最早把所有的信息数据,尤其是图像和声音数据传到云端的公司,还有我这个个体,尤其是高清内容,你现在就能够看到如果一个人的数据全部进入了 ai 的 数据集,会发生什么? 他能够百分之一百的模拟出你的任何的形态,还有声音。那请问这样的内容你的家人分得出身价吗?就我想看到这里,你应该能够理解为什么我们要做这个视频,这不是一个小的技术革新,这是一个会推走行业所有过去流程和沉淀的一个海啸, 我就会这么形容他。那在结束之前,我想再来举一个案例,就我们前段时间出了一个视频, ai 可以 替代我,那我的意义是什么? 那个视频里面我们讲述了我们帮助一位得了肿瘤的粉丝做了 mv, 花了两年的时间做特效,但是最终我们发现我人越努力做越比不过 ai 的 进步速度,我以前学的东西越没有价值。在二零二二和二三年,我们手工做一些这样列车飞天的镜头,大概需要几十个到上百个小时, 二零二三年的 ai 几分钟可以做出这样的结果不怎么好,但是二零二五年,两年以后到了中期, ai 可以 做出这样的结果,已经非常强了,对吧?那请问今天的 cds 二点零呢?我们也试了一下,这是它现在的结果, 所以多说无益。我真的觉得你自己亲自去试一试这个 ai 模型,能更好地理解它的可怕的地方。就它还不算真正改变视频行业的 ai, 我 打心里里说是这样, 但是即将登场的下一个 ai, 下一个版本可能就是了,那请问这对人类是好还是坏呢?

ai 暗句最优的解决方案来了, seedens 二加 gemini 三组合器,直接完美控制视频的走向。用到的二十五宫格分镜和生成提示词七八九,常常咸蛋。只需要在 gemini 做个预设,然后在文档里面复制这段指令,直接粘贴,然后保存,然后把初识角色图上传好, 继续加上一个故事描述,这个角色和黑衣人在地下城里激烈打斗过几招后,女孩变身黑色铠甲,打败黑衣人,稍等一下就生成出一段脚本。 重新打开 gemini 界面,继续上传刚刚两张图片,复制刚刚生成的代码,接着在文档里面复制这段话,继续粘贴到 gemini 里。最后就得到这种连贯的二十五宫格分镜了。把分镜拆分出来,用这个高清放大工作流放大一下。重点来了, 打开吉梦,用 cds 的 多帧功能上传好分镜图,点击生成后,就会得到 ai 慢剧制作指南和分镜提示词七八九,尝尝咸淡。

cds 二生成电商带货视频的表现到底怎么样?目前你应该找不到比我这条视频更全面测试了。我在去年十月份 solo 刚出来的时候就讲过,和 tim 同样的话,传统的影视流程已经进入倒计时了, 而这次 cds 二的出现让我有底气把话说的更激进一点。现在的 ai 已经能够取代百分之九十的电商广告了,因为绝大部分的电商广告都是垃圾,而 ai 在 批量制作垃圾上绝对是有一手的。 更何况现在 cdsr 生产出来的很多视频的质感已经超越了绝大部分的一些电商带货的视频。不信的话,你跟着我往下去看一下它的性能。第一点,它已经开始理解镜头语言了,这一点它甚至做的比 solo r 更好。你把这条视频看完,这单生意很大。有多大? 非常大啊, 再忙也要记得吃点零食。他的运镜切景别切视角是有一套自己完整的逻辑的,这个能力已经被很多博主验证过,他直接决定了他的使用门槛会被降到非常低的水准。 一个什么都不懂的小白,只要一句话,同样能够生成这种专业级的影视内容。第二点,他是完整的多媒体参考图片,文字语音,甚至他能够参考视频来生成视频, 这个功能真的是非常实用,而且目前其他的视频模型都做不到。我举一个例子,你就大概懂他强在哪里了。比如说让图一的女孩分别换上图二的八套服装,并做模特的动作展示动作,参考视频一,然后你看他生成出来的视频。 第三,他可以直接用语言来编辑视频,这个也是非常强,并且非常适合什么都不懂的小白来操作。比如说我直接告诉他,视频一中模特身上的服装颜色更换为藏蓝色,他只会改变这个模特身上的衣服的颜色。 ok, 那 c 档三,他既然这么强,但是对电商来说最关键的几个点,比如说产品的一致性,他到底表现的怎么样?我直接说结论,比目前绝大部分的视频模型 都要强,衣服的结构、走线和扣子的细节,整体颜色的变换,甚至花纹的方向一致性都非常的高,而且因为他支持多模态参考,所以甚至可以三百六十度无死角的去展示你的产品。 电商的第二个点,人脸的一致性保存的非常好,绝对也是目前顶尖的水准,在细节上可能偶尔有点扭曲,但算小瑕疵可以接受。 电商的第三个点就是人物的动作了,目前来看都是非常自然的,人物的走转摆整体感觉是符合现实的逻辑的。第四点就是他成片的概率非常高,生成出来的绝大部分视频都是能用的,这一点非常重要, 像之前的骚扰二,他的成片概率是极低的,我们当时都是二十多条里面才能找出一条能用的,或者三十多条里面才能找出一条。但如果说我们现在生成出来的视频里面,十条里面有九条能用,那效率绝对是呈指数级的上升。 但是大家先别急着庆祝,他仍然是有缺点的。首先第一个就是画质偏低,目前只支持七二零 p, 一 旦人物拉远, 可能就会显得质感比较糟糕,如果说你要追求极致的高清,或者是说商业级的精修,那现在可能还不够。第二点就是他目前的算力价格还是有点偏贵的。如果说大家想要去追求更多数量的视频的话,还是可以去考虑一下能力稍逊一筹但是更便宜些的模型。 但无论如何, cds 二这次绝对是王炸级别的,他给电商行业中 ai 内容的发展继续加了一脚油门。可能到二零二六年的年底,百分之九十的电商内容,包括商降短视频,都将会包含 ai 的 痕迹。 因为传统的广告制作流程被冲击已经是必然事件,很多镜头已经没有必要再用真人去拍了。摄影、剪辑、分镜、执行类岗位的价值正在被快速压缩,技术的门槛在下降,创意和审美的权重在上升。 就我们服装行业而言,未来什么会越来越宝贵?人设 ip 品牌为什么?因为绝大部分的服装类营销内容都是高度的模板化以及制作过程中的结构化,而 ai 最擅长搞定的就是这些内容。就比如说他现在已经能够开始理解服装在画面当中的呈现方式, 镜头要怎么走,衣服在什么时候该成为画面焦点,什么时候该被弱化。服装类的营销视频在 ai 的 辅助下制作起来会变得越来越简单, 这个时候真正值钱的就会越来越集中在你的审美,你的选品、你的内容判断,以及你的客户是否对你保持信任上。我是牧童,目前正专注于用 ai 为服装行业提供解决方案。我们下期视频再见。