粉丝3444获赞18.0万


二零二六年将是 ai 漫剧的时代,目前漫剧市场日成交金额已突破千万,抖爸爸也已入场扶持 ai 漫剧,你可以通过免费和收费的模式,就能直接有效的带来高收益。我将从脚本、画面、配音、配乐来从零到一制作这个 ai 漫剧,不需要懂设计,不需要你懂剪辑, 就算是小白也能利用视频中的免费 ai 软件批量做出这种 ai 视频。小白的图文教程装箱子里了,先吃的七七八,常常咸淡。 ai 视频生成的大体流程,接下来我们来逐个解析其中的关键步骤。 首先来到我们的第一步,故事脚本里处理一个好的视频绝对离不开一个好的剧本呢。首先 第一步我们要给 ai 设置一个身份,而像故事剧本这样的内容,我们就应该让专业的编剧、电影导演来生成。那么我们赋予 ai 这样的一个身份,它就能 解锁它的知识库,然后生成与之相匹配的内容。就比如说这里我们可以设定 ai 的 身份为一个动画编剧,一位电影导演, 那他们的特征是什么?他们的特征就是经验丰富,后面你也可以加上一些其他的内容, 比如说再给他加上一个高超的电影拍摄技术,二十年电影拍摄经验,全球顶级导演这样的身份,设定好一个好的身份,能极大的增加产出好剧本的概率,那么这就是我们的第一步。 此外,我们的剧本是有框架有格式的,那么要给他设置一个好的框架,他才会按照我们的需求生成对应的内容。那么框架有什么呢?是不是要有故事主题, 要有镜头,镜头竖和旁白,这故事讲什么内容?是讲美女与野兽,还是外星飞船?这些内容是在我们一开始的时候就要定好的。此外我们还需要有镜头,每一秒这个视频显示的内容是什么?播放的声音是什么? 这些内容都是要提前设置好的。这里我们可以选择用豆包, kimi、 deepsea 都可以, 这里我推荐使用豆包,因为它用起来更加的方便。我们这里给他输入一个身份,你是一位专业的动画编剧,再给他确认一个主题, 书生狐狸为主题,我们讲一个书生与狐狸的故事, ai 需要帮我们做什么?需要帮我们生成一个一分半钟以上的动画剧本,我们可以测试一下。打开它生成的动画剧本, 我们可以看到他会将每一个场景生成好标题,场景持续时间等等内容生成出来,其中就包括我们以什么样的方式开头,以及我们主要人物在座上, 比如说书生云秀正在抄写论语,这里就是我们的第一个情节,交代了一下人物主体,我们可以看到整体的剧本是非常完整。场景一就是书生云秀给赤狐递了一块麦饼,作为他们友谊的象征。场景二 的是狐狸报恩解决云秀温饱问题,讲述的是一个这样的故事,像这样的剧本就是比较完整,那么我们通过这样的剧本才能够生成一部好的动画短片。那么接下来我们就按照这个剧本来完成我们的 ai 动画短片的创作。 那么我们刚刚就演示了故事脚本需要如何生成,以及需要达到什么样的要求, 再看看第二人物特征。人物特征是保持人物一致性的一个关键要素,因为 ai 生成会导致我们的人物频繁发生变化,所以我们一定要控制好提示词的书写。我们可以让 ai 为我们生成 角色的服装外形,场景特点,我们在这里让他生成剧本中每一个人物的人物设定, 需要具备服装外形、性格、行为特点等等。然后我们查看一下人物设定,我们的云袖,身着一件发白青衫,衣服上打满补丁,外貌清瘦, 肤色白皙,有一股书卷气。再看我们的狐狸,分为狐狸形态和少女形态,在提示词的使用之中,我们通常只需要将服装以及外形特点输入到我们的提示词当中,就可以很好的生成了。 然后呢,就来到了我们的分镜制作,分镜决定了等会我们纹身图和涂声视频的流程,我们可以对脚本输入增加镜号,画面描述,镜头运动时长,对白音效等等, 让 ai 为我们生成更为详细的分镜脚本。我们可以看看生成好的分镜脚本是有着镜号这段时间主体是谁, 他在做什么,整体的环境是怎么样,包括镜头运动,他是特写, 从笔尖缓缓拉开至全景是一个这样的状态,以及他的音效,笔尖的沙沙声。这些内容都是我们进行 ai 视频生成的参考, 我们觉得有哪些不满意的地方,也可以让 ai 帮我们再修改。我们可以看看后面的这些镜头,整体是非常完整,那么有了我们的分镜脚本之后,就只剩下最后的一个内容,那就是制作我们的分镜图,而分镜图 又是靠提示词来进行生成的,所以提示词该怎么写就是重中之重,它就会决定我们整体的一个画面质量。提示词需要包括几个内容, 首先第一个是风格限定,整个视频中所用到的所有图片,他们的风格一定是统一的,这样才能够保证我们视频的一致性, 所以说风格我们要放在题的最前面。然后就是视角构图,这个决定了我们画面内容展示的方式,我们的每一个镜头都是需要有不同景别来进行切换的,我们不可能一直用一个特写镜头,第一个镜头是特写,第二个镜头是特写, 或者一直用全景镜头,一定是全景、近景、中景特写,这样子来回切换,才会有视频的流动感, 我们的画面才会生动,不至于过于呆板。再看下一个主体描述,这个就是说我们的画面内容,画面里面这个人长什么样子,他有什么特征,他要做什么事情,这个就是我们的主体。 再到我们的背景设定,我们的画面主体周围的环境是一座破庙,什么样的时间, 是月光洒下来还是大白天,是春天还是秋天,黄昏还是傍晚,这些就属于我们的场景描述,场景能够渲染视频的一个氛围,再到我们的细节修饰,光影色调,以及这两次这些主要是 辅助我们画面生成的,就比如说人走过是不是有脚印,那么这些都属于我们的细节, 光影色调则是一种美感的体现,像月光与烛火交织,这一种感觉就给人一种朦胧感,以及我们的质量词,提高我们的画面质量,高清细腻 细节要多,通过这些提示词逐步提高我们的画面质量。通过以上这些方法,你就能够得到一份完整的分镜头提示词和一份高质量的故事脚本。拥有这两个东西之后, 就可以进入到我们接下来的环节,我们下节课将继续讲解纹身图的内容。哈喽大家好,欢迎大家来到我们的 ai 视频全流程解析系列课程。那么我们上一节课已经了解了故事剧本该 怎么写,以及我们需要生成哪些内容,那么这节课就来到了我们的纹身图环节,在这里面像豆包吉梦、可怜这种是属于简单一点,没有什么使用门槛。举个例子, 以极梦 ai 生成为例,我们只需要在它的输入框里面输入我们之前设置好的提示词,框架,风格, 人物主体,它的外观场景,它的动作,然后输入到输入框里面,然后使用极梦 ai 生成,只要点击一下 就可以生成,像这样的内容还是非常方便,也可以使用我们的 sd 来生成,也就是 sleep 共享。使用这款工具是需要一定门槛,那么这里为了方便演示,我就直接使用豆包来进行生成。在这里 我将画面风格统一为奇幻高清动画,因为这样的画风我更加喜欢一点,你可以按照自己喜欢的画面风格去生成,我们依次生成四到五个镜头,我们可以来到生成好的这个画面里面像有一些内容其实是不错的,我们在里面 找到觉得合适的内容就保存下来,像这一张就明显过于浮夸了。像这一种我们就要单独的对第二张重新生成,然后我们在接下来依次的生成我们之前产出的所有分镜图片。其中要注意我们对于 生成内容不满意的地方也可以进行修改。就比如说像这里这一张画面就完全没有什么看点,那么我们将它的时间改为白天近景构图,再来看看这一张就明显要好很多。 对于比较满意的图片,我们可以点击变清晰,像这个功能其他的 ai 生图网站都有。通过这些设定好框架的提示词,我们就能够生成整体一致性比较强的 ai 图片。 我们也可以通过提示词内容生成一个完整的产品图片,像这样挑选出其中表现效果比较好的几张 作为我们之后涂上视频的手势图片。我们的整体的提示词内容一定要严格按照设定好的框架来书写,对于不满意的图像,我们可以多次生成,这个是需要耐心的,又或者你想要对其中的某一个部分进行修改。 像这里我就将原本的赤虎改成了白虎,为了避免画面的单调,后续我还生成了一些空镜头,也就是没有人物只有场景的图片作为画面的过渡。这样子我们就把我们所有需要的分镜头图片生成好, 然后再为他们重新命名,设置一下排序, 等会就可以进行我们涂鸦视频的操作。如果你觉得有收获的话,不妨点赞加关注。下一节课我们将讲解如何将这些静态静止的图片 转化为动态的视频,我们下个视频见。哈喽大家好,欢迎大家来到我们的 ai 视频全流程解析系列合成,今天就跟大家讲一下图身视频的具体操作。我们来到极梦 ai 这里先来看一下,这里展示了很多其他用户 生成的优秀图片和视频,我们可以看一下,比如像这个给人一种很梦幻的感觉,再看看这个视,这种就相当于一种文字特效,像之前比较火的缩放场景, 也可以来到他的短片这里,我们可以看到这里有很多优秀作者发布的作品,这些都是由 ai 生成的,像 ai 动漫, ai 的 创意文旅片,还有这种带有梦幻感的 ai 短片, 整个效果给人是一种非常舒服的感觉。 那么像这些 ai 视频该如何生成?我们可以来到下方的提示词输入框,点击这个按钮,切换视频生成模式,然后就可以将我们的文字粘贴到这个输入框里面, 这里我演示一下,让豆包给我们一段 ai 视频生成提示词,我们复制一下这个第一的,将其粘贴到这个书框里面。这里可以选择我们视频生成的模型,有 s 二版本,三点零版本,还有 pro 版本,越新的版本 所需要的灵感值也就越多,这里我们选择视频三 pro 版本,这个十六比九则是我们的视频比例, 在这里面我们可以选择十六比九,一比一,九比十六这样的比例时间我推荐大家选择五秒,因为十秒比较不稳定,而且也比较浪费积分。那么我们点击一下生成按钮,就可以在侧面栏的生成里面找到了, 我们点击一下,我们可以看到视频已经生成出来了,我们看一下效果怎么样,可以看到整个画面场景是非常梦幻,我们的视角往前推入, 一个带着翅膀的小鹿向前慢慢走来,后面云海之上还有一只巨大的鲸鱼,整体的画面是比较梦幻的。 视频生成好了之后,还可以在我们的右下方对它进行更多的其他操作,比如说对口型,给它增加 ai 音效,对它进行补帧,也就是说让画面更加的流畅,提高分辨率。 因为我们现在生成了一个视频,看着还是有点模糊的,对于追求更高清更高细节的小伙伴们来说,这个画质是远远不够的。这里还有一个 aip 院, 它能为我们节省大量的时间,但是有时候可能会出现不太能满足我们想要的效果,对效果不满意也可以对它进行编辑或者再次生成, 但是那样的话是需要花费额外的灵感值的。虽然说 a a 可以 通过文字直接生成视频,但是这样的效果很明显,不能完美的传达我们的意思, 所以说我们更多的还是使用图声视频的操作。这里我们让豆包为我们生成一张动漫图片, 一个女生在骑着单车,我们让豆包为我们提供图声视频的提示词, 我们输入这样的一段内容,将第一个镜头复制一下,拷贝到我们的启蒙 ai 输入框里面,可以点击这个加号上传文件,也可以直接将我们的图片拖入到这个加号当中,然后我们点击生成, 那么我们可以看到生成好的视频整体的效果是不错的, 那么这就是我们使用手针图片生成视频的方式,接下来看看我们如何利用首尾针来生成视频呢? 这里我用这样的一个手针图片,是一个粉红色的一个场景,然后有一些绿叶,再用这一张 两个草莓碰撞在一起,水花四溅的一个场景。我们在出物框里面输入这样的一段提示词,点击生成,点进去看一下,他将我们的手帧图片和尾帧图片很好的衔接在了一起,同时识别了我们提示词当中 所需要的内容,它产生了这种碰撞的效果,看起来还是比较有视觉冲击力。平时使用图生视频当中有很多需要首尾帧才能够顺利生成的视频, 因为它的前后差别比较大,如果你仅仅只用手帧的话,生成的内容是很不可控。那么通过我们刚刚讲述的图生视频的方法,我们就可以像这样开始我们整个 ai 动画短片的生成了。 这里举几个例子,比如说我们以这张图片为例,让他生成一个视频,我们可以来解析一下这个提示词,可以看到人物的主体动作,镜头语言以及细节光感描述。通过这样的提示词,我们就可以生成像这样的一个视频, 然后生成好这个视频之后,再给他提高分辨率,然后逐一生成。通过这些步骤我们就可以得到一份生成好的视频片段,这里我们可以看一下, 下一节课我们就将这些视频片段组合起来,成为一个完整的动画短片。哈喽大家好,欢迎大家来到我们的 ai 视频全流程解析系列课程, 那今天我们来讲一下短片的配音该如何完成。首先我们来生成我们的短片的旁白,这里我们给 ai 输入指令生成故事旁白,可以看到 ai 就 生成了这样的一段文案, 那么这段文案其实是有点笼常的,我们将它精简一下,最后得到了一段这样的比较简短的文字,我们可以看一下差不多两百七十多个字,用我们最后要生成的一个 一分钟左右的 ai 短片其实是很接近的。那么第二步就是将这样生成好的文案通过配音工具转化为短片的配音了,那么该如何完成这样的操作呢?我将在这里讲解一下我平时经常使用到的工具。 那么我们打开这样的一个网站,我们可以看到这里就是它的一个功能界面, 有我们转语音音频编辑语音转换歌声,转换音色克隆等。那么我们要将一段文字转换成好听的故事配音该怎么做?就是要用到我们的文本转语音功能,其实我们的默认界面就是这个文本转语音, 我们可以在这里面完成我们短片配音的工作,这个位置就是我们的文本输入框,我们将刚刚生成好的文案输入到这个输入框里面粘贴进来,然后就到了一步比较关键的操作,我们要选择合适的声音来生成这些文字, 像这种工作以前一般都是由配音演员来完成的,那现在有了 ai 工具之后,我们能很轻松的完成这样的工作,我们点击这个选择角色按钮,在这里面我们可以看到有很多的声音, 男女老少都是可供选择的,那么我们想要的一个故事短片的声音应该是怎么样的?我是想要一个比较有磁性的 声音,又好听的一个女性声音,我在这里面挑选了一下,我觉得第二个就不错, 我们可以听一下他的声音是怎么样的。心若止水,勿与俗世纷扰,淡然处之,听起来感觉还是很不错的,这里我们点击这个选用即可。文字语言选择默认的中文,这个地方其实是比较关键的 情绪选择,像我们平时说话肯定是有对应的场景, ai 配音也是一样的。我们是一个短片的旁白,那么我们就在这里面选择对应的一个解说旁白,可以试听一下,好是时间的艺术, 泥土太干则裂,太湿则塌,感觉还是不错的。那么这个语态强度指的是什么意思?其实就是我们的声音平时是有抑扬顿挫的,有说话的重点,那么你的这个语态强度越高,则更加的饱满,那么这里我们选择默认即可。 至于语速语调,你可以看你生成后的声音是否符合你的需求,觉得语速慢了,那我们就调快一点, 这个可以灵活调整,那么这样我们就可以点击生成,我们看看生成之后的效果。我们来播放一下 寒夜霜月,漫过荒郊破庙蛛网缠绕,断梁残烛与古旧烛台燃烧,火苗侵占,这样的一段声音就是比较符合我的需求,无论是他的一个抑扬顿挫也好, 还是声音的音色都是符合我们一个弹白的标准,那么这样就完成了我们一个短片配音的工作。 这个时候有人就会问了,假如说我想要深沉对应角色的声音呢?而且它的嘴型还要和我们深沉的声音要匹配,这个时候该怎么办?我们来到节目 ai 这里,点击 数字人功能,导入我们的角色照片,再拖入我刚才随机生成的一段音频,我们可以听一下,你觉得今天的天气好吗?我觉得相当不错,在这里选择音频原声,点击确认,然后生成, 你们可以看到已经生成好了,我们播放看一下,你觉得今天的天气好吗?我觉得相当不错,你觉得可以看到我们的口型和生成的音频是一一匹配的, 那么这样子就实现了一个对口型的功能。但是像这里我们输入的是一张图片,那么假如说我们要将我们的视频里面的人物匹配我们的声音,可以来到可灵 ai 这里点击视频生成,在这里面有一个对口型功能,我们点击进去, 在上方输入我们的视频文件,在下面上传我们的配音音频, 我们就可以实现让视频中的人物匹配我们的声音了,那么这就是我们短片配音的全部流程。哈喽大家好,欢迎大家继续来到我们的 ai 视频生成全流程解析系列课程, 那么我们之前已经了解了 ai 生成短片的一个大体流程,那么我们今天就来讲一下如何使用 ai 来生成我们的短片音乐。首先第一步先来生成歌词,我们来到我们的大圆模型这里,点击这个深度思考, 然后参考我这个模板来进行生成,这个模板有什么特点呢?它可以参考你喜欢的歌手的曲风特点,以及人设构建, 节奏,写词风格等等。那么我们让 ai 帮我们生成,我们可以看一下它是如何构建这一首歌曲,可以看到它生成的过程是非常细致,看看它生成后的歌词 整体有着古风的元素,待会我们就要用我们的 ai 工具将这样的一段歌词生成我们的古风音乐。我们复制一下,我们打开这个网站注册之后呢,它会给我们两百的创作点,可以让我们生成好几首歌曲, 而且他是每天刷新的。我们来到这个文本生曲这个部分,点击歌曲分为两种模式,专家模式和普通模式。 专家模式呢指的就是我们可以输入我们生成好的歌词,放进去之后呢, ai 来给我们生成歌曲,也可以使用普通模式直接描述这段歌曲, 他同样会给我们生成音乐。这里面我们先测试一下专家模式是怎么样,我们将我们刚刚生成好的歌词粘贴进去,可以看到下面有几个选项, 风格和弦、调弦等等。这个我们使用 ai 推荐即可,包括速度和作品时长。我们先使用默认模型,这里他有三点五,三点零,那么不同的模型有不同的时长限制, 这里呢我们选择三点零作为我们的生产模型,然后我们点击这个开始生产按钮,可以看到已经开始生产了,我们稍微等待一会,我们可以看到已经生产好了,来试听一下, 可以看到整体的效果还是很不错的,无论是歌手声音的质感,还是音乐的流畅度,这些部分都是在线。那么像我们生成的这个 ai 动画短片呢,我们只需要生成纯音乐的背景就可以了, 我们来到纯音乐这里,在这个位置呢,我们使用普通模式,然后描述一下你对这首纯音乐的期望是什么?比如说我在这里想生成一首古风舒缓的音乐,然后我们点击生成,可以看到生成好了,我们来试听一下, 可以感觉到它结合了我们古典弦乐的特点,整体呈现呢是一种古风的感觉,那么像这样的音乐就已经完全足够作为我们的短片配乐,按照这些操作, 你也可以生成属于自己的个人音乐。那么除了这个办法以外,我们还有没有其他软件可以帮助我们生成短频配乐呢?可以使用剪映,在剪映的音频这里点击进去之后有一个 ai 音乐, 这里面可以选择音乐类型,有人声歌曲和纯音乐,这里面我们选择纯音乐,然后呢同样输入刚才的音乐描述古风舒缓,我们在这里面呢点击开始生成,我们可以看到已经生成好,可以播放一下听一听。 那么通过这样的方式同样可以生成我们的 ai 音乐,但是呢这个需要消耗积分,所以说我更推荐大家使用 上一款软件,它是由每天的免费额度足够我们使用。我们刚刚已经讲解了如何生成我们的 a a 音乐,那么又该如何生成音效呢? 其实在我们视频生成这里就可以生成我们的 ai 音效,我在这里输入鸟在天上飞,然后我们点击进去之后,可以看到现在整个画面是没有声音的,那么我们点击这个 ai 音效,我们来一一听一下这几个音效, 可以感受到整体的一个音效其实是比较接近我们生活当中,但是呢经常会有一些不确定性,所以说还是需要我们自己来手动的找音效。这里呢给大家推荐一个音效网站,它的音质还有效果都是非常好, 我们这里可以随便试听几个,比如说这个敲门声, 再比如说这个 可以感受到整个声音是非常真实的,它里面还有不同的种类,涉及到我们生活方方面面的各种音效都有,那么在这里面找我们需要的音效是非常方便的,而且质量很高。 那么这节课呢就给大家讲解了如何生成我们的 ai 音乐以及 ai 音效。下一节课呢,我们将前几节课的成果整合成最后的一个片段,实现我们最终效果的展示。哈喽大家好,那么今天继续来到我们的 ai 视频生成全流程解析系列课程, 那么这节课呢,就要将我们前面几节课所生成的素材剪辑成最后的一个成片了, 那么来看看我们是怎么操作的。首先第一步我们要选择适合自己的剪辑软件,通常的来说有这么两款软件,剪映和 pr, 剪映适合新手,容易上手,好操作, pr 呢则门槛较高,需要一定的时间成本来学习。那么这里呢我们直接选择剪映软件下载,我们可以直接来到剪映的官网这里,点击立即下载。那么我们打开剪映之后呢,如果想学习一些基本操作,可以直接在我们的右上方,这里有一个教程, 我们点进去这个教程里面。哈喽,各位同学好,我是报道晓峰,这里已经有了我们常用的剪辑功能解析,比如说时间线转场特效,贴纸加字幕等等,那么学会这些基础功能之后, 我们就可以正式的来开始我们的剪辑了,我们点击开始创作,然后呢将我们之前生成好的视频素材拖入到下方的轨道栏这里按照我们的动画脚本对它进行排序。这里讲一下常见的基础操作,这个按钮呢就是分割, 我们将时间线拖到你想要分割的位置,点击一下,这样的话这一段视频就被分割成了两个,那么我们随便删除一个 可以看到就完成了我们最基础的剪辑操作。然后再拖入我们的短片盘白以及短片配乐,这里我直接展示一下我剪辑完之后的视频效果,我们对照着这些做好的效果来讲解一下我的剪辑思路。 寒夜霜月漫过荒郊破庙,蛛网缠绕断梁。首先在我们的短片开头有做一个封面, 那么这种封面该怎么做呢?我们可以选择在这个短片里面你比较喜欢的某一个瞬间,然后呢来到我们的豆包这里面,让他给我们生成我们短片名称的艺术字体,我们点击生成之后呢, ai 就 会自动帮我们生成四张字体,内容为月下湖生的字体图片。这里面我们可以选择自己喜欢的, 也可以多次抽卡,然后可以在 ps 里面后期处理一下,调整一下比例就可以导出了。装月漫过荒郊破庙这个字体呢,我们只需要点击我们的音频素材, 右键选择识别字幕歌词就可以了,然后他可能会出现一些错误,可以直接在这里面点击编辑,就比如说这样还是很方便,可以看到我原本的完整音频被我分割成了很多段, 主要是为了让我们的文字匹配上画面。这里的常用办法就是呢,将原本的完整音频 在不同镜头下进行切分,破庙蛛网缠绕,断梁残竹与古旧竹炭燃烧,火苗侵占。可以看到 音频和视频画面都是一一对应。云袖身着青布长衫,笔锋在粗糙的宣纸,春来赶考日,白狐骤然化。像这一部分的音效其实都是在生成 ai 视频的时候 自动生成的,只是我将这个音频分离出来,可以看到他们的命名是一样。那么通过这样简单的方式呢,我们就完成了视频的剪辑,其中包括视频片段的处理, 深沉字幕以及我们的音频和画面一一匹配。最后让我们再一次欣赏一下这个恋爱短片。 寒夜霜月漫过荒郊破庙,蛛网缠绕,断梁残烛与古旧竹台燃烧,火苗侵占书生。云袖身着青布长衫,笔锋在粗糙的宣纸上沙沙游走, 眼角瓦片松动,白狐探脑,景丁岸上卖饼,云秀推饼轻笑分你一半。自此米缸见底时,门槛总限,野兔有白狐相护,云秀免受激扰。 寒冬腊月,云秀扫雪,白狐相伴,一人一壶,蜿缩草垛取暖。 春来赶考日,白狐骤然化作白衣女子,阿九 云秀又惊又喜,相谈甚欢,递上虎尾所致神笔,指尖相触,情愫暗涌。云秀执笔画进长安,阿九却在破庙独守春秋。 数年后,官袍染尽繁华,故人已随胡茗消散风中为记。当年庙前有佳人在旁, 每想一别,竟是无缘再见。那么这就是我们 ai 动画短片生成的。如何制作一个人物一致性符合的 ai 动画短片?这是我今天想跟大家探讨的问题。 前段时间,有些朋友在评论区给我留言,问我怎么去制作一个人物一致性符合的 ai 动画短片,这个流程是怎么样的? 那我今天这期视频就是想跟大家讲解一下,如何从零到一去产出一个 ai 动画。相传很久以前,在古国庙庄,国王有三个女儿,其中小女儿妙善公主最为出众,她天性慈悲,心怀尘世的繁华喧嚣。 妙庄王希望为他安排婚姻,以巩固王朝权势。妙善却拒绝了父王的安排,妙庄王震怒之下,将他贬为数民,逐出皇宫。 妙善毫不怨恨,毅然前往香山修行半清灯古佛,苦心参悟慈悲真谛。多年后,妙庄王突然深染恶疾,命悬一线,太医束手,双眼入药,方能救命。 王后与众人言言无不退缩。唯有远在香山的妙善得知父王病危,毫不犹豫地已无上孝心,割下双手,挖出双眼,托人送回宫中,为父王炼药治病。妙庄王服药痊愈,父女二人一同前往香山探望。妙善 看着眼前失去双手双眼,面容憔悴的女儿,国王痛悔不已,跪地仰天祈祷, 愿以自己所有换取女儿的平安康健。忽然,天地震动,金光万丈,五彩祥云自天际缓缓降下金身佛陀现于云端,佛陀轻轻一指,妙善顿时端坐莲花宝座,断肢复原,双目重生,更化作千手千眼之圣象, 牵手播撒福纸,千眼洞察人间疾苦。自此,妙善公主化身为救苦救难的千手观音,以无尽慈悲与神力普度众生,必佑世间苍生。 ok, 那 我们现在正式开始,我这边做了一个流程图, 那咱们分成七个步骤,故事脚本、文声、图声、视频、配音、配乐、剪辑视频、放大字幕。对,就总共这七个部分, 那我一个一个讲吧。首先第一点,故事脚本,一个好的故事脚本作用多么的重要,我们最主要的事情就是说从故事脚本开始,我总共分成四个东西,第一个是故事的剧本,然后是人物设计,三分镜脚本,还有四就是这个 prompt 的 初始生成,这一点是非常重要的, 我们需要在前期就把相关的一些人物还有故事的一些 prompt, 先把它提前生成出来,这样才能保证我们之后的一些一致性,特别是人物这一块。 ok, 那 我一个个讲。首先故事剧本,一个动画片的话,你得有它的一个故事整体的框架,你可能自己没有一些很确切的这个想法,但是你至少有个灵感。 比如说以我这次的千手观音的由来为例子,这个是我们的主题,就想了一个小的故事,然后将有一个大语言模型来帮我发散 去 gbt 看一下我们是怎么做这个的。我们现在想要一个故事的剧本,那么 gbt 来帮我做一个事情,你是一个专业的编剧啊,这个动画编剧吧,现在请以千手观音的由来为主题, 帮我生成一个一分半钟以上的动画剧本。 ok, 那 这个时候他就给我们产出了一个简单的一个动画剧本,对吧?我们来看一下哈,标题是千手观音的由来, 总时长约一分五十秒,风格定位,古风写意感人,神话受众青少年及以上对传统文化或神话故事感兴趣的观众。 片头镜头描述什么样的一个镜头,什么样的场景,然后什么样的一个旁白,然后出现了一些角色人物,然后我们需要做的事情呢,就是在这个基础上把我们的想法与他进行融合。怎么去融合呢? 我会在接下来的视频里面去和大家一步一步的去操作哈,从零到一的去产出一个动画。然后这次呢,我就简单的给大家讲一下我的流程是怎么样的,就假如说我这个剧本已经可以了,可以使用的好,回到咱们刚才的这个流程里边, 剧本有了之后,我们需要人物设计,人物设计这个东西很重要,一定要把里面的人物的服装形象,还有角色整个人的状态,心理状态、情绪,还有些习惯性的动作特点去给他统一掉。为什么要做这一点呢?是为了我们的人物一致性,我们一定要把前期把它统一掉了之后, 我们后续出现这个人物的时候,他才能成为一个我们能够把控的东西啊。我们还是借用刚刚的 gpt 吧,用 gpt 来产出里边的人物。 ok, 我 们看一下啊,输入,请帮我生成剧本中每个人物的人物设定需要具备服装外形、性格、行为特点。 ok, 发给他我们看一下, ok, 咱们的每个角色的设定就出来了,我们稍微看一下,妙扇公主就是女主,服装设定,外貌特征还有性格特点、行为举止都给我们生成出来了,妙装王角色设定怎样的,王后设定怎样的,使者设定怎样的等等。 好, ok, 有 了这个人物设计之后呢,我们接下来就是去产出分镜脚本。来到我们这个分镜脚本基于故事剧本,将由大模型生成分镜再自主修改。那我这边写了一个这个,一个分镜对应一个镜头之后,很多文声图图声视频都基于这一点, 所以说这一块是非常重要的,那我的分镜脚本一定要把它确认好。我们还是以 gpt 举例吧,其实你用 gpt 或者用 deepsea 又或者豆包都可以,我们还是用 gpt 举例子, 帮我把剧本转变成分镜脚本。好,现在我们得到了它的分镜脚本,我们看一下哈。分镜脚本和剧本的描述是不太一样的,因为它是包含了每一个镜头,它需要哪些东西,需要哪些角色,什么样的镜头移动,什么样的对话,什么音效,持续多长时间,对吧? 我们看它给我们生成了一二三四五六七八九九个镜头,就代表着我们至少需要通过啊 ai 软件去生成九张图片。 这个时候如果我们对于一些镜头描述不是很满意,或者需要增减镜头的话,可以自己修改调整一下就可以了。我习惯用非书文档,我就把它存到了非书文档,方便我后续的使用。分镜脚本也有了,那我们就到 prompt 的 初生成。 什么是 prompt 的 初生成呢?就是还是用大模型这个人物设计分镜脚本,这两个它们的 prompt 一定要提前生成出来。 ok, 我 这边来让它帮我生成 prompt。 首先生成人物形象的吧,帮我把角色设定按照 comfyux 模型的 prompt 格式生成每个角色的 prompt, 我 们试试看一下能不能行。 gpt 还是非常好用的,因为我的这个视频其实全都是用 gpt 产出的,我们看到它每一个角色的 prompt 已经产出了,我们需要把这 prompt 全部复制过来,给大家看一下我之前的这个脚本吧。 剧本大纲刚刚已经生成了,人物形象设定也有了人物的 prompt 啊,这边每个人物的 prompt 也是保存了下来, 然后分镜脚本,分镜的 prompt 对, 我们也还要一个分镜的 prompt, 然后让 gpt 帮我把每个分镜也按照上述 prompt 的 格式生成对应的分镜。 ok, 好 的,我们等待一段时间,每个分镜的 prompt 也生成了。我们看一下这个镜头,一 golden goddess, thousand arms, radiating from back 之类之类之类的,还是全部复制,然后把它全部导到自己的这个表格里面。我们前期故事脚本准备工作就已经做完了。 好的小伙伴们,这一节分享的内容就到这里,下一节我将和大家讲一下脚本画面的具体生成方法和操作步骤。视频演示的内容,用到的工具和操作步骤,我会以文档的形式全部记录下来。 ok, 我 们来到第二步就是纹身图, 这一步是最重要的,这个决定了我们的这个图像质量。那么纹身图我是分成了这几个方面,一个是技术选择,第二个是主要人物形象生成,第三个是分镜的生成。 我们一个个来看技术选择就是整体影片的画风选择。其实我在做这个动画的时候,我就想好了我需要什么风格,比如说我这次选的是最近大火的 ppt 手办风格,也就是类似 q 版的 p 克斯三 d 风格那种感觉。 所以我第一件事情呢,就是先去搜寻有没有现有的风格模型,然后我来到力布吧,可以在这个地方搜索啊,你想要 gbt 手办, 对,就是这样的一个 loa, 我 看了一下它的画风,其实啊是符合我想要的那种感觉的啊,看了一下它下面的这个模型介绍,它的底膜用的是 flux 的 基础模型,我就用了 flux 一 demo f p 八这个底膜。 那我跟大家说一下,就是整体的这个画风的话,其实有好几种选择,一是现有的风格模型,这个是最省事的,也是最方便的。就如果说你想要的感觉,比如西海城的呀,比如说宫崎骏的呀,其实网上都有很多,你可以去找。如果说有对应的 lora 的 话, 那他其实对应的底膜就已经固定好了,你就只能用那个,或者你是有经验的情况下,可以多测试一下其他的底膜,看看有没有意想不到的效果。 第二个呢,就是你自己去练,比如说你有喜欢的这个喜欢的动漫角色,你就去截图,截一些高清的图,去炼制它的一个 lora 底膜的话就直接用 flux 的 底膜。第三种的话就是 ipad 接口的一个风格迁移,这个我不是很推荐啊,因为它会有一些颜色方面的颜色的异处干扰,整体的主体会比较杂乱。它走的是一个模型的管道, 质量还是偏向于底炉的效果,目前仅支持 s d 一 点五和 s d x l。 不 太推荐大家用 ipad 风格迁移去控制它的整体风格哈,它可以用在其他地方,但是整体风格不建议,所以就有两种,一个是找现有的风格模型,一个就是咱们自己去单独炼制。咱 们技术选择的第二步呢,就是第三方平台的选择了,我刚刚举的所有例子都是基于 comfyui 或者说是 sd 的 midjourney 也很推荐大家去用哈。 midjourney 的 话其实图像的质量也很好,它也可以用 croft 这种命令去保持人物的一致性。国内之光吉梦也是很不错的,截止视频制作,目前为止吉梦也更新了它的最新模型 v 三模型,效果也很 y y d s, 而且关键是也是免费的。 那 comfyui 这边主要注意的就是底膜的选择和 laura, 那 我的这个视频选择的是 flex 一 点 f p 八的这个底膜, 然后就是刚才的那个 gbt 手办的 laura。 那 在底幕这个地方我想跟大家提一点的,就是因为现在已经是 flex 时代了嘛。目前对于在这个电脑配置来说,出图是比较慢的, 有的小伙伴的配置要求可能会跟不上,所以我是建议大家先可以用 sd 一 点五或者 sdxl 系列的模型,又或者可以选择第三方平台,小伙伴们酌情的去选择哈。 如果说你是 ai 绘画新手的话, s d 一 点五比较容易起步, lo 方面丰富,也比较好调教。如果说你要做商业接单, s d x l 是 现在通用商用插图的中间力量, 如果你追求行业领先效果, flux 正在引领新一代扩散模型方向,尤其适合高端绘画、影视、工业设计, ai g c 创新内功。那技术选择这一块我就说完了, 接下来主要人物形象生成为什么要多这一步,不是直接去做咱们的图呢?有些小伙伴就会问,是不是可以直接就产出这种图了,跟他说,比如说以这张图为例吧,我就直接一个图片告诉他,可爱的人物,东方女神。云层之上,雪山背景,一个年轻女子坐在金莲座上, 清纯安详的面容,白丝绸蒙眼,额上红朱砂纹,乌黑飘逸的长发,精致的发饰, 其实这样的话是很难控制人物一致性的,人物一致性是生成 ai 的 短片、影片最重要的一个东西,所以必须要有主要人物形象生成这一块。那主要人物生成有两种做法,一个是简单做法,一个是推荐做法。 这个推荐做法,这我是标红了的,以下所有的标红的地方,标红的地方都是我个人更推荐的方式。简单做法就是我们需要生成一张人物的面部特写,还有一张人物的全身形象。为什么需要这两个东西?首先面部特写, 面部特写他需要的就是我们的用到这个 instagram id 来保证人物的面部是一致的。第二个全身形象的话,是要保证我们人物服装穿着打扮尽量的保持一致,因为这个是简单做法,我们需要这两张图片来为我们之后的工作进行一个参考。 但是这有一个问题,面部只有一张,全身形象也只有一张,那就决定了我们这个人物他一定不能很复杂,而且生成的人物的精细度一定不会很高。 那在这种情况之下,我们最好的做法是什么呢?就是下边的推荐做法。我们需要用到 controlnet 的 如 open pose, kenny 这块,生成人物的多个面部表情,以及这个人物的三式图,还有这个人物的其他骨骼动作, 就相当于是我需要这个人物的不同的表情,正面图像,以及它的三式图的骨骼框架,还有其他的动作,全部都生成,而且是保证服装外貌啊的一致性。我之前也有出过类似的视频分享。 生成了这些东西之后,我们最主要的事情就是要用这些东西去练人物 laura。 练人物 laura 是 我们保持人物一致性最佳的一个做法。如果说没有练至人物 laura 的 话,我们通过 ipad, adapter 或者说其他的方式,其实,嗯,不是很能保证人物的一致性的。 ok, 我 们来到下一步,当我们的主要人物形象生成了之后呢,我们就去生成分镜了。分镜呢,这个是最最最重要的一块了,你的分镜质量如何才能决定你之后生成动画质量如何?还是两个做法,简单做法,推荐做法。 简单做法的话就是可控性差,出图质量不高,但是简单快捷。推荐做法呢,就是可控性强,一致性更高,但是更加耗时间。我这次也用了简单做法。先讲一下简单做法吧, 总体分为两步,第一,抽卡出图,确定构图。那抽卡出图,确定构图呢?分为两种方式, 第一个是直接出图,就根据分镜 prompt 不 断地调试去抽卡,我们来 copy ui 里面尝试一下, 我们把分镜镜头复制一下,来到 comfyui, 在 comfyui 里面正向文本提示词这里粘贴我们刚刚复制的这个 prompt, 然后点击执行。那经过一段时间的等待呢?咱们的图片出来了,这个画风其实是很 gpt, 手办皮克斯三 d 风格的, 剧本上写的是可爱的人物,美丽的女神,千手观音,多臂飘逸的长发,传统的中国服饰,白色和浅蓝色的丝绸长袍,金色的刺绣,神圣的光环,空灵的气氛,站在云端,雪花飘落,柔和的灯光,电影般梦幻景观,高分辨率。 这个时候我们需要考虑到一个点,就是这个图片如果放在图像电影般梦幻景观,高分辨率。这个时候我们需要考虑到一个点,就是这个图片如果放在刚刚那样移动的那个效果,这个图片质量还可以, 如果小伙伴们如果对生成图片质量不是很满意的情况下,可以多抽卡生成几次,这个都无所谓,我们可以去慢慢调试,根据分镜 pro 不 断的去调试抽卡哈。 这个的话我们主要有一点就是时间成本不可控,但是能提供更多的灵感,因为你可能不知道它的构图是什么样的。 第二种呢?就是参考出图,这个是根据参考构图去反推修改,如果说你需要一个,哎,你脑海里面已经有一个你想要的这个感觉了,比如说你在某个电影上面看到了一个这样的一个构图,比如说我们到 printress 里面去找一找有没有这方面的灵感, 哎,大概有很多这种感觉的图片,我们想要那种感觉的就把它保存下来。比如说这一张保存下来之后, comfyui 里面咱们用图生图的方式去生成这个图片,那这个过程中需要用到的东西呢?可能会是 ctrl。 net, 或者说是反推去达到一个你想要的那种感觉的一个效果。 如果是 ctrl 代的话,我们肯定是需要做一些构图上的变化的, ctrl 代的强度就不能太高,或者说咱们直接图生图,直接图生图就有一个问题,就是咱们的这个尺寸问题,那这个就是我们用参考出图或者直接出图的方式去得到我们想要的构图,这是第一步。 第二步呢就是从会确定细节,从会确定细节这一块才是咱们的重点,人物一致性,其他画面调整和确定是否需要首尾针,这个是步骤,不是说可挑选的, 是按照这个步骤来做的人物一致性。我们先看一下,刚刚咱们在第一步抽卡出图确认构图的时候,没有完全没有做任何的人物一致性,就是直接出,那咱们的构图确定之后,人物的一致性怎么去确保?我们这种方法其实比较笨啊,用万物迁移的逻辑去重新修改它。 那怎么改呢?我们到 comfyui 里面看一下,这是一个比较简单的一个万物迁移工作流,这里上存我们要参考的角色服装或者身体, 下面上存我们要调整优化细节,人物一致性的图片。接着我们鼠标右键在遮罩编辑器中打开,比如说构图我很喜欢,场景风格颜色我都很喜欢,但是人完全不一样,衣服也不一样,那我这时候就去教大家怎么弄哈。 调整画笔大小,涂抹要局部重绘或者要迁移的地方,咱们一步一步来,先把衣服换成我们角色原有的衣服。服装 涂抹完成之后,我们点击保存,接着点击运行,稍等一会时间,我们原有角色的服装和身体就已经换上去了,这时我们发现角色的脸跟身体不是很匹配,长得也跟我们的主角也不一样。 不着急,我们用同样的方法把头部也迁移过来,操作过程也跟换衣服的差不多。这时我们把角色的脸部呀上存上来, 操作完成之后,我们再点击运行,借助这个万物迁移的工作流,我们就可以把他脸部和衣服保证他的一致性了。这个是非常笨拙的,方法,也非常的简单,只是说他生成出来的东西呢,可能需要调试,而且不太可控,就是不是那么精准, 这样就可以保持构图确定的情况下,哎,人物不太一样,衣服不太一样,头发颜色也不太一样,我们就用这样的迁移方式全部给他改掉,那这个就是咱们人物一致性,然后第二个其他画面调整,其他画面调整呢,也是一样的,同样用重绘的方式把它进行调整。 第三个呢,就是咱们要确定是否需要首尾帧,首帧是视频或镜头开始播放时呈现的第一个画面,尾帧是视频或镜头结束前呈现的最后一个画面,中间通过动画变化实现视觉连贯、节奏平稳、风格统一的首尾过渡效果。 设计过渡动画的关键原则也是要去保持元素的一致性,这个是我们在生成动画的时候需要确定的。是否需要首尾帧, 咱们分镜生成的简单做法就是这些已经讲完了,其实就两个步骤,抽卡出图,确定它的构图。第二个在确定构图的情况之下去重绘确定它的细节,然后推荐做法呢?我给大家简单说一下推荐做法, 其实我最推荐的是手绘去确定构图。手绘确定构图呢,要么你跟一个画师去合作,或者说你的朋友画画,画的很好,直接画个线稿, 只要一张就行了,因为咱们做动画一般得需要一拍多,但是在 ai 的 加持之下,你只需要一张。不过如果说我们完全没有绘质的基础,那么就这两种方式, 简易的线稿构图,或者是简易的颜色构图, ok, 线稿,简易的线稿画图怎么画呢?比如说咱们这个画板,我需要一个女孩长头发,然后你后面站着一个男人,错位对称构图,周围一些宫廷或者过道相关的元素,我们通过不同的颜色来控制不同的区域和人物, 只需要在我们最终去生成的时候,给它每个区域做上一个遮罩,再在那个区域里面进行一个分区的 lora 就 可以不用去重绘的情况之下,直接出来咱们人物一致性的一个图片。但这个是有一个非常大的问题,对化工的要求很高,需要良好的透视。 对,就这个问题也不算很高吧,但至少你需要良好的透视的感觉,就是说你是要画过画的,不然的话你画出来的东西其实透视效果很差,他达不到你想要的构图的感觉。所以说我是建议可以说简单的做一些透视, 或者说和一些会画画朋友简单画一下之后,再来用 ctrl net 去简易的一个控制强度不要给太高,不要定的很死。 第二个是呢,是这个简易颜色构图,简易颜色构图也跟刚刚一样,只是说我们大致画个区域,比如说这一块红色啊,这一块蓝色, 那我想表达的呢,就是说我想在红色区域放一个我的角色,我在蓝色区域放一个我的另外一个角色,然后其他的这些区域呢?是我的背景,或者说是其他的角色啊。 我们只需要把这些颜色通道提取出来,提取出来之后去做对应颜色的区域遮罩,然后再加上分区的 lora, 就 可以形成我们一张图里面的构图控制,同时还有咱们的这个人物一致性的控制了。 对,这个是简易的颜色构图。那简易颜色构图它的问题是什么呢?没有透视还得抽卡,因为现稿的话,咱们因为有 control net 会给予我们一定的透视结果的,但是颜色构图就只有一堆堆的色块,所以他出来什么样的一个结果,能不能跟咱们的分镜对得上,看运气,所以说你需要不断的去抽 手绘确定构图,就是咱们把两个线稿或者说是简易的颜色构图确定好了之后,分区出分镜图,怎么分区, lora 怎么去分区,用遮罩,这些细致的东西我们以后有很多教程大家可以去看一下,我们这边只讲思路哈。 然后第三步,根据咱们出的分镜图延伸首尾针,在需要首尾针的情况下,最后再把所有的首尾针也好,分镜也好优化调整好,这样咱们的所有的分镜生成就做完了。分镜生成是我们最终需要放到图中视频里面来做的东西, 所以这一步是最重要的,占整个动画制作流程的大头。以上就是 ai 动画制作全流程思路拆解的纹身图部分,主要讲了纹身图,那么我们下集将会从图声视频,还有配音配乐以及剪辑 视频,放大字幕等方面去聊一聊咱们整个 ai 动画制作全流程是怎么样的。 ok, 这期视频我们来讲一下 ai 动画制作全流程思路拆解的图声视频以及最后剪辑成片的部分。如果没有看过前面讲解的朋友,也可以一步至前面三集的内容,再来观看本期视频哈。 文声图结束,然后到图声视频,这一点相信也是大家非常关注的,在图声视频方面有闭源平台和开源项目, 然后还有在币源平台生成的视频如何去除水印,这是在免费补氪金的极端条件下使用的方式哈,这两个是并列的关系,咱们可以根据自己的实际情况去进行选择哈。 闭源平台这边我是最先推荐的,因为它的质量更高,但是它是付费的。闭源平台的话,我目前主要觉得这几个比较好用,国外的有 runway, 国内的话包括可灵吉梦和海螺 ai 等闭源平台通用。万象这边它是开源的,不过它也有在线生成和 api 的 调区使用。 而可灵 ai 的 首页点击视频生成,选择图生视频, 比如说刚刚的这个分镜,咱们已经调整好了,在这边的框框里点击上传图片, ok, 分 镜图片上传好了之后,我们要按照一定的格式去描述他的运动轨迹。这边推荐的方法呢,就是说咱们的镜头加上主体加上运动,再加一些其他描述,这个是我们比较好的一个方式。 如果说小伙伴们实在不会怎么写的话,我们来到 gpt 界面,把分镜图片上存给 gpt, 然后给他输入一段指令,说妙扇公主在书房窗户旁静坐着,帮我根据图片写一段运境提示词, 然后我们点击发送,稍等一会儿, gpt 就 会根据我们提供的这个妙扇公主静坐书房窗边诵经的场景。这我们生成了一段可以直接在可令 ai 使用的图像生成视频的运境提示词了。 接着我们把这一段运境提示词复制一下,来到可灵界面,粘贴到创意描述提示词框这里。模型这里我们选择可灵二点一的大模型,如果需要同时生成视频音效的,可以把这个生成视频音效的按钮打开,接着我们点击立即生成它生成需要一定的时间,我这边就不尝试了, 我们直接来看一下我制作视频时生成的片段吧,可以看到我这里是一次抽卡就成功了的哈。我们按照这样的一个格式或者方法去生成所有的分镜视频,如果有对生成不满意的情况下,我们可以多抽卡几次,直到我们想要的结果。 可玲这里其实是我非常推荐的,因为他出来的结果很有情趣,特别是人物的表情,还有他的动作也是很丝滑很连贯的,人物一致性也保持的非常好。其实国内目前也出现很多好用的视频生成平台,小伙伴们可以对比着使用。第二个就是开源项目, 开源项目在我制作本期案例的时候,我是不太看好的,觉得开源项目不太适合徒生视频也比较吃配置,基本上你没有十六 g 的 那个显存的话,其实不太好玩的转这个东西的,而且质量也不佳。 结果过了一小段时间,来到制作本期视频的时候,我打脸了。最近万象二点一新出了一款 fusion x 视频模型, 仅需六到十步就能输出高质量生成效果,比基础的 one 模型快百分之三十到百分之五十,在相同步骤下拥有明显更加的光照与运镜表现,视觉体验接近闭源。商业模型可快速导入 comfyur, 一 键式上手, 能实现纹身视频、图声视频、扩展视频、首尾帧视频生成、局部重绘以及动作迁移等多场景支持。 我这边来到 comfyui 给大家演示一下。点击左边菜单栏的工作流文件夹,选择我们这期视频用到的图声视频工作流,在加载图像这里上传我们的分镜图片, 例如在这里选择这样一张其中某一位公主听到妙装王突然身染恶疾命悬一线的场景画面,在这里输入一段我们的运镜提示词,稍等一会,我们来看一下它整体的镜头画面表现效果。 镜头在正前方,捕捉到公主突然听闻消息时震惊张嘴的表情,雪花缓缓飘落,增强画面动感。中景逐渐拉近为特写,突出公主双眼睁圆,手抬起至胸前的慌乱动作,背景的宫女略显模糊,形成了强烈紧身效果, 是不是感觉还不错?这里演示用到的工作流和其他的几个功能的工作流,我也一起打包好上传到网盘了,有需要的小伙伴可以在评论区给我留言,我会逐一分享给你。 ok, 好 的,我们接着来聊一下开源项目这一块的内容,它的优点呢,就是免费的啊,比如我们刚刚说的 on fusion x 的 项目效果, 还有之前的老项目 animateif 和出来有一段时间的 call video, 这两个东西其实可以用到我们的做的这个动画短片里面。 animateif 呢,它可以做转场或者说变化特效,但是你想做一些大的运动轨迹其实很难。 call video 对 配置要求也比较高,可以做一些人物之外的一些运动,如果涉及到主要人物的话,它的情绪表达只有运动,没有感情。 如果说你做的这个视频没有人物,没有角色,纯粹的风景啊,你不想让它表现任何的情感的话,你可以用 calliglio, 也可以用 animateif。 可是如果你一旦需要表达人物的情感说话,你一定要用到闭元模型,开元模型现在还不适合徒生视频说话,我说的是徒生视频哈, ok。 然后闭源平台选择可令 ai 或者即梦,又或者 runway 也好,它出来的。呃,视频有水印,那去水印就要在这边解决了, vs 二啊,大家可以去 get up 上面搜一下这个东西啊。 vs 二是一个非常好用的一个去水印的 ai 工具吧,当然它也是有一定的小 bug 的, 可能去除的没有想象中那么理想。我这边也搭建了一个工作流供大家使用,它不但可以移出水印,还可以移除物体角色,而且也可以在多角色的复杂场景里面移除指定角色。 还有一个东西要跟大家讲一下,我们为什么在纹身图这边的分镜生成最后重绘之后的这个地方不添加一个分镜放大 这一点可能。呃,有的朋友会问啊,为什么不放大?在这块放大我觉得不是很有必要的一个事情了,如果说要放大的话,那一定是在人物的面部三式图其他骨骼动作这个地方做一些高清修复,然后再去练至 lower, 或者说在面部特写这边,我只能把参考图片要做的更加清晰, 因为我们的闭源平台或者说是开源项目现在对分辨率的支持他并没有那么高。但是我们也有一个放大步骤,放在哪呢?是放在剪辑完了之后第六步,这一步我待会跟大家讲,并不代表我们不放大,只是说放大步骤放在那个地方。 ok, 那 么我们故事脚本,文声图图声视频都有了, 那剩下的是什么呢?人物的配音,还有音效音乐,人物配音。跟大家说一下,我们是 q 版动漫,那 q 版动漫的话,它需要二次元角色的配音,你自己的声线没法自己配,那咱们是两种方法,一个是 gpt solvets 自训练,第二个是 ai 配音网站 啊,我优先讲 gpt 搜索词自训练吧,我们在 getup 上面去搜一下。这个是我们国内一个大神做的一个模型,可以很短时间的语料之内就能训练自己的语音模型,我推荐大家可以去下载已经训练好角色的模型。这样的方式呢,音质很精准,不过可能情感、语速、语调方面不太可控。 第二个呢就是音色克隆,我们得到语音包之后,你自己去人为配音之后再进行音色转换,情感、语速语调人为可控,但非常吃原本配音人员的音色。这个是什么意思呢? 换一种方式说,就是开了变声器,开了变声器之后,你的声音其实是基于你原本的声音来做一个转换的。如果说原本的声音底子不一样,比如说有一个抠脚大汉的男性声音, 你需要配一个很二次元的萝莉声音的话,你哪怕你的原来的语料训练的很好,但是转过来了音色比较差,不是很好, 所以这两个的话你自行选择吧。最好的方式就是音色克隆。配二次元女性的时候你找一个声音类似的人去配,配男性的时候你再找一个声音类似的男性去配,这样的话能保证音色、情感、语速、语调都可控。 由于这期的案例我没有用到给角色配音,在这里就演示不了给大家看了第二个人物配音的方式,就是 ai 配音网站, ai 配音网站网上有很多,不过可选择范围其实比较有限,大部分都是文转语音, ai 的 味道很浓,就是我们在一些视频平台上面看到的那种配音,一听就知道是 ai 的, 有兴趣的小伙伴可以自己去了解一下啊。音乐音效, 音乐音效这边商用和非商用,看你自己商用的话,建议买一下版权,或者说你用 solo 去自己生成一个。非商用就无所谓了,因为你非商用就随便找找你喜欢的好听的就行。 还有剪映上面一些音效,嗯,这次我用的也就是剪映的,上面资源还是挺丰富的。然后接下来是剪辑,把你的所有的音乐音效和生成的视频导进软件里面,比如说用剪映挨个剪成你想要的长度,然后添加一些过渡转场,最后导出, 再进入第六步的放大,将剪好的影片没有字幕的进行画质放大。为什么要叫做这一步呢?比如说这个项目是一个一千零二十四乘五百六十八的一个分辨率的项目,所以我们需要最终将它进行一个放大。 那为什么我把放大放在这里呢?我们可以想一个逻辑,我每一个视频大概都是五秒,如果说我在前期就做了放大那一个视频五秒,比如说我每个视频帧率都是二十帧, 那么一秒钟就是二十张图片,总共算下来就是一百张图片,我就要每个五秒的视频都要放大一百张图片。可是我在剪辑的时候并不一定需要用到全部的这五秒,有的片段只用到了一两秒, 在只用到一两秒的情况下,我最后剪完了我再去放大,那不是就节约了我很多的时间成本啊,而且也节省了重复放大的操作步骤,所以这是我这边的一个方法。如果说大家觉得有其他的方法,我这个方法不太好的话,也欢迎大家给我指正哈。 最后的视频放大用到什么东西呢?我这边用到的是 topos video, 我 们点击这里的浏览,选择我们刚刚导出来要放大的视频,接着我们看到右边这里选择要输出的分辨率,这里有两倍放大,四倍放大,甚至是八倍放大, 我这里最后只放大了两倍。帧速率这里我目前是二十帧每秒,如果要补帧的话,也可以选择三十帧每秒。接下来把稳定消除,运动模糊,帧差值增强都打开,最后点击 export, 稍等一会,视频就放大好了,输出在我们原本文件的文件夹路径里面, ok, 最后一步就是字幕了,我们把放大之后的视频导进剪映里面,或者说导进一个剪辑软件里面,把字幕加上,最后导出。那么在这里恭喜你,你的视频做完了。 那这里的话我其实还想跟大家说一些东西吧,其实我对 ai 动画还有 ai 短片和电影这块其实一直比较看好的, 因为咱们现在的 ai 的 动画模型啊,运动模型其实越来越先进了,二零二五年的 ai 动画短片已在专业赛事中崭露头角,如 runway film festival 收到六千家多部作品,获奖作品展示了 ai 日渐成熟的视觉与蓄势能力。 韩国 cjem 即将发布首个完全 ai 制作的动画短片 catbg, 并计划进军 ai 影视领域。虽然说 ai 目前有制作低成本和效率高的优势,但 ai 生成的视频经常陷入舆论风波,角色表现和复杂蓄势仍然不及传统手法。 同时, ai 线将在剧本创作、分镜摄影、预演、声音合成、角色动画、色彩渲染等全流程持续渗透,成为创作中不可或缺的辅助工具, 快速产出视觉内容,尤其适合短视频、动画短片、小预算、实验性项目。未来二到三年可能看到更多 ai 混合创作的作品发布,但完全 ai 制作的电影正式上映可能仍需等待技术成熟与行业规范。 当然这只是我自己认为啊。那么本期视频的话,主要是梳理了一下我们怎么用图声视频的方式制作一部 ai 动画短片, 讲的也比较粗糙,讲的也不是非常的细致,而且有很多我自己理解不是很到位的地方,如果说,呃,大家发现这些问题的话,请多多批评指正,我也会耐心的去学习哈,未来会努力制作更多有价值有意义的视频教程分享给大家哈。 那当然,如果你觉得这期视频对你有一定的帮助的话,那也希望你能够一箭三连,我会更加多的去更新更多关于 ai 方面的一些知识,特别是 ai 动画、 ai 视频,还有 ai 图像方面的一些东西。 大家好,我是老成。那众所周知呢? ai 生成创意故事、剧本是一个非常有吸引力的想法呃,但是这个过程呢,就像是学习驾驶一艘强大的想象力飞船一样,你拥有强大的引擎,但是你不知道如何操作控制台飞船可能就会原地打转,或者飞向完全错误的方向。 让我们把 ai 想象成一个才华横溢啊,但是毫无主见的编剧实习生啊,他读过人类历史上所有的剧本,但你必须告诉他具体写什么,怎么写。 以下是新手在使用 ai 生成剧本时最常遇到的五个问题,以及如何从新手操作升级为专家操作的具体方案。 首先我们来看第一个问题啊,开局一张纸,故事全靠给,这是一个啊,致命的一个新手错误啊。新手往往期望 ai 能够凭空制造一个完整的,新颖的而且有趣的故事 啊,那么通常给一个许愿式的一个提示词指令啊,比如说给我写一个有趣的科幻故事剧本,那么这么做他有什么问题? 虽然 ai 现在它的功能很强大啊,它的能力很突出,但是如果你这么给提示词的话,它会有两个不好的地方。第一, 它给出的结果啊,它给出的结果啊,不,非常不符合现实,非常非常的不符合现实,就是说它和现实的脱节是非常大的,它可能是,呃,就是可能尽可能的去给你想象,但是这个想象是和现实脱节的。第二, 这种提示词可能会出现一个相同的结果啊,因为你并没有给出差异化的方案,那么他可能你这种提示词你给他生成几遍,他可能就是在一个小圈子里不断的绕啊绕啊绕啊,他不会给你扩展更多的想象, 比如说啊,他现在生成了一个宇宙尽头的烤面包机啊,那么你看这个融合了幽默、悬疑,然后还有一点存在主义的科幻短剧剧本 啊,大家看题目啊,宇宙尽头的烤面包机,我如果看到这种题目,我肯定是不爱看的。那么他的故事梗概是,一个邋遢的技术宅男发现他新买的他二手烤面包机,不仅能烤出完美的吐司,还能结实宇宙的终极秘密。 当他制造他的巨型公司,派人来回收这个故障产品时,他必须为保护这个宇宙最伟大的思想家而战啊。他为了保护这个面包机而战, 这个故事首先本身就不太好啊,那么如果说我们能不能抽卡呢?啊?能不能抽卡,我们试一下,再重新让他跑一下,看看他能出个什么啊。 好,你看,又来一个最后的烤面包机,就是这个面包机就绕不过去了。所以说啊,就是不管你出几次,可能是面面,烤面包机,可能是酸黄瓜,他反正是不会给你出一个 比较正常的一个结果啊。他这个结果很不正常,虽然说他写了洋洋洒洒写了一大堆,但是他的内容从故事梗概和标题来看,就不具备吸引力啊。所以说,这个这种方式,他是绝对出不来好剧本了。有的同学说啊,老师,你看我出的东西,那不行啊,乱七八糟的,就是因为你给的提示词不对, 你给了个什么提示词,对吧?给我一个有趣的故事,让他去想,他能给你想什么,他想的都不怎么样。所以说,你不能上来,全靠编啊,你得需要给 ai 一个种子啊,你得给他一个呃,就是具体一点的东西啊,这个有趣和科幻,它范围太大了 啊,他不知道你是想看星际穿越还是想看这个什么瑞克和莫迪啊,他只能调取一个大众化最沉瓷烂掉的一个模板啊,他连他刚才连这个宇航员飞船什么外星人都没有啊,就连这个结果都没有,他只给一个最糟糕的模板。 所以说,如果说你想要写一个专业的好看的模板,所以说如果说你想要写一个专业的科幻编剧啊,先给他一个人设, 然后再基于以下核心设定构思一个故事大纲。你需要给一个设定核心设定是什么呢啊?比如说举个例子,在一个记忆可以被提取交易实用的世界中啊,这里就是有一个想象力的设定了,对吧?你的记忆可以交易,可以吃, 是吧?然后一位专门品鉴啊,品尝和鉴定美食记忆的顶尖记忆品鉴师意外尝到了一份匿名的谋杀案第一视角的记忆。你看这个,这个故事就很有意思, 他必须在自己心智被这份有毒记忆吞食之前找到凶手和受害者啊,倒计时也有了,紧迫感也有了。 然后最后要求为这个故事设计的主要角色啊,关键转折还有结局。你看主要角色要设计,关键转折也要设计,结局也要设计。那么他就这个提示词就很丰富了,丰富且精准。那么我们来试一下这个提示词能给到一个什么结果啊? 我们运行一下 啊。呃,第一个故事大纲题目回味的读次 这个,这个这个题目就比上一次就强很多了啊。然后他的故事梗概是什么呢?在一个记忆可以被使用的奢侈未来,一位顶尖的记忆品鉴师意外肠道啊,这个是刚才给的啊,呃,那么核心世界观与设定 啊,既通过一种神经网络技术啊,将特定时间完整的感官情感提取出来,封装在一个记忆精的半透明晶体中,这是世世界观设定,我就不仔细读了,我们详细看一下。什么呢?主要角色就是 ai 给出的结果。 主要角色啊,这个亚瑟凡啊,一位三十多岁,业内闻名的记忆品鉴师,优雅,孤僻,追求完美。品鉴师啊,品鉴室是什么样的啊?是一座结合了清九酒吧和未来实验室的盛典 啊,背景故事啊,还有背景故事,亚瑟曾因一场事故失去了大部分童年记忆,成为了品鉴师。部分原因是因为是为了啊,品尝他人的生命来填补自己的空白啊,是一个空心人啊,靠别人情感而活着的鉴赏家。 弱点是对骄傲,骄他的骄傲和对极致体验的病态追求啊。其实这个写的很详细了啊, 这里给了一个对手和盟友啊,这是一个配角,这个是一个执法部记忆犯罪科的探员,务实刻板, 然后对主角充满不信任啊,靠数据和逻辑,而非这个主角说的味道和余韵啊。他的角色功能是啊,亚瑟通往现实世界的桥梁啊,代表秩序和规则从最初对立发展成一种不稳定的合作关系啊,这个写的很好啊, 那么我们来看一下后面的故事结构和转折啊。第一幕,完美的盛宴与致命的开胃菜展示。亚瑟的记忆怎么怎么样啊,他的每一个事件啊,都很详细,具体 都很详细,具体,你完全可以通过这些事件给他扩展成一个非常专业的剧本啊,这个我就不给大家自己仔细念了,其实大家都可以通过老师给的提示词来自己尝试一下,看看 ai 到底给你一个什么样的结果啊。那么在这里呢 啊,如果你说啊,老师,我不想啊,就是做这种,我想做一个其他的种类的,可不可以?也可以,那么这里我把提示词主干提取出来了,你可以通过填空啊,比如说你是一位丰富经验丰富的 言情小说编剧,可不可以?可以,你是一个经验丰富的这个玄幻玄幻剧本编辑啊,也可以。 然后请基于以下核心设定构思一个故事大纲,这个故事大纲得你自己写,你至少要写一个故事梗概,对吧?然后核心设定是什么,你要填空,如果你实在填不出来,那么你就直接让 ai 来帮你填啊,比如说, 嗯嗯,我要 啊,制作一个啊,一个言情啊,都市小说 啊,都市剧本啊,请帮我完,请帮我完善啊下面的模板内容, 你说我实在是懒,我也不想,我也不知道怎么写,是吧?然后你可以用这种方式让 ai 帮你填空,看看有没有可能出现一个好的内容 这个东西,它有可能好,也有可能不好,你可以抽卡来扩展自己的思维,看看怎么填,然后找几个方案筛选出来一个最优秀的,然后再通过这种方式来完善你的剧本啊,这样就是从零到一, 从零到一,你得自己去想,但是这个从零到一的过程也可以用 ai 来辅助,但是大家一定要注意, ai 只是一个辅助,它可能给你提供选项,但最终的决策和拍板一定是自己来的啊。那么你看,这个出来了啊,这个故事大纲, 嗯,都市情感剧编剧,然后生成以下大纲啊,它的核心设定是一位信奉数据概率风险评估师。啊,这个,这个有一个问题,是什么?它有上下文?它有上下文,那么我现在 把它,呃重新开个窗口再试一下啊,它有上下文,所以说它就出现一个信息污染了。这种情况你只能重开窗口,或者是提示 ai 切断上下文。 好,那么他给出了一个大纲啊,他给出了一个大纲,呃,核心设定啊,一位信奉真爱至上的理想主义插画师,意外继承了素未谋面姑妈留下的专门替人处理分手事宜的分手代理事务所。 为了维持生计和探寻姑妈的秘密,他被迫接受这个与自己价值观完全相背的生意。在一次次棒打鸳鸯的委托中,见证了都市男女百态的情感纠葛,并重新审视自己对爱情和人生的定义。我觉得这个核心设定非常好啊!核心设定非常好, 好故事大纲,大家看一下哈,分手清单或者再见爱人。然后故事的主题是探讨现在都市情感的脆弱与坚韧,以及结束一段关系中的真正意义。好的告别也是一种爱。 故事节奏以单元句推进啊,每个或每两个分手委托为一个单元,贯穿主角的成长和情感主线,我觉得非常棒啊! 然后人物登场。人物女主角林卫,二十六岁,一名为儿童读物绘制美好童话的插画师,对爱情充满不切实际的幻想。他和看似完美的男友江宇交往中,认认为自己找到了现实中的王子, 一封律师函打破了他平静的生活,从素未谋面的姑妈去世,将名下唯一的财产,一家名为好聚好散的分手代理事务所留给他,事务所还附带一笔不小的债务和几名专业员工啊,我觉得不错呀。 然后临慰震惊发现这家事务所的业务是专业代理分手并处理后续的情感与财产纠葛,这是他真爱永恒的信念,背道而驰。 事务所王牌谈判专家沈哲是一个言辞犀利,信奉感情皆可量化的现实主义者,对临危这个空降的理想主义老板充满不信任啊,挺好。 然后被迫接受,本想关掉事务事务所,但是得还债啊,然后内心又对姑妈充满好奇,就经营了下去。然后第一个案子就一团糟,差点被客户投诉,沈哲出面收拾了残局,两人矛盾激化 啊,挺好的啊,然后在婶婶的调教下接触形形色色的委托啊,第一个为你好的谎言啊,一对校园情侣,男生为女友出让,为了男生,为让女友出国深造啊,委托扮扮演坏人被迫分手。 然后在处理中开始思考牺牲式爱情的真伪。然后数字婚姻的破裂啊,数字匹配的夫妻啊,生活无法量化的矛盾而分手啊。然后沈哲的数据理论首次受到挑战,然后是黄昏恋终结啊,我觉得不错啊, 转折结尾,启程转合都有了。然后主要角色设定啊,他的角色也很有特色啊,这个充满矛盾的一个人物啊,他本身是离爱情理想家,但是呢,他又被迫然后接触了这个用数字量化的这种, 这个分手代理事务所啊,我觉得这个矛盾是很很棒的啊,然后理性数据作茧自缚啊,就是都是很有矛盾的这种 啊,然后姑妈前男友啊,我觉得这个这个本子就挺好了,这个本子就挺好了,所以说大家可以用老师给的这个关键词尝试一下,然后直接让 ai 帮你来完善一个,只要你给一个题材,你至少要给一个题材,你要做一个什么样的剧本, 然后你把这个给到 ai, 然后 ai 就 直接能给你出一个很好的一个剧本啊,那么在后边呢, 是只骗人没有灵魂啊。那么新手操作,假如说你要写一个人物小传啊,很多同学就是主角是一个叫李明的警察, 对吧?这 ai 让 ai 完全让 ai 给你编啊,那么就会生成一个刻板的正义勇敢、不苟言笑的这种刻板标签就打在了这个警察身上啊,非常单调,可预测就感觉, 嗯,我看到开头就知道结尾了,那么你想让这个人物丰满鲜活起来怎么办啊?这里有提示词,比如说请为我的主角李明创建一个详细的角色介绍,请用以下结构,是吧? 你看刚才这个提示词啊,刚才这个他其实也出人物小传了,那么他的人物小传是什么呢?人物胡光特点口头禅,前期后期,对吧? 他比较简单,但是如果说你希望把这个人物小传做的更丰满一些啊,那么你就需要再给他添加一些你需要添加的元素,比如说他的职业是什么啊?刑警即将退休,核心驱动力是什么? 表面上想安稳退休,但内心深处极度渴望在退退休前破获一桩完美玄案,证明自己的宝刀未老。其实这个核心驱动力是什么呢?就是人物的动机,你把人物的动机写出来,那么他就可以产生人物的矛盾,人物的表面和他内心深处的动机 发生了矛盾,是吧?这样的话,这个这个人物就有意思了。那么致命弱点是什么呢?啊?这个致命的弱点和矛盾啊,他观察力敏睿,但是因为年纪大了,体力不支, 对新科技非常抗拒啊,这是他的弱点。标一个标志性的习惯。思考时啊,会不停的转动一枚老旧的硬币。有这种标志性的习惯和有一句口头禅,能够加深观众对人物的印象,这样你的人物就会产生一个标签,他不会是一个脸谱化的人物,而是一个个性鲜明的人物。 所以说,标志性习惯和口头禅其实是塑造人物的一个关键啊,但是大多数是不会给的啊。这个好在他还给了一个这个人物的口头禅,前期是什么,后期是什么,对吧?他都给口头禅了,但是人物的习惯他没有。然后我们可以让 ai 给你设计一个人物的习惯啊, 那么同样的啊,人物小传的提示词我也给大家提炼出来,放到后边了。你如果不想填这个空啊,如果你有想加添加的元素,你填在这个空里,如果你没有,那么可以让 ai 辅助啊,让他辅助,然后给你做一个啊,这个也是 ok 的。 那么第三个啊,情节式流水账缺乏张力啊,新手往往只会描述事件的顺序,没有构建戏剧冲突, 就说有的同学可能觉得我做的这个剧本也还行,但是我做出来就是感觉故事很平平无奇,那么你想让这个故事就是有戏剧性,这个故事非常有意思,怎么办呢?就是你要添加一个三木具结构啊, 这个三幕剧呢,是什么意思呢?就是这个三幕剧啊,我,我不单独给大家讲了,但是我把资料给大家整理出来了。什么是三幕剧啊?大家可以回头看一看,回头看一看。这个我就,呃,不具体讲或者是后续啊,可以在某一节课给大家讲一下啊。 嗯,因为这个东西不是很多啊。然后,呃,我们来看一下这个提示词,如果正常的新手,他常常会这么写啊,让李明去案发现场找到线索,接着去审问嫌疑人,发现真凶,这就是一个剧情,基本的一个剧情 啊,对吧?这个剧情是没问题的,但是我们如果让 ai 来生成这个这个剧情,你看看它是什么效果啊,咱看看是什么效果。 然后我们再来看看专家提示词是怎么写的啊。那么现在根据李明的角色设定,按照经典的三幕剧结构,他为他即将调查这起富商密室死亡案编写一个详细的剧本大纲啊,那么第一幕 是什么铺垫?他告诉你是铺垫,然后接到案子本想敷衍了事,但在现场发现,然后一处与他过去某个失败案例极似相似的细节,激起了好胜心,初步锁定几个有明显动机的嫌疑人, 然后第二幕对抗,对吧?你看第三幕结局,其实这几个他写的都很详细,这个也是根据这个上面的剧情来的啊。好,然后我看一下啊,他写的啊,他写的, 呃,这个故事也还行,但是他有点偏了,他有点偏了,然后我看一下啊,因为没有上下文,我忘了把这个上下文给出来了,我先把这个再生成一下啊,然后做一个上下文。 有,有了上下文之后啊,然后我们就可以来做这个啊,同样的,根据这个上下文,我们先给个这个新手操作,然后看看他给个什么什么结果。啊? 呀,给错了,给错了,不是这个啊。嗯,我想想流水账, 没事,那就先从这块升起吧,就从这个人物小传上来,就是人物小传,我们来看一下啊, 然后再给到这个, 好,这是有了一个人物之后,然后再给人物一个剧情,再给人物一个剧情, 人物小传就写了这么多。 好,然后我们再把这个专家提示词复制一下, 我们来看啊,他写里面的故事,然后傍晚花灯初上,然后高档公寓警灯闪烁。啊,这个其实他写的还可以啊,写的还可以,写的还行。审讯室第三幕真相, 这个当做一个小说还是可以的。嫌疑人很快被锁定在合伙人王浩身上,动机很充分,他和死者有严重的商业纠纷,而且他的有公寓的备用钥匙啊。小,在小张看来,王浩有时间,有动机,有机会,几乎就是板上钉钉的凶手。 然后审讯室,他很疲惫,很镇定,然后再说一遍怎么怎么样,就是完全捋着这个剧情走的。那么我们再看一下这个专业题词,我们再看一下 其实你看啊,前面这个,你看他的行文啊,就感觉有点不对劲了啊,这是一种深入骨髓的强迫症行为,在巨大的精神冲击下,他退回到自己最熟悉,最能带来安全感的行为模式,整整理和清洁。 最终李明看着这个因梦梦想被窃取而走向毁灭的女孩,拿出了手铐。案件被告破,年轻警员对李明佩服的五体投地,他们惊叹于他如何从一个干净的磨豆机就洞穿了整个案件的真相。李明独自一人走出公安局大楼,夜色已深,他再次摸出那枚硬币,在指尖灵巧的翻转,这一次 还没有让他转太久,稳稳的接住,放回口袋,他找到了完美悬案,也证明了自己宝刀未老。但此刻他心中没有胜利的喜悦,只有一股属于老警察看透世事的疲惫和悲凉。他抬头看向远方的灯火,喃喃自语,退休也许是时候了,就是感觉像流水账啊,感觉像流水账就不断的复述,叙述,叙述,叙述啊, 那么我们再来看这个剧本大纲啊。呃。然后李明开场,李明在他破旧的办公桌前,用一个台历一笔一画的计算着离休,退休还有多少天,是吧?桌上放着一盆枯萎的绿植, 年轻同事小刘在旁边飞快的敲击键盘,讨论着大多数大数据和人工智能。李明听得直皱眉,你看这个写的就完全不一样了,对吧? 基地事件队长找到李明,将天庭大厦的案子交给他,口头上说案件简单,让你风风光光站好最后一班岗。死者是科技巨头创世纪的创始人陈光,死于自己号称绝对安全的顶层密室中, 门从内反锁,无任何暴力闯出痕迹。李明嘴上抱怨着麻烦,心里只想快点走个流程,敷衍了事,看见没?这个写的就完全不一样了啊,完全不一样了, 然后案发现场,关键发现心态转变,你看,写的非常的细啊,然后包括对抗是吧?新旧冲突,终点颠覆性发现,结局完全按照三目式结构来,第一目铺垫,第二目对抗,第三目结局啊,完全按照这个来的,而且写的非常细致啊, 这个就是三目式啊,你一旦提示词给到位,他出来的东西完全不可同日而语啊。那么第四个问题是什么呢?就是说明文不像人话啊, 那么写一段李明和嫌疑人王总的对话,我们再来试一试,再来试一试啊, 那么专业的提示词他怎么个专业法呢?他有情景要求,这个情景要求就很有意思了啊,他这里给了一个李明的状态,给了一个王总的状态。 为什么要给状态?如果你没有给状态,你看他的结果是什么?李明说,你昨晚在哪?王总说,我在家,有人证明吗?啊?这个对话就像机器人一样,没有潜台词,没有情绪,对吧?那么我们来看看,一会看看专业提示词他给的什么样啊? 啊?他给他对话,你看,嗯?哎,他还行啊,还给出来了,微笑着端咖啡尝尝这个,因为他是有上下文,有上下文,所以说上下文给出来了。 嗯,皱了皱眉头,理想主义,你可以这么说啊。那么我们再看看专业题词有什么不一样啊,现在的模型太强了啊,我只能说太强了。 那么专业的题词应该会更强啊。你看,慢慢悠悠的开口,声音有点沙哑,嘴角挂着一丝刻字,几乎几乎看不见。嘲讽 啊,他是有表演指导在里边的啊。然后仿佛没听到他的催促,自顾自的说,啊,那么我们再来看上面这个,他写的也会不会也这么具体啊。 然后是打断他,但因声音不大,但极有分量,犹豫了一下,硬币翻转速度加快了。呃,其实也还行啊,但是没有下边的这么具体和详细。 然后点点头,像是认同他的话。是啊,材料很全。司机,保姆,你太太都说在家陪儿子,你儿子今年上初中了吧,现在孩子功课真重,初二正是关键时刻, 突然想起了什么,身体稍微前倾一点啊,对了,我儿子以前也在那所,也在那所中学,他们学校云课堂系统是你们公司赞助的吧。啊,真不错,怎么怎么样? 看似夸奖,但实时更新做不了假这几个字让王总的眼神闪烁了一下,他再次伸手去碰他的领带,你看,他这里是有动作的啊,他这动作结合着对话啊,他是有动作的,这个更具体更详细啊,他这个肯定是更好的。 好,那么一样的啊,对话题词我也给大家提炼出来了这一个题词的模板啊,大家都可以去用。 那么最后一个就是小说体,不是剧本体,把上面的故事写出来,你写出来的只能是一个小说,就像刚才我给大家展示的,他写出来的是一个小说,他不是一个剧本。那么你想要要一个专业化的剧本,那么你就说很好,请将这三幕的高潮部分 啊,然后及李明在王总办公室与他对峙的场景写成一句,一段标准的电影剧本啊。这里剧本我,我给大家一个建议啊,尤其是生成剧本的时候,你不要一下子把所有的剧本全部生出来,比如说你这个, 嗯,你不是三幕式吗?三幕式,比如说我先生成第一幕剧本,对吧?然后第二幕、第三幕一块一块的做,不要说一下把所有的都做出来,因为 ai 输出第一,它是有这个上下文长度限制的 啊,如果说一下做太多了,他这个模型还比较大,他是一百万头肯有的,这个这个字结束给的比较少的话,你可能会只能出一半,或者说他是这个上下文,他最多只给你两千字或者三千字,你直接就 不行了,他给你的答案,他就会压缩,压缩,压缩,这个结果就变得很简略,很笼统,他就不好了。所以说我们可以给他分开啊,分成三次或者四次来做,然后后边是约束格式,严格遵守以下格式, 这个格式其实是你可以改的,这个剧本你需要它有什么你就放什么,比如说这个剧本它需要有场景标题怎么怎么样,动作描述, 角色名啊,对话啊,括号,括号注示,对吧?如这一些,如果你觉得还不够啊,如果你觉得还不够,比如说我要加一个 bgm, 加个音效,是吧?你在后边直接写上啊, bgm 音效 啊这些乱七八糟的,你想要什么有什么,或者说你觉得括号注是我不想要,那么你就把它删掉一样也可以,那么同样的给大家整理下来,然后直接用就行 啊。那么这一节课呢,就是总结的是什么呢?从故事消费者到故事工程师的一个转变啊,我们要要像一个程序员一样下达格式指令,你要什么就明确的告诉 ai, 这样可以为你节省大量的时间,而且拿拿到一个更优秀的结果 啊。那么我们必须要完成的核心转变是什么呢?就是把给我一个故事的被动心态转变成我来构建一个故事的主动心态 啊,你不是在点餐,你是在和你的这个实习生一起开一个项目的讨论会啊,然后你要负责核心,你负责核心输出,你负责拍板,你负责决定啊,你负责搭建结构, 定义角色,把握情感,然后 ai 来复充填充,负责填充血肉啊,扩展细节,润色语言,执行格式。那么你要思考一下的是什么呢? 我的点子是个什么样的点子?这个点子的来源有很多,你可以通过 ai 来启发,你可以通过这个借鉴其他人的视频故事啊,你可以是你平时搜集到的灵感啊,那么把只要给 ai 一个种子 啊,给他一个火种,他才能燃起星星燎原,那么这个火种就是你,你必须要起到一个火种的作用啊,所以说不,不能全部依靠 ai, 你 可以用 ai 来辅助,但是核心是什么?核心是人,核心是你的一个创意。 那么这节课呢,就到这里啊,我们主要讲的五个问题,如果你把它吃透了啊,拿好了,然后把这个提示词都会用了,那么你就一定能够做出一个非常棒的好的一个故事。好,那么这节课就到这里,我们下节课再见。 大家好,我是老成,我们这节课探讨一下什么是三木序?什么是三木序结构。三木序结构是西方学术中最重要、最基础也是最强大的一个工具。 对于想用 ai 来生成故事的人来说,理解它就等于给 ai 一个清晰的能够创造出好故事的施工蓝图。那什么是三木结构呢?简单来说,三木结构是一个将故事分成三个部分,开头、中间和结尾的经典序式模型。 他的核心就是为了有效的组织情节,管理观众的期待和情绪,确保故事有一个令人满意的开端、发展和结局。你可以把它想象成一次过山车之旅。 第一幕是过山车缓缓爬上第一个高坡的过程,在熟悉环境,认识同伴,紧张感和期待感正在慢慢的积累。 第二幕呢,就是过山车已经爬到了这个轨道的关键部分啊,他在轨道上疯狂的翻滚呐,穿梭呀,爬到轨道的最高点啊,这,这里充满了尖叫,刺激、绝望和惊喜。这个旅程啊,这是旅程最长也是最核心的部分。 第三幕呢,则是过山车冲向最后啊,最高的冲刺,然后平稳的回到终点。在这个过程中,你释放了所有的情绪,并带着满足感结束了整个旅程。 这个结构之所以经典,是因为它完美的契合了人类心理学中的提出问题、解决问题、获得结果的认知模式。 每一幕啊,都有他特定的任务和关键节点啊。让我们用一部大家都很熟悉的电影海底总动员作为例子来拆解一下, 那么第一幕啊,他的是一个铺垫部分啊,三幕剧嘛,他一般有三幕,就是铺垫,然后高潮对抗,然后是结局,他有这三幕,那么第一幕呢,就是铺垫, 铺垫呢,约占故事时长的百分之二十五啊,他的核心任务是介绍主角和他的主角所在的这个正常的世界,展示他的内心的内核,内心核心的缺陷或者渴望,然后通过一个事件来打破他 这个所在的一个正常世界,然后迫使他踏上一个征程,也就是把把主角扔到一个脱离他世界的一个地方。那么这个关键节点是什么呢? 然后在开场就看到这个主角马林和他的儿子尼莫啊,生活在珊瑚礁,马林因为过去的创伤,变成了一个极度神经质过度保护的父亲啊,这就是他的正常世界和他的核心缺陷。 那么有了这个之后呢,就产生了一个激励事件啊,开场之后他又有一个激励事件,这个激炼事件就是打破平衡的一个火花啊。尼莫在开学第一天啊,为了要向父亲和同学证明自己啊,他是很有勇气的一个人,他故意游向远离珊瑚礁的一艘人类的小船, 于是转折点就来了啊,他导致了一个直接的后果是什么呢?啊,尼莫被一个潜水员抓走了,马林为了救儿子,做出一个他以前绝对不敢做的决定,离开安全的家,冲向未知危险的汪洋大海。 那么这个故事的主线呢,就是找到尼莫啊,马林必须得一直往前冲,找到尼莫,然后这个故事就从这里正式进入到第二幕, 那么第二幕就达到了对抗的一个环节,对抗是整个故事最高潮啊,也是最爽的一个地方 啊,那么这个时长大约占所所有故事的整个的百分之五十,也是最长的一部分,那么他的核心呢?就是主角在追求目标的过程中啊,不断遇到越来越大的障碍和冲突 啊,障碍和冲突才是观众最喜欢看的点,你的故事如果没有障碍,没有冲突,观众是不爱看的。很多人可能说,哎,我看的这个故事看着真难受啊,明明马上就要成功了,哎,就突然来另外一出,明明马上就要成功了,又突然来了个 又另外又一个意外啊,又突然来个意外。为什么就不能让主角直截了当的拿到一个完美的结果?为什么?就是因为如果没有了冲突,那么你看个开头就知道结尾了。 很多观众都是,尤其是现在人们看这个视频的越来越多啊,他的这个爽点的预值也越来越高啊,他很多时候他可能看个开头我就知道结尾了,那么你想让观众看下去怎么办? 你需要不断的给他来点意外,观众觉得已经,哎到结尾了,我已经这个主角已经胜利了,但问题是你偏不让他胜利,你偏出来个意外,哎,观众看,哎,跟我的预测不符,那么我再看一会,对吧?所以说他的障碍和冲突才是能够诱导观众看下去的关键 啊。不要让观众的认知牵着你的鼻子走,而是说你要牵着观众的认知鼻子走啊,这个是角色成长挣扎学习的核心阶段啊,这个任务,嗯, 呃,核心任务啊,还是记住啊,不管是做故事还是做剧本啊,一定要有障碍和冲突,这个是非常重要的关键节点。然后呢,上升行动。 马林啊,踏上了旅程,遇到了一系列的挑战啊,也碰到了很多好朋友啊,他遇到了谁,是吧?他增加了一些人物啊,增加了一些人物啊,遇到了健忘但欢乐的伙伴多丽遇到了三只决心吃素的鲨鱼。 其实你看每一个人物啊,他的形象都很突出啊,比如说,呃,多利啊,健忘,非常明确的一个标签,但是很乐观,对吧?就是很有趣的一个人物,他的功能应该是一个喜剧担当。 然后呢,遇到了三只决心吃素的鲨鱼。鲨鱼,看,这就是反人类常识的,鲨鱼吃什么?鲨鱼应该吃肉, 但是这个三个鲨鱼他决心吃素,这个观众就觉得很有意思,跟我预想的不一样,对吧? 然后他们被灯笼怪灯笼鱼追逐到了,钓到了深海海沟啊,然后被一群水母蛰的半死啊。与此同时,在另一条故事线,尼莫在牙医诊所的鱼缸里与鱼缸帮一起策划逃跑啊,他们也在学的变得勇敢啊, 就是尼莫这里边他用了两条线啊,一条是马林的线,一条是尼莫的线,他做了一个交叉故事啊,交叉蒙太奇,马林为了 营救尼莫,他发生了什么事,而尼莫他被抓走了啊,然后在他被抓走之后啊,尼莫又遇到了什么事啊?尼莫,他的人物弧光是什么?他变得开始变得勇敢,他想证明自己的勇敢,到最后他变成了真正的勇敢, 所以说这也是一个人物湖光,那么在中间的一个节点呢?然后,呃,有一个重大的,一般啊,通常在故事的中间节点有一个重大的转折啊,是伪胜利或者伪失败 啊。这个什么是伪胜利呢?就是就像我刚才说的,你以为他马上就要胜利了啊,实际上他并没有胜利。你以为他马上就要失败了啊,是突然来个意外啊,失败又变成成功了啊,对吧。所以说,这个东西一定要不断的进行一个转折,反复拉扯来调动观众的情绪。 好,我们接着往下看,马林和多利踏上了归群的东澳流。东阳啊,东澳洋流快车啊,东澳洋流快车得到了明确的方向和巨大的帮助, 然后这给了他们新的希望和动力,感觉目标近在咫尺,对吧,这马上就要成功了啊,中间抬高赌注啊,让固执方向更明确你,他就是故意引导你,你觉得马上就成功了啊,终于要到结局了啊,但是转折点出现了 啊!第二幕,转折点,这是主角最低谷,最接近放弃的时刻。马林和多利被鲸鱼吞下,费尽周折终于达到悉尼港时啊,却被提壶奈杰口中得知,尼莫装死逃跑时被牙医杀死了, 对吧?费尽辛苦马上就要救出来尼莫了,结果发现尼莫死了。听到这个消息,马林彻底绝望,你看,这很典型的,他觉得马上就能营救到,马上就要见到了,结果他死了啊,大家都觉得他死了啊,这个任务失败了,其实他只是一个错误的消息,是被误会了, 对吧,这是个误会。听到了这个消息,马林绝望,放弃寻找,与多利告别,要回家,所有希望都似乎破灭了,这叫欲扬先抑啊,因为你先有这个,压了一个情绪,后续的一个情绪才能达到高潮啊。 那么到结到结局了,这个时候,故事就要推向最高潮了,然后主角运用在第二幕中学到的一切,做最后的斗争啊,并且解决核心冲突,展示一个新的常态是什么呢? 是吧,在最低谷之后,主角重新振作起来。多丽偶然遇到了逃出诊所的尼莫啊,记忆瞬间被唤醒,他带着尼莫找到了心灰意冷的马林,父子重逢,对吧? 那高潮是什么呢?这马上高潮就来了,最激烈!高潮永远是最激烈的对决。最后最激烈的对决是什么呢?此时的冲突不再是找到尼莫了,而是马林是否真正学会信任。儿子 多利和一群鱼被渔网困住,尼莫想用在鱼缸里学到的方法救他,但是需要马林放手并且信任他。 然后马林克服了自己内心的恐惧,喊出,我知道你能行,这不仅是解决外部冲突,更是解决内部矛盾。马林一直在过度保护尼莫啊,但是尼莫总想闯出自己的自我的勇气啊。最终, 因为信任啊,马琳能够信任自己的孩子啊,他取消了自己过度保护的一种方式啊,最终解决了这个所有的矛盾啊。那么最后这个高潮结束之后呢?然后他又到了一个新世界啊, 马琳再也不是那个神经质的父亲了,他学会了放手和信任。说到这里,我突然想起了大话西游啊, 这个唐僧也不再唠叨了,然后悟空呢,也对唐僧有了一个应有的尊重,尊重啊,所以说,就是这是什么人物的改变,人物通过了这个整个的故事发生了一个改变,这个东西就叫做人物湖光。那么这里呢,马林不再是那个神经质的父亲,他学会了放手的信任, 那么马林得到了一个成长,这就是马林的人物弧光。而尼莫也变得自信和勇敢,他不再是说像从前一样,必须是自己去要证明自己的自信和勇敢,那个是假的啊。所以说,这是尼莫也获得了成长,尼莫也得到了人物弧光,那么他们去 送尼莫上学。这次的告别和从前不一样了,就充满了爱和从容,世界恢复了平衡,但主角已经成长,进入到了一个比故事开头更好的一个新常态啊,那么他这个整个故事就是最典型的这个三木式啊,三木式结构。 那么为什么说三木式结构对于 ai 写作非常重要啊?首先啊,当你直接对 ai 说写个故事,它很有可能给你一个平淡的流水账,表面上看,哎呀,写的这个天花乱坠的一大片啊,很多。 然后呢,也有对话,也有旁白,都挺好,但是你细细一读,你就会发现它的 ai 味特别浓啊, 很多时候,嗯,包括啊,就是有的同学可能自己用 ai 写一些小说,去番茄呀,去什么地方去投稿,你会发现,人家直接就给你判定是 ai 写的,为什么?为什么他能判定出来是 ai 写的?就是因为你的提示词不对劲,你的提示词给了一个很平,你就给给一个句型,他就是给你一个流水账, 非常非常流水的流水账,那么你会看到这个流水账,他写的表面上没问题,但是你仔细一品,仔细一读,他字里行间就是完全是对一个事件的简单描述,对吧?他就是没有那么具体,没有那么突出啊。所以说,嗯,这就是有的时候你 ai 不 过稿 的原因。如果说你会用提示词,你用三木式的结构来写,那么你就相当于给他一个清晰的指令级。三木式结构啊,这么一个简短的一个指令,其实它相当于一个指令级。 如果说你说我想把它拆分过来啊,拆分给也行啊,也行,那么下面我也给了一个拆分的代码啊,你用这个代码块,你复制,直接点这个复制,复制之后,那么他生成的就更加具体完整啊, 然后它能够保证你故事的完整性。 ai 会确定啊,会确保你的故事有铺垫,有发展,有高潮,有结局,而不是写到一半就跑偏。然后它会强制性的生成戏剧冲突, 通过设置转折点和最低谷,迫使 ai 去创造悬念和情感张力,这个很重要,你没有这个悬念和情感张力,你就是一篇 ai 写的平平无奇的, 没有意思的,平淡的一个 ai 文章啊,你必须要通过悬念和情感张力来让故事变得引人入胜。总之,三木具结构不是一个限制你创意的死板公式,而是一个经过了时间考验, 能确保故事的吸引力和情感力量的一个强大框架啊。你掌握了它,你就掌握了与 ai 合作共同打造精彩故事的钥匙。 其实啊,这个我们编剧的结构不仅仅是三幕剧啊,但是三幕剧是万物的起源,他们其他的一些模式也是都都是通过三幕剧来演变而来的,三幕剧是一个最经典最基础的一个东西,所以说大家用三幕剧的方式是一定可以产出一个好内容的。 好,那么今天啊,我们就给大家讲解了什么是三幕剧,三幕剧的剧情又是怎么分析三幕剧,它又是怎么制作一个好故事的啊,希望能够对大家有所帮助。好,我们下节课再见。 大家好,我是老陈,这节课呢,我们来看一下我们 ai 纹身图中啊,我们常见的提示词错误 啊,第一个呢,很多同学啊,往往犯一个错误是什么呢?就是你把 ai 当成了能够读懂你心思的神笔马良,而不是一个需要精确指令的超级画师 啊,我把这两句话啊,当成了一个做了一个高亮啊,大家一定要重点关注这两句话, 你一定要给他精确的指令,而不是说呃,直接很笼统的告诉他画一个什么什么什么东西啊。那么这位画师虽然记忆高超,能画任何风格啊,但他没有任何的主观想法,你说的每一个字都是他下笔的依据啊,下面有六大误区,我们一起来看一下。 那么第一个误区呢,就是描述过于空洞啊,把 ai 当成了神仙 啊,这是最普遍的问题,新手往往给出一个模糊的概念啊,希望 ai 能够猜中自己脑海里完美的画面啊,比如说啊,一个新手去写一个记事词,一幅漂亮的风景画, 他能不能做一个比较好的图片?能啊,现在的模型很强,他能做一个比较好的图片,但是他的画风不可控,他可能做成什么样的都有,他未必是你想象的那种方式,那么比如说我们先做一个看看啊,我们先做一个看看, 就一幅风景画啊, 一幅漂亮的风景画,那么他的问题是什么?漂亮的标准是什么?是哪里的风景?是山?是海?是白天?是黑夜?他完全不知道啊,他只能生成一张啊,最大众化、最平庸的风景图,可能跟你想象的不一样啊。 啊,我们来看一下啊,风景画油画,对吧。啊?这是不是风景画也是啊,他出的大多是油画风格啊,但是这个是你想要的吗?啊,未必啊,未必你不一定想要一个油画,那么我们来看一看精准的提示词要怎么写啊? 那么我们这里也是要一个油画啊,要一个阿尔卑斯山日落的景象啊,前景是什么?远处是什么?夕阳?是怎么样的?看啊,一幅印象派油画,描绘了瑞士阿尔卑斯山的日落场景, 前景是开满黄色和紫色野花的草地,远处是白雪皑皑的山峰,夕阳的余晖将天空染成温暖的橙色和粉色,光线柔和,比处明显啊。然后我们直接跑一下,试试 这个改一下啊,这个 mg mid journey, 它对于格式的要求是比较严格的啊,如果你前面加了一个无意义的符号,它也不给你升图。 这个是简单提示词生成的啊,这四幅画只能说还可以啊,这个是按照要求的啊,就是具体的提示词生成的 啊,这个有话他的色彩啊,他的近景远景都有明确的规划啊,印象画派,对吧 啊,这个还是有明显区别的,你会发现这四张图片其实是比较相近的,尤其是色调都很相近,但是这四张图片就是什么都有啊,这是因为他更具体的规定了是什么色调啊,更具体规定了是什么色调。 那么你看,印象画派规定了画风,印象画派规定了画风,然后阿尔卑斯山入日落景象啊,这里规定了主体, 然后前景是什么,远处是什么,然后什么样的色彩,什么样的光线啊,他写的很明确,所以说他出来的结果就更准确。 那么第二个误区是滥用主观词,而非客观描述啊。新手喜欢用炫酷、震撼、有感觉这类的词,但是 ai 不好理解,然后你要给它翻译成画面,比如说一个非常酷的机器人,我们来跑一下试试。非常酷的机器人, 那么酷的定义千差万别,是苹果公司那种简洁的酷,还是赛博朋克二零零七,二零七七那种杂乱的酷? ai 只能随便猜一个,那么专家的写法是把它拆解成具体特征啊。什么样是酷?一个未来主义的机器人啊,加个未来主义。 全身覆盖着黑色,哑光,哑光,黑色的装甲,你看,说的很详细,关节处怎么样?有轻微的磨损和划痕?蓝色的 led 光从眼部和胸甲的缝隙中透出, 造型参考了日本机甲啊。这个什么 mycha 的 风格,背景是废弃的工业城市啊。这个就是具体且详细的一个提示词,你会看到这个提示词,风格机器人是有,但是风格各式各样,什么样的都有,它完全不可控。 那么我们再来看一下这个提示词做出来的机器人是什么样 啊?这个机器人其实你单看还可以,但是他不可控,他每一个都不一样,你看这个差距天天差地别,这个差别太大了,对吧? 但是你看这一组他的机器人是不是长长相就风格就很像?他风格很像,虽然也有不同的地方,但是他风格很像,这样的话,你就很容易选出来一个你想要的东西 啊。这个机甲其实还是挺逼真的啊,划痕有,黑色哑光有,是吧?这种机甲,然后你觉得不满意可以再抽一个,对吧?这样的话就越来越接近你的目标,关键问题是它准确且具体,它更可控。 如果我们也可以对比下吉梦啊,吉梦它对于提示词的响应度是优于 mg 的, 但是它的画风,它的画风是和 mg 有 差距的啊,各有优缺点吧。我们来看一下吉梦啊, 吉梦的三点一模型还没有出,估计快了。我们来看一下一个非常酷的机器人,然后再来给一个未来主义机器人, 好,然后我们接着往下看。呃,那么专家将这个专家写法,将酷这个感觉翻译成了材质、细节、光效、风格、参考环境 一系列的客观视觉元素。其实这里边啊,他写的有些地方还是不够详尽啊,有一些,比如说你希望这个机甲加一些特色,嗯, 反正是如果说你想让他有些特色的话,你要再加一些提示词啊,大家注意,为什么要学? 如果说 ai 生成提示词可可不可以用呢?是可以用的,但是为什么要学他的写法呢?是因为我们有的时候是需要修改 ai 生成的提示词的,比如说他设计的东西我不满意,我想添加一点,我怎么加,是吧?我加在哪?这些还是要懂的。 那么你看这里出来的机器人啊,这个简单写法,一个非常酷的机器人,是很酷啊,但是什么样的都有啊,什么样都有,这个酷他没有办法感觉出来,就是到底酷在哪,但是你看下一个具体提示词写出来的这个很酷的机器人啊,哑光,你看 哑光的这个铠甲,然后掉漆啊,略微有划痕的这个关节的地方啊,他都体现出来了,你看这个机器人就一样了啊,基本上是一模一样的,是吧?在在这个集梦里边,他的这个一致性是很强的啊,像这种的用集梦做肯定是更好的一个方式。 那么第三个误区啊,说只说画什么,不说怎么画啊?新手往往关注画面里的内容,而忽略了决定画的最终呈现效果形成的眉界和风格。 呃,风格其实很重要的一个东西啊,有的时候如果你不加风格的话,尤其是 mg, 它会不断的跳啊,它会非常容易跳。风格,比如说一只猫啊,你要分析一下它没有的东西,就是说它只只说一只猫,但是这是什么猫?它是一张照片,还是一幅油画,还是一幅素描,还是一个三 d 模型? 这个默认风格,它未必是你想要的。那么我们用一只猫来生成一下, 用一只猫来生成 一只猫, 然后再对比我们的这个专业写法专家写法提示词,我们来看看是什么猫, 看不同风格的提示词是是什么效果 好,我们来看一下啊,一只猫啊,他给了是一个比较写实的一只猫啊, 比较写实的一只猫。其实这个一只猫他出的效果还挺好,但是他的风格可能不是你想要的,那么我们要一个水彩画风看看一只猫, 水彩的猫,你看这个画风就很统一啊,第一个画风统一,第二个他有画风的情况下,他是另外一种风格,看起来非常舒服啊。那么第三个,一个是专业 摄影工作室,专业摄影,这是一个暹罗猫啊,然后它的蓝色眼睛背景是纯黑的布偶猫,布偶猫?感觉不太对啊,它可能是对于这个布偶猫它识别的不好,那么我尝试一下把这个提示词放到 mg 里边, 很每个模型其实它是不一样的啊,每个模型它的训练素材什么的它都不一样。我们来 m g 看一下啊, m g 看看它对于这个猫的品种有没有训练, 哎,不对,还是有横杠。哎呀,这这里边这个无序符号它起了一个反作用,先给它删除一下。 好,然后我们来继续看啊,然后给它翻译。翻译这个 mg 的 话必须得翻译,如果你不翻译的话,然后输出中文的话,它可能也是会出问题的 啊,也是这样啊,可能是这种猫就是布偶猫,可能是我对猫的品种不太了解啊,我印象中的布偶猫应该脸不应该是黑的啊,我印象中暹罗猫脸才是黑的 啊。这个吉梦出的和 m g 出的都差不多啊,你看小黑脸猫,这个感觉不像是布偶啊,这个还像布偶一些。 嗯,会不会是提示词的问题,看一眼啊。嗯,背景是纯黑的,这个也有一个可能,就是它的背景是纯黑色的,然后它这个没有标明这个毛发,没有标明毛发,我们来看一下这个白色, 白色毛发,它可能是背景污染到这个前面的提示词了,我们再来看一下, 所以说提示词有的时候你不给准确了,他就会出现问题,他应该不是训练模型的问题,应该是黑色的背景,这个提示词污染到了猫的毛发,所以说我们给到一个白色毛发 啊,白色毛发这样的布偶猫就是 ok 的 了,对不对?这样才是 ok 的 了。所以说我们要确定猫的毛发颜色啊,这个还是不太好的啊。 嗯,但是已经有 ok 的 了,这就够了啊,那么这个就说明了这个风格的一个重要性啊,很多时候你不给风格的话,这个风格就会乱跳啊,什么样风格都有,尤其是 mg, 这个米德里尼,非常容易出现这种情况啊, 大家一定不要忘记用 mg 的 时候要给风格。那么第四个问题是缺乏构图和镜头感, 新手呢,常常忘记自己的导演身份啊,没有告诉 ai 摄像机在哪里啊,也就是说你这个图片的构图,这个摄像机的机位啊,然后这个,呃,都没有啊,所以说导致画面主体不突出,或者视角很奇怪。比如说啊,一个 森林,站在森林里的女孩,她默认情况下一般是比较容易就是给一个 一个正视角的一个比较简单的一个构图啊,默认的构图不会太突出,他可能给一个中距离啊,尤其是这个吉梦啊,他容易给中距离 啊,然后这个米德里可能他的这个还丰富一点啊,但是我们如果给到一个这个非常具体的啊,具体的,那么我们再看一下啊,你看这里边啊, 啊,就是一个平平无奇的图片啊,非常的平平无奇,然后画风也没有控制啊,画风,什么画风都有啊, 那么我们看这个是不是就差不多了啊?全身像穿着红色斗篷的小女孩,背后视角拍摄独自站在深幽长满苔藓的魔法森林中,广角镜头,阳光从茂密的树冠缝隙中投下几缕光束,耶稣光,营造出神秘的氛围, 你会发现啊,就是它,当你的提示词精准, ai 给你的图片,它的相似度是很高的啊,因为它没有什么发挥的空间,你给了它精准的提示词,它就没有特别大的发挥空间了,它只能按照你说的来。这个就是能够控制图片的一种方式。 所以说很多同学说,老师我图片控制不了,怎么控?我必须得用这个 openpos, 我 必须得用 controlnet。 为什么?因为你的提示词写得不够细致啊,不够细致和具体,你就只能用那种方式 好,那么所以说这个里边写法它用了全身像,从背后拍摄广角镜头,这些都是摄影术语啊,这样就可以像导演一样指导 ai 如何构图和取景,让画面有了故事感和冲击力啊。 那么第五个问题呢,就是元素堆砌,主次不分啊,就是有的时候新手会贪心啊,把许多喜欢的东西都放在一个图, 结果 ai 没办法理解它的主体,就会生成一张杂乱的大杂烩啊。比如说一个宇航员啊,火在火星上骑着马,旁边有一只狗,天上还有飞碟和地球,正在喝咖啡,其实它的元素是很多的,但是这个元素怎么安排, 这个元素怎么安排?谁和谁在一起啊?他都不知道,那么他出来的东西随机性就很强,随机性非常强, 那么如果说我们不想要那么强的随机性,而且要构图更好啊,很很舒服啊,那么我们可以用专家的写法,比如说一张有故事感的画面,第一个要确定这是一个什么样的画面,有故事感的画面啊,突出故事感。然后宇航员孤独的站在火星红色沙漠上, 他正在抚摸他的同伴,一直穿着宇航员制服的金色巡回犬,远处是火星凄凉的地平线地,你看他有远处,他会给你安排在哪,在哪在哪,然后他这个谁抚摸着这个金色巡回犬,也确确定了主体和狗的位置, 然后地球在哪呢?然后在挂在漆黑的天空中,他把所有的东西,所有的元素都安排了位置,然后还给出了画面,构图简洁,突出了孤独和伙伴情谊的主题,给到了画面的感情啊,给到了主题 是吧,给到了构图啊,所以说有取有舍啊,这样提炼出来的细节,我们再来看一下它的区别 啊。上面的是最开始的新手同学给提示词啊,地球有没有?有,呃,飞碟,飞碟,飞碟有没有?有啊,然后狗有没有?也有,然后马也有,喝咖啡也有,其实它的元素是都给到到位的啊,都给到位的,你看,但是这块你看,你可以看到啊,这个狗在哪? 狗站在马背上,这就不合理了,为什么?因为这个狗你没明确他在哪啊,所以说他就什么样的都有啊,什么样都有,他什么情况都可能出现啊,当然对的情况也可能出现,不对的情况也可能出现,那么你想,嗯,能够准确的生成啊,那么我们再看这个, 你会看到哈这个提示词啊,这个地球,然后狗和宇航员的交互啊,狗穿着宇航服,对吧? 地球像一颗蓝色的星星啊,这块给的不太好。地球像蓝色的星星,那么他给了地球和星星的一个结合,这里可能是他智能化的问题,但是这个宇航员和狗 都给的不错啊,这个图其实非常好的啊,这个图其实就是完全满足啊,完全满足需要的,这个星星他没有做的那么突出啊, 还是比较智能的啊。这个也不错啊,这两张图都非常棒啊,这两张图非常棒,他比全前面这个图要好多了啊。前面这个图你能看出来就是简单的堆砌,虽然说元素都给了飞碟,马呀,什么狗都给了,但是很假,为什么狗没有宇航服啊,对不对?然后你的飞碟也比较假, 飞碟也比较假,是吧?所以说就是元素的堆砌,他真就不如像这种啊,这种故事性的。然后看这个,这个,这个图出的非常棒啊,非常棒,富有故事感的画面啊,画面结构构图简洁啊,突出情意,完全做到了,完全做到了,非常好。 好,那么在下面啊,就是这个方式啊,我再多一句啊,我再多一句嘴,就是他要懂得取舍,将核心故事提炼出来, 不是盲目的堆砌。这个比如说火星骑马呀,表面上看非常有创意,但是他的核心故事没有重点,也没有。那么核心故事是什么呢?宇航员和他的狗, 这个是,这两个才是主体,他在火星,然后围绕着这个来添加细节,先有主体再添加细节,而不是所有的一股脑的就放上边是吧?然后又是骑马呀,又是飞碟又是地球,这样的话就是造成一个图片混乱啊, 然后你围绕着主题添加细节,才能使画面的主题更鲜明,所以说这是一种写提示词的方式,然后你先给出主题,然后你再围绕着主题添加周围有什么细节。那么 第六个误区呢?这个反向提示词呢?一般常用于这个 sd 啊, stable diffusion 啊,它这里边是常常需要反向提示词的, 我们这个反向其实词一般情况下是不需要的,如果说出现了这些什么多余的手指,丑陋,模糊,画质差,水印,签名文字乱七八糟的,我们可以修改啊,或者是一是可以修改, 二是我们也可以把它进行一个重新生成啊,没有必要像这个 stability fusion 那 样一点一点的去做反向提示词,因为它出现这种情况的概率不多啊,因为这种闭源模型它的一个是质量高,像素高啊,它有足够的空间去画它,出现这种情况很少,我只能说出现这种情况很少。 嗯,这个如果你是用这个 s d 啊,一点五或者是 x s s l 模型的,你可能就需要写一些反向提示词,如果你忘记的话,它就可能会出现一些不适当的东西。当然如果你用 flex 也是完全没有必要的啊。 那么这里边啊,给到新手的建议是什么呢?首先我们要从感觉改到描述啊,你比如说我有一个感觉,我要先思考一下怎么把我这个感觉描述出来 啊,要把你脑海中的美啊,酷啊,翻译成具体的形状、颜色、材质、光线,用这几个方面去分析啊,把它翻译成一个具体的具象化的东西, ai 才能精准的给到你的 画面啊。那么第二要有导演思维,你要把自己定位成一个导演,那么你要想好我的摄像机在哪,我用什么样的景别是远景啊,是近景啊,是仰视啊还是俯视啊,对吧。然后把这个导演需要干的活,他的这个构图啊,景别呀,然后细致的安排好。 然后呢要决定是照片,是油画,是水彩还是动漫 啊,这个画面的基调如果你跳了啊,那么就是你整个的生成的视频就会感觉非常的不连贯,感觉像 ppt 一 样啊,一看拼接感太重,如果是你风格非常一致的话,那么观众的沉浸式就更强。 那么第四个呢?第四个建议是学会排除啊。然后呢你要使用反向提示词告诉哎,你不要什么啊,就是刚才的反向提示词,嗯,反正是这几个方面,主要是这几个方面吧,然后一定要分清主次啊,不能主次不分啊。 呃一个核心原则是什么呢?写提示词的过程就是将脑海中的模糊想象啊,一步步翻译成 ai 能听懂的,能精确施工的一个图纸啊,我们一定要多练习,一定要多练习,然后测试不同的提示词会产生什么样的效果 啊,然后最后能够实现你想指哪打哪的这样一个感觉,行,那么这一节课呢,我们就讲到这啊,然后我们下节课再见。 哈喽,大家好,我是老陈,欢迎回到我们的课程,这节课我们主要学习 gemini 二点五 pro 的 使用方式。 那么 gemini 二点五 pro 是 我用过的迄今为止免费的最好用的一个模型啊,尤其是在二点五 pro 正式版发布之后啊,你会发现这个模型已经啊已经和其他和或者是和从前的 gemini 已经不是一个级别了。 那么首先我们要使用这个模型必须要进入谷歌的 as studio 才可以,我们先要打开谷歌 as studio 的 网址, 在这里使用这个 as studio, 它需要一个前置条件,第一,你必须是能够有魔法。 第二,呃,必须得使用美国节点,其他的国家是不可以的啊,像什么日本啊,新加坡呀,香港呀都不行,你得用美国节点。那么我们先打开 ai studio 的 网址啊,这里我给到大家只需要点击就可以了。 然后进来之后呢,我们会来到一个首选的一个一个首页的界面啊,那么我们可以看到它分为三个区域啊,左边的有一个区域啊,这里边啊有一个聊天流生成媒体构建历史。中间呢,也有个区域 啊,这里是这个我们输入的一个主界面儿,右边还有一个区域是设置参数的。那么在这个 as 九九里边啊,如果你正常的直接进来之后,你会发现它是全英文的,在此之前你需要先下载一个插件, 叫做沉浸式翻译啊,这个插件它是长这样的,是一个这种小图标。这个插件怎么来的呢?你在这个谷歌的这个管理程序找到 chrome 应用商店,在 chrome 应用商店里面,然后直接搜索 沉浸式, 沉浸式翻译啊,然后我们搜索一下, 搜索一下,就这个,第一个就是啊沉浸式翻译啊,把它这个安装到 chrome 里边就可以了。然后这里个沉浸式翻译呢,你需要设置一下, 你先点开它,点开它之后你会发现这里边啊,这里是中英对照,如果你需要既有英文又有中文,你就点这个啊,如果你需要纯英文啊,纯英文的话你就,呃,就是你可以点击显示原文啊,这里有一个显示原文 啊,显示原文,这样它就是纯英文啊,如果说你需要翻译的话,你可以总是翻译该网站啊,这样就直接翻译成汉语了,如果你需要双语的话,你在这切换一下,就是既有汉语又有英语啊,这个看大家自己的使用需求。 那么现在回到我们的 as studio, 然后我们来聊一聊它的功能啊,那么我们先看左边栏,左边栏里面我们只需要了解两个部分啊,第一个部分是聊天打开一个新窗口, 在这里聊天就是打开新建一个新窗口,它就变成这样子的了啊,其实就跟主页一样。那么呃,我们这里还有一个历史 啊, history 啊,然后那么历史是什么呢?是我们之前聊过的所有的一系列的这个对话,对话频道,它都会保存起来,那么如何保存呢?比如说我们聊天在这上边有几个按钮, 第一个按钮是这个系统指令,什么叫系统指令呢?你可以理解为他是一个局的提示词,整个的这个提示词,比如说给他一个身份啊,你是一个,呃,有着二十年经验的一个专业编剧,那么他就以这个身份来在 在整体的,不管你给什么提示词,他都会参考到这个身份来进行一个生成啊,就是类似这种的,他属于相当于一个全局提示词的感觉啊。然后呢第二个这个是这个代码,代码这一块呢,需要有一定代码基础才会用,这块我们就不做仔细的解释了,我们一般不用啊。 然后呢在后边是一个分享,这个分享按钮有一个前提,你必须得先保存才能分享,如果你不保存,这个分享按钮是灰色的,那么保存这个键呢?也是灰色的,那么我们想让它保存一下怎么办呢?你先要有内容才能保存,比如说 啊,请啊,呃,今天是今天,今天是什么日子啊?好,他要先把它生成,生成之后,然后我们才能进行一个保存和分享。 好,那么它生成好了,生成好了之后啊,然后这个保存的它就亮起来了,我们点一下保存是吧,然后名字你可以在这里改啊。呃,今天, 今天是什么日子啊?然后我们点击 save 保存,保存之后啊,你就会发现这个历史这里会出现一个今天是什么日子,这个就是你保存好的 啊,这是你保存好的这个频道,你可以接着往下用,如果说你这个不保存的话,那么你一换频道或者是你一新建聊天窗口,他就没有了啊,为了避免这种情况,所以说我们一定要保存,保存之后,然后分享 分享点这个,因为你保存了之后才能分享啊,分享的时候大家一定要注意一点啊,一定要注意一点,在这里很多同学他不会 就这里就忘了点了,你要把这个权限改成知道链接的任何人啊,知道链接的任何人,在这种情况下,然后你再复制链接,别人就可以看到你的这个整个的工作流程啊,就是你所有的这个,这一个频道的所有内容啊,这个是分享啊,那么 包括这个保存,有的时候有的同学说,老师我总忘,我总忘,有没有自动保存的方式?也有的,那么我们点击右上角的这个齿轮啊,这个齿轮,这个齿轮啊,然后我们可以设置什么呢?首先可以设置主题,白天黑夜默认啊,默认是白天啊。 然后这里有一个 autosave, 就是 自动保存,我们把它点开,那么这种情况下,我们只要这个创建一个新的聊天啊,就是或者说我们一说一个新的内容,它就可以自动保存了啊,比如说,呃,我说一个这个,嗯, 过去啊,历史上的今天有什么事件 好开始生成了啊?开始生成了,我们看当他停止的时候会不会自动保存啊?这历史上的大事件,名人诞生,名人逝世。 好,那么你看,那么我们他看已经开始自动保存了啊,正在转啊,这是保存完了,那么我们换一个频道啊,我们换一个频道,再回来看今天是什么日子, 你就会发现他已经保存好了,就是只要你呃,开了自动保存,就是你就不需要再摁了啊,他自动就是你开新窗口也好,开什么也好,他自动就保存了啊,自动保存还是挺方便的,如果有怕忘了同学,你就把自动保存这个选项开启就可以了啊,这个是自动保存啊,那么我们这个 这个 ai 啊,你会发现,呃,左边栏啊,你就学会 chat 新聊天,建立新窗口,然后是历史 history, 就是 你历史的聊天频道,只要会这两个就行了。 然后呢,这里边啊,上面的窗口,这个系统指令大家又会了解,然后会分享,会保存,然后这里有一个对比,这个对比,其实对比模型的我们一般不怎么用啊,他有很多模型,我们可以对比模型,看看他有什么区别啊,这个我们一般也不怎么用啊。然后呢, 右边栏啊,右边栏是参数,参数这里我建议大家就是默认就可以了,默认就可以了。这里边有两个使用的功能,我还还是要给大家说一下啊。第一个使用功能是这个用谷歌搜索进行实证,什么意思呢?就是你把这个选项点开, 那么你搜索的内容就是可以利用谷歌搜索来实时的更新互联网内容,比如说啊,请罗列啊,罗列啊, 罗列,然后六月二十八日啊日呃,前一周呃的模型, ai 模型, 模型更新新闻啊,我们来简单看一下,看看能不能就是一周内的新闻,然后给我们给到我们一个实时性的一个时间, 因为正常情况下他的模型他是有一定期限的,就是说在是某某某日之前的新闻,他就时效性就差了点,但是如果我们想要一个最新的新闻,可不可以? 这里是可以的啊,那么所以说他写的二零零五年六月二十一日至二十八日这一周啊,有什么新闻?然后 jm 的 二点五系列提升啊,更新了啊,这个更新的就是二点五 pro, 然后传文中的 openai gpt 五啊, gpt 五预计六月发布啊,现在应该还没发布 啊, gpt 也要更新了,然后 cloud 三点七, cloud 三点七也要更新了啊,引入首个混合推理模式啊,结合了快速直觉应答和深度逐步推理 啊,能够根据任务需求切换思考模式。然后再一个就是阿里巴巴达摩学院胃癌筛查 ai 模型啊,这个,这个就是很专业了啊,然后行业动态, 然后科大讯飞预测二零二五年全民 ai 元年,腾讯云发布 date 加 ai 能力,美国政府考虑支持 ai 产业 能源供应,然后 ai 在 各行各业应用生化,大家可以看到啊,都是都是有据可查的啊,他甚至给你罗列了来源啊,这个新闻是从哪来的,大家都可以看一下啊,这个罗列来源也可也很好啊,就是我要找到原稿在什么位置 啊?这是原稿啊,你都可以再进行一个性更加详细的一个获取知识啊,这个是很重要的啊,这是这个实证搜索。再一个就是 url 上下文,这个 url 上下文是什么意思呢?就是你可以通过这个方式 啊,然后给他一个 url 的 网址,让他学习这个网站的内容,再给你进行一个回复啊, 再给你进行回复。呃,这个你也可以通过在这里啊,创建一个 url 上下文,然后呢,这里是输入网址的啊,如果你感觉到麻烦,其实你都不用这么费劲,就是你直接开一个新聊天窗口,把这个这个打开,你就告诉他啊。请参考网址,呃, 然后给一个这个网址,比如说我给一个。嗯什么?最好是专业化一点的吧。呃,请参考网址,呃,比如说这个, 呃。我找一个 markdown 吧。嗯, 找个啥呢? 我的 markdown 放哪去了?没保存呢? 好,请参考网址。这个然后,呃总结,呃网址,呃。总结内容, 我就做一个最简单的演示啊,然后后面如果说你需要他做其他的啊,比如说根据这个网址内容,然后你总结或者是发散,重新创造一篇什么什么文章也可以啊, 我们看一下他能不能总结了这个网址的内容。这个网址应该是一个 markdown 格式的,然后这个学习的一个 markdown 的 格式,一个方式,我看看他有没有能做出来啊。 该网站啊,是这个在线工具,可以预览怎么怎么样啊,这些他给罗列了一些什么功能啊?总,我就是总结这个内容,语法指南啊,他讲了这些,他讲了这些啊,然后他能够给到,然后直接连接到这个网址啊, 他还是能够能够分析出来这个网站是干什么的,然后主要内容是什么?这个我给的这个文档,他这个这个网网页,他的内容很少啊,你看就这点, 就这点,所以说他也没办法总结的那么细啊,如果你要看详细的,就上这里边看,但是他总结的内容是没有问题的,然后可以在左侧编辑和编辑,右侧会立即显示 啊,网页本身啊也提供了全面的语法指南,包括标题、列表、链接、图片代码表格啊,所以说他这个总结还是到位的啊, 这个大家也可以刻下自己去详细尝试一下后面的高级设置。这个大家其实不用改啊,大家其实不用改 啊,包括这个温度,大家也尽可能不要改,这个是提示词响应的这个准确程度啊,越往越往回数值越小,然后它的想象力越大,数值越大,那么它可能就是你的这个约束力越大,这个就看这个一般就不用改了,一就可以了啊。 呃,那么这个就是我们这个 as studio 的 一个使用方式。那么我们再回顾一下,我们选择模型,对,我们选择模型要在这里选啊,在这里是选择模型的, 这里呢有几个模型?有二点五 pro、 二点五 flash, 然后这个 flash 其实是二点五的一个快速版本, 它是我们现在用的二点五 pro, 它是一个深度思考的版本,一般来说深度思考的版本它是,呃,要有思考的过程,速度相对慢一点,但是它会得到一个更好的结果。那么如果是二点五 flash, 它的速度很快啊,但是它不需要深度思考,如果是简单一些的任务的话,你用二点五 flash 也是 ok 的。 那么前面就是过去的版本啊,比如说四月十七号的二点五 flash 啊,六月十七号的二点五 flash 啊,都可以啊,六月十七号离现在也很近,但是我目前用的是正式版的二点五 pro 啊, 这个大家可以自己选择一下,那么再往后看呢?呃,就是我们这个保存啊,刚才也讲了保存和自动保存,我建议大家直接开启自动保存,自动保存就在这里啊,在设置里边第一个选项就是自动保存, 然后啊,历史记录的位置在哪啊?历史记录在这, history 啊,而你需要找的话,你可以直接点 history 啊,在这里找也 ok 啊。然后在后边是分享的方法,分享必须有改动才能分享。如果说你比如说这个啊,我随便点一个,这个我之前保存了啊,保存了,然后我可以直接点分享 啊,分享的时候一定要记得权限,把权限打开,权限不开别人是没有办法连接到啊,没有办法打开你的这个网页了 啊。那么在后边啊,是这个系统指令啊,系统指令就是一个,呃,公共的一个提示词啊,就相当于这个全局提示词啊。那么复制的方法复制的方法,比如说我要复制一个文档啊,有的同学可能还不太会复制呃,他可能复制的也比较 呃,比较繁琐啊,比如说你复制这么复制啊,没必要啊,效果还不好。大家可以再把鼠标放到这个 打结果这一块,那么他就会出现上边有三个选项啊,一个是编辑,一个是重跑,一个是更多选项。如果你单纯是复制的话,我们点击这个, 这里边你会发现有一个从分支,这个一般是 get 里边用的,我们这个一般就不用这个了,我们只用两个,一个是呃复制文本,一个是复制 markdown。 如果是复制表格的话,我建议你直接复制 markdown 啊。如果是没有表格的话,我建议你直接复制文本啊,因为直接复制文本就够用了啊,没有必要复制 markdown 啊,当然你复制 markdown 也行。这两个的区别大家可以自己去参考一下 啊,根据不同的软件可能需要不同的方式,如果你是用 word 的 话,我建议是复制文本啊,如果是其他的像非书啊,像腾讯文档啊,你直接复制 markdown 也 ok 啊,这个就看你自己所用的什么软件了。那么这里呢, 这个还有一个方式啊,就是说,呃,我们的这个 jimmy 还有一个优势是什么呢?比如说啊,我这个提示词啊,历史上今天有什么事件,我想改,我不想用这个提示词,我这到这一步我觉得我生成的不好,我希望换一下怎么办?那么这前面有一个 edit 编辑啊,我们点击这个 edit, 然后呢,可以把可以在这里就把这件事改了,历史上的今天有啊,那么我中国啊,中国历史上的今天有什么事件,对吧?然后我再点一下停止编辑,然后这里有一个重新运行这一轮啊,我点一下这个星重新运行这一轮, 他就可以根据这个提示词,然后重新跑啊,这样的话你不需要在后边就是就是微调啊,新开窗口啊,或者是这个担心他跑的不对啊,你在这里直接在某一步,你可以重新制作啊,我觉得这个是非常贴心的一个功能 啊,这个豆包是没有这个功能的,我为什么喜欢用詹姆莱?我觉得这个功能确实我很需要啊。啊,那么我们看中国历史就出来了,对吧?八零年怎么样?三八年怎么样?二七年怎么样,对吧?就是历史,中国历史上的今天,对吧?袁隆平、吴孟超,五月二十二日。 嗯 啊,所以说呢,这个,哎呀 哼,这个今天是什么为什么日子啊?这块他有个问题,是什么?他告诉我是二零二四年五月二十二日星期三,为什么会这样?因为如果你不开时政 这块,我没开。如果你不开时政,那么他这个日期就会定格到这个模型,他的初始日期,这个模型他当时就截止到五月二十二日。那么我们进行一个时政啊,时政,然后我们再重新跑一下试试, 看看能不能给我们跑到这个六月二十八日啊?我们看一下, 好,看,六月二十八日了,这就变了啊,一旦你点开这个时政,就是这个谷歌搜索时政,那么他就实时给你更新到当天了啊,实时更新到当天了,那么再重新跑一下,中国的今天有什么事件,你看,基本上就变了啊。 这个就是结合刚才的一个时政看,清朝的时候第一次鸦片战争, 然后中俄看分界线,拒绝签署凡尔赛合约啊,这个大家学历史的可以去看一看,时间应该都是对的。 那么我们再往后看啊,这个修改重新生成修改,刚才已经说了怎么改?谷歌搜索实时联网,刚才也讲了读起上下文功能,就是读取那个网页的功能啊,也讲了上传图片、视频和文件。那么谷歌他有一个非常重要的功能,就是他是一个多模态模型, 他可以读取你的啊,文档啊,你的文档、音频、视频都能读取,都能读取。然后他甚至还能录啊, camera 相机也可以,但是我们用的少,我们一般就可以给他上传在这上传文件里边啊,比如说上传一个这个,呃, 随便上传一个小视频吧,对吧?然后你可以让他分析,我是随便上传的啊,你可以上传一些,比如说你下载的抖音里边的,然后或者是油管里边的这些视频,然后你让他分析这个视频里边说了一些什么事,什么内容,对吧? 然后你可以根据你的需求,然后让他给你分析这个视频,甚至给你让他直接是提取视频里边的这个文案,也也 ok 的 啊。所以说这个功能还是很好用的,大家也要用起来 啊。其他的功能我们平时用的少,如果大家感兴趣的话,也可以自己试验一下。那么我今天主要就是粗浅的给大家讲一下这个 jimmy 二点五 pro 的 一些常用功能 啊。那么我们如果说有的同学想挨个了解啊,挨个试一下啊,可以回来看我的大纲,我的大纲里就是呃所有的功能啊,常用的功能,你可以跟着大纲里边去做一下,跟着我的课程去做一下。还是那句话, 我们学 ai 一定要做要实操,只有不断的实操才能提升你的水平。好,那么这节课我们就上到这里,同学们,下节课再见! 大家好,我是老成,这节课我们主要讲视频生成的动态效果和常见错误。呃,首先呢, ai 图声视频啊, ai 视频生成是一个令人兴奋的新领域, 但也带来了新的挑战。新手往往会错误的认为, ai 能够像一位经验丰富的动画师一样,自动理解图片内容,并且创造出合乎逻辑,富有美感的动态效果。 可事实上啊,当前的 ai 更像一个听指令的魔法师,你给他一张静态的画,他能让画活过来,但你必须用精准的咒语或者提示词,告诉他如何活,哪里活,否则这个魔法就会失控,产生各种各样奇怪甚至恐怖的效果 啊。所以说我们在生成视频的过程中常见的一些错误,今天来给大家分享一下。首先就是没有动词指令,希望 ai 脑补。 这个是一个最根本也是常见的错误啊,通常你只传了一张图,然后在这个提示词框里描述了图片的内容,而没有给任何关于运动的指令啊。比如说你上传一张图片,一张女孩站在海边的图片,对吧?然后女孩站在海边, 然后 ai 收到了这个描述,但是你只是一个描述,你没有告诉这个图要怎么动,所以说他可能随机动,或者是可能这个啊,小小的微动或者是不动,他可能也能出一个啊,合乎你要求的 动态素材,但也可能他完全不可不可控。你需要靠抽卡,这个为什么有的人需要抽卡,有的人抽的就很少。 那么如果我们正确的写写这个提示词应该怎么写?那么我同样是上传女孩在海边拍照,那么专家提示词啊,就是海浪轻轻拍打啊,海浪轻轻拍打着沙滩,女孩的头发和裙摆在海风中微微飘动,天空的云彩也缓慢移动 啊,是吧?那么你需要这个图片,我们需要一个图片,我们来看一下,之前我做了一个,我重新做一个吧,嗯,一个女孩站在海边的照片啊,一个女孩站在, 女孩站在海在海边的照片啊,然后,呃,远处啊,晴朗的天空,远天空, 远处有白云。 好,那么我们来看看效果啊,我必须加一个远处有白云,不然的话这个云就动不了了啊,所以说这里边必须得有云的素材, 然后我们做动态,一个是女孩站在海边啊,我们来看看他的动态 啊,我又做视频生成了啊,这是一个视频,我们先做图片,刚才做错了,使用提示词啊,图片生成啊, 女孩站在海边,远处有白云,好,我们拿它生成视频啊,然后我们啊就就直接用原来的提示词,然后我们来跑一个啊,描述图像跑一个, 然后我们再用我们的这个专专家级提示词跑一个, 这个也跑一个,然后一会我们看一看他们的对比效果啊, 那么他的核心解决方案是什么?一一个是提示词的重心,必须从试什么转向再干什么,明确指出画面中哪些元素应该动,以及他们怎么动, 给 ai 一个明确的执行方向。那么以前我们就是说做图的时候, ai 升图的时候,我们的提示词重点要描述的是画面里有什么,画面里是什么 啊。但是如果我们做这个视频生成的提示词的时候,我们要重点讲这个画面里的动态是什么,主体怎么动,背景怎么动,细节怎么动,哪里怎么动啊?要描述他的动态,这个很重要, 我们看一下对比啊。第一个女孩站在海边啊,这个云是不动的,然后人物的头动了一点,头发没有动,裙摆动了一点,海浪没有动,他是他 ai 理解,就是说他觉得哪里该动,他就动一下。那么你给精准提示词之后啊,你看他的云是有动态的,头发是有动态的, 然后群白也是有动态的,海浪也是有动态的,也就是说你需要他动的地方,他全都在动啊,这样的话,他就能生成一个啊,更加合理的这个一个动态的方式啊,就是你你的要求他都会精准实现, 这样的话你的视频就有了可控性啊。很多同学说,如果视频控制不住你,提示词都没没有讲具体,那他一定是控制不住的。所以说详细具体的提示词,不光是生图有必要,你做动态视频一样有必要啊。第二个误区是什么呢?是运动指令模糊,缺乏细节, 那么这个就比第一个错误要好一些啊啊,新手给一些提示词,但是这个提示词过于笼统,缺乏具体的方向,速度、幅度的描述。比如说啊,一张城市街道夜景图,有汽车和行人, 那么汽车在动,行人在走,这个就太模糊了,有动有走,汽车是向前开还是向后退,是向左右横跳还是怎么样?还是行人闲散漫步还是匆忙奔跑? ai 只能随机猜测,也可能生成的汽车会原地鬼畜般的抖动,对吧?如果说你这个 我们直接啊,这个是上传图片,我们可以先升个图看看啊。嗯, 有汽车和行人,那么我们有汽车和行人,就主体是汽车,我们只能选一个主体啊,一辆啊,汽车啊,从街道啊中间驶, 街道中间啊驶过,然后行啊,周围啊。呃,人行人行道啊,有行人啊行走,我们先看看效果啊。 呃,这个是图片复制到图片生成, 然后我们再用这个汽车在动人,行人在走,我们来看看它的效果。 嗯,就给这张给这个吧。呃,然后我们用它生成视频, 然后,哎,没了呢?汽车在动,行人在走,我们升一下试试。然后同样的是这个我们形容词给一个红色汽车啊,这个红色汽车就不要了,因为刚才出的图他不是红色汽车,我忘了给颜色了啊 啊。然后我们就直接汽车啊,从左汽车从左到右,汽车从左向右匀速行驶,那它这个趋向不是从左向右的,如果你给从左向右可能会起到一个反效果啊, 它这个提示词它有点吃图,就是你的图像和提示词得需要匹配,那么我得重新生成一个图。 其实这个这个还可以啊,汽车在动,人在走也能用啊,他只不过没那么精准。嗯,像像这种提示词他常见于什么呢?这种提示词常见于直接不?不用参考图不用参考图,直接的。这个纹身视频啊,或者是你给一个夜街景啊,就是没有车没有车的这种。 嗯,我重新设一个图吧。夜景啊,就直接是街道夜景图 的城市街道夜景图啊,然后给一个平视视角, 你看这个就是俯瞰视角了,他不太合理。然后这个也是,其实这个还凑合吧啊,我想要一个横向穿梭的一个街道,这个街道都是纵向的,看看能不能出来一个横向的。 他好像还真没有横向的,他要从左到右的,最好是一个横向的平视视角,城市街道,夜景, 夜景,然后汽车再再 左右啊方向的街道上行驶。 那我尝试一下 mid journey 啊。嗯,因为这个吉梦他出的这个街道的朝向过于统一了啊。换一个模型试试, 平时视角看到汽车的侧面,好,然后我们来做一下, 好不纠结了啊,那么就直接给大家做一个这个纹身图吧,这个纹身视频,他这个纹身,他写的这么详细,可以直接作为纹身视频来用了啊,纹身视频直接做纹身视频, 一辆红色汽车从左向右匀速行驶,穿过画面,背景中行人悠闲的向前走,它全部都是动态,大家看啊,全部都是动态的一个动作,远处的霓虹灯招牌在缓慢的闪烁,镜头慢慢向前推进,它全部都是一个动态的一个动作啊,啊, 这个,这个还是图上视频了,这里其实它还是给了一辆车啊,红色的汽车,从左向右 看,他也给出来了,这个红色的汽车出现了,从左向右穿过画面啊,背景中的行人向前走动,那么我们上一个图,他就没有这个红色的汽车,看到没有这个红色的汽车,他就出现了啊,这就是一个精准的一个控制红色的汽车, 那么我们也可以直接做一个啊,红色的汽车从左到右,这个是才是提示词最精准的,因为上面是图声视频,这个图片限制了,限制了你的提示词,如果说你提示词足够精确的话,你可以指出啊,这样的话,他不会限制提示词,他的画面会更好啊,更好看。 嗯,这个是运动指令模糊,缺乏细节,然后错误。第三个误区就是贪多求全,想让所有的东西都动起来啊,比如说啊,一张宁静的图书馆内部啊的一个图片,我们来做一下啊,还是用吉梦, 嗯,提示词,书在飞,灯在摇,桌子在跳,人在晃啊,什么都在动, 然后它的困境啊,呃,会忠实的执行指令是一场灾难,整个画面会变得一个混乱,无意义的动态噪音,完全破坏原图的意境。这个在 ai 视频领域被称作过度运动啊,我们来看一下过度运动会是个什么状态。 图片生成,这是个视频呢? 好,这个元素是都有的啊,都有的,那么我们来随便找一张啊,随便找一张,然后生成视频,然后我们再让它动一下,看看它能不能动起来 啊?它给的一个女性安静的坐着, 然后我们用这个先生成个图片试试 看,这个就是这个,所有的都让它动啊,它就变成这样了 啊,书在飞,灯在摇。对啊,书是在飞,灯也在摇啊,然后呢?桌子在跳,人在晃啊,都没毛病啊,所有的他给的都对, 但是你给他放到一起,他就感觉很怪了。所以说我们如果,当然,如果说你的文案就是要这个效果,要地震呢?比如说突然失重的状态啊,你这样是没问题的啊,也不是完全不行,也要看具体具体的一个情况。 那么如果是这个专家级的写法应该是什么样的呢?然后我们看一下后面出的啊, 一个女性安静的坐着,手指轻轻划过树叶,桌上的台灯,温暖,发出温暖而稳定的光啊,窗外树叶在风中轻轻摇曳,光影在地面上缓缓的变化啊,我觉得这个非常 ok 啊,这个非常 ok, 他 所有的动态都非常的合理且真实。 好,然后我们再看下面啊,我们生一个图啊,根据这个图,然后我们再用这个提示词 生成视频啊,然后我们再找到这个提示词啊,这样再看一下, 这个是纹身,纹身的啊,这个纹身的其实效果已经很好了啊,但是如果你需要固定人物角色的话啊,然后你用这个图生视频也不错, 这样的话就能实现一个精准控制啊,手指轻轻划过树叶,台灯投下什么样的光,窗外又怎么样啊, 那么我们再看前面啊,其实解决方案的核心是少即是多,确定画面的视觉焦点和情感基调。对于一张宁静的图片,只让少数关键元素产生微妙的合乎逻辑的运动,让大部分背景静止,这样才能烘托出动态的美感。 就是给大家灌输的观念是什么呢?并不是说动态越多越大效果就越好啊。 大家看啊,这个桌子上斑驳的树影啊,他都在动,然后这个手和书的接触,你看,非常的自然啊,非常的自然,刚才的涂上视频,其实还是有一点点,这个翻页的时候还有一点点 bug 啊,感觉不太自然,但是 如果用在图声视频啊,这就非常自然了,你看它这个树叶都非常的细致啊,这个就非常的棒啊。 那么我们在后面是什么呢?就是在后面一个问题,就是忽略图片本身的可动性啊,就比如说它这个本身,这个图它不适合做动态图片啊,不适合做动态的位置, 就是并强行给出了指令啊,你必须得动,比如说啊,这个图片它就很模糊啊,就比如说你用这个 sd 一 点五生成个五幺二乘五幺二的图啊,五幺二乘五幺二的图,然后是一个大远景啊,然后你 这个还让他眨眼和微笑,眼睛特别小啊,嘴也特别小,只有很小的区域,你还让他眨眼和微笑,那样他就做不出来了啊。举个例子,比如说,咱就做一个一 k 的 啊,咱就做一个一 k 的, 呃,图片 啊,一 k 一 比一一 k 啊,远景镜头啊,一个,呃,女孩站,一个女孩, 键盘不太好用啊,站在海边啊, 面带微笑啊,她身穿白色白 红色长裙啊,哎,走一个。 好,那就这个啊,然后动态视频生视频,然后告诉她啊,女孩啊, 女孩眨眼啊,微笑啊,眨眼微笑,嗯, 然后露出惊讶的表情啊,这个脸其实还不算太小了,因为这是一 k 的 啊,如果是五幺二的就有点过分了。然后我们来尝试一下啊,不知道能不能做出来 e k 的 图像,其实还好一点啊,但是如果说你是一个比较远的一个镜头,它可能就容易出问题,因为它能够它的画布能够展示这个画面的地方就太小了。 好,我们来看一下啊,眨眼几乎看不出来了啊,微笑,然后转为惊讶的表情,基本上没有啊,因为这个能够操作的空间太小了啊,它就很难, 他就很难,即使是现在这么先进的模型,他也很困难。那么我们怎么解决这个问题呢?首先我们在选择图片的时候啊,选择图片的时候,尽可能的提高清晰度,确保 ai 能识别出细节。 很多同学他可能用的个图片就清晰度不够啊,看起来还行,但是一旦放大,他就会产生问题。 那么我们用的图片,我推荐是使用极梦二 k 啊,那么他出来的都是二 k 像素的,然后他有足够的空间来做啊,即便是这个占的比例比较小,但实际上他的像素还是达标的啊,所以说极梦二 k 是 比较好的一个选择,这也是我比较喜欢用极梦的原因。那么如果说 清晰度,我用的这个,比如说我用的是 mid journey 啊,这个清晰度出来就是一零八零 p, 它确实是不够用,或者是七二零,或者是更低,确实不够用,怎么办?那么我们用图像放大工具啊,图像放大工具啊,这里飞出了,也给了大家了啊,图像放大工具, 图像啊,不是视频,视频再放大就来不及了,一定是在图像阶段把图像放大,提高分辨率啊,图像放大很简单,这种方式太多了啊,这个一般我们学 ai 的 肯定是都会也手拿把掐的,那么图像放大了,提高清晰度之后,那么你 生成的视频,他就有足够的像素来进行一个制作的动态,这样的话你的视频效细腻度也好,他的动态效果也好,都会有一个阶段性的提升。那么第二个是主体要清晰, 如果说啊,你想要运动的物体要轮廓分明啊,就是你想这个东西运动,然后让他不变形,那么他的轮廓要分明,没有被严重遮挡啊,比如说,呃,人脸啊,你要让这个人脸这个展现丰富的表。

宝宝的思维彩超怎么变清晰?千万不要到外面去花钱修复了,今天三秒钟教会你,首先点击这里,然后再点击这里,然后点击左下角抖音旗下免费工具,点击一键做同款,跳转过来点做同款就可以生成了。

如何用 make 实现图片的局部精准修改?画面中是一位牙口不太好的奶奶,如果我想把她现在的牙齿替换为一口整齐亮白的牙,这用 make 是 完全可以实现的。 这一次给大家分享的是 mg 的 局部重绘功能,首先呢我们要打开设置,确保这一个 remax 这一个按钮是点开的, 那我们可以先来生成一张图片,这样我们就生成了一个有天鹅的图片,那我们可以选择其中一个,比如我选择第一个,放大选择之后呢局部同款的按钮就在这一边,我们可以鼠标单击一下。 单机之后在这边有一个矩形选框,我们直接框选就是你要重归的区域,那这边呢也可以撤回,撤回之后在旁边这里还有一个套索工具,我们一般用套索工具也会用的多一点,我们就可以围绕你想要替换的区域直接绕一圈, 这样的话我们就把区域框选出来了,然后我们再输入你想要它换成什么东西,比如说我现在想让它换成一个白鹭的样子,那我们就输入白鹭的一个单词,然后呢再点击发送, 那这个就是它给我们替换的效果。当然我们还可以不断的去尝试刷新修改,多去调整一下,它会得到不一样的效果,像第三个我觉得就还可以, 那这个呢就是局部重绘,局部重绘它的用途其实有很多,比如说 大家可以看一下我之前生成的啊,这个是之前生成的,比如我们在生成这样一个手部有点问题的图片,那我们呢就可以用局部重绘的功能,把手部这一块给它框选出来,框选出来之后你可以什么都不, 你可以什么都不用去输入,然后呢点击生成的话,我们就能刷出一些手部相对来说好一点的图片了。除了这一块, 除了这一个应用的话,我们还可以去改变人物的微表情,如果说我们只是把这个人物作为参考,想让他去微笑,那他人物的一次性可能保持的没有那么好,但是如果我在这一个基础上对他进行局部重绘, 然后呢我们把他的脸部嘴巴这里给他框选出来,我把这一块框选出来,然后呢再给他一个微笑, 我们再点击回车,这样的话我们就可以得到这种微笑的图片,大家可以看一下就笑起来了。当然除了改变他人物的景 看,除了改变这种表情,我们还可以去改变他的服装,或者说给他加一个服装。像 那这里的话,我们还是进入到局部重绘这个地方,我们就把服装这一块套索,用套索工具把它套出来, 倒出来之后呢再给他加入这样一段话,就是灰色的夹克,然后呢里面是白色的 t 恤,因为这个 t 恤的话我想让他保留嘛,所以我们还是要给他关键词,如果你不给的话,他可能会出现里面没有穿衣服的一个形态, 所以这个的话大家还是要稍微描述一下,那给了之后呢,我们就能够得到这种形态的一个,那给了之后呢,我们就能够得到他穿着这样灰色夹克的一个人物形象, 大家还可以给他加任何东西,比如说这一个夹克,你想要长袖,我们也可以去描述一下,当然我们还可以不断的去刷新, 那除了这一个呢,植物丛会他还可以去融合你上传的图片,比如说我们现在直接选一张图片上传,点击这里上传, 然后呢你可以选择任意图片上传,比如选择这一个,然后按一下回车就把这一个图片上传上来了。上传上了之后呢,我们可以把这一个图片的地址右键复制一下,复制之后我们再选到你想要替换的这一个图片,选择局部重绘, 再把你要局部重绘的区域框选出来,然后在这个地方直接替换你的链接,大家可以看一下啊,给大家演示一下, 就是我之前这里这个链接是没有的吗?这个是他默认的一个提示词,那我们可以在这一个提示词的前面直接把刚刚复制的图片地址 ctrl v 复制过来,然后呢按一个空格键, 这样的话他就会去融合这一张图片,然后再结合这个位置去给你换一下,把这两个图片进行一个融合,所以这个是他的另外一个用途,就是他可以去结合你上传的图片 来去生成。像这里的话,第一个我是上传了这样一张图片,那他给我融合的话,就出来这样的效果。 当然其实我尝试过啊,就是如果你想让他完全替换,这个是需要一定的概率的,大家要去抽卡, 一般来说他都会保留一些原图的这一个效果,像如果我们成这样张图片的话呢,他就会给你得到这种效果的,就是我们可以去得到 可能会让你意想不到的一些效果,像这一个它就会改变里面的材质,然后我刚刚传的这个大家也可以看一下,就会得到这种比较奇怪的形态。当然我们可以去换材质的话,那你可以选择跟这一个产品类似的,然后不同的材质,然后再 然后再去生成。当然大家也可以去上传任意图片,都可以去尝试一下。 那像而且呢在这里我是没有给任何提示词的,大家也可以去给一些提示词,这样的话会更接近你想要的一个效果。好了,那这一次的分享就到这里了,大家觉得 mg 的 植物虫会怎么样呢? 可以在评论区留下你的看法。那本期那本期教程就到这里了,感谢大家。