二零二六年最全的 ai 工具大全刚刚发布,北航清华教授团队亲自整理。不管你是设计师、程序员,还是科研党,又或者是短视频博主等,错过这期视频,你可能整整会落后一个时代,那么我们开始吧。首先 先看我们的通用模型, deepsea 中文开源王者 chat gpt 对 话天花板、谷歌 gmail 原生态多模型,阿里通一千问性价比无敌 kimi 长文本处理,怪兽字节豆包,新手小白的最爱, 志不轻言理工科神器,腾讯元宝能读微信聊天记录这八大金刚总有一款适合你,但是最爽的你还要看后面。 如果你是做设计师的,又或者是你是做电商的,那么接下来你可要好好看了。 midori 艺术感风神 stable diffusion 开源自由 dior e three 跟 chat gpt 的 无缝衔接,还有我们的莱茵娜多 ai, 让你训练自己的模型。以前我会熬几个通宵的火,那么现在几句话就能搞定了,这 感觉是不是特别的爽爽。作为视频创作的工具来说,那么接下来更是开挂了, openai sora 生成电影级的大片让位,运动控制精确到像素级别,皮卡社区能玩出花, 国产可零 ai 长镜头更是无敌,更觉得是剪映,你现在随便说句话,直接它就能给你生成一条视频,这效率,同行还在吭哧吭哧的剪,你已经发第十条了,但我感觉最厉害的还是 cds 二点零, 它确实是太强了。那么接下来到了我们该创作音乐的领域了,首先是苏宁,它能克隆你的声音,那么这只是冰山的一角。 那么我写的这份二零二六年的 ai 工具大全,原文里还有一百多款神器,每个都自带官方的链接和详细的教程,但是由于我们的时长时长有限, 完整的工具清单我已经放在了评论区,回复 ai 工具你就能拿走了。那么下期视频呢?我们一起来看看 ai 机器人的发展史,关注我,别错过!
粉丝907获赞3319

都二零二六年了,如果你还不知道怎么使用 github, 那 么错失 ai 神器的你可能正在被淘汰。结尾奉上五个二六年一月份爆款的 ai 工具,点赞收藏,全程干货。不废话,首先第一步就是打开浏览器,输入 github 的 官网地址,屏幕已经打码放出了,直接复制粘贴。 关于上网环境, get up 在 国内确实是可以直接连接的,但是呢,他不是特别的稳定,所以如果你无法打开,那么其实就需要进行啊,科学上网,然后进行啊,这个魔法的方式我们才能再打开了。具体方式呢,可以参考市面上的各种的案例,有什么不懂的可以在评论区和我互动交流。 第一次进入是一个简洁的界面,这里面划个重点啊,就是不注册也能够浏览项目。但我强烈建议还是注册一个账号,因为它是完全免费的, 后续收藏项目,然后接收更新的相关的信息都是非常必要的,所以早注册早省心。点击绿色方块的 syncup for github, 可以 直接进行注册。邮箱呢,没有任何的限制,谷 qq、 网易邮箱都可以直接充,输入邮箱和密码,跟着看一些呃相关的提示,完成简单的验证,一分钟就基本上可以搞定了。注册好之后呢,重点来了,找到顶部这一个搜索框,直接输入你想要的工具,或者说是项目名称,比如说后面我们要讲到的 whisper 啊,敲个回车就能够精准定位到对应的开源项目了。按收藏数排序,收藏数越高,项目就会越优质,越靠谱,能直接避开大部分的垃圾项目,省时又省心。进入到项目界面,千万别慌啊,不用看满屏的代码,觉得啊,完全就学不会,但是重点呢,关注三个地方就足够了。 第一个就是右侧项目的简介,看不懂英文介绍没关系,复制下面的丢给豆包,直接进行翻译,三秒 get 项目的核心功能。第二步就是往下滑找 readme 文件,这是作者呢给他的这个整个项目一个官方的指南,里面详细了写了部署的步骤,跟着一步一步进行操作就行了。 九大步骤呢,直接复制给 ai 进行拆解,傻瓜式就能跟着做了。第三个呢,就是懒人的福利了,项目官网很多作者会在简介下方付链接,点击就能够直接在线使用了,不用自己进行部署,非常简单,小白可以直接充。 相信你看到这里已经初步的了解了 github, 现在直接上啊硬货中的硬货了,五个开年爆款的 ai 工具一次性奉上。第一个呢就是 clubbot, 运行在本地电脑上的 ai 智能体,能够帮你直接操控你的电脑,帮你干活,只要通过聊天软件就能够给你释放指令。第二个, build u uw n x 强大的开源项目的分享,这里是一个集合各种从零到一的开发教程的开源项目,包含了数据库开发、游戏开发、外部服务器的开发、大模型开发等等。第三个, follow 哎,这是一个我真的是跺着脚转着圈推荐的一个,这是一个能够帮助你彻底打破新一 x 新一员的开源项目,如果你是一个创作者, 你也可以分享你的信息,别人订阅的时候也可以给你进行打赏。第四个, superpowers, 千年以来 ai 编程领域的现象级产品, 为 cloud code 打造一个技术的框架,就是强制 ai 编程前深度的进行思考和规划,接到需求后呢,会进行反复的提问,明确细节,图像完成并编写测试,用力彻底解决了 ai 编程的短板。第五个, deep lab cap, 该实时的换脸神器,无需复杂的配置,仅需一张目标人物的静态照片,就能够通过摄像头实时捕捉画面并进行换脸,无图显也能靠 cpu 运行,直播短视频创作者的必备神器。 以上五个工具全在 github, 可以 进行免费的领取,领取教程的话我放在评论区了,如果你学会了如何使用 github, 找到并使用你想要的工具,记得点赞和关注。我是胡博,一个关注分享 ai 知识的老师,咱们下期再见!

很多人做 ai 视频就是在抽卡,一个镜头试了上百次,半天出不来一个能用的,但如果你能指挥这些工具呢?你将不再需要抽卡,只要你会精准输出指令, ai 直接一发入魂。本期视频我将教会你使用当下最主流的 ai 应用以及与 ai 的 沟通大法,让你能最大程度的掌控你的 ai 视频, 这种对 ai 的 掌控力将是你踏上 ai 时代这趟列车的入场券。本视频用到的题词库,里面包含了六十三种镜头角度,还有对应的提示词和视例,直接抄就能用,感兴趣的六七七现在开始教学。首先视频创作都是需要故事脚本, 就像是这样包含了镜头运镜、内容、旁白和持续时间等,整个视频都是围绕着故事脚本展开的,所以说这个内容很重要,但是不是每个人都具备写剧本的能力, 那么这个时候就可以借助我们的 ai, 我 们只需要给它输入一段文字, ai 就 会自动帮我们生成。然后我们的纹身图部分需要用文字转换为图片,然后再借助图片生成视频的逻辑, 再通过一些 ai 配音软件,我们就能够将文字转换为声音了。最后将我们生成的视频以及配音加入一些音像,通过剪辑软件拼接起来,就完成了我们一段 ai 动画的创作,而这就是我们整个 ai 视频生成的逻辑。 接下来我们来逐个解析其中的关键步骤。首先来到我们的第一步,故事脚本的处理,一个好的视频绝对离不开一个好的剧本,那么如何让 ai 生成一份好的剧本?首先第一步 我们要给 ai 设置一个身份,而像故事剧本这样的内容,我们就应该让专业的编剧、电影导演来生成。那么我们赋予 ai 这样的一个身份,它就能解 解锁他的知识库,然后生成与之相匹配的内容。就比如说这里我们可以设定 ai 的 身份,为一个动画编剧,一位电影导演,那么他们的特征是什么?他们的特征就是经验丰富,后面你也可以加上一些奇葩的内容, 比如说再给他加上一个高超的电影拍摄技术,二十年电影拍摄经验,全球顶级导演,这样的身份,设定好一个好的身份,能极大的增加产出好剧本的概率, 那么这就是我们的第一步。此外,我们的剧本是有框架、有格式的,那么要给他设置一个好的框架,他才会按照我们的需求生成对应的内容。那么框架有什么呢?是不是要有故事主题, 要有镜头、镜头数和旁白?这故事讲什么内容?是讲美女与野兽,还是外星飞船?这些内容是在我们一开始的时候决定好。此外我们还需要有镜头, 每一秒这个视频显示的内容是什么,部分的声音是什么,这些内容都是要提前设置好。这里我们可以先看一下具体的操作过程,你可以选择用豆包, kimi、 gipsy 都可以,这里我推荐使用豆包,因为它用起来更加的方便。我们这里给他输入一个身份,你是一位专业的动画编剧,再给他确认一个主题,书生与狐狸为主题, 我们讲一个书生与狐狸的故事, ai 需要帮我们生成一个一分半钟以上的动画剧本,我们可以测试一下,打开它生成的动画, 我们可以看到他会将每一个场景生成好标题、场景持续时间等等内容生成出来,其中就包括我们以什么样的方式开头,以及我们主要人物在座上,比如说书生云秀正在抄写论语,这里就是我们的第一个情节, 交代了一下人物主体,我们可以看到整体的剧本是非常完整,场景一就是书生云秀给赤狐递了一块麦,作为他们友谊的象征场景二则是狐狸报恩 解决云秀温饱问题,讲述的是一个这样的故事,像这样的剧本就是比较完整,那么我们通过这样的剧本才能够生成一部好的动画短片。那么接下来我们就按照这个剧本来完成我们的 ai 动画短片的创作,那么我们刚刚就演示了故事脚本需要如何生成,以及需要达到什么样的要求。 再看看第二人物特征,人物特征是保持人物一致性的一个关键要素,因为 ai 生成会导致我们的人物频繁发生变化,所以我们一定要控制好提示词的书写,我们可以让 ai 为我们生成角色的服装外形、场景特点,我们在这里让它生成剧本中每一个人物的人物设定,需要具备 服装外形、性格、行为特点等等。然后我们查看一下人物设定,我们的云袖身着一件发白青衫,衣服上打满补丁,外貌清瘦,肤色白皙,有一股书卷气。再看我们的狐狸,分为狐狸形态和少女形态。在题诗词的使用之中,我们通常只需要将 服装以及外形特点输入到我们的提示词当中,就可以很好的生成了,然后呢就来到了我们的分镜,制作分镜决定了等会我们纹身图和涂身视频的流程,我们可以对脚本输入增加镜号,画面描述,镜头运动时长,对吧?音效等等, 那应该为我们生成更为详细的分镜脚本,我们可以看看生产好的分镜脚本,那是有着镜号这段时间主体是谁,他在做什么,整体的环境是怎么样,包括镜头运动,他是特写,从笔尖缓缓拉开至全景 一个这样的状态,以及它的音效,笔尖的沙沙声,这些内容都是我们进行 ai 视频生成的参考,我们觉得有哪些不满意的地方,也可以让 ai 帮我们再修改。我们可以看看后面的这些镜头,整体是非常完整,那么有了我们的分镜脚本之后,就只剩下最后的一个内容,那就是制作我们的分镜图, 而分镜图又是靠提示词来进行生成的,所以提示词该怎么写就是重中之重,它就会决定我们整体的一个画面质量。提示词需要包括几个内容,首先第一个是风格限定, 整个视频中所用到的所有图片,他们的风格一定是统一的,这样才能够保证我们视频的一致性,所以说风格 我们要放在题的词的最前面。然后就是视角过渡,这个决定了我们画面内容展示的方式,我们的每一个镜头都是需要有 不同景别来进行切换的,我们不可能一直用一个特写镜头,第一个镜头是特写,第二个镜头是特写,或者一直用全景镜头一定是全景,近景、中景特写,这样子来回切换才会有视频的流动,不至于过于呆板。再看下一个主体描述, 这个就是说我们的画面内容,画面里面这个人长什么样子,他有什么特征,他做什么事情,这个就是我们的主体。再到我们的背景设定,我们的画面主体周围的环境是一座破庙,什么样的时间,是 月光洒下来还是大白天,是春天还是秋天,黄昏还是傍晚,这些就属于我们的场景描述,场景能够渲染视频的一个氛围,再到我们的细节修饰,观影色调,以及这两次这些主要是 助我们画面生成的,就比如说人走过是不是有脚印,那么这些都属于我们的细节。光影色调则是一种美感的体现,像月光与烛火交织这一种感觉就给人一种朦胧感。以及我们的质量词, 提高我们的画面质量,高清细腻细节要多,通过这些提示词逐步提高我们的画面质量。通过以上这些方法,你就能够得到一份完整的分镜图提示词和一份高质量的故事脚本。拥有这两个东西之后,就可以进入到我们接下来的环节,我们下节课将继续讲解纹身图的内容。哈喽大家好, 欢迎大家来到我们的 ai 视频全流程解析系列课程,那么我们上一节课已经了解了故事剧本该以及我们需要生成哪些内容,那么这节课就来到了我们的纹身图环节,在这里面像豆包吉梦可怜这里是属于简单一点, 没有什么使用门槛的,举个例子,以吉梦 ai 生成为例,我们只需要在它的输入框里面输入我们之前设置好的提示词,框架风格, 人物主体,它的外观场景,它的动作,然后输入到输入框里面,然后使用极目 ai 生成,只要点击一下就可以生成像这样的内容 还是非常方便,也可以使用我们的 s d 来生成,也就是 stable future。 使用这款工具是需要一定门槛,那么这里为了方便演示,我就直接使用豆包来进行生成。 在这里我将画面风格统一为奇幻高清动画,因为这样的画风我更加喜欢一点,你可以按照自己喜欢的画面风格去生成,我们依次生成四到五个镜头,我们可以来到生成好的这个画面里面,像有一些内容其实是不错的,我们在里面找到觉得合适的内容 就保存下来,像这一张就明显过于浮夸了,像这一种我们就要单独的对第二张重新生成,然后我们再接下来依次的生成我们之前产出的所有分镜图片。其中要注意 我们对于生成内容不满意的地方也可以进行修改,就比如说像这里这一张画面就完全没有什么看点,那么我们将它的时间改为白天近景构图,再来看看这一张就明显要好很多。 对于比较满意的图片,我们可以点击变清晰,像这个功能其他的 ai 生图网站都有。通过这些设定好框架的提示词,我们就能够生成整体一致性比较强的 ai 图片,我们也可以通过提示词内容生成一个完整的产品图片, 像这样挑选出其中表现效果比较好的几张,作为我们之后涂上视频的手帐图片。我们的整体的提示词内容一定要严格按照设定好的框架来书写,对于不满意的图像,我们可以多次生成,这个是需要耐心的, 又或者你想要对其中的某一个部分进行修改。像这里我就将原本的赤虎改成了白虎,为了避免画面的单调,后续我还生成了一些空镜头,也就是没有人物只有场景的图片 作为画面的过渡。这样子我们就把我们所有需要的分镜头图片生成好,然后再为他们重新命名,设置一下排序, 等会就可以进行我们涂鸦视频的操作。如果你觉得有收获的话,不妨点赞加关注。今天就跟大家讲一下涂鸦视频的具体操作。我们可以看到这里有很多优秀作者发布的作品,这些都是由 ai 动漫、 ai 的 创意文旅片,还有这种带有梦幻感的 ai 短片,整个效果给人是一种非常舒服的感觉。那么 像这些 ai 视频该如何生成?我们可以来到下方的提示词的输入框,点击这个按钮,切换视频生成模式,然后就可以将我们的文字粘贴到这个输入框里面, 这里我演示一下,让豆包给我们一段 ai 视频生成提示词,我们复制一下这个第一段,将其粘贴到这个输入框里面。这里可以选择我们视频生成的模型,有 s 二版本,三点零版本,还有 pro 版本,越新的版本 所需要的灵感值也就越多,这里我们选择视频三 pro 版本,这个十六比九则是我们的视频比例, 在这里面我们可以选择十六比九,一比一,九比十六这样的比例,时间我推荐大家选择五秒,因为十秒比较不稳定,而且也比较浪费积分。那么我们点击一下生成按钮,就可以在侧面栏的生成里面找到, 我们点击一下,我们可以看到视频已经生成出来了,我们看一下效果怎么样,可以看到整个画面场景是非常梦幻,我们的视角往前推入, 一个带着翅膀的小鹿向前慢慢走来,后面云海之上还有一只巨大的鲸鱼,人体的画面是比较梦幻的。 视频生成好了之后,还可以在我们的右下方对他进行更多的其他操作,比如说对口型 给它增加 ai 音效,对它进行补帧,也就是说让画面更加的流畅,提高分辨率。因为我们现在生成了一个视频,看着还是有点模糊的,对于追求更高清更高细节的小伙伴们来说,这个画质是远远不够的。这里还有一个 aip 院, 它能为我们节省大量的时间,但是有时候可能会出现不太能满足我们想要的效果,对效果不满意也可以对它进行编辑或者再次生成, 要是那样的话,是需要花费额外的灵感值的。虽然说 a a 可以 通过文字直接生成视频,但是这样的效果很明显不能完美的传达我们的意思,所以说我们更多的还是使用图声视频的操作。这里我们让豆包为我们生成一张动漫图片, 一个女生在骑着单车,我们让豆包为我们提供图声视频的提示词, 我们输入这样的一段内容,将第一个箭头复制一下,拷贝到我们的启蒙 ai 输入框里面,可以点击这个加号上传文件,也可以直接将我们的图片拖入到这个加号当中,然后我们点击生成,那么我们可以看到生成好的视频整体的效果是不错的, 那么这就是我们使用首页生成视频的方式,接下来看看我们如何利用首尾帧来生成视频了。这里我用这样的一个首帧图片, 是一个粉红色的一个场景,有一些绿叶,再用这一张两个草莓碰撞在一起,水花四溅的一个场景。我们在输入框里面输入这样的一段提示词,点击生成, 点进去看一下,他将我们的手针图片和尾针图片很好的衔接在了一起,同时识别了我们提示词当中所需要的内容,它产生了这种碰撞的效果,看起来还是比较有视觉冲击力。平时使用图针视频当中有很多需要手尾针才能够顺利生成的视频, 因为它的前后差别比较大,如果你仅仅只用手针的话,生成的内容是很不可控,那么通过我们刚才讲述的图生视频的方法, 我们就可以像这样开始我们整个 ai 动画短片的生成了。这里举几个例子,比如说我们以这张图片为例,让它生成一个视频,我们可以来解析一下这个提示词,可以看到人物的主体动作,镜头语言以及细节 光感的描述,通过这样的提示词,我们就可以生成像这样的一个视频,然后生成好这个视频之后,再给他提高分辨率,然后逐一生成。通过这些步骤我们就可以得到一份生成好的视频片段,这里我们可以看一下,下一节课我们就将这些视频片段组合起来, 成为一个完整的动画短片。如果这条视频对你有帮助的话,不妨点赞加关注,我们下节见,拜拜。哈喽大家好,欢迎大家来到我们的 ai 视频全流程解析系列课程, 那今天我们来讲一下短片的配音该如何完成。首先我们来生成我们的短片的旁白,这里我们给 ai 输入指令生成故事旁白,可以看到 ai 就 生成了这样的一段文案, 那么这段文案其实是有点笼常的,我们将它精简一下,最后得到了一段这样的比较简短的文字, 我们可以看一下差不多两百七十多个字,与我们最后要生成的一个一分钟左右的 ai 短片其实是很接近的。那么第二步就是将这样生成好的文案通过配音工具转化为短片的配音了。那么该如何完成这样的操作呢?我将在这里讲解一下 我平时经常使用到的工具。那么我们打开这样的一个网站,我们可以看到这里就是它的一个功能界面, 有文本转语音、音频编辑、语音转换、歌声转换、音色克隆等。那么我们要将一段文字转换成好听的故事配音该怎么做?就是要用到我们的文本转语音功能,其实我们的默认界面就是这个文本转语音, 我们可以在这里面完成我们短片配音的工作,这个位置就是我们的文本输入框,我们将刚刚生成好的文案输入到这个输入框里面粘贴进来,然后就到了一步比较关键的操作,我们要选择合适的声音来生成这些文字, 像这种工作以前一般都是由配音演员来完成的,那现在有了 ai 工具之后,我们能很轻松的完成这样的工作。我们点击这个选择角色按钮,在这里面我们可以看到有很多的声音, 男女老少都是可供选择的,那么我们想要的一个故事短片的声音应该是怎么样的?我是想要一个比较有磁性的声音,又好听的一个女性声音,我在这里面挑选了一下, 我觉得第二个就不错,我们可以听一下他的声音是怎么样的。心若止水,勿与俗世纷扰,淡然处之,听起来感觉还是很不错的。这里我们点击这个使用即可。 文字语言选择默认的中文,这个地方其实是比较关键的情绪选择,像我们平时说话肯定是有对应的场景, ai 配音也是一样的,我们是一个短片的旁白,那么我们就在这里面选择对应的一个解说旁白,可以试听一下,好是时间的艺术。 泥土太干则裂,太湿则塌,感觉还是不错的。那么这个语态强度指的是什么意思?其实就是我们的声音平时是有抑扬顿挫的,有说话的重点,那么你的这个语态强度越高,则更加的饱满,那么这里我们选择默认即可。 至于语速语调,你可以看你生成后的声音是否符合你的需求,觉得语速慢了,那我们就调快一点, 这可以灵活调整,那么这样我们就可以点击生成,我们看看生成之后的秀,我们来播放一下寒夜霜月漫过荒郊破庙蛛网缠绕,断梁 残烛与古旧竹台燃烧,火苗侵占。这样的一段声音就是比较符合我的需求,无论是他的一个抑扬顿挫也好,还是声音的音色都是符合我们一个弹白的标准,那么这样就完成了我们一个短片配音的工作。 这个时候有人就会问了,假如说我想要生成对应角色的声音呢?而且他的嘴型还要和我们生成的声音要匹配,这个时候该怎么办?我们来到题目 ai 这里,点击数字人功能,导入我们的角色照片,再拖入我刚才随机生成的一段音频,你们可以听一下, 你觉得今天的天气好吗?我觉得相当不错,在这里选择音频原声,点击确认,然后生成,我们可以看到已经生成好了,我们播放看一下。你觉得今天的天气好吗?我觉得相当不错,你觉可以看到我们的口型和生成的音频是一一匹配的, 那么这样子就实现了一个对口型的功能,但是像这里我们输入的是一张图片,那么假如说我们要将我们的视频里面的人物匹配我们的声音,可以来到可连 ai 这里点击视频生成,在这里面有一个对口型功能,我们点击进去, 在上方输入我们的视频文件,在下面上传我们的配音音频,我们就可以实现让视频中的人物匹配我们的声音了,那么这就是我们短片配音的全部流程,对你有帮助的话不妨点赞加关注, 我们下节课将讲解如何使用 ai 工具来生成配乐以及音效,下个视频见。哈喽大家好,欢迎大家继续来到我们的 ai 视频生成全流程解析。首先第一步先来生成歌词,我们来到我们的大圆模型这里点击这个深度思考, 然后参考我这个模板来进行生成。这个模板有什么特点呢?它可以参考你喜欢的歌手的曲风特点,以及人类构建节奏,写词风格等等。那么我们让 ai 帮我们生成,我们可以看一下它是如何构建这一首歌曲,可以看到它生成的过程是非常细致,看看它生成后的歌词 整体有着古风的元素,待会我们就要用我们的 ai 工具将这样的一段歌词生成我们的古风音乐,我们复制一下,我们打开这个网站注册之后呢,他会给我们两百的创作点,可以让我们生成好几首歌曲, 而且他是每天刷新的。我们来到这个文本生曲这个部分,点击歌曲分为两种模式,专家模式和普通模式。专家模式呢,指的就是我们可以输入我们生成好的歌词,放进去之后呢, ai 来给我们生成歌曲,也可以使用普通模式直接描述这段歌曲, 他同样会给我们生成音乐。这里面我们先测试一下专家模式是怎么样,我们将我们刚刚生成好的歌词粘贴进去,可以看到下面有几个选项,风格和谐调性等等。这个我们使用 ai 推荐即可,包括速度和作品时长。 我们先使用默认模型,这里他有三点五三点零,那么不同的模型有不同的时长限制, 这里我们选择三点零作为我们的生产模型,我们点击这个开始生产按钮,可以看到已经开始生产了,我们稍微等待一会,我们可以看到已经生产好了,来试听一下,可以看到整体的效果还是很不错的,无论是歌手声音的质感,还是音乐的流畅度, 这些部分都是在线。那么像我们生成的这个 ai 动画短片呢,我们只需要生成纯音乐的背景就可以了。我们来到纯音乐这里,在这个位置呢,我们使用普通模式描述一下你对这首纯音乐的期望是什么, 比如说我在这里想生成一首古风舒缓的音乐,我们点击生成可以看到生成好,我们来试听一下,可以感觉到它结合了我们 古典弦乐的特点,整体呈现呢是一种古风的感觉,那么像这样的音乐就已经完全足够作为我们的短片配乐,按照这些操作 你也可以生成属于自己的个人音乐。那么除了这个办法以外,我们还有没有其他软件可以帮助我们生成短片配乐呢?可以使用剪映,在剪映的音频这里面可以选择音乐类型,有人声歌曲和纯音乐, 这里面我们选择纯音乐,同样输入刚才的音乐描述古风舒缓,我们在这里面呢点击开始生成,我们可以看到已经生成好,可以播放一下听一听。通过这样的方式同样可以生成我们的 ai 音乐,但是呢这个需要消耗积分,所以说我更推荐大家使用 上一款软件,它是由每天的免费额度足够我们使用。我们刚刚已经讲解了如何生成音效呢? 其实在我们视频生成这里就可以生成我们的 ai 音效,我在这里输入鸟在天上飞,我们点击进去之后可以看到现在整个画面是没有声音的,我们点击这个 ai 音效, 我们来一一听一下这几个音效,可以感受到整体的一个音效其实是比较接近我们生活当中,但是呢经常会有一些不确定性,所以说还是需要我们自己来手动的找音效。这里给大家推荐一个音效网站,它的音质还有效果都是非常好, 我们这里可以随便试听几个,比如说这个敲门声,再比如说这个可以感受到整个声音是非常真实的,它里面还有不同的种类,涉及到我们生活方方面面的各种音效都有,那么在这里面找我们需要的音效是非常方便的,而且质量很高。 那么这节课呢,就给大家讲解了如何生成我们的 ai 音乐以及 ai 音效。下一节课呢,我们将前几节课的成果整合成最后的一个片段,实现我们最终效果的展示,对你有帮助的话不妨点赞加关注, 我们下一节课见,拜拜。哈喽,大家好,今天继续来到我们的 ai 视频生成全流程解析系列课程, 这节课呢就要将我们前面几节课所生成的素材剪辑成最后的一个成品了,那么来看看我们是怎么操作的。首先第一步我们要选择适合自己的剪辑软件,通常的来说有这么两款软件,剪映和 pr, 剪映适合新手,容易上手,好操作, pr 呢则门槛较高,需要一定的时间成本来学习。那么这里我们直接选择剪映软件下载,我们可以直接来到剪映的官网这里,点击立即下载。那么我们打开剪映之后呢,如果想学习一些基本操作, 可以直接在我们的右上方,这里有一个教程,我们点进去这个教程里面。哈喽,各位同学好,我是报道晓峰,这里已经有了我们常用的剪辑功能解析,比如说时间线转场特效,贴纸加字幕等等,那么学会这些基础功能之后, 我们就可以正式的来开始我们的剪辑了。我们点击开始创作,将我们之前生成好的视频素材拖入到下方的轨道栏这里按照我们的动画脚本对它进行排序。这里讲一下常见的基础操作,这个按钮就是分割,我们将时间线拖到你想要分割的位置, 点击一下,这样的话这一段视频就被分割成了两个,那么我们随便删除一个 可以看到就完成了我们最基础的剪辑操作。然后再拖入我们的短片盘白以及短片配乐,这里我直接展示一下 我剪辑完之后的视频效果,我们对照着这些做好的效果来讲解一下我的剪辑思路。寒夜霜月漫过荒郊破庙,蛛网缠绕断梁。首先在我们的短片开头有做一个封面, 那么这种封面该怎么做呢?我们可以选择在这个短片里面,你比较喜欢的某一个瞬间来到我们的豆包这里面,让他给我们生成我们短片名称的艺术字体,我们点击生成之后呢, ai 就 会自动帮我们生成四张字体,内容为月下壶生的字体图片。这里面我们可以选择自己喜欢的, 也可以多次抽卡,可以在 ps 里面后期处理一下,调整一下比例,就可以导出了装月漫过荒郊破庙这个字体呢,我们只需要点击我们的音频素材, 右键选择识别字幕歌词就可以了,它可能会出现一些错误,可以直接在这里面点击编辑,比如说这样还是很方便,可以看到我原本的完整音频被我分割成了很多段, 主要是为了让我们的文字匹配上画面。这里的常用办法就是呢,将原本的完整音频 在不同镜头下进行切分,破庙蛛网缠绕,断梁残烛与古旧竹炭燃烧,火苗侵占。可以看到 音频和视频画面都是一一对应,云袖身着青布长衫,笔锋在粗糙的宣纸春来赶考日,白狐骤然画像。这一部分的音效其实都是在生成 ai 视频的时候 自动生成的,只是我将这个音频分离出来,可以看到他们的命名是一样。那么通过这样简单的方式呢,我们就完成了视频的剪辑,其中包括视频片段的处理,生成字幕以及我们的音频和画面一一匹配。最后让我们再一次欣赏一下这个鸭短片。 寒夜霜月漫过荒郊破庙蛛网缠绕,断梁残烛与古旧竹台燃烧,火苗侵占。书生云秀身着青布长衫,笔锋在粗糙的宣纸上沙沙游走, 眼角瓦片松动,白狐探脑,景丁岸上卖饼,云秀推饼轻笑分你一半。自此米缸见底时,门槛总现。野兔有白狐相护,云秀免受激扰。 寒冬腊月,云袖扫雪,白狐相伴,一人一壶,蜷缩草朵取暖。 春来赶考日,白狐骤然化作白衣女子阿九 云秀又惊又喜,相谈甚欢,递上胡为所致神笔。指尖相触,情愫暗涌。云秀执笔,画尽长安,阿九却在破庙独守春秋。 数年后,官袍染尽繁华。故人已随胡明消散,风中为记。当年庙前有家人在旁, 每想一别,竟是无缘再见。哈喽,大家好,上一节课呢,我们聊了一下关于人工智能的一些基础知识啊,对人工智能有一个基本的了解, 那么人工智能里边啊,最重要的是什么呢?一个是创意,一个是沟通啊,我们一定要想到一个非常好绝妙的创意,另外一个,我们要能有效具体的和 ai 进行沟通,生成我们真正需要的内容。 那么在啊,这节课呢,我主要跟大家来学习一下 ai 沟通的方法啊,我给它叫做 ai 沟通大法。那么我在这里会以一些我们常见的一些误区的方式啊,来手把手的教会大家啊,我们应该怎样和 ai 进行有效沟通。 首先呢,第一个误区就是我们通常会把 ai 当成搜索引擎啊,这个是最常见的问题啊,新手习惯性的输入简短的关键词,希望 ai 能和谷歌一样啊,能和 google 一 样,能猜中他们的心思。 那么新手的写法是什么呢?就是一个非常简单的一个很概括笼统的一个提示词,比如说啊,市场营销策略啊,他心里想的是我要给什么什么方案做一个市场营销策略? 但是他问出来的问题可能就直接写一个市场营销策略,那么市场营销策略这里就会产生一个歧义,你究竟是想要了解市场营销策略,还是想要制作一个市场营销策略啊?那么这里就会出现一个问题, 这个问题指定太宽泛了,那么什么样的产品的市场营销目标客户是谁?预算是多少?营销渠道是什么? ai 完全不知道从何处着手,只能给一个最通用的,最空洞的 模板化的答案。那专家会怎么写呢?专家写的是,你现在是一名专业的市场营销总监,拥有十年的快销品行业经验。 请为一款面向 z 时代年轻人的新型气泡水制定一份上市初期的三个月的社交媒体营销策略啊。你看他说的非常具体啊,产品优势也讲了,是零卡零糖啊,添加了维生素 c 啊,包括整个的宣传预算为五万元啊,包括预算金额也限定了。 核心目标是什么呢?是提升品牌的知名度和初步用化的用户的转化啊。那么他的目标也很明确,我要提升品牌啊,我要让用户来买我的产品 啊。那么他最后的输出要求什么呢?是以表格的形式呈现啊,包含平台的选择,内容的主题,还有关键活动和预期的 kpi 啊,那写的是非常具体,我们来实战一下啊,看看两种的提示词,他会产生一个什么样的不同的结果啊。 首先我先复制一份啊,市场营销策略就是我们通常新手写的这种,在这里呢,我用了两个啊,就这个谷歌的 as studio 里边的三点二点五 pro 模型, 那么它是这个最新的模型,我下一节课会单独开一节课啊,在我们的第三节课,我会单独开一节课,给大家讲一下我们谷歌的 as do do, 好, 我们现在为了区分啊,我把它分成了一黑一白两个 颜色啊,这样我们就很很直观的就能看到啊,他到底是一个哪个是黑色?我是用一个新手的提示词,白色呢?我就用一个专业化一点的提示词,先跑一下,再把我们的专业提示词 复制一下,我们看一下两种方案他会产生什么样不一样的效果好?第一个提示词,市场营销策略啊,他的结果已经出来了啊,他说一个给了一个全面指南啊。第一部分策略制定的基础是什么? 我们就看框架就行了,制定市场策略的完整步骤,他这个整个就很明显了,他整个就是一个市场营销策略的一个教程,教你怎么去做市场营销策略。 但是这个对我们的任务来说有没有帮助呢?其实是没有帮助的,如果我们自己做还要 ai 干什么呢?我们是希望 ai 能够直出一个营销策略的方案,是吧?那么你看我们这这个专业话题词也出来了啊,这个就是说真正能用的专业话题词,那么你看他给的是什么呢? 首先人家给身份了,我是你们的市场营销总监,基于我过去十年在快销品行业的经验,我深知一个新品牌的上市,尤其是在激烈竞争的饮品市场,前三个月是黄金窗口期,他连这个都知道, 我们的目标用户是 z 时代啊,他们不相信权威。他还解释了一下什么是 z 时代,不相信权威,只相信体验和同类,不看广告,只看内容和分享啊,这叫 z 时代。 因此,我们的核心打法是什么?以真实内容为诱饵,以社交裂变为杠杆,以社群归属为护城河啊,人家写的非常明确啊,产品优势是什么?这个预算是多少?每一分钱都花在刀刃上啊,不能高举高打,必须精准渗透啊。他的策略非常的精准, 放弃昂贵的大 v, 聚焦于性价比极高的腰部和尾部,达人用海量真实体验去种草。那么我们来看一下他给的营销策略。 第一阶段啊,他是分阶段了啊,第一个月为第一阶段,核心是建立基础认知制造初期声量,主要平台是小红书作为主阵地,抖音作为辅阵地。你看,他的策略非常明确啊, 高颜值气泡水、神仙饮品、零卡路里视视觉吸引产品、高颜值静态图、开箱视频、创意场景图啊,如健身房、图书馆、办公桌。 而第二点,神秘感啊,猜猜这是什么神仙口味?终于等到你,我的无负担快乐水啊,这个广告词写的也都很到位啊, 然后还给出了关键活动预期 kpi, 也就是说,你要求的他全部都有啊,你要求什么,他就给什么。但是你需要提出一个精准的要求啊,精准的要求包括这个钱要怎么花啊?第一个月百人铺量啊,第二个月要不达人深度合作, 内容激励奖品,奖品是什么?付费网流量抖家推多少钱啊?预备金,还有应对突发情况有多少钱?你看人家这五万块钱怎么花都给你规划明白了, 在后面风险啊,应对啊,又出现这种风险,怎么应对啊?风险和应对也表述的很明确了, 总结啊,说小预算,大联一,不求一炮而红润,物细无声的渗透,呃,做成一种社交货币啊,一种健康生活方式的代表。而我觉得这个非常的具体啊,而且啊,很有可能性,所以说只要你提示词给的精准明确, 那么你就能够拿到一个你想要拿到的一个好的结果,你直接可以根据这个方案简单修改一下啊,就能够落地了。 所以说这就是一个详细具体的一个提示词的一个重要性啊,包括我的这个课程也是一样啊,它是包含了很多的影视专业知识的,如果说你不具备影视专业知识,你可能只能给出一个笼统的一个提示词, 但是如果你是有了相关的影视专业知识,你不一定非得说你变成一个大师级的这个技能, 你只需要了解他,知道怎么用啊,知道他这个事,你在提示词里写出来,你就能够得到一个专业化的结果啊。所以说大家,我们现在处于 ai 时代,我们学什么东西 并不需要那么极端的去深入精确啊,只需要我们有所了解,我们就能够达到一个优秀的满分,甚至是满分的一个答案啊。所以说专业知识啊,你可以不精通,但是你必须得懂啊,这就是新手和专业的一个区别。 我们再来看,再回到我们的提示词啊,那么看他的这个问题的分析,是啊,这个指令太宽泛了,我们这个提示词,第一个总结是什么?我们要写一个具体的指令啊,要越具体越好 啊。第二个呢,是指令模糊啊,那么我们看啊,比如说啊,新手写了一个,帮我写一个关于猫的有趣故事啊, 很多人他写,写故事的时候啊,想出一个剧情啊,比如给我写一个科幻故事,给我写一个武侠故事啊,给我写一个言情故事啊,这个还具体一点,他说帮你写个猫的有趣故事,那么这个有趣是怎么个有趣法?有趣就是一个非常主观的词, 那猫是什么样的猫啊?故事又发生在什么时候?读者是谁?是给谁看的?是给小孩看的,还是给成年人看的?讽刺小说,他都是不一样的。还是老规矩啊,我们还是实操一下,用我们的新手写法和我们的专业写法来对比一下他们之间的区别 好。还是啊,给一个提示,我们这里就重新啊,再来一个窗口,不然的话上下文可能会有影响啊。 重新拉一个窗口,在这里复制一下专家的提示词,同时跑一下。这个专家提示词是,请为八到十岁的儿童写一个短篇童话故事,大约八百字啊,这里限定了题材和字数。 故事的主角是一只名叫奥利奥的胆小黑猫啊,他的梦想是成为一名探险家。这个是故事的人物啊,第一个是限量题材和字数,第二条是故事和人物。故事主要围绕着奥利奥如何克服困难啊, 如何克服恐惧,在自家后院进行了一次伟大探险啊,什么探险呢?比如爬上一棵他从未爬过的树, 这里给了一个势利,当然他也可能写别的,并从中获得了自信。故事的风格要温馨幽默,充满想象力啊,这样就很具体了, 具体的人物啊,具体的这个事件,具体的主题啊,他全部都有,包括具体的风格啊,全都有, 最后还限定了题材和字数。那么我们看一下啊,这个其实啊,帮我写一个猫的有趣故事,看看他是怎么写的啊。米高侦探与失窃的金枪鱼罐头其实他这个写的看题目还可以啊。 在一条安静洒满阳光的小巷深处,住着一只名叫米高的猫啊,从外表看,和其他的猫没什么区别,是一只橘白相间的胖猫。屁生有三大追求,找到暖和的阳台,睡一个无人打扰的午觉,以及说服他的主人王奶奶。相信猫粮碗里永远是空的。 但米高有一个秘密身份,当夜幕降临,更准确的说,当重大案件发生时,就会化作米高侦探啊,其实他因为现在这 ai 非常强啊,如果你需要一个创意感比较强的啊,你也可以用一些 宽泛性的提示词,但是如果你有一个具体的需要需求的话,或者是你有一个具体的故事,一定要把这个故事具体的写出来啊,这样 ai 才能给你一个更好的答案啊。 这里边啊,我就不具体念了,我们看一下我们这个给了精准提示词的他回答了一个什么样的答案啊,那么胆小探险家奥利奥啊。在一座被花园环绕的可爱小房子里, 住着一只名叫奥利奥的黑猫,他的毛色黑的像没有月亮的午夜,唯有两只圆溜溜的大眼睛,在黑暗中像两枚闪闪发光的金币啊,他同样的啊,你看啊,一条安静洒满阳光的小巷深处,住着一只名叫米高的猫啊, 我觉得这个写的更好一点,奥利奥有一个大大的秘密梦想啊,他想成为一名伟大的探险家,就像他常常从小主人书房里偷看画册上的诗心往里奥一样,去征服高山,穿越丛林。 然而现实中的奥利奥有点胆小啊,一片突然飘落的树叶就会让他吓得炸毛,邻居家的小狗一声欢叫,能让他瞬间躲到沙发底下啊。这个我就不给大家仔细念了,但是大家可以看到他写的,无论是这个篇幅,你看这个,这个相对来说 怎么说,他相对来说是你想要的,虽然这个也不错,但,但是这个你可以看到他基本上是 ai 自由发挥了啊,他跟你是基本上没有什么关系啊, 他发挥的好与不好也不是很稳定的,你看他这里边还有第一步,第二步,第三步,这个感觉就是差点意思。我们再来看这个啊,他整个就是一个完完整整的啊,非常符合我们要求的一个故事啊, 包括还有对话旁白,全部都有啊,非常好啊。所以说我们还是说专业性的提示词是什么,其实简单说什么,专家写法没有那么复杂, 最简单的是什么?就是说你要把你的诉求,你想要什么明确的告诉 ai。 在 这里边啊,给大家分享一个小贴士吧,相当于很多同学,他可能写故事写不长,为什么呢?他写故事感觉平淡,为什么会平淡呢?因为这个故事他缺少矛盾和冲突。 这里我给大家总结了一点写故事的一些小技巧。那么写故事我们常见的啊,就是谁在哪干了什么事,谁在哪干什么事,这是个故事,那么你想让这个故事有冲突,有剧情,有意思,那么你还需要加什么啊? 他遇到了什么困难?他干这个事,他有没有遇到困难?遇到了困难,他怎么克服这个困难的? 在克服这个困难的过程中,又发生了什么意外啊?最后达成了什么目标,导致了什么样的结局啊?这么这是一个完整的故事闭环啊,那么你有了这个故事闭环之后,你就会发现你的故事会丰满很多,他遇到了困难,解决困难,这本身就能写很大一段。 在这个过程中又发生了什么意外啊?困难好容易克服了,又出现了一个意外,这个意外说白了就是反转啊,给他反转一下,改变了他的走向,达到了一个什么样的目标? 那么他达到这个目标是不是结局呢?并不是。那么结局又是什么样的啊?这样环环相扣,不断的有冲突,不断的有悬念,那么这个故事才有意思啊。 当然,这个不是说必须得这么干,这只是给大家一个思路。如果说你的故事比较平淡啊,不知道怎么让他出彩的话,可以用这个框架和结构,然后你哪怕是用让 ai 用这个结构来做,他也可能会得到一个很好的结果。这是老师的一个小贴士啊, 好,那么误区三啊。第三个常见的问题就是缺乏角色扮演啊,新手往往直接下载任务,而忽略给 ai 一个身份设定角色的回答质量设定角色就能提升回答的质量和专业的和专业度设定角色不同的角色,他给你的回答是不一样的。 首先啊,一个新手写经常容易出现什么呢?给我一些关于如何缓解工作压力的建议啊,我们还是老规矩实操一下啊。 比如说啊,这个人他工作特别有压力啊,我跟 ai 聊天,我想让 ai 帮我解决一下这个缓解压力的问题啊,我看 ai 怎么跟我说。 如果说我用一个专业式的提示词,方法啊,让请扮演一位资深的心理咨询师和职业规划师。我最近啊,交代你最近的背景啊,我最近感到工作压力巨大,是吧,咱先跑着啊, 我最近感觉工作压力巨大,主要为什么呢?主要来源于截止日期的压迫感,项目截止日期的压迫感和与同事的沟通不畅。请从心理学和行为学的角度为我提供五个具体的可操作的建议来帮助我管理压力和改善工作环境 啊,这个就非常具体了,非常具体,我们看一下啊,我直接给这一句话,好,你看啊,他还是 这个建议是什么呢?缓解压力的办法,他给的感觉像一个说明书啊,我们来看一下五个层面啊,及时缓解调整方法,改变思维模式,改善生活方式,寻求外部支持。第一,当压力来袭时,可以立刻尝试急救的方法。什么方法呢?你练习深呼吸,离开工作岗位 啊,正念时刻啊,集中无感,听一首放松的音乐啊,这完全就是个说明书啊,是吧,你看这个,你写的很清楚,给了身份的提示,他是怎么跟你说的啊? 你看好的,非常理解您现在的感受,工作压力,尤其是源于人和事的双重挤压,确实会让人身心疲惫。 作为您的心理咨询师和职业规划师,我将从心理学和行为学的角度为您提供五个具体可操作的建议,希望能像一套工具箱,帮助你一步一步拆解压力,改善现状啊!我们来看一下他的第一个建议啊,那么他的建议是什么?第一个核心理念,压力是 压力的根源,是失控感。当一个巨大的任务摆在你面前时,我们的大脑将会视为一个模糊而庞大的威胁,从而引发焦虑。行为心理学告诉我们,将一个大目标分解成一系列清晰可执行的小任务,可以极大的提升我们的掌控感,降低焦虑啊。 具体操作是什么呢?吞青蛙和切香肠集合啊,每天开始先识别出最重要不想做的一项任务啊,这就是青蛙啊,利用精力最充沛的时段,先处理他,怎么样是吧?他首先啊,给了一段啊,非常重肯的啊,一个疏导心理的一个过程啊, 再给针对性的意见,他给的就相对专业很多了,你看,深呼吸,离开工位啊,闭上眼睛听首歌,但是人家就很专业,你 先优先处理最难完成的工作,把整个项目给他切开,像切切香肠一样,切成任务片。一个项目啊,分解为什么什么什么 制作时间表,格式化进度啊,这个是非常专业有效的啊。那么沟通升级,引入非暴力式沟通啊,针对沟通不畅,他每一个问题都给出了非常专业化的建议, 预期效果包括生理调节,压力中断的微习惯。但是人家这个呼吸法,你看他这个是深呼吸练习,四七八呼吸法其实是一样的啊,用鼻子慢慢吸四秒,屏住呼吸七秒,嘴巴呼吸八秒,重复三到五次,是吧? 这个他是怎么写的?当感到压力陡增,心跳加速时,立刻停下手中的事,用鼻子呼吸四秒,然后冲三到五次一样的过程。这个简单的生理干预,迅速激活副交感神经系统,让你平静下来。他有一个番茄工作法,但是这里没有是吧? 战略休息,被动接受到主动管理的综合应对。其实大家可以看到啊,他的建议专业性啊,是比没有这个的感觉啊, 专业性要好的多,你看起来看起来也舒服很多啊,他不会机械性的给你一个说明书啊,他直接会,你看,他会先安抚你一下,安抚你一下,这就是专业人士他的不同的能力啊。 好,那么我们再来看下一个啊。第四个常见问题就是一问一答的僵化思维,而非持续对话啊。新手的做法是啊,写一首关于夏天的诗啊,得到的结果不满意,直接关闭窗口,打开新的窗口,写一首五言绝句,关于夏天, 这个我就不给大家做演示了啊,这个是大家经常干的事,有的时候我也这么干,是吧?但是一个好的内容,他一定是不断迭代出来的,也就是说,你通过一个提示词不断的迭代给他记,在这个提示词进行微调的过程中,他面面慢慢的就变得完美, 这是一个迭代的问题,所以说大家一定要学会迭代,不要总是说开新窗口,开新窗口你可能是你做了 五步啊,五步五步都不满意啊,实在是不行了,就说怎么调也调不过来了啊,五步十步实在调不过来了,那么你开个新窗口,如果说他第一步写的不是那么离谱啊,不是那么完全不合你意,那么你就给他微调一下,可能会出现一个更好的效果,因为他是结合上下纹的。 那么第五个常见错误呢,就是信息混乱,缺乏结构啊,当你需要用 ai 去处理复杂信息的时候呢,新手就是直接把所有信息扔给 ai 啊,就像乱麻一样啊,比如说这是我的会议记录啊,巴拉巴拉一大堆啊,总帮我总结一下,然后写一封邮件给老板,重点是下一步计划。 其实 ai 和人一样啊,很多时候对于杂乱无章的文字,他可能识别无力啊,但是如果你给他一个非常好的框架的结构,那么他就识别的非常轻松。 那么这里呢,这个有一个专家写法,是使用的 markdown 标记语言, markdown 是 一种格式啊,这里我给大家一个 markdown 格式讲解啊,我会专门拿出一节课来给大家讲讲 markdown 怎么用, markdown 如何结合非书来使用啊, 这个是 markdown 的 一个讲解啊,这节课我先不讲啊,我们留着下节课讲啊。那么这里呢, markdown 格式,它 ai 给的是这样的,那么你是一个高校行政助理,根据习下会议记录,完成两项任务, 那么 markdown 格式是什么意思呢?它这里边有一标题,二级标题有加粗文字啊,这样的话,你看有一级结构,二级结构,看 一级结构,二级结构,这样的话 ai 能够精准识别啊,这个大家了解就可以啊,因为我现在如果说直接讲 markdown, 这个时间会太长啊,时间关系, markdown, 我 单独拿一节课来编写,然后如何复制 markdown 格式啊。 那么常见的第六个误区是过分依赖主观和情感化的词汇啊,很多新手喜欢写啊。给我一张图啊,我要一个非常有未来感,要这种赛博朋克的感觉, 要震撼一点啊。问题来了,未来感是什么感?赛博朋克啊,这个他到底是什么啊? 有的时候他会感觉很很主观啊,他可能 get 不 到这个点啊,比如说震撼呐,炫酷啊这类的。有的模型他可能是可以识别的,但是有的模型他没有那么高的智能,就识别不了,而且就算识别识别能够识别,那么模型他的理解 未来赶赛博朋克,震撼和你的理解是否是一样的啊?他还有可能有一定的区别,所以说有的时候你需要 测一下,或者是你给一个更加具体详细的一个提示词,我们两张提示词,我们来生一个图看看啊,我们直接用这种两种提示词生图,我们看看是什么效果。用一个啊, 我用最简单的,用吉梦吧,吉梦大家都有,就用这个生图,相对来说直观一点。首先我来复制一下这个,给我一张图啊,赛博朋克点的那种啊,看看他能给出个啥, 再用这个数字画风格啊,看看他能给个啥。好,第一个出来了,给我一张图,非常有未来感的城市,要那种塞坡朋克的感觉震撼一点啊。 其实这个图也还行啊,感觉也还行,我们再看一下这个,刚才啊,比较具体点的啊, 给我一张数字艺术风格图片,一座未来主义大都市夜景采用了赛博朋克美学,画面中高楼大厦高耸入云,楼体遍布全息广告和霓虹灯,天空下着小雨,地面反射出五彩斑斓的灯光,空中多层交通轨道飞行的汽车穿梭期间, 主色调为深蓝、紫色和洋红色,镜头视角为广角,营造出宏大壮观的视觉冲击力啊,非常有未来感的城市啊,有那种赛博朋克感觉震撼一点的。那怎么下边还有这个?我可能是复制多了啊, 这个这个其实大家会看到啊,我们可以看这个缩略图啊, 你会发现第一组他的色调其实是不一样的,你看,尤其到第三张这个色调啊,就已经变了,下边这个色调完全是统一的,因为你给了主色调为深蓝色、紫色和洋红色,那在精准的控制上啊,他一定是下边这个更好的 啊,因为你给的提示词足够精确,他的色调一致性啊,包括他的主体,包括他的飞车什么的,他都控制的很好啊, 所以说这个就是这个详细和具体后,那同学就说,老师,一致性怎么控制一致性?人物一致性也好,场景一式一致性也好,色彩一致性也好,他都可以通过提示词来控制。 那么你没控制好是什么原因呢?其实你没控制好就是因为你的 t 值词给的不够具体和细致,你可能直接给,比如说控制人物一致性的时候,你会说这个人物你给的服装是什么,你给。比如说他穿了一件白色上衣, 白色上衣有很多呀,他是 t 恤啊,是外套啊,他还是内搭呀?他白色你只给了颜色,只给了上衣袖啊,是长袖啊还是背心啊? 你什么都没说,那么他就有可能都出来。那比如说人物发型,你描述黑色短发,具体吗?不够具体,短发有很多呀,寸头是不是短发啊?分头是不是短发? 其实尤其是这个 ai, 他 对于发型的定义哈,只要你没有到期间的部分,他都算短发,尤其是女生,你给他出个短发,其实他这个头发感觉一点也不短。 所以说短发短到什么程度,你要具体到到底是一个什么发型是吧?什么样的黑色是吧?你甚至可以什么调染黑色,他也是黑色啊,黑色带一缕调染,这样你的人物的标签就出来了 啊,一看他就跟别人不一样,一眼看到,即使有些许区别,你也能认出就是这个人,这样你人物一致性就有了。同理啊,场景也是一样,如果你场景你的色彩都跳了,那么你这个场景他一定是维持不了一致性的。首先你要确定画风不能跳,色调不能跳, 才是说场景人物特色不能跳,这样整体的场景也好,人物也好,他的一致性就抓住了啊。所以说抓人物一致性啊,最最重要的是你的提示词一致性,你的提示词写的具体,而且是固定的一样的啊,那么你的特征基本就可以完全抓住啊。 好,那么我们再来看第七个常见问题啊,就是忽略了对格式的要求,你要告诉 ai 他 们用要以什么样的形式来呈现啊,比如说啊,这个新手写的就是比较 iphone 十五和三星 s 二十三的优缺点啊, 你如果说想要一个详细的比较,我给大家来测一下,我们看一下第一个比较优缺点,重新开啊,不然会受上下文干扰的,因为他不是一个主题了, 一会看一下结果,哪个结果更直观啊,看一下哪个结果更直观,大家看一下啊,很明显就看出来了, 这个输出你看就是竖着的啊,看起来就是正常的一个文案的感觉, 但是你看这里,它就给了一个表格的感觉啊,因为我这是给它缩放了啊,如果你给它拉开全屏的话,它会非常直观。特性优点缺点啊,它就是以表格的形式给你呈现的啊,这个 markdown 的 表格看起来非常直观啊, 所以说你一定要注意输出格式,不同的输出格式,如果你需要表格的话,一定要告诉 ai 用表格或者用 markdown 的 格式,然后来输出 第八个啊,也是这个最后一个新手啊,常见误区啊,就是对 ai 抱有不切实际的幻想啊, 很多人就认为 ai 就是 全知全能啊,他能读懂我心思啊,能百分百原创出来这个不存在的,精准无比的数据,这是不可能的啊。 譬如说啊,你给我预测一下明年公司股股票走势,有很多人说这个用 ai 来预测的,但是人家的预测 他是基于一个大的数据库来预测啊,不是说空口白牙,你给我预测一下,那谁也没有那个能力,而且很多时候他没有实时联网的能力啊,现在有了,以前可能是很多模型都没有,现在都有了, 他会告诉你他做不到,或者是给你一个免责声明。如果说我们调整一下思维啊,其实就能做了,比如说你直接做,你又没有具体数据,你还让他预测,他可能预测不了那么准,他可能就糊弄你。但是如果说你给他一个专业化的提示词,你看,请扮演一名金融分析师,基于 这个公司过去三年的公开财报,看到没有,有数据啊,一定要有数据支撑,没有数据支撑他是没办法预测的啊, 有数据支撑他就不一样了。然后分析影响股价的因素有哪些,并从乐观、中性、悲观三个角度分别构建情景分析。这个我就不给大家来进行一个对比展示了,这个很明显啊,一眼就能看出来的。 你只需要记记住一个问题,但凡是需要预测的,它必须得有一个关键的一个数据库啊,没有数据库是没办法进行预测的。你直接告诉 ai 说啊,给我写一篇啊,能够一年挣十亿的文章啊,干不出来 的。 ai, 它不是许愿池里的王八啊,就是说你说我许个愿吗?那不可能,那实现不了,它只是一个工具。但是如果你会写提示词,你可以让它用通过其他的渠道来帮你实现愿望啊,所以说提示词非常重要,会提示词和不会提示词完全是两个概念啊。 这个不管是 ai 生生成视频也好,其实最最核心的是提示词的拣写,不管是哪一步,从剧本生成 啊,到你的图片生成,到你的运境,步步离不开提示词,那么最早最跟上的剧本,一个剧本的好赖好坏,直接决定你成篇的好坏,所以说剧本是最最重要的一个核心。想把剧本写好, 你写提示词的一个方式,那就是一个重中之重啊,所以说大家一定要通过这一些的啊,错的认知来改善自己写提示词的方式啊,把能够让你自己和 ai 进行一个流畅的沟通 总结一下啊。这节课我们学的是什么?从新手到专家的思维转变有哪几个方面啊?第一个是从模糊到精准啊,把写个故事变成为谁写,写什么什么风格啊,从命令到赋能啊,把告诉我变成你现在是专家,请你分析, 从单词到迭代啊,把不行变成很好,在这里修改一下,从混乱到有序啊,标题、列表,分割符啊都做好,这样 ai 能更精准的识别,从抽象到具体,把你主观感受啊,具体到一个能够描述出来的,让 ai 能够理解的一个句子。 掌握了这些,你就相当于学会了如何和 ai 高效沟通啊,你的潜力和 ai 的 潜力才能共同的被激发激发出来。你和 ai 其实是一个合作者的关系, 他可以当做是你的合作者,也可以当做是你的下属,你包括和人沟通也是一样,当我们掌握了这些沟通技巧啊,那么我们就能够很快的变成一个题之词。高手。好,这节课就先上到这里,我们下节课再见!大家好,我是老陈, 这节课我们来看一下我们 ai 纹身图中我们常见的提示词错误。呃,第一个呢,很多同学啊,往往犯一个错误是什么呢?就是你把 ai 当成了能够读懂你心思的神笔马良, 而不是一个需要精确指令的超级画师啊。我把这两句话啊,当成了一个,做了一个高亮啊,大家一定要重点关注这两句话, 你一定要给他精确的指令,而不是说直接很笼统的告诉他画一个什么什么东西啊。那么这位画师虽然记忆高超,能画任何风格啊,但他没有任何的主观想法, 你说的每一个字都是他下笔的依据啊。下面有六大误区,我们一起来看一下。那么第一个误区呢,就是描述过于空洞啊,把 ai 当成了神仙啊,这是最普遍的问题, 新手往往给出一个模糊的概念啊,希望 ai 能够猜中自己脑海里完美的画面啊。比如说啊,一个新手去写一个其实词,一幅漂亮的风景画, 它能不能做一个比较好的图片?能啊,现在的模型很强,它能做一个比较好的图片,但是它的画风不可控,它可能做成什么样的都有,它未必是你想象的那种方式。比如说啊, 你先做一个看看一幅漂亮的风景画,那么他的问题是什么?漂亮的标准是什么?是哪里的风景?是山?是海?是白天?是黑夜?他完全不知道啊,他只能生成一张最大众化,最平庸的风景图,可能跟你想象的不一样啊 啊,我们来看一下啊,风景画,油画,这是不是风景画也是啊,他出的大多是油画风格啊,但是这个是你想要的吗?未必,你不一定想要一个油画,那么我们来看一看精准的题词词要怎么写啊? 那么我们这里也是一个油画啊,要一个阿尔卑斯山日落的景象是怎么样的?看啊,一副印象派油画,描写了瑞士阿尔卑斯山的日落场景, 前景是开满黄色和紫色野花的草地,远处是白雪皑皑的山峰,夕阳的余晖将天空染成温暖的橙色和粉色, 光线柔和,笔触明显。我们直接跑一下试试这个改一下这个 mg 米的詹妮,他对于格式的要求是比较严格的啊,如果你前面加了一个无意义的符号,他也不给你升图。这个是简单提示词生成的啊,这四幅画只能说还可以啊, 这个是按照要求的啊,就是具体的提示词生成的啊,这个有话他的色彩啊,他的近景远景都有明确的规划啊。印象画派,这个还是有明显区别的,你会发现这四张图片其实是比较相近的,尤其是色调都很相近。但是这四张图片什么都有啊,这是因为他啊, 更具体规定了是什么色调。那么你看,印象画派规定了画风,印象画派规定了画风,阿尔卑斯山入日落景象啊,这里规定了主体 前景是什么,远处是什么,什么样的色彩,什么样的光线啊,他写的很明确,所以说他出来的结果就更准确。 第二个误区是滥用主观词而非客观描述啊。新手喜欢用炫酷、震撼、有感觉这类的词,但是 ai 不好理解,你要给它翻译成画面。比如说一个非常酷的机器人,我们来跑一下试试非常酷的机器人, 那么酷的定义千差万别,是苹果公司那种简洁的酷,还是赛博朋克二零零七,二零七七那种杂乱的酷? ai 只能随便猜一个,那么专家的写法是把它拆解成具体特征啊,什么样是酷?一个未来主义的机器人啊,加个未来主义, 全身覆盖着色,哑光,哑光,黑色的装甲,你看,说的很详细。关节处怎么样?有轻微的磨损和划痕?蓝色的 led 光从眼部和胸甲的缝隙中透出。 造型参考了日本机甲啊,这个什么 mycha 的 风格,背景是废弃的工业城市啊。这个就是具体且详细的一个题词,你会看到这个题词风格,机器人是有,但是风格各式各样,什么样的都有,他完全不可控。 那么我们再来看一下这个题词做出来的机器人是什么样?这个机器人其实你单看还可以,但是他不可控,他每一个都不一样,你看这个差距天天差地别,这个差别太大了。 但是你看这一组他的机器人是不是长长相风格就很像?他风格很像,虽然也有不同的地方,但是他风格很像, 这样的话,你就很容易选出来一个你想要的东西啊。这个机架其实还是挺逼真的啊,划痕有,黑色哑光有是吧?这种机架你觉得不满意可以再抽一个, 这样就越来越接近你的目标。关键问题是他准确且具体,他更可控。如果我们也可以对比下吉梦啊,吉梦他对于提置词的响应度是优于 mg 的, 但是他的画风,他的画风是和 mg 有 差距的啊,各有优缺点吧。我们来看一下吉梦啊, 吉梦的三点一模型还没有出,估计快了。我们来看一下一个非常酷的机器人, 再来给一个未来主义机器人啊,我们接着往下看,那么将专家写法,将酷这个感觉翻译成了材质、细节、光效、风格、参考 环境一系列的客观视觉元素。其实这里边啊,他写的有些地方还是不够详尽啊,有一些,比如说你希望这个机甲加一些特色, 反正是如果说你想让它有些特色的话,你要再加一些提示词啊,大家注意。为什么要学?如果说 ai 生成提示词可可不可以用呢?是可以用的, 但是为什么要学它的写法呢?是因为我们有的时候是需要修改 ai 生成的提示词的,比如说它设计的东西我不满意,我想添加一点,我怎么加是吧,我加在哪?这些还是要懂的, 你看这里出来的机器人啊,这个简单写法,一个非常酷的机器人是很酷啊,但是啊,什么样都有,这个酷他没有办法感觉出来到底酷在哪。但是你看下一个具体提示词写出来的这个很酷的机器人啊,你看哑光的铠甲,掉漆啊,略微有划痕的关节的地方啊,它都体现出来了, 你看这个机器人就一样了啊,基本上是一模一样的,是吧,在这个极梦里边,他的一致性是很强的啊,像这种的用极梦做肯定是更好的一个方式。第三个误区啊,说只说画什么,不说怎么画啊,新手往往关注画面里的内容, 而忽略了决定画的最终呈现效果形成的眉界和风格。风格其实很重要的一个东西啊,有的时候如果你不加风格的话,尤其是 mg, 他 会不断的跳啊,他会非常容易跳。风格, 比如说一只猫啊,你要分析一下他没有的东西,说他只只说一只猫,但是这是什么猫?他是一张照片,还是一幅油画,还是一幅素描,还是一个三 d 模型? 这个默认风格他未必是你想要的。那么我们用一只猫来生成一下,用一只猫来生成一只猫,再对比我们的专业写法专家写法提示词, 我们来看看是什么猫,看不同风格的提示词是是什么效果好,我们来看一下啊,一只猫啊,他给了是一个啊, 比较写实的一只猫,其实这个一只猫他出的效果还挺好,但是他的风格可能不是你想要的,那么我们要一个水彩画风,看看一只猫,水彩的猫,你看这个画风就很统一啊,第一个画风统一,第二个他有画风的情况下,他是另外一种风格,看起来非常舒服啊。 第三个,一个是专业摄影,这是一个暹罗猫啊,他的蓝色眼睛,背景是纯黑的布偶猫,布偶猫感觉不太对啊,他可能是对于这个布偶猫他识别的不好,那么我尝试一下把这个题词放在 mg 里边, 很每个模型其实他是不一样的啊,每个模型他的训练素材什么的,他都不一样,我们来 mg 看一下啊, mg, 看看他对于这个猫的品种有没有训练,不对,还是有横杠。这里边这个无需符号,他起了一个反作用, 先给他删除一下。好,我们来继续看啊,给他翻译,这个 mg 必须得翻译,如果你不翻译的话,输出中文的话,他可能也是会出问题的啊, 也是这样啊,可能是这种猫就是布偶猫,可能是我对猫的品种不太了解啊,我印象中的布偶猫应该脸不应该是黑的啊,我印象中暹罗猫脸才是黑的。这个吉梦出的和 mg 出的都差不多啊, 你看小黑脸猫,这个感觉不像是布偶啊,这个还像布偶一些。会不会是提示词的问题,看一眼啊,背景是纯黑的,这个也有一个可能,就是他的背景是纯黑色的,他这个没有标明这个毛发, 没有标明毛发,我们来看一下这个白色,白色毛发,他可能是背景污染到前面的提示词了, 我们再来看一下,所以说提示词有的时候你不给准确了,他就会出现问题,他应该不是训练模型的问题,应该是黑色的背景,这个提示词污染到了猫的毛发,所以说我们给到一个啊,白色毛发, 这样的布偶猫就是 ok 的 了,对不对?这样才是 ok 的 了。所以说我们要确定猫的毛发颜色啊,这个还是不太好的啊, 但是已经有 ok 的 了,这就够了啊,那么这个就说明了这个风格的一个重要性啊,很多时候你不给风格的话,这个风格就会乱跳啊,什么样风格都有,尤其是 mg 这个 mid journey, 非常容易出现这种情况啊,大家一定不要忘记用 mg 的 时候要给风格。 那么第四个问题是缺乏构图和镜头感,新手呢,常常忘记自己的导演身份啊,没有告诉 ai 摄像机在哪里啊,也就是说你这个图片的构图,这个摄像机的机位啊,这个都没有啊,所以说导致画面主体不突出或者视角很奇怪。 比如说啊,站在森林里的女孩,他默认情况下一般是比较容易给一个一个正视角的,一个比较简单的一个构图啊,默认的构图不会太突出, 他可能给一个中距离啊,尤其是这个吉梦啊,他容易给中距离,这个米德里,可能他的这个还丰富一点啊,但是我们如果给到一个非常啊,具体的我们再看一下啊, 你看这里边啊,就是一个平平无奇的图片啊,非常的平平无奇,画风也没有控制啊,什么画风都有,那么我们看这个是不是就差不多了啊,全身像穿着红色斗篷的小女孩,背后视角拍摄,独自站在 深幽长满苔藓的魔法森林中,广角镜头,阳光从茂密的树冠缝隙中投下几缕光束,耶稣光,营造出神秘的氛围,你会发现啊,他当你的提示词精准, ai 给你的图片,它的相似度是很高的啊,因为它没有什么发挥的空间,你给了它精准的提示词,它就没有特别大的发挥空间了,它只能按照你说的来。这个就是能够控制图片的一种方式。 所以说很多同学说,老师,我图片控制不了,怎么控?我必须得用这个 openpos, 我 必须得用 controlnet。 为什么?因为你的提示词写的不够细致啊,不够细致和具体,你就只能用那种方式 好,所以说这个里边写法他用了全身像,从背后拍摄广角镜头,这些都是摄影术语啊,这样就可以像导演一样指导 ai 如何构图和取景,让画面有了故事感和冲击力啊。 那么第五个问题呢,就是元素堆砌主次不分啊,有的时候新手会贪心啊,把许多喜欢的东西都放在一个图, 结果 ai 没办法理解他的主体,就会生成一张杂乱的大杂烩啊。比如说一个宇航员啊,火在火星上骑着马,旁边有一只狗,天上还有飞碟和地球,正在喝咖啡,其实他的元素是很多的,但是这个元素怎么安排, 这个元素怎么安排,谁和谁在一起啊,他都不知道,那么他出来的东西性就很强,随机性非常强。 如果说我们不想要那么强的随机性,而且要构图更好啊,很很舒服啊,那么我们可以用专家的写法,比如说一张有故事感的画面。第一个要确定这是一个什么样的画面,有故事感的画面啊,突出故事感。宇航员孤独的站在火星红色沙漠上, 他正在抚摸他的同伴,一直穿着宇航员制服的金色巡回犬,远处是火星凄凉的地平线地,你看他有远处,他会给你安排哪在哪,他谁抚摸着这个金色巡回犬,也确定了主体和狗的位置, 地球在哪呢?在挂在漆黑的天空中,他把的东西所有的元素都安排了位置,还给出了画面构图简洁,突出了孤独和伙伴情谊的主题。 画面的感情啊,是吧,给到了构图啊,所以说有取有舍啊,这样提炼出来的细节,我们再来看一下它的区别啊,上面的是最开始的新手同学给提示词啊, 地球有没有?有啊,飞碟飞碟,飞碟有没有?有啊,狗有没有也有,马也有,喝咖啡也有。其实他的元素是给到到位的啊,都给到位的,你看,但是这块你看,你可以看到啊,这个狗在哪,狗站在马背上,这就不合理了,为什么?因为这个狗你没明确他在哪啊,所以说他就上, 什么样都有,他什么情况都可能出现啊,当然对的情况也可能出现,不对的情况也可能出现,你想能够准确的生成啊,那么我们再看这个,你会看到哈 这个提示词啊,这个地球狗和宇航员的交互啊,狗穿着宇航服,地球像一颗蓝色的星星啊,这块给的不太好,地球像蓝色的星星, 他给了地球和星星的一个结合,这里可能是他智能化的问题,但是这个宇航员和狗都给的不错啊,这个图其实非常好的啊,这个图其实啊,完全满足需要的星星,他没有做的那么突出啊, 还是比较智能的啊。这个也不错啊,这两张图非常棒,他比全前面这个图要好多了啊。前面这个图你能看出来就是简单的堆砌,虽然说元素都给了飞碟啊,对不对?你的飞碟也比较假, 飞碟也比较假,是吧,所以说元素的堆砌他真就不如像这种啊,这种故事性的,看这个图出的啊,非常棒, 富有故事感的画面啊,画面结构,构图简洁啊,突出情义,完全做到非常好啊。再下面啊,就是这个方式啊,我再多一句嘴,就是他要懂得取舍,将核心故事提炼出来, 不是盲目的堆砌。这个比如说火星骑马呀,表面上看非常有创意,但是他的核心故事没有重点,也没有,那么核心故事是什么呢?宇航员和他的狗 这两个才是主体,他在火星围绕着这个来添加细节,先有主体再添加细节,而不是所有的一股脑的就放上边是吧?又是骑马呀,又是飞碟,又是地球,这样造成一个图片混乱啊。 然后你围绕着主题添加细节,才能使画面的主题更鲜明。所以说这是一种写提示词的方式,然后你先给出主题,然后你再围绕着主题添加周围有什么细节。 那么第六个误区呢?这个反向提示词呢?一般常用于这个 sd 啊, stable diffusion 啊,它这里边是常常需要反向提示词的, 我们这个反向提示词一般情况下是不需要的。如果说出现了这些什么多余的手指,丑陋、模糊、画质差、水印,签名文字乱七八糟的,我们可以修改啊,或者是一是可以修改, 二是我们也可以把它进行一个重新生成啊。没有必要像这个 stability fusion 那 样一点一点地去做反向提示词,因为它出现这种情况的概率不多啊,因为这种闭源模型,它的一个是质量高,像素高啊,它有足够的空间去画它。出现这种情况很少,我只能说出现这种情况很少。 如果你是用这个 sd 一 点五或者是 x s l 模型的,你可能就需要写一些反向提示词,如果你忘记的话,它就可能会出现一些不适当的东西。当然,如果你用 flex 也是完全没有必要的啊。 那么这里边给到新手的建议是什么呢?首先我们要从感觉改到描述啊,你比如说我有一个感觉,我要先思考一下怎么把我这个感觉描述出来啊, 要把你脑海中的美呀,酷啊,翻译成具体的形状,颜色,材质,光线,用这几个方面去分析 啊,把它翻译成一个具体的具象化的东西, ai 才能精准的给到你的画面啊。第二,要有导演思维,你要把自己定位成一个导演,那么你要想好我的摄像机在哪,我用什么样的景别,是远景啊,是近景啊,是仰视啊,还是俯视啊,把这个 导演需要干的活,他的构图啊,景别呀,细致的安排好,要指定风格,指定风格是很重要的,你要决定是照片,是油画,是水彩还是动漫 啊,这个画面的基调。如果你跳了啊,那么你整个的生成的视频就会感觉非常的不连贯,感觉像 ppt 一 样啊,一看拼接感太重,如果是你风格非常一致的话,那么观众的沉浸式就更强。 第四个建议是学会排除啊,你要使用反向提示词,告诉你不要什么啊,刚才的反向提示词,反正是这几个方面。主要是这几个方面嘛,一定要分清主次啊,不能主次不分啊, 一个核心原则是什么呢?写提示词的过程就是将脑海中的模糊想象啊,一步步翻译成 ai 能听懂的, 能精确施工的一个图纸啊,我们一定要多练习,一定要多练习,测试不同的提示词会产生什么样的效果啊,最后能够实现你想指哪打哪的这样一个感觉。 行,这一节课呢,我们就讲到这啊,我们下节课再见。大家好,我是老程,这节课我们主要讲视频生成的动态效果和常见错误。 首先呢, ai 图声视频啊, ai 视频生成是一个令人兴奋的新领域,但也带来了新的挑战。新手往往会错误的认为, ai 能够像一位经验丰富的动画师一样,自动理解图片内容,并且创造出合乎逻辑、富有美感的动态效果。 事实上啊,当前的 ai 更像一个听指令的魔法师,你给他一张静态的画,他能让画活过来,但你必须用精准的咒语或者提示词告诉他如何活,哪里活,否则这个魔法就会失控,产生各种各样奇怪甚至恐怖的效果 啊。所以说,我们在生成视频的过程中常见的一些错误,今天来给大家分享一下。首先就是没有动词指令,希望 ai 脑补。 这个是一个最根本也是常见的错误啊,通常你只传了一张图,然后在这个提示词框里描述了图片的内容,而没有给任何关于运动的指令啊。比如说,你上传一张图片,一张女孩站在海边的图片,女孩站在海边, 该收到了这个描述,但是你只是一个描述,你没有告诉这个图要怎么动。所以说他可能随机动,或者是可能这个啊,小小的微动或者是不动,他可能也能出一个合乎你要求的动态素材,但也可能他完全不可不可控。你需要靠抽卡, 这个为什么有的人需要抽卡,有的人抽的就很少。那么如果我们正确的写写这个提示词应该怎么写? 那么我同样是上传女孩在海边拍照专家提示词啊,就是啊,海浪轻轻拍打着沙滩,女孩的头发和裙摆在海风中微微飘动,天空的云彩也缓慢移动啊,是吧?那么你需要这个图片,我们需要一个图片,我们来看一下,之前我做了一个, 我重新做一个吧,一个女孩站在海边的照片啊,一个女孩站在,女孩站在在海边的照片。远处啊,晴朗的天空,远 天空,远处有白云。好,那么我们来看看效果啊,我必须加一个远处有白云,不然那个云就动不了了啊,所以说这里面必须得有云的素材,我们做动态,一个是女孩站在海边啊, 我们来看看他的动态啊,我又做视频生成了啊,这是一个视频,我们先做图片,刚才做错了,使用提示词啊,图片生成啊,女孩站在海边,远处有白云。好,我们拿它生成视频,我们就就直接用原来的提示词,我们来跑一个啊, 描述图像跑一个,我们再用我们的专专家级提示词跑一个,这个也跑一个,一会我们看一看他们的对比效果啊, 那么它的核心解决方案是什么?一个是提示词的重心必须从是什么转向在干什么,明确指出画面中哪些元素应该动,以及它们怎么动,给 ai 一个明确的执行方向。那么以前我们就是说 做图的时候, ai 升图的时候,我们的提示词重点要描述的是画面里是什么啊。但是如果我们做这个视频生成的提示词的时候,我们要重点讲 这个画面里的动态是什么,主体怎么动,背景怎么动,细节怎么动,哪里怎么动啊?要描述他的动态,这个很重要, 我们看一下对比啊。第一个女孩站在海边啊,这个云是不动的,人物的头动了一点,头发没有动,裙摆动了一点,海浪没有动,他是他 ai 理解,就是说他觉得哪里该动,他就动一下,你给精准提示之后啊,你看他的云是有动态的,头发是有动态的, 群白也是有动态的,海浪也是有动态的,也就是说你需要它动的地方,它全都在动啊,这样呢,它就能生成一个更加合理的一个动态的方式啊,你的要求它都会精准实现, 这样你的视频就有了可控性啊。很多同学说,如果视频控制不住你,提示词都没没有讲具体,那他一定是控制不住的。所以说详细具体的提示词,不光是声图有必要,你做动态视频一样有必要啊。第二个误区是什么呢?是运动指令模糊,缺乏细节。 那么这个就比第一个错误要好一些啊,新手给一些提示词,但是这个提示词过于笼统,缺乏具体的方向、速度、幅度的描述。 比如说啊,一张城市街道夜景图,有汽车和行人,那么汽车在动,行人在走,这个就太模糊了,有动有走,汽车是向前开还是向后退,向左右横跳还是怎么样?还是行人闲散漫步还是匆忙奔跑? ai 只能随机猜测, 也可能生成的汽车会原地鬼畜般的抖动。如果说你这个,我们直接啊,这个是上传图片,我们可以先升个图看看啊, 有汽车和行人,那么我们有汽车和行人,就主体是汽车,我们只能选一个主体啊,一辆汽车啊,从街道驶接到中间驶过, 行啊,周围啊,人行道有行人行走,我们先看看效果啊,这个是图片复制到图片生成,我们再用这个。汽车在动人,行人在走,我们来看看它的效果,就给这个吧,我们用它生成视频, 没了呢,汽车在动,行人在走,我们升一下试试。同样的是我们形容词给一个红色汽车啊,这个红色汽车就不要了,因为刚才出的图他不是红色汽车,我忘了给颜色了 啊,我们就直接汽车,呃,从左,汽车从左到右,汽车从左向右匀速行驶,那他这个趋向不是从左向右的,如果你给从左向右,可能会起到一个反效果啊, 他这个提示词他有点吃图,你的图像和提示词得需要匹配,那么我得重新生成一个图。 其实这个这个还可以啊,汽车在动,人在走也能用啊,他只不过没那么精准。像这种提示词他常见于什么呢?这种提示词常见于直接不?不用参考图,直接的纹身视频啊,或者是你给一个街街景啊,没有车的这种, 我重新上一个图吧。夜景就直接是街道夜景图,城市街道夜景图给一个平视视角,你看这个就是俯视视角了,他不太合理。这个也是,其实这个还凑合吧,我想要一个横向穿梭的一个街道,这个街道都是纵向的, 看看能不能出来一个横向的,他要从左到右的,最好是一个横向的平视视角啊,城市到夜景,汽车在 在左右方向的街道上行驶。我尝试一下米德哲尼啊,因为这个吉梦他出的这个街道的朝向过于统一了啊。换一个模型试试。平时视角看到汽车的侧面。 好,我们来做一下,好不纠结了啊,那么就直接给大家做一个纹身图吧。视频,他这个纹身他写的这么详细,可以直接作为纹身视频来用了啊,直接做 纹身视频,一辆红色汽车从左向右匀速行驶,穿过画面,背景中行人悠闲的向前走,他全部都是动态。大家看啊,全部都是动态的一个动作,远处的霓虹灯招牌在缓慢的闪烁,镜头慢慢向前推进,他全部都是一个动态的一个动作啊,这个还是图声视频了, 这里其实他还是给了一辆车啊,红色的汽车,从左向右看,他也给出来了,这个红色的汽车出现了,从左向右穿过画面啊,背景中的行人向前走动,我们上一个图,他就没有这个红色的汽车,看到没有,这个红色的汽车他就出现了啊,这就是一个精准的一个控制红色的汽车, 那么我们也可以直接做一个啊,红色的汽车,从左到右,这个是上面是视频,这个图片限制了, 限制了你的提示词,如果说你提示词足够精确的话,你可以指出啊,这样的话,他不会限制提示词,他的画面会更好看。这个是运动指令,模糊,缺乏细节。第三个误区就是贪多求全,想让所有的东西都动起来 啊,比如说啊,一张宁静的图书馆内部的一个图片,我们来做一下啊,还是用吉梦片 提示词,书在飞,灯在摇,桌子在跳,人在晃啊,什么都在动,他的困境啊,会忠实的执行指令,是一场灾难,整个画面会变得一个混乱,无意义的动态噪音,完全破坏原图的意境。 这个在 ai 视频领域被称作过度运动啊,我们来看一下过度运动会是个什么状态。图片生成,这是个视频呢,好,这个元素是啊,都有的,我们来随便找一张 生成视频,我们再让他动一下,看看他能不能动起来啊。他给到一个女性安静的坐着,我们用这个先生成个图片试试看,这个就是这个,所有的都让他动啊,他就变成这样了啊,摇,对啊,书是在飞,灯也在摇 啊,桌子在跳,人在晃啊,都没毛病啊,所有的他给的都对,但是你给他放到一起,他就感觉很怪了。所以说,我们如果说你的文案就是要这个效果,要地震呢?比如说突然失重的状态啊,你这样是没问题的啊,也不是完全不行,要看具体具体的一个情况。 那么如果是这个专家级的写法,应该是什么样的呢?我们看一下后面出的啊, 一个女性安静的坐着,手指轻轻划过树叶桌上的台灯,温暖,发出温暖而稳定的光啊,窗外树叶在风中轻轻摇曳,光影在地面上缓缓的变化啊,我觉得打这个非常 ok, 他 所有的动态都非常的合理且真实。好,我们再看下面啊,我们生一个图啊,根据这个图,我们再用这个提示词啊,我们再找到这个提示词啊, 这样再看一下,这个是纹身,纹身的啊,这个纹身的其实效果已经很好了,但是如果你需要固定人物角色啊,你用这个图声视频也不错,这样就能实现一个精准控制啊,手指轻轻划过输液台灯,投下什么样的光,窗外又怎么样啊, 那么我们再看前面啊,其实解决方案的核心是少即是多,确定画面的视觉焦点和情感基调。对于一张宁静的图片,只让少数关键元素产生微妙的合乎逻辑的运动啊,让大部分背景静止,这样才能烘托出动态的美感。 给大家灌输的关键是什么呢?并不是说动态越多越大,效果就越好啊。大家看啊,这个桌子上斑驳的树影啊,他都在动 这个手和书的接触,你看,非常的自然。刚才的图声视频,其实还是有一点点,这个翻页的时候还有一点点 bug 啊,感觉不太自然,但是如果用在图声视频啊,这就非常自然了,你看它这个树叶都非常的细致啊,这个就非常的棒啊。 那么我们在后面是什么呢?在后面一个问题,就是忽略图片本身的可动性啊,就比如说他这个本身这个图啊,不适合做动态的位置,并强行给出了指令啊,你必须得动。比如说啊,这个图片他就很模糊 啊,比如说,你用这个 sd 一 点五生成个五幺二乘五幺二的图啊,五幺二乘五幺二的图是一个大远景啊,你这个还让他眨眼和微笑,眼睛特别小啊,嘴也特别小,只有很小的区域,你还让他眨眼和微笑,那样他就做不出来了啊。举个例子,比如说啊, 咱就做一个一 k 的 图片,一 k 一 比一一 k 啊,远景镜头啊,一个站一个女孩,键盘不太好用啊,站在海边啊,面带微笑, 她身穿白红色长裙啊,哎,走一个。好,那就这个啊,动态视频生视频告诉她啊,儿啊, 女孩眨眼微笑,眨眼微笑, 然后露出惊讶的表情啊,这个脸其实还不算太小了,因为这是一 k 的 啊,如果是五幺二的就有点过分了,我们来尝试一下啊,不知道能不能做出来。一 k 的 图像其实还好一点啊,但是如果说你是一个比较远的一个镜头,他可能就容易出问题, 因为他能够他的画布能够展示这个画面的地方就太小了。好,我们来看一下啊, 眨眼几乎看不出来了啊!微笑转为惊讶的表情,基本上没有啊,因为这个能够操作的空间太小了,他就很难,即使是现在这么先进的模型,他也很困难。那么我们怎么解决这个问题呢?首先,我们在啊选择图片的时候, 尽可能的提高清晰度,确保 ai 能识别出细节。很多同学他可能用的个图片就清晰度不够啊,看起来还行,但是一旦放大他就会产生问题。 我们用的图片,我推荐是使用极梦二 k 啊,那么它出来的都是二 k 像素的,它有足够的空间来做啊,即便是这个占的比例比较小,但实际上它的像素还是达标的啊,所以说极梦二 k 是 比较好的一个选择,这也是我比较喜欢用极梦的原因。 如果说清晰度,我用的这个,比如说我用的是 edgy 啊,这个清晰度出来就是一零八零 p, 它确实是不够用,或者是七二零,或者是更低,确实不够用,怎么办?那么我们用啊,图像放大工具,这里也给了大家了啊,图像放大工具, 图像啊,不是视频,视频再放大就来不及了,一定是在图像阶段把图像放大,提高分辨率啊,图像放大很简单,这种方式太多了啊,这个一般我们学 ai 的 肯定是都会也手拿把掐的,那么图像放大了,提高清晰度之后,那么你 生成的视频,他就有足够的像素来进行一个制作的动态,这样的话,你的视频效细腻度也好,他的动态效果也好,都会有一个阶段性的提升。第二个是主体要清晰, 如果说啊,你想要运动的物体要轮廓分明啊,讲这个东西运动,然后让他不变形,那么他的轮廓要分明,没有被严重遮挡啊,比如说人脸啊,你要让这个人脸展现丰富的表情,那么你给他戴个口罩, 那么这个表情就可能做出错啊,或者是戴个墨镜,虽然他也能做,但是尽可能的啊,没有遮挡,比如说头发挡了一半的脸啊,这种的他可能会出问题,当然现在的模型好很多了,如果是以前的模型,大概率会出问题的。是动物也是一样啊,轮廓分明,没有被严重遮挡。 再一个就是有动态潜力的图,这个图片本身就包含适合运动的元素,比如说火呀、云呐、头发呀,是吧水呀,布料啊,它有一个动态的可能性啊,这些东西它本身就容易有动态,比如说头发, 你有头发,它一般都自动会给你生成动态,或者是有一个运动的趋势,比如说跳远,跳高,跳一半啊,在空中,那么它一定就会自动给你匹配到落下来的感觉。 所以说你要给你的建议是什么呢?第一个是高清,第二个是主体清晰,第三个是有动态趋势或者动态潜力,这样的话你就能生成一个非常不错的一个动态素材。 最后总结一下啊,我们这节课主要是学到了什么?第一个是要学会先用动词来思考啊,我们一定要思考一下 这个第一步描述的是什么啊,而不是不是描述他是什么,而是要思考这个图,我希望图中的东西动啊,再怎么动,这个很重要,给动词加一个副词,不要只说动,要说怎么动,要说缓慢的向上飘动啊, 要有一个副词,要有一个形容词来具体明确表现出它的状态,方向等等啊。第三个呢,就是抓主放肆,抓住主要的运动点,其他部分保持不动,不要所有的都让它动啊,所有都动等于不动,那么要有突出的运动点,它才是一个好的素材。 第四个,选择好画布,一定要让图像清晰,主体明确,有足够的像素,这些都很重要啊, 那么通过这些练习,你就能慢慢的成长一位一个动态的影像大师啊。所以说大家还是课下老生常谈,多练啊,多测啊,要看看这个模型,它的调性,它的极限在哪啊?这节课就上到这里, 我们下节课再见!大家好,我是老成,这节课我们来聊聊动态运镜的常见错误。运镜是让 ai 视频从会动的图片飞跃到有虚实感,短片的灵魂所在。新手在这方面犯的错误往往源于对导演思维的缺乏。 那么请再次把 ai 想象成一个技术一流但毫无主见的虚拟摄影师,你就是导演,你的提示词就是你对他下达的拍摄指令, 如果你的指令模糊不清,他就会用最呆板最基础的方式来交差。那么我们来看一下新手在运镜提示词方面常见的四大错误。 第一个错误是指令模糊,把希望当指令啊,不管是升图还是升视频,指令模糊都是大家常见的一个错误。那么新手往往只描述了自己想看到的结果,而并没有给出具体的运镜动作。 那么如果让我们来写的话,很多人会这样写啊,让画面更有冲击力,镜头拉近,看看他的脸。那么我们来分析下这个问题,什么是有冲击力?冲击力是一种主观感受, ai 是 没办法去量化 的。是快速推进的冲击力,还是旋转的眩晕感啊,它都属于冲击力。那么拉近呢,也是一个非常笼统的词。 在专业摄影里面,拉近至少有两种截然不同的方式,一个是变焦推进,英文是 zoom in, 一个是镜头向前推进 dolly in。 如果说啊,我们用翻译软件的话,这两个是可能被混淆的, 那么专家操作是怎么写呢?比如说变焦推进啊,我们最好是带上一个英文,在里面有英文的情况下,它就很难产生错误。 那么改变变焦,改变镜头焦距,摄像机机位不动,效果是背景被压缩,画面变,画面变平,有一种窥视接视的序句感啊,他的这种变焦推进叫 zoom 啊,我们来尝试一下啊,我们这个提示词, 镜头快速变焦推进,聚焦于他脸上的那颗紧张的汗珠啊,那么如果我们放到我们的这个视频里边,他是什么效果?是这个效果啊,我刚才做了一个啊,还是上节课的图啊,我改了一下提示词 啊,这个就是镜头快速变焦推进,你会发现啊,他的这个有一种稀奇苛刻变焦的感觉啊,他后边的背景他有一种压缩感, 这个就是我们的中印啊,那如果我们用道理印啊,那么是什么样的镜头提示词?镜头缓慢向前推进,穿过人群,最终停在主角面前。我们再来看一下啊,人群出现了,他是缓缓推进的,镜头推进到主角的面前啊,这个也是完美的响应了。 这个就是 zoom in 和 dolly in 的 一个区别,那么 dolly in 常见于一个蓄势,然后一个移动镜头穿梭,但是 zoom in 它会更倾向于来表达主角的瞬间情绪啊,它们是这这个区别,它两种的镜头,它的镜头语言是不同的啊, 那么我们再看一下 dolly in, 摄像机本身向物体移动,效果是观众感觉自己走进场景,空间感和沉浸感极强。是这样的, 那么我们的核心解决方案是什么呢?学习并使用基础的运镜术语,把你希望翻译的 ai 摄影师能听懂的行, 把你的希望翻译成 ai 摄影师能够听懂的行业黑话。比如说平移啊,平移是 pen 啊,摄影机在原地水平转动,可以向左平移,也可以向右平移啊,也就是 pen, left, pen, right 啊。再一个就是倾斜啊, tilt 啊,比如说摄像机在原地垂直转动,可以是上下 up tilt, 也可以是向下 down tilt, 是 吧,也可以推进和拉远啊, in 啊, dolly out 啊,推进拉远就是它的整体向前平移和向后平移, 那么横移啊,它们也都是不一样的,像螃蟹一样,平移就是像轨道平移,轨道横移啊,这种叫 track 啊,然后升降啊,然后就是 up down 啊, 然后摄像机整体向上或向下移动啊,这个后面我给大家制作了一个这个专门的镜头表啊,中英文护翼镜头表啊,回头我可以给大家展示一下啊。 那么我再来看第二个错误啊,第二个错误是混淆主体运动与镜头运动。那么新手常常把角色或者物体的动作当成镜头动作啊,其实这是不一样的, 主体怎么动啊,是主体动作,那么镜头怎么动?它是运镜,是镜头动作,我们上一节课讲的动态效果,它事实上是主体动作,那我们这一课讲的主要是镜头运动的镜头动作。比如说你写一个这个,一辆车从远处开来, 那么我们就要分析这个问题了,那么这个车是在动还是镜头在动,从远处开来,如果是车在动啊,镜头无缘,那是一个固定镜头,看着一辆车从远处的蚂蚁大小,慢慢变成近处的庞然大物啊,这是一个近大远小的一个运动,这是一种拍法, 但是可能不是你想要的,假如说我想要一种跟随追逐的感觉,对吧?那么我们就要清晰的描述 这个是什么在动,镜头怎么动?那么我们再来看一个,专门看一下我们的操作版本啊,这个专家操作是怎么操作的版本? a, 一 辆跑车在山路上飞驰,镜头与汽车保持同步横移,始终啊将汽车保持在画面中央啊, 这个就是一个简单的跟拍,我们来看一下这个这个提示词,上下图,这里我就给大家做一个简单的这个纹身视频就行了啊, 就是这么一个视力,我们来看一下,那么我们再来看一下版本 b, 版本 b 是 什么?摇射,摇射,一辆跑车从画面的 左面快速进入,然后镜头向右快速平移啊,向右平移,然后跟随他,直到他从画面右侧消失,留下一道模糊的残影啊,这样说的就很很明确了啊,他到底是怎么走的,那么来看一下,当然你也可以把他俩连起来啊,连起来一起 吉梦也可以支持多镜头作用啊。看飞驰的跑车,这就是一个简单的跟拍啊,看,就是一个跟拍,跟这个车走啊,在山路上飞驰保持同步横移,始终将汽车保持在画面的中央啊,有点卡, 但是你可以看到啊,他就是这样一个一个动态效果,就是一个跟拍,对吧?那么再看这个,这是摇射,一辆跑车从画面左侧驶入,镜头快速向右平移,跟随他, 直到他画面从右侧消失,留下一道模糊的残影啊,这个其实他做的不大好,那么我来看看这个连续性的 先跟拍啊,然后让他从左到右,然后再出画,入画,出画这个提示词感觉用的还是比较一般,我们尝试一下更高级的模型。用一个 pro 来看一下啊,这个我感觉他可能是这个, 对于这个题词理解不是那么 pro 来看一下啊,这个我感觉他可能是这个,对于这个题词理解不是那么 pro 来试一下啊。 然后我们再来看一下这个解决方案的核心是什么?是养成双线思维习惯,在写题诗词时,心里要同时规划两条线,一个是演员,也就是说你的主体,主体的动线,你的角色或者主体在场景里如何移动。 一个是摄像机动线,就是说你的运镜,你的摄,虚拟摄像机如何来捕捉这一切。那么我们在写题时词的时候就要考虑这两方面了啊,一个是画面中的主体要怎么动,一个是你的机位,你的摄像机要怎么动啊?我们用这种双线习惯,就很容易拍出一个更好的素材啊。 我们再来看一下啊,刚刚生成的,这是 pro 版本出的啊,这个其实也不错,直到他从画面右侧消失,留下一道模糊的残影啊,这个其实也可以啊, 再来看上面这个,其实这个 pro 模型给人的感觉就是真实感更强啊,这个真实感更强,它整体的这个衔接啊,丝滑度啊,真实感啊,它是更强的啊!大家可以看到啊,这种素材的质量就远比你直接弄一个车在那直接跑要强很多啊, 这个素材的质量就很高了。好,那么我们再来看一下第三个误区,就是缺乏节奏感,忽略速度和时机啊,新手往往只给出动作,但没有定义动作的快慢,导致视频缺乏情感和节奏。那么比如说镜头向上移动,看到整座城堡, 事实上啊,就是你单纯这么写也没问题啊,但是呢,给人的感觉就是给人的感觉就是有点有点奇异啊,这个动作是突然完成的还是慢慢的啊?然后 前者和后者,前者是喜剧和惊恐惊悚片,后者用于史诗或者奇幻片,他们的需求其实是不一样的,不同的速度,传达的情感也是不一样的,那么我们来看一个 简单的例子啊,比如说我先写一个提示词,在啊,一个森林场景,我随便写一个啊,森林的场景,然后图片我随便做一个看看啊, 一个森林中的场景,宁静的村庄,屋顶。这个写的不对劲呢,我先,我先生成一个视频吧, 生成一个视频充满史诗感,我用一个普通的模型啊,这不用最好的,我们就用个普通的,先看看效果,然后镜头上移,看到整座城堡,这个主角跪倒的瞬间啊,他可能做的不太好啊,没关系啊,然后我们再看这个, 就是镜头上移,向上移动,看到整个城堡,这个其实也还行,也还行。那么这个问题是什么呢? 这个问题就是他的秒数内容太长了,但是你的时长不够啊,你的时长不够,那么我们给他改一下时长,我们把五秒改成十秒啊,然后主角跪倒的瞬间,啊,镜头突然快速向上升起,结实庞大的军队,营造绝望感, 我们加一个画风吧,北欧史诗电影。我们加个北欧史诗电影,然后来看一下效果啊, 好,这个改成十六比九,镜头向上移动,其实这个是不太符合提示词的,因为我们说的是镜头向上移动,看到整座城堡,那么他只是看到城堡,镜头上移, 其实他是不太贴合的啊。我们再来看一下啊,北欧时事电影,刚才弄了一个这个中国元素的电影啊,有点像拍短剧, 其实倒也还行啊,我们来看看这个北欧史诗电影,主角在跪倒的瞬间,镜头突然快速向上升起,结实身后站着的一支庞大军队啊,是快速升起的啊,然后营造出绝望感。清晨,镜头缓慢平稳的向上倾斜, 从宁静的村庄屋顶越过尘雾,最终定格在远方雄伟的雪山之巅,充满希望和史诗感啊,这个包括屋子啊,也都变成了北欧风格的。 这个其实啊,还不错,这个就是是非常精准一个控制了。像这种镜头上移,看到整座城堡也不是不能用,只不过是第一,他需要有一个手帧图,根据这个手帧图来做相应的参数。镜头上移看到整座城堡,不过他镜头上移看到整座城堡,他可能速度是个匀速,用 匀速的运动,其实这个倒也没有什么大碍,即便是匀速运动,我们可以在后期剪辑的时候给他做一个变速啊,这也是可以的。当然,如果说你能够用这种精准操作啊,他这个效果是更好的。 这个镜头突然快速向上而起啊,这个用什么提示词?向上听写用什么提示词啊,这个用起来可能效果会更加精准。 那么第四个误区,起点和终点不明,镜头不知所措啊。新手给的指令像一个没有起点和终点的路牌, ai 不知道从哪里开始,到哪结束。那么我们新手的写法就是镜头围绕主节旋转啊,这个是大家经常用的,我有时候也经常用 镜头围绕主角旋转,那么从什么角度开始转,转多少度,最后停在哪里啊? ai 可能会从一个奇怪的角度开始,然后无休止地转下去,或者是它只转了一点点啊。所以说你要给他一个精准的方式,比如说起始镜头,主头主角正面特写, 镜头开始围绕他进行三百六十度旋转,速度由由慢到快啊,背景变化旋转的过程中,背景从白天的教室无缝切换到夜晚的战场,然后旋转一圈后,最终停在了主角的正面特写上 啊,表情从天真改为坚毅,我们用这个提示词试一下,因为时间关系啊,我就直接用一个纹身图来举例,纹身图的效果肯定没有图生 纹身视频的效果肯定没有图声视频的效果好啊。如果大家在工作的时候,他一定是要先有一个图,然后用图片再进行一个图片生成视频的操作啊,这样效果是最好的, 它的可控性是最强的。这里哈大家可以看到,有一个起始镜头,有一个运镜过程,有一个背景变化,有一个结束镜头, 这四个过程啊,他里边给了三个部分啊,但是我们可以看到,其实运动过程和结束构图这个是一定有的。背景变化你可以写,也可以不写,如果你的背景需要有变化,你就让他写一个背景变化的提示词,如果背景不需要有变化,你不写也没关系 啊,但是起始构图,运动过程和结束构图,这个最好写下,尤其是你写首尾针的时候啊,你可能写,如果这样写的话,你做首尾针啊,会更准确。我们来看一下效果啊, 主角正面特写运行过程开始围绕三百六十度顺时针旋转啊,由快由慢到快。背景变化旋转过程中,从白天的教室切换到夜晚的战场, 镜头结束旋转一圈后,最终定格在主角的正面特写上,这个是对的,主要一个问题就是没有一个参考图,有参考图效果就更好了,他的切换到战场啊,最好你是有一个首尾针啊,他的效果一定是更好的。 那么我们再来看第二部分,运镜啊,组合运镜,其实他是一个更进阶的一个玩法啊,很多时候一个镜头他可能没有办法能满足你的需求,那么就需要一个组合运镜, 在能在一个镜头内传递更丰富和更丰富的信息和情感。他关键在于逻辑清晰的顺序指令啊,这个顺序指令很重要,假如说啊,你要指挥摄影师完成一个复杂的长镜头,你要一步一步的告诉他啊,首先啊,我们这个 要确定一个目标啊,拍摄一个侦探发现关键线索的戏剧性镜头,那么我们怎么写?新手写的侦探找到线索, 镜头拉近很震惊是吧?找到线索,镜头拉近很震惊,他的缺点就是啊,信息量太低了。那么如果你要专业写法的啊,先要确定一个大环境,其实镜头是一个中景是吧,侦探怎么样是吧?他蹲着,我们来把提示词写一下啊, 那么是一个中景,侦探正蹲在一个凌乱的房间中央,地板上散落着各种杂物。第二镜啊,缓慢向前兜了, in 啊,微微向下倾斜, tilt down, 视线跟随侦探的手,他正伸向一张被踩在脚下的旧照片。啊,那么我们可以看到啊, 那么它这个组合是什么呢?是 door in 啊, door in 加 tilt down 这个组合啊,将观众的注意力从整个房间平滑聚焦到侦探手这个具体动作上,我们把这个其实也可以给它复制粘贴一下啊,这样你做一个解释,它可能能更好的理解啊。我们来看一下效果。 第二个动作啊,他的手指触碰到照片时,镜头切换主观视角啊,捡起照片,我们看到照片上是一个他以为早已死去的人,这是蓄势视角的切换啊,也是一种高级的镜头组合。 当然我这种做法啊,他没有办法保持一致性,因为我是文声视频,如果是图声视频的话,他就可以保持到一个一致性啊, 我们一会来看看效果,情绪爆发啊,镜头瞬间切回侦探脸上,并快速向眼睛做了一个推拉变焦,背景发生扭曲,表示心中的巨大震惊。好,我们来看一下啊! 第一个镜头,中景蹲在房间中央,地板上,各种杂物慢慢推进,同时微微向下倾斜,视线跟随侦探的手伸向一张被脚踩下的旧照片啊, 看他的特写啊,转移到这个照片上,非常精准,也非常有故事性。我们看到第二个啊,当他手指碰到照片时,镜头切换为主观视角啊,捡起照片,看到照片上是一个早已死去的人啊,这个没毛病,只是这个人物,这个人物不对了。 所以说我们还是要适合用一个图片,先做图片来控制人物啊,其他的地方都完美。再来一个啊,镜头瞬间切回啊,聚焦到脸上,快速的眼睛做一个推拉变焦,背景发生扭曲,表现内心的巨大震惊,非常完美。大家可以看到啊, 你只要提示词给到位啊,他就一定能给你做的非常完美。这种内心的震惊,巨大震惊,完美的体现出来,非常棒。 好,那么我们再来看一下啊,分析啊,其实他最后一个瞬间切回,他有一个叫名字说稀缺,稀缺苛刻变焦啊,是一个经典的高级组合, 用这种组合的方式啊,同时啊,向前推进镜头相机,并且向后变焦啊, zoom out, 向前推进,向这个向后变焦,然后 创造出主体大小不变,但背景极具变化的绚丽效果,达到完美传达这种内心的天旋地转,这个就叫稀奇苛刻变焦啊,我们可以用 ai 来做成这种效果,如果说你实在做不出来用这种,用这个剪映啊,或者是 pr 也能做出来啊, 那么最终组合出来的一个完整提示词啊,一个复杂的长镜头,那么我们也可以尝试一下,把它放在一个镜头里,我们尝试一下啊, 缺张图,不过没关系啊,我们只是看看明白这个意思就行了啊,通过这种逻辑分析分布组合的方式,引导 ai 创造出电影级别的复杂镜头,它不简单的是平移或者缩放啊,这是一个有一点,有一些进阶的一个应用。我们最后看一下 这个镜头的一个效果啊,看看能不能把它们组合起来有一个一致性。我用的并不是高级的 pro 啊, pro 模型,我用的是一个普通模型,这个普通模型很便宜的,基本上大家都可以来看一下啊,镜头向下照片啊, 这个组合镜头啊,非常棒,是不是很有电影的质感啊。这种组合镜头啊,是吉梦擅长的,吉梦和豆包都非常擅长这种组合镜头,所以说你同时会了主体动态,会了运镜,同时会做这种组合镜头,那么你制作出来的影片一定是非常精彩的。 好,这一节课啊,我们就主要讲了这个常见的运镜方式啊,包从运镜错误延伸到我们这些运镜方式,怎么做啊?从这个指令开始啊,从这种模糊指令开始,到这个镜头组合的实现啊,那么我们这节课就到这里啊,我们下节课再见。

二零二六年最火的 ai 工具是什么?是 open core, 一个二十四小时能帮大家干活的智能体。今天呢,迪姐就用最简单的方式和大家分享一下如何养一只属于自己的龙虾,让他成为我们的 ai 专属数字员工,从部署到训练到具体的场景应用, 全程干货,建议码住收藏不迷路哦。第一部分是我们使用前的准备,首先呢,开始养虾之前,我们需要准备三样东西,第一个呢是运行环境, 一台普通的电脑就可以了, windows, mac, linux 都可以,或者是租一台云服务器,但也非常建议大家可以用自己平常闲置的电脑去进行一些运行,因为还涉及到一些数据权限的问题。那第二个呢,就是 ai 模型的 api key, 这个是龙虾的大脑,新手比较推荐国内的模型,比如说像 mini max, kimi, 智普 ai, 免费额度多,而且访问速度也会比较的快,如果大家预算充足呢,也可以用 cloud 或者是 gpt, 能力会更强一些。 第三个就是打通的通信渠道,就是大家平时用的聊天工具,像 facebook 啊, telegram, discord 都可以,这个可以用来给龙虾去下具体的指令。准备好这三样,我们就可以准备开始了。 第二部分是三种的部署方案,大家可以根据自己的这个过去的呃,这个技术的一些基础和目前自身的一些需求去进行选择。 那第一种方式呢?是桌面一键安装最适合小白上手的客户端,呃,去进行网页的交互式的这个安装, 然后填入 api key, 绑定飞书或者是 telegram, 五分钟就可以搞定,而且零成本,然后上手都是交互型的界面,复杂度极低。那第二种方案就是云端的托管服务,这个呢是最省心的,比如说像 kimi claw 或者是 max claw, 直接在网页上点击部署,按月订阅,大概是呃一百九十九一个月不用管服务器, 七成二十四小时在线。那第三种方案呢,就是云服务部署,它是呃最灵活的一种方式,比较适合开发者和企业用户。租一台云服务器,然后用 docker 一 键启动 opencloud, 完全是自主控制的,数据的私密性高,成本大概是每个月两美刀起, 新手呢就建议从方案一开始熟悉之后再慢慢的去升级。那第三部分就是核心的配置了,部署呢是完成了第一步,接下来的配置是关键,这步决定了我们的龙虾员工是不是好用。第一步是身份录入,那这个是养的核心,我们需要通过对话去告诉龙虾,你是谁啊?你的身份是什么?你需要什么? 比如说我们会跟他讲,我是自媒体的内容创作者,日常需要你帮我整理资料,拷写出稿,管理日程,我习惯简洁直接回复,每一天上午九点向我汇报代办事项。以上内容请永远记住,这样龙虾就会有永久的记忆,越用就会越懂你,越知道你的诉求。 那第二步就是安装一些 skill 技能,就是龙虾的手脚决定它能干什么。那新手建议四个必备的安装技能。第一个呢就是 capability involver, 这个能让龙虾自己进行优化,越用越聪明。第二个就是 agent browser, 它能够操作浏览器,自动查信息,填表格。 第三个就是 summarize, 快 速总结 pdf 网页长文档。第四个就是 find skill, 需要新功能时让它自己去找, 在 clawhub 市场搜索这些技能的名字,一键安装就可以。第三步就是对接工作渠道,把龙虾接入到我们的飞书或者是 telegram。 以飞书为例,直接在飞书的开放平台创建企业自建应用, 开启机器人的权限,获取 app id 或者是 secret, 填入 open claw 配置页,就能够在飞书当中直接艾特你的小龙虾了。第四部分就是具体的使用场景示意, 配置完成之后呢,我们就可以像指挥员工一样去下达自然的语言指令了。第一个场景呢,就是办公的自动化,把我的邮箱里所有来自客户的未读邮件摘要整理成表格发到非书群里。第二个场景,信息处理 监控 abc 三个竞品和官网的社交媒体,每天下午五点给我一份动态摘要。第三个场景就是内容创作,根据我昨天整理的会议纪要,生成一份公众号推文的大纲,要求风格活泼。第四个场景就是定时任务了, 每周一早九点提醒我更新项目的周报。这些重复性的任务我们都可以交给龙虾,我们只需要专注创造性的工作。当然我们也需要注意一些事情,就是安全哈,务必设置以操作权限的白名单,避免执行一些特别危险的指令。就是还所以还是推荐比较用 docker 的 杀虾模式去去运行。 第二个就是控一下成本,其实因为如果按照 token 去计费的话,这个消耗还是挺大的,呃,或者是呃建议大家可以选择 maxclaw 这种固定式的订阅服务,也可以节省一些成本。第三个就是从简单开始,就是一次性,我们不需要装太多,从一个核心的需求,比如说像整理文件啊,然后 去解决一个子场景的一个小问题,一步一步去构建自己的这套体系。好啦,这就是二零二零年 openclaw 的 完整使用指南。 养虾呢,其实是一个持续部署和调优的过程,那后续迪姐也会在频道当中持续去更新 opencloud 安装部署,具体的呃使用场景等等相关的内容。如果大家感兴趣可以关注订阅迪姐的频道,我们就下一期视频,再见!拜拜!

想要白嫖全球最顶尖的 ai, 却找不到门路?今天给你四个完全免费、不限次数的 ai 网站,不仅不用花钱,还能让你直接对接全球最强生产力!赶紧收藏!基础纹身视频首选 ai video maker 它主打完全免费、不限次数、零门槛操作,只需点一下,就能一键产出高质量、高清晰度的 ai 小 短片,非常适合新人快速出片。进阶生图生视频选利不利不?它主打海量高端模型,免费试用, 适合入门级玩家简单调参数,高精度控制每一处创作细节。顶级大模型对话首选 no marina, 它主打最顶尖模型,免费畅聊,无需注册也不用花钱,就能在一个网页直接对话 g p t 五 cloud、 四点五等全球最强 ai 进阶调用 ai 数据 接口,无脑选 open router 它整合了国内主流模型的 a p i 数据接口,让你像用万能插头一样,无限白嫖全球顶尖 ai 大 模型!

欢迎来到二零二六,全新 ai 视频系统教程同样适用即梦!为什么别人能精准一击即中,效果完全符合预期,而你的视频却像脱缰的野马,不仅浪费积分,还得靠运气碰结果。今天这期全是干货,手把手教你从零到一,彻底拿捏完整 ai 视频流程, 无论你是纯小白还是有基础的老手,学完都能力见效。视频里提到的所有工具、工作流、框架与核心要点,我都整理成了懒人文档, 想要这份资料的朋友直接在评论区扣六六六,我会第一时间安排发送,话不多说,直接开整。哈喽,大家好,从本视频开始,我将和你一起完成整个 ai 视频制作的一个流程, 从新建文件夹到最终的剪辑发布,从头开始创建一个一分钟的 ai 视频。无论你是零基础的入门者, 或者说是 ai 视频的创作者,又或者是急需要接单进行变现的一个需求者,我们都可以通过这套课程来完成我们自己的一个目的。看完了这套课程,我相信在观看完这一系列视频之后,大家都会有所收获。我们本套课程用到的核心工具就是集梦、豆包和剪映。 即梦主要是 ai 生成,豆包是我们的剧本创作,剪映是剪辑和输出。我们本系列的一个课程结构可以分为这七个大模块,主要包括剧本、 角色设定、图像生成、动态效果、音视频创作、剪映的一些剪辑实操和最后的一个接单和发布。并且所有的内容都是非常简单和免费,将尽可能的交涉这些内容,逐步和大家一起完成整个创作的一个过程, 现在让我们开始今天的课程吧。首先我们来看一下剧本的一个生成,要编写一个好的剧本,首先我们需要学习如何来使用 ai, 如何向 ai 来提问。而提问我们需要围绕这三个关键的一个要素。首先第一个角色的一个身份设定, 给 ai 贴上专业的一个标签,比如我明确的告诉 ai 它的一个角色定位,比如它是三年经验的三 d 电影导演,或者是资深治愈系的一个编剧。 身份设定决定了 ai 思考的角度和专业的一个深度。我们需要让 ai 觉得自己真的是一个三 d 的 一个导演,我们需要让 ai 真的 觉得自己是三 d 电影的一个导演。第二个是需求的一个描述, 首先我们需要明确创作的一个边界,比如我让 ai 详细的描述你需要什么内容,包括题材、时长、风格、核心元素等。需求越具体呢,我们 ai 输出的内容也就更精准。第三个就是我们格式的一个要求, 我们需要指定输出的一个格式,首先规定剧本的一个具体格式,包括分镜数量、每镜时长、必须包含的内容相等。而格式的要求也确保输出的结果可以直接进行使用。例如我们现在换到豆包,我们可以这样问 ai, 如果你是汽车的一个推销员,请说明一下为什么人们这么喜欢特斯拉。给出我三条主要的一个理由,我们发送给 ai, 这里我们就能得到我们想要的一个三条主要的理由。得到这么精准的理由是因为我们首先 设定了他是一个汽车的一个推销员,他呢给 ai 分 配了一个身份,我问为什么人们这么喜欢特斯拉,这个就是关于 ai 如何来回答我们的问题,最后请给出三条主要的一个理由, 如何做到这一点。接着我们将这段话发给 ai 后,我们就会得到我们想得到的一个主要内容,其中如果你是汽车的一个推销员,是我们在给 ai 设定一个身份,其实就是是什么,其中说明一下人们为什么这么喜欢特斯拉,是我们明确给 ai 这样一个问题。 接着请说明一下人们为什么这么喜欢特斯拉,其实就是在告诉 ai 需要做什么,让他来帮我们回答这个问题。 而最后请给出三条主要的一个理由,也就是给 ai 规定一个他回答我们的一个格式。我们也能看到下面 ai 回答的也是三条主要的一个理由,这个呢就是我们 ai 提示词的万能框架, 我们只需要记住这三个核心的要素,无论是要求 ai 编辑脚本,还是我们将来希望 ai 能够回答其他的问题,都可以使用这样一个通用的一个框架。 通过这种方式获得的结果,相比较我们直接向 ai 提问也来的全面且精确的多,现在已经理解了通用的一个提问格式。接下来我们就来讲一下我们生成剧本的三种方法。首先我来讲第一种方法, 直接输出剧本,这种方法很快速高效,适合紧急的一个需求。我们首先先生成故事,再生成脚本, 直接根据故事来生成图片,具体的方法我们先准备参考材料,例如我们这里准备了治愈系短篇分镜案例和色彩搭配的一个文档,让 ai 更好的理解我们想要的一个风格和我们剧本的一个主要内容。我们用刚才讲到的 三要素的一个框架,一次性写清楚所有的要求和细节,让 ai 直接输出我们的分镜脚本。我们首先先给到 ai 一个原有的一个治愈系短片的分镜和色彩搭配的一个文档,接着我们将这份资料 发送给 ai, 让他理解好的一个分镜脚本是什么样的。接着我们告诉 ai, 假设你是一个好莱坞很有经验的世界级的一个编剧,拥有非常丰富的电影拍摄经验和精湛的电影拍摄技巧,同时擅长各类型的一个电影剧本创作。我需要他阅读我们刚才上传的一个 分镜的一个案例,然后给我创建一个治愈系的短片故事,以森林中的邮局为背景,最后要求十五个分镜,每个分镜小于四秒,同时含视觉描述,镜头运动,简短的台词等。接下来我们来看一下我们这个提示词。 首先我假设他是好莱坞的顶级编剧,是给 ai 一个身份,让 ai 知道自己需要做什么。接着下面让他阅读并理解我的一个分镜案例,而是在给 ai 提要求,让他用他的专业能力 和专业方法来解决我们这个问题,也就是我们平常说到的做什么。而最后一段要求十五个分镜,并且含很多的一个镜头描述镜头运动,简短台词就是给 ai 它的一个具体的输出格式,告诉他具体应该怎么做。接着我们直接发送给 ai, 我 们可以看到这个分镜脚本其实还是比较详细的,包含了时长风格、核心主题以及核心元素 下面主要的镜头内容,比如剪辑镜头、运镜方式、时长和画面描述都是我们提示词设定了的内容,而这个主要的画面描述,而而这个运镜方式和画面描述在我们生成图片和视频的时候都会有一定的帮助,也是指导我们生成我们 ai 视频的一个主要内容。 这个就是我们用 ai 生成脚本的第一种方法,直接来输出剧本。但是通过我们的第一种方法直接来输出剧本,其实也有一定的弊端,就比如我们镜号五中的这一个画面描述,第一封信件从木盒取出,贴在树干的油箱上, 信纸紧贴树干,瞬间星光沿树皮蔓延。其实在我们真正生成我们 ai 图片和视频的时候,星光沿树皮蔓延,这个场景是很难生成出来的。 也就是说我们在用第一种方法 ai 直接生成这个剧本的时候,它会有一些逻辑上的一个漏洞。所以接下来我们来看第二种方法,先生成故事再转脚本,这种的一个优势是逻辑更顺畅,并且这是最适合小白的一个方法。 通过将剧本拆分为两个步骤,可以大幅降低我们的一个剧本难度,同时确保故事的逻辑完整性和理性。我们先来看一下。步骤一 先生成一个完整的故事,让 ai 创作一个有完整情节闭环结构的故事,一般是四百到五百字, 确保逻辑字恰无冲突。步骤二是转写分镜剧本,基于现在已有的故事,让 ai 转写包含时长、分镜、运动镜头的剧本格式,确保适配我们的 ai 图像生成。我们就可以这样问, ai, 你 是一个小说作家,且相当擅长编写故事,请编写一个 情节简单易懂,主要是三个人物,题材为蒲公英与少年的奇幻成长系故事。故事内容言简意赅,不要词藻过多, 而字数约为四百五十个字。我们这个提示词也同样遵循了我们刚才讲到的三个基本框架,即是什么、做什么和怎么做。我们点击发送,就我们可以看到我们现在生成出来的内容,就不像我们刚才直接生成出来的一个剧本, 有画面编号,画面描述画面时长,很详细的一个信息,它就只是一个故事的一个内容,我们也能看到是以自然段的形式提供的一个文本。我们来大致看一下 ai 生成的这个内容。 阿树十岁那年,在后山发现了一株不会飞的蒲公英,而蒲公英主动开口,我叫蓉蓉,不肯带我的种子走,阿树就蹲下来,指尖碰了碰绒毛,我帮你。于是他每天给蓉蓉浇水,对着绒毛吹气,种子 总粘在花托上。而老槐树下的一位白发老者说,蓉蓉怕离别,你怕长大,你们绑在一起了。 阿树愣住了,映射了我们主人公他因为怕父母进城没人陪,他,怕学校攻克太难的一个内心。而最后,阿树终于握紧拳头,对着绒毛用力吹气,这一次他没想着留住,只想着成全, 这也映射了他自己的一个成长。我们能看到这个生成出来的一个故事,就比我们刚才直接生成的一个剧本脚本 要好不少,我们至少能看到逻辑上不仅整个故事有始有终,拆分到每一个故事情节,他也是逻辑通顺的。例如阿树蹲下来指尖碰了碰柔软的绒毛,或者是白发老者捋着胡须说的话,在逻辑上也是非常通顺的。 我们就可以通过这个故事来直接生成我们的图片,又或者生成我们的一个分镜脚本。接着我们就可以这样问 ai 让他给我生成十五个分镜脚本,每个分镜小于四秒,并且三个分镜不要有画面景别的一个切换。因为在以前我自己的生成中,可能他生成出来的一个内容需要三到四个景别才能描述出他生成的一个内容, 所以我们最好这里写一个单个分镜,不要有画面紧别的一个切换,然后我们直接发送给 ai 就 能看到,它就依次帮我们来生成了画面的一个主要内容,并且是分好一个分镜序号的。比如首先后山城景, 阳光洒在草地上,一株蒲公英的绒毛球粘着成露,这些画面描述都非常的简单,但是我们在用 ai 来生成图片的时候,这些描述是非常的准确和精准的,也能让 ai 知道我们需要生成怎样的一个画面内容。接着我们再来看一下我们生成分进脚本的第三个方法, 借鉴原有的一个框架进行二次创作。这个方法是最适合我们商业接单的一个方法,通过借鉴经典的故事框架,可以避免 ai 天马行空的一个创作,也能确保我们输出的内容更加符合我们用户的一个需求和市场的一个规律,同时又保证了我们创意的质量 效率。我们首先先选择一个成熟的故事框架,如平凡人拯救危机、寻找失落之物、新旧对比等。然后我们再替换这个框架中的一个核心元素,保留故事的一个框架,替换他的角色、场景、核心道具等。 在基于 ai 生成新的一个故事,创作完整的一个脚本。在基于 ai 生成新的一个元素来创作我们完整的一个故事,最后通过这个故事转化为我们的分镜脚本。之前的演示中,我们可以看到 ai 生成的故事比直接生成的模板要好不少, 但是通过这种方法,我们生成的故事情节往往不宜控制,我们只能依靠更详细的提示描述我们 ai 大 模型来帮助我们生成一个更全面、 更精确的一个故事。因此我们用方法三所生成出来的内容其实是更简变的一个方法。我们就用刚才的一个故事来进行举例,我们先将这个故事整理成一个文档,然后告诉 ai 你 是一个小说作家, 让他根据这个文档中的替换角色、场景、核心核心道具等具体元素形成全新的故事,主题相似即可,保持故事的简洁,只需进行适当的修改,字数应与文档中的故事相近。接着我们可以来看一下 ai 通过改写之后写的一个故事, 讲的是小满八岁那天,在巷口老井边发现了一只不会游的一个小锦鲤,而小锦鲤说 水流不肯带我去大河。而后即便是小满每天来给老井换水,用小石子搭水沟,可小井里还是在沟口打转,不愿意去大河。坐在旁边的老奶奶也说, 晶晶怕陌生,你怕改变,你们缠在一起了。这个其实就是和我们刚才的阿树十岁那年的一个故事是非常接近的,而且也是非常有趣的。我们可以看到 ai 生成的结果非常符合我们给他提示词的一个要求,这个框架也非常的相似, 但故事中的情节和人物都是替换了的情节和人物,这就是我们第三个方法,通过已有的故事生成相近似的故事。如果我们在网上找到一些非常有趣的故事,不妨通过这种方法来改写我们的一个剧本。 ai 生成出来的故事也是有一定问题的, 就比如故事中小锦鲤怕陌生,不敢去大河和小满怕改变,怕奶奶离开,怕转学的一个核心矛盾,仅通过项伟老奶奶的一句话直接点破, 缺乏了前期的一些细节和铺垫,就导致了两者绑定的关系就显得比较生硬。所以我们在下一个视频中也会解释 ai 小 本的一个修炼的一个问题,如果大家觉得这个视频内容对你有帮助,不要忘记点赞并三连,我们下个视频再见。 好的,咱们接着往下推进之前的内容,接着已有的故事案例来创作相似的剧本。就像我们之前的课程提到的,我们已经讲过了剧本的制作思路,还有三种给剧本或故事分类的一个方式。而这节课呢,我们会上节课剧本为例子来拆解如何对剧本进行修改。 这里我们再来回顾一下上节课我们深沉的这个剧本,主要讲述的呢,就是八岁的小满在老井边发现了怕陌生,不愿意去大河的小井里晶晶。而小满自己呢,也怕奶奶进城治病, 怕自己转学的改变。暴雨中晶晶想去试一下大河,小满也不再留他,挖深水沟成全他之后呢,小满也不再害怕改变,随着奶奶一起进城并结交了新的朋友,四年夏天还在医院的池塘边重逢了晶晶。 这个呢,就是我们上节课生成的一个故事脚本。这节课我们也会讲到用 ai 来修改这个故事脚本,但其实修改脚本没有固定的公式可以用,咱们唯一能做的呢,就是仔细的研读 ai 所生成出来的内容,排查有没有逻辑不通的地方。 所以接下来咱们就以这个剧本为展开,大家呢可以从这个案例里慢慢琢磨方法。咱们先把话题拉回 ai 生成的内容, 我们能看到这个故事呢,还是相对完善的。但是如果我们仔细研读一下这个故事的话,就会发现核心矛盾铺垫不足。就比如小锦鲤怕陌生,与小满怕改变的一个关联稍显突误, 并且关键转折的一个动力稍显薄弱。比如我们的主角因为一个老奶奶说的话而直接就进行了改变,这个改变呢,也稍显的一个仓促。最后结局的一个呼应就是他们重逢的一个场景 也稍显的单薄。医院食堂里的小锦鲤与前文的一个关联性可以更紧密一点,所以这个故事我们就可以分为三个修改方向。首先核心矛盾的铺垫不足,其次关键转折的动力弱。最后呢是结局的呼应稍显单薄。 然后我们就可以将我们的修改意见再发给我们的豆包。接着我们还是一样来分析一下我们的提示词,因为我们在之前生成这个剧本的时候,已经设定了它是一个小说的作家,所以在下面的提示词中,我们就可以直接输出我们的问题。 就比如这里我提几点修改意见,修改完成之后让豆包直接给我输出文章,这三点就是我们刚才说到的三点修改的一个意见。接着呢,我们发给豆包, 这里我们就能看到豆包就会根据我们的修改意见来修改我们之前不完整的一个剧本。最后呢,大家需要注意一点,就是我们在生成剧本的时候,我们需要仔细地来阅读这个故事,评估一下这个故事在我们生图的时候是否容易生成。有些图像确实很难生成, 也许我们的想象力可以创造出这些图像,但是如果真的去做的话,成本可能会太高,而且时间也用的很久,这也是我们修改剧本的原因之一。最后呢,我们来谈一谈字数与短视频相应时长之间的关系。 通常情况下呢,每三百三十个字对应一分钟的视频播放时间。当然这也并不意味着整分钟都是说话的,剧情中肯定会有一些停顿,所以这是一个大概的时间, 你可以参考这个。比如我们想要生成一个大约一分钟的视频剧本,长度应该在四百字左右,在提出请求时需要注意这一点。最后呢还要提醒大家一点,我们在生成这个故事剧本的时候,我们不能给 ai 指定一个持续的时间,就比如我直接让 ai 生成一个一分钟的短片剧本, 但是其实 ai 它并没有这个一分钟这个概念,所以我们能做的最多就是限制它的字数。以上呢,就是一个关于如何修改剧本的案例研究。如果你觉得本期视频对你有帮助的话,不妨点赞并关注,仪表支持,我们下期再见!

二零二六年死磕这两个工具,过年也能开路虎!第一个,美图设计师,这是一个一键去除背景的抠图神器,无论多么复杂的背景,它都能一键去除,连头发丝这种细节都能够保留下来,不仅支持批量处理,让你的效率拉满,关键是还可以免费使用。第二个, mg prompt, 当你还在熬夜想提示词的时候,我已经靠它实现了提示词自由。你只需要上传一张图片,它就可以一键生成这张图片的提示词,不仅不需要登录,还支持免费使用。以上所有的工具,我已经放在了工具箱。评论区评论六六六,主页低调学习。

今天我来教大家安装 ai 二零二六。 adobe illustrator 是 一款 adobe 推出的专业矢量图形设计软件,专注 logo 插画、图标包装、 ui 界面等矢量创作。首先获取软件, 进入后在 adobe 专栏找到 illustrator, 选择二零二六版本下载,下载完成后解压压缩包, 打开解压的文件夹,右键以管理员身份运行 setup 安装程序,在安装界面可更改安装位置,默认安装在 c 盘安装路径,不要出现中文。 安装完成后关闭窗口,再开始菜单,找到 adobe illustrator 二零二六,拖动到桌面,创建快捷方式,双击启动软件就可以运行了。

它可以帮你做课间中的图片。它可以帮你做音画指出的视频。 它可以帮你做网页教学小游戏。它可以对模糊视频和图片进行修复。它可以帮你替换视频中的人物。 它可以让你在多场景和多人物一起拍电影。 它可以帮你生成智能体。 它可以帮你解决赛事制作中的问题。

二零二六年最新 ai 工具合集来啦!不管你是办公、学习还是做自媒体,这九大领域,二十多个 ai 工具都能帮上忙,全是新手友好型,赶紧收藏,不然刷着刷着就找不到了。二零二六年 ai 工具全家桶第一期办公效率类首先是文档处理组,豆包能直接上传 pdf, word 一键生成摘药、提取重点,还能帮你改写公文。 wps ai 嵌在 wps 里,不用切换软件,就能用自然语言处理表格公式,批量修改文档格式。 腾讯文档 ai 支持多人写作,能自动整理会议纪要,识别不同发言人的内容。刚才说了,文档处理组。接下来是会议效率组。第一个是豆包的录音纪要功能, 开会时打开录音,结束后能自动生成竹字稿和结构化记要,还能区分不同发言人提取行动像和截止日期,特别适合体制内经常开会的场景。 第二个是讯飞,听见语音转文字,准确率很高,支持多余种,还能导出多种格式,用来整理访谈记录或者会议内容,很方便。第三个是腾讯会议 ai 助手,能自动生成会议招标和代办事项, 还能同步到日程表和团队协助无缝衔接。接下来是设计创作组,对于体制内经常需要做宣传、海报、活动通知的人来说, canva 可画的 ai 设计模板特别好用,选个模板改改字就能出图,还有美图,设计师输入需求就能快速生成宣传图,完全不用学设计。 最后是数据处理组, rose ai 能轻松处理复杂数据和公式,还能自动创建图标,可赞。 ai 能把文字 pdf 导入后自动生成思维导图,特别适合做工作汇报和数据总结。除了刚才说的,还有专门做演示文稿的 gamem, 输入主题就能自动生成好看的 ppt, 特别适合需要经常做汇报的场景。还有 notebook lm, 上传论文或资料后能自动生成摘药和引用,对于整理文献、写报告很有帮助。 perplexity 也不错,它 是个 ai 搜索引擎,没有广告,搜索结果直接给出答案,还能追问,找资料更高效。这几个工具也都很适合新手,容易上手。

最近有一个很热门的项目叫做喷手,他号称可以用 ai 来帮你做设计,甚至加速做前端,但他真的有这么好用吗?我今天会用非常实际的方式直接实测给大家看。 喷手目前可以免费下载,但他不是那种免费使用,想用几次就用几次的概念。他背后其实绑定了你本地的 cloud code, 所以 如果你本来就有购买 cloud code 的 会员,并且绑定 mcp 就 可以使用。 当然如果你只有基础方案的话,可能用个几次就要再等五小时,因为这很次。 token 的 使用实验一,依靠首页与主键生成其他页面与前端。我们先让设计师做一个首页和设计主键,把这些设计稿和主键都复制到喷手,这样我就可以透过对话的方式来做视觉设计。 第一次随便下一个提示词,让 ai 扮演设计师,并且参考我的首页,然后设计出其他的页面。 我们可以看到结果其实设计的很一般,而且他没有什么背景,跟我的首页其实一点都不像,他只是做了一个简单的排版而已。但如果今天我是先请 jammer 帮我生成提示词,我再喂进去给 ai 的 话,就可以发现其实效果好了很多。他多了很多背景, 而且他的设计风格也会跟我的首页很类似,基本上我觉得已经是可用的程度了。接下来我们来测试,看看能不能把设计稿给 cloud code, 让他帮我生成前端。 我们直接针对这个首页来看,可以发现其实长得很像,但其实还是有很多不一样的地方,像是这个按钮其实跟设计稿是不一样的,但有个六十分是没问题的,但要做到一百分的话,可能还是需要花一点精力。 实验二,更改完整设计稿的风格那如果我们是直接拿别人完整的设计稿,然后叫 ai 帮我改成其他风格呢?到底可不可行?所以我去 figma 的 community 找到一个 instagram 的 ui kit, 我 希望 pencil 可以 帮我改成宠物版的社交媒体。 因此我也请 ai 帮我生成提示词之后喂给 ai, 可以 发现效果其实蛮好的,它完全把风格做了一些调整,变成更温暖更可爱,所以整体效果我自己是蛮喜欢的。 所以如果有想法不知道怎么做设计的朋友,可以直接去参考别人的设计,然后通过 ai 来尝试改成自己喜欢的样子,是有机会可以完成的。实验三,只给参考图进行复刻, 那如果我就是找不到设计稿呢?但是我有一张 jpe 图片可以吗?因此我们去 pinterest 下载了一张图片,我希望喷手能帮我做出一模一样的设计, 这是生成后的结果,其实跟原图长得很不一样,感觉他并没有真的去读懂图片,而只是针对能读取的几个像素,或是颜色或是文字等,甚至他可以透过文字知道大概是什么产业,所以他会依照他知道的事情去做生成, 但基本上也是不差了。我觉得喷手还是一个很有趣的工具,可以解决零到六十这段,而要拿去 demo 或做沟通或做交互,基本上都没问题。

二零二六年死磕这两个工具,过年也能开路虎。第一个, ai shout, 这个网站汇聚了地球上最牛的 ai 指令,包含写作、编程等二十五个大类,全球最热门的提示词都在这里, 不用动脑,只用复制粘贴,你也能成为 ai 大 神。第二个, mini max, 这是一款爆火的 ai 视频制作神器,只需要输入你的想法,例如一只逃跑的羚羊,它就能生成这种纪录片级别的视频,无需剪辑,条条原创。以上所有的工具我已经放在了工具箱留言工具箱主页,低调学习。

二零二六年五个最值得使用的 app 第五名,叉 ppt 日常我有问题要问或者要查资料的时候,我第一反应就是打开叉 ppt, 它就是我的随身大脑。 第四名,伽玛 ai 以前我们做 ppt 的 时候至少要花几个小时甚至更多的时间,但是现在有了伽玛 ai, 你 只需要一句话,它就可以帮你生成完整的 ppt 方案。 第三名, nano banana nano banana 是 一个最好用的生图神器,你有需要用形象照头像或者是封面的地方交给他就对了。 第二名,可灵 ai 它彻底颠覆了拍摄视频。以前你要拍摄一条片子,至少需要演员、场地、灯光,但是现在,你只需要一段话和一张图片,就能够帮你生成电影级的视频拍摄。 第一名,金玉兰 ai studio 这是二零二六年最恐怖的一个工具,因为它让艺人公司彻底成为了现实。你不需要懂代码,你根本不需要懂,只需要告诉他你的想法, 他就可以帮你把 app 直接打包上线。有了它之后呢,你不再需要技术合伙人,只需要有你的产品想法就足够了。二零二六年关注张小乐,成为 ai 时代的明白人。

二零二六年死磕这两个工具,过年也能开路虎!第一个, image to prompt, 不 会写提示词的小伙伴有福了,你只需要上传一张图片,它就可以一键生成这张图片的中英文提示词,不仅无需登录,还支持免费使用。第二个, mini max, 这是一个自媒体人都在用的 ai 工具, 只需要输入你的要求,例如一头在河边奔跑的老虎,它就能生成这种纪录片级别的视频,无需二次剪辑,直接使用。以上所有的工具,我已经放在了工具箱留言工具箱主页低调学习。

今天给大家带来的是 ai 小 说工具妙笔神修腹记现有的 ai 灵感,点击新建小说编辑需求,选择长短片选择男女频腹记 ai 灵感自动生成小说模板牛逼的作者名称 ai 自动生成小说名称自动生成小说封面直接创建大纲,将截屏按熄填写自动生成故系背景劫色设定故系主要情节 剪辑亮点直接新建江杰,每个江杰可选择发展的线路,角色配镜, ai 自动设计伏笔,期望剧情加强,故戏走向自动生成故戏大纲私有库,可以自行添加自己的语言风格,直接生成正文,来看一下没有任何干异生成的小说 生成正文自动更新江杰情报角色列表,角色关系网,他系活得悠线路里面包括主线、基线、感情线、势力线,直接保存腹记发布,实现第二修路,加油各位宝子们,早日正道成仙!

逼自己一周练完极梦 ai 制作视频存下吧,很难找全的!警告,本视频耗时三个月制作,制作时长三百分钟,给你系统学习极梦 ai 视频制作,这应该是目前抖音最良心的 ai 视频教程了,哪怕你是零基础也能轻松学会。所有在教学过程中用到的指令呢, 我都已经给大家整理完毕,有需要的小伙伴六六六报走,不信欢迎收看二零二六全新录制的 ai 视频制作教程。 ai 慢剧现在已经不是能不能做的问题了,而是谁先把流程跑通,因为一旦转载做起来,广告解锁和付费解锁都会给你强 反馈。但很多人卡在第一步工具安装了一大堆,教程看了一大堆,还是不知道怎么做出第一集。原因很简单, 没人给你一条从头到尾的顺序,今天这条视频我就把顺序交给你,先讲他怎么赚钱,再讲他怎么做,他怎么赚钱。 ai 慢剧是连续剧情内容,观众要看后续,通常只有两种方式,付费解锁和广告解锁。编载越稳, 解锁越多,收益越容易出现。知道了变现逻辑,接下来讲怎么做。从本期视频开始,我将带着大家从新建文件夹开始,到成片发布,从零开始制作一分钟左右的 ai 动画,无论你是完全不懂 ai 视频领域的小白还是老手, 都能轻松跟上。为了不浪费大家时间,本系列教程直接划分为七个核心板块,剧情、脚本、人物设定、分镜生成、 镜头分镜、 ai 配音与音效生成、 ai 配乐和最后的剪辑成片,我会全部使用简单免费易懂的创作工具进行教学,相关制作流程提示词和 ai 工具我都以文档的形式整理好了,感兴趣的看置顶评论直接领取 资料拿到手后,我们直接开始今天的第一节课,如何用 ai 写出让人欲罢不能的影视集剧本。大家好,我们这期视频来讲解制作 ai 视频的过程当中经常需要用到的主流工具的操作概数,看一看各个生成平台 或者是操作工具各自都有什么特性,在制作 ai 视频时在哪些阶段会发挥什么样的效果。不过这节课只是概述具体该如何操作,在使用时有什么技巧,我们会在后续的课程当中给大家逐一进行讲解。我们首先来看极梦和豆包 ai, 它们两个都出自字节公司。来到极梦 ai 的 首页,目前极梦 ai 应该是 ai 视频生成平台当中性价比比较高的一个,大概生成一条视频 所消耗的点数换算成价格的话,也就是其他平台的三分之一不到。具体生成的效果大家可以直接看首页上由其他作者生成的作品,可以看到风格非常多样,且质量也实属上乘。 我们使用极梦 ai 的 时候,它最近更新了一个 i g 的 模式,这个模式可以更加智能的结合极梦 ai 的 各个功能来实现生成我们要求的内容。 具体的操作我们会在之后的课程当中详细讲解。目前极梦 ai 如果是非会员的话,每日登录会有六十六个点数的赠送,大约能够生成十条标准视频, 同时生成图片也是免费的,相比于一些连生成图片都要收费的 ai 平台,在极梦 ai 上生成图片可以说是一个性价比很高,几乎纯免费的选择。简单了解了极梦 ai, 我 们再来看豆包,在豆包上面可以实现非常多的有别于 图像和视频生成平台的功能。可以看到在豆包 ai 的 首页,它支持图像生成、写作、搜索、阅读、 编程、翻译等等。点击更多选项可以展开在豆包 ai 上可以实现的所有功能,甚至近期还有音乐生成功能以及和 ai 进行语音通话的功能,可以说功能十分全面。在豆包 ai 当中, 同样可以生成图片和视频,且使用的图片和视频生成模型是和极梦 ai 类似或者说一样的,因为同属于同一家公司,这点也不奇怪。在豆包 ai 上,除了功能要比极梦多很多之外, 豆包 ai 主要的优势在于它主要是一个大语言模型,在生成内容时,可以结合上下文我们已经提问过的内容或者生成过的内容来继续生成相关联的东西, 对我们创作 ai 视频时生成分镜头图片有着非常大的帮助。先前生成过的形象在之后生成时,在前后一致性上往往保持的不错,所以在创作 ai 视频时,无论是生成剧本、脚本 还是初步的生成一些分镜头图片,我们通常都是在豆包 ai 上进行的。我们下面再来看可怜 ai 平台, 如果大家先前使用过这个平台,可以看到当前平台的页面布局发生了非常大的变化。这里要说明一下,像我们使用的各种平台,随着模型版本的更新或者平台的优化, 在操作时其界面布局都会产生一定的变化,不过在变化之后,其基本功能都大同小异,无非是图片生成、视频生成或者一些与 ai 视频生成相关的工具,例如像视频模板可以生成对应的特效, 或者是由 ai 生成音效、音乐等等。目前普遍来看,可灵 ai 在 生成的画面质量和动作可控性上 相较于极梦 ai 可能会略胜一筹,但相比之下,其价格就会相对比较昂贵。可以看到,点击左下方的会员选项,进入到会员充值页面,其中黄金会员的标准价格是每个月五十八元,而且只有六百六十点灵感值,通常来说可以生成三十三个标准视频。 相比于极梦 ai, 每个月六十九元的基础会员有一千零八十个积分,能够生成二百一十六个视频,显然在性价比上不算太高。不过每个平台都有各自的优势,大家根据自己的需求来选择适合自己的平台就好。在可灵 ai 平台,它的各项功能和极梦 ai 都类似, 可以看到由其他作者生成的作品,同时像基础的图片生成以及视频生成功能也是具备的。不过相比之下,可连 ai 平台可能具备更多的和生成视频相关的一些辅助性功能,例如这里有一个多模态编辑选项,可以替换、增加或者删除视频当中的某些元素, 有些时候使用起来还是比较方便的。之所以说是有些时候,是因为在大多数情况下,我们创作 ai 视频在 一开始生成图片的时候,就已经规划好了画面当中事物的有无,不需要通过后期生成视频之后再去增减, 反而是一些真实拍摄的视频可能会用到这个功能,所以这项功能使用的机会不多。我们最后再来说明一下在什么时候用可灵 ai 比较合适。通常来说,在大部分情况下都是使用极梦 ai, 因为成本更低,且效果虽说会和可灵 ai 有 一定的差距,但差距不是特别的大 果,有些时候在生成事物运动状态的可控性方面,可灵 ai 也许做得更好。所以当使用极梦 ai 无论如何都生成不了某些动作或者某些运镜时,不妨尝试用可灵 ai 来生成。毕竟最终的美术风格是由图像决定的,只要在生成时使用的图像都是一样的, 最终取得的视频美术风格也不会有太大的差距,最终剪辑时是可以剪辑到一起的。那么既然说到剪辑,我们最后就来讲解一下在制作 ai 视频时,将视频生成平台生成的视频片段进行整合,添加配音、添加特效的工具剪映。 当然,如果大家有其他熟悉的剪辑软件,也可以继续用其他熟悉的,如果之前没有接触过剪辑软件,那剪映会是一个很容易上手的选择,且功能也比较丰富。 和豆包吉梦 ai 一 样,剪映同样是字节旗下的一款软件,在打开之后显示的就是当前这个界面,点击这里的开始创作就来到了操作页面。在这个页面可以将 ai 生成的视频片段导入到左上方的预备窗口中,在导入完成之后,我们可以将其拖拽到下方的时间轴上, 在时间轴上可以决定视频片段的长短,视频片段出现的先后顺序,同时给视频片段添加背景音或者人物对话的声音。同时可以看到在右上方有一片区域 是进行参数调节的,当选中了一个视频片段之后,右上方会出现和片段相关的参数流向、缩放大小、调整位置等等。 且随着 ai 模型的不断进步,可以看到目前还新增了一些 ai 补帧、 ai 扩图或者 ai 消除等功能。 如果想要使用这些功能,其实我们还有更好的选择,这些在之后的课程当中也会讲解到。总的来说,剪映的学习并不是十分困难,无非就是导入视频,剪辑长短,添加声音和特效,调整参数,最后导出就可以了。具体的操作细节 我们会在后续的课程当中给大家做十分详尽的讲解。好的,我们最后再来简单梳理一下制作 ai 视频的主流工具和大致流程吧。 在制作一个完整的 ai 视频作品时,我们会首先用到豆包或者极梦去创作视频的剧本和脚本,然后根据视频的剧本和脚本,利用豆包和极梦来生成对应的图片, 以此来当做图生视频的手帧、中间帧或者尾帧。在获取了手帧、中间帧以及尾帧图片之后,我们会利用极梦可令 ai 来生成对应的视频片段。最后就是用剪映将这些视频片段进行后期的加工,整合成一个完整的作品。 整个过程听起来比较简单,但如果具体到每一个工具上,其实会遇到诸多不同的情况,也会有很多操作技巧需要我们去熟练,不过在 ai 时代 其实再困难也不过是熟练软件操作,所以大家在后续的课程当中,只要能够一步步跟着我的操作进行学习,相信都能很快掌握 ai 视频制作的主流工具 及操作流程。那么以上就是本期视频的全部内容,下一期视频我们就来详细的讲解。极梦 ai 平台如果觉得本期视频的内容对你有帮助,也不妨点赞关注支持一下,我们就下期视频再见。大家好,我们这期视频来讲解一下可灵 ai 当中 在之前的课程当中没有讲到的多模态编辑功能,可以看到在多模态编辑功能下方有三个选项,分别是替换元素、增加元素以及删除元素。 首先来看替换元素,这里需要上传的是一个视频以及需要替换的元素图片,例如现在我们上传一个老人和猫的视频, 在上传好之后会弹出一个新的窗口,在这个窗口当中我们需要选择要进行替换的内容,例如现在我们点击视频当中猫的部分,此 时猫这个部分就会被选中,或者点击画面当中人的部分,此时人的部分同样会被选中。当然并不是每次单机都能够完整的选中某些物体,如 如果没有完全选中的话,可以在没有选中的部分再点击一次,这样一来选择的就会更加完善。比如这里猫的耳朵的部分,在选择完成之后, 就要点击右下方的预览完整选区,来预览一下是否整个视频的播放过程中,人物和猫或者说我们其他被选中的部分都会显示为绿色,我们现在点击等待它自动识别,可以看到此时播放的视频,整个段落人物和猫几乎都是绿色的, 这就意味着将来在进行元素替换时,视频当中的人物和猫都不会留有太多的痕迹。点击左上方退回到之前的页面,现在我们需要上传一张用于替换的 画面元素,例如现在就上传这张狗的图像,在上传好之后同样会弹出一个窗口,这个窗口用于选择我们所参考的是图像当中的哪个部分是主体部分,如果上传的是人物的话,还可以选择是参考人物的面部或者人物的服装。而选择自定义选项的话,这里会有一根选区笔。 选中画面当中我们要参考什么部分,通常来说选择智能参考就足够了,选择好之后,点击右下方的确认。我们此次替换就选择原视频当中猫的部分,所以这里我们选择下方的减少选区功能, 将原先人物身上的选区点进行删减,如果删减的不够完善,可以看到在右下方还有一个清空全部选区,在清空结束之后,再次点击重新选择需要替换的部分, 确认无物后,点击右下方的确定。此时我们要做的就是把视频当中的猫换成参考图当中的狗,直接生成就可以了,但如果想要生成的效果更好,也可以配合提示词的描述。可以看到这里的提示词已经给出了既定的框架,这里会描述使用图片当中的什么, 替换视频当中的什么。我们要做的就是在中括号当中来填写名称,使用图片当中的狗替换视频当中的猫,在写好之后就直接点击下方的生成,这里我已经提前做好了一个替换效果,可以看到整体的替换效果还是不错的,成功的是原视频当中的猫变成了狗,但也不难发现,替换之后 狗的部分在分辨率上会比较低,呈现出了一种比较模糊的状态。这是由于我们当前使用的多模态编辑功能只支持一点六模型, 而目前最新的视频生成模型是二点五模型,所以之后可能还需要用到一些提升视频画质的软件来提升一下视频的清晰度。我们再来看下方的删除元素功能,这项功能的使用方法和替换元素大同小异。将视频上传好之后,点击上传的位置,会打开编辑窗口, 然后用鼠标点击我们需要进行删除的元素,在这里预览完整的效果,确认无误后点击确定,这样一来要删除的内容就设置好了, 同时也可以配合提示词的描述,这里直接写作删除视频中的猫,这样一来生成的结果画面当中就不会出现猫,只有老人了。对于增加元素和替换以及删除元素的操作有所不同。在增加元素的位置,我们点击视频上传选项,并不会弹出新的窗口, 让我们对视频进行选中内容来编辑,而是在上传好视频之后,下方上传需要新增元素的参考图, 然后使用提示词描述的方式来告诉 ai 在 视频当中的什么位置添加什么东西。例如这里当前的功能已经提前写好了框架,我们只需要填空就行了,基于视频中的原始内容,以自然生动的方式将图片中的什么,这里 我们写狗融入到视频中的什么,这里我们写位置,比如写猫的旁边,在写好之后就点击生成,一段时间后视频就生成好了,我们来看一看效果如何吧。可以看到,虽然在体型上不是特别匹配,但也成功的让这只狗 出现在了猫的旁边。总结来说,在使用多模态编辑时,确实可以将视频当中原有的内容进行元素替换、增加或者删减,但实际呈现的效果虽然说并没有太糟糕,但也会出现在比例和画质上的问题, 其中的主要原因也受限于当前的功能只能使用一点六的视频生成模型,我们只能期待将来会有版本标号更高的模型能够使用这个功能获取更好的效果。 同时也建议大家在进行画面的元素替换、增加或者删减时,尽量先使用图片生成功能对画面当中的元素进行替换、增加和删减,再使用视频生成功能重新生成视频画面,这样不仅得到的画质更加优秀,效果更加自然, 同时也能减少生成视频所消耗的成本。以上就是关于可灵 ai 中关于多模态编辑相关的操作,如果觉得本期视频的内容对你有帮助,也不妨点赞、关注、支持一下,我们就下期视频再见!

还在为找不到 app 功能发愁吗?今天我就带大家一秒玩转二零二六最新版豆包 app, 新手也能秒变大神!打开 app, 最先看到的就是底部这四个导航按钮, 从左到右依次是对话、智能体创作和我的所有功能入口都在这了。先看最左边的对话页,这可是咱们的主场!顶部能新建对话、查看历史和设置, 中间就是聊天区,长按消息还能复制重发。底部输入区支持打字、发语音、传图片文件连链接都能直接粘贴分析,是不是超方便! 再滑到智能体页面,这里简直是百宝箱,编程助手、写作教练、解题老师应有尽有。还能自定义专属智能体,设定身份性格,一键切换就能应对不同场景,学习工作都能帮上忙, 创作页面更是惊喜满满。纹身图支持写实、动漫多种风格,纹身视频用 cds 二点零技术,十到六十秒视频轻松生成。还有文案写作功能,周报、简历、情书、演讲稿输入需求就能一键搞定, 总结、翻译、朗读也是样样在行。最右边的我的页面,历史对话随时查看,搜索重要内容可以收藏,账号设置、主题皮肤、 声音克隆都在这里,创作额度和会员信息也能一目了然。对了,输入框左侧的加号菜单藏着不少宝藏功能, 图像生成、视频生成、文件上传,扫一扫,还有超酷的声音克隆,录制自己的声音就能用于朗读和对话,快去试试吧!顶部的新建对话和搜索按钮,也别忘了开启新话题。查找历史内容还是需要识图解析, 文件翻译、豆包、 app 都能满足你,电脑端也同步上线了, windows 和 mac os 都能用,支持扫码登录和多窗口操作,办公写作更高效。想解锁更多实用功能,赶紧点击下方链接,体验二零二六最新版豆包 app 吧!

动态特效闪现人物变身 cds 人物转三 d 真人 人物替换 window 场景结构用 jimmy nike nova 特。