粉丝193获赞259

为什么二零二六年视频创作者必须要学会 ai? 刚好最近字节呢,也是杀疯了,他们上线了一个超级厉害的视频模型, c 档是二点零,有多强呢?这种慢剧广告, 这是短剧,怎么还没出来?四根全是阳性,什么 vlog 都是用它一句话生成的, 接下来我给大家用几个案例测试一下啊。然后最近这种仙侠漫剧不是特别火吗?然后呢,我上传了三张图片,让他帮我生成一个十五秒的仙侠高燃战斗视频,最终出来的效果呢,是这样的, 哼, 动作呢,其实是非常复杂的,但是它也能够非常流畅的去完成它,它能够自动去生成风景音乐音效,在特效上呢,也非常高级,而且镜头的切换,全景中景特写啊,这些都有 c 杠子。二点零呢,目前可能是 ai 界最强的视频模型。然后呢,我就拿出了人类最强打斗分镜鸟山明的龙珠出战, 让他参考分镜,生成一段大斗视频,看下效果啊, 你看到分镜切换非常流畅,节奏把控到位,音乐音效呢,也很合适。然后呢,我又翻出了龙珠的动画对比了一下, 不愧是人类最强动漫,打斗情绪渲染力,还有打斗的力量爆发感呢,也是 ai 目前没法比的,所以我觉得 ai 还需要再卷一下下,但如果你要做二改或环外篇呢,我觉得是够了, 虽然离人类最强还有距离,但是像这种真人感的短剧怎么还没出来? 四根全是阳性,什么?天呐,我们怎么养得起四个孩子?其实从质感上面来看啊,你说他的画面还是声音是真人的,我都会相信。其实这一段我只是在网上找了一个段子,然后直接让他帮我生成一个短句就可以了, 以后你刷到的短剧可能都不一定是真人,我连本带利全部拿回来。然后呢?我想试试他到底能不能一句话做商业广告。我上传一张图片,然后一句话让他帮我生成一个 t v c 自改的广告,而且必须是快节奏, 快节奏,慢节奏他都能听得懂。 我数了一下,一共是差不多十八个镜头,这让我真的感觉到 ai 的 进化真的太快了,学习能力、复刻能力远远超于我们人类, 包括剪辑上的卡点都是由他自己来完成啊。用了我们专业剪辑,里面的跳切质感和我们平时看到的 t v c 广告其实已经差不多了。关键是它只需要一句话呀,一句话,甲方都不止对你说一句话。 回到我们最开始的问题,为什么二零二六年视频创作者必须要学会 ai 呢?因为技术门槛儿正在降低,审美门槛儿正在重建。这一反逼着我们去思考我们要做什么。未来的超级个体呢?是一个人,就是一支队伍。那这期视频呢?先到这里,下期视频再见。拜拜。

被 cds 刷屏了,阿婆看到后就是慌张,于是试了试,之前阿婆不是做过 ai 视频吗?那个时候用的是 banana comfy, ui 做的差不多是这样, to realize, i got a feeding but i。 当时 ai 还不能理解什么是镜像,就很艰难,疯狂抽卡,一个镜头前前后后要抽几个小时都只能勉强用。而现在用 cds 不 抽卡,一次性出效果是这样的, 太强了呀!就是他的分镜效果,还有角色定位以及对镜子的理解都太强了,还自己配音,配乐逆天!然后阿婆又试了试其他的效果,比如权宗哲大战剑修夜顺光的二 d 动画,也是一次性不抽卡 呀。哦哦,最后是一张图和场景的结合,三小只的混战,我还没弄人设图,就一张海报图,场景就是游戏里拍了一下,结果。啊啊 啊啊啊啊啊啊, 别打了别打了,给动画行业留一条生路吧!还说啥呢,如此低门槛的就能出这种动画视频,这一切都太恐怖了。四杰这种大企业的 ai 实在是太强了。 这话不是广告,而是感叹。还有一句感叹是人类一败涂地,发展太快了。阿婆也陷入了深深的思考,今天本来是更新其他视频的,被时代浪潮冲击的有一种脱力感。最后来点正能量吧。祝大家新年好! 新年快乐!祝各位新年快乐,万事如意!哎,这也别愣着呀,给大家拜年!新年快乐!愿你在新的一年里心想事成,万事如意!

如何解决 ai 短片中角色音色不一致问题?其实这个问题 cds 二点零已经彻底帮我们解决了。二点零除了支持图片视频参考外,其实它还支持音频参考。先听听这条刚录的声音,死胖子 天天, ai, ai 眼里还有我这个老婆吗?你干脆就和 ai 过一辈子去吧! 现在将这条音色赋予这个美女,要做什么呢?我要还原刚刚音频中发生的事情。整个过程如下,将他丢给 cds 二点零,人物角色场景图以及参考音频也一同传上去。在剧情前面艾特对应的参考素材, 在对应的人物后面加上这句话,语气和音色参考对应音频,男人此时已丧失发言权,不配说话,也不敢说话,所以参考音色无现在发送出去,我们来看看怎么肥四吧! 死胖子天天, ai, ai 眼里还有我这个老婆吗?你干脆就和 ai 过一辈子去吧! 声音参考就是这么简单,当我们在创作下个视频时,爱的相同音频就能完美保持角色音色一致。我真是怎么会看上这个死胖子,当初,当初还说要陪我一辈子, 现在现在全是 ai, ai 甚至还能让他使用这个音色用粤语唱着伤心情歌, 现在你学会了吗?那问题来了,现在这种情况我该怎么办?请支个招,在线等急!

这两天最让人兴奋的事情就是极梦的新模型了, c dance 二点零一上线直接炸锅,对那些国内外 ai 视频工具完全是致命性打击。大家看一下这个广告熟不熟?喂,你的风油精 是你的风油精?是的,我直接把你的益达广告片扔进去给吉梦参考,然后上传了一张风油精图加男女主照片, 一部广告片就搞定了。这样复杂的打斗场面,你是不是还认为需要永长的动作提示词?还得构思运镜?我告诉你有多简单。我把一个打斗视频画面给了积梦参考,再加上人物图片,跟他说一句在天台打架视频直接完成。 大家猜我做这个黑色星期五活动宣传片花了多少时间?两分钟,我找了一段六幺八宣传片给了季梦参考,然后跟他说一句, 参考这个风格,生成黑色星期五的宣传片,把里面的文字都换成黑色星期五相关的内容。你看好了,这个用 ae 做至少得花两天时间。 为什么这次大家的反应会这么大?因为过去这些视频搭工作流分,禁写题日词需要大半天,但现在不用了,这一切完全变了,以后真的没有什么视频画面是做不出来的了。 cds 二点零把这一切的门槛铲平了, 只要脑洞够大,各种离谱的玩法都能实现。大家应该见过各种短视频主播跳扫腿舞,那你见过你全家人一起跳扫腿舞吗?直接把原扫腿舞视频和全家人合照给寂寞参考,让他把视频里的所有人换成全家人。灯光、运镜、动作等保持不变。 这个模型可以精准捕捉人物动作,并保持新的人物形象,完整身材比例和气质神态都能完美参考。 我觉得做电商的人应该会特别激动,你看我这套衣服图来传进去给他个提示词,大意就是设成一个穿搭博主,把图中的商品都穿在身上进行展示来看一下, 就真的有个模特把衣服都穿上了,一次性非常完美,所有商品上身后都没有变形,你看白底格子衫外套,完全一样,连这么小的表都识别到了,戴手上了。这以后做产品展示视频得省多少时间?而且如果你有想让模特输的话,也可以放进提示词里, 就能提升质感,无论小个子高个子都可以穿。还有这个,看这个水蜜桃的宣传片是不是很专业?我现在把西红柿图片传进去,然后瞬间变成西红柿的宣传片, 就是只要你有参考,你卖的任何东西都可以产出专业级产品宣传片,而且操作简直就是老奶奶都会的程度。还可以把背景换成任何你想要的背景,有没有觉得天亮了的感觉?再也不用 古哈哈。制作视频宣传物料,做电商的就应该专心卖产品,这些产品展示视频就应该交给 ai 去搞,这个功能拿来做慢剧真的不要太爽。过去需要先从分镜图开始,现在几句提示词就能实现衔接流畅,运镜到位的画面。你看我这个提示词有多简单, 选一个预告片,图一的图二在战斗,你看我最后还给了文字图让他定格,他也能完美融入最后的画面,而且保持不变形。是不是有预告片的效果了?不够的剧情还可以续写,注意,不仅能往后续写,还支持往前续写。我就只有一张文字图,他就帮我续写出了完整的片子。 哥,是你吗?这就要命了,以后真的没什么不完整的剧情了。 这是季梦的 cds 二点零模型,很多人都激动的睡不着。这种颠覆性的产能提升,不管是商业广告和营销,或者慢剧、短剧、影视的行业都是前所未有的提升。另外他的图片模型也升级了,一样,是指哪打哪精准升图,这简直是创作的万能钥匙,现在限制我们的真的只剩下想象力了。

c 弹子二点零最近刷屏了,很多人第一反应是 ai 做视频更像了,但我看完只想说一句,这次不是像不像的问题,而是 ai 开始按物理规律生成世界。什么意思?当你看到机甲高速摩擦地面时,火花往哪飞,亮度怎么衰竭? 看到重物倒地时,粉尘怎么翻滚,气浪怎么扩散,甚至玻璃碎裂的瞬间,画面和声音是同步长出来的。这不是素材拼接,也不是模板特效,而是模型在底层推演力怎么传递,能量怎么释放。说白了,视觉模型正在从 模仿世界走向理解世界,这是一次待机变化。但如果你只看到模型更强,那其实还只看到了上半场。因为当模型开始理解世界,真正决定行业高度的,反而不再只是模型本身, 而是你有没有能力把模型的能力变成稳定、优质、快速交付的工程系统。为什么这么说?因为模型越强,对最终落地层面的要求就越高,尤其是一致性。比如人物前后是不是同一个人,侧面、正面、背面看是不是一张脸? 场景换机位之后,柱子、窗户光线位置还对不对的上?人物走进场景是不是还站在合理位置?如果这些问题解决不了,那即使模型再强,出来的也可能只是 demo, 不是 作品。甚至连 cds 自己都讲的很坦诚, 他最近也专门发文说,目前 cds 在 细节稳定性、多人口型匹配复杂,编辑上还存在不足,需要持续优化。翻译一下就是 短期内很难出现保证每一次生成都完美的模型。所以现在比拼的已经不只是模型少几个 bug, 而是谁能把不完美的模型 跑成稳定交付的流水线。尤其当下 ai 已经开始进入百亿智能体协同的阶段,真正拉开差距的,正在从模型本身转向应用层和系统能力。这就好比最近的 oslo 模型,未必碾压 open ai, 但靠智能体形态反而在很多场景里跑到了前面。 所以下半场拼的不只是模型参数,而是内容生产范式和真正解决产业问题的能力。那么这里给你一个更明确的判断,行业真正的分水岭,正在从谁的模型更强,变成 谁能把模型跑成流水线。说的再具体点,就是从 ai 视频的抽卡式生成走向工程化生产。说穿了就七个字,先搭世界再拍片。也就是先把角色建成资产,把场景建成空间,把道具 光线布局全部确定下来,再让 ai 在 这个世界里拍。这套逻辑本质上跟电影工业一模一样。你想想,导演拍电影,一定是先搭紧选角定美术,然后才开机,而不是上来就按快门赌运气。 而对于这件事,国内首个工业级 ai 漫剧智能体生产平台纳米漫剧流水线,本质上干的 就是把这套电影工业的方法搬进 ai 系统。它不是给你一个生成按钮,而是给你一整套,从剧本拆成分进脚本到角色场景自动入库,再进入空间引擎,并在同一个空间里切机位, 丝滑生成分镜图、分镜视频,最终完成剪辑成片。换句话说,当以上这些都变成可附用的底层资产,人物才不会乱变场景,才不会穿帮镜头切换才有空间逻辑,你会发现,这已经不是玩 ai 作画,而是在用 ai 拍电影。 同时你再想想,如果这时候再叠加像 cds 这种开始理解物理规律的视觉模型,会发生什么?简单说就是模型负责越来越真实, 流水线负责越来越稳定,两者叠加才是真正的内容生产力革命。所以我给你一个结论,未来 ai 内容行业真正值钱的不是谁先用到最强模型,而是谁先建好把模型快速 持续的变成优质作品的系统能力。最后总结一句,模型决定能力上限,流水线决定产业化上限,前者解决能不能生成,后者解决能不能规模化生产。当能力上线叠加产业化上线, ai 内容才第一次进入工业时代。 所以我说这才是 c 弹子这类模型进化和纳米 ai 这种慢距流水线出现在同一个时间点爆发的真正原因。 那么你觉得当一个人就能用一条纳米 ai 漫剧流水线拍出电影级漫剧,你最想先拍什么题材?历史?科幻?悬疑?还是现实主义?评论区聊聊。

为什么说美国在 ai 领域永远也追不上中国呢?就拿这次新发布的 sedans 二点零来说,绝对是又一个国运级别的 ai 模型,它的诞生直接让马斯克惊呼,这一切发生的太快了。 如果你实在想不明白中国 ai 为什么这么强,那我们不妨换个思路,为什么全世界只有中国和美国配玩 ai? 现在世界上你能想到的主流 ai 豆包千问基本上全是中美的。 之所以出现这种局面,就是因为中文和英文是世界上断档领先的两个宇宙。玩过 ai 视频的应该就能体会,有时候你给他一个很简单的指令,想让它生成一个你需要的图片或视频,结果那个没脑子的 ai 就是 给你做不出来。有时候可能不是你的表达有问题, 而是在于 ai, 它不是人类理解不了你语言中所包含的感情和隐喻。所以我自己在做视频的过程中,如果需要 ai 辅助,就会特意把一句指令掰开揉碎了喂给他, 感觉像是教小孩学说话一样。但即便是这样,我们中国的 ai 大 模型在全世界已经算是非常好用的一批了。 美国 ai 的 算法固然领先,做出来的效果很丝滑,但你如果用过之后就会发现,和他们沟通简直比对牛弹琴还难,有时候忙活一天也出不了几条能用的成片。 可以这么说,我们目前能看到能用到的 ai 大 模型,要么是亿万国人涌入互联网浪潮才换来的成果,要么是全世界那么多英语国家几十年奋斗的结晶。在这里预判一下某些人的疑惑, 为什么都是说英文 ai 只有美国能做,而英国做不出来?那你就要去问伦敦街头那些抗议游行的程序员了。中国 ai 之所以领先,除了中文这个语言系统断崖式碾压以外,还有不容忽视的一点就是宏观经济的带动。当初 ai 刚出现时, 很多人都担心自己未来会不会被机器人抢走工作,可到了现在,我们逐渐就发现了,和 ai 不 沾边的工作压根不用担心被抢, 和 ai 沾边的工作,更多的则是把它当成一个生产力工具。而那些巨头们的全力投入、创业公司在自己垂直领域的深耕,就让国产 ai 出现了一个极其恐怖的成长周期。 在大浪淘沙般的洗礼之下,老选手有的坚持,有的退场,新事里层出不穷,想要活下来,就必须学会错峰竞争。正因如此,我们也能经常在网上刷到很多 ai 测评视频, 写文章用哪家,做视频用哪家?问问题用哪家。每一款 ai 功能多样,但对自己擅长的领域则是专精的。比如我们视频一开头提到的 cds 二点零,就是个典型的偏科生。最近你肯定在网上刷到各种人物大战奥特曼的视频, 无论是分镜还是武打动作,包括激光和武器特效,几乎找不出 ai 痕迹。专业性的东西,这里就不现学现卖了,你只用看视频就能感受到这款 ai 模型的恐怖之处。 有些画面如果我不说这是 ai, 乍一看估计都以为是真人,不能说完美无缺吧,最起码也比以前的 ai 强太多了。这就是错峰竞争所带来的成果。 早在二零一七年,纽约时报在采访了一众美国官员和 it 精英后,就得出了一个结论,在广袤的 ai 领域,中国将和美国齐头并进。 现在看来,纽约时报还是太乐观了,中国 ai 虽然很多都是偏科生,但在各自所擅长的领域,美国真的很难追得上中国本质上就只有一个原因, ai 训练需要大量的人工数据。至于美国的那些高精尖人才都去哪了,那你就去和美国的斩杀线说吧。

这两天有个叫 cds 二点零的家伙迈着六亲不认的步伐走来了,所以他有那么强吗?把这个视频里的角色换成小猫和小狗。楼上三二二住的是马冬梅家吗?马什么马冬梅什么冬梅啊 马冬梅呀马什么梅呀!去掉视频里的人物,把这个视频的运镜应用到这个产品里,用嘴 p 视频的时代真的来了,那这期视频我将教会你 cds 二点零全部玩法。 在小梦梦里,选择视频生成模型,选择 cds 二点零,选择全能参考,再上传宠物玩手机的图片,输入这段提示词,告诉他在规定的时间内做出指定的动作。点击生成, 继续给他一张产品图,再输入这段提示,交代好在规定的时间内做出指定的内容,你就会得到这样的商业大片, 用色彩唤醒活力年轻色彩活力全开, bg 色彩年轻活力无限。先准备一段参考视频,再把要替换的角色和视频都上传进来,输入这段提示词,点击艾特,选择视频,告诉他把视频里的人换成图片里的人物,并模仿视频中的运镜和动作背景换成古代街头 怎么样? 同样给他一段参考视频和产品图,让他把这个产品参考这个视频的运镜,就能得到这样的视频效果。 像这样的广告大片现在也能轻松的复刻出来。 当然你还可以上传一段自己拍摄的视频,再输入这段提示词,你就可以得到。这样 给他两张角色图片和场景图片,再输入这段提示词,你就可以得到一段打斗的片段。 那这是我提前生成好的一组九宫格分镜图片,现在只需简单的描述,你看他竟然能自动切换镜头。总之以上玩法都可以结合使用。对面几个人 是表哥吗?呃呃呃,是表弟呀啊表哥。哈哈哈哈你不要过来呀。 ai 创作虽便捷合规,底线不能越文明玩 ai 创作更精彩,拒绝滥用肖像,尊重影视版权,魔改有风险,创作需谨慎。

为什么你的导入视频很随机?是因为你没有掌握这个题词控制技巧。首先在这里点击视频生成,选择二点零 fast 模式, 速度更快,效果也差不多。输入这段贴纸,贴纸公式如下,每个镜头都按照公式写清楚镜头时间、运镜动作和特效,你就能稳稳控制打斗视频的每个精彩瞬间。我是爱豆版,我们下期见!

坎大人,你消消气,滚开,大人,你别进去,老婆,给老子出来,老头子您来了。

各位好,自从 cds 二点零问世,为了找到控制这个超强模型的方法,帮我们最高效的去制作动漫啊,我和粉丝们整整花了三天时间,一起在直播间进行了非常多的测试,也很感谢这几天有我的粉丝的陪伴,希望你们在评论区可以留下你们的帅屏让我看看。 那么在测试的过程当中呢,我们陆续使用了市面上主流的以及我们设想过的不同方法,这里呢我决定分别做几期视频,告诉大家每种制作方法的优点和缺点。 那么在这里我首先把几种可以控制的内容做成了表格啊,大家可以简单的观看。最右侧是我个人的推荐指数,就是你做剧的过程中使用的这个推荐方法。 以上仅代表个人观点,如果有不同的观点我们可以留言讨论,那当然了,就是以上的推荐指数呢,均以做剧的角度考虑啊,我不考虑短片,短视频等方向啊,如果你只是想出一个绚丽的广告片短片,那么以上的方法可能都不适合你, 那当然除了测试的方法以外啊,我们还有各种的小技巧啊,也通过我们这几天的摸索,不断的摸索出来, 在这个短系列当中,我们也会逐步的分享给大家。那这个视频是我们这个系列的第一个视频啊,这个系列可以叫就是 cds 二点零的 ai 动漫制作方法啊,我将把自己认为最好的方法在这里分享给大家,那 万分感谢你的观看,同时也请你一定看到最后啊。首先我们先看一下使用这种方式制作的三十八秒片段 啊,注意,这里的三十八秒是我用了三个十五秒拼接的拼接的,因为有很多小伙伴说,哎,那我如果用了 cds 二点零,视频跟视频之间要怎么拼接呢?就是两个十五秒要怎么拼接呢?这里给大家做了一个简单的示范,这个片段取自于脑动脉交响视频,没有任何使用,就是视频参考的功能啊, 使用了参考图,也就是我们讲的关键帧加提示词的方式啊。我们在这里先看一下整个动漫片段的效果,我一定要改变自己,我真的可以吗? 不要哀求,学会争取, 若是如此,终有所获。 ok, 那 么看完了之后呢?为了防止我自己做的就是有评价,有偏颇,我给了两个同样看过这本剧的朋友们看了一下这个片段, 他们有点兴奋的问我是不是交响诗篇就是出重制版了,然后怎么是中文的?这个时候我知道了,这个方法的确可行啊。啊,我觉得 cds 二点零你简直是个天才,真的是一个好强好强的模型。那么言归正传,我觉得我们在讨论方法之前呢,首先得谈论一下制作慢剧这件事情, ai 它最重要的能力是什么? 又或者说 ai 对 我们而言最重要的能力是什么?是创意能力?是动作能力?是特效吗?还是完全真,还是诱式音效的配合等等要好? 在我看来的话,就是我个人认为 ai 应该拥有的最重要能力叫控制能力,那恰好这个模型可以说控制力完全拉满,甚至可以夸张的帮助我们接力思考,完成接下来的剧情延展,画面的延伸,还有稳定性的控制,真的很夸张, 就是这个模型出来之后呢,我感觉自己看到了个非常可怕之物,不过也同时看到了颠覆新世界之门啊,没错,是一扇改变影视行业,动漫行业通往新世界的门啊,请燃烧我的中二魂! ok, 那 么前面讲完了对模型的吹捧啊,但是我们真正在制作的时候还是会碰到很多问题,因此我们才测试了大量的一个方法,寻找方法之中最能符合我们制作的一种。 那么在这里的话,我找到了关键帧加分镜提示词这种方式。首先什么是关键帧啊?关键帧就是动画里定动作定状态的核心画面,核心画面啊,而不是我们传统的首尾帧,这里是有区别的。然后第二个 分镜提示词,分镜提示词是依照于关键帧的,就是跟每一个关键帧去配套,你的每一个镜头里面是怎么描述的啊?然后关键帧在中间的什么位置,然后你的音效,然后你的时长,然后你的运镜方式是怎么样的?这个就是我们的提示词构成。 那么在这里我简单列了一下上面的六个关键帧啊,以及我们对应的六个镜头它中间的一些内容。这里的话我截了一下我在记梦里面的图片, 我们可以看到,呃,就是我这边其实是使用了七张分镜图,七张分镜图,然后又有一个两张的人物图,这两个人物是为了就是帮助 ai 去判断整个人物的形象是长这样的啊,然后就防止它出现跑偏等情况。注意,这里一共给了九张参考图, cds 二点零,目前测试下来最高的也是九张啊,同时它还能放入视频加音频,时长总计十五秒 啊,就是他整一个能放入的文件大大增加了,只是他目前还没有出现资产库这样一个功能啊,相信未来也会出现这样的功能啊。 好,为了更好的方便大家理解呢,这里我把图片跟提示词对应起来,每一个镜头的图片跟提示词如果我们对应起来,你就会知道具体发生了什么事情。首先是第一张图片,第一张图片呢,会发现红头发的人物跟黄头发的人物他们有一个交汇,就是说明对话要开场了。 好,然后这里我们给到一个镜头,小林坐在位置上喝咖啡,然后卡尔进入到画框图片所在的位置。哦,这里艾特的是这张图片, 然后叫了一下小林,然后小林接着回头抬头看了卡尔一眼,固定镜头,那么这里的话就是把我们刚才讲的啊,运镜画面描述,镜头序号,镜头时长,还有就是人物这些内容告诉了 ai, 然后 ai 就 帮我们制作出了对应的第一个镜头, 当然这跟我们传统的就是首尾针的制作方式有一点像,就是你一个一个镜头的剪啊,但是实际上也还是有挺大的差别的,我们回头再看,然后第二个镜头,这里的话,我们使用的是一个类似首尾针的这么一个功能啊,就是告诉 告诉 ai, 我 们的镜头是这样的,那么在镜头二里面啊,二到四秒,镜头反打至参考图啊,参考图是上面这张,这里,然后接着固定镜头,卡尔从背后掏出的礼物是背后,所以他有一个从背后掏出来的动作,接着高举礼物开心的递给小林,那么该镜头的尾帧是这个 就是我在一个镜头之内告诉他了收尾帧,这个就是他非常夸张的一个理解和推理能力 好。那么在镜头三里面呢,我们使用了四到七秒啊,镜头切换至这个就是告诉他画面的开始就是这样的一个开场。小林疑惑的看着小林是这个人物,然后歪着头,头上出现了一个问号,然后小林伸出左手接过的礼盒,拿在手中 固定镜头啊,这里跟前面其实也是一样的一个推理,接着第四个镜头啊,因为我们的镜头聚焦到人物的近景了,然后这时候再把镜头拉远,再回到人物的一个中景,七到九秒,镜头切换至这个图片啊,然后同时手中的礼物角度和镜头三保持一致,是这个 镜头三啊,就是防止他的人手一下收回来了。然后小林疑惑的说到,卡尔,你是抽的哪门子风啊?就是这个是对话内容,我们在对话的时候也要关注你的镜头时间,比如说我这里是七到九秒, 他这个镜头时间能不能满足。说这样一段话,如果你不知道怎么办,你就自己念一遍,看看要几秒钟。卡尔,你这是抽的哪门子风啊?可能两秒钟是差不多的, ok, 那 么我们就把这个两秒钟的对话内容填进去, ai 会帮我们自动的判断。 那么镜头五啊,我们再切到人物的一个近景,然后九到十二秒,卡尔身上冒出了很多的爱心,爱心是特效啊,发出粉色的爱心的光,但是他可能会参考这个图片啊,爱心不断的从身体里飘出,卡尔身子扭动,表现的娇羞和兴奋。这是一个固定镜头, 最后啊,然后小林叹了一口气,说,你是不是认错我的性别了?然后用这个镜头,其实我们可以看到是啥呢?你把每一个分镜的分镜头做出来关键帧,然后关键帧匹配对应的镜头提示词, 这个镜头提示词是描写该镜头内发生了什么,以该张参考图为主要的匹配方式。 ok, 那 么在这里的话,我们就来看一下整个成片的效果。小林,嘿嘿, 卡尔,你这是抽的哪门子风,是不是认错我的性别了? ok, 这是跑了一遍就跑出来的,其实没有多余的制作,我认为他制作的水准和原片几乎是一样的啊,控制力几乎拉满了。这里我们来看一下原片,再做一下对比。 小林,嗯,怎么了?嘿嘿,给你情人节快乐,尝尝看吧。 啊哈,托儿,什么?当然了,我们看完了原片之后,还是要秉持着最客观的态度来给视频挑一下刺啊。首先,在这个画面里面, 他加了一个我不想要的转场,因为我这里想要的是固定镜头,但是他有一个渐显跟渐影的一个叠化转场,那这个叠化转场其实在我看来不是很舒服啊。我们可以看到是这样的一个画面, 好人物的这些配音,包括问号的配音都感觉挺好的。然后其实这个画面的镜头其实我没有给到他啊,这里是 ai 自动推理出来的 啊,这个自动推理出来的问题倒不大因为这里的确是有一扇门啊但是有的时候他给我们推理呢比如说这里本来是一扇门他给我们变成墙了。 ok 那 么这个镜头咱们就用不了了。 然后人物的背视呢是因为我前面给过他背视图所以他能很轻松的把这个图片给做出来啊只是在我看来这个镜头是我没有给他的所以我在这里觉得有点美中不足。但这个镜头可以用吗。可以用的你这是抽的哪门子风 好。然后这里又用了一个叠化的转场这个叠化的转场是我不太喜欢的至少我个人不太喜欢啊我希望他是固定的。硬切 是不是认错我的性别了。好那么整体的话跟我们的每一个分镜头其实基本都是完美对应的除了就是增加了一个分镜头啊这个分镜头可能是我不太想要的是把这个分镜头替换了 但是其他的全部都按我们的镜头来所以怎么说呢啊这个控制能力我认为是可以达到百分之九十以上的强度了有的时候如果你觉得不满意你可以改一下提示词再多跑一遍啊一般来说我们的费偏比一比一都已经很高了。好的那么挑完了刺那我想你是不是会说呢 啊这个好像就等于我们以前的手搓嘛每一个镜头然后给他拼接起来对吧。啊所以我们简单的也可以叫他其实是手搓的。进化版好像也没有发现什么新大陆嘛这好像只是用了这个新模型进行了加速哎根本就没有什么飞跃性的进步,对吧? 但是如果你这么想,我就想说,兄弟你可能错了, ok, 接下来我们就去讲述 c, 但是二点零在这种操作方式之下,跟我们原来的差异到底在哪里?又给我们提供了哪些非常净化的能力? 那当然了,我们使用的都是叫全能参考这个模式啊,我们并没有使用收尾针,因为他的参考能力达到了天花板,他可以完全按照你的参考来。 那首先我们这里就要讲一下关键帧的制作,而在以往的话,我们更多的是用首尾帧去进行拼接,因为很多模型它的参考的能力其实并没有那么强,包括大家用的很多的,比如说像 solo 二这样的模型,它也只有手帧的一张图片给你去使用。 不过在 cds 二点零这里啊,它的关键帧制作就会变得相对的简单很多,那关键帧跟首尾帧它有什么区别呢?首先这里我们要讲一下啊,为什么我们使用的是关键帧而非首尾帧,因为我们需要这个人物在场景中的一个重要作用。 我们简单的来举个例子啊,以往像我们第一个镜头,像这个图,我们如果要做出右侧的这个,这个就是我们那个画面还没有开始的状态啊,左侧人物是一个空镜,人物是一个空镜, ok, 这个人物需要从这里走到这里,要我们以往需要怎么做? 懂行的小伙伴一定想到了首尾针,没有任何办法使用首尾针,对吧?但是在我们这里的话就不需要了, 我只需要给他一个中间针,也就是这样一个动作的关键针就行了,这个关键针要把里面的内容全部表现出来即可,他手上拿着东西,然后他整个人物的一个状态,他在屏幕中的一个位置就可以了。 ok, 现在我们来看一下这里面的一个动作。 ok, 到这里其实才是一个尾针,我们可以看到手针是这样,然后尾针是这样,其实我们这张图只是在中间进行了这样的一个中间针而已,那这样的一张关键针对我们来说制作的难度就会比原来要低很多。 首先像这样的场景不需要直接做手尾针了,除非你要固定它的动作啊,有的动作你可以让它自由发挥嘛,你就不需要去固定了。 其实很多的关键针就是他的制作会相对简单,因为比如你要让人物在这张图里面既做出这个样子,又做出右侧的人物测试的这个样子啊,这个图其实是有点难做的,但是我们这里并不需要 去把这张复杂的图做出来,我们只要做一张最简单的右侧人物,他是一个背时状态,左侧人物呢?他是一个走过来的这个状态就行了,那这样的话对我们制作就会相对的简单很多。 好,那我们再看一下提示词啊,小林坐在位置上喝茶,小林是这个女生吗?然后卡尔进入到画框图片所在的位置,是这个位置,哦,你看他对应的, 然后叫了一下小玲,接着小玲回头抬头看了卡尔一眼,固定镜头, ok, 就 这么简单,他就完美的复刻了我们整个想要的场景,所以有一些动作你只要简单的跟他讲就行了,那么这一个简单的提示词就完成了。我们以前可能要做两张参考图啊,而且要做一个复杂的测试图的情况,现在 这样一张参考图, cds 二点零就帮我们全部搞定了,你就说是不是制作难度大幅度降低了啊?其次呢,我们要讲一下,就是转场那手搓模式下,其实我们很难去做比较酷炫的转场了,有的时候你甚至需要一些其他的软件协助,不过这个模型呢,它能帮我们精准的控制转场了, 比如这个画面我们来看一下,我一定要改变自己。好,我们看到这里有一个摩托车轮胎啊,他从前面飞驰过去的样子,看到吧,轮胎其实是我加过来的。 好,这个就很符合我们想要的预期了啊,那这里是怎么做的呢?很简单,其实我就是这样给他写了一个提示词,零点五秒闪过一个转场,转场是男生骑着摩托车 的轮胎,然后从画面前闪过啊,接着车子快速的驶离镜头啊,呈现出来这个画面, 那这个画面后面有个艾特,我没有复制上来。那我们可以看到这个转场其实做的非常的好啊,就是要我平常做,我是觉得我自己是做不出来的,但是在这个模型的加持之下,能很轻松的把它搞出来。 此外呢,我还试过类似,比如说你见光特效啊,人影的去叠画这些的转场,他都能做到,只要你把提示词给他精准就行了。 所以这个模型跟以往不一样,以往我们每一个镜头之间,我们可能要用别的软件,现在完全不需要这么麻烦,我们仅仅只需要把参考图给他,然后在提示词里面告诉他你要什么样的转场,他会根据参考图里面的一些物品信息或者是人物信息来帮助你去制作这个转场,真的太棒了。 接下来呢是一个叫特效一智加音效连续啊,因为我们传统去制作大部分的首尾针可能是五秒钟啊,当然也有多的可能十秒十二秒, 但是他们去制作的整个音效并不是很好啊。其次整一个特效,因为你不是一个片段出的,有的时候特效无法连续,那么这个模型他的最长时长目前有到十五秒啊,十五秒的话很容易让我们一次性跑完一个连续的特效以及一个连续的音效 啊。在这里再插一句,这模型的声音音效真的非常牛逼,特别清脆,没有像 solo 二这种有波点式的杂音,让我听起来非常的舒服,就好像是我人配的一样啊,不对,应该说比我自己配的要强的多得多。 ok, 那 么在接下来我们再来看一个其他功能啊, 在他的全能参考里面还有一个叫表情参考,这里我是复制了官方的文档啊,实际上官方是给到了几张分镜图,我们看一下,这是第一张, 第二张,第三张,哎,第三张的样子是不一样的哦。然后第四张实际上简单讲一下,就是人物从这个样子,然后到了一个近景,然后再到熊,最后他变身成为了一只熊,中间要有一个咆哮愤怒的表情。那么在这里参考的是这一张图, 那以往我们去做这样的图片的过程当中,肯定是需要加大量的提示词,表情狰狞,非常愤怒,对吧?现在完全不需要,只要加一张参考表情进去,然后就可以做出这样的效果。我们来看一下, ok, 这个表情就跟他前面的表情非常类似啊,只是拳头没有拿上来啊, 包括里面的牙齿也是一样的,所以他这整一个参考能力很强,我们再也不用去用那些很难去描述的提示词来去描写他,而是更简单的直接给他一个表情参考即可。 ok, 说完了这个,那么除了表情参考,当然也有动作参考了,那这个是我自己做的,我们看一下左边的这个动作,是动作一, 然后右侧的这个动作,哎,一个见光,一个挥刀啊,这是动作二,我们来简单看一下我做的这个独眼龙大战美少女的片段。 ok, 这是第一个动作。 ok, 这是第二个动作,我们可以看到有类似的见光 啊,这是第二个动作啊,其实效果还是挺不错的,只是视角有不同,然后动作没有百分百的追上啊,不过在我看来就是整个动作参考的参考强度还是可以的。那这也就意味着我们去在使用一些动作片段的时候,无需再像以前那样 啊,我们要去设计各个的分镜头,而是给他一些动作的类似的参考图,甚至是参考视频,他就可以帮我们去按照这个样子去进行替换,整一个替换的效果还是比较不错的。那么综合了我们讲的比如说动作参考,表情参考啊,音效特效、连续 转场功能以及关键帧的,其实我们可以看到它的整一个加持,跟我们原来的一个镜头,一个镜头去做手搓,已经发生了翻天覆地的变化。如果 c 段是二点零,它的时长能再延长,比如说到二十五秒,三十秒,我们进一步的制作速度还将提升。 现在我们看完了上面的介绍,最后再来看我制作的这一个片段,这个片段呢就是我前面做的交响诗篇的这个片段啊, 我们把前面的内容,然后再放到这里进行一个加固。参考图一到八就是我的分镜训练者,这个是我在季梦的最前面加的一句话,其实我是告诉他一个大概的意思,防止他理解错了。我现在在我的每一个视频里面都会加,最后我会把这个整体的分镜词,然后贴在我们的画面上, 那现在的话,这是我们的第一个参考图。参考图我们要的是啊,这样反手捏机车把的这么一个动作 啊,然后分镜一零到二秒,使用这张图啊,固定镜头啊,然后蓝盾的手猛的转动,车把,使用尘土做转场,这里没有给我做好,他变成捏车把了啊,不过也无伤大雅。 第二个就是我们的就是飞驰的分镜,用这个做了一个中间针,就是描写他接近画面的状态,并且把整一个元素放大,比如说摩托车的元素啊,人,衣服、物品的元素,防止他在自己放大的过程当中啊,出现了一些元素上的偏差, 那么我就告诉他,分镜二一到四秒切近至这张图啊,向后平移运镜,蓝盾骑着摩托车运动速度要显著快于镜头的后退速度,接着呈现出画面三,接着零点五秒,蓝盾超过镜头,使用男主的衣服遮挡镜头做转场,有残影,等一下咱们看一下。 然后镜头三就是男主飞出去了嘛,但是飞出去了他是属于一个尾帧,尾帧我们想要的到他这样一个画面,或者我们说他是关键帧,他肯定不是首帧,因为我们需要人物还没有进入画框,然后进入画框的一个过程, 所以分镜三四秒到七秒。先测试镜头啊,这个是测试镜头,蓝盾从画框右侧高速进入,接着从崖边飞出,画框右侧高速进入。就这句话啊,人物飞至最高点是这个样子,接着人物下坠啊,这里打错了个字,在空中给人物和摩托车减速掉落,固定镜头。 好,我们回头看一下啊。第四个镜头,七到九秒,镜头跟随蓝盾缓缓落下,始终保持向下的平移啊,切近。是这个,然后蓝盾在空中失去平衡,同时在天上转了一圈,男生的表情始终坚毅,为了防止他出现害怕等情绪啊,防止 ai 理解错误。 接着镜头五九到十一秒,画框下方的摩托车快速的向下离开镜头。那我们在这里有一个摩托车,这个摩托车我让他先离开 啊,然后男主失重落下,头发是向上吹起的,因为我怕他不理解物理的规律啊。然后镜头呢,向下平移运,就是跟人物一起向下,始终保持蓝盾嘛啊,在画框中心的位置下方是黑色的崖壁。 第六个镜头啊,十一到十五秒,切近至这个啊,然后镜头匀速的拉近,是匀速的拉近哦 啊,同时主角快速的从上向下坠落,身后的崖壁上有向上的残影以及动态模糊啊,因为加了动态模糊,他就会有一个往下掉的状态,否则只给这样一张图, ai 有 的时候不理解,所以我们要把这里写的细一点,那紧别递进至这张图 啊,然后到这张图之后呢,就保持不动了。接着男主在心中默念,我得试试,我可以飞起来。 ok, 那 么这里我们来看一下这个片子的成片, 我得试试,我可以飞起来的。 好的,就在我看来,这一个片段的制作可能跟原片的水平是差不多的啊,当然我这边更是高清版。那前面我们讲了这么多的优点, 这里也得给大家讲一下这种方式的缺点,毕竟万物都有两面性吧。以上的这种方法呢,是我目前找到的最强控制以及最高质量的制作方法啊,但是这种方法他并不是效率最高的,他也有比较大的缺点。首先第一个很大的问题就是制作参考图很费时, 其实我们很多小伙伴本身在做 ai 动漫的时候,卡住你的难点本来就是参考图,这个就最难的。 然后这个最难点呢,咱们还没有绕过去啊,据我判断啊,就是可能以后模型再强一点,也很难完全绕过去,至少要有大量的需要你参考图去进行参考的部分哦。 然后这些参考图你还必须得自己做啊,只是这个模型它用了关键帧,可以让我们比原来会简单很多。接着就是你的这个提示词不好写啊,这个提示词你如果让 ai 帮你写的,我认为多半是写不好的, 所以我是自己写,因为我清楚嘛,就是我自己想要什么画面。但是如果你把你的画面的提示词完全交给 ai 去写,它当然可以按这个格式帮你出,不过它是否能按照你的本意去进行,整个画面的生成 就会有出入了。那所以我还是建议,如果你要让 ai 写也没问题,但是你一定要在 ai 写完自己看一遍,然后去修改, 不要把你的最重要的提示词部分也交给他。然后第三个缺点就是我们无法最大化 cds 二点零的创意能力,这个模型他有很强的自主导演和创意的能力, 但是在这种模式之下呢,他其实很容易被禁锢住,反而可能发挥不出他的想象力。所以我们在做的时候,可能当一些需要创意的时候,需要一些炫酷的场景的时候,你想象不出来,让他去发挥他的想象力吧,你不要去限制他,少给提示词, 当你要控制内容的时候,就像我上面做的一样啊,把所有的参考图给他,然后把提示词写给他, ok, 那 么这个方式其他的缺点我暂时还没有想到,如果你对于我这个方法还发现了缺点的话,也欢迎进行讨论。好的,那么在最后的过程当中,还有两个小要点要给到大家啊。首先呢,就是这个模型,他的副像提示词非常重要, 因为有的时候他会在底端会出现字幕啊,我们要告诉他不要在底端出现字幕啊,同时还有 bgm, 因为我们 c, 但是二点零它给的音效质量非常高。如果你是 solo 二我就不讲了,你整一段音频都是不能用的,但是 c 但是二点零它就不一样了,它的音效我们大部分是要保留的,它给的音效我认为比我自己做的还好嘛。啊,所以我们的 bgm 的 存在其实会让音效一起被剥离啊,我们要告诉它啥呢? 不要生成 bgm。 这句话我也亲测过了,听得懂这两句话,我们在制作动漫的过程当中都要把它加进去啊,当然你说真人剧也是一样。第二个要点呢,就是不要单纯的依靠他人物的配音啊, 因为每个视频出来的音色声调都会有点不一样,他会帮我们对好口型,剩下的我们自己来配就行了啊。不过我听粉丝说就是有一种上传音色的方法,不过我的账号目前还没有找到这个功能, 所以这个呢,我目前保留,如果大家有尝试会觉得 ok, 那 我们再进行讨论。好的,那么到这里我们这一期的视频就结束了,在这个视频里面我分享了我自己认为最好的一种方案,那么在下个视频中,我们会来探讨多宫格的一个用法以及它的优劣势啊,非常感谢你看到这里, c 弹四二点零 真的很令我感到兴奋,请问你也有同感吗?我是栗子,感谢你看到这里。下一期可能是过年之后了,在这里提前祝愿大家亲朋好友身体健康,万事如意,二零二六大展宏图, 各位新年快乐!