周末我在电梯里大喊, cds 的 视频你们应该都刷到了啊,主流媒体都是后知后觉,这两天后才发现是个大热点。今天市场情绪本来一般,科技类 完全是靠 cds 一 己之力给顶起来,经过昨天就是周一的大涨之后,很多人本来想跑路了,结果 cds 在 这个时候发布出来, 时间节点把握的非常巧妙,让很多人联想到去年的 deep sec。 那 到底是机会还是坑呢?目前争议很大,但我觉得啊,这一波表面上看是利好软件,但实际上对硬件的刺激会更大。 cds 它属于视频生成技术,对硬件的依赖度会远远高于 豆包、元宝、千万、 deepsea 这些文字类的大模型,算力需求提高了十倍,会刺激高端芯片的需求,对显存和待宽的要求也是呈指数级别的。这个提升 h b m 三和四是刚需,它相当于挖了一条新的旷脉出来,这条旷脉呢, 你不能用过去的人力铁锹来挖,你得上重型机械。所以我猜测,接下来所有的 ai 应用公司都要重新调整方向,新的竞争马上开始了,接下来会刺激到 g p u h b m、 高宽带存储、 ai 服务器、高速互联、液冷七大方向。
粉丝537获赞5183

这些这些这些 都是我用极梦 synx 二点零生成的效果。嗨,我是 ai 先生,我也算是一个干了整整十年的影视编导了哈,所以我花了整整两天时间,光充值就充了一千多,把极梦所有的功能案例以及网上各种神奇的用法 全部都测试了一遍,就只为了帮大家搞清楚一件事情, sims 二点零是不是 ai 界的 deepsea? 它真的有网上吹的那么强吗?以及它有哪些神奇的用法,并对咱们普通人有何影响?这应该是全网最完整的吉梦 sims 二点零评测解析视频, 视频有点长啊,但全都是干货,并且我把以下全部的测试的使用技巧,案例、提日词素材全部都整理到了线上文档,这么干的视频要个三连不过分吧? ok, 家人们坐好准备发车, 想要看懂 sims 二点零对于 ai 视频是否有颠覆意义,是不是 ai 界的 deepsea, 咱们要先搞清楚整个 ai 视频行业的发展脉络,那咱们就先花点时间来梳理一下啊。其实早在二零二二年菜的 gpd 刚刚震撼全球的时候啊, 就已经有了 ai 视频的概念了,但还没有一个完整的产品。甚至当时我们为了跟风啊,还把实拍的视频调个色,加个风格化, 伪装成 ai 视频。视频行业的朋友应该知道我在说什么哈。直到二零二四年, oppo ai 的 ai 视频模型 sorry 一 点零上线,这才一下子拉开了 ai 视频的大幕,尤其是这几个 ai 画面,不知道大家还有没有印象啊,当时确实把我给震撼到了。之后呢,国内的厂商也快速跟进, 快手的可灵、抖音的极梦也逐渐成为了咱们国内使用频次最高的两个 ai 模型,毕竟国外的 sora 和双威啊, 封门槛太高了,论性价比啊,还得是咱们国内的软件更懂咱们国内的市场。但即便是发展了两年,各种 ai 视频软件的顶配还是有几个核心的痛点, ai 视频一直没办法解决。第一个,人物不真实,虽然在质感上已经有了非常大的突破,但是很多人物的动作或者表情还 还是不太符合现实的物理规律。而第二个呢,人物缺乏一致性,生成剧情和故事的时候往往需要多个镜头画面,但这个时候主要人物就很难保持长的一样。第三,生成的结果不可控,就是每次生成都需要开盲盒,俗称抽卡,又花钱又浪费时间。那么这个极梦的 sims 二点零解决这个问题了吗? 其实啊,目前几个顶级的 ai 软件,他们的攻克方向各有不同,就比如说骚扰二,在技术上其实领先了很多,它采用的是 trance 八八的架构和隐士物理引擎,尽可能的还原物理规律,让画面的人物更真实。而可灵呢,则是采取了小步快跑的策略,迭代了很多 的版本。现在的三点零版本呢,是主打的人物动作的精细化。我不知道大家有没有印象,可灵之前有一个画笔的功能,轻轻一画人物这一块确实也沉淀了很多年了。当, 当然,这也和他背靠快手庞大的短视频美资库有关系。快手上什么最多呢?还不就是跳舞直播的小哥哥小姐姐比较多吗?那抖音呢?刚好相反,抖音这几年主打的是短剧或者是精选视频, 所以极梦主攻的方向就是在镜头的故事性和人物的一致性上。哎,那可能有朋友要问了,这个极梦和这个 sims 到底有什么关系?其实啊,这俩还真的不太一样, 因为极梦 ai 呢,它是属于字节推出的 ai 视频创作平台,它其实是归属在剪映的开发团队,也就是深圳的脸萌。而这个 c 震四呢,其实是字节实验室里自研的底层视频生成模型。 其实这俩并不能完全等同于一个东西,但两个产品呢,实际上是深度绑定的。这个 c 震四呢,不对外开放任何接口,也不允许第三方调用。 如果大家想要使用的话,只能在极梦平台豆包 app 和小云雀 app 以及火山引擎的这个 app 上来进行 使用。而 synx 二零二五年初上线之后呢,一共也就更新了两个半版本,到最近的二点零版本,能有这么夸张的成绩,进步速度啊,也算是相当快了。咱们在用之前呢,先来重点介绍一下这个 synx 二点零的核心的技术优势是什么? 它是采用了双分支扩散变换器的模式,视觉分支啊,是基于三 d 卷积加川字发嘛架构处理时空信息,生成帧序列。而音频分支呢,则是基于波形扩散加川字发嘛架构来处理声音,频谱生成顿化和音效。 说白了呢,就是相比于传统的 ai 视频,先拍画面再配音,我这个画面和音频呢,同时生成,就像有一个剧组一样,导演在这里想镜头,而音效是同时配声音,所以这个镜头的效果呢,就大大提升了。哎,那 这样的话,未来是不是还有可能是三分之或者四分之?编剧来想剧情,导演想画面,摄影师来想镜头,而演员来想表演, 甚至音效师再来想声音。哇,但这样想想, ai 电影还不马上就要来了, ok, 说了这么多啊,相信大家对于整个 ai 行业的发展脉络和痛点,以及吉梦森纳斯二点零的优势都了解的七七八八了哈,吹,都吹了这么多了,我也没收什么钱,那究竟好不好用?是骡子是马,咱们必须拉出来遛一遛。 ok, 我 现在就给大家实际演示一下这个极梦怎么使用哈。目前呢,这个 cns 呢,是只支持字节旗下的平台可以使用,主流的呢,就是这个极梦 ai 和小云雀, 这俩呢,都有 app 和网站,如果简单一点呢,就可以用 app, 那 复杂一点呢,我建议大家还是用网站好一点。那这两个软件有什么区别呢?就这个极梦呢,它是主站,它的功能会非常的全,但是呢,因为用的人也很多,所以生成一次呢,要等很长时间。那个小云雀啊,我自己实测,我就发现它生成的快很多, 当然它的功能不是很全,如果你想上传参考视频,它就不行。对,所以可能按你自己的需求来使用哈。 但是用过的朋友应该都知道啊,这两个软件有一个最致命的缺点,就是这个积分太贵了,每天一几百个积分也就只能用两三次。那今天大家算是来着了啊,我给大家分享一个我的秘密基地,随便升,不收费, 就是这个字节旗下的内侧中心火山方舟,大家可以看一下,你看这就是 sims 二点零,并且所有的功能都可以免费使用。但是既然是测试啊,人家肯定也有一个问题,就是他只能支持首尾帧,目前的参考视频目前还不支持测试。 ok, 我 们接下来就用极梦官网给大家来演示啊。 进来之后呢,大家可以先点击左上方的这个灵感,打开这个输入框,在下面呢,大家可以先点击左上方的这个灵感,打开这个输入框,在下面呢,大家可以先点击左上方的二点零。 当然可能有同学要问了,哎,我的这个打开怎么没有这个 c c 的 二点零,最高只有到一点五,那实际上可能你是一个新号, 你可以选择左下方的这个一元会员,先白嫖个七天啊,然后就可以使用这个 c c 的 二点零了。那接下来呢,我们还可以选择它的功能,比如说全能参考或者手尾针,这两个用的比较多啊, 然后也可以选择画幅以及选择时间,那有一个点大家要注意这个,每一次你的生成需求,他都会评估你的积分,这个积分大概是三十多分,所以有些新人朋友啊,就是一开始还没想好怎么升,就胡乱的提交,导致这个积分都快用完了,还没有生成想要的片子, 所以大家一定要小心。大家其实也不用担心啊,我会把我接下来所有测试的这个素材提制词,包括成片全部都放到我的教程里,大家可以模仿着来使用,让大家少走弯路啊,把这个积分用在刀刃上 哦,我自己其实也摸索出了一些白嫖积分的野路子,等一下我再给大家讲。 ok, 我 们接下来就围绕 c n s 二点零的核心功能,从不同的使用场景有简入深的来带大家测试一下。 第一层呢,我们先来测试一下这个 c n s 主打的这个人物移植性和运镜效果,为了这个保证这个真实性呢,我还同时邀请了两位对比选手, 一个呢是这个全球遥遥领先的这个骚扰二,另一个呢是极梦的一生之敌可灵。三,第一题呢,我们就简单一点,我找了一张图片, 这个大家应该都不陌生啊,这个是全游里面雪诺对阵千军万马的画面,大家都知道后面的剧情啊,我们让 ai 来续写一个不同的剧情,怎么样?我先上传了一张图片,提示词呢是镜头跟随着男的的男子,然后一群骑士冲过来,他转身要跑, 然后镜头侧拍,后边的马冲过来把他顶翻。最后一个镜头呢,是镜头自上而下的俯拍,他被顶上了天空。 ok, 我 把这个提示词发给了吉梦以及包括可灵。大家看看啊,我们选的是三点零版本,以及发给了这个三二二, 因为为了公平起价,我们每个平台只给一次升成机会,来看一下他们的能力。 ok, 我 们先来看一下吉梦的效果, 这个镜头跟随运动还是非常不错的,被顶翻的感觉也很真实,真的有点像拳游里的画面啊。 ok, 我 们再来看一下,可怜可怜,这个人物被撞的怎么这么窝囊呀! ok, 我 们看一下。 sorry, 哇, sorry, 这个人物的质感明显要好很多,但是最后怎么飞起来了,有点离谱哎,大家发现一个问题没有,我给到三个平台的都是一个人物的背身,可玲和 sorry 其实都没有认出来,只有吉梦认出来这是全友里面的女男主角雪诺。 哇,这可能就是 tim 担心的那个问题,大数据快速解锁就可以知道这个人到底长什么样子。 ok, 吉梦,可灵、 sorry 分 别是一二三,大家觉得哪个好一点,可以打个分。接下来呢,我们再用它的首尾针来测试生成一下画面,这也是可灵的拿手好戏了,我们看一下吉梦能不能反超我的手针呢是一个小米汽车的图片,尾针呢是一个变形金刚, 奇石呢是汽车飞快的驶过,然后冲出悬崖,在空中变成了机器人。然后镜头呢是环绕拍摄,最后机器人落在地上,整个的风格呢是这个末日沙丘风。来,我们同时看一下,两个视频的效果 还是挺明显的,积木这个镜头环绕就非常有感觉,可怜的就在死满。 ok, 左和右大家觉得哪个好一点呢?第二层咱们再来测试一下他的仿拍视频的能力,这个就复杂很多了啊,需要调用到图片、视频以及音频,我就不让另外两个小手参与了, 我先找了一个抖音的热门音乐。这个银龙鱼大家应该也不陌生啊,我又找了五个动物来替换掉视频中的五个舞蹈演员, 来我们看一下生成的效果,还是挺真的。哇,这两个老哥怎么没有去掉啊,还有那个狮子在旁边摸鱼哎,不过大家看到没有,他整个的镜头运动和原视频非常接近,并且甚至是黑夜的噪点他都还原出来了, 真的不错啊,我今天这个功能真的急么?可以再深更一下,感觉以后的抖音热榜全部都是 ai 生成的视频了。哎,那如果想要仿照更专业的 t v c 广告呢? 那这个时候我们的人物啊,就要更精细一些了。我先让娜娜补,娜娜帮我生成了一个模特的三式图,然后再找了一个苹果的经典广告题,日词呢,就是把视频中的女主角换成男主,把手机换成板砖,然后完全模仿原视频的画面意境和人物动作。来我们看一下效果, 板砖有点突兀,但这个质感还不错,哎,最后怎么又切成手机了?这个女生还出现了有点小 bug, 不 过几分钟就能生成一个这样质感的广告,已经很牛了,想要入局广告行业的同学们可真的要三思了。 ok, 前面呢还都是小顺牛刀。第三层,咱们直接让他来拍个电影怎么样?要玩就玩最大的 黑之王悟空。不是前两天刚发了那个钟馗的 cg 短片吗?让我有点好奇呢,就是他最后被蒙面的那个人到底是谁?结束的时候不是戛然而止了吗?没关系,我们让 ai 帮忙去续拍一下。这个准备的环节就比较复杂了,我给大家简单描述一下。就是我先让拆的 gpd 帮我构建了一下接下来的剧情以及分镜头脚本, 然后再让那那不单的生成每一帧的画面,最后把这些图片全部都上传到节目的这里。其实词呢,也相对说复杂一点,就是零到八秒呢,我先描述在昏暗的客栈里,有一个人们套着头套,然后八到十秒,孙悟空和钟馗打起来了, 十一到十五秒,孙悟空直接冲上了钟馗的眼睛,大概这样的一个剧情。哇,我这条真的等了好久,来我们看一下效果,还原度还是挺高的, 帅啊,大家觉得怎么样?这个镜头质感是不是已经可以在黑神话悟空里以假乱真了? 不过就是时间有点赶啊,中间有点小 bug, 大家见谅啊。哦,如果大家在生成的时候积分不够用的话,我给大家推荐几种我常用的方法。第一个呢,就是多注册几个手机号,新号啊,可以白嫖,吃点低保,又或者是开个一元会员都可以用。 那又或者呢,是参加一下集梦的这种拉新活动,或者去海鲜市场淘一淘?但这个呢,就不好明说了,我把我过去踩过的坑或者觉得比较有用的都放到文档上了,大家可以按需来使用。 不过呢,大家注意到没有,我整个的测试呢,从单个的运动镜头到访拍视频,再到组合起来讲电影故事,一整套流程下来,其实就是一个完整的电影制作流程。 所以啊,你看似这个 cds 二点零只是对运动镜头的一个阶段性的升级,但它实际上呢,是突破了整个 ai 生成视频的瓶颈,让 ai 彻底颠覆影视行业更近了一步,这也是让 tim 都如此惊讶的真正原因。能看到这里的朋友呢,相信对于 ai 视频都非常的感兴趣,也有一定的见解了哈。 我呢也想说几句我自己的真心话,如果一定要评价或者总结的话,说实话,这个 c c 四二点零的升级啊,其实并没有让我那么觉得惊艳,我也不想无脑的吹它,它确实在人物一致性和运动镜头上有了非常大的改变,但如果以一个电影画面的标准来看的话,它差的还很 远。但其实我也看到了希望。你想啊, ai 视频从二零二四年问世到现在也就两年时间,已经能做到这种效果了,如果再给它两年呢?再给它五年, 咱们等得起,他又能给我们多少惊喜呢?也许到未来的某一天,我们就不需要再等待了,那些易难平的大作,全运的游戏,三体魔界, 咱们都可以用 ai 来实现,各位会期待哪一步呢?好了,这就是本期视频的全部内容了,感谢点赞,这会让视频推荐给更多的人。如果需要上述的所有的案例、提示词以及教程,欢迎留言,我免费送到。在这里呢,祝大家二零二六年新年快乐!

ai 视频的兴亡,最强的视频模型,改变视频行业的 ai 漫剧最终的答案 等等等等,这就是网上赋予 gmail 二点零的评价。一个同时支持图片、音频和视频多维度参考,并且有自己创作想法的全新 ai 视频模型。这期视频我们就来看看它到底有多强。 首先我们进入季梦主页,在视频生成里面可以看到全新的 cds 二点零模型,目前我们只能在首尾帧和全能参考这两个功能上用到它 默认的参数设置。生成一段视频消耗三十个积分点,现在仅仅只能参考两张图片,切换到全能参考,这时候最多就可以同时上传九张图片进来, 消耗的积分依然不会增加,但如果我们上传进来的是视频,那么扣除的积分就会大幅度的提高了。 cds 二点零是一个能够混合参考的多模态模型,除了可以给他提供参考视频外,我们还能给他提供参考音频和对应的图片一起混合参考。 正是因为 cds 二点零有着这样一个交互参考的特性,因此它的玩法就非常丰富了,这些在教程的后面都会一一给大家演示。我们先来测试一下 cds 二点零锁尾针的功能, 这里给他上传一张女生在玩滑板的图片,进来,第一次输入,女生从滑台上冲下,完成一系列高难度的滑板动作。我们来看看生成的结果,可以看到 cds 二对复杂的动作和物理规律的表现,相比过往的视频模型是有着非常明显的提升的, 而且稳定性非常的高。我抽了四次卡,所有生成的素材都是可用的,完全没有出现姿态扭曲的情况。同样的贴纸,用之前的视频三点零模型来生成,对比一下可以看到动作就没有那么真实自然了,而且生成出来的女生样貌一致性保持度也没有 cds 二点零好。 另外, cds 二点零首尾针对细微的文字保持度也是有所加强的。例如这里就上传戏剧迷全面掌握 ai 视频雅诗兰黛广告案例中的两张图片进来, 输入对应的变化题页词,我们把原图放大来看一下,可以看到瓶身上的文字其实是非常清晰的,但由于字体太小了,这是非常不利于模型进行计算和裁样的。 案例中是用之前的三点零视频模型来制作,乍一看啊,没有什么问题,但如果放大拉近来看,这些细小的文字还是会有扭曲的情况出现。 这次我用 cds 二点零来对比测试了一下,很明显 cds 二点零对于这种细小的文字保持度会更好一些,有着更高的细节精度,这对 ai 产品广告制作来说啊,是一个很好的提升。 在缩尾帧功能里面,我们只能上传两张图片,那如果我们要做多张图片的串联过度,就可以切换到 cds 二点零最核心的全能参考功能, 这里面就可以直接给他上传最多十二个素材进来。例如这里给他上传四张图片,同样可以在这里实现多图缩尾帧串联的效果。现在我想通过这四张图片实现人物变成一只熊在咆哮。 在全能参考里面,我们要调用素材有两个方法,一是点击这边的引用参考按钮,这样啊,就可以选择对应的素材了。还有一个更快捷的方法,就是在贴纸里面直接输入 at 这个符号,那么就可以快速的弹出上传素材调用框, 这里选择第一个图片提示词输入,把它作为手针,镜头慢慢拉近人物突然抬起头,面部特征就参考图片二,接着大声的咆哮表情,参考图片三,最后变成一只熊。参考图片四,通过这样用提示词的方式把素材一关联起来, 那么我们就可以得到这样的效果了。 可以看到啊, cds 二点零的多图串联过度是非常丝滑顺畅的,完全看不到图片与图片之间过度刹车的问题,那么我们再来上点难度。 这次上传五张场景完全不一样的图片提示时可以随意一点,直接按出五张图片,然后补充到一镜到底。追踪镜头,从街头跟随跑步者上楼,穿过走廊,进入屋顶,最后俯瞰整个城市,那么我们就可以得到这样的效果了。 hustle all night, never gonna quit till i reach the top now, let's get it on hustle all all night, come on, hocus staying low with a tempo o bright come on, come on, come on! 整个过程是一气呵成的,对于不能衔接的画面, cds 二点零会自动地进行贴近转换,那么我们利用 cds 二点零的这个特性,现在制作产品广告是非常简单轻松的,我们只需要拍摄几张产品的图片,把它上传到季梦, 输入这样一段贴纸词,鞋子的侧面就参考图片二,鞋子的材质就参考图片三,要求鞋子和鞋盒各个细节都要展示出来,并配上大气的背景音乐点击生成,这样非常高清,各个细节都能清晰呈现的产品视频就生成出来了, 我们再来增加一点难度, cms 二点零现在虽然能够很好的在多图之间施划过度, 但如果我想进一步控制某个图片与图片之间的变化时长,应该怎么操作呢?这时候我们就可以用到 cds 二点零的 time 提示格式了。例如这里上传五张历代保时捷九幺幺的图片进来,如果直接交由 cds 二来过渡啊,那么它只会在不同车型之间过渡变化。 但现在我是希望每款车型都要在公路上先行驶一段时间,接着再进行过度变化,所以这时候就要用到太耐的方式来指定视频的变化效果。以图片一作为手帧, 零至一秒的画面,图片一的汽车在公路上高速行驶,一至三秒的画面,图片一的汽车变形拆解整合组装,变化成图片二,接着三至四秒画面,汽车又在公路上高速行驶。以此类推,一直把所有款式的图片串联起来, 把提示输入给 sims 二,点击生成,那么我们就可以得到这样的变化效果了。 前面我们测试的都是 cds 二点零图片之间的过度能力, 那么接下来我们就要测试一下 cds 二点零对提字词的理解和创造性了。例如这里上传一张蒙娜丽莎的图片进来,然后给它输入一系列非常复杂的提字词,要求它有心虚的表情。 先是左右瞄了一眼,然后从画框中弹出来,拿起台面上的可乐喝了一口,露出满足的表情。这时候传来脚步声,蒙娜丽莎立刻把可乐放回原位,保安没有发现,把可乐拿走了,最后画面出现对应的字幕和旁白, 来一口可乐,清爽直上头。可以看到整段提子词交代的人物表情细节和要完成的事项是非常非常多的,时间直接设置成最长的十五秒,点击生成预,似乎我们就得到这样的效果, 来一口可乐,清爽直上头, sax 二点零对我们所交代的所有细节几乎无一遗漏,毫无瑕疵的完整的呈现出来。一分钟就能制作出这样一段有配音的广告大片了, 这就是限阶段 ai 视频惊人的能力,就连影视巨峰的 team 也连夜给 sax 二加更的一段视频,所以我们必须跟紧时代的节奏,拥抱 ai, 学习 ai 和掌握 ai, 这样才不至于被时代所淘汰。 想系统性学习 ai 视频的同学,可以关注一下戏剧迷,全面掌握 ai 视频这一套系统课程。好,我们回到 cds 的 评测,接下来我们请出这次评测的主角,一个手拿着汉堡包的胖子。 在接下来的测试中,我们需要这个主角通过 cds 二完成一系列更加复杂的任务。把小胖的图片上传进来, 贴纸输入,让小胖手拿着汉堡包被一群人追逐。在逃跑的过程中,不小心碰到路边的水果摊,汉堡包丢在了地上,小胖迅速的把汉堡包捡起来,连滚带爬的继续逃跑。设置十二秒的生成时长,点击生成这样一段媲美好莱坞电影大片就生成出来了, 最令我惊喜的是, cds 二并不会像过往视频模型那样,即便时常设置到十五秒,它的各个分镜稳定性都是非常高的,这个效果就是直接一遍就生成出来了,完全不需要多次抽卡,非常的厉害。 对于 cds 二对体语词的超强理解能力,现在我们制作各种电影短片, ai 慢剧啊,都是非常简单的。例如同样上传我们的小胖图片进来,让他用图片中男人的形象, 然后通过刚刚给大家讲解的太耐题词格式,生成一段减肥励志电影破茧的预告片,规定每个时间段要表达的画面和内容,还可以指定小胖的说话内容,让他说出我不想再这样了。接着就是激昂的背景音乐,小胖开始疯狂的减肥,设置一下生成的分辨率, 时间,直接拉满十五秒,点击生成,那么我们就可以得到这样的画面了,难道我这辈子就只能这样了吗?我不想再这样了。 刚刚我们用的都是 cds 二图片参考功能, cds 的 视频参考啊,才是它最灵魂最核心的能力。例如这里我们从网上看到一段炫酷的视频,现在我们通过 cds 就 可以非常轻松地把它复刻出来了, 只需要把这段视频上传到 sims。 但需要注意的是啊,一旦我们用上它的视频参考能力,消耗的积分也会大幅度的提升。可以看到,如果生成十五秒的视频,需要消耗的积分就来到了恐怖的一百九十五点。 接着把我们想复刻的主体图片上传进来,贴时输入参考视频一的运镜和节奏,用图一的跑车来进行复刻,点击生成,那么瞬间同款视频效果就生成出来了。 所以合理利用好 cds 的 这个视频参考功能,我们就可以很轻松的制作出各种好莱坞导演级别唯美的片段出来了。 只需要在网上啊找到自己喜欢的广告片段,把它保存下来,导入到即梦,就可以让我们自己的角色模仿对应的拍摄手法,实现同款的效果。 想要更接地气一点,那么我们就可以找一段炫酷的舞蹈视频,把它上传给 cds, 让我们的主角小胖参考视频中的运镜和节奏,同时也参考视频中女子的跳舞动作,点击生成,这样小胖就丢掉手中的汉堡包,展示出优秀的舞蹈出来了。 刚刚展示的都是单视频单图片的参考方式,我们再来上点难度,直接用手机随手拍一个运镜的视频,向上向下,接着往左转,再往右看, 把这样的视频上传到 sims 作为参考,然后就可以给它上传多个场景的图片,贴时输入以图一作为手帧画面,参考视频的二下方的场景是图片。三, 接着把左右场景的画面都定义一下,点击生成,那么同款运镜第一人称的视频画面就生成出来了。 再来复杂一点的超高难度运镜,直接把这样一段把观众都转晕的电影视频上传到 cds, 主角依然是我们可爱的小胖。接着上传几张自己生成的酒店构造图,根据原视频的运镜方式,输入这样一段贴纸,点击生成,那么这样的好莱坞大片大家也能轻松地实现出来, 同理,我们给小胖添加几个坏人 npc 的 对手,拿着棒球棍和大扳手,并生成一个指定的背景图片,给他上传一段打斗的参考视频进来,让小胖模拟视频中的动作。这些动作参考片段可以是实拍的视频,也可以是三 d 建模,简单的骨骼姿态动作, samsung 二都是能够识别的,然后指定在图片三的场景中与图片二的黑衣人进行打斗。点击生成,这样灵活帅气的小胖打斗视频就生成出来了, 就连坏人是拿着扳手的工具都能非常稳定的还原出来。不得不惊叹,季梦这次推出的 samsung 二确实非常非常的强, 不过在测试的过程中,如果对于过于炫酷的快闪视频, samsung 的 参考能力就会有一定程度的下降和污染。 由这里把这段视频上传给 cds, 同样把小胖上传进来,并给他上传五套不同的衣服。图片要求小胖作为模特分别穿上图二至图六的衣服。参考视频一的运镜,每穿一套衣服都切换一个镜头,点击生成,可以看到生成的效果,总体来说还是不错的, 对于衣服也能够完美的穿上,但某些画面中会有原视频人物污染出现,如果想实现这样的快闪视频效果,那么就需要多抽抽卡了。 six times 二的出现也是 ai 慢剧制作者的福音,现在我们只需要提供这样一张九宫格的图片,也可以在图片上简单备注一下必要的注示,把它上传到 six times。 提示词非常简单,让它根据九宫格的图片说明制作出美式漫画风格的动画,那么我们就可以得到这样的效果了。 对于打斗动校啊,也是很多同学喜欢制作的,现在我们可以先生成两个人物角色的形象图, 然后再生成一张九宫格的打斗图片,直接上传到 cds, 提示输入图一的女生与图二的男生参考图三的九宫格漫画进行打斗,然后补充上一段通用的打斗提示,点击生成,那么我们就可以得到这样一段非常炫酷的打斗效果了, 而且人物一致性保值度是非常好的,男生衣服上的阿迪 logo 在 各个风景中都能很好的保留下来。 此外, cds 二还能对视频进行向前或者是向后延长处理,这个功能对视频创作也是非常有用的。 例如现在我只生成了一段五秒钟从咖啡杯上生长出甜甜圈的视频,我希望接着这个视频在后面继续进行创作,那么就可以把它上传到 cds 贴时输入,让它把视频延长十五秒。后面就是对应的 type n 格式描述,指定它在不同时间段生成的效果。 点击生成那么一段完整的瑞幸咖啡广告就在原来的基础上接着补充生成好了。 samsung 二还有一定的视频编辑和替换能力,利用这里给他上传一段李连杰打斗的参考视频,主角依然是我们的小胖,要求他把视频中右边的黑衣男人替换成图片中的胖子, 点击生成,可以看到前半段替换效果还是非常不错的,但由于参考视频本身是有多个分镜的,在后面的视频中胖子就不能替换出来了,所以更好的做法是对原视频进行对应的拆分,然后分段来替换。 另外在视频替换方面, cds 二很多时候会加入一些自己的想法,他不会原封不动的还原原视频,利用这里让他把视频中左边的白衣男人,也就是星爷替换成图片中的小胖, 点击生成,可以看到生成出来的效果,虽然星爷是被替换过来了,但画面中的动作和背景也有一定程度的改变,所以对于视频编辑替换方面啊, cds 二还有进步和改进的空间。 关于 cds 二,我们可以实现的创意玩法是非常多的,这几天我也是跑光了两个季梦会员的所有积分,进行了各种效果测试,才给大家带来了这个真实的使用评测视频。毫无疑问,在春节到来之前,季梦提前给我们准备了一个大大的新年礼物, 它在很多方面都已经是超越了索尼二和微软了,因此 cds 二点零也快速的出圈,已经火爆外网。确实, cds 二点零又把 ai 视频创作推向了一个全新的高度。

c 档是二点零和可灵三点零,到底哪个更厉害?到底应该买哪一个?这是这几天大家问我一个最多的问题,我今天花点钱给大家从多个维度进行测试。 呃,我们不把它当成玩具啊,所有的案例呢,我们按照真正能干活的方向去猎取啊,一次成型绝不抽卡,我不做任何评价供你们选择。首先说大家最关心的费用啊,我以两家官方最优惠的充值方式来计算,一条十五秒的呢。呃, c 档是二点零的均价大概是四毛三 啊,可林三点零的均价是六块三毛六啊,两个价格差距还是非常大的,下面我来直接开始测试啊!首先是多分镜提字词的听话程度啊,这是一个非常详细的分镜提字词,包括构图啊,人物动作、情绪、音效、质效、磁场等多个要素。 别看它短,这是一个相当复杂的分庭题的词,我们看能不能理解。长脑子是用来干嘛的?别给我磨洋工利索点,谁给你的胆子不报备就敢乱拍板,别只会等指令,自己不会扛事,全是摆设,就没人懂得自我反省。 长脑子是用来干嘛的,别跟我磨洋工利索点,谁给你的胆子不报备就敢乱排版,别只会等指令,自己不会扛事,全是摆设就没人懂得自我反省 啊!再来测试一下多图输入的稳定性,这是我一下给到六张图片,三个人物,三个产品啊,我们来看看人物还原度和产品还原度,以及对于广告创业的理解。 大街辣条,快乐没烦恼, 下面再继续测试开放创意程度。我在家随手拍了一只小熊提子词,说两句台词,咱们其他的不说,具体表现形式呢?交给魔心去自由创意。终于躲开怪兽了, 还是这样安全些!哈哈哈, 终于躲开怪兽了,还是这样安全些!这测试一个他对于本土文化的理解,看看是否能够接地气,能不能理解我们的真实的生活。今年咱全家整整齐齐,妈你做的扣肉还是那味,哈哈哈, 祝爷爷奶奶福如东海,寿比南山!哦中,这年过的得劲!今年咱全家整整齐齐,妈您做的扣肉还是那味, 祝爷爷奶奶福如东海,寿比南山!中,这年过的得劲!再来测试一个相当复杂的视频复刻,呃,我们这两个电影人物呢?参考 a 视频的动作, b 视频的运镜,而且还要根据我设计的提示词来设计这个场景, 可林完全没有做到,他直接把人物进行替换了。那后面我就不测试了,毕竟价格也挺贵的。就这样吧,大家自己看。

各位最近用 cds 二点零,是不是有种感觉,它价格是亲民了,但偶尔好像不太聪明了?别慌,我是小餐。今天咱们就像老中医号麦,聊聊这降智到底是啥情况。最近圈子里的热议话题, cds 二点零开放后,用的人那是乌央乌央的, 结果呢?有些朋友反馈,以前让他生成个侠客对决,镜头语言电影感十足。现在有时候生成出来侠客的剑可能差点意思,或者背景细节有点偷懒。这感觉就像你常去的一家小馆子,原来大厨慢工出细活,道道是精品。突然有一天,他火了,成了网红店,客流翻了几十倍。 后厨再厉害,一时间也可能忙不过来,偶尔出餐慢一点,或者口味有那么一点点不稳定。现在的 cds 二点零,就有点像这个突然爆火的网红。后厨本质不是降智,是算力过载。 首先得说清楚,这不是 ai 本身变笨了,更不是技术倒退,他的大脑还是那个聪明的大脑。核心问题出在算力和流量的短时失衡上,你可以把算力想象成一条高速公路,模型是跑在上面的车。原来路上车不多,每辆车都能飙到一百二十码,顺畅的很。 现在因为免费开放,价格友好,瞬间涌进来成千上万辆车,大家都想上路,结果就是在某些高峰时段,这条路有点堵, 每辆车可能只能跑六十码,甚至需要排队。表现出来的降智,比如细节模糊,逻辑稍乱,其实是系统在超高病发请求下,为了确保大多数人能尽快用上,所做的一些临时性的资源调度和结果优化, 这是一种保通策略,优先保证服务不崩溃,让更多人能体验。为什么会出现这种情况,恰恰说明了两点。 第一点,技术真的够硬,东西不好不会吸引这么多人挤破头来用。这波流量狂潮本身就是市场用脚投票对产品力的最大认可。 第二点,普惠策略成功把门槛打下来,让更多创作者、小团队能用上顶级工具,这个方向无疑是对的,只是成功的速度可能比预想的还要快。 任何一个现象级的技术产品,在经历用户量指数级增长的阶段,几乎都会遇到类似的压力测试,这可以说是技术普惠路上一个幸福的烦恼。那么问题能解决吗?答案是肯定的。这种由于基础设施扩容速度暂时跟不上用户增长所带来的体验波动,在技术层面有非常清晰的解决路径。 首先肯定是硬件扩容,这是最直接的宽高速公路的方法,增加服务器集群,部署更多高性能计算卡, 就像给后厨增加灶台和厨师。接着进行软件优化,通过优化任务调度、算法模型推理效率,让同样的算力能承载更多的请求,相当于优化交通信号灯和道路规划,提升整体通行效率。最后,还得把架构升级,采用更先进的分布式计算架构,弹性应对流量高峰, 以字节跳动背后的技术工程能力应对这种规模的挑战,是有成熟经验和雄厚资源的。这更像是一个时间问题,而非能力问题。技术团队此刻大概率正在连夜添置灶台、优化动线,遇到生成结果不尽如人意时,可以尝试错峰使用或者将复杂任务拆解。 这就像避开饭点去网红店体验可能更好。短期波动是技术爆发期增长的正常半生现象。 一个有能力打造出如此水准产品的团队,绝不会对用户体验下滑坐视不管。我们正在亲身参与一个工具的成熟过程, 他的每一次卡顿,未来都可能转化为更稳健的架构。现在的每一条反馈都在帮助他变得更好。 技术前进的道路很少是一条直线,它更像是在解决一个个问题中螺旋上升,给 cds 二点零一点时间和耐心,也给我们自己一点观察和期待。相信很快,那个又快又聪明的完全体就会回来。

从零基础彻底教会你极梦 cds 二点零入门警告,一口气彻底学会极梦 ai 视频制作,本视频耗时七千两百分钟,带你从零基础小白入门到进阶。由于视频太长,本套教程分期发布,本期带你搞定动画片制作,慢剧制作, ai 脚本生图生视频教程 学完,年底开路虎。哈喽,大家好,这一次我们来分享一下这两天火爆全网的极梦所推出的全能新模型,通过一个小的案例来演示一下整个的制作过程。 那这里呢,我把它分成了几个步骤。首先第一个我们要来确定主题,我这边所确定的主题是奥特曼大战美少女战士,那我们有了这个主题之后,要来去生成角色,那角色的生成我们可以打开任何一个 ai 平台,输入你对这个角色的描述词, 像我这边对奥特曼的描述大概就是长这个样子的。然后模型这里呢,我们选择九比十六,接着我们来点击生成,你可以看一下这个就是它根据我的描述所生成的一个效果。当然同样的美少女战士我们也可以用同样的方法把它生成出来。生成出来之后我们就有了两个角色, 那接下来我们要有这一个故事的内容,故事的内容我们可以选择豆包和 dpc, 这两个都是国内的模型, 他对国内的动漫理解性会更强一点。那这里我们可以打开豆包,然后给他发送这样一段话,就是让他给我去生成奥特曼大战美少女战士的短片,大概三十秒左右。然后下面这一块呢,就是我们给他的一个模板,那他就会大概参照这个模板的内容给我们来生成。这一个呢就是他所生成的剧情, 开场的时候呢是零到三秒的样子,大概是什么样的一个剧情?当然如果说他没有给你分的这么细,我们定量让他细一点, 因为迪梦这个新模型最长的话是十五秒,所以我们可以让他十五秒,十五秒的去生成,所以我们最开始呢可以取到十六秒左右。当然呢这里还有一个小问题,就是这边他直接给的是迪迦和这一个越野兔, 像这种的话 ai 其实不能够去直接用的,所以我们可以再跟他对话,让他给我去生成 ai, 能够做出来的 涉及到版权的都不要让他去用,所以这个时候他就会给我们生成一个这种不是 ai 来做的,所以这个时候呢他就会给我们生成另外的语言,那我们就直接用这个语言就可以了。 当然这里的巨人战士待会呢我们直接去引用我们生成的角色就可以了,所以这个时候我们就可以把前面这一段全部复制, ctrl c 复制了之后呢再来打开节目平台,在这边我们要选择视频生成, 然后大面这里呢选择二点零的这个模型。那接下来在这个地方,我们首先第一个先把角色传进来,点击这里的上传内容,或者说我们直接把刚刚生成的图片直接给他右键用做参考图, 然后下面这里呢也选一个你喜欢的右键用做参考图,那这样的话就有两张图片,那接下来我们再把刚刚这一个提示词给它复制过来, 复制过来之后,接下来如果大家想要更准确一点,我们可以把这里的这个巨人直接这边有的艾特选择这个奥特曼,那包括下面这里所有的巨人我们都去换一下,然后像这一个 女武神这里呢,我们就把它换成我们的美少女战士,每一个都把它换好。换好之后接下来就可以点击生成,那生成完之后大概就是这样的效果, 我在守护不是破坏, 大家可以看一下他的配音,配乐其实都是非常好的,那接下来我们就生成十五秒以后的,因为他最多只能生成十五秒嘛,在这个地方最多就是十五秒,我们把后面的再把它生成出来,后面从这个十六秒开始我们就直接复制, 复制完了之后同样的按照刚刚的方法把它生成出来,生出来之后呢大概就是这样一个效果, 原来我们是一样的。 最后我们只需要在剪辑软件里面把两个片段拼接在一起,给他加一个转场,甚至我们不加这个转场都是可以的。这个转场在这里呢,我加的是一个闪黑的转场,当然我们如果不加的话,直接让他硬切也是 ok 的。 住手,别再摧毁这片城区,我在守护,不是破坏呀。啊, 原来我们是一样的, 好,那这样的话整个短片很快就出来了,这一个更新真的非常的厉害,他的运境以及配音的表达都已经非常的强大了。关注我,后面我会继续分享更多的玩法。大家好,我是有奶,那么相信大家很多人今天呢一直在玩我们极梦的二点零最新推出的一个视频模型, 那么有些小伙伴可能还没有去用过,甚至还不太了解,那么不用担心啊,那在这期视频当中呢,我会分为三个模块,给大家详细的讲解一下如何去使用。那么第一个模块呢,是关于我们对于它模型各种能力的一个小测试,我会详细的把我深层的一些案例分享给大家。 那么第二种呢,我会给大家讲一下如何去白嫖,或者说如何用最小的价格去使用我们的极陌二点零。那么第三个我会提供一些视频生成模板,包括一些风景图和一些生成模板给大家去使用,那么方便大家直接上手就快乐的玩耍, ok, 那 么最简单的玩法其实是根据一个人物的三式图,然后加上我们的一个即视词的一个生成,去严格控制他的一个视频的生成。那么这个效果的话呢,在开头的那个片段当中呢,其实大家也看到了,非常非常的棒,对不对? 那么这个目前来说呢,是所有其他模型都做不到的,他可以完全根据我的提示词去做一个生成,并且速度也非常快,然后放心,我会把我的那个提示模板给大家去提供免费的去使用。那么第二种玩法呢,是非常有意思的一个小玩法,就是我们截图上传一张小说的一个内容, 对吧?他会根据我们这个小说内容做一个深层给大家看一个效果哈,好,我们把这张图上传进这里的一个啊 c 的 档次的一个全能参考的二点零当中,他会根据我们这个效果呢去做一个视频,汗水周中未泛之德永不敢忘。 你,你已经好了,身上寒毒,你好了吗? 但是需要注意的话,这个玩法啊,因为我小时候截取页面内容上会比较长,所以他可能没有办法一次性全部生成,因为他觉得这个东西不符合多少多少秒,十五秒啊,他会做一个归纳,但是呢他只是一个玩法, 但是呢可以看出他是一个多模态的一个真正的视频模型,也就是说他肯定内置的一个智能体,他会去识别我们图像内容,做一个生成,这点对于视频生成是非常非常重要的。 那努布纳娜为什么强呢?就因为它是一个多模态的一个图片生成模型,它会根据你的图片内容或者你的要求呢,先去做一个智能体的一个处理,然后它才会做一个生图。所以这一次的睫毛二点零之所以这么厉害呢,就是因为它是不同于正常的一个视频生成模型 好,所以这个是个示范,只能体现出它这个模型的一个强大。那么还有一种方法是什么呢?就是我们会根据一张我们的分镜图,好,根据一张分镜图的使用好,我们来看一下, 就是我们利用 nasa 布拉纳生成一个九宫格的一个人物分镜图,它是可以完全遵循我们的分镜生成一个视频,那么当然呢,也需要提示词做一个辅助,但是不用担心啊,这些提示词的模组呢,我都会提供给大家的。我们再来看一下,根据这个分镜能呈现效果又是怎么样的呢? 对吧?整体效果是非常不错的,那么现在我给大家讲一下如何去使用这个二点零,以及我们如何白嫖这些次数,那么非常简单啊,我们在登录极梦之后,如果是网页版的话呢,记住一定是网页版, 就是如果你们要使用这个极梦二点零的话呢,哎,一定要网页版才可以跳出这个选项啊,然后我们进入之后呢,是这样的一个模式, 对吧?你们进入会应该这样子,如果你们没有注册过积木,或者你们没有付费过这个积木呢,你们第一次去付费的话呢,他是有一个这个一元的一个模式在这里啊,记得一定要去把它开通,这的话可以白嫖好多次是吧?因为一块钱就够了吗?那么再把这些做完之后呢,我们选择我们的一个视频生成, 好在视频生成里呢,他会跳出一个极梦的,这个啊,二点零啊,这个 c 的 dance 的 二点零对不对?那我们就利用这个一块钱的费用,一块钱我记得是有一千多积分啊,你们可以生成大概十多次的这样的一个视频,我觉得新手作为尝试来说的话,一块钱非常值得。 那么最后呢,我整理了相关的 ai 视频文档教程,还有 c 的 二点零的一个教程使用手册送给大家。好,一个是我们今天的一个视频生成,包括我们生成的一个模板,因为这些时间非常紧张,所以呢我今天才开始玩,也不忘记得关注一下,期待下期的一个新玩法。

自杰 ced 十一出手,慢剧圈的春天来了,现在只需一句话, ai 自动帮你顶级运镜。 那本期视频我将把 cedison 二点零使用手册和制作 ai 慢剧全流程分享出来, 相关的制作流程、提示词和 ai 工具我都以文档的形式整理好了,感兴趣的六六六带走。如何用 ai 制作出一部短片?其实非常简单,一部完整的短片,至少包含视频、台词、配音、配乐这些全部都能用 ai 轻松搞定。 而这里面最难的就是用 ai 做出符合故事情节的视频,以及保持角色的一致性。今天讲的全是技巧,我会手把手将你一条龙搞定。 写故事生人物配音、剪辑,创建一个 ai 短片视频,那我们现在正式开始吧。我这边做了一个流程图,大概分为六个部分,故事的脚本、 ai 图片的生成、 ai 视频的生成、配音、配乐、字幕以及视频剪辑。 我们先来看故事的脚本,我一共把它分成了几个模块,首先第一个我们要先去确定主题,第一种可以去跟客户沟通,第二种也可以自己去设定。就比如这一次的案例,就是以女娲补天的故事为例子去做了一个动画。那我们有了这样一个想法之后,就可以去生成剧本了。 剧本呢,我们可以借助大语言模型来生成,这里给大家推荐的就是 deep tech, 豆包和文心一言都是我们国内的,那我这边打开豆包的网站,直接给大家演示一下。 我们给他这样一段话,告诉他他是一个专业的动画故事编剧,真根三 d 动画领域,因为我现在想要做的就是一个三 d 的 动画, 那我们可以看一下这个就是他给我们写的一个剧本,比如说镜头一,镜头二大概是什么样子的,大家也可以去看一下有没有需要修改的地方。像这里他已经把场景画面和旁白都给我们了,相对来说还是比较全面的,当然我们肯定还是要去修改的。 当有了这个剧本之后,我们就可以让他直接去生成剧本中每一个人物的角色设定啊,我们可以给他发送这样一段话,让他给我生成剧本中每个人物的角色设定,需要包括这个角色的外形、服装、性格、行为特点。做这一步的目的就是为了保持我们人物的一致性, 那我们直接把这段话发送给他就可以了,发送完之后大家可以看一下,他就把剧情中出现的所有角色的设定都给我们写好了, 就比如说女娲的外形是什么样的,服装是什么样的,效果不是很好,也可以让他再去重新生成一下,不满意的部分都是没有问题的。 虽然只是一个雏形,但至少在前期我们会对整个剧本有一定的了解。到这一步我们的角色设定就做好了。那角色设定做完了之后,我们就要开始出分镜了,因为前面生成的只是一个剧本,这个剧本我们可以随时去修改, 修改完之后就要去生成 ai 能够识别的提示词,因为我们要生成图片的话,就需要把分镜脚本做出来,分镜脚本基本上就包含了提示词、旁白以及音乐这些。那我们后面生成图片的时候,直接拿这个分镜脚本里面的内容就可以了,那这个分镜脚本我给的提示词是这样的, 让他直接帮我把剧本转变为分镜脚本,每一个镜头不要超过五秒钟,角色设定也要把提示词写出来,就是我们之前生成的这个角色设定,其实你也可以直接去用,但让 ai 帮我们先整理好提示词的话,生成出来的效果会更好一些。 ai 声图的提示词让他写的详细一些,不需要具体到详细的参数,但要把风格写出来。后面这个其实就是表格的格式,我们把这个格式发送给他,那他就会直接帮我做成表格的样子,这个就是他给我们生成的一个分镜脚本, 这个脚本就是按照我们的格式来的,他就直接把运镜方式、景别是什么样子的,以及 ai 文声图提示词、 ai 图声视频提示词都给我们了。 当然这个我们肯定是要去修改的,大家可以先把这个表格直接下载下来,或者就直接让它存到这里也是 ok 的。 但如果大家后面还想要来回用的话,最好还是把它保存到本地, 那我们也可以先看一下它这里一共给了我们多少个镜头,大概是二十个镜头左右,我们可以先把每个分镜的图片生成出来,再把视频生成出来,就可以得到一个比较好的效果, 大家也可以自己去判断一下,不是说每一个镜头我们都要完全生成出手尾针,有的分镜可能只需要生成一个镜头就可以直接去生视频了。比如第四个分镜,这里讲的是人群逃亡的一个场景,我们就可以只生成一个手针,然后用图声视频的提示词生成视频就可以了。 所以这个部分大家可能要自己去斟酌一下,到底是用一个画面还是两个画面去生成视频会比较好。好,那到这里我们前期故事脚本的准备工作就已经全部做完了。 ok, 那 我们来讲一下第二个部分, ai 图片的生成, 我一共把它分成了四个模块。首先第一个选择台平台这一块我给大家推荐三个,第一个建梦,第二个是 sd, 第三个是 mj。 m g 是 最早普及 ai 图片生成平台,但它是国外的,虽然生成出来的图片很漂亮,但我们要用的话是需要科学上网的,而且成本也比较贵。 s d 它的可控性相对来说会强一些,它是可以本地部署的。 那纪梦我觉得结合了这两者的优势,首先他的图片效果现在已经非常强了,他对图片的控制和一致性都保持的很好,又没有那么难。所以呢,我这边用到的也是纪梦。那我们选择好平台之后,接下来就要了解一下纪梦提示词的结构。 那季梦的提示词我们用连贯的自然语言去描述就行了,就是用大白话去把它讲出来就 ok 了。但风格、色彩、光影以及构图这些画面美学的名词还是需要用短词语去描述的。那我们现在要生成一个动画短片,首先要知道你想要生成的风格是什么样的。 这边我也给大家截取了一些纪梦和剪映里面比较推荐的风格,比如二 d 卡通的风格,三 d 卡通的风格,儿童画的风格, q 版的风格, q 版比较可爱一点。再来就是日漫的风格,这些都是比较常用的,感兴趣大家可以自己去深入了解一下。 那你脑袋里面应该有一个大概的想法,你想要什么样的风格?比如我们现在做的是女娲补天的,那如果我们觉得国漫生成出来的效果相对来说是偏卡通的,我们就可以在他的基础上再添加一个三 d 写实。 那大家要记住这些风格是比较难的,所以我们就可以先去找一下别人做出来的这种国漫风格大概是什么样子的。直接去搜索国漫人物,他就会给我们展示各种不同的国漫角色,选择一张自己比较满意的,直接截图或者保存都可以。 好。然后我们再来到豆包上传图片,直接让他去反推提示词发送给他这样一段话,让他生成要包含画面的风格、构图、光影、色彩, 生成出来后,再结合我们之前生成的角色设定,把设定写在前面,后面再接我们这个反推的提示词,就可以直接用这个提示词去生成图片了。 当然这个 ai 给的提示词我们肯定是要去修改的,像这种国内的模型,它对我们国内的词汇理解能力相对来说会好一些。 ok, 这个就是我们的风格。再往下面看光影这一块,我这边也给大家截了一些出来, 逆光是什么样的,侧光是什么样的,还有侧逆光、柔光大概是一种什么样的感觉,我们都要了解一下,这样去找图片的时候就会好找一些。 再来就是色彩,我们至少要知道什么是暖色调,什么是冷色调,高饱和、低饱和,高对比,低对比这种我们都可以在提示词里去给他一定的描述。再来就是构图,其实我更建议大家去找一些构图比较好的图片再去学习。 好,当我们掌握了这些理论知识之后,接下来就可以去生成人物形象了。那生成人物形象这个部分,我们可以选择生成全身像或者半身像,全身像其实就是为了把他的服装以及高矮定下来,半身像角色的五官相对来说会清晰一些。这边我直接打开季梦给大家演示一下, 大家可以看一下,这个是我之前生成的模型,大家可以都先试一下,看看哪个生成出来的效果会比较好。我这里用的是四点一的模型,生成这种国漫卡通风格的角色,相对来说效果会好一些。把提示词复制过来,比例这里选择九比十六, 提示词里记得添加上全身或者半身立绘图,点击生成就可以了。像这里我写的全身立绘图,他给我生成出来的还是半身的,这个就可以先不用管,我们先挑选一个满意的造型,最终我选择的是这个形象。那当我们得到了这个形象之后呢?接下来就是把这个半身图变成全身图了, 我们可以直接把选好的这张角色图给到他,再描述一下全身像,穿着鞋子就能够生成出比较稳定的全身像的感觉。 因为我这个角色是光着脚的,所以我就把穿的鞋子换成了光脚。生成完全身图之后,可以再用智能超清处理一下。智能超清的细节生成程度不要调的太高,调到二十至三十左右就可以了, 太高他会给你重新生成一些多余的角色设计细节。我们前期尽量把服装定好一点,这样在之后生成图片的时候,前后的一致性也会保持的更好。 那当我们把女娲定下来之后,就要去生成一些配角的角色设定图了,我们把配角的提示词复制过来,上传女娲的设定图,让他参考图片风格,帮我做出配角的形象。同样的,生成完之后,最好再用智能超清处理一下。 把所有角色的设定生成完之后呢,接下来就可以开始生成分镜图片了,我们就根据这个分镜脚本的表格去除分镜图。分镜图这里要注意的是什么?就是人物的一致性。这边我还是给大家看一下像这个分镜,它只是展示了人物的正面半身,我们就直接上传角色的正面图就可以了, 但有些场景是需要展示人物背面的,例如这个分镜,我们就需要再去生成一下人物的三式图,这个直接去豆包上传设定图,是否帮我生成这个角色的三式图就可以生成出来了。 我这里就只生成了女娲的三式图,因为只有女娲会有各种角度的展示,那关于场景的部分,我们可以先生成一张场景图,然后再放到 a 字模式里,让他帮我们根据这张图片生成一个场景变化的图就可以了,那这个就是我们图片的生成。 接下来我们再讲一下 ai 视频的生成, ai 视频生成的方式主要有两种,第一种是在线的平台,第二种是本地的,本地基本上就是 copy 与位。在线平台这一块我也给大家列出出了几个,这是不同平台的一些优势, 像纪梦性价比非常高,他可以生成数字人,就是在生成动作的同时来讲话。海螺打斗和特效做的比较好,可灵的画质比较高,但也比较贵。通赢万象是支持生化同步的,对于情绪的表现力会更好一些。 若恩是国外的平台,需要科学上网,那我这边主要用到的就是纪梦。给大家演示一下, 我们打开界面之后,可以先把图片传上来,再把提示词复制给它。提示词其实在我们之前生成的分镜脚本里面都已经给我们了,我们可以直接把这个 ai 图声视频的提示词复制,然后回到积梦里粘贴模型这一块,选择默认的就好,然后再点击生成它,就能够生成对应的动画视频了。 后面的分镜我们也用同样的方法在脚本里直接复制就好。当然并不是所有的视频提示词都能直接复制过来用的, 像这个画面呢,我就没有直接用他的镜头提示词,因为脚本这里只有动作的描述,没有情绪的描述,所以我就把这个分镜的提示词修改了一下,大家可以根据自己图片的情况适当做一些修改。 像这种比较简单的动作,我们都可以用纪梦来生成,那如果是稍微复杂一点的或者有特效动作的,我就比较建议用海螺来生成。 这边也给大家看一下我用海螺制作的首尾针的效果,像这个分镜就是用首尾针生成的,生成出来的效果还可以,但这个分镜我也是生成了很多次才出来的,因为他有时候生成出来的效果并不是很好,所以我们要不断的去刷图,然后找到一个相对来说比较好的。 像这种效果如果我们用镜幕来做的话,是肯定出不来的,很多镜头都需要自己去补充,包括这种特效效果我们都是用海螺来生成的,相对来说效果会好一些。 像这个镜头我是做了蛮久的,生成了很多次,发现效果都没有很理想,要不就是乱切镜头,要不就是模型崩坏。所以说可能大家看到我展示的最终成品效果还不错,但其实他都是有很多不同的镜头衔接而成的。 好, ok, 这个就是视频生成的部分,视频生成完之后呢,我们就要开始去配音了,像这个视频它是没有人物对话的,所以配音的部分相对来说会比较简单,所以我主要用到的是剪映,这里给大家演示一下。 打开剪映,点击左上角的文本,这里有一个添加口播稿,打开之后我们就可以把分镜里所有的旁白直接复制过来。下面这里是可以选择配音音色的, 选择好音色后,点击一下左边的智能分割字幕,它就会自动帮你把每段话分割好,并生成对应的字幕,能帮我们节省很多时间。参数全部设置好之后,点击添加到轨道里,配音和字幕就完成了。 好,那我们做完配音和字幕之后,接下来就可以去剪辑了,剪辑这一块我们要先导入所有的素材,然后对它进行一个初剪。 初简就是要调整各个分镜片段和旁白朗读的速度,有的可能需要加快,有的就需要减慢,还要调整一下旁白的文字表达和字数长度,让 ai 念出来的语速和韵律更加自然通畅。把不要的片段删除之后,再来做精简。 精简就是要在对应的分镜画面上添加对应的音效和整个视频的背景音乐,然后再根据不同的音轨调整一下音量的大小,字幕分段和字体样式也可以根据实际情况做一些调整,最后导出就可以了。 这边我也给大家演示一下这个镜头,我把它拆分成了两段,因为这里是一个天色变化的场景转换,需要对这两个片段进行不同的变速处理,来呈现天色快速变化的效果。 再到后面这里我对配音进行了一个减速的处理,就是在某些地方我会让他变得慢一点点,再到某些地方可能就需要加速一下,包括音效的一些速度与音轨的位置,也是需要根据画面的节奏去调整的。当然如果大家觉得需要转场的话,也可以加入适量的转场, 其实很多时候我们直接用硬切就可以了。背景音乐这个部分我们可以直接在音频音乐库这里直接去搜索,比如说我输入神话故事,那他就会给我展示很多和神话故事相关的背景音乐。 如果想根据不同的场景做出一些音乐变化的话,也可以插入多段背景音乐,做更细致的音乐处理。 当然我们也可以借助 ai 去生成一个背景音乐,在剪映这里的 ai 音乐就可以直接生成。我们可以先用大模型生成出一些背景音乐的提示词,再把提示词输入进来,点击开始生成就可以了。 因为我生成出来的这个背景音乐不太适配我这个视频内,所以我用的还是音乐库里的音乐,像音效库这一块也是一样的,大家也可以用 ai 生成适配画面的音效,这里我就不给大家演示了,大概就是这样的一个流程,当我们把所有部分编辑好之后,就可以导出了。 以上就是我们整个 ai 短片的一个制作流程。上古之时,天地祥和,历久弥明, 不易骤变突升,天穹开裂,暗流席卷天地,乱石坠落,岩浆奔涌,山林尽染。 纤民父老邪恶奔逃,在劫难中苦苦挣扎。童子之手不迟刹那分离,孑然无一,又同师徒跌倒,繁衍巨色,灾祸降临四方。女娲俯看此景,虽决意挺身而出,寻尸补天, 立于高山之巅,其依然奔赴。寻石之徒,手探赤热火山,徒手攀越岩壁,寻赤红石, 潜入幽幽深潭,穿越暗流险阻,觅青林石,登顶冰封雪山,恢复凿开兼冰采白寒石。历经重重艰险,五色齐时,尽数齐齐。 女娲立于火山练石台,以神力为引,借熔岩之威,开启催练仪式。五色奇石消融汇聚,化作流光溢彩的五彩石浆,石浆承载万物,希望古天征程即刻开启。 女娲纵身欲起,直扑天穹裂缝,五彩石浆如星河一般倾泻而出,封堵天穹裂谷。 天穹既合,风雨渐顺,万物复苏,先民重拾希望,世间重归安宁。 这一切皆因女娲一腔无私,既是大爱。女娲补天的壮举从此流传千古,成为世间最温暖的信仰。

新发布的极梦二点零耗费价格多少?在哪用?有哪些玩法?不足之处是什么?先说价格,每秒视频六积分,约等于六毛钱,单次生成视频可选择,最短四秒钟,最长十五秒。第二个问题在哪用?目前使用最多的是在极梦电脑网页端,仅会员用户可用, 手机极梦 app 暂不可用。值得一提的是,小云雀有极梦二点零模型选项。第三个问题有哪些玩法?二点零模型中文声视频片段静态变动态 全能参考,也就是多模态融合支持,同时上传十二个参考文件,适合专业级内容创作。复杂去式 ip 角色还原。哪些人用极梦二点零模型最多?超过百分之四十为短视频创作者,百分之二十五为电商运营,百分之十五为短剧、慢剧创作者。 不足之处一、复杂视频仍需较长时间,多次测试海贼王经典打斗动作镜头用时二十分钟左右。二、画面偶尔闪回,极少数情况下有杂音。

这两天有个叫 cds 二点零的家伙迈着六亲不认的步伐走来了,所以他有那么强吗?把这个视频里的角色换成小猫和小狗。楼上三二二住的是马冬梅家吗?马什么马冬梅什么冬梅啊 马冬梅呀马什么梅呀!去掉视频里的人物,把这个视频的运镜应用到这个产品里,用嘴 p 视频的时代真的来了,那这期视频我将教会你 cds 二点零全部玩法。 在小梦梦里,选择视频生成模型,选择 cds 二点零,选择全能参考,再上传宠物玩手机的图片,输入这段提示词,告诉他在规定的时间内做出指定的动作。点击生成, 继续给他一张产品图,再输入这段提示,交代好在规定的时间内做出指定的内容,你就会得到这样的商业大片, 用色彩唤醒活力年轻色彩活力全开, bg 色彩年轻活力无限。先准备一段参考视频,再把要替换的角色和视频都上传进来,输入这段提示词,点击艾特,选择视频,告诉他把视频里的人换成图片里的人物,并模仿视频中的运镜和动作背景换成古代街头 怎么样? 同样给他一段参考视频和产品图,让他把这个产品参考这个视频的运镜,就能得到这样的视频效果。 像这样的广告大片现在也能轻松的复刻出来。 当然你还可以上传一段自己拍摄的视频,再输入这段提示词,你就可以得到。这样 给他两张角色图片和场景图片,再输入这段提示词,你就可以得到一段打斗的片段。 那这是我提前生成好的一组九宫格分镜图片,现在只需简单的描述,你看他竟然能自动切换镜头。总之以上玩法都可以结合使用。对面几个人 是表哥吗?呃呃呃,是表弟呀啊表哥。哈哈哈哈你不要过来呀。 ai 创作虽便捷合规,底线不能越文明玩 ai 创作更精彩,拒绝滥用肖像,尊重影视版权,魔改有风险,创作需谨慎。

哈喽,大家好,我是日行一善,今天我们来讲解一下吉梦新上线的这个 c 单词二点零模型,这个模型刚一上线啊,就是效果非常炸裂,很多人都在用, 尤其是这个模型生成出来的 ai 慢距的效果,效果是非常牛的,像开头我们看到的那个视频,都是通过这个 c 单词二点零给我们来生成的这个模型的这个升级啊,主要有这么四点,它可以参考图像,可以精准的还原画面的这个构图,还有角色的这些细节, 以及参考视频支持镜头的这个语言,复杂的动作节奏,还有创意特效的这个复刻,以及我们可以上传视频,让他平滑的延长与衔接,按照用户的这个提示词生成连续的镜头 以及这个模型,他有编辑的这个能力,可以把我们想要编辑的这个视频上传,对已经上传的这个视频进行角色的更替删减,还有增加,这个模型非常强大。我们再来看一个实力, 这个动画效果已经非常炸裂了,这个是对哪吒二做的一个番外的一个延伸, 我们可以上传这个角色的这个图像,再生成一段提示词,就能给我们生成出这样非常炸裂效果的这种漫剧的视频,以及这个效果哪吒跟敖丙的一段打斗的一个特效, 像这个效果无论从运镜还有这个镜头的切换都是非常丝滑的,但是从细节上稍微还有一些瑕疵,但能做到这个程度已经非常牛了。 好,这次这个 s 二点零的这个能力的提升啊,主要针对于物理的这个规律,它生成出来的更合理了,还有动作的表现更加的流畅,还有对我们输入提示词的这个指令,生成出来的视频更精准, 以及风格保持的更稳定。下面我这里有些提示词啊,大家有需要的可以找我领取一下。好, s 二点零的这个模型,它支持这个多模态的一个输入, 既可以上传我们的文本图片、视频、音频这些素材都可以上传给到这个 s 二点零做参考。我们的提示词中也可以参考我们上传的这些素材做特效,还有运镜,还有人物场景声音, 只要我们这个提示词说清楚模型,他就能够理解,所以这个 s 二点零的这个能力,多模态参考的能力可以参考万物 以及强创意的一个生成,再加上我们提示词的指令响应的更加精准,他的理解能力也非常棒的。以及我们给他上传完首尾帧的这个图像,还可以上传一段视频做参考,让他参考我们视频,比如说视频中的打斗动作或者说风格都是可以的, 以及之前我们很难做到的一些视频效果,现在都可以做到,比如说这个一致性,就画面里的人物,首先要保障这个人物的一致性,还有镜头风格的一致性,现在的这个二点零都已经解决了,就是从人脸到服装再到字体这些细节,整体的一致性 更加准确,以及高难度的一些可控的运镜,还有动作的精准复刻也是可以做到的。我们可以看一下这个视力效果, 这个人物一致性保持的就非常好,以及我们做这种角色的这种参考我们上传人物的这个角色,再上传一个视频,模仿这个视频的打斗动作,好生成出来这样的效果。我们来看一下 这个效果都非常不错。以及我们还可以做这种创意的模板,复杂的特效的这种精准的复刻,好,照着这个模仿做这个创意的转场广告的这种成片,还有电影的片段都是可以的。 好,有需要这个提示词的可以找我领取一下。好,以及我们做这种 ai 慢剧,做这种剧情补充的这个模型也是可以帮我们做到的, 以及他有对这个视频做这个延长的能力,参考我们上传的这个视频,帮我们去延长这个视频后续的剧情,以及这个模型他的提升对这个音色更加准确,声音更加逼真,以及这个以及镜头的这个连贯性做的也非常好。 好,我们可以看一下这个一共是上传了五张图,一镜到底,追踪的这个镜头从街头跟随跑步者上楼梯,穿过走廊进入房顶,最终俯瞰整个城市。好,我们可以看一下这个视频的这个效果, 无论从这个角色转场,还有这个人物一致性上做的都是非常的好。以及我们可以针对于我们上传的这个视频做二次编辑,还有对音乐的这种卡点,比如我们可以看这个就是海报,我们上传几张模特还有服装的这个图片, 我们可以生成这样的这个效果, 这种对于做服装展示的视频就非常好。以及下面我们这种做剧情的,他的这个情绪演绎的也是非常到位。我们来看一下这个 啊,沉思了一会,突然开始崩溃,大叫,抓镜子,动作崩溃,情绪表情完全参考我们上传的这个视频。好,我们来看一下。 好,这个情绪做的也非常好啊, 所以这个吉梦 s 二点零的这个模型上线,代表着我们国产的这个视频模型又上了一个更新的一个台阶。好, kill the game, 大家有需要我这个全套提示词的可以找我领取一下。我们再回顾一下开头的这个视频画面。 好,今天的课我们就讲到这里啊,有需要这个题诗词的可以找我一下。好,谢谢大家。

这两天豆包上线了免费的 cds 二点零模型,但是跟季梦的 cds 二点零对比,感觉是两个东西啊。这个是季梦的,我生成了一个我的 ai 形象,然后跟季梦说帮我生成一个在夕阳西下玩滑板的视频,然后季梦给了我,这个 就挺真实的,如果没有 ai 提示,真的很难分辨真假。但我用同样的提示词跟 ai 形象给到豆包,他给了我,这个 只能说也挺好,就是这个人物跟我的 ai 形象已经没有任何关系了。所以如果你想正儿八经的搞点有价值的 ai 视频,还是老老实实付费吧。好,那针对极梦,我们再来看一下,如果给他特定场景、 特定声音、特定剧情,会怎样呢?来试一下。这是我写的小剧本,我将它分成了两段剧生成,然后这是我要求固定的场景、人物、道具以及我的声音,接下来看看生成的效果如何。 皇上,今年的高铁票奴才又没有抢到。哎呦,都说了以后叫大哥,清朝已经亡了,是皇大哥,高铁票抢不到,你就用黄包车拉我回去啊。 这。哎,累死老奴了,该死的高铁票为什么这么难抢?看完这个视频,其实还是有挺多瑕疵的,比如这里的这个场景,明显跟我提供的场景是对不上,但然后面我又调整了提示词, 深层了几遍,但每一次多多少少都会有一些些的瑕疵,不过总体来说还是很好的,起码他的分镜很专业,很连贯。好。最后来总结一下,就是,经过测试,肯定还是付费的 cds 二点零更具备可玩性,但是一旦给到他比较细致的要求,目前来说还是有缺陷的,不过如果你不那么抠细节的话, 那么普通人也能做出来很多看着很专业的小段子电影或者是动漫了,而且上手门槛真的很低,再加上如果你的脑洞够大的话,那这个就真的很适合你了。

最近做视频的新模型, c 单词很火,对吧?然后有很多同学是没有用过,我今天跟大家分享它的最全的几种做法,你看完之后,你就成为了一个电影导演,而且是非常牛的电影导演, 大家看一下,可以选择的啊,我们这里边点开这个视频生成,这里直接就出来 c 单词二点零了。 那我们先讲第一种玩法,我们可以不输入任何的图片,把这个提示词输进去。这个提示词我说的是什么呢?因为最近比较流行的就是有一只猫在床上面玩手机,然后呢来它的主人呢,就敲门进来的,就把自己藏起来,这个是很好玩的视频,我把它变成一个十秒钟吧, 这这里可以选时间了,什么东西都可以不选啊,只要这个就行了,这个呢,十六比九比例,你可以自己选啊,让他去给我们生成,相当于是我不给他参考图,自己也可以生成的, 我们再来做一个。这视频是怎么做的呢?就是我就只给他一张图片啊,你看我给了他这样子一张武侠的图片,手中拿着杯子,对吧?这个提示词是怎么样子的呢?我说要做一个超长远的箭头, 从太空穿过云层,长箭头一路拉进去手上的杯子特写,我就是这样子一张图片,给我做一个超长的长箭头出来,这是做的第二种的这个方法。 第三种做法是怎么做的呢?我先上传一张图片,这张图片就是刚才的这个穿白衣的,你看这样子是两针了,对吧?首尾针的时候选一个全能参考啊,你就可以艾特 第一张图片,对吧?图片一啊图片一,你看他就可以选择。第一张。图片一,主体人物干嘛呢?慢悠悠着查,然后说你来了,然后 我们就可以再艾特图二,人物从空中轻功飞下来,落地 人物说,我来了,我等这一天已经等了十年,那这时候的话,我们可以选择十秒钟,对吧?看看十秒钟,这样我是不是只要两张图片,我就可以把这个剧情给完整给设计好, 你来了,我来了,我等这一天已经等了十年,然后我们再来。第四种啊, 总共上传三张图片啊,这三张图片是什么呢?你可以看一下。第一张,行驶在公路上的一辆大卡车,然后第二张呢,就是大卡车变成了一个 机器人变形金刚。第三张图片呢,太空战舰。好,这样三张图片的时候,比如说我艾特图一,对吧,卡车在高速上飞速在 高速行驶中完成变形,再艾特一下图二这张变形金刚,然后看着 图三开火,在空中开火,双方激战,各有胜负,我就让他十五秒好了,然后完成这个剧情。 第五种的做法应该是怎么做呢?同样上传两张图片,一张是白衣大侠,一张是黑衣大侠啊,然后呢,我就用这个首尾针的这个方式告诉他。图一人物轻功飞起,从 亭子里跃出,站在了图二主体人物面前,双方开始侠 一样,打斗需要有剑气啊,各有胜负,我就搞个十秒钟,让他们开始打。 接下来讲第六种做法啊,好,我现在上传 上第一张熊猫的图片,然后呢,我再上传一段视频,这段视频的话是网友一个骑车的视频啊,这视频的话最好是十五秒以内啊,我说在长安的街上快速的骑行,沿途的摆设都目瞪口呆,然后我们来看一下啊,我这时候我再发给他, 学会了吗?我是西门一个分享干货的博主。

先看视频, 那这个视频呢,我想跟大家聊这样三件事,第一就是为什么让 ai 做出这种画面比你想象中的难很多。第二,我会手把手的教大家怎么把这种视频做出来。那第三个呢,也是我觉得最重要的,我觉得这个事情对大家而言,或者对未来意味着什么。最近 cds 二点零,我相信很多对 ai 感兴趣的人,肯定刷到了 他自己在自己的官方文档标题里面写的是 kill the game, 然后黑神话悟空的制作人呢?冯继也说 a i g c 的 童年时代结束了,然后马斯克都转发说 it's happening fast, 然后发展太快了,我当时看到铺天盖地的新闻,今天虽然是情人节,然后学长硬拉着我要过情人节,我说我不能过,我一定要把这个视频做出来, 然后全网呢,都在用它做各种非常炸裂的视频,大家看,比如说什么怪兽大战啊,太空石狮,魔法世界,这些看起来很震撼,但我想说一个可能反直觉的事情,就这类视频反而是 ai 最容易做好的,因为没有人知道外星球长什么样子, ai 随便怎么生成呢,都不会穿帮。 但是我呢,做了一件更难的事情,我让一只恐龙住进了我们家,还生成了一个这样的短片,我们家的这个客厅布局,院子的样子,以及这个钢琴的位置。哎,老粉丝比我还熟悉任何一个细节,不对,那这个视频的 ai 感就非常强,但大家看刚刚的这个成片,其实还算是不错吧。 先说这个让恐龙住进我们家为什么比这个星球大战的视频更难呢?那大家刷一下就会发现,现在大家用 ai 做的视频,绝大多数都是幻想的场景,那这些场景很炸裂,我也试了一下,就比如这,我给了这个 cds 二点零,我给了一段学长和小帅在床上就是乱打的照片,然后我跟他说,让他参考这个视频打斗, 把这个小孩改成英雄,然后成人改成角色模仿这种史诗级的对决。 这个场景虽然看起来很炸裂,对于 ai 来说其实非常简单,但是我刚刚给大家看这个恐龙住进我们家的视频,我却搞了大半天。 那为什么呢?其实是 ai 生成视频的底层逻辑,它是从海量训练数据中学习,就什么画面是合理的,那幻想的场景在训练数据里并没有标准答案,卫星球长什么样子谁都不知道,所以它怎么生成呢?大家感觉都还不算错,但是像刚刚这种恐龙真实的场景就很不一样, 用 ai 呢呢?他学过无数张就真实可信的照片,哎,他知道哎,沙发应该是比人要大的,然后光影哎怎么去打的,这个透视应该怎么变?所以 一旦这个恐龙放进去的比例不对,任何这种家具的穿模、光线的矛盾或者比例,大家其实一眼都能看出来不对劲,马上就会识别 这个是 ai 生成的。所以我觉得真正 care the game 的 不是生成这种炫酷的画面,而是让 ai 融入了我们这种真实世界的场景,我觉得这个才是最难的。 接下来呢,我也想教大家我是怎么做的,就迫不及待想跟大家分享。我觉得主要就是三个关键的点,首先第一步就是你得设计一个角色,我为什么选恐龙呢?是因为小时候,在他在很小的时候就跟我说过,他说,哎,妈妈,我小时候想养一头恐龙, 所以你一开始呢,要选一个纹身图的工具,要把这个恐龙的形象生成出来。那其实我自己也是试了这个十几个版本,我用的呢,其实就是积木,学长当时说让我用纳努不纳,我说我就用积木吧,有的就是太写实了。像这个版本的恐龙呢, 就是有点太写实了,我觉得不是那么可爱。最终呢,我选了这种皮克斯风格的,就是他身上还有一点水珠,还有一点鳞片,看起来呢就是既油耗又温暖,还很写真。你得在这些所有的图片中选一个你最喜欢的主体, 然后每一次都要参照这同一张照片作为主体。那设计这个角色的时候,你需要三张参考图,一张呢是管这个整体的造型哎, 一张呢是管这个身材的比例,还有一张呢就是面部特写的表情,然后每次生成视频的时候都要带上这个作为参考,确保恐龙呢在每个镜头里长得都一样。第一步,这种纹身图我觉得相对来说还是比较简单的。那第二步就是场景匹配,就是把家里就拍个遍。我今天早上起床第一件事情 就是去院子里拍照片,客厅拍照片,然后卧室拍照片,然后我把家里我觉得可能恐龙会出现的场景全拍了一遍。那拍的时候我就会大致去想, 哎,这个恐龙大约是站在哪里比较合适家具的位置会不会跟恐龙很冲突?比如说我客厅呢,就平视拍了一张,然后我还俯视也拍了一张,然后院子呢,我也是站在了一个倾斜的角度以及卧室呢,我拍了小十二的这个背影,因为它是不能出现真人的,所以千万不要拍人的这个正脸照。补充一下,当你确定完角色以及场景之后,你就可以正式的 来进行视频的生成了,然后呢我也会附上这个 cds。 二点零的时候,我也想提醒 大家,大家首先去选这个视频生成,然后它有两种模式,一种是这个首尾帧,就是你传首帧和尾帧,我选的是这个全能模式,那我全能模式你就可以传更多的照片,而首尾帧只有两张。 比如说我生成的第一个场景,就是恐龙在这个院子里面敲这个窗户的场景,我就跟他说艾特图一,图二是这个场景背景,图三呢是这个 恐龙的质感,体型比例呢则是参考图四,那这样的话,它生成出来的那才是更丰富的。那这些提示词呢,每一个都会说这个画面是怎么样的?超高清,八 k 画质,电影级质感,然后细节清晰等等, 这些提示词看起来都很长。然后这个提示词呢,都是我用 cloud 写的,我把我大致的想法告诉他,我说,哎,请你帮我写成能够丢给这个视频生成的提示词,然后他就会给我这样子的提示词,非常的方便,你可以用 cloud, 你 也可以用任何一个 ai 来帮你写提示词。弄完了这些场景呢,第三步呢,就是镜头的衔接, 这个呢非常重要,因为 ai 生视频有一个天然的问题,就是每个视频它都是独立生成的,比如说我在生这些的时候,我都设定了它生成五秒钟,那他不知道上一条是什么样子。所以呢,如果你不处理哈,恐龙在镜头 a 里面朝左,在镜头 b 里面可能就朝右了。比如说我拿客厅那个左和镜头举个例子,恐龙当时扫掉了尾巴上的杯子, 这条视频的最后一帧就是恐龙侧身的样子,然后我就把它这个侧身的样子就截图保存下来了。我下一个场景是希望生成这个头探出来,然后他很无辜的表情特写, 我就把最后一个他身体转动扫掉杯子的那个截图上传,告诉 ai, 这个保持恐龙的位置和朝向不变,然后镜头从全身推到脸部特写,那同样的方法就是这个无辜表情,之后,恐龙他惊恐的转身, 而他的尾巴就砸掉了这个钢琴,然后我再把这最后一针截下来,下一条就是恐龙趴在地上一动不动,假装什么都没有发生。这三四个镜头就是扫杯子,然后他露出无辜的表情,然后砸掉钢琴,最后装死。 这镜头连起来呢,就非常的流畅。这四个镜头全部是我用上一针接下一针的效果,虽然呢,每个都只有五秒,但连起来就加了一点故事感,然后你再加一点点花字,就非常像一个完整的短片。当然坦诚的说哈,并不是每一条都一次性成功。 a i c 视频呢,还是有点像抽卡,有的时候第一次效果就很好,有的时候我也调了好多次的参数,整个过程确实是花了我三四个小时,但是大家想一下哈,原来这种效果可能要专业团队做真的做很久,但这次大家看这个成片,就是我觉得真实效果的一致性,就我们家的所有的东西,基本上都是没有动的,我 看完当时确实非常的激动,所以也迫不及待录视频跟大家分享。好,那最后呢,我也想聊聊这个开头说的三个问题的最后一个问题, 这个事情到底意味着什么?我自己呢,确实是非常兴奋的,我觉得这对正在找工作的同学来说,可能意味着会用 ai 这件事情,他可能已经不再是加分项了。那现在呢?他已经变成了一种基本功。我觉得未来不论你是想做内容、做营销、做设计、做产品, 当你的竞争对手,他一个人能干一个团队的活,而你还在用传统的方法,我觉得差距就会慢慢拉开。那我身边有一个很传统的朋友,他说他去年的时候他还在公司里面说我们要抵制用 ai, 今年已经跟大家说要全面拥抱 ai, 而且给他们公司的所有员工的电脑全部买了各大公司的最高级的模型,让他们去用。所以呢,我觉得大家真的可以去试一试啊,当然就是 cds 二点零。 这次我觉得就是如果你不充会员,你要等很久很久,我前一天晚上没充会员,等了我三四个小时,然后今天就氪金充了会员,然后升的就非常快了。然后我觉得每个孩子心里呢,都住着一只恐龙。最后呢,我也想把这个短片放在 p 二了,特别感谢 ai, 他 让我用一台电脑就给孩子造了一个梦想的世界。

四种 cds 二点零玩法,一、替换场景,上传一段自己拍摄的视频,输入提示词。 二、视频复刻,上传一张自己的照片和一段爆款视频,输入提示词。 三、分镜生成视频,上传一张包含多个分镜的图片,输入提示词。 四、角色乱斗,上传两张角色图片和一张场景图片,输入提示词。

千万不要学 ai, 不是 讽刺调侃,最近字节发布了 cds 二点零效果,大家也看到了四个字,一家完整好了, 那为啥让你别选了?跟你说一下,就前几年用 ai 制作视频的流程,最早的 ai 图片生成工具 stable diffusion。 使用它,你首先要投资一张还不错的显卡,接着就是要掌握很多提示词,再用极其复杂繁琐的参数设定, 花大量的时间跑图微调,直到运气好抽到一张能用的卡。后来可以通过图像生成视频,但你需要提前生成好不同的分镜图片,而且难以保证一致性。 假设你运气好生成了几个可以用的视频,此时还需要在剪辑时对口音配音、配乐音效,你才可以得到一个勉强可用的成片。而现在,无论是之前的 sorry 或者现在的 cds 二点零, 你只需要一句自然语序的文字,也就是说人话即可,也可以配上一张图,就可以生成一段音画,同步拥有导演级风景高度一致性的影片。这就是说,如果你之前投入了大量的时间精力, 甚至比如在 ai 教辅第一周了,还花大价钱买了课,你所付出的一切都白费。技术进步有两个方向,一是在保证下线的同时, 最大可能的降低使用门槛,二是在专业层面尽可能的提高上限。第二点和普通人无关。第一点就好比现在的你,用手机也能拍出专业相机八分画质的照片,这已经够了。

噢噢噢噢,我期望平寒遵义信仰下一说法呀,我应当和和蔼蔼兮 巅峰。哦哦哦,九连九不发闯三界好汉了回你。 今天这期视频给大家带来一期必然相关的内容,相信大家今天一天应该都被吉梦的这个新模型 cdenx 二点零刷屏了吧,实际上我从昨晚上半夜两点多就开始玩了, 就我体验下来,这个新模型我给四个字的评价,就像他们这个官方使用手册里面说的一样,杀死比赛,他的视频质量真的非常顶啊,一点都不输三二二,完全是配得上这四个四个评价的。像这期视频开头的展示小短片,我就传了这两张图片, 然后再加上这么一段提示词,他就出来这么酷炫的效果。说到提示词,需要跟大家强调一下,这个模型还是非常吃提示词的,大家可以看一下我昨晚上生成的这个结果。第一个是数字人试了,就是传了一段十五秒的音频,他参考音频最强只能传十五秒,然后一张图片, 你看他这个口型的效果,然后就是这两个短片一样的图,只不过这个我写的很简单,就是二人在打斗,图一在左侧,图二在右侧,他出来的效果就很拉胯,你看就像这样的, 当时我就有点纳闷,然后我就把提示词从写了一下,把提示词写好之后,那出来的效果完全就是天壤之别,这个给大家做个参考, 那其次我们也可以用这种九宫格的图片那做这个短片,然后就是这个延长,我把这个视频做出来之后,下载下来,再给他上传到这里,参考 提示词就写根据视频意延长五秒,后续剧情他就能根据这个参考视频的结尾继续生成五秒。那还有一种就是这种搞怪的沙雕类的, 看这两张图我是随便在网上找的,放到这里之后就生成一段搞笑视频,图一和图片二在干啥,然后他说了什么,然后怎么怎么样,他出来的效果我感觉也是挺搞的, 所以这个模型真的非常非常强,推荐大家去试一下。那首先就是提示词啊,很多人说提示词不会写, 那这个官方使用手册会放到我视频下面。然后就是给大家整理了一套提示词模板加提示词工程,通用的基本上是通用的,但是你肯定要自己修改啊,根据你的需求去修改,包含了各个类型, 包括时间也是五秒的、十秒的,然后十五秒的,它包含的类型有广告啊,慢记啊、微短记啊,电商产品展示啊这些都有,这个就是可变量参考表格,这里面的这些可变的,你可以在这里面去参考啊,去找你要做什么样的, 就把它填上,它出来的效果肯定是比乱写的要好。然后这个就是提示词工程 可以直接发给大模型的,他就说你把这一段提示词复制下来发给大模型,让你再上传你的图片,比如说你要生成的时长啊,以及什么风格呀,都给他写上之后,他会生成一段符合这个规则的相对比较完整的提示词, 这个大家到时候下来可以自己去试一下。他这边还有一篇香蕉 pro 的 提示词,里面就包含了这个九宫格的分镜的提示词, 大家到时候把这个复制下来,放上你的一张图搜索图,它会生成前四后四的九个分镜,很用这样的方式去生成视频效果也是比较好的。 现在收到了这个提一词,再给大家说一下。我平时用 banana 的 入口,那第一个就是 gmail, 我 们在他的官网里面去用,这个是需要谷歌会员的,不然的话每天的额度很少。还有一个就是比较实惠的在这里。哇,你好, 零和笔也是我平时常用的在线云平台,在这里不光有各种靠谱意外的工作流,而且也有很多币源 api 的 调用的工作流,这里我也做了几个工作流,大家搜索我的名字进来就能看到,点进来之后在这里你看一样的,并且你在这里可以出四 k 图, 他四 k 图一张只要两毛钱,二 k 图一张一毛五。具体的用法就是你进来之后在这里点 api 进入控制台,这里有个企业级共享,在这里去充值就可以了,充值完了之后你去用这个工作流 进入也能看见,你看四 k 一 张两毛,这个价格还是相当实惠的啊, 给大家推荐一下。那接下来就是这个模型的使用方法,这个大家应该都知道,但是我还是说一下,目前使用这个模型的入口有三个,第一个就是极梦的网页版,第二个就是极梦手机 app, 有 很多群里面小伙伴讲打开极梦之后看不到这个模型。 u 这个模型现在还没有公测吗?它应该是辉度测试分批次开放的,所以我运气比较好啊,赶上了,如果你的积木里面没有这个模型,那你可以去下载这个小云雀这个 ip, 我 们点进来之后在这里点沉浸式短片二点零 啊,他这里面也有一些模板,可以直接点这里就能生成了。这个软件里面,你注册账号之后,每个账号有三次免费的体验机会,在这里生成的话,他的积分是一秒八分,然后你复制链接去发送给朋友,邀请他们注册的话, 他会额外送积分。在这个软件里面我也做了一些视频,体验下来效果都一样的啊。那我们再回到吉梦这边,吉梦这边是每个新账号有一块钱体验七天会员的一个资格, 并且如果你是新账号没有买过会员的话,第一年开年费是五折优惠,好就是这三档都是五折优惠,就是一块钱体验完七天那个会员之后, 你再去续费的话,他也是就这三道会员都是五折优惠,那总的来说,在一众的币源里面,吉梦的价格算是最便宜的了。另外就是吉梦里面也是可以发布作品的,你的图片短片都可以 发布了之后,点赞量高的话,官方也会给你送积分,大家可以看一下,像之前这些积分到账的通知,基本上都是我这短片点赞高了,他送的。老粉应该也知道我在没更新靠谱 ui 内容之前,也是也是用即梦做过一段时间的短片, 就因为自己的技术不过关,再加上精力不够,所以后面就搁浅了。我现在看到这个新模型出来之后,我忽然感觉我这个短片好像好像还可以往下再做一做,然后后面如果有时间的话,我会尝试用新模型把这个短片再往下做一下。哎,扯远了扯远了, 那今天的视频就先到这里,这期视频我们来学习如何正确的书写提示词。首先来到极梦 ai 的 首页,我们来看一看由其他作者生成的作品都是如何写提示词的。例如像这张图片, 可以看到这样内容精美的图片,在提示词的编写上同样非常的丰富。首先描述的是这幅图片的风格,是一个由粒子组成的古风插画,还包括了很多细节,像笔触、线条、明暗对比、 金箔等等。我们再来看下一幅作品,例如像这张汽车海报的作品,同样在提示词的描述上也非常的丰富,最终获取的结果可以看到也相当不错。而在具体的内容方面,像大师级排版、极反主义、半吊图案、 杂色等等这些同样是先对画面风格进行了描述,然后中间部分则是在描述海报当中有哪些内容及主体。 我们现在再来看下一个由其他作者生成的作品。可以看到,像这样简单的一只三花猫的图片,想要生成出来也并非直接描述的是一只三花猫,同样包括了主体描述、质量描述以及像三 d 超精细渲染这样的风格描述。 那么通过这么几幅图的鉴赏,我们会发现,想要生成精美的 ai 图像作品,并非是我们一两句话就能生成的,往往通过简单的描述很难生成好看的或者是我们想要的作品效果。 生成和其他作者类似的作品其实非常简单,我们就只需要直接在极梦 ai 的 首页点击查看其他作者的作品,然后将右侧的提示词复制下来,从中挑选我们需要的内容,再结合我们本身想要生成的内容来生成就可以。 但往往这样会导致我们生成的作品会缺少原创性,且在风格和内容上是无法实现完全可控的。所以要想生成好看的作品,通常有这么几种方式可以实现。第一种就是借助大语言模型的辅 如豆包 deepsea。 举个例子,我们现在输入一段提示词,这里我们就书写生成一台汽车,同时提出要求优化上述提示词,让生成的结果更加精美。现在点击发送可以看到最终生成的结果。豆包 ai 给出了三个备选方案, 分别代表着三种不同的风格,一个是写实高级的风格,一个是未来科幻的风格,还有一个是复古经典的风格, 我们下面就来生成对比一下。例如现在回到极梦 ai, 点击生成选项,在下方的下拉菜单当中选择图片生成,我们首先就描述生成一台汽车,然后回车发送,可以看到此时生成的结果确确实实是一台在 在马路上比较常见的汽车造型。但不难看出,我们生成的这些汽车造型更多的像是一些杂志上的汽车宣传海报,不仅在汽车外形的设计上并没有原创性,同时像汽车所处的环境背景以及美术风格都相当的常见,写在图像的质量上 也并没有发挥出当前使用的 ai 模型该有的实力。我们现在将豆包 ai 帮我们修改的细节更加丰富, 数更加具体的提示词复制过来,然后回车发送,可以看到此时生成的结果能够明显的看出,要比我们第一次告诉 ai 只生成一台汽车所生成的画面更加精美。不仅表现在整体氛围上,像汽车设计本身的原创性 以及画面的细节表现都要明显优于我们之前所生成的图片内容。因此,当大家使用简单的提示词无法生成满意的高质量的效果时,不妨尝试使用大语言模型 辅助我们去优化提示词。不过现在虽然生成的图像通过大语言模型的辅助更加精美了,但依然存在一个问题,那就是可控性,我们还是无法根据自己的想象来生成指定的效果,所以这里我们就需要总结经验来学习一套提示词的万能框架。 通过对无数个作品的总结,以下我们总结出了一个在生成任意图片时都能够使用的万能框架,那就是风格加视角、加主体、加背景加细节加光影加质量词。以当前我们所展示的这张图片为例, 首先来看风格,我们想要生成的是高精度建模风格 u e 五质感那么熟悉游戏画面的同学应该能够一眼感受到,当前生成的画面 就像是一个在游戏当中的建模风格,同时有着虚幻引擎的建模质感,这就是风格的描述。当然,风格的描述类型有 很多像我们当前所描述的属于在质感方面的风格,那么除了质感方面,在美术方面同样有风格之分。像此时生成的这张图片,它背景当中的霓虹灯以及复古和科技相结合的画面,其实就属于赛博朋克风格。 我们这里所书写的赛博朋克风格的城市夜景,他既属于对画面背景的描述,也属于对画面美术风格方面的描述。 除了风格之外,生成一幅画面描述视角通常也非常重要。例如此时我们描述的是正面视角,那么最终生成的图片就是一个正面朝向观众的汽车在城市当中的图 片。那么相对应的,我们现在来到极梦 ai, 将正面视角换成侧面视角,然后点击发送,可以看到此时生成的结果。在整体的质感和美术风格上,与刚刚我们所展示的图片保持了高度的一致,同时汽车也转换成了侧面的视角,当然侧面也分为正侧面、斜侧面以 及后侧面等等,我们可以更进一步的优化提示词的描述,让其描述的更加细致具体。除了视角之外,接下来就是对于画面主体的描述,这是一幅画面当中不可缺少的内容,像我们当前给出的提示词框架,并不是说每一个部分都要具备才能生成图片,但一幅图片当中主 主体是最为基础的内容,我们描述的是风景,是汽车还是人物,至少都要有一样去描述出来。即便是空无一物,那此时描述的主体也可能是天空或者纯白色,这些内容都可以作为画面的主体。 那么对于这张图片所描述的主体就是敞篷跑车,这里我们用黄色的字体进行了标记,那么有了主体之后,往往还要描述主体所存在的背景,像当前的背景就是赛博朋克风格的城市夜景。如果有时想要方便抠图,那 通常我们就描述简单的背景,白色的背景。接着往下看,我们继续还要描述画面的细节,也就是用来修饰主体和背景或者其他的内容。比如说风格的,像当前在提示词当中的科技与复古风结合的银灰色敞篷跑车,这些内容就是用来修饰画面的主体的,描述了它的颜色 的设计风格。同时我们想要生成赛博朋克风格的城市夜景,这里就追加了一个细节描述,那就是霓虹灯广告。接下来就是光影,其实像光影的描述,除了直观的描述光从哪个方向照射,光是什么颜色之外,通常描述时间也能够代表画面当中整体的光影描述。 就像白天也分为清晨可能有浓重的雾气,正午阳光最为强烈,傍晚阳光变得不那么强烈,但颜色偏向于暖色等等。至于夜晚的话,则更多的是人造光源。 所以像当前在提示词中我们所描述的夜景,其实就可以直接使得生成的结果出现更多的人造光源。 在配合着霓虹灯广告,就组成了我们当前画面当中所出现的光影表现。而最后的质量词非常重要,像我们刚刚所看到的几个案例,比如说这个汽车海报,其实上面就使用了大量的质量词,例如大师级排版、充满汽车文化与机械张力、 传递速度与个性的态度场景,这些内容都在极力的想要生成的结果,在视觉观感上能够有更加优秀的表现。此外,像这张图片可以看到,在提示词当中,几乎大部分都是由质量词组成的,像绝美的眼睛、高级感、线条清晰、超高清、 丰富的细节等等,这些都能够有效地提升画面生成的质量。而在我们生成的这幅图片中,加入的是一些比较常规的质量词,并没有指定的方向,算是一个比较通用的描述。像电影感构图,电影质感、胶片颗粒质感、八 k 大 师级构图。 有了这些内容的描述,基本上能够保障任何画面生成的质量都能够有足够的细节以及优秀的构图,还有好看的光影。那么学会了这些知识,我们下面就来实战练习一下。回到极梦 ai, 我们下面在不看提示词的前提下来思考一下,像这张图片该如何通过自己对这节课知识的理解来生成相近的内容。我们首先来书写风格,像当前的这种风格就是一个偏写实的风格, 所以这里我们直接描述写实风格。而视角方面,这幅图更像是一个微距摄影,所以这里我们就书写微距摄影。背景虚化镜头,聚焦主体,接下来再来描述主体,一个穿着探险服的拟人仓鼠, 一只手提着一盏煤油灯看向镜头,然后来描述背景,这里我们就描述森林。接下来是细节,一片有些干枯的叶子撑在蚁人仓鼠的头顶, 煤油灯发出的暖光照亮周围的环境。然后来描述光影,这里我们就描述阴天,让画面当中能有一个自然光照。同时前面所描述的细节,煤油灯发出的暖光其实同样也是一个光影描述, 最后就来书写质量词,这里我们就沿用刚刚的案例图片在生成时所使用的质量词。而尺寸方面我们就设置为与参考图比较相近的尺寸,这里设置为三比四,然后点击生成,看一看最终的效果如何吧。 可以看到,一段时间后,我们就成功的生成了与参考图十分相近的结果。但同时这里出现了一个问题, 那就是我们所描述的一片有些干枯的叶子撑在蚁人仓鼠的头顶。这句描述并没有生成,我们想象当中 整个叶子在地面上撑起一个类似于小帐篷的效果,所以这里就需要我们对提示词进行进一步的优化和修改。点击重新编辑选项,我们将关于这个部分的描述做一些修改,这里我们就将提示词修改为一片比仓鼠大很多的有些干枯的叶子像帐篷一样 撑在蚁人仓鼠的头顶。现在点击发送,可以看到这次生成的结果,就和刚刚我们在首页上看到的那张图片在效果上十分接近了。大家好,在上一期视频中,我们讲解了 ai 绘画中提示词的框架都有哪些, 包括风格、视角、主体、背景、细节、光影和质量词。当然其实除了主体的描述之外,其他的内容都不是 b 选项,不描述 ai 也能帮你生成,只是可控性没那么高罢了。 所以为了让我们生成的画面更加可控,我们今天就来细分的讲解在提示词书写中都有哪些风格,一共分为四个板块,风格的重要性、风格的分类、风格提示词的获取技巧以及风格融合 我们首先来看风格的重要性,同一组提示词在风格提示词的部分描述不同,那么生成的结果在画风上也会有很大的区别。比如像上节课我们使用过的这一组提示词,侧面视角,一台科技与复 古风相结合的银灰色敞篷跑车,赛博朋克风格的城市夜景、霓虹灯广告电影感构图,电影质感胶片颗粒质感 八 k 大 师级的构图。在使用这组提示词时,我们分别用二次元插画、高精度建模和三 d 皮克斯三种风格提示词生成了三组不同的画面。可以看到,很明显,这三组画面无论是在刻画的精度上,还是在对画面当中主体在形状的概括上, 作者是对赛博朋克这种风格的理解上都会有所差异。而事实上,在我们将来拿这些图片去图生视频时,根据风格的不同,在生成视频的难度上也会有很大的区别。在极梦 ai 的 灵感页面,我们查看由其他作者生成的作品, 大家不难发现,在这些作品当中,几乎百分之八十以上都是偏写实风格的作品,剩余的大部分都是三 d 风格,而其中的动画风格、平图风格能够见到的数量会非常的少。之所以会有这样的占比, 就是因为他们的生成难度是依次递增的。往往在生成 ai 视频片段时,最容易生成的就是真人写实的风格,其次是三 d 卡通风格,最后才是二 d 动漫风格。因此我们说风格为什么重要, 是因为它不仅能够决定画面最终生成的视觉效果,更重要的是它决定了今后在生成 ai 视频片段时的难度。 当然,之所以会有这样的难度区分,主要还是因为在训练 ai 视频生成模型时,素材的量的多少,决定的自然是写实风格的素材比较多, 所以训练的更加完善,所以这点我们只能期待将来 ai 视频生成模型能够不断的迭代更新。那么了解了风格的重要性,我们下面来看风格的分类,总的来说共分为三大类,而每个大类又分为几个小类?首先第一个大类是三 d 类,像我们平时看过的三 d 影视作品, 比如说飞屋环游记、冰雪奇缘这样的作品,还有平时玩过的游戏,比如说荒野大票客或者一些三 d 类的三 a 游戏。再比如说 某些国漫作品,像凡人修仙传或者一众用三 d 来制作的国漫,这些都可以归属于三 d 类。而这些三 d 类风格其实有一个共同的特点,那就是它们在刻画的精度上基本是相同的,因为几乎使用的都是类似的引擎, 特别是以虚幻引擎为主的虚幻四引擎,虚幻五引擎,其实都会有着类似的画面表现。哎!那么问题来了,为什么说使用的三 d 建模引擎相同,最终却能衍生出不同分类的三 d 作品呢?这就要说到我们在讨论风格时, 其实还可以进一步的吸分。例如我们看当前的这几个分类,虽说使用的建模引擎都是相同或者相似的,但大家可以很明显的发现,这几个画面当中人物的长相特点、穿着以及画面的色调都是有所差异的, 例如像三 d 皮克斯风格,在画面的色调上会更加明艳,饱和度会更高。而像荒野大漂克二游戏的风格,在色调上就会更偏向于写实,包括人物的长相特征比 美丽,也会更偏向于写实。而向右侧的三帝国漫风格,人物在长相上可能偏向于写实,但略有夸张,也许眼睛更大一些,鼻子更小一些,人物更美型一些。哎,那么说到这里,想必大家就一定程度上能够理解,继续往下细分风格还能怎样去区分了,那就是整体画面的美术设计, 像人物的长相特点,画面的后期调色,包括人物所穿着服装的设计特点,这些都属于后期美术的特点。那么了解的这些,我们来总结一下。像三 d 类的风格,通常会以动画公司建模引擎、 知名游戏、知名影视作品的名称来进行风格提示词的描述。我们再来看第二个大类,绘画类,这类风格相信大家会比较熟悉,像我们经常看动漫时能够看到的塞露露插画风格,而这样的风格也会随着年代而改变, 比如说上世纪八十年代的动漫风格,虽然也是塞露露,但是在美术设计上,像人物的五官比例,以及属于那个年代的服装设计和建筑设计,这些都决定了在风格上的区别。此外,在传统美术中,像油画风格、 素描风格,这同样也是绘画类的分类。而像游戏当中,英雄联盟、美宣图的风格也是比较知名的或者以画师来命名的风格,例如黄光剑风格或者某一个你所喜欢的画师风格 外,像一些古风游戏,比如逆水寒的风格,同样在美术设计上较为自成一派。所以当我们谈及绘画类的风格分类时,其实更多的就都是在美术设计上的风格分类了。不过除了美术设计,在绘画类中还有一种风格分类,那就是刻画的精细程 度。我们可以很明显的感受到,像塞露露插画风格和上世纪八十年代动漫风格,这两种风格在光照的表现上都不是十分细腻, 光照亮的部分和没被光照亮的部分之间的区分是一种非常简单直接的区分。而在我们所见的其他风格,流向油画风格、美宣图风格,在明暗的区分上都更加的细腻,更加贴近于写实风格的光照。从专业角度来说,这就是平图和厚图的区 区别,这同样是一种细分。总结来说,在绘画的风格分类中,它的提示词特点就是通常以传统绘画分类或者年代约定俗成的名称、知名游戏美宣图例绘原画画师的名称来进行风格提示词的描述。我们再来看第三大类,就是写 这类作品。大家在电视上能够看到很多,像自然摄影风格、街头摄影风格、产品摄影、人物摄影风格,这些风格的区分依据通常是根据拍摄对象的不同来区分的。自然摄影就是拍摄自然风光产品,摄影就是拍摄产 品,此外还会根据设备的效果来区分。例如像这里的胶片相机风格,其实之所以会有这样的风格,就是因为在拍摄时使 用的是胶片相机。另外,像知名的影视作品也会进行风格的区分,例如像舌尖上的中国,经常以近景食物特写来勾起人的食欲。像这样的拍摄技巧,因为其知名度足够高, 所以也自成一派,形成了一种以近景拍摄美食而闻名的风格。所以总的来说,我们讲了这三大类风格的划分。大家会发现风格的叫法其实并没有多么成体系化,你能直观感受到什么内容,那么这个内容就可以成为一种风格。而 在大方向上,像美术设计、拍摄装备、制作引擎,甚至是年代而产生的效果都可以称之为风格。所以大家在描述风格时,就找相应的参考案例,或者直观的表达出你对某些图片的感受即可。我们下面来看第三点, 风格提示词的获取技巧。既然我们说了风格的划分,其实可以从很多角度进行划分,很难从举一反三的方向, 我们在生成时能够自己描述任何风格,那么该如何获取风格相关的提示词呢?自然就是找参考来看一看其他作者生成的作品。来到吉梦 ai 的 首页,如果相中某一种风格了,我们就直接点击这个作者的图片,查看大图 时查看其提示词内容,而剩下要做的事情就是从提示词中提取和风格相关的提示词,方法也非常简单。 ai 时代自然是要利用 ai 大 语言模型来帮助我们提升效率。将作者生成图片时用的提示词复制好之后,来到豆包 ai 当中直接粘贴, 然后按住 shift 键加空格进行换行。这里我们就提出需求,将上述提示词中和风格相关的提示词提 取出来发给我,然后点击发送。可以看到,此时我们就直接获取了刚刚所复制粘贴提示词中和风格相关的提示 词。用这些提示词通常就能一定程度上来生成和作者表现十分相近的画面。例如现在我们点击生成来试一试这里的主体描述,我们就从老虎改成猫咪,然后点 发送。可以看到,最终生成的美术风格是不是和我们刚刚所见到的参考图风格十分相近呢?当然,每次生成都会伴随着一定的随机性,也会因为生成的主体不同而导致生成的风格略有差异。所以通过这种方式最终获取的风格效果和原图有一定差异是十分正常的情况。 遇到这种情况时,我们就考虑在原有的基础上进一步的添加提示词描述,来优化画面的生成效果。以上就是关于提示词获取的技巧,我们最后再来看风格融合,就像是做豌豆杂交实验一样,有成功也有失败,风格之间的融合同样如此, 在融合不同的风格时,有些风格是会相互冲突的,并不适合将两种进行融合。所以这里我们展示两组案例。第一组案例是将三 d 皮克斯风格和凡人修仙传国漫风格进行融合, 看到融合的效果还是不错的。之所以能够有这样的效果,主要源自于两者在风格之间存在一些互补的部分,或者说互相不具备的部分。 例如像三 d 皮克斯风格,在人物的美术设计上更偏向于卡通,有着更大的眼睛,更偏向于孩童的五官和身体比例。 在凡人修仙传国漫的风格当中,其实重点突出的是这种仙侠的特效以及偏国风的服装美术设计、发型设计和场景设计。所以最终生成的效果就是将三 d 皮克斯风格当中的人物长相特点和人物身体五官比例 结合了。凡人修仙传当中美术风格、场景风格、发型和服装设计,这就是两种风格能够互补的地方。那么了解了两种风格能够融合的原因,我们再来看第二个案例,自然就好理解了。这里我们使用的是上世纪八十年代动漫风格和逆水寒风格进行融合, 可以看到最终融合的效果就是逆水寒当中的背景服装发型设计与上世纪八十年代动漫风格的刻画方式进行了融合,一个提供设计,一个提供刻画方式,两者并不冲突, 但有些时候可能两种风格就不太适合融合到一起了。举一个简单的例子,例如现在我们书写水墨风格,赛博朋克风格,然后点击发送,可以看到此时生成的效果。虽然确实对赛博朋克 风格和水墨风格进行了融合,但两者产生了非常强烈的冲突感。为什么会产生这样的冲突感导致画面看起来极不舒服呢?其实原因就在于两者主要表现的内容所带给人的感受 在这里产生了冲突。水墨风讲究的是大量的留白以及在刻画物体结构时相对写意、相对抽象的效果,而像赛博朋克风格更加讲究像发光写 石这样的质感,而发光的效果是要靠本身画面当中较暗的部分在发光彼此来反衬发光效果的,这样就和在水墨风格当中的大量留白产生了冲突。且本身在赛博朋克风格中对物体的刻画会较为写实,较为具体, 这同样和水墨风当中对物体的刻画相对抽象,相对写意产生了冲突。所以无论从哪个角度来分析,两者在风格上处处都能产生冲突,自然拼接到一起就形成了两者相打架,让观众看起来不舒服的效果。大家在尝试其他风格的融合时,一定也会遇到类似的情况, 到时也不妨从我们今天所讲的知识里尝试分析一下,为何两种风格在融合之后会让人产生不适感或 根本无法融合。那么以上就是关于提示词技巧、风格偏相关的知识,希望大家通过这期视频的学习,能够掌握风格提示词的获取技巧,同时具备自己修改风格提示词的能力,来生成让自己更加满意的图片效果。我这里也准备了一些和风格相关的提示词文件,大家需要的话可以评论区置顶自取。

兄弟们,外面铺天盖地都是 cds 二点零,说实话我没太在意它火不火,我更关心的是它能不能实现我脑子里想拍的镜头。有个汽车特效的视频,我一直想做,甚至认真考虑过去学 bling 的 剑魔,这次我是用 ai 去做。先给你们看一下生成的效果, 整体效果已经很接近了,尤其是空间和环境的信息还原的还挺准的。这是我给的提示词,大家可以参考一下。我抽了好几次卡,虽然到最后这里还是不够稳,画质目前也一般,我也试了官方增强清晰度修复的这个功能,画质还是差了一点。但是这个问题本质上是时间的问题。我们再看另一个 f 一 狂飙飞车,那种成本极高的已经到底运镜,我只用了几句提示词,他就帮我复刻出来了,这是最终能达到效果的提示词。所以现在问题来了, ai 发展到这个状态,我们是不是得该干点啥了? 比拼的已经不是谁的设备贵,也不是谁建模厉害,而是谁会写提示词,谁会控制 ai, 谁能少抽点卡,谁能提升制作效率。下一步我会开始分享我是怎么写提示词的,怎么用好 ai, 怎么把随机变成可控。

c 弹子二点零最近刷屏了,很多人第一反应是 ai 做视频更像了,但我看完只想说一句,这次不是像不像的问题,而是 ai 开始按物理规律生成世界。什么意思?当你看到机甲高速摩擦地面时,火花往哪飞,亮度怎么衰竭? 看到重物倒地时,粉尘怎么翻滚,气浪怎么扩散,甚至玻璃碎裂的瞬间,画面和声音是同步长出来的。这不是素材拼接,也不是模板特效,而是模型在底层推演力怎么传递,能量怎么释放。说白了,视觉模型正在从 模仿世界走向理解世界,这是一次待机变化。但如果你只看到模型更强,那其实还只看到了上半场。因为当模型开始理解世界,真正决定行业高度的,反而不再只是模型本身, 而是你有没有能力把模型的能力变成稳定、优质、快速交付的工程系统。为什么这么说?因为模型越强,对最终落地层面的要求就越高,尤其是一致性。比如人物前后是不是同一个人,侧面、正面、背面看是不是一张脸? 场景换机位之后,柱子、窗户光线位置还对不对的上?人物走进场景是不是还站在合理位置?如果这些问题解决不了,那即使模型再强,出来的也可能只是 demo, 不是 作品。甚至连 cds 自己都讲的很坦诚, 他最近也专门发文说,目前 cds 在 细节稳定性、多人口型匹配复杂,编辑上还存在不足,需要持续优化。翻译一下就是 短期内很难出现保证每一次生成都完美的模型。所以现在比拼的已经不只是模型少几个 bug, 而是谁能把不完美的模型 跑成稳定交付的流水线。尤其当下 ai 已经开始进入百亿智能体协同的阶段,真正拉开差距的,正在从模型本身转向应用层和系统能力。这就好比最近的 oslo 模型,未必碾压 open ai, 但靠智能体形态反而在很多场景里跑到了前面。 所以下半场拼的不只是模型参数,而是内容生产范式和真正解决产业问题的能力。那么这里给你一个更明确的判断,行业真正的分水岭,正在从谁的模型更强,变成 谁能把模型跑成流水线。说的再具体点,就是从 ai 视频的抽卡式生成走向工程化生产。说穿了就七个字,先搭世界再拍片。也就是先把角色建成资产,把场景建成空间,把道具 光线布局全部确定下来,再让 ai 在 这个世界里拍。这套逻辑本质上跟电影工业一模一样。你想想,导演拍电影,一定是先搭紧选角定美术,然后才开机,而不是上来就按快门赌运气。 而对于这件事,国内首个工业级 ai 漫剧智能体生产平台纳米漫剧流水线,本质上干的 就是把这套电影工业的方法搬进 ai 系统。它不是给你一个生成按钮,而是给你一整套,从剧本拆成分进脚本到角色场景自动入库,再进入空间引擎,并在同一个空间里切机位, 丝滑生成分镜图、分镜视频,最终完成剪辑成片。换句话说,当以上这些都变成可附用的底层资产,人物才不会乱变场景,才不会穿帮镜头切换才有空间逻辑,你会发现,这已经不是玩 ai 作画,而是在用 ai 拍电影。 同时你再想想,如果这时候再叠加像 cds 这种开始理解物理规律的视觉模型,会发生什么?简单说就是模型负责越来越真实, 流水线负责越来越稳定,两者叠加才是真正的内容生产力革命。所以我给你一个结论,未来 ai 内容行业真正值钱的不是谁先用到最强模型,而是谁先建好把模型快速 持续的变成优质作品的系统能力。最后总结一句,模型决定能力上限,流水线决定产业化上限,前者解决能不能生成,后者解决能不能规模化生产。当能力上线叠加产业化上线, ai 内容才第一次进入工业时代。 所以我说这才是 c 弹子这类模型进化和纳米 ai 这种慢距流水线出现在同一个时间点爆发的真正原因。 那么你觉得当一个人就能用一条纳米 ai 漫剧流水线拍出电影级漫剧,你最想先拍什么题材?历史?科幻?悬疑?还是现实主义?评论区聊聊。

cydance 产业链全景与核心上市公司树立 cydance 是 字节跳动旗下继梦 ai 在 二零二六年二月推出的电影级全流程 ai 视频生成引擎, 其二版本在角色一次性、原声音化、同步、长视频连贯性三大核心维度实现关键突破,让 ai 视频从轻量化娱乐工具正式迈入工业化生产阶段。 该技术上线后快速实现规模化应用,不仅重塑了数字内容的生产逻辑,更催生出覆盖算力支撑、技术研发、内容落地、商业变现的完整产业链,带动上下游多家上市公司深度参与,形成协调联动、持续迭代的产业生态。 一、产业链整体架构解析 c d s 产业链以算力底座为基础核心,模行为中枢纽,应用生态为载体,流量变现为目标,形成四层递进式架构,各环节分工明确,相互支撑,共同完成从技术研发到商业落地的全链条运转,也是 ai 视频生成技术走向成熟的典型产业形态。 以上有算力基础设施 ai 视频生成的核心支撑。 c d s 的 大规模商用,对算力的稳定性、密度和效率提出极高要求, 无论是模型训练还是实时推理,都需要海量算力资源作为保障,上游算力基建也成为整个产业链的底层基石。浪潮信息、润泽科技、海光信息、英维克、中继续创等上市公司深度布局该领域,提供全方位算力支撑。 ai 服务器是算力输出的核心主体, 浪潮信息作为服务器龙头企业,凭借高端 ai 服务器产品供应,直接承接 cds 的 算力硬件需求,其高端服务器可搭载多颗英伟达 g b 突焊至三百芯片,凭借多芯片并行计算能力,支撑 cds 高并发、大批量的视频生成需求,保障模型高效运行。 ai 芯片则分为训练与推理两大场景。 训练。端一、托高性能芯片,保障模型持续迭代优化推理端,正,加快国产芯片的适配与替代。海光信息作为国产 ai 芯片核心企业,正加速推进推理端芯片适配,在控制成本的同时提升算力自主可控性。 i d c 数据中心为 cadence 提供全天候、高可靠的算力承载环境。润泽科技作为字节跳动最大的 cadence 模型,二十四小时稳定运行,满足全球用户的病发使用需求。 随着算力集群密度不断提升,夜冷散热成为刚需。因维克作为夜冷散热龙头企业,凭借高效散热方案解决高密度算力运行的散热难题, 保障算力持续稳定输出。高速光模块则承担算力内部及跨区域的数据传输任务。中继续创新益盛等光模块龙头企业,提供高速光模块产品,保障大数据量交互的流畅性,进一步提升视频生成效率。二、中游技术开发与平台产业链的核心。中数 中游是 cds 的 技术核心区,以字节跳动为主体,联合万星科技、当红科技、中文在线、掌阅科技等外部技术服务商共同构建技术壁垒, 聚焦模型优化、工具开发、技术适配等关键工作,直接决定视频生成的质量、效率与使用门槛。字节跳动核心团队专注模型迭代,持续攻克角色一致性、长视频流畅度等行业难题,实现文本、图片、视频、音频四模态输入参考,大幅提升模型实用性与生成效果。 视频编辑码技术服务商则通过定制化方案优化视频传输与存储效率,让生成内容适配手机、电脑、大屏等多终端播放,拓展应用场景。 当红科技作为视频编辑码龙头企业,为 cds 提供高效编辑码解决方案,助力内容高效传输。为降低技术使用门槛,万星科技等 ai 创作工具企业推出适配 cds 的 轻量化创作工具,简化操作流程,让普通用户与中小企业也能快速产出专业级视频。 同时,中文在线、掌阅科技等数据服务企业提供海量优质文本、图像、音频等训练数据,为模型优化提供支撑,形成数据驱动模型, 模型赋能应用的正向循环。三、下游内容应用层技术价值的变现核心下游是 cds 商业价值的最终落地环节,覆盖影视、短剧、广告、 ai 漫剧等多元高价值场景。掌阅科技、中文在线、蓝色光标、上海电影、博纳影业等上市公司通过技术赋能传统内容行业,实现降本增效与模式创新,也是产业链中最贴近市场、变现最直接的环节。上海电影、博纳影业等影视企业与季梦达成合作, 借助 cds 完成经典 ip 修复、特效制作、短片创作等工作,大幅缩短制作周期,降低制作成本,让影视创作更高效灵活。 掌阅科技作为数字阅读龙头企业,依靠自身海量 ip 储备,旗下泡曼平台成为首个接入 cadence two 的 ai 漫剧平台,率先将 cadence 应用于 ai 漫剧生产,实现 ip 快 速视频化,通过技术授权与会员服务实现双渠道变现。 中文在线作为网文内容龙头企业,聚焦短剧赛道,利用 ai 技术将海量网文快速转化为短剧内容,制作周期与成本大幅缩减,通过广告分成、付费观看实现快速盈利。蓝色光标作为 ai 营销龙头企业,依照 cds 批量生产广告短视频,提升创意效率, 降低制作成本,为品牌提供轻量化、规模化的营销内容解决方案。此外,新东方在线、三七沪渝、曲江文旅等垂直领域企业也纷纷将技术融入内容生产, 打造定制化视频内容,拓展业务边界。四、生态层,营销分发与合规服务产业扩张的助推器。生态层一托字节跳动生态体系,承担内容分发、版权保障、 b 端服务等功能,连接下游应用与终端用户,放大商业价值,推动生态持续扩容。 视觉中国、德才股份等上市公司深度参与该环节,提供合规与服务支撑。抖音等短视频平台为 cds 生成内容提供核心流量入口,形成内容生产分发、用户反馈、模型优化的闭环生态。视觉中国作为正版素材龙头企业,提供正版图片、音频视频授权, 保障内容生产合规性,规避版权风险,同时为创作者提供优质素材。德才股份旗下子公司与火山引擎共建漫剧 ai 公放,获得 cadence 模型与算力授权,为中小弊端客户提供定制化视频制作服务,成为核心技术与市场需求之间的重要桥梁。 二、产业链核心上市公司布局依托 cds 的 产业需求,多家上市公司凭借自身资源与技术优势,深度切入算力基建、内容应用、技术配套三大核心赛道,成为产业链发展的核心参与者。 各赛道上市公司定位清晰,受益逻辑明确,以算力击剑赛道确定性最强。该赛道直接受益于 cadence 算力需求的爆发。上市公司多为国内算力领域龙头,与字节跳动生态深度绑定,具备稳定的订单支撑,是 cadence 产业链中受益最直接、确定性最高的赛道。 浪潮信息作为服务器龙头企业,凭借高端 ai 服务器产品直接承接 cadence 的 算力硬件需求, 其英伟达 gb300 服务器代工实战率超百分之四十, cadence 的 规模化商用直接拉动其服务器订单增长。润泽科技作为字节跳动最大的 idc 服务商,为 cadence 模型运行提供稳定的数据中心支撑。 随着 cadence 算力需求的持续提升,其 idc 业务需求迎来爆发。海光信息加快推理端国产芯片适配, 在国产替代趋势下迎来发展机遇。英威克依靠算力集群扩容、夜冷散热业务快速增长中继续创新。益盛则凭借高速光模块产品保障算力数据高效传输,受益于 cadence 算力需求提升。二、内容应用赛道弹性最大。该赛道直接承接 cadence 的 技术落地, 聚焦各类内容场景的商业化变现,上市公司多具备丰富的 ip 资源或场景优势。随着 cadence 技术的普及, 内容生产效率大幅提升, ip 价值重估,成为产业链中弹性最大的赛道掌阅科技凭借 ip 与平台优势,旗下炮漫平台领跑 ai 漫剧赛道。字节跳动持有其部分股权,具备深度绑定优势,率先享受 ai 漫剧行业规模化发展带来的先发红利。 中文在线一托海量网文内容资源,在短剧 ai 化转型中占据先机,海量网文 ip 的 视频化转化持续释放商业价值。 蓝色光标深度绑定字节生态作为 ai 广告内容生产的核心服务商,借助 cds 降本增效,客户订单量持续上涨。上海电影博纳影业通过经典 ip 修复与创新创作,实现 ip 价值二次释放, 推动影视业务转型升级。三、技术配套赛道潜力巨大该赛道为 cds 提供技术配套支持,聚焦 ai 创作工具、 视频编辑码、 b 端服务等细分领域,上市公司具备核心技术壁垒。随着 cds 应用场景的不断拓展,配套技术需求持续提升,发展潜力巨大。万星科技通过适配 cds 拓展用户规模,其推出的适配工具大幅降低使用门槛,实现订阅收入增长。当红科技凭借核心编辑码技术, 保障 cds 内容传输与播放体验,编辑码业务需求持续提升。德才股份搭建 ai 内容生产工坊,服务海量中小弊端客户,成为连接核心技术与下游应用的桥梁。视觉中国则受益于 ai 内容合规需求,正版素材授权业务持续增长,为 cds 生态提供合规支撑。三、 产业链发展趋势与长期逻辑 cds 作为 ai 视频生成领域的标志性技术,正持续推动内容生产行业的改革, 产业链未来发展趋势清晰,长期成长逻辑明确,各环节核心上市公司将持续受益于产业升级红利。 技术层面, cds 将持续迭代升级,分辨率生成速度、功能维度将进一步突破,带动全产业链技术同步升级,推动 ai 视频向更高清、更高效、更多元方向发展。 商业化层面, ai 慢剧、短剧、广告等轻量化场景将率先实现规模化盈利,影视、游戏、教育等重资产场景逐步渗透行业,整体市场空间持续扩容。掌阅科技、中文在线、 蓝色光标等内容应用类上市公司将迎来业绩弹性释放。产业层面,算力、芯片、编辑码等核心环节的国产替代将持续提速,产业链自主可控能力不断增强。浪潮信息、海光信息、当红科技等具备核心技术的国内企业将占据更多市场份额。 整体来看,与字节生态深度绑定、具备核心技术或优质资源的企业如浪潮信息、涨跃科技、蓝色光标等将优先享受行业红利。技术壁垒高、应用场景广的配套企业如万星科技、当红科技等 也将伴随产业链扩张实现长期成长。 cds 引领的 ai 视频工业化革命正在重构数字内容产业的底层逻辑,从算力支撑到内容变现,全产业链迎来全新发展机遇。 相关上市公司唯有紧抓技术改革趋势,深度融入生态布局,发挥自身核心优势,才能在行业升级中抢占先机,实现商业价值与产业价值的双重提升。

前一期给大家介绍了 cds 二点零的玩法,很多朋友都在问 cds 二点零在哪里能用,这一期给大家推荐三个官方免费使用 cds 二点零的使用入口,记得点赞收藏。第一个是极梦网页版,这个是我最推荐的,在你的电脑浏览器里输入这个网址就能直接用 进去。之后呢,选择视频生成,这里可以选择 cds 二点零模型,选择全能参考,可以上传一到五张参考图片或者是参考视频音频。而且呢,网页版的一个优势是可以选择视频时长的选项比较多,四秒到十五秒这个区间里面都可以选,手机 app 上只能选择五秒或者是十秒的视频。 第二个呢就是极梦 app, 手机上下载或者能更新到最新版本,在想象这里选择视频生成。第一个模型就是 cds 二点零,不过我自己在手机上试了一下, app 上目前还上传不了视频参考,只能上传图片参考 极梦账号每天登录都有六十免费积分赠送,如果邀请新用户呢,还能有额外的积分赠送,想体验的话,免费赠送的积分其实就够用了,如果你想深度体验,也可以去付费买会员。 第三个呢是豆包,没错,万能的豆包,现在也可以直接用 cds 二点零了。手机上打开豆包 app, 在 聊天界面就能看到 cds 二点零的选项, 不过同样也是视频时长只有五秒和十秒这两个选项参考呢也只能是上传图片,视频和音频目前还上传不了。以上就是三个可以免费使用 cds 二点零的官方入口,如果大家还有什么问题,欢迎在评论区给我留言讨论。