就关于 cds 二点零这个事,我点了切片,最早从 sorrow 诞生那一天起,两年以前我甚至那会我都没有开始直播,我就说过 ai 必将取代大部分的剧组, 未来的影视剧的制制作,就剩一个导演,然后加上他的 ai 助手,然后往出生产,最终整个生产模式变成网,跟现在的网文写作是一样的,年轻人去拼才华吧。这是我两年以前的预测,因为 ai 肯定不是一步到位,它一定是 sara, sara 二点零,然后明天可灵又出来,可灵二点零极目又出了一个 cds 二点零,很多的软件不同的,然后一点点进步,一点点进步,而这个过程中总会有一些 ai 软件给我们很多惊喜, 它对我的预测没有任何改变。第二点,我同样也说了,它能取代的影视题材是一部分,它取代什么画面像的什么是 ai 慢剧, 尤其是题材特别出挑的,我重生了,我穿越到诡异世界了,我什么寒冰末世了,什么僵尸满街跑了,就现在很多观众在看了,对吧?他最先取代的一定是这种强故事性的片子,特别不吃什么,特别不吃表演, 这个电影传递的这种艺术性的概念重要不重要?不重要,你就是讲故事就完了。所以类似于这样的片子为 来 ai 是 一定能够取代的,就连大片包括流浪地球,包括什么超人、钢铁侠,蜘蛛侠是吧,复仇者联盟等等就是,我是以看故事,看个大场面,看特效,对真人需求很高的艺术理念传传递很多的就取代会比较难。我们现在 ai 做的工作都是 模拟之前人们做过的工作,就包括你看现在 ai 生成的所有的视频,什么模拟个成龙的打斗呀,模拟个什么东西, 这都是以前已经有了标杆,就人类已经把它这个模式拍出来了,包括 ai 的 配音是吧?包括 ai 的 音乐, ai 歌 曲, r b 也好还是什么也好,那不都是以前我们有过的风格吗?它是模拟人已经发明了的风格,但是人最大的价值就在于人可以不停的发明新的风格。 王家卫可以发明王家卫,周星驰可以发明周星驰,包括很多人不喜欢逼干就说逼干,不拍旷野时代,那 ai 能给你拍一旷野时代吗?放到 ai 那 ai 都不理解是吧?主人给我发了,下了一个命令,让我做一旷野时代。 这是个电影吗?这有人能看懂吗?像这种电影肯定还得是人来做,但是呢,这一部分电影时长是小部分,我们影视剧的大部分是剧集时长,所以呢, ai 呢,最终呢,也会取代大部分的影视剧组, 如果你只是青春靓丽,你只是小鲜肉,那你可能就很快就要被 ai 取代,最后能留下的真的是艺术了。哈哈,现在的影视你不能说艺术,是艺术加技术加商业加娱乐融为一体的东西,那 ai 取代的就是那种特别商业的,特别娱乐的,特别模式化的东西,就被 ai 取代了, 那留下的就都是艺术人才,未来的影视行业回归了艺术行业,哈啊,这就是我的预测,我之前就这么预测的,我现在也不改 说 c 袋子太火了,我集中的说一下,大家就不用老问啊,直到那一天到来,再更新多少版本?不管是急梦更新多少版本,可怜更新多少版本,国外的各种 app 更新多少版本都不影响我的预测啊。
粉丝87.7万获赞1287.5万

cds 二点零到底需要排队多久啊?今天我第一次用七梦 cds 二点零去做视频,很激动的充了一块钱,花了二十分钟,精细的写了一连串的提示词,一上传发现要排队好吗?四千多位,还好还好,我是会员, 我想着要等四个小时,那我就干点别的吧。刷了会教程,转头回来一看,天塌了,怎么变成要排十个小时了?呃,四千多位,怎么前面加了个一? 而且此时的排队人数在于每五分钟一千人的速度向上猛涨,这个速度一直持续了有将近半个小时。难道我现在做一个测试视频都这么麻烦了吗? 那抖音上的那些大佬他们是怎么抽的?目前测试了一下啊, tappnow 的 平台速度还是很快的,但是 tappnow 现在还没有搭载 cds 二点零,所以你们都是排队排了多久才抽出来的呢?

昨晚整个 ar 圈都炸锅了,那么原因呢,就是今梦出了一个新的模型,就是 cds 二点零, 这个模型呢就有什么特点呢?我们先从最简单的看起,那么第一个多餐没什么说,但是以前多餐呢,无论是 solo 也好,或者说呃那个维度也好,那么他还是会出现各种崩坏, 但是现在积木出的这个已经稳定的不像样了,几乎可以媲美现有的一些传统动画流程的一些吸滤的效果。我们先看一下 我这个一刀未剪呢,它几乎可以全用上,不过第二段 好,那么这个是最简单的。那么第二种呢,就是九宫格,九宫格的话呢,就随便看一个 九宫格也是完全不成问题的。那么第三个呢,比较恐怖的是什么呢?他可以直接识别你的剧本,比如说呢,你跟他说留一个剧本的那个图片给他, 让他根据这个剧本的这个图片去生成这个影片,那么你看一下我这个地方随便丢了一张图给他,我说你按照这个剧本去给我生成这个相对应的这个短片。 全球通告、全球通告、太平洋战区、欧洲战区等均已被拒收空陷,请其他战区誓死守卫我们的家园!五分钱 人类于末日历八年二月一日复活。当然这个跟我的剧本有关系啊,我的剧本比较长,那么第三个是什么呢?可以指定 人物去演你这个图片里面的剧本,这个比较有意思,我们看一下我这里给他两个指定的这个人物的形象。 然后呢,让他去按照我这个图片里面的剧本去演,你可以记一下这个里面的这些对话, 我看一下。小姐,小姐,你说夫人突然把咱们叫来是合适?他连字幕都被你配好了。什么那个家徒四壁的沈彦秋,你妹妹进宫为妃,你便嫁给书生沈彦秋吧,圆悟了他的前程。什么回到了嫁给沈彦秋?小姐, 他这个只有十五秒啊,我给的这个剧本可能比较长,然后呢,可以指定这个剧本,然后指定人物,还有不同的方言,有不同的场景,你看我下面测试的这个呢,我加了一个博物馆的这个场景。那么呢,你这个可以 指定人物剧本场景,然后直接让他们连提示词都不用写了,让他照着剧本拍。 把咱们叫来。是,小姐,你说夫人突然把咱们叫来是何事啊?嗯,林清河,你爹受贿入狱,是老爷念在手足情分上,好心收留你,现在你也到了出阁的时候,你妹妹明日进宫为妃,你便嫁给书生沈艳秋吧,别误了他的前程。什么家徒四壁的前一天小, 然后呢,可以指定就是人物进行这种大特效的一些制作。嗯,打斗的吧,打斗的我们是最难的,最容易胡的。在 ai 上面来说是吧,经常会出现各种崩坏,然后就是肢体扭曲,然后随便我们看一个 啊,看下面的, 你看几乎都能达到可用的状态了。然后大场景就是电影级别的大场景。 好,包括下面的,我这一刀未剪呢, 那么昨天晚上通宵撤下来呢?那么基本上对我们各个行业,包括一些 ai 的 一些 啊,从事人员其实打击还是蛮大的,你看以前我们所谓的一些导演的一些思维啊,包括一些分镜的一些设计,那么现在在 ai 的 这个加持下呢?其实这个门槛已经越来越低了, 那么更多的以后呢?可能剩下的就是创意,然后你的想法包括审美方面的一些东西了啊,那就到这里吧。

昨天是年初八,是很多公司开工的日子,原本也是 cds 二零模型 api 接口开放的日子,但是因为一些原因呢,给去推迟了,什么原因呢?最主要就是跟美国好莱坞这个版权诉讼问题,我来给大家一张这个事件的来龙去脉时间表,大家可以自行的感受一下。 那我们不仅要问了,好莱坞在害怕什么呢?他在害怕失去自己的价值,他在害怕以后有好的剧本不需要好莱坞也能够实现出来,这个只是时间问题而已。 没办法,新事物的产生总是会伴随着挑战旧的秩序。很多人会说 cds 好 牛啊,字节跳动的技术好牛啊,这样说也没错,但是字节跳动在 ai 视频模型领域真正厉害的不是技术。 ai 视频模型领域里面不只是只有智杰一家在做,我有条视频讲了,全球前五的 ai 视频模型技术,大家花点时间都能够做到,但是其他几家没有智杰这么牛逼的内容。分发生态。 我在这条视频里讲过了,智杰是具备从剪映到抖音和 tiktok, 再到消费者,也就是内容从创作到生成再到分发的完整的生态闭环。 你 oppo i 的 solo 再厉害,那请问你生产出来内容到哪里去用呢?是去推特呢?还是去 instagram 呢?那是别人的地盘,所以这个才是字节真正的护城河。 好,咱们再把话给收回来, api 的 延迟上限不影响继续在吉梦和小云圈上的正常使用,只是开工之后呢?肉眼可见,用的人太多了,生成的速度慢了也太多了。很多人都在吐槽自己的会员积分能够能不能用完?哈哈, 现在就要迎来 cds 慢慢向各行各业的渗透时间了,如果说你也对 cds 如何在各行各业的落地应用感兴趣的话,大家可以一起交流一下。

燃烧了十五亿 tiktok 学了四个月,做了四十五部 ai 漫剧,很多人问我怎么做漫剧,今天我就出一个漫剧速通方案,别信那些卖课教理论的,你就看看我二十分钟从零开始写剧本到分镜生成的视频,最后导出剪映, 我快速讲完,大家可以看一下最后的成片。今天就给你们这些小白一下子点透你们是不是不会用 ai, 我 就用今年春节最火的三个 ai 给你们做演示。第一步,我们先打开千问, 记住打开千问之后要在这选择三点五 plus, 记住了,有最好用的模型就用最好的模型。 在提示词里告诉他帮我完善剧本,然后随便写一段草稿扔进去,你看,这就是我刚写的,等一会他就给我们输出了一个完整的剧本。 好,第二步,我们打开豆包,把刚才千万输出的剧本全部复制进来,然后给豆包说帮我生成一个封面楼提示词,详细的提示词我会放到评论区,你们自己去取就 ok 了,然后你就等就完事了。 等豆包把所有的分镜提示都给你出来之后,我们第三步,打开积木,注意这个地方,我们要选 cds 二点零 fast 的 这个模型, 还是那句话,我们只用当下最好的模型,选择全能参考。然后上传一张你想要的人物图,如果没有就随便生成一张。把刚才豆包生成的分镜提示复制进来,把人物添加进去, ok, 开始生成视频。完事了,到这一步,你的 ai 动画版已经做完百分之九十了, 我们后边把所有的分镜提示词全部复制进来,一个一个生成,生成好之后我们把视频全部下载下来, 你看过程全部是一遍过,一遍出剧本,一遍出分镜头,一遍出视频,我一个都没有抽卡,千问豆包、吉梦都没有抽卡,全部是一次成型。然后我们接下来就是导出剪映,导入音乐,加入转场的特效。 ok, 就 这么简单,我们已经做好了一个成片了。 关注我,下次让你们看一下,我过年期间用了十二亿头更写的一个剧本自动化工具, 哈哈哈,他们都说我疯了,可只有我知道这个世界神明拯救不了, 早晚被神明吃掉。 那就让我来帮你们解脱吧, 鬼神们,我来了。

家人们炸裂了!极梦的 cds 二点零简直是把手撕 sora 的 战书直接拍在了 ai 漫剧圈的桌子上!这哪是普通更新,这分明是扛着加特林冲进了冷兵器时代!我是小餐!今天带你们看看这款国产黑科技到底有多离谱! 技术核爆自动分镜加多帧生成导演集体试业 cds 二点零这次技出的最大杀招是全能多模态参考加自动分镜蓄势两大能力。 它支持同时导入图像、视频、音频、文本四种模态的参考素材,并能基于简单剧本描述,自动拆解出远景、特写、慢动作等多角度镜头,实现十五秒内自动生成电影级分镜式 实测中,有创作者仅用一张分镜图加简短动作描述,就生成了一段打斗流畅镜头切换自然的视频,全程自动切换了七八个分镜视角,几乎无需后期剪辑。 更惊人的是,模型对复杂动作和抽象情绪的理解远超预期,甚至能精准还原角色微表情和场景物理细节。行业地震,九成导演遭背刺编剧时代降临 cds 二点零的推出,可能重构慢剧、短剧行业的生产关系, 导演只能被重构分镜、运镜、剪辑等传统核心工作被 ai 大 幅替代,创作者只需聚焦剧本创意和角色设定,即可快速输出专业级视频,编剧价值凸显。例如输入穿越女配反杀霸总, ai 能自动生成逆袭打脸的全流程镜头。擅长强通透、快节奏蓄势的编剧成为最大赢家。 平台标准升级,粗制滥造的 ppt 慢剧生存空间被压缩,全互动电影级质感的 ai 慢剧将成为新标准, 造逼内容精品化,普通人如何用 cds 二点零抢红利?免费体验路径,目前可通过更新小云雀 app 至最新版获得免费生成次数,无需付费会员即可尝鲜。创作门槛大降。无需编辑复杂提示词,直接上传参考图加简单动作描述即可生成垂直赛道机会。 大厂倾向追逐玄幻、甜宠等主流题材,而文化、非遗、科幻科普、地域方言等细分领域仍是蓝海,适合个人创作者、中小团队快速卡位。极梦 cds 二点零的突破不是优化,而是对 ai 视频生产流程的彻底重构。 它证明了一件事,未来做内容,脑洞比预算重要,创意比技术稀缺。与其焦虑被 ai 替代,不如把它当成最好的创意杠杆。毕竟能用十五秒搞定分镜的 ai 导演,才是每个创作者梦寐以求的超能力。

a i 视频大模型也会堵车?那至于为什么堵车,后面讲这个春节所有干 ai 漫剧的老板都没休息,都抱着一个共同的想法,年不过了,钱得挣到,平台红利这么好,工具又平全了,拽着团队嗷嗷干,结果可好?直接给你打个措手不及, 你以为手里有了金箍棒,你就是齐天大圣了,结果金箍棒不是你的,而且还得排队取用,你说这事让不让人抓狂? 很多圈子里朋友大年初三初四就发现这个问题,在跟帅总抱怨,帅总那有看到排了四天的,最后审核不过了,还有百分之九十九进度的,就是百分之一不给你弄。我们也问了下,内部就不卖关子,为什么?因为现在 c 弹四也好,火山引擎 也好,他们的很多卡,其实在北美 c 弹四放了大招之后,大量的专业的付费的 b 端客户开始大量的消耗普通的 c 端,还有你是一些小币,但凡是你跟平台的关系弱一点, 现在排队无纸巾。所以兄弟们,这个堵车排队包括审核卡,你其实都是表象,核心本质就一个在成为平台的 k a, 你 拿的是 v i p 版本的账号,还是普通按部就班排个队,这个地方就是一个巨大的卡点。在这个点,帅总一定要跟大家强调,当平台给你武器的时候, 新的就是谁家手里的武器可以得到平台的允许,优先给你用,就这一点就够你在市场上大杀四方。我们二五年的八月份就请火山引擎来我们的大会跟大家讲,这个模型后边有大招,有大招有大招,现在所有人都知道它好用的时候,你要做的是什么? 很简单,帅总跟思懂会的兄弟们讲一句,要么跟平台搞好关系,要么去找他的最高级别的代理,你的消耗量极够,你又找对人成为官方的 k a 客户,他们是倒过来服务你的, 总能点到的,也就到这一步。这次网络堵车其实已经在筛选人群了,你的信息是不是最领先的,你的渠道是不是最 ok 的, 能不能得到平台的允许? 目前看来,卡脖子的关键就在于咱们所有行业内的老板,这点一定要清楚的认知,争取在年后的第一轮竞争中,别人有武器,你也有武器,别人不能用,你这边一路绿灯,敞开大门往前冲,如果还有不懂后台来找车主。

cds 二点零一问世,直接把整个 ai 深视频领域的服务器给炸了。我举个例子给影视动漫领域圈外的朋友们科普一下,这波 cds 二干了个什么事情?为什么大伙都发了疯的在讲? 我问你,假如说你上学时期,你们班有一个同学,高一到高三期末之前成绩都是全班倒数,他在进高考考场前一刻都还在讲什么爸爸的爸爸叫爷爷之类的话语,结果成绩下来, 他拿了全校第一,把原本常居第一的同学甩开四十分。别问为啥只甩开第二名四十分,因为他们第二名离满分就差四十分。所有人都诧异地看向他时,他只是推了推眼镜,云淡风轻, 明白了吗?各位?自国内 ai 深视频模型发展之初在排的上号的模型,如可林、 vio、 海罗、吉梦里,他们吉梦是用下来效果最差的,一直都是,其他几位好歹还有各自的优势,就吉梦处在一个非常尴尬的位置。 如果不是因为是自杰的亲儿子,二点六号之前的吉梦是不配在专业影视领域里上桌吃饭。结果就在尖子生可林偷摸上线三点零之后的第二天,他突然一句换人,丢个 cds 二零把桌子掀了。 昨天二十四小时,我起码十八个小时全在玩 cds 二零,这玩意多夸张,你们就看吧,极限八小时干出一部微电影,或者说你们看看下面都是我们 这是什么地方?中转站死后,所有平行时空中的我们都会来到这里观看下一个轮回。然后他就开始了。 啊啊啊,看到没?全程只用了 sims 二零,充卡出来四分之三都能直接用。再注意注意音效你就知道了, 懦夫!在我的时空,我直接向他父亲提出了决斗,然后你死了,蠢货!哈哈哈哈。这玩意不仅把 ai 深视频界的桌子掀了,配音领域的碗也一并砸了。这里我不偏心,提一嘴,可零三点零配音也能达到这效果。 但还是那句话,人们只会记得第一名。基于这种降维打击式的技术革新, ai 慢剧,或者说, ai 剧领域将迈入新台阶,彻底成为可以直接威胁传统实拍剧地位的屠龙勇士。 现在一个人一个月做一部一百二十分钟高质量剧绰绰有余,抛开个人时间成本,制作成本也能控制在三千元以内了。各位要清楚,这种质量,这种生产速度意味着什么。 此前这种质量的 ai 漫剧报价是一千五百到三千元每分钟。你没听错,是每分钟。自此之后,那些草班团队将不再有优势,因为一个团队真正能给出想法的人不多,绝大部分都是执行的佣才。而 ai 时代下,最不重要的就是只会干活制作的工具人, 因为他们都没 ai 好 用。年前打算年后将团队扩大到几百人的那些公司可以省省再瞎玩这波革新格调的就是他们的钱袋子。未来想法、思想境界的高低决定一切。二零二六年,百分之八十以上的内容都将是 ai 生产,这不是玩笑。

这两天,全网都在疯狂吹捧季梦 cds 二点零的出图和视频有多神,但我看到的是无数创作者正盯着电脑上那个转圈的进度条,那个卡在百分之九十九的临界点, 还有那种排队排到三万多名的精神崩溃。这个时候,很多人就在骂大厂挤牙膏,骂服务器太烂。但如果我们戴上奥派经济学的透视镜,你就会发现,这根本不是什么技术故障, 这是一场教科书级别的价格惩罚。奥派经济学里有个最冷血的常识,这世上从来不存在免费分配的稀缺资源。当最顶级的 ai 算力被平台以极低的价格甚至免费推向大众时,金钱标价就失效了。 但市场绝不会做慈善,他会立刻亮出另一种极其残酷的结账货币,那就是你的时间。你以为你没花钱薅到了顶级大模型的羊毛,但实际上,你正在被排队机制强制征收着高昂的时间税。而这场大塞车里, 最荒谬的悲剧,是资本品与消费品的致命错位。对于挤在服务器里的那几百万吃瓜群众来说,寄梦只是一个好玩的消费品。 他们花一小时排队,做个几秒钟的搞笑视频发朋友圈,图个多巴胺分泌在他们的主观价值里,这笔交易很划算,因为他们的时间原本就不值钱。 但是,各位靠接单做账号吃饭的创作者们,寄梦对你们来说是什么?它是用来交付商业结果的资本品, 他是你的印钞机。现在的情况是什么?你开着重型挖掘机赶着去挖金矿,结果收费站门口时时堵着几百万辆去农家乐摘草莓的观光车, 最要命的是,你居然还熄了火跟着他们一起排队。当你在为白嫖了十秒钟的视频额度沾沾自喜时,你付出的是极度昂贵的机会成本。你把原本可以用来洞察客户痛点、打磨爆款文案的精力,全耗在了盯着进度条转圈上。 在奥派的视角里,利润永远是对解决稀缺性的奖赏,而不是对排队耐心的补偿。真正的企业家精神不是比谁更能熬,而是拥有敏捷的计算能力。算力既然稀缺,那就用金钱去数买时间。 只要这个工具能产生商业闭环,真正的操盘手会毫不犹豫的充值最高级的 api, 买下 vip 优先通道,穷人才会用时间去换免费的门票。 操盘手永远是用金钱去清空入账。别再拥挤的免费队伍,把你的资本品熬成了废铁,花钱买下特权,把你省下来的时间拿去降维,打击那些还在排队的同行。 这才是这个 ai 时代最顶级的商业清洗。

字节即望 cds 二点零最关联的七家公司,第一家,中文在线,国内数字文化内容领域先行者,坐拥海量小说核心版权库,布局短剧业务 e p s e d n s。 二点零, 实现 ip 快 速视频化,有效降低短距制作成本。第二家,视觉,中国国内规模领先的视觉内容互联网版权交易平台,为其梦 ai 提供正版素材、训练数据及版权合规服务。旗下炮曼平台已接入即梦 ai 生态。第三家,引力传媒,专业整合营销传播集团巨量引擎金牌服务商,借助 s e e d n s。 二点零高效生成营销视频, 显著提升广告创意效率与转化效果。第四家,博纳影业,国内首家主营电影发行业务的民营影视企业,旗下 a i g m s。 制作中心联合导音及梦 ai 共同出品制作 ai 生成科幻短剧三星堆未来启示录第一季。第五家,掌阅科技,专注互联网数字阅读及增值服务。 旗下炮曼平台率先接入 s e d n。 四二 zero, 实现 ai 慢剧二十四小时快速上线。第六家,海看股份与字节跳动旗下红果短剧建立全产业链深度合作,覆盖内容投资、制作、发行等核心环节。 七家上海电影拥有一二线城市核心地段优质影院资源,与极慢 ai 达成 ai 加影视战略合作,布局影视智能化新方向。记得点赞、收藏加关注,祝大家一路长虹!

字节 cds 谁是盈利最强企业?字节 cds 是 字节跳动 c 的 团队研发的多模态视频生成大模型,主打多镜头叙式原声音画同步六十秒长视频,支撑 ai 影视、慢剧、短剧营销等工业化生产。 分析认为, cds 二点零给用户提供导演级的控制精度,或为 ai 影视的起点时刻, 有望在 ai 漫剧、 ai 短剧等短内容方面率先得到广泛应用,进一步推动漫剧、短剧制作大幅降本提效和产能供给释放,拥有 ip 储备、平台流量优势的公司或充分受益。本文共询取十家字节 cds 产业链企业作为研究样本。第十,结成股份 产业细分影视动漫制作盈利能力净资产回报率百分之二点九六,毛利率百分之十八点八一、净利润百分之八点三一、密切预测 roe 最近三年连续下降至二百分之九十六,最新预测均值百分之四点九四, 主营产品,影视版权、运营及服务为最主要收入来源,收入占比百分之八十七点四零,毛利率百分之二十一点五九。 公司亮点,结成股份积累了十万余小时的影视动漫节目版权内容,与红国短剧进行了批量化的合作,公司为其提供真人短剧、 ai 写实剧和 ai 慢剧等内容。 华策影视产业细分影视动漫制作盈利能力,净资产回报率百分之三点四三,毛利率百分之三十一点零七,净利率百分之十四点三一、密切预测 而 oe 最近三年连续下降至三百分之四十三,最新预测均值百分之四点九七,主营产品,电视剧制作发行收入为最主要收入来源,收入占比百分之六十一点五五,毛利率百分之二十五点五八。 公司亮点,红果短剧是华策影视在短剧业务上的客户和合作伙伴,华策出品的重生之农门肥期及华策和抖音投资出品的我在冷宫、芒种田等多部精品短剧在红果上线。 第八,芒果超媒产业细分视频媒体盈利能力,净资产收益百分之六点二一,毛利率百分之二十九点零三,净利润百分之九点五四,预计预测 roe 最近三年波动在百分之六到百分之十八,最新预测均值百分之六点一零。 主营产品,芒果 tv 互联网视频业务为最主要收入来源,收入占比百分之三十五点三三、 公司亮点,芒果 tv 与抖音集团旗下红果短剧达成系列合作,双方围绕优质成品短剧授权、 ip 联动开发及联合出品、短剧商业化三大核心方向展开深度合作。 第七,照持股份产业细分彩电盈利能力,净资产回报率百分之十点四七,毛利率百分之十七点一七。净利润百分之八点五二。密切预测 roe 最近三年波动在百分之八到百分之十二,最新预测均值百分之八点四三。 主营产品,多媒体视听产品及运营服务为最主要收入来源,收入占比百分之七十三点七八,毛利率百分之十三点一零。 公司亮点,照持股份子公司北京风行目前有试听平台及终端业务、小程序内容分发、短距制作发行三大业务板块。六、 海看股份产业细分,电视广盈利能力,净资产收益百分之十一点一四,毛利率百分之五十六点一三,净利润百分之四十点九零预计预测, roe 最近三年连续下降至十一。百分之十点四五, 主营产品,信息传播业为最主要收入来源,收入占比百分之九十五点三九,毛利率百分之五十五点七八。公司亮点,海看股份与红果框架合作方联合开发平台短距项目,并为其提供项目诚挚极地拍摄等服务。 第五,上海电影产业细分,影视动漫制作。盈利能力,净资产收益百分之五点四七, 毛利率百分之二十三点三九,净利润百分之十七点四八。业绩预测, roe 最近三年最高,为七。百分之八十八,最新预测均值百分之十二点三四,主营产品,电影放映为最主要收入来源, 收入占比百分之六十五点八三、毛利率公司亮点,上海电影与字迹跳动旗下的 ai 创作与内容合作,双方将以 a o 加影视深度融合为核心。 第四,新华都产业细分,营销代理盈利能力,净资产收益百分之十五点零八,毛利率百分之二十四点九一,净利润百分之七点零五。 业绩预测, roe 最近三年波动在百分之十二到百分之十七,最新预测均值百分之十三点一七, 主营产品,互联网营销业务为最主要收入来源,收入占比百分之九十八点七一,毛利率百分之二十四点四六。公司亮点,新华都借助本地部署的 deepseek 的 模型生成文案及视频九本,通过 midjourney、 吉梦 ai 等 ai gc 工具实现内容生产自动化。 第三,横店影视产业细分院型盈利能力,净资产收益负百分之七点五三,毛利率百分之三点二一,净利润负百分之四点八九。业绩预测, roe 最近三年最高为十百分之十九,最新预测均值百分之十八点三五,主营产品, 电影放映及相关衍生业务为最主要收入来源,收入占比百分之八十七点零一,毛利率能计量横店影视已设立大横小竖短剧品牌,多部短剧已在红果、番茄、爱奇艺等平台播出, 同时积极引进海外短剧项目来横店合作拍摄。第二,润泽科技产业细分通信应用、增值服务。盈利能力,净资产收益百分之十九点五零, 毛利率百分之四十八点九三,净利润百分之四十一点六七,密切预测 roe 最近三年连续下降至十九品金品内 钻利权枚银料引力零利,净资产冲击百分之三十二点七六、盈产品 i d c 业务为最主要收入来源,收入占比百分之六十六点七五, 毛利率百分之四十七点五三基公司亮点,润泽科技是全国领先的综合算力中心领域科技公司,终端客户包括字节跳动。第一,引力,传媒 产业细分营销代理。盈利能力,净资产回报率百分之九点五四,利率百分之三点七一,净利润负百分之零点二九。业绩预测, roe 最近三年最高为二十八,百分之六,最新预测均值百分之二十四点零五, 主营产品,数字营销为最主要收入来源,人力收益收入占比百分之九十八点四五,毛利率百分之三点五二。公司亮点,引力传媒已与火山引擎建立起常规沟通机制,在公司内部广泛应用集梦豆包等 ai 工具。

逼自己一个月练完,其实你很会 ai, 视频生成全七百四十二集存下吧,真的很难找全的。本视频耗时三个月制作共计一百六十小时,带你一口气从零基础小白入门进阶。由于视频太长,本套视频分十二期发布, 本期带你搞定 cad 四二点零生成视频会给大家一个小福利,课程视频中的所有素材,脚本、分镜、关键词等,还有学习计划表,几十上百记素材,电子书和课件等等,只要你能想到的素材我这里几乎都有,评论留言六六六即可全部免费打包带走。 哈喽,大家好,我是林默。在上几节课中,我们提到了提示词的九个维度,运用九个维度精准的控制画面。 今天这堂课我们不再重复讲解概念,而是带着大家做一次实操演练,希望大家能将九个维度的框架真正的落地,为一个有效的工作流进行精确的控制,来达到画面的最好效果。 那么今天我们还是使用极梦 ai 的 工具,就让我们一起来看一下吧。大家在使用九个维度之后,容易陷入一个误区,就是要将九个维度全部填入, 我们先来看一下这样做会产生怎么样的效果。来看一下我这里的提示词,伦博朗油画风格一位学者在深夜的图书馆书桌前阅读,周围是高大的书架构图采用经典的三角形构图与幽暗的纵深 色彩,以棕褐色调为主色调质感呈现油画厚涂的肌理,强烈的伦博朗光从左上角照亮学者的面部。哈苏中景质感在这段提示词中, 我包含了九个维度,比如我使用了艺术家伦勃朗风格,主体是一位白发的学者,在深夜的图书馆专注阅读构图上面使用了经典的三角形,情绪,氛围是深沉的静谧的。 色彩,上面是棕灰色调为主色调,搭配烛光的暖黄质感和笔触上面使用了油画的厚涂肌理,光影使用了伦勃朗侧光,质感与精度上面选用了哈苏相机。输入完提示词之后,我们来看下方的功能区,我们点击图片四点五, 可以看到里面有很多的模型,都是极梦过往的一些模型库。不同的模型侧重点不一样,比如像图片三点零,它更具有电影质感, 文字更加精准,能够直出二 k 的 高清图片。而我们最新的图片四点五是强化了一致性风格和图片的响应能力更加。这里并不是说图片版本越高就越好,你要根据你的需求去选择。如果你是新手, 那么这里推荐你使用最新的模型,当你熟练掌握了之后,再根据自己的需求去选择别的模型。接下来我们来看图片比例以及分辨率,可以看到这里有很多的比例选择, 像我们经常电脑端使用的是十六比九,除了十六比九以外,还有我们经常看到的头像一比一和手机屏幕九比十六,小红书规格二比三, 你可以根据自己需要选择对应的分辨率。如果你不想这么麻烦,你也可以使用系统推荐的智能,它会自动识别这张图片,给你推荐合适的比例。这里我们选用九比十六。在分辨率的选择上面,当然是越高清越好, 这里我们先选用默认二 k 即可。可以看到此时的消耗是三个积分,一张通常会生成四张,所以这里会消耗十二个积分。我们来看一下生成的效果来,可以看到图片已经生成完成, 我们对照这个提示词来看一下是否画面中所有的元素都体现完整。先来看画面风格,首先它确实是伦勃朗的油画风格,然后也符合我们的主体。 一位学者在深夜里图书馆专注阅读,周围是高大的书架,采用的是暗绿色的天鹅绒绒布,在构图上使用的是三角形构图与幽暗的纵深,可以看到确实符合三角形的构图方式,空间确实有纵深的感觉。氛围深沉静谧。色彩以深棕色为主色调, 这个也对得上,搭配的是暗绿色的连帐和暖黄色的烛光。这个元素画面中也是有的,质感是油画的厚涂,质感强烈的轮毂。蓝光从顶部的左侧照射在学者的面部和树叶上,我们可以看到这个画面中 全部的元素基本上都是对上了,但是我们将所有的维度放到一个画面中,同时呈现时,画面的效果感觉并不是特别的强烈,这又是为什么呢?这就得提到我们上几节课说过提示词的权重问题, 它会优先地处理最前面的提示词,放在前面的提示词权重最高,放在尾端的提示词权重最低。这就会导致虽然这个画面中使用了九个维度,但是因为整体的提示词结构较长,导致最尾端的几个元素权重太低了。而 ai 又遵循了我们的提示词命令, 将所有的元素都揉捏在一个画面中,但是由于提示词末尾的权重过低,导致画面中虽然有该元素的出现,却没有很好的被表达出来,发挥这个提示词的最大效益。我们可以将九个维度中你认为最重要的那几个提示词拿出来,先将主画面生成, 使用一些局部重绘,将这个图片进行二次创作,接下来就带着大家实际操作一下,这里可以告诉大家,在刚开始创作的时候不要想的太过于复杂,先快速的确定三个主要的维度,比如第一个就是我们说的题材,第二个呢是环境和背景, 第三个呢是风格和艺术家,大家在日常创作中可以根据自己的需求来调换这些核心的元素,这里我们以这三个维度来举例说明。那么第一个题材方面呢, 我这里给出的是一个在舞台上手持电吉他的主唱,环境和背景方面我们可以写夏日黄昏下,露天的音乐节现场,人群涌动,风格和艺术家方面我们可以选用一些,如赛博朋克风格,霓虹光影,接下来我们就将它组合成一个初步的提示词,那么我们组合成的提示词是 赛博朋克风格,夏日黄昏下的露天音乐节现场,舞台上手持电吉他的主唱,台下人群涌动,霓虹光影。那么我们先将这个提示词放入极梦 ai 来看一下产生的画面效果。我们将提示词粘贴到极梦 ai 的 提示框中,在模型上面我们先选用四点五,这里我选用的比例是二比三, 我们来看一下生成效果来看到生成结果,四张图片生成了不一样的效果,我们选用一张图片中我比较喜欢后面的晚霞, 还有人群中热闹的氛围,但这张图片美中不足的地方就是在背后晚霞的照射下,画面中的人群和主角的身上并没有体现出暖色的光晕,反而画面中使用了大量的蓝色基调和红色基调,让这个舞台显得有一些冷色调和背后晚霞的光晕 形成了颜色上的割裂,所以这个时候我们就要用到局部重绘的效果,将色彩的颜色稍加修饰,增加一些暖黄色,来使画面的色彩更加的协调。来看一下我的操作方法,我们点击右边的功能区选择局部重绘, 可以看到此时跳出了一个选择框来看下方的功能区,第一栏是画笔的大小,我们可以根据自己的需求将画笔调试到一个合适的大小。 接着下面的功能区是橡皮擦还有移动工具,这些功能性项目我们前面在无线画布中稍微有所提及。 接下来我要对画面中色彩的变化进行一个处理,我们对画面中需要修改的部分进行涂抹,像人物的头顶,肩膀以及底下的人群,还有舞台上面的颜色我都要进行修改。提示词方面我们可以写来看到我这边的提示词是在涂抹区增加一些夕阳的暖色调, 其余保持不变。让我们来看生成效果,我们来看生成的画面,右侧是我们的原图,左侧是我们生成的画面,可以看到这里我们通过局部重绘这个功能 对画面中的色调进行了重新的绘制,在保留了舞台上的灯光以及人物手中的荧光棒呈现蓝色调的同时,给画面增加了一些暖色的光调,让画面的感觉比原图更加的协调。或两张画面的对比,我们可以看到我们使用了局部重绘之后, 对画面的色彩重新确定了方向,它保证了主体以及其他结构不变的情况下,保留了舞台上蓝色的基调,又强化了晚霞带来的色彩氛围,使画面场景与环境更加的协调自然。通过这个方法可以让我们知道,虽然有九个维度,但是我们可以根据自己的需要 对画面进行维度上的一个变化,不一定全部将九个维度都放置在内,先选几个核心的元素定义一下画面的基础效果,接着通过局部重绘的功能,对画面不满意的地方进行其他维度的修正。 这样的方法也能够通过提日词结合我们的九个维度对画面进行精准的控制,更好的辅助我们完成自己的创作。除了上述的操作以外,其实九个维度也可以作为我们分析的工具, 就像我们现在已经有了一个不错的图片,但是如何判断它是否达到了一个较为美观的图片呢?这时候九个维度就可以作为质量检查的工具,你可以按照下面的几个思路 去反看这张图片,看一下题材方面,比如核心的主体是否突出,占据着画面的主要地位,从风格上面也可以看一下是不是符合我们的赛博朋克的预期,如果感觉较弱,可以回到第二步进行局部重绘来增强这个风格。第三个也可以看一下构图, 看一下主唱是否在视觉的中心,能不能用黄金分割或者是对称构图来调整主唱所在的位置。第四个是色彩和光影,这个我们刚才已经讲过了, 我们在原先的基础上面对画面的光影进行了调整,使这个画面和背景相互融合。那么通过今天的学习,我们对提示词的使用有了更深层次的解读。我们利用九个维度将提示词拆分成了三部的工作流,又使用了局部重绘的功能, 针对单个维度进行了精确的编辑。最后我们又利用了九个维度对框架进行了分析,希望通过这样的思路,可以让你更好地运用这些工具来生成画面的效果。下节课我们会继续讲解 ai 相关的知识,那么本节课的内容就先到这里,我们下节课再见! 哈喽,大家好,我是林默。很多同学在学习 ai 修图的时候,感觉功能很多,记不住该用哪一个,这节课我们就来解决这个问题。其实关于这些功能我们不需要死记硬背,今天我就来分享一套最实用的工作流, 来帮助你迅速掌握这些技能。那么为了方便大家的理解,我这里还是继续使用实力教学的方式来让大家更直观的感受。来看我这边生成了一张图片,这个图片是一个武士中近景正面视角和观众打招呼, 我们看到在这个页面上,左边是我们的图片生成区,右边是我们的功能选择区。我们先来看一下功能选择区,那么今天我们主要来介绍编辑这一栏中关于智能超清, 超清细节修复、局部重绘、扩图消除笔以及对口型和图片编辑。我们先来观察一下这张图片,我们来看到这张人物的左手,他是有五根手指头,并且根根分明,这是没有问题的,人物的面部五官也非常的正常, 并没有发生扭曲的状态,衣服的结构也左右对称,非常的合理。当我们来到腰间的时候,发现这里有一个腰间的配刀, 这个配刀的状态就很奇怪,感觉就像两节的样子,有可能是生成不够完整,所以这里我们要使用到编辑功能的消除笔功能。让我们来到编辑,看到这里有一个消除笔功能,我们点击消除笔 来看到此时跳出了一个消除笔窗口,下方有一个拉杆,可以调节我们的消除笔大小,除这个功能以外,边上有一个橡皮擦,还有一个移动工具。我们先来使用消除笔,将消除笔调试到合适的大小,对这把配刀进行涂抹,可以看到此时消除笔涂抹的部分会有一个选择框, 但是由于这个图片目前的面积比较小,所以看的不是很清楚,我们可以使用右边的放大功能,将图片在百分百的基础上继续放大,最高可以放大到百分之三百, 此时我们要消除的东西位于图片的下方,这个时候我们就可以选用我们的移动工具,将这张图片向上拖拽,这个时候我们要消除的物品就被放大了,我们再使用画笔工具对一些细节进行涂抹,如果发现涂抹的边缘 比较的多,你可以使用这边的橡皮擦功能对多余的部分进行擦除。这个时候我们就将配刀全部涂抹完成,在右下角有一个立刻生成,消耗的是一点积分,我们点击立刻生成看一下效果。我们再来看这个腰间部分,经过了消除笔消除的功能,不合理的配刀已经被消除处理, 那么通过这个功能我们可以知道消除笔可以将我们不需要的物品进行消除。但是有时候一张图片的生成并不意味着只有一个点出现了问题,他可能是结合了多方面的一些问题。我们再来检查这张图片是否还有其他的问题。我们使用放大镜来仔细观察, 可以看到虽然人物的手部拿着这把配刀,但是人物的手部姿势结构不太对劲,特别是指头的关节部分,感觉略微不合理,我们需要对这只手进行优化。我们再来介绍一个功能, 这个功能叫做局部重绘,它可以将这个物品进行从新的绘制。我们来找到这个功能,在编辑里面有一个局部重绘,我们点击局部重绘,此时跳出了一个新的窗口,它的功能跟消除笔的功能页面非常的相近,第一栏也是一个活动拉杆, 将手部移到视觉中心,接着我们使用画笔工具调整合适的大小对这只手部进行涂抹。可以看到在涂抹的时候,我特地在手部多余的位置多涂了一点,因为在一只手需要修复的时候, 多涂一点之后,它生成的结果可以更好的跟边上进行融合,那么这个时候它跟消除笔唯一不一样的地方,可以看到在这个图片的下方出现了一个输入框,来看到我这边修复的时候给出的手握剑姿势, 让我们来看一下生成结果,来看一下这次的生成结果,可以看到左边的图片是我们原先的手部,右边的图片是我们生成之后的手部, 可以明显的看到原本结构不正确的地方已经被修正完整,这个就是局部重绘的效果。但是这里大家需要注意的是,局部重绘的效果往往还是随机的,可能需要通过一次或多次的生成才能达到满意的效果,所以大家需要多次抽卡。如果局部重绘解决不了这块问题, 可以先使用消除笔进行涂抹消除,然后再使用局部重绘尝试修复。以上就是局部重绘和消除笔的使用功能,可以看到此时这张图片已经被基本修复完成。手部的结构,面部的表情, 衣服的对称程度和颜色色彩都非常的协调,但是美中不足的地方就是我希望他能把这把剑露出来。这个时候我们就可以使用扩图的功能,我们点击这边的扩图,此时也会跳出一个扩图的窗口来,看到上面有一点五倍扩图、 两倍扩图和三倍扩图,那么除这些扩图以外,下面的比例还可以调整为一比一,比例, 三比四、四比三或者是十六比九,那么大家可以根据自己的需求调整相适应的比例。这里我们使用原图比例先修改它的扩图范围,对于把键来讲,我觉得只要再扩充一点五倍就可以完整的体现键的样式, 所以我选用一点五倍,那么比例我先选择不变,下面有一个提示框让你描述扩充的内容,我们可以基于这张图片让 ai 自动展开联想, 所以此时我就不再额外输入扩图内容。我们点击生成看一下效果。我们来看一下两张图的对比,右图是我们的原图,左图是我们修正后的图片,可以看到人物经过我们的修正,并且进行了扩图之后, 形成了新的画面效果。在这张修正后的图片中,人物的配刀进行了完整的呈现,除此外,人物身处的环境也进行了扩充,在人物的左侧多了一盆绿植和一些灯布装饰,可以看到极梦在扩图的过程中可以融合周边的场景进行联想, 场景融合的非常协调。那么接下来我们就基于已经生成好的这张图片再进行细节上的修改。我们来看一下这张图片,这张图片目前从左边右边上面出现了三盏灯光,我感觉这个灯在画面中非常的违和, 所以我打算继续使用消除笔功能对这些灯具进行消除。我们来看一下消除结果。我们来看消除后的图片,可以看到上方的灯光已经被去除,但是在柱子两侧的灯光并没有被去除, 像这种消除不了的情况,我们该怎么解决呢?像这个时候我们就可以继续使用局部重绘,我们点击局部重绘,将两盏灯光进行涂抹。我这里的提示词是去除灯,修复墙面,让我们来看一下生成效果,我们来看到这几张修复的结果,四张里面只有一张符合了我们描述 修复了我们的画面,从这个结果可以得出,消除笔和局部重绘可以反复的利用,根据画面的效果选择合适的消除方法。并不仅仅是消除笔的功能,只在于消除局部重绘的功能,仅在于局部修复。希望大家在使用的过程中,不要陷在它只能消除或只能重绘的固定思维里面, 灵活的使用这些工具。好的,我们讲完了这么多,接下来我们来看一下细节修复,细节修复顾名思义就是对细节进行添加细节或消除细节,我们点击使用细节修复。好了,我们来看一下这两张图片。首先右边的图片是我们的原图, 它经过了细节修复之后,产生了左边这张图,我们来找一找不同,看一下这两者图片有哪些不一样的区别。我们打开放大镜功能,先来看一下主角的部分,可以看到左边头部的样式跟右边的样式产生了区别。再来看人物的衣着,可以看到人物的衣着方面产生了变化, 在拿取刀布的动作时,人物的手部更加的协调自然。在人物头顶的区域后面的扁排部分产生了区别,包括后面的背景,可以看到木梁上面比原先的原图增加了更多的木纹细节,包括地面上也比原图增加了更多的纹理, 使这个场景变得更加的真实。通过这些对比,我们可以知道细节修复是基于 ai 对 这张图片的理解,对原图进行了更多细节上的描述,使图片增强了纹理,对这张写实的照片来说,它让这张照片增加了更多的真实性,有时候也会产生一些误判的效果, 将你原本不需要被修复的细节进行了抹除,所以大家要根据自己的需求进行选择。讲完了细节修复,我们再来看一下智能超清和超清之间的区别。点击智能超清之后,会跳出一个窗口,我们点击细节生成,可以发现一个拉杆,数值越小,生成的细节程度越小, 数值越大,生成的细节程度越大。再来看右边的按钮,有一个放大按钮,打开之后可以看到这个是用来放大分辨率的,这个分辨率从二 k 到八 k 不 等,从四 k 开始就需要升级会员才能使用,那么这里我们选择二 k。 细节生成方面我们拉满,方便大家更好的对比, 我们生成一张看一下效果。好了,图片已经生成,我们来看一下生成效果,我们点击看一下,进去之后发现这里有一个拉杆, 左边是超清前,右边是超清后。让我们仔细观察一下这个图片,可以看到超清前的家具和木饰面板以及人物的表面细节较少,超清之后可以明显看到木饰面的表面有了更多的纹理,包括人物的脸庞及手部的掌纹, 增添了更多真实的纹理质感,生成的效果还是很不错的,特别是人物裤子的部分,原本没有任何花纹,加了智能超轻之后,裤子的表面添加了很多的纹理,这个就是智能超轻的功能。大家在生成时可以通过拉取数值,数值越小,细节生成的越少,数值越大,细节生成的越多。 可以看到此时的画面经过了修复和反复的调整,已经达到了我比较满意的程度,接下来我希望能将它导出,在导出之前我们可以再来一道工序, 那就是高清放大。超清顾名思义就是将这张图片高清放大。我们来点击看一下生成效果,可以看到此时的超清已经生成完成,我们点击之后将它下载。我们来看一下超清的功能,左边是我们的原图, 右边是我们经过了超清放大之后的效果。我们将鼠标停放在原图上,可以看到此时的分辨率是八六三乘幺五三六,来看超清放大之后的分辨率是幺七二六乘三零七二。那么通过计算我们可以得到图片的原图经过超清放大之后是放大了两倍的比例。 我们来看一下画质效果,这张是原图的画质,当我们图片拉到近景时,人物的面部较为模糊。我们再来看超清放大后的,通过这样的对比,我们可以知道在导出之前可以进行超清放大,这样可以保证我们导出的图片质量更高, 效果更好。那么再来看一下图片编辑功能,我们点击图片编辑可以看到此时我们来到了无线画布功能,关于无线画布的功能可以去看,我上一节课有详细介绍,我们回到这个详情页,看到这里还有个对口型功能,这个功能和视频生成的功能, 在接下来的课程中我会进行更详细的讲解。最后我们来一个总结,我们可以看到一张图片从生产到创作完成需要经历好几个环节, ai 目前的水平还无法做到一张图片能够完美直出, 所以大家遇到一张图片需要修正时,可以先判断这张图片是什么问题。如果是需要消除,可以使用消除笔功能。如果消除笔消除不掉,我们也可以使用局部重绘的功能。如果你要将近景人物调整为中景,可以使用扩图的功能,最后得到一张修正后的图片。 在导出之前也可以使用超轻放大的功能。这就是我们今天教给大家的工作流程,你可以按照这个流程自己走一遍,多多尝试和发现。那么本节课的内容就先学到这里,我们下节课再见!哈喽,大家好,我是林默。在上一节课中,我们讲解了纹身图的基本功能, 你是否遇到过这些问题呢?比如在生成了一张不错的构图,但风格或细节不满意,想要修改却不知道如何下手。或者是画好了一张线稿,想要尝试不同风格的上色,又怕变形,或是找到了一张完美的动作参考, 但是想换成自己角色的脸和服装,那么这节课我们就来讲解极梦 ai 的 图身图功能。重点来看两个模型, 四点零以上和三点零以上的模型,它们的不同特性,并学会根据实际需求来选择使用。我们来到极梦的首页,点击生成按钮,将下面的模式改为图片生成。此时我们可以看到图片模型,这里有三点零级以上的模型和四点零级以上的模型, 今天我们就来重点讲解这两块模型之间的不同性能,希望大家学会之后可以根据实际需求来选择合适的模型,那么这里我们先来看一下四点五模型,接下来我们将通过实际的案例来展示图片四点五模型的功能 来看,我这边上传了一张白底的咖啡机图片,假设我们要为一个咖啡机的厂家在社交媒体上制作一系列不同生活的场景,将这只产品融入到该场景中来制作营销的海报, 以吸引不同的用户。我们可以怎么做呢?我们将这张白底的咖啡机产品图上传,我们点击这个参考图,可以看到此时出现了一个窗口,那么下面有几个功能区我们来看一下, 第一个是选择编辑区,第二个是抠图,第三个是参考强度,我们依次来介绍,先看一下选定编辑区, 我们点击进入后发现有一个二级菜单,分别是画笔框、选橡皮擦和移动。那么根据我们上节课的介绍,相信大家对这个页面有所熟悉,这个页面适用于一些有背景图需要在背景图中抠出主体的场景下使用,我们可以用画笔对于场景中的图片 进行一个涂抹,点击确定之后,他就可以智能的选取这张场景中的主体。那么由于我们这一次使用的是一个白底图,就不需要使用这个功能,所以我们点击关闭。 抠图,顾名思义就是将场景中的主体进行抠出,这是为了能够更精确的在这张图中参考到我们需要的主体,那么由于我们这张图是白底图,所以我们也不需要操作,来看一下参考强度,点击之后发现这里有一个拉杆,这个拉杆代表着数值越低, 参考这张图的强度越低,数值越高,说明参考这张图的强度越高,而强度的大小又影响着我们最终的画面生成。一般情况下我们使用默认即可,我们点击保存在这里我们继续描述我们的图片, 比如早晨的阳光从窗户中撒入,边上有一杯冒着热气的拿铁和一本杂志 照片集真实感温馨的场景。让我们来使用图片的四点五模型,选择比例为二比三来生成一张看一下效果。我们来看一下生成结果。 从图片中我们可以看到四点五模型理解了咖啡机是主体,并基于提示词自主合成了合理的现代场景,逼真的光影和和谐的构图,将这个单调的咖啡机产品图转化为了一个有故事感的场景照片, 大大提高了我们的素材,拓展了这个产品在不同场景中无限的可能性。那么我们来看第二个演示。 除了上述的电商产品图以外,我们也可以为游戏概念、美术创作一些多姿态的展示。假设我们目前手上已经有了一个场景的角色定妆照,此时我们需要为这个角色介绍页面,生成这个角色在不同场景下的姿态,比如战斗姿态、休闲依靠和使用技能。 那么我们来看一下具体的操作。我们将人物进行上传,我上传了这个角色的白底正面照,此时我给出的提示词是 让人物做出战斗时的预备姿态。身处霓虹的潮湿厚巷,手中的能量武器发光,身体微微前倾,具有未来感和电影镜头。 这里我使用的比例是九比十六,模型同样选用四点五,让我们来看一下生成效果。可以看到,四点五模型成功捕捉了原设定的图像、人物特征,比如发型、服装、配色等等,并根据我们的文本描述创造出了一个全新的姿态,身处在复杂的环境中。 这证明了这个模型在维护角色核心辨识度的同时,还能进行丰富的创意姿态和场景的扩展,非常适合项目概念性的开发。从这两个势力我们可以得出结论, 当你处于一个创意发散期,需要将草图、文字或者是一些灵感转化为视觉呈现,或者需要对现有的图形进行整体的风格转会、氛围重组的时候,优选可以使用四点五模型。那么介绍完了四点五模型,我们再来看一下三点零模型。你可能会疑问, 我们已经有模型四点五了,为什么还要介绍这个已经被淘汰的三点零模型呢?这里需要大家知道一个概念, 简单来说,模型的四点零和模型的三点零并不是新旧版本的替换关系,而是不同的用途关系。像目前最新的四点五模型,他擅长理解你的想法,进行创意的挥发和整体风格的塑造,但是每一次发挥都会有一定的自由度,哪怕我们已经给了他一个固定的参考图, 它每一次的生成都会有一些变化,只是过于细小,导致第一时间肉眼无法察觉,适合用于一些自由度较高的图片生产,而三点零模型可以进行更精确、可预测的复制和延伸, 所以在许多实际的流程中,三点零模型是不可缺少的,它最核心的价值就体现在确定性和一致性。我们通过一个实际的例子来展示它的不同。 假设你是一个设计师,公司现在有一款智能的手表,它的设计方案已经进入了最终定稿阶段,拥有了一张产品定妆照。而市场部现在需要你快速的生成五个一样的产品,但是不同的材质所呈现的产品渲染图用于客户偏好的调研。 那你可以怎么做呢?我们来看一下具体的操作方式。我们将图片的模型切换到三点零模型,然后来上传这张产品图。可以看到我们将产品上传时跳出了一个窗口,这个窗口有区别于四点五的操作窗口,它下面多出了很多功能区。 这个模型的进化就是来源于 state fusion control night 模型,可以对主体进行精确的控制。我们来看一下下面的功能区,分别有智能参考、角色特征、人物写真、主体识别、风格识别、 轮廓识别、紧身以及人物姿态。那么这一次我们使用的功能是线稿模式,也就是轮廓识别。可以看到,当我们点击轮廓识别时,上面的显示区分成了原图和轮廓图,它将我们的原图克隆成了一个线稿模式,并提取了这个产品所有的结构线条。 在原图的下方有两个选择区,一个是参考强度拖动上面的拉杆可以对原图的手表进行更多细节的参考, 数值越小,参考到的细节越少。数值越大,参考到的细节越多,这里我先选用参考最多来增强对比,给大家看一下效果。 生成比例的选择,我们可以勾选跟参考图比例一致,我们点击保存。此时我们要对这张图片进行描述来看,我这里的提示词是构图不变,将手表改成哑光铝合金材质,深海蓝色硅胶表带极简风格。比例上面我们可以选用智能比例, 或者是选用跟产品一样的比例特征。这里我使用智能比例进行展示。可以看到此时消耗一张图片 所需要两点积分,每一次将生成四个图片,一共消耗八点积分。我们来尝试生成看一下效果,可以看到已经生成完成。我们来对比原先的图片,可以看到 在保证了产品一致性的同时,对产品的颜色进行了修改,完全符合我们的产品特征和细节保留。我们再来生成一张看一下效果。这一次我选择将手表改成抛光不锈钢表面。我们来看生成的结果。从图片中不难看出,所有的生成效果图都严格遵守了原始的工程图结构比例, 我们通过提示词仅仅改变了颜色和材质,这保证了调研是基于同一个产品的设计进行的,避免了因为外观的差异带来的干扰,实现了工业设计 后期阶段所需要的绝对一致性。接下来我们再来看一个例子,来看到我这里上传了一张模特图,假设你现在是一名服装品牌的设计师,而你的目的是需要在前期 给客户或企业选定初期的风格,可以看到他身材的轮廓以及基础的发型已经确认好了,我们需要基于这个固定的造型 快速生成他穿着不同风格的服装,比如晚礼服,商务通勤等等,用于前期风格化客户的选择。这里我们选用的是人物姿势,我们将比例调整为九比十六。我们来看一下这张图片,可以看到在原图的基础上,我们为这个模特生成了一个骨骼图,他识别了人物的面部 以及人物的动作,姿态以线条的方式呈现,我们将参考程度拉到最高,方便给大家展示。结果我们选择保存。提示词方面,我们可以写一位亚洲女性模特,身穿米白色的西装外套和直筒西裤,内搭衬衫,手提皮质感的托特包,在明亮的办公室走廊,专业摄影,自然光线。 我们选用比例九比十六来看一下生成结果。对比原图,我们可以看到人物的姿态确实参考了我们的图片,但是 ai 并没有区分人物左右手的姿态, 而是将原图人物的右手理解成了左手,使得这个人物的姿态变得十分的古怪。加上虽然人物在室内场景,但是人物的比例在这个场景中 显得异常的高大,人物变得有点像巨人。那么我们应该如何调整这个问题呢?我们回到这张照片,对于人物姿态识别的不够精准的情况,我们可以换一个,比如景深, 我们来看一下紧身,紧身它还有一个功能叫做深度图,是一张灰度的图片,用黑白灰的深浅来代表物体离相机的远近,越白表示越近,越黑表示越远。向我们提供的这张现行图片使用了紧身这个功能, ai 在 处理这张原图的时候,就会在模特最远的位置处理的朦胧虚化,而近处的姿态则显示的清晰锐利,从而形成逼真的紧身效果。 我们将参考的程度拉到最高比例,选用九比十六,再来看一下效果。好了,我们来看一下生成结果,可以看到这一次我们通过紧身这个功能,人物的姿态基本是对齐的,包括人物的发型基本一致,但是我们仔细看可以发现在人物的手部 出现了变形,这是由于这是人物的全身照,在生成的时候,由于使用了大量的算力来构建这个画面,所以在人物手部的细节处生成的算力不够,导致人物的手部 并没有很好的生成。这时候我们可以通过右边的工具栏局部重绘的功能对单一的手部进行调整。最后我们来一个总结,今天我们通过了以上的案例来进行实际项目的演示,可以看到四点五模型,在项目的前期, 它可以帮助我们拓展思路,视觉化构想,创造整体性的视觉效果。在案例中它可以将白底的图片融入场景,为固定的角色设计新的姿态。而在三点零的模式下,它可以运作于项目的后期,高效的延伸,确保产出的图片 更加的稳定可控。那么现在我们回来这个页面可以看到刚才我们使用了轮廓边缘来展示出一个线稿, 又使用了人物姿态来展示出人物的骨骼图。最后使用了紧身来展示了人物的轮廓深浅。当然除上面的功能以外,还有其他的功能,课后大家可以挨个尝试,在日常的创作中熟练掌握这些技能,来辅助自己更好的创作作品。那么本节课的内容就先学到这里, 我们下节课再见!哈喽,大家好,我是林默,今天我们要来学习 ai 视频生成的功能。在开始学习今天的 ai 视频课程之前,我们先来确定一个核心的理念。好的动态视频本质上是由一系列精心设计的镜头组合而成, 也就是我们俗称的运镜,而导演就是我们。我们要通过提示词来指挥 ai 的 虚拟摄像机如何运动。在 ai 视频生成中,我们主要是通过描述这些镜头的动作来控制画面。常用的运镜主要包括挥、拉、摇、移、 环绕、切、特写、中景、全景等等。我们先来看一下什么是推和拉。推和拉是指镜头向前推进或向后拉远。摇和移指的是镜头水平垂直摇动或跟随移动。 而环绕是指镜头围绕主体旋转。切指的是一个镜头画面直接切换到另一个镜头画面特写。中景和全景则描述了画面的取景范围。 理解了这些词语,你可以更清晰的告诉 ai 你 想要的效果。那么今天我们就以一个统一的创作目标,制作一段侦探调查书房的悬疑短片来学习五种不同的视频生成方式。你会发现从快速构思到精细控制, 每一种方法都有其不可替代的作用。我们先来看一下 ai 视频生成的方式,一共有五种生成方式,分别是图升视频、首尾帧、升视频、 智能多帧和参考图身视频。我们先来介绍第一种纹身视频,纹身视频的意思就是说不依赖于现有的图片,而是通过一段结构化的镜头脚本提示词,直接生成一段包含复杂运镜和内容变化的完整视频, 这是将脑子中完整的动态想法快速实现出来的方式,我们来演示一下。我们打开极梦 ai, 进入生成页面,将 agent 模式改为视频生成。可以看到在视频的生成框中可以上传两张参考图,前面一张是手帐图, 后面一张是伪真图。而纹身视频呢,是直接输入文字得到一段完整的视频。来看一下我这里的提示词,我写的是电影悬疑短片昏暗的书房开场的特写,一只戴着白手套的手不小心推开一扇厚重的木门,镜头遥至房间的全景镜头快速推进,书桌上泛黄的信件, 镜头切至侦探的侧脸近景,他眼神锐利的阅读,随后镜头从他的身后低角度环绕,展示出他沉思的背影以及窗外的雨夜。 最后镜头拉平,他拿起放大镜,光线照亮信纸上的一个隐秘符号。在这个提示词中,我使用了很多的运镜,构思了一个完整的故事按键。点完提示词之后,我们来看一下下方的视频模型,点开以后可以看到这里有四个模型可以选择, 其中三点零 pro 级以上都是需要开通会员才能使用,这里我们选择默认模式。首尾帧方面我们等一下再讲,比例方面我们使用十六比九, 注意看这里有一个视频时长,一般来说我们默认为五秒视频,不过像我目前的这个提示词,他可能涉及到的信息更多, 所以这里我们使用十秒的时长,可以看到每消耗一次十秒的时长需要二十个积分。我们点击来看一下生成效果,可以看到此时视频已经生成完成,我们点击看一下效果。我们可以看到 ai 尝试理解并执行了我描述的这一系列镜头, 直接生成了一个包括推门、摇镜、推进、切换、环绕等多个运动的十秒短片,这可以让我们快速的评估一个动态创意的整体节奏和气氛。从视频画面中我们可以看到,推门进来的这一刹那, 我们的镜头聚焦在了书桌上的信纸,给这个信件来了一个特写。从画面中我们不难看出,信件上的内容略微模糊, 看不清楚具体的信件内容,所以我想要专门优化一下它。那么我们可以怎么做呢?我们可以利用截图工具将这个画面进行一张截图,可以看到通过截图我们得到了一张 信件特写的图片。那么有了这张图片之后,我们就可以使用第二种生成方式,手抷图生成视频。它的优势在于 我们可以将刚才的信件作为手帧图,然后针对这一帧的画面设计的更加精细,更加稳定的镜头运动。我们回到这个画面,将刚才的信件特写进行上传,接着我们可以输入一段提示词,比如我这里的提示词是镜头从信件的上方缓缓的下降并轻微的旋转, 聚焦于信纸上的文字,同时营造出尘埃在光线中漂浮的氛围。我们使用视频的三点零 plus, 这里我们使用的是手征图模式,分辨率选择的是七幺二零 p, 像这一段提示词内容较短,我们可以使用五秒视频, 可以看到五秒视频每次生成消耗十点积分,来看一下生成结果。从画面中我们可以看到原本模糊不清的信件内容变得清晰可见。 通过这样的画面,我们可以得到了一个质感更高的信件特写镜头,锁定了信件的内容,优化了运镜和细节。那么通过刚才的介绍,我们讲解了纹身视频和手针图身视频。 接下来我们来看一下第三个首尾针身视频,它可以精确的控制画面内的关键变化,比如当你需要画面中的某个元素发生精确可控的变化时,可以使用这个功能,我们来实际演示一下。从画面中我们可以看到 此时侦探手中正拿着这封信件,但是上面的字体较为模糊,看不清具体的内容。紧接着侦探拿起放大镜,看到画面中出现了一个神秘的符号,此时可以看到信件上的内容还是较为模糊, 所以我们对这个镜头可以进行优化。那么这一次我们来使用首尾真身视频来将同一张信纸,同一个符号,让信件的内容变得清晰锐利。来看一下我的操作方式,我们先截取一张信件的全貌,取这个图片作为我们的手真图。紧接着我们截取一张 放大镜,显示出神秘符号的图片作为我们的尾帧。那么有了这两张图片之后,我们应该如何使用呢?首先我们需要对这张尾帧进行处理,将信纸上模糊的部分以及这个符号变得非常的清晰,这里我们可以回到图片生成模式,上传这张尾帧。 接着我们给出提示词,同一张信纸上面用哥特式的手写字体写满文字中央盖着一枚精致的皇家文章火漆印。写完提示词之后,我们将图片改为四点五,比例改为十六比九, 让我们来深层看一下效果,我们来看一下,通过这两张图的对比,可以看到我们优化完之后,这张信纸的具体内容比原先的效果要好了很多。首先这个字体的符号非常有标题的质感,而原先这里并不凸显。其次优化了放大镜中的符号,比原先的精致了不少。 我们将这张图片进行下载好了,经过我们的调整,我们得到了一张手帧图片,又得到了一张尾帧图片。接下来就让我们进入极梦 ai 来生成首尾帧视频。我们将图片生成模式改为视频生成, 接着上传我们的首帧,然后上传我们的尾帧。在提示词方面,我们可以描述放大镜略过符号逐渐聚焦,变得清晰可见。写完提示词之后,我们将视频生成模型改为三点零,使用首尾帧串联。 分辨率方面我们使用自动匹配。视频生成方面,我们可以选用五秒。运镜方面,我们可以看到系统为我们提供了预设的运镜镜头, 大家可以根据自己的需求进行选择,这里我使用无。可以看到首尾帧生成的时候,在五秒的视频时长下也是十点几分,我们来生成看一下效果,我们来看一下生成结果,在这个视频中我们可以看到首尾帧的过渡非常的自然协调,特别是人物手中的放大镜, 在照射符号的时候变得清晰锐利。我们将这个视频进行下载好了,通过刚才的首尾真身视频,让我们知道了这个功能适用于元素渐变的过程, 使元素过度自然斜接。那么接下来我们继续介绍智能多帧。智能多帧的核心逻辑就是当你需要一个角色完成一系列复杂的连贯动作时,你可以提前准备好动作分解的关键镜像图, ai 会在此基础上补全全部的中间动作, 我们来尝试一下。还是以这个短片为例,我们来制作侦探从门口走入房间,接着在书桌前坐下的连贯动作,来看一下我的具体操作。 首先我们需要一张侦探站在门口的照片,为了保证生成的人物角色和场景的一致性,我们先截取一张场景图,接着我们截取一张人物的角色形象照。 首先我们来修复场景图,我们将场景中这只白手套的人物手进行删除。提示词我写的是删除这只手只留下背景图片,还是选用四点五 比例,选用十六比九。我们来生成一下,这样我们就得到了一个场景,我们将这张场景进行保存,接着我们上传这张人物和这个场景,我们对图片进行调整。这里我们可以选用抠图将人物进行抠除。 需要值得注意的是,我们并不需要这张信件,所以使用橡皮擦将它擦除,只剩下主体即可。然后我们点击确定按钮将人物抠出之后是为了避免跟后面的场景形成污染,我们点击保存。 接着我们来写入提示词。我这里写入的是二十年代的英式庄园书房走廊长而笔挺,两旁是深色的橡木护墙板,墙上挂着油画和家族肖像。 图片我们选用四点五,我们点击生成看一下效果。看起来生成的效果还不错,我们点击下载。接下来我们用同样的功能得到了其余的两张图片。我们来看一下这三张图片。第一个是人物从门口走进,第二个是人物站在了书桌前面,第三个画面是人物坐了下来。 接下来我们将利用这三个图片来进行智能多帧的演示。来看一下我的具体操作。可以看到我已经将三个图片进行上传,并且在每个图片的运进窗口处填写了描述词。第一个图片我写的是身体向前,手部特写,白手套握门把手开门。 第二个我写的是拉开椅子坐下。第三个我写的是仔细阅读信件内容。视频模型方面我们继续默认,这一次我们使用的是视频多帧。 分辨率方面我们选用自动匹配生成,时长方面这里默认是十秒。我们来看一下生成画面。这段视频从人物进门到人物坐下之后观看信件。流畅度上面取决于我们准备的近图在姿态透视上面是否足够连贯。如果你觉得这段视频不够流畅, 这边可以建议你保存下来之后在剪映里将它们分开调整,特别是人物坐下后拿起信件的动作,我们可以在剪映使用倒放功能来进行调整。讲完了智能多帧之后, 让我们来看最后一个参考图升视频功能,它核心是试图将两张不同的图片内容融合到一个视频中,我们还是以这个侦探片为例, 接下来我将继续使用这个侦探形象,让主角在调查完线索之后走出大楼,来到一个风雪夜的街景上,可以看到这边我使用了一个人物主体和一个场景,接下来我们就将这个人物主体放入这个场景中,我们回到视频生成页面,将智能多帧改为主体识别, 接着我们上传我们的人物和场景,然后我们输入提示词,我给出的提示词是男人走在马路上,接下来我们在提示词部分,男人的后面加上一个艾特,这样就会跳出我们的主体选择,我们选择主体人物走在马路上,马路后面再加一个艾特,接着将我们的主体场景放入, 我们将男人两个字删除,再将马路上三个字删除,这样就变成了男人主体走在了马路上。下方的模型我们默认选择三点零,使用的是主体。参考比例方面,我们十六比九视频生成,我们选用五秒, 让我们来看一下这次生成结果,从画面来看,人物和场景融合的并不是特别好,有一丝违和感,建议大家谨慎选用参考图生视频,这个功能可以使用其他的方式来生成视频。好了,那本节课我们就将这五个功能全部进行了讲解, 希望通过今天的学习,让大家对这五个功能有了深刻的了解,课后可以多多的尝试,期待大家的作品,那么本节课的内容再见! hello, 欢迎来到本节课程,我们今天呢将一起探索 ai 绘画在 ai 视频中的重要作用。 你可能会疑惑,既然我们是 ai 视频课程,为什么我们还要专门讲一下 ai 绘画呢?如果说现有的技术能通过简单的提示词来生成我们想要的画面的话,那我们是不 需要去学 ai 绘画来辅助我们的 ai 视频的。但是现在的 ai 视频画面还没有办法完全靠我们的提示词就能够达到我们想要的效果。那么说到 ai 绘画这方面,不知道大家对 ai 绘画的基础怎么样?我们以前也讲过很多关于 ai 绘画的知识, 希望大家也要下去看一看。一定要把 ai 绘画作为 ai 视频的基础来学习。那首先要有效的运用 ai 绘画,必须掌握提示词的基本结构,通常包含这六个要素,第一主体,比如人物或者某些物体 场景,也就是我们说的环境背景、光线,如晨光、黄昏之类的构图,比如说我们的视角和镜头的位置色调,比如说暖色调、冷色调、风格等等。那接下来我们再来看一下一致性的问题。 首先风格一致性我们可以通过风格参考,也就是 style reference 风格参考和我们详细的提示词来描述我们想要参考的这张图,然后在生成的图片里边去挑选我们认为 风格最像的图片。第二个呢,叫场景一致性,目前场景一致性我们有两大类的方法,第一类的方法我们通过实拍,但是这个比较耗费精力,我们参考实拍的场景,在图生图生成相似的场景,或者我们通过详细的提示词多刷图,选择你认为相对一致性较高的图片作为一个场景的一致性。 第三点就是人物一致性。人物一致性我们要进行一个人脸的参考,比如说我们上传了一张女性的图片,那我们再用详细的提示词去形容你想要的画面,那人物一致性的提示词呢?我们也可以通过大语言模型帮我们 以前设定好一个人物,就比如说我们给他了一个人物的描述,他就会记住这张女性的形象,当你下一次再让他换一个场景的时候,让他在纽约的大街上,那他给我们的提示层就已经附带上了这个女孩的外貌形象,那这样我们就达到了一个提示词的人物一致。 那我们拿到大圆模型,帮我们设计好的提示词之后,再加上人脸的参考,我们就可以得到相似的人脸了。那接下来我们再来说一下 视频中非常关键的一个知识点,叫做关键帧。关键帧我们首先先从手帧开始讲,其实如果对于没有基础的同学来说,这个知识点还是很重要的。首先是我们这一个画面的 第一张图片,我们其实知道视频其实是由一张一张图片组成的,对不对?一秒六十帧,也就是我们这个视频每一秒都是由六十张图片组成,所以说手帧指的就是这六十秒中间的第一 一张图片。那关键针的第二个知识点呢?叫做尾针。那我们有了手针的案例之后,举一反三,想必大家也知道了,对不对? 比如说像这张图墨水到了中间,我们人走到了中间,我们可以通过这张尾针去反过来生成前边的画面,这个就是尾针。那么中间针是什么意思?这个我们就没有给大家图片,我们可以来看一下中间针的意思,我们两个视频首尾结合 你的尾针和我的手针是一张图片,那他们两个合在一起就是中间针了,对不对?想必我们有了一些首尾针的知识之后,这个中间针也没有那么的难理解。 那我们现在玩 ai 视频的最常用的方法就是这一个首尾针,也就是说我们去控制他的手针和尾针,同时给我们跑出一个中间的动态就可 可以了。我们同时控制了手针和尾针,比如说这道光,我让它照在毛字上,下一道光让它照在台子上,这样它就可以从毛字慢慢的变到茅台的台字,这个呢就是首尾针。那好,那我们本节课就给大家讲这几个点,对于我们做 ai 视频来说是非常关键的。

下面呢,我们就为了更好的理解这个 cds 的 一个操作呢,我就根据官网的例子,然后做了一下实测,我们先理解他到底是怎么回事,然后你在自己用的时候或者实测的时候,你就会更少的出错,然后出来更好的一个作品。 他首先强调的是基础能力和多模态能力,那其实什么叫基础能力呢?就是以前的能力现在变得更强了点,能这么理解就理解了吧, 他官网上说的是物理规律,动作表现,指令理解,风格保持。这个其实我看都有点迷糊, 那我们来详细说一下到底是啥意思。所谓物理规律呢?就是衣服水啦,他会流对吧?以前可能容易穿膜,但现在不会了。我们下面有四个例子来说明对应的东西啊,比如说晒衣服,这个就是物理规律啊,这个是个猫的一个题词,看一下效果 对吧?那整个衣服的那种运动的感觉对吧?还有这个人,还有这个猫啊,它整个肢体,还有它身上的衣服,还有光影,真的你就完全看不出来任何的 ai 的 痕迹, 同理呢,三点五是以前的模型吧,我们也来看一下三点五的一个表现, 哇哦哇哦, 同一套提示词,那怎么样?现在你可以感受到差异了吧?第二呢,动作更加流畅,就以前动作会乱走。嗯,有这个经历的人可能都知道,我们说可能画面不太稳定,一眼 ai 可能就是因为这个。这个 例子应该很多人都看过了,就是说这个蒙娜丽莎或者一个画像,他去啊套东西这样的一个事情,我们来看一下。 嗯 哈,基米套餐不可不偿,中间也是一个小 bug, 但是基本上看着就没有问题了,想修一下就行。 这边你可以做很多宣传,你可以宣传你任何的产品,真的你能想到了产品,甚至哪怕是一桶漆,或者是不仅是吃的,甚至是用的螺丝刀都行,就你找到一个对应的梗就可以。 最恐怖的地方就是这个,它是一次过的,就你不用做很多抽卡。 我们来说一下指令的更理解的一个精准性啊,这边是一个女生对吧?限稿型的,这个也是取自于官网的一个方式,只是我换了一下人物和背景, 我们来看一下,先看一下提示词,镜头会先拉远,然后看全景,然后并且跟着这个女主开始移动,然后女主的裙摆会摇摆,然后有一个车经过,会把它这个衣服给吹起来。我们看一下效果, 对,这种先搞的话,以前大概率会出错的,你可以看到它确实是升级了很多。 下面就是打斗了,其实打斗和这个转场是一样的,就是我们要模拟另外的一个世界的一个东西,看它会不会保持这个风格和保持它的动作变形。那这边也是一个稍事风格的一个图片,我们来看一下效果,简单来说就是说镜头先跟着女子跑,后面有的人在追她, 然后镜头上转为侧拍,然后他撞到了水果摊爬起来了,我们来看一下, 注意看结尾,就是转过弯以后,他整个风格的效果,还是这种上市风格电影的效果,并且只看人,还有这个物理规律。其实我还做了其他的测试, 就是后面追的人他也不会变,我后来有个镜头就是人追上他了,结果回到第一针看,那个人就是第一针的那个人就是很稳定 好,这是他的基础能力。我们来看一下多模态,多模态我们还没有圈呢,对吧?我们现在只是说一个图片加一句话,这种能力我们来看一下圈,这次才是真正的一个核心。他所谓的视频创作自由时代,其实就因为这个多模态, 所有的素材都可以参考,只要你能标清楚每个素材是干嘛的。他提供了一个万能公式,我一看有很多博主就这个万能公式出了很多的 课,对吧?像我上次发了一个图文,很多人说那个是 ai 做的,没错,那个就是 ai 做的,我自己都很少看的,可能觉得时间里边可能会更好一些。呃,简单来说可能这个比那个要有价值的很多很多很多。 那个 ai 出的可能就是我对他的理解,加上 ai 帮助我出了一个文档。这个是纯实践的,还是再次提醒, 素材多的时候一定要去检查这个艾特对没对?不然我们一次现在的成本太高了,你要等很长时间才能知道。错了。没错,官网呢,是给了十个能力的子项,他讲了十个能力,其实我觉得可以分六个能力就够了。下面我们来说一下六个核心能力到底是什么。 第一个就是基础的核心能力,一张图加唇纹的起步就是我们上面看的基础能力嘛,我们可以再看一下其他的一些案子,但是方式是一样的,就是最基础的,适合所有人。 呃,特别像我那个好朋友啊,默默问我,我们怎么去做一个煎饼,回头我会告诉他怎么做,估计他看到这他也会了。 嗯,很简单,你就给他一张图片,然后呢?如果你不想写提示词,你就把对标的那个视频传给 c d s, 然后 c d s 就 知道怎么做了。或者你想把那个 煎饼换成包子,他也知道怎么去做。我们这里面简单说一个人物的例子,就是这个人,他下班儿走在这个走廊里面,然后可能下班儿比较累吧,然后调节一下情绪,回到家看到家人变得很开心,有这样的一个剧情,我们来看一下。 回来啦,爸爸,哎,你俩怎么知道我回来啦? 稳定性,还有这个声音,还有这个物理动作真的很棒,真的,它完整了,完成了所有体式词的内容,而不是一个单词,并且你看到这个狗狗啦,还有刚才这个小球儿, 他所有的情绪变化和其他的相关的变化他都有,还有深呼吸,还有转场,这个转场真的很自然,掏出来钥匙,然后开门,然后镜头啪切到里面往外去拍, 这个就很好,你看我们也没有这样写,但是他会自动补全这个内容,还有这个氛围,我们也没有写氛围,但是他补全的很好 啊,这是基础的一个用法。这里面再给大家提一个概念,叫连续动作描述。什么叫连续动作描述呢?就是说我们这件事情它有一个先后顺序,先干什么,后干什么,然后再干什么,具体节奏呢?是由 ai 来分配的。 下面我们说另外一种事情,叫分时间段秒数,像一般做短剧或者做剧情,或者是那种分镜格的时候,可能会用到这个,他会精准的控制在每一秒的时间段会发生什么。我们再来看一下他的提示词形式,就是几秒到几秒干嘛,几秒到几秒干嘛。 我们来看一下这个,这个简单就是说男生叫女生起床的一个事情, 大小姐该起床了,真拿你没办法。 对,再看一下时间,就是他就根据这个时间完美的导演了这样的一个一个小片 啊,这边是对应的一个题词啊,简单来说呢,两个区别是什么呢?连续动作就是你告诉模型发生了一个什么样的事,具体几秒干嘛,几秒干嘛,模型来决定。这种不是说不好啊, 而是说他现在已经很棒了,但是有一些高手,或者人家有这个导演经验,或者以前做比较多,人家的经验很丰富的时候,人家可能更喜欢用分时间段来描述,就告诉我模型第几秒发生了什么 啊,不用特意去学分时间段描述,这个目前绝对够用,如果你一定要去学的话,也不用想的那么复杂,我下面所有的题词 都可以告诉你怎么去用这个分时间段描述,因为我加了一个限制,当你要求的时候,他就会这样给你描述,把这些事情呢交给 ai, 所以 ai 评权呢,不是让 ai 给我们搜个资料,而是我们有一个念头,让他去给我们达成这个念头。 好,我们来说一下选择,如果你的镜头很短,就是五秒到十秒,还是个单镜头,动作简单,你就用连续描述就行。如果是多镜头,特别是跨两个镜头的时候,最好还是用分时间段描述会好一点。这个呢,下面就很重要了,就是在做短片的时候,最容易出的问题是什么呢? 一个篇他时间很赶,就有人说话很快,很多动作都一晃而过了。这个肯定不是模型的问题,而因为我们在一个时间段要求了太多的内容,太多的动作,模型自然就会以完成我们的目标为优先吗?这样他就会很赶。所以这部分我建议是 记一下,如果是四到五秒,就一个固定镜头,一两个简单动作啊,可能适合这种动作展示,然后用连续的描述就可以啊,但是下面这就不具体,这就不具体念了,大家来看一下就行。简单来说就是三到五秒安排一个镜头,一两个核心动作不要太多。 如果在三到五秒安排了三四个啊,真的就很拥挤,并且很容易出错,但如果塞太少呢,他就会空洞。这面我们来举三个例子,一个是五秒的镜头啊,就以这个女性的 vlog 为主。我们来看一下具体的效果。 我们再来看一下两个镜头和三个动作的,这里面就是他在看书,然后听到门铃抬头,然后走到门口,我们来看一下大概的一个效果。 我们再来看一下十五秒的,这个就需要用这种分时间段的写法了,就零到三秒,然后十三到十五秒到底在做什么? 因为它跨了太多的镜头了,我们来看一下最后的一个效果, 其实也可以看到它的 bgm 啊,就背景音乐。呃,如果我们只为了做一个十五秒的话,你看这个片段里面的背景音乐,它真的我认为是可以的了,但如果你跨十五秒,我们做延伸的时候,或者是我们做两个视频的时候,这个时候真的要考量一下, 这里呢?还是再说一下注意事项,四到五秒呢?千万别浪费在剧情上,因为他只适合做一个单独的一个瞬间,十秒,其实性价比比较好的一个时长,他一个讲一个小故事,但是又不至于太单调,也不至于控制不住, 就十五秒这个事情还要慎用的,当然你如果用九宫格或者是六宫格,这个可能有很大的改善。这里还有一个事项,如果你做的是华丽的打斗动作, 那么你一定要提前规划好一套动作的编排,或者我们换个思路,你不要写提示词,你感觉谁的动作好,你就让这个西当子参考一下,艾特他参考一下这个视频的打斗动作,这样可能是最简单的,他真的他不需要你有这个编导能力了,你直接 看哪个片好,你让他去学就行了,或者让他去参考就行了。现在已经不是学了,是只参考,这是核心能力。二就是运镜和动作的复制,简单来说就上传一个参考视频,对,让另外一个人去学他这里面我生成了一个利息二十七元的一个美女,这边是人家 这是一个很好的武打的一个动作, 那好,那我们就让这个人去模仿这个动作来练一套独孤九剑。这边的题词就很简单,对吧?将视频一的人物换成他,然后模拟,并且增加一些二次元的特效,他的特效也特别多,这个真的很不错。 然后我们来看一下效果, ok, 你 感觉怎么样?以前呢,其实有一种动画叫火柴人,啪啪啪啪打那种,我其实也是蛮喜欢这种形式的,我们来看一下片段, 这个是我认为最复杂的了。然后最近呢,我就做了两个人物, 一个是这样的一个机器人,另外是一个卡通人物,让他试了一下。实话来说呢,没有人家这么好,但是我觉得看个新鲜也是可以的,开开脑 洞, 没有那么出彩,但是以前这种事是想都不敢想的,现在可以想一想,后面呢,有兴趣我就再去多研究一下。我觉得理论上是可行的,可能就是我在某些描述上是不够精准的, 这里就要给大家分享一些失败的经验了。就是虽然我知道它本身是有一些视频挑出的限制的,但是我还是犯错了,会有两个错,第一个视频上传的总时长,这个一定要提前规划好,在那个剪映里去剪辑好,想好你要用多少,它最大不能超过十五点四秒。 第二呢,就是一下我传了很多次的素材尺寸过小,我已经是最低的分辨率了,然后大小肯定很小,但是就是素材尺寸过小啊,后来我知道是为什么了, 它不光光是大小,这里面的所有的参数它都和它这个素材大小有关系。所以给大家这里做了一个分类,分大四大类。然后视频的基础,视频的编码还有其他 分辨率呢,就和官网一样,要用这样的一个四零八零 p 或者是七二零 p 格式呢,就是 mp, 四帧率呢,最好是三帧。这里要注意了,视频的编码,还有视频的码率, 还有这个音音频质量,音频彩样,还有色彩空间,最好按这个范围来。这个是测了几次得出来了, 这个片上传的时候我用的是这套参数,这里要注意音频的质量, aac 二五六,我就是在这里出的错,所以一直在传了几次没传好啊,最后也知道为什么了。 下面就是复刻了这个官网文档,里面有可能人家做的更好,然后很多博主也分享过。简单来说呢,就是说参考一的视频,就参考一的视频的什么什么什么参考二的视频的什么什么结果啊,怎么怎么样,大概就这样,看一下视频一 啊,看一下视频二 这里。其实现在在看这个题时,我觉得我还是有点问题的,第一,我没有写音效的事情,其实音效应该也参考视频一的。第二,我说参考这个视频二的转场,但是我没有描述转场是哪一个,它其实有两个转场,如果加上海洋的时候可能会更好一点。我们来看一下这 对问题就存在于这两个,它的这个背景就前面人家是在这是个地铁里边吧,我也没有去描述, 有些还是有缺失的,或者说我们不应该说描述,我们应该给他张图片,告诉他你就在这里去参考视频一的运镜效果和这个音频,它可能会更好一点。下面来说一下九宫格,就是他自己可以理解这样的一张截图它应该怎么去? 呃,串,包括里面的文字,文字都不用手敲了,只要你的这张图里面有这种文字,它就可以自动读出来,并且串起来每个镜头之间的关系, 那就给他张图,然后告诉他将图一从左到右,从上到下这样的一个顺序来演绎啊,保持人物说话的台词和图片一致。我们来看一下效果。 我是靠手吃饭,现在在屠宰场杀猪呢,我现在靠脑吃饭,是一名数据分析师,我现在是靠脸吃饭,什么?马古,你现在靠脸吃饭,真的吗?洗面奶了解一下? 对,可以看到它这样的一个效果。当然我们也说测试嘛,就我们缺什么呢?其实缺个 bgm, 我 没有做 bgm 做任何的 加入,所以他加了一些音效。这里如果我们能给一个参考,参考一个视频,参考他的一个风格和参考他的转场,或者参考他的背景音效,肯定效果会更好的。官方文档那里是有一个参考的。 我们再说这个视频延长,简单来说就是你接着现有的视频继续拍,或者在两段视频中间会有一个内容,直接在视频一和视频二里面加什么内容。要说一下,这里我的测试就是什么呢? 第一,你要明白延长视频的时长选的是你要新增多少,而不是总时长。比如说你有一个十秒的视频,你想延长五秒,那就是五秒,而不能写成十五秒。另外呢,无论是往后延伸或者往两个视频中间加内容, 一定要用提示词去描述,不然出来的结果呢,可能就不太好。像我们有上最上面那个视频啊,美女拖鞋的那个视频,他其实就是自动延出来的,就就没有什么剧情的感觉了。 这里我们就来去看一下官方文档吧,这个我没有实际去操作,这段是二点三五这样的一个视频,我们就从他的文档里面找到二点三五看,都有对应的视频延长, 还有他的题词,这是他的题词的具体写法,你看官方文档,其实写的比我写的还详细,人家参考了哪个图片,这个毛驴骑着车,图片二也是毛驴骑着车,然后人家是这样说的,延长十五秒。视频参考图片一和图片二, 然后这是画面的一个具体描述啊,我们来看一下原视频啊,这是第一段视,简单来说就是一个驴在一个仓库里发现了一个摩托,下面是它延伸出来以后的视频, 下面还有很多很多案例,真的非常强大,非常建议去读一下官方文档,你可以看到有很多凌晨一点多了,还有一百多人在学习, 并且他官方文档是支持评论的,你可以在里面看到任何人对这件事情的理解,或者是他的一些坑的一些分享,同理的音化同步。比如像我们说的,你可以去用多种语言,包括中英俄啊,任何语言包括方言, 还有配乐,写法也很简单,就去圈就行。这里对应的是二点三六的一个官方文档,也举了很多的例子,比如像我们常见的猫狗吐槽直播间,以前也是用节目做的,对吧?可能要去配音 啊,现在就不需要了,他只要说一段这样的词就行。我们来看一个豫剧的吧。啊,豫剧的经经典的一个桥段,这是一张参考图,这是他的题的词,我们来看一下结果, 刀对桥,真凭实据,你赶不着, 且慢。这个第一个案例确实是把所有的东西都参考到了,我们看一下它参考了视频一的一个鱼眼的镜头, see dance, it's full of magic, 好 让视频二中的马看向了鱼眼镜头, 还参考了视频一中的说话的动作,还有背景音乐。看,注意这种用法啊,艾特这种用法啊,我们来看一下结果, one, two, three, four five, once, i catch a fish alive 是他那种说话的方式吧,对吧?还有对应的一个 bgm, 还有这个马的一个形象,这里呢,唯一要注意的地方就是你上传的时长,一定要注意它有总时长的一个限制的, 所以呢,你要注意好这个事情啊,就行了。这个就是很让人很吃惊又很无奈的一个事情了,就是视频的编辑能力, 就是你有一段视频你不想去重新改他像以前做那种甄嬛传或者是曹操恶搞那种视频,你都是需要去先用图片转会一下,然后再生成一段视频再去拼接的吗?现在就不需要了,就是会让你颠覆原剧情。 好,我们下面呢,具体来也是看一下官方文档,这个就没有再去,我们接下来看吧,就是视频颠覆,视频一的句型,你注意啊,要加这个颠覆两个字,他就才会颠覆。如果你直接写后半段的话,效果不会太好, 就原先可能是温柔的,结果现在呢,变成这俩人吵架了。我们先看一下原篇, 这月亮真美,只可惜不能与你一同赏玩,只要与你在一起,哪里都是美景,很恩爱的一个画面。我们再来看一下修改后的结果,我会保护你, 你从一开始就在骗我,这是你欠我家族的, 对吧?就这样的效果,整个人物也没有动,也没有改。这呢我就简单说一下什么就是说你要理解他,不是我们理解的意义上的去编辑了这个视频,而是又重新生成了一遍。注意这个概念就行, 就任何你的个调整都要去重新生成一次的,和我们以前在剪映里面手动剪还是不一样的,就任何一次编辑也是一次重新的生成。

咱先聊聊字节跳动的 c dance 产业链,这玩意儿可太有意思了,你是不是好奇,一个 ai 视频模型能牵扯出多少门道来?咱们掰开揉碎了说。 首先得说说 c dance 二点零,这是字节旗下即梦 ai 搞的新一代 ai 视频生成模型,号称地表最强 ai 视频工具,能一键生成视频,大大降低视频制作成本。就问你这波操作牛不牛? 那围绕它的产业链都有哪些玩家呢?咱们从下游应用开始唠。你想啊,做内容的最缺啥?不就是 ip 吗?有了海量 ip, 再结合这个模型,就能快速把 ip 做成 ai 短剧,实现内容变现。先看掌阅科技,字节还持股百分之七呢, 它有百万级 ip 储备,是首个进入模型的企业,旗下平台做 ip 慢剧制作成本直接降了百分之七十, 周期缩短到三天,还能二十四小时不间断上线,你说这效率是不是绝了?再看中文在线,他握着国内最大的小说版权库,有五百六十万小说 ip 呢。接入模型后,小说能一键转,短剧制作成本大幅降低。而且他和字节红国短剧深度合作,按播放量分成 春节档十部 ai 短剧播放超五亿。这波流量变现玩得真溜,荣幸文化呢,深耕童书一九年,有海量儿童绘本 ip。 他 和余河文化合作,接入模型,开发 ai 漫剧,借抖音流量分发,实现付费加广告双重变现,单部爆款短剧流水能到千万。 你就说这儿童隧道是自结营销核心合作伙伴拿了三十三亿授信额度, 布鲁 ai 深度接入模型后,营销视频生成效率提升十倍,成本降了百分之七十,还承接了春晚 ai 营销, 赋能虚拟人苏小妹和短剧业务,这营销玩的是不是很上头?引力传媒也很厉害,他是字节巨量火山引擎双认证的核心代理商,还有 tiktok 运营牌照字节系收入占比超百分之五十。 接入模型搭建 ai 创意中台后营销、视频制作成本大幅降低,还能赋能短距营销和出海业务,这出海和国内的生意都没落下。 聊完下游,咱再看看上游基础设施。你想啊, ai 模型要用不得消耗大量算力吗?那给字节提供算力支撑的企业可不就有机会了吗?润泽科技是字节最大的 a i d c 供应商, 和字节签了五到十年的长期算力合同,访访平湖智算中心,承载着核心算力,按 gpu 用量收费,随着模型规模化商用,它的算力收入那不得爆发式增长? 浪潮信息是字节 ai 服务器核心供应商提供的 n f 五六八八系列 ai 服务器,支撑大规模推理训练,还拿了字节四十八亿的大单排产到二零二六年 q 三, 这订单是不是很扎实?中科曙光和字节深度合作,提供 ai 算力服务器与液冷服务支撑,训练推理 ai 服务器收入占比超百分之三十。液冷技术,这在算力领域可是很前沿的。网速科技是字节核心 c、 d n 供应商,在全球有超两千八百个 c、 d n 节点, 有 ai 视频低时延高并发分发技术,承接海量数据分发需求,贷款利用率和单价同步提升,这数据分发的活儿,它是行家。最后聊聊中有给模型提供工具的企业, 他们集成到 cds 模型里,跟着模型赚超额收益。海天瑞生是字结合芯多模态训练数据供应商,自研 ai 预标注加人机协调平台,有二十年多余种跨领域数据积累,为模型提供高质量视频语料素材,数据标注与处理,业务量激增, 这数据可是 ai 模型的粮食啊!德才股份旗下,其享无限和火山引擎共建漫剧 ai 公访,获得模型与算力双重授权,向 b 端提供服务,绑定红果短剧,形成生产、分发变现闭环,是 a 股唯一深度嵌入字节 ai 生态的企业。 这生态嵌入是不是很有想象力?万星科技是全球视频创意 size 龙头,自研天幕二点零大模型及 wes 引擎旗下万星喵影深度集成 cds 二零插件,按调用量及订阅分成,毛利率高达百分之九十二。 这个视频创意工具是不是很给力?你看,从下游做内容变现,到上游提供算力支撑,再到中游提供模型工具,整个 cds 产业链环环相扣, 这些企业各自在自己的领域发挥优势,共同推动着 ai 视频产业的发展。是不是觉得这产业链挺有意思的?以后再刷到 ai 短剧、 ai 营销内容,你就知道背后可能有这些企业在发力了。

极梦的 sedance two 点零到底在技术架构上面做了哪些升级?然后为什么会导致这个算力消耗有这么大的变化?嗯,这个 model 它是用上了这个双分支扩散 transformer, 然后它可以让这个视觉和听觉的信息同时去生成,所以它的这个音画同步啊,是比以前好了非常多。 同时呢,它的这个输入也不再是单一的文本了,它可以同时支持文本图片、视频和音频一起混合的输入,最多可以一次塞进去十二份参考素材,听起来就复杂了很多。对,那是不是说这个画质和这个动态效果也有很大的提升?对,没错没错,就是它可以直接输出这个二 k 甚至四 k 的 这种 电影级的这种高清的视频,然后也支持这种复杂的运镜啊,和这个更长的这种连贯的内容,所以他的这个每一帧的细节都变得非常的丰富啊,那所以这个算力的消耗自然也就成倍的往上涨啊。对, 这是一个从各个维度都往上涨的一个升级。具体的讲就是说这个极梦的 cds 二点零在算力消耗上面和这个推理的速度上面跟一代相比到底有多大的变化?就是这个新版本它生成这个二 k 的 视频,虽然说它比一代要快了十倍,但是它每一单所消耗的算力是五到八倍。 对,那如果是说你要生成这个一分钟的这种四 k 的 视频,那他的这个算力的需求就直接飙到了堪比上千次的这种文本对话。所以怪不得大家老觉得说这个东西怎么跑的这么慢啊?对,就是因为,呃,这个二点零的这个推理的步骤从三十步变成了最多八十步, 然后呢,这个单卡单任务的这个时间也从秒级变成了分钟级,再加上这个多模态的这个信息啊,还有这个高分辨率的这个 tokens 就 非涨啊,就十秒的视频可能就有四十万 tokens, 那 如果是说这个复杂的场景可能甚至能上百万,那这个算力的需求就是 暴涨,对,暴涨,就说现在这个极梦的 cds 二点零在实际使用当中,这个算力的压力到底有多大?就这个春节之后啊,这个平台的日火用户涨了三倍。然后呢,这同时在线的任务经常过万, 就是免费的和普通的用户基本上要排几个小时才能等到你的这个任务被执行。哦,怪不得大家都在说这个排队排的让人抓狂。对,不光是这个呃,二点零,还加了这个三重的这个合规审核,这个审核也占了整个盛盛时间的三分之一。 然后呢,这个平台为了去做这个算力的隔离,就会员和非会员的这个等待时间能差出好几倍,所以就是说这个,呃,全球的这个 ai 视频的这个等待时间能差出好几倍,所以就是说在今年的一季度也是暴增了两倍半, 就是整个行业的这个压力都是非常大的。我们现在来进入第二个部分啊,就是聊聊用户和市场的双重压力。嗯,那我们第一个问题就来了,就是这个春节之后啊,这个极梦的 cds 二点零到底用户量增长有多疯狂?就是春节假期结束之后啊,这个平台的日火用户 直接翻了三倍,就因为这个电影级的这个可控生成的这个能力啊,吸引了非常多的新的用户涌入啊。然后这个 普通用户呢,想要生成一个十秒的视频,他的等待时间从春节期间的几分钟,直接就变成了三到八个小时。哇,这个跨度也太大了吧,那是不是高峰期的时候根本就抢不到位置?对,没错没错,就是高峰期的时候啊,这个排队的人数经常破万。 然后呢,这个二点零刚上线的时候,甚至有用户反映说这个他前面有十万多人在排队。哦,天呐,那就是不光是这个个人创作者,还有很多这种广告公司,短视频团队,他们也都来了, 一下子就把这个系统的这个压力就顶到了极限。现在这个全球的这个 ai 算力的供需到底是一个什么样的紧张程度啊?就是现在这个需求是暴涨啊,就因为这个多模态的这种大模型,像这个 cds 二点零这种出来之后啊,这个 ai 视频的这个创作一下子火了,然后大家都要这个高分辨率的大模型训练,所以这个算力一下子就 被大家抢的特别厉害,所以说就是这个东西是供应根本跟不上是吗?对,没错没错,就是 gpu 也好,还是说这个数据中心也好,他的这个扩建都是需要时间的嘛?对,所以这个 就硬件和能源的这个限制,就导致了这个算力根本就涨不上来,然后再加上这个全球都在缺这个 gpu, 所以 这个 token 的 价格也是水涨船高啊,就是大家这个整个行业都在抢这个资源,所以就导致了这个很多平台,包括我们吉梦的这个生成速度也是明显的变慢了很多, 这么多人挤进来,然后又赶上这个算力这么紧张,那吉梦到底遇到了哪些难题?就我们的后台是一直处于这种满负荷的状态嘛?然后呢,这个任务的积压和这个审核的积压,就导致了 这个普通用户和免费用户基本上是寸步难行啊,就是你可能排一天都轮不到你,甚至连这个会员的这个插队的这个加速都不是很明显了,怪不得大家老说这个体验感变差了。对对,没错没错,就是大家等的时间久了,然后就开始在社交上面去吐槽,这个平台的一个口碑也是波动比较大, 有一些人就干脆就去倒卖这个会员资格。平台一边要扛着这个算力的成本,一边还要安抚用户,一边还要想办法去解决这个技术和这个市场的双重的压力,所以就非常的有挑战性。那咱们现在就来聊一聊大家最关心的这个未来的曙光啊,就是这个速度和质量的平衡到底怎么修复。 那第一个问题就是接下来这一两个月极梦平台到底会怎么来缓解这个升成慢的问题?就是马上平台会有大量的这个高端的 ai 服务器进场,嗯,那 仅二零二六年就会新增十几万台这种服务器,并且它是专门为这个视频生成做了优化的啊,那整个这个夜冷的比例也会提升到百分之八十五以上啊,那这个就会让整个这个集群的这个性能会有一个质的飞跃 哦,那就是说这个硬件升级是可以期待一下的,对,但除了这个之外还有什么比较有效的办法吗?有啊,就是平台会上线这种模型的蒸馏的版本啊,就是会有这种 大模型的这种精简版啊,那他会在保证一定的质量的情况之下啊,然后大幅的提升这个推理的速度,同时也会支持这种灵活的这个快慢的切换啊,就是你可以选择我要质量还是我要速度啊,同时这个任务的调度也会做的更智能啊,包括这个审核的流程也会做一些优化, 包括这个会员体系也会做一些调整啊,比如说这个积分的发放啊,包括这个错峰的这个使用啊等等吧,就是让这个资源能够 尽量的合理的分配。那你觉得就从现在开始往后推三到六个月,整个这个 ai 视频的这个算力的瓶颈会怎么来被打破? 就这个期间,我觉得首先就是芯片的这个供应会逐步的恢复啊,那包括这个云厂商也在大力的去扩建 这个新一代的这种制算中心啊,所以这个总算力肯定是会有一个明显的提升的,所以说就是说基础资源会变得充裕一些,对,没错。然后同时呢就是这个 硬件和模型的这个协同的设计也会成为一个主流啊,就是大家会有一些存算一体啊,包括这个光互联啊等等的一些新技术会落地啊,也会有 这种快慢的模型会同时存在啊,大家会有一个呃,根据你的需求来进行一个分级的服务啊,包括整个这个行业的标准也会越来越完善啊,整个这个 生态会越来越成熟。就说如果是我们作为普通用户,现在想要在这个极梦的这个平台上面更快更顺利的去生成自己想要的内容,有什么比较实用的小技巧吗?其实有几个方法还挺好用的,比如说你可以避开这个晚上的高峰, 然后去选择在凌晨或者清晨的时候去提交你的这个任务,还有就是你可以把你的这个视频拆分成几个比较短的片段来分批的生成。 再有就是你可以啊尽量的使用一些比较简单的提示词和比较少的这个参考素材啊,也可以优先的去选择这个一零八零 p 的 这个输出啊,再有就是你可以成为这个会员啊, 利用会员的这个加速的权益啊,最后就是你要随时的关注平台的这个公告啊,合理的去规划你自己的这个创作的节奏啊,这样的话你就可以 既提升了效率,也不会错过一些新的功能,好吧,哈哈哈。今天我们跟大家聊了这个关于吉梦的这个 cds 二点零为什么会这么慢的,背后的原因啊,然后也给大家带来了一些实用的小技巧啊,也跟大家展望了一下这个行业未来的发展,希望对大家在使用的过程当中能够有一些帮助啊。