粉丝3.2万获赞6.5万

当国内互联网大厂还在拿着旧地图通过发红包抢占用户心智时,新一轮的战争已经在更高维度打响。一边是来自硅谷的 anthropic 上周用 cowork 血写了软件行业,一边是北京的字节用 cdance 二点零颠覆了全球影视行业。这里是财经乌多邦,今天我们就一起来看看,这两家公司到底是怎么 餐桌子的。 上周, ai 在软件业引起了一场腥风血雨,甚至有人直言 sars 行业已死。短短一周,全球软件股蒸发了八千三百亿美元, 大概相当于三个茅台的市值。事情的源头是一家叫 anthropic ai 公司,他们在今年年初一共做了三件事,而且一件比一件狠。第一件呢,是他们在一月十二日推出了一个叫 cover 的工具。和传统 ai 不同,他不再只是回答问题,而是替你执行任务。但是这个工具发布后,没有 引起太大的动静,真正引爆华尔街的是他们做的第二件事情。一月三十日,他们发布了十一个专业的插件。注意,这还不是新的模型,仅仅是十一个新的插件,他们直接统领了财务、销售、法律各行各业。其中最先引起关注的是他在法律专业上的能力。 这里交代一个背景哈,很多律所的工作模式是法务助理加上专业软件。比如说你是一个律师事务所老板,你的律所每天要处理大量的合同, 怎么处理?你得雇一个法务助理买一套专业的软件。比如说唐僧路透的 yslo 软件,他一年的花费大概是五万美元。然后这个助理每天的工作是在这个软件里面查条款,审合同,标注风险点,写合规报告。 现在呢,装这个 ai, 配一个法律插件,后台就可以全自动的审核同标风险,出报告,每月只要一百多刀,从五万的成本直接降到了一百多,这是破天荒的第一次。一家做底层模型的 air 软件,把应用层直接端掉了,并且接管了整个业务的工作流。那现如今呢?整个华尔街陷入了恐慌,并宣称 sars 末日真的来临了。摩尔大通也发文称, anthropic 正在吞噬整个世界,让 sars 商业模式坍塌,且无数可逃。 很快很多人就意识到了不对啊,既然 ai 能够取代法律软件,是不是也能取代其他的软件,比如说金融分析、销售管理、客户支持呢?要知道,传统软件服务行业一共有三大支柱,现在这三大支柱全都面临着巨大的冲击。第一根支柱呢,是按席位收费。 以前一个公司有一百个员工,就得买一百个软件账号,每个软件一年得几千美元,你用不用都得交这笔钱,这是萨尔斯公司最稳定的收入来源。但现在呢,可乐的智能体能把这些专业的软件的活直接干了,而且可乐的不是按习收费,是按照使用量收费,这直接击穿了萨尔斯的商业模式。萨尔斯行业的第二根支柱呢,是 复杂的操作界面。以前软件公司会把界面设计的很复杂,因为复杂的界面能够形成壁垒,用户的学习成本太高,不容易换软件。但现在呢,告诉我,你根本不需要在后台看界面, ai 会自动帮你在后台干活,你只需要告诉他,帮我省一下这份合同,然后等待结果就可以了。第三根支柱呢,是功能的封闭性。 以前软件公司会把功能封闭起来,形成自己的生态。就拿作图软件来说,每个绘图软件都有自己的工程文件,而且其他软件是无法识别的, 你要用这些功能就必须待在他的生态里。但现在呢, cloud 通过一个叫 m c p 的协议,就能够接入各种外部工具。什么叫 s c p? 就是模型上下文协议, 简单说就是一套标准化的接口,让 ai 能够像人一样看到一个新工具,自己琢磨怎么用。这意味着 ai 不需要待在各个软件的生态系统里面,它能够自由的调用各种工具,哪个工具好用用哪个,不存在被绑定的问。 所以你看, sars 赖以生存的三根支柱被全面冲击,这不是简单的优化,而是深层意义的颠覆。所以在 cowork 推出专业插件后,软件股一路暴跌,于是就有了新闻里说的 ai 学习软件业的说法。 但是到这一步还没完,还记得前面说过吗? anthropic 一共做了三件事,现在只收了两件,第一件是推出了工具 cowork, 第二件是上线了十一个专业插件。假如说这两件事情让软件行业一夜入冬,那么第三件事情就是雪上加霜了。第三件事呢,是二月五日推出了 coloordos。 四点六,这是一个新版的基础大模型, 前面说的 cowork 还有专业插件都是在这个基础模型上运行了。说白了,前面的改进是让 ai 更会干活,更懂专业流程,而这个基础模型的作用是让 ai 从根本上更聪明。而且要知道,前面讲的很多事情还只是 anthropic 一家 ai 公司掀起的波澜。这还不算 open ai、 谷歌这些 其他的 ai 巨头,假如说这些 ai 巨头一起行动,对软件业的冲击只会更大,这也是为什么软件公司的投资者会在上周那么的悲观。 接下来呢,我们聊聊字节。最近 say dance 二点零是一个强到令人害怕的模型,没有用过的朋友们呢,可以看一看影视剧峰 team 的最新一期节目, 在节目中做了一个测试,他只上传了一张自己的照片,没有任何音频的输入。结果那个 cdance 二点零生成的视频里,那个数字 team 开口说话了,而且用的是 team 本人一模一样的声音, 说明 team 的生物特征数据,无论是长相还是身文,早就已经被未经 ai 模型了。而细思极恐的是,不仅 team 在训练库里,会不会只要在抖音发布视频的人都已经成为了这个超级模型的一部分了,如果这个功能被滥用,后果不敢想象。这个事件风波呢,也引起了 cindance 二点零下架了支 是真人人脸的功能。除了舆论风波, c 的二点零之所以引起这么大讨论的原因,主要还是因为能力的大幅优化。首先是一致性的问题,过去做 ai 视频最大的痛点是抽卡,同一个角色换个镜头就换了张脸,而字节似乎完美的解决了这个痛点。 大家可以看到,无论是大特写还是远景,这就是同一个人,菜就多练。除了一致性的问题, 很多 ai 模型最让人头疼的就是运镜,但在 cdance 二点零零自己引入了一个类似虚拟摄影机的控制层,大家可以看看这个黑客帝国六的测试。 speed defined here breaking boundaries reshaping reality your battlefield your rules 看着这个怪兽级的模型,我只能 说现在谁也拦不住自己,短时间内只有版权伦理和监管能够拦一拦了。那不管是 cloud 还是 c dance 二点零,真正让我们后背发凉的或许不是 ai 今天能做什么,而是他的进化加速度。好了,本期财经乌托邦的内容就到这,我们下期再见。

ai 视频的兴亡,最强的视频模型,改变视频行业的 ai 漫剧最终的答案 等等等等,这就是网上赋予 gmail 二点零的评价。一个同时支持图片、音频和视频多维度参考,并且有自己创作想法的全新 ai 视频模型。这期视频我们就来看看它到底有多强。 首先我们进入季梦主页,在视频生成里面可以看到全新的 cds 二点零模型,目前我们只能在首尾帧和全能参考这两个功能上用到它 默认的参数设置。生成一段视频消耗三十个积分点,现在仅仅只能参考两张图片,切换到全能参考,这时候最多就可以同时上传九张图片进来, 消耗的积分依然不会增加,但如果我们上传进来的是视频,那么扣除的积分就会大幅度的提高了。 cds 二点零是一个能够混合参考的多模态模型,除了可以给他提供参考视频外,我们还能给他提供参考音频和对应的图片一起混合参考。 正是因为 cds 二点零有着这样一个交互参考的特性,因此它的玩法就非常丰富了,这些在教程的后面都会一一给大家演示。我们先来测试一下 cds 二点零锁尾针的功能, 这里给他上传一张女生在玩滑板的图片,进来,第一次输入,女生从滑台上冲下,完成一系列高难度的滑板动作。我们来看看生成的结果,可以看到 cds 二对复杂的动作和物理规律的表现,相比过往的视频模型是有着非常明显的提升的, 而且稳定性非常的高。我抽了四次卡,所有生成的素材都是可用的,完全没有出现姿态扭曲的情况。同样的贴纸,用之前的视频三点零模型来生成,对比一下可以看到动作就没有那么真实自然了,而且生成出来的女生样貌一致性保持度也没有 cds 二点零好。 另外, cds 二点零首尾针对细微的文字保持度也是有所加强的。例如这里就上传戏剧迷全面掌握 ai 视频雅诗兰黛广告案例中的两张图片进来, 输入对应的变化题页词,我们把原图放大来看一下,可以看到瓶身上的文字其实是非常清晰的,但由于字体太小了,这是非常不利于模型进行计算和裁样的。 案例中是用之前的三点零视频模型来制作,乍一看啊,没有什么问题,但如果放大拉近来看,这些细小的文字还是会有扭曲的情况出现。 这次我用 cds 二点零来对比测试了一下,很明显 cds 二点零对于这种细小的文字保持度会更好一些,有着更高的细节精度,这对 ai 产品广告制作来说啊,是一个很好的提升。 在缩尾帧功能里面,我们只能上传两张图片,那如果我们要做多张图片的串联过度,就可以切换到 cds 二点零最核心的全能参考功能, 这里面就可以直接给他上传最多十二个素材进来。例如这里给他上传四张图片,同样可以在这里实现多图缩尾帧串联的效果。现在我想通过这四张图片实现人物变成一只熊在咆哮。 在全能参考里面,我们要调用素材有两个方法,一是点击这边的引用参考按钮,这样啊,就可以选择对应的素材了。还有一个更快捷的方法,就是在贴纸里面直接输入 at 这个符号,那么就可以快速的弹出上传素材调用框, 这里选择第一个图片提示词输入,把它作为手针,镜头慢慢拉近人物突然抬起头,面部特征就参考图片二,接着大声的咆哮表情,参考图片三,最后变成一只熊。参考图片四,通过这样用提示词的方式把素材一关联起来, 那么我们就可以得到这样的效果了。 可以看到啊, cds 二点零的多图串联过度是非常丝滑顺畅的,完全看不到图片与图片之间过度刹车的问题,那么我们再来上点难度。 这次上传五张场景完全不一样的图片提示时可以随意一点,直接按出五张图片,然后补充到一镜到底。追踪镜头,从街头跟随跑步者上楼,穿过走廊,进入屋顶,最后俯瞰整个城市,那么我们就可以得到这样的效果了。 hustle all night, never gonna quit till i reach the top now, let's get it on hustle all all night, come on, hocus staying low with a tempo o bright come on, come on, come on! 整个过程是一气呵成的,对于不能衔接的画面, cds 二点零会自动地进行贴近转换,那么我们利用 cds 二点零的这个特性,现在制作产品广告是非常简单轻松的,我们只需要拍摄几张产品的图片,把它上传到季梦, 输入这样一段贴纸词,鞋子的侧面就参考图片二,鞋子的材质就参考图片三,要求鞋子和鞋盒各个细节都要展示出来,并配上大气的背景音乐点击生成,这样非常高清,各个细节都能清晰呈现的产品视频就生成出来了, 我们再来增加一点难度, cms 二点零现在虽然能够很好的在多图之间施划过度, 但如果我想进一步控制某个图片与图片之间的变化时长,应该怎么操作呢?这时候我们就可以用到 cds 二点零的 time 提示格式了。例如这里上传五张历代保时捷九幺幺的图片进来,如果直接交由 cds 二来过渡啊,那么它只会在不同车型之间过渡变化。 但现在我是希望每款车型都要在公路上先行驶一段时间,接着再进行过度变化,所以这时候就要用到太耐的方式来指定视频的变化效果。以图片一作为手帧, 零至一秒的画面,图片一的汽车在公路上高速行驶,一至三秒的画面,图片一的汽车变形拆解整合组装,变化成图片二,接着三至四秒画面,汽车又在公路上高速行驶。以此类推,一直把所有款式的图片串联起来, 把提示输入给 sims 二,点击生成,那么我们就可以得到这样的变化效果了。 前面我们测试的都是 cds 二点零图片之间的过度能力, 那么接下来我们就要测试一下 cds 二点零对提字词的理解和创造性了。例如这里上传一张蒙娜丽莎的图片进来,然后给它输入一系列非常复杂的提字词,要求它有心虚的表情。 先是左右瞄了一眼,然后从画框中弹出来,拿起台面上的可乐喝了一口,露出满足的表情。这时候传来脚步声,蒙娜丽莎立刻把可乐放回原位,保安没有发现,把可乐拿走了,最后画面出现对应的字幕和旁白, 来一口可乐,清爽直上头。可以看到整段提子词交代的人物表情细节和要完成的事项是非常非常多的,时间直接设置成最长的十五秒,点击生成预,似乎我们就得到这样的效果, 来一口可乐,清爽直上头, sax 二点零对我们所交代的所有细节几乎无一遗漏,毫无瑕疵的完整的呈现出来。一分钟就能制作出这样一段有配音的广告大片了, 这就是限阶段 ai 视频惊人的能力,就连影视巨峰的 team 也连夜给 sax 二加更的一段视频,所以我们必须跟紧时代的节奏,拥抱 ai, 学习 ai 和掌握 ai, 这样才不至于被时代所淘汰。 想系统性学习 ai 视频的同学,可以关注一下戏剧迷,全面掌握 ai 视频这一套系统课程。好,我们回到 cds 的 评测,接下来我们请出这次评测的主角,一个手拿着汉堡包的胖子。 在接下来的测试中,我们需要这个主角通过 cds 二完成一系列更加复杂的任务。把小胖的图片上传进来, 贴纸输入,让小胖手拿着汉堡包被一群人追逐。在逃跑的过程中,不小心碰到路边的水果摊,汉堡包丢在了地上,小胖迅速的把汉堡包捡起来,连滚带爬的继续逃跑。设置十二秒的生成时长,点击生成这样一段媲美好莱坞电影大片就生成出来了, 最令我惊喜的是, cds 二并不会像过往视频模型那样,即便时常设置到十五秒,它的各个分镜稳定性都是非常高的,这个效果就是直接一遍就生成出来了,完全不需要多次抽卡,非常的厉害。 对于 cds 二对体语词的超强理解能力,现在我们制作各种电影短片, ai 慢剧啊,都是非常简单的。例如同样上传我们的小胖图片进来,让他用图片中男人的形象, 然后通过刚刚给大家讲解的太耐题词格式,生成一段减肥励志电影破茧的预告片,规定每个时间段要表达的画面和内容,还可以指定小胖的说话内容,让他说出我不想再这样了。接着就是激昂的背景音乐,小胖开始疯狂的减肥,设置一下生成的分辨率, 时间,直接拉满十五秒,点击生成,那么我们就可以得到这样的画面了,难道我这辈子就只能这样了吗?我不想再这样了。 刚刚我们用的都是 cds 二图片参考功能, cds 的 视频参考啊,才是它最灵魂最核心的能力。例如这里我们从网上看到一段炫酷的视频,现在我们通过 cds 就 可以非常轻松地把它复刻出来了, 只需要把这段视频上传到 sims。 但需要注意的是啊,一旦我们用上它的视频参考能力,消耗的积分也会大幅度的提升。可以看到,如果生成十五秒的视频,需要消耗的积分就来到了恐怖的一百九十五点。 接着把我们想复刻的主体图片上传进来,贴时输入参考视频一的运镜和节奏,用图一的跑车来进行复刻,点击生成,那么瞬间同款视频效果就生成出来了。 所以合理利用好 cds 的 这个视频参考功能,我们就可以很轻松的制作出各种好莱坞导演级别唯美的片段出来了。 只需要在网上啊找到自己喜欢的广告片段,把它保存下来,导入到即梦,就可以让我们自己的角色模仿对应的拍摄手法,实现同款的效果。 想要更接地气一点,那么我们就可以找一段炫酷的舞蹈视频,把它上传给 cds, 让我们的主角小胖参考视频中的运镜和节奏,同时也参考视频中女子的跳舞动作,点击生成,这样小胖就丢掉手中的汉堡包,展示出优秀的舞蹈出来了。 刚刚展示的都是单视频单图片的参考方式,我们再来上点难度,直接用手机随手拍一个运镜的视频,向上向下,接着往左转,再往右看, 把这样的视频上传到 sims 作为参考,然后就可以给它上传多个场景的图片,贴时输入以图一作为手帧画面,参考视频的二下方的场景是图片。三, 接着把左右场景的画面都定义一下,点击生成,那么同款运镜第一人称的视频画面就生成出来了。 再来复杂一点的超高难度运镜,直接把这样一段把观众都转晕的电影视频上传到 cds, 主角依然是我们可爱的小胖。接着上传几张自己生成的酒店构造图,根据原视频的运镜方式,输入这样一段贴纸,点击生成,那么这样的好莱坞大片大家也能轻松地实现出来, 同理,我们给小胖添加几个坏人 npc 的 对手,拿着棒球棍和大扳手,并生成一个指定的背景图片,给他上传一段打斗的参考视频进来,让小胖模拟视频中的动作。这些动作参考片段可以是实拍的视频,也可以是三 d 建模,简单的骨骼姿态动作, samsung 二都是能够识别的,然后指定在图片三的场景中与图片二的黑衣人进行打斗。点击生成,这样灵活帅气的小胖打斗视频就生成出来了, 就连坏人是拿着扳手的工具都能非常稳定的还原出来。不得不惊叹,季梦这次推出的 samsung 二确实非常非常的强, 不过在测试的过程中,如果对于过于炫酷的快闪视频, samsung 的 参考能力就会有一定程度的下降和污染。 由这里把这段视频上传给 cds, 同样把小胖上传进来,并给他上传五套不同的衣服。图片要求小胖作为模特分别穿上图二至图六的衣服。参考视频一的运镜,每穿一套衣服都切换一个镜头,点击生成,可以看到生成的效果,总体来说还是不错的, 对于衣服也能够完美的穿上,但某些画面中会有原视频人物污染出现,如果想实现这样的快闪视频效果,那么就需要多抽抽卡了。 six times 二的出现也是 ai 慢剧制作者的福音,现在我们只需要提供这样一张九宫格的图片,也可以在图片上简单备注一下必要的注示,把它上传到 six times。 提示词非常简单,让它根据九宫格的图片说明制作出美式漫画风格的动画,那么我们就可以得到这样的效果了。 对于打斗动校啊,也是很多同学喜欢制作的,现在我们可以先生成两个人物角色的形象图, 然后再生成一张九宫格的打斗图片,直接上传到 cds, 提示输入图一的女生与图二的男生参考图三的九宫格漫画进行打斗,然后补充上一段通用的打斗提示,点击生成,那么我们就可以得到这样一段非常炫酷的打斗效果了, 而且人物一致性保值度是非常好的,男生衣服上的阿迪 logo 在 各个风景中都能很好的保留下来。 此外, cds 二还能对视频进行向前或者是向后延长处理,这个功能对视频创作也是非常有用的。 例如现在我只生成了一段五秒钟从咖啡杯上生长出甜甜圈的视频,我希望接着这个视频在后面继续进行创作,那么就可以把它上传到 cds 贴时输入,让它把视频延长十五秒。后面就是对应的 type n 格式描述,指定它在不同时间段生成的效果。 点击生成那么一段完整的瑞幸咖啡广告就在原来的基础上接着补充生成好了。 samsung 二还有一定的视频编辑和替换能力,利用这里给他上传一段李连杰打斗的参考视频,主角依然是我们的小胖,要求他把视频中右边的黑衣男人替换成图片中的胖子, 点击生成,可以看到前半段替换效果还是非常不错的,但由于参考视频本身是有多个分镜的,在后面的视频中胖子就不能替换出来了,所以更好的做法是对原视频进行对应的拆分,然后分段来替换。 另外在视频替换方面, cds 二很多时候会加入一些自己的想法,他不会原封不动的还原原视频,利用这里让他把视频中左边的白衣男人,也就是星爷替换成图片中的小胖, 点击生成,可以看到生成出来的效果,虽然星爷是被替换过来了,但画面中的动作和背景也有一定程度的改变,所以对于视频编辑替换方面啊, cds 二还有进步和改进的空间。 关于 cds 二,我们可以实现的创意玩法是非常多的,这几天我也是跑光了两个季梦会员的所有积分,进行了各种效果测试,才给大家带来了这个真实的使用评测视频。毫无疑问,在春节到来之前,季梦提前给我们准备了一个大大的新年礼物, 它在很多方面都已经是超越了索尼二和微软了,因此 cds 二点零也快速的出圈,已经火爆外网。确实, cds 二点零又把 ai 视频创作推向了一个全新的高度。

am 巨抽卡做视频,到底哪家便宜哪家贵?今天一条视频跟大家说清楚,我们针对的平台就是微度可零,吉梦、海 螺各平台都用十秒为一条,这样几样单位来给大家来盘一盘,以图片参考盛视频举例啊,吉梦年会员都是二五九九,每个月一万五千的积分,十秒的费用就是在四毛三, 然后就是可怜啊,月费是九百一十六块钱,大概是两万四千的灵感值,十秒钟的分类成本就是两块一毛一一条。这个费用呢,是咱们针对的 o 一 模型啊,你如果是要用 o 三的模型,价格就是翻一翻,大概在四块多一条。 接下来就是微度啊,每个月的费用大概就是五百六,他给的是八千积分,每十秒钟的成本就是在两块八。 但是有一点微度的会员每天有两百条的错峰视频,把这个也算进去的话,他的费用成本是直线下降 五毛钱。最后咱们来到海螺大师会员举例,每个月的均摊成本是四百六十三块钱,一万零五百的贝壳,他的十秒钟的成本就是一块八毛四。为啥用大师会员举例子?因为现在大师会员是五点八折的折扣, 优惠力度是比较大的一个方式。总结起来来说, cds 每条四毛钱的成本真的是杀死比赛一样,用一个非常低的价格给大家一个非常好的质量输出。但是现在 cds 排队排不到头,然后你会有些降质问题,如果现在大家急于出片的话, 不妨可以考虑重新回到微度上,在质量、效率和成本上都是一个非常不错的一个保障。然后还有一个点呢,就是微度的 q 三马上要上多餐了,我们马上就给大家测试一下,给大家一个反馈。

英斯克特,总监让你去一趟办公室哎,好 莹啊,你今年的业绩是垫底的,你这样过年我怎么给你发钱啊。总监,我明年一定加油把业绩拉上来。你去年也是这么说的,我要信你几回啊。听说你有个机械朋友叫伊涅夫,要不把他微信给我 啊?斯克特,你又找死是吧,领导,我只是想让他帮我挖个人而已啊。你高抬贵手,放过我吧。莹妹,你的数据确实差了些,公司也是对事不对人,回去好好调整,明年加油吧 星总监,我会努力的。 英美,拜拜拜拜。 福宁娜,我回来了。 哎,你辛苦啦。 你又打了一天游戏是吧。哪有,我是睡了一天好不好。你啊,一天天的真会享福。 嘿嘿,今年真的很难,经济不好, ai 发展还那么厉害,工作之余还要学习,每天都是写不完的报告,我真的。好啦好啦,已经放假啦啊哈哈哈, 快睡吧快睡吧福福晚安。 这是给我干哪来了,发什么呆呢。旅游就要开心。 发现海浪在耳边唱着温柔的诗篇,奔向海岸线,把快乐 都。

今天呢,分享一下极梦的使用体验啊,以及在 ai 时代我们个人应该提升自己哪方面的能力 啊?昨天呢,刷这个社交平台,呃,发现有外国人在平台上发布求购信息啊。求购什么呢?求购中国人的这个极梦账号。呃,出价多少?出价两千美金。呃,当时看到这个消息我就震惊了, 嗯,没想到就是呃吉梦的账号会这么值钱。后来上网搜了一下啊,嗯,总结一下,其实就是中国的这个大模型啊,迭代的太快了。嗯,性价比呢,整体要比国外的要高。 嗯,看到这个情况呢,我就下载了一个吉梦啊,去尝试了一下,因为最近 这个国国内的大模型实在是太多了,你像 deepsea 呀,呃,元宝啊,豆包啊,呃,还有吉梦啊等等,我们不可能一个一个的去跑一遍。 昨天我下载以后呢,用这个千问啊写了一个剧本,然后把这个剧本呢放到吉梦里边去,让他帮我生成了一个视频。 这是下一个十年的黄金矿脉,我们正准备在中国找一个操盘手,此人有价值投资的理念就是我们要找的新一代股神,定当竭尽全力。醒醒,该吃晚饭了。呃,先说一下使用感受吧, 整体来讲呢,生成的这个画质呢,是非常高清的,播放也非常流畅,呃逻内容也非常丰富,但是有一点就是这个逻辑自洽方面呢,可能还稍微有一点瑕疵。这个剧本是这样的,呃, 就是呃我呢,呃,假想一下在办公室午休,然后梦见呢和巴菲特和芒格在一块。呃,开会啊, 呃。开会的内容是什么呢?就是呃我问他们,呃对中国未来十年的股市是怎么看待的?呃。然后他们说中国未来十年的股市呢?是,呃,这个是一个旷迈啊, 就是非常值钱。呃。另外呢,他们也有意进军中国啊,就有意进军中国,想来中国找一个操盘手啊。是故事的概,大概是这样啊,我就把这个故事的梗概放到千万里边去,哎,他帮我生成了一个有血有肉的剧本。 呃。然后这个剧本呢放到嗯吉梦里边去。呃。吉梦生成的视频呢?稍微有点瑕疵。有点瑕疵在哪呢?就是呃开头,嗯, 开头直接巴菲特直接说,呃,中国股市未来十年是一个,呃,黄金发展期,是一个旷迈啊。但是没有我开头提问的那一句,我问他说中国未来,呃十年,中国股市未来十年的,呃,这个看法 啊。所以说这里边这个,这个是一点这个逻辑瑕疵啊,就是没有办法把这个剧本完完全全从头到尾的给呃完整的演绎出来啊。当然呢,他能做到这个程度我觉得已经非常不错了。嗯,这对我们个人来讲呢, 嗯是非常有利的,因为我们创作嗯这种内容啊,呃。内容视频的这种门槛大大降低了。嗯。这个集梦火了以后呢?嗯,我觉得,嗯对我们个人来讲,嗯 有个什么挑战呢?嗯,就是他把重复的 这个劳动呢给替代了啊,就是重复劳动给替代。为什么这么讲呢?嗯,因为它是一个多模态的大模型,你可以给它输入输入一段文字,然后它给你生成,呃, word, 呃, ppt, excel, 呃,甚至动画,呃,都可以, 这样就省去了我们大量的这个办公室的工作。那对于我们个人来讲我们需要提升什么能力呢?呃,我个人认为呢,是需要提升我们的这个。嗯, 战略的眼光啊,还有布局的能力。因为以后干活的就是这种 ai 了啊。我们人呢只需要给他提供一些思路啊,就是去指导他应该做什么啊?应该怎么做啊?嗯,我觉得这是我们要提升的,呃,这个能力。 所以呢?嗯,在未来呢,我觉得我们还是应该从这个,呃提升自己的这个战略,呃高度,然后还有布局的能力这方面。呃。去入手啊,先提升自己啊,我们人呢只需要做决策,做指挥就可以了。

极梦的 sedance two 点零到底在技术架构上面做了哪些升级?然后为什么会导致这个算力消耗有这么大的变化?嗯,这个 model 它是用上了这个双分支扩散 transformer, 然后它可以让这个视觉和听觉的信息同时去生成,所以它的这个音画同步啊,是比以前好了非常多。 同时呢,它的这个输入也不再是单一的文本了,它可以同时支持文本图片、视频和音频一起混合的输入,最多可以一次塞进去十二份参考素材,听起来就复杂了很多。对,那是不是说这个画质和这个动态效果也有很大的提升?对,没错没错,就是它可以直接输出这个二 k 甚至四 k 的 这种 电影级的这种高清的视频,然后也支持这种复杂的运镜啊,和这个更长的这种连贯的内容,所以他的这个每一帧的细节都变得非常的丰富啊,那所以这个算力的消耗自然也就成倍的往上涨啊。对, 这是一个从各个维度都往上涨的一个升级。具体的讲就是说这个极梦的 cds 二点零在算力消耗上面和这个推理的速度上面跟一代相比到底有多大的变化?就是这个新版本它生成这个二 k 的 视频,虽然说它比一代要快了十倍,但是它每一单所消耗的算力是五到八倍。 对,那如果是说你要生成这个一分钟的这种四 k 的 视频,那他的这个算力的需求就直接飙到了堪比上千次的这种文本对话。所以怪不得大家老觉得说这个东西怎么跑的这么慢啊?对,就是因为,呃,这个二点零的这个推理的步骤从三十步变成了最多八十步, 然后呢,这个单卡单任务的这个时间也从秒级变成了分钟级,再加上这个多模态的这个信息啊,还有这个高分辨率的这个 tokens 就 非涨啊,就十秒的视频可能就有四十万 tokens, 那 如果是说这个复杂的场景可能甚至能上百万,那这个算力的需求就是 暴涨,对,暴涨,就说现在这个极梦的 cds 二点零在实际使用当中,这个算力的压力到底有多大?就这个春节之后啊,这个平台的日火用户涨了三倍。然后呢,这同时在线的任务经常过万, 就是免费的和普通的用户基本上要排几个小时才能等到你的这个任务被执行。哦,怪不得大家都在说这个排队排的让人抓狂。对,不光是这个呃,二点零,还加了这个三重的这个合规审核,这个审核也占了整个盛盛时间的三分之一。 然后呢,这个平台为了去做这个算力的隔离,就会员和非会员的这个等待时间能差出好几倍,所以就是说这个,呃,全球的这个 ai 视频的这个等待时间能差出好几倍,所以就是说在今年的一季度也是暴增了两倍半, 就是整个行业的这个压力都是非常大的。我们现在来进入第二个部分啊,就是聊聊用户和市场的双重压力。嗯,那我们第一个问题就来了,就是这个春节之后啊,这个极梦的 cds 二点零到底用户量增长有多疯狂?就是春节假期结束之后啊,这个平台的日火用户 直接翻了三倍,就因为这个电影级的这个可控生成的这个能力啊,吸引了非常多的新的用户涌入啊。然后这个 普通用户呢,想要生成一个十秒的视频,他的等待时间从春节期间的几分钟,直接就变成了三到八个小时。哇,这个跨度也太大了吧,那是不是高峰期的时候根本就抢不到位置?对,没错没错,就是高峰期的时候啊,这个排队的人数经常破万。 然后呢,这个二点零刚上线的时候,甚至有用户反映说这个他前面有十万多人在排队。哦,天呐,那就是不光是这个个人创作者,还有很多这种广告公司,短视频团队,他们也都来了, 一下子就把这个系统的这个压力就顶到了极限。现在这个全球的这个 ai 算力的供需到底是一个什么样的紧张程度啊?就是现在这个需求是暴涨啊,就因为这个多模态的这种大模型,像这个 cds 二点零这种出来之后啊,这个 ai 视频的这个创作一下子火了,然后大家都要这个高分辨率的大模型训练,所以这个算力一下子就 被大家抢的特别厉害,所以说就是这个东西是供应根本跟不上是吗?对,没错没错,就是 gpu 也好,还是说这个数据中心也好,他的这个扩建都是需要时间的嘛?对,所以这个 就硬件和能源的这个限制,就导致了这个算力根本就涨不上来,然后再加上这个全球都在缺这个 gpu, 所以 这个 token 的 价格也是水涨船高啊,就是大家这个整个行业都在抢这个资源,所以就导致了这个很多平台,包括我们吉梦的这个生成速度也是明显的变慢了很多, 这么多人挤进来,然后又赶上这个算力这么紧张,那吉梦到底遇到了哪些难题?就我们的后台是一直处于这种满负荷的状态嘛?然后呢,这个任务的积压和这个审核的积压,就导致了 这个普通用户和免费用户基本上是寸步难行啊,就是你可能排一天都轮不到你,甚至连这个会员的这个插队的这个加速都不是很明显了,怪不得大家老说这个体验感变差了。对对,没错没错,就是大家等的时间久了,然后就开始在社交上面去吐槽,这个平台的一个口碑也是波动比较大, 有一些人就干脆就去倒卖这个会员资格。平台一边要扛着这个算力的成本,一边还要安抚用户,一边还要想办法去解决这个技术和这个市场的双重的压力,所以就非常的有挑战性。那咱们现在就来聊一聊大家最关心的这个未来的曙光啊,就是这个速度和质量的平衡到底怎么修复。 那第一个问题就是接下来这一两个月极梦平台到底会怎么来缓解这个升成慢的问题?就是马上平台会有大量的这个高端的 ai 服务器进场,嗯,那 仅二零二六年就会新增十几万台这种服务器,并且它是专门为这个视频生成做了优化的啊,那整个这个夜冷的比例也会提升到百分之八十五以上啊,那这个就会让整个这个集群的这个性能会有一个质的飞跃 哦,那就是说这个硬件升级是可以期待一下的,对,但除了这个之外还有什么比较有效的办法吗?有啊,就是平台会上线这种模型的蒸馏的版本啊,就是会有这种 大模型的这种精简版啊,那他会在保证一定的质量的情况之下啊,然后大幅的提升这个推理的速度,同时也会支持这种灵活的这个快慢的切换啊,就是你可以选择我要质量还是我要速度啊,同时这个任务的调度也会做的更智能啊,包括这个审核的流程也会做一些优化, 包括这个会员体系也会做一些调整啊,比如说这个积分的发放啊,包括这个错峰的这个使用啊等等吧,就是让这个资源能够 尽量的合理的分配。那你觉得就从现在开始往后推三到六个月,整个这个 ai 视频的这个算力的瓶颈会怎么来被打破? 就这个期间,我觉得首先就是芯片的这个供应会逐步的恢复啊,那包括这个云厂商也在大力的去扩建 这个新一代的这种制算中心啊,所以这个总算力肯定是会有一个明显的提升的,所以说就是说基础资源会变得充裕一些,对,没错。然后同时呢就是这个 硬件和模型的这个协同的设计也会成为一个主流啊,就是大家会有一些存算一体啊,包括这个光互联啊等等的一些新技术会落地啊,也会有 这种快慢的模型会同时存在啊,大家会有一个呃,根据你的需求来进行一个分级的服务啊,包括整个这个行业的标准也会越来越完善啊,整个这个 生态会越来越成熟。就说如果是我们作为普通用户,现在想要在这个极梦的这个平台上面更快更顺利的去生成自己想要的内容,有什么比较实用的小技巧吗?其实有几个方法还挺好用的,比如说你可以避开这个晚上的高峰, 然后去选择在凌晨或者清晨的时候去提交你的这个任务,还有就是你可以把你的这个视频拆分成几个比较短的片段来分批的生成。 再有就是你可以啊尽量的使用一些比较简单的提示词和比较少的这个参考素材啊,也可以优先的去选择这个一零八零 p 的 这个输出啊,再有就是你可以成为这个会员啊, 利用会员的这个加速的权益啊,最后就是你要随时的关注平台的这个公告啊,合理的去规划你自己的这个创作的节奏啊,这样的话你就可以 既提升了效率,也不会错过一些新的功能,好吧,哈哈哈。今天我们跟大家聊了这个关于吉梦的这个 cds 二点零为什么会这么慢的,背后的原因啊,然后也给大家带来了一些实用的小技巧啊,也跟大家展望了一下这个行业未来的发展,希望对大家在使用的过程当中能够有一些帮助啊。

昨天用 cds 做了一段短剧的视频,呃,大家讨论的比较激烈哈。呃,今天又用 cds 做了一个以低视角为主体的探班老友记的视频,哎,大家可以看一下。 hey hi, come on over, come on over, hey, come sit with us。 看完了吗?就这么一个,是我在火山引擎中用 cds 二点零的模型来做的 十秒钟视频,消耗了我二十一点六万的 token, 太可怕了,赶紧降降成本吧。你这么说, ai 是 不是正在改变我们的现在和未来呢?


年还没有过,影视领域呢,又一次被洗牌,今梦 c d 四二点零全球首发公司呢,也拿到了内测的名额,我们直接看测试的效果。 小曼可对不起你,落在他们手里,生不如死, 哥我痛。实拍的短剧行业基本上可以说再见了,一个人的好莱坞电影时代即将来临,如果你也考虑延伸 a i j c 关注老马,咱们进群交流。

今天来讲一下我们新手小白最关心的一个点啊,就是我们生成一段视频究竟要花多少钱啊?其实他这个跟你选择的模型是有关系的,现现在他最强大的模型是这个 c 点二,还有这个 c 点二点零 fast 的, 像我们现在如果你是用 fast 生成一段十五秒的话,他是会用到三十积分哦,因为我是个高级会员,高级会员他用 c 点是可以打四折的,那如果你是切到 c 点二点零的话,就得变成四十五的。宝宝们 除了跟这个模型有相关哦,你如果添加一张随便添加张图片哦, 添加一张图片的话,他所需要的积分是不会变的,但如果你是要加一个参考视频的话, 加一个参考视频进去的话,他积分是直接分翻倍的。这种新手小白一定要注意哦, 不然一下子积分一下子就会全没了的,看自己什么时候要参考图片还是什么时候参考视频,一定要,这个一定一定要注意好的,不然积分消耗是很快的。还有一个很重要的点就是它下面这些三点零,三点五 pro 网这个鞋是以前的模型, 上面这两个才是新的模型,一定不要选错这两个他是功能强大很多的。下期再跟兄弟们讲一下新手入局的一些大纲吧,兄弟们有什么想问的也可以在评论区说出来。

不开通会员纯白嫖,每天能生成几条极梦二点零视频?一期视频告诉你,主播这边用电脑演戏,手机也能用,不过会有些差异。一、豆包豆包每天可以生成十条视频, 这里注意了,电脑版是满血二点零,但是只能文胸图,手机版是 size 版本,机器上传多张参考图,每天能生成五个十秒视频。二、小银雀,小银雀和极梦一样拥有全能参考,可以上传多张图片,第一次注册限免三次,二点零 之后每天登录送一三零积分,二点零满血版每秒消耗八积分,也就是每天能生成一个十五秒的极梦二点零满血版。 三、火箱引擎,这个比较麻烦,需要绑定身份证,绑定后直接送五百万 tokens, 按照满血十五秒来算,一共可以生成十四个十五秒的极梦二点零。 注意,这是一次性额度,不是每天十四个,并且目前不开放全能参考,只开放首尾间可以先存着。 四、极梦官方这就不多说了,免费用户每天能生成一个视频,如果开通一块钱七天会员,去掉永久积分,按每天获得积分计算, 每天可以生成二个二点零 size 的 十秒视频,或者一个满血十秒视频。总结,一个手机号每天能生成 一个十五秒的极梦二点零满血版,外加五个二点零 fast 的 十秒视频。如果开了一块钱会员,每天能生成二个十五秒的极梦二点零满血版,外加五个二点零 fast 的 十秒视频。 但假设你有三个手机号,并且都开了一块钱会员,那么每天可以生成六个十五秒的极梦二点零的办法了, 多个手机号,每天能白嫖快四分钟的习强足够做一些动画了,但是最近用的人实在太多,如果不开会员的话要排队挺久的,这一点见仁见智了,抓紧白嫖起来吧。

对我们这些对 ai 有 兴趣的老年人比个雷,我已经把可怜的黑金会员退了一千多,一个月实在太贵,基本算下来是真的香,而且基本就是目前的国产王者。我们这代人应该是人类有史以来最焦头烂额的一代,现在 ai 的 能力已经可以看到,谁都要天天学东西,否则就会面临淘汰。 我自从一个半月前开始捣鼓这东西,就一天都没有休息过, ai 只能干掉很多活,但却让人更加的忙碌,无形的时代压力和阴影,多少人还能从容的喘得过气?如果讲 ai 发展是好事的话,我表示不太同意,哪有好东西会杀掉那么多岗位,哪有好东西能让一代人重新忙碌到极废? 这个春节有几个人敢完全放下工作,敢碰都不碰 ai?

逼自己一个月练完,其实你很会 ai 视频生成,全七百四十二级存下吧,真的很难找全的。本视频耗时三个月,制作共计一百六十小时,带你一口气从零基础小白入门进阶! 由于视频太长,本套视频分十二期发布,本期带你搞定极梦 ai 视频生成功能。最后会给大家一个小福利课程,视频中的所有素材,脚本、分镜、关键词等,还有学习计划表,几十上百记素材,电子书和课间等等。只要你能想到的素材我这里几乎都有,评论留言六六六即可全部免费打包带走!哈喽,大家好,我是林默。 今天我们要来学习 ai 视频生成的功能。在开始学习今天的 ai 视频课程之前,我们先来确定一个核心的理念。好的动态视频本质上是由一系列精心设计的镜头组合而成, 也就是我们俗称的运镜,而导演就是我们。我们要通过提示词来指挥 ai 的 虚拟摄像机如何运动。在 ai 视频生成中,我们主要是通过描述这些镜头的动作来控制画面。常用的运镜主要包括挥、拉、摇、移、环绕、 切、特写、中景、全景等等。我们先来看一下什么是推和拉,推和拉是指镜头向前推进或向后拉远。摇和移指的是镜头水平垂直摇动或跟随移动。 而环绕是指镜头围绕主体旋转。切指的是一个镜头画面直接切换到另一个镜头画面特写。中景和全景则描述了画面的取景范围。 理解了这些词语,你可以更清晰的告诉 ai 你 想要的效果。那么今天我们就一个统一的创作目标,制作一段侦探调查书房的悬疑短片,来学习五种不同的视频生成方式,你会发现从快速构思到精细控制, 每一种方法都有其不可替代的作用。我们先来看一下 ai 视频生成的方式,一共有五种生成方式,分别是图升视频、首尾帧、升视频、 智能多帧和参考图生视频。我们先来介绍第一种纹身视频,纹身视频的意思就是说不依赖于现有的图片,而是通过一段结构化的镜头脚本提示词,直接生成一段包含复杂运镜和内容变化的完整视频。 这是将脑子中完整的动态想法快速实现出来的方式,我们来演示一下。我们打开极梦 ai, 进入生成页面,将 agent 模式改为视频生成。可以看到在视频的生成框中,可以上传两张参考图,前面一张是手真图, 后面一张是伪真图。而纹身视频呢,是直接输入文字得到一段完整的视频。来看一下我这里的提示词,我写的是电影悬疑短篇昏暗的书房开场的特写。一只戴着白手套的手不小心推开一扇厚重的木门,镜头快速推进书桌上泛黄的信件, 镜头切至侦探的侧脸近景,他眼神锐利的阅读,随后镜头从他的身后低角度环绕,展示出他沉思的背影以及窗外的雨夜。最后镜头拉平,他拿起放大镜,光线照亮信纸上的一个影印符号。在这个提示词中,我使用了很多的运镜, 构思了一个完整的故事按键。点完提示词之后,我们来看一下下方的视频模型,点开以后可以看到这里有四个模型可以选择,其中三点零 pro 级以上都是需要开通会员才能使用,这里我们选择默认模式。首尾帧方面我们等一下再讲。比例方面我们使用十六比九, 注意看这里有一个视频时长,一般来说我们默认为五秒视频,不过像我目前的这个提示词,它可能涉及到的信息更多, 所以这里我们使用十秒的时长,可以看到每消耗一次十秒的时长需要二十个积分。我们点击来看一下生成效果,可以看到此时视频已经生成完成,我们点击看一下效果。 我们可以看到 ai 尝试理解并执行了我描述的这一系列镜头,直接生成了一个包括推门、摇镜、推进、切换、环绕等多个运动的十秒短片,这可以让我们快速的评估一个动态创意的整体节奏和气氛。从视频画面中我们可以看到,推门进来的这一刹那, 我们的镜头聚焦在了书桌上的信纸,给这个信件来了一个特写。从画面中我们不难看出,信件上的内容略微模糊,看不清楚具体的信件内容,所以我想要专门优化一下它。那么我们可以怎么做呢?我们可以利用截图工具将这个画面进行一张截图,可以看到通过截图 我们得到了一张信件特写的图片,那么有了这张图片之后,我们就可以使用第二种生成方式,手帧图生成视频。它的优势在于 我们可以将刚才的信件作为手帧图,然后针对这一帧的画面设计的更加精细,更加稳定的镜头运动,我们回到这个画面,将刚才的信件特写进行上传。接着我们可以输入一段提示词,比如我这里的提示词是镜头从信件的上方缓缓的下降并轻微的旋转, 聚焦于信纸上的文字,同时营造出尘埃在光线中漂浮的氛围。我们使用视频的三点零 plus, 这里我们使用的是手征图模式,分辨率选择的是七幺二零 p。 像这一段提示词内容较短,我们可以使用五秒视频, 可以看到五秒视频每次生成消耗十点积分,来看一下生成结果。从画面中我们可以看到原本模糊不清的信件内容变得清晰可见, 通过这样的画面,我们可以得到了一个质感更高的信件特写。镜头锁定了信件的内容,优化了运镜和细节。那么通过刚才的介绍,我们讲解了纹身视频和手针图身视频。 接下来我们来看一下第三个首尾针身视频,它可以精确的控制画面内的关键变化,比如当你需要画面中的某个元素发生精确可控的变化时,可以使用这个功能,我们来实际演示一下。从画面中我们可以看到 此时侦探手中正拿着这封信件,但是上面的字体较为模糊,看不清具体的内容。紧接着侦探拿起放大镜,看到画面中出现了一个神秘的符号,此时可以看到信件上的内容还是较为模糊, 所以我们对这个镜头可以进行优化。那么这一次我们来使用首尾真身视频来将同一张信纸,同一个符号,让信件的内容变得清晰锐利。来看一下我的操作方式,我们先截取一张信件的全貌,使这个图片作为我们的手真图。紧接着我们截取一张 放大镜,显示出神秘符号的图片作为我们的尾帧。那么有了这两张图片之后,我们应该如何使用呢?首先,我们需要对这张尾帧进行处理,将信纸上模糊的部分以及这个符号变得非常的清晰。这里我们可以回到图片生成模式,上传这张尾帧。 接着我们给出提示词,同一张信纸上面用哥特式的手写字体写满,文字中央盖着一枚精致的皇家文章火漆印。写完提示词之后,我们将图片改为四点五,比例改为十六比九。 让我们来深层看一下效果。我们来看一下通过这两张图的对比,可以看到我们优化完之后,这张信纸的具体内容比原先的效果要好了很多。首先,这个字体的符号非常有标题的质感,而原先这里并不凸显。其次,优化了放大镜中的符号,比原先的精致了不少。 我们将这张图片进行下载好了,经过我们的调整,我们得到了一张手帧图片,又得到了一张尾帧图片。接下来就让我们进入极梦 ai 来生成首尾帧视频。我们将图片生成模式改为视频生成, 接着上传我们的首帧,然后上传我们的尾帧。在提示词方面,我们可以描述放大镜略过符号逐渐聚焦,变得清晰可见。写完提示词之后,我们将视频生成模型改为三点零,使用首尾帧串联。 分辨率方面我们使用自动匹配。视频生成方面,我们可以选用五秒,运镜方面我们可以看到系统为我们提供了预设的运镜镜头, 大家可以根据自己的需求进行选择,这里我使用无。可以看到首尾帧生成的时候,在五秒的视频时长下也是十点几分,我们来生成看一下效果,我们来看一下生成结果。在这个视频中我们可以看到首尾帧的串联,使这个视频的过渡非常的自然协调,特别是人物手中的放大镜, 在照射符号的时候变得清晰锐利。我们将这个视频进行下载好了,通过刚才的首尾真身视频,让我们知道了这个功能适用于元素渐变的过程, 使元素过度自然斜接。那么接下来我们继续介绍智能多帧。智能多帧的核心逻辑就是当你需要一个角色完成一系列复杂的连贯动作时,你可以提前准备好动作分解的关键镜像图, ai 会在此基础上补全全部的中间动作, 我们来尝试一下。还是以这个短片为例,我们来制作侦探从门口走入房间,接着在书桌前坐下的连贯动作,来看一下我的具体操作。 首先我们需要一张侦探站在门口的照片,为了保证生成的人物角色和场景的一致性,我们先截取一张场景图,接着我们截取一张人物的角色形象照。 首先我们来修复场景图,我们将场景中这只白手套的人物手进行删除,提示词我写的是删除这只手只留下背景图片,还是选用四点五 比例,选用十六比九,我们来生成一下,这样我们就得到了一个场景,我们将这张场景进行保存,接着我们上传这张人物和这个场景,我们对图片进行调整,这里我们可以选用抠图将人物进行抠除。 需要值得注意的是我们并不需要这张信件,所以使用橡皮擦将它擦除,只剩下主体即可。然后我们点击确定按钮,将人物抠出,之后是为了避免跟后面的场景形成污染,我们点击保存。 接着我们来写入提示词,我这里写入的是二十年代的英式庄园,书房走廊长而笔挺,两旁是深色的橡木护墙板,墙上挂着油画和家族肖像 图片我们选用四点五,我们点击生成看一下效果,看起来生成的效果还不错,我们点击下载。接下来我们用同样的功能得到了其余的两张图片,我们来看一下这三张图片,第一个是人物从门口走进,第二个是人物站在了书桌前面,第三个画面是人物坐了下来。 接下来我们将利用这三个图片来进行智能多帧的演示。来看一下我的具体操作。可以看到我已经将三个图片进行上传,并且在每个图片的运进窗口处填写了描述词。第一个图片我写的是身体向前,手部特写,摆手套,握门把手开门。 第二个我写的是拉开椅子坐下,第三个我写的是仔细阅读信件内容。视频模型方面我们继续默认,这一次我们使用的是视频多帧, 分辨率方面我们选用自动匹配,生成时长方面这里默认是十秒。我们来看一下生成画面,这段视频从人物进门到人物坐下之后观看信件,流畅度上面取决于我们准备的近图在姿态透视上面是否足够连贯。如果你觉得这段视频不够流畅, 这边可以建议你保存下来之后在剪映里将它们分开调整,特别是人物坐下后拿起信件的动作,我们可以在剪映使用倒放功能来进行调整。讲完了智能多帧之后, 让我们来看最后一个参考图升视频功能,它核心是试图将两张不同的图片内容融合到一个视频中,我们还是以这个侦探片为例。 接下来我将继续使用这个侦探形象,让主角在调查完线索之后走出大楼,来到一个风雪夜的街景上,可以看到这边我使用了一个人物主体和一个场景,接下来我们就将这个人物主体放入这个场景中。我们回到视频生成页面,将智能多帧改为主体识别, 接着我们上传我们的人物和场景,然后我们输入提示词,我给出的提示词是男人走在马路上,接下来我们在提示词部分男人的后面加上一个艾特,这样就会跳出我们的主体选择,我们选择主体人物走在马路上,马路后面再加一个艾特,接着将我们的主体场景放入, 我们将男人两个字删除,再将马路上三个字删除,这样就变成了男人主体走在了马路上。下方的模型我们默认选择三点零,使用的是主体。参考比例方面,我们十六比九视频生成,我们选用五秒。 让我们来看一下这次生成结果。从画面来看,人物和场景融合的并不是特别好,有一丝违和感,建议大家谨慎选用。参考图生视频,这个功能可以使用其他的方式来生成视频。 好了,那本节课我们就将这五个功能全部进行了讲解,希望通过今天的学习,让大家对这五个功能有了深刻的了解, 课后可以多多的尝试,期待大家的作品。那么本节课的内容就先学习到这,我们下节课再见。哈喽,大家好,我是林默。这节课我们来学习电影中一次性生成多分镜视频的制作方法。掌握了这套学习方法,你能够将任意的电影镜头运进逻辑 转化为 ai 视频的提示词。今天我们就通过至暗时刻这部电影片段对它进行拉片分析,提炼出片段中的提示词,然后通过 ai 生成来复刻这个画面。在前面的几节课中,我们对景别视角运镜做了一些基础的了解, 希望大家在观看这个片段之前能够带着这些问题一边观看一边思考。让我们来观赏一下这个片段。 business people, business people water, the leader of the opposition president trinity business people it seems that i have not been clear enough then let me be the no go out of my feelings regarding mister chamberlain's future as prime minister for the wrath unremovable chairman be free be free coming to his years of inactivity and incompetence we find it personally responsible, personally responsible for leaving this nation ruinously unprepared to face the president nazi parents。 我们来对这些视角逐一展开解析。我们先来看第一个视角,可以看到这个视角位于场景的正上方,以一个绝对九十度的俯视角呈现出一个大远景。画面中的构图以中心对称,静止的展示了上下对直的会议室大厅全貌, 鉴定了这是一个严肃对直的场景画面。接着我们来看第二个镜头,可以看到此时的镜头以缓慢的速度垂直下降, 并以顺时针的方向匀速旋转。在旋转的过程中,拍摄的角度也发生了根本的变化,从原先的九十度垂直角度逐渐变成四十五度高空俯视角。此时的镜头缓慢下降,此时的画面从大远景变成了远景。 接着镜头向后推,此时的视角逐渐变成平视角。可以看到画面由原先的远景转为大远景,露出了两旁对直的人们。画面也是中心对称,画面中有一束左侧的强光照亮了主席台的右方。 接着我们再来看此时镜头缓慢朝前推进,中心聚焦为左侧的演讲人,人物从一个大远景反为了中近景。 接着人物指出一个手指,将我们观众的视线从右方引向左方,展示出这部片的主角会长先生。 这就是一个片段运镜轨迹的完整解析。那么通过刚才的分析,我已经将这个镜头时间,景别视角, 运动构图,光线和画面内容包括音效整理成了一张镜头拉片表。在这个表格中,我对镜头的景别视角和运镜包括构图做了详细的介绍。 通过这个表格,我整理出了这个片段中所有拉取的片段关键信息。接着我将我的表格导入了让大模型,将我的表格内容整理成了一个提示词模板,可以看到这边他将我的提示词转化为一个六十秒的提示词内容。但是由于这个片子总时长需要一分钟, 而我们平常使用的视频生成只有最长十秒,所以我对他说将上面的视频按十秒进行分配。接着他根据我十秒的框架为我整理出了一个精简版的运动轨迹,那么接下来我们就使用这个运动轨迹放入极梦 ai 来进行生成,看一下效果。 我们来到极梦 ai 的 首页,点击生成按钮,将下面的 agent 模式改为视频生成。在制作这个视频之前,我们需要一张手帧图,用来确定画面的基调。我们回到刚才的视频, 截取这张大远景作为我们视频的手帧,这可以很好的展示出我们的场景,通过截取这张场景可以明确我们的时代背景以及画面内容。我们对刚才图片进行上传,接着我们粘入刚才的提示词, 我们调整完提示词结构之后,在视频模型上面,我们选用三点零,使用首尾针结构。由于我们使用的镜头较长, 所以这里我们将使用十秒我们来生成看一下效果。可以看到视频已经生成完成,我们来看一下生成效果,可以看到他大致展示了我们的运镜效果,但是在最后的运镜过程中,对于人物的指向不是那么的清晰明确, 所以建议大家在使用这个运镜时,可以拆成两段视频生成,一个是视频运镜缓慢向下,到人物近景的时候接入下一个视频片段,让人物的指向更加的明确。 以上就是我们对于视频拉片得到的提示词,并运用了这个提示词,通过 ai 的 转化复刻了这个画面效果。 当然你也可以通过这样的模板套入自己想要的视频内容中,比如我复制这个提示词,我跟 ai 说 参考这个画面内容,并模仿这个提示词结构出类似的运镜提示词给我。我们来看一下他给我们的提示词,可以看到 ai 根据我们的提示词结构为我们生成了运镜提示词。 接下来我们导入极梦 ai 来尝试生成一下,看一下效果。我们将刚才的图片进行上传,接着我们粘贴提示词模型,选择三点零, 使用首尾帧十秒的运镜,让我们来看一下生成结果。好了,我们看到视频已经生成完成,我们来看一下生成效果,会看到画面从俯视角度缓慢推进,最后定格在一个中景,展示出小屋的形状,整体效果还可以。那么通过今天的学习, 希望大家知道了运镜的方式方法以及如何复刻,希望大家课后多多尝试,熟练掌握这个运镜技能。那么下节课我们会继续来学习 ai 视频, 那么本节课的内容就学到这里,我们下节课再见。哈喽,大家好,我是林默。今天我们来解决一个在 ai 创作视频中非常普遍的问题,那就是为什么我出的详细描述,但生成的视频在风格和人物上总是跑偏。我们先来看一个案例, 我们来看这个短片中我给出的提示词,像素风格电影质感的赛车短片。开场是一只戴着红色手套的手有力的拉下炫光蓝色的面罩, 通过多镜头的切换可以看到在车里面是穿着白色赛车手的马里奥,以第一视角,他驾驶着跑车在彩虹的赛道上急速狂奔。通过镜头的多角度切换,可以看到马里奥的侧脸近景。 从这个视频的结果来看,视频中并没有体现我马里奥的形象,并且在风格上面也属于偏写实风格,而不是像素风格,为什么会出现当给出的详细描述真诚的视频,在风格和人物上面却总是跑偏,这样的问题呢?我们再来看第二个视频, 从这个视频中我们可以看到,这一次我将主角固定为穿红衣蓝背心的超级马里奥,还是采用了像素风格。视频采用了多角度切换展示了马里奥的侧脸。从这个提示词我们可以看出,在生成的时候已经将我们的主角 从写实的人物换成了马里奥形象,但是对于像素风格上面,视频中并没有展示出来。从上面两个视频我们可以看出,尽管我们使用了非常详细的提示词,但 但是在纹身视频的生成过程中,对于角色形象的一致性和风格的稳定性控制力还是比较差,导致结果生成的随机性很大,每次生成就像在开盲盒。那么如何获得稳定高质量的视频? 答案就是使用图声视频。上节课我们对手征图这个概念进行了简单的了解,那么今天就带着大家使用这个功能来制作一个速度与激情的超级玛丽奥视频片段。话不多说,跟我一起来学习一下吧。首先我们将这个视频进行下载, 接着我们将刚才的视频放入剪映,导入剪映之后,我们可以在播放器的上方有一个三条杠,点击三条杠之后可以导出竞争画面,我们将这张竞争画面进行导出,接着我们来到极梦 ai 的 首页,将 agent 模式改为图片生成,接着导入我们的图片,那么我们在生成视频之前, 可以先将这个图片变成像素风格,这样可以让我们在生成视频的时候保证图片风格的一致性。来看我这边的提示词,这里我将图片转化为像素风格, 其他保持不变,选用图片四点五模型,比例选用十六比九。我们来看一下生成效果,从画面效果可以看出,他已经将我们原先的三 d 卡通转为了像素风格。接下来我们就使用这张图片来作为我们的手真图。首先 我们要对这张图片进行处理,可以看到左上角有一个重叠的 ai, 为了让生成的效果保持最佳状态,我们需要对这个地方进行修复,我们使用局部重绘涂抹这个位置。提示词方面我们可以写去除水印, 修复画面,我们点击生成,可以看到此时的图片已经生成完成,我们就利用这张图片作为手帧图,我们点击右下角的生成视频, 将这张图片放入手身,接着我们将提示词导入,我们优化一下提示词,我写了像素风格,马里奥驾驶的一辆车头有 m 标志的红色流线型跑车,其他的保持不变屏,我们选用三点零快速模式, 使用的是首尾帧生成一个十秒的视频,我们来看一下生成效果,从画面的生成效果可以看出,像素风格保持的并不是很好,这可能是极梦 ai 这类视频模型训练数据上面风格泛化的不够,像画面中呈现的三 d 卡通效果。不难看出 在海量的 ai 视频训练中,主要使用的是三 d 的 像素风格,在训练数据上面占比比较少。 当模型看到我们的像素风格手征图时,他会尝试理解其中的物体空间和场景,但是由于他学习到的像素风格比较少,他会在运用时自动调换成他最熟悉,数据量最大的模型来填补这个运动信息。 所以我们在生成像素风格的视频时要注意多角度,这个切近非常吃模型本身的像素级, 这种风格在单帧中非常的坚固,很难在连续帧中保持绝对的像素一致性。当你发现这个平台没有办法保证像素风格时,我们可以通过换一个平台来尝试一下。我们将这段提示词进行复制,接着我们来到可灵 ai, 我们使用可零 a 的 视频生成,将刚才的手帧图进行添加,接着我们粘入提示词,这里我增加了提示词内容,如等距像素艺术、复古游戏风格保持锐利的像素边缘,其他内容保持不变。模式我们选用标准模式,视频选用十秒视频,我们来看一下生成结果。 从视频画面中可以看到人物的像素风格保持的非常良好。视频也从单镜头切换为多镜头展示, 很好的展示了马里奥在路面上飙车,特别是车头的位置,像素的风格保持的非常稳定,最后我们来个总结,从上面的例子不难看出,目前 ai 在 生成视频中, 想让物体既保持笔触颗粒感的画面,又要涉及复杂的运动视角和物体的变形,风格的流逝几乎不可避免。这里给大家一些小建议,当你的风格不能很好的保持时,可以多尝试几个不同的平台, 不同的平台生成的效果不同,模型的能力也有所不同。除此以外,你也可以尝试先不使用多角度的贴近,只生成一个简单的平移或缩放的十秒视频, 看一下像素风格能否保持的很好。如果可以的话,那就证明多角度是导致三 d 化的主要原因。你可以在这个基础上结合更多的风格化提示词,如保持锐利的像素边缘,像这样的提示词话语来加强画面在生成时候所呈现的效果。 目前 ai 视频还处于快速发展中,对于高度特定的风格化控制仍然是当前需要克工的一个方向之一,所以大家不用担心在后期的模型升级中会逐渐优化。希望通过今天的演示,让大家对 ai 视频的深层多了一些知识点的掌握。本节课的内容就先学习到这里, 我们下节课再见。哈喽,大家好,我是林墨,今天带大家来做一个有趣的萌宠走秀换装类视频。我们先来看一段视频, 从视频中我们可以看到角色在优雅的走秀,在走秀的过程中丝滑的转场以及服装的更变,氛围直接拉满。这一类短视频在赛道上可变性比较高,画面感强,很容易吸引流量, 接下来就带大家一步步实操,快来一起学习一下吧。核心的逻辑是以一只萌宠参考图为基础,搭配精确的提示词,然 然后用图声视频的工具生成四个连贯的风景,每一个风景实现服装与转场的切换。那么话不多说,我们先来看第一步操作,首先我们要确定一个核心萌宠,首先我们将这张图片进行截图,然后我们来到豆包, 将这张图片进行上传,我对豆包说客观的描述这张图片,给我出提示词好了,我们拿到了这个提示词,之后, 我们将这个提示词放入极梦 ai, 我 们进入极梦 ai, 将 agent 模式改为图片生成,接着我们放入刚才的提示词模型,我们选用四点五比例选用九比十六,让我们来生成看一下效果。图片已经生成完成,我们来看一下,可以看到此时的图片 已经生成完成,效果非常的不错。接下来我们点击生成视频,我们将这张图片作为手帐图,然后我们输入提示词来看到我这里的提示词是模特在 t 台匀速前进,每步无缝衔接,换一套男装,动作连贯无卡顿,第一套给的是街头潮流,第二套给的是未来积分, 第三套给的是英伦绅士,全程正脸跟拍,突出时装细节和走秀动态。这里我们选用的模型是三点零 plus, 视频生成方面选用十秒,我们来看一下生成效果。视频已经生成完成,我们来看一下效果, 从视频 效果来看还是不错的,人物场景都没有变,但是随着着装后面的背景出现了变化,接下来我们进行下载,我们再来看第二条视频生成,可以看到第二条视频进行了变化,我们可以将两条视频进行下载, 看到此时我们就出现了两个视频,接下来我们可以选择一个视频导入到剪映,我们来看一下哪个效果好一点。从两个视频可以看出,第一个视频是在单个人体上直接无痕换装,而第二个视频人物进行了转场,个人认为第一个视频会好一点。我们将第一个视频直接放入剪映,接着我们给场景进行配音, 来到剪映的音效库,选择一个卡点音乐,我们点击试听一下,比如这一个卡点音乐,好的,我们把音乐添加完成之后,点击音乐,可以看到在上面的选择框有一个添加标识,我们点击添加标识,会出现两个踩点节拍,我们点取第一个踩点节拍,就会出现四个标识, 那接下来我们就将下面的节拍和场景进行进行一一对应,这里我们需要手动调节一下,接着我们将视频调速变快一点,让他跟节拍正好对应声音,这里我们选择弹出。好的,我已经调整完成,让我们来看一下最终的成片。 好的,那么通过今天的学习,我们掌握了这个知识点,下课后大家可以自己去尝试一下,期待你做出满意的作品,那么本节课的内容就先学到这里,我们下节课再见。

吉梦 s 二的排队从两万、三万、六万、十二万到现在的不显示,虽然 api 还没开放,但有不少人在利用 s 二开始爆量,所以才这么慢。偶尔还能看到某著名垃圾 ai 软件和某黑牛工厂不时出来嘚瑟一下。 虽然他们两个月前还很风光,但感觉已经是上个世纪的糟货了。还有好几个傻不拉几的公司国内卷,不过又说要去卷,海外 又有一堆各种真真假假、来路不明的海外 ai 漫剧订单发往国内。海外肯定要做,但不是现在,不要在错误的时间做错误的事。 ai 漫剧行业越卷,一些人就越蠢,因为他们总想找一个舒适的逃避方向。我不明白这个世界什么时候逃避能落得好下场。 你越害怕 ai, 就 越会被 ai 所吞食。现在 s 二既没开放, api 又卡的要死,整得大家怨声载道。但即使 s 二变得不如开始那么好用,也没人愿意离开 s 二。因为和 s 二相比,其他 ai 视频软件形同猪食, 人饿急了才会捧起猪食对付两口,许多人幻想其他软件会赶上 s 二成为代餐。我不这么看, s 二最强无敌的一点是,他知道什么是好什么是坏,且能第一发就给你一个还不错的。 s 二大概率是把字节巨量数据进行了量化,特别是利用了其推荐算法。你可以理解为 s 二之所以如此强大,就是因为站在字节超巨量推荐算法成果的肩膀上。 也正因为如此,所以 s 二可以远远拉开和一众杂鱼 ai 软件的差距,且随着时间流逝,在终点前这种差距只会变大,不会缩小。 目前最接近 s 二的是可林,但还是差了很多。现在整个工作流程中,只有 banana 和 m j 还没有被替代。 m j 出图, banana 修图,人设厂设,结合新格式剧本直接丢 s 二出视频,制作流程越来越简单,节后看到最愚蠢的人和事就是各种小看 s 二能力的言论, 什么 ai 出的角色表演不生动,觉得 ai 剧替代不了真人剧。 s 二出的第一天我就说了,直接丢新格式剧本,结合人设厂设就能出视频,至今还有不信我都跑了。五种文本格式测试如何直出视频,还有傻子只把 s 二当做海螺的升级版用, 这些傻子觉得 s 二只擅长做动作戏,不擅长文戏。殊不知 s 二完全继承了吉梦的传统,文戏比动作戏强无数倍。动作戏依然算 s 二的短板,只要剧本格式正确, s 二视频中的人物演技已经能达到电视剧级别,完全碾压普通短剧。 ai 慢剧走到今天已经淘汰了三波人,这些被淘汰的人并不能说是能力差,而是认知差。九月底有二货说什么数量重要,质量不重要, 竟爆量抢占市场。信这个的十月十一月死了一批,我那时候说作品质量很重要,不要做垃圾,要做精品。十一月下调沙雕系数,我说沙雕渡劫,但许多人将只限红果,不影响端元生,结果十二月亏个底调。而我从十一月下半月以及十二月疯狂说的就是做真人 ai 解说类真人 ai 被爆砍系数后,还有人依旧觉得影响不到自己,但一月爆赚的玩家都非常痛快的转型了, 越是做不出爆款,没赚到钱的就越是不信邪,这个行业下个机会点在四月,要么五月,在此期间依旧会不断淘汰犯傻的人,现在就踏踏实实做三个月真人 ai, 只要有实力都可以获得丰厚的回报。