再来看 i 土微工作流,也就是 image to video, 用一张图片生成视频,这里需要额外上传一张图片作为参考,除此之外,其余参数与文声视频的设置基本一 致。极重约罪意的闭上眼睛扇动石棒啊! 如果本地推理模型无法满足需求,想要更精致的画面或者本地算力不足,可以直接使用 api 来调用更高级的模型。 ltx 二 pro 版本,点击左侧的模板选择视频, 在使用视力中选择 api 搜索 ltx。 这里显示的两个工作流对应的就是咬 tx 二 pro 版本的模型调用, 在这里可以一次性生成最长二十秒的视频,分辨率最高支持到四 k, 帧率可达五十帧。 相比本地开员工坐流,它在画面精度、持续稳定性和复杂运动表现上更有优势,同时不受本地显卡算力限制,整体操作也更加简单,不需要配置和理解大量复杂节点,更适合直接出成片。 我生成的这段十秒五十帧四 k 的 视频一共消耗了五百个积分,折算下来大约两美元,值不值你们可以自己判断,欢迎在评论区说说你的看法。 生成的视频默认都会保存在跟目录下的 op 的 文件夹,如果你想自定义保存路径,可以用记事本打开启动文件, 把倒数第二行里的这段代码替换成你自己设置的绝对路径,下次使用时生成的文件就会自动保存在你指定的路径。以上 ltx 二的使用方法送给大家,感谢观看! next time。
粉丝1.5万获赞15.0万

哈喽,大家好,欢迎来到大同的康复爱系列教学视频,今天这期给大家带来前两天刚刚更新的 ltx 二点三视频模型,这是一个本地开源的音画同步音画之初的模型, 次出的二点三这个模型会比之前好了很多啊,至少在很多场景下是可以使用的。这期视频我会介绍一下啊涂声视频的用法,我觉得纹身视频没有什么太多的用处,那我会讲一讲它的使用方式还有优缺点以及使用的一些经验。首先这个工作流和所需的模型我都会放到网盘当中,然后也会尽快的上架到云飞的 镜像上面,让大家可以直接在线体验,因为这个模型所需要的配置需求还是挺高的。我们可能之前在二点零阶段会看到这个模型,说是十二 g 就 可以跑,或者八 g 就 可以跑,然后有人说他又速度很快 都是对的,但是把他们放到一起就是有问题的,显存需求低和速度快是绝对不太可能兼容的,他们都是取一个极端,我给大家看一下实际的占比,我的本地四零八零十六 g 显存加九十六 g 内存, 常规跑的时候基本上就是这样,内存全部都是占满的,第一显存能跑,实际上就是把你的虚拟内存开到极致,这种情况下速度一定是快不了的。那如果你的显存偏大一点,那我们就不需要有这么多虚拟,这个时候我们的速度就能快起来, 我跑一个这样的五到八秒钟的视频,甚至比万象二点二还要快两分钟左右,而且这些速度和显存还是要在你的分辨率,要看你跑的是多少分辨率,要看你跑的是五秒还是十秒还是二十秒,这个绝对是不一样的。 总结一句话来说,如果你的显存也很小,内存也不大,这种情况下即使能跑也是非常慢,所以这是个前提啊,优先还还是推荐大家去云端跑。然后呢,接下来看看它的效果,一些运动幅度不大的,这些带台词、台声音的这些场景,我觉得效果都很不错啊。比如像这个, 你看这棵松树,是我爷爷亲手种的,已经有几十年了,它的清晰度非常高啊。我这里跑的是长边,是九六零的分辨率,最后生成完了之后,实际上就是幺九二零的分辨率,包括这条,女人,不需要别人定义,做自己最美。 像这种呃,镜头运镜幅度不大的,这种情况几乎不需要抽卡,效果都不错。但是呢,如果你想镜头稍微大一点,就会出各种各样的问题呢?我这里还跑了一些,这个声音,我们就不放了,看看其他的,有些还是不错的,总体来说一定是一个可以玩一玩的模型。 另外有一点就是大家千万降低对人物一致性的期待,如果你的图片是一个真人,或者是现实生活当中的人,那传进来一定会非常容易变脸。如果他是个 ai 人,那我们看不出来的状态下,觉得还是不错的,快,他要追上来了, 那生成的速度,中间这几条别看啊,这里显示的一千多秒,这个是我一边录屏一边在跑的时候卡在最后的捷码,卡了很长时间,这 正常来说的话,这个地方的五秒用了一百二十一秒,标准的两分钟,十秒的视频用了四百一十八秒。那 接下来呢,看看这个工作流。首先我的模型是用的官方原版,没有用 kj 那 一套,我觉得官方原版这套好像质量更好一点,用的是 f 一 八模型,满血模型我本地十六级就跑不了了,到时候在云端的话,大家可以用满血的模型去试一下,我感觉效果应该差不了太多。工作流用的也不是官方的在模板里面的那个 l t x 二点三,而是用的这个插件。如果我们要使用这个流程的话,要安装一下插件 l t x video 这个插件它是专门给这个模型所写的,这里面自带了几个工作流,在那个基础上面去改的,我觉得它的效果也是相对比较好,连接已经算是比较简单了,因为这个模型也是先跑初时的,然后再放大,所以这个 流程少不了这部分加载上所有的模型。然后呢,这里是我们之前一直用的这个交换块的这个节点,如果你的显存不是特别大的话,这个是一定要加的。然后后面这些东西大部分是不用动的参数,这里呢我我写成一个,这样我们就不要自己去填宽和高去算你的图片比例了,直接用这个按宽高笔缩放,这里的 分辨率我建议就把它在九六零或者最大是幺零二四,再大就没必要了,因为最终出来的尺寸实际上是它的两倍。然后这个地方我直接做了一个数学表达式啊,我们就不用算什么 n 加一八, n 加一四, n 加一,直接在这里填入描述,那它会自动转成帧数。 提示词是这里面非常非常重要的,网上也有各种大佬分享了自己的提示词经验啊,如果大家不看这个结构的话,给大家几个最基本的标准啊。第一个肯定要是英文提示词输入,因为这是个国外模型。然后第二, 不要写太多的,这个氛围类的,感受类的,一定要写具象化的,有什么动作,有什么展现,一定要具象化的写出来。剩下就是一些标准的质量词,尤其是镜头连贯等等的这些效果。然后我在这里写了一个智能体的提示词,把这个东西给你的任何的大元模型,再输入你的图片, 你可以告诉他你想要的这个运镜的幅度以及预估的时长,我们要跑几秒的,然后把台词给他输入进去,如果你不输入,他就会随机根据你的情况给你生成一句台词,那我建议大家都不要运动幅度太大,因为很难得到好的画面。 ok, 那 内容就是这样,大家可以尽快去体验一下。

让我们体验一下 ltx 二点三的效果,也不知道这次 ltx 二点三能有多大提升,心里还是有点忐忑。 let's experience the new ltx 二点三 model together it has made significant progress compared to ltx 二点 o。 春风十里,不如与君共赏人间烟火。 哈喽,小伙伴们大家好,那么刚才片头那些视频呢,全部是 f t x 二点三刚刚生成的哈,那么也是今天开源那个最新的视频模型, 通过这个一段使用呢,就是生成了大概几十组片段吧,也发现了它的一些特征哈, 首先说怎么去使用这个模型哈,啊,第一步呢,就是先更新我们的康威到最新版,那么就支持了这个我们的二点三的 ltx 版本,那么接下来就是要下载我们的模型,那么模型呢,大概有两组哈,第一组就是 ltx 官方给到的二点三, 跟我们之前的二点零的版本那个模型放置非常一样啊,非常类似的。那么 lts 官方这个模型呢,它其实跟我们之前二点零那个模型的放置呢,是比较类似的啊,我们看一下这个模型啊,同样是有一个主模型,是个 dv 版的主模型,然后还有一个蒸馏版的 laura, 然后还有一个蒸馏版的主模型,这两个模型呢,主模型都是四十多个 g 啊,都是四十多个 g。 然后还有就是说我们的放大的模型哈,就是这个放大模型分也分了两个, 还有一个方法呢,就是开架呢,它已经给了一个自己分离的模型哈,就是我们之前的 l t x 二点零也好,它的模型都是包含了 v a, e 和 clip 的 这样一个模型啊,那么开架是把它进行了一个拆分,这两种模型都可以用, 如果用的话呢,就是开架这个版呢,就是要用我们这个呃 diffusion model 这个加载器来加载哈,然后用单独的 ve 还有这个呃 clip 加载器去进行加载。那我这边就用的官方这个啊,用的官方这个。 那我们分了两组测试,一组是这个纹声的,一组是图声的哈。首先说一下纹声的,我个人感受就是它的这个动态,包括这个破音, 破音是解决的哈,就是破音问题已经没有了啊,我跑了这么多组,再也没有遇到过他的音频破音的这样一个现象啊,就一直都是出了正常音频的。 然后就是他这个动态呢,有了大幅度的提升啊,包括我们可以看看这组这个呃,拳击这个哈,他这个动态做的非常好,包括运镜、切镜哈,我觉得在开元里边算不错了,虽然他还是有瑕疵的,但是我觉得已经很不错了哈, 包括我们看一下这个赛车这个也是啊,他这个运镜的一个整个的效果也是非常好,非常合理啊,但是看了他还是有一些小问题,他容易出现那种斑点,就是有点像那种大果粒的一个样子哈,我们之前在浑源上面见过这个东西,那么这组也是哈, 我们看他的一个动态呢,其实在车里边动态表现是非常好的,但是还是说我们这个场景呢,会稍微有点这个大果粒哈,其他的像这个风光的 这组呢,我觉得效果也不错啊,而且画质也很好啊,对吧?画质也很好,都没什么问题,而且十秒的啊,十秒的, 你再来看这个,但是他的二次元呢,我觉得是不太好啊,二次元我们看一下,这个效果我觉得很差了,不建议大家跑这个纹身的二次元哈,我建议如果要跑二次元的话,尽量去跑图什么的。还有就是说这个写实的一个人物在海边,这个哈,他的整个的音画同步做的是非常棒的啊,非常棒的。 然后就是拳击这个还有这个一个大场景呢,我们看一下哈,这个赛博朋克城市风格的哈,也是表现的不错,但是画质就说他的动态稍微大起来,他的画质就会差一些哈,这个我发现无论是图声也好还是纹身也好,都有这个问题。 这个是一个鬼故事的啊,一个偏恐怖风格的啊,这个就运镜也好,他的整个画面的动态也好,我觉得都很好啊,故事型非常好。还有就是这个人物说话这个,这个其实效果非常棒啊,无论说话还有画质都非常好,因为他动态比较低嘛,就非常棒哈, 这是我们纹身的,那这里无论是纹身还是图腾呢,我建议大家注意一点啊,就是说第一点,我们这个蒸馏的 laura 呢,强度给他降低一些哈,就不要给他按一,不然的话他的画质会出现,就是我们人物会容易变老啊,变得 很脸部非常丑陋啊。就是如果你这个 lowra 强度拉成一的话,第二就是我们这个第二步呢,呃,放大这一段呢,我们用普通的 k 太阳去给它接过来哈,然后跑四步, cg 乘以一,然后降噪呢,可以拉低一些哈,比如零点三、零点四、零点五左右, 它的画质会更好啊,不然的话也是一样容易出现那个面部的一种呃,扭曲啊,狰狞感,就肌肉感特别强, 无论是 t 图 a 还是 i 图 a 啊,我建议大家都去这么调整一下。好,这回我们再来看看这个图上视频啊,图上视频的话,这个一个普通的图上视频 啊,就是这个人物坐在这个秋千上啊,我们会发现他其实也是有一点慢动作啊,慢动作,但是他的一个进步的点,我们比二点零时代好的。什么?就是说这种人即便面部占比比较小的情况下,他也没那么崩了啊,没有那么崩。好,我们再来看下一组例子, 这个就是人物说话的就非常自然了,我发现这个 rtx 二点三呢,他也是有概率出这个字幕的话,特别是在什么情况下呢?特别是在你这个视频说的中文的情况下,他就会容易出字幕,像这个视频的说的英文啊,他就没有出字幕 啊,我发现好多次了啊,那我们看看这段视频,他是用的这个出的中文的,他就出字幕了啊,也不知道这次 ltx 二点三能有多大提升,心里还是有点忐忑, 对吧?他就出现了这种字幕了啊,他就出了字幕了,那么这个也是哈,这个我们看看,也是束缚的,就是说这次二点三这个重大提升,就是他对束缚的支持也已经 ok 了哈,我们的二点零的时候,他的束缚支支持的其实不太好的哈, 也是哈,他因为是我们角色说的中文,所以他就出现了这种字幕哈,因为他只要是非英语的,他就容易出现这个东西啊。我们再来看看这种二次元的这个哈, 这个让他的运镜比较大哈,我们看到没有,这个旋转起来,他这个画质就差一些了啊,但是最后他找回来了,最后这个收尾的这个画质还是不错的啊,还是不错的,但是在中间这块我们能看到他的画质,明显是有这种果粒橙这种现象啊。我们再来看看这匹马的一个哈, 这个马在旷野上跑,这个说实话肢体动作呢,我觉得他这肢体动作有点不太合理哈,我们再来看看,对吧?他这个腿配匹配的不太好,而且还是有点慢动作,同样因为他的运动幅度比较大,他的画质呢,就是在草的这地方,这个画质呢,能看到有种颗粒感比较重哈, 但是最后首尾这个动感,整个运镜我觉得还是不错的,这运镜也是一个非常大的一个提升。我们再来看看这个啊,这个人物走在这海边的这个,这个也是啊,就像我刚才说的,他即便是人物的面部占比比较小的情况下,他也没有崩啊,也没有崩了啊, 而且这个说话呢,就是也符合我们这个,包括他最后这个字幕啊,他虽然出字幕,但是他还是非常努力的去写中文字幕啊,大家看到没有,能非常努力的在写中文字幕,他也在尝试去写,但是很多时候写不出来啊,写的字还是有问题 啊。那么这就是这个二点三目前一个应用的一个感受哈,他的基本的架构,包括整个工作流呢,跟我们二点零几乎是一样的,几乎是一样的,包括一些 laura 呢,也能够使用,但是它的效果呢,没有 在二点零上那么强啊,能有一点点效果,但是不够强。同时这次呢,康复腰的官方工作流也增加了这个 他提示词强化啊,就是前段时间康菲尔专门更新了一个这个文本的一个生成的一个强化,专门做了一个优化节点啊,就是用我们这个呃 jama 三这个模型,或者是用我们的千问三的这个模型,就能够对这个提示词进行强化啊,那么这就是整个的一个二点三,一个感受啊,就说他是有一些问题的啊,实话说他很多问题就是包括一些强动态啊,包括这种,我们看一下啊, 这种强动态的支肢体,他还是不够合理啊,对吧?他还是不够合理,脖子又拧了,是吧?但是呢,我觉得,呃, 他在某些在这种就是说运动幅度不大的这种运镜情况下,像这种这种哈,我觉得他的效果都不错啊,就是你只要运镜不够,不是那么强,他就没什么问题啊,一旦运镜幅度特别大的话,他就容易出一些问题啊,这也是目前他的一个限制, 目前它的一个限制,大家一使用的时候也注意一下哈。 ok, 那 么这个也给大家分享到这里啊,模型呢,我会把这个 l t x 刚才那两个版本就是非正流的版本,还有那个 laura 呢,还有呃,它的这个配套的模型都放到那个我们的 网盘上啊, running hub 上也会尽快部署啊,大家也去感受一下。 ok, 那 就给大家分享到这里。

今天我们用这台麦克迷你来安装这个最近很火的 open 可乐和这个可乐扣的这两个 ai 助理。然后我们在其实在自己安装的时候, 我们就会遇到一些问题,可能是网络问题,可能是呃,你这个电脑本身的环境问题导致安装失败,那我们这里根据这个视频来从头安装,然后这是一台已经重置过系统的一个麦克迷你了,然后里面的环境都是默认的, 然后我们这里是呃开始,接下来就开始啊我们这个教程。然后第一步我们先在这个 apple store 里边这个安装这个插扣的,然后我们这里是已经安装好了,因为他比较耗时间。然后安装完之后我们要执行一个这个安装这个工具类的命令, 这个是给我们这个 mac mini 装一些环境,装一些工具类想 get 之类的,这样我们在后面的命令执行过程中就不会报一些错误影响,这里复制错了, 用这个命令,然后在我们这个后面弹窗是让我们安装,我们点这安装。同意, 好,我们这个工具类已经安装完成。呃,我们还需要再安装一个这个安装包的这个安装工具的一个工具,它是 homebrew, 这工具就是在 mac 上你想安装开发中用到的 node 了, git, redux 一 些各种工具,它,你用这个工具它直接帮你安装好。 呃,也是会用到的,以后你的麦克上会用到的一个工具,如果你现在没有装,也可以直接装一下,这里多了一个二百,这个是错的,给它删掉。 好,开始安装这个工具也是需要一些时间的,然后我们这里要用国内的这个镜像去安装,嗯,选择这个一, 然后这个输入密码输一下,然后这 yes, 好, 开始等待安装,然后这个我们是输入一个回车等待安装。这个 很好,几秒钟安装完了,然后这里输入一下密码,电脑密码。好,这里我们选择这个五用它推荐的这一个。 好,这里开始安装了。 很好,我们这里安装好了, 这里我们根据这个提示看一眼,我们这个命令是 pro, 这个直接岗位就可以看版本,本地安装一个东西就直接 pro install 这个 安装了什么?就 ios, 然后安装充充进内存后运行 sos, 我们这里重新加载一下这个配置文件,不重启,这个中断了就关了,再打开,就这样了。好,我这里测试一下安装是否成功,能成功。 好,这里我们的基本这个基本环境准备好了,然后接下来就是这个网络问题,这我们要自行准备一下这个科学上网的东西,然后这里是给我们这个网络加一个代理,给我们这个麦克这个网络全球的时候走一下这个代理。 呃,先配置一下,然后我们现在是没有开代理的, 我们先走一下安装,如果能安装就可以,如果不能安装就我们就开下代理。第四步安装这个 note。 好, 可以安装,我们现在是没有开代理的, 这个命令是执行之后,是当前这次它生效之后就不会再生效了, 关了这个中断之后,哎呦,我们这个 n m 安装好了,好,看一眼,嗯,它的版本好,已经可以了,这里我把这个 n m 这个呃给它加入到环境变量里面, 这样我们重启电脑之后,呃,也可以,就是在任何路径下都可以输入这个 n o m, 就 直接找到这个我们安装的工具直接使用了, 这边写入一下配置,让它重新生效, 对比一下这个配置文件,这个这个文件是我们的工具的一些环境变量会塞里面,这个不用看了。 嗯,安装好了,接下来就是我们的 note 也安装好了,接下来就直接执行命令,安装我们的这个 clock code 或者 open clock, 这接下来就应该不会再出什么问题了。好,我们现在开始安装, 我们这里是安装完成,我们测试一下这个命令, 测试一下是完成了。好,直接安装完成,我们再安装这个 openclock, 很 显然这个命令是不对的, 看一下官网 这个命令,这里我们用这个 npm 的 方式吧, 跟这个保持一致。 close 口的安装方式保持一致,这里是打错了,这个接口地址插错了 再安装。 我们这里 open close, 这个安装时间有点长,我们换一个国内镜像来试一下,我们这里按这个 ctrl ctrl c 来退出这个。安装好,我们这个当前的,我把我们的这个当前的 note, 这个安装的这个 圆镜像圆给它改成我们这个国内的淘宝的在这儿。好,我们这里再执行一下。安装 好,我们这里 oppo 可乐也安装好了, 看一眼这个版本,啊,好,没问题。好,接下来我们这两工具都安装好了,其实这个教程到这里已经,呃,差不多了,就最困难的地方已经做完了, 其实到后面这个接入这个 api 就是 具体使用的话,呃,你可以自己研究,然后我们这里这里也可以直接就快速的让你上手一下,我们就注册这个制服 a i, 这个不是打广告,这个是因为它就是它会你新用户会送你这个头肯,然后能够直接用。然后这里我们我已经注册过了,然后你们也可以注册一下, 按住 c r k, 这里,呃,我们创建一个 k, 添加一个 k, 然后这里是一个作用啥的 作用,然后这里有这个 a p i k 了,我们就配置的时候,就我们的这个两个助手就可以通过这个 a p i k 调用我们给它设置的模型,然后呃就给它就能够正常使用了,给它相当于给它装上大脑了。 然后你也可以点击我这个链接就进行注册,也可以自己注册。好,接下来我们就先说这个可乐扣子的这个接入使用吧, 它这个,呃,其实这两个接入的接入 a p i 的 接入 a p i 的 就这个方式,我们在这个它的这个官方文档里面, 呃,就有这个说明你,你也可以跟着我这个操作,也可以,你要想自己想要更多的操作,就可以看他的这个进入文档里面的这个说明了,他这里也算详细。好,我们现在先说一个。 先,先我先给你上手一个可能是我们没有说实话的原因,我们这里直接先进入一下这个工具类再说, 我们看这些有没有这个配置文件了。好,已经出现了,这里我们做一下配置就可以了。好,进入这个 它这里还是没有这文件,但是我们这里就直接呃开始编辑,直接开始操作,在这里复制 点击,然后我们按键盘上的这个字母 i, 好, 它变成下面变成 insert 这个,然后我们这里把这个配置放里面,然后这里直接用这个整理好的多了一些东西的这个 里边有几个模型,然后这里再粘过来,然后按一下键盘上的这个冒号, 然后输入 w、 q, 好, 进入退出了。接下来我们再进入这个,开启一下这个完成导入的这里,这里是 cd 点点返返回到我们的这个用户目录,然后这底下是有这个文件,是有这个文件的,我们直接编辑它点解锁这里,我们按回车,然后 ai 变成 s 到可以输入之后,然后我们把这个 设置里面这点一下这个按钮的复制,然后这里粘贴,把这两个箭头去掉, 粘贴过来之后就按一下回车,这样让它确认我们刚才粘的这个东西,然后这里我们要加一个逗号,这里要加一个逗号, 好, esc, 然后输入这个冒号 w 退出,好,我们这里再进来,再输入这个 c、 w、 d, 它这里就会提示我们这个做一个工作目录,我们用它用这个当前用户目录做这个工作目录,它可以操作用户目录下的数据,往这里输入一下确认回车。 如果你是自己工作电脑就慎重一点,这里是一个我这个是不咋用的电脑,然后这里开始他说这个设置错误,就能够得到数据, 看一下我们的那个设置哪里不对, 好,我们这里 这里有提示了,就是说要设置一下你的 api k, 我 说的你没有 api k, 你 怎么用这个东西呢?加了这个感叹号,对吧? 好,我们这里去复制一下,我们刚才在制服里面设置的可以复制粘贴 esc, 然后返回退出 我们这这再执行一次,先这个文档回,这还是错误,继续,没有继续使用, 这次我们测试一下, 在这里是让我们登录门是不能登录的,因为我没有,没有这个账号, 这里我们直接退出就行,也没有用, 退出, ctrl ctrl c, 键盘上 ctrl c, ok, 好, 这里还是正常来说,这里是应该直接能用的, 但这里不让用,肯定是我们的这个配置哪里设的不对, 可能我们的配置没有生效。关闭这个终端,再打开 这里其实是之前已经走过一次,已经操作过一次了,然后一些步骤是可能就忘了,然后这里我们回这 还是失败。 用它的这个方式试一次, 这里把内容清掉, d d 在 键盘上的 d, d 点出来粘贴,这里复制 这保存退出,关闭一下,再打开这里是完成这个触式画,我要改一下, 我们这里是已经,其实已经已经加过了,那我们这里不应该再加了, 这次保存退出关闭中断,再次打开。好,是不是可乐的回吃, 还有这就是刚才那个多了一个逗号,给去掉, 没有问题, 就跟着文件一会好一会不好。哎,我们这次不一样了, 很奇怪,它这个刚才什么也没动,它这里就好了,我们直接开始 选择我们这个风格,代码风格经过人的就行,然后这里让我们继续,这里是 cloud 的 这个 新手,这个触手画设置输入一下回车,这也是要求我们这个 输入一下回车。先生,文件,这里我们试着访问一下 配置成功了, 好,我们退出 ctrl c 整体步骤,要操作的步骤就是两个, 就是一个是在我们的这个引导文件里面加了这个完成引导,但是我们加了之后 他就会说一些错误,然后我们又把他给删掉了,删掉之后他就提示我,就,我就选择了那个 重新这个引导,然后我们再进进来的时候让我们做这个引导。然后第二步就是我们做了这个配置,我们的这个 api k, 它这里是我们重新引导之后, api 是 没有改变的,所以这里我们进来之后能直接用。然后还有我们这个要加一个加个内容,我们这个 它这个是我们刚才用的模型,是可以自己调整的, 我们这里把这几样复制一下, 点错了 可以看一下我们这里用的是什么模型? 钢镚的用的模型,然后这里我们是用的 三点六, 但这里默认的应该是某个模型,这里我们给他配置一下,我们配置好这个东西之后可以我们想用谁就在这里改成是谁。我现在先退出 改一下这个文件, 在这里我们粘贴一下这个, 这里记得加一个逗号,要不然它要截屏错误,这里多出来一些空格, 我们保存退出,退出中页加载这个从打开终端,现在我们进入这个可拉的,然后这里这里其实我们用的是四点七 这个模型,刚才是我们没有提示的, 这里我问他你是模型, 咦,测试一下刚才我们用的是什么模型? 把这一下删掉, 感觉这里应该不用打开,重新打开中间这里 他这里是四点六克拉特,四点六应该是一个免费的模型吧, 我们是没有购买这个订阅这个模型的,若他给我们收费,那就麻烦了, 还是配置好,这个 现在已经可以使用了,我们可以直接说中文, ok, 可乐扣头安装完成,接下来我们用这个 安装这个 openclo 的, openclo 这里操作步骤有点不一样,然后可以直接先跟着我们这个操作来这里,我们刚才是用 npm 安装好之后还没有那个操作,我们这里用这个命令通俗化一下, 然后用这个制服的,它是有专属的,这个那个选择的,专属的选择,看,这里, 这里是助手啊,我们选择这个意思,这里我们选择第一个,然后这里就开始不一样了,这里根据你买的那个 api k 你 自己选,然后这里我们用的支付的就要选这个 z a i。 回车,从这里选择是第二个,根据我们的这个提示。回车,这里我们是 回车,用我们的这个 ip i k, 好 战绩。回车,好,这里让我们选默认的模型, 嗯,用个别的模型,请点这,我们的 k 一 百二十八 k, 可以 用这个格拉五看最新的吗?回车这里让我们选择这个 通道,欢迎跳过, 这里是配置 key, 这个我们不要,那个是工具类之类的,可以帮你做一些东西。然后这里是让我们开启 hok, 不需要,我们先摁一下空格。回车,好,这里我们他旁旁边,这是网关,网关安装没允许, 这里是让我问我们怎么使用我们的机器人,我们可以用在这个外部网站使用它,也可以在这个呃,小黑框终端使用它就是当前的情况, 个人写好,我这里是先用终端试一下回头,回头你也可以启动的时候用这个 f u i 回车。那有没说 进入配置 不用格拉宝五了? model 选择 model 回车。 对,这里选择它,它我们这个也可以,就是用它 准备用这个 a a r。 好, 选择打开方式。 好了,我们这里切成这个四点五就可以用了,我们这个面点五不能用, 这点我们算是整个教程结束了。 好的,剩下就是你自己去就可以再自行去研究发掘它的这个使用方式,拜拜。

哈喽,各位同学大家好,欢迎来到数字折叠,那我们之前的本地 ai 视频生成的课程用到的大模型都是万二点二, 但是万二点二的话呢,他就只能到二点二了,他有二点五,二点六也不会给大家本地开源使用了,是要去做一个线上的收费的。就在大家认为这个开源模型将要进入到一个停滞不前的阶段的时候, 咱们的 l t x 啊,这一家以色列的公司给大家开源了二点三的视频生成模型,那 这个模型相比较于万二点二,它有一个比较大的优势啊,它是可以音画同出的,也就是说我们可以出来一个完整的带有声音的 画面的视频,不用我们后期再去重新给它对口型做这个音频的一个合成了,非常的方便,也比较符合现在的一个 ai 的 视频生成的一个趋势吧。那么我们如何去使用它?对于电脑的要求是什么样子的?我们如何在本地成功的去部署它,那这节课我们就要给大家去讲了。 那首先我们来看一下啊,我使用这个 ltx 二点三制作的一个小效果吧, put your hands on the arm here open your legs not too much there you'll see why i like that very much do you want me back? ok, 那 大概就是这样的一个效果,我们可以看到它的分辨率是很高的啊,我在后期对它进行一个放大,但是我们一次就可以直出一二八零乘以七二零分辨率的视频, 并且的话呢,我们这个视频的帧数率是支持二十四帧或者二十五帧每秒的,它的时长也可以达到十秒甚至以上,对显存的要求也没有那么大,我使用的是 四零八零十六 g 的 显存,然后六十四 g 的 内存就可以跑这个效果了。那如果你的电脑比我还好,我相信它可以在一分钟之内就可以跑出一个五秒钟的视频。 如果你是十二 g 的 这个显卡的话,你可以试一下,因为我没有试过啊。那如果你的内存比较低的话,你也可以设置一个虚拟内存,这样子就会让我们的这个跑起来没有那么大的内存的压力。 那我们看完效果之后,我们来看一下怎么样一步一步的把这个效果给它复刻出来。那我们第一节课讲的就是工作流的部署, 如果你从来没有使用过 comui 的 话,你还需要先去下载我们的 comui, 然后再去给制作我们的 ltx 的 模型的工作流。 如果你不想去折腾啊,你不想一遍一遍的又配置环境,又要用这个代码去调配拍摄的各种模块,还要自己去下载工作流,安装插件,然后优化节点, 解决报错,这是所有的非程序员出身的人来去使用本地 ai 的 时候遇到的问题。那么我们数字折叠给大家提供了一套完整的开箱即用的软件,就是 comui 的 整合包,加上我们的这样一个 e f studio 的 工作流操作工具。如果你是我们输入折叠的会员的话,你可以用我们这个工具,如果你不是会员的话,你可以直接用我们的 comu i 自己去部署这个工作流。那么我们来看一下一步一步的一个操作过程。 首先的话呢,我们的 comui 整合包是可以在我们的网站上去下载的,我们首先可以进入到课程这个页面,在我们的课程页面里,我们点进来这个 ltx 二点三的课程的主页,在课程主页里面我们可以看到这边有一个这个配置链接, 首先第一步你就去点击这个 comui 的 整合包,把这个 comui 整合包下载下来,我们现在使用到的是这个零点一六点四的版本, 里边的环境是库达十三加拓十二点九,也就是说你首先要去升级你的这个显卡驱动,能够支持我们的库达十三,然后呢再去安装我们提供的库达十三点幺的这个库达驱动, 那么我们这个详细的部署的视频是在这里的,你可以到这里去下载部署一下,只不过我们这里边是十二点八,你只需要把我们的库达变成一个十三点一就可以了,如果你不是三维用户的话呢,那个侯蒂尼的安装你也可以自动的给忽略掉啊,就前期先去适配一下这个库达环境, 然后下一步的话就是安装我们的整合包,然后把它解压出来,放到指定的位置,就可以把这个软件打开了,下面给大家去看一下如何去打开咱们的这个软件啊?在你没有安装 cd 的 情况下呢,你进入到我们的 comfui 里面, 然后双击我们这个英伟达 gpu 的 bat 脚本命令,就可以把我们的 comfui 给启动起来了, 在启动的时候的话呢,大家可以再继续去下载第二个东西,就是我们的 d f studio, 我 把所有的工作流都配置好放到里面了,那这个 d f studio 的 下载链接的话,也可以直接去打开它 到这里去下载就行了。那它的一个部署的话呢,你可以看我这边这一个县城文学的课程, 这个课程上面的话呢,我们的第二节有一个部署的教程,你只要把这两个东西部署完,后面你就非常开心的去玩我们的 comu i 在 本地可以零成本的去制作各种 ai 的 一个效果了啊,这是我们的一个前期的部署, 如果你是老用户的话啊,你可能之前已经安装了我们的这一个数字折叠的 comui 整合包了,只不过你的整合包目前不是十六点四或者不是扩大幺三的系统,你就根据我们的下面这个部署教程去重新的升级一遍就可以了,你就不用再去安装其他的环境了,只需要去替换一下里面的这样的一个 is embedded, 还有我们的这个插件,还有我们的本体就可以了。那替换完之后,再把你老版本里面的你之前下载的囤积的一些大模型给它直接剪贴到我们新版本的模型文件夹里面去就可以了,这是一个比较方便,不用折腾环境的升级方式。 那现在我们看到 comui 已经打开了,那我们就直接进入到咱们的 df studio 里面去吧,我们打开我们的控制软件。 好的,现在这个控制软件我们就已经打开了啊。首先我们点击这个视频生成,里面我这边提供了有三个 l t x 二点三的工作流,分别是音画同出的图声视频,还有音画同出的文声视频, 在这个声音生成里面还有一个自定义音频的一个 l t x 二点三的图声视频的这个工作流,这三个工作流是我们要用到的, 我们今天先要给大家去讲的是这个 l t x 二点三图声视频,就这个咱们的工作流,那在去使用之前,你要下载 l t x 二点三的模型啊,我们可以直接点击查看介绍, 我们进入到这个介绍页面,我们可以看到这边有一个模型下载的链接,看到没有,你直接点击模型下载链接这边我就提供了我们的这个三个工作流共用的 一个模型,就一套模型系统吧,它的一个文件的路径我也给大家在这里梳理出来了,比如说在 models 里面,然后 different models 里面下载这一个可立普里面下载这一个 ve 下载这俩,是吧?还有放大模型,然后你就直接可以点击这个百度网盘啊,我们这个模型都是 开源的,免费分享的,在别的地方下也是可以的,没有关系的啊,那我们进入到这里面去之后的话呢,那我们就可以看到了啊,这个可立普文件夹,什么 different model 文件夹,给大家说一个技巧,我这个文件夹的名字啊,比如说可立普,就是在我们的这个 comui 的 model 文件夹里面,我们找到 model, 这里面也有一个可立普啊,你就放到同一个文件夹里面去就好了,就把它下载到这里面, 那相同的,就比如说是我们这个 latent app skill model, 那 你就找到我们 comui model 文件夹里面的相同的 latent app skill model 文件夹,然后把它给下载下来就可以了, 按照我的这个方式把这里面所有的模型下载下来,就可以使用它了。那我们首先的话点击使用该工作流,我们在使用的时候可以先创建一个工程,如果你有新的工程就直接打开就行了,比如说我们就放在我们的 l t x 二里面吧,然后这个名称的话,我们就叫做演示吧。 ok, 我 们创建一个演示的工作流,创建好之后呢,我们就选择这个图声视频的工作流,点击使用工作流就可以了。 然后我们可以先创建一个图像,那这个是我们默认的图像,那我就生成一个新的图像吧。比如说我们在工作流里面,我们选择另外一个工作流,图像生成的工作流,我们使用的是 z 妹子的这个纹身图,我们选择它就可以了。 然后我们这个图像我们创建一个古风女孩吧,一个穿着汉服的女生吧,这个的话是可以支持中文的,我们输入一个穿着古风汉服的中国女人 站在院子里,上半身特写, 就这样吧。然后我们的分辨率可以给到一二八零三七二零稍微小一点嘛。那我们这个保存路径的话,也可以放到我们自动创建的这个资产里面,你可以自己写一个文件夹,比如说叫做古风 这边的话呢,我们改变一下他的保存的前缀也行,让我们刷新一下历史记录,这个时候我们就可以执行了。那这个任意美指纹身图也是需要去部署模型的,我们之前已经部署过了,你可以看一下我之前的课程,我们点击一下执行就可以了。 好的,现在我们已经生成了,我们来看一下整个质量还是可以的啊,非常有这种古装剧的感觉。然后我把提示词的上半身特写去掉了啊,改成了面带微笑,因为只有上半身特写,他的面部没有那么完整, 那我就把它改一下,优化一下。那我们就可以点击一下标记啊,把这个图像给它标记出来,作为我们的一个图生视频的手帧图的使用用途。那下一步的话呢,我们就切换到 lts 二点三的图层视频工作流,把这个手帧图切换成为我们刚才的这个 mark 出来的图像就是它了。然后提词词应该怎么写呢?提词词其实是有一些要求的,那这个 l t s 二点三的这个提词词的格式,我们提供了一个反推工作流,就是说你把一些必要的条件给到它,把图像给到它, 它就能够给你一个适合 l t s 二点三出视频的这样的一个题词词啊。不是说你随便去写,可能随便去写出来的效果并没有那么好,那我们可以再去选择一个工作流,你看我们有了这个十六六软件之后,你就不用到处去部署工作流了,你就直接在这里面去选就行了。 那我们可以看一下,在文字生成里面有两个反推的工作流,另外一个是二点三反推的官方版, 这个是之前 lts 二的反推提词词,它的提词词是比较的完整,就是把画面也描述出来了。那这个是官方的 k z 流给到了一个提词词的反推方法,这个可能会更简洁一点,那我们就用这个官方版的,我们点击使用工作流, 如果你没有部署这个反推模型的话,你也可以查看介绍一下,看一下需要去下载什么模型。其实这个工作流里面所用到的那个模型跟我们二点三这个大模型是一样的,用到的是它里面的可立破模型,所以你就不用下载任何的模型了,直接点击使用就可以了。 那我们把刚才的那个图像给到他,就比如说这个图像,然后他的这个前置条件是有一定的格式的,比如说前面这一句是不用管的,就是让这个图像变成一个流畅的动作,然后这个主题你要改一下,动作你要改一下,场景你要改一下,如果自己改的话比较麻烦啊,你可以直接 ctrl 键加 c 键复制一下,然后我们可以进入到 excel gpt 里面去啊,那我们就进入到这里面来,然后把这个题词给到它,就是这个反推的格式,说修改一下这个这个内容 要求,然后我们就可以把下面的这些题目给到它,就是 subject 啊。这个主题是什么呢?一个女女人对着镜头打招呼, 然后再把我们下一个这个 action 再复制过来。说什么呢?说这个女人走到 镜头前,微笑着说,是吧?一日不见,如三秋兮, 这应该是一个文言文啊,就这样子,一日不见如三秋兮。 ok, 然后我们再去回车,然后这个盛世描述一下啊,盛世就是一个呃,古代的院落里, 这里就会触发他对环境或者声音的一些描述,然后点击给我们的这个大模型,他就可以把我们的题词给优化了,我们来看一下,他自动就去写了。 他给了两个版本啊,第一个版本的话他把台词也变成英文了。啊,这个我们要中文的,这个叫什么呀?呃,一日不见如三秋兮,我们复制一下,可以来去看一下啊, 粘贴是吧,让图像以流畅的运动变得生动起来啊。一个女人面对着镜头,然后微笑的说这个样子。好的,那我们就可以把这个反推的指令复制到我们的工作流里面去, ctrl 键加微键啊,如果大家觉得比较麻烦,可能更喜欢做在线的,但是我觉得,呃,如果你想要简单一键的东西可能就没有那么准确,如果你想要省钱,想要做的更专业,你还是要稍微的呃,用一些流程来去规划一下。 那这个最大制服就是说他反推出来有最大的一个反推提示词的长度啊,但是一般情况下是不会超过一零二四的,你就算给到一零二四,他可能反推到几百个就停止了啊。那我们这个路径也可以改一下, 他会给你一个提示词文档的,你后面可以发给别人,也可以自己去学习使用。那我们可以给到这个反推的文件夹里面去就可以了,这个就叫古风吧,然后我们就开始执行就可以了。 好的,我们现在已经反推完成了,我们可以看到这个提示词在我们的右边展示栏里面也展示出来了,我们可以直接 ctrl 键加 c 键,我们回到这个翻译软件里面来看一下, ok, 就 这样子的,你可以看到它又把我们这个中文给它翻译成英文了,这个我们到时候再翻译过来就可以了。 风格他先定义了,然后再定义动作。女人慢慢走向镜头,热情的微笑着,用舒缓的声音说,啊,什么什么柔和的中国传统音乐,然后与鸟儿的呃声音和远处的喷泉融为一体啊,就非常的详细吧。那我们就回到这个这边来, 然后呢我们就把咱们的这个题词给它粘贴过来,只不过你把这个他翻推出来的这个拼音再改一下啊,一日不见如三秋夕, 如三秋兮。好的,现在应该没有问题了,种子值可以随机一下啊。注意,这个是我们刚才那个音化同出的工作流,这个,这个是反推的工作流啊,他俩你不要弄混了啊,先去反推出提示词来,然后再给到我们的工作流, 然后时长五秒,五秒应该可以了,就默认五秒,帧率二十五帧每秒,然后宽度一二八零乘七二零。保存设置,这里就是你保存在我们的 alt put 里面的这个文件夹里面的。这个后面的文件夹和前缀啊,我们就叫做克拉斯演示吧, 这个不是一个绝对路径,大家注意啊,现在我们刷新一下工作流没有问题就开始执行了,那执行之前的话呢,建议大家可以到我们的 comui 里面啊,你可以去清理一下这个内存,清理一下缓存, 如果你再执行多个工作流之后,你再去执行新的工作流,它的内存来不及卸载,会造成这个 comu i 的 卡顿。建议大家可以多去点一下这里,然后保证我们的这个 gpu 还有我们的内存要干净一点,现在没问题之后,我们就开始点击执行,等待它的一个视频的生成吧。 ok, 那 我们这个已经生成了,我们来看一下啊,一日不见如三秋夕, 是不是还是可以的呀?而且我们可以发现啊,咱们的这个嘴型也能对上声音也是这种比较标准的普通话,美中不足的就是有字幕,这个字幕在中文的发音下是比较通常出现的,所以我们后面的课程当中用英文就不会有这个问题了 啊。再然后的话呢,我们接下来要做的这个效果,并不是说光用这个工作流,我们还会用到其他的工作流,像瑞米克斯呀, 像这个 client 啊等等的,所以我们接下来会利用这个大的 ltx 框架,然后再加入其他的辅助模型来去制作。那这节课的话呢,大家只要把它给部署上就可以了,那么我们也可以对它进行接下来的一个放大高清叉撑的处理,我们都会详细的去讲解的, 那下一节课我们再见。拜拜。

开源 ai 视频生成又变天了,一起来看一下吧!同学们,请跟我读 are you ready? 以上片段均使用 l t x 二点三文声视频生成, comfyui 在 第一时间进行了支持机制,大佬也在第一时间发布了 f p 八的模型,并且上传到了摩达平台。不用担心模型下载问题了, 搜索视频中的项目名称就可以了。基础模型、文本编码模型、 v a e 模型都需要下载,如果要使用 f p 八的模型,需要调整一下模型加载部分, 调整方式可以参考视频。需要注意的是,需要使用 keygenus 插件提供的 vae 加载节点,而且需要更新到一点三点二之后的版本,否则运行工作流会报错。 此外,视频展示的第一个 clip 模型在 k 神的模型中没有,可以去 ltx 二项目中下载,也可以通过模板中的链接下载 f p 四的版本,下载到 textencoders 目录即可。 接着来简单看一下工作流,左下角设置视频的基本信息,包括分辨率和帧数,帧率中间区域彩样,生成零点五倍分辨率的视频, 然后右侧部分是二次彩样,将视频放大回目标尺寸,最后分别将图像和音频通过 v a e 解码后合并为视频。另外放大彩样时用到了一个比较特殊的 sigma 参数,这个使用默认值即可,不建议修改。 最后说一下提示词部分,相比于 ltx 二的工作流二点三版多了一个提示词优化节点, 可以将简单提示词翻译为更专业的描述,后面会给大家演示,这里用中文输入也是可以的。话不多说,先直接使用默认提示词运行一下,跳过等待时间,直接看一下生成结果。 接着我们再换一组中文提示词,看看运行效果。 运行之前,先给大家展示下前一次运行的耗时情况,首次采样耗时约九十六秒, 二次采样放大约耗时五十四秒,再加上提示词优化耗时约九十三秒,完整运行一次延四分钟左右。现在重新运行,工作流还是快进。跳过运行过程, 仅仅一句简短的提示词就可以得到完整带有配音的视频片段,这点确实比万象视频系列开源模型要厉害很多,但画面清晰度还是差了些。 再来看一下耗时,本次运行耗时约三分钟,所以在有缓存的情况下运行耗时还能减少约四分之一。 整体来看,二点三版本在运行速度和生成效果方面都是不错的,但在画面质量上还存在一些提升空间。本期视频就到这里,点赞关注,下期给大家分享 rtx 图声视频工作流。

别再让你的 ai 订阅吃灰了,今天教你一招,把 cloud 和 openai 订阅直接变成全能 api, 还能带人拼车回血! 这就是由微少开发的开源神器萨尔 api, 它的核心功能就一个字,强!它能把你手里昂贵的 ai 订阅一键转化成标准的 api 接口,不管你是想分给朋友用,还是想多设备同步,它都能帮你搞定。最牛的是它自带精准计费和智能调度,支持多账号轮询,谁用了多少头肯,现在的 订发是多少,后台看的清清楚楚。而且它完美适配原声工具,拿来就能用,完全不需要复杂磨改。目前这个项目在 github 已经拿下了两千四百多个星,妥妥的订阅管理天花板。 想实现 ai 自由高效分担成本的老铁们,这个项目绝对不容错过!赶紧去 github 搜索傻不二 api 试试吧!如果你的网络环境无法使用 github 大 路中转站九幺 git, 无需网络环境配置,只需要输入仓库名称, 可以帮你打包好原码和 app, 大 陆用户可以直接下载使用。如果你仍然觉得很麻烦,那我已经帮你总结好了全部资料,关注我,带你发现更多免费优质项目!

hello, 同学们,大家好,好久没给大家做教程了啊,最近拍源没什么新东西, 然后这边在视频生成方面补声,视频出了一个 ltx 二点三啊,据说是对这个图像一致性和稳定性有了大幅度提升。然后我们在星狗云上面教大家怎么用这个 ltx 二点三那个宫格瘤啊。 首先我们看一下案例,已经看过了啊,然后我们这边打开星空云的官方网站,这个地址啊,星空云的官方网站,然后打开以后,我们看桌面上有个邀请码,使用邀请码注册可以得到八块钱的算利息, 可以使用四个小时左右,你使用四个小时左右免费啊。然后我们点击开始部署 gmail, 来这里选择推荐镜像里面的第二个蛀牙师兄的镜像,这镜像有三点几个 t r 三点几个 t, 包含了所有视频里的工作流,基本上都是一键置起 啊。我们这边选这边的那个,那个显卡,显卡我们建议选四至八个 g 的 显,这八个显卡不爆显存,因为他这个,他这个的模型实在太大了, 二十四个进贤卡也能跑啊,也能跑,我们这边已经不说好的,然后我们点击这边康复 u i 这个地方进去,如果直接不说好,千万要等个两分钟才能点击啊,要不然会有无法打菜的,就会像这样组法打菜,我们过一会再点啊, 好,真的,三星以后出来了,我们这边点击左边这个地方有个工作流, 然后我们这边有个零三零七更新 l t x 二点三全能宽圆视频生成好,点击进去以后啊,设置一个工作流整体的一个状态,右边散弹一张图片,那里可以 根据这个自动提示词啊,我们是可以生成出来自动提手词,我们把这个拉大一点旁来一次一个,我们登录顺采一个自动提词词的提交的那里,我们上传一个图片 啊,我们就传一个外国女人的图片,这个地方是看提示词的结果啊,对了, 好,我们根据这个图片,然后让它自动出提置词来,出一个动画,我们测试一下效果。在此之前有可能同学会问这个不要自动提置词,要手动提置词怎么办?我们看这里有个文本输出啊,连接到这个地方,好的,我们双击这里搜索 cr, 然后出来一个 prom, prom 特 啊,在地方有一个新的一个节点,然后把这个 problem 连上这个熨索这里啊,在地方就就就实现了。我们手动输入提示词啊,这是一个小技巧,我们现在就使用它的自动提示词啊,我们现在把这个删除,然后直接连接上去。 好,我们点击开始运行,其他地方都不要动啊,都不要动。简单介绍一下它的参数, 也是个 we do set 单词的参数,它是一个不像长宽长宽高的一个 h, size 是 它的 p n p 处理,做几个目,这也都是页啊,功放,不用管它地方一个 nice nice, 这个地方怎么填? nice, 就 着重讲一下 nice, 它就是视频长度,我们这里看到了它的视频长度是二十四帧每秒,如果我们定视频长度是定二十四帧每秒的话啊, 一般就是十秒钟二百四十加一。因为他这个个平针是从零针开始算的,所以我们做针的话一定要写加一多少秒,加一,然后二百四十一啊,二百四十一就是十秒钟的意思 啊。这个功课流还有优化的地方啊,我们因为时间关系,我们没有去详细的给优化这个功课流,有需要同学可以单独联系我做优化啊, 比如把这个地方时间改成秒数那种啊。然后有人问宽高,嗯?宽高在哪地方?宽高?我觉得这个地方它是自动获取图像尺寸,获取图层的那些渐层, 这个图像尺寸把它做成了一个缩放,就是零点五倍大小,就是原来尺寸是七二零看一二八零,哎,他给它缩小成到三六零看六四零。 这地方想用心改的话也很简单,我们不要改变圆图尺寸,要改变圆图尺寸,然后直接把这个 upscale 这地方改成 e 啊,改成 e, 然后然后图像再连上去,或者是直接就取消掉这个额 色方图像这个节点也从图像连到这个地方,这样就跳过了这个色方图像这个节点好,就可以保持圆骨尺寸是处。然后如果你想改变自定义图像尺寸啊,把这两个渐变也给他去掉,然后在这地方显显你要的尺寸,七二零 一二八零,把这个地方头像切上,然后再接下去,这样就显示了你自定义从小尺寸,等他一些技巧啊,同学们记一下啊,我们现在已经开始生成了啊,我们章鱼等会就生成完了。好的,我们这边做完了啊,我们点击播放看一下效果。 好的,今天我们的教程就到这里啊,感谢大家的收看哦,下次教学再见。拜拜。

视频我们来看到 l t x 二点三的更新,更新在更强的 t r s 遵循原生的竖屏支持, 想追上我,下辈子吧,音频更加的干净,以及对于图声视频而言更好的一致性。模型的体积为二十二 b, 非常的巨大,我已经几乎在第一时间部署这里优云智算平台上面找到对应的镜像, 点击部署实力,这里的话我们可以租用五零九零,或者说四十八 g 的 四零九零,如果有四 k 需求,可以选择更高的配置说明书往下拉,找到对应的启动指令复制 夜间租用显卡会有一定的优惠,点击立即部署,等待一下,进入猪 peter lab 任意的地方,打开终端, 粘贴启动指令回车,出了地址之后回过来,点击进入康复 y, 我 们先说快速启动,快速启动这个地方我们需要去设置提示词, 设置视频的长度,以帧数为计量,设置视频的帧率多少帧每秒钟,设置视频的宽度高,那么这就是纹身视频的几个必要输入项。 如果我们使用加速的工作流,这个加速二模型会进行前置,如果我们不使用加速的工作流, c f g 将为四反向 t s 呢将会生效。图人视频几乎保持一样的设定,不一样的地方呢就在于它需要多加载一张图像,并且呢是按像素百万像素为计量单位, 真实的宽高是为这个百万像素的二分之一,比如这里是二百万,那么它的真实的视频生成就是以一百万像素为约束的宽高来进行生成,相当于是两个数值的乘积。无论是纹身视频还是足身视频,我们都有一个放大组, 放大组我们需要去加载一个放大模型,那么这个放大模型更新到了二点三的版本之后,除了时间空间放大之外,他有一个一点五倍放大的版本,解码后的话就出结果了,没有什么特别的,我们简单看到一些纹身视频,涂身视频的结果,那么这是纹身视频的结果, 这夜景太迷人了,这杯咖啡的味道让我想起了以前非常连贯。其实这个地方不需要特别的离谱深沉的画面,就是电影级的画面,因为 l t s two 这个地方所使用的训练级,我猜测使用了大量的电影画面, 这场雨来的真是时候,还不是那一种真实的,就是完全从电影当中截取的片段一样。涂声视频的结果,我可以非常明确的说,相较于他的上一代版本,绝对是增强了他的一致性的, 尽管我们看到随着视频的片段播放,到了后面还是调相似度了,但比他的上一代要好太多了。 第二个测试呢,下水,游泳,直到到了最后的部分呢,才掉了相似度,在此之前呢,还是有一个很好的保持的。那么这一切都基于我们使用了大模型,而未使用了正一的多二模型的情况之下, 只要设置当中进行一定的微调,或者说官方版本的再一次迭代开源,我们将获得一个非常好的基作模型。 参数量对于模型的生成是很重要的,参数量这个地方往上去叠加,我认为是非常正确的策略。第三个结果呢,是一个歌手的跳舞,那么怎么说呢,这个人物被拉长到了一个非正常的比例,但他的面部相似度呢,是没有掉的。 黄河之水天上来,奔流到海不复回。 l t x two 的 对口型其实是挺棒的。二点三,这个地方的流还没有出来,我们保持关注。

l t x 二点三官方设计流程的更新哈哈哈哈哈哈我们就先看到纹身视频和图身视频两个类目,这两个类目呢,又各分为一阶段,采用直接出结果和二阶段带放大出结果, 二阶相较于一阶而言,多了一个放大组。从官方流程的解读看起,已去探索 j u 实现流程来自于 copy y a t x video 插件,也就是这么两个流程。 接着我们来看到详细的地方,视频对应的流程都已经同步部署至线上的任意 copy 当中,均可以在线运行。对于本次的朋友,我也配置了一套量化方案,已放置在剪辑的网盘当中,使用量化的大模型以及 n v f p 四的 jam 三,或者说 g g u f 的 jam 三, 以达成一个低选择用户可用的模型配置。先看到纹身视频的单阶段双轨生成,那么单阶段的意味在于我们在后面会少一个放大组,也就意味着我们生成视频的分辨率,如我们的输入的宽高将会完全一致。 上方为视频的帧率和帧数。设置以下提示词,大模型这个地方对应低选择的用户,我们可以使用 g c u f 的 q 四 k s。 如追求更好的质量,可以使用 f p 八的模型, 那么 k j 已经把分体式的模型做出来了,我们可以拥有 transformer video, v a e audio v a e 以及 jama 和对应的完美编码器。 官方设计流程当中,我们使用的三八四加速六二模型对应的二十二 b 的 版本,那么可以看到我们在使用了加速的情况之下,权重推荐设置为零点五双轨,在它在上一行与下一行分别进行了一个蒸馏与前量的分组配置。 四个码代表着噪声的强度,那么手动四个码值允许我们完全手动指定模型要在哪些具体的噪声层级上进行计算, 可以看到这里走了八个步骤,因为只有一阶段,所以我们直接是从一降噪到零,走了八个步,那么八步的话,我们就生成了结果下方的全量这个地方我们走了十五步,这两者生成的结果之间还是有差异的,你居然活了,哈哈哈, 明显我们走了十五步的这一个兔子活络的结果呢,是更为接近我们提日词的内涵,风格化的表现极尽到位。只是说这个小兔子呢,可能有一些怪异,其他没有什么特别的瑕疵,很有意思。 那么我个人凝念之后得出了这样一套流程,那么这是一个八步的加速生成流,我们可以看到纹身视频这个地方得到的结果有些怪异,甚至说恐怖股相应的出来了,所以如果让我怎么办,我就会选非加速的节点组 来构成非加速的流程,那么在保持了种子所有的变量控制之后的话,我们使用非加速的流程生成的结果是非常的自然的, 哈哈哈哈哈哈。二阶段的流程主要的内容就在于放大组这个地方,当我们在进行了第一阶段的生成之后的话,其实是可以直接出结果的,前面我们也已经看到一阶段就可以出完整的结果。 二阶段呢,会用到一个放大模型,以进行视频倍数的放大,对于纹身视频而言,我们完全可以用它的这个放大组 插入其中,而且这个放大组的质量我觉得还是可以的,这就是我最后凝练出来的纹身视频的流程,导航智能 app 视频相对的流程已经同步更新,可在线运行。那么图身视频这个地方与纹身视频相比而言,多了一张图像以作为收入相,简单的去过一下尺寸的约束。 l t x 二点三支不支持 l t x 二的 laura 模型呢?我的评价是支持,但不是完全支持。比如说之前这个 image to video 的 dapper laura 是 会生效的,但是不是每次生效的结果都是正向增益的,那其实非常不一定,所以我的建议是保留可选,不一定要用 同声视频这个地方。那么我直接就推荐这一个单阶段双轨流程,不需要后面的官方放大组了。为什么这么说呢?我们看到这个二阶段放大流程 后面的这个官方放大组,他同样的需要去进行再次的降噪,前方的雷肯传过来,我们再注入如零点八五的噪声,让模糊的纹理被打破,在清除这些噪声的过程当中,脑补出原来不存在的高清细节 来进行所谓的放大,非常接近于我们之前图像生成当中的图顺图,所以也就注定的变化。如果我们只做单阶段,我们会发现这个人物的一致性会非常的高。 这个视频呢,有什么问题?问题在于动态可能有点太小了,但问题不大。我想表达的内涵呢?是这样的一个内涵图到视频这个地方官方推荐的权重呢为零点七,后面我会在 roundabout 当中标识出我所凝练出来的两个流程,以及部署微调过的官方设计流程。这一个呢,是图到视频二阶段的流程, 左侧被加入了 dota lara, 可以 看到两者都难免的出现了肢体的崩坏。那么中肯的来说, e r t x 二点三到现在为止的肢体表现不如 one 二点二, 但强项也是非常明显的,也许我们只需要一个 lara 的 增幅,一个社区 lara 的 增幅就可以解决这么一些比较明显的弊端。如果让我再去调整垂直面的流程,我会把它做成单阶段,同时呢,这个单阶段呢,也进行是一个非加速的处理。

观众朋友们大家好,这里是速冻月饼,上一期视频给大家分享了免费使用英伟达的 api 的 教程,但是他家的 api 速度比较慢,所以今天分享了另外两家的速度比较快的 api 的 教程,但是注意 使要使用这两家的 api 需要使用魔法,不会魔法的话自行解决。首先首先是这一家的 没有账号的注册账号,或者直接用谷歌登录,这里我是直接用谷歌登录的, 登录之后点击游乐场,在右上角选择你需要用的模型,这里我选的是千万三三十二币,点击查看源码,这个页面保留。 进入魅居物语 云端大模型,这里先不用管,先把 apm 要和模型名称填一下, apm 要复制粘贴 模型名称在这儿, 然后点击叉号,点文献资料 往下翻,复制这个的原文是这样, 粘贴保存测试连接成功, 可以看到这个访问速度还是很快的。 然后这是第二款 gork, 依旧注册账号登录,我这还是使用谷歌账号登录 进去之后 apm 要创建, apm 要 创建 npm 要填一下名称和过期期限, 提交 复制。 打开美剧物语, 粘贴 apm 二 点游乐场,在右上角选择具体的模型,这里我选的是这款在这个地方复制模型的名称, 粘贴在文档兼容性, 这里复制 粘贴 url 保存测试, 可以看到这个速度也是很快的。 本教程到此结束,感谢观看。

哈哈哈哈哈哈,哎,道友喜欢就进来看看,外面多没有意思啊, 你们这些人什么意思?看够没有?哈哈哈哈,道友喜欢就进来看看,外面多没有意思啊,哈哈哈, 大家好,我是抹布,这是我第一次做的那个 知识类分享的视频,最近就是昨天晚上出了一个执行模型,就是 l d x 二点三,嗯,他相对于前面二点零的来说的话, 呃,他人物的一次性控制的相对好了很多,但是道友,但是他还是有点那个多没有意思啊,这种糊糊的感觉,但是我觉得够用,相对闭元来说的话,这个已经进步很大, 然后我这个工作流的话是是官方版,然后改改一下,呃,这里我是用的铠甲的那个模板,就这个 用它这里面的那个模型文件啊,当然啊, 有有些有,有些道友的话就是想玩的话,你就要把那个 cosplay ui 然后更新到最新的最新的零点幺六点三这个版本, 然后如果你需要放大的话,你要从从这个 lt 叉二点三这里下载一个最新那个放大模型,原来那个放大的话它是有问题的,出来视频全是糊的。 呃,如果,因为我只是做一个分享,然后如果大家想要这个工作流的话,可以 可以什么我稍后发吧,就不用什么私信了。然后我这里的话就是整合了前面比较优秀那个他这个 啊西西克玛值,我改了一下, 然后还有这官方这里他强度是一嘛,然后我改成,呃,零点五,因为这个降噪的话,你你开那个开强的话,他人物的脸部是很油的,很很很重的油腻感, 然后这个还有这个提示词反推的话,呃,大家,呃,因为网上,网上也有很多那个出这个,然后我用的是,就是最新那个三点五的, 对,他推起来的话,他出来的提示词那个质量啊,相对,相对三点零的话啊提升很大。 然后这个工作流也是我自己改了一下的,就是这个提示词反退,然后这个这个提示词的话就是用那个于老的那个啊,提示词模板, 好,大概就这么多。

给兄弟们分享一下,这两天我用 oppo ai 记录了居民之后,使用的时候我发现有个什么问题啊,就是这个,呃,我这个账号是属于叫做付费一级账号,一级账号他那个每一天的 ipd 也就说请求次数最多只能有二百五十次,你可以理解为你最多只能给他发二百五十次信息啊,我不知道我有没有理解错啊,反正在前两天我是等于说刚部署好准备用,然后第一天就被限额了, 我当时是主要在问我们店里一些经营情况的问题,就多聊了两下,用到一半就限额了。 所以呢,后面我还是继续去用那个客户端了,不过呢,我发现 就是一些复杂的问题,不应该就是要聊太多的啊,还是要用客户端,然后一些,如果你已经明确好了要干什么的,再拉个群去安排他干,比如说这个群我用来作为我店里的一些设备啊,账号的登记用专门,然后这里是叫他帮我整理一下话术啊,然后这里是帮我每天准备下文案啊, 知道吧,就我发现你要真的要聊很多的话,还是不建议在这个里面聊,完全不够用啊,在客户端他才是无限的,然后他这个付费层级,如果说想从第一级升到第二级的话,要消费二百五十美元,然后还要至少是付款三十天以上, 我目前的话是只消费了二十一美元啊,离这个二百五十美元还是有点时距离时间的,估计过一个月之后我就能到第二集,到了第二集之后,到时候用起来就基本上就不会有什么限制了啊。

大家好啊,现在市面上企业接入国内大模型 a p i 的 渠道特别多,那我今天就和大家汇报总结一下不同渠道的特点。首先呢是火山引擎的豆包系列和 deepsea 系列产品, 那他们的特点是限流的额度最高,基本上不会打满他们的 tpm 和 rpm。 原因是因为火山之前囤了很多英伟达的卡, 所以它背后的推理集群资源特别充足。那价格上呢,它的折扣力度相对比较小,如果不是特别大的客户的话,官方渠道最多是给七折,火山销售的业绩压力也很大,基本上每个人单单大模型都要背至少一千万的业绩。 其次呢是阿里云的千位系列和 deepsea 系列产品,那它的优点是单价最低,而且阿里云内部最近在打大模型战役, 千万系列模型的折扣根据用量呢,从五折到三折不等。但是缺点呢是背后的集群资源相对来说没有那么充足,如果遇到大客户重保的话,比如说 b 站跨年晚会,那资源就会更紧俏一些。 百度的大模型呢,目前基本上是卖三方的 deepsea 和其他模型为主,他们自己家的文心妍用的客户相对少一些,但是百度的折扣政策一般来说是还不错的。然后就是各种各样的大模型中转站了,比如说三零二点、 ai 云雾、 api 等等的平台, 这些平台的价格浮动会比较大,而且折扣普遍会比原厂高一些。但是有些厂商的模型可以做到特别低的价格,这种情况下呢,一般是做了逆向账号之类的方式,他们能够保证低价,但是不保证可用性。最后呢,如果您希望低价进入国内主流的大模型 api, 可以 后台私信我,我有靠谱的渠道。

观众朋友们大家好,这里是速冻月饼,今天给大家带来的是美居物语接入免费 api 的 教程。首先进入英伟达的网址注册并登录账号, 这里我就随便写来演示了, 你可以填 qq, qq 邮箱或者你其他的邮箱 输入密码,然后输入密码,再次输入密码,再进行一次人机认证, 然后创建账户,我这边之前已经创建过了,所以就不创建了, 这边我是登录了之前已经创建好的账号, 创建好账号之后,点右上角 api 密钥, api case 生成 api 密钥,这个日期你可以填十二个月或者是其他的日期 啊,对这个名称只能填,只能填英文或数字 复制,然后点击模型, 搜索你需要的模型 进入,点查看源码, 然后这个页面先保留,进入魅居物语云端模式,启动游戏 云端大蒙形这个地方。嗯,先把刚才复制的密钥填一下,这里是填这个, 这个的话你可以选择获取,然后在这里面选, 或者是直接在这里复制 保存。测试, 刚才出了点问题,我现在换了另一款模型,接着测试, 哥哥是键盘吧, 现在已经可以正常使用了, 速度还行。本教程到此结束,感谢关哥哥也喜欢玩游戏。

从今天起,你可以彻底告别哑巴视频了。这款火爆全网的 ltx 大 模型可以直接生成包含音效的视频文件, 并且能够让声音效果完美契合角色的动作和口型。除了可以使用文字生成视频外,这款模型还支持图声视频,甚至是视频生成。视频模型对消费级显卡十分友好,生成七二零 p 分 辨率时长为十秒的视频仅需十 gb 显存,而且仅需数分钟即可完成。 如果你的硬件资源充足,模型还支持生成四 k 分 辨率视频,效果相当惊人。如果你对模型感兴趣,可以直接通过访问 hackinface 的 demo 网站在线体验。 而如果想实现本地部署,那么可以直接使用我之前视频介绍的 pinocchio 神器一看。 c 的 安装文件可以从官网或是群内置顶链接下载,在首页界面点击第一个 one two g p 图标进行一键自动安装。 在安装时,要确保你的网络可以顺利访问 github 以及 hackinface 网站,并且硬盘至少有七十到八十 gb 的 剩余空间。安装成功后, 需要在下拉框选择 ltx v two 输入提示词进行视频生成。软件在首次运行时会自动下载体积为十九 b 的 模型文件,需要耐心等待。模型会在下载完成后自动加载,无需额外设置。感兴趣的朋友可以进行安装测试,欢迎在评论区分享您的心得。

大家好,我是飞雪啊,那么 lt 叉的一个二点三版本在昨天晚上的时候发布, 然后整体的效果呢?相较于我们的二点零版本,其实是有比较大的进步的,那么整体的效果在开头的那个 demo 当中,你们也看到了,从不管从一个人物的动态上面,还是从一些细节上面,它都是有比较大的一个提升的啊。那么相对于我们的二点零版本的时候呢,特别是人物这个脸部啊,他之前的话,基本上会随着时间的变化会越来越, 人物脸上的褶皱会越来越多,那么在二点三的时候,这一方面的问题基本上解决了,然后相对来说口型什么的都有很大的一个进步啊,那么从这些角度来看的话, l t 是 二点三呢,作为开元的比 较成熟的一个多模态大模型来说,还是比较有希望的啊,如果后面有大佬把这个模型做微调,然后更加的符合我们中国的一些 优化的话,那么这个模型的话,他进步的潜力还是比较大的啊,那么我们我觉得还是非常值得期待的,因为从二点零到二点三,我们可以看到模型是一个比较大的一个进步的, 那么对于开源领域来说呢,这也是起到了一个非常好的一个鼓励的一个作用啊,因为最近开源领域大家都有点感觉到颓废啊,那么相对来说, hr 这一次的发布呢,其实是能注入一些信心的,也可以缩小我们对闭源的一些差距啊。那么现在来讲一下我们详细的一个工作的一个流程啊, 那么首先我们可以看一下啊,那么先做个对比啊,我们先看一下他的人物的一个进步能力,首先我重新开始一下身体的力量, 这是一个徒身视频啊,所以他对于之前来说其实进步非常多了,那么现在所有的视频你们都会发觉有个问题啊,他都是比较模糊, 那么模糊的原因其实还是非常简单的,因为我们所有的分辨率及调都不是很高,然后等于说出出完之后呢,他都是靠二次放大做一个优化的,所以他的 整体的一个效果呢,相对有点模糊啊。但是基本上你们生成之后啊,建议大家可以去 f s r 做一个超峰放大,那么基本上就解决这个问题了, 因为这种东西适合你们全部生成完之后去最后做一个放大,那么这一次工作流呢,也全部上传到那个 linux 当中了, linux 是 我最常用的云平台啊,你们反正去用的话的话,这边的话我配置会拉的比较高一点,但是我也没有拉的特别高, 那么建议大家如果想要个比较好的效果啊,可以把这个拉到一二八零,然后就变成一个七二零,那么效果会好非常非常多啊。然后再进行一个二次放大的话,基本上效果就会比较不错了,那么我可以看一下这边的分辨率这个效果,只要这座城市还有需要, 我就会在这里基本上都是涂身的,我我本身就不太玩。然后 还有一方面的话,纹身他在之前的二点零版本其实就已经相对有个不错的能力了,那么到二点三基本上如果你徒身提升的话,纹身只会更好啊。 那么开始讲一下工作流,那么工作流这一边的话,我们这一次的话,几个模型我也都上传到网盘当中了,你们到时候自己去下载。 然后我们用的是个 f p 八的版本啊,那么我用过正常的一个原版四十多 g 的 那个,测试下来之后发觉 f p 八跟原版差别,其实光那个四十多 g 的 差别不是很大,所以建议大家用 f p 八就可以了。这种这个方面我反正建议大家 不要去跑一个特别大的模型,你们如果配置高的话,宁可去把这边的分辨率调高一些,这样效果会好非常多啊。 然后这边传过来之后呢,那么本地这边的话给大家加了一个显存的一个保留啊,那么可以减少一个配置的压力啊,那么目前来说十二级的话是可以跑的,没有任何问题啊,所以你们本地的话压力其实也不算大,十六级的话可以跑一个非常流畅的一个运行了,然后看一下时间, 基本上一个五秒的,并且是一个一百二十一帧的话,基本上在三分六十秒左右啊。我跑下来, 然后这边的话加载一下图片,然后我们就正常按比例传过去就可以了,其他你们都不用管他啊,反正全都全自动的,最后反正这边输出就可以了,就反正后面我就不跟大家细讲了,那么核心要讲一下就是我们这一次提词的一个用法啊。 提词的话这次我们做了两个版本,一个是静态版的一个提词,一个是动态版的,那么高动态版有个好处,人物的各种动态可以发挥出来,因为这一次 l t 叉二点三的一个动态能力是提升的, 所以你们用高动态版本的话,它整体的效果是会更加优化的。但有个问题,高动态版本的建议大家一定要考个比较高的一个分辨率啊,如果你们跑的是个像我这边调的这么低的分辨率的话,基本上到了高动态人物会变得特别模糊啊,这个是模型决定的,没有办法的 如,所以如果你们配置不高的话,建议大家就使用这个静态版本,那么相对来说的话,因为人物保持的动态不高的情况下,他的模糊程度会少很多啊,所以你们这要根据自己的配置去调整,然后高动态的话,也容易人物的动作会崩溃,这个是肯定的啊,因为他的模型毕竟也没有那么强大,只是相对于二点零的话有个优化, 所以你们这个根据自己的选择去跑一下啊。那么建议大家第一次玩的话,可以去选择静态版本,那么相对来说可以出一个不错的效果,然后穿插可以用一些高动态版本去使用啊,那么高动态版本的话,肯定涉及到一个抽卡了,反正这个肯定要抽卡的,基本上三四次可以出一个相对不错的啊。基本这个我先跟大家提前说明啊, 然后如何使用,非常简单啊,打开我们的豆包,然后上传一张我们的图片和我的那个模板,那模板的话在这边都已经放好了,然后扔上去之后直接说开始之后他就会生成的,非常非常容易啊,这次的话故意没有给大家接那个 q 三 v l 啊,因为包括那个 q 的 三点五,我故意没有给大家接啊,一方面是 接了之后你们经常会遇到问题,还有个就是对于配置的压力会更大,所以我干脆就不接了,因为你们其实调用外部反而更方便,因为后面你们只需要上传图片之后做个开始,开始继续继续就可以一直生成了。那么相对来说,不管从质量 t h 质量上,还是从你们意用的角度来说,还是外部更方便啊。 然后本地跟 i h 词词这一块呢,有个区别,就是本地的话我们需要去调用我们的那个豆包或者 deep 去做一个生成,那么 i h 这边的话,我给大家已经接好了那个金 进进来了一个二点五的一个版本啊,那么基本上有全自动的台词,这边的话,你们不写的话,他会自动生成台词啊,那你们写了之后就会根据你们台词去输入啊,所以我给大家故意做好了一个搭配,因为有些人可能不会写台词,那他会自动生成的, 然后你们想写字的台词就自己这边写一下就可以了啊,那么啊就这边比较方便,就是这边反正全自动了,你们只要写下台词就可以了,然后这边注意一下这边一个是我们的 采用分辨率啊,那么分辨率的话最后输出是会乘以两倍,等于说这边七二零的话,他最后是一个一四四零那个分辨率啊,因为他有个二次的一个放大,但是呢这个二次放大呢,其实效果没有特别特别好,更重要的一个分辨率的设置其实就在于我们第一次采用,那么你们这个设置的越高,效果只会更好,好吧,所以这个要注意一下啊, 然后这是我们这个帧数啊,因为现在用的都是二十四帧吗?所以他基本上一百二十一就等于一个五秒,但记住一定要八的倍数加一啊,所以如果你们要跑一个十秒的话,就把它改成二百四十一就可以了,好吧。然后这一次的话,图声跟纹身他是在一起的,非常非常简单,你们如果开启这个丘, 那他就变成了一个纹身视频,其他都不用管了,他就这种是个纹身了,那么你们关掉之后就是个图身,好吧,所以这一次的话,基本上纹身都合并在一起了,大家使用起来也非常非常方便。 那么再跟大家讲一下网盘的内容啊,工作流,待会我会上传上来的。然后还有个模型还在上传当中,就我们的大模型,因为好像大家都没有去上传这个 f p 八用的都是一个原版的,所以没办法,只能我给大家上传一下那模型这一边的话,反正就是常规的几个模型,一个是没有上传上来一个大模型,还有一个就是我们的放大模型, 然后涉及到一个 lara, 这个 lara 就是 增加增加细节,那个 lara 嘛,就之前二点零也有的,然后就一个大圆模型,好吧,模型其实不多, 然后插件的话可能会比较多,一个是我们 lt 叉有专用的一个 ctrl u i 的 一个插件,你们一定要去下载一下这个东西,然后这边用那个 k g 的 note, 因为涉及到一个整数常量嘛,你们可能没有,然后这个的话是一个转换器,等于说我们这边的个帧数牵过来之后呢,这里需要有个转换到这边的一个减空间,所以需要有个转换,好吧, 其他就没有什么特殊的插件了,反正那么这期视频差不多就这样子了,因为涉及到的东西其实反而是我这边的工作比较多,一方面我一直在给大家调试一个效果啊,因为一开始刚刚出来的时候去跑那个效果简直没有办法用,那个时候我跟土豆大家说我都不想做这期视频,因为感觉太难用了, 然后后面观看了一下那个 comu ilt 叉的那个出了个官官方买的工作流去试了一下,那效果一下子提升上去了,然后我把工作流 的那个提示模板又做了好多的优化,然后做了一些提升,所以跑出来的效果现在提升非常多啊,你没看到这样跑出来是没有什么字幕的, 偶尔很偶尔很偶尔才会跑出一次字幕,基本上大多数状态是没有字幕的,所以这些问题我都给大家解决好了啊,你们使用起来是会非常非常方便的。好吧,那么这期视频就这样子,觉得有帮助的话记得给我点个一键三连,谢谢大家。

这期教大家飞书多页表格如何接入 api。 首先我们点修改四段,你会看到关联账号,这里点进去出现这样一个界面。好,我们点右上角这一个分享的符号,跑到这里是一个飞书的教程,我们往下滑,他这里会教你如何接入,但我觉得他讲的还不是很详细。 好,我们看到这个火山引擎模型广场,这一个二点三点二点二,登录火山引擎 好,就跳转到这一个界面,这个界面你自己登录就行。登录上来之后是以这样一个界面,然后我们点击模型广场,在这里你可以找到你想要调用的模型,我们在搜索框里搜索 zip 好, 看到 v 三点一点进来到这里,点右上角 api 接入,然后跟着它的步骤一步一步操作,第一步,创建 api key, 创建并使用, 第二步我已完成调试好,这是接入的第一步。之后我们来到在线推理这个板块,创建推理接入点,点进来 好,是这样一个界面,输入接入点的名称,这个你自定义,我这里说的是 d c 和 v 三到下面输入模型,就点这个添加模型好,点进来。 好,第一列这边全是豆包的。好,我们点击上面它分类的深度求索,这里会看到 d c 的 v 三点一在这里,然后点击确定, 再点击右下角创建并接入好。之后是这个界面,选择 api key 并复制好,这里我是创建过很多,然后如果你没创建的话,就直接点右上角的创建 api key 名称,按他这个来就好。点右下角创建好, ok 了,把这个小眼睛点开,复制这一个 api key 好, 再回到飞书输入密奥 api key 就是 第一行,这里。好,我们再回到火山引擎,找到这个在线推理的板块,敲重点了, 这里复制下面这一小行。还是回到飞书这个板块,把你刚才复制下来的这一段输入到第二行。 ok, 关联账号好,到这一步就已经基本完成了。如果还有什么问题的话,你可以点击那个 感叹号,下面有一个联系客服,你点进去,客服会帮你解决比较复杂的一些问题。好,这期就先到这里,感谢观看,点个关注不迷路。