hello, 大家好,我是媛媛老师,欢迎来到本节课题词的写法与高级技巧。 这节课我们学一下题词的写法以及题词的高级技巧。我们知道在 convi 中,我们需要一个正面提示词和负面提示词同心输入到 key 传感器,那什么是正面提示词呢?我们简单理解,让 convi 给我们画一张图片,它里面包含了什么内容,那这就是正面提示词, 那负面贴纸呢?负面贴纸就是跟正面贴纸相反了,就是我们不希望 carnegie 给我们生成的图像中有什么元素。当我们有的时候,正面贴纸写的一堆,出来的效果不是很理想的时候, 那我们加上负面贴纸呢,出来的效果就会有理想的效果。负面贴纸比较简单一点,我们可以去复制一个通用的负面贴纸文字,它无非就是让我们这个画面不要出现低质量或者错误的手,错误的脚,水印这些等等, 这些我们都是可以去复制过来的。接下来我们讲一下正面提示的书写规则。正面提示词它支持短句单词 tiger, 它也可以支持我们自然语言,这里需要我们通过大部分的选择是使用短语还是自然语言。 如果我们现在使用最新的 plus 模型,它支持的是自然语言,如果不是 plus 或者是 s d 三呢?我们正常情况下还是用一个单词一个单词的进行一个书写,比如说 one go, 逗号,龙黑啊, 那这里就是两个英文短句 one go, 聋哑,这中间呢,我们要用英文逗号进行隔开这个英文逗号,它可以分割不同的关键词 tiger, 但是我们要记住空格和换行,它是不影响我们单词词组的, 影响词组分割的就是这个英文逗号,比如这个聋哑,我们再加几个空格,它其实呢还是一个词组,就是一个聋哑,或者呢,我把哑放到下一行, 它其实呢还是浓黑了。只有当我加上一个逗号以后,它才会进行一个分割,就把它分割成浓和黑啊两个短句。所以说目前除了 s d 三,我们正常的孩子用一个关键词短语化,也就是说正常情况下 conifer 它只接受短句,而不是长短的描述。 比如 a girl when long hair is painting in the water, 它是一个自然语言的长句,这个时候我们更多的是把它进行一个短语化。我们可以像下面这样写, a girl 逗号, long hair, 逗号, painting with water。 相互矛盾的词不要放在正面提词里面有这样一句话,在小小的花园里挖呀挖呀挖,种小小的种子,开小小的花, 那这里有一个哇和重,这两个是矛盾词。 ai 他 不知道优先呈现哪个画面,到底是重还是哇,所以说他只能猜测。我们的动作比较随机的进行一个出图,我们尽量删除一个动作,更突出描述我们想要的动作,你到底是想哇还是重? 还有一点,我们尽量选择 stable definition 模型训练的词组,因为很多时候我们的自然语言都可以用不同的词组形成同样的意思。那你比如说 a go 和 one go, 这两个是一样的意思,对于我们来说没有差别,但是对于 a a 来说它们是不一样的,他们认为后面这个弯钩是更准确的,导致这种情况是和模型训练时踩样有关。你可以认为这些同义词在 a a 词典里面已经有了这些词。 接下来我们学习提值词更高级的写法。第一个就是权重提值词的写法。什么是权重提值?就是说我们会让一些短词它的权重更高一些,在生成的时候优先去生成这样的信息,比如这样,我打个比方, one go 龙 hair 跟女孩长发, blue hair, 蓝色头发, red code, 红色衣服, purple eyes, 紫色的眼睛。那这时候我们去生成图片啊,有的时候提值词我会按照我们的要求来进行一个生成, 这里我们可以看到他这个眼睛啊,并不是紫色,而是蓝色。这样我们这个时候就可以用权重提示词,我们把紫色的眼睛给他增加个权重,让这个紫色的眼睛啊更能凸显出来。那如何去给提示词增加权重呢?他的方法也很简单, 我们正常是用小括号将我们需要增加提示词的权重给他括起来,这样我们就可以给紫色的眼睛增加了权重。 那他的权重数值是多少呢?正常情况下,我们加一个括号,他的权重是一点一,也就是说其他没有加括号的,他的默认的权重是一,加了一个括号的,他的权重就变成了一点一。 这地方我们也可以加两个括号,加两个括号的意思呢,就是一点一乘以一点一,相当于一点二一。这整个题的权重呢就是一点二一了,比刚刚的更高一些, 当然也可以加三个括号,四个括号,加多少个括号,就是一点一相乘。当然这里也有一个非常简变的一个方法,就是只用一个括号,在梯子的后面加一个冒号,给他填上我们想要加的权重,比方说填上一点四, 这个时候他的紫色的眼睛呢,权重就是一点四,其他的都是一,也就是说他比其他的梯子的权重啊高了一点四倍。这时候我们去生成看一下效果, 可以看到,由于我们将紫色的眼睛,他的提子权重增加了一点四倍,这个时候他的眼睛变成了紫色,但是同时呢他的头发和衣服也变成了紫色,因为他这个紫色权重啊是非常高的,所以说这里的提子权重啊,也不是随便增加的,一定要把握好这里的素质的关系, 如果不加可能会体现不出来,如果加高了,可能会导致和其他的值的污染。既然有增加提值的权重,那么自然就会有减少提值的权重,那它减少提值的权重怎么书写呢?我们给它输入一个中括号, 增加中括号的理解呢?和我们增加小括号的理解是一样的,只是增加中括号,它是减少小括号的理解是一样的,比方说可以给它增加两个, 它也可以通过中括号后面冒号写上数值,冒号一点四就是减少多少倍, 也就是中括号呢,它就是除以一点一,加两个就是一,除以一点一,再除以一点一,也是同样的道理。那往往我们在写提值词的话,是不用去用减少提值词的权重的,我们正常都是用增加权重,我们需要用的是把想要增加权重的提值词给它添加一个小括号, 给他提升权重就可以了。好了,本节课就先讲到这里了,感谢大家观看,咱们下节课再见!
粉丝84获赞260

哈喽,大家好,今天给大家带来一个小工具,平时只要我们玩 ai 绘画,无论你是用康福源还是极梦香蕉以及其他出图片视频的 ai 工具,都会涉及到提示词的反推和润色。这个功能虽然说在哪里都可以用啊,我们打开豆包,打开 jimmy gpt, 都可以帮你反推一个提示词,甚至在工作的当中的节点也有很多, 但是呢,以我自己的感受来说,就是东一块西一块,真正着急用的时候又没有办法马上调出来用一个什么东西,所以我就做了一个这样的小工具。 小工具说来很简单,就是调用 api 来反推提示词,但是呢,越简单的功能就要把颜值和交互做好一点,而且呢要有积累的功能,让你所有的提示词都沉淀在这个里面。这个工具我有放到群公告里面,大家可以暂停一下自己拿走。简单说一下它的用法,我这里预设了五大类型的提示反推,包括这个 ltx 二点三,大家都知道它是比较吃提示词的, 还有 cds 二点零,以及常规的图声视频,自然语言的中文反推或者润色。还有就是香蕉的提示词,选中任意的模式背后都有一套预设的提示词,我们只要在下面简单的输入 你的提示词要求,那他就会按照这个提示词的预设来帮你反推合理的词。这里面我个人用起来,尤其香蕉这个非常好用啊。有时候我们描述几个图片的编辑关系,描述不清楚的时候,可以直接把图片以及你简单的要求传输上来,它会给你一个相对完整的逻辑,然后呢下面这里是置顶按钮, 然后这里配置 api, 这里会有历史记录,所有我们生成过的提示词都会存到永久的存到你这个工具当中,然后呢最后是一个关闭,比如说我们在自然语言中文这里尝试一下,我们输入一个女孩户外写真,然后呢我给他一个几条两条或者十条五条都可以让我们点击运行,他 就会调用 api 帮我们生成这个地方的 api, 能适配 open 接口的都可以,那得到这个结果之后我们就可以复制到其他地方去用了。同时每次我们生成一条之后,我们在这个地方可以发现 当前你的灵感池就多了一条,也就说你所有的东西都会被积累到这里,那积累的这个内容呢?我们之后可以在这里搜索你之前生成过的提示词,或者呢我们直接在这个大圆球上面点击一下,它就会把当前结果当中的之前的提示词可以随机出来一条,你就可以直接去附用它,尤其是通用的 纹身图类的我们都可以直接用。如果我们的提示词当中有反推图像的,或者你用香蕉的时候要给他看到你的图片,那我们就直接把你的图片这样给他拖动进来,他会有个特效,当我们松手之后呢,他就把图片给吃进来了,最多可以上传四张图片,点击清楚就可以清除掉这个图片。大概的功能就是这样,我在软件当中还放了一个使用说明, 大家打开之后可以详细的看一下这个使用说明里面的提示词预设我们是可以自己改的,如果大家觉得我现在这个预设的提示词不满意的话,可以自行去修改。我这几个预设的提示词对于新手同学来说应该还是挺有用的,大家可以直接打开这个文件,然后看看我当前这几个模式的提示预设,也可以来参考一下。 ok, 这个工具很简单,直接大家解压就可以去使用了,重点是想跟大家聊一聊最近火热的龙虾技术,我发了这个工具,肯定也会有人说现在用龙虾直接都可以调用提示词去出土等等的工作都可以做了。我个人认为,当前绝大部分的人来说,龙 龙虾对它是没有太多用处的,反而大家可以去学一学现在的一些编程助手,比如说 coser, 谷歌的反重力,或者是 cloud code 这些可以直接在你电脑上帮你修改文件,帮你写代码,帮你整理文档,帮你梳理架构,甚至帮你钻研课程的这些东西。像这个工具就是我大概花了三个小时的时间, 一句代码不用写,我也不会写代码,你只要跟他提需求对话,只要你有提需求的能力,只要你有用户思维,那你就可以做出这样的东西来。更底层的就是学会如何跟 ai 对 话,如何跟 ai 学会其他各种你不懂的东西。所以反而建议大家可以去学一学这样类型的工具,它会离我们实际解决问题会更近一点。

搭建好工作流之后,是不是要去别的地方翻译提示词?把中文翻译成英文,然后再复制粘贴到文本编码器里,今天这个视频教会你一键翻译,它还有很多提示词,画质类的面标签,摄影艺术类的 人物场景都有,我们随便选择一个,现在是英文,点击下面的翻译,它就成中文了,然后运行上传好图片,看一下, 完全没问题,接下来教大家怎么操作。点击上方的 menu, 这里有个界面,我会把中文放在旁边,大家可以看一下,我们选择第一个 ctrl 键,我们要在这个对话框里输入小助手提示词, 选择二点零四下载,我这个已经下载好了,他会选择这个界面,如果没下载好的话,他会选择下面这个界面, 我们选择二点零四版本下载,下载好后需要重启康复 u i, 重启好之后,选择左下角设置,往下滑动就能看到提示小助手点击它往下滑动,现在搜配置这一栏, 我们需要注册自己的 a p i, 点击 a p i 管理,有百度,有字谱,有聚合,有本地,我选择字谱够用就可以了。点击开通字谱 a p i 服务,它会跳转至这个界面,我们点登录,扫码,登录后选择右上角图像, 点击 api, 然后就可以在这里注册自己的 api。 点击复制回到康复 u i, 然后把复制好的给 api 粘贴关闭,然后在配置这栏里选择字库关闭添加都可以。根据我们第一节课搭建的纹身图工作流进行创作。 点击文本编码,把鼠标放到文本编码的右下角,就可以出现小助手提示词,还有翻译油画 标签工具,还有回车,向前车,向后车,还有历史记录,现在我们就用小助手提示词创作我们第一张照片,可以点击标签工具,我们随便创作一个, 点击场景大海,点击运行。 创作好图片之后,我们可以点击翻译海洋公主动脉杰作,看一下深层的图片是否跟提示词是一致的。 海洋公主动漫杰作,那么其实此的前后顺序对生成照片有什么影响吗?我们试一下,现在调换一个顺序节奏,放到第一个,我们拿出第二张图片 进行预览,点击运行放大,可以对比看一下。点击翻译, 为什么在相同的体式下,相同的种子下步数下参数都相同,只是变化了体式的顺序,照片的差别就会很大,因为体式它有优先顺序级, 越靠前面的体式它越重视,越靠后面的体式它越背越滑。我们现在多放几个体式, 我把描述人物的放在前面,把动作场景放在后面,然后我们把种子固定住, 点击翻译,点击运行,可以看一下照片,我们就拉出来做一个对比,现在把场景放在前面,把人物描述放在后面,点击翻译,点击运行, 就可以看到很明显的区别。我们看一下负面提示词是什么意思,点击标签,在负面标签这里可以选择,我们可以大致看一下,比如说我们生成的这张照片,它有变硬手指的问题,就点变硬手指, 我们可以看一下原图的手指,再点击运行两张手指进行对比,这边是六指,这边就变成五指, 这就是反向提字词的作用,还可以在正面提字词这里添加画质类的, 选择画质我添加几个测试一下。把画质类的放在前面,然后在副向提字词这里点击负面标签,把画质类的添加进去。看下两张图片, 大家可以自己多尝试一下。

hello, 大家好,今天呢,我们就开始 openclaw 的 教程,然后今天是第一节课, 第一节我们想先讨论一些关于高频的一些问题,也就是大家对于 ai 整个行业,或者说对于 openclaw 以及 comui 的 一些问题。 我们先看第一个哈,也就是大家问的最多的, ai 发展越来越快,我们是不是有必要现在学这些,或者说明天就会有新的工具把这个工具淘汰了,我们是不是有必要去学哈?然后这里可以先想一个问题, 看我视频的,我相信大多数的同学都是之前有接触过康复 u i 的, 那么假如说在一年之前,你因为这个问题,也就是 ai 发展越来越快,我是不是有必要现在学康复 u i, 然后或者说有一些新模型的出现,它的能力很强,那康复 u i 里面的工作流就被弱化了,我是不是有必要再去学康复 u i? 如果说因为这个问题,你在一年前放弃了学习康复 u i, 那么在今天你再继续追这套教程的时候,你就会发现,因为对 cfui 的 不熟练,所以说后续教程讲到 openclock 加 cfui 的 时候,你没有办法去配置工作流, 或者说你对工作流的配置,包括里面的某些参数的设置都是不太了解的。那这个问题呢?或者说这个原因就是因为在一年前你放弃了 cfui 的 一个学习,所以说在今天你需要重新再补充 cfui 相关的知识,那么相当于第一个问题, ai 发展越来越快,我是不是有必要现在去学呢? 那意思就是这个问题不是一个需要考虑的问题,因为你学到的东西在以后不管多多少少他都能够用的到, 其实这一点呢,跟我们第四点也会有关联,一会我们讲到第四点的时候,大家就能发现哈,反正关于第一个问题,主要讨论的点就是能不能跳出你学习的这个工具,去看待 你学完之后到底学到的是什么。如果说你学完 cfui 之后只是会用 cfui, 或者说只是知道在这个界面里面点个运行能生成一张图片,那说明这个学习的过程它是 不太对的,那么一会我们讲传统的学习思路的时候,大家就会明白哈。然后呢就是第二点,本地部署是不是需要很好的硬件,硬件的话只要能支持你运行 cfui 就 行。如果说你只是用 openclaw 去做一些,比如说资讯整理,网页浏览,然后帮助你下载一些内容的话, 那么这个对电脑的要求是非常低的。 openclo 它本身并不具备调用模型的能力,它甚至不如你运行一个游戏对电脑的要求高,因为我们用 openclo 的 时候,最好是给它配一个比较好的大脑, 那么这个大脑一般都是闭源的,我们通过接 api, 所以 说才会消耗我们的 token, 也就是在这样的情况下,我们的 openclaw 对 电脑的要求是特别低的。假如你不做 openclaw 加 comui 的 一个联动,那么 openclaw 本身并不怎么消耗我们的算力,或者说并不怎么消耗我们的硬件。 我们可以写一下啊大概的逻辑或者说流程,大家可以理解为是 openclock 本身加上 comui 工具,或者说你加上 ps 呀,包括你说的 pr 啊,或者说一系列其他的都行,那么主要对硬件的消耗啊,是这块儿它们会占用硬件,但是 openclock 本身它非常的清亮化啊, 它只是一个跟我们交流或者说跟这些软件联通起来的一个工具,所以说它本身占用的我们电脑的内存啊,包括我们的显存啊,甚至说它运行时候对我们的电脑的压力来说都是非常非常小的 好吧,这也是为什么那些各大厂商的服务器都开始推出轻量化的一种 openclo 的 部署教程,一键部署的教程。所以说 openclo 本身对我们电脑的压力非常的小, 只要你不用后面这些大型的工具,那么对你电脑的硬件消耗是非常低的。但是如果说你要用的话,那它的消耗也是基于当前这个软件的消耗情况去进行判断的。比如说你用 copy y 要跑一些视频或者说图片,那么你的显存我建议是十六 g 以上,那么在十六 g 以上的情况, 你可以适配大量的显卡,就像四零六零 ti, 或者说五零六零 ti 等等一系列的,那么这些呢,都能够比较好的去支持我们运行 cfui, 那 你做 openclock 加 cfui 的 联动,在十六 g 的 显存上也是完全可以用的 好吧,所以说你的硬件能力取决于你后面调用的工具,而不是 openclock 本身。如果你用 openclock 只是做一些资讯的整理,那你完全可以在自己的电脑上部署,这个要求并不高 好吧,要求很低。然后第三点,如果 open color 加 comui 你 做到了,你也部署了,但是生图什么的你都可以,但是为什么你还要这样?意思就是 你既然可以在 comui 前面,也就是你坐在在电脑前面完成一次生图,直接点击就可以了,视频也是点击就可以了,那我为什么还要部署一个 open color, 让他去帮我完成点击这个操作呢?如果只是站在这个层面去想,那确实没有什么必要,我们自己点就行了。 但如果说你站在另外一种情况哈,我们来考虑一下,现在给大家演示的它只是一个简单的流程,或者说为了方便大家理解了解它的功能而做的一个流程。但是呢,既然你在 openclaw 里面配了一个非常聪明的大脑,那它就可以像人类一样去思考一整个过程。就像左边我这里给了一个案例, 如果说你在刚部署完 opencolor 加 comui 的 时候,你说让他给我生成一张图片,然后不是给你生成了一张图片发送给你了,那这个确实你在电脑面前自己点运行就行。让他生成一段音频,然后不是生成音频发送给你了,你点个运行也行,那这个过程确实没必要。但如果说你是把大量的工程量给它串联起来的呢? 或者说你以一个任务的形式发送给他,他批量的或者说长线的去完成整个流程的话,那这个时候就不一样了,就不是你点击一下就可以的了。 我们看一下左边这个案例,我说的是给我生成一个真实的男生,然后大概五十岁左右,然后呢,再用小黄瓜的声音生成一段音频,然后音频的内容我也给他了,用文字的方式给的,然后呢,再让他用这段音频和刚才生成的那个男生给我生成一个数字人的视频。 这一整套流程在 comui 里面,如果你要做,最少需要三套工作流,对吧?一个文生图的,一个音频克隆的,再加上一个数字人生程的三个任务。那在当前这种场景里面,我们还是打一段文字发送给他, 等待结果就行了。跟我们生图一样,也是打一段文字发送给他,等待结果就行了,但是他代替掉的工作量,对,我们只是生图,他代替掉的工作量就是我们打开 comui, 导入文生图工作流,点击运行,对吧? 如果是现在这个场景呢?它代替的工作量就是打开 comui, 导入文生图工作流,点击运行,然后保存图片,然后再打开文声音频工作流, 然后导入音频,然后再输入提示词,完成音频的生成,然后保存音频,然后呢,我们再导入数字人生成的工作流,然后上传音频,上传我们的图片,然后再点击运行,生成最终的视频,然后再保存,对吧? 刚才这一系列的工作流,或者说这一系列的任务,在跟我们纹身图对比的时候,在左侧我们跟 opencall 能交流的情况下,它的任务量没有增加, 只是我们多打了几个字,但是它实际替代掉的工作量是成倍数的增加。所以如果你只看一个生图,它确实啊,很简单,就是我们可以自己用 comui 做,但是如果是一个长线任务不行,那假如说后续你直接给他一个剧本呢?我们现在知道大语言模型, 或者说一个类似于豆包一样的能跟我们交流的模型,你给他发一个剧本,你让他完成剧本的分镜,包括每个镜头的设计,他都是可以完成的。 那么这个时候我们就可以想象一下,当我们把一整段的剧本发送给 openclip 之后,他就会自动帮我们把剧本完成分镜,分镜完之后,他就可以自动再调用 copy y 完成各个分镜图的生成,他甚至还能给你做成视频,然后视频进行一个合并再发送给你。 而中间这一整套流程还是没有增加工作量。如果只是用 openclo 的 话,我们就还是一句话,剧本发给他,让他根据剧本给你设计一个视频,然后将最终生成的视频合并之后发送给你, 还是只是打字打了一长段子,这个工作量基本对我们来说没增加。但是如果没有用 openclo 的 过程中呢,你就需要自己去设计分镜,自己去设计人物图,设计定这些角色的妆容什么的,然后再完成视频的生成,然后生成完之后再完成一个合并,对吧? 所以说这一整个过程,大家一定要跳出你当前使用的这个具体的场景,一定要跳出这个怪圈,好吧,不要被现在这个圈给固定死了,你如果站在更高的维度来看,现在发生的这些事情,它是不一样的, 好吧?所以说第三点,如果 opencolor 加 comui 你 做到了,那为什么还要这样呢?就是因为在长线任务当中,它可以帮助我们减少非常多的一个工作量,而且这只是我们现在使用到的一个场景,只是一个场景哈,在其他场景也更多, 因为在我最新的视频评论区看到有个同学说,就是什么样的神人需求是能在外面给龙虾发送指令,帮自己生成一张图片、音频、视频。所以说就像这位同学一样,他可能就是站在了这个具体的场景去考虑了这件具体的事情。就像下面他说的,并不是人人都是靠自媒体为生,也确实是, 就是可能我给大家演示的案例更多的是能够在我的生活中,或者说在我的工作中提供帮助的。但是如果大家以为这个过程就只是能辅助我的话,那就说明大家在学习的时候陷入了一个误区, 这个误区就是看山就是山,也就是我做了一个资讯,那你获得的就也是一个资讯,那这个结果是不一样的哈。 好吧,那么再来第四个,这一点大家一定要认真的去听哈,因为有很多同学还陷在传统的一种学习思路里面,那么这个传统的学习思路我先说一下我的一个理解哈, 就是有很多同学会陷入一个怪圈,就是比如像之前我们学加法一样啊,一加一等于二,那我在计算机上按一加一,最终得到的结果是二,那么你在计算机上按一加一,得到的结果也是二, 所以说你可以跟我一模一样的步骤,完全去复现我们视频里面给的结果,这就是传统的一个学习思路,也就照葫芦画瓢的形式完成复现,这样的话你才觉得自己学的是对的。你就比如说假如此刻我们的 openclaw 已经部署好了, 然后呢?我给他发了一个消息,我问他你好,然后他回我好的哥哥有什么可以帮你的?然后假如说你问他,你好,他回你好的老板有什么可以帮你的?那么这个时候大家可以看到哈,是完全两个不一样的结果,前面可能都一样,但中间这个称呼他是不一样的。 那么假如发生这种情况了,大家会觉得自己因为结果跟我的结果不一样,而去怀疑自己部署的过程是不是对的吗? 如果说哈,大家有这种想法啊,或者说这种思路,那么在现在学习 ai 的 过程中,是会陷入一个非常大的误区的,因为 ai 产生的结果具有一定的随机性,我们给他完全相同的内容,他得到的结果可能是不一样的。 你就像在 comui 当中,或者说你在进行图片生成的时候,或者说你用一些币源,或者说香蕉啊一类的模型去完成图片生成的时候,我们给他完全相同的提示词,他给你最终产生的图片是可能不一样的,对吧?他是可能不一样的,而且是很大概率不一样的, 因为他内部控制的不仅仅是我们能够看到的提示词那么简单,他还有一些随机的种子在里面的。 所以说这个时候大家就要摒弃传统的学习思路,从结果去看你学的过程对不对,也就是很多同学会从结果去反推你的过程对不对?但是在 ai 学习的过程中,大家一定要是过程的一个思维, 也就是你能确定你的过程一定是对的,那这个结果不一样,那他也正常,或者说这个结果不一样,那也不可能是过程的问题,好吧,就是这一点,所以说大家一定要抛弃传统的学习思路,在后续我们部署完 open call 之后,让他去做一些具体的任务的时候, 我们是需要跟他进行非常长线的一个交流的。那么在交流的过程中,我们发给他的问题,比如说我问他一个问题,你用一样的文字也问你的 open call 一个问题,得到的结果可能是不同的,你就像很简单的下载图片,他都可以选择不同的方式, 所以说我们得到的结果可能是不完全相同的。但是你不要去怀疑自己做的是不是对不对,而要去判断这个过程对不对,不要只从结果去看这个过程对不对,而是从过程去,也就是保证你的过程对,然后结果就一定是对的啊,是这样的哈, 好吧,所以说这个呢,就是我们在学习 ai 工具的时候,你要放弃的一个学习思路。那么这一点呢,在后续我们做 openclo 教程的时候,包括大量的跟 openclo 交流的时候,都会不断地去重复强调这一个知识点。然后呢, openclo 的 教程相对来说比较难出一点哈, 因为大部分的情况下,我们看到的都是一个浮于表面的聊天框,而具体的后面也就是 openclock 它运行的过程,我们需要通过各种各样的蛛丝马迹去看它有没有在运行, 而且有的时候呢,你会发现你给 openclock 发送了一段消息之后,它回你,好的,我接下来就进行处理,但是呢,它其实并没有运行,它只是回了你一句话,我我正在处理, 但是其实他并没有运行,那可能你等了一个小时,两个小时之后他还没给你,结果你再问他的时候,然后他说好的刚才确实没有执行,我现在开始执行啊,但是其实他还是没有在执行。那就像这种情况就会带来一个问题,就是大家会不断的等,但是你又不知道该怎么去判断,那么这些内容我们在后续都会去讲, 所以说大家一定要注意整个过程,好吧,整个过程过程是最重要的,好吧,那么接下来呢,我们看一下第五个点,也就是 openclock 后续更新,我们的更新重点呢是会结合 comfyui 去进行使用哈, 那么除了这个重点之外呢,我们也会做一些其他尝试,但我的尝试肯定是依据我当前的工作情况来进行的一个使用哈。 你就像我是一个自媒体的博主,或者说我经常会做一些直播,那么在直播过程中我就会有其他要处理的内容,比如说我直播完的录播要进行一个切片啊,要进行一个压缩。 还有就是我作为 kufui 领域的一个博主,我可能会经常去获取 kufui 相关的一些更新,包括其插件以及模型的一个更新,那么这些内容就是我 个人会去做的一个尝试,那么到时候也可能会出成教程来,让大家看一下我是怎么从零开始,然后让它完全符合我的要求的整个运行的过程。但是呢,大家一定还是那句话, 抛出我们看到的表象,去思考整个聊天交流和配置的过程,也就是假如你不是一个博主,或者说大部分同学,我相信都不是博主啊,那么大家如果说在自己的行业里面,假如说你做的是跟那个新闻相关的, 那可能你就需要把资讯这一块,把它往新闻那方面去搬啊,那假如说你日常会有很多的视频素材要做切片的, 那你就可以把我的这个流程切换成你自己的视频,所以说不要被具体的场景给框死哈,并不是说我教给大家的是做资讯,那你们就只能做资讯的,不是的哈,大家要学到他们之间统一的一个规律哈。 好吧,那么这个呢,就是我们第一节课我想给大家讨论的几个问题。重点还是第一个问题啊,就 ai 发展的很快,但是我们都有必要去学,因为你学到的知识点他一定不是一个点啊,他在以后会给你提供其他的帮助的。好吧,我们之前学到数学真的没用吗? 啊?我们学了一加一等于二,我以后真的不需要用到一加一等于二吗?好吧,那这个问题大家可以想一想,其实学数学最主要的就是一个逻辑思维的能力。好吧,那么第一节课呢,我们就先讲到这里。

大家好,这节课啊,我们讲一下自制节点教程的第二节。嗯,以实践来讲,一个 api 节点的制作,可能大家会觉得这个跳跃有点大啊,因为好多小伙伴可能对 api 这个定义还都不是很熟练, 其实这个 api 定义呢,大家也可以谷歌一下啊,这个没有什么太复杂的,它就相当于一个中间人, 比如说啊,一些大模型,类似于我们这个 nano banana 这种大模型,我们它没有开源,我们想在这个 comptium 中使用, 使用这种优质大模型的,我们就需要借助 api 这个平台,让它和就说代替我们和谷歌进行交流, 它就相当于一个中间人,这就是一个 api 协议。而我们做这 api 节点的目的呢,就是说能调用这个协议,调用这个中间人,调用这个中间人,把你这个需求,比如说我想修这个老照片,然后呢你把这个需求告诉第三方, 第三方 api 调用平台,第三方验证你这个 api 密钥,就是这串钥匙没有问题。之后呢,然后他会把你这个需求再发到这个,就说, 呃,东家,比如说谷歌吧,纳都不纳的是谷歌吧,发配到谷歌,谷歌拿到这个要求之后,然后给你做好了这个东西,然后再返回第三方,第三方再发放给你,他就是一个中间人,一个桥梁的作用, 这就是 api 的 简单一个定义啊。而大家可能做节点呢,感觉就说,呃,稍微跳跃有点大啊,因为我们第一节课讲的是 就这个后端节点的制作,正常来说我们应该讲完后端,然后讲前端,讲完前端呢,讲这些逻辑节点属于这种逻辑节点,然后再开始到 api 这个,但是其实说实话这个东西没有先后, 因为如果大家学会的第一节,其实其他的像是前端节点什么的,慢慢的你通过跟他交流都会明白啊。后端节点我们第一节课讲过了,就剩下的大家想实现什么功能,慢慢和他交流就行。 前端节点呢,无非就是多了一个用户交互的,比如说这个,对吧?我在这实时操作,你看他这里实时就能展现出来,这就是所谓的前端,因为他在前面和你交流了吗? 这就前端的意思啊,当然这个节点啊,这是大炮工具箱,我这边也放出来了,大家自己更新一下或安装一下就可以了啊,弄完之后点应用调整并继续,你看他就到下一步了,这个就叫前端交互节点。 这个通过沟通也是可以的啊,慢慢的和他沟通去做就行。他会在,他会在这个 ai 编程,会软件一步一步告诉你,你想实现这个功能,这个叫什么功能,这一类的你都可以通过问他来解决, 所以说咱就这些就不浪费时间了,因为这个都就是慢慢通过实践来搞的。而 api 稍微复杂一些, 因为很多小伙伴就像我刚才说的,第一对 api 定义不太了解,第二呢, api 有 各种第三方节点,或者说第三方网站调用,每个每个人用的网站都可能不一样,你你比如说我一,我一般平时用真真吧, 用这个真真的功放,但是呢,他有时候也是不太稳定的,我虽然用他,但是他有该不稳定也是不稳定。 呃,还有一些小伙伴呢,比如说用其他的,呃,像是兔子和阿宝宝之类的, 但是我们用节点的话,你不可能就说所有的第三方都找到节点,如果说你实在买了这个第三方钱比较多的话,那你就自己做一个节点,就是为了解决大家这个需求的啊,也很简单啊,学会之后,其实一个节点你只要学会调用了, 也就十几二十分钟就可以做完了,但是这个做完之后我们就会省很大事,对吧? 我们这节课呢,就是以这个豆包豆包处理一点五的一个视频模型为案例,跟大家讲一下啊。 首先啊,我们还是回到工具的选用啊,第一节课我用的是 coser 啊,那时候我就和大家说过,就说如果大家用 coser 的 话, 得去买那些什么无限续杯的,我不给大家推荐,因为会跑路啊,其实我用了一阵之后,那个淘宝卖家果然也跑路了,所以说哈,我现在也是用这个脆啊 脆。我第一节课也跟大家简单介绍过大家如果想用脆的话,两个条件,第一点,你必须魔法稳定,没有魔法是用不了的。第二呢,你必须用这个,就说国际版的脆啊,就说地址要改成这个点 ai 去下载, 比如说这个啊, p r a e。 有 魔法的话,大家一般搜到的都是这个国际版的, 类似于这个网址啊,三 w 点脆点 ai, 如果没有魔法,那你搜的是国内版的,不要去折腾自己啊,这个国内版的基本是用不了的。脆这块呢,你得升级这个 pro 版啊,升级 pro 版之后他是要付费的,第一个月是三美元,然后是六百条高速, 高速什么意思呢?就是说和你交流的时候,他速度会更快啊,更快的回答,一般我们做节点就说你一天一直问他,其实也用不二三十条啊, 所以说我感觉是够用的啊。当然,如果说你这个会员到期了,你可以再注册一个账号,再享受这个三美元一个月。注意啊,他这个是支付宝支付的,如果支付宝支付要开通自动续费,大家开通完之后一定要记得手动关一下,到时候到期了,你再换一个账号注册就行啊, 相当于每个月三个美元。呃,注册完之后,这是正版的吹啊,我建议大家就用这个,就不要折腾了啊,因为淘宝经常跑路啊,所以说我也不推荐了,我也不爱捣鼓淘宝了,做个节点吹足够了。 搞完之后呢,我们在软件里头啊,把这个模型 auto 给关掉啊,这个自动模型肯定不行啊。 然后选模型呢,第一步,大家可以选这个 jimmy 三, jimmy 三呢,分两个啊,第一个就是正常交流的一次一条高速通道, 第二个呢,是每次二百个高速通道。但第二个呢,他会有一个上下文压缩,会给你往上下找上下文针对一些大项目来说会比较有用啊, 并且速度会更快一些。好,再就往下一些高级模型啊,可以大家考虑用这个 gpt 五点二,就这个啊,脆是没有克劳德的啊,所以说这个是也是他的一个缺点。然后大家可以考虑就用 jimmy 和靠和 gpt 五点二, 其实写节点这几个节点,这几个模型足够了啊。好,然后工具选完之后呢,我们就开始,呃,写节点,第一步呢,我们先把这个节点的目录给建好,比如说大家在 comui 中建好这个, 其他的就第一节课都讲过了,比如说装热、启动插件什么的,咱就不讲了。好,弄完之后呢,大家打开文件夹,然后把刚才建的这个给放到工作区里头,然后这是我之前的,就关了就行啊。 工作区工作区建好之后呢,我们需要在设置里头给他定义一个这个规范啊,就模型的规范, 然后这个个人的规范,这个无所谓啊,这个个人规范我是从网上抄的,这些规则呢也会放到网盘里头,到时候大家自己可以照着改改啊,无所谓。然后最关键的呢是这个项目的规则,就这个项目规则啊,大家点创建项目规则,然后 呃,把这个我给的项目规则大家看着改一下啊,类似于这个,这个呢是我就说做节点的过程中规范的规范优化的啊,基本就说比较常规啊, 但是效率比比比较高。第一点,大家需要定义这个项目的名字,你比如说我们这个项目的名字定义的是叫, 定义的是叫豆包微流,对吧?大家也可以直接就这么复制过来啊,然后前面这些什么小图标、小优化自己都可以搞一下啊,这无所谓了。第二点呢,需要注意的是你这个节点分类使用放到哪里, 这个什么意思呢?就我做好了节点之后,你看它会下面有一个列表,对吧?你是放到哪个列表里头?好,比如说我们把它放到这个豆包视频可以有中文啊,这个无所谓。 如果说你是大项目,像大炮 a p i 什么的,也可以再进子文件夹,到时候在交流里和他说啊, 比如说让他放到豆包视频这里头,第一步呢,就相当于改完了,不用管他了啊,就直接改改,改成适合你的项目规范的就完事了。第二点呢,关于图像规范,因为我们这个是要比如说图声视频嘛,所以说这个就不用管他了啊。 第三点呢,是路径与文件管理,这个是不需要的啊,大家可以删掉。 呃,这个如果说适合什么情况呢?因为大家做好节点,有可能是要发到 get 上头,然后发到 get 上头,如果别人下载下来,有可能你写的节点用的是绝对路径,就只在你自己电脑能有效的,别人下载了是用不了的,所以说这个是为了规范这个 才写的一个规范啊。然后如果是 api 节点呢,大家就需要注意这个啊,如果你是最终是要发布到网上的公开的开源节点,一定要把你这个 api 就 说不要发布出去,因为你测试的过程中肯定是需要接入自己的 api 的, 所以说这个是做这个的啊,就说我最后开源的时候,我的 api 在 使用过程中,嗯,就要做到单独分离,是这个意思,所以说大家把这个复制一下,自己改一下就完事了。好, 两点搞完之后,这样相当于项目规则,个人规则都做完了,这个我们第一节课有详细说明,这节课就简单补充一下就行了。好,这个软件这一块准备规划,规划完了。第三点呢,大家就需要注意找到自己。 第一啊,你需要准备一下,你需要了解这个模型能做什么,我们调用的,呃,是火山这个我们调用的呢是豆包,豆包一点五视频模型啊,视频模型能做什么呢?那肯定不用说了,对吧?第一他是纹身视频, 对吧?第二是图声视频,第三呢就是首尾针, 并且呢它这个生成的视频是带声音的。好,大家要首先要了解你要调用的这个 api, 这个模型它有什么能力啊?它能力是这个。 然后第二点呢,就是说,呃,你需要确认自己这个 api 密钥能不能调用这个模型,这个什么意思呢?比如说啊,我们这个例子是以火山方舟这里,因为豆包这里它就发布到了火山方舟啊,是这个看没有豆包 send video, 大家就点开这个文档, 点开这个文档之后呢,先看一下它这个模型的定义,你看第一文字图片视频,它能输出这些输入是这了,文字图片视频符合我们刚才说的,就这些啊,所以说这样就可以了。呃, 然后第二点呢,大家需要在自己的这个密钥这里就 api, api 是 什么呢?就我刚才说的 这个节点,或者说这个网站他需要验证你有没有这个钥匙,你这个钥匙能不能去调用这个模型,这个就在 api k 这里啊,比如说我这边就新建了一个 k 啊,这无所谓啊,因为我录完视频就删了,大家需要自己去手动去注册一个啊,把这个 k 养成习惯啊,新建一个记事本,把常用的东西都放到记事本里,把这个 key 复制到记事本备用。第二点呢,大家需要在开通管理这里去看一下你这个 key 有 没有就说 api 密钥有没有调用这个模型的能力, 一般向着火山这里就在这里看啊,视觉模型,你看豆包 send dreams, 一 点五 pro, 看自己有没有开通,已经开通了,说明你有这个能力,你可以调用这个, 他这个价格也在这啊,一般新用户是免费用的,你看我们就用这个免费的额度去做一下就行。我之前是测过一点啊,用的这一节好, 然后把这个模型确认已经开通了,这就说明你有调用这个模型的能力。如果是第三方怎么看呢?我以真真为例啊,每个每个网站的看法不一样啊,但是 通用逻辑是一样的,大家需要理解这个通用逻辑就可以了。首先在模型价格这里,比如说啊,我们想调用这个 gpt image, 一 点五,就 gpt 一个生图的模型, 大家需要点开这个模型价格,这里有四个分组,这四个分组呢是比较重要的,你看有 defend s s p, 什么 open, 什么 orange, 这说明你只有这个 api 要在这四个分组的情况下,你才能去调用这个模型。什么意思呢?比如说我们这个在 这里啊,在令牌这里,这叫 api 密钥,从这里可以看到你的分组,点这里啊,你看我在这里是属于这两个分组,就一个是 defeat, 一个詹姆尼优质,我再点开一个刚才它的模型的 api, 这块会比较麻烦一些啊,但是学会做 api 节点, 我保证对大家就说帮助很大,因为后期啊,基本我们康费约都属于闭源了,很多都会去调用 api 啊。当然不是所有 api 都付费的啊,很多是免费的,我这边和他重复的分组是不是只有 d f t 是 吧? d f t, 换句话说,我这个 api 密要是可以调用这个模型的,因为他在这个分组里有,但如果我把 d f t 分 组给删掉,只留一个詹姆尼优质, 而这个模型呢,它没有詹姆尼优质分组。换句话说,这样的话,你这个 api 密钥,你怎么的都是调用不了这个模型的,这这一点需要注意啊,包括大家测试的时候也是,这就是我刚才说的,你首先要确保你的 api 密钥能不能准确地调用这个模型。 好,其他第三方的原理也是一样的,大家需要自己看。搞完这个之后呢,我们前置条件准准备充充足了之后 就开始写节点了,怎么写呢?首先啊,我把这个网页打开,把这个网址给复制一下,这个呢就是他的就说,呃,模型介绍。然后呢,我们再换一个浏览器啊,因为我现在这里是登录了, 对吧?我现在这里是是登录这个网页了,我们换一个浏览器,看一下他能不能正常的识别这个网页,你看他能正常识别了, 这说明什么呢?说明这个网页是不需要登录去调用的。这种网页呢,一般我们就可以喂给这个有联网能力的 ai 模型, 然后把这个网址记一下,一会有用啊。第二点呢,大家需要去复制一下这个模型的名字,大部分这些模型的名字包括 api 地址都是可以方便你复制的,比如说啊,从这里, 然后你看这都有复制的地方啊,这里也有复制的地方,为什么都设置成这样呢?就是方便大家不要去手动去敲啊, 你手动去敲有可能多个空格或多个点什么的,这些就很容易造成问题啊,到时候神仙来了也查不到原因,所以说一定要养成这个复制粘贴的习惯啊。好,然后第三点呢,我们就需要把这个 接入这里看有个 api 接入,如果是第三方没有 api 接入啊,大家可以就说 复制这个网页或者说截图喂给 ai, 一 会我们告诉大家怎么喂啊,然后点快速接入测试,你看它有个 api 调用,看没有有个 api 调用势力,把一个完整的调用指南这个网页也给它复制一下。 好,现在啊,第一模型介绍,第二模型名字,第三调用指南,这三个常规元素就齐全了。把这三个元素给搞定之后,我们就开始告诉 ai 去做什么节点了, 好啰嗦的比较多啊,因为这个也确实没有办法, api 确实是有很多我们需要注意的地方,那我们就开始直接告诉他制作节点了啊。好,我们就简单写一下啊,就说我想制作一个康复员节点, 让他按照项目规则帮我生成名字叫豆包。其他的你像是网页介绍 api 调用指南和模型名字,都告诉他 这个模型名字,为什么要告诉他呢?因为有时候你不告诉他,他可能直接就到这,少了后面这个后缀啊,这时候调用会出问题,一般如果我们知道的话,你已经确认的什么名字之类的,尽量提前告诉他,省得我们多和他沟通费劲了, 然后把这告诉他。剩下的呢?比如说我们选模型呢? jmp 五点二都可以啊,比如说我用 jmp 五点二。 好,呃,当然这个一开始制作的这个节点不一定很完善啊,但是呢,我们先以这个基础看看,一步一步去完善他。好,稍等一会,你看他这里, 你看实现三种模式什么的,这就不用管他了,稍等一会吧。好,我们看一下他这里说已经生成完成了,生成完成其他我们就不需要看了,我们先看一下到底有没有啊? 然后因为我们装了这个老狗的热启动插件吗?所以说我们就直接刷新网页就可以了,然后也可以在这个后台看一下他有没有注册成功,你看 加载模块失败,这应该是注册失败了。嗯,我们找一下看看啊,这个确实是加载失败了,因为他这个节点你看豆包视频生成是没有的。呃,那我们就给他截个图啊,就这里加载模块失败后台的这个位置, 从这里吧,从这里给他加载,告诉他就说注册失败了,就说找不到这个节点。 正常来说啊,如果说一般情况下遇到这种情况,我们不会去反复问 ai, 因为他有可能需要找一个参考节点,一般情况我们可以给他一个参考节点, 比如说啊,嗯,比如说我这边做好的大炮 a p a p i。 你 可以直接把这个路径喂给他,当然我们因为是做教程啊,先可以尝试一下,看看他能不能自我修复,因为他有可能需要找参考。呃,这个康复医院注册他是都是在这个文件啊,就这个 innit, 这个都是在这个文件,这个是注册文件。什么叫注册文件呢?就是说从这个文件里去导入你这个 导入到你的康复医院里头,所以说大部分如果是这个文件写的有问题,他是导入会失败的,如果说实在不行,我们就找一个别人的节点啊,找个别人节点把这个呃注册导入文件发给他,让他做参考,我们先让他试一下自己能不能修好啊。 这个文件呢,匡斐源官方也给了,然后大家也可以从别处别的节点找参考,也可以把官方的给他稍等一会啊。 好,他说修好了,你看,嗯,他说修好了,咱看一下后台这里啊,哎,你看豆包微流什么已成功注册,看没有,这就说明确实能搜到了,我们搜一下豆包 豆包视频。好,我没有,我没有刷新啊,刷新一下 好,刷新完之后啊,我们再添加节点,这里看,就有个豆包视频看没有这个鹿头,然后豆包视频生成。好, 我们看一下这个节点的功能啊,第一是纹身视频,再就是首尾针就是 image, 就是 手针, image 就是 尾针啊,那我们找一个提示词看一下啊 啊,再就是刚才说的啊,如果说大家搞不定的话,可以找参考节点,找参考节点,这个这个大家不要有心理负担。第一啊,如果是开源社区,开源社区是有公约的,大家可以看一下,你看这是一份开源社区的许可公约啊, 只要你只要这个项目开源了,你是可以做任何事的,对吧?你看,第一你不需要给作者钱,第二你可以免费修改他的东西,第三你也可以用做商业 项目,你唯一的作用是需要什么呢?你在这里头需要就说保留原作者的声明,再就是人原作者不会为这个其他提供承担后果。所以说如果大家写节点实在有问题,去找参考节点, 包括你找完参考节点之后,把这个节点去作为自己一个公开发布,这个都是没有问题的。当然大家需要呃,一 提一下,你是引用哪个圆作者,这个也是我们需要做的义务,对吧?其他的都是没有问题的,这个是不是违法的?所以说大家需要注意一下这个 开圆的,同样的,如果说你的节点开圆了,别人去借用修改你的节点也是一样的啊,你只要你只要开圆了,就说明你允许你允许别人这么做啊。呃,我们去找一个提示词测一下, 大家尽量不要在这里填,为什么呢?因为这个节点有可能我们要反复的去试验,然后做反复的修复什么的,如果大家在这里填了,你后期每次都得重新填,包括刚才这个 apm 药,我们也尽量填在外头啊, 说我们把 api 密钥填在这外头,然后连进来这里啊, api key, 对 吧?然后剩下的我们暂时它是等待超时啊,超时我们让它短点,因为有可能一开始我们做的节点不对劲,你如果让它等待十分钟的话,太久了,对吧? 然后剩下这个,哎,这里报错了,这里报错了,我们看一下它后台, 如果大家不明白这报错什么意思啊?也无所谓啊,我们就截图给这个, 给这个 ai 告诉他。再就是啊,如果是这些英语大家看不懂,你也可以直接告诉他,让他把这个给我们变成中文,因为我习惯就说做成中文话的,但是啊,他这个视频应该是生成了,嗯,在这里啊展示任何这里都有, 你看 successful 的, 就是生成成功,然后视频呢,他给了我们一串地址,对吧?我们其实可以用这个地址去查看, 只不过他输出这里不对劲啊,应该接到我们正常的一个保存视频的接口,这里接不?没接好,所以说让他改一下这个位置啊,我们先看一下他给的地 址,就是一个直接下载的,大家看一下这个视频,是吧?已经成功生成了, 说明这个节点本身写的是没有问题的,但是有些小瑕疵,就是这块位置啊,我们让他修改一下就可以了,这基本是成功了百分之八十了。一会再测一下图生视频和首尾针就 ok 了。 好,我们看一下啊,他给解释了,就是说这个状态,但是这不太方便啊。第一, 他说呢,呃,就说他是生成视频了,但是这个视频呢,就说直接到我们的 out put 目录里头了,并没有在这里直接能预览,我们需要把这个方式给他改一下啊,一会再说这个。第二点呢,他把这个节点给美化了,那我们就右键修复一下, 对吧?大家看确实是美化了,就像我们刚才说的,然后因为我们这里是点出来的吗?我们再拉过来给他重新测一下啊, 你看他只有一个视频路径,这个很不方便,对吧?因为我们习惯于在这直接能预览到这一个视频,然后我就告诉他,我不喜欢这种保存视频的方式,我需要在康菲园直接能预览输出结果的,然后我们就告诉他啊,也可以优化一下这个说法啊, 我们先试一下他能不能按照我们的改动给搞定啊?好,他改动过程中啊,有可能需要我们给他权限去运行后台,他需要查一下 这些命令之类的,我们就等一会啊,他这一步其实是什么作用呢?我们虽然给他的一个命令啊,就是简单的让他改一下, 但是呢他需要查到我们这个节点,就给他这个保存视频这个节点,他需要看一下这个节点接收的是什么数据类型, 然后这个数据类型要和他这个就说输出的这块给匹配起来,要不然他不容易实现这个功能。其实就是这个意思啊,他干完了之后啊,我们再右键就说修复一下节点看,现在啊就多出了一个这个视频接口,我们接到这个保存视频,这里 其他的啊还是接到展示任何,这里这个 id 就 无所谓了。状态我们再接一个吧,就看他是成功还是失败。好,其他的不改了,我们再跑一遍试一下,这里随便改个三比四之类的啊。 好,我们看一下啊,这次就成功了,对吧?这里也能看到视频了,并且还是有声音的,效果还是不错的,这就说明这个节点改成功了,最起最起码的纹身视频我们是成功了,那我们再测一个 首尾真和这个徒生视频啊,比如说先测徒生视频啊,好,我们上传一个图片啊,就写女人站起身,然后挥手微笑,在这里模式需要改一下啊,对吧?改成徒生视频,这个不要忘了,因为当时写节点的时候就是这么写的, 当然你如果嫌这个麻烦,你也可以在这里 ai 告诉他,让他把这个逻辑改成自切换。 比如说如果没有输出,如果没有输入图片,就默认改成纹身视频,如果输入单张,默认改图生视频,输两张是首尾针视频。这个如果大家不嫌麻烦,也可以让他就说,嗯,逻辑变成自动逻辑啊,这个也是 可以实现的。这个因为我之前做 banana 这里,然后纹身图,图像编辑这个节点切换都都试过啊,是可以的。 好,我们看一下,对吧?这个土生视频也是没有问题的。你别说,豆包这个还挺好用的啊,这个效果还真不错了,四十多秒就能生成。我们再测试一个首尾针的啊,如果首尾针也没有问题,那这个节点实现的功能基本就没有问题了,大家就可以自己玩了啊。 比如说首尾针,这个我们就用 remax 做对比啊,这个我当时发到 r n 哈普这里了,大家平时也可以用 r n 哈普这个平台新用户呢,如果用我这边地址注册,还能送大家一千积分啊。 好,我们就用这个手针和尾针给它测一下,做一下对比啊。当时我在 remax 这里跑的, 用相同的提示词啊,你看从地上结印什么,飞到天上跑一下看,哎,忘了忘了切换模式啊,切换成首尾针这一块,要不然的话他还是第一个图了,这个刚才忘了。好,我们跑,再跑一下, 然后让你哈普,我们也跑一下,看一下他和这个开元闭元对比怎么样。我们测试过程中啊,他这里弹了一个四零零报错啊,不用管他,我们把这个报错给放到这里告诉他啊,我测试首尾 真包括这后台的报错,大家也尽量都发给他,因为因为说实话前面不重要啊, 所有的问题都是在后台里有展示好,我们看的哈,没看明白啊,反正就是帮我们修复好了。修复好之后呢,我们 修复重建一下节点,然后再试一下,就像我刚才说的,大家做这种节点的过程中,尽量把这些变量就说做到直接接过来,这样后期我们修复的时候就不需要再重新填一次,怪费劲的啊。然后我们改改这个比例, 这个是竖版的九比十六啊,好嘞,我们再跑一下啊呀,浪费了这个点错了,忘了点这个首尾针了,你看最后出来一个简单的纹身视频。那我点一下手尾针啊,再测一遍这个还是有报错啊,然后我们再把这个报错再 发给这个节点试一下。有时候遇到这个两三次他都修不好,大家也可以尝试换个模型去回答啊,你比如说 g p t 五点二,不行我换个詹米三,对吧,看一下。好,他这个一直是有问题的啊,就一直修来修去修不好,然后我就换了一种方式啊, 我告诉他就说因为他一直是手针,和参考图还有尾针一直老有冲突,我让他把手针尾针还有参考图这个分开出来啊,参考图只用来就说图上视频,然后手尾针单独分出来试试,这样可不可以? 有时候模型就说改来改去,实在不行大家要给他点引导,所以说自己也是需要有点想法的啊,我们要互相搭配一下好再试一下啊。 哎,跑到这也没有报错,应该没有问题啊,期待这次能成功。好,终于成功了啊,大家可以看一下 啊,这个效果确实比我们就说开元的这个效果要好啊,你看这是我二 h 相同的跑出来的,然后这边是哎哪去了,这边是豆包闭圆的跑出来的, 不管清晰度还是什么都很好,并且带声音。我们把时长给调高一点啊, 调成十秒再跑一下,因为这一块啊它是有个体验额度的,这个体验额度大家可以看一下,就多少元一千 tokens。 呃,具体多少我没算啊,反正我做了这个节点测试的过程中大家看一下,基本用了消耗一半了啊, 如果实在不行大家就得付费来跑了。先测试一下试试吧,如果感觉效果好后期也可以当自己生成视频来使用,也是不错的啊。跑的过程说一下,因为这个节点已经跑的过程说一下,因为这个节点已经做完了。 再跟大家捋捋一下这个思路,首先去制作一个基础节点,这个就不用说了,因为他如果说制作节点的过程中一直有报错啊,你就让他改,如果反复两三次一直改不好的话,你看我甚至都 我甚至都怀疑他是不是,他是不是就说这个模型压根就没有首尾针的能力,然后他又给我反复看了一下,这个模型确实是有首尾针能力的, 那既然他有首尾针的能力我们就换一个思路对吧?我就让他把这个首尾针因为他手针尾针和参考图经常容易混淆, 所以说我就让他换个思路,换个思路把这个首尾针给就说分开了,参考图像和首尾针都给分开做成三个,大家有时候做节点呢,不要去一味的去钻牛角尖,如果说 ai 实在理解不了,我们给他一点思路啊, 你看最后生成了,我们看一下这个豆包的能力确实不错啊,也推荐大家体验一下。然后关于这期节点制作呢,咱就讲到这里啊,然后使用的文档,包括这个节点我也会发到大家,供大家做参考,大家自己试玩一下吧。 学会了做 api 节点,基本之前的像是前端后端这些节点都不在话下了啊,因为 api 节点属于第一,大家需要调用的文档比较多,第二测试的过程遇到的问题也会比较多,这种节点相对来说也是比较复杂的啊。好嘞,谢谢大家,再见。

小白学习康复 u i 的 第三天,用的大炮老师的整合包,我们从这个界面开始,嗯,怎么样来放大呢?我们可以从开样开样采集器里面开始。从开样采集器, 怎么从开样采集器里就能伸出放大图片呢?这样需要复制一个开样采集器,怎么复制? alt 加左键复制一个开样采集器。然后呢,用 nat 的 空间里的缩放比例 把这图片往上拉一下,有点碍事,然后 nat 连接模型,连接 正面提示词,负面提示词都连接好了之后呢,再来一个 ve 解码,再来一个图片,好作对比。 那把这个 ve 解码跟这个放到一起,我们看看是等会生出图片是什么效果啊?哎,现在运行还没有连接,把这 ve 连接上再运行, ok, 图片生成出来啦,可是有点不太一样, 他头上没有花,他头上有花。为什么呢?为什么会不一样呢?是因为我们昨天讲到了降噪,今天正好这个地方没有降噪,所以说图片会有点不一样。我们先来调一下降噪, 零点五跟图片主图基本就一样了,圆形看一下。 嗯,这是没有放大的,这是放大后的,没有放大的话就会放大之后会比较模糊。放大之后呢,你放开来之后就会比较清晰,还是放大的比较好,我们再跑一张。 呃,还是放大的之后的会比较好一点,就更更清晰,更好看。然后呢,我们怎么去去更快的生成第二张图片? 这个第二张生成图片还是挺慢的。那就需要彩样器,高级的彩样器, 我们先把高级的裁剪器找掉,找到之后呢,也需要复制一个过来,复制完了呢,也需要把这个这个普通的裁剪器给删掉, 删掉模型正面贴饰词,后面贴饰词, neon, 然后 neon, neon, 哎,这个要连上模型,对模型 正面提示词后面提示词。这个线一定要连好,连不好,有一根连不好的话,伸出的图片都是不一样的。连好了,连好了之后呢,我们再跑一下, 第一张图片没跑的出来。为什么没跑的出来呢?是因为 nate, 你 看他只要连错一个,他跑出来的图片就是不一样,一定要连对, 没通过采氧器开采氧器,他就是没有图片。来,这次再跑一下,这次就有图片了。 嗯,这图片这次有图片了。然后我们来改一下参数吧,我们主要是要的是第二张图片,不是要的第一张图片, 所以改一下两倍放大。从第七步开始吧, 这个返回照点起用, 这个就是步数再多一点细节吧,步数越高细节越多。然后那从第八步开始 好检查一下,没有问题,没有问题,我们点击开始 是不是这样的话就会特别清晰。其实我们主要是要的第二张图片,第二第一张只是看轮廓啊,所以咱们可以抽卡, 抽到自己喜欢的位置就可以把这个隐藏掉,隐藏掉,抽一个卡,看看哪个图片最喜欢,这样会很快。这个这个 不行,这个不喜欢,再换一个。嗯,也不太喜欢,不好看,有点变。嗯,不好看。 好,这张还可以,对不对?这张可以的话我们就把它启动,启动了之后再点击。 嗯,这是为什么呢?这是为什么?点击运行它还在跳呢?是因为我们没有改固定,我们需要改成固定的话,它就不会不会 跳跳图片了,这个随机中也改成一,不然他会在随机中里边随便抽取一张图片,然后我们现在再把它给隐藏掉, 点击运行。嗯,这张图片还可以来打开,打开再运行, 这样的话,这样的话就是就是能很快,我们只需要一个轮廓,翻到自己喜欢的轮廓之后再把它放大高清,这样会很快。 这些线呢?有点太多了,不过明天吧,明天我学一下,把这些线给整理一下。 今天学的是第三天了,学了高清放大,然后你们有不懂的或者是也刚学的,我们可以一起交流。

这个工作流网上已经有大神做出来了,最简单的办法就是把这个工作流下载下来,然后啵往那一放就行了,就跟你学 ae, 学什么剪辑,会有一些模板给你套用一样,这个就是最简单的方法。但是 comfy ui 这个东西,没玩过的人是对他比较陌生的, 所以想套模板,你也得先对他有一个最简单最基础的了解。我的学习过程是这样的,我跟他说我知道不可以直接套模板,我也不是教大家,国内的这些教程抖音 b 站上都教了,但是他们讲的非常的不详细,就感觉就不想把你教会一样,就想着等你后台私信他们,让他们把你拉到一个麦克。 我现在呢也是一个刚入门的阶段,就是边学习边分享吧,专业玩 ai 的 朋友就别看我这个视频了,我就单纯分享给像我一样的这种新手小白朋友。点进去之后 看它这个页面还挺好看的。点击下载,这里有 windows 版和 mac 版。还有一个方法是从 github 上安装好,安装完直接点击完成,它会运行 这边跳出来的英语是我们没在设备里找到 git, 在 继续安装这个 confluence 桌面之前,请下载并安装 git。 我 们来打开 git 的 下载页面, 它就直接跳转了这个下载页面。啊,我们这个是 windows, 就 选 windows 下载, click here, 点击这里下载,下载成功,跟着它这个步骤去安装这个 git, 反正就一路默认 自动更新,让它自己安装。还有一种下载方式是在这个 github 里面下载的,网址是这个,点进来之后找到这个 release, 点进去 这里面这几个下载方式就是你是 amd 的 就下 amd, 这个英伟达的就下英伟达, 我这个台电脑下了的是这台。好,我已经下完了,下完之后就解压安装,我现在拿我这台 amd 显卡的电脑给大家演示下载 amd 这个版本就是这个压缩包,解压之后长这样。好,双击进来会看到这个东西,跟我们往常看到的软件不太一样,没有那个什么一个程序两个字, 它都是这种一 kb kb 的, 这个结尾是点 bat, 看到这两个就都试一下,如果这个打不开,那就再打开这个,因为这是跟你的显卡配置有关。点击运行它,跳出来一个类似终端一样的东西。 软件下载完之后,它界面就是这个样子的,打开这个界面之后是一个画布,先别管,直接点这个 templates, 这个就是一个模板,这个 templates 里面有很多 其他人已经做好了,这些工作流非常适合新手过来研究学习,但这些工作流都比较简单,比较 low, 就 没有那些网上的那些博主也于 top 大 神做出来的那么厉害,这些都比较简单。好,我下了一个一个最简单的纹身图的工作流,就在这儿点这个 templar 词, 然后比如这边这边是 a 妹纸,就是图,纹身图,视频、音频,这还有三 d 模型的这些大语言模型,这也不管的好点,一个最基础的纹身图模型,这边有 a、 p、 i 三个字母了,不要碰再多是要花钱的,就用千万的吧,二五零九重新下一下这个 一点,他就直接把这个工作流跳转进来了,这每个小方块就是一个节点,这个界面是我认为非常舒服的一种界面,你看拿鼠标一拖抓手就出来,用这种模板非常简单,因为他所有的东西都告诉你了,这个工作流他能干什么?我们现在不知道,因为没没做测试吧。 我们先看这个工作流的作者,他跟我们说了什么,他说这些是链接,你现在要去下这些东西,一二三四五,每一个链接里面都有每一个这个大标题,下面都有一个链接,点上去就能下了,我们待会儿就要挨个下,下完之后还有这个就是放摆放的位置,这个 diffusion model, 放到这个 diffusion models, 放到这个,这个里面都在 comui models 这个里面啊,这是作者或者官方吧给的一个 下载公告,根据这个做就行了,很简单,全是傻瓜式的。好,这下载的时候跟你说一下这些节点都是干什么的?首先我们要理解这个节点流程,他就是他为什么叫工作流, 其实我是跟流水线一模一样的一个原理,每一个小方块就是每一个节点吧,他就执行一件事情,一步一步一步一步把最终这个活给完成。这每一个小方块就是这些东西,这个有字的就是他的节点名称,这个节点是干什么的? load image 就给你加载图片的,这个节点是干什么的? save image 就 保存图片了。又有一个开头,一个结尾,然后中间呢?就它的整个生产过程,这个工作流,它是把它给 打包了,大家看到有这么一个标志,就是作者把它打包了,我不知道它是怎么打包的,然后点这个点这个标志右边的这个标志就能进去,然后我们就能看到这里有一个哎主文件夹,一个子文件夹,这里就它中间的这个生产过程,每一个小方块,一二三四,这四个小方块给作者 弄成了第一步,第一步是加载模型,然后第二步是干嘛干嘛嘞?就你看到这些牛逼的作者弄出来的工作流,你又觉得非常的赏心悦目, 非常的舒服,强迫症患者的福音,你要是自己没事一个人自己去答,那你答的乱七八糟了,我在前两天尝试过自己答,到后面我才开始用这些 typeface, 用这些模板以及在网上下别人下的工作流 typeface, 它只是一个平台,你要是想生成更多的视频,生成更多的更好的效果,你也自己疯狂的去下这些模型,下这些配件模型。 这个 laura 呢?我的理解就是它的配件模型,比如说你现在下的是一个图神图的,那它这边给你一个 lightings for steps, 就是 这个 laura, 它能够通过四个步骤,就四步闪电版的给你深图。 然后还有这个什么 b 十六,可能是一个氢氧化版的这个 laura, 在 我的理解下,它就是一个辅助的模型,然后这个 text encode 是 文本编辑器,文本编码器,每一个模型都有一个属于自己的 文本编码器吧,或者说某一类的模型有一个属于自己的文本编码器。像这个它就是像的,是千问的模型吧,这个 q w e n 是 千问哎,也挺厉害的,最近也出了很多开源的这种大模型。好,下面这个 v a e v a e 有 点像是 你图片画完了之后,它开始给你上一些颜料之类的吧,我觉得就是让你的一个画质的真实度或者干嘛的变得更好,这是我的理解,这些东西都不重要,就你完全不需要搞懂他们是干什么的,你就会用就就行了。 好,现在已经点击下完了,这个下载呢,很简单,你一点就跳转了,你要么用浏览器下载,要么迅雷下载,我一般都是用迅雷下的,下的比较快。 这一二三四四个东西,打开文件夹所在的位置,然后我们把这四个东西按照人家说的这个方法给他剪切到或者复制到相应的文件夹里,在这个安装的文件夹里找到一个 mod。 四文件夹,基本上所有的下载下来的东西都是要放到这个里面。 第一个文件夹 models 里面, diffusion models。 好, 我们找 diffusion models, diffusion models, 找到在这下的是这个 q w e n r sift and sensor, 我 们记一下这个 e 四 m 三这玩意儿,这玩意儿给它拖进去, 然后再看下一个文件夹 l 找找找找找 l 开头了,在这儿把这个也给放进来,放到这个 l 文件夹里,剩下的就一步一步按照它的这个东西 放。下面是 ve 和 textincode, 在 model 里面找, ve 在 下面在 ve 可不是许嵩呢,加一个 textincode 文本编码器,千万二点五。好, 也已经抽过了。 ok, 那 现在这个就是一个目前已经下载了东西的一个工作流啊。他说让我们上传一个图片看一看,遇到不知道怎么解决的问题的时候,先跑一下,跑完之后他会告诉你哪里出问题,就非常简单,不需要自己排查 任何问题,他直接给你指出来,然后去解决就行。在这一看,哎,题词进来之后也没办法编辑,那怎么办呢?那是不是出问题了?不是,我们往前往前倒,看到这个题词前面还有一个节点,这个题词前面还有一个节点,顺着这根线走,走走走 看,哒哒哒。啊,原来这个作者在这弄了一个单独的题词放到这里。好,那作者还是 非常良心的,就是整个节点流程看着很很赏心悦目。就我刚刚生成的一个提示词,很简单,让这个帅哥的头发变成白色,咚,他变成白色,我可以给他直接放到这个位置来,这样的话就可以并排看。那继续修改。 这个就是简单的让你去熟悉一下,了解一下这 ctrl u i 的 效果是什么样的。 他的身图的快慢呢?取决于你电脑的算力,我现在弄一个复杂一点的提示词。好,我自己手敲了一个简单但是比刚刚要稍微复杂一点的提示词,看下他能跑多久,让他变成一个带盔甲的钢铁侠的盔甲, 再给他来一个眼镜。现在这个是近景吗?我要一个全身景,我看他能不能理解啊。好,点击这个 run, 就是 运行,就是跑嘟跑, 这里能看到一些净度,我们还可以点进这个里面来,然后我在这听不到风声啊,因为这电脑不是我的,我在远控,我朋友的电脑,那我们能在这里看到他不停地跑,在现在跑到这个节点了,我不知道怎么读啊,应该是 case app。 好, 跑完了,我们在这看一下预览 全身图,他给我的也不是全身图,但总体上来说还行。这个工作流用来 p 图我觉得是已经足够了,这里可以看到他跑的这些时间,三十多秒,二十多秒正常,我的四零九零 d 跑这种的话应该也就十几秒, 应该像素不是很大,八百八。他这里有一个问题啊,就是你给的原图尺寸其实挺大的,你看 我这是二 k, 然后它生成呢?就是很小,你如果说想在这个里面去修改它的尺,输出的尺寸也可以,但它跑的会很慢。好,现在我们对这些节点有个大概的了解了,就是它是通过这些线一个个连出来,然后最终生成一张 你想要的这个效果图。那我们回到刚刚一开始我说的怎么样给一张图,然后通过这个摄影机的调整,让它生成你想要的角度的图片呢?好,我们把这个保存一下,保存按钮在这儿,这里有三道杠, 点击 save 或者 save as 都行,点确认,你也可以把它下载下来,点这个下载好,下载到某个地方,它导出来是一个这个东西,这个 json 格式的, 你就可以把这个工作流直接丢给你朋友他那边接收到了之后,他再拖进来,拖到自己的这电脑上,直接往画布上一拖,因为我左右都已经改变了,关掉,我新建一个空画布,好一拖拖到这个画布上,非常简单,不松手。出来了, 这工作流出来了,这个没办法,多角度不好玩,我们去找多角度的, 别人做好了这样的工作流,还给它保存成了 json 格式的,那我们下载下来,拖进去,然后再去下载一些东西。那我看到的就是这个国外大神,我不知道这个是不是他最开始的原创啊?总之他这里的信息是最全面的, 他告诉你这个模型在哪,多角度的插件在哪,还有这个加速 laura, 这些都是要下载的,下下下下啊,这,这个是他做的广告,就不下啊,这个是节点, 这个是参考工作流,那我们就先把它这个参考工作流下下来,点击进来之后跳转到了一个 github 页面,点击这个下载, 在这好一下它就下完了。我习惯上是喜欢把这些工作流给放到一个文件夹里的,这样的话自己找起来比较方便, 那尤其是你做好的,或者你调试好的工作流,这个就是我们刚刚下的二五幺幺的这个前面这个是演示的二五零九的工作流,这个二五幺幺 multi angle 就是 多角度嘛,它每一个名字其实写得很清楚。 好,我们跟刚刚一样也是拖进来,往这一放,我就说嘛,它会告诉我们遇到了什么问题,那它就有什么问题呢? 他说 missing models 缺失模型,当加载这个图片的时候,下面的这些模型找不到,所以我们要把找不到的这个模型给下载一下,这个模型有点大了,二五幺幺 b f 十六三十八个 g。 好, 点击下载。 这还有一个加速 lara, 给它下一下八百多兆,这个不是很大,所以你要玩本地部署的这些 ai 模型,你的电脑 存储一定要够大,否则这十几个模型下来,那你的电脑就已经塞满了。这个下的有点慢,那我们等它下一会网址没法贴,之前贴被限流了,大家只能自己去英语网站里搜了这个关键词,官方版的它也有一个下载链接, 当然我们就以官方版为主,他这边没有报错的,我们就先不管他,就等他跑起来,哪里报错了改哪里,让他后台先自己下着。我们要先去下另外一个非常重要的东西,就是这个插件,找到这个插件把它下下来,就是这玩意。 这个网站叫 github, 可以 在这点下载这个扣的,这里点一个这个,然后这里有下载 download, 这个插件就很小,直接下这是个压缩包,给它解压一下。下载的这个网站我们改成中文,看的更清楚一点,它这里有安装的方式, 进入到四点一节点文件夹里,这里有两种方式,一种是克隆,一种是直接把它放进去,这两种我都跟大家演示一下。第一个下载刚我们已经下载好了,现在就去找到 comfyui custom notes, 把刚下的这个给它拖进来。 还有一种是 git 克隆,这个 git 克隆就是一个什么东西呢?这整个网页就是一个可以下载到它的一个网页,那么这个 git 克隆 就是你把这个这段代码也不是代码了,这段东西给它复制过来,找到相应的这个文件夹里,刚就是这个自定义节点文件夹, custom notes 这个里面右键 在终端打开,然后它这里会出现那么一个终端,黑色的就不要害怕,这东西根本就不是什么很高深的代码,就按照它一步一步去来就行了。粘贴, 然后按回车键,他就会在后台克隆这玩意,但是现在我们已经下好了啊,我不知道他会不会再克隆一个,现在他就在克隆,就等待他就行了。这个东西呢,我的理解他就是一个插件,然后同时他又是一个 独立的节点, computer ui 里面是没有这个节点的,没有这个节点我们就得自己去下,下完节点之后还得安装。刚刚我跟大家说的就是这两种安装的办法,现在它正在克隆 好,这个没克隆好,它这显示是 unable, 经常会出现这种没办法克隆的情况,不过无所谓,如果你碰巧克隆好了,那就行了, 这两种方式都可以体验一下。我一般都是下载先让它下着,然后我们再去看一下这个工作,大家没看到吗?它作为一个 j s o n 格式的东西,它很小很小是因为 这些东西它就是表面的那个说明书,你做一个东西,光有说明书是没用的,这说明书里面只有文字,但没有实质性的工具。我来告诉你,你要用电钻去凿一个洞,这个洞的大小是这么大, 但是现在你手上没这个电钻,你就得去网上把这个电钻下载下来,你还得把它安装到合适的位置里面。玩这个工作流的时候,很多很多东西都是需要下载,需要更新的,大家看到这里有个大大的叉,是因为我们还没有刷新这个界面,然后中间的这个 被它打包的点进去看,就它中间的这个过程,作者用好多这些节点,不同的模型,不同的 lora, 不 同的 clip 和 ve, 组建成了这么一个工作流。下载的时候再跟大家介绍一下啊,如果你想了解,你就可以简单了解,这边就是 models, models 就是 模型, 就是各个大公司,比如说字节,阿里,他们会弄很多很多个这种模型,这些开源模型就是免费大家用的。 这个 diffusion models 是 一个扩散模型,它跟另外一个模型叫,就这个这种类型叫 checkpoints, 都是以这个玩意儿 safe tensors 作为结尾的,本质上差不多,但是把它们分成了两个类别嘛,这个是 lora's, 这个已经说过了,这 ve, 这个 text encode, 然后这个是 diffusion models, 这个是 clipvision, clipvision 也是跟文本编码相关的东西。剩下的这些我就不太了解了,这个用的也不是很多,用的最多的就这几个。大家玩这个熟悉了之后就会发现,每次下载都是无非是下载这个,要么下载这个,要么下载它, 要么就全下,下完之后剪切或者复制到相应的文件夹里,然后再重启, ctrl v i。 我 的学习之路就是这样的,用人家的工作流,在这个工作流上面自己去调试,并不是他每个工作流,你把这些东西下载好了, 就能生成跟它参考图一样的东西了,你还得自己去调试的。不同人的电脑也不一样,进去这个里面去调这些参数,最主要的一个参数节点就是这个 saplla 这个节点,这是一个 k saplla 节点,还有别的一些节点也是,反正都是这个 saplla 类型的,它就是主要的这个 核心操作工具,反正这些东西大家自己去弄一弄,就是这些东西它并没有我们想象中去做那种 调色软件或者剪辑软件那么直观,你去改一个东西,你立马就能看到你得在这改完之后,你再跑个一分钟、两分钟你才能知道到底改了什么。 然后等你跑完之后,你又发现,你又忘了你之前改的这个东西是什么,所以只能自己去琢磨一下。但我觉得这这些都不重要,这些都不重要,我们理解他的整个逻辑是最重要的。你跟我说这个节点 说不定下周就淘汰了,这个工作流说不定再过两个月就会被新的工作流,被新的模型取代,还有可能节点更少,效果更好。所以我们现在去纠结他这个什么意思,这些东西没意义,就去理解他整个工作流。就是我 目前看来,你说这些东西会不会变化,那肯定会,但是他的这种运行逻辑,包括你去工作的这个逻辑是不会变的。因为这个工作流节点就是人类发明的一个效率最高、最容易 让大家去执行的一个东西。就从福特当年做出汽车流水线之后,人类的工业化快速生产东西,就靠这套东西。好,我已经下载好了,找到下载的这个位置, 看是不是他说的这几个,这个二五幺幺 b f 十六下好了,还有这个也是 v 一 点零, v 一 点零的也下好了, 都下好了,我们就要去安装,安装的时候要把它给擦掉,或者说你安装完再把它擦掉重启。我这个所谓的教程尽量慢一点,让大家陪着我一起做, 因为最讨厌的就是你自己一个人漫无目的的去搜,去问豆包,去问 jamie 奶,去问 groot。 很 烦,跟着我一起做就可以直接慢慢来了,所以我废话会比较多一点。主要就是这个 v a e 很明显就放到 ve 里了,跑到 ve 里给它一粘,看它这里都写了 put ve here, 把 ve 放到这个里面看,这人家都已经写好了,非常有意思,就生怕我们不知道这个很长的 four steps, 你 看到这边有个什么 lighting four steps, 这就是一个 lora, 这就是我说的它是一个辅助型的模型,就能够让它用尽量短的步骤 给他跑完找 lars。 哎,在这就像我现在已经熟练了,我就能很快的找到他们了。就一开始看完的时候还是挺两眼一抹黑的。这个清亮画板有意思就有意思,在这就是得自己放,放进去, 在放的这个过程当中,你就已经基本上熟悉了整个流程,它是有哪些东西弄出来,这两个记不得放哪了,我们再打开工作流,再看一眼就行了。工作流上面人家写的清清楚楚的,双击一下,打开它后台运行一段时间, 就会自己跳转到一个网页上,所以这个东西为开头了。你看,刚已经装了两个了,还有这两个刚我们不知道在哪了。好,这两个分别是 diffusion models 和 text in code, 这个放到 diffusion models 里面, ok, 进来了,进来之后得再重启一下网页关一下,后台也关一下。可能是我习惯了这么用啊,当然我也用了一下单纯的软件版,其实都是一样的, 继续双击它,它跑后台的时候你能看到它的后台,在跑报错的时候,你把这个一截截给豆包 jamie 奶什么的, 他们就能帮你分析出来,现在没有再报错了。上传一张图看一下,测试一下行不行。这个是第一个节点,上传图片的第二个节点就是 can 问 multangle camera, 我 们在这点击一下这个蓝色的运行,它就单独运行一到二这个两个节点, 它这一运行就把这个图片给加载过来了,加载过来的目的是方便我们调整摄影机,这个摄影机摸一摸就知道了, 当然这个并不是真正的摄影机,它的逻辑并不是说一个无级的摄影机,我们可以任意调整角度,它其实是有九十六个机位,我不知道设计这个的人是怎么想的,反正就 弄了九十六个位置,然后你弄到不同的位置,每个位置对应着一个提示词,它其实还是通过提示词去改变图片的角度的,并不是那么神奇的一个什么三 d 的 效果来看一下,我把它相机往它右侧面高居位往下打一点,拍一条看看。哎, 好,非常 nice, 非常 nice。 一 跑红了,红了,我们就点进去看一下是哪里有问题,有问题的地方 compeg 就 会给你用红的给你标出来。哪里有问题呢?其实是因为作者用的时候他用的就是这个 safensils, 但是我们下载下来的并不是,所以我们得找到我们下载的这个 再跑一遍看看。运行到现在为止,只要它是绿的就舒服啊。没报错,好,已经跑完了,我把这两张图给挪过来了, 可以看一下。这跑的效果还是挺不错的啊,我摄影机的角度是放在了高机位俯拍的一个角度, 然后他就是高级辅助拍的,这个效果基本上是没什么问题,他也把这个豆包水印也给放进来了,非常搞笑。那这个小教程基本就这样了, 大家有什么问题可以私信我,我看到的话就会回大家,大家通过这么一个工作流的简单学习,也基本上能够会用这些工作流了。就是怎么套模板吗? 无非就是遇到报错,然后去解决,去下载,下载完之后就去安装这几个东西,如果你用的是官网下载的那个版本,你都不用进这些后台这些文件夹里,就可以直接下载出来了,更简单。 就这个东西我玩下来我才觉得就是一个信息差,你在之前不了解,你觉得,哇,这个玩意好高深啊, 大家怎么这么牛逼啊,都弄弄出来这么厉害的东西。实际上当你开始研究这种所谓技术性所谓 ai 工具的时候,你会发现 使用这些工具其实并不难,关于作品,关于怎么样生成好内容方面,难的其实更多是想法。就我个人觉得,现在单纯的生成这种好看的图片,什么科幻特效的这些效果已经意义不大了,就不足为奇了。剩下的就是 这个工具有了。大家怎么样去讲一些故事,再讲一些好玩的故事。就像我大概在一个月前刷到的一个特别牛逼的 ai 生成的视频,抖音上两百多万赞,我想大家应该都刷到过,就是那个讲 emoji 表情的那个 ai 视频, 太牛了,这类的东西我觉得才是我们使用 ai 进行内容创作的意义所在,因为这类的内容你没办法用实拍或者说一般的特效给它实现出来。好,这期视频已经够长了,如果你能观看到这里,那证明你的学习能力真的非常强,谢谢大家。