哈喽,大家好,这里是张红丽,有八哥。今天是创业的第七十一天,那么今天是假期的最后一天,我们今天的原计划是做一些 gradual 的应用,那我们 gradual 的应用 大概是一个音频相关的一个训练的的一个过程的一个 gradual, 然后由于这个项目他不是对外公开的,就大概是一个训练音频的呃训练模型的一个过程,那么 呃直接的应用就是呃有比如说你输入一段音频,就音频相关的深度学习的应用的例子大概是有,呃,你输入一段音频,然后他会告诉你 这个音频的风格,然后或者是你输入一段语音,他会把语音转换成文字,然后你输入一段文字,然后他会根据你选择的音色再转换成对应的音频,那么目前主流的音频类的 的应用大概是这一些,然后主要还是他的准确率,像那个科大讯飞,他一直在呃 提升他的准确度,那还有各种小于众的语言的的训练也会在调整,那么早几年其实我们就知道他们的 就是语音,还是在行业内还是挺 ok 的。现在的 ai 开源也是多元化,就是 大家可以选择自己感兴趣的领域去生根,然后并且做应用还是有机会的这个赛道,不过众所周知,大家都需要,这需要一个周期,就是你可能 就是为什么现在有很多项目你刚立项,然后已经有很成熟的 aa 产品出来,然后你的这个项目就基本上就不好做了,那说明你们的战略可能 我感觉目前来说还算是很好的,因为有很多的赛道还是可以选择的,像你国内特有的一些数据级,或者一些特有的特色像,嗯,举个例子,像非物 文化遗产这一类的,像国外是不可能训练这一类的模型,就是这一类的模型是可以把它国产化,并且有机会能做起来的。 而且中国的非物质文化遗产还是挺多的,就大家感兴趣的话可以去挑一挑,并且把它做成一个生根一些模型,万物皆可 ai, 那就主要看未来各位的选择了。 那么今天的视频就先到这里,我们继续去写 grayo 的应用,那么大家记得一键三连哦。
粉丝37获赞174

hello, 大家好,这里是张宏丽有八哥。今天是创业的第三十七天,我们在昨天讲到 gradio 的前篇,那我们今天展开讲一讲 gradio, 那除了 state diffusers 的呃在线训练的案例以外,那我们是不是可以把呃大部分的模型训练的方式,我们以前端的交互的形式展示出来, 相当于我们早期的用命令行去执行训练的命令,用命令行去执行预测的命令以外,然后我们封装了一层图形的交互界面,这样让用户就是动动手指,点一点就可以立马 进行交互或者在线的训练。其实同类型的平台,我们在呃 e g d l 就是百度的这个产品中,我们有能能体验到类似的产品,就是一个网页,然后我们上传相应的数据集,之后 在选择对应的模型,我们就能做到训练,然后并且对样本进行预测。那我们呃就是 考虑一下自己搭建 grido, 呃,我们先借用别人的原码,然后我们尝试着自自己搭建,然后自己做训练,看一下能跑到什么样的程度。 这是文本方面,目前最能打的就是 gpt 跟文心妍呃等同类型的产品,那 呃图像的话就是 more january 的,它的效果会比较好一点,然后还有笑脸上面的,嗯,有几个模型就是文字生成图片的效果会好一些。 然后其他大家有什么有趣的应用,或者是那个可以在评论区留言,我们去一起互相的学习跟去去看看。那么我们今天就先到这里,记得一键三连哦。

happy face 是机器学习界的 github, 不仅可以开源模型,还可以把模型托管成一个机器学习外部小应用。不知道大家有没有注意到,每个 happy face 小应用页面的下方都有这样的一个小图标和一段话, build with gradiel。 没错, gradiel 就是开发这些小应用的拍层权占外部开发框架,今天我们就来看看它 规定是一个快速构建积极学习 web 展示页面的开元拍层库。其实你从来没有学习过外部开发,只要会使用拍层,就能用几行简单的代码,让你的积极学习模型从抽象灰色代码变成可以交付的应用程序。 就像鬼屌被用到哈根 face 中去 host 开源模型的外部应用一样,它可以让鸡学习项目在非常早期的阶段就能很好的进行原型展示,并且呢,通过交互快速的获取用户的反馈。使用鬼屌甚至不需要额外的开发环境,你可以在中 opt notebook 中直接开发和展示,这也使得 grade 程序的调试和分享都变得特别的简单。 grade 可以支持图像文本框、数据框、下拉选项这些常见的 ui 组件,也可以操作 mark 档文档文件,以及做出 type 标签页和表格这类更加复杂的游玩效果。目前 gradio 在 github 上已经有了二十二 k 的 stars, 大家快来自己试试看吧!跟我一起一天一点继续学习,大家再见!

大家好,上一次我们出过一次视频,就是 cbo defusion 的 lora 训练模型,怎么训练?那下面有些留言呢,说训练出来跟生成出来的样本图片啊不一样,小伙伴说的确实这个问题存在,那么今天呢,我们来解决这个问题, 首先呢我们就随便选取了一个模型的一个风格啊,就是我们下载的一个模型风格,是动漫风格的,我们用很简单的,很简单的就几个词的 token, 还有就是我们下面这些反向题词 都是一个大致方向的一个 tok, 我们来看一下,我们复制到翻译软件里面看一下,就是一个大致的 tok 杰作,最好的质量,一个女孩美丽的风景,就是几个简单的提示词啊, 但是这次呢,我们要用到要用到一百张,一百张样例图片来训练一个模型,因为之前图片很少, 训练的时候就八张或者十几张图片,然后训练出来很难达到能够让他随意去控制控制结果的这种,而且训练出来的不像,但是因为我们图片太少,其实官方说应该用两百张样立图片去训练,但是现在在我们劳拉里面, 我们只能在 lora 的这个 do boss 参数里面,他最多只能设置一百张,那么我是用,我是用 civil defugen, 然后选了一个模型生成了一百张图片,然后我们来训练一下,看一下结果。 这里面我们先明确一个概念,就是说今天要用到的是分类图片吗?那么分类图片我们用的是一百张,这些众多的这些图片都属于分类图片,这些分类图片会加入到训练去训练,我们的实力图片也叫做样本图片,也叫做样本图片,因为在我们这些选项室里 里面,他要用到实力提示词,分类提示词,还有的样本图片提示词,其实样本图片提示词和我们的实力提示词都是一类,都是一样的提示词。不一样的是我们这个分类提示词不一样的是我们的分类图片和实力图片不一样,也就是说我们的分类图片 和样本图片是分开放,我们的样本图片也就是实力图片,我们一般用的都是少,一般都是用的几,用了几张到二十张来用作来用作实力来去训练他。好,今天我会重复上一次的训练的时候的步骤。嗯,新创建一个 叫麦六麦五吧,然后下边我们就不选刚才的那个模型了,选择随便选择另一个模型。好,下面这个解冻一定要打上勾。好,现在创建模型完成之 之后来到选择这里面,你可以找到我们这个麦五的这个名字,然后下面是使用模型的一些路径,来到右边的这个设置,你可以把第一项第二项都给他打上勾。如果你第二项没有这个用这个劳拉扩展的这个选项的话, 你可以看看你的这个扩展里面是否有这个 s d y 不 u i local 这个选项, 这是一个差,这就是一个扩展。因为我们这个 lora 的这个训练呢,它不如我们的追风 boss, 所以说加上了这个扩展,它能够加上我们追风 boss 呢,它能够提升我们 lora 训练的这个层次,反正意思就是能够让 lora 训练的更好的一个扩展, 现在又出了这个 licorice, 这个呢这个呢也这个能够代替我们 look on 那个那个扩展,用这个 licorice 也是可以的。那么 之后有机会的话我们再讲这个 licurice 的这个使用,下面这些参数呢,先按照这样来,一百八十零零 三十三十,下面保持默认不动,把这个勾给它去掉,这个是梯度检查点的意思, 我们不需要这个下面学习率,这里面我们给他设置为零点零零零,后面四个零,然后后面这个是也是四个零,后面是二五,下面点击勾选这个套用水平翻转来到高级选项,这里面 选择八 b t, 下面选择 f p, 十六选择 x formos, 下面这个噪声偏移给它改为零点一,零点零一应该是零点一,下面这个严格的题词,我们给它打上勾。好,那么来到下一步参数设置完之后呢,需要输入我们的图像路径了,我们需要先对这 先对这二十张头像呢,因为他都已经裁剪过了,都是五幺二的,我们直接给他做一下批处理就是来到更多这里面,就是来到训练这里面,我们把路径给他填上去。图像预处理,这里面填一下路径,填完路径之后宽度高度不用动,直接用这个, 直接用这一项,最后一项这个是生成动漫,前面这个是生成真人的啊,这样裁切我们也不需要自动裁切的啊,直接给他一处理就可以了。生成好之后呢,带着这些描述文件,我们再把这个路径给他复制到这个 boss 里面,这个 这个路径里面。好,下面这个我们放分类图像的路径。接下来需要在图像预处理,再对这个分类图像呢,一百张分类图像进行一个预处理,让他生成带文字描述的图像,也就是对这一百 每张进行一个预处理。认证完成之后呢,他应该是这样的一个文件,然后复制一下这个路径给他放到这个分类文件的路径里面啊,实力名称呢?我上次讲过这个你自己自定义就好,然后后面打上下划线,斜杠,斜杠括号,斜杠括号, 我上一次讲过这个,为什么这样定义?如果不知道为什么这样定义的,可以看上一次的罗尔训练的模型的视频啊,这里面就随便打 开始测试或者 my photo 吧, my photo 也行。 p h o t o。 好,下面是分类的这个 token, 我们打上 one go, 这个 one go 的提示词呢,会在这样放呢,它会放在我们每个这样提示词文件的最开头的一部分。 下面这个我们直接用这个格式 fireworks 这个就行。为什么这样用呢?因为我们都生成了这些文件,所以说这些就是 fireworks 分类图的反向 提示词呢,我们直接粘贴通用的反向提示词就可以,然后上面上面是正面的分离提示词,下面这个 class plus 呢,也用这个 firewix。 下面这个样本提示词呢,我们直接粘贴这些通用的杰作,高质量的这些提示词,来把上面的这个标题呢实力标题 touch 给他复制过来。下面的样本反向提示词呢,也可以用这个实力反向提示词用一模一样的。好,下面的这个呢,下面我们这样设置,就是一百张分类图片的样例, 然后下面这个我们选择十,然后下面这个步数我们用六十吧,像这个 scare, 下面这个 scare 和这个步数呢,这里是用六十,它主要是来补足我们 这个分类样本不足的情况。下面这个选择一,样本种子选择一,下面这个样本的 scare, 我们选择十啊,下面的样本步数选择六十。上面的是分类步数和分类的 scare 啊,然后下一个步骤来到保存这里面,我们将上面这些勾 都去给它取掉,这次我们 lora 要调到五十,上一次我们是两个六十啊,这次我们调到五十,这个是三百,然后下面是一一 下面这些全部给他打上勾。好,那现在就可以训练了,在训练之前咱们最好保存一下啊,保存一下设置好,看到终端有这样的重复保存设置提示,说明我们保存是成功的,以防出现崩溃或者意外。好,现在可以安全的去训练了,如果训练崩溃的话,你可以下次重 重启重启来读取我们的这个设置进行重新训练。好,别忘记这里面自定以名以名模型的名字,麦五 p h photo, 我们再保存一下。好,现在我们开始训练吧,这是我们在生成分类图的过程, 在生成分类图的过程呢,每一张图片他的风格都固定非常相似,因为我们刚才是一百张分类图片嘛,所以说是十九张需要生成模型的样本的图片,所以说十九张样本乘以一百张分类图片,现在总共需要生成一千九百张。他现在这个风格呢,采用的是我们 之前选用的这个,选用这个原模型的这个风格,那么我们这个训练的这个分类图片呢,主要是训练他的人物,由于我显存不足的这个问题,那么出现了错误提示,显存不足的错误提示,那么我 只能给大家做,我只能给大家做到这里了,那么显存显存足够的小伙伴呢,可以去测试一下,看能否通过这个显存,我的是六 g 的显卡,如果如果大家有六 g 的显卡可以通过测试的话,麻烦告诉我一下方法,谢谢。

我学习了一下 facbt 的代码解释器分析过程的代码,把我自己做的 gbt 数据分析小工具再改进了一下,不用 plusgbt, 三点五也可以用,站在巨人的肩膀就是不一样。话不多说,直接分享。 这个工具也是把表格进行读取处理后,当做数据员作为 prompt 提示词的嵌入信息来使用。实际和代码解释器是一个原理。 来看代码首先就是读取 excel 表格,不同的是我提出多余的无效支付,缩减到最简单的 csv 文件,只用逗号间隔的那种,毕竟 api 画的是自己的拓客。 然后自己摸索和测试,出了一个相对稳定的 pro 模板,提示词中嵌入表格内容,并且约束 gp 分析表格的过程,按照格式要求进行数据分析并阐述过程。最后使用 gradu 进行界面存在功能和展示。 这里顺带简单介绍一下粉丝小伙伴推荐的这个界面应用,我是这么理解的, gradu 是一套基于 passion 的大约模型相关的新应用开发构建,而且名字比较好记,我们可以叫刮掉 封装了常用的界面组件,这些组件你直接用就可以,省了一部分代码开发的时间。 stable diffusion 就是和这个作品界面。 我把 gradu 的输入框、下拉框文件和表格组件组装成了数据分析工具界面,代码中一个函数就搞定了,就不用像之前的 meet journey 和 chat with file 的 web 界面那样繁琐的代码相对简单。执行这条指令就可以安装 gradu 的 passengelago 运行工具看看效果。按照界面要求输入 a p i k, 选择模型,设置温度值,上传我们需要分析的表个文件。演示文件我还是用上一期用到的移动端的运营数据,这类数据分析问题,小伙伴们 写日报、珠宝、月报、联保都会遇到。比如我说这个问题,哪个月份的 app 流程最好,请给出引用数据。等几秒以后可以看到 gpt 基于表格给出的答案是二零二三年七月四千多的流程,但是你看数据有一个六千万的流程呀, gpt 发现了这个表格数据是个陷阱,因为他没有二零二三年八月。 再问,每个月的 a p p 下载量增长率是多少,每个月份最差如何提升等论几秒, g p t 给出了答案,咱们可以直接粘贴复制来去做汇报了。是不是很简单?其实也不简单,主要是花了不少时间在 gradual 的调试上,封装是很方便, 但是开发文档的代码视力在线调试注视太少了,对于我这个产品经理来说实在不友好。比较高兴的是,这个工具一开始设计思路和欠 gbt 代码显示器是一样的,自己的产品设计实现技术入群和官方是一致的。对这个技术实现有问题的小伙伴,欢迎评论区留言,有用的话记得点赞收藏。

大家好,上一期的视频呢,我讲关于这个 stable diffusion 呢,那么我使用过了这两个训练,一个是这个训练,一个是我们这个 dreambox。 这个训练哇,我都失败了,原来是这个 dreambox 这个最低标准,你的这个显存要十二 g 的,但是我的电脑只有六 g, 所以说我肯定是训练不成功,直接失败。那么我们这款 ai 软件的这个训练呢,它是有一个演变历史的,我们总共有四种训练模式,最早期的是这个 n bad, n bading, 还有这个 hipponite works, 还有这个 dreambox, 然后最后是我们现在流行的 lora。 那么今天呢?那么前面三种我肯定是用不了了,因为我的显存不够到 dreambox 这一块,最低标准的显存 存要十二 g, 达到标准,达到正正常标准的要二十四 g 现存。所以说我使用不了,我只能使用 lower, lower 是显存非常使用,显存非常低。那么今天我来学习啊, lower 来怎么制作模型。 那个劳拉的优点就是说他占用的显损小,六届最低要求六届就可以使用。那么他这那么他的训练模型的质量呢?相对要是比这个追拥 boss 要差一些。但是劳拉可以多种模型混合在一起使用。那劳拉有两种安装方法, 那第一种呢是使用这个扣呀杠, ss 是用这个来安装,但是安装这个插件呢,他需要另一套系统,而且需要大量占用硬盘的空间,这个是比较主流的一种使用的一种方。 那么今天呢,我们用军用 boss, 也就是第二种方法来是来做我们的这这个 lora, 因为第二种我因为第二种方法能省去更多的空间。那么现在我们用军用 boss, 我们创建一个名字为脉的一个 模型的名字,然后下面这个五幺二勾选,然后这里面你随你自己随你自己啊,看你自己想要什么风格了。然后你在你的这个下载的模型这里面选择你下载好这个模型的你选择你自己的一种风格, 那么下面呢这个打上勾,这个是动机模型,下面这个你可以自己随便选。那我这边选择的这个是这个,然后你点击训练, ctrl mode, 然后这 训练好了会生成会在左边显示你的模型,选择好你这你自己的模型名字之后呢,下面会显示你这个模型的位置, 那么这个是你模型的生成的位置,那么这个地址呢?是你刚用的刚才这个模型的这个地址。 然后我们来到设置这里面,你点击一下上面这个按钮,然后他会在右边这一块给你显示,他现在自动给你根据你的电脑配置自动给你配置的一些选项。那么刚才我们勾选这个 柚子 lora, 这个时候呢,我们左边呢没有这个 lora 模型的这个选项,那我们可以重新点击,再打上勾,那么他会出现这个 lora 猫头的选项。那么接下来调整参数,第一个呢是训练一百次到五百次, 那么质,那么次数越高呢,那你的质量越高。那么往下呢,这两个是来控制你这个显卡的多长时间休息一次,现在是六十秒秒休息一次,如果你的显卡有保固的话,可以不用休息,不用休息就设置为零, 那么下面呢下面这个是多久训练多少次保存一次模型。那么这里面我们给他设置二十到三十就可以了。 那么下面呢是内存的优化,那么只要你的显卡不是十二 g 的,不是十二 g 显存的,建议都使用一十二四十二 g 显存以上的你可以选择高一点。 那下面这个我们记住都要打上勾,他是内存的优化。下面这一块是学习率,那么这里面我们整 能微调这个第一个呢,他这个 low 学习论文建建议官方建议是官方建议是零点零零零一,那么这边官方建议是零点零零零五, 其他参数我们保持不动。下面这一块有个应用水平翻转这个你要打上勾,打开这个下面这个高级选项,那么下面这个高级选项呢,记住这个八 b t 一定要打上勾。然后下面这里面就没什么可选了, 这里面都保持默认,这样就可以。接下来我们来到这个网站,我们把我们需要的这个素材,我们这个模型素材呢,需要四到二十张人物的脸部图片,脸部跟衣服的这个比例呢,应该是三比 一,脸部为三,衣服为一的这个比例。现在我只有这四张图片,所以说我现在用这四张图片导入到这个网站里面来了。然后我们选择好,可以选择他这个五幺二乘五幺二这个尺寸, 在这个位置我们给它调好,然后给它输出五幺二乘五幺二的图片。好,现在我们直接点击这个 save as vip 或者 save as 这个文件都可以, 那么点击一下 save s z i p, 然后他给我们下载下来就可以了啊,我们就用这四张作为我们的生成模型的素材,复制一下这个文件的这个目录作为输入目录来到这个训练里面,然后这个 图图像预处理,这里面不是第一个生成这里面啊,是图像预处理这里,然后我们把这个粘贴进来,然后他还有个输出目录,输出目录我们可以自定义去找一个 好输出目录呢,我就在这个文件下面,我再给他新建一个,新建一个就能输出。 复制一下放到这个输出目。然后下面是你这个模型的宽度和高度都是五幺二,然后这里面我们 可以点击一下自动焦点裁切,这个下面保持默认就可以。然后如果你是生成动漫角色的话,卡通角色的话就使用这个,使用最后这一个, 如果你是生成真人的角色的话,就需要用到倒数第二个,这样生成真人的 啊,那我们使用第四个,使用最后一个生成动漫角色,然后进行预处理。在预处理完成之后,会给我们有这样一个提示, 然后来到我们这个文件夹里面,这个输出目录里面你可以看到他对于四张图片呢,又额外生成了四个这样的文件啊。那么现在我们回到军用 boss 里面, 来到第三项概念设置这里,那么这里面分为这个实力分类和样本,那么现今天不对分类和样本进行讨论,那我们先把实力给贴上去, 那这里面就是带有输入图像的路径,我把路径给输入进去,这个路径应该填写我刚才我们刚才输出的那个目 啊,那么下面这个我们不管,下面这个属于分类的。那么这下面需要我们输入我们的这个名字,这个是要输入模型的名字,那我们这模型的名字就叫麦,然后斜杠 下划线,斜杠然后括号,斜杠再括号,然后中间我们输入个关键字了, my goal。 那这是什么意思呢?为什么要这样输呢?斜杠括号,斜杠括号,斜杠括号。可以把我们这个括号呢变成字符, 因为在我们这个关键字里面呢,输入的关键字里面呢,括号代表权重,我们括一个括号就代表代表权重的意思,另外可以输入权重, 但是我们用下划线括号的话,可以用下划线把这个括号变成字词,也就是说他行这个括号里面呢是一个单纯的一个,是一个单纯的一个关键字。然后这样的话 可以让我们这个可以让我们这个模型呢,把括号里面这个关键字呢认识为一个新的一个单词 啊,这是一个不成文的一个规定嘛。啊,下面是这个分类的,下面是分类的这个标题哈,我们就不管。下面这个是提示词,那我们直接输入这个他提示有这个,直接输入 fair words。 这是什么意思呢?这是文件的意思,因为刚才我们图片旁边生成了那些文件嘛,就是提示词。那么直接就输 这个 fire what 提示词这个关键字加上括号就可以。好,现在我们这个实力的这个选项部分就设置完了。下面我们设置样本的部分,那么下面呢这个是样本提示词, 直接就随便打一些比较通用的一些样本这些提示词,那最后这个要注意一下。最后这个要注意,我们要用我们上面这个上面我们这个提示, 我们要用我们这个实力提示这个标题名我们给他复制管, 我们要用这个把我们标题名给他复制到最后,那么中间的这两项我们不管,中间这两项不管。然后到下面 这个是个反向提示词,反向提示词我们就用一个通用的反向提示词给他粘贴进去就可以了啊,我随便找了一个,然后直接给他复制进去就可以了啊。那么下面呢这个是分类,分类图片这个实力,那我们没有分类,没有设置分类就给他设置为零,下面这些我们都不用管。 然后下面这些这四个是啊,第一个这个是设置的这个样本,这些都保持默认不变,我们只是把这个样样本种子呢设置为一 下面七点五四十,这个我们就不变好。那么最后呢我们那个这这个呢 number, 这个是样本数量,样板样本数量是一,我们自己给他设置为一 好。接下来我们来到这个储存这里面,上面呢我们不要动。然后中间呢因为我们是做的是 lora, 所以说这里面我们全部给他打勾,全部去取消啊。上面这里面我们要给他输入我们的模型名字输入哎,然后下面来到这个 lora 的设置里面 啊,这里面的下面我们把这个 lower one 呢我们看一下是什么,然后等级我们从四给他升到六十或者五十也可以, 这样的话我们 lola 生成的细节会比较高。然后下面呢直接全部打上勾,那么下方这三个呢选项是训练军营 boss 才能够用到的。好了,现在没什么可设置了,我们直接点击保存这个设置好。保存好设置之后呢, 右边会点击这个,会显示这个我们的设置已经保存,我们直接训练就可以了。经过差不多一个小时的训练,现在已经训练完成了。 完成之后他会生成这三个结果图啊,这是我们的样本图片。那么现在训练好了,这个模型的路径呢?放在哪里呢?那这个模型呢是放在我们的这个根目录里面,这个 models, 这个 lora 里面。这个样本图片呢,放在我们的根目录 models, 然后追用 boss, 追用 boss, 然后你找到这个我们这个模型项目文件,然后他在我们这个 symbols 样本文件里面。大家记住这两个目录,我们将这个样本文件呢复制一份,复制到我们这个模型,乱按模型里面,然后将他的这个名字的改成跟我的模型名字一模一样。 那么在我们这个训练训练右面还有一个生成这个 c, k, p, t 生成之后呢,他会直接放在我们这个我们的这个 models 放在我们这个模型库里面。然后我们回到文生图里面, 这是 lora, 这是我们看这,我们看 lora 的这个模型好,那么上面呢,我们刷新一下,我们可以看到我们生成的这个卖两千的这个,那么现在这个 lora 生成了。给我们生成模型太多了,我们只保留几个别的,其他我们都给他删除掉, 像我们这个一百二到三百六的可以给他删除掉了,六百到一千九百二的也可以给他删除掉,我们只留四百八跟两千的,我们可以把这个图片给他复制一下,你在 来一个四百八的啊。现在我们重启我们这个 stephdown 重启这个软件,我们直接点击右边这个这个小图标,然后会给我们展开 lora, 然后我们看一下,现在这个 lora 已经更新了,只剩下两千和四百八了, 我们点击一下这个四百八的,然后他会有一个提示间括号,这个提示词代表我们这个四百八的这个关键字。我们把刚才我们这个他就给他安排的这个提示词呢,我反向提示词给他复制进去。好,现在我们给他复制进去之后呢, 我们这个一定不要忘记复制,就是刚才我们给他起的这个标题描述,这个标题描述是我们这个 lora 模型的啊,单独的关键字。好,现在我们直接给他生成 一下图片,我们给他生成六张看一下,然后上面这个样本,我们按照我们之前刚才那个训练模型的设置,设置为四十,然后这个相关性呢,设置为七点五,这都是我们刚才在训练模型的时候设置的啊,其他我们保持不变,我们直接生成。 好,那么现在生成这个结果呢?他这个人脸模型呢?主要依据我们刚才训练的这个人物模型。 好。那么今天这个 lord 先讲到这里,那至于还有一些细节没有讲到,那么我们下次关于他生成 lord 时候的那个图表什么意思?还有一些分类,还有我们那个 lord 生成的那个分类什么意思?下次再给大家讲。

我们看一下这个训练的代码,这部分是比较难的,这部分是比较难,这部分代码是比较难训练的代码。这个就是我怎么把一个标准的一个 chinese, 呃,那个波特的一个标准的一个模型,怎么把它训练,把它训练出来的训练出来,这个里面有很多坑,我基本上一一都把它过了,然后再把这个模型保存在某一个目录下面,然后再进行预测,它等于是这样。 那么训练一个模型的话呢?他也是一样的,他要经过几步就第一个的话呢,就是还是一样,就是把前面的那个导出来的这个数据能够把它给装载进来,然后你目 目前训练的这个 token, 那意思是什么?就是说怎么把这个中文变成一个数字,对吧?把它变成这个模型需要的这个矢量举举证,那这个前面这些都是在做这些事情 啊,都是在做这些事情,然后告诉他我这个这个把中文变成数字化举证完之后就哪三个列是我是要输入到这个模型里面去的啊? input 这个什么这个 laborers, 然后,嗯,放到这个模型里面去训练啊,他就训练完了,他其实还是一直在跑啊,一共有二百 五十三个模型,对吧?他大概分了四十八个批次,大概不断的在迭代, 每个批次的话大概是我目前设了这个是十六个样本批量的去跑,他等于是这样,那每次样本的话呢?是一 pro 十三次, 这个就是我前面给大家介绍的这几,这几个参数是比较重要,很多人不成功的主要的原因就是这这三个参数搞不清楚到底是怎么回事? 好,我们等他跑吧,跑完了之后我们可以再给大家看一下,跑完了之后的话, 我靠,有点打脸, 没事,但是可以看一下,如果是正常的情况下的话,就是他会这样,就是说他会,就是在你标注某一个任务的时候,他会自动的会预测出来,就是说,呃,这行文字里面哪些是品牌, 就是说哪些是组织,哪些是产品,哪些是 misk, 然后他他会自动的可以帮你预测出来这个东西,他等于是这样。嗯,这个我再尝试一下。 park what? 如果不出来的话,大家可能印象不深,那么如果是这个 弄出来的话,其实这个是其实还是蛮有价值的。嗯,蛮有价值。比如说他这个是瑞爱, 呃, vrai, 他认知出来他是一个组织,这个瑞爱他这个也是一个组织,然后钻石他认知出来的他是一个产品, 然后这个是一个相当于是一个动词,就是哪家比较靠谱,他等于是这样啊,那么基本上是我这个机器是可以识别这一句话的,他可 基本上是识别出来。嗯,那么如果他能他我这个机器,如果有人在问这个事的话,我知道,哦,这个是哪个组织的,对吧?他是哪个产品,对吧?那我就大概就清楚了他在问什么事,然后我我我后面, 如果我机器能清楚这个东西的话,我后面就可以做这件事啊,我给你看看啊,就是有点慢,我这个机器不行,你看到吧? 大家看到没有? lucky 型,对吧?我这个东西还没标啊,他这个重庆实验室培育钻石就是 product 怎么样? misc, 然后我自动把它标注下去,我再跑下一个,它就有点慢, 哎,怎么会这么慢?机器不行,那这个又来了。重庆实验室培育钻石挪哪些产品,对吧?这个就是我前面训练的这个模型,预测了一下这个下一个如果预测完了,他就标一了,没有预测,他就是一。 哎,这个又没出来,我估计又 out 好来了,他就比较慢,对吧?非常慢。重庆实验室陪转式购买好了,这个就就好。

哈喽,大家好,现在这一段声音是大家平时听到我原本的声音,这一段声音呢,是我用朋友的声音炼制的声音模型,接下来这一段呢,是我家楼下大爷的音色,接下来这一段呢,是我用自己的声音推理出来的歌曲。 没错,今天我们来分享一个关于训练声音模型的技术。其实训练声音的模型很早就已经接触了,但是一直没有准备做教程来分享,因为呃声音的训练和推理就像是这个二维码一样,都是比较敏感,容易在很多诈骗的场景被使用我所以我基本一直是自己来自娱 自乐一下。但是呢,前几天做了一件事,让我感觉这项技术其实可以拿来做很多非常有意义的事,比如说把家里人的声音训练成声音模型,或者是把照片训练成 sd 的模型。在一些非常遗憾,人力不可抗拒的情况下,这样的赛博飞升其实真的是非常有意义的。所以今天准备跟大家分享这个呃 有趣的技术吧。我们接下来进入正题,开始训练之前呢,首先要跟大家讲一下,这个软件其实还是利用 gpu 来训练的,所以对显卡有一定的要求,经过我的测试,应该是二零系的显卡基本都没问题了。 当然我们的显存尽量要大一点,最低最低最低应该是要六 g 甚至六 g, 我估计可能是训练不了模型,但是你可以用已有的模型来推理,保险一点的配置应该是八 g 的显存。首先呢,我们需要下载这个软件,软件的名字叫做 rvc, 这也是一个大佬基于这个技术原理来集成的一个这种 ui 界面,类似于 s d 的 y, 大家如果想去了解更多的这个使用知识,可以去 b 站去关注一下这位大佬,这个软件呢我也放在了链接当中,大家可以自行去下载, 下载完之后呢,我们把它解压出来,解压了之后我们打开下面这个 r v c, 在里面呢,我们找到有一个勾 v 点 b a t, 我们双击打开这个,这样的话我们就到了 ui 界面,这个 ui 界面里面呢,我们其实只要用 其中的两个功能。首先第一部分先教大家如何来训练我们的声音模型。首先需要准备素材,这个素材集呢,根据我的经验,我们需要准备至少 十到十五分钟的纯人生的素材,这个声音的质量是越高越好,而且不要有杂音,不要有混响。如果你没有专业的录制设备,其实我们现在的手机录音在一个安静的环境下就可以做得到。然后素材量呢,理论上是越多越好,但是一定是要在保证质量的前提下,呃,然后素材要注意的第二个点就是,如果我们训练出来的模型是想让他更多的用语说 话,那这个时候我们尽量就录制正常来说话沟通的这个声音。如果我们是想用来推理歌曲,想用来唱歌,那我们尽量素材就是我自己清唱的声音,不用担心唱的不好或者跑调,因为他最终训练的是我们的音色,但是尽量的要覆盖到高中低音,如果你的唱歌的声音里面全部都是低音, 或者你用纯说话的声音推理歌曲,他就会产生一些这种电子音或者是一些哑音的情况。当我们准备好了这个素材之后,接下来我们进入到这个 web ui 的训练界面里面。首先第一个部分,我们要给这个训练的模型起一个名字,然后呢这里的目标采样率我建议大家就保持默认,然后呢模型是否带有高音指导, 我们也是让他默认保持打开的状态。然后接下来版本,这里啊建议大家都是选择 v 一,因为 v 二目前不是特别稳定。然后最后这里呢就是除了在使用 gpu 处理的情况下, cpu 也可以辅助我们完成这个数据的处理,这个地方我们尽量给他拉满了,相对处理的会更快一些。第二步 这里我们要选择训练的文件夹路径,也就是说我们要把准备训练的声音素材,这个素材可以是一整段的,也可以是多段的,我们把它放到一个文件夹,然后呢复制这个文件夹的路径,然后粘贴到这里。然后第二步的其他所有的部分全部都是保持默认。接下来呢直接进入到第三个步骤,来填写一下他的训练设置。 首先我们先看一下总轮数吧,根据我的测试状态,如果你是有十五到三十分钟的素材,那么我建议这里的训练轮数是二百轮或者到三百轮,总轮数是二百轮。如果我们是五轮保存一次的话,那最后就会得到四十个模型, 其实没有必要的,所以这里建议我们改成每二十轮保存一次,这样最终我们就会得到十个模型来从中挑选。然后呢这里相当于一个并行处理的数量,这个越高的话处理的就会越快,但是越迟,我们的显存这里的话,它会自动根据我们的显卡来确定,我们保持默认就好。然后这里呢是说我们是否保存最新的一节是一般空间,也就说无论你这里填了多少, 如果你把这个勾选的话,他最后只给你保存最新的这个模型,我们当然是要选择否了,这个部分我们也可以给他选择否,然后最后这里是否在每次保存的时间点将最终小模型保存至这个文件夹。我们这里要选择是因为最终训练完的模型,我们要在这里找到他,接下来其他地方全部保持默认,然后我们点击 一键训练,这个时候我们就看到后台这里已经在处理,包括前台他正在处理数据,这里我们需要耐心做一个等待,做演示,我这里就不训练完了。训练结束之后,我们会看到一个英文单词 successful 的字样,就代表成功了,然后最后在结尾的时候,他会有一个二三三三三三这样结尾。当他整体训练完了之后,我们进入到这个 rvc 的这个根目录下面,然后我们在这个为此这个文件夹当中就可以找到我们训练完的,比如说这个是之前我训练过的,他就会显示,呃每一轮保留的一个模型,这些就都是我们训练好的模型。训练完之后,再当我们打开模型推理的时候,我们在下拉菜单 中就可以找到刚才训练的模型,到这一步我们的训练就结束了,那如果我们正常自己使用,其实在下拉菜单中找到进行下一步的推理就可以了。那如果我们想把训练好的音色分享给别人来使用,在 哪里找的?首先第一个我们需要把这个位词当中这个模型给他复制出来。然后第二个我们还要在这个 logs 里面找到我们刚才训练的这个音色,在这里面呢我们会看到非常多的文件,我们要找到其中的两个,一个是以 n p y 结尾的这个文件,另外一个就是上方的这个音 desk 结尾的这个文件,这三个文件组成了我们完整的模型文件。那第二步我们如何来进行声音的推理呢?首先我们需要把模型放到我们文件夹当中的位置里面, 然后在推理音色这里我们就可以找到刚才放进去的模型。我给大家展示一下,如果我们用这一首歌来做推理的话,首先第一个我们一般下载的歌曲都是带伴奏的,这个时候呢我们就要把伴奏跟人声 进行一个分离,这里呢推荐一个简单的工具,这个软件呢我也会把它放到链接中,他的使用其实非常简单,打开之后呢,我们直接选择他的输出路径,确认输出路径之后呢,我们就把这个想要分离的这个音乐给他 进来,处理完之后,在这个输出目录他就会生成一个文件夹,这个文件夹当中呢 ocas 就是我们的人声,然后上面一长串就是分离出来的伴奏,我们所需要用到的是这个人声,然后这个变调这个部分, 如果我们是男生转男声,或者女生转女生,音调是差不多高的,我们就默认保持为零。那如果原音是男生转为女生模型的音色,相当于他做了一个声调,那这里呢,我们就要填写十二。然后呢,如果是原音是女生,我们要转成男生的音色,那又给他填写负十二。我们这里呢,因为这个原音 是一个男生,我的这个声音也是男生,所以就不用给他做变调。然后这个地方的路径呢,就是我们之前保存那个 indesk, 如果这个模型是别人复制给你的,那我们 就是要把它放到 logs 里面,我们给它新建一个文件夹,然后把这个 indesk 给它放进来。如果是我们自己练的就不需要了,它自动已经就在这里了。然后其他的地方我们都不用去管它,直接点击转换, ok, 这样的话最终在剪辑软件里面把伴奏跟人声合在一起就完成了,学会的话就赶紧去尝试一下吧。

大家好,今天继续我们的探测辅路二点叉的深度学习系列。本视频我来分享一下怎样读取潘纳斯的数据训练模型。这次我使用的数据集是一个心脏病预测的数据集, 他是一个二分类的问题。我们都知道潘纳斯呢是 pasen 非常好用的一个数据处理与数据分析的内裤,如果能将潘纳斯和特色 flow 进行对接, 那么就能先使用 plus 进行数据处理,然后将数据处理之后的结果呢传给 tenson flow 进行模型的训练, 这是一个比较好的处理流程。首先来介绍一下这个数据机,它的名字叫做心脏病的数据机,在它里面每一行呢是一个病人, 包含病人的信息,以及这个病人当时真的是否有心脏病。而我们的目标呢是使用该数据训练个模型,根据病人的信息来预测这个病人是否有心脏病,这是一个二分类的问题。我们来看一下这个数据, 这个数据就是这样的一个 csv 的格式,它有一些病人信息,比如说性别,年龄等等一些信息。最后一个 target, 这个 target 呢是零代表没有心脏病,十一代表生了心脏病。 我们的目标就是用前面的特征来预测,最后这个 target 回到我们的代码,本次的目标就是这样的,就怎样把一个 pandas 的数据加载到 cares 能够进行训练呢? 首先我们使用 pandas 来读取数据,第一步应用 pandas 和 test floor 运行,然后呢,我看一下这两个库的 version, pd 点 version 和 tf 点 version 运行。 大家看到我用的 tf 呢是二点一点零,判断死是一点零点一,然后我使用 p 点 ready csv, 把刚才的这个 csv 给读取到 df, 这 csv 的路径在 datas 下面的 hot, 下面的 hot 点 csv 运行,然后我们看一下这个 data frame 前进行, 我们看到下载成了一个正常的表格,前面呢就是 a 级 sex, 后面呢就这个 target 在这里面,前面呢都是数字,其实由于这一列它的数据呢是这种字无串,也就是说是一个 分类的特征,比如说我们看一下 d f 点 d types 就是美丽的类型,我们看到其他的呢都是 inter 六十四以及 float, 而这个 sol 类型 tar object 就是怎么串。 我们都知道机器学习只能处理数字,所以说我们想办法把这一列变成数字,这里简单起见,我们直接使用 pandas 的 category 扣,就是说先把这一列变成分类列,然后呢使用 category 扣点扣子, 直接使用分类的编码来把它变成数字运行,我们看一下,我们重新看一下前几行, 我们看到这个扫这一列呢就变成了二三四这样的数字,那么输入输出都是数字了,就可以往 cares 试图加载了。第二步我们怎么把数据加载到 tf 点 data 等 data 呢?首先呢我们把这个塔盖的这一列给取出来, 就 d f 点 pop 这一列,把它等于 target 运行,这个时候我们看下 d f, 我们看到它的 target 那一列呢已经消失了,也就是说这个时候它就是我们的输入特征的数据,这个时候我们看下 target 点 high 哎,它是个 series, 就是我们要预测的目标,就这样的零一零一这样的数字,接下来呢我就会使用 tf 点 data 点 dataset 下面它的一个函数 from tensor slices, 这样的话可以直接把一个内存的数据变成 dataset, 这里我使用的方法是 d f 点 values 以及 target 点 values, 然后用原组的形式把这俩括起来,传给这个函数,就可以构建你的 set。 那这个 d f 点 values 和 tactical values 是什么东西呢?我们先看一下 d f 点害的去前进行的 values 运行,我们看到它呢其实就是个 ninepad array, 它是个二位数组,每一行呢就一条数据,它有多行, 然后 target the values, 我们看一下它也是个男排的 ray, 那么我们就明白了,这个 from tensor slices 它传承的原组呢,这两项都是男排的数组,男排的数组加载到 date set, 前面我们演示了, 所以说总结一点,潘纳斯要想进入 carrus, 方法还是通过南派这个中间的形式,所以说南派号称 是机学习底层的这种通用的语言运行。然后我们介绍一个特性, ditasit, 它是个数据集,它本身呢是可以否循环便利的, 而它里面因为我们传了个原子,有两项,所以说可以直接编例的时候呢,分开去两项,我们打印一下前五行,就是分别打印出 features 和 label, 逆行,我们看到 features 呢,就这样的 lv lab 呢,就这样的数字。接下来为了送人模型,我们将这个数据随机打散,打散了这个八分,我直接取这个数以及的行数,然后拜其为一,就是每次取一条 运行。第三大步我们就来创建训练模型,首先创建的模型呢,依然使用 cart 点 c 勾选手, 这里分三层,因为我们是二分零预测,所以说这里最后一个是单词一,就有一个元素他值,因为是零,因为是一, 中间是一个十元素的 r, e, l, u 的单词层。而它的输入呢,我们也是一个单词,它英文的 ship, 这里可以这样写,就是 d f, 它 ship 的一, 这句什么意思? d f 的 ship, 它本身是一个二元组,代表它是多少行多少列。当我们送入 cars 这个函数的时候呢,我们需要把行给省略掉,只取它的列,列数呢,就是特征数,就这个意思 运行。然后呢, model 点 compare, 我们设定它的优化器 los 和 matrix, 因为我们是二分类问题, los 可以是 binary 的 超市 enter 配运行。然后看一下 model 点 summary, 我们看到就有三层以及每一层的参数。最后呢,我们使用 model 点 fit, 把我们这个 dear set 传进来训练。十五轮运行, 我们看到他进入正常的训练,而这个 los 呢,在持续的降低这个精度呢,从七十一直到了七十九, 说明他是正常进行训练的。 ok, 以上呢就是本视频代码的演示,回顾一下,我们的目标是把判断词的数据传递给 tender flow 的 disset, 然后送到 cares 进行训练。 要把 pandas 的数据转换成 decide, 我们可以使用 nampa 这个中间的形式来进行转换。方法呢就 decide 点 from tensor slices 传音 元组,第一项是特征的麦六四这个蓝牌手组,第二项是 target, 也就是 label 的蓝牌手组这样的形式。好了,我们下次见,拜拜。

玩 ai 绘画的小伙伴们,今天给大家推荐一款完全免费并且超级强力的 ai 绘画网站,名字叫海意,大家可以直接去浏览器搜索。 首先进到他的主页,我们会发现这里的内容真的非常的丰富,包括其他创作者的作品图片及短视频以及模型。因为他这里的模型是直接和 c 站打通的,所以应该是你不需要魔法就能找到模型最全的网站了。我们可以直接在其他创作者的基础上进行二次创作,当然也可以在下方输入我们的提示词, 如果你没有想法的话,我们可以直接用他的随机提示字筛子以及提示字优化的功能,让我们做图变得非常轻松。当然了,不仅仅是文生图,我们在左侧可以找到他的高级创作,里面可以找到图生图 这个位置,我们可以上传自己的一张图片,以这张图片为圆形来进行二次创作。比如说这里我们选择一张图片,他会自动帮我们分析出相应的提示词,我们来到右侧选择一下他的参数,比如说这里的模 模型,我们可以选择更多模型,然后在推荐这里呢,整个网站的模型我们都可以直接来调用,这里呢我们选择一个二次元的,如果有需要的话,你还可以在下方选择一些 形象的风格,点击生成。我们可以看到通过图声图的方式,在原图的基础上给我们进行了非常惊艳的二次创作。同时呢,图声图这里还有两个非常好用的小功能,第一个就是局部重绘,我们可以选择一张图片,然后在右侧,我们可以通过画笔的形式, 或者是更简单的直接点选的方式,把我们想要重绘的部分用左键点击出来,想要保留的部分用右键选择,然后我们在提示词的部分输入重新绘制的内容, 然后我们点击生成,这张图的背景被我们进行重新绘制了,用这个功能我们可以去给人物换背景,给产品换背景,都可以实现。另一个非常好用的地方就是在人物修复,这个地方,我们可以选择修复人物的脸或者手或者身体,解决了很多情况下人物坏脸坏手的问题,大家可以亲自去尝试一下。如果你觉得图生图还 还是不能打造你的创作需求,那我们可以在左侧找到他的条件生图功能,这个功能非常强大,他可以通过十几种不同的维度来控制你的出图效果。这里呢我们用这个人物动作来尝试一下,我们选择姿态识别,然后上传一张图片,在右侧选择模型以及风格,点击生成。 生成的图片中人物的姿势和原图是一模一样的,这个就是条件生图的强大之处。除此之外呢,他还内置了非常多的强力工具,比如说最近非常火的图片填充功能,我们随意上传一张图片,然后呢将他的画幅拉大,点击智能分析,自动获取提示词,点击生成,我们可以看到他直接把我们的一张原图进行了 智能化扩展,并且可以说是毫无违和感。接下来我们再来看看他的 ai 聊天功能,这里是需要模仿的,我们可以在这里完整的使用他的 ai 对话功能,同时呢他还内置了非常多的角色身份,让我们来一键调用。第三个非常非常强大的功能就是在线训练模型,我们在页面 面的左上角就可以找到这个 ai 模型,在这里我们可以创建自己的数据集,给他起个名字,然后选择一下你要训练的是写实人物还是动漫人物,还是一种画风。然后点击创建之后呢,进到这里面 可以上传我们的所有素材,如果你没有训练基础也没关系,左下角的快速打标签工具让你非常好上手。右边也内置了训练的参数,我们直接点击在线生成,然后进行等待就可以了。 我视频开头说过的要送给大家一个小福利,就是我们在注册的时候可以填写一个邀请码,这个邀请码填了的话,被邀请的人和邀请的人都可以得到算力奖励,但是这里呢,我就不让大家来填我的这个邀请码了。 所有已经注册的伙伴,我们在个人中心这里的左下角可以找到自己的个人邀请码,大家可以把个人邀请码留言到我的评论区,这样后来的伙伴如果要注册的时候,可以填写一下留言过的伙伴的邀请码,这样你们双方都可以获得算力。那最后大家就快去尝试一下吧,这个网站真的非常不错。

哈喽,大家好,今天我们讲的是 lara 模型训练,首先我们来到这个后亚 ass 页面,这个地址的话我会发在我的视频的说明哪里,然后你往下翻, 看到这里这的话首先我们要去安装 ps 三点一零,如果你不是这个版本,要换成三点一零版本,然后如果你没有的话,你可以直接点击这里进行一个安装。接着我们需要去打开我们的 powershare, 然后我们可以直接在这里进行一个搜索, 而是看到这个地方,这个地方的话右键以管理员身份运行, 然后我们要把这条指令这条指令复制粘贴到这来, 然后回车,然后出现这个之后你选择 a, 然后回车,然后这个地方好运行好了之后你直接关掉,关掉之后我们再把这个 这一行指令然后复制。你找到你想安装 laura 的一个位置,比如说我想安装到这个地方,然后你就直接在这个地方右击, 嗯,点到这个在终端打开,当然有的人的话可能没有这个按键,因为这个需要去配置,那怎么办呢?我们可以直接在这个地方输入 power shield, 然后回车,他就按出这个这个框了,然后把刚刚那个指令复制粘贴过来, 然后等它去运行这个地方的话,首次去安装可能会,嗯,就是时间比较久,大家稍微等一下, 然后我们来到这里,这里已经执行完了,就是你出现这个字样之后,然后就说明上边的执行完了,完了之后你就回车运行最后一行指令,然后这里的话需要注意稍微等一下,也需要一点的时间, 有一些电脑的话可能会快一些哈, 然后运行了之后他会出现这个选项,这里的话是配置你的, 嗯,就是执行环境的,你选择这台电脑就可以的,就是这台电脑,然后你直接点回车,然后这个地方的话是是否就是呃进行分布式训练,然后你这个第一行选第一个就行了,也就是按回车就可以了, 然后这个地方的话你选择 no, 然后这个地方也选择 no, 这个地方也选择 no, 然后这个地方的话输入 or, 然后这里的话因为它不给选择,所以这儿直接就回撬吧, 然后这个地方就已经运行完了,运行完了之后你擦掉,然后你会看到这个地方就是我们刚刚选的这个位置,然后出现这个好雅的 ss 的文件夹哈。嗯 嗯,接着呢,我们又回到刚刚那个页面,就是这个页面,然后可以看到这里,这里的话它是一个可选项,就是说如果你现在使用的是呃 nr 三零系或者四零系的,嗯,你可以使用这个,然后进行, 就是让你让你的那个训练进行一个加速吗?然后你可以点击这个 here, 然后在这个地方进行一个安装。嗯,我这边就不点了哈,因为我已经下载过了,然后下载的就在这个地方 就是这个文件下载之后你解压,解压之后点进去,点进去这这有个这个,然后你进行一个复制,然后你回到你的那个就是这个文件夹,然后点进去 浩雅的目录,然后你可以,嗯,直接进行一个复制粘贴,然后他就过来了,然后接着下一步的话我们要去又回到这个页面,又回到这个页面,我们要复制这行指令, 复制这行指令,然后复制之后再导候雅的这个目录,然后我们右击,然后中端打开,但是你没有的话,你就在这儿输入 powerseer are share, 然后到这个文件夹这边,然后把这行指令输入进去,然后回车,然后这里就运行完了,运行完了 之后就关掉它,关掉它之后,然后我们来到这里,这个我们要找到,嗯,这个大家看一下 upgrad, 嗯, p s e 这个,然后我们右击。 呃,你有一个右击使用这个 powershare 运行,然后我们需要等它运行一下, 然后运行好了之后,嗯,这儿它已经是运行好了哈。呃,因为我之前运行过,然后运行好了之后,你再找到这个 do i bet 这个,然后双击它进行 运行, 然后他会弹出这个地址,然后你复制 复制过来,然后找到一个浏览器,然后把打开,然后这个的这个页面的话就是我们 lara 训练的这个页面了。 我们看到这个 dreamboss laura 这个的话才是训练我们的 laura 的,不要弄错了,是这个第二项。然后这个地方的话是选择我们的原模型,你可以看到这个图标,我们点进去, 然后找到你的 vip u i 目录,然后里边儿的 models, 然后找到 stop defishing, 然后这个地方的话就是你的本地模型了,你我就 就选择这个一点五的吧,然后你看这个路径的话,就直接就跳转过来了。当然如果你不想使用本地的模型的话,你可以使用远程模型,你在这进行一个选择, 然后选择的选择之后,他会自动在网上进行一个下载,然后第三个的话,这个地方的话就是你,嗯,训练出来的模型,然后 他以什么样的一个格式进行一个保存?我建议还是就用这个 sevenths 这个格式进行一个保存,然后这边我们输好了之后,我们来到第二栏,第二栏的话我们需要去建一个文件夹, 嗯,这个文件夹的话,你就,嗯随便输在哪个地方就行了吗?我们就在这个地方去建吧。我们建一个文件夹,比如起个名字,你随便起个什么名字 都可以,我就写个 test, 然后点进去,在这儿要建三个文件夹,第一个是 image, 然后第二个 note, 然后第三个就是 model, 第一个文件夹的话,这个文件夹是存放我们要训练的图片素材,然后第二个的话就是我们输出的训练日志,就在这个地方,嗯, model 就是我们的模型文件夹,也就是我们输出的模型就会在这个地方。 嗯,第一个就是要进行一个图片的处理哈,然后大家可以看一下,这个是我事先准备好的这样的一个图片,图片的话,嗯,尽量 是一个人,然后,嗯,尽量是这种比较规范的一些。呃,就是分辨率吗?就是五幺二乘五幺二,你就见这个就行了,当然其他的一些分辨率的图片也是可以的哈,当然我是建议就要工整一点,就五幺二的吧, 就剪裁成这样,然后我们再找到 v b o m 录,然后在这里建一个 train 的一个文件夹,你可以,呃,随便什么名字都行,然后进去之后,然后我们要建两个文件夹, 嗯,要要建一个文件夹,比如说我们起名 my arnia 吧, 然后我们再点进去,再起名,然后起一个呃,买阿年 啊 in 这样的文件夹,然后我们再建一个文件夹, 然后把这里改成 alt, 然后建好之后,我们要把我们选定的这个图片素材,然后全选复制粘贴到,嗯,就是这个 trend 这个文件夹里边儿, 这个 in, 买按压 in 这个文件夹里边儿,然后进行一个复制粘贴,复制粘贴好了之后,我们要到 stop tv 微信这个主页面, 就是这个页面他的训练这,然后这里有个图像预处理,然后我们要把刚刚的这个文件夹的这个路径,就买安妮啊,这个买安妮啊印这个路径,然后复制粘贴过来, 这复制粘贴,然后这个目标路径的话就是买 onion alt 那个,然后我们这儿改成 alt 就可以了,然后五幺二的一个就是分辨率,然后我们使用这个吧 这个,然后去给他生成文字说明,然后预处理。大家可能稍微等一下, 看这里的话,出现 finish 的一个字样就已经处理好了。然后我们回到这个, 然后我们找到 myani out 这个文件夹,你可以看一下这就是一张图片,一个文字说明,你可以看一下这里,然后就弄好了。弄好了之后你把这个文件,然后进行一个复制粘贴,然后到我们之前见的这个 test 这个文件夹,然后 image, 然后点进去,然后复制粘贴过来。 复制粘贴这个地方的话是需要去改名字的,而且是有特定的一个格式,然后比如说,呃,这里你要给他一个数字, 给他一个一百的一个数字吧,这个数字是代表了就是每一张图片你要让 ai 看多少次,就是这个数字。然后后边的话内容你可以随便跟个名字都行,比如下划线阿鸟就起这个名字吧。 然后大家可以看到这里边的话,就是我们之前的那个图片呢,我们可以用大图哈,一定要是一张图片,然后这边的话是他的这些标注,你可以看一下,一定要是这样的一个 合适哈,然后我们把这个路径复制一下,呃,可以不用复制,然后这个设置好了之后,然后我们到 这个页面来这个页面来这个地方,然后我们需要传我们刚刚的那个路径, 嗯,这个是 test, 然后 image 这个地方不要点进去了,就是 image, 然后选择这个文件夹,然后这个,嗯是选 model 那个文件夹 就是这个 model 这个文件夹,然后这个地方是选择 log 这个文件夹,然后选好了之后我们再到 第三项这个地方,第三项你把这个取消掉,然后我们就可以去就是说训练了, 然后点他,点这个 dream model, 然后你就可以看到你的后台这个地方,然后就可以开始训练了,但是这个训练的时间有点长哈,我们就不等了,然后我今天的一个分享就到这里。

为什么别人练的模型精彩万分,你练的模型惨不忍睹?问题出在哪?我认为主要是对于基础模型的选择和下载安装还没有特别的熟练明白没关系,今天手把手教你成为一个出色的炼丹师。接下来说一说模型的分类。 s d 常用模型大致分为五种, 第一种我们称为大模型或者主模型,大模型可以单独使用,拓展模型必须搭配大模型使用。第二种也是我们最常用的,其实是除了官方模型之外的主模型,叫做 checkpoint, 你甚至可以简单理解,几乎所有模型都是基于官方模型作为底膜来进行训练得到的。第三种说它是模型,但其实外更像是个滤镜,在生成图片过程中搭配着主模型使用, 起到调色和微调的作用。第四种, embedding 模型,又叫 texture ingresher 模型,需要和主模型一起搭配使用。 embedding 可以简单理解为题词打包模型,它可以生成 指定角色的特征风格或者画风。最后就是最近最火的 low 模型了,他最大的特点就是几乎图像上的信息他都可以训练,并且还原度非常高。现在网络上流行的很多 ai 真人绘图基本都是用的这类模型, 甚至你可能会看到很多画出来的网红形象都很像,这是由于他们用的是同一款 laura。 推荐两个免费 stable defusion 模型下载网站, 第一个国内 ai 分享网站,上面有很多可以直接下载使用的 stable diffusion 模型,用过 c 站的朋友会发现他们的页面布局、使用方法都是很相似的,对于没有魔法的朋友,这是最好的选择。第二个就是 c 站上面模型十分的丰富,公认的 stable diffusion 模型网, 遗憾的一点就是它是国外的网站,国内不能直接访问。下期视频推荐几款我常用的模型,记得一键三连点点关注呦!