粉丝3204获赞5.6万

全网最细的变声器教程来了,宝宝好想你啊,什么时候能带我玩啊,能不能秒回我消息啊,哥哥再不理我,我可真的要生气了,我真的会把你的头打爆,哼,如果我不说,你敢相信你听到的声音是我说出来的吗?嗯,如果你也想用同样的声音去整蛊你的兄弟, 把游戏的好友调成翘嘴的话,我已经给大家准备好了最详细的变声器工具箱,大家可以在评论区评论,工具箱三个字我看到都会免费分享给大家的。我们拿到工具箱直接打开,然后点使用工具,这里 显卡检测,这里下载,然后点击启动,等一会就会弹出我们的显卡型号和性能,判定是否达标, 还会指引下载我们显卡所对应的版本,这样就不会出现因为下载错版本导致变声器安装失败的情况了。然后点击资源下载界面,第一个是 n 卡四零系及以下的版本,第二个是 n 卡五零系的版本, 第三个是 amd 的 版本,第四个是虚拟声卡全版本,这个不分型号的,都是通用的。 然后找到我们的变声器版本,点击查看详情,右下角就可以直接下载了,这个下载速度就看我们的网速了,下载进度可以在右上角的下载中心查看, 然后再下载这个虚拟声卡就可以了。变声器所需的软件就准备好了,接下来就可以解压安装了。 如果你没有免费的解压软件,直接下载这个免费的七 z 解压就行。接下来就是找到我们变声器的下载位置,然后右键七 z 解压到当前的文件夹,解压需要一分钟左右的时间,大家可以稍等一下,解压好后记住我们的文件位置, 一会需要找到这个文件的位置,这个没有任何的难度吧。现在再来安装我们的虚拟声卡,打开文件,点击 install 安装,安装同样需要等待一分钟左右, 等弹出广告就是安装成功了,这里需要注意的是,不要重复安装,这个 remove 按钮就是卸载了哦,这个错误大家千万不要犯哦。完成以上步骤,变声器和虚拟声卡的下载解压安装都已经完成了, 我们再来打开设置界面,虚拟声卡这里选 voice meter 驱动路径这里点击刷新状态就会自动绑定, 然后是变声器设置,选 r v c 启动文件路径这个手动选择我们变声器刚刚解压的位置,然后选上这个变声器的启动的快捷方式,同样绑定成功就 ok 了。 接下来就是降噪的设置,点击降噪通道这里需要注意的是,下载之前要先选这个下载位置,不然下载不了的。 下载后点击 install driver 开始安装,同样等弹出广告就是安装成功了。然后就是设置这里只有麦克风,这里选择你自己的麦克风,其他的设置直接参考我的设置就可以了。 然后我们点进启动变声,等变声器和虚拟声卡弹出就可以了。虚拟声卡这里的设置只有右上角的 a 一, 选择你密格式的耳机就行,剩下的所有设置全部参考我的设置就可以了,只要不自由发挥就不会出错。 然后我们就可以点开始音频转换,现在说话就能听见自己的变声了,变声器运行黑色终端不能关闭,最小化后台就行。是不是很简单?如果对自己的声音不满意, 可以在教程专区点 r v c 参数,教程可以自己微调声线的,需要更多模型的兄弟也可以在模型市场查看,学会的兄弟千万不要爱上自己哦,拜拜。拜拜。


哈喽啊小宝们,今天带大家看看我的绘画过程,搭档已就位。今天画分镜里的这幅画,据说这是新出的数字笔,笔很跟手,几乎没什么延迟,左手画也不偏,双波轮跟快捷键手感很好。这个真的挺爽的,你就这么拨拨拨调,笔刷和切画布也真的很方便。 好开始上色,最近改变了视频风格,就不会像之前一样细画了张都画不完。屏的色彩显示也蛮不错的,画起来有沙沙的声音,很像在纸上画画, 休息的时候直接把笔吸在上面也很方便。入手还不到一千,打到身价竟如此亲民!搞快点搞快点!看成图!

手机版变声器教程来喽,宝宝,我自己一个人在家好无聊呀,来我家一起玩游戏呗,你带我上分。那刚刚大家听到的声音就是我用变声器变出来的,那如果你也想拥有同样的效果,就整蛊你的好兄弟,把它雕成翘嘴。 那这里的话,我已经把变声器所需要用到的安装包给大家准备好了,那在评论区评论变声器,我也会免费的分享给大家。 那首先说一下,因为真实的变声器是要用大模型去运算的,手机的算力肯定是不够的,那肯定也处理不出来更真实的变声效果。所以手机变声器的话,也是需要先在电脑上进行成功变声,然后再通过转接线传到手机上的。 那这里如果还不知道怎么在电脑上变声的话,可以看上一期有关电脑的变声器的详细教程。 那这里我们直接开始手机的教学。那在电脑上设置好之后,这里以唱吧的这个直播一号为例,然后我们根据自己手机的接口来选择对应的版本, 那如果你是苹果接口的话,就选择苹果的版本,那我这里就选择 c 口的。然后我们用这个两头三点五的音频线,一头接在我们电脑的扬声器接口,另一头就接在直播一号左下角的接口, 然后我们的耳机就接在直播一号右下角耳机图标的接口,然后再接上我们的手机,此时手机右上角就会显示耳机的图标,那就代表我们的设备已经连接好了,那我们来测试一下。 宝宝,我自己一个人在家好无聊呀,来我家一起玩游戏呗,你带我上分。 宝宝我自己一个人在家好无聊呀。来我家一起玩游戏呗,你带我上分。 ok, 那 这样的话就操作完成了。那打游戏发语音,语音电话都是可以使用的。那大家可以先去试一试,如果有什么问题也可以在评论区评论。那我看到也都会一一的解答。

今天跟大家分享 gpt 收位子使用时的一些细节,包括如何控制语速、语气以及模型训练的注意事项。先请大家看个短片, 我不敢苟同。我个人认为这个意大利面就应该反四十二号混凝土,因为这个螺丝钉的长度,它很容易会直接影响到挖掘机的扭矩, 你往里砸的时候,一瞬间它就会产生大量的高能蛋白,俗称 ufo, 会严重影响经济的发展。照你这么说,炸机关要用九十二号汽油? 这段语音是用 gpt swiss 极速版合成的,其中 swiss 模型只训练了二十轮, gpt 模型训练了五十轮。之所以在网上找这段文本来测试,主要是它的内容有点像大语言模型产生幻觉时的胡言乱语, 这样能降低跟训练内容撞衫的概率,更能客观的评价模型在语速语气上的泛化能力。 先来简单介绍下极速版的下载和使用,这个版本除了推理速度快以外,其他功能跟最近发布的整合包没什么区别。不过它只适用于 windows 系统,并且需要 n 卡,显卡不少于六 g, 内存最好八 g 以上。国内网可以到百度网盘下载这个文件, 外网可以在谷歌网盘下载,分享链接都在本期视频下方的说明。理解压好以后,建议先做三项设置,首先点这里的查看,把这个文件扩展名选项勾上, 然后调整显卡设置在桌面,点击鼠标右键,选择英伟达控制面板,切换到第二个程序设置,然后点击添加弹窗里,点击浏览按钮地址栏,这里定位到整合包的解压目录, 再进入 runtime 文件夹,选择这个 python 文件,添加好以后,在这个下拉列表里选择高性能英伟达处理器下面列表区域,再点击这一行,把这个值改为偏好无系统内存回退, 最后点下面的应用按钮,这样就设置好了。如果你的内存少于十六 g, 还需要确认下虚拟内存是否为自动管理。在桌面上右键此电脑,选择属性窗口右侧,点击高级系统设置,再点击设置按钮, 把这个选项勾上,这样会降低训练推理时内存溢出的错误。注意,勾选以后需要重启电脑才能生效。 如果你之前用过其他版本,并且有训练好的模型,可以直接拿到这个版本里使用到原来版本的解压目录下,复制这两个文件夹,粘贴到加速版的解压目录里, 然后运行勾 web ui, 点 bat 启动程序,切换到推理页面,点击刷新按钮,这两个模型列表里就能看到复制过来的模型了。 如果想在这个版本里继续训练原来的模型,可以再复制原来版本里这两个文件夹,粘贴到加速版解压目录就可以了。 在模型既定的情况下,合成后的语速语气跟两个因素有非常大的关系,一是这里的参考语音,二是合成内容的切分。先来看参考语音如何影响,我先用这个一号参考音频来合成, 这里填上参考音频的对应文本,生成了八秒的语音来听一下萤火虫,心想就算酒中有毒,萤火虫早就命不久长,给他毒死便毒死,何必输这口气,当即端起酒杯又连饮两杯, 现在更换参考音,再来合成 这次深沉的语音有九秒,林胡聪心想,就算酒中有毒,林胡聪早就命不久长,对他毒死便毒舍,何必输这口气。当即端起酒杯又连饮两杯, 可以感觉到语速稍慢了一点,语气也有细微的变化,特别是何必输这口气这一句。所以挑选合适的参考音频是非常关键的。语速快的参考音必然生成快速的朗读,具有明显语气特征的参考音,合成的语音也会带上语气。 关于参考音频的挑选,有个更简单的办法,可以切换到第一个标签页,先在这里指定标注文件, 打开这里的标注工具,一般找五秒左右的音频试听,尽量是完整的语句 没,不要哎,没有你有这么高超易忍的机械进入中国进入我给出的原理,小的时候挑好以后,点击这里的下载,然后把文件改个名,编上号, 这样选择参考音频就不需要到音频切割的输出目录里挨个找了。 我就是命逆者逻辑化名执念人,我不亲命李世强,你不你不你不散,你吗?我的心脏运转就是为了完成广播的事,银河系一带全都在坐标, 你以为我跟你闹着玩啊,你天天阻我们分析你,你干什么工作的?你这军情我分析的没有物理学了。你们这段合成的效果不是太好,可以明显的听出声音很沙哑,因为训练素材的背景噪音太大了,去除不了。 下面来看影响语速语气的第二个因素,断句和标点符号。这几种切分方式合成后的语速从快到慢,大致的顺序是不切的语速最快,其次是五十字一切,最慢的是按标点符号切, 这是不切的效果。音频千万不能有杂音,要口齿清晰,响度统一,没有混响,每句话尽量完整,全部手动校对标注,三十分钟内有明显提升,不建议再增加数据级长度, 这是默认的凑四 g。 已切音频千万不能有杂音,要口齿清晰,响度统一,没有混响,每句话尽量完整,全部手动校徽标注,三十分钟内有明显提升,不建议再增加数据及长度。在听下按标点符号切 音频千万不能有杂音,要口齿清晰,响度统一,没有混响,每句话尽量完整,全部手动交对标注,三十分钟内有明显提升,不建议再增加数据集长度。 这里值得注意的是,这几种切分方式对显存的占用也是不一样的,不切占用的显存最大,特别是几百字的长文本,不切可能会爆显存。 对于短文本,比如十个字以内可以不切,通过手动加标点符号来进行语速控制,这是不加标点的效果。老公,我想要买个包, 这是加上省略号的效果。老公,我想要买个包。对于一个字的文本,像 n、 r、 o 这些语气词,添加标点符号一样也起作用。 one one one one 如果再调高这个 topkai 参数,合成效果就更加多样化 啊啊啊啊!总的来说,标点符号更适用于短文本的语速语气控制。一百字以上的长文本,推荐按句子或标点符号切分,超过五百字以上,最好先在这里切分,以后再合成 切分和标点符号只能改变局部文本的语速和语气,每个字的发音速度,以及合成后的整体语气,还是参考音频的影响更大。 参考音频还有个比较有趣的用法是声音融合。先来听下这一段语音,维特跟斯坦说,这个世界上有语言能说的要说清楚, 这个世界上也有超出语言说不明白的。维特跟斯坦直接用了两字, dj 没法说吗?所以才有了如来。什么烟花加夜微笑, 这是周处除伤害里的那位尊者的声音合成,现在把参考音频换成星爷的配音来合成下,听下效果。 维特根斯坦说,这个世界上有语言能说的要说清楚, 这个世界上也有超出语言说不明白的。维特根斯坦直接用了两字,闭嘴,没法说嘛,所以才有了如来。什么莲花家业、微笑。 当使用的模型和参考音频不是同一个人的时候,合成后会把各自的音色和语气融合在一起,类似于 ai 幻联里的多张人脸融合。 不过这种用法对模型的要求比较高,如果训练模型用的声音不纯净,那融合后的声音就会很沙哑。在声音合成时,可能大家也遇到过声音泄露的问题,就是合成结果里有时会出现提示音频的内容,或者合成后漏读复读的某句话,甚至胡言乱语。 如果这些情况是在多次合成后产生的,建议首先关闭推理页面,取消这里的勾选,再勾选重新打开推理页面进行合成。如果这种方法解决不了,那就依次尝试拆分合成内容,更换参考音频。最后是更换第轮次的模型, 一般低轮次的模型合成的结果会更加准确,但是语气会差一些。高轮次的模型在复刻语气上表现的更好,但也容易出现声音泄露。 我们可以在训练时改变保存频率来获得更多轮次的模型。关于模型训练的完整流程,在这一期视频里有非常详细的演示和介绍,今天把几个需要注意的地方再补充一下。第一个是在指定音频切分这个参数时,容易漏掉文件的扩展名。 第二个注意点是音频切割好以后,要到输出目录里检查一下,把显示时长打开,然后排序。如果你的显存小于十六 g, 就 把超过十秒的片段全部删掉,这样可以降低训练时报显存的几率。 批量 asr 的 时候,中文语音就用达摩非,中文就用 vespa。 vespa 模型整合包里是没有的,第一次使用时会自动下载,中国大陆需要开魔法。第五个注意点,训练模型起名不要用汉字。 最后是模型训练,这里需要注意的是, sovis 和 gpt 训练不能同时进行,除非你有两张显卡。 训练收尾词。模型首先要根据自己的显存来调整,这个 batch size 参数小于六 g, 显存保险一点就设为一八 g 以上的显存可以设置为显存的一半。 如果训练素材十分钟以内,剩下的参数建议全部默认。如果是三十分钟到一小时的素材,而且声音处理很干净,可以调整这里的训练轮数。五十、一百甚至二百都是可以的, 不过界面上最高只能设置到二十五,需要修改这里的代码 学习率这个参数十分钟以内的素材就用默认的零点四,三十分钟以上可以调到零点三。 训练过程中可以切换到命令窗口查看详细进度,这些数字代表当前正在第几轮训练。可以按 ctrl、 加 shift、 加 esc, 打开任务管理器,把第一个图标这里切换成显示扩大的使用情况。 可以看到, gpt suite 的 模型训练对 cpu、 内存、显卡都有占用,特别是内存的使用还是很高的,所以这个 ai 还是比较吃硬件配置的。 训练完成后,在这个目录下可以看到保存的模型,因为只训练了八轮,四轮一保存,总共是两个文件。 如果想继续训练,可以再增加训练总人数,比如调到十二程序只会从第九轮开始进行增量训练, gpt 模型同样也可以进行分布增量训练,先设置十轮,把这里的保存频率改为二 gbt 模型,训练的速度要快很多,所以多训练几轮也不费时。训练完成在这个目录里可以看到,保存了五个模型,再把总人数增加到五十,保存频率改回五。现在从第十一轮开始继续训练,四十轮 训练完成,这样又产生了八个模型。点一下这里的刷新, 可以看到, gpt 模型总共有十三个, switch 模型有三个,我们在推理时,一般 switch 模型就挑最后一个。 gpt 模型的挑选有一些规律,先挑第十五轮的尝试, 如果合成的朗读准确,但语气不够,可以再往高轮次挑选。如果出现复读、漏读等声音泄露的情况,再往低轮次挑选,可以换成四轮、六轮的进行尝试, 一般对于一百字以内的短文本没有特别强的语气要求,使用第十五轮的效果就比较好。 如果想把训练好的模型分享给别人使用,只需要复制这两个文件夹里对应的模型文件,然后再带上几段提示音频就可以了。



一点都不好玩, 我九块九买的变声器,好听吗?兄弟们,平时一不是说白了你有啥实力啊? 不是说白了你有啥实力啊?兄弟们,平时一定要多吃辣条,好吧?