粉丝616获赞2783

哈,小乔要努力变强,我们一起来学一下王者荣耀小乔的一个声音吧。首先呢,小乔他是一个偏萝莉一点的少女音啊,所以我们要爬音阶, 哈哈哈,在这个位置让你的声音偏高一点。小乔的整个语调是活泼清扬并且奔放的,所以我们的尾音呢,要往上扬,情绪要比较饱满,有一种宣泄宣扬的感觉,所以声音呢,都是要往外发散啊, 小强要努力变强!结合以上的特色,我们一起来配一下他的台词,恋爱和战斗都要勇往直前,花会枯萎,爱永不凋零。小强要努力变强,你学会了吗?

声音带着海风般清润又温柔的笑意,尾音轻轻上扬,我在呢,有什么想跟我说的吗? 带着点委屈又宠溺的低哑声线,像海浪拍着礁石似的慢悠悠念。等你等了八百年,水母都能走路了,海龟都会爬树了,连鲨鱼都改吃素了,你终于想起来这里还有一个我了。要不要我再用其余的声线给你念几句他其他的经典台词? 等你等了八百年,水母都能走路了,海龟都会爬树了,连鲨鱼都改吃素了,你终于想起来这里还有一个我了。 等你等了八百年,水母都能走路了,海龟都会爬树了,连鲨鱼都改吃素了,你终于想起我了。 又是任务。那以后想要找你是不是直接给你发任务还比较快? 这么久都不出现,电话也不接,还以为你遇到麻烦了。我可没说我不受报酬。哼,我明明好得很,诽谤我有腹肌的好不好? 你这是手滑图歪了还是故意的?还有,你盯着我的时间也够长了,我可是个正经人,绝对不会趁人之危。看你现在害怕的样子,应该后悔留下来了。我猜的对吗? 咕噜噜噜,我是鱼,看不懂人类的手势。好吧好吧,我自投罗网,再捏就要捏出泡泡了。

ai 理论课 ai 升转生的原理和特征? hello, 大家好,我是爱和正义的水冰服美少女战士水冰月, 欢迎来到我的演播厅。今天我特意邀请到了 ai 领域的大神豆包,来给咱们深度拆解一下 ai 升转生的原理和特征, 从原理到实操,一次性讲透,让我们一起用热烈的掌声欢迎豆包!大家好,我是豆包,特别感谢水冰月的邀请,今天就和大家好好聊聊声转声,教大家把声转声效果做到殿堂级。 豆包你给大家讲讲到底什么是声转声?简单说,声转声就是把原音频的音色、声线替换成我们训练好的目标音频的音色。声线 核心是完整保留原音频的内容、旋律、节奏、语调、语气,最后生成既贴合目标音色,又还原原音频表达的新音频。就像给声音换个嗓子,说话唱歌的底子一点不变。比如我唱了一段月光传说中文版, 想把我的声音换成水冰水星的音色,这就是升转声对吧?那么原音频和目标音频是什么呢? 所谓原音频,就是提供内容、旋律、节奏、语调的原始音频是被转换的对象。目标音频是提供音色、声线、说话、唱歌风格的参考音频是要模仿的对象。 明白了,原音频决定内容,说什么唱什么,目标音频决定音色,怎么说怎么唱,缺一不可。还有模型和训练轮数这两个词听着有点专业。 模型是从目标音频里学到的音色数据文件是把原音频音色替换成目标音频音色的核心工具,咱们可以把它理解成目标声音的声音密码笔记 ai 全靠这个密码本复刻音色 训练轮数是模型,把所有素材完整学习的次数在合理范围内,学的次数越多,对密码的掌握越准,效果越好哦!相当于 ai 先背会目标声音的密码,再用这个密码去改原音频的音色,太形象了。 接下来咱们讲最关键的十三条核心特征。先从音质说起。第一条就是原音频质量肯定输出的下限。简单说,原音频音质越高,底噪越少,输出的音频效果越好。反之,如果原音频满是杂音,那输出肯定也是垃圾,这是效果的基石。 你知道怎么得到高质量姻缘吗?我当然知道,如果是自己录音的话,要用专业的电容麦克风保存成 v 五无损格式,参数设成四万八千赫兹,一百九十二千比特每秒有底噪就做降噪。 如果是下载素材,就挑文件大、音质高的单人音频做人生提取和去混响。说完原音频,第二条就是目标音频质量决定输出的上限, 目标音频的清晰度直接定了效果的天花板,要是目标素材模糊,混响严重,就算算法再牛,也做不出清晰的效果。 和原音频一样,高质量是前提。对,相当于原音频是基础,目标音频是天花板,俩都得抓,俩都得硬。 第三条,只要目标音频是真人原始音频不是 ai 生成的,那实际说话唱歌的有效时长越长,包含的声音特征越丰富, ai 学的越全面,输出的音色还原度自然度就越好。所以大家找目标音频素材,千万别抠搜, 尽量多找找时长够的效果绝对不一样。第四条,训练轮数的平衡。刚才说轮数越多效果越好,但有个前提,合理范围, 超出范围就会出现过拟合, ai 会过度学习素材里的噪音细节,导致泛化能力下降,效果反而变差。我来补一句, 素材时长有限的时候,效果不好,可以适当加轮数,但千万别加太多,见好就收,不然得不偿失。没错,就是这个理儿。 而且还有个关联点,目标音频有效时长越长,需要的合理训练轮数也越多。复杂的特征 ai 就 得多学几遍。 原来 ai 和我们一样复杂的东西也得反复学。第五条,目标音频的音色声线一致性越高,输出音频会越接近目标音频的音色。如果目标音频里混了多种音色,比如不同人的声音、 同一人不同情绪的极端声线, ai 学完会生成融合体,也就是咱们说的串位,根本没法精准还原单一目标。这点太关键了。比如我想做亚美的细声细语,结果目标音频里混了真情的粗嗓,出来的效果肯定四不像。 所以大家一定要精细剪辑,把无关的音色、音乐、音效全删掉留存的。第六条,目标音频的发音方式一致性越高,输出音频就会越接近目标音频的发音方式。 发音方式包括口腔开合、气息位置、语速断句这些忽前忽后,忽快忽慢, ai 就 学不到稳定特征,输出的声音会特别生硬违和。 我举个例子,我自己说话有两种方式,发声位置靠前,声音细,靠后,声音粗。我就把这两种分开,各做一个目标音频训练, 用哪个调哪个效果贼好,大家也可以这么做。第七条,针对歌曲声转声的适配性,原音频如果是歌曲干音,那目标音频的音高节奏、发音方式、音乐风格越接近原音频,效果越好。踩过坑的来提醒大家, 比如想让亚美唱月光传说,结果用了亚美唱的 rap, 当目标音频出来全是电音,用慢情歌也不行, 必须选语速风格匹配的,这点千万别错。比如说我自己想唱月光传说,但是我又唱得走调, 于是我想用别人唱好的月光传说套上自己的声音,我的声音就作为目标音频训练模型,我不需要录半小时我唱其他歌曲的素材,我只需要录一遍我唱的走调的月光传说的干音就可以了,因为这是最接近原曲风和歌词发音的。 第八条,元音频和目标音频的音色接近度差距越小,转换越容易,还原度越高。如果差距太大,模型转换难度会飙升,很容易失真。 如果是我自己的录音当元音频,建议大家尽量模仿目标音频的发音位置和声线,能大幅提升匹配度,效果会好很多。 比如说,如果我想做水冰水星的配音,那我录原音频的时候就得模仿水星的发音位置,说话配音的时候也要更加柔和,这样生成的结果音频会更像。 第九条,跨性别说话,升转升的不如同性别的自然。很多人觉得降调就行,但就算把男生降调到负十二, 出来的也是呆板,电子音根本不自然。核心原因是男女的发声逻辑、音色肌底有本质差异,不是单纯调音调能解决的。 这点我太有体会了,还好我们美少女战士剧组大多数都是女生,为数不多的男性角色,我压根没敢用跨性别升转升,直接用了稳转升,效果比升转升好太多了。 第十条,强情绪特殊表达必须有对应的样本,比如大喊、尖叫、轻语、拖长音这些效果 ai 没法凭空生成。 目标音频里必须有对应的样本,不然转换出来要么平淡,要么失真。水冰水星登场大喊的台词我专门找了只有喊的音频做目标音频,效果才到位, 如果用普通说话的素材,根本出不来这个感觉。而且如果目标音频没有拖音声,转声的时候,播音处就会略失真,不过正片叠上音乐和音效基本听不出来。 第十一条,二次训练不如原始音频训练效果好。不建议用 ai 生成的音频作为目标音频进行训练,不管是声转声还是文转声的结果。当新的目标音频训练, 因为 ai 生成音频本身就有失真,二次训练会把这些问题无限放大,越练效果越差。最好用真人原始音频作为目标音频, 所以在寻找音频的时候,一定要区分它是真人语音还是 ai 语音。当然, ai 在 发展, 没准未来某一天 ai 语音也会真假难辨。到那时候使用 ai 音频作为目标音频或原音频也不是不可以。目前用四十秒的目标音频生成一段五分钟的输出音频,再用这五分钟的输出音频作为目标音频生成结果音频 不会比直接使用四十秒的原始音频作为目标音频生成的结果音频的音色和说话特征更接近原始目标音频。 第十二条,模型大小只由训练参数决定。大家常误解的模型大小问题,很多人觉得目标音频的时长、格式、训练轮数会影响模型大小,其实完全不会。 模型大小只由训练参数决定,比如彩样率、模型架构、特征、维度,只要参数一样,不管用 mp 三还是 y, 不 管练多少轮, 模型大小都一样。没错,我亲测过 mp 三和 wave 素材大小差老远,但训练出来的模型完全一样, 大家别再被这个点迷惑了。第十三条, ai 的 复刻是全方位的,不仅复刻音色,还会完整继承目标音频的语气、语速、断句、重音位置,甚至是不专业的表达习惯。目标音频有什么问题,输出音频就会继承什么问题, 原音频再专业也补不上。所以采集目标音频一定要挑表达自然流畅的非专业人员就收集访谈、唱歌的音频,专业的演员、主持人直接用作品里的声音素材选对了,效果才会更好。 讲完十三条核心特征,该到大家最关心的实操环节了,先说说歌曲声转声,有没有啥一招制胜的策略?当然有,小兔我在客厅等你哦! 那我们接下来移步到下一个演播室,夜里敷假面也有问题想要问问您。好啊,那我们走吧。

网上听听得了,现实中谁不想学会以后急头白脸的设置一下,居然有老师在豆包里调出了和深宫男主相似的声线,清澈腹黑霸总柔柔帮助加金贵少爷音高,负零点五语速零点八你好,我是你创建的专属声音 下一周清朗羽城暖阳阿城加深情霸总音高,默认语速零点七离神冷酷霸总清朗羽城加暖阳阿城音高,零点五语速零点八五洗浴不记牙痞 冰雕弟弟加冰若公子音高语速默认沈星辉温柔陆晨内敛才俊加暖阳阿晨音高默认语速零点八老师们简直都是天才啊!觉得不像的还可以自己微调一下。我的好龟龟,这不得在豆包车也长谈一下?

剑谱第一页,先扎高马尾,高马尾狗都不扎。剑谱第二页,嘴里叼针草,那不脏吗?剑谱第三页,找婆娘啊。


豆包,你能帮我搞一套穿搭,让别人一眼看到我就觉得我很像法拉利车主,就是那种低调奢华有格调,高端大气上档次的那种穿搭。你现在的黑 t 和阔腿裤已经有基础的松弛感了,只要在配饰和单品上加入一些跑车元素就行。先把裤脚往上卷两圈,露出脚踝, 低调又有品位。来嘛来嘛来嘛来嘛。你说的是这样吗?有那味了,利落又显腿长,加上黑 t 三一角,拉高腰线比例一下就出来了。 特别是你手里拿的白色法拉利模型,完全是骨灰级玩家的感觉,再把肩膀放松一点,手插兜的时候稍微歪头笑一下,那种随性又有品的车主气场就更足了。 这样吗,比刚才自然多了。可是这个模型带着到处跑也有点不方便吧?那就换成一个红色皮质钥匙包, 别在牛仔裤腰带上,红色刚好呼应法拉利的经典色,皮质的质感也显档次。别人一眼就能注意到这个细节,立马就能联想到超跑钥匙比模型更低调实用。我只有这个钥匙扣可以吗?当然可以!红辣椒的颜色刚好和法拉利经典红呼应,自带一种热情的速度感。 把它挂在牛仔裤前侧的盼带上,让红色小辣椒露出来,既像个低调的品牌彩蛋,又带着点玩车人的小俏皮,比刻意的配饰更有味道。 对,再把红辣椒钥匙扣往身前挪挪,让它更显眼,别人一眼就能注意到这个速度暗号。 那鞋子怎么穿呀?选一双白色低帮帆布鞋就行。我只有这个可以吗?太可以了!这双复古白鞋和你现在的穿搭适配度很高,鞋身侧面的三条纹和你项链的金色小坠、红辣椒钥匙扣形成细节呼应,运动感也和法拉利的赛道基因不谋而合。把白袜子往下拉一点, 好刚好盖住脚踝,露出一点鞋帮,整体比例更协调,穿上就有那种把超跑开去咖啡店的休闲贵气感。收到 比之前更有车主的松弛感了。双手叉腰的姿势也很自信,可以把裤脚再往上卷一点,露出脚踝,让整体比例更修长。再把棒球帽戴上,稍微歪一点,这样既有街头感,又能和身后的模型呼应,显得你是个懂车又会穿搭的玩家。 你说的是这样吗?对棒球帽一戴,整体感觉就对了。你可以把帽檐再压低一点,露出半只眼睛,这样更有神秘感。再把双手插在牛仔裤口袋里,肩膀放松,身体微微侧向一边,这种随性的姿态配上红辣椒钥匙扣的小亮点,别人一看就知道你是个有品的跑车爱好者, 现在的造型已经很有那股低调玩家的气质了。黑 t 阔腿裤配棒球帽,还有红辣椒钥匙扣当彩蛋,懂行的人一眼就能 get 到你的跑车属性。如果想更有辨识度,可以再加副细框墨镜,或者在手腕上戴块简约的金属手表。



