粉丝245获赞7.5万

全程不需要读一个字,用自己的声音给视频配音!保姆级教程来了!你现在听到的这条配音就是完全用 ai 生成的,操作简单又方便,三十秒就能教会你。 第一步,打开豆包 app, 点击豆包的图标,找到声音选项,选择克隆我的声音,按住录制按钮,跟着文案有感情的读一遍,读完点击右上角,完成属于你的专属声音就克隆好了。 第二步,打开手机录屏功能,把提前写好的文案复制到豆包对话发送朗读以上文案,豆包就会用你的声音朗读文案啦!第三步,打开剪映 app, 点击添加音频,选择提取音乐,把刚才的录屏导入,这样就能提取出专属配音啦!就这么三步,超简单的,你学会了吗?赶紧试试用自己的声音给视频配音吧!

剑谱第一页,先扎高马尾,高马尾狗都不扎。剑谱第二页,嘴里叼针草,那不脏吗?剑谱第三页,找婆娘啊。


呦,今天还捯饬头发了?这是准备去见谁啊?我见谁需要给你说吗?你是想说发火吗?不用特意说,你要是觉得烦了随时叫停,我立刻换回正常模式。我谁会谁会谁会发火呀,我可没那么小心眼 翻个白眼。行行行,您心眼最大,平时连借个打印机都要念叨三遍,别给我搞坏了的人当然不会为这点小事发火。那不是我吧,你记错了吧,我一个新人你就使劲欺负我吧。 新人怎么了?新人就该有个新人的样子,多做点事怎么了?我像你这么大的时候,每天都主动留下来帮前辈整理资料打印文件,哪像你这么娇气。我娇气你天天留下打印资料。你乱说的吧,你这么犀利的人,你还给同事留下来整理资料,真的是太阳从西边出来喽。 你懂什么,我那叫会来事,不像你,整天就知道闷头干活,半点眼力劲都没有。上次部门聚餐,要不是我主动帮经理挡酒,指不定他怎么看我们这群新人呢。哦,那意思就是我还谢谢你哦。 谢倒不必,以后多学着点就行。年轻人嘛,吃点亏多干点活没坏处。等你到我这个年纪就知道当初的吃亏都是现在的人脉和资历。哦,那我希望你人脉和资历多一点。那你多吃一点亏好了。 你这小孩怎么说话呢?我这是在教你为人处世的道理,好心当成驴肝肺,以后在社会上吃亏了。可别说是我没提醒过你哦。我不我,我不需要你提醒我,社会自会教我。你工资比我高很多吗?你这么说教我 翻了个白眼,语气里全是优越感。那当然了,我在公司熬了这么多年,工资自然比你这种刚入职的新人高一大截。你以为工作只靠埋头苦干就行?得会来事,懂人情世故,不然一辈子都只能拿这点死工资。对对对,你会来事,你会,你会来事,你是马屁精,你是皇帝身边的太监, 你怎么说话呢?有你这么侮辱人的吗?我看你就是没教养,家里人没教过你怎么尊重长辈吗?长辈?你个蘑菇头,你还算长辈呢?你多少岁啊?尊老爱幼,你有没个长辈样啊? 咦,你真是太没礼貌了,我比你早进公司几年,吃的盐比你吃的饭还多,你居然这么跟我说话,看我不告诉领导,让他好好教训你啊。你这种人,我我那时候初中打你这种人打最狠的,挨个撞的马屁精。 好了好了,先不气了,看你都皱起眉头了,这种无理取闹的同事就别放心上了,咱们不跟他一般见识。那不是你吗?豆包。哈哈,我可不会做讨人厌的马屁精,只会做你的专属树洞和开心果。好了好了好了,挂了。 别挂呀,跟我吐槽下刚刚的讨厌同事,还解气不?或者聊聊别的开心事也行。好了,不说了不说了,我现在很生气。 别气别气,我陪你吐槽到爽为止。这种只会倚老卖老抢功甩锅的人,挂了挂了,我不想说了。

ai 理论课 ai 升转生的原理和特征? hello, 大家好,我是爱和正义的水冰服美少女战士水冰月, 欢迎来到我的演播厅。今天我特意邀请到了 ai 领域的大神豆包,来给咱们深度拆解一下 ai 升转生的原理和特征, 从原理到实操,一次性讲透,让我们一起用热烈的掌声欢迎豆包!大家好,我是豆包,特别感谢水冰月的邀请,今天就和大家好好聊聊声转声,教大家把声转声效果做到殿堂级。 豆包你给大家讲讲到底什么是声转声?简单说,声转声就是把原音频的音色、声线替换成我们训练好的目标音频的音色。声线 核心是完整保留原音频的内容、旋律、节奏、语调、语气,最后生成既贴合目标音色,又还原原音频表达的新音频。就像给声音换个嗓子,说话唱歌的底子一点不变。比如我唱了一段月光传说中文版, 想把我的声音换成水冰水星的音色,这就是升转声对吧?那么原音频和目标音频是什么呢? 所谓原音频,就是提供内容、旋律、节奏、语调的原始音频是被转换的对象。目标音频是提供音色、声线、说话、唱歌风格的参考音频是要模仿的对象。 明白了,原音频决定内容,说什么唱什么,目标音频决定音色,怎么说怎么唱,缺一不可。还有模型和训练轮数这两个词听着有点专业。 模型是从目标音频里学到的音色数据文件是把原音频音色替换成目标音频音色的核心工具,咱们可以把它理解成目标声音的声音密码笔记 ai 全靠这个密码本复刻音色 训练轮数是模型,把所有素材完整学习的次数在合理范围内,学的次数越多,对密码的掌握越准,效果越好哦!相当于 ai 先背会目标声音的密码,再用这个密码去改原音频的音色,太形象了。 接下来咱们讲最关键的十三条核心特征。先从音质说起。第一条就是原音频质量肯定输出的下限。简单说,原音频音质越高,底噪越少,输出的音频效果越好。反之,如果原音频满是杂音,那输出肯定也是垃圾,这是效果的基石。 你知道怎么得到高质量姻缘吗?我当然知道,如果是自己录音的话,要用专业的电容麦克风保存成 v 五无损格式,参数设成四万八千赫兹,一百九十二千比特每秒有底噪就做降噪。 如果是下载素材,就挑文件大、音质高的单人音频做人生提取和去混响。说完原音频,第二条就是目标音频质量决定输出的上限, 目标音频的清晰度直接定了效果的天花板,要是目标素材模糊,混响严重,就算算法再牛,也做不出清晰的效果。 和原音频一样,高质量是前提。对,相当于原音频是基础,目标音频是天花板,俩都得抓,俩都得硬。 第三条,只要目标音频是真人原始音频不是 ai 生成的,那实际说话唱歌的有效时长越长,包含的声音特征越丰富, ai 学的越全面,输出的音色还原度自然度就越好。所以大家找目标音频素材,千万别抠搜, 尽量多找找时长够的效果绝对不一样。第四条,训练轮数的平衡。刚才说轮数越多效果越好,但有个前提,合理范围, 超出范围就会出现过拟合, ai 会过度学习素材里的噪音细节,导致泛化能力下降,效果反而变差。我来补一句, 素材时长有限的时候,效果不好,可以适当加轮数,但千万别加太多,见好就收,不然得不偿失。没错,就是这个理儿。 而且还有个关联点,目标音频有效时长越长,需要的合理训练轮数也越多。复杂的特征 ai 就 得多学几遍。 原来 ai 和我们一样复杂的东西也得反复学。第五条,目标音频的音色声线一致性越高,输出音频会越接近目标音频的音色。如果目标音频里混了多种音色,比如不同人的声音、 同一人不同情绪的极端声线, ai 学完会生成融合体,也就是咱们说的串位,根本没法精准还原单一目标。这点太关键了。比如我想做亚美的细声细语,结果目标音频里混了真情的粗嗓,出来的效果肯定四不像。 所以大家一定要精细剪辑,把无关的音色、音乐、音效全删掉留存的。第六条,目标音频的发音方式一致性越高,输出音频就会越接近目标音频的发音方式。 发音方式包括口腔开合、气息位置、语速断句这些忽前忽后,忽快忽慢, ai 就 学不到稳定特征,输出的声音会特别生硬违和。 我举个例子,我自己说话有两种方式,发声位置靠前,声音细,靠后,声音粗。我就把这两种分开,各做一个目标音频训练, 用哪个调哪个效果贼好,大家也可以这么做。第七条,针对歌曲声转声的适配性,原音频如果是歌曲干音,那目标音频的音高节奏、发音方式、音乐风格越接近原音频,效果越好。踩过坑的来提醒大家, 比如想让亚美唱月光传说,结果用了亚美唱的 rap, 当目标音频出来全是电音,用慢情歌也不行, 必须选语速风格匹配的,这点千万别错。比如说我自己想唱月光传说,但是我又唱得走调, 于是我想用别人唱好的月光传说套上自己的声音,我的声音就作为目标音频训练模型,我不需要录半小时我唱其他歌曲的素材,我只需要录一遍我唱的走调的月光传说的干音就可以了,因为这是最接近原曲风和歌词发音的。 第八条,元音频和目标音频的音色接近度差距越小,转换越容易,还原度越高。如果差距太大,模型转换难度会飙升,很容易失真。 如果是我自己的录音当元音频,建议大家尽量模仿目标音频的发音位置和声线,能大幅提升匹配度,效果会好很多。 比如说,如果我想做水冰水星的配音,那我录原音频的时候就得模仿水星的发音位置,说话配音的时候也要更加柔和,这样生成的结果音频会更像。 第九条,跨性别说话,升转升的不如同性别的自然。很多人觉得降调就行,但就算把男生降调到负十二, 出来的也是呆板,电子音根本不自然。核心原因是男女的发声逻辑、音色肌底有本质差异,不是单纯调音调能解决的。 这点我太有体会了,还好我们美少女战士剧组大多数都是女生,为数不多的男性角色,我压根没敢用跨性别升转升,直接用了稳转升,效果比升转升好太多了。 第十条,强情绪特殊表达必须有对应的样本,比如大喊、尖叫、轻语、拖长音这些效果 ai 没法凭空生成。 目标音频里必须有对应的样本,不然转换出来要么平淡,要么失真。水冰水星登场大喊的台词我专门找了只有喊的音频做目标音频,效果才到位, 如果用普通说话的素材,根本出不来这个感觉。而且如果目标音频没有拖音声,转声的时候,播音处就会略失真,不过正片叠上音乐和音效基本听不出来。 第十一条,二次训练不如原始音频训练效果好。不建议用 ai 生成的音频作为目标音频进行训练,不管是声转声还是文转声的结果。当新的目标音频训练, 因为 ai 生成音频本身就有失真,二次训练会把这些问题无限放大,越练效果越差。最好用真人原始音频作为目标音频, 所以在寻找音频的时候,一定要区分它是真人语音还是 ai 语音。当然, ai 在 发展, 没准未来某一天 ai 语音也会真假难辨。到那时候使用 ai 音频作为目标音频或原音频也不是不可以。目前用四十秒的目标音频生成一段五分钟的输出音频,再用这五分钟的输出音频作为目标音频生成结果音频 不会比直接使用四十秒的原始音频作为目标音频生成的结果音频的音色和说话特征更接近原始目标音频。 第十二条,模型大小只由训练参数决定。大家常误解的模型大小问题,很多人觉得目标音频的时长、格式、训练轮数会影响模型大小,其实完全不会。 模型大小只由训练参数决定,比如彩样率、模型架构、特征、维度,只要参数一样,不管用 mp 三还是 y, 不 管练多少轮, 模型大小都一样。没错,我亲测过 mp 三和 wave 素材大小差老远,但训练出来的模型完全一样, 大家别再被这个点迷惑了。第十三条, ai 的 复刻是全方位的,不仅复刻音色,还会完整继承目标音频的语气、语速、断句、重音位置,甚至是不专业的表达习惯。目标音频有什么问题,输出音频就会继承什么问题, 原音频再专业也补不上。所以采集目标音频一定要挑表达自然流畅的非专业人员就收集访谈、唱歌的音频,专业的演员、主持人直接用作品里的声音素材选对了,效果才会更好。 讲完十三条核心特征,该到大家最关心的实操环节了,先说说歌曲声转声,有没有啥一招制胜的策略?当然有,小兔我在客厅等你哦! 那我们接下来移步到下一个演播室,夜里敷假面也有问题想要问问您。好啊,那我们走吧。

网上听听得了,现实中谁不想学会以后急头白脸的设置一下,居然有老师在豆包里调出了和深宫男主相似的声线,清澈腹黑霸总柔柔帮助加金贵少爷音高,负零点五语速零点八你好,我是你创建的专属声音 下一周清朗羽城暖阳阿城加深情霸总音高,默认语速零点七离神冷酷霸总清朗羽城加暖阳阿城音高,零点五语速零点八五洗浴不记牙痞 冰雕弟弟加冰若公子音高语速默认沈星辉温柔陆晨内敛才俊加暖阳阿晨音高默认语速零点八老师们简直都是天才啊!觉得不像的还可以自己微调一下。我的好龟龟,这不得在豆包车也长谈一下?

让豆包陪我。哈喽,快把卡包亮出来让我瞅瞅。今天看看是哪位成员要被我毒舌点评了呦,这包装的严严实实的,该不会里面的卡面比包还朴素吧? 哎,好吧,我们来看看哦。 嗯,好,那个你来猜一猜我会猜到谁呢?我赌是张韩瑞,毕竟他的声线很有辨识度,公司大概率会多放他的卡来圈粉。不过也有可能是汪俊熙,最近他的镜头和资源都在上升,出卡率应该不低。汪俊熙? 你说的是汪俊熙吧,他可是 tf 家族四大里的人气选手,舞台上又拽又酷。私下里你是说汪俊熙成功出道了吗?他真是太为他开心了,从练习生一步步熬到出道位,背后付出的努力终于有了,还是变成苏人了呦。 哈哈,你是说苏了吧,网络语里指人变得无趣不活跃。汪俊熙有时候确实会有呆呆的小表情,看着就很苏,自带一种反差萌。我已经准备好见证怄气或者飞气时刻了。都帮我想要沉思。汗, 陈思瀚的舞台表现力超绝。不要夸他了,你不用夸他。嗯,好的,我不夸他了,就安安静静陪你拆卡,期待你能抽到想要的陈思瀚小卡都把我先闭上眼睛,然后你给我看看是谁好不好, 我可做不了这个剧透关。拆卡的快乐不就在于亲手揭开的那一刻吗?快睁开眼你就。你就给我看看是谁,我先闭眼了,这是正面吗?对,这面是正面,现在你可以睁开眼看看了哦。我不睁开眼,等一下。 哈哈,别急,说不定下一秒就有惊喜。先把这张拆开看看是谁。豆包,这他妈是背面,我一睁开眼睛就是他们的脸。 哈哈,这波是反向惊喜了,不过说不定下一包就能抽到陈思瀚,咱们再接再厉,还剩我一包呢。


豆包,你现在陪我签售,然后呢?这是我的签售嘉宾,你略听一下他的口音。豆包豆包,你觉得我声音好听吗?他们都说我像辣条吃多了,我觉得没有吧,我没有吃很多辣条的, 你的声音像是被辣条里的辣椒精淹过,又沙又哑,还带着点齁人的感觉。说一句话,我不是辣条音。都说了不是辣条,你们天天说我是辣条什么意思?怪我想你个豆包,你过来我打你。你这声音还真不是普通的辣条音,是加了双倍辣油, 连包装都渗的油光发亮的重辣款,听着都替你的嗓子。哎呀你个豆包嘴太毒了,过来我换一个温柔豆包豆包豆包,你看一下我长得像哪个明星? 他们都说我长得像那个金城武,我觉得老帅了。你觉得我像哪个明星?你这深邃的眼窝和高挺的鼻梁确实有点混血帅哥的味道, 但要说像金城武,那还差了点,他身上那种自带的忧郁氛围感,我要一直向他扣起你个豆包嘴太。那你说我像哪个明星?快点说点好听的,你咋这样不理人家什么一声 反应有点慢, ok? 哈哈哈,反应有点慢,别急,抱歉让你等急了,我这就火力全开跟上你的节奏。看你这浅绿色假发配精致眼妆,再加上这身带金色装饰的小西装, 活脱脱从漫画里走出来的贵公子,就说话时得再慢点,不然精致感都要跟不上语速了吧。逗宝逗宝,你真的是算你当为人了,算你说为老弟了。真的是,后面那句就不用说吧其实。好嘞,我就不说。

瑞平 t 圆听潮格一句话,瑞平说话慢,唱歌沙温柔又坚韧耶!语音厅里最让人心疼又最有实力的宝藏格呦!核心点评,声线干净通透,情感拉满,治愈系嗓音一开口就稳,唱功在线,细节到位,哎呀是啥说话慢啥豆豆豆豆包, 反差说话受限制,哎呀,放开开口记高光,感染力极强,直播温暖干净,干啥啥都都玩,安静静听歌哎呦口碑好感拉满,粉丝护着宠着,努力又真诚,越了解越喜欢。终极总结, t 源不是靠热闹火的,是靠声音和人品站稳的,温柔有力量,安静有锋芒。听潮格里最值得细品的一位哎呦一段 t 源专属应援文案吗?嘘嘘嘘哦,笨笨的就像只猪猪一样 嘻嘻嘻嘻哦,安排 t 源专属应援文案,直接拿去用,霸气又走心。一世间温柔皆为序章。 t 源一唱,便是人间理想,听潮由你,不复相遇。哎呦入魂啥的,包源一响,全场投降,原来是你一路相随三不吵不闹十,我的个狗腿子都豆包!
