solo 这个 v 五点五的自定义模型出来以后,基本上做歌就不需要任何的技术了,就是一个比拼审美的时代了。我刚刚已经自己做了一个模型了,就很简单点开这上面 v 五点五,然后它上面写着 create custom model, 点它一下,然后上面可以上传二十四首歌,那最少你要上传六首歌就可以做了。然后现在传上去了,我传的是一些有一点复古,有点千玺年代的 rmb 的 感觉,我起了个名字叫做 vintage rmb, 下面 create custom model 还会消耗我们一百个积分,然后他会在后台操作一段时间,大概我刚刚弄了一下,是十分钟左右吧,就生成完毕了。我们就可以点开这个 v 五点五,这边就有一个选项,看到我们就是 my model it's vintage rnb。 然后我们先来测试一下,我用同一篇提示词,同一篇歌词,高级选项设置也都一样,我用我自己创建这个模型,和它 v 五点五分别生成两首歌曲,我们听听看,对比一下就知道它这个功能怎么样。现在随便拉了一篇 a 写的歌词,没有任何改动,我们直接生成一本看看。 怎么说呢,我觉得这个 custom 它肯定也是接的这个 v 五点五的 a p m 嘛,所以它们的实力原本差不多,但就是因为这个五点五学了它的东西,所以可以看到后面这一首歌,它就会有一 些莫名其妙的变化,但不是我们想要的。有了这个 custom, 我 们就可以把这个旋律的走向规定在某一个范围之内,然后大家想要生成出来的歌曲,就会 自动的向我们的参考歌曲去靠,相当于你们可能用一首歌作为 instagram 或者踩样,或者你用两首歌 mashup 坐在一起。但现在呢,你可以做到上传二十四首歌曲,然后为某一个曲风单独训练一个模型, 那这样产出出来的歌曲可能更加是你想要的,大家可以自己去尝试一下。然后在我目前看来就是这个技术门槛被一步一步的砍平,到最后呢,用 solo 盛传歌曲就是一个比拼品味的问题了。关注我,解锁更多 ai 音乐爆款技巧!
粉丝1.7万获赞9.1万

来听听这世界上最厉害的 ai 音乐发展到什么程度了啊。就在去年九月份的时候,苏诺推出了他的威武大模型,经过这几个月创作者们的奋战,现在呢,苏诺官方出了一个歌单, 是他精选出来的,觉得用威武用的最好的。这二十多首歌,我们今天就挑几首来品鉴一下。这个歌单标题就是 best of 威武。首先我们来听一首这个词,我不能翻来听一下, 这个选乐有点迷, 等会这第一句就直接一个调式转换写出来的旋律,我天呐,哦,这很有水平啊!这个旋律写的,然后讲的这个歌词的话是, ok, 二零二零年的事,明白了吧?大家就这个意思。好,继续听。 it's the mix, we were losing what was left inside it's gone, everyone's gone crazy, we've all。 哎,刚才那一句,有一点点 ai 演唱时候会出现的一点小故障的音, 就这个 nz 有 点问题,就这个音色,其实捏的已经非常非常接近于真人了,是一个气混唱法, 也倒是能听出来一些 ai 味儿。就不管是演唱还是在它的这个背景配乐上,像它的钢琴弹的混响真的加的挺大的。然后它的旋乐是比较硬的, midi 的 感觉,就不是实录那种感觉。换一首歌听听啊,换一首不一样的, everything's fine 啥都 ok, 一 首胖哥。 the discount price is a million, it's been fun oh, this is it's about tomorrow and i scream everything's fine, while i'm burning out the fuse。 哦,这千分。 push it back tell my friends, it's alright just part night whatever life cause the world could cave right under me, but everything's fine and fine ok, 听到这儿,哇,它现在连这种嘶吼的声音都可以生成了,这个真的是一个大进步诶。整体的音质上来讲的话,确实能听出来是 ai 生成的痕迹, 因为很混。就是尤其在副歌的时候啊,你感觉所有的东西都是咣叽砸成一团的,就跟一个面团一样,就被揉在一起了啊,没有办法单独的把吉他拎出来啊,没有办法单独把鼓拎出来啊,没有办法单独把人声拎出来啊,整体就是一个比较混 你中有我我中有你的感觉啊。但是从作曲和编曲上来讲的话,就是一个有点能力的音乐人,完全可以就把这首歌 给它扒出来 midi 鬼,然后放在工程文件宿主里面,直接按它的这个作曲思路直接给它复刻出来。并且现在苏诺也是支持导出 midi 鬼了,就只要是有音乐人把它重做一下,这是非常完整的一个作品了。唯一的难点就是这个人声, 这得是非常非常非常强的唱 punk 专业的歌手才能唱的出来的,一般的歌手这没法唱这个歌根本就好。我们再来听一个歌特女孩, knife fight 拼刀子, crawl out of your hole try to destroy ok, 有 点震惊啊,家人们就这个歌,就一开始前面这两句大耳朵一听特别像 passenger 或者说那个 demi 会写出来的歌,一直到副歌的时候才能听得出来它是 ai, 味儿 会有些明显啊,因为他的副歌时候的和声那个失真调的太大了,然后那个失真和他两个人声轨,他又叠在一起了,很浑浊,但是听前面的时候,尤其这个开头的时候,真是听不太出来这是 ai 的。 再来听一下, 你看,就是各个乐器的风鬼,很明显,然后他们互相不打架。如果不告诉我这是 ai 音乐,我可能会理解成这个艺术家, 他就喜欢用这种把自己的人生放的时阵率比较大的风格。哇,这有点厉害这真有点厉害。然后这歌写的就旋律非常流畅,但是这个词写的就不太行啊,就 写的乱七八糟的。如果是国外的一些音乐人,就是玩抖音的,他们自己把这个曲子扒下来,自己吉他弹唱一下,然后再唱点别的词儿,我觉得是能火的,就这个旋律写的真的不错。 ok, 稍微有点震惊了家人们,我们再听个别的 sure circuit, 好, 这个 air 味儿就非常的浓啊,不是很有代表性,再换一首。 哇,这有点厉害啊。这个 ok, 我 们先暂停一下,就已经到了能发行的程度了,就是 这都不用单扒出来了,我觉得就虽然还是有点浑啊,如果跟下沉市场的音乐的质量比较的话,这个简直暴杀。这个人生已经到了,虽然我知道是他是 ai 音乐,但是我都会自己在脑子里面说服自己,他可能只是一个奥特曼挂的比较大的 男歌手,这太纯净了。再来听一下这个开头 那个 p a s o。 就 稍微有一些 ai 的 断层感出来,真的很厉害,我们来听一下后边有什么改变吗? program for this channel, switch and faces cover secrets, i close my eyes。 哇, 好, ok! 这个从编曲思路上来讲,是一首绝顶棒棒的好歌了已经是,我天呐,就希望这个作者这个 urban urchin 这样念嘛, 我希望这位老哥自己就是能在诉说里边再重新把这个歌导进去,然后再编一下,再输出一个高音质版本的。这歌啊,绝对可以啊,我天呐,就他在第二段主歌的时候,完全改变了前面的一个编曲思路,然后用了 不一样的古典的组合,并且非常有 rnb 的 感觉,然后也有了不一样的启程转合。副歌的人生设计的时候啊,层次非常的丰富,就完全像写了另外一首歌一样,而且又是通过和弦这样顺下来的,我这很棒哎,很少有编曲师 和作曲师能写的过他了。就是这个没副歌词啊,看不到歌词, ok, 很 震惊了。再听这个 数字摇滚吗? i'll be the one who called you。 这首就很常规啊,很一般。 got it don't disrespect my art, it's from a heart you were friendly at the start but now you're all killing me。 和刚才听那一首胖可很像啊,再换一个 哦,这做折版和弦型也行。 很常规啊,一一首一般好的流行摇滚,再听一个 photograph of smoke。 电磁啊,你看 radio have inspired。 风格写得很全面啊 呜, 这个 b 非常有感觉。 i shed a song just to set it down。 人生一出来第一句就露馅了, ok, 再来一个, come on, quickly! 哇,好纯净的人生! rap, it up, come on let's head well think about it later come on hey, let's head it's about time yet。 他 这句写的好哎, 说的很干脆利落。行,这是我收藏的这个歌单里面这几首啊。然后我们做一个简单的 总结,首先就是现在这些 ai 生成的音乐,就算是现在最好的模型来讲的话,也确实是能听出来一些他是 ai 音乐的痕迹的,就是没有到那种完全无痕,我就根本就分辨不出来了啊,可能有几句是能做到,但是放到整首的话还是能听出来一些的。作曲和他的编曲来说,我觉得行业内啊 行活的话就指这种不是很创新,然后就是单纯的好听的旋律,不管是在风格还有在流畅性来讲,我觉得他已经没问题了,甚至可以说能赢得过百分之八十的目前的编曲师, 尤其是令我印象深刻就是第一首播放那个第一句有一个调式转换,写出来的旋律一个大跳,它那个音阶跨度非常大,这可很少很少有作曲家会这么写旋律啊,确实是一个很好的启发。我看到现在行业里面大家就对于这些 ai 音乐的 态度,就是说我们可以利用它一些好的编曲思路,好的作曲思路通过我们自己在音乐诉求里面,不管是 logic 还是 f l 还是 cubase 这样的宿主里面,把它给复刻出来之后,确实能给我们很大的灵感上的帮助。但是这个 ai 音乐它会有一个问题,就是它没有办法写出来大家目前没有听到的音乐, 这什么意思?就是它现在这些歌你一听你就知道你之前类似的歌已经听过非常非常多了,除了有一些在编排上,有一些精曲在段落安排上会有一些惊喜, 基本上来讲就是都是之前已经出现过很多次的这个编曲的套路,所以就是你让他创作很新的东西是不可能的。然后另外一方面,纯按照他的这个参考做出来的曲子,很可能会导致大部分的歌手根本就唱不了这首歌。这个 ai 歌手又没有声带嘛, 他想怎么唱怎么唱,就跟洛天依一样,就算是在录音的时候啊,你让那歌手把吃奶劲使出来,把这首歌唱下来,那唱现场的时候根本就没 他唱。根据我对于 ai 模型的了解,像这个 solo 它也是基于 transformer 这个底层架构所出的一个衍生的音乐模型,就按这个底层架构的话,它永远不可能做出来目前人类没有写出来的新的音乐。然后另外一个就是它的这个编曲当中各个不同乐器,各个不同音轨,它那个浑浊的问题 很难改善,也是一个底层问题,就什么意思啊?就比如说他单纯的像钢琴、小提琴这样的可能还好一点,如果是一些其他的乐器,咱拿琵琶来举例啊,像这样的乐器,他采集的单纯这个乐器的音频的数量不够多,所以就导致他可能会混入一些 其他乐器的声音,那这个就变成一点噪音,他怎么消除这些不太常见的乐器的噪音?这个问题我觉得也是比较难以攻克的, 谁知道呢?他们会不会有什么新的算法就是能把这个问题解决?所以我觉得对于业内人士来讲的话,他确实能给大家编曲的时候或作曲的时候提供一些灵感啊,但是不不可以完全照抄,只能是提供一些灵感,还是要改挺多东西的。然后对于我们听众来说,我其实稍微有点悲观,因为大家可以现在就去搜抖音热榜歌曲, 你听一圈你就会发现就这些歌可能输出的质量还不如 ai 音乐呢,甚至里边可能百分之八十就已经是 音乐了。那确实,对于不太深度的听听众来说的话,现在已经能符合他的需求了。 他完全可以说啊,我今天好累,你帮我输出一些比较舒缓的音乐,能够平复一下我今天这个心情,他真的可以或者我现在就很燥啊,我要听一些就类似于蠢朋克这样的歌,你给我来一些,他真的能给你整出来,并且风格相似度极高。 好吧,我的感受就是可能对于作曲和编曲来讲,真的得非常努力的提升自己的职业素养了,才能不被 ai 击走。但是对于乐器演奏家或歌手来说的话, 这个应该是目前威胁还不太大,但到下一代模型怎么样的话,这又这现在 ai 进化速度太快了,谁能想到 openclaw 现在能这么火呢,对吧?之前我们还在讨论就可能哪个模型比哪个模型更聪明一点,结果发展到现在的话, 其实各个模型它的下限都已经足够我们普通人重度使用了,就是已经足够聪明了。好吧,现在只能置之不乱的等待看看下一代模型会进行怎样的一个改变。最近有点感冒啊,就鼻音比较重,还没好利索,但是确实是被它这个歌单整的有点吓住了。那本期就这样,我们下期再见,拜拜。

yeah! 清晨六点,踩碎落叶的声响是担当往左甩着暖阳打个响,流浪不是 俗。 yeah! 午后树荫是我们的避风港,兄弟并肩景天美一处,风浪软蹦是伪装,野心刻在鼓上,谁也别想闯入我们的驻场。叫声是安好,尾巴是心, 恒远在公园飘。

震撼来袭!就在昨天, solo 官方更新了 v 五点五版本,重新定义了什么叫专属生产力,把极其复杂的模型微调时间压缩到两到五分钟,这不是魔法,是极致的算法进化。我们要的不是千篇一律的 ai 口齿歌,而是带给你灵魂印记的专属神曲。 这款降本增效的神级应用,让录音棚和大众脸的 ai 嗓音从此成为历史。一键提取人生克隆专属音色,个人品味学习,用工业化的速度实现极致个性化的交付。 受够了抽卡副歌全封,人生毫无辨识度的无底洞吗? v 五点五版本实现了全方位的个人定制,就像开箱即用的随身乐队一样,一键录音,稳定克隆,两分钟时间完成一次音乐版权革新 暗号,直接开启你的专属创作之旅。大家好,今天这节课我们来深度拆解 solo 最新的 b 五点五版本。这次更新的底层逻辑就两个字,定制! 废话不多说,直接上实操!首先看顶部,官方加入了一个王炸级功能,自定义模型,点进 customer model, 这里就是打造你专属曲风的秘密基地。它的底层公式是未给系统至少二十四首你喜欢的,或者是你自己以前生成的同风格音乐, solo 会深度学习你的音乐审美,炼制出一个完全属于你的专属大模型。 除了曲风,人声也能深度定制。以前的 persona 功能现在全面升级为 voices, 你 可以直接录制十秒以上的高质量干声,或者上传现有的音频。勾选授权后,系统就会一比一克隆你的音色、发声位置和演唱习惯。 底层逻辑理顺了,咱们直接进入实战。在生成界面下拉,选择我们刚刚训练好的 custom 自定义模型,输入歌词,直接点击生成,见证奇迹的时刻到了。废话不多说,来我们一起戴上耳机听听这段套用了专属定制模型后的最终效果有多震撼, 听完是不是感觉非常牛?对比普通的通用模型,自定义模型完美继承了你未给他的独特律动和和弦走向,这就是 v 五点五的真正魅力,赶紧去打造你的专属 ai 歌手吧!


兄弟们, ai 音乐圈真正的终极王炸来了!就在昨天, solo v 五点五迎来了史诗级的震撼发布,之前的版本是降维打击,这次 v 五点五版本简直就是宇宙大爆炸,直接把几万块的录音棚压缩到了网页里,送了你一家专属的私人唱片公司。为了让大家光速上手, 关于怎么高质量录制干音,怎么选歌训练大模型以及 v 五点五最新的高阶提示词公式,我都整理成了一份终极懒人保姆包了,直接上干货!揭秘三大逆天功能!第一个核弹级大招,全网呼声最高的专属人声克隆!它基本原理就是录制你的声音样本 或上传录音。这样你就相当于在苏 no 中创建了一个语音模型。一旦创建了语音模型,就可以在生成的任何歌曲中使用它。 因此不是一些随机的苏牛声音唱你的曲目,而是你可以唱任何歌曲。让我们去苏诺网站,点击左侧边栏的 create, 并切换到高级模式,查看名为 lucas 的 新选项 persona 已改为 voice, 不 过别担心,什么都没变。实际上你仍然可以像以前一样使用它们,它们在力五点五版中听起来更好。可以创建自己的声音。 点击 create voice, 然后打开 record, 可以 在其中录制自己的声音。上传样本或从你的 solo 库中选择音频。 用你想要的风格和语言唱歌。如果你有一个好的麦克风,最好尝试在安静的空间录制没有背景噪音,说话的时间越长,录音越能准确你的声音。这里建议至少三十秒或更长时间。我这边选择上传选项, 因为我已经有自己唱歌的录音了。我会选择它并将其上传到这里。如果你的音频有背景音乐,苏诺会自动为你分离人声。一旦语音上传, 你可以听他并修剪任何不需要的部分。只保留干净的声音样本。接下来选中复选框,以确认这是您自己的声音。确定没有用别人或任何歌手的声音,然后点击使用语音。 素牛现在会确认这是你的声音。让你读一个短语,显示在屏幕上。该短语可以用多种语言显示。从这个下拉列表中,我会用英语阅读并单机复选标记。 素牛会将您的声音与上传的样本进行比较,然后就来到这个页面。你可以给你的声音起个名字。为了容易辨认,您还可以删除默认图像并生成 ai 头像或上传您自己的照片,并将其设置为头像。请注意, 语音是通过录音或上传创建的,不能公开。他们在你的速牛个人资料中保持私密。单机保存您的声音已准备好。在模型选择中。在模型中选择最新版本力五点五, 然后选择语音。让我们写一些歌词,并在风格描述中创建一首歌曲。输入你想要的流派或氛围。然后点击个性化魔术魔杖,根据您的喜好增强提示 单机更多选项已调整其他设置。您可以指定语音性别,并增加音频影响滑块。如果你想让声音更像你的默认值调为百分之二十五,可以先保存,然后给你的歌起个标题。点击创作,看看生成效果怎么样。这是语音样本。 there's nothing in the world like the way that it hits so when you're laying back laying back on the drift。 这是苏 no 创造的。 如果您想从现有歌曲中创建新的声音,选择曲目,点击三点菜单,然后去创建语音。 搜 new 将开始处理人声。一旦准备好了,你可以点击并拖动波形。选择最喜欢的人声部分,然后给它起个名字,方便以后容易认出来。你也可以选择公开。 如果你希望其他速牛用户使用你的声音,然后点击保存。生成后就是这样。如果您打开语音部分,您的新语音就可以使用了。 你会看到目前创建的所有声音。如果你有任何遗漏的声音,您可以将它们升级到力舞版本,以获得更好的声音一致性。例如,这是我最喜欢的声音之一, 那我们选择这个声音。保持当前风格,添加一些歌词,选择一种 style, 给它起一个歌曲标题,然后点击创建,这就是我们得到的。 就这样,您可以使用相同的声音创作任何流派的歌曲, 任何风格,即使是不同的语言。如果你觉得克隆声音还不够炸,那第二个大招,自定义专属大模型绝对让你原地起飞。您可以在自己的曲库上训练肃纽,并创建您自己的自定义版本的肃纽。接下来展示它是怎么操作的。 在模型菜单栏中有一个名为创建自定义模型的新选项,点击它就会打开一个窗口,这是上传音乐的地方。为了达到最佳效果,您可以上传超过二十四首歌曲,但需要至少六个人来训练模型。我们点击批量上传。 我的电脑上有九首歌,我想让素妞学习。歌曲上传后,可以给这个模型起个名字,就叫沙漠女武神吧。然后点击创建自定义模型,素妞将开始在后台训练。他如果想检查情况,可点击模型,他目前正在训练。与此同时,我 来解释一下这些数据。我用了的歌曲上传了四首女生演唱,带有中东节奏的重金属音乐,复杂的拍子和现场表演氛围。我们可以听一下训练的歌曲。 现在看起来模型已经生成好了,那我们选择它并测试它。先添加一些歌词,将样式部分留空,看看它会出现什么。 one, two, three hit, it let's go。 这是有趣的部分。即使我切换流派或声音,它仍然倾向于相同风格的音乐。那是因为这个自定义模型只在这个数据上训练,所以无论你为它什么,它都会学。 第三个,即刻即降为打击 ai 音乐品味记忆系统,它就像音乐版的叉 g p t。 自定义指令, 酥妞会捕捉您的创意偏好和风格,你一贯做出的声音选择,还有你喜欢的歌曲种类,不喜欢或点击返回。如果你点击你的头像并进入 my taste, 你 会看到酥妞已经开始建立个人档案了。根据您的使用情况, 例如,他发现我喜欢戏剧性的流行民谣和现场表演强劲的流行摇滚。他也理解我的歌曲创作主题,爱失去任性以及我的制作风格以及首选语言和语音。当然,你可以编辑或随时改进来,更好匹配你的喜好。 把它想象成叉 gpt 中的自定义说明。针对你的音乐口味档案,让酥妞推荐更好的风格建议,并创作更好的歌曲。到目前为止,您最想尝试哪些功能呢?那今天的内容就先到这里了,我们下期再见。


完全 ai 生成的有七十五首,我们主要是研究了酷狗的托普,五百大头真独占十七首,疑似和不确定的占了二十四首。 大部分 ai 歌曲集中在前一百名,这个数据是很可怕的,越往后 ai 歌曲的数量越少,相比之下老歌占据的比例比较大,其中周杰伦一人就占了二十六首,这个是一月二十二号的真实的 数据。在这些 ai 的 歌曲里面,我们看到刚才有人说这个经典的老歌确实比较多,因为大家对老歌熟悉, 这也是为什么抖音里面红的都是老歌。原创很难推,以前有一个综艺叫做中国好歌曲就没了,做了两三期,那中国好声音可以做十几年,为什么?就因为好歌曲是做原创的,原创东西很难推,因为老老百姓对于熟悉的东西还是可以接受的,更容易传播的, 所以说对于老歌消除了陌生感,让 ai 歌曲更容易被大家去接受。第二个就是 ai 的 重编曲,就是苏诺的 cover, 一 首曲子一两分钟就能完成,节省了大量成本。但是苏诺的 cover 对 歌曲又带来了极大的生命力的提升,无论是从我们这个大东北, 还是很多这样的歌,包括什么用陶喆的方式打开,周杰伦的青花瓷之类的都是这个例子,他能够给歌曲特别带来一个反差的编曲,这样的号也特别的多。 最近大家看这个泡沫雨蝶,这都很老的歌,为什么那么火?还有烟花易冷,其实都是用老歌曲,用苏诺去翻,但是苏诺大家看现在编曲水平非常高, 所以这个其实是刚才说了 ai 音乐出现之后第一个被消灭的就是编曲这个岗位,也是这个原因,它能够迅速的赋予老歌全新的生命力,所以这种反差的编曲是比较重要的。 所以我们有一个公式叫什么叫老歌加 solo cover 的 重编曲等于新流量啊。从这个酷狗的我们分析它的上榜的 ai 歌曲可以看到这么样一个趋势。