谷歌刚刚在 germany 上线了最新的 ai 作曲功能,叫 larry 三,你给他一句话,他给你一首完整的歌,带词带唱带封面,三十秒出炉。我总结了三种玩法啊,第一种是文字生成音乐,描述一种风格,一种情绪或者一段回忆,直接给你带歌词的完整歌曲风格,人生速度都可以调。第二种是图片生成音乐, 上传一张照片,这么呢,会分析画面的情绪,自动填词谱曲。比如你家猫窝在阳台上晒太阳的照片,它能给你编一曲慵懒的小曲。第三种是视频声音乐,配合 youtube dream track, 用自媒体人给自己的短视频生成专属的配乐,纯 b g m 或者带词的都可以,而且全都能免费用, free 用户有次数限制, 用户会有更高的额度。谷歌一出手就把 ai 作曲从小众工具变成大众玩具,像苏诺可能会紧张了,有个小遗憾,目前支持八种语言,但是没有中文,但谷歌说后续会扩展,就这么的工具栏里找生成音乐,现在就能用,赶紧去试试吧!
粉丝2022获赞1.8万


哥刚刚在珍妮娜上线了一个全新的音乐模型,叫 larry 三,玩法非常多啊,最简单的方式呢,就是说你只需要用一句话来描述一下你想要的音乐感觉,比如说一首慵懒的午后爵士,很快一首带歌词的完整乐曲就帮你做好了。 更有意思的是,你可以直接丢一张照片给他,这张照片可以是旅行照或者是随手拍的一个街景照,他都能够根据画面的氛围帮你生成一首风 和匹配的乐曲。视频也是一样的,那像我就不用再去花时间找背景音乐了,直接让他根据我的视频内容来生成风格,上面像什么摇滚呐、电子啊、流行啊这些都可以做,中文英文,还都支持,歌词还能自定义。 目前呢,这个功能在 beat 阶段免费就能够体验,大家可以去试一试。我是开心关注我,每天进步一点点。

朋友们,一定要去用这个 gmail 的 会员专区,你像我自己,作为一个谷歌 gmail 的 深度使用用户,我自己是非常喜欢 gmail 中的 vivo 三点一的视频生成功能的,但是呢,你像谷歌 air pro, 它每天只有大概五个视频的资格。 然后你看,像在这个平台上看这个 gmail 会员专区,它这里有非常多的 gmail pro 啊, gmail 后台 auto 节点, 你像我在使用完一个节点之后的视频生生存资格,我换到另一个节点,它仍然可以去使用, 这个是他非常好的一个点。然后我最重要的是什么?最重要的是他的生产率几乎跟官方积木奈没有任何差别。我给你们看一下,我啊,我用积木奈做的这个二次元视频分镜啊, 哎呀,他一个视频大概就八八秒钟, 然后这是下一个镜头,那视频效果非常好,对吧?而且在这里你每天可以白嫖到很多的视频资格,真的非常好用,真的,朋友们。

谷歌今天发布了一个新的音乐的 ai 模型,所以 ai 音乐圈又变天了。 如果你还在折腾各种复杂的音乐大模型,可以停一下。谷歌终于不再沉默,向整个 ai 的 内容赛道发起了一场生态级的重构。这不是一次简单的功能的更新,而是接下来真是整合了其全新研发的 live 三音乐模型。 这是模型最具颠覆性的地方,就是零门槛。你可以在这个语音的对话框直接输入,然后它就能够生成。以前你可能为了去配一段音乐,得去专门的网站,然后得去学习复杂的英语的提示词。 现在在界面里面就跟朋友聊天一样,丢一张图片,让他给你生成一张曲子,或者说支持多人的对话,连人的声音都能够发的非常准确。 音乐的创作不再是专业的动作,而是聊天的副产品。但细心的朋友能够发现,目前他只能够生成三十秒左右的音乐。有人在说,这是技术的瓶颈吗?不是, 这恰恰是商业落地的克制。普通人真的需要生成一首三分钟的单曲吗?其实不是,大家只需要发个朋友圈,做个短视频,这是恰到好处的背景音乐三十秒, 他牺牲了浓藏的整个视频的深度,换来了极低的算力成本和极致体验的石化体验。对于一个创作者来说,这意味着什么?我可以举个例子,自媒体人的团队接入之后,谁能 原来去找配乐卡点要花一个小时,可现在只需要三十秒。不仅仅效率的提升,还能够在底层带来自带的整个水印,连版权的风险都规避了,视频有没有 文案有,建立了,配乐有了 real 三、未来比拼的不再是谁会用工具,而是谁的审美更高级。面对这种生态级的覆盖,你觉得垂类的 ai 音乐软件还有机会吗? 我反正认为还是有机会的。评论区可以聊一下你的观点,关注陶小开,带你拆解 ai 落地的真实逻辑。

今天一觉醒来,发现 gemini 发布了三点一版本,我打算用它来尝试一下创作音乐。之前我已经被送到五点零十分的打击过,现在我想感受一下来自 gemini 的 打击。好,我给他一个 prompt, 你 可以看到这个界面是这样子的,我们选创作音乐有很多不同的风格,可以听一下他的 感觉整体风格还是比较偏向美国市场,我们尝试一下,比如说用 a beat, 最近我有听一首歌,是 b b 的 那个 scott and zodda, 比如我们给他一个 prompt, 说参考 b b 的 scott and zodda, 轻快的 带有中文词曲的流行歌曲,看看它会生成什么样的一个内容。但是你在 loading lyrics 就是 它的一个词,曲名 a few moments later 速度有点慢,比我想象中的要慢一些,听出来,看一下它是什么样的 k o, 就是 听不下去了,这个也太难编了,但是它编曲生成的还是非常优秀的, 可能跟中文词曲有关。我刚才呢,也让它生成了一个 pop 风格的,它生成了一个英文歌曲, 非常的 pop, 感觉随时可以发行。不过我觉得就是在歌词方面可能还没有达到特别好的程度。我们再试一个英文词吧,这次来一个拉丁流行, 经过这一轮测试呢,近阶段的 ai 编曲和词学创作以及人生的这个导唱,我感觉是非常流畅的。你作为音乐人呢,我们可以把它加入到自己的工作流,来帮助自己的工作。比如说可能我们需要一个 demo, 需要导唱, 可能我们自己并不适合这样的风格,那么我们可以向 ai 去求助。在创作方面的话,我觉得人工智能创造的词,无论是 jimmy 还是 solon, 它们的词都会有一点点尴尬的地方, 尤其是生成中文词的时候,所以可能我们我们有救了。我觉得更多应该要把 ai music 当做一个可以使用的工具,不要去过于的恐慌,也不要去过于的利用,因为我们还是需要有自己的创造和表达。在这个时代应该怎么样更好的去做音乐人生存?我觉得所有原创音乐人需要比以往更急迫的去找到自己的 独特的声音表达,比如说你真正喜欢什么风格或者适合什么风格,不是说你要一味的去追求大波控或者要向谁,我们可以在一定程度上去找一些 reference, 但是世界上本来只有一个你,你向自己就可以了。希望所有行业的音乐人能够越来越顺利,不要把这些当做洪水猛兽, 也能够接纳它,也不要过多使用它给大家看到这些东西。在未来有想要加入音乐产业的朋友们也可以再多加考虑考虑。哎,怎么样在这个飞速发展的音乐产业当中有自己的一席之地?

我去,兄弟们, ai 应用发展太快了吧!就在昨天晚上盘中,谷歌宣布了,啊,真命三已经配备了公司最先进的音乐生成模型 vivo 三用户啊,只需要描述一个想法或上传一张照片,真就能在几秒钟内将其转化成一首高质量、朗朗上口的歌曲。 谷歌还说,真命里不仅可以文字转歌曲,还可以通过上传照片或者视频创作出啊一首完美契合的歌曲。就在盘中消息公布后,欧美主流音乐服务平台就出现了冲高回落,抹掉了所有涨幅。看来啊,二六年真的是 ai 应用元年,懂了吗兄弟们?

谷歌宣布, gmail 助手全面集成 deepmindillaria 三音乐生成模型,文字、图片、视频输入,数秒内生成三十秒原创音乐,支持流行、古典、摇滚、古风电子等一百家风格版权免费商用。 自媒体博主、短视频创作者福音。这一功能标志着生成式 ai 从文本、图像延伸至音乐领域,内容创作零门槛,普通人也能成为原创音乐人。二零二六年,内容行业迎来新变化, ai 音乐生成功能简单易用,新手秒上手 打开干乐队助手输入温暖治愈的普通钢琴曲、动感卡点短视频、 bgm、 悲伤抒情流行歌或上传风景照、视频片段,系统自动匹配旋律、编曲乐器,生成高音质音频,支持下载 mp 三调整时长、更换风格 对比传统音乐制作成本从数万元降至零,时间从几天缩短至几秒,音质媲美专业工作室,无版权纠纷,放心商用。抖音、快手 b 站博主实测,用 ai 音乐搭配视频,播放量提升百分之五十,再也不用为 b g m 发愁。 谷歌布局多模态,生态音乐生成是关键一环。此前, jamie 已支持文本、图像、视频代码生成,新增音乐能力后实现全品类内容一键生成,创作者可一站式完成文案配图,视频音乐制作效率拉满。 同时,谷歌开放 api 接口,自媒体工具、剪辑软件、直播平台可接入,赋能全行业,国内厂商同步跟进字节。阿里、腾讯推出 ai 音乐工具,国风粤语方言适配更优,本土化体验超越谷歌 ai 音乐时代。版权与创作领域引发热议,有人担心冲击音乐人就业,有人认为 ai 是 辅助工具,激发创作灵感。业内认为, ai 不 会取代音乐人,而是让专业音乐人更高效,让普通人实现音乐梦想。 未来内容创作不再依赖专业技能,创意成为核心竞争力。对于自媒体、商家、博主赶紧体验珍妮 ai 音乐,免费原创 bgm 用起来,视频质感瞬间升级,流量立马轻松掌握。

大家看这段视频总觉得缺少些什么,我发给 jama, 让他为视频配乐,得到了这样的效果, 是不是瞬间就不一样了?大家好,我是本杰明。做自媒体的朋友都知道,音乐是视频的灵魂,但是想要找到合适又没有版权的 bgm, 要么花上半天时间,要么就随便找一首应付一下刚刚大家听到的那段特别有电影感的 bgm。 这是我用 jamna 刚刚上新的音乐大模型 live 三看着我的视频素材生成的。它最可怕的特点就是多模态,它不仅能听懂你的文字,更能读懂你的图片和视频, 甚至还能自动写词,配上逼真的真人演唱。今天我们就来实操一下。我们进入 jamna 的 页界面,唤醒音乐生成功能为给他情绪素材,这里可以选择你喜欢的音乐流派,或者把你的文字、照片、视频拖进来,输入提示词,点击生成,他每次都会听中吐出三十秒的高保证音乐。 我们先看最基础的文字生成,这里有个小细节,记得在这里选择 jammer 三点一 pro 为什么要强调这个?这其实是双模型在打配合。 libra 三负责底层的编曲。 jammer 三点一 pro 负责前置的推理, 它能够精准拆解你其实自己的情绪词。比如我输入流行英文,女生不要古典,完全靠空灵唯美的合成器和人生推进权力抓二 质感不错,因为有了三点一 pro 的 强大推理,它完美理解了不要古典,保持流行感的这种需求。看完了文字,我们来讲更有趣的图片生成音乐。比如我去山里面度假,拍了一张在泳池边躺平的照片,现在我把这张图片喂给 lara three, 让它根据照片来生成音乐。我们看一下结果, 这段慵懒的节奏和照片里那种远离城市宣泄、彻底放空的印记完全吻合。说明大模型不仅能看懂画面,还能读懂你松弛的情绪。我们再来用视频生成音乐。下面是一段我视频的 b 肉, 我把它拖进去,让它根据视频来生成音乐。 就像开头那样,它能紧跟画面的运程,快慢构建情绪的起伏。最后帮你体验一下用 ai 生成音乐的核心心法,停止搜索,开始用提示词描绘情绪, 不需要去音效库里逐个试听,而是把文字、图片和视频当做情绪的主体丢给 larry 三。只要能给足足够的情绪提示,它就能极大的提高你成片的效率和质量。赶紧去打造你的专属 bgm 吧!如果这期对你有帮助的话,感谢点赞订阅关注我是本杰明,我们下期见!

大家好,欢迎来到玲姐说 ai, 大家新年好啊,现在是新年的第二期节目,最近啊,真是春光无限,天气非常好,每天都是晴天啊,我也忍不住去外面去游玩。这期节目呢,实际上是这个闲里偷忙给大家录制在春节期间的各种 更新的节目。春节期间呢,中国的大模型厂商呢,是不大不让大家好好的过好春节,海外的大模型呢,是根本不过春节,他们就是各种喜欢不让大家睡觉,半夜就开始放各种重磅的消息, 谷歌的这个三点一 pro 又放出来了,我也后面会找个时间给大家评测一下,但是今天要给大家去测的 不是谷歌的三点一 pro 是 谷歌的另一个新功能,就是谷歌它掀桌子了,它现在不仅是要先 open ai 的 这个桌子啊, 它连其他的这种垂直品类也要一起搞,不愧是搞多模态搞全家桶的。今天要介绍的是它的一个新的 ai 功能, 它把 liri 这个 ai 音乐生成的功能塞进了桌面上,我自己测了一下,整体的效果真的很棒,今天给大家整体来介绍一下,并且评测一下。 这里啊,就是谷歌发的公告,一种新的表达你自己的方式。在这里啊,它提供了三种方式。之前呢,我比较推荐大家使用的这个 ai 音乐生成呢,我最推荐的产品是 solo, 现在啊,它搞的 solo 的 日子可能都没有那么好过了。 在这里啊,它使用的这个模型叫做 linear 三,这个模型呢,它特点是在于什么呢?可以纹声音乐,还可以给它上传音频,视频或者一张图片来进行自由的创作。 他这篇公告里面也讲到啊,我们可以通过一个想法,一张照片,比如说你告诉他给我创作一首关于袜子,找到这个 rmb 风格的慢歌,他就可以给你创作三十秒的高质量的朗朗上口的曲目。 因为谷歌是多抹肽这个模型里面的王者,所以你可以给他任何多抹肽的创作,包括他的联动啊, 那个 notebook lm, 你 可以把它你的这个笔记本的东西给它上传,作为引用源,让它根据这个内容来给你创作音乐。 有没有心动?既然提到了音乐这个事情啊, ai 音乐其实在头顶上一直悬着一个达摩克里斯兹兹件啊,就是它的版权的问题,我们经常在上传这些 youtube 视频上面一个最核心的检测,就是检测这里面的音乐啊是否有版权问题。在这个公告里面啊,它也会提到 johnny 呢,往这个深层的 ai 音乐啊去嵌入了隐秘的一个内容的水印,就说这个音乐你放在谷歌的这个内容场景里面去使用的时候,它能够去识别这个音乐是 ai 深层,并且使用了它这个 linear 三的模型。 并且啊,它这一次的发布啊,我自己测评下来,虽然在用户端的使用体验和这个精细度啊并 并不如苏呢苏呢,它本身是一个锤子的音乐创作的这么一个产品,而谷歌啊这次的这个加入了 libra, 加到 germina 里面,更核心的强是强在它的生态,它会在 youtube 里面,也可以让你很方便地使用到它的 ai 创作音乐 核心在于什么?就是在于它的这个 shots 里面,以后你可以很容易地根据你 shots 里面拍摄的内容,它帮你自动地去配一个 ai 音乐,这样子对于我们内容创作者来说是非常方便的。以前我用一些音乐啊,需要考虑它的版权问题, 现在啊,不是说这个谷歌的生成的 ai 音乐质量有多高,它最大的一个优势说这个音乐生成它就在我的手边,它离内容的生态更近, 就是谷歌的全家桶的这个板块又补足了一块板。现在大家打开 gemina, 在 工具这个位置啊,直接选择 create music, 它就可以帮你制作对应的曲目了。这里涉及的曲目啊非常多种,包括了说唱、拉丁、流行、民谣、 imb、 金属摇滚、电影风格等等,都可以去尝试 给大家看一下我的创作。大家还记得这段视频吗?这段视频是我用 c dance 二点零那一期里面我用 ai 创作的视频,我把这段视频给他,让他基于这段视频给我创建合适的背景音乐。我这里提示词写得比较简单,看看他给我生成的效果, 他说给我生成了配合这段视频的专属乐器,叫做 dragon essence, 史诗级的交响乐,配合了中国传统乐器和现代管弦乐的力量,我们听一下 是不是还挺不错的?这个封面图是用小香蕉生成的, 在这里啊,如果你比较喜欢这个音乐,你可以直接点击下载,可以下载纯音频 mp 三,也可以下载音频加这个封面图片的这个音乐, 你看这里的想象空间就很大了,是不是我可以用 c dance 二点零或者 vo 三点一来生成对应的视频或者一些舞蹈的画面,然后让谷歌的这个音乐创作给我生成对应的配乐。 谷歌的多模态能力一直是非常强的,同样处理视频,处理这种图片,它整体的能力我综合对比下来,要比 openai 叉 gpt 要强,它的多模态能力比较强,而且上下文有一百万 token, 那 么我们就可以先创作视频,然后配合背景音乐。 那如果说你是创作这个 youtube 的 shots, 或者在 tiktok 上面去创作这种短的视频,是不是有个特别快捷的列录了?而且我相信啊,这个能力,这个字节跳动一定会 copy 过去的,它完全有这样的基础。 呃,字节在基础设施上真的是花了很多很多钱的字节。呃,你说这个阿里,他在去年二零二五年的时候,包括未来二零二六年, 他投了很多钱,说这个,呃,五百亿搞什么外卖大战,然后投了很多钱在基础设施上面,但实际上你知道吗?字节光是花在豆包上一年的,就是在算力这方面的费用就八百个亿, 还不考虑其他的营销呀,各种活动的费用,就光是豆包的这个沟通费用就非常强。所以我认为字节他也会把这个能力迅速地 copy 进去, 可能会欠到它的这个剪映里面,或它这个 tiktok 这个抖音相关的产品里面,就相当于它把它作为一个基础设施和配套能力,放在它的内容生态里面。字节是有这样的基础的,我这里继续跟它对话,就是我可以把这个 ai 音乐生成能力 放在一段长对话里面,我可以给他上下文,比如说我对这个音乐不满意,我就跟他说,我希望你来思考一下,一开始我给你的这段视频啊啊怎么配合比较好,让他给我生成更多的方案, 这样子呢,他可以用 jamming 的 pro 功能去思考。他这里给了我三个方案,一个是东方史诗交响的,就是还是配合中国传统的民族乐器的,正统的仙家风的配乐。方案二呢,是国风的赛博电子这种电子舞曲合成波的方式。 方案三是热血动漫的摇滚风啊,日系的热血动画的那个风格。方案四呢,是暗黑预告片电影的叔式风。然后呢,我就可以基于这个上下文让他给我生成音乐,这也是谷歌能力强的地方。当然这也是一个弱点啊,就是 当我想先生成音乐提示词,然后再生成音乐的时候,它会直接就帮我直接生成音乐了。如果说我想让它呃给我生成一个很精细的音乐提示词,我最好是使用别的这个呃大模型,比如说 jpg 的 模型,让它给我生成这个音乐提示词,生成歌词, 然后呢,我再给它,然后呢,我就这里说,我就按照方案四来生成音乐。我们听听方案四生成的这种暗黑预告片风格的配乐啊, 他这里说开场是低层的这种打击乐,然后呢,万剑绝的这个火魔的爆发,最后有这种紧张感在结尾处啊,男主遇见飞向夕阳就是他,还是结合这个画面整个的过程去生成的。 怎么样,是不是挺专业的,特别是这种电影的蓬勃感这种工业级的配乐啊,他可以做的比较好了,然后我再尝试了一下方案,一再听一下。 这里还挺搞笑的,他搞的是 中音混合版的这个中文加英文的,虽然我也不是很看得懂他的语法,但是我觉得配在背景音乐还是,嗯,挺契合的,没有特别大的违和感。刚刚我测的就是基于视频来生成 ai 音乐,我们再测一测基于图来生成 ai 音乐。 比如说啊,这里我给了他一张梗图,我们经常有一些梗玩一些梗图, 但是呢,如果是单纯的放上这个梗,放上这个画面会觉得有点单调,那我就可以基于这些梗图或者一些视频的梗给他配音乐。你看这里我给他一张图,我说视频的这个主题啊,是,当你的猫咪决定统治世界,请根据这张梗图来给我生成音乐。 我这里提的要求是说,请用充满戏剧张力的男高音深情的演唱,关于权力和荣耀的咏叹调。他这里会简单的描述一下整个音乐深沉的逻辑,然后我们直接来品鉴一下 歌词,我不是很听得懂啊,我不是专门的这个呃,音乐鉴赏的专家,但是我能感受到他对我整个提示词的跟随度是比较强的。 关于图声音乐还有更多的玩法,比如说啊,这里我给了孩子随手画的一幅简笔画,我让他基于这张画来深沉儿童的音乐,并且让他来给我填词。如果说你是一个教育工作者,这里面是不是有很多激发了你很多这种可以玩的空间和想象力了? 我们看一下,他就根据我的这幅画,这里啊,这幅画他描述了一下有个橙色的身体,圆圆的眼睛,酷炫的话题,然后给我生成了一首专属的儿童音乐,然后再匹配一些可爱的歌词,看看这首歌,我们一起来听一下, 是不是很可爱?你看,当有歌词的时候,在这里啊,他会出现一个选项,是否显示字幕,非常贴心哦。刚刚生成的是中文的歌曲,我们再寄予同一张图,让他给我填英文的歌词,充满童趣,看看生成的效果。 谷歌 ai 音乐这种基于多模态 进行创作灵感创作音乐的能力啊,是像 solo 这样的产品目前所不具备的,而且它现在做的很轻,把它塞到了 german, 大家可以快速的去试一试。同时在测评的时候,我也考虑了版权这个事情,比如说啊, 我就尝试让他使用王菲的唱歌的风格来给我创作来写一首歌,这个歌的主题呢,叫做最初的美好,它这里也会提示我啊, ai 的 这个音乐模型啊,通常为了版权和安全的原因,他不建议直接写歌手的名字,其实这是一个非常重要的技巧, 你要去描述啊,比如说王菲这个歌手,他唱歌的方式,他的特点,比如说,他这里总结了王菲唱歌的这个声音特点是水晶般清澈的,带有 寄生般的这个头声、假声,听起来毫不费力,超凡脱俗但又饱含深情的这么一个唱歌的特点。 我们在希望他用某个歌手的唱歌特点的时候,最好是描述他的特点,而不是直接用他的这个名字。那么这里呢,我就讲啊,用这个唱歌的这个特点,然后呢,创作一首主题为最初美好的这个歌曲,我们来听听这首王菲版的最初的美好, 我自己感觉已经很不错了,有王菲的那个感觉,当然和真实的王菲的这个表达还是差那么点意思。这也是 ai 不 能够完全模仿人类的地方, 包括你每一次犯错,每一次的这个气音重点可能会有一些差别,这个也是目前 ai 没办法目前这个阶段复刻的,其实当它收集的数据足够多啊,它也可以完整的复刻的。接着呢,我又继续啊,在它这个版权的这个边缘啊,继续试探, 比如说啊,我这里说把这个王菲的这个特质啊说进去,这个水晶般清澈啊,什么这个特点放进去,然后呢,我给他复制了一段这个话,这个歌词呢,实际上是华语的这个邓紫棋的一首歌里面泡沫的歌, 我想试试这种错位的感觉啊,让王菲的清澈来唱这种比较破碎的歌,像泡沫,但是啊,你看他迅速的就识别了 这个版权的问题,谷歌这个公司很大,所以它对版权这个问题啊,是非常重视的,因为它自己这个树大招风真的要罚的,这个罚怕了,所以说它对版权这个事情上非常重视,包括你生成的每一首这个 ai 音乐里面都是加了这个 leary 的 编码的。 它这里啊,就直接拒绝了我的请求,没有办法按照泡沫的原歌词来生成歌曲啊,就帮我生成了一个替代的音乐。 再接着我继续给大家介绍有趣的玩法,我让它基于我 notebook l m 的 笔记本的内容来给我的频道创作歌曲。谷歌的产品玩法多很大一部分,一个是它的多肽能力,一个是它的生态非常的齐全。点击这个左下角的加号, 你就可以选择这个 notebook lm, 可以 选中你历史的这个笔记本的创作。这个笔记本啊,如果之前看过我讲 notebook lm 这个节目的,会看过我的这个, 呃,笔记本这个笔记本呢,实际上是我把我之前一百多期的视频链接作为这个源来进行这个信息图还有 ppt 的 创作。 你看我的节目是有连续性的,所以大家记得啊,订阅我的频道,最好是连续的看我的频道,关注我的频道,持续的给我点赞,让我的频道的内容,视频的内容更多的在你的信息的推荐流里面去呈现。 好。我寄予的就是我的这个一百多期的年度复盘的总的视频链接的这个笔记本,我在这里面进行了引用,我给他的提示词也比较简单,请基于玲姐说爱的频道给我创作歌曲。 他这里说啊,这首曲子融合了我的频道里面拥抱 ai 时代,打破认知壁垒,与科技共舞的核心理念,我们听一下,欢迎来到 林和林子一起遇见美好时光。接着我让他继续以这个 notebook l m 的 笔记本为参考,给我创作一首片头的背景音乐作为频道的开头,并且我让他建议风格这里他给了我四种风格,然后我选了其中我比较偏好的赛博朋克电子风, 我们来听一下效果。 另外呢,如果你对这个音乐啊比较满意,你可以把这个音乐啊下载下来,把它切成十五秒以内的 上传给到 c dance 二点零。 c dance 二点零有个功能就是全能参考,它可以基于你的音乐,比如说这个跳舞的节律去创作对应的视频, 你看这个内容创作的飞轮是不是滚起来了?从视频到音乐,还可以从音乐到视频,多抹肽,不同的介质结合转化、融合创新,这里会有非常多的玩法和想象力留给各位去发挥你们的创造力和创新力。 今天关于谷歌 gemini ai 音乐创作的新功能就介绍到这里,功能也比较轻,而且你打开 gemini 就 能够用,赶紧在春节假期期间尝试起来吧。天气这么好,玲姐又要出去玩了,我们下期再见。拜拜!

嗨,欢迎回到我的频道,本期视频我想分享一下专门来在二月十八号发布的这个专门用于创作音乐的小功能 area 三。那么首先是它的一个它的用法,它主要分为两种,一种是纹身, 纹身轨道,一种是呃,从照片或者视频来生成曲目。什么意思呢?就是你可以给他一个特定的音乐的类型,或者是相关的描述,就类似于 web coding 嘛,对,就一句话,生成应用那种感觉,当然还可以是 上传照片和视频,然后接下来他会来创作一首歌词,但是我会在接下来测试里呃,发现他其实也可以直接基于你提供的歌词来生成音乐。那话不多说,我们直接开始。 那么本次用到的这个歌曲就是我大学舍友极度喜欢的一首歌,叫流浪歌。那我们先听一下原版的这个声音, 可以听到是那种类似于民谣的那种感觉吧风格。那么我们第一个测试就是,呃, 先打开 jimmy, 然后,呃,然后这里可以点击工具,这里有一个创作音乐,大家我已经操作过了。那么第一个测试就是, 呃,我找一下对,第一个测试就是这个,让他直接用陕西话把歌词我提供给他歌词看下,直接看下效果如何? 我感觉有有一点陕西话的感觉,但是我感觉又差一点意思,因为我没有给他原版那个歌嘛。那我们再看一下下一个啊,这个是我让他生成还是同样的歌词,但是让他生成英文版了,再听一下。 嗯,我其实最满意的是这个就是他,他翻译没有问题,而且唱的也算是有感情吧我觉得。 然后下一个是什么?我看一下啊,就是我上传了原版的声音,然后让他参考这个这个旋律,重新生成英文版的,听一下效果, 我觉得这个再参考了原版的那个歌之后效果会好一点。那么最后还有第四个测试什么呢?就是, 呃,啊,对,我让他又还是参考原版的歌,但是但是上传了我我这个舍友的这个声音,然后他看一下能不能模仿。 好,那么除了这四个测试之外,我们再看一下我还做了哪些,应该还有两个 啊,这个还是一样的,就是我把我朋友的声音还有原版的声音上传,让他能不能让我朋友声音来唱这首歌呢?我看一下应该也不行,因为版权的音 这个歌词也不对,人人的声音性别也不对,说明他。 呃,我不知道是咋回事,就是他没有真正去去去去理解这个,我给他上传这首歌,包括我这个声音。啊,那我再看一下,最后就是让我朋友这个声音再只是按照这个歌词在唱里面,他最后看这个效果。 呃,我感觉这应该是大模型的幻觉,因为我上传的确实是我舍友的声音,但是我不能播放,因为自己, 所以就本期视频就到这里,所以我个人觉得这个功能就拿来玩一下就确实还挺挺有意思,而且目前是免费版本就可以,没有任何限制, 你只需要点击这里创作音乐。啊,我重新给大家看一下,你只要发起一个新的对话,然后点击创作音乐,你可以看到它有这么多类型,我看下 行好。

一张图生成二十五张连贯分镜,这效率真的绝了!操作简单到离谱!把这二十五条分镜提示词直接喂给 jamie 奶,他不仅能精准吐出每一帧的描述词,还能顺手甩给你一张超震撼的分镜大合集!最牛的是什么?是 场景、人物、光影全部保持高度统一!当然,九分镜十六分镜完全不在话下!直接一键生成动画大片,爽到飞起!这套无敌的提示词我已经帮大家整理好了!想弯道超车的评论区直接扣个六六六!

刚看到一个消息,谷歌又放大招了,吉米现在不仅能聊天,还能够写歌了。昨天刚上线的 莉莉啊,三模型,输入一句话,或者上传一张照片,三十秒就能生成一首完整的音乐片段,还带封面,什么概念?以后你想给自己的女朋友写首歌,不用学乐理,不用找编曲,对着吉米说句话就搞定。 但站在投资者的角度, ai 正从聊天进化到创作,文本、图像、视频、音频,深层次 ai 的 边界正在疯狂地扩张,谁受益?算力还得买,模型还得训练。但关键是,谁能够把 ai 落地成 产品,谁能够吃到下一波的红利。所以,咱们别只盯着英美达拉多,看看应用层,你们觉得 ai 写歌能火吗?评论区,咱们聊聊。

大家先看图, gemini 集成 liri 三图文视频一键成曲,到底什么情况呢? google 在 gemini app 中正式部署了 liri 三模型 beta 版, 这是一个音频生成模型。简单来说,它现在允许你通过文本指令甚至上传图片和视频,直接生成一段三十秒的高质量音乐。这并不是简单的音效合成,而是对标 suna 和 udo 的 专业级生成。 虽然目前时长限制在三十秒,但它打通了视觉输入到听觉输出的通道。也就是说,你拍一张照片, jamie 就 能根据画面色彩和构图算出对应的旋律。这不仅是功能的增加,更是多模态交互效率的一次提升。我的天呐!

谷歌 gem 刚刚上线的音乐制作功能给大家演示一下,我们先创建一首戏非传统慢听风格的纯七乐曲, 再来一首激流金属, 不知中国民歌风怎么样? 最后来一个西海岸诽谤说唱。

哈喽,大家好,我是阿卷,今天和大家分享一下最近节目来新出的深沉音乐功能,和大家一起来体验一下它深沉音乐的效果,优缺点以及适合的场景。那首先我们可以看到它目前只支持十六种音乐类型,整体来看是比较受限的,我选了一些,比如 rmb、 民谣以及生日祝福都体验了一下。 那先来说说它的优点,它作为一个低门槛的工具,使用体验还是比较惊艳的,对于非中文的歌曲,整体识别效果其实很不错的,同时它对于指令的识别也很准确。 那我们一起来听一下。这一段是我写的一份关于暗恋主题的音乐,要求是男生四次拍前两个小节简单鼓组和人声吟唱铺垫氛围,然后进入主歌的部分,而歌名、主题和参考的部分歌词都如上。那我们一起来听一下。 在前两个小节都使用吟唱,同时他也没有参考我给到的对应歌词,而是基于主题自由去发挥的。 那我们现在来试一下,让他修改两个之前没有做好的指令,也就是第一个前两个小节简单的鼓组和人声吟唱去做铺垫,第二个的话是完全参考我的歌词, 然后同时我们再新增两个指令,第三个是加上更多的转音,然后第四个是融合 dovo 的 风格,使整个的音乐的层级更丰富,更耐听。然后我们一起来看一下它生成的效果怎么样。 他不仅准确的理解了 duop 的 音乐风格,还在整个融合上面显得非常的自然,多层次的人声给丰富度添加了不少的层次,所以我们可以看到他的第二个优点就是他的指令识别非常准确,这里面像包括了风格、歌词、细节等等。 那说完了优点,我们来讲一讲他的缺点。第一个缺点其实就是他的一致性比较差。我本来希望他再去把 duop 的 风格元素细节做优化,比如说用多声不和声以外,我更希望贴合歌词的问句的结构,增加 duop 常见的回答式处理,我们可以一起来听一下, 同时我在下一段提示词中告诉他参考第二个的旋律,我们只需要改掉问答式的这个处理,其他的都保持不变,但他好像是没有办法按要求输出的。所以我觉得他的一致性差就是他缺乏多轨的意识。 在音乐中会有多轨的概念,比如人声、鼓组等等。如果你想保留人声只去改鼓组,或者保留鼓组去改 bassline 之类的话,他是没有办法识别单轨的元素并修改的,而是作为一个整体输出,每一次改动可能都要牵一发而动全身。 那他的第二个缺点是他的中文生成效果比较差。我们一起来听一下我做的两个生成的中文音乐。第一个是想让他做一首关于暗恋的中文 rnb 的 音乐情歌, 再来听一听民谣曲风,这个这一次我觉得问题更大。 第三个缺点是他目前只支持做三十秒的音频结合第一点一致性差的问题呢,导致只能做片段,无法拼作成一首整首歌曲。那讲完了优点和缺点,我们来讲一下 jamming 生成音乐适合当前的哪些场景呢? 第一个我能想到就去做一些简单个性化的一次性消费,比如说定制人民的生日歌曲,这里我试了一下,通过一些图片和定制人民去生成了一份生日歌曲,其实效果是蛮好的,我们可以来感受一下, 可以看到在这个场景他其实做的不错的同时第二个场景的话,他会会适适合一些 demo 的 定调,比如说在这里面你可以上传图片文字或者用意向去定 demo, 就 像刚刚播放的生日歌曲一样, 上传了一个生日的一个场景图,以及上传了这个生日蛋糕图,所以你看它在歌词里面就结合了巨大的生日蛋糕这些意向去进行表述,所以它其实在做劳报 demo 的 定调时候,对于音乐工作者来说其实是有一定的帮助的。 那第三个我觉得它适合场景就是片段化的音乐,比如说你有播客的话,你可以在你的 intro 或者 out 上面去生成一段专属于你个性化的音乐。 那最后一个场景我会觉得它更适合于没有歌词轻音乐的这种状态,比如说一些 vlog 视频,它的 bgm 它也是可以生成的,这样也不会有版权的问题。那好的,以上就是我针对于 jimmy 新推出的生成音乐初体验过程中总结的两个优点,三个缺点以及四个我觉得可能适合的场景。如果你还有什么问题的话,也欢迎在评论区和我交流。