00:00 / 00:30
连播
清屏
智能
倍速
点赞7
daftAI1周前
最新!Gemini 推出音乐生成模型 Lyria 3 Google DeepMind 推出的生成式音乐模型 Lyria 3,现已作为测试版集成到了 Gemini 中。 核心亮点和玩法解析: 1. 核心功能:人人都能做音乐 Lyria 3 允许用户通过简单的操作生成 30秒的高质量音乐片段。 - 文字生成音乐:你可以用文字描述你想要的流派、心情,甚至是一个梗或一段回忆。 例子:“做一首关于我妈做的炸大蕉的有趣的非洲节拍音乐,要有那种真正的非洲氛围。” - 图/视频生成音乐 :上传一张照片或一段视频,Gemini 会根据画面的氛围自动谱写一首带歌词的曲子。 例子:“用这张照片给我徒步时的狗狗 Duncan 配一首曲子。” 2. 相比前代的三大升级 自动生成歌词:模型会根据你的提示词自动生成。 更强的控制力:你对音乐的风格、人声(Vocals)和节奏(Tempo)有更大的掌控权。 更逼真复杂:生成的音乐在真实感和音乐复杂性上都有显著提升。 3. 配套体验 自动封面:生成的音乐会由 "Nano Banana" 自动生成配套的专辑封面,方便你分享给朋友。 主要目的:Google 表示这是为了给用户提供一种有趣、独特的自我表达方式。 4. 安全与版权 水印技术:所有生成的音轨都嵌入了 SynthID 水印(人耳听不到的数字水印),用于标记这是 AI 生成的内容。 音频验证:Gemini 应用内新增音频验证功能,你可以上传音频检查它是否由 Google AI 生成。 版权保护:模型设计初衷是鼓励原创,不支持模仿特定艺人。如果你在提示词中提到某位歌手,Gemini 只会将其作为“灵感来源”来生成类似风格,而不会直接克隆该歌手的声音或作品。 5. 如何使用 适用人群:向 18 岁及以上的用户开放。 支持语言:首发支持英语、德语、西班牙语、法语、印地语、日语、韩语和葡萄牙语。未来计划扩展语言覆盖范围,并提升质量。 平台:桌面端即日(博文发布日)上线,移动端将在随后几天推送。 高级权益:Google AI Plus, Pro 和 Ultra 的订阅用户将拥有更高的使用额度。 你可以去 gemini 试一试,看看能不能生成一首属于你自己的 BGM。 原视频 via 𝕏 @google #AI #gemini #音乐生成
00:00 / 01:40
连播
清屏
智能
倍速
点赞16
00:00 / 00:28
连播
清屏
智能
倍速
点赞60
00:00 / 00:18
连播
清屏
智能
倍速
点赞2
00:00 / 01:17
连播
清屏
智能
倍速
点赞4
00:00 / 00:30
连播
清屏
智能
倍速
点赞16
00:00 / 00:30
连播
清屏
智能
倍速
点赞3
00:00 / 00:55
连播
清屏
智能
倍速
点赞294
sdsds2222周前
【缝合】IndexTTSQwen3实现AI全自动故事配音工具 自制AI沉浸式有声故事一键生成工具,再也不怕没睡前故事听了。自己动手,丰衣足食!#Qwen3 #TTS #IndexTTS2 #ai配音软件 #ai有声小说 一个基于Indextts和Qwen3TTS的 AI 有声书制作工具。利用 LLM 自动拆解剧本与识别情绪, 集成多角色 TTS 语音合成(可智能分析音色并使用Qwen3TTS语音设计模型从音色描述文本生成音色), 支持音效(SFX)、背景音乐(BGM)混音及实时台词音频滤波器的自动插入和匹配, 可直接在浏览器导出 mp3 成品。 本工具本体无需配置环境即可跨平台在浏览器使用。 IndexTTS2和Qwen3TTS的CNB云原生在线使用,基于脚本管理调度服务器的内存显存资源实现。 现已支持音色自动分析生成功能,基于llm分析剧情产生角色音色描述文本,再利用描述文本使用qwen3tts生成音色参考音频。 Github项目地址:https://github.com/sdsds222/Unitale CNB云原生服务端仓库:https://cnb.cool/ConyStudio/IndexTTS2-Qwen3VoiceDesign 在线使用页面(llm和tts须自行配置):https://sdsds222.github.io/Unitale AI音色自动合成:能够分析文本,为角色智能生成音色描述文本,使用Qwen3TTS音色设计模型生成对应的参考音频。 AI 自动音效编排:系统能够深度理解文本中的动作描写与环境氛围,自动从本地素材库中检索匹配的音效,并精确计算其在台词念白过程中的插入时间点,无需人工手动对轨。 AI 动态配乐系统:AI 实时分析剧情的情绪起伏与转折,自动判断背景音乐的切入、停止与无缝切换时机,实现配乐与剧情发展的同步。 AI 场景感知滤波器:系统自动检测特殊的对话场景(如“电话通话中”、“内心独白”、“水下对话”、“广播通知”),并自动为对应台词挂载实时音频滤波器,还原真实的物理声场听感。 深度情绪与角色演绎:自动拆分小说段落,精准区分旁白与不同角色,并根据上下文推断角色的情绪强度,产生情绪描述提示词,指导 TTS 生成有感染力的语音表演。
00:00 / 05:59
连播
清屏
智能
倍速
点赞27