分享InfiniteTalk项目最新版，8G显存可用针对InfiniteTalk项目做了更新。优化了工作流以及参数，处理速度提高40%，另外，针对整合包内indextts2项目节点根据官方项目进行了更新，优化了断句等功能，修复了情绪缓存的bug,提高了语音生成效果。项目地址：https://github.com/MeiGen-AI/InfiniteTalk整合包链接：https://pan.quark.cn/s/74e369314119

indextts2生成模型时间

30

20

25

8

举报

发布时间：2025-12-27 10:06

粉丝2631获赞1.5万

相关视频

15:41
15分钟带你跑通 IndexTTS 2：情感向量、拼音精控这期视频我在 Mac 上完整跑通了 B 站 Index Speech 团队开源的 Index‑TTS 2，并做了系统演示与横向对比。它不仅支持“可控时长”，还能将“情感”和“音色”彻底解耦，带来更稳定的“换情绪不丢音色”效果。我还展示了 4 种情感控制方式、中文拼音精控，以及从零到一的本地部署与故障修复过程（含 torchaudio NaN 修复与最小化脚本验证）。
你将收获：
- Index‑TTS 2 的核心能力：可控时长、情感/音色解耦、8维情感向量、中文拼音精控
- 4 种情感控制方式：音色同源、情感参考音频、情感向量、情感文本
- Mac 本地部署实战：uv/Git LFS/FFmpeg/Qwen‑0.6B‑Embedding、Apple MPS 加速
- 踩坑与修复：WebUI 报错定位、torchaudio 修复、最小化命令行验证
- 横向参考：与 CosyVoice‑3 等模型在说话人相似度等指标上的对比思路
适合人群：
- 想把前沿 TTS 模型用于配音/口型对齐/播客生成的创作者
- 希望在 Mac 环境下跑通开源 TTS 项目的开发者
- 关注情感控制、音色克隆稳定性与可控时长的研究/工程同学
时间戳：
00:00 开场与模型亮点
02:27 核心能力
03:17 实测：情感参考与 8 维情感向量
05:04 四种情感控制方式总结与对比
06:56 Mac 本地部署与避坑
11:16 报错修复验证与总结
116kate人不错
04:08
免费开源声音大模型IndexTTS2本地部署教学 #AI #AI新星计划 #声音克隆 #IndexTTS2 #01研究所
26901研究所
15:33
IndexTTS v24｜全网最详细使用教程｜语音情绪克隆 #语音克隆技术
307易圆自媒
03:48
如何快速部署IndexTTS2？本地或云端部署的一种方法
136A计划dot
01:00
《十七爱玩》地表最强AI声音克隆配音工具!index tts2免费开源，完全的小自一键部署安装包，支持音色、情感、语气精准克隆，一键整合包轻松上手，吊打同类模型。#A声音克降 #声音合成 #ai配音软件工具#Indextts #indextts2 下载教程，使用教程安装教程
3031忘不掉的思念
02:41
Index TTS2
查看AI文稿
AI文稿
上两期视频分享的 tts 语音类生成软件受到了很多朋友的关注，不少粉丝留言和发私信询问此类软件如何安装使用。今天就给大家一个傻瓜式教程，告诉你如何分两步在本地电脑部署另一款热门的语音模型 index tts。在安装的第一步，也是最重要的一步，请参考我之前的视频。先下载并安装 pinocou 工具，这是可以帮你自动安装部署 github 软件的 ai 神器，安装时候一定注意选择路径为 d 盘或是其他盘符，避免在安装多个程序后 c 盘空间不足。现在开始第二步，一键自动化安装 index t t s 方法也很简单，进入 pinocou 程序主页，在首页你已经可以看到很多的 github 热门程序展示。请先选择搜索栏下方的 community scripts，输入关键词 index tts，在搜索结果中选择带 pinocchio 的脚本，点击连接后，再次点击黑色的一键安装按钮，软件会弹出一个 get 脚本的下载确认框，点击下载，剩下的工作 pinocchio 会帮你全自动完成。在设置好虚拟环境的同时，它也会下载程序所需模型文件，无需人工干预，省时省力。如果你的显存小于八 gb，那么你也可以选择之前视频介绍的优秀 tts 工具 voxcm，它的模型体积仅为零点五。 b 程序安装完成后， index tts 会自动启动，可以通过软件的网页客户端进入使用界面。使用方法也很简单，先在左面选择你需要克隆的语音文件，中间输入要生成的文字脚本，点击生成按钮，程序就会帮你生成对应的语音文件。本次视频的音频文件也是使用了 index t t s r 生成的，感兴趣的朋友可以对比下前面两期我用 voxcm 配音的视频，告诉我你觉得哪款软件的效果更好。音频生成后，我们来听下效果。风浪越大鱼越贵，这 ai 的水可比金海的浑水还深几分。你以为它只是悄悄代码吐点文字的玩意儿？错了！现在多少人挤破头想往里面钻，有人靠它赚得盆满钵满，有人栽进去连底裤都不剩。怎么样，你对这个生成效果是否满意？欢迎在评论区发表你的意见。此外，该语音的原始音频来自于谷歌最新发布的 tts 语音模型，下期将为大家介绍如何在没有 gemini pro 版本 license 的情况下，免费使用谷歌最新发布的 tts 语音模型。欢迎点赞并关注我的后续更新。
76杨大哥
10:05
最强AI音色克隆发布，B站IndexTTS2整合包！【本地整合包下载地址】解压即用，良心分享，完全免费，https://pan.quark.cn/s/e10139987c3e
如需AI问题咨询、远程一对一指导、软件包定制等服务，欢迎加入我的知识星球【与AI同行】获取，https://t.zsxq.com/uxk7B，星球号：97910047，有问必答!
#音色克隆 #IndexTTS #MegaTTS #F5-TTS #CosyVoice #Sovits #ai #整合包 #tutorial
1120与AI同行
04:03
最近发布的IndexTTS2，支持情绪控制和参考，配合comfyui的灵活性，玩法很多，有可能会成为wan2.1视频生成的最强搭子。工作流和插件已同步网盘，需要的自取。插件安装很简单，对着项目介绍中的安装即可，有坑的地方就两个：
1、DeepSpeed不装会报错，直接pip install deepspeed安装就行，这可能是个bug
2、transformers版本要求大于4.50，这个我没遇到过
52Gary.W（乐皮ai）
00:57
IndexTTS2 这款来自 B 站最新最强的零样本文本转语音模型，在情感真实度、时长控制上超越市面主流 TTS，更在性能指标上完胜开源竞品。体验 AI 语音的未来，解放你的创作力！ #SOTA #TTS #语音模型 #甄嬛传 #AI配音
32OPENSOTA.AI
00:53
一句话生成电影级配音当下最强AI语音克隆IndexTTS2 保姆级使用教程，无限使用，免部署#AI #IndexTTS2 #文本转语音 #TTS #晨羽智云
76晨羽智云AI(算力租赁)
03:34
声音克隆天花板IndexTTS2：本地部署实测，这效果是真实存在的吗？#热门 #indexTTS2 #AI语音 #AI声音克隆 #AI新星计划 @DOU+小助手
查看AI文稿
AI文稿
朋友们，三秒克隆声音的质量又到了新高度，我可以非常开心，非常愤怒，非常伤心，他还是免费开源的哦，一起来看看吧。那这个 index tds 呢，是 b 站团队开源的最新的声音模型，应该是目前市面上情感控制最强的声音克隆模型和最强的原声翻译模型。因为之前的模型呢，也许音色可以复刻，但是情感和时长想要保持一致是非常难做的。但是你听它这个，臣妾要告发熹贵妃私通，会让后宫罪不容诛。 my concubine wants to accuse x's imperial concubine of fornication and filth in the harem， the crime is beyond reproach。他这个原生原情绪保持的就非常好，时长也都是一致的。所以 b 站开发这个模型非常的合理，因为这是视频平台非常需要的一个功能。 ok，那我们自己来用这个模型呢，用起来也很简单，只需要在这里上传你的参考的音频，比如说我们传这一条，别躲在里面不出声，我知道你在家，那在这里输入我们要让他深层的话。 ok，我们点击生成就好了，听一下。吉克洲的朋友们，好啊，昨天有个年轻人和我说声音克隆又到新高度了，我一看，好家伙，原来是 index tts，是那个味儿哈，那比较有特色的是它的情感控制的，它的情感和音色是可以分开控制的，那情感控制呢？分成了四种不同的控制方式，我们点开它这个显示实验功能就能看到。那我们刚才用的要保持跟参考一样的语气，那他这个保持呢，其实是可以帮你保留参考音频里的这个现场的混响啊，语气啊和口音的。比如说这一条啊，接下来的讲的这个人呢，我觉得特别有意思哎，听起来他就有口音什么的，那我们让他改成说这句话，这现在的 ai 声音克隆，哎呀妈呀，连我口音都能克隆了，赶紧整个试试呗。你看他这个语调，语速和口音和这个现场的混响都给你保留了，那这个就是最主要的声音克隆用法，多用于哎原声翻译啊，整活呀。那这里有个复刻的小技巧，虽然说我们上传几秒钟的参考他就可以复刻，但是你如果上传更长一点的参考，生成的语气会更自然一点。那其次这个功能最实用的就是原声翻译了，比如说国内做电商的朋友，哎，你想要出海传播中国苹果看陕西，陕西苹果看洛川。朋友们，我们直接把翻译的文稿贴上去给他翻译。翻译什么叫惊喜，效果非常好啊， chinese apples， look at shanxi and shanxi apples，这个吆喝的感觉都给你保留了，出海电商的朋友必备神器。所以正如用情感向量控制，因为他这个更好操控，比如我们想要恐惧一点还是惊喜一点，情感的浓烈程度是几分？我们直接在下面这样拉分子就好了啊，我们来一个又愤怒又哀伤吧。呃，情感给他都拉满，为什么？为什么要这样对我？到底为什么？虽然说他的音配色保持也没有那么好了，但是他的操作简单，情绪也是很有效果的，所以说他就比较适合有声书啊，隐私啊，或者是广告的配音，这种不需要还原某个名人音色的一些场景。好了，又收获一个新利器，有问题可以再问我，我们下期见。
29极客周AI 实验室
11:21
自媒体配音救星！IndexTTS2 本地部署教程：10 分钟搞定短视频语音，音质碾压免费工具#知识分享 #打卡学习
125云上天6090
07:59
IndexTTS2：Bilibili最新发布的工业级语音AI #IndexTTS2 #AI语音合成
34王小鱼_fish
01:47
最强AI声音克隆模型开源，无需部署+免费使用 #AI配音 #开源项目 #声音克隆 #免费工具
365解放生产力
01:14
超绝的语音模型。 #开源 #逛逛github #github #ai #科技
223逛逛GitHub
01:42
开源Index TTS2，免费AI声音克隆，三秒复刻任何人声 B站开源的Index TTS2，直接碾压市面付费工具。一句话三秒克隆任何人声，用Google Colab免费白嫖专业GPU部署。开源免费比收费还好用，别再给声音克隆工具交智商税了。
#AI配音 #声音克隆 #IndexTTS2 #AI语音合成 #开源神器
查看AI文稿
AI文稿
先试听一下这个声音克隆的效果，红楼梦告诉你上流社会有多渣，金庭梅告诉你中层社会有多烂，水浒传告诉你兄弟义气有多假，西游记告诉你，就算你有天大的本事，照样走后门拉关系怎么样？很棒吧！重点来了，这些全是免费的，这是 b 站开源的 index tts 二，直接碾压市面所有付费工具。 ai 配音这行有个特点，开源免费的比收费的还要好用。花钱买声音克隆工具是在交智商税，为什么？因为顶尖算法都在开源社区，商业软件只会包装收割使用超级简单。看好了，一句话，三秒克隆任何人手拖个音频进去，输入文字，点击合成按钮搞定。想要更细腻的效果，这里还可以调整情绪、语调等细节。使用 index tts 二有三种方案，第一种在 hugging face 免费试用，但每天字数限制严格，需要不断切换 ip。第二种整合包，本地部署，但是对 gpu 硬件要求太高，普通电脑根本跑不动。第三种也是我最推荐的用 google collab 白嫖专业的 gpu，别人花几百块买的劣质效果。我用 collab 免费获得顶级方案，每天四小时免费额度，多注册几个谷歌账号，轮流切换，相当于无限白嫖。 collab 直接给你 test 了专业级显卡，几分钟就能部署完成，能用开源工具降维打击的事，决不给资本交保护费。站内搜索关键词就能获取 collab 一键部署链接，复制链接粘贴，跟着帖子中的教程操作就行，点个关注不迷路。我是阿杰，我们有缘再见，拜拜。
87瞎分享
03:42
工具分享《indexTTS 2》（语音合成 & 克隆）
查看AI文稿
AI文稿
今天分享一个语音合成的工具啊， index tts，它的上一个版本就已经很强了，然后这个二代版本呢，就比一代版本呢更进一步啊，增加了一些新的功能啊。我们这里先把这个压缩包进行一个解压缩啊，注意一下它的这个文件目录啊，它没有一个外包的一个文件夹啊，所以我们在解压之前最好自己先创建一个文件夹啊，并且我们的整个的解压路径啊，都最好不要有中文啊，像这样啊，打个比方，我在 d 盘的根目录我创建了一个文件夹叫 index t t s r 啊，我就把这个文件夹作为我解压的这个目标文件夹解压到这个地方。好，然后我们可以把这个启动器呢，把它创建一个快捷方式啊，然后我们来启动一下。有的时候啊，如果你发现这个系统窗口长期没有任何反应的话，你可以尝试按一下空格键啊，好，然后等它这个地方跑完的话，它会自动弹出一个浏览器的界面啊，它会采用你的默认浏览器打开我们这个网址，你也可以把这个网址把它复制到其他浏览器打开，这个是一样的啊，没有什么区别。我们这里可以上传一个参考音频啊，就是我们的目标音频啊，我随便选一个吧，然后给大家写段文本，然后点生成。好，我们来听听看。今天天气不错，我想出去走走，这个是他的原版，这个音频我们听原版，一进门看到我就急着要我嫁给他，然后我们还可以选择使用这个情感参考音频，就是我们可以给他一种情绪音频作为他的参考样本，像第一个啊，就是高兴啊，第二个是惊讶、恐惧、失落，最后一个是啊，一个混合的啊，我们先随便选一个啊，比如说开心的，然后我们再来点设置，今天天气不错，我想出去走走啊，它的整体情绪的话就会更加上扬一点，你也可以通过这个向量调节，就是一个数值去控制它的一个整体的一个情绪值。我这个随便啊，随便给多抓一下啊，情感向量值和不能超过一点五啊，他有这个他这个要求啊，要不然的话就太混乱了，是吧？今天天气不错，我想出去走走，最后你还可以用这个情感描述来控制他的情感，比如说我们这里写这个极度难过啊，今天天气不错，我想出去走走。好，下面这里还有些参数设置，不过一般来说我们没有什么好改的，唯一要说的就这个，我们可以通过这个数字来调节我们的语音的情感的一个系数啊，这个系数越大，那我们的整个情感他可能就越生动，但是也就越不稳定啊。然后这里还有个选项啊，叫情感随机彩样啊，就是我们每次生成的时候呢，它的这个情感呢，它是一个随机的啊。
20禅影
01:39
但也不用担心录音录错了，B站开源最强AI语音克隆模型#IndexTTS2#AI语音
11陈三少导演
00:33
《诗梦合集》indextts2来源AI语音克隆模型整合包下载教程，indextts2整合包下载方法，indextts2整合包下载入口，怎么下载indextts2整合包#indextts2 #ai音频 #语音克隆 #indextts #语音变声器
5小漫漫长夜
01:07
【15期】最强AI声音克隆工具：Index_tts2一键整合地表最强AI声音克隆工具！Index_tts2 地表最强声音克隆模型Index TTS二代免费开源，附一键整合包，支持音色、情感、语气精准克隆，一键整合包轻松上手，媲美真人语音，吊打同类模型。
#AI声音克隆 #声音合成 #AI配音工具 #Index #TTS2
88十三在分享

热门推荐

热门分类