你是否想知道如何在家用一台电脑就能离线生成数字人视频? 本期【灰盒实验室】手把手教你,从文字脚本到数字人视频,全流程实操! 🔹 视频要点: 1️⃣ 数字人语音合成(TTS):使用Fish-Speech(OpenAudio)、CosyVoice2、Duix三款模型对比,克隆你的声音,生成高仿真语音。 2️⃣ 离线部署与Docker镜像使用:无网络依赖,快速搭建数字人API。 3️⃣ 视频生成与数字人动画:将音频结合视频,制作完整的数字人视频,支持自定义参考视频。 4️⃣ 实用工具教程:Postman调用API、音频Base64编码处理、Docker操作技巧。 5️⃣ 安全提醒:数字人语音合成虽然强大,但需注意防止语音被恶意合成使用。 🎯 适用人群: 自媒体创作者 数字人/虚拟主播爱好者 AI语音、TTS技术学习者 视频内容自动化爱好者 💡 教程资源: Fish-Speech/OpenAudio镜像:Docker Hub下载 Duix数字人生成镜像:Docker Hub下载 TTS训练音频与文本示例(视频评论区提供) 在视频中,你将看到如何从零开始: 文字转语音(TTS) 克隆声音并生成音频文件 将音频与参考视频合成数字人视频 通过API下载和管理生成的数字人文件 ⚠️ 注意事项: 生成长音频需要更多显存 数字人语音仅在特定内容使用时标注清楚 不法分子可能利用语音合成进行诈骗,请务必谨慎 📌 关注灰盒实验室,解锁更多AI数字人、TTS和自动化视频创作教程! 🎤 FishSpeech 安装命令 docker run -it \ --name fish \ --restart=always \ --gpus '"device=0"' \ -p 2026:2026 \ pinetrick/fish:v2 \ /bin/bash -c "source /root/miniconda3/etc/profile.d/conda.sh && conda activate fish-speech && cd ~/fish-speech && python -m tools.api_server --listen 0.0.0.0:2026 --llama-checkpoint-path checkpoints/openaudio-s1-min
00:00 / 22:23
连播
清屏
智能
倍速
点赞4
夫子Ai6天前
疯狂动物城2彩蛋之《长耳朵的烦恼》AI彩蛋 值得收藏的AIGC制作思路 第一步:gemini写分镜 好的,这是为您刚刚生成的两个镜头的详细画面描述和对白脚本。 镜头 A:故事开端——壮丽的日落 (对应您最后生成的全景图 ) 画面描述: 一个广角远景镜头,从背面拍摄。朱迪和尼克并肩站在一个高处观景台的金属栏杆前。面前是令人惊叹的壮观日落景象,天空被染成了绚丽的橙色、粉色和深紫色,云层层次分明。朱迪兴奋地伸直手臂指向地平线方向,身体微微前倾。尼克站在她身边,双手插在裤兜里,姿态放松地顺着她指的方向望去,尾巴自然地垂在身后。 对白: 朱迪(兴奋地): “哇!尼克,快看那边!天空像是着火了一样,这绝对是我们这周见过最美的景色了!” 尼克(懒洋洋地): “是啊,还不赖,萝卜头。比起整天盯着毫无美感的监控录像,这确实比较养眼。” 镜头 B:故事结局——“完美”的自拍 (对应倒数第二张生成的图 ) 画面描述: 中景镜头,时间稍晚,天色比刚才更暗了一些。朱迪笑得前仰后合,眼角挂着笑出来的泪花。她一手举着手机,屏幕上清晰地显示着刚才那张尼克被勒得翻白眼的滑稽自拍照,她的另一只手指着屏幕,似乎在强调照片有多好笑。站在她身旁的尼克一脸不爽和无奈(表情参考了经典的“我就静静地看着你”),他一边用爪子揉着刚才被勒得不舒服的脖子,一边整理那条已经松松垮垮的绿色领带,头上的毛发看起来也有点凌乱。 对白: 朱迪(笑得上气不接下气): “哈哈哈哈!对不起……但是……哈哈哈!这张简直是艺术品!你的表情太经典了,我要把它发到警局的大群里!” 尼克(恼火地整理领带): “我严重怀疑你是故意的,霍普斯。这是袭警,我要工伤赔偿。还有,如果你敢发出去,你就死定了。” 第二步:Nano Banana ; 第三步:可灵2.6生成故事镜头; 第四步:TTS行声音克隆; #疯狂动物城 #即梦ai短片挑战赛 #即梦生图#疯狂动物城2 #朱迪尼克
00:00 / 01:37
连播
清屏
智能
倍速
点赞952