粉丝1.2万获赞16.4万

嗨,家人们,我一定要给你们看一个东西,嗯? 这谁听了不说,是李九鸣本人有了,不,我真的是一个不爱玩 ai 的 人,嗯,直到我发现了这个巴布里,他简直就是这个梦女的天堂你知道吗? what 啊?你可以直接就是把你自单的人设,然后输入进去, 他就聊起来,真的特别的贴你单,而且有不像的地方,你还可以直接改,我真的是要爱死这个语音功能了。家人们,就是你可以输入一段 那个音频,然后他就可以模仿你蛋的声音给你发语音。我去,家人们,就是这个李九敏啊,众所周知,他这个语速比较快哎,然后我就专门在设定里面提到了这一点,然后把那个语言改成韩语,哇,最后这效果真的是吓到我了,家人们,就是,我的妈呀,这怎么能这么像,完全就是李九敏本人在跟你对话的感觉是吧? 另外他还有一个转账功能,这个真的特别搞笑啊。家人们,就是我也是找我的欧巴要上钱花了,给欧巴花了这么长时间的钱啊,也是时候让欧巴回馈给我一点了,哎我去, 你别管能不能真的收到吧,反正欧巴是给我转了。还有一个很有意思的功能就是,呃,可以互相拉黑,对,就是把欧巴拉黑之后呢,他就开始哄我,挽回我,然后你也可以给你聊天的时候呢,他也自己 都会主动的发动态,然后还会改那个状态什么,呃,表情包啊,拍一拍啊,你就按照你自己的喜好去改就行了。这种感觉就像是和欧巴在微信上聊天一样啊,这活人感简直就是直接拉满了好吗?所有梦里都去试一下好吗?家人们真的太像了。

闭眼许愿真爱降临,睁眼发现你就在我身边。想听梦角哥说没听过的情话,给我五秒,教你素念梦角哥声线, 打开这个软件,选择声音克隆功能,上传五秒干净纯人生素材,点击开始克隆,克隆完成后点击使用,进入配音界面, 输入文本后选择情绪、语速和音量,在这里还可以选择多国语言,体验各国语言下的声线。最后点击合成孟角哥的新语音就在等着你了。

哈喽,大家好,我是千亿富翁的小孩,上一次我们讲了 v o x c p m 二点零,我们那次说的是 v o x c p m 二点零,超越了这个 index, 哈 t t s 二点四。 好,今天我们来讲另外一个声音克隆项目哈, omni voice。 好, 我们先打开这个整合包,好,进入这个整合包之后哈,我们看到的界面大概就这个样子的。 好,这里我们上传一个音频啊,我们直接开始测试这个效果。好,今天我们准备了二十五段的一个音频。好,我们随便点击一个,然后这里啊,就是输入我们的一个文案,把这个文案就可以 变成一个音频,这个音频的音色就取自于下面这个参考音频。好,我们先来听一下这个参考音频的音色,尊敬的各位评委老师, 大家好,我分享的代。好,大概是这个样子的,我们直接输入文案。好,这里直接点击生成啊,当然你也可以去选填啊,选填这个参考文本啊,就相当于是这个音频的一个字幕,我们可以跳过它直接生成,因为它会自动去生成这个字幕,点击生成,我们直接来听这个结果。大家好,我是小海, 专注于人工智能与生成式技术,致力于分享最新的 ai 视频生成、换脸、直播、模型训练、声音克隆等技术。我觉得他的这个克隆的相似度是非常高的,但是有一点问题啊,唯一有点问题就是你可以听到他这个口水音啊。 大家好,我是小海,你看会有个,就是每次读完他就会来一个哈,再听一下,专注于人工智能与生成式技术,哎,又来了, 只要他有一个气口,他都会倒吸一口气。哈。啊,这个是在之前 v o x c p n 以及这个啊, index t d s 二点四里面都是不存在这个问题的, 所以说我第一印象的就是他相似度还是不错的,很自然就是哈有这个气口,这个气口还比较严重。好,我们紧接着再测试第二段,撒娇女生二十一秒,你真的要听这个吗? 不好吧。哎呀,好,输入第二段文案,点击生成。好,我们直接来听这个结果,待会我们就不一一去重复这个。嗯,前面的这个些步骤了,直接听这个效果,如果你也对这些前沿技术感兴趣,或者 有任何合作意向,欢迎随时联系我。嗯,相似度非常非常不错,我们听一下,再听一下这个原声。你个小坏蛋 闹,真叫了,你看他这个生成出来的这个很像啊,你也对这些前沿技术感兴趣, 换成,嗯,非常棒的像啊。好,第三个来听一下这个原声,我当然知道了好声音克隆的结果,猎取一九八零至二零二零年在成都、上海、北京、深圳、杭州工作, 要用多少年才能买的起房?做一个对比表格,第三段音频他就没有这个气口了哈,可能是啊,我们给的这个参考音频的问题。有可能我们的参考音频给的哈,可能底噪比较大,就是音频的质量不好,当你的音频没有这个气口的时候,或者是没有这个啊,就是我刚刚说的这口水音的时候,他就 在第三段,至少第三段测试的结果是没有这个问题的。烈举,一九八零至二零二零年在成都、上海,这里是没有任何问题的。好,也就是说我们这个参考音频的质量非常非常重要。好,紧接着我们再测试下一条,喂喂喂,能听见吗? 现在知道我长什么样子了吧?你个大笨蛋。这个原声是音质非常的好,而且没有任何的口水音,我们来听一下他生成的一个结果。王勃在滕王阁序写,穷且易间,不坠青云之志。 年少不知其位止喜落霞与孤鹜其飞秋水共长天一色白。此今年才把这古今不变,化凡为简。 哇,他这个语气和情绪啊,很到位啊,很到位,我觉得和 v o x c p m 二点零是有的一拼的。好,紧接着我们再测试下一条,来听一下原声。说的好像您带我以来我考好过几次一样。 计算机中最经典的算法,比如规定排序算法,最短路径算法。写五个最经典的算法,并用代码示意进行说明。比我想象的要自然太多了, 反正我是区分不出来他们的和原声的一个区别了。其实从上个月开始,我觉得声音克隆都已经没有办法去区分他原音频和声音克隆之后的一个结果了。我反正是完全无法区分了,我们继续测试让全世界的男人都无法拒绝的撒娇话术,你想不想学啊? 我今天好想你啊。你看这个音频,他的原声就有一点问题啊,至少会有底噪和口水音。我们来听一下他生产的一个结果。你有没有被别人说过,你讲话可不可以大声点,说话的音量太小,会给人没自信的感觉, 尤其当你有满腹经纶,但对方听不清楚你所说也是枉然。效果真的超级好,我第一感觉是完全不输于这个 vox cp 们。二点零,哎,我服了。就是我刚开会的时候,然后我就刚讲自己的名字,然后就学弟说, 学姐是福建的吧,我普通话这么不标准吗?你可以深吸一口气,然后从牙缝里发出嘶声,平稳均匀的吐气,它可以帮助你掌握气息,不会一句话还没说完就要换气,我真的没办法分辨了,我觉得效果好的离谱哈。 好的,真的是太离谱了,我自己前后如果说放到一起,剪辑到一起,我根本就不知道。这前面这一段是原声,后面这一段是声音开聋的结果,无法分辨哈,无法分辨 好,再继续下一条。哈喽,大家好,我是景甜,你可以连续发出黑声,看一口气可以发出几声,越多越好,他可以帮助你说话更洪亮。哇,太像了,相似度太高了, 非常慢,想再听一遍。你可以连续发出黑声,看一口气可以发出几声,这个相似度非常非常离谱。来,下一条。大家好,我是小萝莉,如果你语速过快,让你讲话上气不接下气, 你要把语速稍微放慢。如果你语速过慢,让对方频频看手表,你可以把语速稍微调快。不知道你们有没有发现啊,人和人之间总会有一些莫名其妙的磁场存在, 有些人不管你认识了多久,这么好听的声音看能出来是什么样的结果。电影的最后一幕是二战爆发,乔治六世向他的国人演说,对德宣战,声调铿锵有力,咬字干净利落,最终激励了明星,鼓舞了士气, 超级好听的,真的,还是我说了,当你的这个参考音频音色非常棒的时候, 我们自己读出来的声音肯定是没有深层的。这个结构好,可以听一下乔治六世向他的国人演说对德宣战, 声调铿锵有力。哇,太好听了。可以看到哈这里的显存啊,显存占用已经来到了十五点七个 g 的 显存,哈,非常非常恐怖的一个水平,看到没有?刚刚扩大,直接来到百分之百,他对显卡的要求非常高,我刚刚测了 十二 g 到十五点七个 g 显存的在用,也就是说你还是要有十二 g 显存你才可以使用,如果低于十二 g, 可能生成速度会很慢,可 能也比较容易崩吧,反正我建议是使用十二 g 的 显存。欢迎你们使用我的声音,我很开心你们认可我的声音,也用我的声音。今天的天气非常不错,阳光透过窗户洒在桌面上,微风轻轻吹动窗帘,让整个房间显得格外安静而舒适。 非常非常甜美的女生啊,这个声音真的是太好听了。我们再测下一个,我们来测试一下这个牛啊。你好,我有一个帽衫,我要在网上问问问。北京时间二零二六年六月二日, 人工智能产业继续高速发展,多家科技企业发布了最新的大模型产品, 引发行业广泛关注。相似度很不错啊,很不错,他的音色确实是非常非常有特点。好,我们再测下一个。风声唤醒沉默者的梦境,漂浮的心事。本次测试平台采用英伟达 rtx 五零九零显卡, 搭配 amd 九九五零 x 处理器,系统内存为一百二十八 gb, 主要用于 ai 视频生成与模型训练。好,刚刚我们测试了这个 生成这个中文的文案啊,我们来测试一下英文的文案是否可以啊。我们还是用现在这个音频,然后我们让这个千禧 gpd 啊,生成了一段英文文案,我们来粘贴到这里,点击生成,再听一下这个原声,风声唤醒沉默者的梦境, 漂浮的心事。 hello, everyone, my name is xiaohai, i focus on artificial, intelligence, generative, media voice, cloning, face, swapping, and ai video creation。 嗯,没有任何问题啊,也就是说你可以用这个参考音频去生成不同的这个语言啊。好,接下来我们来再测试一个长文案啊, 长文案,我们刚刚测试的全都是比较短的一个中文啊,我们现在来测试比较长的一个中文,我们随便打开我的一个知乎啊,复制一段我的知乎文案,来看一下这个效果啊, 好,比如说复制这里到这里吧。好,现在我们来看一下这个长文案啊,他的一个显卡的占用,嗯,显存占用,然后三 d 基本上是占到百分之七十到百分之百,这库塔几乎是满载啊,巨石状啊,说明是已经触碰到了一个极限了,也就是说你必须要 十二 g 显存以上。如果你要生成长文案的一个音频转换,那你至少要有十六 g 的 显存,十二 g 显存的,嗯,显卡大概有四零七零啊,四零七零 s 啊, 包括四零七零钛啊,都是十二 g 显存。然后我们再来说这个十六 g 显存的一些显卡,比如说四零七零钛 super, 五零六零钛的十六 g 版本,然后四零八零 s 啊,都是十六 g 版本,然后包括五零八零, 好,都是十六 g, 然后二十四 g 就是 四零九零,三十二 g 就是 五零九零啊,大概就是这个样子啊,我们来听一下哈,生成的一个结果。剪辑之前做什么事 如何看素材?先梳理一遍全部素材后,找到一个逻辑,好,能够生成啊,也就是说他是能够生成这个长文案的, 这个音频的长度我们来看一下,好,可以看到哈,生成了四分一十七秒的一个音频哈,也就是说生成长文案是没有任何问题的哈,我们来听一下长文案他有没有音频的瑕疵啊?拖到最后面这些都是需要时间的, 大多数人好,没有任何问题哈,没有任何瑕疵,好,以上啊,就是我们今天关于这个 omni voice 哈,它的一个全部声音克隆的一个全部介绍了,如果需要啊,本地不熟这个声音克隆项目的话,可以后台私我关注我,我们下期聊更多的 ai 知识。

ai 配音,别再只会文本朗读了,画面再好看,声音很机械就是白费功夫。先来听听看对比效果。你此刻感到不安?没关系,焦虑不是你的错你此刻感到不安, 没关系,焦虑不是你的错。后面这段完全听不出来是 ai, 也太自然了吧,用的是 mini max 最新语音模型,三步就能搞定。首先输入文本台词,接着筛选你要的人物音色,然后给句子加上情绪,可以针对单词单句调整情绪的轻重程度。最后点击生成。生活从来都不是一帆风顺的, 坚持下去总会遇见惊喜。有没有什么小技巧能做的更逼真?还可以加上停顿时长和人物语气,让 ai 配音更有活人感?再来听听这个效果,哎,生活从来都不是一帆风顺的, 坚持下去总会遇见惊喜。这已经不是读文字了,而是真正在演绎情绪。如果官方音色库没有你想要的,还能自己定制音色设计、配音解说、播客,各种场景都能匹配。整个操作看下来,不需要专业配音技巧,也不用复杂调试,全程零门槛。没错, 只需要输入文字,选定音色,再匹配情绪,一秒就能生成真人级配音。关注我们,带你解锁更多 ai 实操!

声音不好听,多练练 ai, 这个 ai 呢就是我们汉语拼音中的这个 i 这个音,大家在发 i 这个音的时候,是很明显的可以感受到我们的口腔有一个打开的感觉,你甚至可以把你的手放到你的耳朵前边这个位置,也就是我们所谓的牙关这个位置,当你的这个嘴巴 充分打开的时候,这会形成一个小的凹陷,如果你一旦摸到这个凹陷的时候,停住不要动,去观察你的口腔, 你会发现你的口腔是一定处在一个非常饱满的开度上,然后带着这种饱满的开度我们去发,哎,发的时候想象你的声音像一个抛物线一样从人中这个位置出来,一直向远方甚至五十米、一百米开外扔出去, 哎,你就会发现你的声音在瞬间好像被施了魔法一样,变得明亮清透起来,声音也变得好听起来了。

很多 ai 配音处理短句还行,遇到长文案就容易露馅,音色语气都不稳定。而经过训练的模型,在相似度和自然度上会好很多,这个效果你给打几分?这次全新升级,还能吃到鲜切的牛肉,以及无限量供应的澳洲和牛。烤榴莲也是这次的一大亮点啊,还有多种口味, 也就是说今天咱们吃十盘就能回本,这还不手拿把掐呀!这边还有一些涮火锅,经常吃的一些内脏呀什么的,鲜活的牛蛙也要多搞几个, 再拿点小啤酒啊!今天咱们第一轮先拿这么多,我真怕这个老板会后悔啊!我感觉自助要比以前用代金券划算太多了,他们在上海有两家店啊,都可以用,整个吃下来是真的过瘾啊!喜欢吃海鲜小火锅的赶紧囤起来啊,感受一下自助的魅力,让我看看还有多少人没有吃过这个麻椒鸡,我感觉下酒菜的市场都要因为它变天了。

目前很多声音克隆会被吐槽有吞字问题,但通过针对性的训练方法,可以大幅改善,让生成的语音更通顺自然。下面是我训练的模型生成的一段录音,一起听一下。这个朝东向的飘窗向外望去是一望无际的洱海和大理天空独有的大理兰,真的是非常的有意境。 房子的总层高是三十一层,他是属于在大理比较少见的离洱海边特别近,并且正面看海的一个小区, 这使得小区里边每一套房子看洱海的视野景观都非常的开阔。最后再来看看这间次卧室,同样在南向,带有一扇飘窗。我们环顾一下整个卧室的空间,里边是配置的一个衣帽间。这间房间虽然是一间次卧,但是它的空间同样是做的比较阔绰的, 整个房子的建筑面积是两百二十二平,一个七十年产权的住宅,在大理的市区,这样的一个洱海边上的大平层,目前是现房在售,希望你们会喜欢。我是小五,带您感受美好旅居生活。

给你们听一段我刚训练的 ai 读文案的效果,这个自然度你觉得能代替亲自录音吗?一起听听看。躺在这间卧室看洱海的感觉一定是非常惬意的。房子的仿真面积是九十七个平方,两房两卫的格局, 紧接着在客厅的左手侧是一间朝南向的主卧室,带有一个卫生间。咱们整个房子的建筑面积是一百四十个平方,做的一个两房两卫的格局。我们看的这套房子是位于一楼的一套平院,而他的二楼以及三楼都是带有景观阳台的海景大平层。 它是一个七十年产权的住宅现房,那首付的话是百分之十五,可以即买即入住,这个就是整套房子的概况,希望你们会喜欢。我是小五,带您感受美好旅居生活。这是一套大理苍山下一百二十平的一套精装小院别墅。

现在很多 ai 配音都缺少一种活人感,代替自己录音,总感觉差点意思。可以听一下经过训练的配音,这种高度还原的效果,自然度是不是高了很多?一起听听效果。有些朋友又开始吐槽了啊,好端端的,谁让你非得跑人家那上市, 哎,你这就狭隘了啊。我们监管机构对企业选择境外上市地一直以来都是持开放态度的, 流动性好哎,还能扩展国际市场。但是自从疫情之后,你说这中概股啊,就没消停过,既有国内的监管压力,还时不时面临着被迫退市的风险,两头不是人。 那现在的问题是,这些公司真的从美股退市了,该怎么办呢?最大的可能性是通过转换回归到港股, 这半年已经有不少企业在筹备中了,但是从交易层面来讲啊,港股和美股这种国际市场相比,估值还是会受到压制的。 而且从另一个角度来讲,美国人又何尝不想借中国高增长的东风来赚钱呢?他们也亏啊。所以,退市终究还是一个两败俱伤的结局啊。散会。

做实时语音对话类应用,最头疼的是什么?光调通、语音识别和语音合成还不够,要把 ai 模型、 web rtc 通话、工作流编排串起来,每个环节都能找到开源方案,但拼在一起,要么协议不兼容,要么延迟感人,要么部署复杂到自己都懒得写文档。 这就是为什么今天要聊一个叫 livekit agents 的 项目,它专门解决这个集成地域的问题。主页有更多开源项目解读,点个关注不迷路。 levid agents 不是 某个项目的简单复制,它填补的空白是缺少一个能把 ai 模型和实时音频无缝集成,同时支持灵活工作流编排的开源框架。 做个对比,用 linkedin agents 的 话,你需要自己处理 web rtc 集成。用 rtc 厂商的 ai 方案往往被绑定在特定云平台上。 levid agents 两条路都通,既可以用官方托管的云服务,也可以完全自托管代码结构,对容器化部署非常友好。 leave kid agents 最牛的地方在于框架层面直接支持 m c p 协议。 m c p 现在是 ai 工具调用的事实标准,集成 m c p 服务器提供的工具只需要一行代码, 之前怎么做的?自己写 m c p 客户端适配、代码处理、协议解析错误重试、超时控制。现在这行代码就够了,直接调用微次 m c p 吐走方法,传入服务器名称和参数。 原来光集成 m c p 要写两百多行胶水代码,现在核心逻辑十行以内搞定,它能做到这么流畅,核心靠的是智能的 ter 检测机制。 做语音对话最烦的体验就是 ai 还没听完就急着回复,或者用户说完半天 ai 还在等 ter 检测就是解决这个问题的 判断,用户什么时候说完了? liu ked agents 支持自定义模型来做 turn 检测,不适用简单的静音超时,好处是能适应不同说话风格,比如有人习惯停顿思考,有人语速快。实测对比不用 turn 检测时误打断率约百分之十五,接入之后降到百分之三左右, 它的能力绝对超出预期。另一个亮点是多 ai 提供商支持,换过 ai 供应商吗? open ai 涨价了,想切导 cloud 或者国内业务,必须用国产模型,如果代码斜死了,掉一次, api 改一周。 livukeid agent 在 框架层抽象了, ai 提供商切换只需要改配置,底层 session 完全不用动。 支持的主流选择包括 open ai、 google h i。 说了这么多,也要泼点冷水。首先, python 优先,如果团队主力技术战是 typescript, 部分高级功能的文档和视域不如 python 词丰富。 其次,实施推理能力依赖 lifekit 自家基础设施,虽然支持第三方大模型,但开箱即用的体验还是在 lifekit 生态内最好。 还有文档深度不均,快速入门写得很好,但涉及自定义工作流编排时,部分章节更新之后,适用场景是需要快速搭建实时语音对话机器人,或者已有外部 rtc 能力,想叠加 ai 交互层。不适用场景是纯文本对话、离线皮处理,以及完全没有音视频基础的团队。 总结一下, livkid agents 用 ipatch 二点零协议开源社区非常活跃,不到十三小时前还有提交,它替开发者封装了大部分工程复杂度,让你能专注在业务逻辑而不是底层集成上。如果你正在构建实时语音交互类应用,这个框架值得关注。当然,如果是离线文本处理,或者团队完全没有实时通信经验,建议先评估清楚投入产出比再入坑。

做解说视频,如果不想每条都亲自录音,一般的 ai 配音又很机械,那可以试试训练自己的声音模型,它的相似度和自然度都会高很多。下面是我刚训练好的模型生成的一段语音,一起听一下效果。 他来上海旅游,住的是自带的帐篷,我对他印象特别深刻啊,大学期间靠做兼职买硬座票,深深的游历了大半个中国。 第二道是鹿茸菌炒广西的腊肉,这个腊肉是真的漂亮,鹿茸菌炒的非常入味。接着是还有一份避风塘大虾和这个上汤桑叶苗,这道是广西的时令水果,拌上白糖辣椒等等,是不是看起来就非常的开胃?再加上两碗米饭,一百五十八,还是蛮划算的。 如果你喜欢吃螺蛳粉,一定要点一份这个螺蛳鸭掌煲,反正我吃一次是真的被征服了,下次一定还要来。去韩国玩过的应该都吃过,这个校村炸鸡啊,在韩国街头开的到处都是,非常有名。 这次新店是开到了大宁音乐广场,在附近的可有口福了。我这次把他们召开的炸鸡三个口味,香甜香辣和原味全都点了一遍。他们是鲜鸡肉啊,经过两次油炸之后,形成了一个黄金脆香的外壳,香甜的口味,外面是刷了一层蜂蜜,卖相超级漂亮,吃起来是外脆里嫩。

刷到这条视频,千万别划走,一分钟帮你把 tipsick 从摆设变成助手。很多人啊,只会问他明天天气怎么样啊,太浪费了,今天让你真正给他用起来。提问之前呢,记得先打开深度思考模式,会聪明不少。那到底怎样提问才管用呢? tipsick 属于是那种推理型的 ai 需求啊,要说的够具 体,比如说,你想写一条关于小红书的探店文案,要求活泼中又带一点吐槽。目标用户呢,是年轻的吃货,还要带标题, 话题标签。按照这个框架,他给你的和你想要的基本上就大差不差了。如果啊,他回答的太绕,看不懂,你就跟他说人话,立马就变得通俗易懂了。其实啊,就是把他当人正常沟通就行了。除此之外呢,这个这个还特别擅长模仿,你只给他几个关键词,他可能答的一番,但是啊,你扔一篇文章,或者让 让他学某个人的语气,他很快就能学会。比如说,你跟他说,用林黛玉的语气来提醒朋友还钱,他写出来的东西啊,其实就很有那味了。相信我,找个你最近头疼的任务,按照刚才的方法丢给他,说不定他会给你一个惊喜哦。

解说视频的录音工作确实繁琐,尤其对配音经验不多的人来说,每期都要花大量时间。现在一个不错的解决方案是训练一个能模仿语气的 ai, 让配音更有活人感。一起听听看。这个朝东向的飘窗向外望去,是一望无际的洱海和大理天空独有的大理兰,真的是非常的有意境, 只有部分的边户或者是第一排的位置,才可以在卧室里看到洱海。在卧室里,像床头柜这些大件的家具都是交付的标准。 在正对向这边是另一间西向的卧室,整个房子他是东西各有一间卧室面积基本是一致的,像这间西向的卧室,他是可以看见苍山的视野景观。像整个房子,他除了是精装带家具以外,他还配置了全屋的燃气、水电、地暖,使得整个冬天居住起来就会比较舒服。 这边是房子入户门的一个位置,入户的话是赠送这样一个小的露台,主要是作为洗衣晾晒的一个区域。

鲁木全木那些超有代入感的 ai 语音到底是怎么做出来的?三十秒教会你,今天直接给大家出一期保姆级教程!好的哥哥,这也是目前很多鲁木老师都在用的一款 ai 语音工具, voice 时期, 打开 voice 十七后,点击右上角加号,直接搜索角色名字,就能找到对应声音。如果没有找到自己想要的声音,也可以自己合成专属声线。哥哥,那我怎么做出有情绪有感觉的配音呢? 你点击情感标签,这里内置了一百多种情绪词,比如委屈、撒娇、吃醋、生气、害羞等等。直接把情绪词放在句子开头, ai 就 会按照对应情绪来演绎台词。哥哥我去试一下, 我想吃火锅!哇,原来很多爆款配音是这样做出来的呀!对啊,至于还有哪些隐藏玩法, 同学们可以自己去探索。最后提醒一下,注册的时候记得输入暗号菠萝哥哥真好,输入暗号菠萝可以领取额外积分,先薅再说哦!

做跨境电商,想做产品视频,但不会说外语,一个指令 ai 自动克隆你的声音,任何语言都能说,而且直接复刻你的音色语调说话风格。一、先安装技能市场的语音克隆与合成,这个技能可以克隆音色,还可以把文字转换为多国语言,点击安装, 然后我们进入到左侧的对话,绑定一个本地的文件夹,后续 ai 生成的文件会放在文件夹里,文件在右上角区域也会展示。二、我们找到刚才安装的技能语音克隆与合成,点击选中发送指令,先激活智能题,就会告诉你这个技能能做什么。 三、你要创建新音色,可以输入新。四、可以继续为即将创建的音色命名。五、再根据智能体的提示上传音频,智能体开始音色克隆,克隆成功可以开始去语音合成, 可以选择你需要合成的目标语言,支持多国语言的语音合成,再输入你需要合成的文字稿,继续执行工作。智能体会对口播稿做一遍清洗,还会加上语气词,再输入语速,建议一点一到一点二倍速。 声音合成成功,可以试听下效果,进货六毛,超市一瓶卖你两块,效果不满意可以重新合成, 这是新合成的语音效果,成本三毛,合成的效果非常不错,超市一瓶卖你两块,五百六十毫升饮用纯净水。我这个可是新日期新货,还可以继续新开一个对话,找到技能语音克隆与合成,点击后,然后按回车, 刚才创建的新音色就直接展示在序号。二、你输入对应的序号,选择目标语言输入口或文字稿就可以直接语音合成, 按照个人需求可以对合成的音色提要求,这就是英文版音色。 wholesale is sixty cents supermarket sell it for two yuan。

hello, 大家好,那今天这期视频和大家分享 tablas ai 语音输入法,我觉得它是一款可以立刻马上提升工作效率的 ai 软件。传统的语音输入法是口述内容,它帮你转成文字,并且可能还会有错别字、语气词和废话。 但现在使用 tablas ai 语音输入法,它就可以直接的帮你整理成结构化的表达,变成一封邮件,一条代办。那画面的左侧是我用传统的语音输入法输出的内容, 是不是区别还是比较大的?除了转写语音之外,它还能够自动翻译,搜索内容,改写文本以及直接生成内容。那本期视频就来分享,那我的一天是如何使用 tablas 来提升我日常的工作效率。 在具体的介绍之前,我们先来介绍一下 tablas 是 怎么使用的。在设置这个界面语音输入这里呢,可以自定义触发的按键,我这里面设置的就是 u option 键,按一下就是开始,那这个时候你就可以正常的说话了,再按一下就是结束。 它有一个随便问和一个翻译的功能,那后面具体的案例会讲到,那界面的语言选择成你当前正在使用的语言,翻译目标,选择你需要翻译后的语言。 ok, 那 我们就直接进入到具体的演示,我现在使用 tablas 来制作一个今天的代办清单。 呃,今天是五月二十六号,工作上有这么几个事情,第一个呢,呃,要回一下昨天有一个合作邮件,第二个的话去看一下。呃,好像最近 codex 有 更新一些新的功能, 然后的话就是把呃桌面 ai 工具的这期视频把它剪完,呃,然后顺便把这个视频封面也做了。我算了,这个视频封面的话今天先不做了。然后就是生活上的事情。第一个的话就是下午五点的时候去趟菜市场,今天准备自己做饭。 第二个的话就是去一趟水果店,买一点水果,最后的话去一趟那个餐角驿站,把这个包过去一下。 ok, 能够看到 tabulas 它生成的内容。第一个的话就是比较结构化,那每一项都分了一二三,看起来结构也是比较清晰的。第二个的话,我刚刚说话的时候有一些停顿,嗯啊之类的语气词,那这些全部都自动去除了,它只保留了主要的内容。 第三个,我前面说今天把视频封面做完,后面又说不做了,那 tablas 记录了这个备注,并没有把前半段说的不算数的这个话也记下来,而是直接保留了最后的结论,那这一点也是非常实用的。 第二个场景是邮件回复,那我经常会遇到一些英文的影片合作邀约,那之前都需要单独的开一个翻译软件,那现在的话就可以直接使用 tablas 的 翻译功能。 你好,我已经看过你们发来的这个产品资料了,我的初步规划是从几个真实的工作场景来介绍这个产品,而不是一上来就介绍一大堆的功能。我大概会先做一版六分钟左右的视频大纲给你们确认一下,如果你们有想重点展示的场景,也可以直接发给我。 ok, 那 大家能够看到那 typeles 帮我把刚刚说的完整的对话直接就转写成了英文, 也没有先生成中文再翻译的步骤,那直接输出的就是写好的英文文件,这样的话效率也是比较高的。他的措辞也是比较得体,没有任何错误。而且他也不是一长串没有换行的文本内容, 他根据我的主要内容分成了三大段落,结构上也是比较清晰的。除了能转写英文之外,在这个设置翻译语言这里,他能够支持一百多种语言的翻译,非常夸张。 第三个场景是搜索资讯,那我这里会用到它这个 ask anything 的 这个功能,比如直接提问帮我搜索今天的 ai 新闻, 那这样一篇完整的 ai 资讯就搞定了,那内容也是比较丰富了。我觉得这个真的是非常方便,我之前搜索资料的时候,通常都会连续打开好几个网页来回刷新,现在的话只需要按下快捷键,那然后语音输入就能够直接得到想要的结果了。 那这个功能不仅可以搜索资讯,你也可以问他任何的问题。呃,今天的人民币对美元的汇率是多少? 明天杭州的天气怎么样? ok, 那 只要你能够想得到的。之前可以用搜索引擎干的事情,那直接现在就可以只用 tablas 的 语音搜索,直接语音问一下,那效率非常的高。 第四个场景可以直接用 tablas 来直接生成内容,或者改写原本的内容。比如我上面演示了用它来翻译英文邮件,那效率更高的方式是直接让他帮我们写一封英文邮件, 帮我写一封英文邮件,回复对方语气要礼貌一点,大意是我已经看过他们发来的这个产品资料了,那我这边会更建议从真实的场景切入,而不是一上来就堆一些功能介绍。然后我大概会做一版六分钟左右的内容给他们,如果他们那边有想, 呃,比如重点展示的场景,也可以直接发给我,结尾要客气一点,不要太生硬。 ok, 那 这个的话就是他直接帮我写好的英文邮件,那使用的也是 ask anything 的 功能,它不仅可以直接问问题,也能够输出内容。当你需要他写作的时候,他就会按照你的要求来进行文案的一个创作,并且在这个邮件里面给我标注了邮件的主题。 如果需要写对方名称或者我自己名称的地方,也给我留好空白了。那一些重点的地方也进行了加粗,细节也是比较到位的。 这里是我让他生成的英文邮件,但实际上他生成中文内容的话也可以。 ok, 那 这个的话就是我刚刚用同一套提示词输出内容,只是把英文邮件的要求改成了中文,生成的质量也是非常好。 除了生成内容之外,你还可以直接让 tablas 来改写你的内容。我经常用它来提升我的提示词质量,比如我现在使用 codex 这个 ai 工具,我现在需要它帮我检查附件的视频字幕有没有错别字。画面上展示的呢?是原版的提示词,非常简单。现在我们可以选中这一段话, 请你帮我优化一下这段提示词,尽量专业,条理清晰,输出结构化表达。 ok, 那 tablas 就 会直接帮你改写原来的提示词,并且改好后的提示词比之前会更加专业,需求描述的也更加清晰,那这个的话在实际的使用中真的是非常有用。那即使你本来输出的提示词是非常简单的,那有了这个 tablas 的 加持之后,那效果也是立马提升。 ok, 那 以上就是关于这个 tablas ai 语音输入法的使用教程了,它目前是可以免费下载使用的,虽然有每周单词字数的上限,但对于大部分人来说应该也是够用的了。好了,那本期视频就到此为止了,我们下期再见。拜拜。

大家好,我是云雀,我自己开发了一款 ai 语音创作 ip 叫声会,它可以试听音色,设计音色,克隆自己的声音,也能通过标签让文本更有表演感。 接下来我用真实手机录屏,带你看完整流程。第一步,先试听音色,音色库里可以播放官方音色,判断声音的年龄感、语气、音质和表达风格。试听片段会保留原 app 声音,方便直接感受效果。 你好,欢迎使用声会。这你好,这是一段密蒙默认音色试听, 接着演示创建音色里的设计音色。你只需要写出想要的声音特点,比如年龄、性别、质感、情绪、语速和场景。声会会先生成一段试听,试听满意后就可以把它保存成自定义音色。 你好啊,欢迎来到生辉这段话呢? 你好啊,欢迎来到声音克隆,适合保存自己的声音,录制时跟读一段清晰自然,没有明显背景噪声的文本,也可以上传参考音频声称,试听后如果效果合适,就保存为自己的专属音色。 今天阳光很好,窗外有微风,我用平稳清楚的声音。 你好,欢迎使用声会。 你好,欢迎使用声会。有了自定义音色之后,就可以回到生成页面,用自己的音色生成语音。这里还会演示插入标签 风格,标签通常放在段落开头,音频标签可以插入到具体句子位置,用来表现停顿、笑声、语气和场景变化。 大家好,我在介绍我开发的软件省会,我是云雀 高级案例库,提供了更完整的写法参考。你可以先试听安利,再查看他的表演指令和生成文本。套用案例后,文本会回到生成页面,再用自己的音色重新生成 接口。那个老周啊,媳妇走得早, 你们求我垂脸,求我降下甘霖洗净。 你们求我垂怜,求我降下甘霖洗净这浊世。 可这世间的尘埃,唯有烈火能剔骨刮。 生成完成后,历史记录会保存每一段语音,你可以给语音重命名,方便后续管理。也可以下载或分享音频,把生成结果发送到微信、 qq 或其他应用。 接下来是语音服务配置,用户可以点击语音服务页面里的入口去开通小米 mimo 的 语音 a p i, 或者使用兼容的第三方服务,开通后把 a p i 地址和 a p i key 填到对应位置。保存前可以先测试连接 文本优化服务,用于辅助写提示词和打标签。你可以点击入口去获取归机流动的 a p i。 也可以使用其他支持 open i n 格式的接口,填写 t 后获取模型列表,选择模型并保存,就能让 ai 帮你优化语音文案,或者自动加入语气风格和音频标签。 欢迎关注我的账号,云雀课堂,这只是我目前小试牛刀的作品,后面还有一个更实用的工具马上发布,应该能帮助大家在工作中提升效率。官网和开验仓库地址已经放在画面里,感兴趣可以去看看。