粉丝4241获赞2.5万

各位朋友们,让我告诉你们,这就是 index dts。 二、它不是又一个普通的 tts, 它是语音合成的新工业标准,是把声音变成可编程、 可控制、可商用的基础设施。我想各位聪明的视频博主已经看出来了这段视频的不对劲了,对的,他就是口型不对,因为声音是我用 index t t s。 二、参考老黄的演讲生成的。那么恭喜你,在手机电量带数字一二三四五六七八九的情况下刷到这条视频, 瞬息成文兼荟萃今朝算力助人生,仅三到十秒人生参考就能高度复刻音色情绪,普通人生 特色,声线还原度都极高。很高兴这次来到中国, ok, 今天我就把我花了几天时间才跑起来的 index t t s。 二、部署流程分享给大家,只需要跟着视频操作就行。资源整合包我已放在评论区, 前提是你的电脑配置得满足这个条件,显卡得是英伟达显卡显存,且满足大于等于八 g, 例如博主自己使用的三千零六十十二 g 显卡。 这里说明一下,官方只提供了英伟达酷达生态的完整支持,所以 nvidia 酷达的支持是最好最成熟的。第一步,把资源整合包下载下来,保存到 d 盘 index tts 二文件夹, 解压出来就是这个画面。第二步, uv 安装在 d 盘 index ttr 文件夹里,按住 shift 鼠标右键, 打开 power shell 管理员窗口,复制粘贴回车这条命令因为我已经安装过了,他现在在帮我检查版本,然后更新到最新版本。等你们操作时,画面不是这的,别担心,只要看到有下载进度条就没事,这个过程需要等待点时间,我们直接快进到它完成时。 ok, 现在已经下载好了, 我们继续复制粘贴这条命令下载所需要的依赖,因为我下载过,所以接下来的操作我这边都会很快,你们只需要输入指令,等待下载时间即可。接下来我们下载模型权重,同理复制这条指令粘贴回车, 它提示我,我已经存在此文件,我们接着下一步操作,下载主模型,直接复制粘贴。 ok, 权重已经下载好了,因为第一次加载,它会自动下载一些小模型。这里我们来给它设置一个下载通道,就是必须走国内镜像通道,不许去国外 hugging face, 等他下载完毕,我们就可以直接启动了。这里我们在后缀加了一个减减 f p 十六使用半径度启动指令,如果你的显卡显存大于等于十六 g, 你 可以毫不犹豫直接启动,我们使用半径度启动速度会更快点,显存更省克隆,声音质量一样优秀。 当模型加载完毕,出现这个地址后,我们直接打开浏览器,输入 h t d b 二七点零点零点一七千八百六十这条地址后,就可以进入工作台了,此时你就可以随心所欲做你想做的事了。 大家好,我是黄仁勋,最后就可以双击一键启动直接启动了。最后 有道是妙算神机解百忧,劳心省却更忧忧。愿君此去皆如意,点赞关注共遨游!

上两期视频分享的 tts 语音类生成软件受到了很多朋友的关注,不少粉丝留言和发私信询问此类软件如何安装使用。今天就给大家一个傻瓜式教程,告诉你如何分两步在本地电脑部署另一款热门的语音模型 index tts。 在安装的第一步,也是最重要的一步,请参考我之前的视频。先下载并安装 pinocou 工具,这是可以帮你自动安装部署 github 软件的 ai 神器,安装时候一定注意选择路径为 d 盘或是其他盘符, 避免在安装多个程序后 c 盘空间不足。现在开始第二步,一键自动化安装 index t t s 方法也很简单,进入 pinocou 程序主页, 在首页你已经可以看到很多的 github 热门程序展示。请先选择搜索栏下方的 community scripts, 输入关键词 index tts, 在 搜索结果中选择带 pinocchio 的 脚本, 点击连接后,再次点击黑色的一键安装按钮,软件会弹出一个 get 脚本的下载确认框,点击下载,剩下的工作 pinocchio 会帮你全自动完成。 在设置好虚拟环境的同时,它也会下载程序所需模型文件,无需人工干预,省时省力。如果你的显存小于八 gb, 那 么你也可以选择之前视频介绍的优秀 tts 工具 voxcm, 它的模型体积仅为零点五。 b 程序安装完成后, index tts 会自动启动,可以通过软件的网页客户端进入使用界面。 使用方法也很简单,先在左面选择你需要克隆的语音文件,中间输入要生成的文字脚本,点击生成按钮,程序就会帮你生成对应的语音文件。本次视频的音频文件也是使用了 index t t s r 生成的, 感兴趣的朋友可以对比下前面两期我用 voxcm 配音的视频,告诉我你觉得哪款软件的效果更好。音频生成后,我们来听下效果。风浪越大鱼越贵,这 ai 的 水可比金海的浑水还深几分。 你以为它只是悄悄代码吐点文字的玩意儿?错了!现在多少人挤破头想往里面钻, 有人靠它赚得盆满钵满,有人栽进去连底裤都不剩。怎么样,你对这个生成效果是否满意?欢迎在评论区发表你的意见。 此外,该语音的原始音频来自于谷歌最新发布的 tts 语音模型,下期将为大家介绍如何在没有 gemini pro 版本 license 的 情况下,免费使用谷歌最新发布的 tts 语音模型。欢迎点赞并关注我的后续更新。

哈喽,大家好啊,今天我们录个视频来跟大家说一下我们 index t t s v 二版本啊,如果在我们自己电脑上运行比较慢,我们怎么来去给它提速啊?呃,然后就是我们如果在服务器上去进行一个部署的一个教程。大家都知道 v 二版本的话,它推出的这个情感控制功能,它里面有喜怒哀乐恐惧啊,什么东西的, 那所以它对于我们一些这个有声说呀,或者 a r 直播啊,或者是音频视频,音频生成的,这种需求量还是比较大的, 但是很多用户的电脑配置不够,你比如像我这样的电脑啊,我们之前在运行这个 excel 一 点零版本或者一点五版本的时候,运行是没有问题的,六 g 的 话运行都是没有问题的,没有压力的,但是一到这个 v 二版本的话,会发现非常的吃力。吃力到什么程度?我先给大家演示一下啊,我们现在来启动一下啊, 那么启动的时候我们正常来跟大家说怎么弄,你看到他在启动没有个五分钟,十分钟他启动不起来啊,就先慢慢启动去吧,先不管他了啊。那么呃慢的话呢,我推荐大家去找那种云服务器啊,或者说你自己去买的显卡,现在显卡价格也挺贵的啊, 服务器的话一天的话也就几块钱啊,我还推荐大家用这个服务器短期的来过渡一下啊,如果后面你资金多了,你可以去换个配置稍微来高一点的显卡。好,那么云服务器的话呢?我推荐大家,因为我也测了很多啊,我给大家推荐这个,这个平台叫智星云,他的价格来说,相对于我找的其他平台的话,价格还是比较便宜的啊,给大家看一下啊, 像他的二零八零,三零八零才七毛钱,四零九零才一块,三毛,二,五零九零才两块钱。那么我们在用的时候,基本上像四零九零啊,五零九零啊,三零九零这种就完全足够我们用了,所以我们就不也不用读,太贵了,像这种太八十个 g 的 我们也用不到, 毕竟你这个 tds 它是一个语音合成的啊。那我们就以四零九零为例啊,我们先出一个四零九零的,这个东西在此之后,在此之后呢,还有个基础呢,我们要准备一个网盘啊,等下我们要把这个整合包去下载下来啊,我们来以四零九零为例。好,那么我们进来之后,我们先注册账号,然后在算利算利市场里面找这个四零九零,我们来弄一下 啊,我给大家说怎么弄,一步步的来,跟着这个来自动续租,开不开?根据你自己的情况去选,这个镜像的话,大家随便选个就行了,因为到时候 啊,如果说遇到这种情况下没有可用的 gpu 资源,那我们就要去换一个了,说明四零九零已经被出完了,用的人还是比较多。那我们用五零九零来试一下啊,五零九零一样的啊。 啊,五零九零的,它没有 win 四版本的啊,没有 win 四版本呢,我们再换一个啊,因为好多人用那个 linux 系统啊,他用不习惯,他用不习惯啊,我们用这个二零八零,嗯,有个三零九零,三零九零也出完了, 看这个有没有,我们就尽量的选择 win 十版本的啊,他这个环境无所谓啊,环境真的无所谓,因为等一下我们会用自己的这个,我们要用自己的环境,这个是四十八 g 的, 四十八 g 的 话也是可以的,没有问题啊,这是 a 四零的这个显卡。好,我们现在来租赁一下啊, 好,我们做好之后,我们处理好之后,我们就等它启动就行了啊,我们就等它启动就行了。为什么推荐大家用这个 windows 版本呢?因为 windows 版本我们平时自己用的比较多啊,用的比较多,所以用这个比较我们操作起来大家都能看得懂,如果用 linux 系统的话,到时候好多人,尤其作为一个新手新手来说啊,可能会觉得比较麻烦啊。 然后我们等一下就下载一个跨客网盘,然后因为这个整合包里面,整合包都是放在跨客里面的,这个一点五的话,我,我是给它放到移动云盘里面啊,移动云盘的话它是不限速的,但是我们这个教程主要是讲 vr 版本的啊。好,它现在已经,我看看,正在启动啊,正在启动。好,那这个时候我们电脑的话都有个远程窗口啊,如果说没有远程窗口的话啊, 我们要 win 加 r, 然后我们输入一个 m s t s c 啊,我们来 win 加 r, 然后输入这个指令,我们打开它的这个远程窗口。 远程窗口这里的话啊,等下怎么填啊?其这运行中,运行中的话就好了,我们点查看连接方式,我们复制一下远程桌面的地址, 粘贴过来,然后连接。连接它需要我们提供账号跟密码啊,账号基本都是 vip super 啊,密码就是复制一下。 好,我们给它粘贴过来登录啊。好,那这样的话我们就登录到服务器那边去了啊,如果说你不会用,那你也可以用用用这个 web 的 这个方式一键登录,但 web 方式你看用它有两个鼠标用的比较比较烦人啊,我们就用这个远程窗口来登录啊,我们点试 好,那么我们的远程窗口就弄好了啊,如果说你不会弄啊,我们点击这里啊,我们点击这里,然后点这个点击右键。讲错了,点击右键我们点运行也是可以的,输入这个 m s t s c 啊,或者我们在直接里面输入远程桌面 也都可以的啊,都可以这几个方法啊。好,那么我们进来之后,那么我你看它里面没有跨客,我们首先第一步我们就下载一个跨客网盘啊,用百度的啊。好,我们来下载一下我们的一个跨客网盘啊, 我们直接安装就行了啊, 你看我们从录视频到现在已经这么久了,我这个电脑都没有启动起来,所以这个如果说电脑配置比较低的朋友用的话啊,还是非常的痛苦的一件事情,我们让他再慢慢的去去弄吧,我们等他安装。 哇,终于启动起来了啊,现在我们视频我看已经录了多久了,录了六分钟这个东西才启动起来。好,我们来看一下,我们现在来,既然本地的已经启动好了,我们看一下本地运行它有多慢啊, 大哥的问题,好,我们就少弄一点吧,因为多了他也弄不了,我们现在生成好,生成让他生成去吧,我们现在看一下时间啊,现在是这个视频的七分十七秒,让他慢慢合去吧,不知道要合到啥时候啊。好,我们来到我们的远程窗口这里,我们看一下有没有下载好,好耐心的等待一下。 好,现在我们的跨客已经安装好了,安装好之后的话呢,我给大家说一下怎么来去下载啊?有两个方法去下载啊,如果说你是跨客会员的话,那你就不用多说了,直接去下载就行了。如果说你不是跨客会员,我等下给大家说怎么去下啊?我登录一下啊。 好,这个是我们的云服务器,然后等一下你们要去下载的话,下载这个就行了,弄进来, 然后点进去把它都抠掉啊,我们选那个 v 二五版本的就行了,我们保存保存一下就行了, 然后查看一下。好,我们不是已经保存好了吗?如果说你像我是跨客会员的话,我就直接下就行了,对吧?它下载速度不受限制了。如果说你不是跨客会员,怎么下?给大家讲一下啊?如果说你不是跨客会员,看到这个三道杠没有?这里有个快传啊,有个快传发送网盘文件, 我们点来自分享的,然后选择刚才我们这个东西添加,然后我们下载到本地,他,他也是可以不限速下载的啊。这是,这是跨过我们的一个 bug, 你 们能看到这个视频是非常有幸的,因为我是会员啊,因为我,我是跨客的尊贵的 vip 会员,那么我就我就不用这个方法了,我就直接下了啊,我们下载到桌面吧。 好,如果像这种下载速度比较慢的话呢,是因为我们刚开始在租赁的时候啊,呃,我们的宽带选的比较慢,选的是三十二兆的,那我们这里就暂时先给他提升一下。提升到啊,五百兆吧,提升到五百兆吧,先让他快点下完, 我们给他停到五百兆,看下的会不会更好。我们先给他下完啊, 好了,刚才我们这个合成的东西也给他合成好了。刚才我们本地的啊,看到没有?本地的也合成好了。这个呀,就是我们精心制作准备的纪念品,在本地的话合成还是比较慢的,本地的合成实在太慢了,所以咱们本地的咱就不演示了啊,这个本地只是给大家看一下配置机,他有多慢,多影响工作效率。那我们先把本地的先给他关掉啊, 等下我们就全部在这个服在这个服务器上面讲了,下完了我们已经刚才已经给它下载到桌面上去了啊,再把它关掉了。下载桌面之后呢,我们还有一个,我们要下载一个这个三六零的这种三六零压缩软件啊,我们要给他解压一下,我们先把它全屏啊, 再下载一个三六零压缩啊。为什么用三六零呢?用 v r r 也行,但 v r r 它不是有那个啥嘛,它广告烦人嘛,这个三六零压缩它是不带广告的啊,别找错了,一定要找它的官网啊,这个啊这个这个才是的啊,我们直接解压啊,直接下载啊, 下载完之后我们安装一下, 如果说你们也出现这个东西啊,我们点击这个更多,然后把这个拉下来啊,拉下来下次他就不会再提醒了啊,点下试,后面他就不会再提醒了。好,按下灯安装 好,我们安装好之后呢,我们这个东西我们这个就可以了,然后我们直接给他解压到桌面上就行了啊,直接给他解压,解压的过程中不要有中文路径啊,千万不要有中文啊,它的路径啊, a few moments later。 好, 那么我们已经解压结束了啊,我们解压结束之后,我们解压结束之后,你看我们这里有完整的这个运行包啊,我们直接点这个启动器 bat 啊,它就可以自动运行了 啊,这个这个包呢是来自于我们这个 b 站大佬王志峰的一个做的一个版本啊,然后这个版本的话我也进行了一些简单的优化啊,做了一些简单的优化。 好,我们现在来启动他啊,因为他第一次启动的时候他需要加载啊,他需要加载这里面的每一个这种模型啊,他需要加载这些模型,第一次启动的话会比较慢啊,后面的话就比较流畅了。 那么好,我们现在启动起来了啊,启动起来之后,我们来看一下这个合同速度快不快啊?大哥的问题,这也就是我的问题, 这个呀就是我们精心制作准备的纪念品,大家可以看到这个色泽和这个材质啊,哎呀,多么的光彩照人。好,这个升速的话相对相对于我们自己本机的电脑上面来说还是快了很多的啊,我们再来试一下。 好,这个是我们的参考音频,我们的现在的这个情感控制,他的与参考是与音色参考音频相同,也就说现在我们在使用的时候他的所有克隆出来的,呃,不是克隆,是生成出来的音色,就是跟我们的原就是我们的参考音频是一样的啊,你就需要我这种专业人士的帮助, 手无缚鸡之力的人进入雪山狩猎一定需要最老练的猎人指导,不方便动手,大家可以听一下,这两个音色是差不多,如果说你不想用这个东西啊,有人说就是我想用我的这个音频参考文件,可不可以?音频参考文件的话他比较难搞,因为你要保证你每一个这个音色啊,大家听一下啊, 贵妃三眼几个人不得信口雌黄。好,那我们就用用这个音色,我们来试一下啊, 共跪。三眼几个人不得信口雌黄。那这样的话就是需要我们提前把这种情感的这种音频啊给它弄上来,那么这个参考参考音频的话,就说实话就不太重要了,那我们现在我们使用参考音频,我们来试能试一下啊, 你就需要我这种专业人士的帮助,就像手无缚鸡之力的人进入雪山狩猎一定需要最老练的猎人指导, 尊贵申言,岂贵人不得信口雌黄。大家听得出来这个我们生成的结果跟我的参考音频的这种啊语气啊,情感保保持的还是还是非常不错的,但我们再来换一个这个情感文件啊,在我们这个一个这,这英文我也不会读啊, 我们听一下,今天呢咱们开一部这个是老郭的啊,我们来听一下啊,再来重新生成一下看看啊, 就大家在用的时候,所以说用这个 index vr 的 时候啊,我们在用的时候,这个双利市场里面的显卡啊,我们尽量就选那种显得比较大的,像四零九零、五零九零这种的啊,刚才我选的哪一个我也忘了啊,我选的好像是 a 四零四十八 g 的, 按理说这个应该也不差呀。 啊,来了来了,你就需要我这种专业人士的帮助,就像手无缚鸡之力的人进入雪山狩猎一定需要最老练的猎人指导。那他就口齿清楚的那种啊,他说话就是一板一眼的那种啊,我们再来,我们再来,换个音色, 就我连吃,就是我在正常的那个面馆店,凉面我也是带肉的,我只是去吃小龙虾的时候,不会就是那个凉面是没有肉的啊,他这个语气的话就有点像我们的口头语啊,还平舌翘舌不分的那种, 你就需要我这种专业人士的帮助,就像手无缚鸡之力的人进入雪山狩猎一定需要最老练的猎人指导。好,这个是我们使用这个情感的啊,然后我们还可以使用这个情感项链啊,情感项链的话它就有喜怒哀乐,那么我们调的话,比如说我们用喜,我们来升腾一下啊, 也就说它不仅可以使用你的这个参考音频的这个音色,你可以,你也可以说参考音频用一个也是可以的啊,我们听一下习, 你就需要我这种专业人士的帮助,就像手无缚鸡之力的人进入雪山狩猎一定需要最老练的猎人指导。这个好像听的不太听出来啊,我们听一个不开心的这种啊,听个哀的。 你就需要我这种专业人士的帮助,就像手无缚鸡之力的人进入雪山狩猎 一定需要最老练的猎人指导好,那么我们可以通过情感的控制来去给他合成不同的这种情感表达的语句啊, 然后像下面这些灯的话,都是已经系统预制的,系统预制好的,我们他是一个参考音频的,那么通过这个我们也可以看得出来,我们 index 的 v 二版本啊,他可以通过你自己上传的参考音频的音色来去生成,他也可以通过这种情感的参考音频来去生成,甚至于说啊,我们可以通过这种 文字来表达喜啊怒啊哀乐啊,我们再换一个低落一点的,我们来试一下啊,这个就是 vr 版本的,它的强大之处,它可以深层这种情感,那当然了,这个也是根据你的使用场景来去来去选择的啊, 你就需要我这种专业人士的帮助,就像是无伏击之力的人进入雪山狩猎一定需要最老练的猎人知道, 那么好,那到此的话,我们的 index 的 tds v 二版本的哈,我们的这个,呃,怎么去租,怎么去?怎么去下载,怎么去安装,你看大家都看到非常的简单啊,整合包都已经给大家弄好了,其实 我们现在来回顾一下也是非常的简单,就是到我们的自行云上面去选一个服务器啊,选一个服务器租赁好,租赁好之后然后给它开机,开机好之后我们通过这个远程窗口去登录它,登录完之后,哎,我们在里面下载一个这个这个这个这个这个整合包下载下来解压出来, 检查出来之后,我们双击启动就可以了啊,启动好之后我们就可以在里面去进行调试呀,安装啊就可以了,那么我们生成的音频的话呢,我们可以直接给他下载下来,就可以直接用了啊,我们点这里他可以直接下载就可以下载本地了啊, 那么好,那么教程就录到这里,大家在使用中遇到什么问题的啊?欢迎大家一起来留言多交流啊,谢谢大家啊,那么这个远程窗口我就给他关掉了,那么我们的服务器用完之后,我们要给他关机。怎么关呢啊?在这里啊,我们可以给他直接提前结束哎, 我们直接给他提前结束这个就可以了,你不提前结束他,你等他到一个小时以后,他也会自动关机的。那我们就因为我这个教程已经录完了啊,我们就提前给他结束掉就行了啊,那么到此一整个的这个使用我们就完成了。

我看网上有好多说想把三资的地块投放到奥维地图上,但是很多人说的模糊不清,我今天给大家录个这个视频, 嗯,首先从三字上要那个地块上要把那个 h a r 文件下载下来,我这没有三字那个,那我没有三字的账号,我就给大家演示一下怎么弄吧。 嗯,首先你登录那个三字那个账号之后,然后点到这个网络这个地方看,点到网络这个地方, 然后点清除,先把这个这个日期全部清除,要记得保留日期,看把地块加载完了没有。然后三资,三资那个地图上边 那里显示有已完成,未完成还是总部地块哈,然后你点大勾,点 f 五,按 f 五, f 五刷新,然后然后这个这个地方他就会拼命的加载,拼命的加载,然后你这个时候就就在那个地块上,呃,放大,缩小,放大所在务必把所有的那个地块 就是全部加载出来。加载完之后,你看这里就是这么一个状态,看这里就是这么一个状态,然后你点这个地方,这里有一个下载,看到没有导出, 点导出的话,然后你这个时候,嗯,就随便找个地方把它下载下。名字,如果你用那个三字的话哈,嗯,他会,他会那个啥?嗯,写的是你网站上的 ip, 这你随便标个一或者二,然后保存, 保存之后这就在你的下载的下载的文件夹里边,就是在这里边看看到了没有这个 啊?这,这就是下载这个 h a r 文件,下载 h a r 文件之后,我们然后进行下一步, 这边是我已经下载好的这边这就是三点 h a r 哈,然后这个时候你打开你的浏览器,打开 deepsea, 或者是或者是那个豆瓣都可以。然后你,你跟他说让他给你生成一个那个 呃 diffic, 或者是那个呃,生成一个那个,这不是,就是这个 h a r 转那个呃 k m i l 坐标的这个,然后你让它给你生成一个代码, 看,这不是,这就是我最开始生成,其实最开始第一步它就生成了,只不过后边它没有分图块,然后我就让它给改进了。这代码生成出来就很简单,主要是电脑要装个那个 pass 那 个环境,看这不很简单, 你不会的话,那个那个豆包或者是 deepsea 的 话,他会教你一步一步的做,反正是很简单,他生成出来的代码,这不就是这样子的,这个是我已经弄好的, 这不,这是我已经弄好的,这不这个代码一共才好像一百来行,这就这么多。 然后然后最后生成完之后,我让那个啥,呃,我让那个我把它打包成了一个软件, 是不是打包成一个软件?就是这样子的,打包软打包的方法也可以直接去找 ai 问,问完之后就是这样子,看把你那个那个刚才这个 这弄它这下载的 h a r 文件,对吧? 这边打开 桌面 是不是直接打开,然后它就开始转换,点开始转换 好,然后转换完毕之后,这就这就很简单了, 转换完之后它会出来一个这种,这不是三 k m k m l 这个东西,然后打开你的那个奥维地图,嗯, 这个这个是我已经导入的,然后咱们再把它隐藏掉,看,然后这边这个三,然后看他就倒进去了, 然后导入这些地图的斑块,其实它是有偏差的,它是有偏差的,看到没有它是有偏差的。然后你这时候要点到这这不,然后右击在地图上整体移动,然后这有个这, 你看这是写着吗? 按这个 ctrl 键把它拖到你要对齐的那个位置,其实这也能对齐,给在这对齐也行,这不点这个把它慢慢对齐, 看 对对齐之后,然后你在这个系统这个地方把这个啥,把这个保存一下,然后你的地块就出来了,看你随便一点好看 他就都有,看就出来了,看到没有? 至于那个啥,那个那个,呃,这个安装的话,它是就是在网上下载一个那个 part, 拍摄那个那个环境,反正就是 p y t h o n 这个哈, 就是就这个东西你一搜就能下来,下来很简单,安装完之后那个啥安装完之后,反正你要是不会的,让豆包一步一步教你, 让它,让它生成一个,生成一个软件,生成一个那个转的转的那个代码就可以了。看这它就它就很简单,你就跟它给这个 h a r 转 k m i 的 坐标提取,看它就它就给你转,转成了 看, 对,就这样子,这个很简单, 这个代码,嗯,我看后边能不能做个 txt 文档发到后边这个小软件我估计是发发不成的,想要可以,就是说是那啥私信我也行。


前两天,我在抖音分享了两款大模型的核心原理,很多朋友点赞收藏。今天,我们把镜头对准大模型背后最真实、最硬核的成本密码。 token 消耗的真相。当你和大模型对话,让他写文案、做总结、 写代码时,你看不见的算力洪流正在奔涌。而计量这一切的最小单位就是 token, 它不是虚拟货币,不是积分,而是大模型理解与深层语言的原子级单元,是帅力、显存、电力的统一计量标尺。从技术本质看, token 是 文本被模型分词后的最小片段。一个汉字、一个标点、一个英文字词 都可能是一个 token。 中文语境里,一个汉字约等于一个 token, 英文中约四个字母或零点七五个单词对应一个 token, 空格标点换行, 五一例外,全部计入消耗。每一次交互都在消耗双重 token 输入。 prompt 的 token 加输出, completion 的 token 输入是你提出的问题。上传的文本历史对话,上下文输出是模型逐字逐句深层的回答,这不是简单相加,而是算力的真实对价。输入决定理解深度 输出主导计算强度。为什么输出 token 更贵?因为大模型生成文本是自回归推理,每生成一个 token, 都要基于全部上下文做一次完整计算。上下文越长,计算量呈平方级增长, 险存、债用、电力消耗、 gpu 折旧都随 token 数量同步攀升。 token 就是 大模型世界的算力通货。你必须知道三个关键真相。第一,上下文窗口就是记忆边界,八 k 三二 k 一 二八 k。 token 决定模型能记住多少,处理多长文本,超出上限,内容被截断,逻辑必然断裂。第二,多轮对话会累积消耗。每一次追问都要把历史对话重新带入计算,聊的越久, 投肯消耗越快,成本限性上升。第三,计费按真实消耗结算。国内模型多以签投肯为单位计价, 国际主流模型输入输出分离定价,输出单价往往是输入的数倍。一次长文深沉,一次深度分析,背后都是精确到 token 的 资源消耗。很多人以为 ai 是 免费的,是无限的, 其实每一次思考,每一行文字都在消耗真实的工业级算力。 token 的 背后是数据中心的灯光,是芯片的运算,是电力的流转,是技术谱汇背后 沉甸甸的工程成本。理解 top, 你 就看懂了大模型的效率、边界、成本逻辑与能力上线,它让我们更理性地使用 ai, 精简指令,清理上下文,聚焦核心需求,既提升效果,也降低消耗。 ai 的 智能 藏在模型的架构里,而 ai 的 真实代价藏在每一个 token 的 流动中。敬畏技术,理性使用,让每一次交互都物有所值。本地部署 vs 云端 token 讲到这里,很多人会问,本地部署大模型是不是就没有 token 消耗了?答案是, token 依然存在,但计费逻辑彻底消失。本地模型同样会计算 token, 占用上下文窗口, 它的理解逻辑生成机制和云端模型完全一致,区别只在于云端按次付费。本地一次性投入 云端大模型用的是别人的显卡,别人的贷款,别人的电费。所以用 token 计价,本地大模型用的是你自己的硬件,自己的电力,自己的存储空间,所以没有优次计费,没有额度限制,没有隐私泄露风险, 你可以无限生成无限对话,无限处理长文本,不用担心 token 超标,不用担心对话被记录,更不用担心突然涨价, 服务下架,但代价也很真实。本地模型的性能上线,由你的显卡决定,显存不够,模型跑不起来,算力不足,生成速度就慢。一句话总结,原端,模型买的是服务,按 token 付费。本地模型买的是自由,靠硬件支撑,没有绝对的好坏,只有场景的选择。我是小白,持续用专业与温度 拆解大模型的底层逻辑。关注我,下期我们讲如何高效优化 token, 让你的 ai 使用更省钱、更强大。

ok, 今天我们讲一下亚马逊的一些 ai 工具,亚马逊现在不知不觉也出了很多的 ai 工具,比如说一些卖家助手,然后一些那个排布,然后 呃视频工作室 mistine, 以及关于一些 ai 生成器,还有前台的 alexa, 然后从杭到拉盘点一下。首先看一下我们的这个卖家助手,卖家助手的话是作为我们官方的唯一一个集成工具, 可以支持中文英文,整体非常的自然,然后又是免费,又没有什么封号的风险,就是用一些做上一些链接, 然后在采纳率上面也有基本上非常的高,他们调研官方采纳率百分之九十以上,也非常节省时间,从奥丹纳的话,这个品可以给到康康爆了。然后第二个就是关于前台的一个 页面,前台的页面的调整,目前的话前台页面调整比起我们的一二 p 来讲只能长这个样子,只能看一下简单的一个销售额,这差距还是非常大的。 然后另外呢它也有一个这个 ai 呃工具,然后说可以帮你查你店铺的一些销售额,但是我们发现的话,这出来的这个 s 它根本就不是我的 s, 然后出这个链接的话都已经遍购了。 然后另外呢我在想,哎,如果说他可以查到别人的 s n, 那 是不是可以去反查别人的这个流量?当我去通过别人的这个产品去反查的时候,反而他又找不到这个产品,所以这个东西还是很奇葩,直接给他拉完了。 然后第三个工具的话就是关于我们这个创意工作室,创意工作室的话大家可以在广告后台可以看得到,呃,有一些图片生成,还有视频,还有一些灵感和图库,呃可以上传一些呃提示词,然后来去产生一些那个产品的图片,基本上的话生成的时间还是比较慢的,基本上八十多秒才能生成一张图。现在很多的工具可能 几秒钟就出一张图,或者是十秒钟就出一张图,然后任务可能就消失了,也没有提前,这个秘密基本上还是有很大的问题, 但是呢,好在他还能够产生一些基本上能用的一些图,并且的话是亚马逊官方出来的这些图,那会有一些侵权或各方面的风险呢?这个亚马逊里面都有,就是还好,所以综合来说的话,基本上生成图片还可以 给他一个那个 npc 吧。然后另外的话,关于生成图片这里其实还有另外一个东西,就是关于生成视频,生成视频这里可以批量的去生成六个视频,然后整体的生成出来了过后,基本上就是一个动态图片,还说让我们去调整这个文案和这个音乐,基本上就就是一个动态 ppt, ppt 的 一个视频纯粹拉完了。 然后接下来我们讲一下这个 ai 生成 listing, ai 生成 listing 的 话,呃,在我们在创建 listing 的 时候,可以直接给一个标题啊,这个标题这里的话,它就会自动去生成这个,找到这个类目,然后在前台去找一些关键词,我们去反查了一下,基本上也不会涉及到侵权的问题, 所以这里还还能补充一些关于我们的这个一些属性。其实我们这运营来讲最烦的就是这个事情,有很多的一些属性,让这个也填,那个也填,不填就报错,然后有的时候也不清楚到底是什么意思,也不是怎么去填,但他给一份这样的模板,我们可以去改,这个还不错啊。综合来讲的话给一个人上人。 呃,另外的话就是关于我们的 ai 板块, ai 板块的话其实也有一个自动生成图片,在我们在选 ai 的 这里点了 ai 已准备就绪, 然后我们可以在这里选择生成内容,选择生成内容的话,它需要你收集一些图片,比如说你的卖的是一个什么玩具,然后它也会去给你生成一些图片,这个图片生成的话角度也不对,透视也不对,基本上,呃,和那个 ai 生成主通差差距还是比较大的,基本上就是 ppt 生成动画 啊,动画来讲也可以拉完了。最后呢,我们看一下前台的 alexa, 以前的话叫 rovis, 现在现在叫 alexa。 alexa 的 话现在整体的可以做一些市场调研,比如说你做 一些产品的一些尺寸啊,或者是一些重量啊,或者价格调研。另外的话还可以去推荐竞品,比如说这个产品他有哪一些相关的一些竞品,我们可以推荐竞品啊。最后的话就是,呃,我们可以去做一些那个同意,就比如说你这个产品需要 等他降价,现在卖一百,等他降八十,我再买一件加购,他现在可以实行一件加购。所以这个东西还是比较智能的,不论是写文案啊,反推我们的赫斯摩的这个意图啊,还是说调研尺寸和性能啊,查历史价格呀, 或者是自动购买啊,这其实都还不错,综合来讲的话,给一个顶级啊,这基本上就是我们的这个 ai 测评的工具,谢谢大家。

哈喽,大家晚上好,最近我的本地视觉自然库已经全部写完了,这些是从网上抓到的题词和其对应的图片,然后下来是视频生成的库,也是自动从网上 tab 上去抓取相关的题词和对应的展示效果。 下来是 web ui 的, 这是自动去解锁一些 ui 组件库,然后打上合适的标签,下来是设计规范,这也是从 tab 去找相应的设计规范。最后一个是 skill, 主要是解锁我们的 skill, 为 scale 打上一些它面向于场景的一些标签,方便日后的一个查找。目前目前解锁到的 github 总数已经有九百多了, 如果大家想要获取我的吉他项目,一共有两种方式,第一种方式就是去我的 github 上去找我们的 prompt vision 这个仓库, 通过 github 进行一个自己的下载。第二个就是去我的嗯 ai 点 i c u 这个网站,在资源里面找到我们的项目链接之后,我会把网盘的地址放在这块,大家可以直接通过网盘进行下载。下来再跟大家说一下之后想做的一个项目全自动的运营我们的一个图文的一个账号, 首先会开,开通的平台应该就是小红书和微信公众号了,通过我们的热点雷达去定时的去检测一些热点信息和我们所关注的领域,然后形成我们的选择题,最后通过 ai 形成文章。最后我们只需要通过去审核,然后进行一键发布, 这是仪表盘界面,仪表盘界面主要就是展示一些文章的表现,文章的分布状态和之后我们可以进行转化的一些选择题内容,这些都是由 ai 自动给我们分析出来,这是创作者画像,也是 ai 通过我们本身账号的一些内容进行一些定位, 为我们之后的一些图文方向做一些指导性的建议,我们可以把它作为一个参考意见。 就是热点雷达,热点雷达就是通过一些定时任务,去网上不同的信息搜索员去解锁一些相关的热点信息,大概想做内容就是这些,如果大家日后想要这个项目的话,可以关注一下我,等我日后也会把它开演出来。

做 tommy 的 宝字看过来,七个动作加两个避坑点,学会直接少走三个月外路,先记核心操作流程,五步走不慌!一、 erp 批量选订单,选渠道。二、申请头层单号。三、打印头层面单贴好。四、把货发给货代仓库。 五、后续交给货代接手货到美国中转仓后会免单。重点来了,换面单分两种情况,选 erp 时一定要留意,有自动补录功能,系统自动选最便宜的尾程 退免单给货代海外仓换票贴就好了。二、没有自动功能,手动从特务后台导出官方面单,再上传到货代系统, 别漏步。这两个错绝对不能犯,轻则警告罚款,重则前功尽弃。一、不虚假发货,货没到海外仓,千万别在系统点发货,判定虚假发货,罚款加警告,跑不了。二不超卖歪。二不用囤货,但库存必须钉紧,超卖会冻结资金,下架商品 之前跑的量全部白瞎。最后总结, vr 模式的核心优势就是国内直发加平台尾成,既减轻库存压力,又能快速测评冲量。那前提是把刚才说的七个动作做对,节点卡准,避开两个坑, vr 这条路就能稳稳跑通,收藏起来反复看,避免操作失误。

今天手把手教大家如何把开源大模型塞进你的普通电脑里,以后使用,不花任何偷看费用。这条视频有点长,点赞收藏好。我会和大家讲清楚,哪些人需要做本地部署,什么行业适合本地部署,以及什么硬件匹配什么样的本地部署需求。 ok, 咱们直接开始我自己平时服务的客户里,向政企、医疗、教育这几类, 他们在做品牌战略咨询的时候,都会延伸出一个新的需求,帮他们做大模型的本地部署。尤其是政企的科研部门。用通用大模型有一个很明显的问题,它没有你的私有知识库, 也没有针对你所在的行业做过适配和微调。咱们平时用拆 jpt cloud 或是国内的大模型查资料、写报告完全够用。但一旦涉及行业机密、私有语料、内部文档和客户信息,这些内容就不适合直接丢进通用的 ai 对 话里。这时候本地部署的价值就出来了。 第一类,适合做本地部署的人是对数据安全要求特别高的,比如你们企业有很多资料不能外流。第二类是内部知识体系非常反复的企业,比如你们公司有大量的产品资料、培训手册、制度文档,员工每天要反复查看, 这种情况下接一个私有化的大模型,价值非常大。那我们自己的电脑能不能做本地部署?答案是可以,但要看你的需求,咱们一步步说。第一步,我们先来选模型。首先我们来看二零二六年开元大模型的综合排行榜。第一档,入门体验级, 适合日常回答清量知识库对硬件要求是最低的。第二档,使用生产级,在普通消费级 gpu 上就能实现,很多企业内部场景都能 carve。 第三档,高阶推理级,在代码和推理能力上更强,适合有明确业务目标、预算相对充足的团队。第二步,咱们再来看看不同模型匹配什么样的硬件。如, 如果你是个人体验,跑个小参数模型,一台高配的游戏电脑就够用了。但如果你想多人使用,要求响应快、效果稳,接入公司的知识库和业务系统,那就是企业级部署的标准了,需要做算力或者上服务器。第三步,实操来了,我们以这个模型为例,它在多项公开扳指 mark 里 代码能力处于同量级的领先水平,而且对中文用户比较友好。那具体怎么做?首先,打开欧拉玛,这是本地大模型的运行工具 icon, 是 个非常可爱的羊驼,只需一行命令就能搞定。安装和运行 完成之后,下一步打开终端,输入这行代码,回车一下,它就会自动下载或启动本地模型。如果你不喜欢用命令行,也可以选择 i o m studio, 它是 g u i 图形界面,有聊天入口,更适合非技术背景的用户。好了,今天的分享就到这里,记得关注人工雨林,我们下期节目见!