粉丝1015获赞6707

先试听一下这个声音克隆的效果,红楼梦告诉你上流社会有多渣,金庭梅告诉你中层社会有多烂,水浒传告诉你兄弟义气有多假,西游记告诉你,就算你有天大的本事,照样走后门拉关系怎么样? 很棒吧!重点来了,这些全是免费的,这是 b 站开源的 index tts 二,直接碾压市面所有付费工具。 ai 配音这行有个特点,开源免费的比收费的还要好用。 花钱买声音克隆工具是在交智商税,为什么?因为顶尖算法都在开源社区,商业软件只会包装收割使用超级简单。看好了,一句话,三秒 克隆任何人手拖个音频进去,输入文字,点击合成按钮搞定。想要更细腻的效果,这里还可以调整情绪、语调等细节。使用 index tts 二有三种方案,第一种在 hugging face 免费试用,但每天字数限制严格,需要不断切换 ip。 第二种 整合包,本地部署,但是对 gpu 硬件要求太高,普通电脑根本跑不动。第三种也是我最推荐的 用 google collab 白嫖专业的 gpu, 别人花几百块买的劣质效果。我用 collab 免费获得顶级方案,每天四小时免费额度,多注册几个谷歌账号,轮流切换,相当于无限白嫖。 collab 直接给你 test 了专业级显卡,几分钟就能部署完成, 能用开源工具降维打击的事,决不给资本交保护费。站内搜索关键词就能获取 collab 一 键部署链接,复制链接粘贴,跟着帖子中的教程操作就行,点个关注不迷路。我是阿杰,我们有缘再见,拜拜。

区呃一年的大学生免费认证啊,这个还是呃非常火爆的,然后群里面也有很多人了,然后大家基本上都通过了, 然后想要出一个详细版的呃文档 pdf 文档那个教程,所以我这边就做好了,然后给大家看一下这个怎么呃一步步流程怎么弄的。 然后呃这边是最终订阅成功的一个状态啊。然后第一步的话在这儿, 然后呃首先需要大家去登录一下这个 ipad 的 这个网站,然后去看一下我们这个自己的 ip 地址是什么一个状态。那么这边的话有两个信息需要去看一下,第一个这个 control 的 话肯定是 u s 的, 然后第二个的话,呃这边这个 呃分数的话尽量越高越好啊,保证是个绿色的就行。然后这个要求的话,是这个后面说的那个 ekey 这个官网的这个作者的要求。然后呃我们也有一些小伙伴呢,呃去直接跳过了这个 ip 地址的一个验证,直接用自己的这个呃原 ip 地址啊,就实现了这个认证。那大家也可以去直接跳转到我这个文档的这个第四步, 然后学生开始学生认证这个地方直接去认证啊,但是如果说你直接跳过呃第二第三步去认证了,然后在这个 e k 的 官网出现这个提示的话啊, ip likely been been band, 嗯,然后呃出现这个提示的话,希望大家再跳回来啊,从第二步我们继续开始一步步操作,那第二步是什么呢?就是我们需要去呃 让我们的 ip 地址变成 us, 以及呃非常纯净的一个状态, 那我们需要去买一个呃我们说的一个,呃静态的 ip 地址啊,相对比较干净一点,那这个静态 ip 地址我们在这个官网上可以去买,然后在这边选择这个,呃长静态 s p 啊,然后点这个购买就可以了, 然后下一步在这个购买这个地方呢,我们这边选 u s 啊,然后这个地方注意我们选这个七天啊。呃, e k 的 那个官网是作者呢,建议我们, 呃直接在他那个上面去买,然后,呃我在那个指纹浏览器里面看了一下,他最便宜的需要买三十天啊,比较贵,所以我找了一个这个网站啊,这个网站还比较良心的啊,最少可以买七天,那七天的话大概就是十二块钱啊,还是比较低的一个成本。 那我们购买完之后呢?呃会回到这个,呃, novel procs 啊,这个官网回来,回来之后呢,提取一下 ip, 提取一下 ip。 呃,这个我因为已经提取了,所以我截不到图了。那这个地方的话,呃,我记得里面会有 family 啊,或者一些专线的字样的,然后大家尽量挑这个家庭或者专线的字样,这个相对来说呢更纯净一点。 然后,呃你挑选完之后确定之后呢?哦,我们会到这个界面,再回到首页,然后这下面就会出现 啊,我们现在挑选的这一个,嗯, ip 地址的一个信息了啊,然后,呃下一步我们只要点一下这个 use 就 好了啊,点一下这个 use, 点完之后呢是这么一个界面啊,不用去点这个确认啊,直接点这一个复制啊,点这边一个复制的图标 好,呃这个时候这个东西已经存在你的这个,呃这个这个复制的一个状态等,然后我们继续往下 啊,然后这边有一个网址啊,然后我们去呃进去下载一下啊,我们这个 e k 的 这个作者让我们去呃下载的一个指纹浏览器啊,就是这个 procs 啊,我英语比较差啊。然后,呃下载这个之后呢? 呃我们第一步点这个创建窗口,然后回到这个界面,那这个界面的话,呃它这边是可以使用各种系统内核的 啊,有 windows、 安卓啊、苹果啊,这样子我建议就用这个 windows 就 可以了啊。然后这边呢,这里有个代理,代理后面有个添加,那我们这一步就要添加我们上面买的这一个呃这个静态 ip 了啊,然后点这个添加之后呢会到这个位置 这个位置,那这个位置呢?呃我们直接把我们刚才复制的东西粘到这里就可以了啊,然后点一下空白处,它会自动把这个相应的 ip 地址以及用户名密码全部都输进去啊,全部都输进去。 然后,嗯,这边提醒一下啊,呃,有一些群里面小伙伴说买了之后,呃也按照这个流程做了,但是提示的话代理检测失败 啊。呃先看一下你是不是没有用这个我们这个东西啊?呃,如果你有了这个东西还是失败的话啊,那你可以回到那个官网去申请退款,然后,呃只需要支付百分之三的一个手续费,还比较良心的这个网站。 呃,然后,呃我们这边保存之后啊,然后这边提交完,哎,我们回到我们全部窗口啊,就会发现你刚才建好的这个窗口已经好了,那么你点击一下打开啊,点击一下打开,哎,打开之后呢,它会弹出这一个浏览器的界面 那,呃之前是这个窗口,你在这边再加点个加号,然后再开一个窗口,你把这个 ipdate 这个网站呢,再打开看一看 啊,这个时候,呃,你发现你的这个呃 control 已经 u s 了,然后这边的话也已经呃是一个绿色的,那说明你这个 ip 纯净度啊,已经没问题了啊,我们可以呃,如果啊,另外如果说你发现,哎这个是红色的啊, 那一样回到这个官网上啊,去退退款啊,去把你这买的这个纯净的 ip 给退掉啊,退掉一样只需要付百分之三的手续费啊。 好,这一步到这一步的话,基本上你已经把你的这个 ip 啊纯净这个问题解决掉了 啊,然后这个呢我们就开始正式进入我们这个学生认证了啊,那学生认证呢?是比较简单的了,然后,呃直接通过这个网址链接啊,到达我们这个界面,那这个界面的话 啊,这边有一个验证条件啊,这边也是群里面的小伙伴反馈的一个问题啊。呃,不要点进去,我们直接右键这个 验证资格条件,右键一下,然后它会出来这些选项,我们选择复制链接地址,复制链接地址啊,不用点进去啊,然后 我们再,我再在这边我们的浏览器里面再登录一个呃,网站,这个就是我们刚才一直说的这个 ekey 的 这个网站啊,它可以帮我们做好这个学生伪装啊。然后, 嗯,在这个地方啊,也是其他的一个群里面小伙伴建议的。呃在这边右键点一下,然后直接粘贴进去,把我们刚才的这个呃复制的这个地址 粘贴进去,然后这边有一个人人的一个验证啊,真人验证啊,验证完之后呢,开始啊 start 一下就可以了啊, start 之后呢,在这个地方它会弹出来呃各种提示啊, 那如果弹出来是这么一个提示啊,这边是 success, 然后这边会有一个网址啊,那恭喜你成功了啊,恭喜你成功了啊,如果没成功可以进我们的这个群里面去咨询一下其他的一些大佬啊,群里面一直有小伙伴在里面热心的大衣的, 然后呃点这个链接其实就可以了,那他点过去呢,有可能直接就成功了。还有一种可能呢,点了之后啊,呃他会提示你没有资格了啊。那这个不用担心啊,你用我后面贴的这个网址 再去登录一下啊,用这个网址再登录一下应该就可以了。那接下来后面的一步呢?就是,呃直接会呃让你从之前的那个验证学生资格变成了畅想学生优惠,然后点进去之后会让你绑一个呃国外的银行卡, 那这个的话你们可以去某鱼啊,或者一些这个这个地方去去呃买一个国外的 visa 的 卡啊,大概目前群里面交流下来最便宜的一张卡是三块钱,那这个价格的话大家自己去参考一下啊,这个是最低价了 啊,然后整个流程就这些还比较简单,然后中间呢会有一些问题,那我们呃先看一下这个问题,如果说你全部弄完之后,或者说你一开始登录这个学生认证的官网的时候就提示这个的话,有两种可能啊,第一个 你用的是不是美区的 ip 啊?就是其他区域的话,这个学生认证已经在十二月三十一号就截止了,现在只有美区 还可以去做学生认证,然后它会持续到一月三十一号啊,所以先保证你这个登录的 ip 是 美区的, 那如果你是美区的 ip 还提示这个啊,那你可能需要去我在网上找了一个这个视频啊,你把这个复制一下,然后粘到这个抖音里面去搜一下这个视频,然后学习一下这个具体的办法我就不展开讲了。 然后还有一种情况是这个,那这个就比较尴尬了啊,这个可能是你之前用了很多次不纯净的 ip 去尝试,一直失败了,然后之后你再去呃,换一些纯净的 ip 都没有用了 啊,然后直接就是一直不停的吹 again, 然后这个提示啊,不停的提示这个东西,那这个的话唯一的办法就是等七天之后啊,账号会恢复正常。 好,你需要用纯净的 ip 再重新操作一遍啊,这个就结束了啊,这个文档呢,我已经整理成 pdf 了,然后我放到了我们的这个呃群里面, 然后感兴趣的小伙伴啊,可以进群去呃,群收藏里面找一下,然后一个个对照着看一下啊,感谢各位的观看啊。

大家好,欢迎来到这期视频,今天讲如何在 google collab 上训练自己的劳拉模型。操作之前做一项准备工作,准备好训练用的照片,压缩成一个 zip 文档,在谷歌云盘新建一个 zip 文件夹,把刚才压缩好的文件上传放进这个文件夹, 今天用到的是这个项目,等下我们使用 stable diffusion 的 dream booth 扩展训练劳拉模型,点击这个按钮, 选择左上角复制到云端硬盘,这样我们就在自己的谷歌云盘上建立了一份文件副本,在新标签页中打开,选择上面菜单栏的代码,执行程序,更改运行时类型 硬件加速,选择 gpu, 把鼠标向下移动一点一部分,勾选这个选项,连接谷歌云盘,点击左边按钮运行。连接到谷歌云盘,允许 这里出现一个绿色的勾,就说明成功执行了。点开左边文件, 打开 drive 文件夹,这个就是谷歌云盘。在这里可以看到我们刚才上传的 zip 文件。 一到二点一,选择下载一个模型,这里建议采用 stable diffusion 一点五版本运行。如果选用自己的模型,那不要运行二点一这部分,一到二点二部分, 我们可以到 cfi 网站上找其他模型复制下载链接,粘贴到这里运行,这样就可以指定我们自己的模型。但是在这个视频中,我们还是采用 stable diffusion 一点五版本,因为这个用来训练比较好用。 鼠标继续向下移动到二点三部分,选择对应 stable diffusion 的 v 文件 运行。三点一,放置训练数据的文件夹,采用默认运行。三点二,再次打开文件,找到刚才上传的 save 文档, 复制路径,粘贴到这个位置。运行 三点三,跳过四点一,清除一些可能存在的不必要数据,比如说 m p 四, jeff 等等。运行 四点二,采集照片数据。第一部分,读取图片,生成文字描述,这里的 bench size 是说一次处理多少张图片,数字越大,需要显存的容量越高。运行 到第二部分,做标签,在这里可以调整一个参数,如果是人像类别的图片就把系数调高,如果是环境物体就把系数调低。 运行执行完成以后,打开左边劳拉文件夹, 在 train data 文件夹里可以看到每一张图片都分别生成了两份文件,一份是图片描述,另一份就是标签。第三部分,跳过不执行 五点一,如果我们使用的训练模型是 stable diffusion 版本二以上的需要勾选这个选项,给项目取一个名称,输入保存模型的路径, 输入保存 v 文件的路径, 勾选这个选项,这样训练好的模型就保存到了谷歌云盘。 运行五点二,部分,直接运行五点三部分,直接运行 五点四,这里有两个参数需要注意,这个参数跟图片的颜色有关,零是全黑图像,一是全白图像,这个参数是模型训练迭代的总轮数。 运行五点五,这里所有的文件的位置不需要做更改,点击运行 开始训练。 训练完成以后检查一下, 这就是保存在谷歌云盘的训练模型文件。最后一个没有数字的 safe tensors 文件就是最终的训练模型文件。有两点提醒注意,第一,刚才 batch size 设置太小了, 谷歌分配给我们的 gpu 有十六 g, 所以是够用的,可以设置到八。另外迭代次数不能太多, 刚才设置二时要运行四个多小时,中间就断掉了,这一点要特别注意。

这个视频给大家介绍一下 gemini 官网和 google ai studio 的 区别以及它们的使用方式,大家可以拉到视频,最后看文字版的区别总结。首先我们先进入 gemini 页面,在开始使用之前,我们可以将对话框左下角的工具切换到 canvas, 这个工具可以帮助我们直接预览效果。注意右下角一定要把模型切换成 pro, 然后把提示词输入到对话框中发送给 gemini jame。 把代码写好之后,我们可以在右侧直接预览当前版本代码的运行效果。如果报错或是效果不满意,我们可以在左侧对话框中继续发送指令进行修改。如果确认没有问题,我们切换回代码,将代码复制并在本地保存成 html 格式就完成了。 接下来我们切换到 ai studio, 有 时候进来 ai studio 会直接到 build 模式,如果不想使用 build 模式,我们可以点击左上角的 build 按钮回到主页。回到主页后,我们可以看到左侧可以选择 playground 和 build。 如果我们只是需要制作简单的 html 文件,可以直接选择 playground 的 模式。 如果希望制作 app 或者部署到网页,就需要切换成 build 模式。在 playground 界面,我们可以选择不同的模型, 比如 gemini 三和 nano banana。 以及上方我们可以切换成制作图片、视频以及音频等。如果我们需要制作的是交互小游戏,直接选择第一个 gemini 三模型就好了。 另外, playground 的 右侧可以调节模型的参数,这里注意把 thinking level 切换成 hi 主播。顺便简单介绍一下 build 模式,以主播个人经验, build 模式没有 jamming 和 playground 生成的效果好,等待时间也稍微长一点,但是这个模式和 jamming 一 样,可以直接预览 这里主播打开一个之前制作的塔罗牌 demo 给大家演示一下。和 jamming 一 样,左侧是对话框,右侧是预览界面, 点击 ko 的 我们可以看到这个模式生成的不止一个文件。如果大家的 demo 制作好了,我们点击右上方的下载,会把这里的所有文件下载到本地。点击右边这个 github, 可以 直接部署到 github 上。 好了,主播给大家总结一下,接纳页面简洁,但是非铺入用户每天有提问次数,适合有会员且只想生成简单网页的友友们。 ai 都利用,页面复杂,但是功能齐全。虽然非 pro 用户也有透客数量限制,但是以主播的经验来看,对于大多数人来说是够用的。 适合非铺入用户和想要将代码部署成网页或者 app 的 友友们,大家按需要选择适合自己的就好。


hello, 朋友们,今天讲一下 google a s studio 怎么去调整节目的三点零 pro 的 参数,这里面的参数呢,具体会是什么含义?我推荐大家看到结束补充一下对 ai 模型的一些基础认知,用其他 ai 的 时候呢,也能够去快速上手。首先就是进入 google a s studio 的 网站, 我们选择 gemini 三 pro preview, 参数调整就在右侧,我们一个一个去看。第一个就是模型选择,这里可以去选择不同的模型,下面有详细介绍它的扩展消耗是怎么计算的。 这次我们选择就是 gemini 三 pro preview。 第二个呢, system instructions, 这个重点要讲一下,你可以把它理解成是在 ai 的 脑子里面去植入一个人设芯片, 通常呢是用来去定义角色的一个身份,语气输出格式,以及必须遵守的一个硬性规则,让他知道自己是谁,该怎么去说话,什么能做,什么不能去做。 那在这里设定好了 ai 的 人设以后,你就不需要每人对话都提醒他你是一个健身教练,就算后面你会去说你现在是个厨师, ai 坚持自己是一个健身教练, 也不会因为上下文太长忘记自己的身份,大概就是这样,但是这里的提示词啊,一定要记到精简。如果你去给 ai 一个几千字超级详细的人设,那么你后面聊天的时候每说一句话, ai 都要去先读一遍,这几千字的人设比较消耗。 token, 这个在 jamming 的 官网上也可以进行设置,对应的叫 get。 第三个是 api key, no api key 说明你现在用的是 google 提供的免费额度。第四个叫做 temperature 系统默认的温度是一啊, google 官方的开发者指南也提到使用 gmail 三,强烈建议是去保持默认值, 因为 gmail 三 pro 引入了叫 thinking 思维链的一个机制, ai 在 生成最终的答案前,内部有一套严密的逻辑推导路径。我尝试过将温度去调高,结果呢,输出的是一堆乱码,使用之前的版本也可以去调整温度,调低温度,你可以适合去做数学计算,代码生成等需要精确答案的任务。 调高温度呢,适合你去做多个不同的创业方案,比如说写故事,诗歌等艺术创作,还有头脑风暴阶段。第五个呢,是 media solution, 这个控制的是 ai 识别你上传的图片、 pdf 等内容的一个理解程度。选择 raw, ai 只能去识别基础内容,但是选择 media, ai 能识别上传文件的更多细节。 选择 high 呢, ai 能识别复杂内容,比如说像图片中的小字识别复杂的一个图标,但是 token 消耗量会非常大,如果你没有特殊要求,那就用 default 让 ai 自己去判断。第六个叫做 thinking level gemini 三 pro 具备了先思考后作答的能力,在回答前先在后台进行一连串的一个逻辑推理。 thinking level 呢,就是控制这个推理过程,要想多久,想多深的一个参数,遇到难题的时候调成 high, 可以 去深度推理,处理简单任务。调成 low, 可以 去节省时间和算力。这个默认是 high, 因为你既然用上了杰米兰三 pro, 那 就用 high, 看它到底有多聪明。 但是如果不涉及到复杂的数学代码或者逻辑的内容,日常闲聊,我还是建议你可以先设成肉,七个是 tools, 主要有几个,一个是 structured outputs, 让 ai 以特定的格式去输出内容,日常聊天写文不用开。如果你是开发者,那就需要去开启。 第二个 code execution, 让 ai 自己去运行代码来得出答案,涉及到计算数据处理的时候就开启, 提高回答准确率,因为纯元模型对这些方面的内容容易是算错的。日常聊天的时候,你的纯文本任务也不需要去开。第三个方形 colin, 让 ai 调用外部工具或者 api, 日常使用呢也不用开。第四个 ground in with google search。 开启。这个 ai 会实时去搜索最新信息,因为 gemite 三的训练数据是二五年的一月份。第五个 url context, 让 ai 读去链接的网页内容后再去回答。建议呢,也可以去开启。 最后一个是高级设置 safety settings, 这个开启 ai 就 会很保守,稍微敏感的一点的话题就会去拒绝回答。如果你关掉呢, ai 就 会比较敢说,但可能会输出争议的内容,默认你可以是去把它关闭的。第二个叫做 s stop sequence, 这什么意思?这个只可以去设定一个或者特定的词, ai 在 输出内容的时候,当看到有这个词的出现,它就会立即停止生成。你可以防止 ai 自言自语太久,或者防止它开始扮演用户的角色来说话,正常使用你可以不用去管。第三个叫做 up pause, 这个是 ai 回答的一个字数,上限 六五五三六头衔,相当于大约是数万个汉字或者几十页代码,已经是一个很大的数字了。 第四个叫套屁,这个控制 ai 回答的一个多样化和创造力,默认也是零点九五, ai 的 回答会更丰富,更像真人,更有创意。 如果是零点一呢? ai 的 回答就比较死板了,像机器人,但是很准确,适合法律解读这种。像 temperature、 套屁这些设置不只是 jamie 有 chat、 gpt、 cloud 等也都能看到。这些参数是 ai 大 元模型的通用设置,遵循相同的一个底层逻辑。 ok, 那 今天对于 jam 的 三 pro 各个参数的一个分析以及解释就在这里,如果大家感兴趣,或者说大家想学更多 ai 知识呢,也欢迎点赞、关注、收藏一下。

嘿嘿出的一段爆笑视频,视频中的外语老师正在教大家世界上最先进的拼图方法。 e o o o o t t l a l a e e blue blue 一席话白读十年书呀!这要是被谷歌创始人听到了,估计会气吐血。