粉丝820获赞1.2万

哈喽,这次我来给大家介绍一个用来做大模型最常用的一个工具。这个工具呢是,呃,主要是是因为要养 overcrowded, 然后不想用那些网上厂商的大模型,然后才自己选择琢磨一下本地大模型怎么用。 网上大模型很贵,因为它有三十一个,然后一些内容的话也不好往上传。然后第三个就是你断网的话就用不了网上的模型了,然后这边不断网的话就, 然后上网的话我们就用不了的模型了,但是这样的模型的话上网也能用,然后的话就写一些定制的模型化,我们临时不能再往上跑对不对?嗯,在机器上跑的话,我们就可以通过调整你的参数来让它得到更高的性能。 嗯,然后呢手动调参数,如果用自己手动填切的话比较麻烦,我就写一个自动填切参数。呃,手动调手动调参数比较麻烦,我就做了一个可以自动测试的一个工具出来, 这工作使用也比较简单,只要选择好的模型,设置好它的长度和 s b 六个限速,再勾选一些优化参数,我们就可以直接去测试,测试的话会展示一些。呃,这个运行参数直接就可以用来布置这个等量模型的服务。 然后如果想要 p 二测试的话,还可以选择一个。呃,三角纹长度区间,然后让他可以测出一个最优的三角纹。呃,长度,还有的话就是可以制定一个 cpu 线的范围,也能找到最优的一个 cpu 线的配置。呃,这样子我们就可以得到一个性能比较好的一个本章模型了,我们直接可以去我们要好的性能,再得到比较好的性能的 cpu, 在得到性能更好的本地大模型之后,我们就可以供给我们的小龙虾,直接给他上一个,直接用本价,直接用本地的大模型,用一个新款,你所要做的只是非法,你要做的只是跟他一起成长。 好的,那来看看我们具体的一些操作。首先呢我们这个操作流程要准备好一些材料,第一个是版本 c p, 我 们去一个号上面去把它下下来,并且编好,然后还有这个大模型我们可以直接去我们大社区还有一个 app 直接下载,下载完之后我们就可以直接用了,以后的话我们就打开我们的工具,我们来本地演示一下, 还有我们的工具,那个工具就长这个样子,我们首先要它会自动帮我们匹配这个的工具,模型这边就选择一下,我们想要,嗯,选这个模型,这边一般比较流行的话就是 q n 三点五的,三点五的模型,这个用起来不错,他们这句话问题,我们用这个吧,先用 q c c 这个模型, 然后的话我们一般有句话推荐的是六十四 k 的 一个强度,那我们就选上下文是类似这样的话,嗯,这么多的可以选 g s b u s s s s, 能选能选十七, 然后还加了三个优选参数,这个选参数的话它可以减少一个内存的使用,对,适合选低的,那这个是镜子思考模,镜子思考就可以更快的数结果,我们需要要点击测试这个这个参数,这个是用那 cpb 内置的一个参数的一个 工具,嗯,写的,那就把这个参数切出来,我们直接点这个参数对话,我们就可以去体验一下这个这个参数的效果怎么样,因为我们这里是直接通过这个三维的 gpu 程序的,有可能它这个不太适应,但是我们还是要测试一下,看能不能够用 好了。界面打开,我们在一起,让他输入对话,介绍一下自己,他没有思考过的过程,直接就生成了比较快,然后生成速度是十五和每秒,大概也就是完了。嗯,马上那个大家问答速度已经很不错了。嗯,可以让他写个编程问题吧, 也可以写啊,问题我们不做测试,就写烟,让你们自己回去测试吧,问一下他,然后我们第三步就可以生成一个小本,然后直接去应用它,我们把它放到桌面吧,这个就叫做千万三点五。嗯,这个是我们直接这样写,等一下我们直接用它打开就好了,先按住二点五 b 这个,把这个服务打开,它就可以直接运行其他这个 mcp 的 服务,现在正在启动,用之后我们把这个网关一下先 好,这个已经启动完成了,在我们可以看到点击的界面,可以看到这个界面,我们可以简单测试一下它功能,看能不能正常运行, 在这边的视频速度可能会比较慢一点,但是也够用了。我们看到龙虾的五官开好了,龙虾网开好,先爆出来,先把它先刷新一下, ok, 这已经我已经配置过了,到时候再给大家演示一下怎么配置这个龙虾了,再打开页, 我们这个通过图层的配饰界面直接去配置这个模型,选择 logo, 然后选择模型,然后我们选择这个自定义的提供,这里会输入一些信息,我们打开我们的工具,然后复制粘贴进去,把这个 a、 p、 u、 dy 复制进去,确定,然后粘贴这个 ip, 这个可以不写,也可以写。那再写,写出来吧,然后再说用的不是,然后在模型 id 就 复制这个,那一点成功了,那就可以,那我们这里随便填个名称吧,三吧, 已经写过了。 ok, 那 现在已经开始好了,我们再回到这里再刷一下。啊,来问一下,看我们开始好没有,把它注一下。小 a, 第一次开始的话可能会快一点,但是我这是个长对话。嗯,就是会比较吃这个,这种长度他回复比较慢,刷新一下,看他有没有回复,我们可以看一下服务,确定他是不是在运行。哦,这确实在运行,那我再提供。他肯定要读很长上下文,应该六一下了。 啊,他回复我了,这没问题,你已经背诵成功了,后面可以这样做, t s 级别都没问题。好,那我们这个也是完毕的,这是一个。嗯,这个光标, 那么也是完毕,怎么去啊?从这个测试最后参数,然后测试一下这个数据速度,大家生成色本我们已经搞定了条路了。另外一个就是批量测速,比如说我们不知道哪个上下文章做的速度更好一点,我们可以把它全选,然后再测试。我们现在可以测试一下, 我们看到这个 p 二测试已经开始了,从八 k 开始测到二百五十六 k, 再测完程度,这个可能需要几分钟的时间。嗯,我们看到这边八 k 生成,八 k 的 话,它速度大概是五十每秒,这其实是一个很快速的,十六 k 的 话也是五十多每秒,稍稍微慢一点点变化不大。 我们看到三十二 k 三十五的话,它的速度会减了几百根,但是也还可以接受。我们的四十四 k, 这个速度虽然更高了,更快了,它一百二十八速度就更慢了,这说明不是越快越小的效果越好,这个一百二十八 k 的, 这个四十 k 秒直接能接受了。 好的,我们测试完了。嗯,二百五十六 k 的 三十四 k 秒已经快了,最快的话是八 k 的 那个传送门, 平均的话有四十多的那种,我们选择一个我们需要的啊,龙虾的话最好还是用长三角纹的。对,二百五十六 k 刚刚好。那比如说我们想要二百五十六 k 的 上角纹的长度,然后我们那不知道什么线就好,我们可以测五到十去测试一下,我们每个上角纹长度是我们的上长,我们在特定上角纹长度的话,哪个 cpu 线成的速度最快,我们找最稳的方法。我们可以测试线成 这个 cpu 啊,因为我是把部分的专家层放在 cpu 里面,所以说 cpu 现成越高的话,其实一般会啊速度越快的,我们现成速度的话,就比我们的还开始期要慢很多了,通过增加现成的话,我们速度会有一点提高。 好,这我们测试完了,我们看到这个射程速度会提高的话,它的射程速度是有很多提高的,但是提高并不大,在七县城这里已经达到进了一个最高峰了。 嗯,最快速度这些人九,但这个数据会用到比较大的资源,如果你的县城多的话,那我们平均生成的速度就是三十九,我们这个七的话就已经不错了,这样资本少,然后速度又会明显的一个台阶, 然后太高的技能是没必要,你看这十的话已经到三十九了,十六的话可能会更好,但是我感觉已经够了,有些到我们,嗯,作为我们的一个空余量,不必加到最满。那我们现在已经知道了,在二五六的我们需要测量长度,然后我们县城的话呢,七是最好的参数的话可以拉满,然后我们点一下这个测试优先参数, 然后再点一下生成脚本文件,我们就可以拿到千万三点五。嗯,六四 a m 到十六 k 七七七的一个参数我们可以保留下来, ok, 我 们保存下来就可以用来配置我们的其他的配置,我们的服务。好的,整个剪辑完毕,大家有没有什么 好的,这个就是我们所有的操作流程了。嗯,最后统计一下我们这个最下的一配置了,我们用它配置,我们养虾就从此告别了收费动画。嗯,撕切了出的产品的空点输出还是得看你的配置啊,因为我们的成本其实深层速度并不快,但是我们可以尝试不同的模型,我们发现这个 cvt 二十 b 的 模型是最快的,给大家体验一下, 这个模型要达到惊人的八十多倍,哎,它是原生的 oppo r i 的 一个模型,感觉是非常不错,我看这个镜子我说关不了,哎。哦,我开的太高了,不好意思,这个上午长度开二五六,二五六的话它也有一个。呃,四十秒的速度也很快了,它处于 我们关掉它,我们来到二十四倍吧,二五六确实难为他。那就这样速度就快了, 看这个能达到二十五,每秒二十度,我感觉用来切减一度两下是没问题的。好的。

这个视频将指导您在 comfyui 中部署 ai 聊天工具。前提准备是你已经有了秋叶启动器或者独立的 comfyui, 还有你的电脑需要满足这个配置要求。 首先需要给 comfyui 安装 comfyui lm session 插件,再搜索引擎搜索这个,然后下载大语言模型, 这里推荐千问语言模型,它对中文支持友好,在搜索引擎搜索这个。需要注意的是,如果你的显卡在八 g 以下,建议选九 b 的 模型,八 g 以上的可以选三十五 b 的 模型, 点进来后在这个位置找 g g u f 量化版本,这里可以无脑选第一个。点进来后按照自己的电脑配置选一个,原则是你的内存加上显存值和大于模型文件,这里需要下载两个文件, 一个是从 q 二到 q 八之间选择一个,另一个是 hammi prj。 将下载好的模型文件放置在这个目录下。 接下来需要给 cfui 的 python 环境安装 l l a c p p python 模块,这个模块的安装流程建议为 ai 解决,因为涉及比较复杂的翻译流程,一时半会说不清。 一切准备就绪,后来演示一下,在 cfui 左侧点开工作流模板,找到 i o i m session 分 类点开这个,首先建议把这个节点换成高级聊天插件,在左侧的节点列表找到这个,就像这样, 节点替换好后,这里选模型文件,分别对应刚才下载好的两个文件。然后微调参数,你需要重点关心的有这些, 这些参数是什么意思?建议请教 ai。 我 这里是按照自己的电脑配置微调的参数,每个人都会不一样,这个工具不仅可以聊天,还能识别图片,但凡处理文字上的活儿,它都能干。视频到此为止,祝您玩得愉快!

新上市的四零 ti 被全网差评,甚至说二 k 以上分辨率都不如老款三零六零 ti, 今天用实测证明网友观点是否属实,为公平起见,采用更生 rtx 四零六零 ti 踏雪与老款第六版 rtx 三零六零 ti 追风对比,采用幺三六零零 k 平台, 散热拉满, cpu 磨平,不废话,直接开测。首先是经典大作战神二可以特效拉满,可能是老卡优化比较好,四零 ti 以一针差距惜败,后续驱动优化一下应该会反超。 接着是蜘蛛侠,同样二 k 特效全开,这次四零 ti 高出六针,用一百二十八位宽的四零 ti 对比二百五十六位宽的三零 ti, 二 k 分辨率能这样也算很强了。误事三, 依旧二 k 特效拉满,依旧是四零 ti 强一些,虽然只是三针,但是工号相比三零 ti 低很多,四零 ti 只贵三百元,多玩几把省的电费就能赚回差价了。 星游霍格沃兹二 k 分辨率全高,特效四零六零 ti 与三零六零 ti 帧数完全一致,一 k 分辨率是要高出十多帧的,可见一百二十八位宽在高分辨率下还是受点影响的。 最后赛博朋克二零七七二 k 特效拉满,可以看到四零 ti 要高出两帧,并且工号低了近六十瓦,对于三百元的差价就能用上四零系还是挺值的。 好了,绷不住了,如网友所说。

上显卡四零六零八 g 加四零七零十二 g 加莱玛二点 c p p 能不能本地运行 jam 四二十六 b 模型?为了快速演示配置,莱玛二点 c p p 的 步骤我就不演示了,直接给出指令。 这里可以看到拉玛点 c p p, 按可用内存切割比例分配内存到两个卡里,这是欧拉玛做不到的。自定义配置命令加载完成,出现八零八零就可以到 open kala 开始对话了。选择 jama 四二十六 b 模型, 本期我只做实测效果演示配置问题欢迎评论区一起探讨。接下来出使画 open kala 角色定义, 可以看到输出的 token 在 二十五个每秒跑 open 克拉完全够用的,码内有限,将就用吧大哥。调用工具链性能会差些,主要是输入 token 大 时显存压力更大,拖慢了整体性能。让他去逛逛五角楼吧, 哈哈,回复还是很幽默的,智商没问题。后来跟他进行了十几轮对话,有的甚至调用了十几轮工具链, 输出都非常稳定。最后总结,平均偷客输出在十五个每秒,用来测试与养成简直不要太爽。知足了,兄歹好了,本轮测试先到这里,感谢观看,点点关注,我将分享更多 a i g c 实测内容。

英语达、 rtx 四零六零、四零零零太这两款显卡哪个适合你,哪个值得购买?两者之间的差距又有多大,你了解吗?如果你是一名游戏玩家,或者是做生产力的,那在传递的时候,独立显卡是必选项,和弦肯定是满足不了你了。目前市场热门的显卡无疑就是这两款显卡, 很多小伙伴在选择上比较纠结该如何选择,今天我们就简单来了解一下哪个更适合你。我们先来看一下 rtx 四零零零太和四零六零的参数都有哪些区别。 我们可以看到,这两款显卡由于是同一系列,所以均为 tsmc cn 的支撑工艺,显存容量同为八 g, 显存类型同为 gd, 二二六,显存位宽同为一百二十八位。 不过四零六零和四零零太的核心面积要小了不少。这两款显卡主要区别有六处理器单元, rtx 四零六零有三千零七十二个,四零零零太 有四千三百五十二个,二级缓存少了八兆。不过 rtx 四零六零功耗更低一些,从参数来看,无疑 rts 四零六零太性能更强。当然,两款显卡的差价也达到了将近八百元左右,如果说你预算五千,那选择上四零六零就可以了, 如果预算达到了六千,那就选择四零六零泰这两款显卡,在两 k 分辨率下,四零六零泰可以满足大多数的游戏需求,而四零六零在两 k 下就要差一些。当然,在幺零八零 p 下畅玩绝大多数游戏也是没有问题的, 如果遇到赛博朋友二零七七的游戏,四零六零就无法满足使用了,除非降低游戏画质,那么你会怎么选择呢?评论区讨论一下吧。

现在熔点已经到达了,我们准备拆卸这个 rtx 四零六零, 这个 rtx 四零六零就这样被拆下来了, 继续拍一个微距特写,这个黑胶基本上都残留在这款 rtx 四零六零粉底上, 然后可以比较清晰的看到这个踏板上面基本上没有硅胶的残留。 马上这是处理好的焊工,处理好的 cpu, 还有处理好的闪灯等会把它全部安装一下。 现在快要达到熔点了,马上这个芯片就要焊好了。焊接之前我们看一下这个气球的融化状态, 现在气球已经在全部融化过程中,马上就要焊好,这是我们显卡和显存焊接好的效果,大家可以看到很漂亮。 现在这个 rtx 四零六零显卡已经运转天灵圈运转了接近五分钟了,一直保持稳定的运行,然后这台 rtx 四零六零显卡我们已经充值成功。

被全网差评的四零六零 ti 对比五年前的旗舰卡二零八零 ti 有几分胜算?来看看游戏实测,新游霍格沃兹,二 k 高特效,虽然二零八零 ti 帧数高出百分之十,但是功耗高了接近一倍。 显卡质检员赛博朋克二零七七依旧二 k 分辨率特效全开二零八零 t i 平均帧率比四零六零 t i 高出四帧 画质天花板的地平线五、二 k 画质拉满,这次四零六零 ti 反败为胜,领先二零八零 ti 五帧 杀手三、依旧二 k 分辨率全高特效,二零八零 ti 以一针优势显圣 荒野大雕刻二同样是二 k 分辨率特效拉满,这次四零六零 t i 反超二零八零 t i 高出三帧。最后经典大作巫师三,二 k 分辨率全高特效下,依旧是二零八零 t i 以两帧优势获胜, 结局令人意外,二 k 分辨率居然是五年前的二零八零 ti 胜利。

六百五十瓦电源能带动 rts 四零六零钛显卡吗? rts 四零六零钛显卡 tdp 功耗是一百六十瓦左右, 它的实际满载功耗大概是一百六十到二百瓦之间,而这款显卡一般搭配 i 五级别的处理器,比如说 i 五幺三四零零 f 功耗是六十五瓦, i 五幺二六零零 kf 功耗是一百二十五瓦,再加上其他硬件的功耗,整机功耗大概是三四百瓦。 我们按照电源负荷建议控制在百分之五十到百分之七十之间,可以计算出这款电源是可以带动这款显卡的。