粉丝4191获赞9672

首先进入这个网页并登录,爱着打不开的可以用 chrome 点击右上角的 generate api key key, 名字随便输。 下面的到期时间 expiration, 选择 never expire, 这样我们就获得了有效期为一百年的英伟达 api key。 点击下方的 copy api key, 复制 api key 之后再打开这个网页,找到你想要的 ai 模型。 我这里以 openai 的 chatgapos 二十币举例。点击右上角的 viewcode, 再打开的页面,点击 shell, 打开软件 chatbox, 没有的先去下载并安装, 打开设置,点击模型提供方并新建名称随便输,只要你看见名字能认出来是哪个模型就行。 下面的 a p i 模式默认即可。然后点击添加 a p i 密钥,输入刚才复制的 a p i key, 打开浏览器刚才选择的模型页面,复制这段链接,这就是 a p i 主机,注意不要少复制或多复制一个字母, a p i 路径默认即可。之后点击下面的新建,打开浏览器页面,找到 model 后面的字母串及模型 id, 不 输入或输入错误的模型 id 会导致模型配置失败。 名称随便输,只要你看见名称就能明白这是哪个模型就行。 最大 token 也可以输一下,即浏览器页面中 max token 后面的数字输完之后保存配置,之后建议测试模型,软件会自动测试并打开模型支持的功能,以免后续使用时出现问题。测试完成后,保存并返回对话页面, 在右下角选择模型, 发个信息测试一下,可以看到速度也挺快的。

你敢信我现在手里拿着的这是前段时间老黄送给马斯克那台英伟达 d g x spark, 你 别看它个头不大,这可是目前地表性能最强悍的桌面级 ai 超算了!今天我将在英伟达办公室为你解读 ai 如何正在从云端特权变成你的桌面级能力。 首先,这台 d g x spark 的 核心架构相当强悍,它配备了一百二十八 g b 的 统一内存, cpu 与 cpu 通过 nv link c to c 进行高宽带低延迟直连。 这并不是简单意义上的堆显存,而是英伟达最新一代共享内存架构,让计算和显存真正成为了一个整体被调度。所以你看,这么一台小设备,直接部署上了满血版的千万二百三十五 b 模型,不依赖云端,实现了本地离线推理,并且响应速度还快的离谱。 更夸张的是,当这两台 d g x spark 互联之后,算力直接可以翻倍,模型规模可以继续往上扩,但重点不在能跑多大,而在于它真的能干活,我在现场尝试用它跑。 com 视频八 k 输出复杂节点组合同 同样的工作流,旁边这台 m 四 pro 高配版的 macbook 已经开始显存,吃惊了!你看 d g x spark 这边,稳定跑完四十秒左右就出结果。 这意味着你现在可以在本地把整个 ai 创作链路一次性跑通了,让模型不出内网,数据不上传云端。你可以在公司、在家里、在任何地方用它部署一套完全属于你自己的 ai 大 脑, 从模型调参到微调验证,再也不需要每一次都丢到桌面端,那么游戏体验也开始被 ai 重写了。因为拿新一代 d i s 四点五技术太离谱了, 你看它在左右及其相同硬件配置下,四 k 全特效全光追环境下运行黑神话悟空。当开启 d l s。 四点五多帧深层技术后,已 经不是单纯的拉分辨率了,你可以注意到右边这个鼠标快速移动产生的拖影。在开启 d l s。 四点五之后,利用第二代 transforem 模型,你还会重新理解画面中的运动趋势和光影关系,稳定性明显增强。而且不光是清晰度更高了,多帧深层技术直接带来了最高六倍的性能提升。而且英伟达这次直接把 d l s s。 四点五其中的超分辨率技术下 放到了 rtx 二零到四零全系显卡,并且已经支持了四百多款游戏。但最科幻的是, ai 现在已经开始进入游戏逻辑层了。像 tableware 里的这个有 nvidia ace 技术驱动的 ai 顾问,注意,这个角色不是预设的台词,而是实打实的植入了端侧模型,让它有了真正的灵魂,并能基于占据状态玩法给你时时建议,这意味着游戏开始会思考了。 接下来一个问题就绕不开了,这些 ai 技术到底跑在哪?答案不是云端,正是前面这些真正的 ai pc, 因为它的策略不光是对信等,比如实时四 k 视频增强本地四 k 视频深层模型、 nvidia hyperlink ai 辅助视频搜索,这些 ai 能力把原本需要反复折腾的流程直接压缩成在本地,完成,让你的整个工作娱乐创作流程。第一次可以在一台电脑里闭环 骑士和开头介绍的 d g x bug 是 同一套逻辑, d g x bug 解决的是谁能把模型和数据真正留在自己的手里。 r t x a i p c 解决的是当算力足够普及,更多人能不能真的用上 ai。 所以 从 d g x bug 到 r t x, 从本地大模型到游戏到创作到 pc, 因为达其实在做同一件事,把 ai 从云端特权一点点下放到了个人桌面。而当 ai 真正成为了一种桌面及能力的时候,改变的就不只是性能,而是每一个普通人第一次真正拥有了算力的主动权。 ok, 关注赛文乔一只,为你分享前瞻科技。

我们今天呢有一个合作伙伴呢,选择了这个 nvidia 的 这个杰特森 a g 叉 orange 啊,那么这个是,嗯,杰特森的 a g 叉 orange, 六十四 g 的 版本啊,一百二十八 g 内存,我们应客户的啊,六十四 g 内存加六十四 g 的 硬盘啊,我们应客户的要求,要需要帮他安装这个 啊,两 t b 的 固态硬盘啊,两 t b 的 固态硬盘,那么原机的配置可以在这个地方大家可以看一下啊。呃,我在这给大家演示一个安装的一个过程啊,这是一个拆箱啊,我们把它打开,这个没有这个封箱条没有打开啊, 好,那我们打开的时候它是里面是怎么样子啊? 然后直接的把它拿开,可以看到它的这个背面的这个效果。其实这个在安装的时候呢,它是相对的是很简单的啊,很简单,但是我们可以看一下,就是它里面的这个配件, 配件都有哪一些呢?我可以来看一下啊,这个整个的把它拿开,然后里面的这个线是相当相当多的啊, 这个供电线为什么有那么多呢?因为这个是主要是这个适应欧洲或者各个地方的。为什么叫开发套件?它实际上要有很多个这个头都可以用啊,这个说明书,然后这里是有一个这个电源适配器, 那简单的它的这个配件就是这么多了啊,那我们现在呢就是简单的在这个盒子上包装盒上把这个硬盘把它装起来,这个硬盘装的时候呢,它其实也是相对的比较容易啊,比较简单。 然后我们拿一个对应的这个螺丝刀啊,直接取一个硬盘啊,取一个硬盘,然后呢把它这个对应的这个螺丝先把它拧下来 啊,我这个螺丝刀,螺丝刀用的不对,需要用一个大口一点的 好螺丝取下来,然后把这个硬盘把它插上去, 注意插的时候稍微的就是要用力,要均衡啊,可以看到它实际上插着它会有个自动弹起来的过程。那么这个就这个硬盘呢?这是全新的这个姿态,长江存储的啊,我们要支持国产。 把它拧好,那么这个硬盘呢?就把它装好了啊,其实是 so easy, 如此简单,那最后把它装起来的时候,我们可以看到它的这个供电口啊,然后这个这边呢也有这个有人说需要用这个 dc 的 这个供电口也是可以的啊, 然后它的开关在这边啊,开关在这边,那么也有人说这边为什么有这么多的这个接口呢?这实际上是更多的这个拓展接口,所以这个开发套件这一个产品呢?这个 amiga 的 机身 a g 叉 orange 六十四 g 内存啊,六十四 g 的 这个硬盘,那么 但是同样呢它也是二十盒的这个 cpu 啊,并且来讲的话,就是这个呃,英伟达的这个 am 架构的这个集成的这个 gpu, 它比较适用于像这个自动无人驾驶的这个 l 二到 l 三这个级别的这个研究上面。那另外来讲的话,它也可以用在一些无人机的这个初级的这个研究方面,包括一些这个制造类的一些机器人的这个设计研究开发方面。 另外还有像这个呃矿场,无人矿区的这个无人矿车的这个直接驾驶的这个方面有很多,在这一些西北的一些大型无人矿上面的话,就可以直接 用它放在这个机车里面,让它去驾驶这个车,这样的话呃,可以有更多的这个让让很多的人远离这个,呃, 那个粉城区。另外来讲的话,在这个相对应的有一很多的这个呃信号的这个检测方面啊,比如说像这个, 呃轨道交通的这个信号检测,还有这个有缘无缘的,比如像高压电线这些。另外来讲的话,它这个中间这个旁边有一个这个接口啊,这个也是同样的,就是可以方便大家去这个拓展啊,拓展有一些设备的啊。 好,那我们这个就把它安装到这里,现在我们就把它这个还原回去。那么今天这个客户呢,我需要给他装十台,我的硬盘都给他装好了啊,准备好了, 那给它装完了之后,今天就会给他发货。这是一个在东北沈阳的一个客户啊,我们期待我们更多的客户,那个联系我们。好,谢谢大家。

针对电商老客户提出的本地部署生图生视频需求,我们已完成整套流程的全面实测,整体运行稳定可靠,完全适配电商日常商用场景。本次采用 n 卡方案,实测数据表现优异,三十秒以内就能快速生成三到五秒的高质量视频, 可实现二十四小时不间断运行,批量生成需求完全能够满足,无需担心卡顿、中断等问题。大家可以近距离观察实际出图效果,尤其是和咱们电商行业的产品图制作,即便只用最简单直白的基础提示词,无需掌握复杂繁琐的专业指令,也能生成高质量的产品图, 省去专业操作的门槛。同时,我们也生成了多个人物视频片段供大家参考,画面质感细腻,细节处理到位,呈现效果完全符合电商商用标准,无需额外厚积优化。相较于大家平时常用的云端线上 ai 模型,这套本地部署方案的优势尤为突出。 首先,彻底摆脱排队等候出图的困扰,高峰期也不会出现废片、风格跑偏等问题,不用再担心花费成本却只拿到无效素材,大幅提升创作效率。其次,全程不消耗任何流量额度,无需充值抵扣 token, 没有任何隐性额外扣费,彻底降低使用成本。 除此之外,不受平台规则限制,可实现全天候不间断运行,无论是批量生成图片还是视频,都能拥有极高的创作自由度,性价比直接拉满,完美适配电商批量创作的核心需求。

来这一期我们来安装了部署配置 openclock 小 龙虾, 那么我们打开这个桌面 windows 一 桌面右键打开这个终端管理,管理员直接输入 wsl 了, 我比较建议是安装在 wsl 下面的,那么它会提示你没安装,那我们先安装,把这个 install 这一串拷贝到下面回车,然后它就会自动的进行一个安装,顽固的一个系统, 这个速度呢取决于你家的一个网络环境,正常来说早上相对来说会服务器会比较快一点,晚上的话就不好说,那我们等待它下载完成, 然后下载过程我们可以打开浏览器,然后打开 d c, 那 么我们直接在 d c 上面输入 open crawl wsl 下 下安装部署, 一键安装 o p e n c l i w 命令, 开车 它就给出会给出一个 open core 的 一个安装的一个命令。 那我们再回到这个五班图这边,看到已经安装完成了,他提示叫你创建一个账号,那我们直接回车输入密码, 它是不显示的,然后重新再输入一下,确保两次是一样就行了。好,那我们就进入到欧版图的一个系统,再看一下电脑这一边的,我的电脑这一边,它会多了一个 linux 欧版图的一个文件夹, 这个就是刚刚安装的一个五班图的一个系统,默认的话是五班图,应该是二四的吧, 应该是二四的吧,默认的话是二四零四点四,应该是最稳定的版本。那我们回到,回到,回到目录,我们也可以先退出重新进,也可以 it 这样就退,退出到原来的那个,或者直接新进入,然后我们直接 wsl 就 可以重新进入到这个魔方图的一个系统,那我们重启一下,这样吧, 先重启系统, 哎,好了,系统重启完,我们重新进 wsl 系统,输入 wsl, 这一次就能直接进入五班图的一个系统了,然后 cd 回到主目录,然后我们再回到这一边,把这个一键安装 openclock 小 龙虾的一个命令 直接拷到这一边回车,然后他就进入到一个家里,输入密码 好了,这样的话它就进入到一个安装的一个过程,我们就只需要等待它去安装就可以了, 这安这个安装的时间长度取决于你家的网络,因为它需要通过一个外网去或者 get 去拉取一个镜像干嘛? 好了,弹出这一步就证明已经安装完成了。然后我们看了一下过程,这边是有一个 有一个提示,就说我的那个安装目录可能存取向是有点问题,我们先退出 ctrl 加 c, 然后先退出这个设置的一个 状态,那我们来到 dipc 这边,把刚刚的那个报错给到 dipc, 然后他会给出一个永久修复的一个方案。我们这边是使用 bus, 那 我们直接使用 bus 把这个考到这边回车, 回车之后验证,验证的话它会给出一个目录,就是我们的目录还有一个 vivo 这个版本就证明已经 ok 了。修复完毕,那我们重新进入到刚刚的那个 open core 的 一个设置界面, open core 重新进入到刚刚的那个设置界面, 第一次启动相对来说是有点慢,我们需要去等待一下。好了,我们重新进入到设置的页面,然后 yes 这个过程我们先打开我们应用达的一个官网,去 biu 英文打点 com, 然后找到你想要的一个模型,我个人是比较推荐这个 stefan, 三点五 fresh, 这个的幻觉相对来说没有那么严重, 我们先把这一个这一个 url 跟主要就是这两个参数,我们把它复制,然后再来到这边稍微等待一下,大家需要一点时间去创建这个配置。 好了,我们进入到设置的界面,那我们选择 menu, 然后回车回车创建那个工作目录 继续,稍微需要等待一下。 好,创建完之后,因为使用是英伟达,英伟达在这里有一个英伟达转向,但是我们不要选它,因为它的那个里面的模型是并非对接英伟达的一个接口,那我们来到这个 customer 这里,选择这个,然后把它删掉, 然后把刚刚的英伟达的接口的这个连接 url 复制到这里,然后回车输入 api key, 然后我们把 api key 准备好, 就在刚刚那个网站上直接注册就好了,我这边是已经注册好了,直接把 api key 拷到这里,然后回车选择 openai 的 一个接口, 然后模型的话就把这个 stefan 这一个拷进去右键, 然后它检测就是通过,没问题,那下面 id 这边随便好记就行,那我就直接 and edit, 然后这边模型的话 step one 这这边这两个参数是随便输入的,就是让你记住,让你记住这个仓,这个参数 没有特别要求。好,回车回车回车回车回车。好,它有一个报错, 这种报错是在 wsl 下面是非常正常的,因为有时候依赖缺失, 有可能是网络问题,也有可能是系统本身的一个依赖缺失,那我们回到这个 d p c 这边,把这一边,把这一个报错,然后给到 d p c, 就 不一定所有人都会有出现这种报错, 这种报错有可能是就是依赖缺失,你看它的意思就是安装这个插件就是因为依赖缺失嘛, 直接安装这一个依赖 m p m install, 把这个缺失的依赖手动安装, 可以看到它有六个文件已经安装。那我们再次使用一下 openclock o p e s c l a w 哦, 再次使用一下那个刚刚的设置。 很多时候遇到问题的话怎么说呢?问 d c 或者问豆包,如果 d c 不 行就问豆包。一般来说 ai 都能解决这些普遍的依赖缺失问题, 如果实在不行的话,我们就卸载掉,重新再安装一遍,然后再次 reset full reset, ok, ok, 我 们再重走一遍刚刚的那个流程, 再选择 custom, 然后 我们选择找到刚刚的英伟达,然后回车回车, 然后再找到 i a p i k 回车,回车模型,就刚刚的这个 stefer 回车好 mini, 然后 stefer 再回车,回车回车回车!回车。 这次的话它是有一个警告,但是没有退出这个配置,就已经成功的成功的配置好了, 就是补出,我们把那个刚刚的这一个这一个依赖补上之后, 就成功的创建了配置。那我们 channel 这边直接把飞书先直接接入进去飞书,可以看到这里有个扫码,那我们直接掏出你的飞书, 掏出你的飞书,如果没有的话,可以直接跳过,有飞书的话直接扫一扫滴, 然后选择已有应用,选择你现在的飞出,创建好机器人, 然后打开应用,然后如果个人使用的话,我建议是 oppo, 但是如果你对安全有一定要求的话,可以只选 aloe, 然后企业微信啊那些,另外自制自制操作,然后 finish, 然后 no。 好 了,这里是一个搜索的供应商,我们可以直接挑过 skip, 这个就是技能的一个选择。个人比较推荐的是 cloud cloudhop 安装技能的一个商城跟那个 githop, 这两个是要安排上的, 还有一个 samurai 也可以安排上,比较常用一点。拉喽 pdf 就 按空格键,可以看到绿色点是选择上了,然后选择完之后回车。 yes m p m 它会安装一个依赖,叫做 home brief, 如果是苹果的话,它本身就有这个 play, 没有有 a b i k, 就是 输入,没有就直接跳过跳过,后续也可以输入 好,这边的话是一个插件,直接跳过跳过。 yes, 回车, 它会安装一个网关 get away, 我 稍微等待一下, 确实有时候遇到依赖的问题,我安装会比较麻烦一点,那我们直接回车 好了,可以看到它。呃,已经创建了,这个叫什么?但是还是有一个 报警,就 one, 但是这个是我们是现在是可以直接忽略掉它, 有可能是刚刚的那个安装的那个一代没有成功,可以看到它已经是进入到聊天界面,让我们打个招呼 算了。我们先把这个头根,现在看到头根是这个上下纹,长度是十六 k, 是 太小了,正常的话我们是可以设定到二五六或者一千六百,我记得这个模型应该是一千六百, 一百六十 k 的, 一百六十 k 的, 我们来到这个乌班图这边,打开这个文件夹, home link m p m 啊不,不是 m p m open crawl, 点 open crawl, 这里有个专审,那我们打开这个专审,找到这个模型 section, 找到这里有一个一千六百,这这这个把这个参数改到加一个零,就是一百六十 k, 然后文件保存,然后再把它关掉。 好了,我们重新打开, ctrl 加 c 回车, 这个应该是刚刚的一个,哎,我退出,然后它刚刚的设置没完成吗?无所谓,等一下,等它重新起用, 可以看到刚刚已经是一个设置完的一个进入到对话,但是我们是把这个 上下文,你可以看到十六 k 实在太小了,就一个小小对话就把它塞满了百分之六十五了,我们需要把这个聊天对话就比较把它加长一点。好,我们重启一下网关, 该有位 w a y r t 重启网关。 好,我们可以看到已经重启完成了,那我们新开一个对话框 ws l cd, 然后再启动对话框 open curl 退,这样就进入到一个对话,先确认没问题了,还是这个报警还是存在。如果是觉得这个碍眼的话,大家也可以复制到这个 dipc 或者其他地方去看能不能修复 好了。可以看到已经进入到对话,我们输入一个礼号试一下,看能不能。哎,他说没有,没有连接,那我们直接换个模型试一下。 哦,这里有一个,可以看到它,这里有一个提示,叫它叫做这个 to approve 有 id, 因为它有一个安全认证的问题。 那我们来到这一边的话,输入这这一串命令,他这里有一个提示,然后我们回车 可以看到这里,因为我们重新开了一个窗口,有可能是他不认,他需要把这一串码通过了才可以去进行一个聊天, 把这一个复制进来。 ok, 好 了,可以看到已经完成了一个认证。 ok, 正确的格式应该 open cloudywise approve, 然后再加上这个请求的这个设备码, 可以看到他 boy, 就是 证明就 ok 了。哎呀,你看我的,我先重新进嘛,你看我的鞋子,好朋朋友看我鞋子,看我鞋子。嗯,真棒。嗯,真好看。 ok, 然后我们再输一个,你好,看一下有没有回应。 ok, 可以 看到是已经有回应了,可以看到这边十六 k 阴影依然是没有变了,这个对话长度还是超标了,我建议还是取消掉,然后六新建一个绘画, 然后再试啊。可以看到新建绘画之后,这边就变成了一百六十 k 证明就生效的,然后重新重新绘画,因为上下文如果抄的话,有可能会导致你的绘画是不能正常的进行的。 可以看到他已经那个了,已经正确的回复了,比如说我们可以问他,你是谁,你是谁 啊?他会刚上线,那我们就说开启, 开启初步化,初步化记忆系统,系统开启长记忆, 长记忆,这是一个 agent 的 最基本的一个操作,这个必须要那个的, 那么因为 openclock 现在是完善了它的那个系统机制,必须要回答它这个 user 的 问题。那我叫梅花,我是老梨。 好,其他细节 可以不补充。设定时区设定时区 时区为上海,中国上海国上海。然后就是其他后续的 定出使化喜地 开启长计 好, 好了,基本上到这一步的话,你的 open claw 已经是一个正常的 open claw 了。 至于怎么设定,大家可以后续再关注,或者自找一下这个 开启,还有设定的一些提示词。好,我们这一次的安装就到这里。

给大家看一下最近很多粉丝提的本地部署生图生视频的需求,整套流程已经全部实测完毕了,非常稳定。用的是恩卡的这套方案,实测三十秒不到就能直接生成三到五秒的视频,二十四小时不间断,日常商用,批量使用是完全没问题。大家可以近距离看一下实际出图效果,特别是咱们做电商行业产品图的, 哪怕只用最简单直白的基础提示词,不需要复杂繁琐的专业指令,都可以生成这样的效果。人物视频也生成了几个片段,给大家看一下整个画面质感、画面细节依旧做得非常出色。本地部署的优势真的特别突出。 首先不用长时间排队等候出图,不会一到高峰期就开始出废片,风格跑偏等等,完全不用担心花钱买废片,效率大大提升。全程不消耗任何流量额度,不用充值抵扣 token, 没有任何额外扣费成本,不受平台规则限制,全天候不间断运行,批量生成图片,视频创作自由度和使用性价比直接拉满了!宝宝们晚上好呀!

免费使用大模型的顶级羊毛来了啊,今天我就手把手教你们这个羊毛到底怎么薅,我不宠我的粉丝,谁宠你们,让你们零成本使用! kimi 二点五, mini max 二点七, g l m 五点一,谷歌字节跳动、 deepsafe、 阿里千问,整整九十个顶级大模型的 api, 每分钟四十次调用,可以白嫖一年,普通人根本用不完,你还有什么理由不去学 ai 呢?咱们拍拍手仔细听啊,说白了就是英伟达搞的模型 api 超市, 赚钱可能赚太多了。开始讲良心了啊,第一步呢,创建账户网址,我这不能写啊,你们自己搜一下,输入好邮箱,点 nest 设置密码,创建账户。然后呢,到你的邮箱里去验证一下,通过之后,系统会让你创建一个云账号,记住这里啊,用户名必须用英文和数字。创建完云账号,顶部会弹出一个验证信息,用咱们中国的手机号做一下验证。手机验证通过之后呢,点右上角的头像,选 a p i k, 进入 a p i k 管理界面, k 的 名字你可以随便起啊, 模范围默认勾选就可以了。点 general api k, 看到这个页面马上复制保存,每个账号最多八个 api k, 一个 k 呢,可以访问所有的模型。好了,你现在就可以开始你的 ai 之旅了。再说一句啊,我会的东西挺多的,那你们倒是问啊!

这么多老板想要搭建本地 ai 模型,那到底该选什么硬件?选哪些模型?今天一次性讲清楚!目前本地模型主流方案 n 卡和 max studio 该怎么选呢?那如果你是小型团队或个体老板,优先选择 max studio, 体积小,颜值高,首选 m 二 ultra, 六十四 g 版本两 万多,价位,对比 m 四 max 性能更强,内存待宽能达到八百 gb 每秒,对比 m 三 ultra 性能差距不足百分之五,价格更低,性价比极高, cpu 和 gpu 共用内存架构,六十四 g 全部可以当显存,适合日常办公与轻量化 ai 预算。那如果你是多人团队,想要并发使用 max studio, 预算速度稍弱,复杂数据处理多任务并发场景下效率不足,所以就得考虑 n 卡方案了。以电商行业为例,日常海量报表整理、 数据分析、多表格批量处理,因伟达设备响应速度更快,大幅提升工作效率,满足企业高频预算需求。模型适配方面,这两套都可部署 q i 系列模型、 g m 系列等主流开源模型,像电商、利索、服务行业等多领域都能适配。像无缝对接 erp 系统,自动统计销量成本利润、智能分析、爆款单品 类数据精准预判市场趋势、节日热销品类,为运营决策提供数据支撑,这些都能实现。而且本地模型数据安全、算力自由无限、 toker 等优势能够杜绝云端数据泄露风险。那如果您还不知道怎么选模型,关注我,看更多行业案例!

hello, 大家好,上期视频发布完之后呢,反响非常的热烈啊,特别开心大家能在评论区积极的互动交流。 技术本身没有好坏之分,只是适配的适用环境各不相同,只要用对合适的地方足够好用就可以了。本期视频呢,咱们就细致的讲解 i m studio 完整的使用方法, 同时呢教大家借助这款软件把本地大模型成功的发布成线上可用的本地服务,之后再用小轮下 apple clone 来配置接入, 顺利的调用运行本地的模型。这款软件整体使用起来十分的友好,上手难度很低。 眼前出现的就是软件的开始启动页面,我们直接点击开始进入,页面会自动给我们推荐一款模型,这里我们直接挑我推荐,后续再自行挑选自己需要使用的模型即可。 随后我们打开软件内部的开发者模式,现在就正式进入到了模型的操作的主页面当中。我们还可以点击左下角的设置选项,更换软件使用的语言, 切换成简体中文。不过在实际日常使用过程中呢,软件大部分功能界面依旧还是以英文显示为主,大家按照自己的使用习惯选择就可以了,我平时还是喜欢使用英文界面操作。 接下来我们看一下左侧栏目里的 c 他 们分类下的两大板块。首先先来查看 helloworld 的 硬件设置板块,在硬件设置页面当中呢,软件已经自动侦测到我设备里的独立显卡,并且识别出对应的互联讯讯行协议,我们直接将这个功能开启。 第一个选项是设置,让模型全程只在显卡显存当中运行,一旦开启这个选项,要是电脑显卡显存容量不足,就很容易出现程序卡顿甚至崩溃的宕机的情况, 所以这个选项我们一定要关闭,我们只需要开启第二个选项,把部分运行缓存放置到显卡显存当中,依次来提升模型整体的运行执行效率。这里给大家说明一下本机硬件配置。运行内存一共三十二 g, 显卡显存为六 g, 大家一定要记住这个六 g 的 显存数值。设置完硬件板块之后,我们再进入了 ron time 运行环境板块,在运行环境页面里,我们直接选定库达运行协议,目前软件内一共只有这三类运行协议可供选择,我们直接选择这一款就可以了。 下方拓展运行组建,那可是英伟达独立显卡专属的配套文件页面还有相关运行的配置文件, 要是想更新版本能手动操作,咱现在下的是最新版本,暂时不用更新,懂者软件用久了运行不正常了再来这更新就好。设置弄好直接关闭设置页面, 我们重新回到左侧功能菜单栏,页面底最底端就是模型搜索查找功能,我们直接将这个功能打开,打开之后呢,页面会自动弹出各类热门模型推荐。 今天我们着重给大家讲解谷歌的伽马四系列模型,这款模行为一四 b 版本,整体内存大小约在六点三三 g, 经过 i m 四六的软件压缩优化之后呢,六 g 显存的显卡完全能够平稳承载运行,我们直接选择下载这款模型就可以了。 在模型下载界面当中,大家能够清晰的看到三个不同功能的分类选项,第一个选项代表模型具备深度的逻辑思考能力,第二个选项支持各类的实用工具调用功能。最后一个选项可以实现图片、图像内容的输入识别。 这三类功能全部集齐也是目前全新版本模型的主流优势。大家直接勾选进行下载 页面当中除了 e 四 b 版本之外,还有个 e 二 b 版本模型可以选择。 e 二 b 版本整体体积更小,内存仅为四点四一 g b, 对 于我这款六 g 显存的显卡来说,这款模型适配度会更高一些,不过它的模型参数相对更少,实际运行表现和使用效果会略微逊色一点。 清楚了了解这两款不同版本模型的区别之后呢,我们接下来正式进行模型的载录操作。 点击页面上方的下拉选项菜单,就能看到当前可选用的模型列表。我们直接打开手动自主选择模型参数的开关,随后选中已经下载完成的模型,并开始载录。进入模型载录页面之后,我们把展示进阶详细设置的功能页面打开, 同时把相关参数记录设置功能开启保存。完成这一步操作,我们就可以开始进行各项精细化的参数调配工作了。 我们部署搭建本地 ai 模型,最主要的用途就是对接小龙虾 a 阵的来使用。首先第一个硬性要求,对话上下文长度最低要设置到十六 k, 也就是幺六三八四数值,不过我经过多次实际使用测试,发现这个数值依旧不太够用,所以大家直接设置成了三十二 k, 也就是三二七六八, 使用体验会舒适的很多。接下来调整 cpu 层级,卸载相关参数,软件的默认数值为二十八,这个二十八代表模型运行到第二十八层数据内容之后,后续剩余的模型参数以及相关运行数据都会转交到 cpu 当中进行运行处理。 我们如果把这个层级数值不断调高,就会加大显卡 gpu 的 资源占用量。按照当下设备设置情况,我们把数值调整到三十层左右最为合适,能够有效的提升 ai 智能回复的整体响应效率。 cpu 的 缓存空间大小直接拉满,调到最大,日常使用体验会更好。最后找到这个 kv 缓存相关设置选项,直接将这个功能开启,下方的 fresh attention 的 功能选项我们切记要开启,这样能够让本地模型的整体运行反应更加的稳定和顺畅。 所有参数全部调试完毕,我们点击确认载录模型,等待模型加载完成。模型载录完成之后,大家打开电脑自带的任务管理器,点击进入性能查看页面,在页面当中找到 gpu 显卡选项,向下滑动查看详细数据,可以清晰看到本机显卡总内存为六 gb, 当前实际占用内存为五点一 gb, 剩余还有将近九百兆 b 的 内存空间,能够又流出充足的余量用来完成后续内容输入和数据的处理工作,整体运行状态完全可以正常使用。 模型成功载入运行之后,我们再次进入左侧的开发者模式页面,这个页面当中找到 server setting 的 服务器设置选项,并点击进入。进入服务器设置界面,我们把本地局网内提供模型服务的功能开关打开, 开启这项功能之后,同意局域网内的所有设备都能够顺利的连接调稳这台设备。搭建好的本地 ai 模型服务。成功开启本地服务之后,页面上方会显示服务器的端口,软件默认端口数值是一二三四,大家有修改需求可以自行的调整更改。 紧接着把页面显示的模型 id 完整的记录保存下来, 再把本地服务器访问地址一并记录好,我们直接复制保存这两正好两项关键信息。到这里,整套完整的本地模型服务搭建部署工作就全部完成了。接下来我们正式进入小龙虾 open clone 程序当中进行对接配置。 现在正式进入小龙虾程序安装的配置环节,我们先把电脑终端窗口打开,在终端当中输入 open klo 的 启动指令,成功输入指令之后进入程序的配置页面。 成功进入对应的页面之后,我们按下 yes 确认键,正式进入参数的设置板块,我们直接选择快速设置模式,进入模型挑选设置页面, 随后向下滑动页面,找到 customerpricer 自定义本地模型选项,这一选项就是专门用来对接配置本地部署模型的专属通道。 我们点击进入对应的配置界面,先把之前在 imcc 软件当中提前复制好的本地服务访问链接调取出来, 反正年期填写到对应的输入栏当中,填写完成之后,页面会提示输入 api 的 密钥,我们直接按下确定键即可。由于我们搭建的是本地私人的模型服务,没有设置专属的 api 密钥,所以这一栏大家随意输入内容确认就行。 完成密钥填写之后,我们统一选择了 open ai 通用的兼容协议,紧接着把提前记录好的模型 id 准确地输入进来去填写完毕之后,小龙虾程序会自动进行网络联通测检测,等待检测成功之后, into point id 输入栏目当中, 我们直接填写和模型 id 一 模一样的内容就可以了。至于模型别名这一栏,大家不需要额外填写任何内容。 全部配置流程完成之后,我们打开网页端进入小龙虾程序主界面,能够正常顺利的加载出主页面内容,就代表本地模型和小龙虾已经成功完成连接的对接。 这期视频实操内容非常多,从 i m studio 安装、显卡参数调优、模型选型部署,再到本地服务发布,全程对接 iphone klo 小 龙虾智能体每一步都给大家讲的特别细致,手把手带大家落地, 整套都是可以直接照搬套用的干货教程,大家千万别嫌麻烦,认真的跟着操作一遍,就能彻底的掌握本地 ai 智能体的部署方法。觉得这期内容实用的话,一定要点赞收藏转发,方便以后随时回看附用, 还没有点关注的朋友记得点点关注,不然后期更新更更高级的玩法,进阶调优的教程你很容易就刷不到了,咱们下期继续解锁更多本地 ai 智能体搭建的硬核干货,精彩内容持续更新!

这么多老板想要搭建本地 ai 模型,那到底该选什么硬件?选哪些模型?今天一次性讲清楚。目前本地模型主流方案 n 卡和 max studio。 那 么首先就是 max studio 它的优点肯定就是它的显存足够大,因为它的显存内存是统一的嘛。像这一台是 max studio m 二 ultra 六十四 gb, 也就是说它可以装最大六十四 gb 以下的,但是你像五零九零呢, 它就只能装二十四 g 以内的一些模型,这是很大的区别,也是 max 的 优点,但它的缺点呢,是它的算力不够啊。就是如果说你要跑多人并发的,但 max studio 只能一个人啊,那如果你是多人团队, 想要并发使用,就得考虑 n 卡方案了。但是 n 卡五零九零的,它的价格也会稍微贵一点,贵个几千块钱啊,并且它的算力速度是翻倍的。因为我们实测下来一个数据,那 max studio 它的 t g token 可以 跑到五十到七十,那么五千零九十的 t g token, 它可以跑到一百到两百,然后 max studio 它的 p p token 可以 跑到两百到三百, 那么五千零九十的 p p token 可以 跑到七百左右,这就是它们两个最大的一个算力的区别。所以从算力来讲,那么五千零九十它是全面领先的, 最终怎么选?那么也可以从几个点去考虑,第一点就是你愿不愿意多花几千块钱去获得一个翻倍的算力啊。第二点呢,就是你到底想装多大的模型?如果你一定要装一个六十四 g 才能装下的模型的话,那么可能只有 max studio 可以 满足你这一点。再就是要上 pro 六千了,那么这个价格就不是它翻倍这么简单了。

嗨,各位,英伟达可以免费领取 api 的 事情应该都有听说吧,今天我就跟大家分享一下如何进入英伟达官网去领取这个 api。 首先呢要进入英伟达的官网,官网我打在屏幕上了,大家可以暂停看一下。 好,这边开始呢,我们只需要点右上角的这个 log in 就 开始,它会让你输入一个邮箱,那登录界面也是这样的,不过这里呢,为了考虑到很多朋友的没有账号, 那么我也就新注册一个账号,用一个新的邮箱,那这里就是账号密码输入,那我觉得这边呢,我就可以快进掉了。 ok, 到这一步开始呢, nba 会告诉你是不是要一些讯息,那我是会要的, 因为我是可能剪视频以后会用啊,包括我后面做一些行业资讯的补充,那你们可以看你们自己到底要不要,然后这边呢,就是打一个自己的昵称。 ok, 那 创建完这个昵称之后呢,我们账户基本上就完成了,那只只需要验证一下,验证这一步你可以看到啊,在最上面它会有个验证的这个按钮,点击它, 你只要输入手机号就行。那这一步呢,我也是快进的账号验证完成,我们这个时候就开始 选择 models, 就 可以看到有这么多大模型,我们是可以免费的,都是免费的可以选的啊,我们这边就继续用这个 deepsea v 四 pro, 好 吧,它是最新的,然后点开之后呢,我们去看这个 vivo code, 就是 看它这个代码,点开之后,我们再选这个 api key 点开,然后呢就会获得 a p i k。 那 同步呢,我们这里呢就会获得 base 二幺 a p i k 和 model 了。那有了这些东西之后呢,我们就可以配到我们的小龙虾里面去了,那我觉得感兴趣的小伙伴呢,现在就可以去动手去试一下,欢迎帮我点赞、收藏、分享,你的支持是我更新的最大动力,谢谢!

今天,这套本地部署大模型方案马上就要发走。粉丝是做贸易的,他的需求特别直接,让 ai 把订单、单据、数据的全流程跑通,一千几百笔进出口订单、报关单、采购明细、物流信息全靠人一条条往表格里敲, 手忙脚乱赶进度不说,甜葱露甜是家常便饭。想对比不同批次的采购价格,大海捞针。合同快到期了,也没有人提醒。 现场给他演示了一下订单数据自动同步,报关单、采购单智能生成、业绩报告一键输出。他明确要求所有数据不上云, 所以我们做的本地部署服务器放到自己公司,数据不出门,谁也拿不走。 ai 不 光是处理订单,我们帮他搭建了私有知识库,档案、合同文档、供应商资料、报关流程手册全放进去。在对接他的 erp 和 crm 以后,随口就能问,在报关的订单还有哪些? 上个月某类产品的进出口量比去年增长了多少?哪些潜在客户该跟进的,用什么话术?不同港口的报单时效和成本差多少?这些以前要翻表格问财务的,汇报的是 ai 几秒钟给你 答案。整套本地大模型部署到位,教你跟 opencloud 怎么沟通,帮你搭好贸易业务的知识库,手把手训练你的 agents 一 对一陪跑,直到你团队能正常用起来。把数据统计、档案剪辑这些耗时的活交给 ai, 你 才能腾出手去拓展供应链、谈客户、做增长。

今天在这个网站上看到一个唱歌数字人啊,我觉得这个还挺有意思,然后把这个下载安装一下,把所有的模块打通啊,然后现在开始运行了,是从早上十点开始的,搞到了下午五点, 这模型太重了, gpu 专用的内存二十四 g 它都没有用满,然后把把模型给放到了虚拟内存里面去了,虚拟内存现在都快占满了 啊。一起来验证一下这个视频到底咋样啊?打开视频来一起看一下, 呵,完了,哈哈哈,二十秒。

兄弟们,英伟达这次是真的把赛博菩萨做到底了, deepsea 一 四 api 免费调用了。之前很多人刷到过英伟达免费开放 mini max m 二点七,但当时内地手机号只开放了一段时间,好多人根本拿不到 api key。 但我今天替大家实测了, deepsea 一 四也能直连调用,而且国内手机号验证秒过, 无需绑定银行卡,不需要任何魔法环境。趁着现在国内手机号还没被关进小黑屋,赶紧上车,下次还不知道什么时候开放了。不知道如何申请的评论区扣英伟达关注我哎,不落伍。

给粉丝搭了一台五零九零 d 本地大模型解决方案三万二的主机,能带来什么样的体验?粉丝是在浙江做医美行业的,他把销售订单、采购记录、库存数据、直播数据、员工信息全部喂进去, 平常在手机上就能直接问。帮我分析一下最近的销售订单直播投放还能怎么优化,员工绩效怎么分配合理整理一版逼单话术给我全在这台英伟达二四 g i 主机上跑,速度快,不调外部 ipi, 不 花一分钱脱困费, 公司所有数据都不上传,保证数据安全。他还能做什么?企业私有知识库,帮你打好 skill, 产品知识库、合同文档、新人培训手册、 s o p 流程权、 c r m e r p 系统能接入这些东西加在一起是什么?是公司的数据资产? 通过你自己投喂的公司数据,他不再是通用的 ai 助手跟你尬聊,你问一个问题,他答一下,而是上下文连续。真正理解你公司业务,吃你公司数据的 ai 员工, 硬件是你的,模型是本地的,数据是你的,训练的 ai 助手是你的,你是老板不是租客。五零九零配好,直接寄收到以后工程师一对一,记住配套,你拿到的是整套解决落地方案,不是一台冰冷冷的机器。 ai 是 强大的生产力,就看你怎么用。

今天这套配置是专门给做带运营的老板安排的,就是用来搭本地大模型,帮你管公司财务报表、各类合同,还有账号运营的全盘数据。老板之前一直用线上 ai, 反一半不说,还一直好偷坑烧钱。关键是所有数据走云端,容易被共享出去,隐私和数据一点都不安全。所以这次直接把大模型搬回本地跑,数据完全自己把控。我给他配的是英伟达二十四 g ai 主机, 千问三点六的二七 b 全量模型,性能刚刚好,数据精准又稳定。以前财务做完报表老板才能看,还得自己慢慢分析。现在直接把报表丢给 ai, 自动帮你梳理分析汇总日常账号运营数据, 手机随手一问,就能看到每条视频的详细数据,公司资料全部录进去之后,想问什么直接说哪些合同快到期了,哪些客户该回访了,自家账号和竞品数据差在哪,全部实时就能查到。最重要的一点,所有数据全部分地存储 上云端,杜绝外泄。我们提前帮你把实用功能全部预设好,到手就能用。还有一对一全程陪跑,教你怎么用 ai, 怎么搭建自己的企业私有知识库,后续模型更新我们都会提前测试调试好,你直接放心用就行。