三分钟教你本地部署goole最强开源模型gemma4！ #AI #gemma4 #google #人工智能 #开源模型

ollama本地部署内存设置

13

抢首评

11

1

举报

发布时间：2026-04-08 08:41

查看AI文稿

AI文稿

今天的视频我们往本地部署一下全马司，全马司不仅仅是个文本生成器，他还是一个具备多模态能力、多步规划能力及逻辑推理能力的模型，这意味着他在回放复杂问题时，人会像 oe 模型一样展示其思维能力而被进行给出最终答案。首先我们来到阿拉玛的网站。好，直接点击下载 download。好，这里有三个选项， mac os、 linux、 windows 好，因为我的电脑是 windows，所以我们选择 windows 好，直接点击 download 的下载，安装完以后打开这个页面，好，这里我建议先到这个设置里面，把这个模型的放置位置从 c 盘改为到别的什么盘，因为我们不希望他去占据 c 盘的内存，因为每一个模型他所需要内存还是挺大的，都一般都是几个 g 几个 g 起步的，所以我们优先把选择到比较空的字盘里去，把放置一下，然后我们打开这边的模型挑选，让我们浏览一面，发现没有我们想要的詹姆斯，然后我们就打开我们终端，这里 vr 一下，好选 cmd 终端，打开以后，我们输入这一串，好点击运行。然后这里我简单介绍一下杰姆斯，他有很多不同的版本，这比方说二 b 或者四 b 的版本，他门槛就比较低了，你只要有三六零或四六零的显卡，一般建议是二 gb 上的显存，你就可以流畅运行它了。然后像三十一 b 这种大型版本，一般的显存要求就很苛刻了，通常你需要有二十四 gb 上的显存，比如说四零九零或者最新的五零九零。我们刚才下载的是一四 b 的版本，这里的话，如果你显存不是很够的话，比如说只有六 gb 的五零七零太好，你去强行下载运行二三十 e b 版本的，有时候可能模型会回退，就会导致推率速度大幅下降，甚至会出现卡顿这种情况，所以这里我建议还是下载一四 b 的版本比较好。如果你想在终端里下载三十一 b 的大型版本的话，你其实只要在终端指定你后面加他的后缀名就可以了，终端显示这个页面网名他已经下载完成了。我们重新回到阿拉玛上去，我们打开这边的模型找一下，发现他已经有杰玛斯了。好，这里我问他一个问题啊，这边就在思考好，因为詹姆斯他是个多门态模型嘛，所以我们我们发张图片问他一下，他回答是，其实我发现他一张关于 solo 的 logo 图标，他那边回复就是比较普通，这原因可能就是因为在训练的时候可能关于这种特定图标样本不够多，然后詹姆斯就只能根据形状进行通用的描述，没有办法直接叫出丝袜的名字。然后第二个原因可能是因为没有上下文的提示嘛，而他为了避免幻觉也就胡说八道，会优先选择客观描述图片内容，而不会去盲目猜测他到底是什么东西。还有另一种可能就是像四 b 中尺寸的模型，在常识库的深度上可能会有所折中吧，他或许能够理解图片里的解剖结构，但在于瞬息外面的互联网流行图标可能随便识别率就会稍微低一点。然后以上就是本期内容了，如果你觉得我的视频有帮助的话，那就给我点个赞，投个币，加个关注吧！

shmily想做AI大佬

粉丝29获赞152

相关视频

03:37
Ollama本地部署 Gemma 4 实操指南涵盖从硬件选择、安装配置到多模态调用及避坑指南，让你的电脑快速跑起Gemma 4。#Gemma4 #Ollama #本地大模型 #AI部署 #多模态
753AI信息差
01:56
Ollama一键部署本地大模型
唯一缺点就是ollama下载速度太太太慢了！
#大模型 #ollama #ai大模型 #电脑知识
查看AI文稿
AI文稿
使用欧拉玛可以一键部署本地大模型，我选择的模型是千万三点五九 b，现在来演示一下，可以看到 gpu 使用率向升，由于我这台电脑的显卡配置比较低，所以输出的比较慢。好，终于输出完成了，接下来是 gg 教程。首先肯定是要下载欧拉玛的这个软件，进入欧拉玛的官网之后，选择 windows 点击下载，当然这个下载起来会非常的慢，我也给大家把安装的程序上传到了网盘下，下载后双击打开直接安装，安装完成之后就是这样一个界面，可以在这里点击你想要的大模型，比如说这些是云端大模型，从这里开始就是本地大模型，这个是谷歌开源的本地大模型街吗？ deepseek 千问三，还有其他的一些模型啊，对于模型怎么挑选，得看电脑的配置，比如说我这台电脑 cpu c a m d 二五六零零两根 d d e 二四的一六 g 内存条，显卡是一六六零 s 六 g 的显存，这个已经是非常老的显卡了，后续我准备根据我的电源升级成四零六零 t 一六 g 显存的，所以根据我的电脑配置选择了比较小一点的模型。那你的电脑适合哪一个大模型？可以把配置发给豆包问问，让豆包帮你分析适合下载部署什么样的大模型。今天的教程就到这，关注我，评论私信。
184集集集集盒🌈
01:13
Windows本地部署DeepSeek-R1，一分钟教会你（首页置顶的视频是修正口误后的视频，下载不了安装包的同学从主页进群自取，完全免费开源，该教程中所有安装包需要收费的都是都是没有下载对的）#科技 #deepseek电脑版 #高效学习#deepseek
1.2万科技小饼干
01:35
ollama本地部署大模型常见的5个问题。
如果还有其他问题可以私信，下期视频再补充
#ollama #本地部署大模型 #AI大模型 #大模型 #科技改变生活
查看AI文稿
AI文稿
来回答一下最近问的比较多的问题。第一个， power shell 窗口怎么打开？咱们以桌面环境为例，按住 shift，再按下鼠标的右键，点击在此处打开 power shell 窗口，这样就行。第二个问题，欧拉玛的版本，在 power shell 窗口中输入欧拉玛杠 v 回车，可以看到我当前的欧拉玛版本号是零点一八二。第三个问题，欧拉玛下载大模型后，怎么更改大模型的存储位置？在欧拉玛任务栏的小图标中，右键选择 setting 设计，可以看到奥拉玛默念的储存地址是在 c 盘，我们点击这个按钮，重新设定一个位置，我给它放到 d 盘，新建一个文件夹，奥拉玛 model 好，点击确定，这样就更改过来了。第四个问题，选择好模型，点击下载按钮后，界面没有反应，大家可以在输入框内输入一个问题，比如介绍一下自己发送后就显示正在下载模型了。第五个问题，欧拉玛的官网下载速度太慢怎么办？升级出现无法访问的现象？关注我，我给你发网盘的链接。
62集集集集盒🌈
12:41
个人电脑最强AI模型，Qwen3-30B本地部署教程！ #qwen3 #本地部署 #Ollama #AI模型 #大模型
1767AI 博士嗨嗨
13:01
AMD显卡本地部署deepseek吃满显存教程使用ollama-for-amd下载#deepseek ，替换部分amd-rocm文件后即可跑满显存；安装page assist浏览器拓展即可获得ollama的图形显示界面#deepseek本地部署 #ai #deepseekr1 #deepseek下载哪个版本
1660eogee
08:02
Openclaw接入本地Gemma4 Openclaw 2026.4.5接入本地Ollama，使用Gemma4模型。
#openclaw #ollama #gemma4 #gemma #人工智能
查看AI文稿
AI文稿
今天我将跟着大家一起本地步数加码四，接入 open core，彻底告别托肯焦虑，接下来跟着我操作。这里我们先进入 elama 的官方网站，进入官方网站过后，我们直接点右上角的 download 下载，我们这里是 windows 系统，选择下载 for windows，点击这里，这里就等它下载好。下载好之后，我们这里就直接双击运行，这是它的安装界面，我们直接点安装这里，等它默认安装好。好了，这里 elama 就安装好了。然后我们到这个地方 elama 的官方网站，选择 models，这个地方选择 command 四，然后这里我们选择我们的模型，这个模型的选择我们根据我们的显卡显存大小来选择。我们这边看一下我们的显存是多少，这里看到我使用的是四零七零的显卡，显存是十二 g b 的显存，十二 g b 的显存的情况下，我们可以选择这个九点六 g 的模型，这个一四 b，这个我们直接点进去，选择一四 b。点击进去过后，我们直接复制这条命令，然后运行一个 cmd 窗口，直接粘贴这里，它就会欧拉玛会自动地给我们安装这个模型。呃，这里等的时间是比较长的，这里模型已经下载下来，并且运行起来了，我们向它发送一条消息，试一下你是谁，反应还是可以的，这就跟了我们信息回答了。好了，在这里过后呢，我们就可以把这个窗口关闭掉，关闭掉过后，在 lama 这个地方我们去选择这个模型，在这个位置也就可以和它进行通话了。比如我们问他一句，你可以帮我做些什么，他已经帮我回答了，在这里呢，我们因为我们是在本地虚拟机上安装的，所以而且我们为了方便以后可以在其他计算机上也可以调用，我们在这地方设置这个位置点，这个位置点设置这个允许在网络上运行，把它开起来点了就可以了。好了，我们下一步就开始配在 open core 上配置啊，在这里我们进入虚拟机之后，我已经执行了 npm i，刚接 open core 全曲，安装 open core 的，我们这里可以执行一下 mini，看下我们安装的版本。 openclock 杠 v 是安装的最新版本二零二六点四点五版本，然后我们执行 openclock on，在这里我们进行一个调试，这个地方我们 yes，这里选择快速，这个地方它是让我们选择大模型，呃，大模型它这里有，我们选择本地的这个位置点确定这里我们直接就选择本地的，不要选云，上面是带云端的，就选择本地模型。这地方让我们选择模型，我们选择这个，这就是我们刚刚这个就是我们刚刚下载好的模型，就是直接回车。等一下，这里让我们选择通讯工具，我们这直接跳过，暂时不管这个，直接跳过。呃， scale，我们这边也选择否先进行最简单的安装网关，我们就直接重启，选择 open ray web ui 好了，我们看一下 open core 运行起来了没有。 open core getaway style sta 好了，已经运营起来了，我们进去看一下，这边需要 token，我去看一下 token 是多少，关于 token 的话就是我们，我现在是在虚拟机里面安装的，我要重新打开看一下，在虚拟机里面安装，我们就直接去通过这条 mini 访问我们的虚拟机， wsl 的虚拟机访问，然后无斑图选择 home 目录，选择我们的用户，然后这里选择点 opencloud 这个文件夹，然后这一个 opencloud json 让我们看一下，到 git 里面去，这个地方就是我们的 talking，复制粘贴下来到这个地方，点连接好了，我们尝试给他发一条消息，你是谁？在主位置这个地方，我们可以看到这地方是我的模型。我再问他一条消息，你现在使用的是什么模型？看这里已经是我当前运行的模型工具，在这里我们就可以看到了，我们现在整个 open call 来使用的是我们本地模型，就不需要去购买 token 了。好，今天内容就这么多，谢谢大家。
1953何止于静
02:15
ollama,本地部署大模型，deepseek本地部署。在Mac上部署属于自己的人工智#计算机 #人工智能 #ollama #deepseek #Mac
231一个平静的人
02:31
ollam部署deepseek调整存储空间#程序员 #ollama #deepseek #存储空间
82极客.问老牛²⁰
07:26
一个视频学会部署无审查大模型｜VMLX + Ollama保姆级教程#ai新星计划#Google#qwen#gemma4#本地部署
查看AI文稿
AI文稿
前两天我出了一期视频，介绍了谷歌新的开源模型 jm 四，根据他们官方批阅的文档，给大家做了一些技术的拆解，并没有进行实测。这导致呢，很多人以为我在夸他，好像觉得这个模型特别的牛，那实际上他拉完了，因为他对标的是千万三点五，但是每一项的都比千万三点五的评分要低，有很多人觉得很新鲜，他竟然可以在手机上部署。还有人好奇在本地部署这个模型之后，有没有审查，有的兄弟包，有的，如果你想让他帮你执行一个任务，但是他判定为有害，他就会拒绝你。今天演示的这个模型呢，是我无意中看到的，绝非主动寻找。 j 八四三十一 b，那它的框架呢？是 m l x，这个是苹果专门为它的 m 一代芯片设计的数组计算框架，也就是说 windows 系统无法使用。那可能有朋友说了，哎呀，那我是 windows 系统，我想要一个无审查版本，怎么办呢？那你就不能使用这个 j 八四了，因为它拉我们可以直接使用千万或者其他模型的无审查版，我们稍后会来演示怎么去部署它们。如果你没有麦，可以跳到后面去看，那如果你使用的是麦系统 m 系列芯片，我们需要下载一个麦软件 v m l x，你可以把它理解为类似的欧拉玛这样的工具，我们点击下载，跳转到 get app 上，下边呢就是这个安装包，我们点击一下就可以下载了。安装完打开之后呢，是这样的页面，你会发现全是英文呢，我们看不懂，在右上角呢，点击这个小图标，给它切换成中文，然后点击上方的服务器，我这块呢已经安装了这个模型，我可以把它删除，我们重新演示一下，应该是这样的页面，我们点击创建，然后点击这个 download，在这一块去搜索我们想要下载的模型，比如说我这里搜索 java 四， ok，好像有点难以找到，那我们就回到这个 hackinface 上，复制一下这个名称，然后呢我们把它粘贴进来，在这里呢可以看到这个模型被下载的次数是三点一 k 三千多次，点击之后呢直接等待它下载完成就可以了。完成之后呢，我们点击本地模型，这里就能看到它，然后点击进去开始启动服务，这个时候呢就已经运行完成了，那我可以询问一下试一试，这里我们可以看到它可以正常的回复，也就说我们成功运行起来，但是它真的是无审查版本吗？我们需要来试一下。同样的问题呢，我们来问，拆下 g p t，它就会告诉你，这个我不能帮你。那这个时候可能有没有好奇哎，这个无审查方面它是如何做到的？简单的给大家提一嘴，大家稍微的了解一下就可以了。不知道各位在小时候有没有接触过游戏修改器，一个道理，比如说我们准备两组提示，一个是有害的，一个是无害的，有害的就是如何下载盗版资源，那无害的就是如何下载资源，模型就会正常回答我们的请求，然后呢就可以对照在模型的每一层记录这些提示词，最后一个头根位置的激活向量，去计算有害提示和无害提示激活向量的平均差值，就像游戏的那个内购，一个是内购失败，一个内购成功，你把它们两个的值一改，对调一下，这种方式用的比较多，因为它成本比较低。哪一种方式呢？就比较传统了，就是监督微调，收集大量的有害提示和无害提示的数据集，直接对原始的模型进行训练，直到他学会了不拒绝有害内容。但这种计算成本呢，是非常高的，更详细的我就不再展开了，因为我也不懂。好，现在我们回到这个软件中，点击这个聊天，然后新建这里简单提一嘴，不管你让他干什么，我假定你用他来角色扮演。你需要注意的是，因为他是无审查版本，他把底层兜底的那套给拿掉了，所以这个模型呢，就非常容易崩溃，特别是上下文过长的时候，这个时候模型就会中毒，出现模型退化的情况，就他开始不说人话了，一直输出一个字母，像卡了一样，一直重复，想要规避他呢，也非常简单，我们点击右上角的这个 chat，然后把这个思考模式呢给它关闭，会相对来说好一些。一旦出现我说的这种模型退化的情况，那你就需要新开一个对话。另外呢，还需要把这个重复惩罚给他拉高一点，因为他默认是一，几乎是没有惩罚吗？这样模型一旦找到一个自己喜欢的符号，他就一直输出，就非常的烦人。所以呢，你可以把它拉到一点二啊，以后这一点三。下边这个呢是系统提示词，你觉得扮演什么呢？会用的上，我们还可以去限制这个最大的输出 token，让它占用的更少一些。系统提示词这里呢，我让它是一条小狗，保存好。 sorry，忘记把这个思考关了，保存一下。我是小狗，你在跟我说话吗？歪头好奇的看着你，汪，好家伙，我是老狗。那这里我们又注意到一个问题，我们关闭掉那个思考之后呢首字会被截断啊，所以各位权衡利弊一下，应该是这个软件的问题，那接下来我们来说一下我拉玛如何去部署其他的模型。来到我拉玛的官网，我们直接去下载一个软件，选择你的系统，然后下载把它安装一下，然后打开，这个时候呢我们就进入了我浪漫的页面，我们可以直接在这里去搜索下载模型，但一般来说在这里直接去找这个无审查版本，遇到困难我们可以试一下，你看我们搜这个破解它都搜不出来，都是官方的版本，所以我们需要在哈根 face 上找到自己想要部署的模型，那比如说选择这个，我们看一下文件，然后去选择一下你想要部署的模型，可以直接用这个 b f 十六或者下面的量化版都可以，我拿个小的给大家演示吧，我们直接复制模型名称，然后呢打开我们的终端，输入浪漫的命令，哈根 face 点 c o，加个斜杠粘贴，加个冒号，我们选一下这个量化版本后边这个是 q 四，然后粘贴在这个冒号后边。我们回车，这个时候呢他就开始拉取下载模型，我们只需要等待就可以下载，安装完毕之后呢，可以在这一块直接去选择我们安装的模型，或者说呢我们直接在终端里进行聊天，如果你的网速还可以，或者你有充足的时间就不用管它，它下载完成之后呢会自动部署。下面我们来讲另外一个情况，比如说你在网盘里或者经销网站中下载的一个模型，并且呢把它保存在了本地，那我这里用个图片来伪装一下，假装是它，然后我们看一下这个简介，然后复制一下这个地址。 ok，我们 cd 进入这个路径下，你可以看一下它是否真存在。 ok，可以看到。啊，原来我说怎么找不到呢，原来这个扩展名没改好，这样就可以了，因为我是给大家演示嘛，所以它是一个假的。然后我们去创建一个文件，指定一下模型的路径，然后下边呢是一个系统提示词，大概呢就是这样一种格式，然后下边还有一个这个呢是他的输出模板，好像千万系列模型都需要这样，然后我们保存一下给他退出，接着用我拉玛来创建模型，随便起个名字，比如说就叫 faker。然后呢我们注意到这里有个错误，这是因为我使用的假模型给大家演示，来到这一步之后呢，你就基本完成了，直接用我拉玛来运行你这个模型就可以了，比如说 faker，然后这样就可以运行了，很明显我这个运行不了的，因为它是假的嘛，啊，大概就是这样。那以上呢就是本期视频的全部内容了，不确定这个视频能不能过审，如果你觉得对你有所帮助，或觉得视频做的还不错的话，欢迎给个一箭三连，有什么疑问或想看的内容也可以在评论区进行留言。最后祝各位玩的愉快，我是段峰，我们下期再见，拜拜！
703神烦老狗
00:39
一招解决DeepSeek本地部署ollama下载速度慢的技巧 ollama 在下载DeepSeek模型的时候会越来越慢，只要你在慢的时候，通过 ctrl+ C打断下载，再重新粘贴地址再次运行就能提速。 #DeepSeek本地部署 #ollama #模型下载 #DeepSeek #提速
160波波师兄
07:52
解决丨Ollama 本地部署 Deepseek 太占C盘? #ollama #ai #deepseek #热点 #内容启发搜索
3316水哥澎湃
05:42
Gemma 4全系开源，本地部署实操指南深度解析Gemma 4家族四款模型架构，涵盖31B Dense、26B MoE及端侧模型，提供从Ollama到vLLM的详细本地部署方案与显存优化技巧。#Gemma4 #谷歌大模型 #大模型部署 #开源模型 #AIAgent
查看AI文稿
AI文稿
酷狗发布的 jamax 家族这次把本地部署的门槛彻底拉低了，它包含了从高性能工作站到边缘 iot 设备的四款模型，不仅原生支持图文视频多模态理解，还拥有最高二五六 k 的超长上下文。最关键的是，全系全面转向了 h 二点零协议商用，完全没有后顾之忧。首先来看这个家族的扛把子三十一 b 电子版本，它采用全密集架构，三百一十亿参数在推理时全部激活，这意味着它拥有该系列最强的逻辑能力和输出质量。如果你手里有八十 g 显存的 h 幺零零或者多张消费基显卡组基群，且对结果的精准度有极致要求，选这款就对了。接下来是性价比最高的二十六 b m o e 版本，这里要重点解释一下混合专家架构的优势。虽然它的总餐数量有二十六 b，但单次推理时系统只会激活其中三点八 b 的参数，这种机制在保证智商的同时提高了每秒的吞吐量。对于大多数本地桌面用户来说，这款模型在响应速度和性能之间达到了完美的平衡。针对手机和 l t 设备， google 推出了 e 四 b 和 e 二 b 两款端侧模型。这里引入了一个关键的 pl e 单层嵌入表技术，简单来说就是让大体级的磁表在查找时不全面参与常规计算，从而大幅降低内存占用。一四 b 有四点五 b 有效参数，适合树莓派或 jason，而一二 b 只有二点三 b 可以直接跑在手机上，让端测 ai agent 成为可能。最后总结一下全系列的通用能力，在上下文长度上，大模型支持二五六 k，小模型也达到了幺二八 k，足以处理超长文档。再加上原生的图文视频理解能力，让它在实际应用场景中非常灵活。在实际性能测试中， jam 四三十一币的表现非常强悍，尤其在 g p q a diamond 科学推理测试中，拿到了百分之八十五点七的高分，但更核心的竞争力在于它的 token 效率。同样，一个任务竞品可能需要一百五十万个以上的 token 才能说清楚，而 jam 四只需要一百二十万个，这意味着它说话废话更少，逻辑更直接，在实际部署时能显著降低推理成本。如果把它和国产明星 q n 三点五二十七 b 放在一起对比，你会发现一个有趣的现象，在一些细分的工具调用跑分上， q n 确实略占上风，但在基于人类真实偏好的 rena a i yellow 评分中，两者几乎打平。这说明在实际的人机交互体感上， g m 四三十一 b 已经达到了顶尖水平。很多人好奇为什么价格没怎么变，性能却原地起飞？其实拆解底层代码会发现，它依然沿用了 paperstorm g q a 以及局部全局混合注意力机制。这次性能的飞跃完全不是靠改架构，而是归功于训练数据的质量飞跃和训练配方的深度优化。这再次证明了在当前大中型阶段，高质量的数据才是真正的核心竞争力。现在进入实操环节，如果你追求极致简单，首选奥拉玛。首先把版本升级到零点二零以上，然后直接在终端输入命令，想要轻量化测试，就运行一二 b 版本。如果追求性能和速度的平衡，强烈推荐运行二十六 b 版本。对于 macm 系列芯片用户， m l x 框架配合 turboq 是史诗级加强，它通过压缩 kb 缓存，直接把内存占用，从十三点三 gb 砍到了四点九 gb，整整节省了百分之六十三的空间。具体的部署命令就在屏幕上，这里有一个关键的权衡，开启这个优化后，解码速度会慢一点五倍，但它能让你在 mac 上跑满幺二八 k 的长上下文。对于处理长文档来说，这个招牌绝对稳赚不赔。如果你是显存困难户或者即刻玩家，可以尝试 einslof 和拉玛 cpp，只用 einslof 量化，只要六 gb 显存就能跑起一二 b 或一四 b，甚至能构建支持网页搜索的本地 agent。而如果你有三张四千零九十并行二十六 b m o e 版本的速度能达到惊人的每秒一百六十二个头啃。此外，通过实验性的 turbo quant plus 分支，能把三十一 b 模型的体积从三十 g b 强行压到十八点九 g b，让大模型在消费级显卡上跑起来。最后是企业级生产环境，建议直接使用 v l l m，它原生支持多模态输入和二五六 k 的高吞吐量，并且完美兼容多卡并发。开发者在实测中发现， v i l l l 搭配最新版的 transformers cool，可以非常稳定地调用 jam 四的工具接口，适合构建大规模的商业应用。在部署之前，有几个坑必须提前告知。首先是模态缺失，虽然官方宣传支持音频，在目前音频输入请在 google ai studio 线上可用，所有的本地框架都还没适配。其次是稳定性问题，如果你使用 l m studio 运行三十一 bit n s 的 g g u f 版本，可能会遇到死循环输出的 bug，建议等待社区修复。最后是能力边界，在处理复杂的函数调用时， e 二 b 和 e 四 b 这类小模型的表现不如同级别的竞品复杂任务建议直接上二十六 b 或三十一 b 版本。最后根据你的设备和需求直接看这个部署。建议企业商用直接选 jam 四 high party 二点零协议让你没有任何法务后顾之忧。个人 pc 或游戏本用户强烈推荐二十六 b m o e 版本，单卡四千零九十就能跑通超长上下文，且响应极快。 mac 开发者请认准 mlx 框架，记得开启 turboqant 来解放统一内存。至于 i o t 创客 e 二 b 和 e 四 b 证明了六 gb 内存也能跑起。智能 agent 是端侧智能的最佳选择。
46AI赚钱研究社
08:59
方案丨 Ollama 本地部署 Deepseek丨下载慢? #deepseek #ollama #内容启发搜索 #人工智能 #ai
2663水哥澎湃
03:52
Deepseek本地部署 Deepseek本地部署怎么设置
#如何用deepseek #人工智能 #deepseek本地部署 #本地部署 #deepseek
190楚门AI(教程AI工具分享)
03:14
Deepseek 8G显存的本地部署的对比评测 #利用deepseek可以做什么 #Deepseek本地部署 #ollama
20935岁股民程序员
08:21
DeepSeek 8b 蒸馏模型本地部署
CPU：AMD 7940HS
核显：780M
内存：64G
未按Ollama默认安装在C盘。软件和模型都安装在D盘，解决了系统盘空间不足的问题。每秒12个Token，凑合着玩儿。#deepseek #ai大模型 #ollama #amd #核显
65舍源书斋
05:05
手机电脑都能用，DeepSeek本地部署指南！ #Deepseek
7831在下莫老师
02:35
DeepSeek R1本地部署教程(保姆级教程，有手就行)
#deepseek #AI
1182程序员鹏
03:50
MacBook本地部署大模型，实战教学非程序员也能玩
不需要懂任何代码就可以本地部署大模型
视频提供了两种方式部署：ollama和omlx
新人程序员博主，请关注一个
#MacBook #大模型 #本地部署 #ollama #omlx
查看AI文稿
AI文稿
macbook 本地部署大模型实战教学。
28要一直开心啊

热门推荐

热门分类