粉丝363获赞3821

公主,你现在看到的就是谷歌最强的开源模型加码四,可以看图,能听音频,也有不错的推理机制,最重要的是完全免费,给我几分钟,从零开始,将加码四部署在自己的电脑上。我们直接开始 先花一分钟和大家聊一下贾马四是什么?它是谷歌刚发布的开源 ai 模型,跟商业版的怎么奈同根同源,你可以理解为谷歌把自家最强的 ai 技术浓缩成了一个免费的版本,直接送给你用。 那么它好在哪里呢?三个点。第一,多模态,不只是聊天机器人,你可以发图片让他看,发音频给他听,还能写代码。 我们可以看看这张表格,横轴是模型的参数体量,而纵轴就是性能表现。贾马四以满血版的性能表现和千万的三百九十七 b 的 模型能力基本持平,关键在于它的体量只有千万的十分之一,这真的非常夸张。 第二,完全免费,不用充会员,不按 token 收费,并且可以商用,你可以模改它做成各种有意思的本地模型,拿去做产品也没有任何的问题。第三,隐私安全,因为跑在你自己的电脑上,所有的数据都不会出,你的电脑拿它处理合同,财务,私人物件,不用去担心泄露。 ok, 我 们直接动手。你现在只需要打开一个浏览器,然后把它放到全屏上,直接官网上搜索欧拉玛点 com 啊,然后这个东西就出来了。然后你只要点击整个画面的一个右上角 download, 看到没有?然后你可以选择你是 mac os 系统还是 linux 还是 windows, 我是 mac os, 那 你就直接点击这个 download from mac os, 然后我们就可以看到这个画面上的右上角应该是会有个下载的链接, 然后等它下载好就可以了,因为我这边其实已经安装好了吗?那么我这边的最终的一个输出效果的话,大概是在这里。你们下载完了之后,打开你们的桌面上的欧拉玛,你们看到的应该是现在这样子的一个画面,那就说明你已经安装成功。 佳马仕一共有四个版本,你可以根据你的电脑配置进行模型的选择,模型的能力越强,所需要的配置就越高。对于内存小于三十二 g 的 玩家,我建议大家直接安装一四 b, 三十二 g 及其以上,可以试试看二十六 b 和三十一 b 的 参数量, 其实这两者模型的能力大通小异,如果你是为了极致的精度,可以选择三十一 b, 但是在我看来,二十六 b 呢,其实是一个非常甜点的位置,达到了速度和精度的一个平衡。如果你不知道你的电脑内存是多少,这里针对 mac 用户,你可以选择终端输入这行命令。 而 windows 用户你可以点击 win 加 r, 点击回车,召唤出来你的终端以后,然后再输入这个命令,也可以显示出你的内存。选择好对应的模型,我们只需要打开终端,和刚刚一样的步骤,根据模型输入指令直接回车即可。等待模型下载好,打开你的 oala, 选择模型就可以开始了。 ok, 我 们打开我们欧曼的软件,你点击这里,然后往下滑,你就可以看到你刚刚已经安装好的这个佳马仕。我们来问他一个很有逻,就是说很有那个逻辑陷阱的一个问题,就是我今天要去洗车,但是只有一百米,你觉得我是走路去还是开车去? ok, 我 们来看一下他的一个答复是怎么样子。 这是一个非常有意思的一个逻辑陷阱题,我们可以从不同的维度去分析。逻辑层面上来说,必须开车去, ok, 这一点已经很棒了啊。 那如果说是从脑筋急转弯角度上来说,他说如果你走路去,那么你是在散步,而不是在洗车。哦,也就是说他分为了三个维度,一个是脑筋急转弯,一个是实用主义层面,还有个就是逻辑层面。我们来看一下他这个佳马仕的这个逻辑能力。哎,你还真别说这小参数,但他的表现还是不错的。 那么 jamas 它的一个很大的优点就在于它其实是支持这个多模态的。我们来不妨给他上传张图片,我们来看一下。 ok, 那 么我们上传一张什么图片呢?哎,上传张这个图片,你们看怎么样啊?就是这是一朵花,然后有个太阳,有一本书,我们来让他看看。我说,啊,描述一下, 描述一下这个图片,我们来看看他的多模态识别能力怎么样?说实话,本地具有多模态识别能力的模型,而且是能够你自己去模改的,其实并不是很多。我们来看一下。 ok, 一, jeff 二,然后 jeff 三,给了几个他看到的一些画面。好,我看他现在在思考和输出。这张画面充满了诗意,唯美且带一丝忧伤。 画面主体是一本翻开的书籍。哎,确实是对的,背景与中景是一个画面,然后呢,躺着一只洁白的玫瑰,然后背景是有一个夕阳,散发出这个温暖的金橙色光芒,哎呦,很不错,你们发现没有,是不是很棒?就是说他好像 表达的还是很到位的,但是因为呃,我其实本来还是想测一下这个关于音频识别和这个视频识别的,因为这个佳马仕它也是支持视频识别的, 但是因为欧拉玛官方不太支持,所以大家可以自己去谷歌 as do do 上面去玩一玩。所以总的来说,其实通过这么两个比较简单的测试,它当然不够严谨,而我觉得感受来说的话,这个香奈儿丝还是 真的是能够在本地帮我们处理一些比较复杂的一些任务的,就是在文字层面以及去多模态识别能力上来说,是一个比较抗打的模型。 看到这里相信你一定会明白, olama 本身是一个模型管理器,你当然也可以不用贾马四,你可以选择开源的 deep stick, 千问等等,其他的开源模型还是同样的命令,一键配置就可以了。 本地捕鼠的最大优点就是保护你的隐私,模型的使用不会受到任何的限制,同时也可以支持模型的微调,让它更合你的口味。下期我打算教大家小白如何从零到一,微调自己的本地模型,感兴趣的可以点个关注,我们下期再见。

一分钟让你搞清楚关于全球最强开源模型 jam 的 一切。最近谷歌开源了 jam 四,我将用四个问题 让你清晰了解关于 jam 的 一切。 jam 各版本的区别,我家的电脑能用吗?模型怎么部署安装?普通人用来干什么?先说他的四个版本,三一 b 直接冲上全球开源 ai 榜第三名,以前要机房才能跑的能力,现在你家里的高端游戏显卡就能搞定。 轻量版的一二 b 和一四 b 为手机、平板以及中低端电脑设备打造,性能虽不是最顶级,但是绝对好用够用。而二六 b 猫号称总参数两百六十亿,但实际每次思考只用其中三十八亿个,最相关的效果却能媲美两百六十亿, 能理解超长文章以及视频。简单说,无论你是用手机、笔记本还是高性能电脑, jam 四都能给你免费安全强大的顶级模型体验。再说你家里的设备是否能用上?一张图告诉你 jam 四个版本的最低要求。 对于多数人而言,家用的电脑设部署一二 b 一 四 b 完全够用,基本能满足百分之九十的使用场景。另外两个版本对内存要求较高,但是性能出众,属于好马配好鞍。 再说模型安装,整个过程大概十分钟左右。首先下载 lm studio, 然后打开 opencool 或者 id 工具,让它查找你本地配置,给你推荐安装哪个版本。之后在 lm studio 里下载,运行搜索推荐的模型名点下载,最后接入 opencool 或者 i d e l m studio, 提供 open ai 兼容 api, 在 open 框里把 api 地址改成, h t t p l o c a o s t colon twelve three four slash vivo 就 能用 jama 四驱动你的 ai agent 了。 网上攻略一大堆,这里就不展开了。最后说下所有人最关心的能用 jama 做什么?这里推荐三个场景,可以去试试。第一, 构建本地知识库,把工作和学习相关的文件丢给本地 jama, 让他帮你形成系统化的知识。构建个人知识库时进行向量缩影和 anitive, 解锁数据不出本地,安全合规。第二,给家人搭建一个 ai 助手,下载好模型,配个界面,电脑手机都可以直接对话,不花钱不泄露隐私。第三,内容创作 最大优点是无限额度,即便不如部分付费模型,但可以靠大量尝试提升优质内容的概率。千马寺会改写国内企业及政府客户的私部模型格局吗?欢迎在评论区发表你的观点。

谷歌刚公布了基于二零二六年初实测的 demo 四本地部署指南。想在自己电脑上跑大模型,门槛其实比你想象的低得多。 只要你有一张六 g 显存的普通显卡,或者一台十六 g 内存的 mac, 就 能轻松上车。这个底线配置足够你流畅运行,量化后的一四 b 版本,它满打满算也就占四到六个 g 的 显存。那如果你手里的设备配置更高, 具体能跑多大的满血模型?接下来我们直接按硬件档位对号入座。我们先看大部分人用的六到十二 g 显存的中低端显卡,比如三千零六十到四千零七十这个档位,老老实实跑一四 b 版本最稳。很多人显存有个七八 g, 就 想硬去尝试大模型的量化版, 结果往往是一对话就报错卡死。因为你必须从这点显存里扣出一块空间,留给 ai 处理上下文。 如果你手里是十二 g 到十六 g 的 高端卡,比如三千零八十或者四千零八十,这就跨过了二十六 b 模型 a 四 b 量化版的最低门槛。显存容量算是过关了,但别高兴太早, 模型加载进去之后要随时盯着,每秒能吐几个词。简存刚够的情况下,推理速度有可能会让你等的很心焦。至于二十四 g 甚至更大简存的四千零九十或五千零九十,土豪玩家可以直接上三十一 b 的 满血大模型,它的基础占用在二十到二十四 g 左右。 但这里有个大坑,即便你显存再大,如果你一次性喂进去几万次的长温档,或者进行疯狂的多轮长对话,照样会把显存撑爆爆错退出。接着看苹果 mac 用户,十六 g 或者十八 g 统一内存的基础款,统统优先跑一次币。苹果不同带芯片的区别在这里,很明显, m 二和 m 三因为起步是十八 g, 它的实际推理效率会明显压过老款的 m 一。 如果你硬拿十六 g 的 m 一 去跑二十六 b 模型,电脑会被榨干,整个系统都会变卡。 预算充足的 mac 用户优势就完全体现出来了。三十二 g 内存以及能非常流畅的玩转二十六 b 量化版到了六十四 g 以上,这就成了目前最强的便携推理机。二十六 b 和三十一 b 随便跑。要是上了幺二八 g 的 m 三 ultra, 不但能跑顶级大模型,几个人同时发请求都不会排队卡顿。选好硬件后,有一个多数新手必踩的坑。模型页面标称的显存占用只是个起步价。当你开始聊天,历史记录越来越长,内部的 k v k 机制就会像无底洞一样治疗你的剩余显存。 系统本身还要占用一部分,官方给的都是刚加载完的静态数据,真跑起来,必须预留几笔额外的显存帐,最后破除一个对硬件的误解。 mate 的 内存确实动不动就能配到几十上百 g, 功耗也低的吓人。但是苹果的统一内存受限于物理带宽,它就像一个水库很大但出水管不够粗的系统,跑同一个模型,它的生成词汇速度通常还是比不过同容量的 pc 独立显卡的。

今天给大家带来手机本地部署大模型,无需网络支持 ios, 安卓无需特殊网络环境。当然了,今天部署的是谷歌最新发布的模型,小模型的性能大家都懂得,娃娃可以正当生产力,还需要等待发展一段时间,和电脑的本地部署是一个道理。 那么我们先进入 ios 的 教程其实非常非常简单。首先先进 app store 下载如图的应用 google ai edge gallery, 安装好之后,我们直接打开进入 ai 对 话, 会发现我们首次运行的时候会让你下载模型,因为我手上的这台设备是 iphone 十五 plus, 因此我选择下载这个折中的它推荐的二点五 g 的 模型, 等待它下载完成之后,我们可以和它对话看看。这个时候我进入飞行模式,把网络给关掉,它是完全本机运行的,会发现我们已经可以和它对话了,只不过在运行的过程中,它可能有点微微发热。当然了,小模型的智商就是这样,和它进行一些简单的对话是可以的。 那么接下来我们进入安卓的部分,然后我拿来做演示的这台手机是荣耀八零二, 在国产的安卓机上,我们有两种安装方式,第一是通过 apk, 也就是安装包进行下载,第二种方式就是你需要一些手段,对吧?上网的手段,然后进谷歌商店里进行下载,下载好打开之后和 ios 里的使用是一样的,我们首次进入的时候,点击下载模型,同样还是这个二点五 g 的, 然后就可以和他进行对话,我们可以问两个问题来看看效果,嗯,就比如说我离加油站五百米,我是应该开车去还是走路去看看他怎么回答? 最后我们就会发现没有说必须开车去,对吧?去加油站。所以说小模型的这个智商这一块肯定是和 ap 还远远比不了, 但是这也代表着这给我们一种可能性,随着科技的发展,模型的发展以及手机硬件性能的发展,拥有一台纯本地部署的 ai 助手将成为可能。那我们今天教程就到这里,非常简单,我们下期再见。

谷歌最近刚刚推出了一款免费高配的云主机,大家好,这里是天亮分享,据说这台机器不仅配置拉满,而且还能免费白嫖,实时网速相当惊人,下载速度竟然可以突破每秒四千多兆,妥妥的即刻网络。配置方面也非常豪华,十六和 cpu, 六十四 gb 的内存,三百 g 左右的硬盘空间, 用这个主机呢进行这个学习和测试使用还是十分不错的。只不过呢这个主机他有一个缺点,就是说呢,他每隔一到两个小时他会断开一次,不过呢他这个上面的数据是给我们保存着的,你不用担心这个数据丢失的这个问题,我们只要重新登录一下,我们的数据还在上面, 还可以继续进行这个学习和测试使用,这一点呢是我推荐他的一个主要原因。好了,现在呢就让我们来看一下他是怎么注册和申请的。首先打开天亮公众号上这个文章,上面已经放了我们今天所用的全部资料,打开以后在下方这里我们看一下他目前官方的链接是这个,打开它进入以后 出现一个提醒,就是让你接受一些个权限,然后呢我们点击这个接受,我们点击确定,然后呢我们就来到这个页面,我们选择这一个,就是这个小 a 的一个图标,就是 android studio code, 我们点开,然后呢我们需要给我们这个工作空间起一个名字,这一点呢我们随便的定义就可以了,比如叫天亮。然后呢我们点击创建他,这个步数是十分快的,并且呢我们只要有一个谷歌账号就可以了,直接登录这个网址,也不需要这个什么卡,我不知道后期他需不需要什么卡,反正现在是不需要,大家呢尽快注册。他这里面提示你是否这个查看这个剪切版 和这个文字和图片,我们点击允许,然后呢这里面我们点击这个 don't send 它,这里面呢让你创建一个项目,我们把它关闭就可以了。好了,现在呢我们就登录了这个云主机,然后呢我们点击这个左上角有一个白色的这个横杠,我们点一下,然后呢在底下就出来这个菜单了,我们点击这个九宫格,然后呢我们可以看到这里面呢就给我们安装了 这个各种应用,我们可以点开这个谷歌浏览器,我呢他这里面提示你是否设置为默认的,我们就点击 ok 就可以了。现在呢这个谷歌浏览器我们就可以使用了。比如说呢我们可以看一下他这个 ip 地址,我们在上面这个输入一个网址,可以看到他这个 ip 地址呢是由这个谷歌云提供的,然后呢是一个广播 ip, 大家呢分配到的这个 ip 地址不尽相同,又来自这个世界各地的这个 ip 地址,但是这个 ip 地址呢肯定都是由这个谷歌云提供的。好了,我们把这个浏览器给它关闭,接下来呢我们给它更改一下这个语言,我们可以看到这里面这个语言呢都是这个英文呢,我们给它更改为这个中文,我们点击这个 settings, 然后呢我们往下拉,这里面有一个 system, 然后呢这里面有一个 language, 我们点开,然后呢点击这个管理安装语言,他这里面呢会提示我们让我们更新,我们点击更新,他提示我们验证权限,我们点击这个允许,我们稍微等待一下他更新完成。然后呢我们可以看到 他这里面这个语言呢只有一个英文,我们点击底下的这一个安装这个语言,然后呢我们在里面选我们这个中文中文简体。接下来呢我们把这个后边的勾给他勾上,然后呢我们点击应用,然后呢点击这个允许,他现在呢就在给我们应用这个更改,然后呢我们可以看到这个语言呢已经给我们安装了,然后呢我们把这个底下的这个 chinese, 然后拖动一下,拖动到这个上方,好了, 现在呢他已经上去了。接着呢我们点击这里面应用这个更改,还是点击这个允许允许,然后呢我们就点击底下的这个关闭。 接下来呢我们需要退出一下这个当前的这个用户,我们点击上方的有一个电源的这个按钮,然后呢点击底下这个电源按钮,接下来呢我们点 击这个 log out, log out, 现在呢我们就已经登出了这个用户,接着呢我们再点击这个链接,然后呢我们点击这里的关闭,现在提示你呢就是说这些文件夹的语言是否更改,我们点击这个更新名称,好了,接下来呢我们再看一下,我们再点击这个左上 角的这个白色的这个横杠,然后呢再点击这个九宫格菜单,可以看到这里面呢已经给我们更改过来了,接下来呢我们给他安装一个输入法,我们还是点击这个设置,然后呢我们点击左侧边角有个键盘,接下来呢我们点击这个添加员这里面,然后呢我们在这里面点一下,然后选择这个其他,然后呢我们就选择这个 中国的这个智能拼音,然后点击添加,可以看到这个输入法呢我们已经这个添加上去了,接下来呢我们可以点击后边的这个三个点,然后呢点击上移,我们把这个语言呢排在第一位好了,接下来呢我们就点击关闭,然后呢我们回到这个菜单这里面,我们可以去这个终端里面验证一下, 我们点击终端,然后呢我们可以 ios 看一下他这个文件夹下有哪些文件,我们可以看到这里面呢有一个桌面的这个文件,我们就 cd 到这个桌面,现在呢还是不能这个出这个中文的,我们点击上方呢有一个语言的选择,我们选择智能拼音,然后呢这里面我们输入桌面可以看到,现在呢已 已经可以输入中文了,证明中文输入法已经安装成功了。我们 cd 到桌面,然后呢我们可以这个 l s 下,现在这个桌面文件夹下面还没有文件, 我们在这里面呢给他创建一个文件,然后呢我们再登录一下用户,看看他这个数据有没有给我们保存好,我们现在呢给他创建一个文件,然后呢我们就在这里面输入中文就可以了,我们我们可以点击这个左键盘左侧的这个 shift 切换这个中英文,现在呢我们就在一个中文的状态下,比如说呢我现在输入好,接下来呢我们给他保存, 我们可以看到在这个桌面这个文件夹下面已经有一个 test 点 txt 这个文件了,按解下来呢,我们就断开一下这个连接,看一下他这个数据有没有给我们保存好了,我们点击退出,好了,现在呢我们再点击连接,然后呢关闭这里面,打开这个中端,我们可以这个 cd 到 桌面这个桌面这里面,然后呢 l s 一下可以看到它这里面这个数据呢还是给我们保存着的,我们可以看一下,可以看到这里面这个内容呢 都还在证明了它这个主机,它是给我们这个保留数据的,大家呢不用担心这个数据丢失的这个风险。好了,现在呢我们查看一下它这个硬盘空间,看看它有多大,我们可以使用这个 d f 杠 h l 这个命令,然后查看一下,我们可以看到它这里面的这个骨骼的这个加目录, 给我们提供了这个一百九十六 g 的这个空间,然后上面呢还有这一个四十六 g 的空间,然后呢底下还有这个五点九 g 的一个空间,这里面这个配置文件这里面还有一个四十六 g 的空间,然后我大概加了一下,大概呢有这个三百 gb 的这个空间左右,反正呢他提供这个空间还是很大的,我们可以在上面存储一些个东西。 虽然呢这个云主机每隔一到两小时他会关闭一次,但是呢我们可以测试一些个临时的项目,我们主要利用这个云主机给我们提供这个高配置,他是十六核的,然后是六十四 g 内存,在我们自己这个电脑上不能跑的一些个项目呢,我们完全可以拿到他这个主机上来运行进行测试使用,可以说呢, 这是对于这个开发者一个很好的一个福利,如果需要安装软件话,那么可以在控制面板进行安装,它就相当于是你那台远程的云主机,云电脑,你在里面做的任何设置或者保存文件,从今以后里面东西都还在的。好了, 安装命令 copy 出来,我们点击复制一下,然后在里面执行一下,鼠标右键粘贴看行不行,看一下他能否安装 onepinel 的面半,然后输入二选中文的,然后默认就可以了,段口号任安全入口默认就行了,看行不行啊,哎,安装成功了,这个是他的外部地址, 外部地址是不能正常访问啊,那说明他是应该是有这个,那说明他外部一层还是有防火墙啊,应该是我们通过他内网地址打开看一下啊, 大家看一下内网地址可以正常访问的啊,然后输入他的用户名,还有他的密码,密码大家看一下,登录一下,大家看一下,在他内部可以正常访问的,而且他是安装成功的,大家看一下,如果他目前没有提供一个外网的 ip 地址啊,在内部的话 可以正常访问,但有一个好处就是你可以直接通过这个 vnc 进行链接登录,以后就可以不用翻墙使用谷歌浏览器。 今天呢就给大家介绍这么多,如果大家感兴趣的话呢,可以赶紧去注册一个他作为这个学习和测试使用是十分不错的,更多好玩的,大家可以自己去尝试。好,今天视频所用的全部资料,他们的链接我都放在我的公众号和飞书知识库上。

使用欧拉玛可以一键部署本地大模型,我选择的模型是千万三点五九 b, 现在来演示一下, 可以看到 gpu 使用率向升,由于我这台电脑的显卡配置比较低,所以输出的比较慢。 好,终于输出完成了,接下来是 gg 教程。 首先肯定是要下载欧拉玛的这个软件,进入欧拉玛的官网之后,选择 windows 点击下载,当然这个下载起来会非常的慢, 我也给大家把安装的程序上传到了网盘下,下载后双击打开直接安装,安装完成之后就是这样一个界面,可以在这里点击你想要的大模型,比如说这些是云端大模型, 从这里开始就是本地大模型,这个是谷歌开源的本地大模型街吗? deepseek 千问三,还有其他的一些模型啊, 对于模型怎么挑选,得看电脑的配置,比如说我这台电脑 cpu c a m d 二五六零零两根 d d e 二四的一六 g 内存条, 显卡是一六六零 s 六 g 的 显存,这个已经是非常老的显卡了,后续我准备根据我的电源升级成四零六零 t 一 六 g 显存的,所以根据我的电脑配置 选择了比较小一点的模型。那你的电脑适合哪一个大模型?可以把配置发给豆包问问,让豆包帮你分析适合下载部署什么样的大模型。今天的教程就到这,关注我,评论私信。

现在我的 codex 正在帮我本地部署前问二点五十四 b 的 大模型,然后还需要大概十来分钟的时间,正好 趁着它在执行任务,我给大家分享一下从我有本地部署大模型的这个想法到落地是怎样的经历,大概用了多长时间? 呃,首先原因是前两天不是谷歌的芝麻四开源了,嗯,然后我就又重新关注了本地部署这件事,我就用 ai 学习相关的这个内容, 就是让他首先把我电脑的配置发给拆 gpt, 这是网页版的。然后,呃,让他一步步的给我讲清楚这个本地部署,他的这个架构 运行原理,还有和我电脑的适配程度和本地的大语言模型的生态,把这些所有概念性的东西通过网页的 chat 模式都给它聊清楚。 内容还是很长的,我进行了多轮对话。呃,然后呢,你看,我就用这个,这是 obsidian 的 一个插件,可以一键把所有对话内容保存到我的 obsidian 里面去。 接着呢,我就在这个 vs code 里面把我这个呃 obsidian 的 本地文件打开了,这是下载的版本, 因为下载版本呃,我们都用过这个网页对话,他实际上是很多重复的。然后废话,那全下来大概有这两千六百五十五行。我第一件事就是先让 口袋的插件帮我优化了一下这个对话,这是这是优化版,优化版的话呢,它结构性更强,然后一共才五百多行,这样就方便我把这些知识给沉淀下来,我可以再多了解了解它的原理。 搞明白之后,根据我的实际使用场景,到底哪个模型更合适?最后我得出来的结论就是这个前文二点五十四 b 并不是最新的。呃,正码四,也不是这个前文比较高的模型。 得出这个结论之后,我就直接让他帮我部署,那我给他的指令也很简单,之后让他开始执行, 下面就是他的完全自动的,现在看看装到哪了。呃,大概还有六七分钟的时间。 ok, 现在已经部署好了,总共用时十五分钟,四十三秒。他同时还帮我优化了本地文档, 你看它进行了哪些动作。就是这些都安装好了,并且进行了测试。那我现在怎么用它呢?就可以直接输入这段代码就可以用。那我们试一下,把这代码复制,然后打开我的终端,终端命令行粘贴进去, send a message, hello, 嘿嘿,那就可以用了,同时我也准备好了,如果不好用的话,我怎么卸载啊?后面如果想清理,就这三步就能卸载干净。 那从调研到部署成功,我大概是从早晨睡醒觉,七点钟开始跟 gpt 聊,然后现在是 九点四十二分,就不到三个小时,我就大概对本地部署大模型这件事有了一个框架性的了解,并且让 codex 帮我完成了部署。我现在已经用上了,哈哈,还不错, 这就是整个的过程,从你想做一件事,但是完全不知道概念,就先在网页的 chat 模式跟他聊 聊的,你大概了解之后得出一个最优的方案,适合你自己的方案,然后就用这种像可拉的 code 或者 codex, 因为他们不只是可以聊天,他们可以调用工具来执行,就让他们帮干活。呃,这样的话其实也是一种省 talk 的 方式, 你当然也可以在 codex 或者是 cloud code 里面直接跟他聊需求,但是就会花你更多的 token 嘛。所以好用的工具有很多,大家怎么合理使用它是我们需要考虑的。

谷歌发布了 gemma 四,简单体验了一下,好像不是很适合我,这期分享一下如何接入 opencode 以及初体验。首先我们直接在奥拉玛官网看一下模型,这里主要是看一下你的电脑适合哪个参数版本,如果没有安装奥拉玛的,就先安装一下。 在客户端这里还没有看到 gemma 四模型,所以就在命令行这里输出奥拉玛 run gemma 四,这里可以根据你的电脑配置来选择我的电脑配置二十六 b 是 最适合的,安装需要下载一段时间,所以你挂着可以先做别的事。我已经下载过,所以它就直接在命令行里运行了。 打开奥拉玛,在聊天这里切换模型,就可以直接试一下绘画,问一下它现在是什么模型, 模型下载了之后就可以在 open code 上接入这个模型,我这里用的是 open code 的 客户端,打开 open code, 在 下面这里添加点字定义。在这里主要是有两个点需要注意,一个是 r o, 另外一个就是模型名称要和欧拉玛上的保持一致,不然会连接不上。先填 r o, 注意一定要加上斜杠 v e 后缀,否则客户端可能无法识别路径。填完之后提交, 完成之后就可以在下面选择了。最后说一下这个 jamma 四模型使用体验,就是感觉确实是很聪明的样子,但是好像不大能在本地干活。在 open call 的 这里,我让他整理桌面,还有安装 open call 都不会直接执行, 当我切换千万的模型就可以直接操作,我不知道是什么原因呢?后面在实际用途上再多体验操作一下再说说。这期就分享到这了,拜拜。

还在为昂贵的 a p i 账单焦虑,忍受极高的网络延迟?今天这期视频手把手教会你在 vs code 里装上 gem 四,不花一分钱零延迟,实现真正的无限 token 自由。前几天谷歌开源了多模态的 gem 四家族,那么大家可以来看一下,这是最新的跑分图表 加八四,它全系直接杀入了图标左上角的最具吸引力象限。特别是二十六 b 这个混合专家模型,用极少的激活参数量打出个月级碾压的智商分数和 i 成绩。这意味着你不需要搬一台服务器回家,用家用电脑就能享受顶级的 ai 算力。 那么我根据官方发布的数据,给大家整理了一份最全的防踩坑硬件指南,大家可以对号入座并截屏。 那么只要你的硬件设备有五 g 到八 g 的 内存,就能轻松玩转轻量款的 e 二 b 和 e 四 b。 那 么如果你有十八 g 以上的内存,就可以像我一样直接上今天主角二十六 b, 体验顶级的 mo e 专家架构。 要是你的电脑有着二十八 g 甚至更大的超大内存,那最顶配的三十一 b 性能怪兽也是没问题的。那么搞懂了配置,选好个模型,我们直接开干。首先我们来到 jama 四的官网, 然后选择阅读文档,点击阅读文档后,我们会来到这个页面,来到该页面中,我们可以从左侧侧边栏转 jama 的 部分, 通过下拉的方式找到欧拉玛,我们选择欧拉玛来到对应的页面。那么第一步我们需要来到欧拉玛的官网去进行欧拉玛的下载,下载好后,我们找到电脑终端,在终端中输入该内容, 我们按下回车键,在这里会显示欧拉玛的版本后,这也提示我们欧拉玛已经下载并安装正确。接下来我们按照提示继续输入 欧拉玛铺 jama 四,那么默认他会给我们安装 jama 四 e 四 b 参数的模型。那么如果你希望他给你安装其他比如说二十六 b 或者三十一 b 的 模型,那么你可以在 jama 四的后续添加对应的版本号。 在你的终端中输入欧拉玛铺 jama 四的指令,按下回车后,他便会帮我们安装好 jama 四 e 四 b 的 模型。 像二十六 b 和三十一 b 这种超过十几个 g 的, 大家伙下也需要一段时间。大家记得把系统中的自动休眠关掉,那么盯着进度条走完,看到终端里弹出对话,光你的本地引擎就准备就绪了。 打开奥拉玛,当我们打开奥拉玛,在模型切换选项中,我们向下滑,就可以找到我们最新的伽马四系列模型。比如说在这里我就可以选择伽马四二十六 b 参数模型。 那么接下来是今天的核心,把本地算力接入 b s code。 通常大家会装一些第三方的开源插件,那么在这里我推荐大家去使用 github coopilot chat 啊,它是可以直接绑定到我们欧拉玛中的。 我们可以在侧边栏插件中找到 github coopilot chat, 选择并进行安装。安装后,我们会在右侧看到我们的聊天部分,我们可以进行登录, 然后我们打开 escode, 我 们可以在模型这边自动选择模型,这里找到其他模型,其他模型我们可以选择管理模型,在管理模型页面,我们可以选择添加模型来自欧拉玛。 接下来我们按下回车键,我们会找到目前我们已有的多个模型 选择。将左侧的小眼睛开启,接下来关掉,我们就可以看到我们通过欧拉玛部署的伽马四系列模型并进行使用。当你成功把本计算例连上 vs code 后, 还要解除模型上下文的封印。很多小伙伴刚装好让 ai 读一个稍微大点的前端项目,写着写着突然开始胡言乱语,或者直接报错罢工。这不是你的电脑性能不行,而是欧拉玛默认给所有模型的上下文长度丝丝卡在了二零四八个头。肯,那么我们花五秒钟给他做一个脱绒手术, 打开终端,复制这段指令下回车键。这段代码的意思是我们以 jm 四二十六 b 为底座, 强行把他的记忆容量拓展到三二七六八个 token, 也就是让他一口气能记住将近两三万行代码。 那么大功告成。现在你的 ai 已经拥有了过目不忘的超长记忆,哪怕是复杂的项目丢给他也可以化身为你的大局架构师。那么我在 vs code 里给他提需求,让他去给我制作一个马里奥的游戏,我们来看一下他在这里所达到的效果, 我们可以看到达到效果还是不错的。那么接下来第二个测试,我们来看一下它的多模态视觉推理能力。那么既然 jam 四支持多模态, 我们上一个略微有一点难度的,我这里有一张在野外拍摄的复杂的动物脚印,我们让它识别一下是什么动物,请你帮我看一下这是什么动物的脚印,这是我在四川甘孜发现的, 那么这展示了 r 六 b 惊人的逻辑推理能力,它不仅认出了我们动物,这是雪豹的脚印,还通过脚印的物理特征完成了深度的逻辑推理,那么这才是真正的多模态的能力。那么如果我们换成一次 b, 让它去处理相同的工作,我们来看一下达到的效果。 我们依然上传对应的图片输入,请你帮我分析一下这是什么动物的脚印, 这是我在四川甘孜发现的。我们可以看到 e 四 b 给我们回答的结果就没有那么准确了。那么总体而言,从 e 二 b 到三十一 b, 从下载 到我们利用 copilot chat 的 本地绑定,这就是我这几天折腾 jama 四总结的全部干货。有了这套工作流,你以后就可以在处理相对简单或基础的任务工作时,再也不用担心 api 额度耗尽了。 如果这期视频帮到了你,请一定要给我点个大大的赞!如果有不懂的配置问题,随时在评论区问我,我是 tim, 我 们下期再见!


哈喽大家,我今天专门把我的电脑拿回来,我想跟大家分享一下我最近呃用谷歌吉姆耐的一些感受。 咱们国内的豆包和元宝一直都在用,但是元宝他最近高冷了,你有没有发现?就除非呢?你问的那种特别就是学术化的问题,或者是特别有意义的问题,他才会回答你。你要是说我现在好烦,他不再像以前一样 就是跟你说啊,你为什么很烦,然后说这么一大段,他现在只回一句话,那你为什么烦?你可以告诉我, 刚好因为工作的原因啊,我现在在接触 gmail, 什么都挺好的,但他唯一的门槛是在需要答题字,但是他真的是很好用,就是元宝他比如说可以有不同的话题主题,但是你没有没有办法就给他 未知时,但是在这个界面里面呢,就是可以的,我给大家看看你看镜的这个下面就是一些你的一些话题,你是可以修改的点,修改之后呢,你可以就是给他你的指令,我让他当我的创意总监,他的名字叫 snake baby, 你还可以给他传知识文件,就是有一些需要他学习的东西,你都可以给他上传上去,这样子在以后你跟他的这个聊天对话里面,你可以直接就跟他聊,他就直接可以给你产出 特别方便。那么我接下来给大家去分享如何去用 gmail 完成你的一个工作流。假如说你是一个自媒体的博主,然后你现在需要他帮你完成你工作中所有的这样子的一个内容,那怎么做? 第一步还是需要我们自己来,你要清楚你的工作留的步骤,第一、第二、第三、第四、第五、第六,一共有多少步,然后都是什么?你要清楚,假如说是有六步,从一开始的选择题到写脚本 啊,然后到哪里哪里,这个你要清楚,完了之后你去做像刚刚我那个 snake baby 那 样子的助理,同时给他做上个两三个,三四个这样子,然后把你的工作流程分别的发送给不同的助理,一号、二号、三号助理,他们每一个助理都要知道你的全部的工作流程,但是 他们不是所有人都干一样的事情,一号是负责这个流程,第一第二步,二号助手是完成,第三第四步, 三号助手是完成,第五第六步是这样子布局,然后你就告诉一号一号,你的职责是选择题,然后加上脚本的制作,给他尽量详细的描述他的职责是什么。我可以给他喂一些文档 啊,这个文档里面是你的一些产品的背书呀,各种东西,具体越具体越好。告诉二号二号,你的职责就是这六部里面的第三第四部,不要越界啊,只做好你工作该做的事情。然后 你把刚刚一号生产的这个脚本喂给二号助理,二号助理的职责就是去用 一个优质视频的评判标准去为这个脚本去打分,他好还是不好,然后如果是好的话,达标的话,你可以给他设置一个分值,你才继续下一步去拍摄剪辑,如果不行的话,他会告诉你问题在哪,然后你再修改 修改,一直到这个分数是合格以上的标准,然后你再进行下一步剪辑,以此类推,然后让你的小助理可以帮助你高效的完成你的工作。是 因为金木奈能这样操作,所以我才能给大家这样讲。然后我今天又反过来看了看元宝,他同样有这样的可以固定的这种对话框,但是他没有,就说是每个单独的对话框可以去给他一些指令级的这样的功能。 所以说我认为吉木纳还是挺好用的,但是如果你不太方方便爬墙的话,可能就我们今天已经把整个壁环做完了,我这个星期不是还没有开始正式的工作吗?就大家 一直就是几个人在一起,一起去调教这个 ai 的 助理,才把整个逻辑壁环给完成了,因为很多的细节 你要不断的去试错,你比如说你给他一说一个指令之后,你去试发现,哎,还有哪个指令需要补充,你需要再补充到那个指令机里面去,就一直在更新迭代,更新迭代这样子,然后才能把它调教成一个你真正需要的一个助手。 所以说,呃,如果有这方面需求的,不知道如何用 ai 的, 明明听大家讲都很厉害,但是到我这怎么他就, 嗯,只能说是当朋友聊聊天这样子在工作中运用的话,其实还是很高效的。那么我相信像咱们的豆包也好,或者是元宝也好,以后应该都会出这样子的 功能,嗯,这都不是问题,因为我们在这方面发展的也挺好的。我那天也下载了马斯克的 rock, 我 觉得就那样吧,我甚至觉得像作图的这个功能像豆包啊啥更胜一筹,包括我们是那种 ai 的 视频,然后它有一些就是 国外的这些 app, 反正做的都挺一般的,我看有一个测评的博主,呃,说做一个视频让那个柯基从十米跳台跳下来, 他做的所有的都是只有这么高,根本就没有十米,他哪怕把指令再优化,再优化都跳不了十米,每一个做出来的视频都是可低可低,但是我一放到这两天我老玩的那个 cds 二点零就是即梦,上面 我给大家看一下我做的立马就出来了一个小柯基,还会说话的小柯基,然后跳十米跳台还是以这个柯基的视角去做的, 而且十米跳台真的是很高很高的那种,所以我觉得咱们,呃国内在很多这些地方都是有领先他们很多,但是呢,就是谷歌在这个整个生态这方面完成度还是比较高的。嗯,这就是今天给大家分享啦,妈妈我好像上错台了 啊,呜 哼,本王这叫曲线入水。

刚发布三天的谷歌街挖四家欧莱玛最新王炸组合,彻底解决大模型部署难的问题!普通人不用敲代码就能一键搞定,电脑手机都能装,既能写文案改代码算难题,还能分析长文档,拆解短视频脚本全能又好用,关键是本地离线用,还能无限免费商用!打瓜教程安装包都给你们打包好了!首先在视频右下角的分享图标里点 点击复制分享链接,然后打开这个可以在正规应用商城下载的蓝色工具,打开后允许粘贴,就会弹出这个口令弹窗,如果没有就点击这里,然后输入不吃饺子。打开后找到软件资源里的这个文件,右下角保存后下载就可以啦!关注我,每天分享宝藏资源!

今天跟大家讲一下,我们这个用电脑啊,做这个外贸设媒,做单个账号,应该怎么去设置我们的这个浏览器啊?因为我们一般都是用这个谷歌浏览器嘛, 啊,因为之前很多朋友看过我发的视频,是讲这个手机怎么操作的啊?那我今天给大家录一下,这个电脑怎么去弄啊?因为有的朋友是既用手机用电脑,那么电脑需不需要设置这个?呃,使用环境呢?当然也是需要的啊,那我们今天就拿这个谷歌浏览器啊,给大家演示一下。 呃,那么首先的话呢,我这里也整理出来了啊,就是我们几个步骤。呃,首先第一个啊,就是我们的隐私安全设置啊,因为我这里面加的图片可能看不清楚,我直接切到这个谷歌浏览器。 ok, 我 们打开谷歌浏览器之后啊,我们点右上角,他这有有几个点,然后有个设置 啊,就最下面有一个设置,咱们点设置好,然后设置,打开之后。好,我放大一点。好,这左边的话呢,它会有一个隐私与安全啊,咱们点隐私与安全好, 大家可以看到啊,这里有一个删除浏览数据,对吧?还有一个隐私保护指南,还有第三方。呃, cookie 啊,那我们需要改哪些呢?首先啊, 我们的这个第三方 cookie, 这个我们要阻止啊。呃,这个 cookie 是 什么? cookie 是 什么意思呢?就是你在这个网页上面的所有的一些操作啊,你的兴趣偏好啊,它会有记录的,所以说我们要阻止它或阻止我们这个第三方啊,获取我们的这个 cookie 数据。好,所以我们给它关掉。 好,关掉之后我们返回。好,这里有一个安全啊, 好,安全的话呢,这个地方最上面啊,大家看它有一个增强型保护啊,这个就是 啊,我这里前面讲到的安全增强,安全保护好,我们看它有什么作用,根据谷歌发送的浏览数据提供实时的这个 ai 赋能的保护啊,防范危险网站下载内容啊,这个我们可以给它打开啊,打开再下一个, 关闭我们的敏感权限啊,在网站设置这里最下面,网站设置好,他这个地方有一个位置信息,网站可以请求获取你的位置信息,对吧?好,不允许啊,再给他关掉摄像头也给他关掉,不允许网站使用您的摄像头, 麦克风无所谓啊。好,这个就是我们这个防防追踪的一个隐私设置。好,这第一步啊,好,再往下语言和时区啊,这个我们就最后来改吧,因为有的朋友可能英文不太好,你现在把语言改了,你后面就不会弄了。那语言的话呢?是在左边啊,我给它放大一下。 好,这里有个语言,这个地方我们现在先不改啊,这个我们可以留到最后一步。 好,其次的话呢,就是我们的系统的时区啊。好,呃,修改这个系统的时区啊,就是你电脑里面的这个时区 啊,这个也要改成跟你这个网络相对应的这个时区啊,当然这个是最稳妥的啊,就是这样的话呢,呃,就不太会因为这个,呃,你的这个环境问题导致你的账号出问题啊,那当然有的朋友可能没设置也没出问题,对吧?那我们要想保险一点,那我们就可以这样去做好更改时区啊,这个我就不多讲了啊。好,下一个 就是。呃,有几个这个拓展程序啊?就是有的朋友可能可以用到。那首先第一个就是我们的这个官方翻译工具啊,我就不念出来了啊,我就不念出来了,大家平台以为我在做营销 啊?主要是翻译的。那第二个的话呢?就是拦截广告,还有这个主要的功能呢?是,呃,屏蔽这个追踪器啊,可以保护你的这个一些浏览记录或者说隐私。 那第三个的话呢?就是自动帮你去清理你这个 cookie 啊,防止这个网站长期来。呃就是获取你的这个浏览记录啊,因为有的朋友你要是能做到,比如说你这个,你今天下班了对吧?你这个你可以把你的这个浏览器, 呃,把它的这个浏览记录全给它删了,你要每天能做到,那你用不用无所谓,你要做不到呢?那你可以借助这种工具来实现。好吧,这个我就不多讲了啊,大家可以自己去。呃,你自己去找豆包问也可以啊。好吧, 好。然后最后一个步骤就是我们清除我们的这个,呃,所有的这个浏览浏览数据啊, ok, 给它再切回谷歌浏览器。呃清除浏览数据的话呢,咱们点右上角这三个点啊,然后它这里会有一个清除浏览数据,好,放大给他看一下。哪个啊?对,就这个清除浏览数据,咱们点一下。好,回来。 好,它这里会让你选择清除哪些啊?这个全都全都清啊,浏览记录啊, cookie 以及其他网站数据,还有缓存的图片文件下载内容,这都都给它清了。呃,一般的话呢,我们要选择这个时间不限啊,就清所有的。好,然后咱们点击删除。 ok, 好,那这样的话呢,咱们就呃一个基础的这个环境设置啊,大概就是这样,那包括说我们的一些使用行为啊,咱们要怎么去清除?好吧?然后最后一步啊,你再把你的语言改掉啊,语言给他改成你相对应的这个国家啊。好,这个咱们点添加,然后搜索就可以了。 ok, 好, 我们回到我们的这个总结,最重要的一个安全原则啊。好,大家摆一下摄像头, 就是一个谷歌浏览器,你只登一个社媒账号,就是,如果说你是要做矩阵的啊,因为有的朋友他一个账号已经做成熟了啊,他准备开始,比如说做五个胜出,做十个,对吧?那这种时候的话呢,你就不能把全部的这个账号登在同一个浏览器上面了,这个时候你可能就会需要用到这个指纹浏览器啊。这个我们后期再讲视频,呃,再出视频再跟大家讲。 好,总结一下啊。第一个先把我们的这个隐私安全里面的这个增强型的这个防护给他打开啊,然后把我刚刚演示的一些这个他获取的你的一些信息啊,你给他阻止他获取啊,就是还有这种我们时期语言,还有就是我们的一些必备的一些托管程序, 那还有就是每次你使用之后清除浏览数据,保持你的这个环境啊,是干净的。那最重要的一个点核心原则就是如果说你要做设没,你想这个账号,对吧?不出问题, 那你就一定不能说一个浏览器,你去登多个这个社媒账号啊?比如说你做这个 facebook, 对 吧?你在一个谷歌浏览器里面,你开两个网页。好,你登了两个不同的这个 facebook, 这个会被平台识别出来的。啊?如果你要多账号,那你就要换浏览器了。好, ok, 这个视频就到这里了。

谷歌刚放出来的 jam 四用的 apache 二点零协议,不管是商用还是魔改都随便用,三步就能装自己电脑里,以后跑模型一分钱不用花 它。四个版本对应不同配置,四 g 内存就能跑二点三 b 版本支持图文音输入,手机都带得动。六 g 内存选四点,五 b 版本日常聊天够用,十八 g 内存上二十六 b 混合专家版性价比最高, 二十 g 以上直接充三十一 b 满血版,推理编程能力拉满。第一步,装 alama 苹果电脑,去官网或者 homebrew 装 windows powershell, 输一行命令就行,工具全包了。第二步,终端输 alama run, 加你选的版本自动下载启动。第三步,直接聊天,出回复就成,现在就去试免费的 ai, 不 用白不用。


如何把谷歌的 gemini 免费的安装到你的电脑手机上,并且呢,不用联网也可以使用,也不用担心数据泄露,也不用支付会员费用,答案就是安装它们的开源模型 gemma。 那 gemma 又是什么呢?和 gemini 虽然是两个名字,但是它们本质上都是同一个东西。 gemma 是 gemini 的 开源模型,也是 gemini 经过简化之后的模型。这里面要讲一个大模型为什么叫 gemini, gemini 经过简化之后的意思。 二零二三年,谷歌为了应对拆 g p t 带来的生存威胁,谷歌合并了内部两大顶级 ai 实验室, 谷歌 brain 和 deep brain, 那 这个就是谷歌 ai 版图上的双子星。其实在拉丁语里面, gemma 就是 gemini 这颗大宝石切下来的一块儿小明珠。打个最简单的比方,网页上那个无比强大的 gemini, 就 像城市里面的中央供水系统, 水流极其的庞大,但是你必须连上水管,也就是连上互联网,并且用多了,人家是要按流量收你费用的。而 gmail 就是 谷歌免费送给你的一台满级配置的高端净水器, 虽然出水量不如水厂大,但是它完全免费,完全是属于你自己的。在最新发布的 jam 四家族里面,同样支持多模态,也就是它既可以看图,也可以听懂声音,还可以写代码。 点到这里,你肯定会问,谷歌是来做慈善的吗?为什么要把一个模型免费放出来呢?那这样子谁还会去充 jamie 的 会员费呢?这个其实是谷歌一个极其高危的羊毛,想象一下,谷歌现在建了一栋无比豪华的写字楼, 如果他把内部的办公空间完全免费开放,让所有的创业者出创公司全部搬进来,表面上看他亏了租金,但实际上呢?当整个商业生态都用他的标准写代码,他就掌握了 规则制定权。等这些小公司项目做大了,需要更强的算力了,自然就会购买谷歌云服务,或者租用顶楼收费的 vip 会所。 另一方面,谷歌面对试图垄断闭源生态的 openai 和开源大户 meta, 如果不把 jama 拿出来免费送,那整个 ai 时代开发者生态就会被别人拿走。所以免费送模型本质上就是为了抢夺未来十年的技术话语权。 那这个免费开源神器到底适合谁呢?首先,对于做科研、商业分析、金融投资的朋友就特别合适,因为自己手里面有大量未公开的研报和财务数据,根本不敢上传到网上的 ai 里。而像 jam 这样部署在本地电脑的开源模型就是他们最好的选择。 而最新发布 jam 四有四个版本,就像小杯、中杯、大杯、特大杯,那到底选哪个好呢?这条视频就直接告诉你答案,手机就直接选小杯,普通电脑选中杯,高端电脑选大杯, 企业级的就选超大杯。如果你不知道你的电脑是什么型号的,那就选中杯。那如何安装这个开源大模型呢?建议去欧拉玛的官网上下载,注意一定要下载带 it 版本的, 它代表了是能够听懂人话的指令微调版,如果你在安装的过程中出现问题,建议搭配豆包使用。这就是本期的视频啊,关注我,带你了解更多 ai 内容!

来啦来啦!四月份最新更新的谷歌开源 ai 指纹下载教程它来喽!它不仅轻量版手机就能跑,支持图文视频,不用服务器本地就能跑,而且开源免费,多模态推理拉满手机电脑都能用,支持安卓苹果鸿蒙系统。还没有拿到的赶紧跟着我的步骤操作获取,说不定什么时候就给河蟹啦! 首先点我视频右下角分享键复制分享链接,然后在手机打开这个蓝色小鸡,没有的先去下一个,等个一两秒会跳出个包包,没有的话就在首页搜索前进,前进也是 ok 的, 在软件资源里找到你需要的工具,保存安装就可以玩耍啦!