粉丝313获赞487

你的电脑显卡是残血还是满血?三十秒自己查清楚为啥同星号的显卡,别人玩游戏的帧率比我高。新买的笔记本怕买到残血缩水版,花大价钱吃大亏。今天教你用系统自带的功能,一眼辨真假, 不用安装任何软件。桌面右键打开英伟达控制面板,点击左上角,帮助系统信息找到你的显卡型号。记住,哭打核心数,这就是判断关键。然后用任意一个 ai 工具直接问他,你的显卡哭打核心数是多少?核心数和官方一致,那就是满血版,核心数明显偏少,那就是残血版。 笔记本台式机都能用吗? n 卡都能用, a 卡可以看吗?这个方法只能看 n 卡, a 卡我后面再讲,不知道核心数多少才算正常怎么 办?直接问 ai 查到满血的。恭喜你,没买亏,查到残血的也别慌,只是性能低一点,正常用没问题。赶紧去查一下,把你的显卡型号打在评论区,我帮你看看是不是满血。

到底是谁还在买这种纯割韭菜的笔记本啊?说到惠普,他家的暗影精灵一直以一线品牌的售后和极具性价比的价格闻名,但是我们好的不讲,今天好好考打一下跟他同样历史悠久的兄弟品 牌光影精灵系列。最新的光影精灵十一搭载的是十三代 i 七处理器加五零六零的显卡,新机官网售价七千二百九十九元,平台这张补贴卖的更便宜,只有四千多。乍一看这价格好像还可以,但仔细看,他这张五零六零功率只有八十瓦,并不是满功率的一百一十五瓦, 也就是我们常说的残血显卡。因为功率不足,性能释放稀烂,五零六零只能发挥三零六零的性能,那我还不如去买下满血的三零六零本呢。哦对了,你三零六零的光影八也是残血, 今年的五零六零只需要一百一十五瓦的功耗,性能释放就已经很优秀了,大部分厂商也都觉得没有必要再出残血本,只有光影精灵这个残血就像什么设定一样,功耗每一代都要砍。而且光影精灵的定位就非常模糊,我盼它性能不配做游戏本,它可以是高性能半攻本,我盼它重量不配做半攻本,它又可以是低性能游戏本,无法选中是吧?

我们今天给江西南昌的一个小姐姐淘一台 m 四 pro, 四十八加一 t 的 机子,十四寸的,看一下能不能淘到一台他满意的机子,顺便了解一下今天的行情。出发 电脑已经找到了,我们首先要检查一下电脑的外观有没有划痕,最主要是四个角,要详细的检查一下有没有划痕,整体这台电脑的成色还是相当不错的。 第二步就是打开界面,核对一下这台电脑的配置和参数,看一下它是什么芯片,内存, 它的硬盘,还有这台电脑是不是带锁的,包括它的容量,还有循环数, cpu, gpu 都要去核对一下。第三步就是测试一下屏幕有没有老化,压伤,漏液,踩点,每个颜色都要仔细的核对一下,看看有没有问题。 最后一步就是把电脑传输还原,恢复出厂设置,可以正常使用就没问题了,电脑已经跟小姐姐确认过了,我们马上给他安排打包发货,买电脑找海哥,我在华强北等你。

macbook air m 四到底该买什么配置呢?十六 g 内存到底够不够用呢?这玩意到底能用来干什么呢?这些是学长从上期节目的留言和私信当中总结出来被提及最多的灵活问题。如果你也有这样的疑问,相信这期视频一定能给你答案, 这就是选项十二,我是周学长,喜欢苹果设备、数码、影音、摄影、摄像同学请一定记得关注选项频道,这里有很多好看的等你来发掘哦。 这期视频学长将会从办公和创作两大使用场景来展开,分别进行轻度和重度的测试。学长这台是十五寸的 macbook air m 四十六 g 加五幺二的中配版本,素材全部放在闪滴一六幺固态硬盘中,托盘使用。 首先用它来办公、学习,偶尔娱乐可不可以呢?在这种使用需求下,主要侧重于 office w p s。 等办公软件,浏览网页、听音乐、看视频等用途。接下来让我们先从轻度使用开始,开启六个桌面,打开一个七千字小 小说,一个九百多兆的 ppt, 一个 pdf, 再打开网易云音乐听歌,打开网页看学长的四 k 视频,让我们来看看桌面切换是否流畅,每个 app 是否能自如运行,完全没问题。那么接下来开始模拟高强度的使用,再打开两个万字小说,一个九百兆的 ppt, 三份 pdf 文件,三份 excel 文件, 再开十个网页,每个桌面应用依旧能够正常使用,且桌面之间的滑动也依旧流畅自然,没有任何的问题, cpu 还是很清闲,内存压力也不大。不得不说啊, macbook air 真是太强悍了,应对这种情况对他来说简直是太轻松了,接下来用它来做设计处理图片可不可以呢? 还是一边播放音乐,一边打开一个一点九 g 的 psd 设计图,再开一个一点二 g 的 ai 设计图哇,完全没有任何问题,没有任何的卡顿, cpu 还是很倾斜,内存压 压力也不大,这都难不倒他。那么接下来上强度,咱们直接打开十个总大小两个多级的 psd 文件,其他不变哇,依旧没有任何卡顿,桌面切换流畅, cpu 还是很倾斜,内存压力也不大。要知道啊,如果在 windows 十一上进行同样的操作,此时的物理内存已经占用了差不多十六 g 了。也就说,如果你使用的是 windows 笔记本,在这样的使用情况下,必须要选择大于十六 g 的内存版本, 而 macbook 选择十六 g 内存完全没有问题。接下来,由 captur one 处理总大小接近十九个 g 的四千两百万像素肉格式照片,同时打开一个一点九 g 的 psd 设计图,依旧没有任何问题,还得上强度啊,咱们一边导出这些照片,一边操作 ps, 哎,想不到在这种情况下, cpu 依旧清显,不过内存的压力啊,已经变黄了, 好在各项操作啊依旧流畅。再测试一下机身表面温度,此时已经出现了发热,最高温度约四十五度左右,最高温点位位于键盘顶部。看来啊,无论是办公设计还是修图啊,都难不倒 macbook air。 那么接下来视频剪辑将会是对于性能更大的挑战。 让我们先来试试看,用 pr 剪辑一个中等强度的视频,素材量五十个 g, 全部都是四 k 六十帧十比特的 slog 三素材,上期视频学长就是用的这台 macbook air 剪辑的,可以说是毫无压力啊。接下来上强度,咱们再看一个达芬奇软件,拖入一百零二 g 的四 k 六十帧十比特 h 二六五素材进行调色, 依旧毫无压力。两个桌面之间的切换依旧丝滑, cpu 依旧清闲,内存压力啊,居然也很小, 电脑表面的温度呢,也很正常。这可不行,得再来点猛的,咱们让 pr 开始导出渲染, 此时 cpu 还是很清闲,内存压力也不大,不行,还得再上点强度。我们让达芬奇也开始渲染素材,哇,这种强度可以说是非常重度的使用了。 cpu 居然依旧未满载,内存压力不大,还是绿色的,不行,再开十个网页哇! 电脑运行依旧丝滑流畅。 cpu 依旧未满载,不过内存压力啊,终于变黄了,不过时不时的呢,还会回归绿色,高温的点基本还是在四十五度左右。 如果你常用的剪辑软件是剪映,那么完全可以放心了,他可比 pr 对性能的要求更低,就不参加测试了。那么接下来咱们继续给他上强度,用 ae 做视频 特效,他还能撑得住吗?咱们测一个中等强度的三 d 摄影机模板,有四 k 和幺零八零 p 两种分辨率,在幺零八零 p 分辨率下,跑预览的帧率啊,基本可以保持在十帧以上,还是能用的。 cpu 的负载率在百分之五十到百分之九十之间,几乎可以说是满载状态。 再试试四 k 分辨率,从差不多的位置开始,哎呀,帧率明显掉下来了,只能维持在三帧以上了, 这几乎是一个不太能凑合用的状态了,不过此时 cpu 的负载反而没那么高,这也许就是他 cpu 性能的上限。相信大家一定对 macbook air 的性能啊有了最直观的感受了。 通过测试,你可以很直观的看到 mc 芯片以及十六 g 内存的性能上线。简单说, mc 芯片让他拥有了非常强悍的性能,十六 g 内存也几乎可以满足百分之八十以上人群的使用需求了。无论是学习办公、 做设计、处理图片,还是中度的剪辑调色,甚至使用 a 做一些简单的特效都没有任何问题。即便没有风扇,在大多数的情况下也能做到很低的温度。如果你需要长时间的让 cpu 满载运行,比如高强度的使用 a 或者渲染软件等等,那么应该直接选择 macbook pro 好了。这是本期视频的全部内容了,如果你觉得学长视频对你有帮助,请一定记得一键三连支持一下学长哦!如果你还有什么想说的,咱们评论区见吧,我们下期视频再见!

大家好,我是大叔,只说真话,只做实在事,只给干货。最近后台一直有人问 maxon 怎么跑本地大模型,说实话我之前也折腾过几次,踩了不少坑,今天就把完整的流程整理出来,从模型选择到两种方案的对比,再到最关键的内存优化,一次性讲清楚,咱们这就开始。 为什么要在本地运行大模型呢?我觉得主要有四个核心优势,第一,完全隐私保护,所有数据都在本地处理,不用上传到云端,敏感信息更安全。第二,零 api 成本,一次配置无限使用,不用付昂贵的调用费。 第三, apple silicon 优化 m 一 到 m 四芯片的统一内存架构,性能特别好。第四,超低运行成本, mac mini m 四 pro 跑 ai 功率九三十到五十二瓦,一年电费不到六十块钱, 就算按最高功耗一百四十瓦算,一年也就一百五十六块,成本低到忽略不计。说回模型选择,我试了好几个模型,最后发现酷温三点五杠九 b 最靠谱,推力能力强,内存占用也合适,八到十六 g b 的 mac 都能跑得动。有两种格式可以选,第一种是酷温三点五杠九 b, 杠 q 四 k m g g u f 格式,占显卡五点三 gb, 跑起来大概要十 gb 内存容量化, k v cash 用拉玛 d c p p 后端。第二种是 q 稳三点五杠九 b r m m x a p 四 m l x 格式,显卡占用差不多五 gb 内存要十二 gb 左右,用 mxa 后端这里有个坑要注意,总内存等于模型大小,加 k v cash。 九 b q 四模型大概五 g b k v cash 在 一百二十八 k 上下文下 q 四量化只要四到五 g b, 但默认 f 十六 k v cash 要吃掉十六 g b, 千万别用我踩过这个坑。量化 k v cash 真的 是内存紧张时的救命稻草。 现在我们来看第一种方案,拉玛 c p p 的 安装与配置。第一步,打开终端,输入 brew install 拉玛 c p p 回车,拉玛 server 就 装好了。 第二步,装 hugging face 命令行工具,输入 blue install hugging face c l l 回车,然后下载模型,输入 hugging face c l i download unslos 斜杠 cool when 三点五到九 b g g u f 后面跟文件名 cool when 三点五到九 b q k m g e u f 再加 local d r 波浪线斜杠 models 回车。如果需要认证,先跑 hugging face c o i login 登录。第三步,启动服务器,输入 lama server 警 m 波浪线斜杠 models 斜杠亏 when 三点五得九 b q 四 k m g g u f 然后是负 n g l 九九 c 一 三一零七二 n p e file on cash type k q 四零 cash type v q 四零 host 零点零点零点零 回车拉马蹄 d p p 的 参数挺多的,我挑几个关键的说说。杠 n g l 九九,把所有成丢给 g p u, 也就是 metal c p u 不 参与计算。 杠 c 一 三一零七二上下文窗口一百二十八 k tokens 内存不够可以调小杠 n p 一 并行,槽位数一个人用,保持一杠 fa on, 开启 flash attention, 省内存,还能加速长文本推理。加加 cash type k q 四零把 key cash 量化成四位,这个很重要。 加加 cash type v q 四四零 y 六 cash 也量化成四位 k v cash 量化的效果很明显。一百二十八 k 上下文九 b 模型 f c 六,要持十六 g b q 八零,要八 gb q 四零,只要四 gb 能省下百分之七十五的内存。不同内存的 mac 怎么选?八 gb 的 mac 用 q 四零 k 为 cash, 上下文调到杠 c 三二七六八,也就是三十二 k。 十六 gb 的 mac 跑一百二十八 k 很 轻松,三十二 gb 以上的 mac 跑一百二十八 k 很 轻松。三十二 gb 以上的 mac 可以 试试更大的模型,或者开多个并行槽位。第二种方案是 mlx y o x。 什么是 omx lase 来呃, omx 是 一个 microsoft 原生应用,专门用来管理和提供 m l x 模型服务。 m l x 是 apple 自家的机器学习框架,针对 apple silicon 的 统一内存架构做了专门优化。第一步,安装 omx x x a 下载并安装应用, 它有个图形界面,方便管理模型,还内置了服务器。第二步,下载模型,打开 ol cs 应用,搜索 qwind, 三点五调 b l l m m x p 四点下载按钮,模型会存到波浪线斜杠点 ol l cs 拉杠 model 斜杠目录下。 第三步,启动服务器 omlex, 默认在 http 冒老斜杠斜杠一二七点零点零点一点冒号八零零零提供服务,从应用界面点 start serving 就 能启动。它的好处是可以同时跑多个模型。两种方案到底哪个更好? 我在 apple m 五 max 一 百二十八 gb 统一内存上做了测试,用的都是 cuan, 三点五到九 b 量化级别也一样。结果挺有意思的, t t f t 就是 首 token 时间,拉玛 cpp 只要六十七毫秒, m l x 要二百八十九毫秒,拉玛 cpp 快 了四点三倍 升程。速度方面,拉玛 cpp 是 七十 token 每秒, m l x 是 九十六 token 每秒。这次 m l x 赢了快百分之三十七。总时间的话,拉玛 cpp 七点三秒, m l x 五点五秒, m l x 快 百分之二十五。总结一下,拉马尔 c p p 适合交互式聊天,手头肯快,内存优化也好,还支持量化 k v cash, 而且跨平台 linux 也能用。 m l x 适合长文本生成和批量处理,生成速度快,原生 metal 优化还能同时跑多个模型。怎么选呢?做聊天机器人低延迟工具,选拉马尔 c p p 考场文本批量处理,选 mlx 加 o mse, 内存只有八到十六 gb, 选 lamar c p p, 想同时服务多个模型,选 o mse。 最后是如何连接 hermes agent? 配置起来很简单, 在终端输入 hermes model, 选择 custom endpoint, 然后输入 base url。 如果是 lamar c p p, 就 输入 h t t p 妙妙妙妙号斜杠斜杠 local host, 冒号,八零八零。 如果是 m l x, 就 输入 http, 冒号斜杠斜杠 localhost, 冒号八零零零。接着输入模型名称,从斜杠 v 一 斜杠杠 models 端点获取。 关于超时配置, hermes 会自动检测本地端点并放宽超时,大多数情况不用管,但如果遇到超时错误,比如大上下文或硬件比较慢,可以在点一幕文件里手动设置。 关键是 stream rate timeout 默认一百二十秒,本地自动调整为一千八百秒。环境变量是 h r n s stream rate tamod style stream 媚任一百八十秒,本地会完全禁用。变量是 h m s stream s tail tamod api call, 媚任一千八百秒,一般不用调。我发现 stream rate timeout 最容易出问题,大上下文欲填充实 本地模型,可能要几分钟才能输出。总结一下今天的核心要点,两大方案,拉玛 c p p 低延迟 m l x 高吞吐推荐模型, q 温三点五杠九 b 是 八到十六 g b mac 的 甜蜜点,关键优化是量化 k v cash q 四点,内存降低百分之七十五 无缝集成 hermes agent 自动检测本地端点,快速开始步骤,安装 homebrew 运行 brew install lama c p p 下载 qwin 三点五杠九 b 模型,启动服务器连接 hermes agent 进阶建议,内存紧张,减小上下文或使用更小模型,需要多模型尝试 omsls 追求极致性能升级到三十二 gb 以上。 mac 遇到问题检查超时配置。现在你可以在 mac 上运行自己的私有 ai 助手了。零成本,全隐私,高性能,超低电费。感谢观看,下期见。如有问题欢迎交流讨论,后续会持续更新更多本地大模型技巧。

来应大家要求,之前看到的这个 m 四 pro 的 高配啊,原封未被开封,未被使用过机器,今天当二手卖,配置是高配的 十四盒的 cpu, 来加咱们这边的一个二十盒 gpu, 加二十四 gb 的 统一运行,加 e t 的 硬盘,高配配键盘侠的机型,这个黑色现货就这一点 来公网发售价的价位的话两万块,这个给到您的一个价格的话帮您省六千,有喜欢的话点我直播间。

失主顾客马克布克 m 四 pro 哭容失败,不料了,果断赔偿顾客一台新的两万多的 m 五 pro。 你 是 m 三还是 m 四啊?我不是上次问你 m 三吗?你跟我说 m 三 pro 啊。 m 三, 这里是苹果 m 四 pro 扩容现场,我们制造了这台机器扩容两 t b, 因为前两天的扩容中呢,我们有台机器定制机扩容失败,我们也想从在这个机的扩容过程中,我们能不能把这台机修起来。我们答应顾客是下午两点钟给顾客的,现在是九点二十七分,我们抓紧处理。 嗯,没事没事,喊你海哥搞一下吧。嗯, 一大早就从上海跑过来了。啊?对,昨天中午撒了,不小心撒了咖啡。 哦哦哦,拿给你了是吧?好,那我上去碰碰。失败后我们尝试维修,没有好机器才行,市面上没有太多机密和相关数据提供参考,测量电流,电流体的后置掉下来不知道是不是正常的,我们铺贴需要一台机器来验证。是差不多的, 机器也进了水, 马上开始装硬盘了。 小孙,那个苹果笔记本维修的就是这个客户,上海过来的,要下密码。 十二点五十六分,我们公司拼了,饭还没吃呢,马上刷机。 我们现在是做也是做智能机开发,每天的这个节奏非常快。对,我就等着写写写程序,你就送到苹果去检测的。我观察方式就是芯片什么的有问题呢,他们也不能换主板,换主板就有点不值当的,关键是我数据比较重要, 电一起要掉下来。今天我常会多次维修给你看一下这个机器,我,我们还没有拆。对,就推着上回过来修,也是抖音上看到您那个发的,然后我就说这个应该还可以 啊,这个感觉好,该冒的风险我们也要冒的,因为我们也也想追求技术领先嘛, 下次以后有需要再来麻烦你。好好,谢谢理解 先生。反正我们测过了,你直接拿走就行了,我们这边是保修是第一百八十天哎,你就放心用就行了,不会有问题的。好的。