用Mac Mini能分币不花的养龙虾吗? 用Mac Mini部署本地算力,能实现分币不花的养龙虾吗?养龙虾最大的成本token的费用,也就是算力。那现在最简单的方式就是接入阿里云 腾讯云 火山云上的大模型,你每次使用都会消耗算力,所以这是一个持续付费的过程,要是使用频繁一个月花个几千块钱买token,也是稀松平仓,然后另外一种所谓分币不花的方式呢,就是一次性投入买一个硬件,然后在里面部署一个开源的大模型,类似Kimi/千问/DeepSeek这种,为了省下token费用,我花了将近4k买了个丐版macmini,经过尝试 想分币不花的使用本地算力养龙虾基本没戏,下面我说说原因啊,我选的这个90亿参数的qwen3.5:,算是能力比较低的模型了。但要想让他发挥全力大概需要18gb显存。而我这款钙板macmini最大调动显存也就13g左右,好在Ollama这个工具可以量化压缩模型,所以勉强能跑这个千问3.5,但是因为算力不够,你随便问他一个问题,真的是等到天荒地老…时间久到你都怀疑是不是卡了。。。最后还接了云龙虾才正常运行起来。但是如果要接云模型,我就没必要新买macmini了,云模型龙虾对配置要求很低的。基本常用的笔记本电脑都能运行,完全没必要为了龙虾新买电脑,所以这个macmini算是又交了一笔AI学费#openclaw #养龙虾 #ai #大模型 #macmini
00:00 / 02:18
连播
清屏
智能
倍速
点赞909
00:00 / 02:05
连播
清屏
智能
倍速
点赞51
Codex为什么更适合自媒体公司部署? CodeX适配自媒体公司核心原因 1. 原生搭载顶尖GPT大模型 文案创作、脚本撰写、口播稿、带货文案、账号人设文案全链路一键产出,自媒体日常内容文案需求直接闭环,不用再切换文案工具。 2. 内置顶级AI生图能力 依托GPT顶尖生图水准,全网画质、构图、氛围感、商业实景图、爆款封面图、场景配图随手出,自媒体封面、配图、短视频静态素材全部搞定,替代高价设计。 3. 一站式全流程整合,零工具切换 把文案+配图+简易工作流+轻量编排全部集成,不用分开用写稿软件、生图平台、排版工具,一套软件搞定内容前期所有环节,大幅缩减团队操作成本。 4. 精准适配自媒体降本逻辑 实拍视频制作耗时久、人力与拍摄成本高,自媒体大多靠图文+静态配图+口播剪辑起量,高清AI图片完全满足流量内容需求,低成本量产爆款素材。 5. 自带编程+自定义工作流能力 可搭建自媒体专属自动化流程:批量写文案、批量出封面、批量整理选题、矩阵账号内容一键分发排版,适合MCN、自媒体团队规模化批量产出内容。 6. 轻量化易上手,全员可用 不用专业技术功底,运营、编导、剪辑都能快速上手,快速实现选题-文案-配图-初稿成型极速出稿,大幅提升账号更新频率与产能。 简单总结:CodeX就是为自媒体量身打造的内容量产一体化中台,靠GPT强文案+顶尖生图双核心,砍掉多软件切换成本、砍掉设计配图成本、拉高整体出稿效率,完美契合自媒体轻资产、快产出、矩阵化运营需求。 #点金手丰年 #codex @点金手丰年
00:00 / 01:51
连播
清屏
智能
倍速
点赞50
00:00 / 04:55
连播
清屏
智能
倍速
点赞3379
00:00 / 03:58
连播
清屏
智能
倍速
点赞47
三款搭载不同架构芯片的设备在本地运行大语言模型时性能对比 老外做的测评,真的是壕啊,两天dgx都只能跑32b q4量化版,看来距离民用本地大模型还有好长一条路要走啊 1. Apple Mac Mini (M4 Pro) 核心特性:搭载苹果 M4 Pro 芯片。 表现:在测试中,它的提示词预填充速度(PP)表现中规中矩(563),Token 生成速度(解码)为 55 t/s。 定位:目前市面上非常热门的、具有高性价比的统一内存架构(Unified Memory)设备。 2. Framework Desktop (AMD Strix Halo) 核心特性:搭载了 AMD 尚未(或刚刚)推出的 Ryzen AI Max (Strix Halo) 顶级 APU。 表现:这款芯片的特点是拥有极强的 GPU 核显性能和高内存带宽。在视频中,它的 Token 生成速度(73 t/s)超过了 Mac Mini,但提示词预填充(PP)性能却意外地较低(342)。 定位:作为 Windows/Linux 阵营对抗苹果统一内存架构的强力竞争者。 3. NVIDIA DGX Spark 核心特性:这是 NVIDIA 推出的一款紧凑型“桌面级 AI 超级计算机”,搭载了 GB10 Grace Blackwell 超级芯片。 性能:它拥有 128GB 的统一内存。在测试中,它的预填充速度(PP)高达 2107,远远碾压前两者(是它们的 4-6 倍)。 定位:专业级 AI 开发设备。视频作者强调,虽然在普通聊天时感知不强,但在处理复杂、长文本的“提示词预填充”阶段,DGX Spark 的计算能力才真正显现出来。 #llamacpp #dgxspark #strixhalo #m4pro #qwen
00:00 / 01:16
连播
清屏
智能
倍速
点赞78
00:00 / 00:33
连播
清屏
智能
倍速
点赞132
00:00 / 03:40
连播
清屏
智能
倍速
点赞10
00:00 / 02:13
连播
清屏
智能
倍速
点赞98
Mac 本地跑 Qwen3.6-27B,我实测了 4 种方案 这期视频我系统测试了 Qwen3.6-27B 在 Mac 上的本地运行体验。 我一共体验了 4 种方式:Qwen Chat 官网版本、Unsloth 的 UD-Q5 GGUF、Unsloth MLX 6bit 搭配 DFlash,以及最后速度最让我满意的 MTPLX 4bit 方案。 这次重点不是只看跑分,而是看它在真实任务里的表现:网页复刻、交通仿真、3D 魔尺、礼物包装助手、仓库分拣系统、体素艺术场景、写作、推理和幻觉识别。整体来看,Qwen3.6-27B 的编码和创作能力确实很强,尤其在 MTPLX 上,本地速度可以跑到 40 tok/s 以上,对 Mac 用户来说体验提升非常明显。 当然,它也不是完美的。比如复杂 3D 场景会出现穿模、逻辑不稳定、动效不准确等问题;MTPLX 当前也不支持图像识别。但如果你想在 Mac 上本地运行一个速度快、质量不错、适合 AI 编程和日常任务的 27B 模型,Qwen3.6-27B 很值得尝试。 本期会聊到: - Qwen3.6-27B 为什么值得关注 - Mac 上运行 27B 稠密模型的真实速度 - GGUF、MLX、DFlash、MTPLX 的体验差异 - MTPLX 的安装和 Open WebUI 接入体验 - 4bit 模型在编码、写作和推理任务中的表现 - 我目前更推荐哪一种本地运行方案 如果你也在 Mac 上折腾本地大模型、AI 编程模型或 Qwen 系列模型,这期可以作为一个实际体验参考。 时间戳 00:00 开场:为什么这期要测 Qwen3.6-27B 02:21 Mac 上运行 Qwen3.6-27B 的几种新方案 05:00 官网版本与 Unsloth GGUF 10:37 Unsloth MLX 6bit + DFlash 16:34 MTPLX 上手 20:50 写作、推理、幻觉识别测试 #Qwen #Qwen36 #Qwen3_6_27B #本地大模型 #Mac本地部署 #AI编程
00:00 / 24:26
连播
清屏
智能
倍速
点赞21
00:00 / 00:46
连播
清屏
智能
倍速
点赞0
例外5天前
CodexCoding插件分类入门:开发,协作,部署该怎选择 本期视频延续 Codex 插件入门系列,在上一期介绍 Featured 插件入口和基础使用流程之后,进一步聚焦 Coding 分类插件的选择方法。视频没有采用逐个罗列所有插件的方式,而是从实际开发流程出发,将 Coding 插件拆分为三个更容易理解的使用场景:开发与构建、代码协作与质量、部署和线上服务。 在“开发与构建”部分,视频主要说明不同项目类型应该优先关注的插件。例如,做网页或前端应用时,可以先看 Build Web Apps;做浏览器游戏或互动玩法原型时,Game Studio 会更贴合;如果项目涉及移动端或客户端开发,则可以再关注 Build iOS Apps、Build macOS Apps、Test Android Apps 和 Expo 等相关插件。这个部分的重点是帮助新手先判断“自己正在做什么类型的项目”,而不是一开始就把所有 Coding 插件都装上。 在“代码协作与质量”部分,视频介绍了 GitHub、CodeRabbit、Superpowers 和 Codex Security 这类插件的定位。GitHub 更适合处理 PR、Issue、CI 和发布流程;CodeRabbit 偏向 AI 代码审查,可以辅助发现代码改动中的潜在风险;Superpowers 更强调规划、测试驱动开发、系统调试和交付流程,适合希望让 Codex 工作方式更稳定的用户;Codex Security 则偏向代码安全扫描,适合项目规模变大后补充安全检查。 在“部署和线上服务”部分,视频将 Vercel、Netlify、Render、Cloudflare、Supabase、Neon Postgres、Sentry、Vantage 和 Statsig 等插件放在项目上线后的场景中理解。Vercel、Netlify、Render 和 Cloudflare 主要对应部署、托管和发布管理;Supabase 与 Neon Postgres 更偏数据库和后端数据服务;Sentry、Vantage 和 Statsig 则适合项目上线后观察错误、成本和实验反馈。 快到上限了,不往下写了 #codex #codex_coding #ai #codex插件
00:00 / 01:29
连播
清屏
智能
倍速
点赞39