查看AI文稿
李岚9256
李岚9256

粉丝319获赞2696

相关视频

  • 最新Gemma4大模型实测。总结,26b性价比最高,质量和速度都可以,用来做本地agent很合适。31b质量最好,但需要硬件到位。e2b和e4b甚至都可以部署在移动端,回答速度相当快。#gemma4 #本地部署 #ollama #本地大模型
    01:30
    查看AI文稿
  • Gemma 4本地部署指南:根据显存大小选模型 想在自己电脑上跑Gemma 4?从6G普通显卡到128G高端Mac,各档位硬件能跑多大模型?本文带你梳理最低门槛与满血配置,揭秘KV Cache显存吞噬陷阱,并客观对比Mac统一内存与PC独立显卡的真实推理速度差异。#Gemma4 #Mac #大模型 #本地部署 #显卡
    02:56
    查看AI文稿
  • 现在手机都可以一键本地部署大模型了,玩玩可以 小模型的性能嘛,玩玩可以,虽然现在生产力还不行, 但是至少给了个梦。 #本地部署大模型 #AI手机 #ai工具 #AI智能体 #gemma4
    02:03
    查看AI文稿
  • 1分钟搞清楚关于Gemma的一切 为什么它号称全球最强开源模型?4大版本怎么想?硬件要求高不高?我该用它干嘛?一次性全解答#Gemma #OpenClaw
    02:13
    查看AI文稿
  • 谷歌Gemma4本地部署教程+接入OpenClaw实测! 谷歌最新开源大模型Gemma4的实际战斗力到底怎么样?这期视频除了保姆级的本地部署教程,还接入小龙虾🦞进行实测!运行速度、推理能力、Agent 联动效果一次性为你揭晓。建议点赞收藏备用!#大模型   #AI   #本地部署    #OpenClaw  #macmini
    06:19
    查看AI文稿
  • 笔记本部署Gemma4免费养“大龙虾”可行么? Gemma4本地大模型发布啦!你的笔记本部署本地大模型免费养“大龙虾”可行么?
今天 AI 圈最大的新闻,就是谷歌正式发布了本地开源大模型 Gemma 4,包含了 E2B、E4B、26B、32B多个参数版本。
众所周知,养大龙虾这种需要高频调用、实时反馈的智能体,Token 的输出速度就是生命线。 如果半天憋不出一个字,那不叫智能体,那叫“智障体”。 为了回答这个问题,我拿手头的两台主流配置的轻薄笔记本,用 Ollama本地部署大模型,做一次真机测试。 不吹不黑,我们直接用数据说话。 
为了尽量还原大家的日常使用场景,我选了一台 Mac 笔记本和一台 Windows 笔记本,都是目前大家最常用的笔记本型号。其中苹果笔记本为MacBook Air M4 芯片,配置了16GB 统一内存和 1TB硬盘。而Windows笔记本为联想小新Pro 14 GT ,配置了酷睿 Ultra 5 CPU,以及 32GB 大内存和1TB 硬盘,笔记本为核显,没有独立显卡。 
让我们来看看最终的核心数据,也就是Token 输出速度: 
1. 谷歌的中量级模型Gemma 4 E4B
MacBook的Token输出速度为21.25 tokens/s;
Windows笔记本的Token输出速度为12.64tokens/s;
在小尺寸大模型中,苹果笔记本凭借统一内存架构,速度几乎快了一倍,是绝对的王者。 
2. DeepSeek R1 8B
MacBook的Token输出速度为16.74 tokens/s
Windows笔记本的Token输出速度为7.8 tokens/s 
3. 阿里的Qwen 3.5 9B
M4芯片的MacBook Air的Token输出速度为8.8 tokens/s
而Windows笔记本的Token输出速度为5.9 tokens/s
低于 10 tokens/s 的模型体验非常糟糕,不建议在此配置下使用。 
4. 谷歌Gemma4:26B的重量级模型
MacBook Air 笔记本显存直接爆掉,完全无法运行。
而Windows 联想小新笔记本的Token输出速度竟然达到了11.45 tokens/s,完全超乎想象。 
#vibecoding#gemma4#openclaw#大龙虾#大模型
    04:29
    笔记本部署Gemma4免费养“大龙虾”可行么? Gemma4本地大模型发布啦!你的笔记本部署本地大模型免费养“大龙虾”可行么?
    今天 AI 圈最大的新闻,就是谷歌正式发布了本地开源大模型 Gemma 4,包含了 E2B、E4B、26B、32B多个参数版本。
    众所周知,养大龙虾这种需要高频调用、实时反馈的智能体,Token 的输出速度就是生命线。 如果半天憋不出一个字,那不叫智能体,那叫“智障体”。 为了回答这个问题,我拿手头的两台主流配置的轻薄笔记本,用 Ollama本地部署大模型,做一次真机测试。 不吹不黑,我们直接用数据说话。
    为了尽量还原大家的日常使用场景,我选了一台 Mac 笔记本和一台 Windows 笔记本,都是目前大家最常用的笔记本型号。其中苹果笔记本为MacBook Air M4 芯片,配置了16GB 统一内存和 1TB硬盘。而Windows笔记本为联想小新Pro 14 GT ,配置了酷睿 Ultra 5 CPU,以及 32GB 大内存和1TB 硬盘,笔记本为核显,没有独立显卡。
    让我们来看看最终的核心数据,也就是Token 输出速度:
    1. 谷歌的中量级模型Gemma 4 E4B
    MacBook的Token输出速度为21.25 tokens/s;
    Windows笔记本的Token输出速度为12.64tokens/s;
    在小尺寸大模型中,苹果笔记本凭借统一内存架构,速度几乎快了一倍,是绝对的王者。
    2. DeepSeek R1 8B
    MacBook的Token输出速度为16.74 tokens/s
    Windows笔记本的Token输出速度为7.8 tokens/s
    3. 阿里的Qwen 3.5 9B
    M4芯片的MacBook Air的Token输出速度为8.8 tokens/s
    而Windows笔记本的Token输出速度为5.9 tokens/s
    低于 10 tokens/s 的模型体验非常糟糕,不建议在此配置下使用。
    4. 谷歌Gemma4:26B的重量级模型
    MacBook Air 笔记本显存直接爆掉,完全无法运行。
    而Windows 联想小新笔记本的Token输出速度竟然达到了11.45 tokens/s,完全超乎想象。
    #vibecoding#gemma4#openclaw#大龙虾#大模型
  • 一个视频学会部署无审查大模型 |VMLX + Ollama保姆级教程#ai新星计划#Google#qwen#gemma4#本地部署
    07:26
    查看AI文稿
  • 16G显存跑大模型推荐Gemma4 5060TI16G跑Gemma4大模型实测 推荐!# #5060TI16G跑大模型 #16G显存跑大模型推荐 #16G显存跑什么大模型
    00:16
    查看AI文稿
  • OpenClaw + Gemma4全新本地模型体验来了 #OPENCLAW #Gemma4
    03:20
    查看AI文稿
  • Openclaw接入本地Gemma4 Openclaw 2026.4.5接入本地Ollama,使用Gemma4模型。
#openclaw #ollama #gemma4 #gemma #人工智能
    08:02
    查看AI文稿
  • gemma4 本地部署实测 为了token我也拼了
#抖音科技风向标 #我在抖音养虾 #openclaw #ai #openclaw部署
    03:00
    查看AI文稿
  • Gemma 4全系开源,本地部署实操指南 深度解析Gemma 4家族四款模型架构,涵盖31B Dense、26B MoE及端侧模型,提供从Ollama到vLLM的详细本地部署方案与显存优化技巧。#Gemma4 #谷歌大模型 #大模型部署 #开源模型 #AIAgent
    05:42
    查看AI文稿
  • Gemma 4 接入 OpenClaw,真能省 token 吗?
#Gemma4 #OpenClaw #本地大模型 #AI工具 #AI测评
    04:26
    查看AI文稿
  • 别再花钱买 API 了!谷歌最强开源 Gemma 4 + OpenClaw 本地部署全流程,31B 大模型满血联动!#AI新星计划  #Gemma4  #gemini  #人工智能  #AI
    09:55
    查看AI文稿
  • Gemma4在编程能力上是否可以取代云端大模型呢?简单任务还行#gemma4#claudecode#ollama
    04:10
    查看AI文稿
  • gemma4接入openclaw测评 要玩本地部署还是得提高配置啊#gemma4 #openclaw
    01:41
    查看AI文稿