查看AI文稿
AI踩坑指南
AI踩坑指南

粉丝3656获赞2.0万

相关视频

  • Google最强开源Gemma4,一键部署指南!【小白必会】 #ai新星计划 #人工智能 #谷歌 #教程 #本地部署
    05:28
    查看AI文稿
  • 谷歌放大招!Gemma 4配“MTP起草器”推理狂飙3倍 #fullservice #电脑知识 #程序员日常 #洋垃圾 #大西洋唱片公司介绍
    01:32
    查看AI文稿
  • gemma 4 mtp#AI
    01:18
    查看AI文稿
  • Google深夜放毒:MTP投机解码本地大模型提速三倍教程 Google深夜放毒,教你用MTP投机解码技术让你的Gemma 4 /Qwen3.6 27B 本地大模型提速三倍 #本地大模型加速 #MTP #投机解码 #投机解码教程 #本地大模型MTP
    02:58
    查看AI文稿
  • iPhone 最強本地AI | Gemma 4 #IPHONE #手机AI #离线AI #GEMMA4 
嗨喽,大家好,今天分享iPhone本地运行Gemma 4的使用感受!感谢收看!
    06:46
    查看AI文稿
  • iPhone最强AI!Gemma 4 本地部署教程,完全免费 #AI #gemma4 #本地AI #离线AI
    01:17
    查看AI文稿
  • AI教程:Ollama安装到指定盘 因为Olladm的程序本身和模型都默认安装到C盘,很占用C盘空间,所以我们就需要将他们安装到C盘以外的盘符。
#ollama #gemma4 #gemma  #这也能开播
    05:43
    查看AI文稿
  • 16GB版mackbook部署实测Gemma4 E4B多模态,接入龙虾(附傻瓜式部署)
本视频主要测试了Gemma4 E4B LiteRT (3.6G大小)这个模型的文本、音频和视频理解能力。mac用户强烈推荐使用omlx傻瓜式部署本地模型!#ai #gemma4 #ai新星计划 #本地部署
    06:28
    查看AI文稿
  • 老手机硬核爆改,本地跑通Gemma 4多模态并接入OneAP 🔥 变废为宝!骁龙855老手机硬核爆改,本地跑通Gemma 4多模态并接入OneAPI!
抽屉里吃灰的红米 K20 Pro 还能干嘛?我把它爆改成了一台纯本地的 AI 服务器,不仅跑通了参数量约 7.52B 的 Gemma 4 多模态模型,还通过自写中间件完美接入了 OneAPI!全程硬核折腾,快来看看完整的部署通关流程👇
🛠️ 第一步:底层打通与环境保驾护航 先通过 Linux 服务器配置无线 ADB,利用 Magisk 获取 Root 权限,并写了脚本实现开机自启无线调试,彻底解放数据线。随后在手机原生 Termux 里装好 clang、cmake 以及 termux-wake-lock 防休眠锁,防止系统杀后台,为后续长时间编译做好准备。
🧠 第二步:疯狂避坑与跑通文本模型 一开始想用 llama-server 提供服务,结果发现安卓底层的 Bionic libc 存在兼容问题,果断弃用,改用 Ollama 完美跑通了纯文本推理。接着编译 llama.cpp,注意这里是个大坑:旧版的 llama-llava-cli 已经被废弃了,必须编译最新的 llama-mtmd-cli 工具。最后把 5.3GB 的文本主模型和 946MB 的视觉投影文件塞进手机。
👁️ 第三步:榨干老手机,点亮多模态 加上灵魂指令参数 --jinja,多模态链路正式打通!过程相当壮烈:推理一张图片时,老手机的 8 核 CPU 基本吃满,内存占用飙到 7.1GB 甚至开始调用 swap,总耗时大概两分钟多。虽然属于“可用但不轻盈”,但它真的能看懂图了!
🌉 第四步:手搓 Bridge,变身标准 OpenAI 接口 为了把手机 AI 变成局域网里的正规军,我在另一台 Debian 服务器上手搓了一个自定义 Bridge(桥接中间件)。这个神器绝了:
多模态接管:收到 OneAPI 的请求后,Bridge 会先下载图片,通过 SCP 把图传到手机,再通过 SSH 唤醒手机执行命令行推理,最后清洗掉杂乱的日志,包装成标准的 OpenAI 格式返回。
秒回探活:遇到 OneAPI 的渠道连通性测试,Bridge 会直接触发“短路探活”秒回结果,防止超时报错。
github:https://github.com/shihua-guo/Diary/tree/master/daily/202
    04:34
    老手机硬核爆改,本地跑通Gemma 4多模态并接入OneAP 🔥 变废为宝!骁龙855老手机硬核爆改,本地跑通Gemma 4多模态并接入OneAPI!
    抽屉里吃灰的红米 K20 Pro 还能干嘛?我把它爆改成了一台纯本地的 AI 服务器,不仅跑通了参数量约 7.52B 的 Gemma 4 多模态模型,还通过自写中间件完美接入了 OneAPI!全程硬核折腾,快来看看完整的部署通关流程👇
    🛠️ 第一步:底层打通与环境保驾护航 先通过 Linux 服务器配置无线 ADB,利用 Magisk 获取 Root 权限,并写了脚本实现开机自启无线调试,彻底解放数据线。随后在手机原生 Termux 里装好 clang、cmake 以及 termux-wake-lock 防休眠锁,防止系统杀后台,为后续长时间编译做好准备。
    🧠 第二步:疯狂避坑与跑通文本模型 一开始想用 llama-server 提供服务,结果发现安卓底层的 Bionic libc 存在兼容问题,果断弃用,改用 Ollama 完美跑通了纯文本推理。接着编译 llama.cpp,注意这里是个大坑:旧版的 llama-llava-cli 已经被废弃了,必须编译最新的 llama-mtmd-cli 工具。最后把 5.3GB 的文本主模型和 946MB 的视觉投影文件塞进手机。
    👁️ 第三步:榨干老手机,点亮多模态 加上灵魂指令参数 --jinja,多模态链路正式打通!过程相当壮烈:推理一张图片时,老手机的 8 核 CPU 基本吃满,内存占用飙到 7.1GB 甚至开始调用 swap,总耗时大概两分钟多。虽然属于“可用但不轻盈”,但它真的能看懂图了!
    🌉 第四步:手搓 Bridge,变身标准 OpenAI 接口 为了把手机 AI 变成局域网里的正规军,我在另一台 Debian 服务器上手搓了一个自定义 Bridge(桥接中间件)。这个神器绝了:
    多模态接管:收到 OneAPI 的请求后,Bridge 会先下载图片,通过 SCP 把图传到手机,再通过 SSH 唤醒手机执行命令行推理,最后清洗掉杂乱的日志,包装成标准的 OpenAI 格式返回。
    秒回探活:遇到 OneAPI 的渠道连通性测试,Bridge 会直接触发“短路探活”秒回结果,防止超时报错。
    github:https://github.com/shihua-guo/Diary/tree/master/daily/202
    查看AI文稿
  • 上条视频说Gemma4只能当聊天机器人,我不信。 
今天给它装上了文件系统权限,它能在本地创建文件了。
然后我又想了个新招:让聪明的模型先示范一遍,再让Gemma4复刻——
结果它找到了图片,调用了技能,就是卡在最后一步出不来。 
是模型太笨?还是内存不够?我倾向于前者,但还不确定。
答案等4月16号Mac Studio到货才揭晓。 
另外顺手整理了一个选版本的经验公式,内存怎么对应参数量,视频里说清楚了。 
#Gemma4  #openclaw #本地部署 #AI工具 #AI测评
    04:58
    查看AI文稿
  • 谷歌发布AI大模型Gemma4!iphone17pro实测 谷歌新大模型Gemma4开源免费重磅上线!不用花钱买token了?!到底好不好用?
iPhone17pro手机实测+选型指南+安装攻略+调教干货+适合场景!#gemma4 #大模型即将改变世界
    07:00
    查看AI文稿
  • ORC识别WX机器人 通过桌面运行的微信进行Orc识别,将消息对接Openclaw实现聊天机器人,每个聊天在openclaw串讲独立会话。用到技术#openvc #paddleocr #gemma4 #openclaw #openai
    08:37
    查看AI文稿
  • Google最强开源Gemma4!小白部署教程! #gemma4 #人工智能#谷歌#教程#本地部署
    01:11
    查看AI文稿
  • 谷歌Gemma 4免费部署到手机!筷莱琼茅郝元彤夺郝支持离线 支持离线使用多款模型,太强悍了#软件下载 #Gemma4 #ai #资源分享 #大模型
    01:12
    查看AI文稿
  • #ai工具使用 #创作者中心 #创作灵感 #openclaw #gemma4 openclaw对接Gemma4,省去token费用
    05:13
    查看AI文稿
  • Gemma4 26B 能力挑战测试#hermes #hermes爱马仕 #gemma4
    01:59
    查看AI文稿
  • 如何不联网就能使用Gemini? #Gemini #Gemma #开源 #AI
    03:00
    查看AI文稿