Qwen3.5小模型实现手机端本地运OCR兼顾效率与隐私 #Ai #电脑 #科技

qwen小模型安装在手机端

7

抢首评

1

分享

举报

发布时间：2026-03-07 08:12

查看AI文稿

粉丝611获赞8034

相关视频

01:43
奶奶都能学会的Qwen部署教程来了！无需任何计算机知识，只需要会用手机，动动手指点几下，就能轻松在手机上部署大模型，不止可以跟你文字对话，还能和你语音聊天，帮你看世界！
#Qwen #通义千问 #AI #人工智能
919千问大模型
03:08
这可能是全网坠简单的部署大模型教程... 💡 通义千问大模型 🤖 部署复杂？不存在的！
Qwen找来好朋友Ollama，一句话搞定部署，告别繁琐安装。文本，图片都支持！
#AI教程 #AI大模型 #通义千问 #Qwen #Ollama
332千问大模型
02:24
九年吃灰老手机，轻松部署Qwen 3大模型别不信！这台“古董”手机在我抽屉里躺了快十年，成功部署上了Qwen3大语言模型，还能丝滑运行，现在就手把手教你实现。
#Qwen #人工智能 #大模型 #本地部署
2255千问大模型
11:50
手机可以直接跑最新的Qwen2.5大模型了？ 🚀 手机可以直接跑最新的Qwen2.5大模型？最简单的三种使用方法一个APP搞定。
✨ 手机使用Maid离线运行本地大模型、调用OpenApi、调用Ollama，以及软件操作和角色卡使用演示教程。
🔗 本次教程用到的文件 https://pan.baidu.com/s/18no-YxHo1ekTSZr9l0wdbQ?pwd=ZXCV
🎉希望这篇教程帮助到了你，想了解更多AI知识
👍 还请关注博主，点赞收藏哦
#人工智能 #ai #通义千问 #ollama #大模型
458zxdorro
01:40
手机也能跑 Qwen3？手把手教你部署！全球开源模型冠军 Qwen3 、端到端全模态模型 Qwen2.5- Omni 在手机上也能跑通啦！Android、 iOS、桌面端通通安排～
#通义 #Qwen #大模型 #教程 #涨知识
3.6万通义实验室
00:33
千问3.5小尺寸模型发布手机本地运行的大模型越来越强了。真正完全免费完全隐私 #qwen #千问
查看AI文稿
AI文稿
阿里千问三点五小模型今天发布，手机端 ai 进入新时代，在 local ai app 的 app 内已经可以在本机手机内安装和体验。视频里是二 b 模型，在 iphone 十七 pro 上完全本地运行，它提供了四个尺寸，零点八 b，二 b，四 b，九 b，全部 ipad 二点零开元。最厉害的一个点是它原生多模态文字图片视频，一个模型搞定两百六十二 k，上下文两百零，一种语言，只要九 b 击败五 n a n o 和上一代困三到三十 b。最疯狂的是零点八 b 模型，能理解和处理视频。
63AI逐风
01:00
马斯克惊呼太强了！阿里Qwen开源四款小模型 Qwen3.5-0.8B、Qwen3.5-2B、Qwen3.5-4B、Qwen3.5-9B，引发外网热议，在iPhone17pro上都能实现飞速运行，回答速度堪比云端。#马斯克 #阿里巴巴 #Qwen #千问大模型
查看AI文稿
AI文稿
你没看错，现在你的手机也能本地飞速跑一个 ai 大模型了，回答速度堪比云端！就在昨晚，阿里开源了四个千万三点五小尺寸模型，直接把 ai 的门槛给踩碎了，连马斯克都坐不住了，空降评论区惊呼令人惊叹的智能密度！此次阿里发布的千万三点五九币，在七项评测中均拔得头筹，大幅领先了 pt 五 nano 和 google 的 jamming、二点五 flashlight 等模型。重要的是，不需要几万块的服务器，在你的普通电脑上就能跑。有网友实测，九 b 模型跑起来内存占用比 tom 浏览器还小，八 g 内存就能带飞。甚至有大神在 m 四芯片上跑出了每秒四十九点五个 token 的速度。也就是说，一个三百五十亿参数的模型，在本地实时对话几乎零延迟。有开发者算了一笔账，一台 mac mini 加上千万三点五成本，甚至不到初级员工一个月的工资，它能二十四小时帮你干活。而且它完全属于你，不需要联网，不需要买会员，不用担心隐私泄露，因为所有数据都在你自己硬盘里。正如网友所言，没人能夺走它。以前全世界都在争夺谁控制 ai，但从今天起，答案变成了你！
3482智东西
13:29
Qwen3.5 小模型实测：0.8B 到 35B-A3B 这期视频我实测了 Qwen3.5 中小模型在本地端的真实表现：
你会看到：
- 不同量化下的显存占用与推理速度差异
- 浏览器端 WebGPU 运行 0.8B 的体验
- 视觉识别/OCR 实测表现
- 9B 与 35B-A3B 在任务稳定性与效果上的差异
- LM Studio 关闭 thinking 的实操方法
- 在 OpenCode / Cline 中做工具调用与编码测试的结果
如果你也在找一套“能在本地跑、质量又够用”的模型组合，这期会很有参考价值。
时间戳
00:00 Qwen3.5 中小模型简介
00:50 格式与部署
02:21 显存与速度实测
03:40 视觉/OCR能力对比
05:33 本地实战案例
11:00 工具调用与编码测试
#Qwen35 #本地大模型 #Ollama #LMStudio #千问
查看AI文稿
AI文稿
大家好，我是叶哲，今天我将介绍一下千万三点五中小模型的使用体验。这些小模型非常受社区的欢迎，而且很多人都认为他们的能力很不错。从这张图上我们可以看到千万三点五九 b，它在多个基卷上居然是要超过千万三 s 的八零 b a 三 b c 型模型，这两个模型呢，规模相差是非常大的，虽然说一个是重密模型，一个是 m o e 模型，九臂呢，是主力模型，社区里用的会比较多。而且现在这些小模型它的工具调用能力也是有了一个极大的提升。四 b 的话也是有非常多的用户的喜欢，比如说你可以用它来和你的手机做一个连接，嗯，操作你的手机。那二 b 模型和零点八 b 模型呢，就可以在我们手机端运行，零点八 b 模型呢，甚至可以运行在浏览器上，非常方便。而且它是有多个的格式衍生，比如说 g g u f o n n x m m m 还有 m l x 社区里常用的技术站呢，奥拉玛拉玛 c p p 之前我有详细介绍过拉玛 c p p，嗯，它也有 webui，使用起来也是比较好用的。而用 g g u f 的话，社区里呢大多数会选择啊 onslaught 的方案，它的动态量化做得非常好。如果你是 mac 电脑的话，当然我们用 m l x 是比较好的。 tech news 的反馈呢，如果说你的系统提示词不够像样或者够长模型呢，就会进入很怪的 planning 或者长时间的自我检查模式。 parking face 社区呢，还分享了一个零点八 b webgl 版本，然后可以在我们浏览器上跑的，如果我开的话，我手上拿什么东西，或者说呃摄像头里面是什么场景下方它会立即识别出来。首次进入这个页面，它会下载八百多兆的模型，那这里呢，用的就是 o n n x 的格式，它是跨框架的计算图交换标准，主打可移植，可被多种运行时变易器加速。 g g o f 大家非常熟悉了， m n n 呢，它是阿里开源的端侧的推理引擎。 m l x，这个大家应该也是非常熟悉。 g g o f 呢，它是文件格式偏分发部署 o n n x，它是一个开放标准，这里有它们的核心的优势，对比大家可以简单了解一下。再来看一下各个模型不同的大小啊，不同的量化程度，它们的显存需求，推荐的硬件和速度，零点八 b，基本在任何的 g p u 啊手机上都可以跑起来。二 b 模型呢，如果是四比特量化的话，那需要的显存是一点五 g b，如果是四 b 四比特量化的模型，显存需求是三 g b，如果是九 b 四比特量化，那需要的显存是九 g b。二十七 b a 三 b 四比特大概是占用二十 gb 显存，在我的 mac 电脑上，我更倾向于使用三十五 b a 三 b 巴比特 m l x 格式的，那它的速度呢？大概是呃七十二 tik 每秒，同样也是巴比特，然后九 b 的模型，那呃速度的话，只能是五十多 k 啊每秒，这个速度的话就显著变慢了，如果是用了二十七 b 这个重密模型的话，那速度会更慢。而我在电脑上跑零点八 b 巴比特量化的时候，速度能达到两百 k 以上，这个速度是相当快的。再看一下各个模型啊，它的性能表现，零点八 b 的模型呢啊，它在数学 ocr 方面的话，得分也是非常高，可以适合一些简单的 ocr 任务。之前呃千万三 vl 的很多模型就将下方的 lvm 里面会漏掉一个字母，因为这一行的文字呢，它是比较小的。我在本地用巴比特量化的零点八 b 模型，让他去 o c r 的时候，发现它这里的质量是相当不错，我肉眼看了一下，是没有什么错误的。而三点五二 b 模型呢，它的得分呢，是超过很多上一代七 b 模型的，也是非常强。四 b 模型在 m m l u pro 得分呢，接近于千万三三十 b a 三 b 了。而在呃 omega dos 编制得分上，它是击败了 g b t 五 nano。再看一下九 b 模型，在长上下文基准上，它是打败上一代的千万三三十 b a 三 b 的。而在 m m m u pro 基准上，超过 g p t 五 nano。那社区的用户反馈呢，二比特和三比特量化质量又开始有明显下降，六比特呢，几乎没有可测量的性能损失。那千万的这几个模型，社区对他们有些评价，比如说啊，很多用户对二十七 b 还是非常青睐的，认为它的知识库很丰富，能力也很强。社区呢，给到三十五 b a 三 b 是三分。说到这里呢，非常推荐大家在使用千万三点五的时候呢，看一下 onslos 的它的一个使用指南，它在这里就详细介绍了啊， sync 模式下，那我们的各方面的参数怎么设置？现在就来看一下千万三点五中小模型在我本地进行的一些实际体验，那我在这里呢，用到的都是它们的 m l x 格式巴比特量化的模型，现在看到的是让 a 三 b 模型反推 ai 绘图提示词，在下方，我们看到它回复的内容还是非常多的，我把这里的提示词发给 nano blender pro。二、它帮我生成的图片呢，和我一开始发给的原图非常相像， a 三 b 帮我解读图片也是比较好。这张图呢，呃，我们可以看到各个模型，它并没有明确说这个模型。呃，它的 swbench pro 的得分是多少，那这里 a 三 b 它是自己估摸出来说啊，千万三 coldest 它的性能达到了约百分之四十四，这张图呢，是我从网络上获取的。再讲呢，千万二点五零点五 b 模型和现在的千万三点五零点八 b 在回答同一个问题的时候，已经有了非常大的进步。那我现在就让 a 三 b 模型来解读一下它。在这里呢，解读的非常好啊，每个模型的名称，包括每个具体的回答，然后还来了句幽默的话，说这张图呢，主要目的就是炫耀千万三点五相比千万二点五的进步，就模型呢，就是太听话了，你问什么他姓什么，甚至呢能编造事实。而篮筐呢，他更聪明，能识别出常识性的错误，不会一本正经的胡说八道。我在使用 a 三 b 的时候呢，有的时候它的思考过程会一直循环，那我们可以通过重建对话，或者在提示词里面加一句，让它不要过度思考来解决这个问题。在呃，这张图里呢，我们看到这是九 b 回答的，我呢是希望模型识别出这张图里的所有的配件，八五四是一个垫片，九臂模型呢，它说这里是连接圆盘和固定件，这里的说法的话还有待加强。之后我又让九臂模型帮我做一个音乐格式化合成器，这是它第一次生产的效果，点击自动演奏，点击的话是没什么反应的，当我点击粒子喷发，那效果的话也能出来，但是和我的琴键上是不是一一对应的，而且控制台是有一些报错的，所以呢，我需要他给到完整的啊。最后修改后的文件能听出来他正在弹奏小星星，但是我们可以感知到他发出来的声音和琴键的按键的啊，按下去是不对应的，所以这里还是有比较大的问题。再让九臂做一个赛博朋克的个人信息仪表盘，再看一下它身上的效果，在这里的话，它身上的这个页面就要比刚刚要好很多了。再接着呢，我将一张模糊的小票发给九臂模型，让它识别一下。这张图下方呢有四个字比较模糊，那九 b 呢，模型在这里没有识别出来，其他的文字内容的话，我看了一下，没有什么太大的问题，我再尝试了一下，这次呢，他将五音良品下方的文字都是展示出来了，这样的千活字减字盘 a 三 b 模型也能非常很好的识别出来，这是他的思考过程，内容非常非常多，真的就是一个一个字在识别，最终是能识别出大部分文字的。如果说你在连接 ml studio 让它识别图片的时候出现这样的问题的时候，那你可以考虑，一是将整个模型它的上下纹长度变小一点。第二呢，是限制一下啊，整个图片的一个尺寸，我一开始给它设置的是不超过四零九六，那经常会有内存溢出的情况，而改成二零四八之后就会好很多。这个画面里呢，我让他数一下有多少只火烈鸟模型呢？是，呃，思考了十一分钟，最终呢，一直都在重复，所以我就终止他任务了。我换成 a 三 b 呢，让他识别图片中有多少只火烈鸟。它这里的话啊，识别还是相当不错的。同样的，剪字盘发给 a 三 b，让它解读图片，并且 ocr 图片里的所有内容，它能很好地指出这是活字印刷的字模，必须是反字镜像。之前是只有一些比较大的模型，它能识别出来，那像 jammer 二点五， flash 这种，它是识别不出来的。所以现在啊， jammer 三点五，它的能力还真的是非常不错的。当我提示九 b 模型呢，让它数一数图片中有多少只火烈鸟，不要过度思考，那我们看到它思考了三分半钟，最终就给到非常好的回答。如果说，嗯，大家也遇到同样的他模型，一直在思考，那就可以将提示词改一下。我还让零点八 b 模型呢，反推 ai 绘图提示词，最终将这里生成的提示词呢啊，发给 ai。最后 ai 生成的图片和原图呢，是有一些区别。换成四 b 模型之后，将这样的提示词发给 ai 身上后的图片就和原图非常接近了。在这里呢，呃，用到了四 b 的思考模型。而在这里呢，大家可以看一下，这里是没有思考模式的，那这个是怎么设置呢？我们来到啊 l m studio 里面找到模型，然后右侧呢，我们可以点击一下这样的一个设置按钮，在推的这个界面有一个提示词模板，在这最上方呢，在这最上方添加一下这样的一个设置，它就会关掉思考了。最后呢，我也测试了一下 a 三 b 模型，它的工具调用能力，我是通过在 client 里面和 open code 里页计划模式让它来编码来测试的。我们现在看到的是一个理发应用，右侧有 three js 的元素。在我个人看来啊 s m b 它能达到这样的效果还是非常不错的，这是它生成的方便面自动化工厂，包含多个步骤。其实和我之前用一些比较大的模型啊生成的已经是很接近了，这是它生成的火星体数生物研究站的啊，一个场景，我们仔细看的话会有一个透明的球，它生成的这个透明的球的话，效果肯定是比不上 mini max m 二点五或者呢是 office 四点五。但我个人觉得对于啊，它在我本地运行这样的一个 a 三 b 巴比特的模型，质量也是很不错了。现在我们来看一下咱们在 opencode 里使用 lm studio 的模型。那首先呢，我们可以通过这行命令来确认一下 l m studio 当前暴露的真实模型 id。然后呢，可以啊，打开配置文件路径修改粘贴以下部分，再之后呢，就可以重启。以上呢，就是今天介绍的关于千问三点五中小模型的一些使用体验，我个人对它来说是非常喜欢的，因为它文本能力也强啊，原声支持二百五十六 k，而且它是多模态的，现在无论是 m、 l、 s 还是拉曼 c， p、 p 都是支持批量调用的，所以大家可如果有一些批量的啊，一些任务不复杂的，那完全可用它来在本地来做，因为它输出的质量是相当不错的。四 b 模型、九 b 模型和 a 三 b 模型都是非常非常推荐的。
685kate人不错
08:10
人人都能玩! Qwen3最强开源模型保姆级本地部署教程 #qwen3 #ollama #本地部署 #cherrystudio #AI模型
657AI 博士嗨嗨
01:24
阿里新AI：直接装落部手机度
阿里出新AI啦！阿里Qwen3.5細模型
直接装落部手机度，离线都用到
翻译,P图,私隐更安全
未来买手机，AI先系最重要嘅硬件！
#创作灵感 #跟着大光用Ai升级 #未来已来AI创意大比拼 #手机Ai #数码科普 @人民日报 @大光真的很正常
查看AI文稿
AI文稿
大家好，你们有没有看新闻，最近阿里出了一个新的 ai 模型，特别在哪里？它有十个尺寸，最小的是零点八 b，直到可以放在手机里的镜片。以前 ai 要上网，要等它 loading，因为它住在文端里嘛。这一次少量的小批的模型直接可以搬到你的手机里， offline 都是线下，也可以用快很多，还有比较私人一点，因为你不需要再上传去文端嘛。你想一下，将来你去买手机会做到什么呢？旅游，看到餐牌的字不懂，一扫描他都可以直接帮你翻译，不用开数据，万有 p 图，你想把后面的人弄出来，一间一个按一个键都已经 ok，不用再安装 app，不需要再上传去文端了。还有都是你跟 ai 说个什么，它源泉似的，因为它都是住在你手机里，所以我经常都对人说，现在买手机不要图它，手机有多少的内存呐，相机有拍的多好。你现在要看的是这部手机离线的 ai 能力有多强。你觉得 ai offline 有什么用？留言告诉我，关注我，用 ai 提升自己。
1香港魔翼|手机AI实战
10:00
Qwen2.5-VL视觉模型本地部署！ 10分钟学会Qwen2.5-VL本地部署运行，最强视觉AI模型，含可视化页面，离线可用！小白也能轻松部署！附部署文档
#大模型 #大模型即将改变世界 #AI #人工智能 #计算机技术
116大模型七七【教程👀简介】
00:08
9B 参数干翻 80B？
阿里开源四款Qwen3.5系列小模型
- 可在手机、笔记本、普通电脑上运行...
- 而且都是多模态，支持文字、图片、视频输入
- 百万 Agent 级别 RL 训练，Agent 任务能力显著提升
- 支持 201 种语言
- 支持 262K token 的超长上下文，可扩展到100万
下面是2B版本在手机上本地运行#玩个很新的东西 #每日ai
83澳門AI佬
00:10
#ios技能 #AI模型手机本地部署#千问3.5
21后浪的旅途
04:07
在手机端部署本地大模型qwen1.5b，全程未做加速处理。
13cooook
05:51
阿里开源四款Qwen3.5小模型，马斯克惊叹“智能密度”惊人阿里近日开源Qwen3.5系列四款小尺寸模型（0.8B/2B/4B/9B），这些模型专为端侧设备优化，可在笔记本电脑甚至手机上运行。马斯克在社交媒体评价其具备“令人惊叹的智能密度”，引发开发者社区热烈反响。
#Qwen35 #马斯克 #阿里 #AI小模型
性能突破：小模型实现大能力
Qwen3.5-9B在多项基准测试中表现卓越，在GPQA Diamond、MMMU-Pro等评测中超越GPT-5 nano、Gemini 2.5 Flash-Lite等大型模型。特别是9B版本在MMMU-Pro测试中以13分优势击败GPT-5-Nano，展现出色性能。4B版本在多语言知识、视觉推理等任务接近9B水平，成为轻量级智能体的理想选择。
端侧部署优势明显
0.8B/2B版本专为移动设备和IoT边缘设备设计，具备低延时特性；4B版本支持多模态任务，平衡性能与资源消耗；9B版本在受限显存环境下提供高性价比服务。实测显示，Qwen3.5-9B在AMD Ryzen AI平台配合量化算法，处理速度达30 token/s，仅需16GB显存即可运行。
开发者积极验证应用潜力
开发者验证模型可在Mac mini等设备配合OpenClaw实现全天候运行，成本低于初级员工月薪。有用户成功在iPhone部署，引发移动端应用热潮。虽然小模型在复杂数学推理方面存在局限，但其在特定任务上已达到商用级水平。
此次开源标志着端侧AI能力显著提升，为低成本AI部署开辟新路径。模型已在魔搭社区和Hugging Face开放下载，助力全球开发者探索边缘计算新场景。
37小萌芽科技
05:04
开源绝唱？如何在Comfyui部署qwen3.5
查看AI文稿
AI文稿
hello，小伙伴们大家好，那么昨天千问团队呢，那个可以说是个地震吧，这个事好多小伙伴也已经看到了，那么有可能啊，我们现在千问三点五呢，就是我们的版本绝唱了哈，那么 comui 呢？现在也有第三方的插件能够使用这个模型了，我们就看一下怎么去用这个模型啊。首先我们需要装一下这个节点，就是这个 comui 拉玛 c p p 啊这个，那么这个项目呢，在昨天的话已经更新了，支持了这个千万三点五，那么这个节点安装完以后呢，我们需要下载对应的模型哈，对应的模型大概我们看看这边哈，他现在提供的是 g g f 的版本的啊，因为是二十七 b 这个版本的，我这边试了两个模型啊，一个是他这个 q 六这个版本 u d q 六的版本啊，八个多 g 的那个。那么使用的时候呢，把这两个模型下载到我们 comui 的 models，然后呢有一个 l l m 的文件夹啊，放到这里，然后这里也要注意啊，我们需要下载这个 mm project 这个文件啊，对应的文件这边有两个，我这边可以推荐下载一个 b f 幺六的，如果你想从大一些的话，可以用这个 b f 幺六的啊，稍微小一点可以用个 f 幺六的啊，他们两个属于是这个适配的一个文件。那么这个项目的节点呢？其实核心节点我们看看啊，他就这个三个啊，就这三个这三个啊，这个是我们核心的预算节点，这个是模型加载节点，我们这个是他这个参数设置节点啊，我们看看这里边的模型加载的话，我们就是第一个选择我们这两个模型当中的一个啊， g g f 的可以用这个 q 六的也可以用 q 二的，那么 q 啊， q 八那个呢？我这边也跑不了啊，显轮占的更大啊，三十二 g 是跑不了我这边，那么这两个模型的显存占用呢？这个 q 六的大概要吃到这个二十七 g 啊，二十六七 g 左右的显存，那么这个 q 二的最小号的这个呢，它只需要十二 g 不到的显存就可以使用哈，然后在这边 improject 这个选项呢，选择对应的这个量化的一个参数哈，可以选择 bf 幺六和 f 幺六的，然后在这个下边这个 chat handle 这边啊，选择我们的前文三点五啊，你可以选择带 syncing，也可以选择不带 syncing 啊，接下来就是我们这边的下边这个参数设置节点啊，设置我们最大的 token 数这些，然后就是这个核心节点，核心节点的话，我们在这边呢有几个选项要注意啊，首先是我们的任务类型啊，任务类型的话我们可以选择他这边，看到没有，有几个第一个是空的啊，就是你全部看你自己写的内容啊，他去帮你生成。还有一个就是 normal description 啊，就是说作为文本生成的这个，还有就是说这个，呃，提示词生成啊，包括这么几个选项啊，还有这个电影选项的，还有这个创意类的哈，还有创意类的，我们可以选择这些啊，我这边就用了这个 cinematic，就是电影类这个创意类的，让他去写这个提示词啊，然后在第一个栏里边呢，就及时告诉他用中文描述啊，下边这个 system promote 啊，我就没有写。这里还有一个点要注意啊，就是这个模式选择，模式选择的话，我们看这边它有一个 one by one，它那个意思就是怎么讲呢？ one by one 的话就相当于图片是一个，每次只读取一张，那么还有第二个选项就是 image 啊， image 是什么呢？它就会读取整个这个里边加载的所有图片，即即便你加载是一个视频，它也只是读取图片哈，还有一个就是 video， video 的话就是会把你输入图片当成一个整段的视频去呃，去反推哈，那么就是这里的这样一个选择，下面还有个最大的一个针数啊，还有一个最大的尺寸，还有这个种子的选择啊，就在这里选择。我们这里呢有一个强制卸载，我建议大家把大家把这个打开啊，就是说如果你把它整个接入整个的一个工作流当中呢，你把这个打开以后，它会自动的把我们这个模型去卸载掉哈，在运转完以后它会自动卸载掉，那么我试了这个三个模式哈，啊，第一个模式就是我们这个 one by one 啊，只对单真图片进行一个提取，那图片反推呢？我们也试了一下啊，用了这个生化危机九的这个海报，我们反推了一下，整个的复现的效果还是很不错的，包括他的文字，包括整个这些细节的一个场景啊，然后呢还有一个就是怎么讲呢？是让他自己去写，我没有接触图片啊，直接没有接触图片，直接让他去写，呃，写一个武侠电影打斗场景的第二次，还有一个，那就是视频的一个加载啊，视频的一个反退。那我觉得这个反推的效果都不错啊，很精准很精准啊，而且运算速度也挺快，因为 g 六 i 的话，他只用了三十多秒啊，都是三十多秒到五十多秒之间，包括这个视频的反推也只用了三十多秒啊，当然这个也是目前我们可能在开元社区能用到的一个绝版啊，大家是且用且珍惜吧，那就是可以去试试这个版本啊。 ok，那就给大家分享到这里。
94Aiwood爱屋研究室
00:30
qwen 3.0下载教程 #qwen3模型下载方法 #Qwen3 #人工智能通义千问3下载教程
163小彭友🌈
00:19
豆包手机倒下，“千问手机”来了？？一位美国大兄弟，做了个“千问手机”！
他用 Qwen3.5-27B + NVIDIA DGX Spark 实现 Android 控制，运行速度特别快。
模型用 Qwen3.5-27B：多模态，支持视觉+长上下文。
硬件用 NVIDIA DGX Spark，就是桌面上的小型金属盒子，128GB 统一内存，能本地跑 200B 以内模型，推理特别快。
#数码大玩家 #AI
查看AI文稿
AI文稿
卧槽，千万手机来了。有个兄弟用千万三点五杠二七 b 模型结合英伟达 d g x spark 小敲算实现了本地操控安卓手机一个豆包手机倒下了，千千万万个千万手机起来了，厉不厉害？留下你的评论。
22daftAI
01:16
除夕！Qwen3.5来了！我们很高兴正式发布 Qwen3.5，并推出Qwen3.5系列的第一款模型—— Qwen3.5-397B-A17B 的开放权重版本，作为原生视觉-语言模型，在推理、编程、智能体能力与多模态理解等全方位基准评估中表现优异。
亮点速览：
✦ 基于混合结构，397B总参/17B激活，能力匹配>1T参数的Qwen3-Max；
✦ 原生多模态设计，同等规模下超越Qwen3-VL；
✦ 覆盖201种语言；
✦ 在代码生成、智能体推理与多模态理解方面表现卓越！
#Qwen #千问大模型 #大模型 #除夕 #新年快乐
2.3万通义实验室

热门推荐

热门分类