Claude Opus蒸馏Qwen3.5 V3来了 9B的蒸馏模型,工具调用测试居然打了满分。大家好,我是AI学习的老章。Claude Opus蒸馏Qwen3.5这条线,我从v1追到现在。今天v3来了,这次改动大到连名字都换了,叫Qwopus3.5,Qwen加Opus的合体。v1是让小模型学会推理,v2是让它想得更少答得更快,v3的核心是让它学会用工具干活。从会思考,到会行动,这是一个质变。先看数据。9B的GGUF版本下载量10.9k,断崖式领先。说明什么?大家心里清楚,9B就是甜蜜点。16GB的MacBook就能跑,Windows上普通显卡也没压力。再看跑分。HumanEval,v3拿了87.8%,比原版Qwen3.5的9B高了将近5个百分点。v2在9B上其实没啥提升,v3一下子拉开了差距。MMLU-Pro,通用知识能力,v2掉了7.2%,当时我说这是代价。v3把这个问题修了,反超原版1.43个百分点。代码更准,知识也没丢,这在蒸馏模型里非常少见。效率方面,思维链缩短25%,推理效率提升31.7%,用更少的Token办更多的事。最让我兴奋的是工具调用。v3专门做了针对工具调用的强化学习训练。我用ToolCall-15跑了一遍,15道题全部通过,满分。之前v2的27B才做到这个成绩,现在9B就行了。我的判断,这是这个系列真正成熟的一代。想本地跑一个能写代码、能调工具、还不吃资源的模型,Qwopus3.5-9B-v3目前最值得试。关注老章,我们下期见。
00:00 / 01:53
连播
清屏
智能
倍速
点赞500
00:00 / 03:32
连播
清屏
智能
倍速
点赞457