Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; ClaudeBot/1.0; +claudebot@anthropic.com)
精选
推荐
搜索
探索
直播
放映厅
短剧
小游戏
搜索
您是不是在找:
烽火挑战赛M7怎么改
gpt中转可以用skill
hermes opc怎么设置
gptimage2警察怎么制造
gpt详情页怎么拆解
codex cli怎么切换提供商
杨女士用的ai是什么
豆包深圳的代码在哪里运行
龙虾修改书稿用什么skill
obx吸附会影响电脑吗
科技区角
4天前
1200万超长上下文,AI黑马SubQ重磅发布 全新SubQ AI模型重磅发布,次平方架构打破算力瓶颈,1200万token超长上下文、98%稳定精度,速度提升52倍、成本暴跌95%,彻底革新长文本AI行业格局。 #大模型 #AI #超长上下文 #人工智能 #科技资讯
00:00 / 01:12
连播
清屏
智能
倍速
点赞
22
深思圈
4天前
SubQ发布!全球首个亚二次稀疏注意力大模型,1200万token超长上下文窗口,处理速度比FlashAttention快52倍,成本仅为Opus的5%。这意味着AI智能体可连续工作数周而不失精度,革命性改变了大模型的训练和推理方式。 #SubQ #大模型突破 #AI技术 #亚二次复杂度 #长上下文
00:00 / 01:24
连播
清屏
智能
倍速
点赞
17
杨大哥
4天前
SubQ 横空出世: 大模型计算量暴降 1000 倍,支持1200 万上下文的大模型来了 ,比 FlashAttention 快 52 倍。
00:00 / 00:46
连播
清屏
智能
倍速
点赞
1239
姜无维 AI
4天前
大模型1200万上下文窗口要来了? #AI #人工智能 #大模型 #vibecoding #ai新星计划
00:00 / 04:32
连播
清屏
智能
倍速
点赞
66
AI有点聊
4天前
美国版DeepSeek,颠覆Transformer架构 速度快52倍,成本不到5%,全球首个完全亚二次架构模型诞生!#SubQ #美国版DeepSeek #1200万长上下文 #Subquadratic #亚二次
00:00 / 00:47
连播
清屏
智能
倍速
点赞
3775
声译看世界
4天前
AI周报 1200万上下文模型开源 本周AI突破 1200万上下文LLM 最强开源图像生成器 无限制视频工具 Grok 4 3升级 以及AI女友等前沿进展汇总
00:00 / 24:34
连播
清屏
智能
倍速
点赞
15
Zoe的信号
4天前
黑科技让 OpenAI 估值归零?! 今天整个AI圈都在疯传一个消息: 一家叫Subquadratic的公司发布了新模型SubQ,声称用全新的稀疏注意力架构,打破了Transformer的二次方计算天花板。 几个数字你们感受一下:1200万token上下文,Claude Code才100万;比Claude Opus便宜95%,速度比FlashAttention快52倍。 1200万token是什么概念?大概120本书,整个公司代码库一次性塞进去。 如果这是真的,这不是靠堆算力堆出来的scaling,而是架构级突破。传统Transformer每多读一个字,计算量就是平方级增长,长上下文一直是硬天花板。SubQ的做法是让模型自己判断哪些token之间的关系真正重要,只算重要的部分,计算量变成线性增长。 但我先泼个冷水:目前这些数字全是公司自己说的。没有独立第三方验证,没有开放权重,连他们自己引用的竞品基准数据都对不上。 有人说这是Transformer以来最大突破,也有人说这是AI界的Theranos。Mamba、RWKV这些架构之前也都吹过类似的话,最后在前沿规模上都拉了。 我觉得吧,方向肯定是对的:注意力不应该需要二次方计算。但营销显然走在了证据前面。等技术报告出来再说。 #还有什么是不能ai的 #与AI同行 #SubQ #大模型 #AI架构
00:00 / 01:24
连播
清屏
智能
倍速
点赞
6
差评前沿部
2周前
源神启动?DeepSeek V4 终于来了! #DeepSeek #大模型 #AI #AI新星计划 #青年创作者成长计划
00:00 / 03:56
连播
清屏
智能
倍速
点赞
NaN
久韭究财
1周前
国产开源大模型下载量领跑全球 #开源大模型 #国产开源大模型 #涨知识
00:00 / 05:08
连播
清屏
智能
倍速
点赞
214
Ai风向标
1周前
硅谷巨头连夜开会!DeepSeek V4毫无征兆突袭 全球最大开源模型直接把AI白菜价!#DeepSeekV4 #开源大模型 #程序员失业 #AI人工智能
00:00 / 03:53
连播
清屏
智能
倍速
点赞
660
进化中的阿陈
1周前
小米掀翻桌子! MiMo V2.5 Pro发布,击败V4! 兄弟们,程序员圈子今天真的大地震了!谁能想到,这次把桌子掀翻的居然是小米!刚刚,小米悄悄开源了他们的最新怪兽级模型 MiMo V2.5 Pro,实测表现直接碾压了一众顶级闭源大厂! 我是抖音新人阿陈,关注我在我的粉丝群里免费领取我的AI工具箱 #AI#MIMO#Deepseekv4#大模型#人工智能
00:00 / 02:00
连播
清屏
智能
倍速
点赞
NaN
云顶智慧
3天前
#人工智能 #大模型 #AI #科技前哨
00:00 / 01:19
连播
清屏
智能
倍速
点赞
1
AI逻格斯
4天前
▎ 🔥 LLM 又有大事 ▎ ▎ 一家叫 Subquadratic 的新公司, ▎ 真的把 Transformer 的 O(n²) 改成了 O(n)。 ▎ ▎ · 12M tokens 上下文(=整仓 Python 标准库 + 6 个月 React PR) ▎ · 每秒 150 tokens,价格只要 1/5 ▎ · SWE-Bench 81.8 / RULER 95.0 ▎ · 一行装就能接进 Claude Code、Codex、Cursor ▎ ▎ 团队是 Meta、Google、牛津、剑桥、BYU 的研究员。 ▎ ▎ #大模型 #LLM #长上下文 #AIagent #SubQ
00:00 / 02:31
连播
清屏
智能
倍速
点赞
0
锋芒AI
4天前
350亿参数大模型压缩到11G Intel开源量化算法,让消费级显卡也能跑顶级大模型。追新不盲从,实测出真知。#AI #大模型 #开源 #量化 #AutoRound
00:00 / 01:25
连播
清屏
智能
倍速
点赞
122
姓王者
4天前
这个AI模型能一次读完120本书!SubQ的1200万tok SubQ横空出世!1200万token上下文、比FlashAttention快52倍、成本仅1/5,程序员狂喜?🚀 #SubQ #AI #人工智能 #大模型 #科技新闻
00:00 / 01:21
连播
清屏
智能
倍速
点赞
0
小鸣说AI
2周前
腾讯2950亿参数模型直接开源!直接叫板GPT-5 2950亿参数、激活参数仅210亿、支持25.6万上下文——腾讯今天开源的这个模型,直接在大模型军备竞赛里扔了颗核弹! #腾讯混元 #Hy3 #大模型开源 #AI竞争 #国产大模型
00:00 / 00:08
连播
清屏
智能
倍速
点赞
314
杨菠萝AIPineapple
2周前
万亿模型全开源!中国AI双雄,正在改写全球规则#DeepSeek#kimi #ai
00:00 / 02:36
连播
清屏
智能
倍速
点赞
57
白话Ai社
2天前
国产大模型已经进入"五强争霸"时代 #AI副业 #豆包 #通义千问 #DeepSeek #基模五强
00:00 / 01:28
连播
清屏
智能
倍速
点赞
45
小鸣说AI
4天前
欧洲突然逼Anthropic开源!神话模型必须开放 欧元区财长在布鲁塞尔会议上要求Anthropic开放Mythos AI访问权限,称该模型能发现各行业系统漏洞与后门,欧洲要借此建立防御体系,避免在AI安全领域落后美国。你觉得这种要求合理吗?评论区聊聊! #AI #Anthropic #大模型 #欧洲科技 #地缘摩擦
00:00 / 00:08
连播
清屏
智能
倍速
点赞
1302
内部看美国
2周前
DeepSeek V4!依然最强开源大模型 时隔484天,DeepSeek V4 Pro终于发布,它不仅将开源模型首次推向了万亿参数时代,更以100万token的上下文让AI从“聊天工具”进化为真正的“生产力工具”。这一次,V4深度适配华为昇腾芯片,推理性能达到英伟达H20的近三倍,价格却仅为GPT-5.5的几十分之一,让AI成为一种真正普惠的公共基础设施。面对“蒸馏”“盗版”等舆论抹黑,本期视频将结合长达58页的技术报告,为你还原一个真实的DeepSeek:它不是最完美的模型,但可能是最重要的模型,因为它代表了一条脱离西方芯片与闭源垄断的独立路线。AI的民主化,正在发生。#全球创作者计划 #零基础看懂全球 #DeepSeek #人工智能 #OpenAi
00:00 / 15:24
连播
清屏
智能
倍速
点赞
NaN
aigc测评员
2天前
魔法成真:重绘、移除、无限扩展! 后悔没早知道的“神仙改图工具”!#图片扩展 #AI扩图 #AI教程 #扩图 #重绘
00:00 / 07:15
连播
清屏
智能
倍速
点赞
6
api头目
3天前
特朗普家族下场卖AI API中转站!? 1. Anthropic拿下马斯克Colossus全部算力,Claude放开用 2. Subquadratic 发布 SubQ 模型,1200万上下文真假难辨 3. 特朗普家族下场卖AI API中转站! 4.Genspark推出SB-Git,为Agent打造的真正版本化知识库——一个Git仓库 5. Luma Uni-1.1 API开放 6.360上线新产品JJT,定位超级J的AI PPT #Claude #JJT #API #AI #算力
00:00 / 02:49
连播
清屏
智能
倍速
点赞
0
AI 启示录🇨🇳
5天前
谷歌免费送Gemma 4 谷歌把数亿美金烧出的头部级模型完全免费,性能却超过收费版的GPT-4。背后三层算计:云算力收割、生态绑定、开发者心智占领。看懂的人已经在行动。#Gemma4 #谷歌开源 #AI模型 #大模型 #科技前沿
00:00 / 09:08
连播
清屏
智能
倍速
点赞
2936
橙色溪流
2周前
开源大模型巅峰之作⛰️ Qwen3.6-27B惊世发布🔥 它不仅是一个 270 亿参数的稠密多模态模型,更标志着开源模型进入了“小尺寸,高性能”的新纪元 。 它以 27B 的参数规模,在所有核心编程基准测试中,全面超越了上一代拥有 397B 参数的开源旗舰 Qwen3.5-397B-A17B ,并全面追上甚至超越了Opus 4.5,证明了架构优化与训练深度的力量。 #科技下一站 #还有什么是不能ai的 #开源大模型 #与ai同行 #本地大模型
00:00 / 00:48
连播
清屏
智能
倍速
点赞
695
Qiuming
3天前
13人小团队挑战Transformer!SSA算力暴减千倍 13人小团队挑战Transformer!新架构SSA算力暴减千倍 核心摘要: 美国初创公司Subquadratic(仅13人)发布全新 SubQ模型,基于 SSA(亚二次方稀疏注意力)架构,宣称颠覆统治AI领域九年的Transformer架构。 关键突破: 效率暴增:在1200万token的超长上下文下,计算量减少近1000倍,速度比主流方案快52倍。 极致低价:处理100万token的成本不到Claude Opus的5%,在特定测试中仅花费8美元(对手需2600美元)。 性能持平:在多数学术基准测试(如RULER、SWE-Bench)中,SubQ的表现持平甚至略超Opus 4.6。 争议与质疑: 虽然AI圈惊叹其为“Transformer以来最大突破”,但也有专家公开质疑,认为其技术可能是基于现有模型(如Kimi)的微调,真实性有待独立验证。 结论: 若SubQ的技术为真,将彻底改写大模型的成本与规模规则;但目前社区态度两极分化,等待进一步开源验证。 https://x.com/alex_whedon/status/2051663268704636937?s=20 https://subq.ai/how-ssa-makes-long-context-practical https://x.com/daniel_mac8/status/2051710659822305661?s=20
00:00 / 02:23
连播
清屏
智能
倍速
点赞
1
Simon林
3天前
Claude Code x Qlib:量化研究 4.2万Star的AI 量化研究仓库分享 #claude #claudecode #ai新星计划
00:00 / 06:01
连播
清屏
智能
倍速
点赞
353
AI种草官
3天前
开发者狂喜!腾讯混元全新开源大模型,低价好用 开发者狂喜!腾讯混元全新开源大模型,低价好用 ##腾讯混元 #混元Hy3 #AI大模型 #开源大模型 #代码神器
00:00 / 00:47
连播
清屏
智能
倍速
点赞
4
Bin
2周前
等了5个月deepseek v4不负希望终于来了 就在今天deepseek v4更新了,带来了2个版本一个por足足16亿参数啊,另外一个是Flash模型,而且直接开源了,这一波也是直接好起来了,重新杀进开源第一模型的宝座了。#deepseek #国产ai #deepseekv4 #人工智能
00:00 / 02:09
连播
清屏
智能
倍速
点赞
6
智声工坊
2天前
0.1B、单卡可训、完整开源的多模态语音助手,MiniMind-O 把 Omni 模型拆成了图纸 MiniMind-O 最狠的不是替代 GPT-4o,而是单卡 3090 约 2 小时跑通 mini 链路,代码、权重、数据全开。想学 speech-native Omni,可以从这里下手。 #AI #Omni模型 #开源AI #MiniMindO #多模态 #语音模型 #大模型
00:00 / 04:14
连播
清屏
智能
倍速
点赞
212
小Yao财经
2天前
DeepSeek新模型,打破CUDA生态限制,英伟达慌了?#Deepseek#英伟达#零距离看懂财经
00:00 / 03:09
连播
清屏
智能
倍速
点赞
NaN
王不响
5月前
为什么国产AI集体“开源”?3张图告诉你! #DeepSeek #ChatGPT #大模型 #AI #Qwen
00:00 / 01:37
连播
清屏
智能
倍速
点赞
549
AI日日报
3天前
1200万token,SubQ真突破了吗 Subquadratic 发布 SubQ:1200 万 token 长上下文、2900 万美元种子轮、号称近 1000 倍注意力计算降幅。但关键问题是,这些数据还需要更多独立验证。你觉得这是突破,还是新一轮长上下文营销?评论区聊聊。 #SubQ #vibecoding #人工智能 #AI模型 #AI编程
00:00 / 00:48
连播
清屏
智能
倍速
点赞
2
锋芒AI
3天前
用笔记本一小时训练自己的大模型 不用买显卡不用租GPU,普通笔记本就能从零训练一个大语言模型!这个开源项目把 nanoGPT 精简到1000万参数,Mac/Windows/CPU都能跑,一小时搞定。#大模型 #AI #开源 #程序员 #Python
00:00 / 01:26
连播
清屏
智能
倍速
点赞
26
依然俊(在路上)
1周前
DeepSeek连续三天放大招,有人夸有人骂,我看着像极了小米SU7那时的节奏。 “不诱于誉,不恐于诽,率道而行,端然正己。”国产开源模型,这次我站它!#deepseek #国产大模型 #AI #开源 #科技平权
00:00 / 05:01
连播
清屏
智能
倍速
点赞
101
正商参阅
1周前
梁文锋又放了个王炸,DeepSeek V4打破最强闭源垄断 #梁文锋 还是太保守了,打破最强闭源垄断,#DeepSeekV4 刚开源,就迅速登顶了Hugging Face开源模型榜@抖音作者助手
00:00 / 02:32
连播
清屏
智能
倍速
点赞
549
科技星探局
3天前
颠覆翻译格局!,腾讯王炸开源! 腾讯开源 440MB ,离线翻译模型,手机本地运行、33种语言+5方言、完全不上云。
00:00 / 01:01
连播
清屏
智能
倍速
点赞
6
鲶鱼说点实在的
2天前
#抖音科技风向标 马斯克xAI宣布全量开源!万亿参数模型Grok-3核心代码公开,AI赛道一夜变天。 为什么说这是对AI巨头的“降维打击”?当底层模型不再是秘密,未来的财富增量究竟藏在哪里? 从算力囤积到应用落地,2026年AI下半场的底层逻辑已经变了。作为投资者,看清这波“技术普惠”背后的产业位移至关重要。#马斯克 #xAI开源 #AI底层逻辑 #真实生活分享计划
00:00 / 01:02
连播
清屏
智能
倍速
点赞
35
张易发ai创业
5天前
DeepSeek 赚不赚钱?根本不赚钱,但它在决定谁能赚钱#ai创作浪潮计划 #DeepSeekV4 #开源 #DeepSeek赚不赚钱 #张易发
00:00 / 02:03
连播
清屏
智能
倍速
点赞
110
第一财经
6月前
王坚:目前开源基础模型的能力已与闭源持平 中国做出了巨大贡献 千问大模型与DeepSeek能力远超Meta的Llama模型
00:00 / 00:36
连播
清屏
智能
倍速
点赞
3270
老金急转弯
2月前
别再吹开源了!为什么说开源大模型正在拖垮中国AI? 阿里千问核心灵魂离职背后:开源大模型到底是不是一条死路?| Qwen林俊旸离职真相与AI商业化深度拆解 就在全世界都在夸赞阿里通义千问(Qwen)模型性能、马斯克亲自点赞的时候,它的灵魂人物、阿里最年轻的P10技术高管林俊旸却突然宣布离职。这背后究竟发生了什么? 很多人认为开源大模型是中国AI弯道超车的利器,但它真的是一门好生意吗?本期视频我们将硬核拆解大模型赛道的残酷真相:为什么大模型不能照搬Linux的开源赚钱模式?中美AI大模型竞赛中,全面押注开源是否会让我们输掉这场关键的长跑? 如果你对人工智能发展、大模型商业化、以及科技巨头背后的博弈感兴趣,这期视频绝对不能错过!
00:00 / 13:47
连播
清屏
智能
倍速
点赞
952
雨哥冲冲冲
4天前
第105集|好多小伙伴问闲置老款笔记本也能轻松带起来的Aiskill他来啦!复旦大学开发的只要0,1B,零0️⃣GPU即可运行#开源 #github #tts #声音克隆
00:00 / 00:35
连播
清屏
智能
倍速
点赞
81
子婷引线计划
2月前
解读Qwen3.5-Plus:为什么说它的发布,会让中小企业迎来AI春天?#千问 #阿里 #开源 #Qwen3.5 #AI性价比时代
00:00 / 05:12
连播
清屏
智能
倍速
点赞
943
大白鹅
6天前
#英伟达 #芯片 #黄仁勋 #deepseek
00:00 / 00:50
连播
清屏
智能
倍速
点赞
1372
名字叫阿发
1周前
Deepseek重磅更新, AI行业重新洗牌#Deepseek #开源模型 #国产替代 #AI
00:00 / 02:20
连播
清屏
智能
倍速
点赞
13
万大叔来了
1周前
中国开源大模型,全球累计下载量突破100亿次! #国产开源大模型下载量破100亿次 #AI大模型 #人工智能 #开源大模型
00:00 / 01:45
连播
清屏
智能
倍速
点赞
65
财姐水晶
1周前
DeepSeek V4问世,到底颠覆了什么? #deepseekv4 #百万上下文 #开源大模型 #财经
00:00 / 06:24
连播
清屏
智能
倍速
点赞
2454
Ali厂长
4天前
为什么 V4 改写了 AI 定价规则 OpenAI 最贵的 GPT 5.5,一百万 Token 输出要$30。开源最强的 DeepSeek V4,现在仅¥6。 不是降价百分之九十,是三十五倍价差。 其次,V4 跑分没赢闭源,独立评测说它还落后顶级模型八个月。但定价规则已经被它改写了。 给我三分钟,我把 V4 这一次改了什么、为什么跑分输了反而能改写定价、以及对你用 AI 意味着什么,讲清楚。不堆术语。 #deepseek #AI模型 #大模型 #开源模型
00:00 / 03:29
连播
清屏
智能
倍速
点赞
160
亚当技术日记
2周前
HuggingFace开源了个AI实习生 能自己读论文训模型发上线 全自动ML工程Agent #AI #开源项目 #HuggingFace #机器学习 #AI实习生
00:00 / 00:45
连播
清屏
智能
倍速
点赞
67
陈序员
4天前
HuggingFace开源叠衣服,成功率凭什么碾压全网? 有没有发现,HuggingFace开源机器人叠衣服,成功率直接干到83%,普通 AI 却直接挂零,背后核心逻辑,今天一分钟给你讲透! 它靠的不是简单la算法,是一套SARM 阶段感知奖励建模和RA-BC 奖励对齐行为克隆双框架。 专门解决,长视野、柔性物体机器人操作难题。 以前方法拉胯,全栽在两个坑:演示数据噪音大、传统帧标注乱,根本没法精准判断 “叠到哪一步”。 而这套开源方案,直接换了思路: 先用自然语言拆分子任务,自动生成进度标签; SARM模型双分支并行,一边判任务阶段, 一边精细估执行进度,完美避开标注噪音。 再搭配 RA-BC奖励对齐, 优质轨迹重点学,劣质噪声直接降权。 真实机器人实测,平整T恤折叠 83% 成功率, 褶皱乱衣也能做到67%; 反观普通传统算法,只有8%甚至0%,完全没法用。 就靠这套框架,轻松拿捏机器人复杂操作! #ai新星计划 #青年创作者扶持计划 #搞机的陈序员
00:00 / 01:05
连播
清屏
智能
倍速
点赞
62
奇点视界InsightVision
2周前
本周AI大事件——DeepSeek V4终于来了 万众期待的Deepseek V4 终于来了,直接登顶开源模型第一,适配全国产昇腾和寒武纪芯片 。中国最强AI强势回归 正面硬碰全球最强大模型GPT5.5 #Deepseek #DeepseekV4 #AI
00:00 / 04:46
连播
清屏
智能
倍速
点赞
202
大鹏哥ⁱ
1周前
#真实生活分享计划 #DeepSeekV4 #小米MiMo #开源大模型 小米MiMo超越DeepSeek登顶开源大模型榜首了?是真超越还是营销噱头?
00:00 / 04:14
连播
清屏
智能
倍速
点赞
1861
小泽_
1周前
5月最新ComfyUI-v8中文版重磅更新!! 【666玩一下。自带311模型一键安装。 。#comfyui #stablediffusion #comfyui工作流 #aigc #ai视频
00:00 / 00:50
连播
清屏
智能
倍速
点赞
1235
AI设计师小晨
4天前
破解版AI工具来了!不排队,无需付费,你想要的都一键直出! #AI #AI绘画 #AI工具 #AI视频 #AI创作浪潮计划
00:00 / 03:20
连播
清屏
智能
倍速
点赞
131
观势财评
2周前
DeepSeek下一代模型蓄势待发:开源路线的“高性价比”还能打多久?#经济 #高性价比
00:00 / 01:30
连播
清屏
智能
倍速
点赞
2010
38073666201
1周前
重磅消息!DeepSeek V4 正式开源了! 这次V4更新诚意拉满,分为Pro和Flash两个版本。 超长100万上下文窗口,推理、智能体能力全面暴涨。 平民玩家也能免费上手顶级大模型,这次开源属实良心! 带你客观看懂 DeepSeek V4 真实开源现状。 #AI #DeepSeekV4 #DeepSeek #大模型开源 #人工智能
00:00 / 05:52
连播
清屏
智能
倍速
点赞
32
丫米
3天前
Paperidea:降aigc率模型被攻击到开源!!!#paperidea #论文查重#论文
00:00 / 00:15
连播
清屏
智能
倍速
点赞
3
赛博吴同学
2天前
Redis之父antirez开源DS4专用推理引擎,极致优化DeepSeek V4 Flash在Apple Silicon上的本地推理,极简架构、超高性能。 #赛博吴同学 #AI #DeepSeekV4 #梁文锋 #Redis
00:00 / 00:08
连播
清屏
智能
倍速
点赞
404
企业龙虾炼丹炉
1周前
DeepSeek V4正在证明国产大模型的实用价值 DeepSeek V4开源才五天,政务、地质、企业全用上了 #DeepSeekV4 #国产大模型 #算力
00:00 / 00:26
连播
清屏
智能
倍速
点赞
909
见道Seetao
1周前
国产开源大模型密集迭代升级,多款国产开源大模型近期完成迭代升级#最新消息 #最新发布 #国产开源大模型
00:00 / 01:53
连播
清屏
智能
倍速
点赞
0
Ai 学习的老章
1周前
Qwopus3.6-27B 本地部署,24G 显卡轻松跑 Qwen 加 Opus,缝合怪又来了,这次是 27B 本地版。大家好,我是AI学习的老章。今天聊一个有意思的开源模型,Qwopus3.6-27B-v1-preview,作者 Jackrong。光看名字你就懂了,Qwen 加 Opus,意思是拿 Claude Opus 的蒸馏数据,去调教 Qwen3.6-27B。底座是阿里的 Qwen3.6-27B 稠密模型,原生 262K 上下文,能扩到 1M。训练用的 Unsloth,数据是 Claude 蒸馏数据集打底,混入 GLM-5.1、Kimi-K2.5、Qwen3.5 的推理数据。最关键的一步在这,作者用一个 8B 模型当过滤器,把风格跑偏的样本剔掉,最后只留 12K 条调性统一的高质量数据。这思路特别反直觉,别人都是越多越好,他在做减法。我觉得这个项目最值得琢磨的就是这个点,吃什么长什么样,数据干净,比数据多重要得多。早期评测合作者用 16 条 prompt,单卡 5090 跑 GGUF 量化版,覆盖 Agentic 推理、前端设计、创意 Canvas 三类场景,对比的是 Qwen3.6-27B 原版。但说实话,16 条样本,作者自己都说是 early signal,谁也别当定论。GGUF 仓库已经放出来,量化档位很全,IQ4_XS 是 15.2 G,单张 24G 显卡就能跑,4090、5090、3090 都行。Q2_K 是 10.7 G,16G 显卡能塞但损失不小。直接用 llama.cpp 或者 Ollama 拉起来就行。我的看法是,值得关注,但别神化。它是 preview 版,作者自己都说在探路。但这个思路把 Claude 风格用工程手段迁移到可本地部署的 27B 模型上,加上 Apache-2.0 协议商用友好,给国产开源生态加了一个有 Claude 味儿的选择,这个角度挺难得。手上有 4090、5090 的玩家可以尝个鲜,正式版出来我再拉出来实测一波
00:00 / 02:13
连播
清屏
智能
倍速
点赞
190
简介:
您在查找“
subq模型开源了吗
”短视频信息吗?
帮您找到更多更精彩的短视频内容!
最新发布时间:2026-05-09 05:42
最新推荐:
江山如此多娇写的是哪里
魔兽表格插件哪里开会员
达美乐披萨为什么意式肉酱加不了薯角
重庆足球黑色衣服含义
操着一口方言是什么意思
手工高跟鞋怎么折高难度
道歉的五种语言
王者农场荞麦多久变大可以祝福
有价值的爱是爱吗
做床垫的三哥造梦里喜师傅主理人
相关推荐:
鸣朝如何获取绯雪的升级的花
颜颜恋综里有长发吗
还是老样子吗先生
抖鹏9277擂台赛王子浩
卢昱晓拒绝恰逢什么意思
强化印记流派紫色效果选择
风信子是一季植物吗?
乱涂彩世界怎么改102服务器
重庆狼队vs南通hero什么时候打
森林公园千年古树游览攻略
热门推荐:
为什么刷朋友圈一秒就没了
哪个口令才能换2600个券
爱探究绑定的学生怎么删除
tt怎么设置房间名
如何让豆包别再提供错误的信息
宁芙奖活动商城签名涂鸦怎么用
78x3d配5060ti
用醒图怎么给人物戴美瞳
codex如何跳回上一句话
tag怎么打出来excel