12
2
5
分享
举报
发布时间:2026-02-21 08:13
查看AI文稿
唐国梁Tommy
唐国梁Tommy

粉丝2333获赞5351

相关视频

  • Qwen3.5 实测:会写代码,能读视频 原生多模态到底强在哪?
#AI #Qwen #千问大模型 #人工智能 #开源
    06:07
    查看AI文稿
  • 深度实测Qwen3.5,原生多模态表现如何 #AI新星计划 #qwen #千问大模型 #IT咖啡馆 #大模型
    07:52
    查看AI文稿
  • 实测Qwen3.5-Plus对比deepseek代码glm5 Qwen3.5-Plus概览对比deepseek测试glm5代码测试基本介绍开源模型api调用基本架构分析qwen3.5-397b-a17b#Qwen35 #deepseek #ai #大模型 #qwen35397ba17b 知识图谱
    09:14
    查看AI文稿
  • AI贺岁,Qwen3.5刚刚发布,性能霸榜消耗减半 #AI贺岁 #大模型 #人工智能 #qwen35
    00:27
    查看AI文稿
  • Qwen3.5-Plus发布:性能超GPT5.2 深度解析Qwen3.5-Plus技术架构,看它如何以极低成本实现全球领先的逻辑推理与多模态能力。#Qwen35Plus #LLM #人工智能 #大模型 #GPT52
    04:22
    查看AI文稿
  • Qwen 3.5开源!硬刚 GPT-5.2和 Gemin? #Qwen 
 #千问 
 #AI评测 
#ChatGPT 
#Gemini
    03:45
    查看AI文稿
  • 国产AI逆袭!阿里云QWen3.5发布 国产AI逆袭!阿里云QWen3.5发布,128K上下文碾压GPT-4!#QWen3.5 #国产AI #开源大模型 #多模态AI #阿里云
    02:26
    查看AI文稿
  • qwen3.5PLUS 测试 2 使用标准 #aigc #ai #qwen #openclaw #clawdbot
    03:41
    查看AI文稿
  • Qwen3.5实测!来看贺岁档大模型的实力! 贺岁档大模型来啦! Qwen3.5 这次支持了文本、图片、视频多模态输入, 本次准备了全新的后端能力测试! 以及照例带来前端能力、Agent、长上下文能力的全面测试! 
来看本次新增的后端编程测试 vector DB Bench: 要求大模型从零实现一个高性能向量数据库, 只给提示词不给实现方案, 配合 coding agent 自动写代码、编译、跑分. 结果 Qwen3.5 直接甩出王炸 —— QPS 1405, 是 Kimi-K2.5 的 4.8 倍, GLM-5 的 25 倍! 关键在于它不仅用了 IVF 倒排索引 + AVX512F 指令集, 还在有限轮次内自主探索出了最优聚类参数 (K=2048, nprobe=30), 每次查询只需扫描约 15000 条数据, 而 Kimi-K2.5 的参数配比要扫描 75000 条, 正好解释了近 5 倍的性能差距. 这波调参堪称神之一手. 
前端编程也有进步: 大象牙膏测试终于能正确建模三角烧瓶, 鞭炮连锁爆炸的粒子光影效果不错, 支持多模态后甚至可以对着网站录屏直接克隆. 但空间理解仍是短板, 陀飞轮机芯测试中齿轮设计暴露了差距. 
指令遵循: 洛希极限测试中的指令遵循达到 85.9% (Gemini-3.0-Pro 为 90.6%), 主要扣分在未遵循加速曲线公式. Agent 能力: 硅基骑手测试得分 668.43, 仅次于 GLM-5 的 738.69, 也侧面解释了为什么后端编程 Agent 表现这么强. 
长文本召回: 256K 上下文召回 99.1%, 但不给原文时四选一蒙对率高达 75.6%, 结果完全不置信. 
总结: Qwen3.5 最亮眼的是后端编程能力, 同样的 IVF 算法靠调参拉开 5 倍差距, Agent 能力同样在线. 不过本次测试还发现了点小问题, 输出偶尔不太稳定, 会漏掉 markdown 语法或把答案输出到 thinking 标签里, 这点要注意, 目前我已经反馈给官方了.  
这份新年礼物, 大家觉得怎么样? 
#Qwen  #千问大模型  #Qwen35  #阿里千问  #通义实验室
    07:01
    Qwen3.5实测!来看贺岁档大模型的实力! 贺岁档大模型来啦! Qwen3.5 这次支持了文本、图片、视频多模态输入, 本次准备了全新的后端能力测试! 以及照例带来前端能力、Agent、长上下文能力的全面测试!
    来看本次新增的后端编程测试 vector DB Bench: 要求大模型从零实现一个高性能向量数据库, 只给提示词不给实现方案, 配合 coding agent 自动写代码、编译、跑分. 结果 Qwen3.5 直接甩出王炸 —— QPS 1405, 是 Kimi-K2.5 的 4.8 倍, GLM-5 的 25 倍! 关键在于它不仅用了 IVF 倒排索引 + AVX512F 指令集, 还在有限轮次内自主探索出了最优聚类参数 (K=2048, nprobe=30), 每次查询只需扫描约 15000 条数据, 而 Kimi-K2.5 的参数配比要扫描 75000 条, 正好解释了近 5 倍的性能差距. 这波调参堪称神之一手.
    前端编程也有进步: 大象牙膏测试终于能正确建模三角烧瓶, 鞭炮连锁爆炸的粒子光影效果不错, 支持多模态后甚至可以对着网站录屏直接克隆. 但空间理解仍是短板, 陀飞轮机芯测试中齿轮设计暴露了差距.
    指令遵循: 洛希极限测试中的指令遵循达到 85.9% (Gemini-3.0-Pro 为 90.6%), 主要扣分在未遵循加速曲线公式. Agent 能力: 硅基骑手测试得分 668.43, 仅次于 GLM-5 的 738.69, 也侧面解释了为什么后端编程 Agent 表现这么强.
    长文本召回: 256K 上下文召回 99.1%, 但不给原文时四选一蒙对率高达 75.6%, 结果完全不置信.
    总结: Qwen3.5 最亮眼的是后端编程能力, 同样的 IVF 算法靠调参拉开 5 倍差距, Agent 能力同样在线. 不过本次测试还发现了点小问题, 输出偶尔不太稳定, 会漏掉 markdown 语法或把答案输出到 thinking 标签里, 这点要注意, 目前我已经反馈给官方了.
    这份新年礼物, 大家觉得怎么样?
    #Qwen #千问大模型 #Qwen35 #阿里千问 #通义实验室
  • 测完Qwen3.5,我哭了,期待了好久的场景终于实现了 #ai新星计划 #抖音年味新知贺岁  #qwen35 #qwen3 #AI教育
    06:15
    查看AI文稿
  • OpenClaw保姆级教程:带你免费调用Qwen3.5! 龙虾免费调用最Q开源大模型Qwen3.5详细教程#openclaw #qwen #随变ai随便玩
    05:48
    查看AI文稿
  • 营销号都说qwen3.5强到没边,我来实测一下 针对同一个开发需求,分别让 qwen3.5 / gpt-5.3 / minimax 2.5 / claude opus 4.6 分别开发,最终发现qwen3.5还是差点意思。
另外,视频采用remotion编辑,第一次尝试代码定义视频。#gpt53 #remotion #qwen #火山引擎
    03:38
    查看AI文稿
  • 春节档真正的杀手锏来了! Qwen3.5-Plus版本总参数为3970亿,激活仅170亿,以小胜大,价格仅为GPT的十五分之一,学生党也用得起#阿里 #Qwen #大模型 #AI
    01:51
    查看AI文稿
  • 做外贸太累?试试千问 Qwen3.5 Plus #千问 #千问大模型 #阿里巴巴国际站 
#国际站 #国际站运营技巧
    03:16
    查看AI文稿