00:00 / 03:22
连播
清屏
智能
倍速
点赞18
00:00 / 05:28
连播
清屏
智能
倍速
点赞61
00:00 / 01:45
连播
清屏
智能
倍速
点赞517
00:00 / 00:50
连播
清屏
智能
倍速
点赞20
Qwen3.5-Omni 正式发布! 千问最新一代全模态模型 Qwen3.5-Omni 正式发布!支持文本,图片,音频,音视频理解,包含 Plus、Flash、Light三种尺寸的Instruct版本,灵活适配不同场景需求,更在离线智能与实时交互两大维度实现了突破。 💡 突出亮点:惊喜涌现的「氛围编程」 Qwen3.5-Omni-Plus 自发涌现出 Audio-Visual Vibe Coding 能力:只需对着镜头描述创意,即可转化为可运行的代码。 🧠 离线模式:硬核智力升级 • 精细化音视频Caption: 支持时间戳、场景切片及角色-音频映射,输出剧本级详细描述! • 业界领先性能: 在215项音视频/音频子任务与基准测试中全面领先!音频任务超越 Gemini-3.1 Pro,音视频理解能力与 Gemini-3.1 Pro对齐。 • 原生多模态:基于超1亿小时音视频数据训练,支持长达10小时音频输入,及超过 400 秒的 720P(1 FPS)音视频输入。 • 多语言支持:语音识别覆盖113种语言及方言,语音合成支持36种语言及方言。 🎙️在线模式:拟人实时交互 • 细粒度语音控制: 实时调节情绪、语速、音量。 • 个性化声音克隆: 上传语音样本,即可定制拥有克隆音色的专属AI助手。 • 语义级打断: 精准识别意图,有效过滤无意义的背景噪音干扰与附和回应。 • 联网增强: 内置 WebSearch 与复杂工具调用。 #通义实验室 #Qwen #多模态 #音视频 #大模型
00:00 / 06:14
连播
清屏
智能
倍速
点赞1372
00:00 / 00:42
连播
清屏
智能
倍速
点赞0
00:00 / 00:44
连播
清屏
智能
倍速
点赞0
00:00 / 00:43
连播
清屏
智能
倍速
点赞0
00:00 / 01:06
连播
清屏
智能
倍速
点赞45
00:00 / 00:33
连播
清屏
智能
倍速
点赞85
实测翻车!千问3.5写个小游戏烧了我1000万Token! #大模型实测 #千问35 #避坑指南 #AI写代码 #Token刺客 一、实测背景:用千问3.5开发3D小游戏 1. 测试目的:通过TRAE平台,使用千问3.5生成一个3D滑雪小游戏,测试其代码生成能力和实际效果。 2. 生成结果:经过多次对话优化,最终生成了一个滑雪场小游戏,支持方向转动,但存在bug(如滑出屏幕外)。 二、严重问题:Token消耗惊人 1. Token消耗:整个开发过程调用138次,消耗超1000万Token。 2. 换算理解:100万Token约等于一本书,1000万Token相当于10本书的量。 3. 成本计算:按千问3.5定价0.8元/百万Token,消耗约8-10元。虽然单价低,但消耗量巨大,若换成高价模型则成本爆炸。 三、对比测试:谷歌Gemini 3表现 1. 同样提示词:使用谷歌平台生成同款滑雪小游戏。 2. 对比结果: - 运动逻辑:谷歌Gemini 3更还原滑雪场景,运动逻辑更真实。 - 画面表现:两者差距不大,但谷歌画面稍好。 - 成本优势:谷歌平台免费生成在线APP,无Token消耗压力。 四、模型排名:千问3.5实际表现 1. 查询平台:主流大模型竞技场排名(人工反馈评估)。 2. 排名数据: - 千问3.5(3397B):排名第20,超越GPT-4.5,但与头部差距明显。 - 亮点模型:豆包Seed模型排名第4,GLM-5排名第12。 - 榜首:Claude Opus 4.6。 结论:千问3.5声势虽大,但实测效果和排名均未达顶尖,与闭源模型仍有差距。
00:00 / 02:39
连播
清屏
智能
倍速
点赞19
00:00 / 02:03
连播
清屏
智能
倍速
点赞12