Qwen3.5-Omni 正式发布! 千问最新一代全模态模型 Qwen3.5-Omni 正式发布!支持文本,图片,音频,音视频理解,包含 Plus、Flash、Light三种尺寸的Instruct版本,灵活适配不同场景需求,更在离线智能与实时交互两大维度实现了突破。 💡 突出亮点:惊喜涌现的「氛围编程」 Qwen3.5-Omni-Plus 自发涌现出 Audio-Visual Vibe Coding 能力:只需对着镜头描述创意,即可转化为可运行的代码。 🧠 离线模式:硬核智力升级 • 精细化音视频Caption: 支持时间戳、场景切片及角色-音频映射,输出剧本级详细描述! • 业界领先性能: 在215项音视频/音频子任务与基准测试中全面领先!音频任务超越 Gemini-3.1 Pro,音视频理解能力与 Gemini-3.1 Pro对齐。 • 原生多模态:基于超1亿小时音视频数据训练,支持长达10小时音频输入,及超过 400 秒的 720P(1 FPS)音视频输入。 • 多语言支持:语音识别覆盖113种语言及方言,语音合成支持36种语言及方言。 🎙️在线模式:拟人实时交互 • 细粒度语音控制: 实时调节情绪、语速、音量。 • 个性化声音克隆: 上传语音样本,即可定制拥有克隆音色的专属AI助手。 • 语义级打断: 精准识别意图,有效过滤无意义的背景噪音干扰与附和回应。 • 联网增强: 内置 WebSearch 与复杂工具调用。 #通义实验室 #Qwen #多模态 #音视频 #大模型
00:00 / 06:14
连播
清屏
智能
倍速
点赞1371
圣诞节2周前
老用户上手千问G1:对比夸克G1,优缺点全坦白! 作为夸克G1的老用户,我实打实体验了一段时间千问G1,两款智能眼镜放在一起用,感受差别还挺明显的。今天不吹不黑,全是实测心得,把这款新品的优缺点一次性扒清楚。 先聊佩戴,这是千问G1最戳我的点。它的镜架明显更贴合我的脸型,戴上去舒适度拉满,一整天都不压鼻,整体观感也更协调好看。反观夸克G1,脸型适配度就稍逊一筹,单论佩戴颜值和贴合度,千问G1直接赢在第一印象。 再说说官方宣传的核心升级。当初冲着“大内存、后续更新取消摄像时长限制”入手,结果这个“饼”至今没兑现——摄像依旧是1080P分辨率,最长时长还是10分钟,属实有点让人失望,坐等官方赶紧落地优化吧。 不过长续航版本的体验确实加分。配套的换电仓完美解决续航焦虑,太实用了!整机皮质质感也很到位,摸上去精致高档,完全不输高端智能穿戴。更关键的是新增了Type-C直充,不用再专门带原装磁吸充电设备,出门便携性直接拉满,这个细节必须点赞。 但两款眼镜的共同老毛病还没改,就是断连bug。有时候摘下眼镜,设备还一直连着手机,没法自动断开,每次都得手动操作,体验感打了折扣,厂商能不能赶紧修修? 语音交互是另一大差异点。千问G1只有“你好,千问”“千问”“千问同学”三种唤醒词,我用夸克G1喊惯了“夸克同学”,上手初期总喊错,适应成本有点高。而且实测下来,它的语音唤醒灵敏度还不如老款夸克G1,安静环境偶尔都要喊两三次,复杂场景更拉胯。 最致命的硬伤,是收音和抗风噪。骑行时风噪超大,语音唤醒直接失灵,喊破喉咙都没用;日常通话时,对面根本听不清我的声音,收音模块确实还有很大优化空间,这也是智能眼镜普遍的短板。 最后聊聊影像。白天体验超棒,上下班骑行记录的画面清晰度拉满,镜头稳不晃不抖,日常记录完全够用,就是拍照别乱走动,不然容易糊成一团。夜间拍摄分情况:灯光充足时出片不错,色彩和清晰度都在线;但极暗环境下,拍照录像都糊到没细节,夜拍能力还得加油。 整体来看,千问G1虽有未兑现的升级、语音唤醒、风噪收音、极暗夜拍这些短板,但佩戴适配、质感、充电、续航这些升级都戳中日常痛点,而且性价比真的很高。作为亲民款智能眼镜,它很有潜力,真心盼厂商重视用户反馈,把这些问题一一优化!
00:00 / 03:22
连播
清屏
智能
倍速
点赞1