00:00 / 02:36
连播
清屏
智能
倍速
点赞22
00:00 / 06:20
连播
清屏
智能
倍速
点赞9
GLM 4.6V开源全能王,多模态一夜变天! @王兴波(Ra·Zero) 智谱 AI 发布的 GLM 4.6V,以开源多模态 “全能选手” 身份颠覆 AI 圈格局,彻底打破 “多模态闭源贵、开源半成品” 的困境。它是首个将图像、视频帧、网页截图直接纳入工具调用流程的开源模型,无需先转换为文字描述,相当于给 AI 装上 “会干活的眼睛”,普通人可下载本地运行,开发者能二次开发,大幅盘活智能体应用场景。 其核心优势显著:一是超大上下文窗口,12.8 万 token 可一次性处理 150 页文档、200 页 PPT 或 1 小时视频,视频帧带 “时间戳标签”,精准定位特定内容;二是双版本适配,1060 亿参数云端版与 90 亿参数免费 Flash 轻量版(本地电脑可跑)均采用 MIT 许可,企业部署无代码公开与天价授权费压力,定价仅为输入每百万 token 0.3 美元、输出 0.9 美元,性价比远超 GPT 5.1、Claude Opus 等竞品;三是工具调用革新,通过 URL 定位视觉内容,截图、PDF 图表可直接作为工具参数,接收视觉结果后连贯推理,补上多模态智能体 “最后一块拼图”。 场景能力同样亮眼:能处理 “图文混搭” 内容(如带图表论文总结)、实现网页 “边搜边思考” 的结构化分析(如手机对比)、像素级复刻 APP 界面代码(含 HTML/CSS/JS,支持可视化修改确认),还可处理 200:1 超宽全景图。测试中 Math Vista 获 88.2 分、Web Voyager 得 81 分,超越 GLM 4.5V、Qwen 3 VL 等,Flash 轻量版也碾压同类模型。目前用户可从 Hugging Face 下载权重,通过 OpenAI 接口调用或试用桌面助手,小白也能低门槛上手,为 AI 圈设立多模态开源新 “内卷标准”。#人工智能产业链联盟 #人工智能 #智谱 #智能体
00:00 / 07:17
连播
清屏
智能
倍速
点赞41
00:00 / 01:00
连播
清屏
智能
倍速
点赞85
00:00 / 01:17
连播
清屏
智能
倍速
点赞72
00:00 / 00:58
连播
清屏
智能
倍速
点赞37
00:00 / 01:30
连播
清屏
智能
倍速
点赞6