00:00 / 02:14
连播
清屏
智能
倍速
点赞9631
智谱首个面向视觉编程的多模态模型实测! 智谱出了个新模型 GLM-5V-Turbo,首个面向视觉编程的多模态 Coding 基座模型。我平时喜欢用 Claude Code 写前端、用龙虾跑自动化,这个定位正好对口,直接接进去跑了三个场景。 场景一:Claude Code + 截图写 H5 用 Excalidraw 画了个很粗糙的健身 APP 原型图,手绘线框那种。以前用纯文本模型得把这图翻译成几百字需求描述,现在直接截图丢给 Claude Code,一句话提示词,H5 页面就出来了。不光做了原型上有的,还自己补全了交互和设计细节。 场景二:龙虾 + PPT Skill 自己看自己改 龙虾里有个 vibe-slides Skill,能把口播脚本自动生成交互式 PPT 网页。以前接的是纯文本模型,生成了网页但它自己不知道长什么样,配色好不好看排版有没有问题全靠运气。换了 GLM-5V-Turbo 之后,龙虾自己截图看自己的产出,"配色太暗了""标题字号太小"——自己发现问题自己改,改完确认没问题再自动部署到 Vercel。从需求到上线不用你打开浏览器。 场景三:视频多模态分析 以前视频分析是视频提取音频、音频转文字、再丢给大模型,三步流水线每步都可能出错,而且画面里的 PPT 字幕场景切换全丢了。现在有了多模态视觉能力,视频直接丢进去,音画同时理解。以前让 AI 听,现在让 AI 看,省掉的不只是步骤,是信息的损失。 如果你也在用 CC 或龙虾,可以试试切到这个模型感受一下差距。 #GLM5VTurbo #GLM5V #智谱GLM5V #智谱多模态 #ai新星计划
00:00 / 05:13
连播
清屏
智能
倍速
点赞250