00:00 / 02:14
连播
清屏
智能
倍速
点赞9631
智谱GLM-5封神!20 万字文档拆解国产最强开源大模型🔥 #GLM5 #智谱AI #国产大模型 #AI大模型 #大模型技术 一、GLM-5 核心定位与性能 1. 智谱最新发布 GLM-5,7440 亿参数混合专家 MoE 模型 2. 底层:MoE + Slime 异步强化学习架构 3. 上下文窗口:200K,可输入整本书 / 完整代码仓库 4. 权威榜单:全球第 4,开源模型第 1 5. 编码能力:开源 SOTA,超越 Gemini 3 Pro,逼近 Claude Opus 4.5 6. 支持:多模态、超长文本、复杂工程、AI Agent 开发 二、文档与学习内容 1. 提供20 万字深度文档(Cursor 编写,11 章) 2. 提供10 万字技术文档(OpenCode + Minimax 生成) 3. 内容覆盖:行业格局、模型演进、架构原理、训练、部署、应用、未来趋势 三、GLM-5 技术架构与创新 (一)模型架构 1. Transformer + MoE 混合专家(256 个专家) 2. 借鉴 Deepseek 稀疏机制,自研优化 3. 稀疏注意力、多 Token 预测、旋转位置编码 (二)训练创新 1. Slime 异步强化学习,替代传统 RLHF,训练效率大幅提升 2. 训练数据、流程、分布式部署全面优化 3. 部署成本降低 50%,节省数千万美元训练资源 (三)核心能力 1. 长文本理解与超长上下文 2. 工程级代码生成(从辅助编码→完整项目) 3. 多模态融合(视觉编码器) 4. 动态路由、专家调度、事件总线 (四)源码与工程 1. 架构清晰,可复现、可学习 2. 展示了国产大模型在软件与算法层面的领先性 四、总结与行业意义 1. GLM-5 是国产大模型里程碑,打破外部限制 2. 核心竞争力:架构设计 + 工程化 + 训练效率 3. 未来方向:AGI、工程级自主编程、多模态复杂任务
00:00 / 03:27
连播
清屏
智能
倍速
点赞42
00:00 / 00:24
连播
清屏
智能
倍速
点赞33
00:00 / 01:58
连播
清屏
智能
倍速
点赞9742
00:00 / 02:16
连播
清屏
智能
倍速
点赞74
智谱首个面向视觉编程的多模态模型实测! 智谱出了个新模型 GLM-5V-Turbo,首个面向视觉编程的多模态 Coding 基座模型。我平时喜欢用 Claude Code 写前端、用龙虾跑自动化,这个定位正好对口,直接接进去跑了三个场景。 场景一:Claude Code + 截图写 H5 用 Excalidraw 画了个很粗糙的健身 APP 原型图,手绘线框那种。以前用纯文本模型得把这图翻译成几百字需求描述,现在直接截图丢给 Claude Code,一句话提示词,H5 页面就出来了。不光做了原型上有的,还自己补全了交互和设计细节。 场景二:龙虾 + PPT Skill 自己看自己改 龙虾里有个 vibe-slides Skill,能把口播脚本自动生成交互式 PPT 网页。以前接的是纯文本模型,生成了网页但它自己不知道长什么样,配色好不好看排版有没有问题全靠运气。换了 GLM-5V-Turbo 之后,龙虾自己截图看自己的产出,"配色太暗了""标题字号太小"——自己发现问题自己改,改完确认没问题再自动部署到 Vercel。从需求到上线不用你打开浏览器。 场景三:视频多模态分析 以前视频分析是视频提取音频、音频转文字、再丢给大模型,三步流水线每步都可能出错,而且画面里的 PPT 字幕场景切换全丢了。现在有了多模态视觉能力,视频直接丢进去,音画同时理解。以前让 AI 听,现在让 AI 看,省掉的不只是步骤,是信息的损失。 如果你也在用 CC 或龙虾,可以试试切到这个模型感受一下差距。 #GLM5VTurbo #GLM5V #智谱GLM5V #智谱多模态 #ai新星计划
00:00 / 05:13
连播
清屏
智能
倍速
点赞248
Karminski6天前
从国产SOTA走向世界SOTA? GLM-5.1 实测! 给大家带来 GLM-5.1 编程能力实测! 本次测试涵盖了前端, 后端, Agent 能力, 前端主要面向空间建模, 场景, 材质, 粒子效果等, 后端能力主要面向数据结构与算法, 体系结构, 性能优化, 内存和并发管理, 性能热点分析与调优, 面向编辑器方向的Agent能力(因为AI要自己改代码). 直接说结论, 本次测试前端方面粒子效果和光影鲜果略有提升, 剩下空间理解(甚至感觉下降了)和前端美学上没看到有什么提升, 只能说是提升了一点点. 但是后端性能上有巨大的提升, GLM-5.1 在我的 vector-db-bench 中直接秀了一手量化, 把原本32bit精度的数据量化到了8bit, 然后使用SIMD实现了一个指令周期内计算32个向量, 在我测试的其他模型中(包括Claude-opus-4.6, GPT-5.4-Pro(xhigh)) 都没有实现, 直接来到了榜首. 另外Agent能力上也有不小的提升, 同样是我写的让大模型模拟送外卖的硅基骑手测试, 其他大模型的优化还停留在看一个店能不能取两单上, GLM-5.1 已经优化到了我送餐的顺路还能再接一单, 并且仅用了大概GLM-5 1/4的 token 用量就超越了 GLM-5 的测试总分. 当然本次测试过程也很坎坷, 首先是我周末抢了2天都没抢到 coding plan (目前只有coding plan 能用这个模型), 我最后找智谱的同学给我开了个权限. 以及测试中发现白天API不是很稳定, 偶尔输出速度会掉到10tps, 以及会出现乱码文字(我的规避方法是让它输出英文, 然后再找个便宜模型翻译过来). 总结, 各位前端同学估计会失望, 因为无论是从工程还是页面效果上都看不到提升, 甚至可能会有点倒退, 但果写后端代码或者复杂Agent应用可以试试这个新模型, 会有很大的提升. #GLM51 #智谱 #GLM #AIAgent #大模型编程
00:00 / 08:00
连播
清屏
智能
倍速
点赞239
AI编程进入“视觉原生”时代,软件开发的生产力拐点真的到了吗? 4月2日,智谱发布了一款名为GLM-5V-Turbo的多模态Coding基座模型。最大的亮点是什么?它不再是纯文本的编程助手,而是真正“看懂”画面的AI程序员——给它一张设计稿截图,它能直接生成完整可运行的前端代码;给它一个网页链接,它能复刻整个站点的前端结构和交互逻辑。 这意味着什么呢? 编程这件事,以前的核心壁垒是“语法”和“逻辑”,模型需要开发者把视觉需求翻译成文字指令。现在GLM-5V-Turbo直接把感知链路从枯燥的字符延伸到设计稿、网页截图和K线图表中,实现了“所见即所得”的编程体验。 大家想一想,这个逻辑其实很简单。当模型拥有了真正的视觉能力,它在AutoClaw这类Agent场景里就能看懂屏幕信息——比如在PinchBench、ClawEval这些评测基准上,它的表现都相当突出,说明复杂任务执行能力已经通过了严格验证。 对行业的影响是什么? 首当其冲的是软件开发效率的革命。传统的前端开发,从UI设计稿到代码实现,往往需要设计师和工程师反复沟通。GLM-5V-Turbo能把设计稿“秒变”成可运行代码,这意味着产品经理和设计师自己就能快速做出Demo原型,再拿给开发讨论,沟通成本大幅压缩。这种能力跃升,正在重塑整个软件开发生命周期的效率逻辑。 那么产业链的投资机会在哪里? 沿着技术传导路径梳理,最直接的受益方向有三个—— 第一层,AI编程工具本身就是最大受益者。 全球AI编程工具市场正快速增长,从2025年的76.5亿美元增长至2026年的94.6亿美元,年复合增长率达到23.7%。多模态视觉能力的加入,让这个赛道从“代码补全助手”真正进化为“全栈AI工程师”,价值空间被重新定义。 第二层,上游算力基础设施。 多模态模型的普及意味着Token消耗激增,推理需求爆发。浙商证券在2026年3月发布的策略报告中明确指出:大模型参数规模扩容、多模态应用普及、Agentic AI交互频次提升,正在导致算力需求指数级增长。像海光信息、浪潮信息、神州数码这些算力基础设施厂商。 第三层,下游多模态应用场景。 天风证券在2026年1月的报告中指出,AI视频、机器人、自动驾驶将是多模态技术落地的核心方向。 #智谱 #GLM-5V-Turbo #海光信息 #科大讯飞 #昆仑万维
00:00 / 03:04
连播
清屏
智能
倍速
点赞55
2月12号凌晨,智谱扔下了一颗重磅消息——GLM-5正式上线并且完全开源。但比这个官宣更精彩的,是它背后的故事。 就在几天前,全球开发者社区被一个神秘模型"Pony Alpha"搅得沸沸扬扬。这个在OpenRouter平台上线的匿名模型,没有任何品牌背书,却凭借强悍的编码能力和超长上下文窗口,连续多日霸榜热度第一。直到智谱官方确认,大家才恍然大悟:原来这匹"黑马",就是GLM-5的匿名测试版本。 这种"先上车后补票"的玩法,在AI圈极其罕见。通常大厂发布新模型都是锣鼓喧天、发布会加PPT,但智谱选择让产品自己说话。当一个模型在没有Logo、没有营销的情况下,被全球开发者当作真实生产工具使用,这本身就说明了能力层级的质变。 那么GLM-5到底强在哪?智谱给它定的调很清晰:这不是一个聊天机器人,而是一个"Agentic Engineering"基座模型。什么意思呢?过去两年,大模型的主流叙事是"写代码""写前端",这叫Vibe Coding,氛围编程,追求的是代码片段的流畅生成。但现在行业共识正在转向:模型需要完成完整工程与复杂任务,从写几行代码进化到端到端交付整个系统。 举个例子你就明白了。以前的AI编程像是请了个文笔不错的实习生,能帮你写个漂亮的HTML页面;但GLM-5更像是一个系统架构师,它懂Linux内核,懂500个微服务之间的调用关系,懂如何在不炸掉线上的前提下重构代码,还能自己规划任务、自己修Bug。在SWE-bench-Verified和Terminal Bench 2.0这两个权威编程基准测试中,GLM-5拿下了开源模型的最高分,真实使用体验已经逼近行业天花板Claude Opus 4.5。 更值得关注的是它的"长程记忆"能力。智谱构建了一个叫"Slime"的异步强化学习框架,让模型能在长程交互中持续学习,不再是聊几句就忘。在一个模拟经营测试中,GLM-5被要求经营一年的自动售货机业务,最终账户余额达到4432美元,这个成绩接近Claude Opus 4.5的水平。这意味着什么?意味着AI开始具备长期规划能力和资源管理能力,能在复杂任务中保持目标一致性。 #智谱 #GLM5 #AI编程 #大模型涨价 #AI应用
00:00 / 03:16
连播
清屏
智能
倍速
点赞313
00:00 / 00:24
连播
清屏
智能
倍速
点赞1853
00:00 / 01:24
连播
清屏
智能
倍速
点赞4
00:00 / 11:39
连播
清屏
智能
倍速
点赞2
00:00 / 00:42
连播
清屏
智能
倍速
点赞611
00:00 / 01:52
连播
清屏
智能
倍速
点赞29
00:00 / 01:42
连播
清屏
智能
倍速
点赞38