00:00 / 02:16
连播
清屏
智能
倍速
点赞74
Karminski6天前
从国产SOTA走向世界SOTA? GLM-5.1 实测! 给大家带来 GLM-5.1 编程能力实测! 本次测试涵盖了前端, 后端, Agent 能力, 前端主要面向空间建模, 场景, 材质, 粒子效果等, 后端能力主要面向数据结构与算法, 体系结构, 性能优化, 内存和并发管理, 性能热点分析与调优, 面向编辑器方向的Agent能力(因为AI要自己改代码). 直接说结论, 本次测试前端方面粒子效果和光影鲜果略有提升, 剩下空间理解(甚至感觉下降了)和前端美学上没看到有什么提升, 只能说是提升了一点点. 但是后端性能上有巨大的提升, GLM-5.1 在我的 vector-db-bench 中直接秀了一手量化, 把原本32bit精度的数据量化到了8bit, 然后使用SIMD实现了一个指令周期内计算32个向量, 在我测试的其他模型中(包括Claude-opus-4.6, GPT-5.4-Pro(xhigh)) 都没有实现, 直接来到了榜首. 另外Agent能力上也有不小的提升, 同样是我写的让大模型模拟送外卖的硅基骑手测试, 其他大模型的优化还停留在看一个店能不能取两单上, GLM-5.1 已经优化到了我送餐的顺路还能再接一单, 并且仅用了大概GLM-5 1/4的 token 用量就超越了 GLM-5 的测试总分. 当然本次测试过程也很坎坷, 首先是我周末抢了2天都没抢到 coding plan (目前只有coding plan 能用这个模型), 我最后找智谱的同学给我开了个权限. 以及测试中发现白天API不是很稳定, 偶尔输出速度会掉到10tps, 以及会出现乱码文字(我的规避方法是让它输出英文, 然后再找个便宜模型翻译过来). 总结, 各位前端同学估计会失望, 因为无论是从工程还是页面效果上都看不到提升, 甚至可能会有点倒退, 但果写后端代码或者复杂Agent应用可以试试这个新模型, 会有很大的提升. #GLM51 #智谱 #GLM #AIAgent #大模型编程
00:00 / 08:00
连播
清屏
智能
倍速
点赞239
00:00 / 00:24
连播
清屏
智能
倍速
点赞33
00:00 / 00:42
连播
清屏
智能
倍速
点赞611
00:00 / 00:24
连播
清屏
智能
倍速
点赞1853
00:00 / 03:58
连播
清屏
智能
倍速
点赞26
00:00 / 11:39
连播
清屏
智能
倍速
点赞2
智谱GLM-5封神!20 万字文档拆解国产最强开源大模型🔥 #GLM5 #智谱AI #国产大模型 #AI大模型 #大模型技术 一、GLM-5 核心定位与性能 1. 智谱最新发布 GLM-5,7440 亿参数混合专家 MoE 模型 2. 底层:MoE + Slime 异步强化学习架构 3. 上下文窗口:200K,可输入整本书 / 完整代码仓库 4. 权威榜单:全球第 4,开源模型第 1 5. 编码能力:开源 SOTA,超越 Gemini 3 Pro,逼近 Claude Opus 4.5 6. 支持:多模态、超长文本、复杂工程、AI Agent 开发 二、文档与学习内容 1. 提供20 万字深度文档(Cursor 编写,11 章) 2. 提供10 万字技术文档(OpenCode + Minimax 生成) 3. 内容覆盖:行业格局、模型演进、架构原理、训练、部署、应用、未来趋势 三、GLM-5 技术架构与创新 (一)模型架构 1. Transformer + MoE 混合专家(256 个专家) 2. 借鉴 Deepseek 稀疏机制,自研优化 3. 稀疏注意力、多 Token 预测、旋转位置编码 (二)训练创新 1. Slime 异步强化学习,替代传统 RLHF,训练效率大幅提升 2. 训练数据、流程、分布式部署全面优化 3. 部署成本降低 50%,节省数千万美元训练资源 (三)核心能力 1. 长文本理解与超长上下文 2. 工程级代码生成(从辅助编码→完整项目) 3. 多模态融合(视觉编码器) 4. 动态路由、专家调度、事件总线 (四)源码与工程 1. 架构清晰,可复现、可学习 2. 展示了国产大模型在软件与算法层面的领先性 四、总结与行业意义 1. GLM-5 是国产大模型里程碑,打破外部限制 2. 核心竞争力:架构设计 + 工程化 + 训练效率 3. 未来方向:AGI、工程级自主编程、多模态复杂任务
00:00 / 03:27
连播
清屏
智能
倍速
点赞42
00:00 / 01:07
连播
清屏
智能
倍速
点赞5
00:00 / 00:15
连播
清屏
智能
倍速
点赞111
00:00 / 00:51
连播
清屏
智能
倍速
点赞3690
00:00 / 02:36
连播
清屏
智能
倍速
点赞22
Tony沈哲2周前
智谱发布了专为 OpenClaw 等 Agent 驱动环境优化的高速模型 GLM-5-Turbo。 该模型 API 定价比 GLM-5 略高。在 GLM Coding Plan 中,Max 套餐用户已可直接使用,Pro 用户将在本月底前开放,Lite 用户将在下月可用。同时,智谱推出“龙虾套餐·团队协作版”,搭载专为 Agent 优化的 GLM-5-Turbo 模型。该模型上下文窗口为 200K,最大输出 128K Tokens,官方数据显示其在 ZClawBench 基准测试中位列第一梯队。另外,智谱宣布针对 GLM Coding Plan 开启限时服务窗口,该窗口昨日开启并将持续至本月底。此次方案旨在保障老用户权益,涵盖续订、回退及补偿三项内容。 NotebookLM 开始向 Pro 用户推出 “Cinematic Video Overviews”(电影级视频概览)功能。该功能由 "Google 最先进模型的全新组合" 驱动,旨在提供更高级别的视觉概览体验。 据央视 “3·15” 晚会报道,互联网出现 GEO 业务,声称可操纵 AI 大模型搜索结果。部分服务商利用 力擎 GEO 优化系统 生成虚假软文“投喂”AI。实验显示,虚构的 “Apollo-9 智能手环” 发布虚假文章后,2 小时 即被 AI 抓取;增加虚构测评后,获多个 AI 模型靠前推荐。据从业者透露,该操作已形成产业链,不仅用于提升排名,还被用于恶意抹黑竞争对手。 据彭博社援引知情人士消息,Moonshot AI 正寻求筹集高达 10 亿美元 资金,本轮估值约为 180 亿美元。作为 Kimi 的开发商,该公司在今年早些时候获超 7 亿美元 融资,彼时估值为 100 亿美元。去年底,其在 5 亿美元 融资交易中估值仅为 43 亿美元。 #智谱 #NotebookLM #Kimi #OpenClaw
00:00 / 02:18
连播
清屏
智能
倍速
点赞10