00:00 / 07:29
连播
清屏
智能
倍速
点赞231
🚀开源编程新王诞生,实测GLM-4.7 🚀开源编程新王诞生,对标Claude Sonnet 4.5?实测GLM-4.7:Coding和Agentic能力直逼Gemini 3和Claude 4.5 🚀🚀🚀视频简介: ⚡️ 本期视频详细演示了智谱AI最新发布的GLM-4.7开源大模型的全方位编程能力测试! 📊 模型亮点:358B参数MoE架构,MIT开源协议支持商业使用,在数学竞赛、代码能力、科学推理等多项基准测试中超越GPT-5.1和Claude Sonnet 4.5! 🎮 实测内容: SVG太阳系动画生成(一句话搞定) 冒泡排序算法可视化动画 3D风格侏罗纪恐龙狩猎游戏 圆面积公式推导交互动画 根据网页自动生成PPT Claude Code接入配置教程 Chrome DevTools MCP浏览器自动化 iOS原生背单词APP完整开发 💡 无论是前端开发、游戏制作还是iOS原生应用,GLM-4.7都展现出强大的编程实力! 🔥🔥🔥时间戳: 00:00 开场介绍 - GLM-4.7模型发布,358B参数MIT开源 00:53 基准测试 - 数学、代码、推理能力全面对比GPT-5.1和Claude Sonnet 4.5 01:59 测试计划 - 前端编程、工具调用、复杂推理三大维度 02:30 SVG动画测试 - 一句话生成太阳系八大行星公转动画 03:27 算法可视化 - 冒泡排序动画:指挥舰排列小行星 05:01 游戏开发测试 - 从零开发侏罗纪恐龙狩猎射击游戏 07:12 数学推导动画 - 圆面积公式推导可视化演示 08:52 PPT生成测试 - 根据网页链接自动生成完整PPT 09:53 Claude Code配置 - 三条命令接入GLM-4.7 API 11:09 浏览器自动化 - Chrome DevTools MCP实战博客改写 12:00 终极挑战 - iOS原生背单词APP完整开发 14:54 总结评价 - GLM-4.7编程能力综合评估 #ai #GLM47 #ai编程 #aigc #大模型
00:00 / 15:05
连播
清屏
智能
倍速
点赞65
Karminski4天前
抱歉我们只有超大杯! GLM-4.7实测! 本次测试覆盖了GLM-4.7的编程能力, Agent/ToolCall能力, 长上下文召回能力, 给大家带来刚发布的 GLM 4.7 的测试结果: 考验Agent能力的硅基骑手测试, 简单讲是让大模型使用工具模拟骑手取外卖送餐. GLM 4.7 在24小时总计300回合的极限送餐中收益达到了 571.91 元, 执行了总计 354 次 tool call, 测试使用了大约 50% 的上下文空间, 直到超过100K后才停止工作. Agent 测试这次是创了新高, 执行效率特别高, 得益于模型可以在一次会话中发起多个 tool call, 节省了时间并能选择收益最大的方案. 然后是考验长上下文召回能力的霍格沃茨测试, 简单来讲就是在长上下文中, 能否记住上下文并准确的回答问题. GLM 4.7 在192K以内召回水平在91%到100%区间, 而200K也有95%, 召回效果同样也很不错. 最后再来看编程能力测试上最大的感受是粒子, 建模, 光影效果都有提升, 尤其是空间能力有了巨大的提升. 当然性能问题仍然存在, 希望下个版本着重优化下生成代码的性能问题. 总结, 这次GLM 4.7 在各个方面都有明显的提升, 作为主力编程模型不是问题, LMArena 和 SWE-bench 等编程测试中都取得了开源大模型 SOTA 的水平. 不过还是要说一句, 测试中我发现API速度时快时慢, 是不是因为大家都在用新版本导致的? 希望官方赶紧加机器. #GLM47 #智谱AI #智谱GLM #ai编程 #大模型
00:00 / 04:16
连播
清屏
智能
倍速
点赞9
00:00 / 02:21
连播
清屏
智能
倍速
点赞30
详解 & 实测 GLM-4.7 ,14个Skills 这期视频,我在最新的 GLM-4.7 上做了一轮「从评测到实战」的体验: - 先对比 GLM-4.7 和 4.6 在人类测试、SWE-bench Verified、数学竞赛等基准上的提升,在数学上超过 Gemini 3 Pro。 - 展开讲「交织思考」和训练细节:数据、多阶段训练、LoRA-like 方法,以及智谱开源的 Slime 框架、后训练阶段算力投入。 - 结合 AMA 内容,聊智谱在 RL 工具链、编程 Agents、上千并发 Docker 环境等基础设施上的布局。 - 重点体验 4.7 在 UI / 前端审美 上的升级:包括前端设计 skill、体素艺术 Demo、新年场景、兵马俑觉醒、亚特兰蒂斯塔楼、咖啡车等案例。 - 对比 GLM-4.7 与 Claude Opus 4.5 在 Remotion 视频任务上的实际表现:角色一致性、重新打光、纹理迁移等细节制作谁更强。 - 最后在展示提示词设计和效果。 如果你关心: - GLM-4.7 真实体验到底如何? - 它的前端审美和 UI 生成,能不能当生产力? - 智谱 的 skill 体系(大模型、视觉、语音、搜索、文档、前端设计等)怎么影响个人 AI 开发工作流? - 和 Claude Opus 4.5、Gemini 等主流模型相比,它的优劣势在哪里? 这期视频应该能给你一个比较完整的一手视角。 时间戳 00:00 升级亮点概览 01:21 训练细节与 AMA 精华 03:05 Skills 全家桶 04:28 前端 UI Demo 与体素艺术展示 07:01 Remotion 视频任务对比 #GLM47 #GLM #智谱
00:00 / 10:26
连播
清屏
智能
倍速
点赞36
智谱 GLM-4.7 + 香蕉2做PPT,效果好到离谱 #智谱 #GLM #大模型 #开源 #AI做PPT 嘿!我是成峰。 最近用智谱 GLM-4.7 + Nano Banana Pro 做 PPT,效果好到离谱。 先看效果👇 哆啦A梦、火影忍者、梵高星空、赛博朋克… 19种风格,全是AI一键生成的。 我把文章丢进去,它直接给我吐出20页PPT。 数据图表能做、流程图能做、架构图也能做。 风格统一,排版专业。 有意思的是,整个测试过程我以为自己用的是Claude。 做完才发现:用的是智谱GLM-4.7。 国产模型,真的很能打。 --- 以前做PPT: 不管用啥工具,反正就是不好看。 现在: 一句话,20张精美幻灯片搞定。 三个核心优势: ✅ 快:说一句话,全自动 ✅ 统一:一次调好,全套一致 ✅ 复用:方法存进去,下次直接跑 --- 原理很简单: 你把文章+风格丢进去,智谱帮你做4件事: 1️⃣ 读方法论,知道怎么做PPT 2️⃣ 拆结构,分出封面、痛点、章节 3️⃣ 画草图,每页布局先规划好 4️⃣ 调用生图模型,出成品 全程自动化,你只管验收。 --- 6步上手: 第1步:搞个智谱API Key 去智谱官网注册,买个套餐就行。 第2步:搞个生图API Key 一张图0.18元,充5块钱够用27张4K图。 第3步:装Skill 让AI帮你装,直接说:帮我安装AIPPT Skill 第4步:生成框架 ⭐最关键 说一句:帮我把这篇文章梳理成PPT框架 AI会画成布局草图,你检查一遍。 不满意就改:第3页布局换成左右对称、封面加个副标题… 先对齐,再生图,省钱省时间。 第5步:选风格 说一句:打开案例展示页面 19种风格随便挑。 第6步:生成 说一句:帮我把这篇文章生成PPT,用梵高风格 完事。 --- 进阶玩法: 🔧 改字 发现错别字?直接说:把「肥」改成「爬」 AI自己改,改完还会检查。 🎨 自定义风格 19种不够?自己造。 说:帮我生成测试图,风格是蜡笔小新 满意就跑全套,不满意继续调。 你的风格,你说了算。 --- 智谱GLM-4.7:bigmodel.cn AIPPT Skill开源地址:github.com/Ceeon/AIPPT2 有问题评论区见👇
00:00 / 05:17
连播
清屏
智能
倍速
点赞114
00:00 / 09:21
连播
清屏
智能
倍速
点赞1199
Tony沈哲4天前
2025年12月23日AI晚报 智谱AI 正式发布并开源其最新旗舰模型 GLM-4.7。该模型针对 Agentic Coding 场景进行了深度优化,并在编码、复杂推理及工具调用能力上实现显著突破,部分指标超越 Claude 4.5。在 LMArena Code Arena 盲测中,GLM-4.7 位列开源模型第一和国内模型第一。 MiniMax 在 MiniMax Agent 平台中上线了其最新的 M2.1 模型。据官方称,这是一款为 Agent 和复杂问题解决设计的模型,在多项任务上有所提升。MiniMax 团队负责人表示,可见的状态(如文件、工具、进度、决策)对于信任和可用性至关重要,M2.1 是朝这一方向迈出的一步。该模型现已可在其在线平台中体验。此外,MiniMax M2.1 模型已经在第三方基准测试平台 LM Arena 中上线。 月之暗面近日通过官方公众号分享了其团队如何在 2025年 将旗下的 Kimi K2 系列模型应用于实际工作。文章内部分享了深度研究、OK Computer、PPT助手以及 Agentic Coding 等 Agent 技能在日常业务中的应用案例,展示了其自主规划、检索和交付成果的能力。这些能力源于擅长代码和工具使用的 Kimi K2 及 Kimi K2 Thinking 模型。 阿里巴巴通义实验室旗下的大语言模型 Wan 正式发布了其商用级图像生成模型 Wan2.6-Image。该模型支持交错图文生成,能够结合逻辑推理能力创作叙事驱动的视觉内容。同时,它支持多图条件生成,可灵活参考、组合和替换多张图片。该模型提供商用级的身份(ID)一致性保持,确保角色、风格和元素在商业场景下的高一致性。它能从参考图中提取颜色、风格、构图等创意元素,进行美学驱动的图像生成。 NVIDIA 近期发布了一份面向初学者的 LLM 微调指南,详细介绍了如何在从 GeForce RTX 笔记本到 DGX Spark 在内的多种硬件上使用开源框架 Unsloth。 #GLM #MiniMax #Kimi #wan #NVIDIA
00:00 / 02:39
连播
清屏
智能
倍速
点赞13
00:00 / 00:14
连播
清屏
智能
倍速
点赞23
00:00 / 00:11
连播
清屏
智能
倍速
点赞0
00:00 / 00:27
连播
清屏
智能
倍速
点赞0
00:00 / 02:36
连播
清屏
智能
倍速
点赞22