00:00 / 01:34
连播
清屏
智能
倍速
点赞49
智谱 GLM-4.7 + 香蕉2做PPT,效果好到离谱 #智谱 #GLM #大模型 #开源 #AI做PPT 嘿!我是成峰。 最近用智谱 GLM-4.7 + Nano Banana Pro 做 PPT,效果好到离谱。 先看效果👇 哆啦A梦、火影忍者、梵高星空、赛博朋克… 19种风格,全是AI一键生成的。 我把文章丢进去,它直接给我吐出20页PPT。 数据图表能做、流程图能做、架构图也能做。 风格统一,排版专业。 有意思的是,整个测试过程我以为自己用的是Claude。 做完才发现:用的是智谱GLM-4.7。 国产模型,真的很能打。 --- 以前做PPT: 不管用啥工具,反正就是不好看。 现在: 一句话,20张精美幻灯片搞定。 三个核心优势: ✅ 快:说一句话,全自动 ✅ 统一:一次调好,全套一致 ✅ 复用:方法存进去,下次直接跑 --- 原理很简单: 你把文章+风格丢进去,智谱帮你做4件事: 1️⃣ 读方法论,知道怎么做PPT 2️⃣ 拆结构,分出封面、痛点、章节 3️⃣ 画草图,每页布局先规划好 4️⃣ 调用生图模型,出成品 全程自动化,你只管验收。 --- 6步上手: 第1步:搞个智谱API Key 去智谱官网注册,买个套餐就行。 第2步:搞个生图API Key 一张图0.18元,充5块钱够用27张4K图。 第3步:装Skill 让AI帮你装,直接说:帮我安装AIPPT Skill 第4步:生成框架 ⭐最关键 说一句:帮我把这篇文章梳理成PPT框架 AI会画成布局草图,你检查一遍。 不满意就改:第3页布局换成左右对称、封面加个副标题… 先对齐,再生图,省钱省时间。 第5步:选风格 说一句:打开案例展示页面 19种风格随便挑。 第6步:生成 说一句:帮我把这篇文章生成PPT,用梵高风格 完事。 --- 进阶玩法: 🔧 改字 发现错别字?直接说:把「肥」改成「爬」 AI自己改,改完还会检查。 🎨 自定义风格 19种不够?自己造。 说:帮我生成测试图,风格是蜡笔小新 满意就跑全套,不满意继续调。 你的风格,你说了算。 --- 智谱GLM-4.7:bigmodel.cn AIPPT Skill开源地址:github.com/Ceeon/AIPPT2 有问题评论区见👇
00:00 / 05:17
连播
清屏
智能
倍速
点赞183
Karminski2月前
GLM-5发布啦! 给大家带来实测! 大模型进入月更节奏! GLM-4.7 才发布一个月, 智谱又掏出了 GLM-5, 这迭代速度属实离谱. 照例给大家带来编程、Agent、长上下文能力全面测试! 本次编程能力提升巨大: 新引入的鞭炮炸鱼缸测试, 要求模拟水滴/碎屑/烟雾/气泡四种粒子效果混合在流体中, 折射效果还原度已经和 Claude Opus 4.6 几乎没区别了. 鞭炮连锁爆炸测试指令遵循大幅提升, GLM-4.7 会忽略的参数 GLM-5 都能精准还原, 视觉上玻璃箱效果、色调映射达到了电影级画质. Python 杯子倒水新增了顶点碰撞检测, 甚至给2D粒子加了模拟3D高光! 大象牙膏测试实现了三层碰撞检测, 引入动画阶段机制精准还原 prompt 要求. 陀飞轮机芯也是一眼可见的提升. Agent 能力再次刷新纪录: 硅基骑手测试 (这次订单量加了5倍!) GLM-5 拿到 ¥738.69, 对比 GLM-4.7 的 ¥571.91. 关键发现是, GLM-5 每轮对话都在跟踪剩余轮次 ("254/300, 还有46轮"), 这种元认知是 GLM-4.7 未有过的. 它甚至给自己定了个小目标 "突破700元大关", 达成后庆祝了一下就继续干活. 而 GLM-4.7 在第198轮就开香槟不干了... 长文本召回: 各长度上下文召回均 98% 以上, 但有个问题 - 不给原文时四选一蒙对率达到 51.4%, 模型甚至能脑补出哈利波特小说英文原文, 所以分数置信度存疑. 不过 Agent 测试本身上下文就超过 100K, 召回性能实际上没问题. 总结: GLM-5 编程全面进化, Agent 能力展现出自主规划意识, 视觉美学也显著提升 (这次它特别偏爱科技感的 Orbitron 字体). 这么猛的表现, 很期待接下来的 GLM-5V! 另外官方账号还发了个马的图案, 看来之前的 pony alpha 是 GLM-5 石锤了! (P.S. 本次测试的是内测版本) #GLM5 #智谱 #智谱GLM #AIAgent #GLM
00:00 / 07:03
连播
清屏
智能
倍速
点赞53
00:00 / 05:15
连播
清屏
智能
倍速
点赞16
00:00 / 02:14
连播
清屏
智能
倍速
点赞9640
00:00 / 02:18
连播
清屏
智能
倍速
点赞8
00:00 / 06:40
连播
清屏
智能
倍速
点赞10
AI编程进入“视觉原生”时代,软件开发的生产力拐点真的到了吗? 4月2日,智谱发布了一款名为GLM-5V-Turbo的多模态Coding基座模型。最大的亮点是什么?它不再是纯文本的编程助手,而是真正“看懂”画面的AI程序员——给它一张设计稿截图,它能直接生成完整可运行的前端代码;给它一个网页链接,它能复刻整个站点的前端结构和交互逻辑。 这意味着什么呢? 编程这件事,以前的核心壁垒是“语法”和“逻辑”,模型需要开发者把视觉需求翻译成文字指令。现在GLM-5V-Turbo直接把感知链路从枯燥的字符延伸到设计稿、网页截图和K线图表中,实现了“所见即所得”的编程体验。 大家想一想,这个逻辑其实很简单。当模型拥有了真正的视觉能力,它在AutoClaw这类Agent场景里就能看懂屏幕信息——比如在PinchBench、ClawEval这些评测基准上,它的表现都相当突出,说明复杂任务执行能力已经通过了严格验证。 对行业的影响是什么? 首当其冲的是软件开发效率的革命。传统的前端开发,从UI设计稿到代码实现,往往需要设计师和工程师反复沟通。GLM-5V-Turbo能把设计稿“秒变”成可运行代码,这意味着产品经理和设计师自己就能快速做出Demo原型,再拿给开发讨论,沟通成本大幅压缩。这种能力跃升,正在重塑整个软件开发生命周期的效率逻辑。 那么产业链的投资机会在哪里? 沿着技术传导路径梳理,最直接的受益方向有三个—— 第一层,AI编程工具本身就是最大受益者。 全球AI编程工具市场正快速增长,从2025年的76.5亿美元增长至2026年的94.6亿美元,年复合增长率达到23.7%。多模态视觉能力的加入,让这个赛道从“代码补全助手”真正进化为“全栈AI工程师”,价值空间被重新定义。 第二层,上游算力基础设施。 多模态模型的普及意味着Token消耗激增,推理需求爆发。浙商证券在2026年3月发布的策略报告中明确指出:大模型参数规模扩容、多模态应用普及、Agentic AI交互频次提升,正在导致算力需求指数级增长。像海光信息、浪潮信息、神州数码这些算力基础设施厂商。 第三层,下游多模态应用场景。 天风证券在2026年1月的报告中指出,AI视频、机器人、自动驾驶将是多模态技术落地的核心方向。 #智谱 #GLM-5V-Turbo #海光信息 #科大讯飞 #昆仑万维
00:00 / 03:04
连播
清屏
智能
倍速
点赞57
00:00 / 00:42
连播
清屏
智能
倍速
点赞620
Tony沈哲3月前
2025年12月23日AI晚报 智谱AI 正式发布并开源其最新旗舰模型 GLM-4.7。该模型针对 Agentic Coding 场景进行了深度优化,并在编码、复杂推理及工具调用能力上实现显著突破,部分指标超越 Claude 4.5。在 LMArena Code Arena 盲测中,GLM-4.7 位列开源模型第一和国内模型第一。 MiniMax 在 MiniMax Agent 平台中上线了其最新的 M2.1 模型。据官方称,这是一款为 Agent 和复杂问题解决设计的模型,在多项任务上有所提升。MiniMax 团队负责人表示,可见的状态(如文件、工具、进度、决策)对于信任和可用性至关重要,M2.1 是朝这一方向迈出的一步。该模型现已可在其在线平台中体验。此外,MiniMax M2.1 模型已经在第三方基准测试平台 LM Arena 中上线。 月之暗面近日通过官方公众号分享了其团队如何在 2025年 将旗下的 Kimi K2 系列模型应用于实际工作。文章内部分享了深度研究、OK Computer、PPT助手以及 Agentic Coding 等 Agent 技能在日常业务中的应用案例,展示了其自主规划、检索和交付成果的能力。这些能力源于擅长代码和工具使用的 Kimi K2 及 Kimi K2 Thinking 模型。 阿里巴巴通义实验室旗下的大语言模型 Wan 正式发布了其商用级图像生成模型 Wan2.6-Image。该模型支持交错图文生成,能够结合逻辑推理能力创作叙事驱动的视觉内容。同时,它支持多图条件生成,可灵活参考、组合和替换多张图片。该模型提供商用级的身份(ID)一致性保持,确保角色、风格和元素在商业场景下的高一致性。它能从参考图中提取颜色、风格、构图等创意元素,进行美学驱动的图像生成。 NVIDIA 近期发布了一份面向初学者的 LLM 微调指南,详细介绍了如何在从 GeForce RTX 笔记本到 DGX Spark 在内的多种硬件上使用开源框架 Unsloth。 #GLM #MiniMax #Kimi #wan #NVIDIA
00:00 / 02:39
连播
清屏
智能
倍速
点赞13
00:00 / 00:28
连播
清屏
智能
倍速
点赞42