00:00 / 00:44
连播
清屏
智能
倍速
点赞98
🚀开源编程新王诞生,实测GLM-4.7 🚀开源编程新王诞生,对标Claude Sonnet 4.5?实测GLM-4.7:Coding和Agentic能力直逼Gemini 3和Claude 4.5 🚀🚀🚀视频简介: ⚡️ 本期视频详细演示了智谱AI最新发布的GLM-4.7开源大模型的全方位编程能力测试! 📊 模型亮点:358B参数MoE架构,MIT开源协议支持商业使用,在数学竞赛、代码能力、科学推理等多项基准测试中超越GPT-5.1和Claude Sonnet 4.5! 🎮 实测内容: SVG太阳系动画生成(一句话搞定) 冒泡排序算法可视化动画 3D风格侏罗纪恐龙狩猎游戏 圆面积公式推导交互动画 根据网页自动生成PPT Claude Code接入配置教程 Chrome DevTools MCP浏览器自动化 iOS原生背单词APP完整开发 💡 无论是前端开发、游戏制作还是iOS原生应用,GLM-4.7都展现出强大的编程实力! 🔥🔥🔥时间戳: 00:00 开场介绍 - GLM-4.7模型发布,358B参数MIT开源 00:53 基准测试 - 数学、代码、推理能力全面对比GPT-5.1和Claude Sonnet 4.5 01:59 测试计划 - 前端编程、工具调用、复杂推理三大维度 02:30 SVG动画测试 - 一句话生成太阳系八大行星公转动画 03:27 算法可视化 - 冒泡排序动画:指挥舰排列小行星 05:01 游戏开发测试 - 从零开发侏罗纪恐龙狩猎射击游戏 07:12 数学推导动画 - 圆面积公式推导可视化演示 08:52 PPT生成测试 - 根据网页链接自动生成完整PPT 09:53 Claude Code配置 - 三条命令接入GLM-4.7 API 11:09 浏览器自动化 - Chrome DevTools MCP实战博客改写 12:00 终极挑战 - iOS原生背单词APP完整开发 14:54 总结评价 - GLM-4.7编程能力综合评估 #ai #GLM47 #ai编程 #aigc #大模型
00:00 / 15:05
连播
清屏
智能
倍速
点赞91
00:00 / 01:30
连播
清屏
智能
倍速
点赞15
Tony沈哲1周前
2025年12月27日AI晚报 智谱AI宣布面向 GLM Coding Plan 订阅用户推出了名为“阿姨助我”的福利活动,活动从目前开始将持续至2026年1月初。所有正在生效中的订阅会员,不限等级与订阅时间,只需在 Claude Code、Cline、OpenCode、Roo Code 或 Kilo Code 等指定编程工具中接入该计划并配置 MCP,随后输入口令“阿姨助我”,即可获得一张沪上阿姨新品奶茶兑换券。 MiniMax 近期正式开源了 M2.1 编程模型,该模型已在 Hugging Face、ModelScope 和 GitHub 同步上架。此外,MiniMax 针对开发者开启了 Coding Plan 系列优惠活动。其中,“9.9 元月度 Starter 套餐返场活动”已于2025年12月26日启动,并将持续2026年1月15日。 Yann LeCun 推出了基于联合嵌入预测架构的视觉语言模型 VL-JEPA,这是首个可实时处理通用视觉语言任务的非生成式模型。VL-JEPA 通过在潜空间预测抽象含义而非直接预测单词,仅以 1.6B 参数就在性能上媲美 72B 的 Qwen-VL,并在视频分类与检索任务中超越了 CLIP 和 SigLIP2。 Qwen Code 发布了重要更新 v0.5.0 版本,这次更新不仅包含了功能增强,更是 Qwen Code 从命令行工具 向开发生态迈进的关键一步。根据介绍,用户可在终端窗口中同时运行四个 Qwen Code 实例,分别处理不同任务,而不必等待一个对话结束后再开始另一个对话窗口。譬如,其能够同时完成智能问答、实时翻译、原型设计、创意绘图四个任务,号称让 AI 编程 “跳出命令行”。 #智谱ai #MiniMax #LeCun #Qwen
00:00 / 01:57
连播
清屏
智能
倍速
点赞9
00:00 / 01:52
连播
清屏
智能
倍速
点赞29
Tony沈哲2周前
2025年12月23日AI晚报 智谱AI 正式发布并开源其最新旗舰模型 GLM-4.7。该模型针对 Agentic Coding 场景进行了深度优化,并在编码、复杂推理及工具调用能力上实现显著突破,部分指标超越 Claude 4.5。在 LMArena Code Arena 盲测中,GLM-4.7 位列开源模型第一和国内模型第一。 MiniMax 在 MiniMax Agent 平台中上线了其最新的 M2.1 模型。据官方称,这是一款为 Agent 和复杂问题解决设计的模型,在多项任务上有所提升。MiniMax 团队负责人表示,可见的状态(如文件、工具、进度、决策)对于信任和可用性至关重要,M2.1 是朝这一方向迈出的一步。该模型现已可在其在线平台中体验。此外,MiniMax M2.1 模型已经在第三方基准测试平台 LM Arena 中上线。 月之暗面近日通过官方公众号分享了其团队如何在 2025年 将旗下的 Kimi K2 系列模型应用于实际工作。文章内部分享了深度研究、OK Computer、PPT助手以及 Agentic Coding 等 Agent 技能在日常业务中的应用案例,展示了其自主规划、检索和交付成果的能力。这些能力源于擅长代码和工具使用的 Kimi K2 及 Kimi K2 Thinking 模型。 阿里巴巴通义实验室旗下的大语言模型 Wan 正式发布了其商用级图像生成模型 Wan2.6-Image。该模型支持交错图文生成,能够结合逻辑推理能力创作叙事驱动的视觉内容。同时,它支持多图条件生成,可灵活参考、组合和替换多张图片。该模型提供商用级的身份(ID)一致性保持,确保角色、风格和元素在商业场景下的高一致性。它能从参考图中提取颜色、风格、构图等创意元素,进行美学驱动的图像生成。 NVIDIA 近期发布了一份面向初学者的 LLM 微调指南,详细介绍了如何在从 GeForce RTX 笔记本到 DGX Spark 在内的多种硬件上使用开源框架 Unsloth。 #GLM #MiniMax #Kimi #wan #NVIDIA
00:00 / 02:39
连播
清屏
智能
倍速
点赞13
00:00 / 01:07
连播
清屏
智能
倍速
点赞25
00:00 / 00:34
连播
清屏
智能
倍速
点赞1
00:00 / 00:41
连播
清屏
智能
倍速
点赞68