实测 MiniMax-M2.1,编码真的强 Minimax M2.1 终于发布了,这期视频我没有只看榜单,而是直接把它接入 Cursor 的 Plan 模式,当成「全职 AI 搭档」,从 0 开始做完一个完整的全栈应用:输入一大段文字,AI 自动切分成多页幻灯片、生成配图,还支持风格管理和批量出图。 视频前半部分,我会快速带你过一遍官方给出的能力指标:SWE-bench Verified 国产第一、多语言编程能力接近 Claude Opus 4.5,在 Web / 安卓 / iOS / 后端多个子任务上的 VIBE 基准表现;然后演示如何在 Cursor 里配置 MiniMax API、打开 Plan 模式,让它自己梳理任务、规划文件结构、持续检查 TypeScript 和 lint 报错并自动修复。 中间部分,是一大堆好玩的创意实验:黑金配色理发店着陆页、催眠数学动画、奥德赛号主控面板 UI、Minecraft 春晚 3D 场景、绵羊理发店、兵马俑跳街舞、数字书画应用……能看到 M2.1 在 UI 审美、交互设计和对中国文化元素上的理解到底到什么程度。 后半部分,我会详细拆解这个全栈项目的完整链路:从 PRD 到 Plan、从自动切分文案、提示词生成、风格系统、图片比例适配,到批量生成、版本管理、前端调试,再到用 Chrome DevTools MCP 让模型自己点页面、看 Network / Console 定位 Bug。 时间戳 00:00 M2.1 正式发布&能力总览 01:18 M2.1 在 Cursor Plan 模式里的配置 02:00 Web 端创意 05:10 全栈项目拆解 07:40 自动调试体验 #独立开发 #AI #AIAgent #AI编程 #MiniMax
00:00 / 09:57
连播
清屏
智能
倍速
点赞53
开源黑马!MiniMax-M2 深度测评!专为编程而生! 🔥🔥🔥视频简介: 本期实测开源大模型 MiniMax-M2。其在多项基准表现优异,Artificial Analysis 榜单综合排名全球前五;参数为 230B、激活 10B,上下文 200K。 面向 Agent 与编程优化,支持全栈多文件编辑、编译-运行-修复循环、测试验证与自动修复,覆盖 23 种编程语言;具备复杂指令理解与通用能力(数学/逻辑/科学/指令遵循)。 推理速度约 100 token/s,据称较 Claude Sonnet 4.5 快 2 倍、吞吐 +2.3 倍、成本降幅 92%。 实测内容: SVG:骑车的鹈鹕;行走的猫(实现步行动画,对比同词提示下 ChatGPT 效果较差)。 前端小游戏:单文件吃豆人(方向键、迷宫碰撞、计分、三鬼巡逻追击、胜负与生命)。 Win95 桌面模拟器:灰色 UI 还原,窗口创建/拖拽/最小化/关闭与任务栏同步,内置记事本,自动测试与报告。 Three.js:可探索的 3D 森林(光照、雾、FPS,自动发现并修复控制问题);3D 城市(高楼、车辆、路人、交通灯、人行横道、昼夜循环与视角切换)。 Agent 调用示例:在账户管理生成 API Key,设置 base URL 与 Key;以 AutoGen 定义 4 个 agent,生成 3 天尼泊尔旅行计划(含时间/天气、交通/费用、逐日安排)。 深度研究示例:输出 特斯拉近三年投资价值分析 与 2025 AIGC 投融资趋势简报(含指标、对比、案例、引用数据源)。 #MiniMax #MiniMaxM2 #AI编程 #AI智能体 #AIGC
00:00 / 12:01
连播
清屏
智能
倍速
点赞128
Tony沈哲3天前
2025年12月24日AI晚报 MiniMax 正式发布了采用 MoE 架构的旗舰模型 M2.1,在多项编程与开发基准测试中表现卓越,性能直逼 Claude 4.5 系列。该模型采用了 MoE 架构,包含 230B 总参数和激活的 10B 参数。它拥有 200K 的上下文窗口和 128K 的最大输出。模型在 Rust、Java、Go、C++、Kotlin、Objective-C、TypeScript 和 JavaScript 等多语言编程任务中表现出色。此次 M2.1 的性能提升还体现在应用开发与网页开发方面。模型专门针对原生 Android 和 iOS 开发能力进行了升级,并增强了在网页美学设计、逼真科学模拟及高质量可视化表达方面的能力,旨在推动场景式构建成为可交付的生产实践。 阿里 Qwen 团队开源了图像编辑模型 Qwen-Image-Edit-2511,这是对前代模型 Qwen-Image-Edit-2509 的升级,重点提升了生成质量和一致性。在功能特性方面,Qwen-Image-Edit-2511 在保持输入对象身份和视觉特征的同时,显著增强了单人肖像编辑的想象力,并提升了多人群照的高保真融合能力。 阿里 Qwen 团队新推出了两款文本转语音模型:Qwen3-TTS-VD-Flash 和 Qwen3-TTS-VC-Flash。VD-Flash 模型支持通过自然语言指令自由设计声音的音色、韵律和情感,不再依赖预设音库。VC-Flash 模型则能以极短音频完成克隆,并支持中文、英文、日语等多种语言。两款模型均已上线。 xAI 正式推出 Grok Collections API,这是一个集成在 API 中的最先进 RAG 系统。该 API 允许开发者上传 PDF、Excel 表格及完整代码库等数据集构建知识库,从而在不自行管理索引和检索基础设施的情况下构建 RAG 应用。该系统利用 OCR 和布局感知解析技术提取文本并保留文档结构,同时提供语义搜索、关键词搜索和混合搜索三种检索模式。 #MiniMax #qwen #xAI #rag
00:00 / 02:34
连播
清屏
智能
倍速
点赞7
00:00 / 00:26
连播
清屏
智能
倍速
点赞1
00:00 / 03:13
连播
清屏
智能
倍速
点赞5538