00:00 / 00:51
连播
清屏
智能
倍速
点赞139
通义MAI-UI发布:全尺寸GUI基座,全面刷新SOTA 通义实验室 MAI 团队正式开源 MAI-UI——新一代全尺寸 GUI 智能体基座模型。它打破了传统 GUI 模型的局限,首次将工具调用、用户交互、端云协同与在线强化学习原生整合,在GUI视觉定位和手机任务执行上全面刷新 SOTA,超越 Gemini-2.5-Pro 与 UI-Tars-2 等强力基线。 📊 尺寸与性能:开源SOTA 开源首发: 我们正式开源 2B 与 8B 版本,将 SOTA 级的 GUI 能力直接装进开发者口袋,不仅轻量高效,性能更优于同规模竞品。 全谱系覆盖: 模型家族涵盖 2B/8B/32B/235B-A22B,满足从端侧高效部署到云端强力推理的全场景需求。 霸榜表现: 在 5 大视觉定位评测集全面登顶,MAI-UI-32B 更在 ScreenSpot-Pro 上超越 Gemini-3-Pro、Seed1.8。在线任务执行评测集AndroidWorld 成功率达 76.7%,超越Gemini-2.5-Pro和UI-Tars-2。 💡 技术亮点:解决实战痛点 原生 MCP 集成: 扩展模型边界,让 GUI 智能体学会“走捷径”,用 API 解决复杂 UI 链路。 用户交互能力: 拒绝“机械执行”,懂得“主动提问”,大幅提升指令模糊或缺失时任务成功率。 原生端云协同: 玩转“大小脑”默契配合,让端侧小模型主控执行 ,云端大模型仅在疑难时刻“空降救场”,高效能低成本,兼具隐私保护。 在线强化学习: 并行环境超过500个,突破长序列训练瓶颈,最大步长扩展至 50 步,让模型在动态环境交互中越来越强。 🔗 体验与了解更多:2B 与 8B 模型权重现已开放下载,欢迎 Star ⭐️!#通义 #GUI #Qwen #技术分享
00:00 / 03:53
连播
清屏
智能
倍速
点赞4328
00:00 / 01:54
连播
清屏
智能
倍速
点赞186