Karminski6天前
蚂蚁集团 Ling&Ring 2.5-1T大模型实测! 给大家带来蚂蚁集团 inclusionAI 团队的 Ring-2.5-1T & Ling-2.5-1T 大模型实测! 最近很多小伙伴问我是怎么第一时间知道大模型发布的, 秘密就是我用AI搞了一个爬虫平台, 帮我监控所有大模型厂商的 HuggingFace、GitHub、社交媒体页面, 有更新就自动通知我. 这个平台用到的正好就是蚂蚁集团 InclusionAI 团队刚发布的万亿参数大模型: Ring-2.5-1T (思考模型) 负责操作浏览器抓取信息, Ling-2.5-1T (非思考模型) 负责对比两次抓取内容判断是否有更新. 来看测试结论: 前端编程能力上 Ring-2.5-1T 会优于 Ling-2.5-1T 从建模精度, 逻辑细节, 粒子效果, 到一些图形学算法上均有不错的表现. 而 Ling-2.5-1T 的最大亮点则是指令遵循能力意外地强! 指令遵循测试中 6000 token 上下文、85个需求, 部分指令遵循达到 91.8%, 加权总分 8.2, 不输 SOTA 级别模型. 特别适合文本比对、内容抽取、修改文章这类需要精准遵循指令的场景. Agent能力: 硅基骑手测试 Ling-2.5-1T 得分 180.48, Ring-2.5-1T 则达到 325.79, 思考模型在 Agent 任务上优势明显. 总结: Ling-2.5-1T 指令遵循是真的亮眼, 作为非思考模型响应速度快, 适合各种自动化任务和脚本. 需要更强编程和Agent能力就上 Ring-2.5-1T. 官方透露 2.6 版本不久后发布, 期待后训练能进一步加强! #Ling25 #Ring25 #蚂蚁集团 #AntLing #百灵大模型
00:00 / 05:14
连播
清屏
智能
倍速
点赞34
00:00 / 01:37
连播
清屏
智能
倍速
点赞44
00:00 / 00:59
连播
清屏
智能
倍速
点赞214
00:00 / 02:39
连播
清屏
智能
倍速
点赞3428
00:00 / 01:23
连播
清屏
智能
倍速
点赞18
00:00 / 03:58
连播
清屏
智能
倍速
点赞NaN