2025年8月6日,OpenAI发布了两款开源推理模型,gptoss120b和gptoss20b,这可是自GPT2后该公司首次重新开源模型,在AI圈引起不小轰动。 先看模型基础情况。gptoss120b总参数1170亿,激活参数51亿,性能接近o4mini,单个80GB的H100 GPU就能部署。gptoss20b总参数210亿,激活参数36亿,性能接近o3mini,仅需16GB内存,高端笔记本甚至手机都能轻松运行。 结合小尺寸开源LLM模型评分对比表,能更直观感受它们的实力。在数学竞赛相关的AIME24评测中,gptoss120b得96.6分,gptoss20b获96分,远超阿里云Qwen3系列和智谱AI的GLM4.5Air。AIME25评测里,gptoss20b以98.7分领先,gptoss120b也有97.9分,与Qwen3系列差距明显。GPQA评测中,gptoss120b得80.1分,表现优于Qwen330BA3B。MMLU综合评测里,gptoss120b拿90分,gptoss20b获85.3分,相比GLM4.5Air优势突出。 gptoss系列亮点不少。许可证采用Apache 2.0,个人和企业都能自由构建、定制和商业部署。功能上支持三档推理力度调节,有完整思维链可访问,方便调试,还支持参数微调、Agentic功能等,原生MXFP4量化降低了部署门槛。 技术上,采用Transformer架构和专家混合技术,用多种注意力机制和编码方式,支持长上下文。训练数据以英文为主,分词器应用广,后训练流程专业。 应用场景广泛,适用于智能体工作流、本地推理等,已有不少合作伙伴,也提供了体验平台并上线云服务。发布后海外社区反应热烈,Hugging Face服务器都承压了。 总体而言,这两款模型性能优于Qwen3、GLM4.5Air等,开源特性和强大功能降低了AI应用门槛,能让更多主体参与,推动行业发展,为AI行业注入新活力。 #OpenAI新开源模型 #AI大模型对决 #手机能跑的AI模型 #AI技术突破 #开源AI新动向
00:00 / 02:51
连播
清屏
智能
倍速
点赞146
00:00 / 03:52
连播
清屏
智能
倍速
点赞NaN
00:00 / 02:04
连播
清屏
智能
倍速
点赞169
00:00 / 01:35
连播
清屏
智能
倍速
点赞41