00:00 / 00:25
连播
清屏
智能
倍速
点赞127
00:00 / 02:10
连播
清屏
智能
倍速
点赞6
2025年8月6日,OpenAI发布了两款开源推理模型,gptoss120b和gptoss20b,这可是自GPT2后该公司首次重新开源模型,在AI圈引起不小轰动。 先看模型基础情况。gptoss120b总参数1170亿,激活参数51亿,性能接近o4mini,单个80GB的H100 GPU就能部署。gptoss20b总参数210亿,激活参数36亿,性能接近o3mini,仅需16GB内存,高端笔记本甚至手机都能轻松运行。 结合小尺寸开源LLM模型评分对比表,能更直观感受它们的实力。在数学竞赛相关的AIME24评测中,gptoss120b得96.6分,gptoss20b获96分,远超阿里云Qwen3系列和智谱AI的GLM4.5Air。AIME25评测里,gptoss20b以98.7分领先,gptoss120b也有97.9分,与Qwen3系列差距明显。GPQA评测中,gptoss120b得80.1分,表现优于Qwen330BA3B。MMLU综合评测里,gptoss120b拿90分,gptoss20b获85.3分,相比GLM4.5Air优势突出。 gptoss系列亮点不少。许可证采用Apache 2.0,个人和企业都能自由构建、定制和商业部署。功能上支持三档推理力度调节,有完整思维链可访问,方便调试,还支持参数微调、Agentic功能等,原生MXFP4量化降低了部署门槛。 技术上,采用Transformer架构和专家混合技术,用多种注意力机制和编码方式,支持长上下文。训练数据以英文为主,分词器应用广,后训练流程专业。 应用场景广泛,适用于智能体工作流、本地推理等,已有不少合作伙伴,也提供了体验平台并上线云服务。发布后海外社区反应热烈,Hugging Face服务器都承压了。 总体而言,这两款模型性能优于Qwen3、GLM4.5Air等,开源特性和强大功能降低了AI应用门槛,能让更多主体参与,推动行业发展,为AI行业注入新活力。 #OpenAI新开源模型 #AI大模型对决 #手机能跑的AI模型 #AI技术突破 #开源AI新动向
00:00 / 02:51
连播
清屏
智能
倍速
点赞144
00:00 / 02:03
连播
清屏
智能
倍速
点赞58
开源图片大模型,改变AI应用范式! 
家人们出大事了!媲美GpT 4o图像生成能力的超强模型,FLUX.1 Kontext [dev] 模型现在开源了!当然这个是他的开发者版本,但是图片生成效果已经很强了! 拥有 12B参数,具备 接近专有工具的图像编辑能力,关键是,他可以在消费级硬件上运行。
一个可在本地运行,无需联网,媲美GPT4o可生成和编辑图像。你敢想象吗? 
这个版本最大的特点,就是解决了角色一致性的问题,要知道,AI生成图片,一直以来的问题,就是生成的角色与真实的人差距太大。 
而现在一个能解决角色一致性问题的开源图片模型,可以让我们在真实的人、物的基础上,进行任意的编辑。 比如说,我们看几个很实际的应用方案。我们随便拍一张T恤的图片,可以把他变成商拍级的水平;我们找一个普通人模特,可以给她增加品牌新品很自然的植入。 
我们可以说,在电商领域,这个开源模型,已经拥有了可交付结果的能力。 
这让我想起了Linux基金会创始人说的那句话:AI基础模型注定全面开源,战场只在应用端。 
所以说我们看为什么OpenAI创始人奥特曼,最近的采访中,已经在说OpenAI目前的重点可能不是追求AGI 了,而是更快地让目前的用户再翻一倍,达到10亿的月活用户。 
所以可以回想一下我昨天的视频,为什么open AI要进入金主微软更擅长的AI办公领域? 第一,更普世的办公软件可以让OpenAI更早达到10亿用户; 第二,OpenAI大模型在多个层面被google的Gemini2.5超越,某种程度上,基础大模型已经不再是壁垒。 
AI应用的范式完全变了,用AI的方式重做所有传统软件的时代到来了。 
用AI逻辑抢夺更多基础软件的地位,拿到用户更多的行为数据,10亿的月活,几亿用户的日活,完全能媲美现在互联网巨头的地位了。 
不过我想,接下来这种路径已经不再只适合OpenAI,而是适合所有做AI应用的创业者了。一个更有利于agent创业者的时代到来了! #人工智能 #Agent #OpenAI #AI #flux
00:00 / 02:34
连播
清屏
智能
倍速
点赞19