2025年8月6日,OpenAI发布了两款开源推理模型,gptoss120b和gptoss20b,这可是自GPT2后该公司首次重新开源模型,在AI圈引起不小轰动。 先看模型基础情况。gptoss120b总参数1170亿,激活参数51亿,性能接近o4mini,单个80GB的H100 GPU就能部署。gptoss20b总参数210亿,激活参数36亿,性能接近o3mini,仅需16GB内存,高端笔记本甚至手机都能轻松运行。 结合小尺寸开源LLM模型评分对比表,能更直观感受它们的实力。在数学竞赛相关的AIME24评测中,gptoss120b得96.6分,gptoss20b获96分,远超阿里云Qwen3系列和智谱AI的GLM4.5Air。AIME25评测里,gptoss20b以98.7分领先,gptoss120b也有97.9分,与Qwen3系列差距明显。GPQA评测中,gptoss120b得80.1分,表现优于Qwen330BA3B。MMLU综合评测里,gptoss120b拿90分,gptoss20b获85.3分,相比GLM4.5Air优势突出。 gptoss系列亮点不少。许可证采用Apache 2.0,个人和企业都能自由构建、定制和商业部署。功能上支持三档推理力度调节,有完整思维链可访问,方便调试,还支持参数微调、Agentic功能等,原生MXFP4量化降低了部署门槛。 技术上,采用Transformer架构和专家混合技术,用多种注意力机制和编码方式,支持长上下文。训练数据以英文为主,分词器应用广,后训练流程专业。 应用场景广泛,适用于智能体工作流、本地推理等,已有不少合作伙伴,也提供了体验平台并上线云服务。发布后海外社区反应热烈,Hugging Face服务器都承压了。 总体而言,这两款模型性能优于Qwen3、GLM4.5Air等,开源特性和强大功能降低了AI应用门槛,能让更多主体参与,推动行业发展,为AI行业注入新活力。 #OpenAI新开源模型 #AI大模型对决 #手机能跑的AI模型 #AI技术突破 #开源AI新动向
00:00 / 02:51
连播
清屏
智能
倍速
点赞147
00:00 / 00:19
连播
清屏
智能
倍速
点赞2
00:00 / 00:23
连播
清屏
智能
倍速
点赞102
00:00 / 00:05
连播
清屏
智能
倍速
点赞49
GPT-5发布,AI混战升级,平台生态成关键 OpenAI正式发布了万众瞩目的GPT-5,并且宣布对所有用户免费开放。这不仅仅是一次简单的模型升级。 根据我们的分析,GPT-5在编程、数学和逻辑推理方面实现了巨大飞跃,尤其是在代理式编码能力上表现突出,同时,模型的幻觉率也显著降低,这意味着它提供的答案更加可靠和准确。 微软已经迅速跟进,宣布旗下Copilot和Azure AI等核心产品将全面集成GPT-5。 然而,就在市场为之沸腾时,另一位科技巨头埃隆·马斯克却发出了不同的声音。他宣称,自己公司xAI旗下的Grok 4 Heavy模型,在多项智能测试中已经超越了GPT-5。同时,xAI的视频生成器Grok Imagine也已免费向所有人开放,这无疑是向OpenAI发起的直接挑战。 这场双雄争霸的背后,一个更深层次的趋势正在浮现,那就是平台生态的崛起。亚马逊的Bedrock平台正成为这场竞赛的关键变量。它不再押注单一模型,而是采取了“选择大于一切”的策略,汇集了包括OpenAI、Anthropic在内的13家顶尖AI公司,提供了超过400款模型供客户选择。 这标志着市场正在从“谁的模型最强”转向“谁的生态最全”,多模型协作将成为未来的主流。在这场技术浪潮中,新的商业机会也在不断涌现。成本低廉的AI短剧正成为内容创作的新风口,一些工作室甚至实现了月入数百万的营收。 同时,AI智能体也开启了全新的赛道,预示着AI将更主动地为我们完成复杂任务。当然,技术的进步也带来了挑战。 最新的行业报告指出,人工智能正在冲击劳动力市场,年轻的科技工作者首当其冲,有近40个职业正面临被AI替代的风险。 总而言之,2025年的人工智能领域,已经从单一的模型竞赛,演变成了一场涉及模型、平台、应用和资本的全面战争。GPT-5的发布只是拉开了新一轮竞争的序幕,而马斯克的强势入局和亚马逊的平台战略,则让这场竞赛的未来充满了更多变数。谁能最终胜出,或许答案就在于谁能更好地构建一个开放、多元且充满活力的生态系统。 #GPT5 #OpenAI #ElonMusk #xAI #人工智能
00:00 / 02:26
连播
清屏
智能
倍速
点赞9
00:00 / 00:23
连播
清屏
智能
倍速
点赞608
00:00 / 00:42
连播
清屏
智能
倍速
点赞5
00:00 / 00:06
连播
清屏
智能
倍速
点赞35
00:00 / 01:05
连播
清屏
智能
倍速
点赞14
00:00 / 00:23
连播
清屏
智能
倍速
点赞NaN
00:00 / 00:14
连播
清屏
智能
倍速
点赞17