00:00 / 41:12
连播
清屏
智能
倍速
点赞737
00:00 / 02:06
连播
清屏
智能
倍速
点赞635
00:00 / 00:28
连播
清屏
智能
倍速
点赞12
00:00 / 01:08
连播
清屏
智能
倍速
点赞55
00:00 / 05:53
连播
清屏
智能
倍速
点赞30
00:00 / 01:24
连播
清屏
智能
倍速
点赞12
GPT-5在凌晨1点来了!更可靠,重实用 #OpenAI正式发布GPT-5在GPT-4发布两年半后,GPT-5在凌晨1点来了!更可靠,重实用。 OPENAI宣称最智能、最快捷、最实用。然而 (一)最智能有分歧 原股东马斯克当即不服,推理能力自家大模型Grok 4吊打GPT-5。ARC-AGI-2测试分别15.9、9.9。 不服的或许还有原GPT-3主导者Dario,编程能力其大模型Claude 4.1和GPT-5难分高下,SWE-bench测试分别74.5、74.9。 为此,OPENAI总裁拉来知名智能体平台Cursor的 CEO,现场体验助阵。还请用户演示AI修改代码中的BUG。 数学能力、理解图像视频的多模态能力,GPT-5优异,数学竞赛满分碾压人类,但仅比之前o3版本略有提高。 (二)最快捷、最实用不易比较,但重实用。 1.快捷(1)推理耗费Token的数量,GPT-5比o3版本减半(2)大模型统一为GPT-5,用户不用切换不同模型,由智能路由器,按用户问题难易,进行快速回答或深度思考(3)处理长上下文性能稳定,之前o3版本长100万Token时,性能衰减严重 2.实用(1)GPT-5向免费用户开放。 (2)轻量版在电脑、手机可用。 (3)在法律、物流、销售和工程等 40 多个行业,优于 o3 版本和 ChatGPT 智能体。 (4)已用于容错率极低的医疗行业。CEO奥特曼亲请癌症患者上台,讲述GPT帮她分析病情、查找医生、决断治疗方案、解释检查报告等。 (5)创意方面,写作更人性化,报表更优雅,小游戏更好玩。 3.最突出进展:更可靠。可信、安全是实用的基础。 (1)幻觉大幅降低。事实类降到低于1%,比 o3 模型降80%。其中医疗类降到1.6%。 (2)诚实度大幅提高,欺骗率降到2.1% (3)安全机制新模式。对于制造火药、病毒等问题,拒绝回答并给出原因。 #人工智能 #实用好物 #ai#OPENAI @哇喔 @科技日报 @四川观察 @科技公元 @混知 @九派新闻
00:00 / 00:42
连播
清屏
智能
倍速
点赞2
00:00 / 03:17
连播
清屏
智能
倍速
点赞548
00:00 / 01:13
连播
清屏
智能
倍速
点赞22