在 openai 成立整整十年的这一天啊,发布了 gpt 五点二,这个名字呢,好像只是一个小版本的更新对吧?从 gpt 五点一到五点二而已,但是从 benchmark 和刷分板凳上呢,相比于之前呢,有巨大的更新,可以称之为啊跳跃。 gbt 五点二呢,也是 openai 狙击 jimmy 三点零的一部戏。我们先来看看有哪些更新,这些刷分如何呢?首先, gbt 五点二 thinking 在 多项指标上都超越了 cloud office 四点五和 jimmy 四点零数学竞赛的 aimee 二点二零二五呢,直接刷到了百分之一百。 这里值得一提的是,最后这个指标叫 gdp vel, 就是 这个指标呢,其实跟 gpt 没什么关系啊,这个是测量行业专家对于大模型输出结果的偏好程度, sam 奥特曼也是专门发了推特去说明,这个指标 也代表了呢, gpt 五点二在这个指标上遥遥领先于其他的一个模型,尤其是相比于 gpt 五点一上有飞跃的提升,从百分之三十八点八到百分之七十点九,这就意味着呢, gpt 五点二可以更好地帮助我们提升工作效率。 针对 gpt 五点二,如何提升我们的工工作效率,官方也举了几个例子啊,第一个就是 workforce planner, 就是 人力规划和预算。第二个呢,是让 gpt 五点二扮演投行的分析师,做股权结构表的瀑布分析。相比于 gpt 五点一呢,这个 gpt 五点二 正确的完成了所有的计算。第三个呢,是这个项目的管理, gpt 五点二呢,可以输出这样的直观展示的干的图,相比于 gpt 五点一,那直观上面它有更好的 visualization 的 效果。另外值得一提的呀,是 jimmy 五点二的代码能力 在 swebench pro 上面呢,超越了 cloud opus 四点五,我们可以在这里看到啊,这个 swebench pro 的 上面的一个指标达到了百分之五十五点六。 a cloud, 呃, opus 四点五呢,只有百分之五十二,我们直接看一下官方给出的一些例子啊,这些代码编程的例子,首先第一个啊,它做了一个海浪的模拟 ocean wave simulation, 你 可以调节这个风速,还有海浪的这个高度。还有一些观影 来看,这个是作为圣诞的贺卡,有一些互动的感觉,然后你可以点这个 shake 来进行震动。 还有像这个呢,是一个打字的游戏,就是那个字母像会落下来,然后你就可以去 通过打字练习打字的游戏。幻觉问题呢,这次也做了优化,评估了整个 ai 响应的这个错误率啊,被判定为错误或不准确的比例呢,只能从之前的百分之八点八也下降了百分之六点二。 长文本能力啊,也是 gpt 五点二的一大更新,对于文案从业者来说不失为一大助力啊。 openai m r c r 的 v 二版本,这视帧测试中呢,相比于 g p t。 五点一,在长达二十五万 token 的 长度下呢, g p t。 五点二依然可以保持接近百分之百的一个匹配准确率, 这足以说明 g p t。 五点二的一些长文本的一些能力啊。另外呢,我们可以看一下它的输入 token 的 数量,首先在 context window 就是 上下文这个窗口呢,它可以达到四十万,然后输出的最大的 token 可以 达到十二万八千。 然后域训练的数据也是非常新的,截止到二零二五年八月三十一号的这个域训练数据,虽然能力有提升,但是大家在使用的时候呢,还是建议大家带着质疑的眼光去看待呃, gpt 五点二输出的结果因因为毕竟幻觉问题还是存在的。 另外呢, gpt 五点二今天开始慢慢推送给了付费用户,如果你是付费用户,在左上角还没有看到 gpt 五点二呢,代表还没有推送给你。接下来呢,我就给大家简单演示一下 gpt 五点二到底怎么样 进入 cherry gpt 啊,左上角呢,你会发现它变成了 gpt 五点二下拉呢,你可以选择 auto, instant 和 thinking 三种模式。在 legacy models 里面呢,你会发现有 gpt 五点一的以前的模型,还有 gpt 五这些之前的一些模型 我自己也测试了很多啊,主要呢给大家看一下几个对比。首先第一个呢,相比于 gpt 五点一啊, gpt 五点二倾向于马上给出答案,不喜欢啰嗦, 而且人性化的一面更弱了。你发现他给出的答案呢,没有情绪化,活人感比较少。应该这么说,我拿两个例子给大家对比一下。首先第一个就是大家看到的这个,基于我给的食材去推荐菜谱, 那么 gpt 五点二 instant 呢,给出了一个韩式和西式融合的料理,这道料理的名称叫泡菜熔岩鸡腿局,他也给出了具体的做法步骤,所需的食材等等。最后有吃法的建议。 然后说啊,如果你想把它改成下角的小锅,龙卷的版本或空气炸锅的版本,可以给出直接对应的做法。你看这些文字描述呢,你就觉得它就是一个非常书面的,然后很冰冷的一种感觉。这个是五点二 incident, 我 们来看一下五点一的 incident, 同样的 prompt, 他 给出了也是差不多的菜, 就是龙岩泡菜之乡鸡,也是韩式西式融合料理,那给出的是所需的食材,还有制作步骤,你会发现制作步骤的它的描述呢,更偏口语化一点,你看,比如说像把泡菜推到锅边, 还有这种吃的,都很绝,他给出了风味亮点。最后呢,这个建议呢,也是更有情绪化的,更有口语化的一个版本。 我们再来看看让他扮演乔布斯,人工智能让人变懒,看乔布斯的角度,他会怎么去回答这问题,或者有什么看法? gpg 五点二的 instant 呢,就是一个冷冰冰的回答,他就说懒惰不是人工智能带来的发明,而是人类一直更省力的方式啊,叭叭叭。他说了这么多,你会发现他就是一个很书面的,很冰冷的一种感觉。 但是如果我们看一下 gpt 五点一 instant, 你 会发现它就更有情绪,比如说懒惰,别把责任推给工具,真正的问题是什么?制造噪音,还有这种疑问句或者设问句,然后那,那你感觉它是更情绪化的啊。从这个角度来说,我是更喜欢 gpt 五点一了,因为它给你的感觉更有更有亲切感,更像一种人类回答的一种感觉。 第二个,我们来看一下 gbt 五点二的代码水平啊,既然分数都刷到了第一了,这个 s w e bench pro, 那 我们在实战对比一下。拿两个例子,首先第一个我做的是用一个单一的 html 文件去渲染一个三 d 的 飞行模拟器, 这是我输入了 prompt, 然后采用了 syncing 模式输出来的代码。结果呢,也不是一次性生成的,中间又出现几十 bug 啊,我让它进行了一个修复,比如说我点击按钮,它没有开始运行, ok, 最终成品是大概是这样,这个渲染的结果,我们直接来体验一下,点击这里, 好,这个是它做的一个飞行器,我觉得都不像飞行器,然后你可以按它的这个进行操控,我觉得一般般吧,没有符合我的预期。同样的 prompt 呢,我输入给了 jimmy, 进行了一个对比,它一次性就帮我搞定了,没有出现 bug。 好, 我们直接点击屏幕开启飞行器。哎,这个就非常像飞行器的概念, 我就直接给你造了一个小飞机加速俯仰翻滚,这个操作的物体呢,也是飞行器的概念,但是 gpt 五点二呢,没有达到我预期,比较普通。同样的 prompt, 我 给到 jimmy 整体的前端啊,还有玩起来的感觉都更不错。 ok, 这是第一个例子,来,再看一下第二个例子,第二个例子呢,我是让他做一个互动式的教育的模拟啊,去解释一下关合作用,然后这个是 gpt 五点二,给到这个结果非常的丰富, 你可以去体验这个有学生的操作区,你可以进行体验光照的强度,不同的光照强度下,它右边是有不同的反应的,做一个模拟,还有二氧化碳的浓度,它做一些模拟曲线 啊,这个感觉还是很不错的,你可以进行一些操作,下面也有具体的数量,整体进行一个模拟。 ok, 这个是,呃, gpt 五点二给到我的结果,同样的 prompt 呢,我给到了 jimmy 三, ok, 这个是他输出的结果,他输出的结果挺炫酷的,你点击开始实验。同样的,左侧呢,他就有这个光照能源强度可以进行调整,然后他就会有提示说光照作用受限于最稀缺的资源木桶效应。右边呢,就有限制的因子,比如说当前就缺水,你就给他去补水就好了。 当然,呃,相对于 shift gpu 五点二来说, jimmy 输出的结果,这个相对于简单了。然后 jimmy 五点二输出的一次性输出的结果是更为复杂的,而且啊,整个功能也更加丰富。就这个例子来说, jimmy 五点二输出的效果啊,它是更好的。 但从我的多次实践和测试来发现呢, g t 五点二在 app 前端编写代码的时候容易过度思考,有时候呢,甚至会出现这样的超出文档允许长度范围的一个错误,导致无法输出结果。比如我这个屏幕上展示的例子, 那么如果你的 prompt 里面带有这个 reason auto think, 就是 要深度思考这些字眼呢,过度思考就更容易出现。总的来说啊, g p t 五点二目前呢,没有达到我的预期,还不能让我从 jimmy 三点零 pro 就 切换过来。 ok, 这个就是这期内容的分享了,如果你觉得还不错呢,记得点赞、收藏和关注,我们下期再见。
粉丝1862获赞1.1万

来了来了,刚刚更新的 chat gpt 五点二最新版本,我给你们找到了,多模态增强,整体性能与可信大幅度提升,简单三步教你免费获取,下面火速分享给大家。首先我们点击右下角分享键分享复制链接,然后我们打开这个蓝色小鸟, 没有的去安装一个,就会弹出这个资源包,没有弹出的去主页搜索鱼饼资源屋,打开这个文件包,找到我们的工具,右下角保存安装就可以了。

就在几个小时前, openmind 的 gpt 五点二正式发布自己号称迄今为止功能最强大的专业知识工作模型。这到底是 ai 界的又一次挤牙膏,还是真的要颠覆我们的工作方式? 哎,我昨晚可是定了闹钟蹲发布会的,你猜怎么着? openmind 这次直接甩出全家桶 instant、 thinking 和 pro 三个版本,简直是要承包我们从早到晚的所有工作啊! 说到工作效率,官方数据说 gpt 五点二在百分之七十四点一的职业任务中表现超过人类专家,速度还快十一倍。要真这样,一个人又要干多几个人的活了? 先别慌啊,我们来看看这超级打工人到底强在哪儿?最让我震惊的是,他在 swebench pro 编程测试中拿了百分之五十点六的高分。要知道上一代才百分之五十点八,直接把谷歌 gem 三 pro 甩在身后, 编程还不是最绝的,他在数学竞赛 a m e 两千零二十五中居然拿了满分,要是当年高考有他,那我就是天才了。打住打住,说点我们普通人能懂的二五六 k 上下文窗口听过吗?简单说就是能一口气读完四十万字的长篇小说,还能准确记住每个细节。 以后老板再发几十页的 ppt, 直接丢给 gpt 五点二总结就行。等等,价格呢?我记得上一代就不便宜。说到价格就扎心了, pro 版输入二十一美元,每百万 token 输出一百六十八美元,比五点一贵了百分之四十。不过官方说 token 效率更高,长期用反而可能省钱,你信吗? 我觉得最有意思的是 openeye 的 红色警报状态,说是要集中资源办大事,结果高管又否认是针对谷歌健民奶山,这波操作你怎么看?不过有个真黑科技,它能独立完成数学证明。有篇论文里, ai 负责证明,人类只负责验证。 这简直要颠覆科研范式啊!朋友们,你们觉得五年后我们的工作会被 ai 取代多少?欢迎在评论区留言。不过先说好,丢工作了可别找我们算账。放心,至少现在 ai 还不会替我们主持节目。但说真的, notion、 shopify 这些大公司已经在用它处理复杂工作流,错误率比之前低了百分之三十。 那普通用户该怎么选?三个版本看得我眼花缭乱。简单说,日常办公用 instant, 深度思考,用 thinking, 科研编程上 pro。 对 了, plus 用户今天就能用,普通用户可能要等逐步开放。我还看到个彩蛋, openai 说下周有圣诞小礼物,你猜会是什么?新模型还是降价?我读五毛,是 api 接口优化,毕竟开发者们等的花儿都谢了。 十年前 openai 成立时,谁能想到现在 ai 已经能帮科学家搞研究,替程序员写代码了。最后提醒大家, gpt 五点一还能用三个月,想怀旧的抓紧时间记得点赞关注,我们下期再见!拜拜!

g p t 五点二今天正式更新发布了,那么如何在国内使用最新版的 g p t 五点二 gemini 三 pro gulp banana 绘图等主流国际 ai 模型呢? 记住这个网站,进去后点击任意 plus 通道左上角切换想要使用的模型就可以了,有需要的小伙伴赶快去试试吧!

谁说大模型会撞强大模型直接把墙撞飞了! openai 甩出王炸! gpt 五点二,数学科学编码核心精准测试全面碾压 gemini 和 cloud, 强势夺回地表最强最难的 agi 测试直接反超 gemini 九分, 大模型智商再创新高!奥特曼放话, gpt 五点二不仅是最强通用大模型,还要成为你日常办公的 ai 合伙人! 亮点一,最强视觉能力从看图说话进化到看图推理,能像专家一样分析出门道,图表推理和系统界面理解错误率直接减半。运营增长能读懂看板漏斗和留存产品设计能分析原型图、优化交互流程。金融投研能读财报格式化估值模型。 亮点二,最强上下文大模型有两个老大难问题记不住和爱扯淡。 gpt 五点二给出了硬核答案,它是首个大海捞针接近满分的模型,同时幻觉率暴降三成。这意味着你可以把几百页的合同、论文、大型项目的资料放心大胆丢给他,让他做交叉对比和深度分析, ai 终于能融入高精度业务场景,做你稳定可靠的大脑。亮点三,最强办公能力 gpt 五点二,在四十四类职场办公任务中,以七成胜率登顶, ai 办公首次超过人类。专家出活速度比人类快十倍,成本不到人类的百分之一。无论是做表格、写 ppt、 出研报,还是生成各种交付成果, ai 能帮助普通用户每天节省六十分钟,重度用户每周节省十小时。亮点四,最强编程能力 gpt 五点二,软件工程跑分干到八十, 还能更可靠的调试生产环境代码,重构大型代码库,并实现端到端修复,前端能力表现惊艳。擅长处理三 d 效果和 复杂意外,一句简单提示词就能生成带动画、带交互的单页应用。 ai 进化成你的全站队友。 open ai 最终守住了二零二五最强通用模型争夺战,也给自己的十周年交出了体面的答案。奥特曼预告,下周还有彩蛋!

兄弟们,大的来了, gpt 推出五点二版本,拳打 grak, 脚踩街门,奈重登 ai 王座。接下来一个视频教你怎么下载五点二, 首先点我视频分享,再点分享链接,然后打开这个手机版工具箱,打开后会跳出文件夹,没跳出就搜蜻蜓宝库,点进文件夹,点开使用工具,找到这个直接保存就好了。