粉丝8.4万获赞38.9万


就在刚刚,掐着 gpt 五点二上线了,不出意外各种补榜吊打 jimmy 三,不然他也不会拿出来。不过现在这些榜单看看就行了,强不强还得自己来测。这次 gpt 五点二的官方报告中着重强调了他解决日常工作的能力, 所以我们将从这四个维度来测试 gpt 五点二。好,咱们立刻开始。首先,我们让他制作一份二零三零年 ai 发展趋势 ppt, 我 这一等就是五十四分钟, 不过质量是实打实的,从信息收集、背景图片的选择、整体排版布局到具体内容都可以称得上制作精良。所以我可以理解为什么他需要五十四分钟, 因为这是一个人两到三天的工作量。接下来我们测试 excel, 我 让他预测英伟达未来五年的财务报表,然后进行估值。他又运行了整整三十四分钟,但最终的表格让人非常准确合理,而且 excel 公式都是写好的, 你改任意一个数字,表里相关联的数字都会自动更新,整体制作质量不亚于专业金融从业者,好评。第三关,图片理解, 我扔给他一张电脑主机的图片,让他把里面的配件全部标注出来,整体几乎没有问题,就是右侧玻璃上反射的风扇被他当真了, 可以给到八十分。最后来看看代码开发能力,我让他制作一个栗子特效圣诞树,还能一键切换成圣诞老人。我感觉挺漂亮的,还可以旋转让我们切换成圣诞老人。咦, 怎么出来个天线宝宝?好吧,估计也就这水平了。总体感觉和 jammy 三最大的差别就是在长任务上掐的 gbt 五点二明显拥有更强大的 agent 能力, 可能就像在文档里说的那样,它更适合帮助我们完成复杂的日常甚至专业的工作。好啦,今天的初步测评就到这里,关注阿朱,我们将带来更加详细的 g b t 五点二和 gemini 三的横向对比。