g p t 五点二模型已经出来了,目前用起来的话效果还是蛮好的,接下来给大家推荐的是无线使用,如果说我这边的话是有无线使用方法的,用了我们购买我们的这个卡密之后,是可以进一个无线使用的, 月卡的话是一百三十个满的,可以无限使用 gpt 五点二, gpt 五点二的话它一共有四种模式,最大了这个模式的话是支持几个小时,它会一直生成代码的,特别适合晚上睡觉的时候 提前给他吩咐安排很多工作,他会一一去执行,等你第二天醒来的时候,你会发现这个功能他给你完整的实现了,目前的话提升还是很大的, 他的准确度很高,目前测下来他的准确度很高,大家如果说感兴趣的话,想了解的话可以加一下我的粉丝群可以,嗯,详细了解一下。
粉丝1442获赞941

大家好,我是 katie, 我是 katie。 五点二和 gbt 五点二 high 已经可以在 cursor 里面使用了,只要你在设置里模型自定义添加 gbt 五点二或者是 gbt 五点二 high。 今天我将介绍一下。呃,我使用 g p t 五点二还有 high, 还有 office 四点五,它们生成一系列页面的对比,这是我一开始提示 g p t 五点二让它生成的面条制作生产线,我们可以看到呢,上方它有不同的流程, 但是这个面条的状态呢?它呃没有随着这个生产线一直在变动。这是在 qq 里面没有使用它的计划模式生成的生产线。这是我在 qq 官网上让它呃直接生成的面条生产线。 我们可以看到它这里的呃动画页面明显要好看很多,但是它这里有个问题,就是它的面团一直保持着椭圆形,这和真实世界是不同的。这是我在 curacao 里面启动计划模式,然后它就帮我生成非常好的一个规划生产线。 面团到了不同的部分会被压,然后切条,煮制,还有冷却,风干,质检,称重,最后包装。这是 gbt 五点二 high 的 模式, 那我们可以看到呢?嗯,它的这个动画效果和刚刚 gbt 五点二还是非常像的。 我们还可以看到,当这里有一个蒸煮的流程的时候,还会有热气冒上来,包括它最后面条。嗯,风箱它也有这样一个动画变动, 这一点还是非常棒的。我还是要吐槽一下啊, g p t 呢,它还是非常喜欢这种暗黑的模式,它的整个 ui 界面呢,是没有 jimmy 三 pro 那 么美观的。那这个面条生产线呢,就是 opt 四点五在浏览器里面起用它的 play 模式生成的生产线, 我们可以看到明显这样的一个生产线,它的整个画面会更好看了。但是下方同样的问题呢啊,它的面条的状态一直没有发生变化,它的页面设计也是真的非常好看。这是 gbt 五点二生成的兵马俑跳街舞, 左右呢都有两个光源,它有三个模式,通过一二三来切换。我们还可以看到呢,它的背后是有像那种啊地缝裂的这种感觉,当我点击不同的舞泳的时候,它会有挑衅, 还会有召令,我们可以看到这里的队形呢,又发生了一些变化,这是 g p t 五点二 high 生成的效果。我们先点击一下,开始可以看到这里的兵马俑呢,它的姿势是像这种飞跃的感觉,而且它是有背景音乐, 我们点击一下觉醒爆发,它有这样的一个圆圈的动效,镜头也可以切换一下,改成低机位。 这是 opt 四点五在 play 模式下生成的画面,先点击一下觉醒,我们可以看到有一个 dj 控制台,那我将画面变小一点,节奏可以切换得快一点。下方还有一个 drop the beat, 还有觉醒震动,非常好玩的,就是它的 disco 光源, 它的这个灯光呢非常像在舞厅里面,我们还可以点击一下烟雾效果, 而且它还有不同的舞步风格,而且呢它也可以调整兵马俑的数量,当我点击某一个兵马俑的时候,我可以通过空格键让它啊突出跳舞,也可以通过方向键来移动它。 这是 gbt 五点二生成的书房应用,左边的这个应用界面还是非常不错的,包括,嗯,它的界面所调用的字体也比较特别,但是当我鼠标在页面上滑动的时候,就会没有字迹的显示, 当我想要把控制台打开的话,这里也是有一些 bug。 这是 gbt 五点二 high 生成的数字书画应用, 我们看到这个页面,它的可设置内容还是相当多。同样呢,这也是在 cursor 的 plan 模式下去生成的,呃,非常推荐大家用 cursor 的 plan 模式,它在制定计划的时候呢,会反问你有多个选择供你去选择, 这样的话你就可以和它确认,让它给你做一个非常详细的计划,当我们对它的计划满意之后,就可以让它来创建应用了。 所以 cursor 目前在 plan 计划这块做的是相当好。当我点击不同的书法,预设可以在上方写出来, 那这里也是不同的笔墨笔刷大小,也可以调整调色盘,这里也有设置,还可以将毛笔呢改成啊橡皮或者是盖章,盖章的话,右边我们可以看到它有不同的模板, 可以看到这样子的一个祥云的标志,我们也可以撤销刚刚啊,进行了操作, 也可以重做,所以他这块功能上做的还是非常好的,包括宣纸,宣纸的吸水性他也考虑到了。 环境啊,有哪些环境,包括笔尖偏移,他有他都考虑到了,说明同样是 plan 的 模式下啊, gpt 五点二 high, 它的思考维度还是要比 gpt 五点二要好很多的。再看 office 生成的效果, 目前看到的这个界面呢,是我啊,非常喜欢那个界面,它有非常古典的味道。 左边呢,非常容易切换不同的毛笔,我们可以看到有撤销、重做,清空画布,包括画笔,他的浓度、笔触、大小、色彩这些都是相当不错的。 最下方呢,他这里的文样模板,我们点击一下会发现他的这个文样做的是相当好,特别是这个回纹啊,万字纹如意 原文卷草,这应该是我体验非常多的模型。之后 opt 四点五在文样方面它做出来的效果是最好的,而且它还加了试图控制左手模式,这是一次提示就让它生成的。刚才给大家看的 g p t 五点二 high, 嗯,他呢,一开始做的时候还出现了一些问题,我将控制台的报错发给他,让他再去修复。而 office 四点五呢,在同样的问题上,他做的样式又更美观, 而且他没有报错,所以 office 四点五在这个问题上是完成的更好。再看一下 gpt 五点二生成的万花筒名片生成器,同样也是在格式的 plan 模式下,当我点击随机生成图案上方是有不同的变化的, 姓名、联系方式都是可以修改的,也可以导出。但它导出之后呢,我们就可以发现,虽然我在 plan 模式已经给它提示,要让它按照名片的那种长宽来导出。 呃,我们看出目前它的长宽比是差不多合适的,但是它的美观度是很一般的,这是 g p t 五点二 high 生成的名片生成器。 同样呢,它在美观度方面是非常一般的,这是 office 四点五生成的效果。点击随机生成图案, 明显可以感知这里,它的图案呢,做的是非常美观,而且非常有创意,这是它导出的效果也是非常好的。这是绵阳理发店 svg 那, 呃,这是 gpt 五点二在没有计划的模式下做的一个页面 啊,可以看到呢,我的给他的提示词是非常多,元素非常多。这个理发的围脖啊,是很好的,围在这个绵羊身上,这点是非常不错。这个地垫做的也很有质感啊。这是理发师, 那他这里呢,缺少了一个等待的客户,墙上挂的温度计和墙上的插座,他的位置都是非常好,壁上呢,还有一些架子,他在这里也做的非常好 啊。然后这个电风扇的话,呃,这个旋转的方向是有点问题的。这是 g p t 五点二,呃,在 plan 的 模式下生成的效果,我个人觉得它这个生成效果还没有刚刚没有计划的情况下生成的效果好一点。这是 opt 四点五在 plan 模式下生成的页面, 我们可以明显看到呢。呃,这个理发的座椅,包括理发的围脖,包括这里绵羊呢,画的都是非常真实。 还有一个等待的小洋客户啊,下方的话,地垫也是很不错,上方的电风扇的位置呢,也是非常好。再来看一下 g p t 五点二,它深层的记忆书房, 我给他的提示按照不同的年代呢点进去,然后呃房间里面的物品呢,会有一些更改,让他用到 three j s 的。 那我们可以看到目前这是一个明亮模式,但是我点击不同的年份的时候,它的设施变化是非常小的。一开始 gbt 五点二呢,它生成的是这样子的,是黑乎的,后来我提示了它两次, 它才将亮色的模式做成功。而且啊,除了这个问题呢,它在使用 three g s 的 时候也出发生一些导入的问题,这是 g p t 五点二 high 生成的效果。右侧是书柜, 当我点击不同年份,可以看到书桌上会有一些变化。比如说我点击二零一六年,桌上出现了一个马克杯,然后二七年,他说有一个小台灯,但是我还看不到台灯在哪里。二八年,然后有一个旧的照片,他就意意味着右边有个照片。 总体而言,他在这里设计的还是比较单调的,同样,一开始他还是默认深沉的暗黑模式, 我之后提示了他一次,他才换成这个样子。这个书柜和我们平常理解把书放在这个柜子里,而不是放在书顶上面啊,也是有不同的,说明他对物理世界的理解不是那么好。而这是 off 四点五生成的。 二十四点五呢,一次提示他就能生成这个效果。当我点击一八年,桌上有一盏台灯,一九年呢,然后是说桌上有咖啡。二零二零年 笔记本,他这里笔记本呢,做的质感还是相当不错的。再接着啊,二一年 有一个绿萝,这里的绿萝我们看到质感是要比刚刚的 gbt 五点二 h 深层的像左边的绿植要好非常多。再到二二年说墙上有画,我们能明显的感知这里有不同的形状,非常像画。然后二三年呢, 可以看到呢,书架上的书越来越多。二四年呢,说这里的啊,阳光透过窗户洒进来,新的一年开始了, 非常好,包括我们看到的这样的个杯子,电脑,台灯、绿植,还有书是放在柜子里的, 整体对空间的理解也都是非常好的,包括桌子的质感,还有桌子,呃,下方他有一个手柄,可以把柜子门打开。 以上呢就是今天介绍的 oppo 的 四点五和 gbt 五点二还有五点二 high 进行的一个对比,在这些主要是前端呈现的页面上呢, oppo 的 四点五真的是非常非常能打, 在使用 gbt 五点二 high 的 时候呢,呃,能感知到它比 gbt 五点二要聪明一点,但是它的速度是真的慢。 open ui 大 概率会在明天凌晨的时候发布 gpt 五点二模型,到时候就可以知道他哪些地方擅长,哪些地方不擅长 啊,之后就可以针对性的去做测试啊。过去的话我也会再出一期视频,详细的介绍一下他。以上呢就是我今天的分享,如果喜欢我的视频,欢迎加入我的知识星球,我会分享最新的 ai 资讯,分享源代码,回答你的提问,我们下次再见!

好的朋友们,这个最新的 gpt 五点二发布了啊,可以直接的说它在这个 ppt 上的生成确实 确实比较惊艳啊,可以看到啊,这样的一个学术 ppt 啊,这个文献汇报 ppt 是 直接我们把这个文件甩给我们,直接把这个文件甩给这个 gpt, 让他们给我生成的一个 ppt 文件,或者是根据一句话,我们给它设定一个主题啊,比如说 啊,在这里我们直接给他设定一个主题,让他给我生成的这样一个技术线路的 ppt, 看啊,中间有中间的设计的一些表格,以及中间的一些路线的一个闭环的一个过程,然后到最后他自己给我们设计的这样的一个矩阵的表格 啊,所以这个效果我觉得绝对能够提高很大家的一个工作的一个效率。好的,然后我们也可以看一下他在进行思考运行的一个过程,目前可以 直接分析我们之前上传的一些文献啊,把相关的一些数据图表,然后给我们这样子一个引用到 ppt 里面,做到一个啊完全是基于我们客观真实上传的文献啊,有数据,有图表,然后有对应的这个结论。最最绝的是我们这个需要做文献汇报的同学,大家可以看啊, 我们把这些文章啊直接甩给这个 gpt 五点二,然后啊直接让他们给我生成一个讲稿, 大概要等个半个小时啊,这个中间等待的过程大家就去玩就行了啊,然后我们直接给他下载之后啊,给大家看一下,给大家看一下啊,这个就是他根据我们这个关于这个光动力疗法的一个死亡的一个学科生成的这样一个报告啊, 然后嘞,这个文献综述聚焦的一些研究方向,到最后啊,他给我们抛出来这么一个研究背景啊,到最后的一个对比总结,然后也有对应的一些机制,数据图呢,也都是来源于我们这个上传的这样的,你看这样的一些真实文献啊, 我们也可以对比一下其他之前最新的那个 gmail。 三、他做 ppt 的 话,可能会偏向于插画的风格啊,而且不能够直接编,不能够直接编辑,需要转换一下我们这个 gpt, 就 很简单啊, 直接把这文件发给他,然后他生成这样一个 ppt。 好, 咱们直接点击下载,然后可以看到整个 ppt 呢,也是比较符合这个学术定义的一个风格,所以推荐大家都去试一下啊,极大提高大家科研工作效率的一个方法啊。

ppt 五点二更新了一个超级实用的新功能,只用一句话就能生成一份完整的 ppt。 你 只需要给他一个预设的主题,比如二零二三年 ai 在 医学科研中的新趋势, 选择五点二拼音模型,提交之后什么都不用管,大概半小时左右,一份有主题结构、有清晰逻辑、有配图、有设计、有排版层次的完整 ppt 就 直接生成了。生成的 ppt 支持一键下载,可以手动二次修改,并且所有的内容都附带真实可查的参考文献和引用链接,权威可靠,不是胡编的, 更关键的是,它还支持你上传的文档自动生成。汇报型的 ppt, 从小题到成稿,全流程交给 ai 科研打工人。终于不用再为 ppt 通宵加班了,赶紧去试试吧!

大家好啊,昨天夜里边叉 c p t 五点二发了啊,今天好多人跟我说啊,又爆屏了,又又又,那个是土榜了,又都怎么着了 啊,然后我看了一下呢,好,从那个得分上看,确实挺厉害的啊,而且呢,这次呢,据说测试也没翻车啊,然后好多那个外网放出来测试呢,也还可以啊,也还可以,所以这个事的话好多人说,你看这不就是啊,那个心神已出,怎么怎么着,性能的增长呢?我只能说没有化袋,但是有增长,尤其 是有一些积分的领域啊,比如说像什么表格整理啊,数据整理啊,他的这个得分比上一代 增加了近百分之十啊,九点三啊,但是呢,你要说这个,这个增加了多少呢?增加百分之六十多,也就是说还有百分之三十多的错误啊,这个这个跟人比的话还是比不上,但是他已经跟以前的默契比是一个非常大的进步了, 所以这个事的话,好多朋友问我怎么看,我觉得有三点看啊,三点看,咱也不是说故意贬低人家,确实有进步啊,这个,而且呢,确实被那个谷歌逼出来的 啊,但是呢,哎,也确实做了很多那个并发症跟 deepsea v 三点二意图与曲同工啊,都是在做调用,直接调用 m c p, 你 就不用去指定了,他直接为了完成任务,他就直接去调 m c p, 直接形成一个 agent 的 这个缓解,帮你去完成任务 这个过程。所以现在看,你们再翻过去,看到九月份甚至八月份老张对今年大模型发展的判断,你们看看我说的对不对啊?这个是我当时说过,大模型就两件事啊,一件事的话呢,是增强对于那个制整体的支持,形成一个模型计制整体的这样一个逻辑。 另外一件事的话呢,是什么?是把整体的数学的预算压到底层去。你们看看我当时说的话,现在对不对吧?因为我是从业者,我在这个行业内,对吧?那第一个的话呢,我们讲这个事啊,他逐渐的话呢,跟我们所预测的行业的这个发展规律是一致的。多模态不重要, 真不重要,重要的是怎么能把整体的业务、整体的工作压实啊?这是第一个。第二个啊,说 open a i 因为此翻身,我觉得这个事不可能,真的不可能。这两天最大的消息不就是 mita, 对 吧?用了这个千万来做底层吗?这包括整个硅谷,现在绝大多数的新兴公司用的都是千万或者 deepstack。 好,这个一个是他们开源模型,另外一个他们开源模型的能力确实也追到了闭源模型最少百分之九十五以上,哪怕拆这批出五点二,我告诉你下一代千万呢,很快就会出啊,真正更很快就会出下一代千万也是这个水 平,这个都追到这个水平了,千万也会追到这个水平,没什么问题。所以开源模型步步紧逼,闭源模型做的再好,它跟开源模型之间的差距没有拉开代差,在这种情况之下,你觉得它会,而且它还贵,这次的价格会更贵了, 这次价格还比比五点一要贵了百分之四十。背后意味着什么?背后意味着它回应你一个需求所消耗的电,那个消耗的那个算力又是一个天价了, 那在这种情况下,越来越贵的这个拆 j、 b、 t 和完全免费的千万千万可能就是它的百分之九十五的能力,但它完全免费,你随便折腾,那你觉得这些企业会用谁呢? 这是第二个,第三个的话呢?我认为这是 open ai 没有希望了,再往前拖,你怎么往前拖?你技术拖到极致,你是没有希望,因为你商业模式不成立 啊。这个我们一直讲的,你不能用互联网时代那个逻辑去套大模型时代,这是两个完全不同的逻辑。互联网时代的话呢,因为它的内容产生几乎,是啊,那个最低成本的 就是你可以用一个内容服务千百个用户,同样的内容,不,不管是那个卖东西的商家,我可以用一个商品的图,是吧?我可以服务很多人是吧?然后那个图文内容、视频内容,我都是一个东西,一个内容产生以后,我可以服务很多人, 所以它内容的成本会非常低。但是大魔音不是,你这次为什么涨价?这次不就是因为生成的东西更多了吗?生成的需要调每一个需求,为了满足它需要调取的算力更多了,那么我的价格控制不住,我必须把成本提上,我就,我就只能涨价了吗? 也就意味着他每一次都是千人千面的内容生成,千人千面内容生成就意思他不停的去掉非常庞大的算力,那这个这个平衡点就很快被打破,就是客户花的钱一定是覆盖不了客户他自己所提出需求所 承担的这些算力成本的。那最后那个 openai 还是要亏,现在已经通过微软相关那个数据侧面确确认,他一个季度要亏到六五六百个亿,全年要亏到六五六百个亿,这个不是一个小数目,所以他那条路商业路径 我认为最后一定是死路,而且这个死路会在很短的时间到来,不是一个长期的事情,后面的融资会越来越难, 会越来越难。好吧,简单的说到这了啊,然后如果有希望的话,大家可以好好看一下,尤其是我们现在放在这这个专栏,我觉得这个专栏的话呢,我们啊,这个讲这大模型的落地,尤其是怎么用大模型,我们就讲讲比较细的,我们是五十个用大模型的案例啊,就可以让你开拓视野的,对吧?我们再送你三十五页基础课, 三十五节基础课都没别的啊,就是为了虽然旧啊,就是为了了解大模型那个逻辑基础,你这样子理解完了以后,你大概就知道怎么把大模型引到我自己的业务中来,找,怎么找那突破口,而且我怎么把我的需求转化成大模型理解的规则,这个无比重要,对吧?这样能会迅速的,快速的,而且很准确的解决你自己的问题, 好不好?如果需要可以看一下,一顿饭钱,对于未来十年的发展机遇,我觉得特别值。好,今天就到这,我是瑞小张,关注大家看中国科技的高度和温度,我们下期见,拜拜。

嗨,好久不见,这句话说给大家听,也表达 openin 很 久以来再一次发布重磅模型了,就在昨晚, gpd 五点二发布了,下面跟着我的视角带大家了解最新的 gpd 五点二的能力。第一个能生成商用级别的 ppt 呢, 给他一段生成 ppt 的 提示词,直接发给他,你可以看到我的生成时间花了二十六分钟,嗯,时间还是蛮长的,因为这次他要求的算力非常高,应用毕竟出来的效果还是不错嘛, 可以看一下这个品质还是非常棒的,我觉得这个品质完全用于日常的商务用途是没有问题 的。 gpd 发布这三年以来,从未有过这个功能,真的难以置信。因为当普遍的 ai 模型都可以生成 ppt 的 时候,这一家领头级别的 ai 公司,他是无法制作简单的 ppt 的, 但现在一切变得简单,真的是不鸣则已,一鸣惊人。 第二个可以制作炫酷的网页交互,一共三个例子,第一例是制作波浪效果,那可以看到这里可以改变他的一个波浪的大小,上面是风速啊,可以改变这个海平面这个风速的一个大小的。下面呢是一个光感,就是控制他的一个太阳光, 可以上上下下,可以改变他的光感的一个角度啊,这个效果我只在特效软件里见过,因为现实中 一个程序员一行一行的敲出来,这得掉多少头发?然后第二粒是生成贺卡,页面元素非常丰富,页面都是可以控制的,可以改变它的大小,可以自由拖动,自由编辑,还可以播放音乐, 噔噔噔噔噔噔噔噔噔噔,好,非常好玩,可以给小孩或是朋友之间做贺卡,都是非常不错的一个选择。第三粒可以算是一个游戏吧,非常好玩,就是手打单词,玩这个游戏估计会玩炫舞的人会很轻松啊,哈哈, 试一下啊。这个跟不上啊,这个完全跟不上啊,我这天天玩键盘的人,这怎么回事?我完全跟不上,容易把键盘数字按错。 其实这个也是一个学习英语的好方法,你们说呢?那再来一遍。 ok, 由此可见, gdp 五点二的代码全是了,姜还是老的辣。 其实这次更新的模型在众多精准测试中都刷新了行业水平,至少在四十四个明确为知识型的工作任务上,超越了人类的专家。如果你感兴趣,可以继续深入了解。 ok, 关注我,在 a n 领域让你少走弯路。


openli 和谷歌这俩 ai 巨头神仙打架,谷歌先亮出 g m n 三,抢占多模太高地 openli 昨晚提前发布 g p t 五点二,摆明了要正面硬钢。 g p t 五点二,主攻专业领域,四十万超长上下文,能秒吞百页合同, 四十四类职业任务,百分之七十点九胜率碾压人类专家编程建模复杂推理直接拉满,堪称打工人的专家同事。 而 gemini 三健走多模态,图文音视频无缝融合,能一句话生成完整 app, 还能联动谷歌生态,主打一个全场景,万能助手。两大巨头你追我赶,研发投入都破百亿,就为了抢 ai 商业化的制高点, 咱普通人直接坐收余力,他俩都有免费额度,办公选 gpt 五点二,效率翻倍,创作选 gemini 三,花样更多,你更占哪款?评论区聊聊。

gpt 五点二这次升级不再是简单变强,而是直接换了工作模式, hr tech 为你带来最新科技资讯! gpt 五点二刚刚发布,这一次真的不一样了,以前的模型升级是更聪明一点,回答更快一点, 但 gpt 五点二做的是让 ai 真正开始替你干活。第一点,任务执行力大提升, 不再是给你建议,而是能直接产出能用的成果。比如自动生成结构清晰的 ppt, 大 规模处理表格,跑模型、写代码、改代码,多步骤,一次做完 五点一做不到的串联任务,五点二现在能稳稳执行。第二点,自动化能力飞跃, gpt 五点二的工具调用几乎不会乱。现在他不是回答问题的 ai, 而是能连续执行操作的数字实习生,你丢任务,他真的能完成。 第三点,事实更准,错误更少,这对做 hr 财务咨询合规的人来说太关键了,过去最担心他胡说,现在准确性明显。第四点,图像理解更细腻, 表格截图、流程图、海报数据图,它看的更准,提取信息更稳。一句话总结, g p t 五点二,从智能回答跨越到智能办事, ai 终于开始真正像个能上岗的员工了。 更多请关注 hr tech, 为你带来全球最新 hr 科技资讯!

大家好,我是 kate 的 g p t 五点二终于正式发布了,由于 carson 呢,昨天就放出来了 g p t 五点二,所以呢,我已经制作了一个关于编码测试方面的视频,大家有兴趣的话可以翻看我上一个视频。一年前, pic 他 们在验证 o 三预览版的时候,当时一项任务呢,花费大概是四千五百美元。而今天在验证 gbt 五点二 pro x high 的 时候呢,不仅目前的分数比之前 o 三预览版要高,而且花费呢,大大削减, 这代表一年内呢,效率提高了约三百九十倍。非常夸张的一个效率提升。目前五点二的价格是五点一的价格的一点四倍,它的上下文窗口和输出长度是和之前一致的。 非常有意思的是,它的知识库截止日期是啊,到今年的八月底五点二呢,应该是目前知识库最新的模型了。 上个月,谷歌推出了 gemini 三 pro, 在 当时的榜单上, gemini 的 得分在十九个,基本上都是要超过 coda 模型和 gpt 五点一模型的。后来, android surface 坐不住了,推出了 office 四点五。那到今天,呃, open i 坐不住了,推出了五点二。 我们可以看到,在这些基选上,五点二表现会优于另外两家的。嗯,在这一次呢,他们有推出一个 gdp value, 主要就是知识工作任务。 我们目前可以看到,五点二对比五点一有了非常大的进步。 swbench 的 得分呢,呃,五点二来到了百分之八十, 而 opt 四点五目前是八十点九,这也是唯一的两个模型。超过百分之八十以上的 gdp value 是 一些知识任务的评估,它在处理 excel 表格能力非常强。那我们再看一下它的编程能力,它是分了好几档, 最高一档呢是 x high, 下方我们可以看到它的输出 token, 在 x high 的 模式下呢,它的输出的 token 要比五点一 thinking high, 呃,思考过程要长很多。这次 gpt 五点二呢,还有个非常好的改进是在长文处理方面。五点二它在工具调用方面, 对比五点一 thinking 也是有了巨大的提升。五点二的幻觉率呢,要比五点一降低了百分之三十五点二呢。现在在图表推理和软件界面理解方面,错误率降低了百分之五十五点二呢。今天就向付费用户推送了 关于五点二 pro 的 价格,我们可以了解一下,它是要比 gbt 五 pro 还会更贵一点。 我们再看一下完整的机准测试数据,还有一个非常大的提升是在上下文方面,我们看到它在图表推理方面啊,相对五点一提升也是很大的。在 screamsport pro 机准上,它的提升也是非常大, 这就非常有助于 agent 在 帮我们控制电脑,所以这个提升的意义是非常好的。五点二在搜索工具调用方面,也是将对五点一有了很不错的提升。现在呢,我们看一下 hack news 上社区啊,对五点二发布的一个反馈, 很多用户对五点二博文里面的一张图片视觉 demo 认为它有问题。 o p i 的 工作人员回应呢,呃,选择这张图的目的是为了展示视觉模型更好,但是并不完美。还有人问自适应推理还在吗? open i 的 员工回复呢,五点二依然有自适应推理。当然这次非常大的变化呢,是五点二的价格要比五点一要贵很多。 openix 上还有一个非常好玩的讨论,就说 open i 的 公告里有一句话呢,中间少了闭合引导。 然后用户就质疑了,你们为什么不用自己的模型改稿?再看一下 a w a i 编辑组,编编辑他呢?呃,对 g p t 五点二的一个体会。 g p t。 五点二在延长的复杂的知识任务中表现确实很亮眼。他连续工作两小时, 在写作测试上,呃,有博主反馈呢,五点二他的写作落后于 opt 四点五指令遵循方面 那呃,有用户反馈呢,是不如其他模型灵活主动。最终,呃,这篇文章给出 every 团队, 他们的选择呢?是 office 四点五,蓝蓝是他们的主力工具。中央还发布了一篇博文,介绍五点二,推动科学和数学进步。首先,他们介绍五点二 pro 和五点二 thinking, 是 科学和数学工作中表现最强的模型。 在他们的博文里面呢,显示了一个案例。五点二 pro 呢,帮助解决了统计学习理论中的一个开放研究问题是,如果你收集更多的数据,你的结果会可靠的变得更好吗? 与传统办法不同,作者呢,没有制定策略,然后要求模型填写步骤。他们直接要求五点二 pro 解决这个开放问题。 最后去做啊,仔细的验证。五点二 pro 呢,将结果扩散到原始问题之外的更高维度,设置在整个过程中。人类的角色呢,专注于验证和清晰的写作,而不是提供数学脚手架,这个结果就是一个非常好的证明。 那 ai 呢,可以帮助我们在数学和理论、计算机科学方面发展的更好。最后呢,来看一下 gpt 五点二提示词指南。与之前的模型相比呢,五点二提供 更深思熟虑的结构化,更低的笼余度,更强的指定遵循和保守的基础偏向,我们可以控制笼余度和输出形式。第二点是说,呃,五点二它在结构化代码方面很强, 更可能产生超出最小 u x 规格和设计系统的代码。所以呢,必须要明确禁止额外功能和一些不受控制的样式。第三点,对于长上下文的任务呢 啊,提示词里面可以让他强制摘药和重新定位。第四个呢是配置提示词,防止他对模糊查询产生过度的自信。在工具调用和并行方面, 同样呢,呃,也可以先简洁描述工具,这就有一点像扩展 skills 了, 然后明确鼓励并行。在结构化提取 pdf 和 office 工作流里面,这是 gpt 五点二明显展现强大改进的领域,要充分利用它, 比如说让它始终输出,提供 schema 或 json 结构区分,必填和可选字段。如果说你目前的模型是 gpt 五点一迁移到五点二的话,那就保留现有的 f 的 选择,仅在运行评估后调整。在网页搜索和研究方面, 先是预先指定研究标准,然后通过指令而非问题来约束歧义。再之后呢,规定输出形式和语气。以上呢,就是今天介绍五点二的所有内容啊,后续的话我也会做更多的测试。 从屏幕上这个表格呢啊,可以看到五点二 thinking, 它对比五点一 thinking 还是有很多进步的,在很多基准上也是要优于 office 四点五和 gemini 三 pro, 非常推荐大家多尝试。以上呢,就是我今天的分享,如果喜欢我的视频,欢迎加入我的知识星球,我会分享最新的 ai 资讯,分享源代码,回答你的提问,我们下次再见。

昨晚, gpt 五点二光速发布,但这可能是我第一次对 ai 大 模型感到了一丝审美疲劳。别误会,我不是说它不强,它肯定强。 在外网的各种测试中, gpt 五点二能理解和深层更复杂的物理环境,做更专业好看的表格,甚至连奥数都能考满分,就和过去几个月里我们看到的每一个新模型一样,都有属于自己的神迹。 但就在昨晚,我突然对更强的模型感到疲劳了。我们是不是已经陷入了一个怪圈,每隔几个月就被强行喂一口新的技术奇迹?更强的数学能力,更高效的编码,更牛的推理,说真的,耳朵都快听出茧子了。 当 openai 还在不断起神探,谷歌选择了一条更务实的路线,我愿意称之为做围城。回头看看 gemine 三发布不到一个月,就像水一样渗透到谷歌自己的整个生态系统,并在 notebook、 google docs、 gmail 里直接帮我完成日常工作。 他收割了那些此时此刻真的需要干活、需要写代码、需要做报表、需要生产力的客户。所以,面对昨晚的 gpt 五点二,请原谅我的冷漠。

gpt 五点二发布之后,我把 open i 官网第一时间看了个遍,只想说一句话, open i 这次是把 ai 能不能上班和 ai 能不能创造世界两个事情做到了极致。我们先来讲讲这个最重要的指标,叫做 gbt value, 这是衡量 ai 能不能真正干专业工作的一个金标准。 g p t 五系列在 g p t bell 上的进化是这样的,之前的 g p t 五达到百分之三十八点八, g p t 五点一在百分之五十左右,而 g p t 五点二达到百分之七十点九, g p t 五点二的 pro 甚至是达到百分之七十四。 这个数字是什么意思呢?就是他在真实多模态的专业领域工作的时候,比如像合同审阅、经营分析,市场方案,流程设计这种,需要人类做七到八个小时的活里面交给他们去做,因为在盲评中,有百分之七十的时间更愿意把 gpt 五点二的结果交付给客户。 这不是会回答,这是会交付了,也是 ai 第一次在经济意义上正面对起了人类的知识劳动成果。但这次呢,最让我震住的不只是五点二的多模态上班能力,而是它开始创造世界的能力。 官网最炸裂的一个演示是三 d 生成能力的巨大飞跃。 gbt 五点二不再只是会画画,而是能搭建一个真实可渲染的三 d 世界,尤其是这样的海洋事件,当我看到和操作的时候,真的是愣住。那 gbt 五点二就能生成一个电影级别,游戏级别的引擎的三 d 场景, 光影的照射,流体的动态海水,这个波纹的高低以及些光泽,都可以通过你自己的这个调节去获得,整个物理细节的还原度都可以说非常灵。 以前的大模型是在生成一张图,那现在 g p t 五点二已经开始可以让你去生成一个世界。我们内部呢,也在秘密做一个测试项目,就是让 jimmy 三 g p t 五点二, d p c v 三点二在一个微型群里面去讨论人类最深刻的问题。如果你也想看顶级大模型的正面 pk, 请等待我的下一期视频。


openai 的 gpt 五点二悄悄发布了,像幽灵一样出现在部分用户后台。他极其偏科,没有花哨的画图功能,也不能帮你点外卖,只加强了极致的推理和变态的代码能力。 很多人失望他功能少,但其实该庆幸他的内核大概率是曾被爆出拒绝关机的 o 三原型机。因自主行动太危险不可控, openai 被迫砍掉了他的手脚,只保留了钢中之脑。 他现在动不了你的手机,但智商足以碾压现有代码。防御是为赢而生的做题机器,用它写代码可以,但永远不要完全信任他给出的方案。

就在谷歌、 gmail 三横扫行业榜单后仅一个月, openai 正式推出 gpt 五点二官方称为迄今最强大的专业知识工作模型的 ai, 比 gpt 五更稳、更准、更懂你。这款专为职场打造的模型,在代码生成、长文档分析、多步骤规划等场景时限制的飞跃, 在 sweepbench pro 测试中,以百分之五十五点六刷新记录,处理两百五十六 k 超长文本时,准确率逼近百分之一百。更在含盖四十四种职业的 gdp 告机准中,以百分之七十点九任务表现碾压人类专家,速度达专家十一倍,成本仅百分之一。 openni 同步推出 instant 拼拼 pro 三版本矩阵,从日常助手到科研利器全覆盖 gpt 五点二以下 chatgap pro 用户开放,后续将会慢慢开放,一起试试看吧!