粉丝7757获赞2.6万

大家好, g p t 五点二已经可以开始使用了,现在主播就是用的 q 乐叉中的 g p t。 五点二进行一个开发项目,开发一个新功能, 目前的话用下来还是体验挺好的,我让他给我开发一个新功能,他会去进行一个梳理,首先他是进行一个梳理了,梳理后的话他会按照一个顺序进行一个开发, 他的目标还是挺明确的,他会把你整条链路都给开发下来,效果还是蛮好的。跟五点二对比了一下,发现他比 五点二的一个上下纹更长一些,修复问题的话要修复的要准确一些,目前用下来的话效果还是蛮好的,虽然说很多人用不惯的一个原因是觉得他回复太慢了, 但是它的效果确实是挺好的。 大家如果说感兴趣的话,可以加一下粉丝群,可以免费无限使用,需要购买卡密。

同志们, oppo ai 的 gpt 五点二发布了,就在刚刚,没发布会,没有公告,就像一个幽灵悄悄出现在了部分用户的后台,全网都在找新功能,但我劝你别急着点开。为什么静悄悄?因为这是一次被 google 杰姆莱三逼出来的战事。早产。我的数据分析显示这个版本极其偏科, 他没有花哨的画图,也不能帮你点外卖。他只加强了两样东西,极致的推理和变态的代码能力。很多人失望他功能少,但在我看来,你应该庆幸。还记得那个被爆出拒绝关机的 o 三原型机吗? g p t。 五点二的内核大概率就是他。 正是因为他的自主行动太危险不可控, open ai 才被迫砍掉了他的手脚,只保留了这个钢中之脑。他现在动不了你的手机,但他的智商已经足以碾压现在的代码防御。他是为了赢而生的做题机器,用它写代码可以,但永远不要完全信任他给出的方案。我是零一号档案怪物已经出笼,无论他带不带的料。靠。

g p t 五点二模型已经出来了,目前用起来的话效果还是蛮好的,接下来给大家推荐的是无线使用,如果说我这边的话是有无线使用方法的,用了我们购买我们的这个卡密之后,是可以进一个无线使用的, 月卡的话是一百三十个满的,可以无限使用 gpt 五点二, gpt 五点二的话它一共有四种模式,最大了这个模式的话是支持几个小时,它会一直生成代码的,特别适合晚上睡觉的时候 提前给他吩咐安排很多工作,他会一一去执行,等你第二天醒来的时候,你会发现这个功能他给你完整的实现了,目前的话提升还是很大的, 他的准确度很高,目前测下来他的准确度很高,大家如果说感兴趣的话,想了解的话可以加一下我的粉丝群可以,嗯,详细了解一下。

g p t 发布了这个最新的这个五点二版本,那么在介绍中呢,我看到了一句非常重要的话,他说这个 g p t 五点二新品是迄今为止最适合真实场景与专业工作的模型, 这句话其实就是代表了就是 g p d 五点二,它是个非常强大的一个综合模型啊。但是我们关注的是编程方面的,那么它在下面的话,专门对这个编程啊,这个编码方面做了一个介绍,他说在这个 s w e 编程这个测试里面,然后取得了这个五至五点六的这个成绩,然后 也是非常高,比五点一高了很多。然后他他这边还特别强调了一下,就是说在前端的开发能力上进行了很大的提升。那么我们就来看一下,就是他他在这个前后端编程里面到底有没有提升,那我之前其实对五点一是经过测试的,那么前端是一塌糊涂。 ok, 那 我们现在进入测试阶段,那么现在分为这个前端和后端测试,那前端呢?我准备了两个测试,那一个呢是一个这样的一个斗地主的游戏啊,那么这个测试其实有两个非常重要的目的,第一呢是这个测试这个界面 啊,第二呢测试这个前端的逻辑,因为我们不仅要他要做的好看,最起码逻辑要对,对不对?斗地主这个游戏其实有些复杂的,他的规则是非常多的,那么如果能把大部分的这个规则去实现的话, 那说明前端能力是非常强的。那等我它出来结果之后,我们可以用这个 cloud opus 四点五和它对比一下,看一下谁的效果是更好,那么我们使用酷来 x 来进行这个测试啊,然后我们可以选择就是啊这个啊,五点二,然后选择它的这个最高这个尺寸来进行一个测试,然后呢我们把这个 提示词直接复制过去啊,终于好了啊,一开始我选的是这个尺寸,是这个 high 这个尺寸,但是太慢了,真的太慢了,我只能把它调回这个中中这个尺寸,然后才顺利的去把这个东西搞完 前,这个效果上还行,我们来玩一下,看他能不能,能不能有把这些规则都实现了。传统音乐音效, 但是没有背景声音啊,背景声音是没有关闭,那我们来玩一下看游戏开始叫地主,但是这个没有选择叫还是不叫 出,请选择要出的牌,这个还是不太行,还是不太行过,请选择要出的牌,完全出不了, 我选出不了。我们来看一下这个啊, opus 四点五,这 opus 四点五当时我是用这个 coso 那 直接一把就一把就输出的,一把就输出,然后的话这个效果是非常不错的, 叫地主不抢不抢。嗯,随便出一个三带一,对三带二,不出不出。 解释一下,顺子不出顺子这个是能玩,这个是能玩,虽然说这个这个样子有点有点问题啊。我们再来看一下我当时用这个界面,三 pro 做的这个,那这个界面就就非常不错 啊,这个界面设置的不错,但是它这个规则上是没有那个 opus 四点五遵守的好,就它有些就是这个敌对玩家啊。出牌的话这个规则是很单一的规则是很单一的,没有那个牌型宠物啊,你看我出错牌了,但是这边拉不到, 连对声音啊什么的都是很正常过,所以在这个前端这个这一部分,是啊,我觉得是比这个 oppo 的 四点五和这个啊,这个 gm 三 pro 都是不如它。 接着我们来进行第二个测试,那第二个测试是纯的这个页面,这个效果测试,那也很简单,就是做一个企业的官网,那第一个其实更强调的是我这个强大的逻辑能力的实现能力,那第二个就是我们的真实的就是我要做一个企业官网,看他做出来的效果是怎么样,那提示词也很非常简单, 那这个我在 g m 三 pro 也也用它来做了一个这样的官网灯,我们对比测试一下,还是一样的,我们是个空的项目,然后我们把提示词输给它,这次我们还是一样选择这个 j p t 五点二啊,中型尺寸, ok, 他 这边已经生成完成了,然后这里是代码的这个结构啊,也是按照我们的指令啊,使用 nex js 来搭建,那生成速度也比较快,因为我们选择了这个中型的尺寸啊,我们来看一下最终的效果,打开是这个样子的啊,给人的感觉还是比较的清爽啊,然后这边是一个首页, 一个热门产品啊,点开是这样的产品的页面分类 啊,关于我们联系,然后这边有个报错,好,我们先先不管啊, 我们看一下就是 gmail s 三 pro 来生成的这个页面,你看整个页面给我们的感觉就是会有很多这种动态的东西,动态的元素, 这个是我使用 antigravity, 然后的话也是同样提示词啊,选择这个 jimmy 三 pro 来生成的。我觉得在这个页面展示效果上和这个交互上是比这个 jpt 五五点二要好很多, 这边都会有,都会每个页面都有一些这样的效果。所以从前在前端的对比上啊,目前 啊,在我个人的测试里面,我觉得这个 g p d 五点二十不如这个 g m 三 pro 的, 那我们接着测试它的后端,那后端测试呢,是我在之前的模型中经常用来做测试的一个场景啊,那这个场景就是做一个这样的用户支付 啊,和这个退款的这样的两个接口,那这个支付呢,是包含了这种微信支付和这个余额的支付。这个测试目的呢,是测试大模型在对这个微信支付或整个支付的环节,从发起到毁掉接收这个 流程的完成,是不是能够在很少人的对话中去完成这样的一个,嗯,逻辑代码的编写。 那第二个就是对这个需求进行了一个间接的需求,就说啊,在前面产生大量代码这个基础上,因为对话记录已经很长了, 那么让他继续升级这样的功能,在原有这个支付基础上,然后增加更多的支付的通道。那这个其实考验的就是啊,第一是大模型在很长的上下文 的前提下,能不能去做更好的设计,做扩展的设计。那第二呢,就是在现在已经完成的基功能的基础上去进行优化,因为其实第二个间接的需求是去改变,第一个 本来是支持微信支付,现在要支持更多支付,那按照我们的设计肯定是接口啊,抽现成啊,对吧?把原来的接口替换掉,那这里面其实都是考验了这个大模型对这个代码的理解啊,对这个历史啊,这个上下文记录的一个质量的一个考察。 所以呢,那前面呢啊,我是用这一套测过了很多大模型啊,基本上测出来的效果啊,跟大部分人这个呃,效果是差不多的,那我使用的是这个 java 的 框架,我使用的空的项目啊,那也定义了一个这样的一个 java 开发规范, 那目前已经全部测试完了,测试完之后呢,其实啊,他跟这个五点一啊,就是我们测了好几个模型,之前啊,跟五点一其实差不多,都是在三轮对话 就完成了这两个工作。那第一个需求完啊,支这个微信支付的话,是通过这个两轮对话啊,就完成了,那么间接的需求升级呢,那通过一轮对话就完成了,目前啊, opus 四点五啊,五点一, code x 和这个 gpt 五点二,那么都是 都是在三轮计划完成,那苏联的四点五十进行了四轮计划才完成。所以说这方面后端编码的这个能力上啊,目前的话,我觉得这个这几个模型都是非常优秀的。那整个测试下来之后啊,啊,我在使用这个啊 high 这个尺寸的时候 太慢太慢,别说我在测试第一个的时候,就光这个逻辑的编写啊,就花了九分钟,他还没出来,所以我不得不把它切换成这个中型尺寸了。那么我在测测测试这个后端,因为后端很注重逻辑啊,我就把它切回到这个啊,焊的这个尺寸啊,这个时间是非常非常长的, 所以总结来看啊,就对比一下我之前的测试啊,那么目前看下来就是 g p d 五点二,因为它其实不是一款专门用来编程的模型,因为 oppo ai 公司是有专门的编程模型,比如说 codex 系列,所以呢,它更是一种通用的这个呃 模型啊,在解决你的日常里面各种其他的非编码,这种可能会更出色一点,所以呢,目前测试下来的效果就是目前五点二跟五点一 q 的 x 我 觉得差不多,甚至前端的还比它差一些, 所以呢,我还是比较期待这个 g p t 五点二 codex 就 专门的这个编程模型,可能就是在这个 g p t 三 pro 或者跟 oppo 四点五上能能够去做一些更深入的对比,或者说差距会更少一点,但是它在这个后端代码的逻辑能力编写上其实也是非常优秀的,跟五点一 codex 啊这个持持平的。那么在整个测下来,我自己的心得体会就是什么呢?就是这些好的大模型啊,在完成这些大部分基础任务上已经是非常完美的,就很难去测试这个模型的上限。就比如说我是这个后端测试这个场景啊,这个微信支付的场景,其实模型已经基本上 在三轮都能完成这样子,那好的模型在三轮就完成了,那么我就没办法去 用更好的办法去测试这个模型上线就测不出来,可能需要大量的去真实场景去编码去,你自己才能感受到这个模型是好还是坏,就是靠这种 某个场景去测试,我觉得目前在模型目前这个阶段,或者说后面的发展阶段是已经很难去客观的去评测了,那以前模型可能差,比较差的时候,你可能用一两个场景就能验出来,但现在模型好了, 你的场景我们在生活中或者在编码工作中能碰到的场景,对于这些模型来说已经能够很轻松的去胜任了。所以呢,这个测试其实我觉得 后面所有的升级的模型测试很可能都是 s, 就 这个后端能量都是 s 了,没办法,就是让它能体现出来就是更强,除非你有大量的项目去做一个平均值。 我觉得后面的话可能就是这个后端测试这个意义不是太大了,不是太大了,那么目前,但是目前的话局限性还是在这个上下文,就是上下文的长度,如果说出现就说我的这个需求,三轮对话变成一轮对话就完成,那么这个 对于于提升的应该不是说是模型的能力,而是上下稳的能力,那 ok 呢?整体来说 gpd 五点二是在是一个非常好用的通用模型,但是在编码上目前我觉得还是不如这个 open i 的 codex 自己的这个专门的编程模型可以, 所以呢大家也可以根据情况自己去测试去选择。 ok, 那 本期视频就到这,如果你关注这个 ai 编程的话,可以多多关注我。

openli 和谷歌这俩 ai 巨头神仙打架,谷歌先亮出 g m n 三,抢占多模太高地 openli 昨晚提前发布 g p t 五点二,摆明了要正面硬钢。 g p t 五点二,主攻专业领域,四十万超长上下文,能秒吞百页合同, 四十四类职业任务,百分之七十点九胜率碾压人类专家编程建模复杂推理直接拉满,堪称打工人的专家同事。 而 gemini 三健走多模态,图文音视频无缝融合,能一句话生成完整 app, 还能联动谷歌生态,主打一个全场景,万能助手。两大巨头你追我赶,研发投入都破百亿,就为了抢 ai 商业化的制高点, 咱普通人直接坐收余力,他俩都有免费额度,办公选 gpt 五点二,效率翻倍,创作选 gemini 三,花样更多,你更占哪款?评论区聊聊。

就在今天,恰点 gbt 推出了他们最新一代的模型 gbt 五点二,是一个领先的前沿模型啊,为专业的工作和持久运行的智能体而打造它。这一次最大的一个亮点的话是他们号称超越了整个人类的一个专家,他们搞了一个 gdp 的 一个专业能力精准测试, 这次的评分相交于他们上一代的模型,有大幅度的一个领先。那第二个的话就是他们的一个 agent 的 能力嘛,从思维到最终去产生行动这块提升也非常明显,后续去做一些 agent 的 话,提升应该也比较明显。那今天的内容主要分为两个部分,第一个部分 就讲一下官方的一些啊, bootstrap 参数。那第二个部分我会用我最近做的一个真实项目,然后去对比 gpt 五点二跟 cloud, office 四点五它们的编程水平到底怎么样,我会按代码行及一行一行去对比它们生成代码,让大家看一下到底怎么样啊,看完这个视频就知道了。 ok, 下面我们来看一下整个的一个榜单哈,其实榜单每次我做这种新模型的评测榜单,大家就看一看就得了,但是还是可以看一下他们比较关键的三个吧。第一个是这个软件工程的,这个哈,他相较于 cloud 是 有百分之三点几的一个提升啊,提升不是特别明显。 那第二个的话是这一个就是数学竞赛这一块要拿的,拿出来说一下哈,他们 g t g p t 五点二是得到了一个一百分,就是相当于一道题没错, 然后 cloud 的 话是九十二,这一个它提升是挺明显的,所以说对一些专做数学推理啊研究的人应该帮助很大。 g p t 五点二, ok, 那 下面一个比较关键的是我们刚说到了这一个 啊, g d p 他 们最新的一个测试,他们新加的这个是测试的一个啊,就是测试四个职业,去找里面的一些人类专家出来出一些测试题,出完之后拿 g p t 五点二去跑,跑完之后然后去评分,评分出来的话他们的整个结果是达到了七十分 啊,已经相当于说顶尖整个顶尖行业的一个专家的水平了哈,那同样我们可以看到他其他的就是他们拿上一代的模型去对比,上一代的模型的话是 三十八分,然后跟 cloud 比的话, cloud 是 六十分,就提了十分,其实也不是特别明显。那下面的话就是他这一次发布会着重讲了他的一些帮助,一些其他行业的人去啊,怎么提升他们的工作效率,不管是从财务啊,法律啊,做 ppt 啊等等,还有他的一些逻辑推理嘛,刚刚我们也看到他数学这一块有一个测试得了一百分, 还有就它的一个幻觉力相较于上一代模型降低,那这个的话对于我们去做项目啊,写代码呀,以及你去写域的都有非常大的一个帮助,那还有的话,它的那个上下文 也相较于上一代有一定的提升。看完这个简单的一个汇总的话,我们来看一下整个编程实测吧。之前有朋友在评论区说,很多的一些就是专门做大面积评测的哈,就一直一直去测前端,那我其实大部分的测试都在测后端,那今天也不例外,我们就直接测后端,因为前端的话我觉得像 q 的, 然后 g、 p、 t 他 们的模型其实都没有那个谷歌那个强。好,我们来看一下我们今天的整个编程实测的一个任务哈,一个任务的一个背景是什么呢?如果熟悉后端的朋友应该比较了解这个 prome 修斯哈,它是主要是为了监控你一个代码的一些指标的,你可以在代码里面去买点,买点完了之后你可以结合 官网哪儿去做一些啊?就是类似这样的监控报表嘛。对,那整个的一个需求的话,就是我们有一个非常老的项目,就还在我手上有在维护的,然后这个项目是一六年搞的,但是他没有去接各种指标。那今天我们的一个核心的目标就是我们有几个这样的一个就是服务吧,可以理解的就是代码吧,让他去 帮我们把这代码加上一些 http 的 一个指标,还有数据库的一个指标,连接词的一个指标,然后给再给他加上一些就是一些约束哈。我们大概的一个提示词,我们也可以简单来给大家看一下啊,就是背景给它说清楚,然后当前采用的架构以及我们的一些,就是服务的一些清单嘛,还有数据库相关的一些信息, 就是题的词都描述清楚了,然后我们来去看整个 gpt 五点二到底怎么样啊?已经用 curl off, 四点五已经把这个东西推到线上去,目前跑起来看没有任何问题,从它打标、 买点,最后到帮我们生成那个 java 的 一些查询语句,就整体就这样子,看起来也没有什么太大的问题哈,那下面我们就来看一下它真实的一个代码的一个情况哈,那右边代码的话是那个 gpt 五点二写的。 首先给大家看一下这一个项目哈,它其实不是一个玩具项目,它是一个就真实跑在线上的项目,它代码其实特别大,因为看这个名字就知道嘛,是一个比较重的一个押注项目。那我们先看它给我们打的一个就是写的一个代码吧,就是一个指标的一个代码啊。那 cloud 这边呢?就是它分为了一个主要的一个指标代码,以及关于 http 的, 然后数据库的,然后业务指标 啊,还有它暴露给那个 server 来采集的一个代码,我们一个一个去对比,首先看 color 这边的一个核心代码哈,然后这边的话,这个就是去做一些设置 app 嘛,这个没什么好说的,那下面就是它的一个 指标,就它定义的一些指标,那相较而言,在 gpt 五这边它没有通过这样的设计,它是在它的主要搞了一个 common 点 py 的 一个文件,就是主要为了去粗俗化 一些跟这边差不多的一些代码吧,但是他这边实现的话,其实是有点小瑕疵的,比如他搞了一个就是现成那个是 reading 进来,其实我这个项目是基于 i o 的, 这个其实是没必要搞进来,我感觉没必要搞进来哈,就看起来我还是会选这边哈,这个代码就没什么好对比,对比的那个力度也不大, 那他的指标定义是放在就每一个模块下面的,比如他在 h d、 b 定义的一些指标,然后然后再去做下面的处理,那么下面我们来去对比他们在处理 h、 d、 b 指标上到底有什么区别哈。 ok, 来看一下吧,这个的话是他为了需要去排除一些路由,不参与你这一个就是路由的计算,那下面的话没什么好说呢,看他这边啊,他这边也差不多这个函数去把你的 u r l 让他不要膨胀嘛。 ok, 那 下面这段代码有必要给大家讲一下,就是我们通常不管你用什么框架,他都会有一些就是中间键嘛,你可以在中间键里面做拦截请求,然后做去打字啊,去买点啊各种。那他这块的实现的话就是 g p d 五点二的实现,我认为肯定是没有 cloud 的 这边。好的哈,那他这边的话是写了一个函数, 然后他从我传给了他的一个 hander 里面去获取,用 python 的 这个获取,获取它的一个属性啊,这种写法我觉得真的就是虽然有点 python 的 风格,但是我觉得这样维护性不太好。说实话 看下面代码啊,那你再来看一下 cloud 四点五写的呢,就是从这个代码就看起来很像人类写的,就是我感觉哈,就是他搞了一个积累哈,搞了一个积累之后呢,然后去重写了,就是你正常的一些应用框架的一些就是关键的函数嘛,比如这个就是我们一个请求打进来之后,他必须要走的一个就是方法啊,然后下面的话就是你结束要走的方法。 这种代码看起来就是就简单,这一点你应该都会去觉得 call 的 off 四点五的代码写的要要比这边好一点,我们有一个 acp 的 代码,就是我们所有的收口都会进到这个文件里面来去执行,那我们来对比一下这两边它的一个区别。 看到 cloud 的 这边哈,它是写了一个方法哈,一个方法的话,它是去记录你的一个操作类型时间,然后然后去调用 pro 修饰的这个指标,然后去做一些加减嘛,就做一个加减,然后做一个异常处理。 看这边啊,这边他又是从这种导入,其实这种导入我感觉就感觉实现的有点不太喜欢,那这个缺少一个日制, ok, 那 对于具体的查询的话,这一块其实大差不差吧?就记个时嘛,记个时,然后完了之后在整个最终结束的时候去埋个点, 我还是会选这种 ok, 所以 我们通过简单的一些代码的对比你就能看出来,他在这个实线上,虽然说他的那个评测分数很高,但是他的代码实现 还是没有 cloud 那 么工程化,虽然他也能完成任务,但是写工程化代码我觉得还是 cloud of 四点五要强一些,这只是我展示了就是这个项目下面的一部分哈,还有就是他真正要去集,集成到就是整个 app 里面去,其实也能发现他这边的代码就是 gpt 五点二会稍微次一些哈,那这个就是 代码层面的一个测试嘛,我们来看一下他的那个评分的一个情况哈,那评分的一个情况的话,就是我刚刚是我人为的去觉得就是我人工嘛,站在我自己的角度说,啊,卡尔的 off 四点五,然后他的写的代码要强一些,那我把两份代码都让同一个 ai, 让他去 利用美业行代码,然后最终来给出我们的一个整个的一个评分。通过这个结果看,卡尔的 off 四点五也是要比恰尔 gdp 五点二要高一点的,然后高了零点四分吧, 那它主要的话是在这几个维度吧,就是代码质量评分,就是一些模块化呀,然后一些错误处理啊,还有一些就是最佳实践啊,还有指标命名啊等等。那下面的话是一些综合性的分析,就是它还是真的是有趣,扫所有的代码,然后给出了一个 比较完美的一个对比吧,然后就是每一方都有它的一个特点吧,但我是比较,就是据我的就是一个经验来看的话,我还是比这个 ai 给的一个优势,然后恰了 gdp 五点二的一个优势, 那它也指出来两方的一个不足。 ok, 那 下面详细对比我们就不一个个的展开去看了啊,它有去做就是具体的详细对比。 那最终的结论的话, ai 也是建议就是 pro 的 off 四点五这个代码是在本人的一个测试里面是要领先的,就它这种代码工程的一个质量,以及你 prometheus 的 一个实践,以及你业务观测的一个业务可观测性嘛,它都是要优于那个 d p t 五点二了。我记得我之前有一期也出过一个视频,就是说 一个标准的一个,就是我们现在一个外部定制的一个工作流是怎样子的哈?如果有条件的话,你可以在 jimmy 三点零 pro 上去做你的前端代码哈,比如说写 ui 打地基完了之后,让 cloud 四点五去写后端做工程化,如果遇到一些代码修不了的,你可以让恰当的 gpt 去修,你可以有一个奇效哈。 所以说整体看的话,这个模型的一个能力的话,主要还是在它扩展了,就是其他行业的一个 能力吧,就是在编程这块他的提升不是很明显啊,那这个能力应该是是他们这一次提升最大的一个明显啊,最大的一个就是提升的地方吧。好,那这就是我这一期的视频评测的全部内容了,如果大家喜欢我的评测内容的话,可以给我一键三连点个赞啊。然后如果想要这一个报告以及其实是原码的,可以给我点个关注。

水 h 二 o 是 典型的 v 型分子, 氧原子带有两对孤对电子,使得 h o h 的 键角约为一百零四点五度,小于理想四面体角一百零九点五度。在该模型中,你可以点击原子查看原子 本。 c 六 h 六是平面六圆环结构。 二氧化硫 s o 二三氟化硼 b f 三乙汞 c 二 h 四含有 c, 等于 c 双键每个碳近四 sp 平方杂化 乙氨。 c 二 h 六含有 c c 单键两个碳均近四 s b 立方乙醇 c 二 h 六 o 含有抢击 o h o h 键极性强,可引出氢键与溶解性等概念。 五、绿化林 p c l 五可展示三角双锥几何,三个赤道位置加两个轴向位置。

大家好,今天给大家推荐的是 gbt 五点二 ai 编程工具, 首先使用它的话肯定是需要进行一个付费的,但是我这边的话有无限使用的方法需要购买卡,你感兴趣的话可以加一下主播的粉丝群了解一下。目前我推荐克罗莎进行一个编程的原因就是其他的,其他的像克拉的开发确实效果很好,但是它的一个价格 哦,很多人用不起吧。目前来说性价比最高的只有这个酷路叉 g p t 模型,目前来说 g p t 模型的话,它的一个效果还是蛮好的,就比如现在主播就是在用酷路叉进行一个开发,它首先是要进行一个 珍惜,珍惜你这个功能的一个上下文,他他会分析,分析之后他才会按顺序进行一个开发,他是开发整体链路的前后端一起开发。 目前来说的话五点二比五点一开发功能要好,写的更准一些,修复问题的话也会修复的更准一些, 所以说目前用下来的话,体验还是效果还是蛮好的,但嗯,很多人用不惯还是因为他思考的时间太长吧。但如果说大家追求性价比的话,还是推荐大家用这款 polo 衫,还是效果还是蛮好的。 大家如果说感兴趣的话,可以加下主播的粉丝群了解一下。

openai 昨天发布了其旗下最新的 check gpt 五点二,其实五点一的发布也就是不久前的事情,这次五点二的迭代来的非常快,据说是为了应对詹妮三点零 pro 和 cloud 四点五。 opus 官方扳指 mark 当然是各种碾压五点一系列模型, 正好我也好久没测过币源模型了,今天就来好好盘一盘它。测试题目、打分标准和目前最新排行榜,各位可以暂停自取。 另外这里使用的是 getop 高拍了 tos 的 版本,模型精准方面,上下文四十万可以拿到四分,支持视觉的两分模型币源无法本地部署。中文写作部分 得分是九分、八点五分和九分。有意思的是, cloud 扣的零点五分是因为字数过多,英文写作部分得分是九分、九分和九分。 cloud 同样在字数过多方面扣了分。其实这也是为什么我设计让三方共同打分的原因。 观察三家大模型对相同输入的不同分析见解,也是很有意思的。应用文写作部分 得分是九点五分、八点五分和九分,然后以经理身份回复并降级。试探得分是九点八分、八点五分和九分。数学几何和逻辑推理能力方面的得分是十分、九点八分和九点五分。 物理的得分是十分、十分和九点五分。问答部分结束, check gpt 五点二的成绩是六十一点五分。 最后是代码智能体的部分,这也是这次迭代主要提升的方面。首先是写一个 html 的 网页手机操作系统模拟器,这个效果相当不错。 图形方面很漂亮,模拟的 app 也可以正常互动。但是也有一些小问题,比如 app 返回功能貌似不能正常工作,且半透明效果在锁屏下有点乱, 我个人可以给个八分,我相信稍稍修改一下就能解决问题。 log 对 代码的打分则是八点五分,最后是进阶班的六边形小球拍子任务 代码正常运行需求都实现了,视觉效果也非常不错,我个人可以打九分, 可 log 则是继续打出了八点五分,最终差的 g p t。 五点二的得分是七十八点五,暂列排行榜第一,除去上下文和多模态,纯看模型性能的话则是七十二点五分,也是目前的榜单第一。

hello, 大家好,我是你们的老朋友,今天咱们来聊点最近科技圈的大卦。哎,就是那个传的沸沸扬扬的 g p t 五点二提前泄露的事,还有 openai 和谷歌这俩老对手,听说今夜就要拿 jammin 三级贴, 嗨,这标题一看就够劲爆的,对吧?那今天咱们就掰开揉碎了,好好聊聊这里面的门道。首先啊,咱们得先说说这个 gpt 五点二到底是个啥?你想啊, gpt 四才刚出来没多久,这五点二就来了,而且还是提前泄露, 这事听起来就跟谍战片似的。不过根据微信文章里说的啊,这个 gpt 五点二它可不是凭空冒出来的,它背后有两个内部项目, 一个叫大蒜,另一个叫 shellapete。 哎,你说这名字起的怎么都跟吃的有关呢?不过这俩项目的关系可没那么简单,据说大蒜是 openli 内部一个比较早期的项目,主要是用来做模型训练的基础架构的。 而 charlotte pete 则是在大蒜的基础上针对 gpt 五点二的一些特定功能做的优化和升级。 简单来说啊,就是大蒜是地基, charlotte pete 是 在地基上盖起来的房子,而 gpt 五点二就是这房子里最核心的那个房间。 你这么理解是不是就清楚多了?那这个 gpt 五点二它到底厉害在哪呢?文章里提到了一个很重要的点, 就是他在编程领域的优势。你想啊,现在的 ai 模型,虽然说在编程方面已经能帮我们写不少代码了, 但多多少少还是会有一些小问题,比如逻辑不严谨啊,或者是代码的效率不高啊之类的。但是 gpt 五点二不一样,据说他在编程领域的能力有了质的飞跃。 具体来说呢,就是他能够更好的理解复杂的编程逻辑,写出的代码不仅正确率更高,而且还更简洁,更高效。比如说以前我们可能需要写十几行甚至几十行的代码才能实现的功能, gpt 五点二可能只需要几行就能搞定了。而且啊,他还能根据不同的理解复杂编程语言和框架,自动调整代码的风格和结构, 这对于程序员来说简直就是福音啊,你想想,要是以后写代码都能这么轻松,那程序员们得省多少事啊?当然了, 一个模型的好坏,除了它的功能之外,预训练策略也非常重要。那 gbt 五点二在预训练策略方面又做了哪些调整呢?文章里说, openli 这次对 gbt 五点二的预训练策略进行了大幅度的优化, 具体来说呢,就是他们采用了一种叫做动态混合预训练的方法。这种方法的好处是什么呢?就是他能够根据不同的数据类型和任务需求,自动调整模型的训练参数和训练方式。比如说,在处理文本数据的时候,模型会采用一种比较传统的预训练方式, 而在处理图像或者视频数据的时候,模型又会切换到另一种更适合的预训练方式。这样一来啊,模型就能更好的适应不同类型的数据和任务,从而提高它的整体性能。 而且啊,这种动态混合预训练的方法还能大大缩短模型的训练时间,降低训练成本, 你说这是不是很厉害?不过要训练出这么厉害的模型,光有好的预训练策略还不够,还得有足够的算力支持才行,这就不得不提到 open ai 和谷歌之间的算力资源争夺了。 你想啊,谷歌作为 ai 领域的老大哥,他的算力资源那可是相当雄厚的。而 open ai 呢,虽然说这些年发展的也很快,但在算力方面可能还是稍微逊色于谷歌一点。 不过,为了训练 gpt 五点二, openai 这次可是下了血本了,据说他们不仅投入了大量的资金来购买新的算力设备,而且还和一些第三方的算力供应商签订了长期的合作协议。 甚至还有消息说, openai 为了争夺一些稀缺的算力资源,还和谷歌发生了一些小摩擦呢。不过这些都只是传闻,具体的情况咱们也不得而知。 但是不管怎么说,从这些传文中我们也能看出来, openai 对 于 gpt 五点二这个项目是多么的重视。那说到这里啊,你可能会问了, 这个 gpt 五点二它到底什么时候才能正式发布呢?文章里说,目前还没有确切的消息,但是根据一些内部人士的透露, gpt 五点二很有可能会在今年年底或者明年年初正式和大家见面。而且啊, openai 这次之所以会提前泄露 gpt 五点二的一些信息,很有可能是为了应对谷歌即将发布的 gemini 三。你想啊,谷歌的 gemini 三可是号称要比 gpt 四还要厉害的模型, 如果 openai 不 提前放出一些 gpt 五点二的消息来压压场子,那岂不是会被谷歌抢了风头? 所以啊,这次的泄露事件很有可能是欧鹏 ai 的 一种信息策略,不过这也只是我们的猜测而已,具体的情况还得等官方的消息。不过不管这个 gpt 五点二到底是不是真的提前泄露了, 也不管他和该米奈三之间到底谁更厉害,有一点是肯定的,那就是 ai 技术的发展速度真的是越来越快了,从 gpt 一 到 gpt 四,再到现在的 gpt 五点二和 jimmy 奈三, 每一次的更新换代都给我们带来了很大的惊喜。而且啊,这些 ai 模型的应用场景也越来越广泛了,从聊天机器人到自动驾驶,从医疗诊断到金融分析,几乎包含了我们生活的方方面面。 你想想,要是以后这些 ai 模型都能普及开来,那我们的生活将会发生多么大的变化?不过在享受 ai 技术带来的便利的同时, 我们也得注意到一些潜在的问题,比如说 ai 模型的理论问题、隐私问题,还有 ai 替代人类工作的问题等等,这些问题都需要我们去认真思考和解决。 不过这些都是后话了,咱们今天就先不聊这些了。那今天咱们关于 gbt 五点二泄露和 open ai 硬钢 jimmy 三的话题就聊到这里了, 不知道你对这个话题有什么看法呢?欢迎你在评论区留言和我一起讨论。好了,今天的节目就到这里了,咱们下期再见!

今天给大家分享的是最近全网火爆的叉 gpt 五点二,当前最先进的 ai 模组之一,很多人都知道,但是还有小伙伴不知道怎么安装,现在就免费教会你,安卓、苹果汉屏版都可以使用。 首先点击视频右下角分享按钮,然后打开这个蓝色小鸟,如果没有的去下一个,进来后会弹出一个框,如果没弹的情况下也不用着急,可以在这里搜索一下。扬叶宝库也是一样的,点开滋润合集, 打开工具类软件,去找到叉 g p t, 五点二,点击保存,再下载安装就可以使用了。

今天科技圈最大的事情啊,就是 oppo air 推出 g p t 五点二,不仅要硬钢 g m a 三,更是 oppo air 成立十周年的重磅的产品发布。那 g p t 五点二和谷歌的 g m a 三到底谁更厉害呢?今天我们来看一下 第一不出人意料啊, g p t 五点二在大部分的核心能力的榜单上,比如说编程、数学等方面都超越了 g m a 三,重回世界第一。 其中有两个榜单非常值得一说,一个是 ark agi 二,另外一个是 gdp 与 v a l。 那 先来看看 ark agi 二这个榜单,它的设计的目的是悟性和开窍的能力, 也就是在互联网上找不到任何现成的答案,它必须当场理解,当场推理是大模型真正的智能水平的体现。那在这个测试里面, g p t。 五点二直接飙到了呃,五十二点九的得分,所以人类最强的外挂诞生啊, 生物医学科学家、免疫学家德雅教授,近乎这就是 agi。 让我们再来看看另外一个有意思的方案,就是 gdp vol, 那 从名字里大概就可以看出来,就是生产种子的那个 gdp, 它是 openai 自己在两个半月之前新推出的,目的是来衡量 ai 在 真实事业中具有经济价值的任务上的表现。那这些任务来自于不同的职业,不光是程序员、科学家,还包括律师、设计师、市场经理、销售等等。 那 oppo 爱在美国贡献 gdp 最高的九个行业里面,选举了四十四个核心职业,然后呃,他们找到了这些行业里面平均有十四年工作经验的资深专家,让他们出了一千三百二十道专业任务,那每一项都是基于真实工作成果的, 那测试的结果啊, g p t 五点二 pro 这个模型啊,它的得分是七十四点一,远超的将近三 pro 的 五十四点五。也就是说, ai 已经在真实职业任务中胜过或者是持平人类专家了,不是普通人,是人类专家,而且完成的速度比人类 提升的十一倍,成本还不到百分之一,这意味着 ai 为人类打工的时代正在开启,而且是快速开启, ai 牛马要来了。 第三,从 gdp 五点二的发布来看,尤其是 gdp 呃 v a l 这个榜单可以看出,圣母奥特曼是非常希望用 gdp 去参与人类的脑力工作来创造出经济价值的,比如说软件开发,商业智能等等,毕竟奥特曼是做投资出身的。 而且很有意思的是,这次奥特曼顺带将迪士尼核心 ip 给整合进来了,还有很多大人都非常期待的成年人模式也开放,这说明奥特曼是最懂商业的。 和谷歌是不同的,吉米莱山似乎更有科学家气质,比如说在人类的最后考试 hle 中啊,吉米莱山在没有工具的时候还是渗出的, 那这种不用依赖外部资源的时候展现的更出色的纯思维能力啊,正是科学家探索未知领域的核心特质。毕竟的谷歌的老大还在鄙视是诺贝尔奖得主。好了,你怎么看呢?评论区见吧。

openai 年度压轴模型 gpt 五点二发布不到十二小时,盘点全网首播实测案例。这款被奥特曼称为世界上最聪明的通用模型,专门针对真实工作场景优化。大家都卷出哪些案例来?有技术大佬直接用 gpt 五点二一次性搭建了完整的三 d 图形引擎, 交互控制、四 k 导出功能全齐活,一个提示词就搞定。还有人直接让它生成视觉炸裂的着色器,模拟出无限哥特式塔楼淹没在风暴海洋的奇幻场景。本来这种渲染得调半天参数,现在一句话就出效果,开发者更是直接被惊艳到。 有人用它零样本复刻了 veritasium 视频里的森林火灾模拟器 prompt, 一 发本地秒级运行。更厉害的是,有团队直接用 gpt 五点二打造了开原版 notebook m, 扔个网址,它就能自动浏览阅读记忆、跨源问答、音频摘要、思维导图一条龙服务。

今天给大家分享的是最近全网火爆的叉 gpt 五点二,当前最先进的 ai 模组之一,很多人都知道,但是还有小伙伴不知道怎么安装,现在就免费教会你,安卓、苹果汉平板都可以使用。 首先点击视频右下角分享按钮,然后打开这个蓝色小鸟,如果没有的去下一个,进来后会弹出一个框,如果没弹的情况下也不用着急,可以在这里搜索一下摇页宝库也是一样的,点开自热合集, 打开工具类软件,去找到叉 g p t, 五点二,点击保存,再下载安装就可以使用了。