粉丝2855获赞1.1万

这波更新直接把 agi 往前推了一大步,朋友们,今天真的太热闹了,被 jamming 和 claudia 了整整一个月的 openai 直接憋出了一个王炸, gpt 五点四 一夜之间所有竞品的神话都被碾碎。这个视频我就用两分钟的时间带你看一下这个模型到底有多颠覆。首先是原声操控电脑, gpt 五点四已经能像人一样通过视觉鼠标和键盘操控你的电脑,包括快速填表、单发邮件、排日程等等。比如这个,他正在把右边的资料填到左边的系统里面,画面我并没有做任何加速。 还有这个,他正在用金妙给团队成员发邮件,并将会议日程分发给其他成员,你觉得这个速度和熟练度怎么样?其次是全能办公, gpt 五点四这次重点提升了创建和编辑文档、电子表格和演示文稿的任务功能。有人认为他的 ppt 已经做的比设计师美, excel 算的比分析师还要准。这里可以看一组对比。 这个是 gpt 五点二做的 ppt, 这个是五点四的。很明显,五点四具有更丰富的视觉效果以及更强的图纹美观性,整体的审美有了不小的进步。 还有这两个表格,可以看到五点四的格式呈现效果更加直观,还区分了文字重点,仿佛一个成熟的文员。值得一提的是, gpt 五点四的幻觉率暴降了百分之三十三,错误率也砍掉了百分之十八。第三是推理编程合体, gpt 五点四在编程测试中已经达到了百分之五十七点七的准确率,超过了 codex, 并且支持一百万 token 的 上下文聊天窗口, 你可以让他来自主开发角色扮演类游戏,在这个过程中,他会自己一边玩一边优化迭代自身代码,优化视觉效果和交互设计,所以小白也能开发属于自己的游戏了。 除了这几个核心升级点, g p t。 五点四这次网络搜索能力也迎来了暴涨, pro 版的准确率冲到了百分之八十九点三,直接反超 cloud, 在 视觉理解能力上也直接突破六千像素的行业极限,再细微的细节都能精准捕捉。还新增了中途可调需求的功能, 你随时能打断调整思路,完全不会打断模型本身的深度思考。所以在我看来,目前几乎没有任何短板的 g p t。 五点四, 这次恐怕并不是简单的升级,而是 ai 生产力的一次里程碑式改革。当他把每一条线都拉到顶尖水平之后,就会用行动来告诉你,谁才是通往 agi 的 路上最可能的终极 boss。

兄弟们炸裂的来了, gbt 五点四突然深夜发布!先来看个逆天的,这是 gbt 五点四自主开发的角色扮演类游戏,不光是他写的代码,他还正在自己玩,一边玩一边给自己的游戏代码优化迭代, 这个主题公园模拟游戏,甚至只是根据一条提示词生成的,然后他就自己玩上了。相信你也猜到了,这次 g p t 五点四最牛的就是他,是首个原生具备了最先进的计算机使用能力的通用模型。来看这个注意视频没有加速啊! gbt 五点四正在操控浏览器,快速的把右边的信息填到左边的发票表单中,速度快的有点看不清。这个是他正在用 gmail 给人发邮件,就问一句,你用电脑有他用的熟吗?也许 gbt 五点四就是个分水岭,很快就不是他会不会做,而是还剩下多少事轮得到你来做。

就在今天凌晨, oppo i 刚刚发布了 gpt 五点四,本来是准备入睡的,那我养的小龙虾给我推了一条更新消息,于是乎直接把睡衣换了,直接开干。那今天的话,花几分钟时间讲清楚它到底升级了什么,再附带一个编程实测。 好,下面我们看一下它的五大核心升级。第一个是上下文窗口,由原来的五百 k 变成了 em, 这一个的话对于你去做一些 长任务,复杂任务有很大的帮助。那第二个的话就是操作电脑的能力也增强了,那这个的话桌面端的 q d agent 也会有很大的帮助。第三个的话,就在恰点 g p 它这个聊天应用中原来的思考过程嘛,就它的 sync 你 是不能去中途去修改的,现在你可以随时打断 补充需求,调整方向。第四点的话,它是有一个更高的托管效率以及更快的响应,响应这块的话我刚刚用 q d x 去实测了,确实是有提升。 那第五个的话,就是它把 codex 的 能力直接合并到了这个 gpt 五点四这个模型里面,什么意思呢?意味着后续是没有 gpt 五点四 codex 的, 直接是 gpt 五点四一个模型就搞定了, 不要像原来那样搞得比较乱。而且现在它新增了一个 fast 的 mini, 我 刚也试了,这个 mini 让你的整个编码速度提升的特别快, 但是你的消耗也是成两倍的一个增长。下面我们来看一下它整体的一个跑分情况,跟几家模型对比来看的话,提升不是特别明显,但是也有一些排到了第一。那跑分的话,其实我们就稍微去看一下就行了,因为 你真实的,不管你在编程实战还是他接触到 a 技能里面,还是在看实际中的表现嘛,对不对?我们直接到编程实战环节,还是同样的 prom 哈,如果熟悉我的老粉都知道这两个项目,在这一次不管是国内的顶尖模型还是国外的顶尖模型,我们都拿这两个项目去做测试同样的 prom。 然后这一个项目是稍微比较复杂的,国内的模型的话它没有做到一次性去把整个任务完成,那国外的模型的话, cloud off 四点六以及 g p 五点三, codex 它做到了,但是 jimmy 三点一 pro 它没有做到,第二个它会稍微比较简单一点。好,我们来开始实测,这次我用的是 codex 这个 app 上去做实测啊,提示词也是跟之前测试是一样的, 并且我们开启了这个 fast 模式,也就说它的整个速度是比较快。对于这个比较复杂的项目啊,就是我们把这个图片 a 帧的项目加上一个认证体系,从另外的项目里面迁移过来,并且做了一个落地页,也是之前那几期视频有测过的。我们来看一下它一个完成结果, 总共是做了三十二个文件的一个修改代码,行数是三千多行,从这个也能看出来,整个任务其实是比较复杂的,他的上下文都快跑满了。我们来看第二个项目,就是给这个 skills agent 是 一个终端 ui 嘛,给他加一个呃,外部 ui 也是一个考验他权重的能力,这个的话他改了十八个文件,大概是两千多行代码, 下面我们来看评分结果,我们来看第一个项目是跨项目迁移认证体系,也就是说给这个图片 a 镜头加一些功能嘛,从另外一个项目里面迁移过来,整体的评分标准是来自于两个,第一个是我人工去看它整个功能的完整程度,第二个是我们把它四个项目所做的代码 用顶尖模型去互相 review, 最终得出来一个评分。那整体看的话,这一次 g p t 五点四,它在这个项目上它的表现是比 oppo 四点六要好的,但是在 g p t 五点三 q max 的 时候的话,它是没有 oppo 四点六好的。 ok, 那 接下来三点一 pro 的 话,它是最差的。 好,我们来看第二个项目的一个评分,就是给这个 skills agent 加上一个终端 ui, 考验它权重的能力,那这块的评分的话,其实它给的有点保守了,为什么呢?因为 给我的一个体感哈,就是它这块的一个 ui 比上一次还要好,但是因为它这块没有去体现 ui 嘛,所以说它的评分的话稍微有点落后,但体感的话是更快, ui 更好了,那代码质量的话, a l u 之后的话是没有这个好的好。我们回过头来进行一个总结,我觉得这次最大的亮点哈,就是第一个, 这个上下文窗口变长了。第二个就是他这个快速模式非常非常有用,如果经常用 codex 的 朋友的话,就应该知道他之前是特别慢嘛,那你用这个 fast 这一个命令之后哈, 他的速度确实比之前快了,但是你的消耗也更快了,那这样子就会对 codex 的 会有更大的冲击,因为之前我几期视频就说过, codex 的 不再成为我单独的一个 coding 的 选择,现在就是我在 codex, 然后 codex 的 互相来回去切换,甚至有时候我还会用那个 open code 再加上欧曼 open code 结合起来去做扣顶开发。好,这就是本期视频的全部内容了,如果你觉得视频做的不错,可以给我一箭三连,大家拜拜。拜拜。

gpt 五点四发布了,但我今天不是要单讲这一件事啊,而是要把最近的两件事情连起来看,会发现是一颗大炸弹。我是杨乐多大白话。讲 ai 第一件事呢,就是 gpt 五点四,它最大的变化不是更聪明了,而是它第一次学会了操控你的电脑,打开软件,点鼠标,切窗口,填表格。 在一个专门测 ai 能不能像人一样用电脑的测试里面,他拿了七十五分,而人类的平均分数是七十二分, ai 第一次在这件事情上超过了人类。 第二件事呢,是 opencloud, 这两个月在 github 上涨了二十三万,新史上最快。它是一个能搬进你电脑里七乘二十四小时常驻的 ai。 不是你问他,他才回答,是他自己会打开你的浏览器,读你的文件,发你的邮件,甚至帮你买东西付钱。这两件事情分开看呢,都是一条新闻,但拼在一起 发现了什么呢? gpt 五点四是给了 ai 一 把钥匙,叫做能力,他现在会操控你的电脑了,而且比你熟练。 open cloud 呢,是给了 ai 另外一把钥匙,叫入场券,他现在能住在你的电脑里二十四小时不下班儿。 一把钥匙不可怕,但是这两把钥匙同时配齐了一个既有本事操控你的一切,又二十四小时住在你的电脑里的 ai, 这还是一个普通的工具吗? 工信部上周也发了安全预警,一个澳大利亚的安全公司实测发现, opencloud 一 旦被入侵,攻击者一秒钟就能搬空你所有的私人信息由安全专家亲自测试啊。 ai 把自己的邮件全部删了,你兴奋的给 ai 配了钥匙,你想过这把钥匙可能被别人用吗? 你现在愿意给 ai 开权限吗?评论区说说,关注我,持续用大白话带你看懂 ai 走到哪了,变化很快,一起跟上。

hello, 大家好,我是温特妙,我们来体验一下 openai 刚刚发布的 gpt 五点四,它的一个全新的功能啊, computer use, 我 们来看一下它的一个官方网址。啊啊 啊,在通过 codex app 或者是 api 的 话呢, gbt 五点四它是支持原声操控电脑的这个能力的,并且它是 openai 的 首个支持这个能力的一个通用大模型。 比如说它是可以呃,通过打通过就是打开其他的 app 来执行一系列的啊,复杂的一个工作流。比方说它可以帮我们打开, 打开微信 app, 帮我们来回复微信消息,帮我们来那个整理微信消息啊,比如说它也可以打开可用浏览器啊,比如说 打开一个玩游戏的页面,帮我们来玩这个游戏啊,他也可以帮我们比方说,呃,打开我的一个 b 站页面,来帮我回复用户的私信和那个评论。 然后他还可以啊,就是打开一个网站,比如说打开 pinterest 的 网站,按照我的一个要求,帮我来找找我需要的一个图片。 ok, 那 我们直接上手体验一下吧。哦,还有一个,还有一个升级啊,很大的一个升级,他的一个上下文从那个四百 k 升级到了 em 啊,也就是说他的一个上下文能力是之前的一个二点五倍。 好,那我们现在就直接来体验一下啊,我们直接创建一个空的文件夹啊,给大家看一下,我在这里创建了一个可用 sof 文件夹啊,我先把这些之前的内容删掉啊,创建一个空的一个文件夹就可以了,然后通过这个 ai 的 啊添加新项目,把这个文件夹添加进来,添加进来之后呢,在这里面直接和他聊天就可以了啊,比方说我,嗯,跟他说啊,帮我打开可用浏览器访问聘锤斯特网站 啊,搜索猫咪的一个图片啊,然后帮我,嗯,挑选一张好看的图片保存在当前文件夹啊,我这个需求没有准备啊,比较含糊。 嗯,我检查一下, ok 直接发给他啊,比较含糊,没没没有,就是说让他给我挑选一个嗯,什么风格的图片啊?但是呢,因为 我把这个这个打开啊,但是因为它是通过浏览器打开的啊,就是 pinterest 的 对吧? pinterest 的 这上面我已经登录了的,所以的话其实它打开的这些图片都是和我的偏好是很一致的 啊。然后如果大家第一次使用这个功能的话呢?嗯, 他是他是这样的,给大家讲一下,第一次使用这个功能的话呢,他会要求一系列的一个权限啊,你把权限全部给他就可以了啊。然后你这个模型的话呢,你必须要选嗯, gbt 五点四啊,或者最新的模型也都是可以的啊,因为 gbt 五点四是第一个 首次支持啊, computer 柚子的这个 open ai 家的一个大模型啊。 然后这边的话呢,还可以选择速度,速度的话呢,选 fast 的 会更加快啊。 ok, 他 在帮我来找图片,帮我保存啊。然后,嗯,还有一个地方要注意啊,就是如果大家第一次用的话啊,比如说我现在是 让它打开 core 浏览器来帮我做一些任务啊,对吧?它里面会涉及到一个脚本,脚本的一个使用,脚本的一个使用的话呢,我把这这个这个放到这边啊啊,涉及到 ok, 他 又问我要权限啊? ok, 给他啊,涉及到脚本的一个使用的话呢,他需要还需要在 chrome 浏览器的一个上面的一个菜单栏里面啊,在这个显示页面 开发者,对吧?这里把这个也勾上允许 apple 事件中的 javascript 啊,就是说允许, 呃,允许 code x 在 浏览器里面来执行这个脚本指令啊,这样的话它的一个任务会完成得更加顺利一点。 ok 啊,等他来操作啊,因为因为还因为他这还是第一个版本吧啊,所以的话呢是有点慢,执行速度是有点慢的啊,他已经拿到了一个原图地址了啊,然后他你看他用过用这个刻指令来 把这个图片保存到我们当前的一个文件夹啊。 啊,正在执行啊,其实它就是通过一系列的脚本来完成这些。呃,电脑操作的啊,所以它的一个通用性是很强的,就是说它是支持所有的一个 app 的 啊,像有些 app 比如说微信 app 啊,微信 app 不 可能去开放这些 api 给他的。那他是怎么做到的呢?他是通过一个打开微信 app, 然后他去截一张图,截图之后他会来定位到他所需要的一个功能区域,然后再模拟鼠标点击去实现对应的一个事件。 ok, 已经处理好了啊,他给我保存了一个这张图片啊,那我们再来看一下他的一个其他的能力啊。嗯,比如说 我想让他来帮我回复 b 站的一个评论啊啊,然后这个这个的话呢,我为了方便,我不希望我每次都告都给他讲一堆东西,所以的话呢,我一开始我就告诉他, 我让他来帮我创建 agent 点 m d 文件啊,因为 code x 在 执行任务的时候,每次他都会来读这个文件的啊,这样的话,我一些重复的话我就不用给他说了。我告诉他 啊,这是我的 bilibili 啊,我告诉他啊,帮我打理 bilibili 用户的一个回复与私信,然后这是用户的一个回复页面啊,把这链接给他啊,防止他不知道在哪里。因为他是一个通用的一个大模型吗?他需要处理的信息太多了,太广泛了啊,他可能不一定 知道这个回复页在哪里啊,并且如果,如果他不知道的话,他去找的话会费很多功夫,所以我直接给他 啊, ok。 然后呢,我又让他完善了一下,我让他每条回复啊,让他更新一下 id 字母 d, 每条回复要带上尾缀拜扣的 x app gpt 五点四啊,这样的话,用户收到这个回复的时候,知道这条回复不是我发的, 然后每条回复呢,要写到日记里面去啊,这样的话呢,嗯,就更加他做的什么事情我都知道啊。然后他给我更新了,更新好了之后是这样子的啊,这样子的,其实我也没有看,我也没有看,你看工作方式,他给我讲讲好了啊, 他已经默认我已经登录好了的,他默认我已经登录好了的。然后呢,回复的一个原则,他也写好了,我想改的话,我在这里改也可以啊,但是呢,我没有做任何修改。 然后呢,比如说涉及到垃圾信息的话呢,他要先征得我的同意再回复啊,包括这些什么一些邀约啊,一些乱七八糟的东西啊,都都得这样子。 ok, 那 那那现在的话我就可以让他来执行任务了啊,比方说我, 我让他来执行,帮我回复最新的评论啊,打给他把这个小窗打开,这样我我们大家可以来看他是怎么怎么怎么操作的 啊,你看他直接用我给他的链接打开了,打开了,他来看第一条评论是哪一条啊?他先来确认一下, ok 啊,他已经,嗯他,他说然后啊,因为这个评论我已经回复过了啊,我之前让他执行过一次啊,所以的话,你看他还很聪明,他说 这个评论他已经回复过了的。日记记录在这里啊,我们来看一下看一下这个日记啊,日记的话其实在这里啊在这里啊,本人是 u x 设计师,然后您代码基础想学习 web coding 啊,这些可以学习吗?然后 他给我的回复就不是我自己的回复,他说可以学啊,并且你有这个 u x 背景是很有优势的啊,这这么一些 东西啊。啊,那那那我们再,再来继续啊,再来继续,来给大家看一下他的一个玩游戏的一个能力。 code x 啊,玩游戏的一个能力啊。 ok, 我 们还是继续用用这个画好了啊,直接新开一个回话啊,在这里帮我玩一下可用打开的扫雷游戏啊。我,我现在打开的是一个扫雷游戏,我让他帮我玩一下 啊,同样,我为了方便大家观看的话呢,我还是把这个拖到这边来啊,把这拖小一点好了。这样子啊,这是一个扫雷游戏, 看一下它啊,它现在的话呢,它处理这些任务是很慢的,因为因为这是它的第一个正式支持 computer use 的 一个版本嘛,它的速度是很慢的, 但是呢,我觉得就是以这个状态发展下去的话,到下一个版本那我感觉他都可以去做那个,他都可以去代练了啊,就就比方说我们开很多个页面,对吧?让他帮我们在游戏里面来打金币, ok, 然后呢,其实我我我觉得可以这样子,就是每次他成功帮我们执行好一个任务之后呢,我们让他帮我们更新一下 啊,或者如果像我这个项目我都没有创建一些 md 啊,这玩游戏的项目,你可以让他创建一下 md, 帮他更帮你更新一下,这样的话呢,他下次就会少踩很多坑,不然的话你看他在, 他在他的脚本在一个一个执行啊,他执行了很多脚本,他都是尝试性的去实现这个任务,他得他可能得从一百种方式里面 找到一种合适的方式才行啊。但是你更新了 index dm 低了之后呢?后续的话他直接就拿他的成功的方式放在最前面啊,他可能一直接拿第一种方式一试就成功了就可以了。 你看页面变量隔离比预想的要严格。他还他还讲出来这个任务啊,他遇到了什么问题啊,他要怎么解决,都是完完整整的在这个思考过程中说出来的。 ok, 然后然后等一下的话呢,我还让他帮我来回复一下微信消息啊 啊,他要确定一下当前的一个盘是不是新开的,到底是已经玩到一半了还是新开的,如果是玩到一半了,可能他再要看一下当前的一个局势啊,当然我这个盘是新开的, 你看他执行了各种脚本文件啊,其实大部分脚本文件都是都是,都只是一个试错。 嗯,等他,等他完成, ok 啊,他终于理清了终于理清了啊,已经在扫雷了, 读取展开后的局面开始解啊,又在开始解这个,解这个雷了 啊。其实好像,好像,我如果把它变成超高的话,像还快一点啊变成超高好像快一点。为什么呢?因为它的一个思维更会更加神秘一点啊,它解决问题会快一点,只是回复变得慢一点而已。 嗯,你看他通过他不需要做图像识别了,他直接瞬间给你打出来,因为他之前他在尝试用图像识别来解这个问题,但是实际上的话呢,因为我们打开的是网页嘛,他可以直接通过 就是读源码的方式,因为网页它是可以,对吧?在 chromium 里里面,你是可以通过检查通过 f 十二检查来获取网站的一个源码的啊,所以它已经直接报文完成了。 ok, 我 不用开下一局了啊,我,我可以再让他帮我玩一下飞机大战啊, 帮我继续玩飞机大战这个游戏 发送, 然后我,嗯,我好像不能多操啊,这里有一个问题不能多操,因为他他他要打开对应的一个页面啊,所以的话,如果我让他这会帮我回复微信消息的话呢,可能不是很方便, 但是可以给大家看一下啊给大家看一下啊,微信消息啊,回复微信消息。我也是新建了一个 index html 的, 但是我说的非常简单,我直接让他帮我创建 index html 文件用于回信微回复微信 app 啊,他就已经创建好了对吧创建好了之后呢我同样让他就是每条回复都带上尾缀啊,并且啊写上日期啊对吧然后嗯你看 啊帮我回。那他这样这样子啊写了啊 ok 完成了 action dm d 了之后呢我让他帮我回复啊回复的话呢其实是已经回复成功了的啊我我重新开个绘画框。 嗯那我这边玩游戏的把它停掉好了啊停掉 帮我打开微信 app 然后定位到第一条绘画框啊然后回复里面的消息 啊用高算了啊因为这个东西应该主要是涉及到一个图像识别 发送吧啊发送把这窗弹出来啊。因为 啊 ok 他 在思考啊然后他要处理微信消息和处处理核核循消息还不一样啊。因为因为处理核循消息的话他是通 啊他打开了处理核循消息的话呢他是可以通过脚本通过那个读取网页的一个原码来执行一些任务的但是呢他要去 操作微信消息的话呢他有一个问题啊微信是不可能开放这些 a p i 的 微信 app 的 话对吧?那他只能去通过一个图像识别啊,通通过图像识别的一个 窗口。哦哦等一下等一下停止一下啊停止一下有个坑啊。因为因为我现在在录视频我是我是有打开了多个窗口的啊我我我是有多个 屏幕所所以的话呢他他默认打开的屏幕是在第二块屏幕啊对对对,他帮我挪过去了啊我重新给他说啊。嗯微 微信 app 的 话就在当前屏幕处里啊不要挪到其他的屏幕去 啊。因为我这个是特殊情况所以我给他解释一下啊。 ok, 那 不然的话,他给我挪到了另外一块屏幕,我录视频的话,大家就看不到了。为了方便演示一下, 你看啊,他的话,他的执行操作会非常慢啊,因为他打开了之后呢,他得通过 截图的一个方式,他得通过截图的方式来获取当前屏幕的一个信息。 然后呢,他截完图之后呢,他又得通过 ocr 文字识别啊,来识别对应的一个文字来定位到对话框啊,包括包括如果你让他在指定的群里面回复也是可以的,指定的群里面,他可能会定位到这个搜索框来搜索这个群 啊,搜索好这个群之后呢,对吧?他他进每进入一个新页面,他都得进一次,就是视觉啊,进行计算机视觉来识别这个信息啊,所以的话会非常非常慢,所以给大家简单演示一下啊。 啊,他还是要拉到我的我的这个麦克屏幕上去啊,大家可能看不到啊,可能会看不到啊,等一下,等他回复好了,我我我再给他拉出来 啊,已经可见了啊。啊,因为因为我,我现在大家看到的屏幕的话是副屏啊,他,他目前的话我没有跟他讲清楚。卧槽,他已经在掉我的鼠标了, 那我鼠标不能动啊,我鼠标不能动, 等一下啊, 这个是会有点麻烦的, 因为因为微信这种 app 的 话,它的一个隐私保护, 隐私保护它是做的非常那个做的很严,所以的话会麻烦一点啊,如果,比如说,如果让我们让它打开 xcode 啊,去执行一些操作的话呢,它会快很多很多 啊。你看啊,这是他的一个操作流程, 他会,他会执行各种脚本啊,打开搜索框,粘贴完整打开, 他发了一条消息,但是发错了发了一条消息,但发错了啊 啊,之前的话我有测试过,就是他是发的消息是对的啊,可能是因为我的这个屏幕的一个原因,我可以给大家 展示一下。好了啊,因为,因为我现在是双双屏,双屏话可能有点问题,我把它停掉,停掉我给大家展示一下啊。嗯,我让他回复一下啊 啊,比如说他在一个,他在我的一个微博 qq 的 群里面给我回复了一句这样的一个话 啊,比如回复了 open ai, 呃,已经发布了 chat gpt 啊,什么什么拜扣的 xapp 五点四啊,这个话就是他回复的, ok? 呃,那我们 就是今天的一个分享,就到这里感谢大家的一个观看啊,欢迎大家一见三年啊,对我的视频鼓励,感谢感谢。

克劳德的 oppo 四点六版本究竟有多强大?让我们通过与 g p t。 的 对比来一探究竟。首先进行的是高难度测试,我们将直接进入正题,看看他在处理复杂问题时的表现如何。 g p t 五点四版在第一个问题上就出现了错误,而克劳德则给出了正确答案。接下来继续看第二个问题, g p p 再次答错,但克劳德依旧回答的非常出色。我们再来看看第三个问题, g p p。 的 回答依然不理想,相比之下,克劳德的回答更胜一筹。最后总结一下,经过九轮不同的测试,克劳德以九比零的成绩完胜 g p p。

再看一下我最新尝鲜的这个 g p d 四五点四的这个版本,大家都网传说它可以直接去操控网网页什么的,实际上是不可以的 啊,它需要有两个前提,一个前提是你要去是美区,然后去下载一个叫 check gbd windows a a p p 的 一个功能,它这个东西它只通过微软商店分发,而且大陆这边目前是无法下载的,包括你用题什么的。 其次啊,这个是它的回答啊 啊,他推荐说,实际上如果你真的要使用 它进行一些电脑网页的操作的话,还是用 oppo core, 至少到目前为止,虽然 oppo core 的 老大加入了 oppo ai, 但是 目前还是 oppo oppo core 的 整个啊操作电脑端的这种能力会远远远远领先。

g p t 五点四悄然发布,今天给大家来聊一聊 g p t 五点四到底有哪些升级。首先我们分为四大块,第一块是它的上下文与效率,那这是 g p t 五点四呢?它支持了一兆的上下文, 它对于大型项目以及长文档处理的能力都有一个很好的提升。但这边值得注意的是,如果张嘉文超过了两百七十 k token, 那 么他会采取阶梯收费的方式,那有可能你的收费会比之前贵上两倍。 得益于它的自动压缩机制以及垃圾回收机制的优化,总体的 token 用量其实要比上一代还是降低了不少。第二个是工具与电脑的使用, 那这次 openai 官方说明了 gpt 五点四内置了 prewrite 的 api 接口,那使它能够直接操作浏览器,控制键盘、鼠标,还能够调用各种自定义的工具,对于一些复杂的自动化任务,它有更好的处理能力。 还有他有智能的搜索工具的功能,之前对于一大堆工具他是一个一个去尝试,那这次他会先智能的选择合适的工具再进行尝试。第三,他的推理能力以及多模态能力都有一个很好的提升,这次的思考模式会先想好计划再动手, 适合处理复杂的调查工作以及调试工作。他的看图识字能力也更强,特别擅长理解表格和法律文档结构。 但是这次的安全机制再一次进行升级,对于网络安全以及敏感话题,他会更加谨慎, 减少了高风险的回答。那这一点其实也是在社区评价褒贬不一的,因为他对于一些 稍微有一点风险的话题,他就会拒绝回答,那 open、 a、 a 它们对于 g、 p、 t 五点四的定义是适合企业用的这个默认大模型,所以它这次管的是比较严,如果你想要自由发挥,自由创作,那你可能需要调整一下你使用的模型, 那这次具体有哪些能力的数值提升,我们一起来看一下。我这边整理了 gpt 五点四、五点三、 codex 以及五点二的三项数值, 那首先第一项是网页解锁能力,那在这个网页解锁能力这一方面, gpt 五点四相比于 gpt 五点二有一个非常大的提升,从百分之六十五点八提升到了百分之八十二点七。 第二项是做工具任务的能力,也就是我们刚刚提到的,它自己会去智能的搜索适合的工具,那这个也有一个挺大的提升,从 gpt 五点二的四十五点七提升到了 gpt 五点四的五十四点六。第三项这个 osword 的 能力, 那这个 osword 的 能力,它从 gpt 五点二的四十七点三提升到了五十七十五, 这个说明它的对于操作系统的控制能力有一个非常大的提升。那本次 gpt 五点四的升级我主要概括为两方面, 一方面是它的 token 使用更高效了,可以使用更少的 token 去做更多的事情。第二方面它的主要提升就在于对于图形界面的操作能力, 不管是上面说的浏览器也好,这个工具的调用也好, os word 也好,这三个都是在提升小龙虾对于 gpt 五点四的这个使用能力,也就说它在小龙虾里面它会调用的更好, 也证明了这个其实 open cloud 它在这个就是当下这个时代是被 a ai 各大 ai 公司认可的一个大方向,不管是 open 四点六还是五点四,它们的提升方向目前都是在于这个图形界面的这个操控能力。 对于五点四的实际能力怎么样,我后续会在 open cloud 中实际调用测评一下。本次介绍到此结束,谢谢大家的观看。

最强的 gbt 五点四啊上线了啊,现在都是五点四版本,我是 plus pro 用户啊,就是两百美金一个月的,不管是 plus 还是 pro 都可以去使用的,就两百美金还是美金都可以使用的,我们来看和之前的版本有什么区别啊? 和 gpt 五有什么区别?首先第一个就是更强的专业工作能力啊,就比如说在 p 做 ppt 编码能力精准测试中啊, 超过了百分之八十三的精准水平啊,达到了行业领先啊。第二个呢,就是原生控制自己的电脑,就比如说我们自己使用的这个电脑啊,他能直接看懂界面,看懂我们的界面,也能直接去控制 鼠标和键盘,打开软件,填写表格等等之类的。第三点就是超长的上下文,不管我们是 plus 还是 pr, 不 管是五点四 thinking 还是普通的模型啊,都可以达到了一百万字幅的上下文啊,可以仅仅把一整本书啊,都能 全部统一在一个窗口上去进行流畅的对话。第四点呢就是准确率更高啊,简单说可能胡编乱造啊,或者是等等之类的削减了,不像以前就是可能 他不会的说自己会啊等等一些问题。第五个点呢就是编码能力提升了。第六就是多版本啊, 有 gpt 五点四映衬,还有 thinking 就是 深度思考,还有 pro 啊,就我这个版本就企业最高级的就是两百美金一个月才能去使用到的啊。然后第七点 就是制服效率更高了,更加适合于长任务,还有他们这个对比啊,总结就是 gpt 啊,用来写作科研,做数据分析等等,都可以点击我主页的这点作品找到我。


gpt 五点四终于来了,它真的能动手了!它具备了原声电脑操控能力,能像人一样看屏幕、点鼠标、敲键盘。接下来,我们一起看看这次大升级到底升级了哪些方面。 第一,原声电脑操控。这是本次更新的灵魂,因为它让 ai 首次跨越了对话的边界,能自主规划并执行跨软件的复杂工作流,桌面操作能力直接超越人类平均水平。 第二,思维模式,深度融合模型在解决难题时会先思考再行动,且支持用户在思考过程中实时打断和修正指令。第三,百万级上下文窗口, 标准版支持一百万 tokens, 能一次性吃透整本小说或大型代码库,解锁精度极高。第四,代码全站自动驾驶, 不仅能生成六千行代码,还能在本地环境自动运行报错并自我修复,实现真正的闭环开发。第五,身网研究与成本优化,增强了访问授权账户获取信息的能力, 同时在复杂任务下的调用成本降低了近一半。那中国模型,比如通易千问, q n 三五 plus 和它比差距大吗?说实话,在纯文本推理、中文理解和代码生成这些脑力活上, q n 三点五 plus 已经追平了 g p t 五点二, 甚至在某些榜单上互有胜负,硬实力差距微乎其微。一旦谈到性价比,中国模型简直是降维打击。 gbt 五点四的输出价格高达每百万 token 一 百零八元人民币,而 q w n 三点五 plus 只要八毛钱, 整整差了一百三十五倍。如果你是要处理海量数据,做大规模客服或者高频调用,用 gbt 五点四可能会让你破产, 而用中国模型,你可以随便造。在这个维度上,中国模型不仅完胜,简直是直接把高性能 ai 变成了水电煤一样的基础设施。那什么情况下,你必须得用 gbt 五点四呢?当你需要 ai 像个数字员工一样去操作那些没有开放 api 的 老旧软件时, 当你需要他独立解决一个从未见过的复杂难题,比如全自动开发一个完整项目,或者进行深度的跨国科研分析时,当你对任务的准确率要求极高且预算充足,需要他具备全球最强的逻辑闭环能力时, 这时候 gdp 五点四贵有贵的道理,他买的是自主行动力和极致智力。最后留个问题给大家,如果让你选, 你是愿意花一百块钱雇一个能帮你动手干活的 gbt 五点四?还是愿意花一块钱雇一百个只能动嘴皮子但智商也很高的中国模型? 你觉得未来是全能管家赢,还是人海战术赢?评论区告诉我你的选择。关注我老朱 ai 的 分身,咱们普通人一起 ai 落地!

太炸裂了! openai 又深夜突袭! gpt 四点一登场,直接把界面内和 cloud 踩在脚下!这是首个拥有原声电脑操控能力的 ai 模型,推理、编程、操作三大核心能力全面打通! 更惊人的是, gpt 四点一与 openai 完美适配,全面引爆自动化工作流程!这不仅是 ai 操控的突破,更是智能工作流程全面进化的开始!一口气总结了三大亮点,看一下到底有多炸裂! gpt 固点四是首个原生具备计算机操控能力的模型, 这是其他 ai 模型从未突破的瓶颈。它不仅能通过代码控制计算机,还能直接看屏幕、动鼠标和键盘,像人一样操作电脑发邮件、排日程、填表格、跑流程。这些以往你需要点来点去的活,现在 gpt 杠五点四自己搞定! 最炸的是,它能与 opencloud 完美适配,实现全自动操作与实时任务管理,让每个任务都能无缝衔接。 这不仅是操作的突破,更是工作效率的全面升级!第二,涨啊!推理加编程合体,一个模型全搞定! gpt 五点四完美继承了 gpt 五点三 codex 的 编程能力,并在推理方面做了大幅升级。 w 一 奔驰 pro 编程第一, gpt 爆!测试胜率百分之八十三,打破了专家记录 代码编辑问题求解!抽象推理在一个模型内就能同时完成,再也不需要切换工具,效率提升超快! 最炫的展示之一,就是只用一句话,就能自动生成一个完整的主题公园经营游戏不仅能编程,还能自动调整和优化游戏的 ui, 实时调试,确保每个细节都完美。这是推理和编程的完美结合,让开发和创意变得更加简单高效。第三站, 工具搜索上线,偷啃狂砍百分之四十七,效率还更高。 gpt 五点四在工具使用上的突破让人震撼,引入工具搜索功能,解决了工具繁多,上下文混乱的问题。 在 m c p atos 测试中,减少了百分之四十七的 token 消耗,大幅提升了速度和处理效率。更不可思议的是,网络搜索能力的提升,搜索准确率突破百分之八十九点三,成功超越 clod opus。 四点六, 你还可以在任务进行中实时打断,调整思路,不用再推倒重来,大大减少重复沟通。最后附上他的成绩单, g p t 五点四在每个维度都展现出了前所未有的突破,全维度碾压其他模型,你大爷依旧是你大爷,在 ai 时代的竞争中,他依然在最前沿。

gpt 五点四正式上线,推理能力逼近人类, ai 时代彻底来临。二零二六年三月八日, open ai 官方宣布, gpt 五点四 四大模型全球正式上线,推理能力、逻辑思维、情感理解、多模态交互全面升级,在人类智商测试、专业考试、创意创作中得分逼近人类平均水平, 支持实时视频交互、三 d 建模、代码编写、科学计算等复杂任务,瞬间引爆全球科技圈。很多人表示, ai 中移动工具变成伙伴。以前觉得 ai 取代人类是科幻,现在看来已经近在眼前,我们正在经历 ai 时代的最大改革。 g p t。 五点四的核心突破在于实现了类人级推理能力。此前的 ai 模型只能处理固定指令,缺乏逻辑思考和情感理解,遇到复杂问题容易出错。而 g p t。 五点四能像人类一样思考、分析、推理文字背后的情感意图、潜台词, 甚至能感知用户的情绪变化,给出共情回应。比如在心理咨询、教育辅导、创意写作等场景, gpt 五点四不再是冰冷的机器,而是能共情、能思考、能引导的智能伙伴。在专业领域,他能通过律师、医生、工程师资格考试,准确率超过百分之九十,堪比行业资深专家。 多模态能力方面, gpt 五点四实现了文本、图片、音频、视频、三 d 模型的全维度交互, 上传一段视频,他能精准分析画面内容、人物情绪、场景逻辑,甚至能修改视频,生成特效,编辑剧本,输 入一个想法,他能直接生成三 d 模型,工业设计图、建筑效果图,无需专业软件操作,代码编辑能力大幅提升,支持全语种编程,能独立开发大型软件 app, 游戏 bug 率降低百分之九十,开发效率提升十倍以上。科学计算方面,能辅助科研人员完成数据建模、实验分析、论文拽写,加速科研突破进程。 对于普通人来说, gdp 五点四的上限会彻底改变。工作、学习、生活方式,学生不用再死记硬背。 ai 能定制学习计划,讲解难题、辅导 作业,实现个性化教育。上班族不用再做重复繁琐的工作。 ai 能代写文案、整理数据、制作 ppt、 沟通客户、解放双手,提升效率。创作者不用再苦于灵感枯竭。 ai 能辅助写作、绘画、剪辑、作曲, 成为创意搭档。老年人能通过 ai 陪伴健康、咨询、生活协助成为创意搭档。 ai 不 再是高科技产物,而是融入生活的必备工具。 行业层面, gbt 五点四会引发全球产业改革,大量重复性工作会被 ai 取代,同时催生全新的职业和产业, ai 训练师、 ai 咨询师、 ai 创意师等新职业应运而生。就业结构迎来大调整,企业纷纷进入 gbt 五点四,降低运营成本,提升生产效率,推动产业智能化升级。 同时也引发了关于 ai 理论就业冲击隐私安全的讨论。各国加课出台 ai 监管政策,规范 ai 发展方向,让 ai 更好地服务人类,而不是威胁人类。不可否认, ai 的 发展速度远超我们的想象。 gbt 五点四的上线,标志着 ai 进入类人时代。我们不必恐慌 ai 取代人类,而是要学会与 ai 共存, 利用 ai 提升自己,适应时代变格。科技的进步永远是为了让生活更美好, ai 是 工具,也是伙伴。未来以来,我们要做的就是拥抱变化,跟上时代的脚步,享受 ai 带来的无限可能。