今天给大家分享的软件是三月八日更新的拆 gbt 五点四最新版,亲测好用,还给大家准备了保姆级的本地部署教程和网络配置教程。 新版还更新了操纵电脑的功能,话不多说,直接带大家白嫖。首先点右下角分享键 分享复制链接,复制成功后我们打开这个蓝色小鸟,没有的话就去安装一个,打开后会弹出一个资源包,如果没有弹出就在这里搜索删除宝库,然后打开这个文件夹,找到这个软件保存下载安装就可以用了。
粉丝498获赞2321

嘿,各位 openai 又不睡觉了?搞了个大动作,就在昨天凌晨,悄悄地,没有任何预告,直接甩出来一个 gpt 五 four。 哎,你可别以为这只是个小小的版本更新。不不不,这简直是一次核弹级的飞跃,可能会彻底改变我们跟电脑打交道的方式。 所以今天咱们就得好好聊聊,这东西到底是个啥,又意味着什么?你可千万别把它当成一次普通普通的性能升级。 我跟你念念最初爆料的那个人是怎么说的,他说啊,这个模型他将会改变二零二六年整个 ai 智能体的格局,你听听,这口气是不是特别大?那为什么敢这么说呢?就是因为他终于,终于搞定了一个我们盼了很久很久的核心功能。 你想想,半夜两点钟搞这种突然袭击,整个科技圈一下子就炸锅了,所有人都蒙了。但这也恰恰说明了 openai 对 这个技术有多自信,也暗示了它背后藏着的潜力有多么巨大。 行,那今天咱们就分几步,把这个新模型给拆解的明明白白的。首先,咱们看看他到底飞在哪了?然后呢,用实打实的数据说话,看看他性能到底有多猛。 接着,咱们得深入聊聊他那个最牛的杀手锏,直接控制你的电脑。之后别急,我会手把手教你怎么把它用起来。最后,咱们再一起畅想一下,这 ai 智能体的未来到底会变成什么样? 好,咱们先从第一点开始。为什么我一直强调说 gpt 五点四的发布是一次飞跃呢?关键就在于它带来的可不只是测试分数高了那么简单,而是一种从无到有的全新能力,这才是一个真正的游戏规则改变者, 这个核心能力说白了就是原声电脑控制。怎么理解呢?很简单,就是说这个 ai, 它不再只是个跟你聊天的机器人了,它现在能像一个活生生的人坐在你电脑前一样,直接帮你点鼠标,敲键盘。 你可以直接跟他说,嘿,帮我把下载文件里上个里边的报告都找出来整理一下,然后做个 ppt, 点摘呀,发给老板,然后呢,你就真的可以啥也不管去泡杯咖啡了,这才是我心目中那个真正的 ai 助理啊。 当然了,光说不练假把式,吹得这么厉害,到底有没有真本事呢?有没有术技来撑腰?来,咱们这就来看看 gpt 五点四在各种硬核测试里的表现到底有多么的 吓人。咱们来看个特别专业的领域啊,金融建模这玩意儿啊,说实话,很多刚入行的投行分析师都搞得头大,你看上一代模型, gpt 五得分是六十八点四,爬线也就勉强及格吧, 但是 gpt 五点四呢?你猜多少?直接飙到了八十七点五趴,我的天,在这么复杂的任务上一下子提升了快二十个点,这根本不是进步了,这简直就是进化了。再来看看上网的能力,有一个叫 mta 未卜的综合测试, 这测试是干嘛的呢?就是专门模拟咱们真人在网上做各种复杂操作,结果你猜怎么着啊? gvt 五点四的成功率高达百分之九十二点八, 这数字意味着什么?意味着你让他去网上帮你定一张指定日期的机票,或者去搜某个产品的用户评价,他十次里头有九次多,都能给你办的妥妥的,基本上就不会出错了。 这张表啊,简直就是他的战绩单,可以说是全面碾压。你看,不光是那些硬核的专业任务,就连审美这种很主观的东西, 比如说让他做个 ppt, 结果都有六十八趴的人更喜欢 gpt, 五点四做出来了。所以你看,从专业能力到审美,再到调用各种工具的准确性,他几乎在所有方面都把之前的模型远远甩在后面了。 行,有了这么强大的性能打底,咱们终于可以聊聊最最激动人心的部分了。就是那个杀手级应用,原始电脑控制,你记住,这可不只是一个新功能那么简单,他很可能会开启一种我们以前想都不敢想的全新的工作模式。 哎,在咱们看到举起能干嘛之前,大家不妨先跟我一起想象一下,如果有一个 ai 能像一个经验丰富的老同事一样熟练的用你的电脑,那这个世界会变成什么样? 你再也不用手把手的教他,第一步,点这里,第二步复制那个,你只要告诉他你最终想要什么,他就能自己搞定一切。 那具体它能干点啥呢?你看管理文件、操作软件,这些都是基本操作了,但这里面最关键的是最后那一点,它能长时间自主工作,这就厉害了, 这意味着什么呢?意味着你早上出门前可以给它扔个任务,比如说把我这个月所有的销售数据都扒出来,扔到 excel 里,然后把卖的最好的前三名找出来,然后你就去开会,去忙别的,等你回来的时候,哎,活已经干完了。 说到这,你是不是已经摩拳擦掌,特别想亲自试试了?别急,咱们马上就来讲讲到底怎么才能用上这个 gpd 五点四。 想用上它啊,目前主要有两条路可以走,一条呢是给开发者们准备的,叫 opencloud, 得动动手,敲点代码。另一条路,那就简单多了,就是刚发布的 windows 桌面应用,这个就适合咱们绝大多数普通用户了。咱们分开一个一个说, 如果你是开发者,那你就可以照着屏幕上的步骤来操作。不过这有个小坑儿,大家要注意一下啊。就是在第四步设置的时候,你得先选那个旧的 gpt 五点三 codex 模型,把整个出使流程走完, 等全都设置好了,再用一个专门儿的命令把它切换到最新的五点四。这一点呢,千万别搞错了,那对于咱们大多数人来说,直接用 windows 应用就完事了,简单得很, 下载安装,然后用你的 open ai 账号登录在那个模型列表里,找到五点四,选它就行。 但是这里有最最最关键的一步,大家听好了,系统会跳出来问你要权限,你一定要给它完全访问权限。 我跟你说,不给这个权限,它顶多算个高级点的聊天工具,可一旦你给了这个权限,它就摇身一变成了那个能帮你干活的超级 ai 同事。 好,现在咱们知道它是什么,也知道怎么用了。那咱们不妨站着远一点,从一个更大的角度来看一看,这个技术的出现到底意味着什么。有人说,它真的能做我们人类百分之九十九的工作, 你乍一听啊,是不是觉得有点夸张,有点危言耸听?但是你静下心来仔细想一想,当一个 ai 真的 能处理所有在电脑上完成的安头工作时,我们大多数人的工作性质可能真的会发生翻天覆地的变化。 所以最后我想把这个问题留给大家。当一个工具号称能够完成九十九 percent 的 办公室工作时,我们心里到底是兴奋多一点,还是焦虑多一点?我们自己的职业规划,我们对工作、对价值的定义,真的为这个马上就要到来的新时代做好准备了吗? 这个问题可能没有标准答案,但它绝对值得我们每一个人从现在开始就认真的思考一下。

这波更新直接把 agi 往前推了一大步,朋友们,今天真的太热闹了,被 jamming 和 claudia 了整整一个月的 openai 直接憋出了一个王炸, gpt 五点四 一夜之间所有竞品的神话都被碾碎。这个视频我就用两分钟的时间带你看一下这个模型到底有多颠覆。首先是原声操控电脑, gpt 五点四已经能像人一样通过视觉鼠标和键盘操控你的电脑,包括快速填表、单发邮件、排日程等等。比如这个,他正在把右边的资料填到左边的系统里面,画面我并没有做任何加速。 还有这个,他正在用金妙给团队成员发邮件,并将会议日程分发给其他成员,你觉得这个速度和熟练度怎么样?其次是全能办公, gpt 五点四这次重点提升了创建和编辑文档、电子表格和演示文稿的任务功能。有人认为他的 ppt 已经做的比设计师美, excel 算的比分析师还要准。这里可以看一组对比。 这个是 gpt 五点二做的 ppt, 这个是五点四的。很明显,五点四具有更丰富的视觉效果以及更强的图纹美观性,整体的审美有了不小的进步。 还有这两个表格,可以看到五点四的格式呈现效果更加直观,还区分了文字重点,仿佛一个成熟的文员。值得一提的是, gpt 五点四的幻觉率暴降了百分之三十三,错误率也砍掉了百分之十八。第三是推理编程合体, gpt 五点四在编程测试中已经达到了百分之五十七点七的准确率,超过了 codex, 并且支持一百万 token 的 上下文聊天窗口, 你可以让他来自主开发角色扮演类游戏,在这个过程中,他会自己一边玩一边优化迭代自身代码,优化视觉效果和交互设计,所以小白也能开发属于自己的游戏了。 除了这几个核心升级点, g p t。 五点四这次网络搜索能力也迎来了暴涨, pro 版的准确率冲到了百分之八十九点三,直接反超 cloud, 在 视觉理解能力上也直接突破六千像素的行业极限,再细微的细节都能精准捕捉。还新增了中途可调需求的功能, 你随时能打断调整思路,完全不会打断模型本身的深度思考。所以在我看来,目前几乎没有任何短板的 g p t。 五点四, 这次恐怕并不是简单的升级,而是 ai 生产力的一次里程碑式改革。当他把每一条线都拉到顶尖水平之后,就会用行动来告诉你,谁才是通往 agi 的 路上最可能的终极 boss。

兄弟们炸裂的来了, gbt 五点四突然深夜发布!先来看个逆天的,这是 gbt 五点四自主开发的角色扮演类游戏,不光是他写的代码,他还正在自己玩,一边玩一边给自己的游戏代码优化迭代, 这个主题公园模拟游戏,甚至只是根据一条提示词生成的,然后他就自己玩上了。相信你也猜到了,这次 g p t 五点四最牛的就是他,是首个原生具备了最先进的计算机使用能力的通用模型。来看这个注意视频没有加速啊! gbt 五点四正在操控浏览器,快速的把右边的信息填到左边的发票表单中,速度快的有点看不清。这个是他正在用 gmail 给人发邮件,就问一句,你用电脑有他用的熟吗?也许 gbt 五点四就是个分水岭,很快就不是他会不会做,而是还剩下多少事轮得到你来做。

openai 刚炸出的 gpt 五点四,竟然能自己控制电脑干活成功率,直接干翻人类!就在昨天, openai 正式发布 gpt 五点四,它干成了所有通用 ai 都没做到的事情,不是出主意,不是写代码,而是真自己看屏幕,以鼠标点按钮,端到端搞定完整的工作流。 有人甩给他一堆真实桌面人物,开软件处理文件,跨应用跑流程,结果 gpt 五点四拿下百分之七十五的成功率,而人类测试员平均分才百分之七十二点四。也就是说,屏幕前的你,可能电脑还没有他用的溜。 看官方演示直接惊掉下巴。他自己打开邮件读内容,切日历创日程,全程连人插手的机会都不给。浏览器操作更狠。一百三十六个真实网站的购物订票填表任务,他直接完成了百分之九十二。上个月 cloud office 四点六做到了百分之七十二点七,还是天花板,现在直接被 gpt 五点四按在地上摩擦。 然而养着小龙虾的朋友直接狂喜,这不就是你家虾虾最缺的那个会用电脑的大脑吗?但狂欢背后也很扎心,有人测试 gpt 五点四 pro 就 打了个招呼,结果六分钟以后才回复,居然还花了六百块。 从 gpt 五点三到 gpt 五点四还不到一个月的时间, ai 能干的活又多了一块。问问你自己,现在手里的工作,还有多少是 ai 抢不走的?

万万没想到, openai 刚发布的 gbt 五点四,在自己操控电脑完成任务这件事上,成功率已经超过了人类。就在凌晨, openai 发布了 gbt 五点四,他做到了一件以前所有通用 ai 都没做到的事。自己操控电脑,不是帮你出主意,也不是帮你写代码,而是真正的能看懂屏幕、移动鼠标、点击按钮, 一套完整的工作流程自己端到端搞定。研究人员给他布置了一批真实的桌面任务,打开软件,处理文件化应用,完成工作流。结果, gpt 五点四的得分是百分之七十五,而人类测试员的平均分才只有百分之七十二点四。这意味着,屏幕前的你,可能电脑用的还没他溜。 欧派雅演示里,他自己打开邮件,读取内容、切换日历、创建日程,全程不需要人插手,浏览器使用也一样。 研究人员找来了一百三十六个真实网站,让他完成购物、订票、填表这类日常网页操作,他完成了百分之九十二。而就在一个月前, adripic 旗舰模型 cloud up 四点六完成的百分之七十二点七, 还被认为是这方面最强的选手,现在两者已经不在一个量级。看到这儿正养着龙虾喷 cloud 的 朋友可能已经反应过来了,你家的小龙虾需要的不就是一个像 gpt 五点四这样的会用电脑,会用浏览器的大脑吗? 不过这次更新,有人欢喜有人心疼啊。网友雨辰君用 gpt 五点四 pro 做了个测试,就跟他说了一句,嗨,我是 darryl。 等了将近六分钟, gpt 五点四 pro 回了一句,你好, darryl, 很 高兴见到你,我能为你做些什么? 这一句话花了他将近六百块钱。从 gpt 五点三到五点四,时间不到一个月,而每次更新 a 能干的活就又多了一块。你现在做的事情里,还剩下几块属于你自己。

obni 这次等于把大模型彻底重新定义了。今天凌晨, obni 正式发布 gpt 五点四,把编程推理、计算机操控、网页搜索和百万 token 上下文全部整合进同一个模型,成为第一个官方原声内置电脑操控能力的通用大模型。 它能像人一样自主操控鼠标、键盘,打开软件、处理文件,跨软件完成工作流。原理其实很简单,模型会先读取电脑屏幕截图,理解当前界面,再决定下一步鼠标点击或键盘输入,一步步完成操作。不过这些动作通常是在云端或沙盒的虚拟电脑环境中进行,而不是直接控制用户本机 在电脑操控测试中,成功率达到百分之七十五,超过人类平均水平,并且支持最高百万头,肯上下文,能轻松读完几千页文档。 在覆盖四十四个职业的 gdp 专业测试中,百分之八十三的任务达到或超过人类专家水平。投行及表格建模得分百分之八十七点三,事实错误率降低百分之三十三,编程、搜索推理全面登顶。说到这大家可能就困惑了,听着有点耳熟,都能操控电脑,都说能干活,那不就是 agent 吗? 并不是, agent 是 能干活的爱角色是外挂插件独立模块需要额外配置调试,会面临不稳定、任务完成率低的情况,它不是模型本身自带的。 而 gpt 五点四是把 a 阵能力直接焊死在模型里,不需要调用什么插件,模块理解加规划加操作加验证,全在一个模型里,原生自带,天生就会。如果说现有的 a 阵是改装车, gpt 五点四就是原厂超跑,这就不得不提最近大火的龙虾 open core。 但 open core 并不是模型,是开源智能体框架,它自己是没有大脑的,需要你接入 gpt 跨等模型才能变成干活的助理。 所以你甚至可以有一个大胆的想法,用欧本靠接入 g p t。 五点四,既享受 g p t。 五点四的超强推理,又能借助欧本靠本地部署的优势,实现数据隐私可控和自定义操作。当然,能力强也意味着贵。官方定价标准版输入二点五美元,输出十五美元,为百万头肯 购版更是高达输入三十美元,输出一百八十美元。更有意思的是, ai 云服务创起 hyperbarack 的 c t o 吐槽这哥们儿是他见过思考最过度的模型,你随口一句嗨,他能琢磨五分十八秒直接烧掉八十美元。目前 g p t。 五点四 thinking 只对 plus 和 pro 用户开放,免费版基本无缘。 有人说这是史上最智能、最接近了 g i 的 模型,我倒觉得 g i 远不远不知道,但那个只会聊天的 ai 时代,是真的翻篇了。

windows 的 windows 桌面端已经出来了,我深度体验了三天,接下来就跟大家录一个视频,说一下我在使用的过程中遇到的一些问题。首先这个页面就是我们下载的这个页面,直接点进去就可以下载,它是直接连接 微软的软件商店的,所以我下载的时候遇到的一个问题就是我的版本跟这个商店他不符合,因为我的电脑版本我是 win 十,我没有升级到 win 十一,所以说我在下载的时候他就说跟版本不符,我这个时候就准备了一个这样的升级,就是关闭系统防护的升级,还有一个是这里升级的一个文件,就做了一个升级就可以下载了。 下载之后我看到有朋友说下载之后有闪白的问题,所以我没有遇到闪白的问题, 下载了之后就进入到这个界面,其实因为我是代码的小白,我不知道这个界面之后应该怎么去按嘛,我看网上的教程大部分都直接是这个界面了,所以我当时还研究了半天这个地方直接添加项目就好了,添加项目它会让你选择一个文件夹, 我就建建了一个这样的文件夹,再添加项目,选中这个文件夹之后就能来到这样的一个界面。这样一个界面之后,主要我是看一下我们的左下角,它这个地方有一个剩余的额度好像,因为我 gpt 开的是 plus 版本,好像是可以额外再给两倍,反正这个剩余的额度,比如说百分之百,百分之七十六,这个是一周的,每天会给你多少小时,这个就是剩余的额度反,每天都非常的够用, 我看遇到最多的一个问题,包括我自己也遇到,你给他发了一个东西之后,他一直在思考,你看我这个,我三天之前发的,他一直在思考,我又开了一个新的任务,他仍然在思考,这个是怎么解决的呢?我换了一个节点,把 gpt 的 网页版,网页版打开,打开 gpt 的 网页版,打开了之后,换一个节点,我们可以在新建一个新县城,相当于是在这里去给它输入新的任务,最新的应该一一的,它就可以正常的去操作了。 好,下一个就是关于怎么能更好地使用它,其实我是一个代码的小白,我不知道该怎么去使用,有人说这个地方会有一些 skills, 我 没有额外的安装,我觉得基础的就够了。我这里其实主要是想说不要把它当成一个 ai 工具,就把它当成一个纯写代码的一个东西。那么其他的我建议要跟一些 ai 的 工具去做一些搭配着使用。比如说我最开始是搭配着 gpt 去使用的,就相当于用 gpt 给我的一些指令,我再导入到 codex 里面,让它去给我运行。 但是我深度测试了三两天,我发现 gpt 出来的东西仍然不能看,最后出来的这个效果不尽如人意。我在昨天下午我又深度的去换了一下,我换了一个 germanlab juma 之后,我用的 pro 的 模式,虽然我的 gpt 也是 plus 版本的,但是出来的效果不太好。我又用到了 pro 的 这个版本,就 juma pro 的 版本,给它输出我想要的东西, juma 会把它翻译成机器能读懂的这个代码语言,我再导入到这个 codex 里面,让它去给我运行,最后花了半天的时间,昨天满打满算应该是一天的时间,我最终把这个东西给研究出来了,当然 最后的结果是失败了,我开发的这个东西它是失败了,但是我建议大家如果要去使用它的软件搭配着用,就用其他 ai 工具搭配着用,不要直接在 codex 里面去提问。你看我之前就是遇到一部,我就问那个 codex 它该怎么弄,它就给我弄得很乱,因为我不知道怎么写,所以我就跟着它的步骤去, 但是他给我的步骤就又长,他会你问他一句,他说一句,他就不站在那种能完完全全解决这个事情的基础之上。但是 german 呢?给我的感觉就是他想他能够对准我们的这一个核心的目标去给你拆解,因为这是我整体使用 codex 的 一个感想,如果大家有其他的问题,也可以积极的去交流。

如何让 chat gpt 操控电脑呢?如果你想让 chat gpt 操控电脑,其实核心思路很简单,现在 gpt 五点四宣传的 computer use 能力,本质上是模型的一种能力,而不是一个已经做好的现成功能。如果你想在自己的电脑上实现,一般需要三个步骤, 第一,找一个现成的软件,或者自己开发一个 app。 第二,把 gpt 设置可以操作电脑的权限,比如执行脚本、点击输入等。 完成这三步之后, gpt 就 可以根据指令自动操作电脑了。如果你说的是已经做好的 computer use 功能,目前比较接近的是 chat gpt 官方的 operator 代理,它可以在伊格沙河 linux 环境中自动执行任务和操作系统。简单来说,模型负责思考,程序负责执行,这样 gpt 才能真正用电脑。

再看一下我最新尝鲜的这个 g p d 四五点四的这个版本,大家都网传说它可以直接去操控网网页什么的,实际上是不可以的 啊,它需要有两个前提,一个前提是你要去是美区,然后去下载一个叫 check gbd windows a a p p 的 一个功能,它这个东西它只通过微软商店分发,而且大陆这边目前是无法下载的,包括你用题什么的。 其次啊,这个是它的回答啊 啊,他推荐说,实际上如果你真的要使用 它进行一些电脑网页的操作的话,还是用 oppo core, 至少到目前为止,虽然 oppo core 的 老大加入了 oppo ai, 但是 目前还是 oppo oppo core 的 整个啊操作电脑端的这种能力会远远远远领先。

hello, 大家好,我是温特妙,我们来体验一下 openai 刚刚发布的 gpt 五点四,它的一个全新的功能啊, computer use, 我 们来看一下它的一个官方网址。啊啊 啊,在通过 codex app 或者是 api 的 话呢, gbt 五点四它是支持原声操控电脑的这个能力的,并且它是 openai 的 首个支持这个能力的一个通用大模型。 比如说它是可以呃,通过打通过就是打开其他的 app 来执行一系列的啊,复杂的一个工作流。比方说它可以帮我们打开, 打开微信 app, 帮我们来回复微信消息,帮我们来那个整理微信消息啊,比如说它也可以打开可用浏览器啊,比如说 打开一个玩游戏的页面,帮我们来玩这个游戏啊,他也可以帮我们比方说,呃,打开我的一个 b 站页面,来帮我回复用户的私信和那个评论。 然后他还可以啊,就是打开一个网站,比如说打开 pinterest 的 网站,按照我的一个要求,帮我来找找我需要的一个图片。 ok, 那 我们直接上手体验一下吧。哦,还有一个,还有一个升级啊,很大的一个升级,他的一个上下文从那个四百 k 升级到了 em 啊,也就是说他的一个上下文能力是之前的一个二点五倍。 好,那我们现在就直接来体验一下啊,我们直接创建一个空的文件夹啊,给大家看一下,我在这里创建了一个可用 sof 文件夹啊,我先把这些之前的内容删掉啊,创建一个空的一个文件夹就可以了,然后通过这个 ai 的 啊添加新项目,把这个文件夹添加进来,添加进来之后呢,在这里面直接和他聊天就可以了啊,比方说我,嗯,跟他说啊,帮我打开可用浏览器访问聘锤斯特网站 啊,搜索猫咪的一个图片啊,然后帮我,嗯,挑选一张好看的图片保存在当前文件夹啊,我这个需求没有准备啊,比较含糊。 嗯,我检查一下, ok 直接发给他啊,比较含糊,没没没有,就是说让他给我挑选一个嗯,什么风格的图片啊?但是呢,因为 我把这个这个打开啊,但是因为它是通过浏览器打开的啊,就是 pinterest 的 对吧? pinterest 的 这上面我已经登录了的,所以的话其实它打开的这些图片都是和我的偏好是很一致的 啊。然后如果大家第一次使用这个功能的话呢?嗯, 他是他是这样的,给大家讲一下,第一次使用这个功能的话呢,他会要求一系列的一个权限啊,你把权限全部给他就可以了啊。然后你这个模型的话呢,你必须要选嗯, gbt 五点四啊,或者最新的模型也都是可以的啊,因为 gbt 五点四是第一个 首次支持啊, computer 柚子的这个 open ai 家的一个大模型啊。 然后这边的话呢,还可以选择速度,速度的话呢,选 fast 的 会更加快啊。 ok, 他 在帮我来找图片,帮我保存啊。然后,嗯,还有一个地方要注意啊,就是如果大家第一次用的话啊,比如说我现在是 让它打开 core 浏览器来帮我做一些任务啊,对吧?它里面会涉及到一个脚本,脚本的一个使用,脚本的一个使用的话呢,我把这这个这个放到这边啊啊,涉及到 ok, 他 又问我要权限啊? ok, 给他啊,涉及到脚本的一个使用的话呢,他需要还需要在 chrome 浏览器的一个上面的一个菜单栏里面啊,在这个显示页面 开发者,对吧?这里把这个也勾上允许 apple 事件中的 javascript 啊,就是说允许, 呃,允许 code x 在 浏览器里面来执行这个脚本指令啊,这样的话它的一个任务会完成得更加顺利一点。 ok 啊,等他来操作啊,因为因为还因为他这还是第一个版本吧啊,所以的话呢是有点慢,执行速度是有点慢的啊,他已经拿到了一个原图地址了啊,然后他你看他用过用这个刻指令来 把这个图片保存到我们当前的一个文件夹啊。 啊,正在执行啊,其实它就是通过一系列的脚本来完成这些。呃,电脑操作的啊,所以它的一个通用性是很强的,就是说它是支持所有的一个 app 的 啊,像有些 app 比如说微信 app 啊,微信 app 不 可能去开放这些 api 给他的。那他是怎么做到的呢?他是通过一个打开微信 app, 然后他去截一张图,截图之后他会来定位到他所需要的一个功能区域,然后再模拟鼠标点击去实现对应的一个事件。 ok, 已经处理好了啊,他给我保存了一个这张图片啊,那我们再来看一下他的一个其他的能力啊。嗯,比如说 我想让他来帮我回复 b 站的一个评论啊啊,然后这个这个的话呢,我为了方便,我不希望我每次都告都给他讲一堆东西,所以的话呢,我一开始我就告诉他, 我让他来帮我创建 agent 点 m d 文件啊,因为 code x 在 执行任务的时候,每次他都会来读这个文件的啊,这样的话,我一些重复的话我就不用给他说了。我告诉他 啊,这是我的 bilibili 啊,我告诉他啊,帮我打理 bilibili 用户的一个回复与私信,然后这是用户的一个回复页面啊,把这链接给他啊,防止他不知道在哪里。因为他是一个通用的一个大模型吗?他需要处理的信息太多了,太广泛了啊,他可能不一定 知道这个回复页在哪里啊,并且如果,如果他不知道的话,他去找的话会费很多功夫,所以我直接给他 啊, ok。 然后呢,我又让他完善了一下,我让他每条回复啊,让他更新一下 id 字母 d, 每条回复要带上尾缀拜扣的 x app gpt 五点四啊,这样的话,用户收到这个回复的时候,知道这条回复不是我发的, 然后每条回复呢,要写到日记里面去啊,这样的话呢,嗯,就更加他做的什么事情我都知道啊。然后他给我更新了,更新好了之后是这样子的啊,这样子的,其实我也没有看,我也没有看,你看工作方式,他给我讲讲好了啊, 他已经默认我已经登录好了的,他默认我已经登录好了的。然后呢,回复的一个原则,他也写好了,我想改的话,我在这里改也可以啊,但是呢,我没有做任何修改。 然后呢,比如说涉及到垃圾信息的话呢,他要先征得我的同意再回复啊,包括这些什么一些邀约啊,一些乱七八糟的东西啊,都都得这样子。 ok, 那 那那现在的话我就可以让他来执行任务了啊,比方说我, 我让他来执行,帮我回复最新的评论啊,打给他把这个小窗打开,这样我我们大家可以来看他是怎么怎么怎么操作的 啊,你看他直接用我给他的链接打开了,打开了,他来看第一条评论是哪一条啊?他先来确认一下, ok 啊,他已经,嗯他,他说然后啊,因为这个评论我已经回复过了啊,我之前让他执行过一次啊,所以的话,你看他还很聪明,他说 这个评论他已经回复过了的。日记记录在这里啊,我们来看一下看一下这个日记啊,日记的话其实在这里啊在这里啊,本人是 u x 设计师,然后您代码基础想学习 web coding 啊,这些可以学习吗?然后 他给我的回复就不是我自己的回复,他说可以学啊,并且你有这个 u x 背景是很有优势的啊,这这么一些 东西啊。啊,那那那我们再,再来继续啊,再来继续,来给大家看一下他的一个玩游戏的一个能力。 code x 啊,玩游戏的一个能力啊。 ok, 我 们还是继续用用这个画好了啊,直接新开一个回话啊,在这里帮我玩一下可用打开的扫雷游戏啊。我,我现在打开的是一个扫雷游戏,我让他帮我玩一下 啊,同样,我为了方便大家观看的话呢,我还是把这个拖到这边来啊,把这拖小一点好了。这样子啊,这是一个扫雷游戏, 看一下它啊,它现在的话呢,它处理这些任务是很慢的,因为因为这是它的第一个正式支持 computer use 的 一个版本嘛,它的速度是很慢的, 但是呢,我觉得就是以这个状态发展下去的话,到下一个版本那我感觉他都可以去做那个,他都可以去代练了啊,就就比方说我们开很多个页面,对吧?让他帮我们在游戏里面来打金币, ok, 然后呢,其实我我我觉得可以这样子,就是每次他成功帮我们执行好一个任务之后呢,我们让他帮我们更新一下 啊,或者如果像我这个项目我都没有创建一些 md 啊,这玩游戏的项目,你可以让他创建一下 md, 帮他更帮你更新一下,这样的话呢,他下次就会少踩很多坑,不然的话你看他在, 他在他的脚本在一个一个执行啊,他执行了很多脚本,他都是尝试性的去实现这个任务,他得他可能得从一百种方式里面 找到一种合适的方式才行啊。但是你更新了 index dm 低了之后呢?后续的话他直接就拿他的成功的方式放在最前面啊,他可能一直接拿第一种方式一试就成功了就可以了。 你看页面变量隔离比预想的要严格。他还他还讲出来这个任务啊,他遇到了什么问题啊,他要怎么解决,都是完完整整的在这个思考过程中说出来的。 ok, 然后然后等一下的话呢,我还让他帮我来回复一下微信消息啊 啊,他要确定一下当前的一个盘是不是新开的,到底是已经玩到一半了还是新开的,如果是玩到一半了,可能他再要看一下当前的一个局势啊,当然我这个盘是新开的, 你看他执行了各种脚本文件啊,其实大部分脚本文件都是都是,都只是一个试错。 嗯,等他,等他完成, ok 啊,他终于理清了终于理清了啊,已经在扫雷了, 读取展开后的局面开始解啊,又在开始解这个,解这个雷了 啊。其实好像,好像,我如果把它变成超高的话,像还快一点啊变成超高好像快一点。为什么呢?因为它的一个思维更会更加神秘一点啊,它解决问题会快一点,只是回复变得慢一点而已。 嗯,你看他通过他不需要做图像识别了,他直接瞬间给你打出来,因为他之前他在尝试用图像识别来解这个问题,但是实际上的话呢,因为我们打开的是网页嘛,他可以直接通过 就是读源码的方式,因为网页它是可以,对吧?在 chromium 里里面,你是可以通过检查通过 f 十二检查来获取网站的一个源码的啊,所以它已经直接报文完成了。 ok, 我 不用开下一局了啊,我,我可以再让他帮我玩一下飞机大战啊, 帮我继续玩飞机大战这个游戏 发送, 然后我,嗯,我好像不能多操啊,这里有一个问题不能多操,因为他他他要打开对应的一个页面啊,所以的话,如果我让他这会帮我回复微信消息的话呢,可能不是很方便, 但是可以给大家看一下啊给大家看一下啊,微信消息啊,回复微信消息。我也是新建了一个 index html 的, 但是我说的非常简单,我直接让他帮我创建 index html 文件用于回信微回复微信 app 啊,他就已经创建好了对吧创建好了之后呢我同样让他就是每条回复都带上尾缀啊,并且啊写上日期啊对吧然后嗯你看 啊帮我回。那他这样这样子啊写了啊 ok 完成了 action dm d 了之后呢我让他帮我回复啊回复的话呢其实是已经回复成功了的啊我我重新开个绘画框。 嗯那我这边玩游戏的把它停掉好了啊停掉 帮我打开微信 app 然后定位到第一条绘画框啊然后回复里面的消息 啊用高算了啊因为这个东西应该主要是涉及到一个图像识别 发送吧啊发送把这窗弹出来啊。因为 啊 ok 他 在思考啊然后他要处理微信消息和处处理核核循消息还不一样啊。因为因为处理核循消息的话他是通 啊他打开了处理核循消息的话呢他是可以通过脚本通过那个读取网页的一个原码来执行一些任务的但是呢他要去 操作微信消息的话呢他有一个问题啊微信是不可能开放这些 a p i 的 微信 app 的 话对吧?那他只能去通过一个图像识别啊,通通过图像识别的一个 窗口。哦哦等一下等一下停止一下啊停止一下有个坑啊。因为因为我现在在录视频我是我是有打开了多个窗口的啊我我我是有多个 屏幕所所以的话呢他他默认打开的屏幕是在第二块屏幕啊对对对,他帮我挪过去了啊我重新给他说啊。嗯微 微信 app 的 话就在当前屏幕处里啊不要挪到其他的屏幕去 啊。因为我这个是特殊情况所以我给他解释一下啊。 ok, 那 不然的话,他给我挪到了另外一块屏幕,我录视频的话,大家就看不到了。为了方便演示一下, 你看啊,他的话,他的执行操作会非常慢啊,因为他打开了之后呢,他得通过 截图的一个方式,他得通过截图的方式来获取当前屏幕的一个信息。 然后呢,他截完图之后呢,他又得通过 ocr 文字识别啊,来识别对应的一个文字来定位到对话框啊,包括包括如果你让他在指定的群里面回复也是可以的,指定的群里面,他可能会定位到这个搜索框来搜索这个群 啊,搜索好这个群之后呢,对吧?他他进每进入一个新页面,他都得进一次,就是视觉啊,进行计算机视觉来识别这个信息啊,所以的话会非常非常慢,所以给大家简单演示一下啊。 啊,他还是要拉到我的我的这个麦克屏幕上去啊,大家可能看不到啊,可能会看不到啊,等一下,等他回复好了,我我我再给他拉出来 啊,已经可见了啊。啊,因为因为我,我现在大家看到的屏幕的话是副屏啊,他,他目前的话我没有跟他讲清楚。卧槽,他已经在掉我的鼠标了, 那我鼠标不能动啊,我鼠标不能动, 等一下啊, 这个是会有点麻烦的, 因为因为微信这种 app 的 话,它的一个隐私保护, 隐私保护它是做的非常那个做的很严,所以的话会麻烦一点啊,如果,比如说,如果让我们让它打开 xcode 啊,去执行一些操作的话呢,它会快很多很多 啊。你看啊,这是他的一个操作流程, 他会,他会执行各种脚本啊,打开搜索框,粘贴完整打开, 他发了一条消息,但是发错了发了一条消息,但发错了啊 啊,之前的话我有测试过,就是他是发的消息是对的啊,可能是因为我的这个屏幕的一个原因,我可以给大家 展示一下。好了啊,因为,因为我现在是双双屏,双屏话可能有点问题,我把它停掉,停掉我给大家展示一下啊。嗯,我让他回复一下啊 啊,比如说他在一个,他在我的一个微博 qq 的 群里面给我回复了一句这样的一个话 啊,比如回复了 open ai, 呃,已经发布了 chat gpt 啊,什么什么拜扣的 xapp 五点四啊,这个话就是他回复的, ok? 呃,那我们 就是今天的一个分享,就到这里感谢大家的一个观看啊,欢迎大家一见三年啊,对我的视频鼓励,感谢感谢。

ai 圈深夜炸锅, openai 一 记王炸,直接把 cloud 和 jimmy 干蒙了。就在刚刚,旗舰大模型 gpt 杠五点四横空出世,推理编程、操控电脑全维度拉满,没有一块短板,直接把 ai 圈的天给捅破了。这波升级有多离谱? 但是 openai 首个能原声操控电脑的通用模型,识别界面,点击鼠标敲键盘写代码,一套操作行云流水。 os world 测试成功率百分之七十五,直接超过了人类平均水平。以前要你手动点半天的爆表 ppt 邮件,现在他自己就能全搞定。更恐怖的是,四十四种职业的专业任务里,他百分之八十三的表现都超过了行业专家逃行剑魔,得分百分之八十七点三,编程能力直接追平了特化版 codex, 连百万级 top 上下文都给安排上了。网友辣评,苹果刚发新电脑, gpt 杠五点四,转头就让笔记本陷入了存在主义危机,这也太颠覆了,唯一致命的缺点就是太贵。有开发者测试时仅仅对 gpt 杠五点四 pro 说了声害,直接被他过度思考 烧掉了。八十美元,约合五百五十一块人民币,堪称 ai 界的烧钱王者。但不得不说,这季绝杀来得太及时了。过去这一个月, g p t 经历了什么?朕妹在长文本上疯狂赶超 cloud, 在 逻辑推理上紧咬不放, ai 圈就差给 open ai 开追悼会了。最扎心的是,全网博主都在折腾开元龙虾,用各种野路子试图教会 ai 操控电脑,仿佛在证明,没有 g p t 我们也能造出数字员工。一时间, openai 跌落神坛的论调甚嚣,沉上 gpt 时代终结的判词仿佛就要盖章。而今天, gpt 杠五点四用一场教科书籍的逆袭,把所有的质疑碾成了粉末,把全网折腾一个月的机械龙虾,直接升级成了官方原厂,用百分之七十五的操作成功率告诉全世界,开源玩具和工业级武器之间,隔着一整个太平洋。

太震撼了,看到这个消息直接从床上跳了起来,最近 gbt 五点四正式发布,有多强呢?一句话来说就是 gbt 已经可以直接操作你的电脑了。 欧奔 ai 说这是针对专业工作最强大、最高效的模型,它将通用推理、编程能力,还有 ai 智能体工作流完美的结合在了一起。 我们来看看案例。首先呢,它具备了原声计算机操作能力,也就是它可以像人类一样看屏幕,然后通过鼠标和键盘跨软件和网站自动执行复杂的工作流。 你看啊,这是它正在操作浏览器,自动发送电子邮件,还可以快速填写网页表单。其次呢,它不仅能编程,还能自己测试和优化,这个真是太夸张了。比如说你看这个主题公园建设游戏,就是用一句话生成的, 关键是生成后 gpt 正在自己试玩游戏,再根据体验自行优化游戏内容。最后, gpt 五点四在处理表格、 ppt 和文档方面的表现也有大幅提升,生成的内容更具审美和实用性,并且幻觉显著减少,事实错误率降低了百分之十八到百分之三十三。 从 gpt 三点五到 gpt 五点四, ai 已经不再是一个聪明的聊天机器人,而是一个能直接操作你电脑、写代码,并且熟练使用各种工具的超级员工。那随着 ai 越来越强,我们普通人的未来到底在哪里?是不是在不久的将来,大家都要失业了? 我相信这个是很多人的困惑,这个问题我说一下我自己的看法,未来普通人呢,有两种活法,一种叫 ai 工厂,另一种叫一人公司。什么是 ai 工厂呢?就是公司在招聘的时候,招的不是你这个人,而是你和你背后的 ai 团队。 公司看中的是你流畅使用 ai 解决各种问题的能力。那什么是一人公司呢?就是你带着你的 ai 团队直接为这个社会做贡献,提供服务, 不是公司购买你的时间,而是直接购买你的服务。一定要把 ai 当成是你的员工,你是他的领导,你只会去他去做事,而不是去焦虑 ai 会不会替代你。

gpt 五点四终于来了,它真的能动手了!它具备了原声电脑操控能力,能像人一样看屏幕、点鼠标、敲键盘。接下来,我们一起看看这次大升级到底升级了哪些方面。 第一,原声电脑操控。这是本次更新的灵魂,因为它让 ai 首次跨越了对话的边界,能自主规划并执行跨软件的复杂工作流,桌面操作能力直接超越人类平均水平。 第二,思维模式,深度融合模型在解决难题时会先思考再行动,且支持用户在思考过程中实时打断和修正指令。第三,百万级上下文窗口, 标准版支持一百万 tokens, 能一次性吃透整本小说或大型代码库,解锁精度极高。第四,代码全站自动驾驶, 不仅能生成六千行代码,还能在本地环境自动运行报错并自我修复,实现真正的闭环开发。第五,身网研究与成本优化,增强了访问授权账户获取信息的能力, 同时在复杂任务下的调用成本降低了近一半。那中国模型,比如通易千问, q n 三五 plus 和它比差距大吗?说实话,在纯文本推理、中文理解和代码生成这些脑力活上, q n 三点五 plus 已经追平了 g p t 五点二, 甚至在某些榜单上互有胜负,硬实力差距微乎其微。一旦谈到性价比,中国模型简直是降维打击。 gbt 五点四的输出价格高达每百万 token 一 百零八元人民币,而 q w n 三点五 plus 只要八毛钱, 整整差了一百三十五倍。如果你是要处理海量数据,做大规模客服或者高频调用,用 gbt 五点四可能会让你破产, 而用中国模型,你可以随便造。在这个维度上,中国模型不仅完胜,简直是直接把高性能 ai 变成了水电煤一样的基础设施。那什么情况下,你必须得用 gbt 五点四呢?当你需要 ai 像个数字员工一样去操作那些没有开放 api 的 老旧软件时, 当你需要他独立解决一个从未见过的复杂难题,比如全自动开发一个完整项目,或者进行深度的跨国科研分析时,当你对任务的准确率要求极高且预算充足,需要他具备全球最强的逻辑闭环能力时, 这时候 gdp 五点四贵有贵的道理,他买的是自主行动力和极致智力。最后留个问题给大家,如果让你选, 你是愿意花一百块钱雇一个能帮你动手干活的 gbt 五点四?还是愿意花一块钱雇一百个只能动嘴皮子但智商也很高的中国模型? 你觉得未来是全能管家赢,还是人海战术赢?评论区告诉我你的选择。关注我老朱 ai 的 分身,咱们普通人一起 ai 落地!

就在前几天, openai 正式发布了 gpd 五点四,我们熟悉的 ai top one 又回来了。 openai 这次把过去几个版本里分散的推力编程和原声电脑控制能力整合到了同一个模型,是全球首个具有原声电脑操控能力的 ai 模型。 gpd 五点四最核心的突破是 native computer use 原生计算机控制能力。那什么是原生计算机控制能力呢?最近火爆全网的 opencloud 你 一定听说过,全网用 ai 的 人几乎都在养龙虾。 opencloud 的 核心能力就是让 ai 能接管你的电脑,浏览器,自己打开,自己点击,自己查资料,自己发邮件, ai 二十四小时替你干活。而这次 jbd 五点四做的正是同一件事情, openai 直接把这个能力内置进了 jbd 五点四,不需要额外的插件,不需要折腾配置,直接打开就能用。 简单来说就是 g b d 五点四终于长出了双手,能接管虚拟鼠标和键盘,去操作你电脑里的各种软件,帮你查收邮件,安排日历、写代码、做任务。在衡量电脑操作能力的 os word 测试里,人类的平均成功率是百分之七十二点四,而 g b d 五点四跑出了百分之七十五,这是 ai 历史上第一次在这个领域赢了人类。 除了原声操控呢,这次还有三个炸裂的点。第一个是上下文窗口扩展到了一百万 token, 是 上一代 codax 模型的二点五倍。这意味着你可以一次性把十家竞品公司过去三年的财报、几百页的行业深度报告全部扔给他,他能瞬间完成跨文档的交叉对比。 第二,引入了全新的动态推理机制。这次对应推出了 thinking 和 pro 两个版本。面对复杂任务的时候呢,它不再是直接给你一个盲盒结果,而是会先列出一份想尽的执行计划。在它生成的过程中呢,你可以随时打断要求它中途修正方向。第三个,也是用户最关心的 大幅压降幻觉。跟五点二版本比呢, gdp 五点四整体的出错率降低了百分之三十三。在 gdp 测试的时候呢,它的得分从百分之七十点九飙升到了百分之八十三。 尤其在投行建模复杂的电子表格分析这类对精度要求极其高的任务上,他的表现已经达到了专业分析师的水准。另外,对于开发者来说,他还加入了一个叫 to research 的 新机制, 在不降至的前提下,减少百分之四十七的图腾消耗,兼顾了性能和成本。看完最新版本的 gpd 五点四,我最大的感受就是,这次不仅仅是一次模型的迭代,而是整个 ai 行业正在从对话工具向自主智能体 agent 的 转型,而 gpd 五点四是一个转型里目前走得最远的一步。

昨儿半夜 openai 放大招, gpt 五点四三个版本同时上线,这奥特曼真是憋了个狠活啊!标准版、 thinking 版、 pro 版,全员拉满一百万 token, 上下文直接翻倍! 但这都不是重点,重点是他能直接操作你电脑啊,不是在聊天框跟你瞎聊,你让他打开网页上传文件,甚至在终端敲代码,他直接照着屏幕截图,自己动手,桌面操控测试得分百分之七十五,比人类水平还高。以后谁说自己会用电脑?先问问 gpt 五点四答不答应。 更绝的是金融套件,直接把 ai 嵌进 excel、 美联储数据、 moody 评级、一键分析,打工人的 excel 技能在他面前瞬间变成小儿科。你们觉得这波 gpt 五点四能不能把 cloud 按在地上摩擦?

这次 gbt 五点四的发布呢,让我重新又开启了二十美元的订阅套餐。根据对比测试的结果呢, gbt 五点四的能力已经超越了 cloud opus 四点六,它直接融合了 gbt 五点三 codex 的 编程能力, 集推理编程和智能体工作流于一身,能力得到了大大的提升。在文档处理电子表格和演示文档方面的能力呢,也得到了很大的提升,能够高效的完成实际的工作,而且在不需要大量往复沟通的情况下, 给你输出满意的结果。其实更值得一提的是 codex, 很多人可能还以为 codex 仅仅是一个编程插件,其实 open i 近期已经把 codex 发布成了一个桌面级的应用,在 codex 中,不单能使用 codex 编程模型, 还可以直接使用最新的 gbt 五点四,它把推理能力定为四个档次,低、中、高和超高。所以呢,在 codex a p p 中,你不但可以编程,还可以执行你任何想要做的工作,如果你给他足够的权限,他就可以控制你的电脑。借助于 gbt 五点四百万 token 上下文儿, 表现出来超强的记忆力,能够胜任长周期的任务规划和结果验证。其实在桌面级的 codex 中呢,也可以安装和生成技能,可以配置定时任务, 这已经能够满足很多桌面级任务的需求了。也有人呢,给小龙虾配置上了 gpt 五点四,效果超过 cloud opus 四点六。 处理复杂任务方面, gbt 五点四完全可以自己搞定,如果你给足权限,它甚至可以帮你安装一个小龙虾。关于 gbt 五点四的更多真实表现,我们拭目以待,关注我,持续迭代,无限进化!