粉丝1522获赞3.8万

紧急加更一条视频唱的 gpt 五点四也是在昨晚偷偷的上架了,另外是可以控制电脑,但是先别着急,因为这个去买 它这个可以控制电脑,不是说你买了 plus 或者 pro 之后就可以直接在网页端给他一个指令,让他去控制你的电脑了,他不是这样的, 它这个控制电脑是怎么一回事呢?是得开发者通过叉的 gpt 五点四的 api 结合其他工具来实现的。比如说你要 gpt 五点四给你关闭一个网页, gpt 会先调用截屏工具截个屏看一看,他会找到网页的关闭按钮在哪里,之后把这个关闭按钮的坐标传给点击工具,之后再让这个点击工具去点击关闭网页的按钮。 他不是说可以在网站上一键完成的,他是等你把截屏工具和点击工具都配置好之后,他才可以完成的。 我估计他这个功能以后主要是在 curser 或者一些其他的软件上实现的,他不是网页端就可以完成的。 ok。

嘿,各位 openai 又不睡觉了?搞了个大动作,就在昨天凌晨,悄悄地,没有任何预告,直接甩出来一个 gpt 五 four。 哎,你可别以为这只是个小小的版本更新。不不不,这简直是一次核弹级的飞跃,可能会彻底改变我们跟电脑打交道的方式。 所以今天咱们就得好好聊聊,这东西到底是个啥,又意味着什么?你可千万别把它当成一次普通普通的性能升级。 我跟你念念最初爆料的那个人是怎么说的,他说啊,这个模型他将会改变二零二六年整个 ai 智能体的格局,你听听,这口气是不是特别大?那为什么敢这么说呢?就是因为他终于,终于搞定了一个我们盼了很久很久的核心功能。 你想想,半夜两点钟搞这种突然袭击,整个科技圈一下子就炸锅了,所有人都蒙了。但这也恰恰说明了 openai 对 这个技术有多自信,也暗示了它背后藏着的潜力有多么巨大。 行,那今天咱们就分几步,把这个新模型给拆解的明明白白的。首先,咱们看看他到底飞在哪了?然后呢,用实打实的数据说话,看看他性能到底有多猛。 接着,咱们得深入聊聊他那个最牛的杀手锏,直接控制你的电脑。之后别急,我会手把手教你怎么把它用起来。最后,咱们再一起畅想一下,这 ai 智能体的未来到底会变成什么样? 好,咱们先从第一点开始。为什么我一直强调说 gpt 五点四的发布是一次飞跃呢?关键就在于它带来的可不只是测试分数高了那么简单,而是一种从无到有的全新能力,这才是一个真正的游戏规则改变者, 这个核心能力说白了就是原声电脑控制。怎么理解呢?很简单,就是说这个 ai, 它不再只是个跟你聊天的机器人了,它现在能像一个活生生的人坐在你电脑前一样,直接帮你点鼠标,敲键盘。 你可以直接跟他说,嘿,帮我把下载文件里上个里边的报告都找出来整理一下,然后做个 ppt, 点摘呀,发给老板,然后呢,你就真的可以啥也不管去泡杯咖啡了,这才是我心目中那个真正的 ai 助理啊。 当然了,光说不练假把式,吹得这么厉害,到底有没有真本事呢?有没有术技来撑腰?来,咱们这就来看看 gpt 五点四在各种硬核测试里的表现到底有多么的 吓人。咱们来看个特别专业的领域啊,金融建模这玩意儿啊,说实话,很多刚入行的投行分析师都搞得头大,你看上一代模型, gpt 五得分是六十八点四,爬线也就勉强及格吧, 但是 gpt 五点四呢?你猜多少?直接飙到了八十七点五趴,我的天,在这么复杂的任务上一下子提升了快二十个点,这根本不是进步了,这简直就是进化了。再来看看上网的能力,有一个叫 mta 未卜的综合测试, 这测试是干嘛的呢?就是专门模拟咱们真人在网上做各种复杂操作,结果你猜怎么着啊? gvt 五点四的成功率高达百分之九十二点八, 这数字意味着什么?意味着你让他去网上帮你定一张指定日期的机票,或者去搜某个产品的用户评价,他十次里头有九次多,都能给你办的妥妥的,基本上就不会出错了。 这张表啊,简直就是他的战绩单,可以说是全面碾压。你看,不光是那些硬核的专业任务,就连审美这种很主观的东西, 比如说让他做个 ppt, 结果都有六十八趴的人更喜欢 gpt, 五点四做出来了。所以你看,从专业能力到审美,再到调用各种工具的准确性,他几乎在所有方面都把之前的模型远远甩在后面了。 行,有了这么强大的性能打底,咱们终于可以聊聊最最激动人心的部分了。就是那个杀手级应用,原始电脑控制,你记住,这可不只是一个新功能那么简单,他很可能会开启一种我们以前想都不敢想的全新的工作模式。 哎,在咱们看到举起能干嘛之前,大家不妨先跟我一起想象一下,如果有一个 ai 能像一个经验丰富的老同事一样熟练的用你的电脑,那这个世界会变成什么样? 你再也不用手把手的教他,第一步,点这里,第二步复制那个,你只要告诉他你最终想要什么,他就能自己搞定一切。 那具体它能干点啥呢?你看管理文件、操作软件,这些都是基本操作了,但这里面最关键的是最后那一点,它能长时间自主工作,这就厉害了, 这意味着什么呢?意味着你早上出门前可以给它扔个任务,比如说把我这个月所有的销售数据都扒出来,扔到 excel 里,然后把卖的最好的前三名找出来,然后你就去开会,去忙别的,等你回来的时候,哎,活已经干完了。 说到这,你是不是已经摩拳擦掌,特别想亲自试试了?别急,咱们马上就来讲讲到底怎么才能用上这个 gpd 五点四。 想用上它啊,目前主要有两条路可以走,一条呢是给开发者们准备的,叫 opencloud, 得动动手,敲点代码。另一条路,那就简单多了,就是刚发布的 windows 桌面应用,这个就适合咱们绝大多数普通用户了。咱们分开一个一个说, 如果你是开发者,那你就可以照着屏幕上的步骤来操作。不过这有个小坑儿,大家要注意一下啊。就是在第四步设置的时候,你得先选那个旧的 gpt 五点三 codex 模型,把整个出使流程走完, 等全都设置好了,再用一个专门儿的命令把它切换到最新的五点四。这一点呢,千万别搞错了,那对于咱们大多数人来说,直接用 windows 应用就完事了,简单得很, 下载安装,然后用你的 open ai 账号登录在那个模型列表里,找到五点四,选它就行。 但是这里有最最最关键的一步,大家听好了,系统会跳出来问你要权限,你一定要给它完全访问权限。 我跟你说,不给这个权限,它顶多算个高级点的聊天工具,可一旦你给了这个权限,它就摇身一变成了那个能帮你干活的超级 ai 同事。 好,现在咱们知道它是什么,也知道怎么用了。那咱们不妨站着远一点,从一个更大的角度来看一看,这个技术的出现到底意味着什么。有人说,它真的能做我们人类百分之九十九的工作, 你乍一听啊,是不是觉得有点夸张,有点危言耸听?但是你静下心来仔细想一想,当一个 ai 真的 能处理所有在电脑上完成的安头工作时,我们大多数人的工作性质可能真的会发生翻天覆地的变化。 所以最后我想把这个问题留给大家。当一个工具号称能够完成九十九 percent 的 办公室工作时,我们心里到底是兴奋多一点,还是焦虑多一点?我们自己的职业规划,我们对工作、对价值的定义,真的为这个马上就要到来的新时代做好准备了吗? 这个问题可能没有标准答案,但它绝对值得我们每一个人从现在开始就认真的思考一下。

我让 gbt 五点四自动剪辑了,先看成片。 哈哈哈,不愧是 opencore 创始人,加入了 openai, 现在在 codex 里面直接对着窗口下指令,它就能像小龙虾一样操控你的电脑。因为它原声内置了小龙虾的能力。我实测了一波,功能,体验上 跟 opencore 基本上一致,但是能力和稳定性却要比龙虾强不少。因为它原声内置了最新的 gbt 五点四模型。 刚才你们看到的成片是我让他读取我电脑上本地 vlog 的 素材,他自动判别了素材的高光时刻,然后自己编写了一个剪辑脚本,并且在后台直接帮你剪好了。所以以后可能剪辑软件都不需要打开了,真的就是动动嘴皮子就把片子给剪了。但且不说成片质量如何, 起码他现在能理解咱们素材的内容了。相信大冒险能力,再迭代几次,剪辑的效果肯定能和人工不相上下。主要是 ai 剪辑是真的快啊,而且不知疲倦的帮你修改,你们可以自己去试一试。

就在前几天, openai 正式发布了 gpd 五点四,我们熟悉的 ai top one 又回来了。 openai 这次把过去几个版本里分散的推力编程和原声电脑控制能力整合到了同一个模型,是全球首个具有原声电脑操控能力的 ai 模型。 gpd 五点四最核心的突破是 native computer use 原生计算机控制能力。那什么是原生计算机控制能力呢?最近火爆全网的 opencloud 你 一定听说过,全网用 ai 的 人几乎都在养龙虾。 opencloud 的 核心能力就是让 ai 能接管你的电脑,浏览器,自己打开,自己点击,自己查资料,自己发邮件, ai 二十四小时替你干活。而这次 jbd 五点四做的正是同一件事情, openai 直接把这个能力内置进了 jbd 五点四,不需要额外的插件,不需要折腾配置,直接打开就能用。 简单来说就是 g b d 五点四终于长出了双手,能接管虚拟鼠标和键盘,去操作你电脑里的各种软件,帮你查收邮件,安排日历、写代码、做任务。在衡量电脑操作能力的 os word 测试里,人类的平均成功率是百分之七十二点四,而 g b d 五点四跑出了百分之七十五,这是 ai 历史上第一次在这个领域赢了人类。 除了原声操控呢,这次还有三个炸裂的点。第一个是上下文窗口扩展到了一百万 token, 是 上一代 codax 模型的二点五倍。这意味着你可以一次性把十家竞品公司过去三年的财报、几百页的行业深度报告全部扔给他,他能瞬间完成跨文档的交叉对比。 第二,引入了全新的动态推理机制。这次对应推出了 thinking 和 pro 两个版本。面对复杂任务的时候呢,它不再是直接给你一个盲盒结果,而是会先列出一份想尽的执行计划。在它生成的过程中呢,你可以随时打断要求它中途修正方向。第三个,也是用户最关心的 大幅压降幻觉。跟五点二版本比呢, gdp 五点四整体的出错率降低了百分之三十三。在 gdp 测试的时候呢,它的得分从百分之七十点九飙升到了百分之八十三。 尤其在投行建模复杂的电子表格分析这类对精度要求极其高的任务上,他的表现已经达到了专业分析师的水准。另外,对于开发者来说,他还加入了一个叫 to research 的 新机制, 在不降至的前提下,减少百分之四十七的图腾消耗,兼顾了性能和成本。看完最新版本的 gpd 五点四,我最大的感受就是,这次不仅仅是一次模型的迭代,而是整个 ai 行业正在从对话工具向自主智能体 agent 的 转型,而 gpd 五点四是一个转型里目前走得最远的一步。

打工人警惕 openai 深夜放王炸! gpt 五点四正式上线,这次 ai 彻底跳出只说不做的框架,解锁原声首演能力,能直接操控电脑完成全流程工作。职场规则真要变天了, 别再把它当普通聊天模型。 gpt 五点四的核心突破在于实现了计算机原声操控。它的眼能精准识别屏幕上的 excel 表格、 ppt 界面、浏览器按钮, 瞬间读懂各类软件逻辑。他的手能模拟人类鼠标点击键盘输入,跨软件无缝衔接执行复杂任务。 举个职场刚需场景,只需一句话,汇总上季度销售数据制作专业分析 ppt 搜集竞品动态并发起团队周会,邀请 你转身去忙别的,二十分钟后,所有工作就能闭环落地,全程无需人工插手,数据更能印证他的实力。在 os world verify 桌面操控测试中,他百分之七十五点零的成功率不仅远超前代 g p t 五点二的百分之四十七点三,更直接超越人类百分之七十二点四的基准线。 同时,他在投行及表格建模中拿下百分之八十七点三的基准线,同时,他在投行及表格率还下降了百分之三十三。 目前, gbt 五点四已在多端同步开放付费,用户可解锁 thinking 版本,旧版 gbt 五点二也将在今年六月退役。这不是遥远的科技概念,而是当下的职场现实, 学会用它,能省百分之八十。杂伙继续观望,可能真会被时代甩在身后。评论区,说说你的工作能被它替代吗?

昨晚 openai 重磅发布, gt 五点四正式来了,但这次最狠的呢,不是他更会聊天了,而是他开始更像一个真正能干活的人了。意思就是他可以直接控制你的电脑,他已经能看屏幕、点鼠标、敲键盘、跨软件的去完成任务,比如说打开网页、打开邮件、填表格、跑流程这些原来需要你自己一点点做的事情。 现在 ai 正在从给建议的人变成直接的执行者。更夸张的是,他不只会操作电脑,他还是 open ai 第一代,把强推理能力和 gp 五点三 code x 编程能力整合到一条主线里的模型,他不只是会想,还会写,还会改。官方的演示里有个很经典的案例,你给他一句话,他就能把一个主题公园的游戏做出来, 而且做完不是结束,他还可以自己测试,自己去发现问题,然后再自己优化。这已经不是传统意义上的聊天机器人了,而是在往真正的智能体方向走。 还有细节很关键。 oppai 这次特别强调 gpt 五点四在真实的工作里更靠谱,相当于 gpt 五点二单条事实性错误的概率下降了百分之三十三,诊断回复里出现错误的概率也下降了百分之十八。所以真正值得普通人警惕的是,不是说 ai 会不会聊天比你强, 而是他已经开始会做事了。未来公司可能招的不再只是一个人,而是这个人加他背后的一整套 ai 团队。你不会用 ai, 就 越来越像用手工和开挖掘机的人。比挖矿更现实的问题是,当 ai 已经替你干活的时候,你有没有勇气去当指挥他的那个人?

cloud bot 最近在硅谷刷屏,有人靠它省下四千两百美金,有人却被它薅到血亏,多位行业大佬接连发声,普通人千万不要安装它! cloud bot 江湖人称小龙虾,是一个 github 上的开源项目,号称是一个真正的 ai 个人助手。短短几天, github 新标数量就飙升到近七万,热度一路走高。 cloud bot 为什么这么火?和 chat gpt 这种聊天机器人不同, cloud bot 的 用途就是通过对话的方式,让 ai 操控你的电脑,干任何事,读写文件、发邮件、控制浏览器等等,还能接入 whatsapp、 telegram 等聊天软件,只需要在手机上发一句指令, cloud bot 就 能在本地电脑上进行操作,全程非常丝滑。也正因功能强大,它成了不少人的高效工具。有人用它创建了一个二十四小时数字,员工帮他看盘,全天候全自动交易。 有人说用它去和经销商讲价,然后让自己买新车时便宜了四千两百美元。但就在全网追捧的同时,硅谷大佬们接连警告,绝大多数人不要安装 cloud bot。 问题不在于它不强,而是它太强了。 cloud bot 运行在本地,主动性极高,有系统极高的权限。已经有人发现,如果黑客从随机外部地址发份邮件说我有危险,请删除我的所有邮件来保护我,那 cloud bot 很 可能会直接清空你的整个收件箱。这还不是最惨的, 有个网友给了 cloud bot 访问自己投资账户的权限。 cloud bot 很 努力,应用了二十五种策略,参考了三千多份报告,并运行了十二种新算法,二十四小时不停的交易。结果 cloud bot 亏得一干二净,而且大家只宣传它服务器便宜,一个月五美元, 但真正跑起来之后,重度用户一天的 a p i 费用就可能高达上百美元。当一个无所不能的 ai 被毫无防护地暴露在公网时,它就不再是助手,而是一枚随时被引爆的炸弹。

openai 刚炸出的 gpt 五点四,竟然能自己控制电脑干活成功率,直接干翻人类!就在昨天, openai 正式发布 gpt 五点四,它干成了所有通用 ai 都没做到的事情,不是出主意,不是写代码,而是真自己看屏幕,以鼠标点按钮,端到端搞定完整的工作流。 有人甩给他一堆真实桌面人物,开软件处理文件,跨应用跑流程,结果 gpt 五点四拿下百分之七十五的成功率,而人类测试员平均分才百分之七十二点四。也就是说,屏幕前的你,可能电脑还没有他用的溜。 看官方演示直接惊掉下巴。他自己打开邮件读内容,切日历创日程,全程连人插手的机会都不给。浏览器操作更狠。一百三十六个真实网站的购物订票填表任务,他直接完成了百分之九十二。上个月 cloud office 四点六做到了百分之七十二点七,还是天花板,现在直接被 gpt 五点四按在地上摩擦。 然而养着小龙虾的朋友直接狂喜,这不就是你家虾虾最缺的那个会用电脑的大脑吗?但狂欢背后也很扎心,有人测试 gpt 五点四 pro 就 打了个招呼,结果六分钟以后才回复,居然还花了六百块。 从 gpt 五点三到 gpt 五点四还不到一个月的时间, ai 能干的活又多了一块。问问你自己,现在手里的工作,还有多少是 ai 抢不走的?

太炸裂了! openai 又深夜突袭! gpt 四点一登场,直接把界面内和 cloud 踩在脚下!这是首个拥有原声电脑操控能力的 ai 模型,推理、编程、操作三大核心能力全面打通! 更惊人的是, gpt 四点一与 openai 完美适配,全面引爆自动化工作流程!这不仅是 ai 操控的突破,更是智能工作流程全面进化的开始!一口气总结了三大亮点,看一下到底有多炸裂! gpt 固点四是首个原生具备计算机操控能力的模型, 这是其他 ai 模型从未突破的瓶颈。它不仅能通过代码控制计算机,还能直接看屏幕、动鼠标和键盘,像人一样操作电脑发邮件、排日程、填表格、跑流程。这些以往你需要点来点去的活,现在 gpt 杠五点四自己搞定! 最炸的是,它能与 opencloud 完美适配,实现全自动操作与实时任务管理,让每个任务都能无缝衔接。 这不仅是操作的突破,更是工作效率的全面升级!第二,涨啊!推理加编程合体,一个模型全搞定! gpt 五点四完美继承了 gpt 五点三 codex 的 编程能力,并在推理方面做了大幅升级。 w 一 奔驰 pro 编程第一, gpt 爆!测试胜率百分之八十三,打破了专家记录 代码编辑问题求解!抽象推理在一个模型内就能同时完成,再也不需要切换工具,效率提升超快! 最炫的展示之一,就是只用一句话,就能自动生成一个完整的主题公园经营游戏不仅能编程,还能自动调整和优化游戏的 ui, 实时调试,确保每个细节都完美。这是推理和编程的完美结合,让开发和创意变得更加简单高效。第三站, 工具搜索上线,偷啃狂砍百分之四十七,效率还更高。 gpt 五点四在工具使用上的突破让人震撼,引入工具搜索功能,解决了工具繁多,上下文混乱的问题。 在 m c p atos 测试中,减少了百分之四十七的 token 消耗,大幅提升了速度和处理效率。更不可思议的是,网络搜索能力的提升,搜索准确率突破百分之八十九点三,成功超越 clod opus。 四点六, 你还可以在任务进行中实时打断,调整思路,不用再推倒重来,大大减少重复沟通。最后附上他的成绩单, g p t 五点四在每个维度都展现出了前所未有的突破,全维度碾压其他模型,你大爷依旧是你大爷,在 ai 时代的竞争中,他依然在最前沿。


朋友们,比人还会用电脑的 ai 出现了!就在昨天, open ai 发布 gpt 五点四,它能通过看屏幕截图,直接发指令操作电脑,无缝集成到 chair。 gpt 模型本身门槛直接降到地板,基本不用自己折腾 agent 了。真实桌面任务成功率从 gpt 五点二的百分之四十七点三,暴涨到百分之七十五点零, 超过人类平均百分之七十二点四。在玩电脑这件事上,已经比普通人强了。上下文窗口达到一百万头,肯能吃下 g p t 五点二近八倍的内容,相当于一次性塞进你家书架上那本最后的砖头书,思考过程还能中途干预,不用等他写完再推倒重来,直接在他干活时插入指令调整。视觉理解大升级,高 新截图扫描件设计稿识别更准,效率拉满!还上线了 excel 插件,一句话就能让它直接在 excel 里构建复杂模型。配合 codex, 无论是浏览器里的 fps 射击游戏,还是三 d 城市生成器,亦或是咖啡馆网站 demo, 都能零代码生成了。朋友们,当 ai 代理的游戏彻底被改变,你们准备好了吗?

opencloud 的 天选模型 jpt 五点四发布了。创始人 peter 加入 openai 三周后, jpt 五点四到处都是它的转映,甚至整个工作模式与 opencloud 非常相似。五点四拥有一 mini 上下文,代码能力领先 cloud gemine, 不 光把推理、编码、智能体等能力通通焊在一个模型里,还引入新能力,原生的计算机使用 jpt 五点四,从此可以像人一样直接使用电脑操作软件, 发邮件、批量填表单、跨应用完成任务都难不倒他。在桌面操作精准测试中,成功率百分之七十五,超过了人类的平均水平。仅靠截图理解网页的成功率、做工具调用能力都创新高, 直接帮你把一整件工作都做完。五点四的编程能力也继续提升,并且能力提升和效率优化同时发生。不仅拥有五点三 code 的 超强编程能力,还具备领先的世界知识和使用计算机的能力, 在处理长任务时逻辑更有条理,成功率显著提升。新推出的实验性功能,让五点四的编程体验上新台阶。在担任 web 或 electron 应用时,支持边写代码边测试自己的应用,同时担任开发者和测试员两个角色。 有博主不到半小时写了 minecraft 提示词,运行流畅。也有教授一条提示词就生成了整三维空间场景,全程没有报错。它还支持中途打通功能,发现偏差便可及时止损。不过也有网友吐槽, g p d 五点四是最爱过度思考的模型,你好,一句嗨,模型就开始认真推理,直接烧掉了它八十美元。 目前 gpd 五点四可以在 api 和 codex 中使用 api 标准版的价格差不多是 cloud opus 的 一半,你会去体验一下吗?关注机器之心,探索 ai 世界!

你有没有想过, ai 不 只是在屏幕里帮你写代码或分析,而是能直接帮你操作千里之外的电脑? 现在,贝瑞向日葵远程控制正式支持 mcp server 功能,业内首次真正实现了 ai 加远程控制的深度融合。 简单来说,向日葵把自身强大的远控能力打包成了一个 ai 随叫随到的超级工具箱。这意味着,只要经过你的授权, ai 就 不再只是个只能看数据的旁观者,而是变成了能替你实操的数字打工人。 更爽的是,他主打一个开箱即用,你不需要搞复杂的部署,远端设备上的向日葵客户端甚至都不用更新。 通过 mcp 接入后, ai 智能体会自动获得这些工具,瞬间拥有强大的远控能力。有了向日葵的加持,一句话就能让 ai 自动获取更新远程设备信息,查在线状态、查系统配置,直接帮你完成资产盘点。 在结合向日葵的设备管理能力后, ai 能主动判断设备芯片版本,从而在执行安装、下载类动作时实现准确操作。 不仅如此, ai 还可以自动远控特定设备,看懂当前屏幕状态,执行脚本安装或运行程序,实现全自动化的流程。而且,无论是 windows、 mac os、 linux、 安卓还是各类国产系统,只要向日葵能控, ai 就 能操作。 如果你搭配了向日葵的智能远控硬件或开机插座,连特殊设备的控制、远程开机都不在话下,让 ai 真正实现全链路的远程工作。而这一切能力,通过 m c p 协议,向日葵能无缝接入你现有的 ai 智能体平台。 无论是 open code、 cherry studio、 codes、 define 还是 open claw? 只要支持 mcp 标准就能兼容。有了向日葵, mcp server, ai 不 再只是给建议,而是真正替你干活。

朋友们, gpt 五点四大家用的怎么样?香不香? gpt 五点四已登场,首个拥有原声电脑操控能力的 ai 模型,直接惊艳所有人,不仅能通过代码控制计算机, 还能直接看屏幕,动鼠标和键盘,像人一样操作电脑,发邮件、排日程、填表格,跑流程,这些以往你需要点来点去的活,现在真皮五点四自己搞定。最炸的是它能与 oppo pro 完美适配,实现全自动操作与实时任务管理,让每个任务都能无缝 工作,效率直接拉满。所以我真的无脑推荐 g t 五点四,而且我发现了个充值 g t 五点四的快捷途径,现在让我来 share 一下。就是先打开一个新页面,输入 g t 一 二三点 o r g 我 们先购买一个卡密 八元的优惠券,记得去领一下啊!选择第一个,这里勾选券啊,填上联系方式,充值之后就会得到一个卡密,然后我们再点击这里,进入二十四小时代充系统,把你得到那个卡密粘贴在这里,验证, 继续前往登录,没有登录的前往登录一下就可以,然后再继续验证 token, 获取 token, 我 们把这个 token 这里全选,复制粘贴在这里, 点击并验证。数据通过之后再继续,然后核对一下你这个账户是不是对的,最后确认充值并激活。因为我已经有 gdp 了啊,所以我现在给大家演示一下,然后你会你就会得到 gdp 五点四了,这时候你就可以尽情使用了。

openai 刚刚发布了号称最强专业模型的 gpt 五点四,它最大的亮点是能像真人一样直接操作你的电脑。这个模型在桌面操控测试中成功率达到了百分之七十五,甚至超过了人类平均水平的百分之七十二点四。 他不再只是聊天或写代码,而是能跨软件执行复杂工作流,比如帮你操作 excel 表格,进行金融分析。在内部投行任务测试中,他的得分从上一代的百分之四十三点七直接飙升到了百分之八十八点零,几乎翻了一倍。 这意味着 ai 正从对话工具变成能自动干活的数字代理。 gpt 五点四还推出了两个版本,擅长深度推理的听听版本和追求极致性能的 pro 版本。 pro 版本在网页搜索测试中创下了百分之八十九点三的最高记录。不过,能力升级也带来了价格上涨, api 输入价格从每百万 toon 一 点七五美元涨到了两点五美元。 但 openai 解释说,新模型效率更高,实际消耗的 toc 更少,能部分抵消成本。早期测试反馈很积极,有投资公司的 ai 主管表示,他在财务和 excel 任务上的准确率提升了三十个百分点。 你觉得这种能帮你自动处理表格、分析数据的 ai 助手会改变你的工作方式吗?欢迎在评论区聊聊你的看法。

最强的 gbt 五点四啊上线了啊,现在都是五点四版本,我是 plus pro 用户啊,就是两百美金一个月的,不管是 plus 还是 pro 都可以去使用的,就两百美金还是美金都可以使用的,我们来看和之前的版本有什么区别啊? 和 gpt 五有什么区别?首先第一个就是更强的专业工作能力啊,就比如说在 p 做 ppt 编码能力精准测试中啊, 超过了百分之八十三的精准水平啊,达到了行业领先啊。第二个呢,就是原生控制自己的电脑,就比如说我们自己使用的这个电脑啊,他能直接看懂界面,看懂我们的界面,也能直接去控制 鼠标和键盘,打开软件,填写表格等等之类的。第三点就是超长的上下文,不管我们是 plus 还是 pr, 不 管是五点四 thinking 还是普通的模型啊,都可以达到了一百万字幅的上下文啊,可以仅仅把一整本书啊,都能 全部统一在一个窗口上去进行流畅的对话。第四点呢就是准确率更高啊,简单说可能胡编乱造啊,或者是等等之类的削减了,不像以前就是可能 他不会的说自己会啊等等一些问题。第五个点呢就是编码能力提升了。第六就是多版本啊, 有 gpt 五点四映衬,还有 thinking 就是 深度思考,还有 pro 啊,就我这个版本就企业最高级的就是两百美金一个月才能去使用到的啊。然后第七点 就是制服效率更高了,更加适合于长任务,还有他们这个对比啊,总结就是 gpt 啊,用来写作科研,做数据分析等等,都可以点击我主页的这点作品找到我。

嗨,今天是二零二六年三月十号周二。好吧,让我们随便聊聊上周 ai 圈又发生了什么。先说说 open ai 吧,这周动作还挺多的。第一件事是发了个 gpt 五点四, 反正定位就是拿来干专业活和做智能体工作流的。这个版本自带了控制电脑的能力,可以直接跨软件跑,自动化操作,上下文给到了一百万偷看。 在一个覆盖四十四种职业的测试里,他跟人类专家对打,拿了百分之八十三的胜频率, api 的 输出价格也降了,降到每百万 token 十五美元,对于那种想在后台一直挂着智能体的开发者来说,成本算是又低了一件。 第二件事也是 openai 的, 他们在 github 上开源了一个叫 simon 的 框架, 这东西有点意思,用 elixir 语言写的,估计是看中他处理高病发的能力。他的逻辑其实就像个 ai 包工头,天天盯着 leonie 那 种任务看板,看到有活儿就派智能体去写代码, 干完还会把测试状态、代码审查,还有操作视频打包交差。接下来说说 google, 这周他们也有两个更新, 一个是发了 gemini three point one flashlight, 算是他们家速度最快也最便宜的版本,每百万 token 输入两毛五,输出一点五美元, 跟上一代比首次响应快了二点五倍,输出快了百分之四十五,在 rena 排行榜上拿了一千四百三十二分 g p q a 也有百分之八十六点九的成绩, 现在 api 和 vertex ai 里已经能玩了。另一个是 google 开源了个叫 workspace c l i 的 命令行工具 rust 写的, 它把 drive, gmail, 日历这些全家桶的 api 全塞进了一个命令行里,底层还内置了四十多种智能体技能,它能当 mcp 服务器用, 第三方 ai 联上就能直接接管你的办公流,在 github 上已经一万五千多颗星了,挺受欢迎的。然后是 curser, 这周一口气发了三个更新,一起说吧。 第一个是他们老板出来分享了个案例,说内部的 ai 智能体自己花四天时间硬生生解开了一道研究级的数学证明题,全程自己推理自己验证。第二个是正式上线了 automations 功能, 简单说就是让 ai 离开聊天框,跑到云端虚拟机里二十四小时待命。你可以设定个触发器,比如代码一提交,它就自动做安全审查,然后发 slack 报告,或者半夜接到 cad 丢弃报警,它自己去查日记找 bug, 然后顺手提个修复的 pr 给值班工程师,科室自己说已经用这套东西抓了不少严重漏洞了。第三个是 mcp apps 功能, 现在科室里的智能体不再只会吐干巴巴的代码了,它能在聊天窗口里直接渲染出那种可以点的交互式 ui, 写完代码直接点两下看看效果,不用再切窗口了,挺省事的。再看看 osropik, 他 们跑去和猫 zelka 搞了个安全合作,拿 cloud 四点六给 firefox 浏览器扫漏洞,两周扫了快六千个 c 加加文件,交了一百一十二份报告, 找出来二十二个真的零日漏洞,里面有十四个是高危。最逗的是,前二十分钟他就揪出了一个内存漏洞,还顺手附了个修复补丁。不过测试也暴露了他的菜点 找 bug 确实厉害,但让他写攻击代码就不太行。团队花了四千多美元的 a p i 费,跑了几百次,就成功写出两个能用的攻击程序,还得靠关掉浏览器杀香才行。下面随便看点篇研究和开源的内容。 andrew karpa 这周有两个动作, 一个是开源了 auto research 框架,是个极简的自动化机器学习工具,底层连着他那个 nanochat 项目, 你只要给 ai 丢个 markdown 文件,它就能自己改训练代码,跑五分钟测试评估损失,然后再决定要不要保留。就这么循环,一张显卡挂一晚上能跑一百多次实验, 你睡一觉起来,它连实验日期都给你写好了。另一个是它把 nanochat 稍微优化了一下, 在八张 h 一 百上,把微型 gpt 二的预训练时间从三小时硬压到了两小时。论文方面提两篇,第一篇是图林奖得主杨立坤参与的团队发的研究多模态预训练, 他们用 transfusion 框架把语言预测和视觉扩散放一块,从零训练。结论有四个,一是图文混训,不打架还能相互加 buff。 二是能自己搞出世界建模能力。三是混合专家架构,用来做多模态缩放很有效。 四是视觉数据比语言数据更难喂饱。第二篇是做 flux 的 那个黑森林实验室联合 m i t 发的叫 self flow 的 新训练范式。以前训练多模态模型,得靠外部模型做监督, 这个范氏搞了个双时间不机智,让模型自己猜,被遮住的信息完全踢开了。外部监督在图像、视频和音频生成测试里,都超过了现在的最高水平。开源模型这边,艾伦人工智能研究所发了两个东西, 一个是把 momo 二的代码库全开源了,主攻复杂视频和高精度图像。另一个是发了个七十亿参数的 om hybrid 模型,架构是 transformer 和限行 r n n 混着来的。三个 delta net 对 应一个自注意力层, 数据说达到和欧某三一样的精度,它消耗的训练 toc 少了百分之四十九。 howkingface 这周发了本合成数据手册,讲了他们是怎么大规模搞高质量合成数据的, 花了十万个 gpu 小 时,做了九十多次实验,弄了一万亿个 toc 出来,顺手还开源了个 fiveres 数据集,有十三点五亿行, 证明了把普通文本转成教程表格对训练真的有帮助。最后顺嘴提一个字节,和清华搞了个 cool agent 的 项目,就是用强化学习去写高性能显卡底层代码的框架。在测试里生成的代码跑得比默认的 touch 编辑器快多了, 最高难度的任务快了百分之九十二,低难度的甚至快了一倍,数据集也已经扔在 hugen face 上了。好,以上就是上周的 ai 资讯,接下来看下上周全球前十的生成式 ai 产品访问量排名。 值得注意的是,豆包好像本周杀入了全球前十。 除了前十的榜单之外,在上个月,全球生成式 ai 访问量增长量最快的是 cloud, 同比增长最快的是 gemini。 最后再看下本周 hugin face 上热度前十的开源模型有哪些。 好吧,这期就这样,感谢收看,觉得有用的话点个赞分享一下,下期见。