GPT 5.4 支持直接操控电脑屏幕 #chatgpt #openai #AI #token #agent

gpt为什么不知道openclow

326

105

130

56

举报

发布时间：2026-03-23 11:21

查看AI文稿

AI文稿

openai 推出了它的最强模型 g p t 五点四，可以说直接粉碎了 java 三点一 pro 和 cloud open 四点六的神话。这里面最有强力的是 g p t 目前已经可以真正的原声地实现电脑使用了，办公的效率可以说直接拉满。这个我觉得跟 open cloud 推动的方向呢，也是比较一致的。先快速看一下它的一些基础数字。本次呢， g p t。推出的是五点四的 thinking 和 pro 开发测呢，推出了 api 和 codex，并且附带极速版的五点四 fast。在一些指标上，比如 g d p l s w e h pro a r c a g i 二这几个指标上都拿到了第一名，超过了 jimmy，超过了 office。比较有想象力的呢，是一个所谓叫原生电脑使用能力，什么意思呢？就是 g p 五点四可以通过 playwrite 等酷编辑代码来控制计算机，也能直接通过看屏幕截图，动用鼠标和键盘，比如说发邮件，排日程，填表格，好流程这些以前需要点来点去的活呢，在 g p t 五点四上面都能直接实现了。这份很多工作原来是通过工具的，比如说 browser use g p t 呢，现在是把这份能力内化到模型里面。在 o s word verified 这个指标上， g p g 五点四呢，刷出了百分之七十五的成功率。一个月前登顶的 cloud ops 四点六呢，也不错，是七二点七。而人类呢，在这个指标上的成绩呢，只有百分之七十二。换句话说呢，其实它们都超越了人类控制屏幕上的效果了，比人更会使用电脑。直接影响呢，就是整个的分析师的这个行业，应该说华尔街的一系列的分析人员呢，都可以被 ai 替代了，这里面呢，包括比如说销售的演示文档，会计的电子表格，急诊排班表，制造图表、短视频等，全部要求 ai 真刀真枪的交付工作产出。目前呢， g p t。五点四呢，已经能非常成功的做出 ppt excel，比绝大部分的专业人士还要更好。有内部的班主榜表示呢，人类在百分之六十八的情况下，更培养 g p t。五点四胜任 ppt，而不是人类自己胜任 ppt，因为它的美观度更强，视觉更丰富，图像使用也更高效。换句话说呢，现在每一次的模型的升级，都把一些 ajax 的能力，包括一些办公的能力以及功率使用的也都累化了。 g p d。五点四也是 open ai 迄今为止 token 效率最高的推理模型，解决同样的问题的情况下，所需 token 大幅下降。 codex 在 fast 模式下，其 token 的生成速度最高可以提升一点五倍，同样的智力，同样能力，只是快了百分之五十。这里重点介绍一个他们很有趣的一个场景，就是 g p d。五点四呢，发布了一个实验性的 play right interactive 技能，让 codex 一边构建 web 应用，一边呢，在浏览器上通过 play right 格式化的调试测试，可以理解呢，这是一个双方拉扯的关系，生成者呢，就是 codex 通过网页来构建，而测试者或者说是评估者呢，是通过他的 play right，通过屏幕操控电脑来测试效果。所以呢， open 团队也给了一些比较有意思的案例，比如说主题公园的模拟游戏，凭一个提示词呢， gpt 五点四就能独守的搓出一个完整的经营类的游戏，在游戏的建立过程中呢， gpt 自己呢，又作为一个裁判员来实现一个全自动运行的检测，从扩建到拆除的整个流程的检测，保证呢，整个的功能呢，是足够丝滑，体验的足够优质，还算达标。所以呢，其实是一个自我进化的，有点像强化学习的一个能力。类似的，比如说战旗 rpg gpt 五点四通过一款回合制的网络战斗游戏，包含移动行动、站立和遭遇战等完整系统。 playrite 呢，又充当了每一轮携带中的验证界面交互检查并微调 u i 行为的检查员，直到战斗手感、视觉表现和整体的体验全部调优为止。下一个场景叫做金门大桥的飞行体验， g b 五点四呢，可以生成一个超写实的三 d 场景，而 playrite 呢，化身成一个王牌飞行员，作为一个模拟用户的体验，来通过多视角的全自动的巡航的测试，最终呢，保证产品的渲染的效果的稳定性。通过一小时的高频的迭代呢，最终完成了整个效果的验收。当然还有一系列的 g p t 五点四的性能提升，包括 token 达到了一百万的上下文，包括整个速度和效率的提升，以及幻觉的下降。这些呢，我就不一一来分享了。有一个比较有意思的产品上的一个功能， g p 五点四编辑呢，是支持随时介入，也不会打断思路。换句话说，你在运行 g p t 输出答案的过程中呢，你可以随时加入新的条件跟注意因素，如果 g p t 还没有输入结果之前，它在编辑的过程中是可以接收更多的信号和信息的。接下来我觉得 g p t。五点四的发布呢，是 openai 对于 jammer 三点一 pro 跟 cloud opera 四点六的一次全面的反击。虽然目前的价格还是很贵，但是可以看出整个的 g p t。五点四的芯片呢，是没有短板，从推理到编程到视觉的工具使用计算机操作，网络搜索支持工作，每一条线呢，都拉到了顶级的水平。价格呢，当然短期还不是 g p t 需要优化的点，但是他们回到了真正的铁王座之后呢，对市场也是一个非常有效的回应。当然了，随着 ai 这一波竞争呢，大家能看出来，整个的 ai 颠覆目前数据来看的话，整个炸子行业呢，已经跌到了二零二四年疫情刚结束这段时间的一个低谷了，按照目前的趋势来看的话，整个的 ai 的发展速度只会越来越快，无论是 openclaw 还是 cds，还是这轮的 gbt 的五点四的提升，以及一系列的开源模型的升级，我们也希望呢，能看到巨源的速大模型不断的去开启新的领域的升级，让我们看到更多的可能性。这样呢，让整个 ai 发展呢，不至于局限在目前能看到这应用场景。这次呢，我觉得 oppai 的 g p t。五点四对于电脑屏幕操作的这一个方向呢，又开启了新的里程压力。

粉丝3.5万获赞30.7万

相关视频

05:10
MiniMax调用量全球霸榜，MiniMax和ChatGPT DeepSeek OpenClaw的区别讲透
查看AI文稿
AI文稿
minimax 调用量连续登顶全球第一，总市值更是超越百度，成为国产 ai 里最耀眼的存在。很多人还一头雾水， minimax 到底是什么？它和 chat gpt、 deep seek、 open club 到底有什么区别？今天我们用一个例子，把四者的区别一次性讲透，让你看完就能彻底分清谁是谁，能干什么，该怎么选。先从最核心的定义说起， minimax、 chat gpt、 deep seek 属于大模型，也就是 ai 的大脑。而 opencall 不属于大模型，它是智能体执行框架，相当于 ai 的身体、手脚和行动系统。大脑负责思考、判断、理解、决策，身体负责操作、执行、落地、完成任务。这是最底层的区别，也是绝大多数人搞混的根源。我们来做一个非常直观、极具代入感的沉浸式场景对比，就用你每天都可能遇到的一个典型办公难题。你在工位上对着电脑下达一句指令，帮我把这一周的销售原始数据整理成 excel，做成正式汇报 ppt，最后发到部门指定的工作群里面。对这条完整且有执行深度的任务， chat gpt、 deep seek、 minimax 以及 open cloud 的表现会瞬间拉开天壤之别。我们可以清晰感受到四者的核心差异。你把同样的指令发给 chat gpt，它的反应非常快，会输出一段条理极其清晰的长文，详细告诉你完成这项工作的每一步流程。从文件存放位置、数据清洗方法，到 excel 透视表制作、 ppt 排版设计，甚至连图表样式、文字表述都会给出专业建议，内容周全，逻辑严谨，但也就到此为止了。它没有办法真正触碰你的电脑文件，不能打开办公软件，不能自动生成表格和 ppt，更无法打开通讯工具发送文件，所有的实际操作都需要你亲自动手完成。叉 g b t 更像是一位只会提供方案的顾问，擅长给出思路和指引，却无法参与实际执行，始终停留在文本交互的层面，无法突破只说不做的局限。换成 deep seek，它的表现会更偏向专业工具属性。收到指令后， deep seek 不会一步步教你操作流程，而是直接生成一段可运行的 python 代码，包含数据清洗、统计计算、表格生成等功能，能精准解决复杂的数据处理问题，充分发挥它在长文本理解和专业编程上的优势。但它依旧无法独立完成全流程任务。你需要手动复制代码运行程序、处理报错。即便代码生成了数据结果，后续的 ppt 制作、文件发送等环节仍需你亲自操作。它能攻克专业环节的难题，却无法打通从数据处理到成果交付的完整闭环，更适合作为专业开发者、技术人员的辅助工具，难以满足普通职场人一站式办公的需求。而当你把这条指令交给 mini max，整个使用体验会发生根本性的颠覆。 minimax 做的是所有需要思考、判断、计算、设计、生成内容的智力工作。他会先理解你的需求，规划好整个任务流程，然后读取原始数据清洗、数据计算、汇总、设计 excel 的结构和公式。再接着构思 ppt 的页数、版式、文案、图标、样式，把所有内容、逻辑、数据、格式全部生成出来。简单说， minimax 产出的是文件的灵魂和内容，它决定这份 excel 对不对，这份 ppt 好不好看，数据准不准确，逻辑通不顺畅，这是只有大模型才能完成的智能工作。但是它不会点击鼠标，不会打开软件界面，更不会手动保存文件，它只负责把完整的内容造出来。而最后， openclaw 做的是完全不需要思考的机械操作界面控制文件执行。他不懂数据是什么，不懂 ppt 该怎么做，也不懂报表逻辑，他只负责按照 minimax 的指令去完成，点鼠标、开软件、保存文件、上传、发送这些动作。 minimax 把 excel 内容生成好， openclaw 就负责点击保存。 minimax 把 ppt 内容做好， openclaw 就负责导出文件， minimax 下达发送指令， openclaw 就负责打开聊天软件，找到群聊，上传文件，点击发送。 openclaw 相当于一个只会执行动作的机械手，没有任何思考和生成能力，没有 minimax 指挥，他什么都做不出来。没有 openclaw， minimax 的智能思考无法落地为实际行动。没有 minimax， openclaw 就失去了指挥核心，无法理解任务逻辑，完成有序执行。也正是基于这样的核心逻辑， openclaw 会深度依赖 minimax，而非 chat gpt 或 deep seek。 chat gpt 仅能提供方案，不具备执行能力，无法为 openclaw 提供有效的决策支撑。 deep seek 聚焦专业编程和长文本处理，没有适配智能体执行的全流程能力，难以驱动 openclaw 完成复杂任务。而 minimax 从模型架构到功能设计，都专为智能体执行优化，具备稳定的工具调用能力、流畅的系统兼容性、高效的并发处理水平，能为 openclaw 提供最精准、最稳定、最适配的指挥核心，让两者的配合达到最优状态。一场简单的办公场景对比，就能清晰看清四者的本质区别。叉 gpt 是提供思路的顾问， deep seek 是解决专业问题的技术助手， minimax 是独立完成任务的全能执行者， openclaw 是落地操作的执行主体。在 ai 迈向智能体走向真实的生产力的当下， minimax 与 openclaw 的组合真正打破了 ai 只说不做的局限，让人工智能从辅助工具变成了能独立完成工作的核心生产力，这也是 minimax 能够在全球调用量登顶，市值实现跨越式增长的核心原因。
4878老林白话财经
02:22
你的GPT变笨了？1秒检测是否被降智！附解决方案！#gpt #gpt4 #gpt降智 #人工智能
507蔡蔡TV
02:48
「只说不一样」openAI新模型gpt-oss有什么特别的？其他不重要，只要记住三个点：开源，本地部署，AI安全风险 #人工智能 #openai #gpt #智能玩家联盟 #deepseek
608第四种黑猩猩
02:47
GPT-5正式发布！3分钟全面解读5大核心突破！程序员、老师都将被取代或改变 #ChatGPT #GPT5 #openai #AI #科技
8.7万和杜老师学AI
04:44
完了，一月近1500的最贵GPT账号，刚买10天就被封了 #openai，ChatGPT #o1-pro #人工智能 #企业获客神器
379【俗人六哥】Ai企业获客盈利系统
05:22
GPT-5.4发布：OpenAI最全模型，养龙虾天选模型 #OpenAI #GPT #杜雨 #openclaw #人工智能
443杜雨说AI
01:05
GPT登录不进去，各种原因解析，一分钟了解GPT登录不进去 #人工智能 #gpt #gpt4 #openai Chat GPT登录不上去，没办法登录？#科技
1123北城君带你学Ai
02:10
OpenClaw调用GPT经常失败，问题可能不是AI，是网络。#open
查看AI文稿
AI文稿
当你使用 open class 调用 gpt 时，是否经常遇到失败、超时或响应缓慢？你可能会怀疑是 ai 接口本身的问题，但真相往往藏在网络层，不是 ai 不行，是你的网络拖了后腿。为什么网络会成为瓶颈？ gpt 等 ai 服务通常部署在海外，国内直接访问会面临高延迟，跨国传输数据包来回时间长，导致 api 响应缓慢甚至超时，连接不稳定。公共网络或普通 vpn 线路波动大，容易出现丢包、断裂。合规风险，随意使用 vpn 可能涉及跨境数据传输合规问题，企业业务更需谨慎。解决方案，从能用到稳定调用，要保障 ai 服务的连续性和低延迟，你需要的是企业及合规跨境网络，而不是简单的 vps 或普通 vpn。一个专业的网络架构应具备低延迟专线，通过优化路由和专用宽带，将 api 调用延迟降至最低，让 gpt 响应如本地服务般迅速。企业即稳定性。多路迂迂，自动故障切换，确保七成二十四小时不掉线，业务不中断。合规跨境，遵循国内国际法规，提供合法合规的跨境数据通道，规避政策风险。推荐架构， ai 企业级网络方案针对欧本科等 ai 工具的高频调用场景，建议采用以下网络架构，一、前端接入企业内网或云服务器，通过合规专线接入跨境网络。二、智能路由，动态，选择最优路径，避开拥堵节点，确保低延迟。三、本地加速节点在国内部署接入点，缩短物理距离，提升响应速度。四、安全与监控，实时流量监控，自动告警，保障连接质量。这样一来，无论你调用 gpt 的频率多高、数据量多大，都能获得稳定快速的响应，彻底告别 api 失败困扰。如果你正在为企业寻找可靠的 ai 调用网络方案，不妨从优化网络架构入手，让专业的网络服务商为你搭建一条 ai 高速路，让技术回归业务本身。
1TK跨境顾问
08:43
我把 GPT-5 全面实测了：准不准、会不会编、值不值？| | 从 0 到可用：GPT-5 代码能力暴走的一晚!#GPT5#openai#chatgpt#ai新星计划 #GPT5实测
4807神烦老狗
03:26
GPT-5上手前必看！免费、强大，但它有个“致命”的坑… #GPT5 #openai #chatgpt #ai新星计划
368神烦老狗
08:40
GPT5.4重磅发布！ #GPT #AI #openAI #科技#热点
查看AI文稿
AI文稿
今天一上来啊，要跟大家聊一个让人惊掉下巴的一个消息啊，就在刚刚，二零二六年三月六号， oppo ai 突然之间发布了 gpt 五点四，这个新版的 ai 不光是能力上有了巨大的提升，而且他竟然还分了不同的价格档位，然后能用的地方也多到你数不过来，难道说这就是 ai 要统治世界的节奏吗？没错没错，这个消息一出来大家就炸锅了啊，那咱们今天就来好好聊一聊，这个 g p t 五点四到底是个什么厉害的东西。咱们第一个聊的是这个 g p t 五点四的新特性揭秘啊，这个我我特别想知道，就是这一版到底在专业能力上面有哪些令人惊讶的提升？这个模型呢？它就是在四十四个不同的专业领域的测试当中，有百分之八十三的项目都达到或者超过了人类专家的水平啊，那这就比上一代有了非常明显的进步啊，听起来好像他已经可以替代很多高技能的岗位了，对，没错没错，比如说他在这个金融建模的测试里面，他可以拿到百分之八十七的高分，然后呢，他做的 ppt 有百分之六十八的评选，更喜欢他的这个事实性错误也降低了三分之一以上，就他已经可以真的去处理非常复杂的专业任务了。这个所谓的原声计算机使用能力到底有多厉害，他就是可以直接看屏幕截图，然后模拟鼠标键盘的操作， ok，他可以很流畅的在不同的软件之间进行切换，完成一整套的任务。听起来像是一个会用电脑的数字人了，没错，而且他在这个桌面操作的这个测试里面，他的成功率是百分之七十五，那他已经超过了人类的平均水平，然后他还可以理解复杂的界面布局啊什么的，这就真的让这个 ai 可以像员工一样去自主的完成很多工作。他在这个处理非常长的这种输入的时候表现怎么样？这个就是他的这个 pro 版本已经可以支持一百万 tokens 的这种上下文了，就是他可以一口气读完一本很厚的书，然后或者说读完一个很大的代码库，他都不会丢掉前面的信息。那这个对于那种需要不断的去追踪很多细节的这种任务是不是特别有用？对，因为它这个长窗口的这个加持，它可以在这种非常复杂的科研啊、法律啊、开发啊这种项目里面持续的推理几十甚至上百次都不会断片。 ok，对，就是它可以真正的去应对那种超长的上下文的挑战。我们来聊一聊这个 gpt 五点四在专业领域的表现。好吧，来第一个问题，它在这个 gdp 五点四在专业领域的这种测试里面，他有百分之八十三的项目都达到了或者超过了行业专家的水平。 ok，那这就比上一代提升了一大截。而且他这个不光是在这种金融建模这种东西上面，他可以拿到百分之八十七的高分，包括在这种做 ppt 啊，做这种表格啊，这种实际的任务当中，也有百分之六十八的评选认为它比人类做得更好，所以它不光是理论上厉害，它是真的可以在办公室里面干活的，对，而且它这个事实性错误也比上一代减少了三分之一，然后整个的回答出错的概率也降低了将近两成。包括它还可以 pre view，它的推理的过程你可以随时去打断它，修正它对它的这种在金融和法律这种对精确性要求非常高的这种领域，它的表现也非常的强眼。那这个新版的这个 ai，它在写代码和实际操作电脑方面有什么让人惊讶的进步吗？它在这个 s w e bench pro 这种非常权威的这种编程的测试里面，它的通过率是将近百分之七十五，然后它的这个速度也比上一代快了一半。它可以直接去解决 github 上面的一些真实的工程里面的难题，包括一些前端的修复啊，或者是说这种系统的重构啊，它都可以非常快的就搞定，这开发效率感觉要翻倍了呀。对，而且它还可以就是原生的去操作电脑，就它可以看截图，然后去模拟键鼠的操作。它这个在 os word verify 的这个测试里面，它的成功率是百分之七十五， ok，它可以甚至可以通过这个 d o m 和截图去操作网页，它的这个成功率也超过了九成。它还可以去处理一些非常复杂的多步骤的人物，它的这个 token 消耗也减少了一半。它的这个无论是在这种自动化测试，还是说在这种实际的项目当中，它都表现的非常的亮眼。如果是具体到不同的行业当中，这个 gbt 五点四它到底能够帮上什么忙呢？比如说在金融领域，它可以直接帮你搭建非常复杂的财务模型，然后分析报表，包括在法律行业，它可以帮你去吃透大段的合同，帮你去归纳出一些关键的条款。就这些原本非常办公是不是也会发生变啊？没错没错，研发团队可以用它去做一些代码的审查，然后项目管理，那普通的白领呢？可以用它去自动的生成一些非常高质量的 ppt 和报告，就是大家可以把更多的精力投入到创新和决策当中，而不是说去做一些重复的劳动。我们来聊一聊这个价格和应用前景啊。首先第一个问题， gpt 五点四到底有哪些版本？它是怎么定价的？这个模型它是分两个版本，一个是叫 gbt 五点四 thinking，它是主要面向专业的个人和小团队。然后它的这个 api 的价格是，输入是每百万 token 是二点五美元，输出是每百万， token 是十五美元。如果你是用这个缓存的输入的话，就只要零点二五美元。如果你是这个叉 gpt plus 的会员的话，你每个月是二十美元就可以用。那如果是更大的企业，或者说有更高需求的人呢？有更高的就是企业级的用户可以用 gpt 五点四 pro，它的这个价格是输入是每百万 token 是三十美元，输出是每百万， token 是一百八十美元。然后如果你是这个呃批量的，或者是说这个 flex 的这种模式的话，还可以打五折，但是如果你是要这个 priority 优先处理的话，那就是要加倍收费了， ok，对，就是它是这种分档的定价，可以满足不同的人，不同的预算和不同的场景，就是说不同的用户群体用这个 gpt 五点四到底会有什么样的体验上的，或者说成本上的差别？像那种自由职业者或者说小团队，那他们用这个标准版的就可以呃自动化掉一些繁琐的工作，然后也可以降低一些成本。那如果说你是那种更高要求的个人或者说创业公司，你可以去升级到这个 pro 版，就可以去解锁一些更复杂的应用。企业和开发者呢？是不是也有专属的优势？对，没错没错，就是大公司的话，它可以用这个 pro 版的，或者是说企业版的就可以支持这种大规模的专业人物的处理，然后安全性也更高。开发者的话可以去呃利用这个 a p i 去构建一些呃各种各样的智能的应用。那教育用户的话，其实也可以去申请这个早期的体验，就是它是可以真正的做到呃各类用户都可以找到自己的合适的使用方案。 ok，对，你觉得这个 g p t 五点四会在哪些领域最先掀起革呢？我觉得这个东西会让办公啊和这个专业服务啊会有一个大提速，就很多人可能会从那种繁琐的重复的任务当中解脱出来，去做一些更有创造力的事情，然后呃甚至可能会产生一些新的工种，就是 ai 原声的工种。那当然了，就是呃因为它的这个价格也不低嘛，所以对于一些小团队来讲可能还是有一些门槛的。看来这个东西确实会改变很多行业的工作方式啊。对，而且就是因为它的这个 a p i 是很完善的，所以它其实可以跟很多现有的系统去打通，那他的这个应用场景几乎是无限的 ok。对啊，虽然说他可能在一些需要创新啊，或者是说需要一些情感理解的这些方面，还没有办法完全取代人类，但是他的这个安全性和他的这个可控性也在不断的加强，所以他会成为一个各个行业的一个非常强大的助手。好吧，对，今天我们聊了这个 g p t 五点四的一些新的特性，然后也聊了他可能在各个行业里面带来的一些变更。确实他的到来让很多东西都变得可能了。所以我觉得大家面对这样的一个技术的浪潮，大家可能需要去思考的是如何跟这样的一个 ai 去共同成长。 ok 了，那么就是以上就是这期播课的全部内容啦，然后期待大家都能够找到属于自己的那个和 ai 相处的方式，那么下期再见。拜拜。
11商业吃瓜员
00:50
GPT5就是坨大的，毫无亮点 #gpt5 #OpenAI #ai新星计划 #人工智能
4604赛博小凡
01:19
国内使用ChatGPT实用教程分享
chatgpt-open.com
#chatgpt #chatgpt4 #gpt4 #gpt4o
9229静静学AI
03:10
ChatGPT5.0国内使用教程，体验最强人工智能！ #chatgpt #chatgpt5 #openai #AI #gpt4
2626程序员老张（AI教学）
01:46
OpenAl重磅开源！gpt-oss本地部署教程来啦，单卡可跑! #开源#大模型#科技 #Openai #GPT5
213棒棒闲不住
02:22
GPT 5.1发布，但OpenAI仍难脱豪赌质疑，国产AI如何戳破西方的AI万亿泡沫？#AI #MiniMax #OpenAI
31科技圈
04:18
全面深度解读GPT5.4大更新 #GPT #ChatGPT #OpenAI #AI #科技资讯
查看AI文稿
AI文稿
gbt 五点四昨晚发布了，这是 openai 目前最强的模型，也是过去几年里面变化最大的一次更新啊。这条视频呢，会有点长，大家耐心看完就能彻底搞明白它到底更新了什么。现在啊，每隔几天我们就能看到更强的模型，每家的 ai 都在进化。但 gbt 这次的更新到底解决了什么实际问题呢？对我们普通人有什么影响呢？我们先从最基本的讲起啊，就是以前你用 check gpt，本质上你是在跟问答机器人在对话，你问他答，他能给你很好的答案，但他的能力呢，就被框在了那个对话框，就像孙悟空，有很强的能力，但是被五指山压住了。但今天这个更新呢， g p d 五点四之后呢，就等于把这个五指山给搬走了，它可以跳出对话框来了。 g p d 五点四是 open i 第一个原声，支持操控电脑的通用模型，它自己现在可以移动鼠标，自己可以敲键盘，打开应用，填表，发邮件，安排日程，完成一整套的工作流程，不需要你在旁边一直盯着。例如你告诉他让供应商把报价发过来，然后呢，把回复的报价整理成表格，然后安排下周的会议，那你说完关掉屏幕就可以了，就可以去干别的事情了，他自己就可以全部搞定。 openai 还用他从头开发了一个主题公园模拟游戏啊，设计地图，生成资产，写代码，测试游戏逻辑，全程没有人的介入，他自己就会发现 bug，自己修，自己验证。你只用说一句话，过半个小时一个完整的游戏就开发好了。以前啊，我用 gpt 来操作浏览器，或者是用它来操作 excel 表格呢，它的准确率和速度，说实话不敢恭维。但这个五点四的新版本啊，在实际操作电脑完成任务的考试中呢，第一次超过了人类平均水平，它的成功率有百分之七十五，而人类平均只有百分之七十二点四。但有人会说啊，操控电脑是一回事，但鼠标点的再快，也不能说明它可以干好更难更专业的活，对吧？于是 open i 就搞了一套叫 gdp value 的评测，就是覆盖美国 gdp 贡献最高的九个行业，里面呢，有四十四种职业，比如有会计、律师、同行分析师、医生、销售工程师等等。让 ai 去做这些职业的真实工作，再让人类专家来打分， gpd 五点四的结果是，百分之八十三的情况下， ai 做的跟专业人士做的一样好，甚至更好。而上个版本的 gpt 五点二呢，是百分之七十一。也就是说啊，公司里大部分以前白领做的工作啊，看起来需要很高智商才能完成的活啊。现在 gpt 五点四也可以做了。你可能会说啊，别扯了，那种假大空的 ppt，它能做，真正需要判断力的活，它能做吗？我们来看真正有难度的博，他能做到什么程度？先看投行建模任务，就是投行初级分析师做的那种财务模型。 gbt 五点四的得分是百分之八十七点三，上一代是百分之六十八点四，提升了将近二十个百分点。那法律文书、法律 ai 公司哈比测的他，在他们落班评测里呢， gbt 五点四得分是百分之九十一，他们说他在处理复杂交易分析和查长篇合同这件事情上，比其他任何模型都强。那还有一个大家最关心的幻觉率，就是 ai 一本正经胡说八道的概率， g p d 五点四，单条陈述的错误率降低了百分之三十三，整体回答含错误的概率降低了百分之十八，那总的来说就是能力更强，错误更少了。因为还有一个让人抓狂的点，就是你发出了一长串指令，等了半天，结果出来呢，方向全错，只能重来。那这次 gpt 五点四呢，也给解决了，他在干活之前呢，就会先给你一个计划，告诉你我打算分几步走，你觉得哪步不对呢，你就可以直接打断他，就会马上调整，再接着跑，不用等到最后发现错了又重新来。还有一个改进呢，普通用户可能体感不深，但是用它来搭工作流的人会很在意，那就是成本。以前 ai 同时接很多的工具干活，每次干活前呢，都要把所有的工具的说明全部加载进来，那又是又慢又贵啊。五点四呢，也改进了，就是用到哪个工具才去找那个工具的说明，用完它就释放节省头肯， open ai 撤了一批任务啊，这个改动让成本降低了百分之四十七，那同样的活价格现在砍了一半。另外它现在一次性能读进去的内容也变多了，最高呢支持一百万托肯，也就是你把三体一二三部还有各种研究资料全塞进去，它都给你一口气读完，然后给你一个综合的分析。说了那么多啊，那我们现在能用吗？那 gpt 五点四 thinking 呢？从今天起，面向 plus 和 tips 用户就开放了，替代原来旧的 gpt 五点二 thinking。那 gpt 五点四 pro 呢？是面向 pro 用户和企业用户的。好了，我要把我的龙虾模型分析一下了，下期见。
227李开学(深度智能前线)
01:58
简单聊聊 gpt-5 api 价格
#gpt #openai #大模型#人工智能
6刘涉水写的代码像面条🍜
06:46
5分钟讲透 Open Claw #chatgpt #未来趋势 #openclaw #人工智能 #ai新星计划
查看AI文稿
AI文稿
如果你现在还不知道养虾是啥， open cloud 是啥，又或者说看到了别人都在用，你开始焦虑了，那么我强烈的建议你一定要把我这个视频看完，尤其呢，是新手小白，你最关心的 open cloud 的问题，在这里都能得到解答。视频比较长，大家先点赞收藏再观看。 open club 是啥？他能帮你干啥？他有啥毛病？该不该养他？这条视频呢？全都给你安排明白，我们直奔主题， open club 到底是啥？ open club 是一个叫彼得斯坦伯格的奥地利程序员，退了休没事干二五年，年底就捣鼓出了这个项目， logo 呢，是一只红色的小龙虾，所以大伙管他叫龙虾，管部署他就叫养虾。那龙虾是大模型吗？不是，是智能体吗？严格的说，他也不是，准确的说，他是一个能利用大模型生产智能体的模具，最终呢，要落在这个模具的身上。我帮你捋一捋这几个概念，你就明白了。大模型呢，就是我们经常用的，比如说豆包、 g、 p、 t、 d、 sigma 等等。它呢，就是 ai 的大脑会思考，能理解，但只会说，只能出主意，它干不了事。智能体呢，是长了手脚的 ai，它不光能想，主要它能干活了。 open class 是啥？它呢，就是把大脑装进身体的那个机器，他本身是没有智能的，但是他通过调用这个大模型，就产生了不同的智能体。你可以理解成，大模型和 oppo 可乐结了婚，生出了一堆可以干不同活的儿子们，那这些儿子就是智能体了，这回明白了吧？所以呢， oppo 可乐的本质就是一个开源的，能让你用自然语言控制电脑干活的智能体框架，他呢，不挑大模型，你可以给他接 gpt，你也可以给他接 deepsea，甚至于同时接好几个，谁便宜用谁呗。既然说到这了，我知道你肯定想问哈，他到底能帮我干啥？咱们以前用 ai 呢，不管是 gpt 还是豆包千问，说白了他就是个嘴，你问他答，他给你出主意，写文案，但是活还是你自己来干。龙虾可不一样，他是嘴加上手，他不光能听得懂你说话，主要他能直接上手帮你在电脑上干活，整理文件，发信息，回邮件，盯热点，你吃饭的时候他在干，你睡觉的时候他还在那干，七成二十四小时，他不停的在干。我跟你讲个真事啊，猎豹移动的董事长，春节的时候髋关节脱臼，卧床用 o p k l 养了一只叫三万的龙虾，结果这个三万给他干了多少活呢？他给六百一十一个人拜年，安排了一个月的行程，写公众号，策划视频等等等等。十四天以后，三万自己成长为一个八人的智能体团队，七成二十四小时不停的运转。你看，还有啊，你可能想不到，这个最积极研究这个 open cloud，竟然是券商的分析师，有券商呢，用这个 open call，每天自动抓取 a 股的公告，分类识别，提取关键的信息，生成汇总的表格，定时推送到分析师的手机上。那么这个对于咱普通人来说，他能干啥？我给你举几个场景吧，比如说你是个做自媒体的，你就每天让他给你推送热点，问你这个热点要不要追，要追的话就先给你写一个出稿，你早上一睁眼，选择题已经在哪躺着了。做短视频的，可以让他帮你发文案，找素材，甚至于写脚本框架，你只要最后把关出境就行了。再比如你这个经营网店老板，你就让他每天干三件事，早上八点自动爬一遍这个竞品的价格，看看谁涨价了，谁降价了。中午十二点自动算一遍自己广告投放的情况，看看哪个词烧钱没效果。晚上六点自动生成当日的销售报表，推到你手机上。再比如，你是个开餐馆的，你就让他盯外卖平台的差评，只要有差评，立刻截图发给你。好了，不多举例子了。说了这么多，你是不是有点蠢蠢欲动了？哥，先别上头啊，天上是一定不会掉馅饼的，这只龙虾他一定不是白养的。第一呢，他需要这个玩意，说白了，他每思考一步都得烧钱。我们在以前的视频讲过，有的人一个月就干掉了一点八亿，头壳两万多块钱。第二呢，是安全隐患，想让龙虾干活，你就得给他权限，他能读你的文件，操作你的浏览器，访问你的系统后台。说白了啊，就是他想干啥就能干啥，搞不好就把信息泄露了，甚至直接把你电脑就干废了。第三啊，有很多人说安装有门槛，其实这个也催生了一个新的生意，叫上门装虾。我看这东西还挺贵，安装一次几百块钱，我觉得这就不是问题，马上一定会有傻瓜式的安装教程了。而且现在国产的龙虾已经在路上了，那咱们到底该不该养这玩意呢？是不是感觉如果我们自己不养几只，马上就会被时代所淘汰了呢。我的建议是啊，不用焦虑 ai 现在发展的速度，天天都有新玩意，你看那些排队装虾的，像不像以前排队免费领鸡蛋的那种大爷大妈？只不过鸡蛋还能吃饱人，这龙虾可是个烧钱的主啊。如果你要是真想养，记住以下三点，第一呢，别拿主力的电脑养，弄个旧电脑或者是 mac mini 专门跑他。第二呢，先想清楚自己需不需要养，你是真有一堆活让他干，还是就图个乐呵，图个新鲜，自媒体博主追热点咱可以理解，普通人真没必要。第三呢，安全第一，权限别给太满，重要的文件千万别让他碰，操作之前多留个心眼。说实话啊， ai 离我们是越来越近了，对于大多数的普通人而言呢，关注 ai 带来的行业趋势，理解其能力的边界，远比盲目跟风更为重要。所以这期视频呢，我希望让你们身边的人都看一看，尤其是今年有中考或者高考的孩子们。关于 ai 的话题啊，一定会在语文和英语的考试中有所体现。相信我，我是威哥，陪你一起看懂 ai！
26V哥AI搞米有东西
09:42
这么好的模型为啥要开源，怎么看OpenAI的质疑和他要走的路 #人工智能 #openai #ChatGPT #DeepSeek #开源
5.0万笨鸟怎么飞

热门推荐

热门分类