00:00 / 00:56
连播
清屏
智能
倍速
点赞45
OpenAI 发布最新产品 ChatGPT 智能体 OpenAI 预告了最新产品发布,原来以为可能会是 GPT-5。没想到最后发布的是一个类似 Manus 的 ChatGPT 通用智能体。 发布会中,开发团队解释了开发这款工具的原因。年初的时候 OpenAI 发布了 Operator 和 Deep Research 两款新的产品,一个侧重操作和交互,一个擅长深度信息检索和总结。经过一段时间的用户反馈和内部迭代,开发团队发现这两类能力其实是互补的,Operator 能解决登录、表单填写等实际操作问题,Deep Research 则在批量、高效处理长文档和网页内容时更胜一筹。于是,他们就想到将这两款产品的优点集成在一起,并且加上了终端、API 调用、图像生成等更多能力,从而打造了如今功能更全面的智能体(ChatGPT Agent)。 ChatGPT 智能体的最大特点,是它能像 “数字员工” 一样,在虚拟机环境中调用浏览器(文本和 GUI 两种)、终端、API,还可以生成和处理文档、幻灯片、Excel 等。用户只需要输入需求,智能体就会自动选择最合适的工具,拆解任务、查找信息、模拟点击和输入,最后把结果整理好,甚至附带截图和过程说明。比如规划婚礼、预订酒店、选购礼物和服装、给生成贴纸下单,甚至还能帮忙设计行程、处理财务模型等。 在演示中,可以看到智能体会根据任务的复杂程度自动切换工具。用户还能随时打断、下达新的指令。在关键操作前智能体还会要求用户进行确认。这种交互方式很像人与人之间的协作,既可放手让智能体全权处理,也能随时插手微调。 但是,Sam 也警示这样的能力也带来了新的风险。智能体具备浏览互联网和自动操作的能力,理论上可能遭遇钓鱼、提示注入等新型攻击。团队针对这些问题做了模型训练和行为监控,强调用户在涉及敏感信息时需要保持警觉,比如建议在支付环节由用户自己接管输入。 从实际表现来看,ChatGPT 智能体在多个基准测试上都有较大突破,不仅能完成数学推理、网页搜索、电子表格编辑,还能自动生成高质量的 PowerPoint 文件。尤其是集成了强大的检索和操作能力后,很多原本需要人工多步操作的场景都被极大简化。这让复杂的数字任务变得更自动、更省心。 #OpenAI发布智能体 #openai #智能体 #AI创造营
00:00 / 25:29
连播
清屏
智能
倍速
点赞0
00:00 / 01:08
连播
清屏
智能
倍速
点赞1
GPT-5在凌晨1点来了!更可靠,重实用 #OpenAI正式发布GPT-5在GPT-4发布两年半后,GPT-5在凌晨1点来了!更可靠,重实用。 OPENAI宣称最智能、最快捷、最实用。然而 (一)最智能有分歧 原股东马斯克当即不服,推理能力自家大模型Grok 4吊打GPT-5。ARC-AGI-2测试分别15.9、9.9。 不服的或许还有原GPT-3主导者Dario,编程能力其大模型Claude 4.1和GPT-5难分高下,SWE-bench测试分别74.5、74.9。 为此,OPENAI总裁拉来知名智能体平台Cursor的 CEO,现场体验助阵。还请用户演示AI修改代码中的BUG。 数学能力、理解图像视频的多模态能力,GPT-5优异,数学竞赛满分碾压人类,但仅比之前o3版本略有提高。 (二)最快捷、最实用不易比较,但重实用。 1.快捷(1)推理耗费Token的数量,GPT-5比o3版本减半(2)大模型统一为GPT-5,用户不用切换不同模型,由智能路由器,按用户问题难易,进行快速回答或深度思考(3)处理长上下文性能稳定,之前o3版本长100万Token时,性能衰减严重 2.实用(1)GPT-5向免费用户开放。 (2)轻量版在电脑、手机可用。 (3)在法律、物流、销售和工程等 40 多个行业,优于 o3 版本和 ChatGPT 智能体。 (4)已用于容错率极低的医疗行业。CEO奥特曼亲请癌症患者上台,讲述GPT帮她分析病情、查找医生、决断治疗方案、解释检查报告等。 (5)创意方面,写作更人性化,报表更优雅,小游戏更好玩。 3.最突出进展:更可靠。可信、安全是实用的基础。 (1)幻觉大幅降低。事实类降到低于1%,比 o3 模型降80%。其中医疗类降到1.6%。 (2)诚实度大幅提高,欺骗率降到2.1% (3)安全机制新模式。对于制造火药、病毒等问题,拒绝回答并给出原因。 #人工智能 #实用好物 #ai#OPENAI @哇喔 @科技日报 @四川观察 @科技公元 @混知 @九派新闻
00:00 / 00:42
连播
清屏
智能
倍速
点赞2
00:00 / 04:33
连播
清屏
智能
倍速
点赞31
00:00 / 06:48
连播
清屏
智能
倍速
点赞NaN
00:00 / 00:06
连播
清屏
智能
倍速
点赞35
00:00 / 00:56
连播
清屏
智能
倍速
点赞4
00:00 / 02:46
连播
清屏
智能
倍速
点赞459