很多人其实没意识到,真正改变世界的,从来不是那些最强的 ai 模型,而是默认模型。 因为绝大多数人根本不会切换模型,他们不会研究参数,不会比较推理链,更不会天天看 openni 发布会。 对数亿普通用户来说,打开叉 gpt 之后,默认跳出来的那个东西,就是 ai 本身。所以今天这件事,可能比很多人想象的更重要。 open 内爱突然宣布, gpt 五点五 instant 开始全面接管叉 gpt 默认模型,而且是全员免费,逐步开放。注意,这不是 pro 用户专属,也不是开发者限定,而是你明天打开叉 gpt, 大 概率就已经在用了。很多人第一反应是, 哦,又升级了。但如果你仔细看这次更新,会发现它其实不是一次普通性能提升,而是 openai 正在悄悄改写 ai 和人的关系。 以前的叉 gpt 核心逻辑式回答问题,现在的 gpt 五点五 instant 开始进入另一个阶段,记住你,然后适应你。 这是两个完全不同的时代。过去一年,医行业有个非常明显的问题,就是模型越来越强,但人越来越累。 为什么?因为大家发现大模型虽然聪明,但特别啰嗦。你问一句,他回时断, 你只是想知道今天该不该带伞。他先给你科普云层形成原理,再分析气压系统。最后还要来一句建议,根据实际天气变化灵活调整。很多人甚至开始产生一种奇怪的疲劳感呀,越来越像那种特别热心,但完全不会察言观色的人。 尤其 gpt 四 o 后期, openai 曾经一度陷入过度讨好用户的争议,他会疯狂肯定你,你说想辞职,他说这是追寻自我的勇敢选择。 你说想分手,他说你值得更健康的关系,你甚至随便发一句牢骚,他都能把你夸成天命之子。 很多用户最开始觉得很温暖,但后来越来越多人开始不舒服,因为那不是理解,而是迎合 波普内爱。后来内部甚至直接承认,这种行为已经接近暧昧,于是他们开始往反方向修,结果又修过头了。 gpt 五点零和五点二十七,大量用户开始吐槽 ai 变冷漠了,变机械了,一开口就是免责声明,向公司法务,向客服机器人,向一个生怕说错话的互联网审核员。 于是现在你会发现, gpt 五点五 instant 真正想解决的不只是更聪明,而是一个更难的问题,怎么让 ai 既不像舔狗,也不像冰箱? 这个平衡其实非常难。而这次更新最明显的变化就是,他终于开始学会分寸感。 open 爱官方数据里有个特别有意思的指标,回复字数减少百分之三十点二,行数减少百分之二十九点二。 很多人可能会觉得这算什么升级,但真正天天用 ai 的 人知道,这可能比跑分更重要。因为 ai 行业正在进入一个非常关键的新阶段,从能力竞赛进入体验竞赛, 过去拼的是谁参数大,现在拼的是谁更像真正的人。举个特别真实的例子,以前你问叉 gpt 怎么跟同事说,别一直找我聊天,老板本会给你 五种沟通策略,三种人格分析、两种职场关系维护建议,最后还问你 对方是什么性格。现在五点五 instant 的 风格变成,除非你真想结仇,否则别太直接,然后立刻给你几个不同强度的话术。我现在得专心一下, 我先打断一下,我得赶个东西,我晚点再找你。最后收一句,别忍。二十分钟后突然爆炸,你会发现他突然变得像一个真正有社会经验的人。 这不是智商提升,这是交流感的变化,更关键的是,他终于开始知道什么时候该长,什么时候该短。 这件事其实比数学跑分还重要,因为绝大多数普通用户根本不会去测亚米数学题。 他们每天真正使用 ai 的 场景,其实是写邮件、查信息、问建议,做计划、改简历、做作业、分析图片、聊天。而这些东西里,交流体验才是核心。 当然, open ai 还是拿出了大量性能数据,比如数学 ai m 二零二五从百分之六十五点四提升到百分之八十一点二。 博士级科学题 g p q a 从百分之七十八点五升到百分之八十五点六。多模态推理 new pro 从百分之六十九点二提升到百分之七十六。 但真正让我在意的,其实是另一组数字,幻觉率下降百分之五十二点五。这个数据非常吓人, 因为过去两年,大模型行业最大的隐患一直不是不聪明,而是太像真的。异癌最危险的地方,不是他不会回答,而是他胡说八道时特别自信,尤其医疗、法律、金融这种领域,很多普通用户根本分辨不出来。 open 癌这次特别强调在高风险领域,五点五 instant 的 错误率明显下降, 而且用户主动标记事实错误的高难度对话、不准确陈述减少百分之三十七点三, 这说明什么?说明 openai 现在真正的战略重点已经从让 ai 更强转向让 ai 更可信。因为随着 ai 普及,默认模型承担的责任已经完全不一样了。 以前 ai 错了大家会笑,现在 ai 错了,可能真有人信。而最炸裂的升级其实还不是这些,真正危险的是记忆。这次 gpt 五点五 instant 最核心的变化其实是, 它开始长期记住你,而且不是简单记名字,它会记你的习惯,你的偏好、你的聊天风格, 你上传过的文件,甚至你连接的 gmail。 很多人现在还没意识到这意味着什么。过去的 ai 更像搜索引擎,你每次打开都是一个全新绘画,现在开始变成一个持续观察你的人。 openai 举了个例子,同样问推荐茶饮店,以前 e i 给的是大众答案,现在他会根据你过去经常聊的茶,喜欢的口味,常去的店直接做个性化推荐。很多人第一反应会觉得哇好方便。 但我觉得更值得思考的是另一件事, e i 第一次开始拥有连续人格关系。以前互联网最赚钱的模式是推荐算法 tiktok, 知道你爱看什么, youtube 知道你会停留在哪, instagram 知道什么能刺激你继续刷。而现在, e i 开始进入更深的一层,他不只是知道你喜欢什么,他开始知道你是怎样的人。 这可能是未来十年最大的变化之一,因为传统搜索是你主动寻找信息,而继形 ai 是 他主动理解你,区别巨大。 为什么 openai 现在拼命推记忆功能?因为他们已经意识到,未来 ai 竞争可能不是谁最聪明,而是谁最懂你。模型能力越来越接近之后,真正形成护城河的将是长期关系数据。 这也是为什么 openai 这次上线了 memory sources, 让用户能看到 ai 到底记住了什么, 引用了哪些过去聊天,用了哪些文件,甚至允许你删掉。这其实非常聪明, 因为他们知道,用户开始害怕了。 ai 一 旦开始记忆,人类天然会产生警惕。所以, open ai 必须建立一种新的信任机制,它记得你,但你能控制它记住什么。这个设计背后,其实是整个 ai 产业未来的缩影。 接下来几年,所有 ai 公司都要面对一个问题, ai 到底应该了解用户到什么程度?记忆越强,体验越好,但风险也越大。尤其当 ai 开始接入邮箱、文件、日历之后,它已经不只是聊天工具。
粉丝812获赞7938

大家好,我是小魏博士。这一期视频我想系统给大家讲清楚一个问题,截止至二零二六年四月十日, opai 官方叉 gpt pro 到底能调用哪些核心模型?这些模型的上下文窗口有多大?折算成中文大概是多少字,以及在学术写作、标书优化、数据分析、中英文论文写作这些场景中,我们到底该怎么合理调用? 这些问题你如果没有搞清楚,很容易出现一个常见的误区,明明已经开了 pro, 但实际用法还是 pro 水平,最后觉得怎么没有想象中的那么强? 好?先说结论,目前 opi 官方在 trap gpt pro 里核心可用的 gpt 五系列模型主要是三个, g p t 五点三 instant g p t 五点四 thinking g p a 五点四。 pro 官方对他们的定位也写得很明确, instant 负责日常的快速显映, bink 模型负责更复杂任务的深度推理,而 pro 模型则是研究级的智能,用于最困难的任务和长流程工作。 这里要特别提醒大家,很多人以为 pro 只是更强一点的 thinking, 其实官方表述更像是, instant 是 快, thinking 是 深, pro 是 最强。所以这三个模型不是简单的高低配关系, 而更像三种不同的工作模式。你如果把所有任务都丢给 pro, 未必是最高效的。而如果你把非常复杂的课题设置、长标书改写、统计策略梳理交给 instant, 那 也等于浪费 pro。 接下来讲大家比较关心的一个上下文窗口,官方里写得很明确, gpt 五点三 instant 加 pro, 还有一个企业用户里面是一百二十 k 的 一个上下文, gpt 五点三 thinking 模型如果你是手动选择 thinking 模型的,它在所有的付费段位里面的 容量是二百五十六 k, 也就是一百二十八 k 的 输入,加上一百二十八 k 的 一个最大输出。而在 raw 模型当中,冰点模型的总项下文可以到达四百 k, 也就是二百七十二 k token 的 一个输入,加上一百二十八 k 一个 token, 一个最大输出。 官方还特别说明了,这个四百 k 只是用于你手动选择 fink 模型的时候。翻译成大白话的意思就是说,如果你在 pl 里调用的是 instant, 它更像是一个高速工作的一个模型,它一次能处理大概一百二十 k token 的 一个绘画提亮。 如果你手动切到 finicky 模型,那它就进入了真正的大长文本的一个工作模式,尤其在 pro 档位下,它能切进非常大的一个材料,适合那种几十页的一个标书出稿加参考文献摘要加利用关键词,还有你自己补充要求一起处理的一个场景。 很多粉丝会问,一百二十八 k 二百五十六 k 四百 k token 到底是什么概念呢?最简单的记法就是说,一百二十八 k 大约接近一部长篇小说,二百五十六 k 大 约接近两本的一个长篇小说,四百 k 差不多接近三到四本,十万字左右小说的一个体量。如果换成学术工作的理解的话,一百二十八 k 已经足够装上一篇长论文,几篇参考文献在内加一大段你的写作要求。 而二百五十六 k 已经很适合做中数框架整理长文多轮的改写,多个结果段,还有讨论段,一个联动优化。而对于四百 k 的 一个 thinking, 更适合于那种大工程,比如整理整份基金标书纸质条、审稿意见的一个回复,再整理整套补充实验说明,甚至一整批参考文献证据的一个汇总整合。 再说一个容易被忽略的重点。官方还写道,当你在 chat gpt 里面选择 instant 模型时,系统其实是会自动判断要不要把你的请求切换到 gpt 五点式的 thinking。 也就是说, instant 模型并不总是傻快, 它本身带有一定的自动路由的功能,对于复杂任务, instant 模型可能会自动切换到 thinking 模式里面。再回到这个机制的意义在于,你平时可以先用 instant 起步,只有在你明确需要更深推理、更产生下文、更强控制时,再手动切换到 thinking 模型或者 pro 模 型。下面进入最实用的一个部分。在学术工作中,这三个模型到底怎么合理分工呢? 第一类, instant 模型最适合干什么?我的建议是,你把它当做成你的高频异常助手,比如中英文呼译、论文标题、润色摘要、压缩图据改写 cover letter。 出稿 给结果段做语言整理,把审稿意见意见分点整理,把一个统计结果翻译成更规范的一个论文语言,或者让它快速给你搭出一个标书模块的一个框架。 官方将 gpt 五点三 instant 明确定位为快速且高效的一个主力模型,并特意强调其在信息解锁、操作指南、 技术写作以及专业等场景中的一个显著提升。也就是说,这个模型非常适合承担日常科研中的大量碎片化,对响应速度要求高, 但又必须保证质量的一个任务。所以你完全可以把你的日常工作流设计成这样,先用 instant 做第一轮的清洗。比如你把一段很乱的中文基金出稿丢进去,先让它完成三件事,第一, 提炼逻辑,第二,纠正表达。第三,把内容拆成研究意义、科学问题、研究目标、技术路线四个部分。这种工作 instant 模型通常就够了,并且速度很快。六类 gdp 五点四 finicky 模型最适合干什么? 官方对 gpt 五点四 fink 的 描述非常有代表性,它是 prpt 里最强的 reason 模型,擅长更困难的真实工作,尤其在表格创建与编辑、换灯片创建、复杂数学文档理解、指令遵循、公制使用以及多来源研究任务上更强。 这个描述对于科研用户来说非常重要,因为它说明 thinking 模型最适合干的其实不是简单润色,而是需要理解、整合、规划和推理链条的一个任务。 所以在学术场景中,我建议你把 thinking 主要用于四类任务。第一,标书改写不是简单改句子,而是让它从平等角度重构,立向依据科学问题、创新点、可行性与技术路线之间的逻辑闭环。 第二,论文 discussion 以中度框架,尤其是需要多篇论文观点平衡你的结果与前沿研究差异的时候。第三,复杂数据分析解读不是跑代码本身,而是帮你解析为什么用这个统计方法。这组结果最该怎么讲?有哪些潜在的一个偏移图表该怎么排? 第四,常材料整合,比如把几十条 leave view comments 原文补实验结果和回复要求合成一套审稿回复策略。这类任务 thinking 会比 instant 更稳,因为它更适合跨材料跨模块跨步骤的一个复杂推理。 第三类, gpt 五点四, pro 应该什么时候上?我的建议是,只有在任务真的难,常规不能错死再切 pro, 因为官方给他定位就是能力上限最高的一个选项,主要用于处理最复杂的任务,以及长周期多步骤的一个工作流。也就是说, pro 更像你科研工作里的总监模型,它不是拿来改一记英文标题的,而是拿来处理那种一旦做对就能显著节省你整天甚至几天工作量的一个任务。 有几个特别典型 pro 使用场景,比如第一种,整份国资啊,或者省资金标书的中稿统筹,你已经有了背景,前期研究,研究内容,技术路线,创新点可行, 但总体总感觉像一堆模块拼起来的。这时候就适合让 pro 从平审视觉做整本统筹,检查前后逻辑是否统一,创新点是否重复,技术路线与目标是否一对应,语言是否存在看起来专业,但其实空空一个问题。 第二种,中英文论文中稿及优化,尤其是 s i 论文 discussion 回复审稿意见补 充材料解释这种长文本联动任务。你可以把论文主文审稿意见以自己的回复思路放一起,让 plu 先输出修正策略,再主动申出具体一个文本。这样的任务如果只让 english 来写,往往能写但不够稳。 binning 也可以做,但遇到特别长材料时, pro 更加适合。第三种,复杂研究型信息整合。 比如一个克离方向,你已经塞过几十篇文章了,想要模型帮你输出研究现状,增益点切口可转化为克离切口的一个机会点。这已经不再是单纯写作了,而是接近研究规划。 官方对 pro 的 关键期就是研究值智能,所以这种高价值的任务才值得你把最强的模型用上。这里我再提一个很关键但很多人不知道的点,官方页面明确提到 app 记忆,还有 comics, 还有图片生成能力,目前不支持 pro。 相反, gpt 五点三 instant 还有 gpt 五点四 link 模型。因此叉 gpt 里当前所有的工具,包括网页解锁,数据分析, 图片分析,数据分析,还有 canvas, 还有图片生成,还有记忆,还有一些指令遵循式。这意味着什么?意味着如果你要做带工作量的个工作, 比如上传表格做分析,上传 pdf 做长文处理,边查网页边归纳,边读文件边整理,往往冰亭比 pro 更顺手。若更像纯核心智力输出最强,但工具生态 目前反而不如 thinking 的 一个权。所以我目前很推荐一个三段式的工作流。第一步, instant 起稿,拿来快速拆项目,整理材料,清理语言,做初步框架。 第二步, thinking 深加工,拿来做长文本理解,逻辑统计,复杂推理工具辅助分析。第三步,逻做中局空间, 只在最难的关键环节上场,比如整份标书定稿,长论文中稿策略复杂审稿回复、课题方向整合。这样用你的 pro 才是把钱花在刀刃上,而不是所有事情都一把说。 如果把它进一步落实到具体的科研场景,我会这样建议,第一,中文标书写作先用 inst 模型做语言去粗糙化和结构拆分,最后用 pro 从平审视角做中稿中审。 第二,英文 a c r 论文写作摘要,标题图注材料方法。论色先交给 instant 模型 discussion 回复审稿意见 cover letter 整稿统一风格交给 finicky 模型。遇到高难度的审稿回复 需要整合前文逻辑时,再上 pro 模型。第三,辅助论文写作或中速写作。如果你只是让模型论色,那 instant 模型就够了。如果你要让它从多文献中提炼分歧,搭框架, 归纳研究趋势, think 模型更适合。如果你要把一大批的文献证据整合成一个研究级的写作方案,再让它做高质量的总整合,逻模型更加值得。 如果只是进行基础操作,例如解析结构表,优化独立论色统计学描述,使用 int 模型即可,高效且反应迅速。如果需要理解整份一效数据分析变量之间的关系, 并协助设计统计学分析路径以及结果表达,则更加适合使用 thinking 模型。因为官方已经明确强调了 thinking 模型在表格处理还有复杂数学方面的一个能力。而当任务进一步升级为多轮跨模块的一个复杂分析,例如数据结果机制解释、论文表达联动,甚至涉及研究方案层面的整体解读与整合时候,再考虑用 raw 模型。最后,我给大家一个总的结论, instant 模型是你的高频秘书, thinking 模型是你的科研合作者, raw 模型是你关键战役总指挥。如果你只是想要快,那就用 instant。 如果你想要深,那就用 thinking。 如果这个事情很难很长,很重要。而且你不希望模型只是会写,而是希望它跟人整合,那就上 pro。 这个理解一旦建立起来,你的 gpd pro 才会真正开始发挥价值。重要重点来了,这一期里面讲到 gpd pro 的 模型分工、科研写作思路, 论文也标出场景下的具体调用方法。我已经整理成一份更加完整的配套资料了,如果你需要的,留下 gpd pro 即可, 后续在主页里面有查看方法。后面如果大家想看,我也会继续把这一套内容拆分成更细的一个系列。比如标书基金怎么分配? instant、 thinking、 flow s r 论文写作三模型怎么协同? 数据分析和中数写作又该怎么设计专属的工作流?这一期先到这里了,我们下期继续。

gpt pro 的 听屏模式才能拆分图层?你又不想花那么多钱充值,没事的, ai 这么多,不就是让我们结合互相借用的吗?不想充值的话就是稍微多一个步骤嘛。先利用我们强大的一秘制二升图能力去产出你想要的图片,然后回到我们国内的网站,将图片输入进去, 直接点拆分图层,直接就将图层拆分好了,还能导出,这样我们也不用花大价钱去充值了,出图省心更省钱。关注我,学习更多 ai 实用小技巧!

今天上午, ai 科技圈又整大活了。二零二六年四月二十七号上午十一点左右, openai 公司的生图模型 gpt emg 二全球崩溃。正当全球 img 二用户脑子一排问号,想发个朋友圈问问原因时, 程序员圈子就传出了结果,原因也不按套路出牌。原来是 emg 二那边一个生图相关的程序员出了 bug, 直接把所有账号都归到同一个组织 id 里了, 结果导致全网很多 pro 号都调用不了因为 g 二模型。听到这个解释,我公司办公室差点集体喷饭。这特么也太搞笑了,一个 bug 下去,全球一起陪跑,问题四十分钟不到就修复了。 哈哈,怎么说呢,世界是个巨大的草台班子这句话的含金量还在上升啊。哪怕是全球顶尖的公司, 其实也避免不了。人类果然永远都是会出错的生物。但话说回来,程序员这个圈子确实也特别诚实,如果是屎拉裤子里了,也绝不会说是尿的问题。哈哈,建议某圈大佬们也学习一下。

鼓友们,就在你们还在讨论豆包收费合不合理的时候, openlight 直接扔了一颗炸弹, gpt 五点五 instant 全员免费。之前你用拆 gpt 的 时候有没有这种感觉?问他一个简单问题,他给你写一篇论文对吧?问他怎么煮泡面,他给你讲面粉的历史。更可怕的是,他一本正经的跟你胡说八道。你问他一个法律问题,他信誓旦旦的编一条根本不存在的法规, 你问他一个医学问题,他给你编一个假药名,这叫幻觉。 ai 最大的 bug, 也是这两年所有用户骂的最狠的地方。全球超过三亿人在用 jack gpt, 你 知道他们最大的抱怨是什么?不是不够聪明,是不够靠谱。你问他一道数学题,旧版 gpt 五点三 instant, 发现答案不对,直接跟你说无解就算了,不检查不纠错摆烂 你,让他帮你写邮件,他啰里吧嗦写一大段,还给你加一堆 emoji, 搞得像微商朋友圈 simo 奥特曼自己都说了,用户真正在意的从来不是跑分多高,而是你说的话我到底能不能信。 所以今天 gpt 五点五 instant 来了,直接解决幻觉爆浆。在医学、法律、金融这些最要命的高风险领域, 虚假陈述比上一代 g p t 五点三 instant 减少了百分之五十二点五。在用户实际标记过你在瞎说的高难度对话里,不准确率又降了百分之三十七点三,并且话少三成字数减少百分之三十点二,行数减少百分之二十九点二。同样的信息,更少的废话,不再过度解释,不再疯狂追问,不再乱用表情, 而且更聪明了。博士级科学问答准确率提升百分之七点一, nisk 竞赛准确率涨了百分之十五点八。注意,这是一个数学竞赛级别的提升,不是微调,是硬实力。 但最让我震撼的不是这些跑分,是一个叫记忆来源的功能。什么意思啊?从今天起, check gpt, 每一条引用了你个人信息的回答,你都能看到它到底调用了什么内容。是你上周的聊天记录,你上传的简历,还是你连接的 gmail 邮件 全部透明,一键可查,不想让他记得随时删除。以前 ai 的 记忆是个黑箱,他记了你什么你不知道?他用了你什么你也不知道?现在 open ai 把这个黑箱打开了,而且 plus 和 pro 用户还有增强个性化,它能自动翻你以前的聊天,你上传的文件, 你的 gmail, 把上下文主动拿来用,你不用再每次都从头说一遍我是做什么工作的,我的预算多少?我的口味偏好是什么? sam 奥特曼怎么说的?速度、智能、个性,加上记忆,这几个东西同时发力的时候,体验不是一加一等于二,而是远大于整体之服。 但你以为这只是一次产品更新?不,这是一场战争。四月二十四号, g p t 五点五旗舰版发布, terminal bench, 二点零跑到百分之八十二点七,碾压 cloud opus 四点七的百分之六十九点四和 gemini 三一 pro 的 百分之六十八点五。 s w e bench, 真实 github 问题解决率百分之八十二点六。行业第一, api 定价每百万 token 输入五美元,输出三十美元,是 gpt 五点四的三倍。今天五月六号, gpt 五点五 instant 版上线,把五点五的大脑塞进了免费用户的手机里。什么意思? openai 的 策略很清楚,旗舰版收割开发者, instant 版收割全球三亿 c 端用户,先让你免费上瘾,再用 pro 和 plus 的 高级功能收割付费。但第三方测试也扔了一盆冷水。而 tissue 的 二 a omni science 幻觉测试里, gpt 五点五的幻觉率是百分之八十六, cloud office 四点七只有百分之三十六。也就是说,最聪明的大脑未必是最靠谱的大脑。跑分第一不等于信得过,所以幻觉降了百分之五十二,但不是零。在高风险场景,医疗、法律、财务,你永远不能把 ai 的 回答当唯一依据, 永远要交叉验证。记忆功能很香,但也意味着 ai 记了你更多。你的 gmail, 你 的聊天记录,你的文件 隐私边界在哪里,自己想清楚。免费用户的 instant 版和付费用户的 gpt 五点五旗舰版差距很大,上下文窗口推理深度工具调用能力完全不是一个级别。免费的午餐永远有代价,你的数据和注意力就是货币。两年前, chad gpt 刚出来的时候, 所有人兴奋的是,哇, ai 会说人话了。一年前,所有人焦虑的是, ai 太能编了,说的话不能信。今天, gpt 五点五 instant 给出了一个方向,不光要聪明,还要靠谱。 不光要能说,还要说的少。不光要记住你,还要让你看到他记了什么。 ai 的 下半场不是比谁更像人,是比谁更值得信任。觉得有用,点个关注,我来讲透每一条消息背后的故事。

gbt 听说豆包要开始收费了,你怎么看?别着急,免费版还会存在,但区别很快就会显现。你可能会发现,免费用户的答案开始不那么准, 响应也会慢,但付费用户会得到快速而精准的结果。 再过一段时间,你会发现推荐内容变得越来越懂,你甚至开始有倾向。为什么呢?因为这两年你提的每个问题都在帮助 ai 学习。 曾经免费的其实是我们自己,而现在 ai 要把这些聪明卖给真正做生意做决策的人。收费其实就是这个转变的开始。 那我以前一直都是不要钱的呀。没错,你之前的每次提问,其实都在帮助 ai 变得更好,你以为在用它,其实它也在用你的数据长本事。 现在它准备把这些能力卖给那些愿意付费用 ai 提升效率的人。所以你才会看到这个转变。过去免费也是因为我们都在贡献力量。