00:00 / 00:50
连播
清屏
智能
倍速
点赞780
00:00 / 11:11
连播
清屏
智能
倍速
点赞57
Qiuming3天前
硅谷一夜双响!GPT-5.3-Codex vs Claude 硅谷一夜双响!GPT-5.3-Codex 紧急对阵 Claude 4.6,编程AI战火升级 硅谷经历了一个不眠之夜,OpenAI与Anthropic在几小时内相继发布重磅编程AI模型,拉开了AI王座争夺战的新序幕。 事件始于Anthropic毫无征兆地深夜发布Claude Opus 4.6。约半小时后,OpenAI的萨姆·奥特曼紧急回应,仓促推出GPT-5.3-Codex,将AI竞争推向白热化。 OpenAI此次发布的并非通用版GPT-5.3,而是专注于编程的智能体模型GPT-5.3-Codex。它融合了GPT-5.2-Codex顶尖的编程能力与GPT-5.2卓越的推理能力,运行速度提升25%。该模型在评估现实世界软件工程的SWE-Bench Pro评测中创下行业新高,并在Terminal-Bench 2.0中表现远超此前最佳模型。 其核心突破在于能够驾驭涉及深度研究、工具调用和复杂执行的“长程任务”。它像一位并肩作战的同事,允许用户实时引导和交互,且不丢失上下文。演示中,它能从零开始构建功能复杂的赛车游戏、潜水游戏等,并自主进行迭代。 不仅如此,GPT-5.3-Codex在衡量专业知识工作的GDPval中与GPT-5.2持平,在计算机操作基准OSWorld上也表现优异,标志着其正朝着适用于全方位技术工作的“通用智能体”迈进。 该模型现已加入ChatGPT付费计划,覆盖所有Codex应用场景。有趣的是,OpenAI内部已开启“自我进化”:利用GPT-5.3-Codex的早期版本帮助训练、部署和优化其正式版,极大加速了研发流程。此次发布意味着Codex的角色发生质变,从一个编程工具进化为能操作计算机、端到端完成工作的“全能协作者”,重新定义了AI生产力的边界。 https://openai.com/index/introducing-gpt-5-3-codex/ https://x.com/OpenAI/status/2019474152743223477 https://x.com/sama/status/2019474754529321247
00:00 / 03:01
连播
清屏
智能
倍速
点赞0
00:00 / 06:22
连播
清屏
智能
倍速
点赞98
00:00 / 01:36
连播
清屏
智能
倍速
点赞28
00:00 / 01:21
连播
清屏
智能
倍速
点赞2
OpenAI工作文化揭秘:7周上线Codex,晋升靠实力 今天我们来深入聊聊一个大家非常好奇的话题:在OpenAI工作,到底是一种什么样的体验? 最近的市场分析和一些内部观察,为我们揭开了这家顶尖AI公司的神秘面纱。 首先,最令人震惊的是它的增长速度。在短短一年内,公司规模从一千人扩张到超过三千人。这种爆炸式增长,必然带来了组织和沟通上的挑战。一个非常有趣的特点是,这家公司几乎没有邮件文化。内部沟通和决策,几乎完全依赖于即时通讯工具。如果你不能有效管理信息流,会感到巨大的压力,但如果运用得当,效率则会极高。 更核心的是它的“自下而上”和“行动优先”的文化。在这里,好的想法可以来自任何角落,不需要层层审批。只要你的点子有潜力,团队很快就会自发形成并开始执行。晋升和影响力,靠的不是演讲或办公室政治,而是实实在在的成果和能力。许多技术领导者可能不善言辞,但这并不重要,因为在这里,能解决问题的想法才是王道。 这种文化最极致的体现,就是其一个核心编码助手产品的开发过程。一个由工程师、研究员和设计师组成的小团队,从敲下第一行代码到产品正式发布,只用了短短七周时间。这意味着团队成员每天都要工作到深夜,甚至周末也全力以赴。在一个三千人的公司里,能保持如此惊人的启动速度和执行力,这在业界是极为罕见的。这背后,是公司领导层的高度投入和扁平化管理,高管们会直接在工作群里参与讨论,而不是当甩手掌柜。 当然,快速扩张也带来了工程上的挑战。公司的技术栈以一个巨大的Python单体代码库为核心,虽然灵活,但也因为贡献者背景各异,导致代码风格五花八门。他们全面依赖一家主流云服务平台,但由于该平台在某些高级功能上有所欠缺,工程团队不得不自研大量基础设施,其风格深受一家社交媒体巨头的工程文化影响。 最后,从战略层面看,OpenAI的决策调整非常迅速,一旦有新的信息出现,就会立刻转向,不死守旧计划。同时,由于身处全球科技竞赛的中心,公司对保密性的要求极高。一个值得注意的现象是,公司非常关注外界,尤其是社交平台上的讨论氛围,很多热门话题都会在内部引发关注。 而在AI安全问题上,公司投入了远超外界想象的资源,致力于解决仇恨言论、信息滥用等现实世界中的风险。总而言之,在OpenAI工作,意味着身处一个高速、高压、精英驱动且略带混乱的环境。它既有研究实验室的探索精神,又有顶级消费级产品公司的巨大影响力。 #openai #科技公司
00:00 / 02:55
连播
清屏
智能
倍速
点赞5
00:00 / 05:35
连播
清屏
智能
倍速
点赞3
OpenAI Codex APP 使用方法和技巧 OpenAI 开发体验部门负责人 Romain Huet,分享了一些使用 Codex APP 的方法和技巧。 在 Codex 里,你可以同时管理多个项目,也可以让多个智能体并行工作。每个任务都有清晰的状态,有的在运行,有的已经完成。对开发者来说,这意味着可以把一些耗时但明确的工作直接交给它,比如加新功能、更新依赖、迁移技术栈,而自己只需要在合适的时候查看进度和结果。 和传统写代码的方式不同,你不一定非要敲键盘,可以直接用语音描述想法。比如给一个正在开发的 iOS 应用增加一个展示 NASA 每日天文图片的页面,Codex 会自己去找合适的 API,生成代码,并把整个过程拆成可查看的步骤。任务完成后,你可以直接看代码差异,在行内给反馈,要求它继续调整,或者确认没问题后合并。必要的话,也可以一键在 Xcode 里打开,或者直接运行应用。 Codex 也适合处理长时间的任务。有些操作可能要跑几分钟甚至几小时,尤其是在大型代码库中。你不需要一直盯着,它会在后台执行,你只要在完成时回来查看。这种方式更接近带着一支团队工作,而不是一个人盯着编辑器。 对于偏视觉的工作,Codex 提供了更灵活的交互方式。你可以把对话窗口弹出来,让它跟着你在界面中移动,一边看效果一边口述修改需求,比如给网页里的进度条加动画,几秒后就能看到变化。这种即时反馈让协作感更强。 Codex APP 同样支持技能。技能可以把你常用的工具和团队约定封装起来,让 Codex 直接使用。比如通过 Figma 技能,它不是看截图来猜界面,而是直接读取设计文件的结构,包括间距、字体和变量,然后生成符合设计系统的真实代码。这也解释了为什么生成的界面和设计稿匹配度很高。你也可以为自己的团队创建定制技能,让它更贴合实际工作流程。 在此基础上,Codex 还支持自动化。你可以把技能变成定时运行的任务,比如定期整理来自 Sentry 的警告,或者处理 Linear 里的缺陷和工单。这些事情在后台完成,你可以把更多精力放在真正需要判断和创造的部分。 Codex 还引入了工作树的概念,为每个智能体提供独立的代码副本,减少冲突的风险。如果你愿意,也可以把任务直接交给云端的 Codex,用的还是同一套界面。 #AI技术 #CodexAPP #OpenAI #人工智能
00:00 / 04:21
连播
清屏
智能
倍速
点赞27
00:00 / 01:32
连播
清屏
智能
倍速
点赞18