从逻辑到美学:Gemini 3.1 Pro 深度评测 2月19日,谷歌带来了核心模型的重量级升级——Gemini 3.1 Pro。 在基准测试 ARC-AGI-2 中,Gemini 3.1 Pro 拿下了 77.1% 的高分。这意味着什么?它的推理性能是前代 3 Pro 的两倍多。它不再是单纯地模仿人类,而是真正开始理解未曾见过的逻辑。 Gemini 3.1 Pro 最迷人的地方在于它能将“复杂系统”转化为“优雅设计”。对于开发者来说,它能精准弥合复杂 API 与用户界面之间的那道裂痕,让技术不再冰冷,而是充满交互的美感。 如果你热爱文学,也热爱编程,你会爱上它的创意编码能力。 给它一段文学文本,它不仅仅能写总结,更能读懂小说阴郁、深邃的基调,并据此直接编写出一套现代感十足、完美捕捉主角灵魂的个人作品集界面。 更进一步,它能帮你构建“沉浸式原型”。比如一个 3D 的椋鸟飞舞场景,不仅有视觉代码,它甚至能为你写出结合手部追踪的操控逻辑。 目前 Gemini 3.1 Pro 已开启预览。 • 开发者可以在 Google AI Studio 或 Antigravity 平台抢先体验; • 而我们普通用户,在 Gemini 应用中,以及大家非常喜爱的 NotebookLM 里的 Pro/Ultra 频道,都能见到它的身影。 • 国内用户也可以在PH8来体验Gemini 3.1 Pro 最后我想说,面对汹涌的 AI 浪潮,有些同学可能会感到焦虑。 回看计算机发展史,从汇编到高级语言,从物理机到云原生,工具层一直在变,但解决问题的底层逻辑、系统的架构思维、以及对业务痛点的精准洞察,这些核心能力从未过时。AI 只是帮我们把那层厚重的‘搬砖活’剥离了,让我们能像架构师一样去思考。把 AI 当成你的助理,你负责定义方向,它负责冲锋陷阵。只要你解决问题的能力还在,你就不会在这个浪潮中被淹没。你是如何认为的呢? #Gemini3 #GoogleAI #LLM #AI模型 #gemini
00:00 / 02:36
连播
清屏
智能
倍速
点赞43
00:00 / 01:48
连播
清屏
智能
倍速
点赞4
今天我们聊聊 谷歌Gemini3 Deep Think模式 谷歌在2月13日凌晨推出了一个超级厉害的AI模型新版本,叫Gemini 3 “Deep Think”(深度思考模式)升级成了一个“科研级大脑”,专门解决那些连人都觉得头疼的复杂科学和工程问题。 1. 成绩单有多吓人? 它在几个公认最难的测试里,分数高得离谱: 在最考验抽象推理的ARC-AGI-2测试中,拿了84.6%(普通人平均才60%左右)。 在最硬核的编程竞赛平台Codeforces上,拿到了3455分,这个分数已经是传说级别,全球排名能排进人类前十。 在2025年国际物理、化学、数学奥林匹克竞赛的笔试试卷上,表现都达到了金牌水平。 这个成绩把同行(比如Anthropic的Claude Opus 4.6和OpenAI的GPT-5.2)都甩开了。 2. 能干啥?不止是考试 谷歌的野心不是拿高分,而是让AI真正走进实验室和科研一线,比如: 审论文:帮数学家审阅高度专业的论文,甚至发现了人类评审都没看出的逻辑漏洞。 搞材料研发:帮杜克大学的实验室设计新型半导体材料,优化复杂的生产工艺。 当工程师:工程师画个草图,它能直接分析建模,生成可以拿去3D打印的精确文件。 3. 这意味着什么? 这标志着一个重要的转变:AI正从一个“聊天机器人”变成一个“研究工具和深度思考搭档”。谷歌已经把这个最强推理能力开放给研究者和企业使用了。 4. 离“通用人工智能”(AGI)还有多远? ARC-AGI测试的创始人说了,就算AI通过了这个测试,也不等于实现了AGI。他给AGI下了一个很实在的定义:当我们再也想不出“普通人能做,但AI做不到”的任务时,才算真正的AGI。按照这个标准,虽然Gemini在个体能力上已经超过了普通人类平均水平,但离真正的AGI还有距离。 总结:谷歌这次是押注“AI for Science”(AI助力科研)。未来几年,AI可能不再是仅仅帮你写邮件、编代码,而是会和科学家、工程师并肩作战,共同推动科学发现的边界。一个永不疲倦、能力超强的“AI研究员”或“AI工程师”,已经触手可及了。
00:00 / 10:14
连播
清屏
智能
倍速
点赞27
详细聊Gemini 3 “Deep Think” 推理模式 谷歌在2月13日发布了其AI模型 Gemini 3 “Deep Think” 推理模式的一个重磅升级。这个新模式不再只是聊天工具,而是定位为一个“超级科学家大脑”,专门用来攻克最前沿的科学、研究和工程难题。 升级后的模型在多项“高难度考试”中创下新纪录,全面碾压了对手: 它在被称为“人类终极测试”的基准测试中刷新了最佳纪录,在最考验抽象推理能力的 ARC-AGI-2 测试中获得了84.6%的高分。在竞技编程平台 Codeforces 上获得了 3455 的惊人评分。此外,它在 2025年国际数学、物理、化学奥林匹克竞赛 的笔试中都达到了金牌水平。这些成绩均全面超越了竞争对手 Claude Opus 4.6 和 GPT-5.2。 该模型的核心目标是实际应用,已成为科研一线的重要工具: 谷歌强调,Deep Think 旨在真正帮助研究者和工程师解决现实问题。它展现出的能力包括: 自动化设计制造:将一张简单的设计草图,自动分析并生成可直接用于3D打印的复杂三维模型文件。 深度学术审阅:能够识别出高度专业的数学论文中,连人类同行评审都未曾发现的细微逻辑缺陷。 前沿材料研发:例如帮助杜克大学的研究人员优化复杂晶体的生长方法,成功培育出性能指标更优的新型半导体材料薄膜。 此次发布的重要背景是华人科学家的贡献: 值得注意的是,曾获得清华物理系特等奖、并从 Anthropic 加入谷歌 DeepMind 的 姚顺宇(Shunyu Yao) 研究员,参与了这一重要模式的开发工作。 总结来说,Gemini 3 Deep Think 的升级标志着顶级AI模型竞赛正从通用对话能力,转向 “深度专业化” 和 “科研生产力” 的新高地。它不再满足于回答问题和生成内容,而是开始作为专家级的思考伙伴,直接推动科学发现和技术创新的边界。目前该模式优先向 Google AI Ultra 订阅用户及申请获批的研究人员与企业开放。
00:00 / 06:49
连播
清屏
智能
倍速
点赞2
00:00 / 02:08
连播
清屏
智能
倍速
点赞25
00:00 / 04:14
连播
清屏
智能
倍速
点赞3