谷歌Gemini 3深度思考版本,重大升级,悄然降临! #谷歌 #双子座

gemini3为啥没有think了

387
36
139
49
举报
发布时间:2026-02-17 10:57
查看AI文稿
老杜深度学习
老杜深度学习

粉丝10.5万获赞76.7万

相关视频

  • 清华姚顺宇出手!Gemini冲进全球前7,编程圈炸了 清华背景的姚顺宇参与推动,Gemini 3 Deep Think原地进化,Codeforces评分3455,全球仅7人能赢它!ARC-AGI-2直接84.6%封顶,还能审论文、做3D建模、优化材料实验。AI推理能力进入新阶段。
    01:22
    查看AI文稿
  • 谷歌官宣 Gemini 3 Deep Think 的重大升级 1. 定位:不再是“聊天机器人”,而是“科学家”
谷歌这次给 Deep Think 贴的标签极其硬核:专门为科学、研究和工程设计。 
解决“脏活儿”:它强调处理那些没有标准答案、数据混乱且不完整的任务。 
实战案例:文中提到它识别出了人类同行评审都没发现的数学论文逻辑漏洞,还能帮实验室设计半导体材料的配方。 
2. 成绩单:把“刷榜”推向极限
如果你关注 LMSYS Arena 和各种榜单,Deep Think 3 这次给出的数据非常吓人: 
编程(Codeforces):Elo 分数达到 3455。这是一个什么概念?这相当于全球顶尖竞技程序员(特级大师级别)的水平。 
数学(IMO 2025):达到了国际数学奥林匹克金牌水平。 
“人类最后的考试”(Humanity's Last Exam):在不联网、不使用工具的情况下得分 48.4%。这是一个专门为难倒 AI 设计的极端硬核考试,这个分数目前是行业天花板。 
ARC-AGI-2:得分 84.6%。这是衡量 AI 是否具备“类人通用智力(AGI)”的最权威榜单,这个进步跨度极大。 
3. 实战功能:从“想”到“做”的闭环 
这对你关注的 AI 自动化非常重要: 
3D 建模能力:官方演示了它能把一张手绘草图直接变成可打印的 3D 模型文件。它不仅是理解图像,而是能通过代码对物理系统进行建模。 
开放 API 权限:这是第一次,谷歌不仅在 Gemini 应用里开放 Deep Think,还通过 Gemini API 向开发者和企业开放早期访问权限。
#gemini #谷歌 #ai #nanobanana #google
    05:45
    谷歌官宣 Gemini 3 Deep Think 的重大升级 1. 定位:不再是“聊天机器人”,而是“科学家”
    谷歌这次给 Deep Think 贴的标签极其硬核:专门为科学、研究和工程设计。
    解决“脏活儿”:它强调处理那些没有标准答案、数据混乱且不完整的任务。
    实战案例:文中提到它识别出了人类同行评审都没发现的数学论文逻辑漏洞,还能帮实验室设计半导体材料的配方。
    2. 成绩单:把“刷榜”推向极限
    如果你关注 LMSYS Arena 和各种榜单,Deep Think 3 这次给出的数据非常吓人:
    编程(Codeforces):Elo 分数达到 3455。这是一个什么概念?这相当于全球顶尖竞技程序员(特级大师级别)的水平。
    数学(IMO 2025):达到了国际数学奥林匹克金牌水平。
    “人类最后的考试”(Humanity's Last Exam):在不联网、不使用工具的情况下得分 48.4%。这是一个专门为难倒 AI 设计的极端硬核考试,这个分数目前是行业天花板。
    ARC-AGI-2:得分 84.6%。这是衡量 AI 是否具备“类人通用智力(AGI)”的最权威榜单,这个进步跨度极大。
    3. 实战功能:从“想”到“做”的闭环
    这对你关注的 AI 自动化非常重要:
    3D 建模能力:官方演示了它能把一张手绘草图直接变成可打印的 3D 模型文件。它不仅是理解图像,而是能通过代码对物理系统进行建模。
    开放 API 权限:这是第一次,谷歌不仅在 Gemini 应用里开放 Deep Think,还通过 Gemini API 向开发者和企业开放早期访问权限。
    #gemini #谷歌 #ai #nanobanana #google
    查看AI文稿
  • Gemini 3 Deep Think发布后2天,首波3D案例火出圈 STL文件直接3D打印,盘点真硬核案例 超材料设计与3D模拟 #3d打印 #黑科技 #AI #人工智能
    00:44
    查看AI文稿
  • Gemini3 Deep Think 工程建模实测 #Gemini #3d打印
    00:44
    查看AI文稿
  • 全新 Gemini 一夜血洗编程:AI 技术迈入新阶段     2026 年 2 月 13 日,谷歌 DeepMind 正式发布 Gemini 3 Deep Think 版本,在编程、通用推理、成本效率三大维度实现颠覆性突破,被业内称为 “AI 彻底血洗编程圈”,标志人工智能从辅助工具走向独立顶尖智能体。
一、编程能力:达到人类顶级竞赛水平
Gemini 3 在国际顶级编程竞赛平台 Codeforces 达到 3455 Elo 分数,全球排名第 8,仅 7 位人类选手排名更高,超越 99.99% 的人类程序员与竞赛选手。
对比前代模型,GPT-4 早期仅约 392 Elo,GPT-4o 约 808 Elo,前代 o3-preview 约 2727 Elo,Gemini 3 直接跃升 700 分以上,拉开与所有竞品的差距。
在 LeetCode 周赛中,题目通过率超过 85%,动态规划、图论、复杂算法接近人类顶尖选手水平。
在真实软件工程基准 SWE-Bench Verified 上通过率超过 65%,LiveCodeBench 实时编程通过率超过 80%,智能合约 Solidity 开发通过率达到 92%。
二、通用推理:刷新全球最高纪录
在难度极高的 ARC-AGI-2 通用推理任务上,Gemini 3 达到 84.6% 正确率,此前最强模型仅在 60%–70% 区间。
ARC-AGI-1 正确率达到 96%,在无工具辅助的人类终极测试 Humanity’s Last Exam 中达到 48.4%,明显领先 GPT-5.2 的 34.5% 与 Claude Opus 4.6 的 40.0%。
数理化奥赛水平全面达到金牌级别,可独立完成复杂逻辑推导与证明。
三、成本与效率:数量级下降
Gemini 3 将单任务推理成本大幅压低,ARC-AGI-2 单任务成本仅 13.62 美元,ARC-AGI-1 仅 7.17 美元,而前代顶尖模型成本普遍在 2000 到 3000 美元,成本降低 280 到 420 倍。
这让顶级推理能力从实验室奢侈品变成可大规模商用的普惠技术。
四、核心技术突破:Deep Think 深度推理
Gemini 3 采用全新 Deep Think 模式,核心是慢思考、自我修正与多路径并行搜索。
模型在输出前会自主构建多条解题路径,实时验证逻辑一致性
    05:00
    全新 Gemini 一夜血洗编程:AI 技术迈入新阶段 2026 年 2 月 13 日,谷歌 DeepMind 正式发布 Gemini 3 Deep Think 版本,在编程、通用推理、成本效率三大维度实现颠覆性突破,被业内称为 “AI 彻底血洗编程圈”,标志人工智能从辅助工具走向独立顶尖智能体。
    一、编程能力:达到人类顶级竞赛水平
    Gemini 3 在国际顶级编程竞赛平台 Codeforces 达到 3455 Elo 分数,全球排名第 8,仅 7 位人类选手排名更高,超越 99.99% 的人类程序员与竞赛选手。
    对比前代模型,GPT-4 早期仅约 392 Elo,GPT-4o 约 808 Elo,前代 o3-preview 约 2727 Elo,Gemini 3 直接跃升 700 分以上,拉开与所有竞品的差距。
    在 LeetCode 周赛中,题目通过率超过 85%,动态规划、图论、复杂算法接近人类顶尖选手水平。
    在真实软件工程基准 SWE-Bench Verified 上通过率超过 65%,LiveCodeBench 实时编程通过率超过 80%,智能合约 Solidity 开发通过率达到 92%。
    二、通用推理:刷新全球最高纪录
    在难度极高的 ARC-AGI-2 通用推理任务上,Gemini 3 达到 84.6% 正确率,此前最强模型仅在 60%–70% 区间。
    ARC-AGI-1 正确率达到 96%,在无工具辅助的人类终极测试 Humanity’s Last Exam 中达到 48.4%,明显领先 GPT-5.2 的 34.5% 与 Claude Opus 4.6 的 40.0%。
    数理化奥赛水平全面达到金牌级别,可独立完成复杂逻辑推导与证明。
    三、成本与效率:数量级下降
    Gemini 3 将单任务推理成本大幅压低,ARC-AGI-2 单任务成本仅 13.62 美元,ARC-AGI-1 仅 7.17 美元,而前代顶尖模型成本普遍在 2000 到 3000 美元,成本降低 280 到 420 倍。
    这让顶级推理能力从实验室奢侈品变成可大规模商用的普惠技术。
    四、核心技术突破:Deep Think 深度推理
    Gemini 3 采用全新 Deep Think 模式,核心是慢思考、自我修正与多路径并行搜索。
    模型在输出前会自主构建多条解题路径,实时验证逻辑一致性
    查看AI文稿
  • Google Gemini 3 Deep Think 发布:84.6% ARC-AGI 霸榜,AI 进入科研合伙人时代
    07:28
    查看AI文稿
  • gemini3 用户有福了,编程能力全球仅7人可超越 谷歌上线 Gemini 3 Deep Think 的重大升级,编程能力全球仅7人可超越 #ai #大模型 #程序员 #Gemini3
    00:52
    查看AI文稿
  • AI找BUG打败了数学家 #人工智能 #AI新星计划 #gemini3
    02:15
    查看AI文稿
  • 今天我们聊聊 谷歌Gemini3 Deep Think模式 谷歌在2月13日凌晨推出了一个超级厉害的AI模型新版本,叫Gemini 3 “Deep Think”(深度思考模式)升级成了一个“科研级大脑”,专门解决那些连人都觉得头疼的复杂科学和工程问题。 
1. 成绩单有多吓人?
它在几个公认最难的测试里,分数高得离谱:
在最考验抽象推理的ARC-AGI-2测试中,拿了84.6%(普通人平均才60%左右)。
在最硬核的编程竞赛平台Codeforces上,拿到了3455分,这个分数已经是传说级别,全球排名能排进人类前十。 
在2025年国际物理、化学、数学奥林匹克竞赛的笔试试卷上,表现都达到了金牌水平。
这个成绩把同行(比如Anthropic的Claude Opus 4.6和OpenAI的GPT-5.2)都甩开了。 
2. 能干啥?不止是考试
谷歌的野心不是拿高分,而是让AI真正走进实验室和科研一线,比如:
审论文:帮数学家审阅高度专业的论文,甚至发现了人类评审都没看出的逻辑漏洞。
搞材料研发:帮杜克大学的实验室设计新型半导体材料,优化复杂的生产工艺。
当工程师:工程师画个草图,它能直接分析建模,生成可以拿去3D打印的精确文件。 
3. 这意味着什么?
这标志着一个重要的转变:AI正从一个“聊天机器人”变成一个“研究工具和深度思考搭档”。谷歌已经把这个最强推理能力开放给研究者和企业使用了。 
4. 离“通用人工智能”(AGI)还有多远?
ARC-AGI测试的创始人说了,就算AI通过了这个测试,也不等于实现了AGI。他给AGI下了一个很实在的定义:当我们再也想不出“普通人能做,但AI做不到”的任务时,才算真正的AGI。按照这个标准,虽然Gemini在个体能力上已经超过了普通人类平均水平,但离真正的AGI还有距离。 
总结:谷歌这次是押注“AI for Science”(AI助力科研)。未来几年,AI可能不再是仅仅帮你写邮件、编代码,而是会和科学家、工程师并肩作战,共同推动科学发现的边界。一个永不疲倦、能力超强的“AI研究员”或“AI工程师”,已经触手可及了。
    10:15
    今天我们聊聊 谷歌Gemini3 Deep Think模式 谷歌在2月13日凌晨推出了一个超级厉害的AI模型新版本,叫Gemini 3 “Deep Think”(深度思考模式)升级成了一个“科研级大脑”,专门解决那些连人都觉得头疼的复杂科学和工程问题。
    1. 成绩单有多吓人?
    它在几个公认最难的测试里,分数高得离谱:
    在最考验抽象推理的ARC-AGI-2测试中,拿了84.6%(普通人平均才60%左右)。
    在最硬核的编程竞赛平台Codeforces上,拿到了3455分,这个分数已经是传说级别,全球排名能排进人类前十。
    在2025年国际物理、化学、数学奥林匹克竞赛的笔试试卷上,表现都达到了金牌水平。
    这个成绩把同行(比如Anthropic的Claude Opus 4.6和OpenAI的GPT-5.2)都甩开了。
    2. 能干啥?不止是考试
    谷歌的野心不是拿高分,而是让AI真正走进实验室和科研一线,比如:
    审论文:帮数学家审阅高度专业的论文,甚至发现了人类评审都没看出的逻辑漏洞。
    搞材料研发:帮杜克大学的实验室设计新型半导体材料,优化复杂的生产工艺。
    当工程师:工程师画个草图,它能直接分析建模,生成可以拿去3D打印的精确文件。
    3. 这意味着什么?
    这标志着一个重要的转变:AI正从一个“聊天机器人”变成一个“研究工具和深度思考搭档”。谷歌已经把这个最强推理能力开放给研究者和企业使用了。
    4. 离“通用人工智能”(AGI)还有多远?
    ARC-AGI测试的创始人说了,就算AI通过了这个测试,也不等于实现了AGI。他给AGI下了一个很实在的定义:当我们再也想不出“普通人能做,但AI做不到”的任务时,才算真正的AGI。按照这个标准,虽然Gemini在个体能力上已经超过了普通人类平均水平,但离真正的AGI还有距离。
    总结:谷歌这次是押注“AI for Science”(AI助力科研)。未来几年,AI可能不再是仅仅帮你写邮件、编代码,而是会和科学家、工程师并肩作战,共同推动科学发现的边界。一个永不疲倦、能力超强的“AI研究员”或“AI工程师”,已经触手可及了。
    查看AI文稿
  • 90%的人没用对Gemini 3,这9个技巧是关键! 你知道吗?其實90%的人都把Gemini 3用錯了。這支影片我用9個立刻見效的技巧,帶你把Gemini 3用到飛起: 
✅ 一次塞進大量上下文,它依然不漏掉重點
✅ 把它當資深顧問,職涯、財務、決策直接給方案
✅ 零基礎做小程序,用Canvas 做出可互動App
✅ 視覺推理 + 圖像生成,做海報、PPT圖秒出
✅ 一鍵拆解影片時間軸、生成信息圖、創作工作流 
看完你就知道:什麼場景該用Gemini 3,怎麼問才能得到高品質回覆。
👇點開影片,9招把Gemini 3變成你的超級助理。 
如果你看完这部影片有所收获,请点赞支持👍,订阅我的频道❤️
你也可以分享出去,让更多人受益!☀️☀️ 
#gemini3 #gemini3教程 #gemini3教學 #gemini3用法 #gemini3技巧 
📽️ 时间轴: 
00:00 开场
00:30 强推理能力
03:13 调整思考水平
03:52 资深顾问
05:33 创建App
07:36 强视觉推理
08:08 强图像生成
09:48 多模态能力
11:56 制作信息图
12:23 建立工作流 
免责声明: 视频仅供娱乐和教育之用。所有信息都是基于互联网的公开资料,请进行独立研究并做出明智决策。
    13:58
    90%的人没用对Gemini 3,这9个技巧是关键! 你知道吗?其實90%的人都把Gemini 3用錯了。這支影片我用9個立刻見效的技巧,帶你把Gemini 3用到飛起:
    ✅ 一次塞進大量上下文,它依然不漏掉重點
    ✅ 把它當資深顧問,職涯、財務、決策直接給方案
    ✅ 零基礎做小程序,用Canvas 做出可互動App
    ✅ 視覺推理 + 圖像生成,做海報、PPT圖秒出
    ✅ 一鍵拆解影片時間軸、生成信息圖、創作工作流
    看完你就知道:什麼場景該用Gemini 3,怎麼問才能得到高品質回覆。
    👇點開影片,9招把Gemini 3變成你的超級助理。
    如果你看完这部影片有所收获,请点赞支持👍,订阅我的频道❤️
    你也可以分享出去,让更多人受益!☀️☀️
    #gemini3 #gemini3教程 #gemini3教學 #gemini3用法 #gemini3技巧
    📽️ 时间轴:
    00:00 开场
    00:30 强推理能力
    03:13 调整思考水平
    03:52 资深顾问
    05:33 创建App
    07:36 强视觉推理
    08:08 强图像生成
    09:48 多模态能力
    11:56 制作信息图
    12:23 建立工作流
    免责声明: 视频仅供娱乐和教育之用。所有信息都是基于互联网的公开资料,请进行独立研究并做出明智决策。
    查看AI文稿
  • 两步教你找到正确的gemini3pro入口#gemini3 #gemini #AI #AI工具 #ai新星计划
    00:33
    查看AI文稿