00:00 / 01:15
连播
清屏
智能
倍速
点赞7981
00:00 / 01:29
连播
清屏
智能
倍速
点赞99
谷歌官宣 Gemini 3 Deep Think 的重大升级 1. 定位:不再是“聊天机器人”,而是“科学家” 谷歌这次给 Deep Think 贴的标签极其硬核:专门为科学、研究和工程设计。 解决“脏活儿”:它强调处理那些没有标准答案、数据混乱且不完整的任务。 实战案例:文中提到它识别出了人类同行评审都没发现的数学论文逻辑漏洞,还能帮实验室设计半导体材料的配方。 2. 成绩单:把“刷榜”推向极限 如果你关注 LMSYS Arena 和各种榜单,Deep Think 3 这次给出的数据非常吓人: 编程(Codeforces):Elo 分数达到 3455。这是一个什么概念?这相当于全球顶尖竞技程序员(特级大师级别)的水平。 数学(IMO 2025):达到了国际数学奥林匹克金牌水平。 “人类最后的考试”(Humanity's Last Exam):在不联网、不使用工具的情况下得分 48.4%。这是一个专门为难倒 AI 设计的极端硬核考试,这个分数目前是行业天花板。 ARC-AGI-2:得分 84.6%。这是衡量 AI 是否具备“类人通用智力(AGI)”的最权威榜单,这个进步跨度极大。 3. 实战功能:从“想”到“做”的闭环 这对你关注的 AI 自动化非常重要: 3D 建模能力:官方演示了它能把一张手绘草图直接变成可打印的 3D 模型文件。它不仅是理解图像,而是能通过代码对物理系统进行建模。 开放 API 权限:这是第一次,谷歌不仅在 Gemini 应用里开放 Deep Think,还通过 Gemini API 向开发者和企业开放早期访问权限。 #gemini #谷歌 #ai #nanobanana #google
00:00 / 05:45
连播
清屏
智能
倍速
点赞42
00:00 / 01:50
连播
清屏
智能
倍速
点赞14
今天我们聊聊 谷歌Gemini3 Deep Think模式 谷歌在2月13日凌晨推出了一个超级厉害的AI模型新版本,叫Gemini 3 “Deep Think”(深度思考模式)升级成了一个“科研级大脑”,专门解决那些连人都觉得头疼的复杂科学和工程问题。 1. 成绩单有多吓人? 它在几个公认最难的测试里,分数高得离谱: 在最考验抽象推理的ARC-AGI-2测试中,拿了84.6%(普通人平均才60%左右)。 在最硬核的编程竞赛平台Codeforces上,拿到了3455分,这个分数已经是传说级别,全球排名能排进人类前十。 在2025年国际物理、化学、数学奥林匹克竞赛的笔试试卷上,表现都达到了金牌水平。 这个成绩把同行(比如Anthropic的Claude Opus 4.6和OpenAI的GPT-5.2)都甩开了。 2. 能干啥?不止是考试 谷歌的野心不是拿高分,而是让AI真正走进实验室和科研一线,比如: 审论文:帮数学家审阅高度专业的论文,甚至发现了人类评审都没看出的逻辑漏洞。 搞材料研发:帮杜克大学的实验室设计新型半导体材料,优化复杂的生产工艺。 当工程师:工程师画个草图,它能直接分析建模,生成可以拿去3D打印的精确文件。 3. 这意味着什么? 这标志着一个重要的转变:AI正从一个“聊天机器人”变成一个“研究工具和深度思考搭档”。谷歌已经把这个最强推理能力开放给研究者和企业使用了。 4. 离“通用人工智能”(AGI)还有多远? ARC-AGI测试的创始人说了,就算AI通过了这个测试,也不等于实现了AGI。他给AGI下了一个很实在的定义:当我们再也想不出“普通人能做,但AI做不到”的任务时,才算真正的AGI。按照这个标准,虽然Gemini在个体能力上已经超过了普通人类平均水平,但离真正的AGI还有距离。 总结:谷歌这次是押注“AI for Science”(AI助力科研)。未来几年,AI可能不再是仅仅帮你写邮件、编代码,而是会和科学家、工程师并肩作战,共同推动科学发现的边界。一个永不疲倦、能力超强的“AI研究员”或“AI工程师”,已经触手可及了。
00:00 / 10:14
连播
清屏
智能
倍速
点赞27
00:00 / 05:31
连播
清屏
智能
倍速
点赞6803
00:00 / 00:10
连播
清屏
智能
倍速
点赞50
00:00 / 02:08
连播
清屏
智能
倍速
点赞117
00:00 / 00:32
连播
清屏
智能
倍速
点赞16
00:00 / 00:51
连播
清屏
智能
倍速
点赞NaN
00:00 / 01:50
连播
清屏
智能
倍速
点赞11
00:00 / 03:27
连播
清屏
智能
倍速
点赞1082