00:00 / 03:07
连播
清屏
智能
倍速
点赞74
00:00 / 04:37
连播
清屏
智能
倍速
点赞188
00:00 / 04:05
连播
清屏
智能
倍速
点赞39
00:00 / 00:53
连播
清屏
智能
倍速
点赞97
00:00 / 00:16
连播
清屏
智能
倍速
点赞5
00:00 / 01:09
连播
清屏
智能
倍速
点赞175
00:00 / 00:19
连播
清屏
智能
倍速
点赞4
00:00 / 04:48
连播
清屏
智能
倍速
点赞96
LongCipher1周前
Gemini 3.1 Pro: Gemini 最新升级 #gemini #ai #llm #google #大模型 Gemini 3.1 Pro 相比 3.0 版本在核心推理能力上实现了重大飞跃,其核心在于将此前专用的“Deep Think”推理引擎能力进行了整合与普及,专门用于解决表层回答无法满足的复杂高阶任务。 其在推理能力上的核心提升主要体现在以下几个方面: • 抽象逻辑推理能力实现翻倍:在专门评估模型解决全新逻辑模式能力的 ARC-AGI-2 基准测试中,Gemini 3.1 Pro 获得了 77.1% 的验证得分。相比之下,Gemini 3 Pro 的得分为 31.1%,这意味着 3.1 Pro 在核心逻辑推理性能上提升了 147%(翻了一倍多)。 • 科学研究与数学计算的严谨性大幅增强:在科学研究分析场景中,3.1 Pro 能够敏锐地识别出以往模型(包括 Gemini 3 Pro)完全忽视的深层数学和方法论错误。在 Box AI 的企业级评估中,针对医疗健康和生命科学领域的数据分析,3.1 Pro 展现了卓越的算术精度,能够穿透复杂的统计噪音,准确计算相对百分比差异(RPD)和标准差,将该领域的准确率从 3.0 版本的 47% 飙升至 67%。 • 具备深度的文档逻辑解析能力(如法律分析):对于需要细微解读和深度逻辑链的任务,3.1 Pro 表现出极强的理解力。例如在复杂的法律尽职调查中,它能够准确应用“方向性测试(directionality test)”等复杂逻辑来判定责任归属,而不只是简单地提取事实,这使其在法律用例中的准确率从 57% 提升至 74%。 • 强大的长周期智能体(Agentic)规划与自主工程能力:3.1 Pro 针对需要精确调用工具和可靠执行多步操作的智能体工作流进行了深度优化。在面对如数据库迁移等长周期复杂任务时,它不仅能生成代码,还能主动进行风险评估并架构出底层同步引擎以防止数据丢失,展现了从“代码补全”向“自主软件工程”的思维跨越。 • 多模态空间与 3D 推理的突破:该模型在空间智能和 3D 转换理解方面有了实质性提升,能够准确推理旋转顺序和坐标系映射,解决了以往模型在 3D 动画生成管道中容易崩溃的难题。此外,它还能通过高级推理将文本提示直接转化为纯代码构成的复杂动态 SVG 动画或构建互动的 3D 模拟场景。 • 引入并行的“思维链”验证架构
00:00 / 04:50
连播
清屏
智能
倍速
点赞49