00:00 / 01:15
连播
清屏
智能
倍速
点赞6142
00:00 / 07:06
连播
清屏
智能
倍速
点赞145
daftAI1周前
快讯!Gemini 3.1 Pro 发布!(详细讲解) Google 推出了全面升级 Gemini 3.1 Pro。 Pro 及 Ultra 用户可以在 Gemini App 和 NotebookLM 中使用。 它专为处理那些“仅靠简单答案无法满足需求”的最复杂任务而设计,为解决复杂问题提供了更聪明、更强大的基础支撑。 推理性能实现翻倍: Gemini 3.1 Pro 在核心的逻辑推理能力上取得了重大突破。在专门评估模型解决“全新逻辑模式”能力的 ARC-AGI-2 基准测试中,它取得了 77.1% 的极高分数,其推理性能是上一代产品 Gemini 3 Pro 的两倍以上。 强大的实际应用能力: 该模型擅长将高级推理能力转化为实际生产力,能够应对高难度的挑战,例如: 代码级动画生成:能直接根据文本提示生成适用于网站的动态 SVG。因为是纯代码而非像素,这些动画在任何缩放比例下都能保持清晰,且文件体积极小。 复杂系统的数据整合:能够跨越复杂 API 与用户界面之间的鸿沟。例如,模型可以构建实时的航空航天仪表盘,通过配置公开的遥测数据流来可视化国际空间站的运行轨道。 交互式设计:能够编写复杂的 3D 椋鸟群代码。用户可以用手部追踪技术来操纵鸟群,并聆听根据鸟群移动而变化的生成式配乐。这对研究人员和设计师来说,提供了一种原型化感官丰富界面的强大方式。 创意编程 :可以将文学主题转化为可运行的网页代码。例如,为艾米莉·勃朗特的《呼啸山庄》构建一个现代个人作品集网站时,该模型并没有简单地总结文本,而是通过推理这部小说的氛围基调,设计出了一个时尚、现代的界面,并且完美捕捉主人公精髓的网站。 面向全平台的广泛推送: 从发布之日起,Gemini 3.1 Pro 已开始向不同类型的用户提供服务: 开发者:可以通过 Google AI Studio 中的 Gemini API、Gemini CLI、Google Antigravity 以及 Android Studio 进行预览。 企业用户:可以通过 Vertex AI 和 Gemini Enterprise 进行访问。 普通消费者:已经整合进 Gemini App 和 NotebookLM 中。 #AI #gemini #google #ai新春游园会 #ai创作浪潮计划
00:00 / 02:47
连播
清屏
智能
倍速
点赞61
00:00 / 01:55
连播
清屏
智能
倍速
点赞458
《谷歌Gemini3.1Pro推理能力翻倍!AGI暴涨两倍》 #谷歌 #Gemini31Pro #大模型 #推理能力 #AI更新 一、Gemini 3.1 Pro核心更新:推理能力大幅跃升 1. ARC-AGI-2评分:达到77.1%,是此前版本的两倍,在12项基准测试中位列第一(官方公布16项),尤其推理、编程、科学知识等指标领先。 2. 大模型竞技场排名:综合排名第三,文本和代码能力得分比前代高出13分,视觉能力排名最领先。榜首为Claude Opus 4.6,国产模型中豆包排名第六,GLM排名第十五。 二、ARC-AGI评测的意义 1. 评估通用智能推理:ARC-AGI测试模型对未见新逻辑的泛化和推理能力,区别于依赖预训练知识的常规任务,是衡量类人智能的关键指标。Gemini 3.1 Pro的翻倍提升展现了更强的逻辑适应力。 三、实际案例与应用展示 1. 官方案例: - 城市规划模拟:从零生成可交互的3D城市,处理地形、道路规划并模拟交通流量。 - 动态SVG生成:纯代码生成高美化UI,适合传统项目部署。国际空间站追踪:接入公开遥测数据,实时追踪空间站并可视化。 - 3D椋鸟群模拟:用真实群聚算法,支持手势控制鸟群,集成音频和3D渲染。 - 个人网站搭建:生成符合文学气质的“呼啸山庄”主题网站。 - 网友实测:生成《我的世界》小游戏、教育网站、鬼怪猎人SVG动画等,还原度高。 2. 定价:每百万token 18美金,保持不变。 四、技术架构与文档概要 1. 架构特点:采用混合专家(MoE)+深度推理集成,支持百万级上下文窗口(优于国内20万左右),多模态内置,代码执行与规划能力提升。 2. 文档内容:10万字详细解读谷歌模型发展史、3.1核心架构、推理原理、上下文处理技术、多模态理解、评测指标、行业应用案例等。
00:00 / 02:44
连播
清屏
智能
倍速
点赞20
LongCipher1周前
Gemini 3.1 Pro: Gemini 最新升级 #gemini #ai #llm #google #大模型 Gemini 3.1 Pro 相比 3.0 版本在核心推理能力上实现了重大飞跃,其核心在于将此前专用的“Deep Think”推理引擎能力进行了整合与普及,专门用于解决表层回答无法满足的复杂高阶任务。 其在推理能力上的核心提升主要体现在以下几个方面: • 抽象逻辑推理能力实现翻倍:在专门评估模型解决全新逻辑模式能力的 ARC-AGI-2 基准测试中,Gemini 3.1 Pro 获得了 77.1% 的验证得分。相比之下,Gemini 3 Pro 的得分为 31.1%,这意味着 3.1 Pro 在核心逻辑推理性能上提升了 147%(翻了一倍多)。 • 科学研究与数学计算的严谨性大幅增强:在科学研究分析场景中,3.1 Pro 能够敏锐地识别出以往模型(包括 Gemini 3 Pro)完全忽视的深层数学和方法论错误。在 Box AI 的企业级评估中,针对医疗健康和生命科学领域的数据分析,3.1 Pro 展现了卓越的算术精度,能够穿透复杂的统计噪音,准确计算相对百分比差异(RPD)和标准差,将该领域的准确率从 3.0 版本的 47% 飙升至 67%。 • 具备深度的文档逻辑解析能力(如法律分析):对于需要细微解读和深度逻辑链的任务,3.1 Pro 表现出极强的理解力。例如在复杂的法律尽职调查中,它能够准确应用“方向性测试(directionality test)”等复杂逻辑来判定责任归属,而不只是简单地提取事实,这使其在法律用例中的准确率从 57% 提升至 74%。 • 强大的长周期智能体(Agentic)规划与自主工程能力:3.1 Pro 针对需要精确调用工具和可靠执行多步操作的智能体工作流进行了深度优化。在面对如数据库迁移等长周期复杂任务时,它不仅能生成代码,还能主动进行风险评估并架构出底层同步引擎以防止数据丢失,展现了从“代码补全”向“自主软件工程”的思维跨越。 • 多模态空间与 3D 推理的突破:该模型在空间智能和 3D 转换理解方面有了实质性提升,能够准确推理旋转顺序和坐标系映射,解决了以往模型在 3D 动画生成管道中容易崩溃的难题。此外,它还能通过高级推理将文本提示直接转化为纯代码构成的复杂动态 SVG 动画或构建互动的 3D 模拟场景。 • 引入并行的“思维链”验证架构
00:00 / 04:50
连播
清屏
智能
倍速
点赞49
00:00 / 00:31
连播
清屏
智能
倍速
点赞254