00:00 / 01:28
连播
清屏
智能
倍速
点赞5
00:00 / 04:41
连播
清屏
智能
倍速
点赞209
00:00 / 01:17
连播
清屏
智能
倍速
点赞4
00:00 / 02:01
连播
清屏
智能
倍速
点赞143
闲田2天前
Gemini 3.1 Pro 实测:狂烧2亿token 作者用新发布的 Gemini 3.1 Pro 连续“vibe coding”17 小时,烧掉 2.146 亿 tokens,在真实生产环境里全面压力测试这个模型,并给出自己的结论:这已经是他新的默认主力模型之一。 模型表现与基准测试 相比 Gemini 3 Pro,Gemini 3.1 Pro 在 ARC AGI 2 从 31.1% 飙到 77.1%,在一系列代码与推理基准上也有明显提升。 在 Artificial Analysis 的 Coding Index 上拿到第一名得分 56,超过 GPT‑5.2 和 Opus 4.6 等前沿模型。 人类偏好类榜单(如 LM Arena、Design Arena)目前排名一般,他认为需要再等一段时间数据稳定后再看。 UI / 前端与创意能力 作者用自己自建的 BridgeBench 做“创意 HTML”测试,比如 Space Invaders 小游戏和 lava lamp 动画,对比 Opus 4.6,认为 Gemini 3.1 Pro 生成的 UI 更现代、更有设计感。 在 BridgeMind 官网中,他让模型用 Remotion 自动生成多个营销视频、重写几十个页面的布局和样式,并用 3JS 生成独特的 3D 动画效果,整体网站视觉被“全面焕新”。 他专门强调:3.1 Pro 在样式和组件设计上的 风格 明显优于之前版本,他以后不打算再用 Opus 4.6 做前端样式。 真实生产用例(多仓库重构、资产抓取) 他让 Gemini 3.1 Pro 在 Cursor 里“一次性计划 + 执行”重构整个复杂的 Auth 系统,涉及 4 个不同的 repo(API、web app、管理后台和 UI),包括后端逻辑、前端守卫和鉴权流程,称其“一发过”。 之前同一个问题他用 Opus 4.6 折腾很久没解决,换成 Gemini 3.1 Pro 后就解决了,这也让他觉得 3.1 Pro 的可靠性和推理更强。 他还让模型自己上网抓取各大模型/工具的真实 Logo(OpenClaw、Codeex、Cursor 等),下载品牌资产并生成定制组件,证明模型在“带浏览器工具的实际操作”上非常靠谱。
00:00 / 04:46
连播
清屏
智能
倍速
点赞34
想白嫖Gemini Advanced的年卡会员?其实只要走官方学生通道就行,全程合规,就是步骤有点细。按照下面这五步走,基本就能稳稳拿下这一年的免费使用权。 第一步:先确认你有没有“入场券” 别急着操作,先打开这个链接:goo.gle/freepro。如果页面弹出学生验证表格,恭喜你,有资格,直接看下一步。如果提示无法享受优惠,大概率是网络环境问题。这时候你需要检查一下自己的节点,最好换成美国这种支持区域的IP,而且得是“干净”的独享IP,那种万人骑的公共节点很容易被系统拦下来 。改完IP还不行?那可能是这个Google账号注册时绑了国内信息被风控了,建议直接注册个新号再试,注册时出生年份记得填在2000年以后 。 第二步:搞定学生身份验证 有资格之后,点进活动页获取验证链接。这里有个小技巧,复制浏览器里那个长长的SheerID验证链接,然后去第三方认证网站(比如batch.1key.me)提交一下,等个一两分钟就能自动通过,省去了自己填表的麻烦 。当然,如果你有自己的edu邮箱(包括国内的.edu.cn邮箱),也可以自己填,接收邮件验证就行 。如果提示验证失败,先别慌,很可能是当前IP的“质量”不够好,有欺诈标记。你可以用 ping0.cc 或 ipdata.co 这种工具查一下IP纯净度,换个干净的IP重新获取链接再试 。 第三步:绑卡支付(关键步骤,要细心) 验证通过后,页面会跳转让你绑卡。这一步虽然不扣钱,但必须绑。这里有个大坑:千万别直接用你那张绑了国内账单地址的Visa卡,大概率会触发风控导致资格丢失。最好是弄张虚拟卡,或者绑卡时把账单地址改成美国地址。去网上搜个“美国地址生成器”,找个免税州的地址和邮编填上去(比如俄勒冈州),这样就能0元绑定成功 。 第四步:确认订阅成功 绑卡完成后,确认一下订阅页面显示的是12个月且费用为0,点击订阅就大功告成了。这时候你再去打开Gemini,右上角应该就显示“Advanced”标识了,同时你的Google Drive容量也会变成2TB。 第五步:动动手指,关闭自动续费 为了防止一年后忘了被反撸,建议拿到权益后马上去设置里关闭自动续费。路径是:Gemini首页-> 设置 -> 管理订阅 -> 取消订阅。放心,现在取消只是关掉了到期后的自动扣费,你这一年的免费使用权一点都不影响 。#拒绝废话#科普#冷知识
00:00 / 01:39
连播
清屏
智能
倍速
点赞2
LongCipher3天前
Gemini 3.1 Pro: Gemini 最新升级 #gemini #ai #llm #google #大模型 Gemini 3.1 Pro 相比 3.0 版本在核心推理能力上实现了重大飞跃,其核心在于将此前专用的“Deep Think”推理引擎能力进行了整合与普及,专门用于解决表层回答无法满足的复杂高阶任务。 其在推理能力上的核心提升主要体现在以下几个方面: • 抽象逻辑推理能力实现翻倍:在专门评估模型解决全新逻辑模式能力的 ARC-AGI-2 基准测试中,Gemini 3.1 Pro 获得了 77.1% 的验证得分。相比之下,Gemini 3 Pro 的得分为 31.1%,这意味着 3.1 Pro 在核心逻辑推理性能上提升了 147%(翻了一倍多)。 • 科学研究与数学计算的严谨性大幅增强:在科学研究分析场景中,3.1 Pro 能够敏锐地识别出以往模型(包括 Gemini 3 Pro)完全忽视的深层数学和方法论错误。在 Box AI 的企业级评估中,针对医疗健康和生命科学领域的数据分析,3.1 Pro 展现了卓越的算术精度,能够穿透复杂的统计噪音,准确计算相对百分比差异(RPD)和标准差,将该领域的准确率从 3.0 版本的 47% 飙升至 67%。 • 具备深度的文档逻辑解析能力(如法律分析):对于需要细微解读和深度逻辑链的任务,3.1 Pro 表现出极强的理解力。例如在复杂的法律尽职调查中,它能够准确应用“方向性测试(directionality test)”等复杂逻辑来判定责任归属,而不只是简单地提取事实,这使其在法律用例中的准确率从 57% 提升至 74%。 • 强大的长周期智能体(Agentic)规划与自主工程能力:3.1 Pro 针对需要精确调用工具和可靠执行多步操作的智能体工作流进行了深度优化。在面对如数据库迁移等长周期复杂任务时,它不仅能生成代码,还能主动进行风险评估并架构出底层同步引擎以防止数据丢失,展现了从“代码补全”向“自主软件工程”的思维跨越。 • 多模态空间与 3D 推理的突破:该模型在空间智能和 3D 转换理解方面有了实质性提升,能够准确推理旋转顺序和坐标系映射,解决了以往模型在 3D 动画生成管道中容易崩溃的难题。此外,它还能通过高级推理将文本提示直接转化为纯代码构成的复杂动态 SVG 动画或构建互动的 3D 模拟场景。 • 引入并行的“思维链”验证架构
00:00 / 04:50
连播
清屏
智能
倍速
点赞49
00:00 / 00:28
连播
清屏
智能
倍速
点赞14
00:00 / 00:55
连播
清屏
智能
倍速
点赞42