00:00 / 04:31
连播
清屏
智能
倍速
点赞93
“人类完爆AI!听说,全球最难的通用人工智能测试(ARC-AGI-3)上线,人类一百分通关,而顶尖AI Opus 4.6只有0.2分,还不到1分。” “你知道这测试考什么吗?分怎么算吗?” “不知道。” “这套测试不做选择题,也不论述答案。而是把玩家丢进一大堆陌生的游戏世界里,不给说明,不给提示,想通关只能自己摸清规则。” “就是考验随机应变呗?” “对。最鸡贼的是计分方式。假设人类解决用了1步,而AI用了10步,那AI的得分不是10%,而是1%。” “啊,那蛮力穷举不就吃亏了。” “看出问题了没?” “没有。” “从得分倒推一下,虽然AI解题的步骤多,但用时恐怕比满分人类要更少。” “啊?怎么会这样?” “你知道人类决策的底层逻辑是什么?” “是生存,刘慈欣说的。” “那是明规则。” “还有潜规则啊?” “那就是省力。就是喜欢用更小的代价,解决更大的问题。” “像是各种便利的发明?” “对,做人呢,最重要的……” “是开心!” “是多一事不如少一事。是不战而屈人之兵。” “这不就是偷懒吗?” “也对,文明就是高级的偷懒。因为碳基生物需要休息。人就是那只跑着跑着要睡觉的兔子。” “那AI就是乌龟!” “硅你个大头!AI是电,AI是光,不休息,不偷懒。” “那又怎么样?” “那人类就没法真正做到赢家通吃,所以会追求共生共赢。而硅基生命如果按照现有路径产生,决策逻辑只能是集中资源,堆砌算力,最终此消彼长,你死我活。” “那AI岂不是会完爆人类?” “岂止是人类,丧钟正为所有爱偷懒的碳基生命敲响。”#AGI #刘慈欣
00:00 / 01:55
连播
清屏
智能
倍速
点赞4
00:00 / 02:19
连播
清屏
智能
倍速
点赞0
00:00 / 07:02
连播
清屏
智能
倍速
点赞1
00:00 / 03:14
连播
清屏
智能
倍速
点赞6
00:00 / 21:24
连播
清屏
智能
倍速
点赞9
00:00 / 00:56
连播
清屏
智能
倍速
点赞22
00:00 / 00:09
连播
清屏
智能
倍速
点赞1
从逻辑到美学:Gemini 3.1 Pro 深度评测 2月19日,谷歌带来了核心模型的重量级升级——Gemini 3.1 Pro。 在基准测试 ARC-AGI-2 中,Gemini 3.1 Pro 拿下了 77.1% 的高分。这意味着什么?它的推理性能是前代 3 Pro 的两倍多。它不再是单纯地模仿人类,而是真正开始理解未曾见过的逻辑。 Gemini 3.1 Pro 最迷人的地方在于它能将“复杂系统”转化为“优雅设计”。对于开发者来说,它能精准弥合复杂 API 与用户界面之间的那道裂痕,让技术不再冰冷,而是充满交互的美感。 如果你热爱文学,也热爱编程,你会爱上它的创意编码能力。 给它一段文学文本,它不仅仅能写总结,更能读懂小说阴郁、深邃的基调,并据此直接编写出一套现代感十足、完美捕捉主角灵魂的个人作品集界面。 更进一步,它能帮你构建“沉浸式原型”。比如一个 3D 的椋鸟飞舞场景,不仅有视觉代码,它甚至能为你写出结合手部追踪的操控逻辑。 目前 Gemini 3.1 Pro 已开启预览。 • 开发者可以在 Google AI Studio 或 Antigravity 平台抢先体验; • 而我们普通用户,在 Gemini 应用中,以及大家非常喜爱的 NotebookLM 里的 Pro/Ultra 频道,都能见到它的身影。 • 国内用户也可以在PH8来体验Gemini 3.1 Pro 最后我想说,面对汹涌的 AI 浪潮,有些同学可能会感到焦虑。 回看计算机发展史,从汇编到高级语言,从物理机到云原生,工具层一直在变,但解决问题的底层逻辑、系统的架构思维、以及对业务痛点的精准洞察,这些核心能力从未过时。AI 只是帮我们把那层厚重的‘搬砖活’剥离了,让我们能像架构师一样去思考。把 AI 当成你的助理,你负责定义方向,它负责冲锋陷阵。只要你解决问题的能力还在,你就不会在这个浪潮中被淹没。你是如何认为的呢? #Gemini3 #GoogleAI #LLM #AI模型 #gemini
00:00 / 02:36
连播
清屏
智能
倍速
点赞46