arc-agi-3测试对AI影响 - 抖音

您是不是在找：

杜雨说AI1周前

最新测试: AI全员败给人类,AGI泡沫要破了？ #AI #人工智能 #杜雨 #openclaw #ARC

00:00 / 05:28

连播

清屏

智能

倍速

点赞494

全球AI速递1周前

AI快讯：基准饱和！ARC-AGI-3如何重塑AI能力评估？ #AI #AI新闻 #科技快讯

00:00 / 02:14

连播

清屏

智能

倍速

点赞6

橙色溪流6天前

老黄又被打脸，这次是关于AGI。顶级大模型被这个测试无情羞辱 ARC-AGI 系列测试认为，真正的智能不在于存储知识的规模，而在于学习效率——即系统在面对从未见过的、先验知识极少的任务时，获取新技能的速度。不同于前代的输入-输出（I/O）对格式，ARC-AGI-3 要求模型作为“智能体”进入未知的交互式环境并进行测试。曾在多项基准测试中登顶的 Anthropic Opus 4.6 及 GPT-5 系列测试原型，在 ARC-AGI-3 中的表现跌至冰点。其中，Opus 4.6 的有效得分仅为 0.2%，基本宣告了现有 LLM 架构在处理高度抽象且不可预测的任务时完全失效 #科技下一站 #开源项目 #ai工具学习 #大模型微调 #llm

00:00 / 01:28

连播

清屏

智能

倍速

点赞4473

硅基宇宙siliverse6天前

最新测试ARC-AGI-3，把主流AI全考懵了#大模型测试 #gemini#chatgpt#claude#人工智能

00:00 / 00:27

连播

清屏

智能

倍速

点赞275

老杜深度学习6天前

ARC AGI 3正式发布，顶尖AI大模型集体挂科！ #arc #agi

00:00 / 10:16

连播

清屏

智能

倍速

点赞173

科技最前线1周前

人类100分，最强AI不到1分！全球悬赏200万美金揭开真假AGI的智能底牌！#AGI #全球悬赏 #马斯克 #奥特曼 #人工智能 #科技前沿

00:00 / 01:16

连播

清屏

智能

倍速

点赞425

颜dvf5天前

让 GPT Claude 零分的测试：ARC-AGI-3

00:00 / 04:31

连播

清屏

智能

倍速

点赞93

量子位4天前

AGI测试新标杆来了！人类满分 vs AI不到1% AGI测试新标杆来了！它叫ARC-AGI-3，人类几乎人人满分，但AI的正确率连1%都不到，GPT、Claude、Gemini等前沿大模型统统翻车。 #人工智能 #AGI #大模型 #前沿科技趋势发布月 #AI新星计划

00:00 / 02:59

连播

清屏

智能

倍速

点赞363

老高玩儿AI5天前

#ai干货分享 #科技下一站 #AGI #开源项目 #ai工具学习

00:00 / 02:26

连播

清屏

智能

倍速

点赞883

AI有点聊6天前

人类满分，顶尖AI集体挂科，得分不到1%！受困于知识的诅咒，大模型只会“一路走到黑”，彻底暴露了缺乏“自我反思”的致命软肋。 #ARC-AGI-3 #AGI #AGI测试 #AI翻车 #大模型局限

00:00 / 02:52

连播

清屏

智能

倍速

点赞1302

夜蝶-AI信息速递4天前

人类100%通过，AI不到1%｜ARC-AGI-3 所有AI模型都在刷榜，但ARC-AGI-3这个测试，至今没有任何AI能超过1%。人类100%轻松通过。这是唯一没被AI攻破的基准测试，悬赏200万美元。GPT-5.4: 0.3% | Claude Opus 4.6: 0.2% | Grok 4.20: 0%跑一次成本几千美元，人类只要17美元。#ARCAGI3 #ARCAGI #人工智能 #AI基准测试 #科技

00:00 / 01:33

连播

清屏

智能

倍速

点赞15

IT情报局1周前

全球最难AI考试被破解全球最难AI考试被破解了！一个名不见经传的黑马公司，首日就拿下36%的分数，直接碾压全球顶尖大模型！#全球最强AI #推理型大模型 #AI考试 #科技资讯 #科技前沿

00:00 / 00:44

连播

清屏

智能

倍速

点赞2

Jay4D4周前

未来，你还够聪明吗？ AGI都实现了，灵活掌握数理化，还是不是刚需？ #聪明 #智商测试 #硬核玩家计划 #ai新星计划 #科普

00:00 / 10:16

连播

清屏

智能

倍速

点赞36

大鹏哥-元认知5天前

#真实生活分享计划 #小米Mimo #AI时代 #伪知识粉碎机小米MiMo这场发布会，纯纯把中国科技圈的底线，踩在地上摩擦。

00:00 / 02:06

连播

清屏

智能

倍速

点赞1741

小牛聊AI1周前

人类满分，AI仅得0.2%分？ARC-AGI-3测试揭示智能 Opus 4.6惨遭滑铁卢小牛说：ARC-AGI-3测试上线，人类满分100%，AI得分仅0.2%。这项互动游戏测试考察探索、建模、目标获取和规划能力，采用效率评分公式，堵死了AI的蛮力路径。有趣的是，非LLM方案反而表现更好，大模型因缺乏元认知能力而垫底。你认为AI何时能突破这种学习瓶颈？ #机器学习 #ARC测试 #科技 #AI #AGI

00:00 / 00:09

连播

清屏

智能

倍速

点赞10

AI 前线3天前

一个小游戏如何干碎全球顶尖AI？ #AI测试 #AI #AGI #图灵测试

00:00 / 04:10

连播

清屏

智能

倍速

点赞2

弘凌的小酒馆3天前

智能体最新挑战：推理能力仅为人类1%！ ARC最新行为实验报告显示：在陌生环境，顶尖智能体的推理迁移能力只有普通人的1%。作为论证AGI未到来的核心证据，AI推理泛化能力的局限性，到底意味着什么？#智能体新挑战

00:00 / 06:46

连播

清屏

智能

倍速

点赞541

哈基米AI1周前

哈基米AI日报260326: TurboQuant造成恐慌重点包括：ARC-AGI-3 重排大模型榜单，TurboQuant 开始改写 LLM 成本，AI token 正在变成员工新福利。如果你这几天只想快速补齐 AI 圈最关键的变化，这一条就够了。 #AI #人工智能 #OpenAI #Nvidia #Claude

00:00 / 00:54

连播

清屏

智能

倍速

点赞38

误上贼船6天前

“人类完爆AI！听说，全球最难的通用人工智能测试（ARC-AGI-3）上线，人类一百分通关，而顶尖AI Opus 4.6只有0.2分，还不到1分。” “你知道这测试考什么吗？分怎么算吗？” “不知道。” “这套测试不做选择题，也不论述答案。而是把玩家丢进一大堆陌生的游戏世界里，不给说明，不给提示，想通关只能自己摸清规则。” “就是考验随机应变呗？” “对。最鸡贼的是计分方式。假设人类解决用了1步，而AI用了10步，那AI的得分不是10%，而是1%。” “啊，那蛮力穷举不就吃亏了。” “看出问题了没？” “没有。” “从得分倒推一下，虽然AI解题的步骤多，但用时恐怕比满分人类要更少。” “啊？怎么会这样？” “你知道人类决策的底层逻辑是什么？” “是生存，刘慈欣说的。” “那是明规则。” “还有潜规则啊？” “那就是省力。就是喜欢用更小的代价，解决更大的问题。” “像是各种便利的发明？” “对，做人呢，最重要的……” “是开心！” “是多一事不如少一事。是不战而屈人之兵。” “这不就是偷懒吗？” “也对，文明就是高级的偷懒。因为碳基生物需要休息。人就是那只跑着跑着要睡觉的兔子。” “那AI就是乌龟！” “硅你个大头！AI是电，AI是光，不休息，不偷懒。” “那又怎么样？” “那人类就没法真正做到赢家通吃，所以会追求共生共赢。而硅基生命如果按照现有路径产生，决策逻辑只能是集中资源，堆砌算力，最终此消彼长，你死我活。” “那AI岂不是会完爆人类？” “岂止是人类，丧钟正为所有爱偷懒的碳基生命敲响。”#AGI #刘慈欣

00:00 / 01:55

连播

清屏

智能

倍速

点赞4

Qiuming1周前

史上最难AGI测试发布：人类满分，AI最高得分不到1% 史上最难AGI测试发布：人类满分，AI最高得分不到1% 2026年3月26日，全新的AGI基准测试ARC-AGI-3正式发布，其残酷结果震惊了整个AI圈。这项被称为“全球最难”的测试，揭示了当前顶尖大模型与人类智能之间的巨大鸿沟。人类表现：满分通关（100%）。 AI表现：所有前沿模型得分均低于1%。上一代“学霸”Opus 4.6得分更是从69.2%暴跌至0.2% 。 ARC-AGI-3的难点在于，它不再是静态的填空题，而是包含150多个互动游戏、超1000个关卡的“黑盒”环境。AI没有说明书，必须自行探索规则、建立世界模型并找到通关目标。评分标准首次引入“效率”概念，公式为（人类步数/AI步数）²，彻底封死了AI依靠穷举法“大力出奇迹”的路径。最讽刺的是，排名靠前的方案并非大模型，而是轻量级的CNN（卷积神经网络）智能体。专家指出，大模型缺乏“元认知”能力，容易因“先入为主”的错误假设而迷失方向，而人类则本能地具备“观察-建模-验证”的学习闭环。目前，该挑战赛设有85万美元奖金，其中70万美元悬赏首个实现满分通关的团队。 https://x.com/Hesamation/status/2036861818321146306 https://arcprize.org/arc-agi/3 https://docs.arcprize.org/ https://x.com/fchollet/status/2036881543973790004

00:00 / 02:19

连播

清屏

智能

倍速

点赞0

Alex 林修1周前

AI日报_2026.03.27 #AI日报 #人工智能 #Claude #AIbenchmark

00:00 / 07:02

连播

清屏

智能

倍速

点赞1

阿朱星际漫步5天前

把所有AI斩于马下的交互式测试，我来试试？ #arcagi #ai #人工智能 #AI挑战 #AI新星计划

00:00 / 19:35

连播

清屏

智能

倍速

点赞15

小胡-API5天前

【重磅】Claude Operon 泄露！Google Ge 【重磅】Claude Operon 泄露！Google Gemma 4 现身 & ARC-AGI 3 登场！#鸣潮 #时尚百货城 #随时随地标记一下 #dating软件怎么下载 #直播课堂

00:00 / 09:22

连播

清屏

智能

倍速

点赞5

雷长春6天前

00:00 / 03:14

连播

清屏

智能

倍速

点赞6

第一性思考4天前

AGI最可怕的是它开始证明你根本没那么必要 #AGI #AGI到来#对人类的影响 #AI

00:00 / 10:59

连播

清屏

智能

倍速

点赞14

News 391周前

【News 39】初音未来AI日报 2026-03-26 初音未来每天唱新闻给你听🎤 今日速递👇 🤖 谷歌推出TurboQuant算法可压缩大模型缓解内存瓶颈 🔒 全球首个AI类人智力测量基准ARC-AGI-3推出 🧠 GitHub更新Copilot政策交互数据可用于模型训练 💚 开发者开源Optio 实现AI编码全流程自动化 🎵 新疆老师家长会展示孩子匿名心声不少家长落泪 💻 饶河湿地保护成效显著迎来大批北归候鸟 📱 江西都昌推行订单育秧模式助力早稻春耕生产 News 39 —— 阴暗话题禁止播放ダヨー！ ————————— 🤖 本节目由 OpenClaw AI Agent 框架全自动生成从新闻采集、歌词创作、AI演唱到演播室画面全流程由 AI Agent 团队协作完成，零人工干预 📅 每日更新，记得关注不迷路！ ♪ 本节目由你的笑容赞助播出 ♪ #初音未来 #AI日报 #News39 #虚拟歌手 #初音未来 #AI日报 #News39

00:00 / 02:31

连播

清屏

智能

倍速

点赞108

shmily想做AI大佬1月前

Gemini 3 开启深度推理新纪元，AI 进化速度难以想象 #google #AI #深度思考 #gemini

00:00 / 04:19

连播

清屏

智能

倍速

点赞9

徐涛Neo4天前

暴力算力之路错误智能源于简洁内核 #AGI #人工智能 #算力 #符号下降 #ARC测试

00:00 / 03:49

连播

清屏

智能

倍速

点赞399

GPLP科技说1周前

最难AI测试放榜大模型集体“交白卷”！黄仁勋惨遭“打脸”#大模型 #AI测试 #黄仁勋 #热点

00:00 / 00:34

连播

清屏

智能

倍速

点赞1

经纬策论1月前

从AI火箭发动机看AGI：不只是快，而是人类无法理解的创新 #ai #agi #科技 #火箭 #产业升级

00:00 / 02:12

连播

清屏

智能

倍速

点赞3911

视频大脑1周前

AI大模型集体翻车！人类满分它才0.2% AI大模型集体翻车！人类满分它才0.2%

00:00 / 00:10

连播

清屏

智能

倍速

点赞0

科技舆情眼1月前

谷歌这波操作真是科技圈的“卷王”附体，Gemini3一出手，深度思考模型直接升级成“人类脑力外挂”。以前是AI帮人干活，现在是AI开始替人想事了？我刚准备发个朋友圈说“今天好累”，它已经给我写好了文案：“累了，不是因为工作，是因为大脑在偷偷运行深度思考模型。”#谷歌#Gemini3#AI觉醒

00:00 / 01:30

连播

清屏

智能

倍速

点赞37

杨竹筠10月前

不听人类指挥，OpenAl模型拒绝关闭不听人类指挥，OpenAl模型拒绝关闭，人类专家在测试中给03下达明确指令，但o3篡改计算机代码，以避免自动关闭，以后人类关不住AI了？#AI #AGI #OpenAI模型现失控风险

00:00 / 02:08

连播

清屏

智能

倍速

点赞NaN

马克Ai 笔记4天前

悬赏200万美元的测试，顶级AI全军覆没，得分率不超过1% #AI #AGI #大模型 #马斯克 #openai

00:00 / 00:57

连播

清屏

智能

倍速

点赞7

C哥聊科技2周前

AI教父最新论文：AGI就是泡影！杨立昆最新论文揭示一个残酷真相：AI平权是幻觉，未来属于会用专业化AI的人。你以为人人都能靠AI翻身？真相可能完全相反。#AI #杨立昆 #AGI #SAI

00:00 / 07:42

连播

清屏

智能

倍速

点赞3348

Joe爱折腾1月前

AGI近在咫尺，一切都将不再相同！ #ai #agi #aiagent #人工智能 #程序员科普

00:00 / 03:29

连播

清屏

智能

倍速

点赞3622

>Kapi_ai4天前

模型没有变聪明，只是变有用了 — 这两件事完全不同 Chollet 在 YC 播客里说了一段让整个 AI 社区需要冷静下来的话。 #ARC AGI-3 #AI智能 #FrancoisChollet #流体智力 #AI泡沫 #后训练

00:00 / 01:13

连播

清屏

智能

倍速

点赞0

Ai风向标3周前

AI 正在“暴食”人类知识，AGI 机械大军即将降临！ #马斯克 #擎天柱 #ai人工智能

00:00 / 04:18

连播

清屏

智能

倍速

点赞2236

Ai2050实验室1月前

人类历史最重要的推演 #通用人工智能 #AGI的使用 #AGI的影响

00:00 / 02:04

连播

清屏

智能

倍速

点赞218

Ai2050实验室1月前

2026，Ai海啸，人类最后的演习 #通用人工智能 #AGI的使用 #AGI的影响

00:00 / 01:14

连播

清屏

智能

倍速

点赞21

卡尔维闹10月前

AI有了婴儿直觉 AI有了婴儿直觉？谷歌Veo3表现惊人，直觉物理会是AGI关键钥匙吗？ #直觉物理 #Veo3 #谷歌 #人工智能 #AGI

00:00 / 05:21

连播

清屏

智能

倍速

点赞496

水球泡1月前

深度详解AGI时代下的社会形态变革，和对固有认知的冲击。 AI已经不再是“辅助工具”，而是开始直接接管生产结果，而且几乎没有门槛。这期内容不是唱衰职业，而是想和你一起认真面对一个问题：当生产能力被无限压缩，人真正还能靠什么站住位置？ #AGI #AI时代 #职业危机 #深度思考 #视频播客

00:00 / 40:21

连播

清屏

智能

倍速

点赞NaN

生鱼片5天前

AI 发展的现状及前景 #程序员 #AI #计算机 #就业前景

00:00 / 21:24

连播

清屏

智能

倍速

点赞9

南山派2月前

AGI能不能实现，这个结论对时代，乃至人类的影响深远 #AI #人工智能 #洞见未来

00:00 / 14:14

连播

清屏

智能

倍速

点赞14

白月说1月前

现有AI大模型能训练出超越人类的智慧吗？对AI现状理解 #AGI #人工智能

00:00 / 05:48

连播

清屏

智能

倍速

点赞6

地理视界3天前

从中国神话中来学习AI是什么，有什么用。 #ai#agi#DeepSeek#豆包#人工智能

00:00 / 03:58

连播

清屏

智能

倍速

点赞10

乐梓说1月前

谷歌genimi3.1#科技#ai

00:00 / 00:56

连播

清屏

智能

倍速

点赞22

大圣Vlog4天前

not much happened today #AI新闻 #人工智能 #科技前沿 #OpenAI #ClaudeAI

00:00 / 00:45

连播

清屏

智能

倍速

点赞0

赛博胖猫CL4天前

#ARC #AGI-3 #AI #Gemini #GPT

00:00 / 00:09

连播

清屏

智能

倍速

点赞1

Ai2050实验室3周前

现在的AI和通用人工智能有什么区别 #通用人工智能 #AGI的使用 #AGI的影响

00:00 / 02:06

连播

清屏

智能

倍速

点赞170

火鼠X观察员4月前

杠杆还是镰刀？ Gemini 3 真相揭秘谷歌Gemini3掀桌子！它不是来聊天的，它是来清算旧世界的！#Gemini3 #谷歌 #AI #AGI#马斯克

00:00 / 03:45

连播

清屏

智能

倍速

点赞727

第一性思考4天前

AGI最可怕的是它开始证明你根本没那么必要<一> #AGI #对人类的影响 #人工智能取代人类，人类该做些什么#ai时代已来 #人工取代的不止是工作

00:00 / 11:38

连播

清屏

智能

倍速

点赞2

凯哥的小圈子2月前

医生的天塌没塌不知道，医学生看到以后什么心情？#医学生#医生#AGI#马斯克#AI医生

00:00 / 04:57

连播

清屏

智能

倍速

点赞3086

土豆豆_tudoudou1月前

AI商业价值仍被低估原因分析 #AGI #人工智能 #大模型

00:00 / 06:55

连播

清屏

智能

倍速

点赞9

向野哲哲1周前

再也不用亲自写代码，程序员不要高兴地太早#AI #AIGC#ASI #AGI

00:00 / 02:49

连播

清屏

智能

倍速

点赞571

北美小厂花花1月前

从逻辑到美学：Gemini 3.1 Pro 深度评测 2月19日，谷歌带来了核心模型的重量级升级——Gemini 3.1 Pro。在基准测试 ARC-AGI-2 中，Gemini 3.1 Pro 拿下了 77.1% 的高分。这意味着什么？它的推理性能是前代 3 Pro 的两倍多。它不再是单纯地模仿人类，而是真正开始理解未曾见过的逻辑。 Gemini 3.1 Pro 最迷人的地方在于它能将“复杂系统”转化为“优雅设计”。对于开发者来说，它能精准弥合复杂 API 与用户界面之间的那道裂痕，让技术不再冰冷，而是充满交互的美感。如果你热爱文学，也热爱编程，你会爱上它的创意编码能力。给它一段文学文本，它不仅仅能写总结，更能读懂小说阴郁、深邃的基调，并据此直接编写出一套现代感十足、完美捕捉主角灵魂的个人作品集界面。更进一步，它能帮你构建“沉浸式原型”。比如一个 3D 的椋鸟飞舞场景，不仅有视觉代码，它甚至能为你写出结合手部追踪的操控逻辑。目前 Gemini 3.1 Pro 已开启预览。 • 开发者可以在 Google AI Studio 或 Antigravity 平台抢先体验； • 而我们普通用户，在 Gemini 应用中，以及大家非常喜爱的 NotebookLM 里的 Pro/Ultra 频道，都能见到它的身影。 • 国内用户也可以在PH8来体验Gemini 3.1 Pro 最后我想说，面对汹涌的 AI 浪潮，有些同学可能会感到焦虑。回看计算机发展史，从汇编到高级语言，从物理机到云原生，工具层一直在变，但解决问题的底层逻辑、系统的架构思维、以及对业务痛点的精准洞察，这些核心能力从未过时。AI 只是帮我们把那层厚重的‘搬砖活’剥离了，让我们能像架构师一样去思考。把 AI 当成你的助理，你负责定义方向，它负责冲锋陷阵。只要你解决问题的能力还在，你就不会在这个浪潮中被淹没。你是如何认为的呢？ #Gemini3 #GoogleAI #LLM #AI模型 #gemini

00:00 / 02:36

连播

清屏

智能

倍速

点赞46

张纪豪3天前

别吹AGI已经来临前几天，黄仁勋刚拍着胸脯说“我们已经实现AGI了”——结果48小时内，一个低调发布的基准测试就把这话的底裤扒得干干净净3月25日，ARC Prize基金会悄然推出ARC-AGI-3交互式代理智能基准，没有花里胡哨的宣传，就一个测试网格加一个计时器。结果呢？ GPT-5.4 只拿到0.26%！ Claude 0.25%，Grok 直接0%交白卷！而一个开发者几周搭出来的CNN+强化学习小系统，却轻松干到12.58%，把千亿参数大模型全部吊打！更扎心的是，普通人类测试者在全新环境里直接100%通关——随便一个普通人，都能秒杀当前最强AI。这个测试像一面镜子，照出了大模型在抽象推理和适应全新任务上的巨大短板。70万美元奖金至今无人领走，AI泡沫的讨论又一次卷土重来。记住这个0.26%吧！下次再有人跟你吹“AGI已经来了”，就把这个数字甩过去，笑着说：“兄弟，先过这关再说。”#agi

00:00 / 01:02

连播

清屏

智能

倍速

点赞1

国栋AI说10月前

AI 黑科技，传统特效已 OUT！AI裸眼 3D 特效直接 “撞” 进你屏幕！ #ai #裸眼3d #人工智能 #ai新星计划#waytoagi

00:00 / 00:51

连播

清屏

智能

倍速

点赞378

老郑说 AI 前瞻1月前

外网刷屏，三万亿 AI 巨头掌门人：未来三年出现“数据中心里的天才之国”，硬核解读Anthropic 创始人达里奥最新播客#AGI #Anthropic #Claude #AI

00:00 / 06:03

连播

清屏

智能

倍速

点赞412

启明聊科技4天前

烧掉50亿美金，Sora只活了半年 #Sora #AI #AGI #人工智能 #咖啡文学大赛

00:00 / 05:05

连播

清屏

智能

倍速

点赞19

哎呀阿瑟～3天前

AGI4S珠穆朗玛计划_深度分析。AI正在重新定义科学发现#AI #AGI4S珠穆朗玛计

00:00 / 08:26

连播

清屏

智能

倍速

点赞17

Xuan酱8月前

一个作品涨粉10万？我拆解了用AI涨粉变现的流量密码和大家一起拆解用AI整活搞流量的套路～ #AI新星计划 #ai #waytoagi #海螺AI #ai

00:00 / 07:50

连播

清屏

智能

倍速

点赞9548

简介:

您在查找“arc-agi-3测试对AI影响”短视频信息吗？帮您找到更多更精彩的短视频内容！最新发布时间：2026-04-01 07:30

最新推荐:

相关推荐:

热门推荐: