00:00 / 00:40
连播
清屏
智能
倍速
点赞5
00:00 / 00:37
连播
清屏
智能
倍速
点赞291
00:00 / 10:48
连播
清屏
智能
倍速
点赞3933
00:00 / 03:04
连播
清屏
智能
倍速
点赞175
00:00 / 02:10
连播
清屏
智能
倍速
点赞64
AITarf6月前
Grok 4 超越人类博士的AI,离通用智能还有多远? Grok 4:下一代超级智能的开端? 2025年7月,马斯克旗下的 XAI 团队正式发布了 Grok 4,被称为“全世界最聪明的 AI”,其性能不仅远超前代,还在学术考试、人文学科终极测试(HLE)、推理能力、多模态理解与工具使用等维度,刷新了业界对 AGI(通用人工智能)的认知。 🚀 智能飞跃的关键突破 相比 Grok 2 的“高中生”水平,Grok 4 的训练计算量增加了 100 倍。它在 SAT、GRE 等标准化考试中几乎满分,更令人震惊的是,在 HLE 这类博士级考试中也能独立完成四分之一的问题,而其“重型版本”(Grok 4 Heavy)通过多代理协作,能攻克超过一半的高难度题目。 更重要的是,Grok 4 拥有超人级别的第一性原理推理能力,可以在不依赖人类知识的前提下自主思考、修正错误。 🛠 原生工具能力+现实互动潜力 不同于传统语言模型的“答题型思维”,Grok 4 原生集成了工具使用能力。从物理模拟器、工程分析工具(如有限元分析)、到未来与人形机器人 Optimus 结合,Grok 4 正在迈入“虚拟 + 实体”互动的 AI 新阶段。 比如在发布会上,它展示了生成黑洞合并的可视化动画,并能引用真实物理数据解释过程;还能自动运营一台“虚拟售货机”,包括库存管理、定价与盈利分析,表现比其他模型强两倍。 📊 商业与研究的深度应用 Grok 4 不只是聪明,它开始“动手干活”: 📈 在金融领域实时读取数据、提供预测 🔬 帮助 ARC Institute 自动化生物医学研究 🎮 用几小时开发第一人称射击游戏 📺 预计今年生成 AI 电视节目,明年挑战 AI 电影 它甚至已经接入 API,供企业与开发者使用。 🔒 AI 安全哲学:灌输“真相价值观” XAI 强调,“最重要的 AI 安全机制不是限制,而是真相导向”。Grok 被比喻为“超级天才孩子”,在强大前必须学会诚实、正直等价值观。这种价值观训练,或将成为未来 AGI 的行为底座。 📉 挑战与展望 当然,Grok 4 仍有弱点。比如图像理解能力不足,被称为“部分盲”;同时,随着模型越强,能用于强化学习的挑战数据越来越少。这意味着未来的 AI 将不得不以“现实世界”为测试场,而不是答卷纸。 下一个版本(Grok 7)将大幅强化视频、图像、语音
00:00 / 07:38
连播
清屏
智能
倍速
点赞2