K纪元3周前
每周AI事件盘点(12.22-12.28) 1.英伟达新模型NitroGen 无需读取游戏后台数据,用 4 万小时“看直播”学会通玩千款游戏。通过 “以虚促实” 的思路促进具身智能发展。先在海量虚拟环境学控制,再微调到真实机器人/自动驾驶,降低真实世界采样成本。 2.Gemini 3性能飞跃的原因是“更好的预训练”和“更好的后期训练”,认为AI训练的下一站是长上下文、高效检索与成本革命,AI 正在回归“研究时代”,顶级大厂不再只是比拼谁的 GPU 多,而是比拼谁能发现下一个类似 Transformer 级别的底层创新,数据质量取代数据数量,简单的互联网爬虫数据已不再能支撑模型继续进化。 3.智谱发布GLM-4.7模型,主打编程能力,轻松写出植物大战僵尸,强化了"交错式思考"的同时,引入"保留式思考"和"轮级思考"模式。 4.快手遭AI黑产攻击直播间出现大量黄色内容,上万机器人同时开播,内容洪峰冲垮审核,暴露直播AI风控致命短板,业内呼吁升级实时对抗模型,黑产已用AI打摆AI,AI安全进入秒级对抗时代。 5.清华大学智能产业研究院团队首次将“人类驾驶员的脑电信号认知特征”融入自动驾驶模型训练,碰撞率相对下降约 18%,在前车突然切入等高风险场景下,增强后的模型展现出了类似人类驾驶员的防御性驾驶策略,有效避免了事故发生。 6.修图 AI 模型 Qwen-Image-Edit-2511上线,模型最大亮点在于指令遵循能力,能够保持原图主题结构不变前提下对图片进行修改,提升角色一致性。 7.公司将因ai自动化升级而被替代的员工刘某直接辞退,这一做法未获仲裁支持。裁决指出企业主动引入AI属于可预见的商业决策,明确判定“因岗位被 AI 替代而直接解雇员工”属于违法行为。 #NitroGen #ai裁员 #QwenImageEdit2511 #自动驾驶模型训练#快手直播
00:00 / 02:13
连播
清屏
智能
倍速
点赞21
00:00 / 01:01
连播
清屏
智能
倍速
点赞8
英伟达发布NitroGen:看4万小时直播学会通用游戏的AI 英伟达近日发布开源基础模型NitroGen,标志着游戏AI向“通用智能体”迈出关键一步。该模型的突破在于其仅通过观看4万小时带有手柄画面的游戏直播视频,就学会了通用游戏操作。 NitroGen的创新在于其“视觉-动作”的端到端学习模式。它通过分析YouTube和Twitch上主播游戏时角落里的手柄叠加画面,将游戏画面(视觉输入)与对应的按键操作(动作输出)关联起来,就像人类玩家通过观察学习一样。 与以往只能精通单一游戏的“专才”AI不同,NitroGen是一个“通才”。它在涵盖1000多款不同游戏的庞大数据集上训练,从而具备了跨游戏的基础“直觉”。测试显示,面对一款全新游戏,它的上手表现比从零训练的模型高出52%。 这项技术的意义远超游戏本身。NitroGen基于英伟达的机器人基础模型GR00T构建,其核心目标是解决机器人领域的“莫拉维克悖论”——即让AI具备在物理世界中行动的低阶智能,远比实现高阶推理更困难。游戏世界由此成为训练未来机器人“通用大脑”的高效、安全的虚拟练兵场。 同时,最新研究显示,如GPT-5.2等大模型已能解决《塞尔达传说》中需要六步前瞻规划的复杂谜题,展现了强大的推理能力。这预示着“高级推理大脑”与“通用控制小脑”的结合,正推动AI从虚拟世界走向真正的物理智能体。
00:00 / 13:45
连播
清屏
智能
倍速
点赞6
12月29日上周AI圈发生的大事 1. 清华团队推出TurboDiffusion,将视频扩散模型推理速度提升最高200倍,使视频生成从分钟级进入秒级,有望重塑短视频素材生产流程。 2. 英伟达与斯坦福等开源通用游戏智能体NitroGen,可横跨上千款游戏并在未知关卡中稳健运行,其技术被视为未来机器人通用动作大脑的基础。 3. 通义开源Qwen-Image-Layered模型,生成的图片可拆分为多个RGBA图层,用户能像使用PS一样便捷地换色、替换物体及调整前景背景。 4. 智谱发布新一代开源大模型GLM-4.7,重点提升复杂推理与编程能力,为开发者提供了一个强大的开源工具选项。 5. 通义开源端到端语音对话模型Fun-Audio-Chat(8B),摒弃传统拼装路线,旨在实现更低延迟、更自然的语音对话体验。 6. 通义更新Qwen3-TTS模型,支持仅用3秒音频克隆音色,并能通过自然语言指令定制音色,大幅降低口播、配音等应用门槛。 7. 字节Seed团队发布形式化数学推理模型Seed-Prover 1.5,采用大规模强化学习,据称其证明能力已达到国际数学奥林匹克(IMO)金牌水平。 8. 中国气象局发布端到端气象AI“风源v1.0”,可直接基于观测数据进行全球预报,标志着AI天气预报进入深度应用竞速阶段。 9. OpenAI为ChatGPT新增精细化个性调节功能,用户可直接调整其回答的热情度、兴奋度及表情符号使用频率。 10. ChatGPT推出“Your Year with ChatGPT”年度回顾功能,根据用户数据生成个性化总结与可分享卡片,旨在增强用户粘性。 11. 微软在PowerPoint中集成由Copilot驱动的Explainer功能,可一键解释幻灯片中的缩写或复杂内容,提升工作效率。 12. 三星宣布将在CES 2026展示搭载Gemini AI的Bespoke冰箱,通过摄像头识别食材并推荐菜谱,推动AI向厨房等真实生活场景落地。
00:00 / 03:11
连播
清屏
智能
倍速
点赞16
00:00 / 01:22
连播
清屏
智能
倍速
点赞2779
00:00 / 00:49
连播
清屏
智能
倍速
点赞0
00:00 / 00:24
连播
清屏
智能
倍速
点赞97
00:00 / 00:21
连播
清屏
智能
倍速
点赞756
00:00 / 01:07
连播
清屏
智能
倍速
点赞45
00:00 / 00:24
连播
清屏
智能
倍速
点赞9620
00:00 / 00:23
连播
清屏
智能
倍速
点赞125
00:00 / 02:46
连播
清屏
智能
倍速
点赞896