00:00 / 04:12
连播
清屏
智能
倍速
点赞331
什么是 JEPA ,它和世界模型有什么关系? 或许你听说过 JEPA 这个词,但它究竟在做什么的?AI 科普达人 New Machina 将用 4 分钟的时间让大家了解这个世界模型背后的重要概念! 简单说,JEPA 是一种让模型学会 “预测” 的方法,不过它预测的不是像素,也不是下一个 Token,而是更抽象的东西:数据背后的“表示”。 JEPA 的全称是 Joint Embedding Predictive Architecture,联合嵌入预测架构。这个名字听起来复杂,其实核心思想不难理解:就是把图像、文本、传感器信号等不同形式的数据都转成一种共同的表达形式,然后在这个空间里做预测。 这里的关键是 “嵌入空间”,也叫潜空间。你可以把它理解为一种压缩后的表达。模型不再盯着每一个像素、每一个字词,而是提取出更有意义的结构,比如物体之间的关系、语义信息、因果线索。噪声、纹理、随机性会被过滤掉,留下对理解和决策更重要的部分。 和常见的生成模型不同,JEPA 不负责 “生成” 图像或文本。它不去逐个像素还原画面,也不去一个字一个字往外写。它做的是在潜在空间中预测,如果当前状态是这样,接下来可能会怎样?换句话说,它更像是在做模拟,而不是创作。 这点在世界模型中尤其重要。一个完整的世界模型,通常包括以下5个部分: 1. 把输入变成状态表示 2. 根据当前状态做预测 3. 决定可以采取哪些动作 4. 记录历史信息 5. 通过模拟未来来做规划 在这个框架里,JEPA 天然适合承担 “状态” 和 “预测” 这两块。它把原始输入转成紧凑的潜在表示,然后预测下一个潜在状态。规划模块再基于这些预测,模拟不同动作带来的结果,选出更优的方案。整个过程都在潜在空间里完成,不需要频繁生成像素或文本,效率更高,也更稳定。 这也是 JEPA 受到关注的原因之一。传统生成式方法在很多任务上表现不错,但当目标变成长期预测、复杂决策或多模态融合时,逐 Token 或逐像素生成就显得笨重。JEPA 提供了一种不同的方式。它不急着生成结果,而是先建立对世界结构的内部表示。 长远看,这种思路将对机器人、自动驾驶以及需要与真实环境持续交互的系统更有意义。因为这些系统的核心问题不是 “生成一段话”,而是 “理解当前发生了什么,以及下一步会发生什么”。 #世界模型 #JEPA #AI技术
00:00 / 04:05
连播
清屏
智能
倍速
点赞16
回复宝贝。这个事情我在18年就开始想这个事情了,现在已经2026年了,当时我就在想如果欢迎回家是一个回家的概念,那么在我们火星是不是真的有一个属于我们几万人的家?所以花了很多年的时间和大家一起去做了我们乐园场1.0的版本,风里雨里,我们彼此也都都等着对方,我们彼此也一起经历了,哪怕会遇到很多天气原因的困难,慢慢我们也会把这些困难变成乐趣,但也会有限制,比如早点要结束,到点就要分开,我就在想如果有一天没有这些限制呢?所以后来我们就花了很多年的时间去考察中国各个城市,直到我们去到一个地方,觉得那里太美了,四季如春,真的很适合在这里安家啊!然后呢我就在想如果在这里我们可以一起唱歌一起欢声笑语一起吃一起打游戏一起看夕阳一起看星星一起看日出,那该有多美好啊,所以呢,我们以前乐园是找一个地方租一块地,从零开始做基建搭舞台,那2.0,我们是在一个四季如春的地方,拿下了三块地!那里有我们的乌托邦,还有演唱会,有吃有喝有玩,还有我们温暖的房子!当然啦,我们开过会了,我已经看过了我们2.0的舞台,我只能说 不知道比我们1.0的舞台升级了多少,到现在也没算清楚要花多少,真是个无底洞啊!以前我们舞台要搭一个月吧,这个要搭好几个月吧,所以要把它挪到其他地方也挺难的,至于几月开始开呢,后面再和大家说好吗?当然火星不是我一个人的也是大家的,所以后面我会找个其他的方式比如直播,一起来探讨一下怎么把我们的家装修的漂亮一点好不好?
00:00 / 03:15
连播
清屏
智能
倍速
点赞388
最近看到刘润采访薛兆丰的视频,他提到孩子越早掌握 3 个经济学概念,越能在人生里走得更稳。 我非常认同,也发现这三件事,其实正是我这几年带学生时,反复在教的学习底层逻辑。 它们分别是:成本、边际、利息。 也是所有能真正逆袭的孩子身上,必然具备的三种思维方式。 01 成本:学会取舍,才有可能变强。 成本不是钱,是“你放弃的最值钱的东西”。 很多孩子不是不努力,而是意识不到:当你选择玩手机的那一小时,是在主动放弃本可以提升的那几分。 当学生真正理解“选择=代价”,学习节奏、专注度和执行力,会立刻变得稳定。 02 边际:决定提分速度的关键变量。 边际讲的是:“我现在再投入 1 小时,会带来多少收益?” 孩子能否做边际判断,直接决定效率。 比如:语文刷 1 小时提升 1 分;英语 1 小时提升 4 分。 会边际思考的学生,不靠蛮干提分,而是靠策略爆发。 这也是为什么很多孩子努力 4 个月不涨分,不是不努力,是方向不对。 03 利息:时间复利下的学习红利。 今天的努力,未来会放大; 未来的努力,只能原地踏步。 理解“时间的利息”的孩子, 会珍惜每一次当下、每一个小突破,这就是长期主义,也是逆袭的真正底气。 我越来越确信:真正能改变一个孩子学习命运的,不是多刷几本题,而是掌握这三条底层决策逻辑。 当孩子会判断、会取舍、会规划,自学力会被激活,成绩自然水涨船高。 这也是我做 提分规划陪跑的核心初衷,不是带孩子死学,而是带他学会真正“会学”。 如果你也想知道孩子目前最缺的是哪一步、最适合从哪里突破,可以给我发私信。 我帮你看孩子当下的阶段与最优提分路径。
00:00 / 02:28
连播
清屏
智能
倍速
点赞19
00:00 / 01:17
连播
清屏
智能
倍速
点赞14
傅博1月前
五分钟一键成片,但我们更在意“可交付” 最近我们发布了一个演示概念片:五分钟 AI 一键成片。 但我想说的重点不是“快”,而是——终于可以稳定交付。 我是商业广告导演/摄影团队出身,过去几年做过不少服装与 3C 类实拍项目: 像 Dior(迪丽热巴圣诞物料)、Tommy Hilfiger(polo 微观质感)、FILA 高尔夫(巴黎/凡尔赛相关拍摄)、安踏 CNY,也做过 KBHONG 的线上秀场。 越拍越确定一件事:服装广告的高级感,很多时候不是“氛围”,而是细节与一致性。 但大家现在刷到的很多 AI 走秀/电商图/AI 模特,为什么“一眼假”? 核心原因其实很简单:同一件衣服、同一个人,经常不是同一个。 角度一换,纹样漂;景别一推,缝线乱;光线一变,材质塑料;标识甚至会随机变化——所以远景能看,特写必崩,品牌标准线直接断掉。 所以我们做了 SOMEWHILE ID FORGE(身份熔炉)。 它不是“更会写提示词”,而是把生成变成一条可控的生产流程: 1)身份资产化(品牌脸) 自研超拟真数字模特:皮肤层次与光照反应做到真假难分 支持妆造无级可调(同一人换风格,身份不漂) 支持高复杂动作(不是只会站着好看) 并提供清晰的商业使用与授权路径,让品牌能长期复用 2)服装细节锁定(反塑料的关键) 把面料纹理、织法、缝线、版型、标识等关键细节沉淀为可控资产,让同一件衣服在多角度、多景别、甚至特写里仍然稳定。 3)影视级影像调校(让它像“片场”而不是“AI图”) 我们用过往项目经验与数据沉淀一套影视级质感标准线,对齐肤质、材质反光、光比与色彩一致性,让画面更接近实拍语境。 4)自动化生产管线(从图到片) 从 lookbook 多视图、KV 延展,到短片镜头与线上秀场级内容,都能在同一套资产逻辑上扩展,不再靠抽卡。 它怎么用? 品牌只要一句话输入:品牌/产品线/人群/调性, 系统会对照 2026 流行趋势与真实市场审美拆解需求,一次性输出可选的 9 张“品牌脸”,并进入一致性锁定与资产化流程——帮助品牌建立属于自己的数字形象底座,后续再做妆造与服装搭配,效率会非常高。 我们不打算把它做成“走量工具”, 更希望它是一个高端服务型平台:为品牌把内容生产做得更稳定、更高级,同时在过程中实现降本增效。 如果你来自服装品牌的品牌部/市场部/内容团队,正在评估: AI lookbook、虚拟试衣、KV、短片、线上秀场 欢迎私信
00:00 / 04:38
连播
清屏
智能
倍速
点赞204
00:00 / 07:59
连播
清屏
智能
倍速
点赞23
00:00 / 01:19
连播
清屏
智能
倍速
点赞3