张小珺4天前
谢赛宁 × 张小珺:我心中深远影响AI的论文 视频播客片段: 谢赛宁:我昨天在想,大概有20到25篇paper(论文)深远影响了深度学习和AI的进程,我一篇都没有。 张小珺:DiT(Diffusion Transformer,扩散Transformer架构)不算吗? 谢赛宁:我觉得算0.25。DiT更像是在边界的切线上往前铺实了一小步,我们不做也会有别人做,它没有completely(完全地)属于我。 但那些generative model(生成模型)当然算,包括DDPM(去噪扩散概率模型)。我们随便数数:LeNet(卷积神经网络鼻祖)算,AlexNet(开启深度学习时代的卷积网络)算,ResNet(残差网络)算,R-CNN(目标检测标杆模型)算,Transformer(基于注意力机制的架构)算,"Attention is All You Need"(Transformer原始论文)算,GPT-3算,BERT(双向编码语言模型)算,CLIP(连接视觉与语言的对比学习模型)算,ViT(Vision Transformer,视觉Transformer)算,GAN(生成对抗网络)算,还有3D领域的Gaussian Splatting(高斯泼溅渲染技术)我觉得也算。 这些工作的意义在于:大家本来是渐进式通往一个方向,突然这类论文横空出世,彻底改变了进程。这叫phase transition(相变)。 这条路远远没有converge(收敛),后面还有很多事可以做。我希望下一次revolution(革命)发生时,我能理解一些东西,并对AI发展产生影响。 #视频播客 #张小珺商业访谈录 #世界模型 #视频播客扶持计划 #抖来聊聊
00:00 / 05:01
连播
清屏
智能
倍速
点赞2524
张小珺3天前
谢赛宁 × 张小珺:从DiT到Sora诞生的前传 视频播客片段: 当初我在做DiT(Diffusion Transformer,扩散变换器模型)的时候,diffusion(扩散模型)也是刚刚起步,FAIR还没有一个人在做diffusion model(扩散模型)相关的研究,但我觉得这个东西好像很有趣,应该去尝试。 然后Bill Peebles(DiT共同一作),他是我当初招的一个intern(实习生),他现在是Sora(OpenAI发布的视频生成模型)的head(负责人),也在Sora生成的视频里面担任主角。他是一个非常sharp(敏锐)或者在我看来是一个完美的PhD(博士)学生,在各个方向都是”六边形战士"。 但anyway(总之),当初我们的起点其实不是要做diffusion model(扩散模型),也不是要做DiT(扩散变换器)。在前两个月的探索中,完全是集中在representation learning(表征学习)这件事上。 就是说我们想看一看一个diffusion model(扩散模型)学到的表征,到底跟一个正常的supervised(有监督)的ResNet(残差网络),或者说一个MAE(Masked Autoencoder,掩码自编码器)学到的表征到底有什么不一样? 其实后续在这个方向还有很多的工作,但我们开始做了一段时间的感受是:这个东西好像也还行,也就那样。它能学到一个不错的生成模型,能学到一个不错的表征,但这个表征要比你的self-supervised learning(自监督学习)的表征要差得多得多,完全不能打,所以我们就放弃了。 但是在这个过程中,到了最后一个月的时候,我们发现,这个转变的前提是:因为做DiT(扩散变换器)我们需要在representation level(表征层级)去跟比如基于ViT(Vision Transformer,视觉变换器)的表征系统做一个对比,所以那个时候是我们为什么不用U-Net(用于图像分割和扩散模型的卷积网络)、要用ViT来做diffusion model(扩散模型)的出发点。 #张小珺商业访谈录 #谢赛宁#ai新声计划 #视频播客扶持计划 #抖来聊聊
00:00 / 12:00
连播
清屏
智能
倍速
点赞1002
Alex恆1月前
杨立昆+谢赛宁联手创立 AMI Labs! 家人们!AI圈又炸了——图灵奖得主杨立昆与华人AI学者谢赛宁共同创立了 AMI Labs,并且拿下了创纪录的融资!🔥 但他们的目标不是大语言模型(LLM),而是 世界模型。这波操作,直接挑战硅谷主流! 划重点🔍: 1️⃣ 世界模型 vs 大语言模型 主流LLM:预测下一个词,玩的是文字游戏 世界模型:理解真实物理世界,预测系统状态,让AI像人一样“看懂”并“交互” 杨立昆一直批评LLM没有真正的智能,只是“统计学上的巧合”。现在他亲自下场,要把AI拉回正轨🧠 2️⃣ 谢赛宁:“大语言模型污染了视觉研究” 谢赛宁在访谈中直言不讳:LLM的狂热让视觉研究被带偏,大家只顾着刷榜、堆数据,却忘了智能的核心是 对世界的表征学习。 AMI Labs要做的是构建能预测系统状态的“大脑”,而不是更会编故事的聊天机器人💡 3️⃣ 全球化布局 + 开放联盟,对抗巨头垄断 AMI Labs采取全球化的研发布局,并且推行 开放的联盟模式——不搞封闭,不搞垄断,回归纯粹的学术探索。 目标是打破科技巨头对AI的“私有化”,让世界模型成为公共基础设施🌍 4️⃣ 从数字空间走向物理空间,才是真智能 作者核心观点:LLM被困在数字文本的虚拟世界里,而真正的智能必须 理解物理规律、因果逻辑、空间时间。 无论是自动驾驶、机器人还是科学发现,都需要世界模型。这条路更难,但通往的是真正的AGI🚗 💎 总结: 大语言模型让AI会“说话”,世界模型让AI会“思考”和“行动”。杨立昆和谢赛宁的联手,可能是一场AI范式革命的开始。你觉得世界模型能打败LLM吗? 评论区聊聊你的看法~ ⬇️ #世界模型 #杨立昆 #谢赛宁 #大语言模型 #科技前沿
00:00 / 02:24
连播
清屏
智能
倍速
点赞2
00:00 / 01:30
连播
清屏
智能
倍速
点赞191
张小珺2月前
对谢赛宁7小时马拉松访谈:逃出硅谷(上) 2026年春节,在中国机器人登上春晚的喜乐时分,纽约刚下过一场暴雪——这是近几年以来纽约最凛冽的一个冬天。在布鲁克林一栋略显凌乱的楼房,我与谢赛宁开始了这场对话。 这是谢赛宁第一次接受访谈。2026年2月雪后的一天,我们从下午2点,开启了一场始料未及的马拉松式访谈,直到凌晨时分散去。 这是2026年新创的AI Neo Labs中备受瞩目的一家,创造了欧洲历史最大Seed轮。从统计看,它的第一笔融资在Neo Labs中位居世界第二,仅次于前OpenAI CTO Mira Murati创立的Thinking Machines Lab(20亿美元Seed轮融资)。 “Silicon Valley is very LLM-pilled。”AMI联合创始人兼首席科学官谢赛宁说道,“硅谷已经深陷于LLM(大语言模型),完全被它催眠了。” 在黑暗浸透的霓虹纽约街头,空气中弥漫着没化完冰雪与难闻烟雾的混合味道。就像谢赛宁的表达,总是带着多重的混合感。 以下是分段标题,如果感兴趣可以拖到具体的章节收看: 00:01:19 The normal one 00:35:40 世界总不让我做Vision 00:52:06 学术流浪 00:57:43 与何恺明的友谊 01:21:05 两次拒绝了Ilya 01:37:50 杨立昆和李飞飞往事 01:58:30 草蛇灰线:“表征的世界” 02:43:55 Research taste与《金刚经》 04:11:07 世界模型是什么? 04:29:47 从下载互联网,到下载人类 04:58:17 和杨立昆创立AMI始末 05:45:53 “硅谷被催眠了” 06:07:17 自大的人类! 06:18:45 “42” 免责声明:本内容不作为投资建议。 #张小珺商业访谈录 #AI #谢赛宁 #杨立昆 #世界模型
00:00 / 03:30:00
连播
清屏
智能
倍速
点赞6298
张小珺2月前
对谢赛宁7小时马拉松访谈:逃出硅谷(下) 2026年春节,在中国机器人登上春晚的喜乐时分,纽约刚下过一场暴雪——这是近几年以来纽约最凛冽的一个冬天。在布鲁克林一栋略显凌乱的楼房,我与谢赛宁开始了这场对话。 这是谢赛宁第一次接受访谈。2026年2月雪后的一天,我们从下午2点,开启了一场始料未及的马拉松式访谈,直到凌晨时分散去。 这是2026年新创的AI Neo Labs中备受瞩目的一家,创造了欧洲历史最大Seed轮。从统计看,它的第一笔融资在Neo Labs中位居世界第二,仅次于前OpenAI CTO Mira Murati创立的Thinking Machines Lab(20亿美元Seed轮融资)。 “Silicon Valley is very LLM-pilled。”AMI联合创始人兼首席科学官谢赛宁说道,“硅谷已经深陷于LLM(大语言模型),完全被它催眠了。” 在黑暗浸透的霓虹纽约街头,空气中弥漫着没化完冰雪与难闻烟雾的混合味道。就像谢赛宁的表达,总是带着多重的混合感。 以下是分段标题,如果感兴趣可以拖到具体的章节收看: 00:01:19 The normal one 00:35:40 世界总不让我做Vision 00:52:06 学术流浪 00:57:43 与何恺明的友谊 01:21:05 两次拒绝了Ilya 01:37:50 杨立昆和李飞飞往事 01:58:30 草蛇灰线:“表征的世界” 02:43:55 Research taste与《金刚经》 04:11:07 世界模型是什么? 04:29:47 从下载互联网,到下载人类 04:58:17 和杨立昆创立AMI始末 05:45:53 “硅谷被催眠了” 06:07:17 自大的人类! 06:18:45 “42” 免责声明:本内容不作为投资建议。 #张小珺商业访谈录 #谢赛宁 #杨立昆 #视频播客
00:00 / 03:14:36
连播
清屏
智能
倍速
点赞1690