00:00 / 10:26
连播
清屏
智能
倍速
点赞85
这段视频取材自“两分钟论文”,这是一个纯公益性质的科普频道,由卡尔洛伊博士创办,致力于将极其复杂的学术论文简化为普通人也能听懂的视听盛宴,可说是声名卓著,被业内称为“宝藏频道”。我是科普知识搬运工周教授,为保持视频的原汁原味,我除了将内容写成下面这段科学小品外,仅仅将字幕翻译成中文,😉顺便让大家练练听力。 在数字的海洋中,谷歌DeepMind实验室的探索者们犹如潜水员,潜入科技的最深处,带给我们一场关于现实与虚拟的视觉盛宴。他们的最新成果,4D重建技术,仿佛一把钥匙,打开了通往科幻世界的大门。 想象一下,一个场景的完整四维重建,这不仅仅是对三维空间的复制,更是时间的延伸。它让我们不禁联想到那些消失在另一个空间维度的事物,如同《宫之隐》游戏中的奇观。然而,这并非科幻,而是DeepMind实验室正在努力实现的现实。 在探索这条道路的过程中,我们不得不提到一位勇敢的探索者——卡罗利。他曾参与过一篇名为《》的研究论文,花费了3000个工作小时才完成。这段经历让他深知,科学研究之路并非一帆风顺,但正是这种挑战,让我们不断突破自我,追求更广阔的天地。 那么,4D究竟是什么?它不仅仅是三维空间加上时间的维度,更是一种对现实世界的全新理解。它让我们能够像建造宜家家具一样,将一个场景的每一个细节拼接起来,仿佛在指尖舞动。 DeepMind的4D重建技术,名为D4RT(读作Dart),它使用了一个AI技术,可以同时处理深度、运动和相机姿态,而不需要它们互相交谈。这听起来有些不可思议,但正是这种技术的魅力所在。 D4RT技术的核心在于一个编码器和一个解码器。编码器如同一位大师级木匠,观察着场景,试图理解其过去和现在;而解码器则如同魔法精灵,将信息瞬间转化为现实。这种合作模式,使得D4RT技术能够在极短的时间内完成场景的重建。 然而,这项技术并非完美无缺。它输出的是点云,数据看似简单,但无法用于3D打印或物理碰撞。此外,由于没有网格的结构化面部,编辑起来也相对困难。但正如任何一项创新技术一样,D4RT技术仍在不断进步,未来将会有更多的可能性。
00:00 / 10:41
连播
清屏
智能
倍速
点赞2
00:00 / 01:20
连播
清屏
智能
倍速
点赞25