粉丝132.6万获赞600.8万

从二二年横空出世、全球爆火的 chat gpt, 到如今因为沉迷让人玩起裤腿而引发爆笑的 ai 穿搭博主,近几年来飞速发展的人工智能似乎已经渗透进我们日常生活的点点滴滴。 相信有不少小方块也会和小魔方一样,平时碰到搞不懂的生活常识或是遭遇苦闷的小烦恼,都会向 ai 提问或诉苦一番。在之前的魔方研究栏目中,小魔方就 ai 音乐、全球首个语音指挥的 fps ai 队友等话题采访过魔方的 ai 团队。那么除了声音, ai 是 否在其他层面也 影响着游戏的生产?今天我们有幸邀请到腾讯会员三 d 基础生成模型的研发负责人黄经伟来聊一聊 ai 在 三 d 模型生成领域的发展,一起探讨下他会在不久的未来如何切实的影响游戏吧。 说起 ai 生成的三 d 建模效果,应该不少人会先想到前段时间小红书平台上爆火的 nano banana ai 手办,仅需要输入一张原形图和一段简单指令,就可以生成三 d 效果的手办图片和视频。尝试过把自己喜爱角色生成手办的小方块请在公屏上扣一。 但实际上, ai 并非一开始就能生成如此流畅和高精度的三 d 建模效果。让早期的 ai 生成三 d 建模,就像让一个尚未拥有视觉的孩童做手工,只能捏出轮廓模糊的橡皮泥模型,或是一堆如同散乱乐高积木般的点云,虽然能看出个大概形状,但根本没办法实际应用。 为了提高三 d 建模的 ai 生成精度,开发者们想了个聪明的笨办法,既然 ai 生成二 d 图片效果已经很过关,那不如让他从不同角度为同一个物体画几十张素描,然后再反向推导出他的三维形状,就像通过一个人很多不同角度的照片猜出他的立体长相一样。 这个方法让生成的模型看起来自然多了,虽然看起来像那么回事,但效果不稳定,且几何结果十分模糊。如何跳过二 d 生成,直接根据算法生成三 d 几何就成了许多从业人员必须攻克的难题。 随着技术的突破、算力的增加,以及同行们越来越多的数据投入,这个问题最终得到了初步的解决,主流产品开始建立了自己专属的高质量三 d 数据库。 作为国内深耕这一领域的代表,腾讯会员三 d 的 发展几乎就是 ai 在 三 d 内容生成领域的成长日记,清晰的记录了这个技术如何一步步变得可用。 这个时期的会员三 d 就 如同市场上其他产品一样,面临着三 d 生成三个十分困难的客观挑战。三 d 表达贵、数据量少、资源少。 采用图生三 d 的 间接生成方案,依赖可微渲染与 transform 结构,虽然能够从单张图像快速输出基础的几何体,但生成结果粗糙、泛化弱,且严重受限于三 d 数据匮乏的问题。在尝试了一段时间后,混元三 d 团队渐渐意识到仅靠从二 d 模型蒸馏或小规模重建是难以突破质量瓶颈的。 受到其他开发者研究和成果的启发,会员三 d 转向原生三 d 生成路线,并开始尝试规模化训练。别怕资源贵,三 d 生成也得大力出奇迹。通过大量数据模型训练, ai 终于能生成结构合理、具有基本细节的模型了。此时的会员三 d 已经可以稳定输出和竞品相当的结果。 经历了二点零的混元三 d 团队虽然可以生成结构合理、具有基本细节的模型了,但团队在大批量生成时发现了新问题, ai 生成三 d 内容时,表面容易模糊或者脏乱,生成质量仍旧比较低。此时混元团队做出了大胆的尝试,魔改二点零时期学习的三 d shape to vexat。 通过一个小改动, wuxset 在 仅仅两个半月中用了最小的代码调整,并在二零二五年四月底将会员三 d 生成模型推入了下一个阶段,实现了中等程度结构和细节的规整生成,一举确定了会员三 d 在 竞品中较为领先的趋势, 解决了生成质量的问题。会员三 d 团队发现当前还存在两个大问题,一是智能补动模型在分辨率超过五百一十二时使用起来很慢。另一个则是 wuxset 重建高分辨率的模型,能力上线,差强人意。 而此时, hightam 三 d 的 spa 三 d 发布了下一个重要的特性,一五三六分辨率下使用另一种表达办法,纯 wacom 表达生成的三 d 效果会更精细。 当然,这也不可避免的带来了许多其他问题,无效、脏细节破面、规整度下降等等。因此,会员三 d 取长补短,改进了水密化处理,即解决了二点五版本分辨率不够的情况,又规避了纯 wacom 表达带来的其他问题,可以生成更好的几何,例如全身五官。 当然,纯粹听黄老师的讲解,可能许多小方块同我一样有种回到高速课堂的迷茫感,我们不妨来亲自体验一下它的效果吧。 进入会员三 d 的 官网,可以很轻易的找到生成的入口,而需要操作的东西也很少,只需要输入你要的效果提示词或者是上传参考图即可。当然,你还可以额外调整其他的参数,例如模型版本、模型面塑、纹理效果等等。 可能有部分小方块会卡在如何输入提示词的问题上。不用担心,系统已经帮你写好了参考,在确定完各种参数之后,大约排队等候几分钟就可以看到成果了。看小 魔方轻轻松松就生成了近期的女明星猫咪开门。而除了自行生成的效果,大家也可以在灵感广场上参考其他大神们的作品,并一键生成同款。话不多说,我们直接上图。 另外,网站上还有三 d 世界模型和其他应用套件,相信能给许多创作者带来便利。 那么经历了这些这么多进化,现在的 ai 三 d 生成技术到底可以在游戏世界中发挥什么作用呢?对于开发者来说,它更像一个提高效率的好工具。 基于 ai 生成内容的版权风险和当前 ai 生成三 d 资产远未能达到行业标准的现状,目前 ai 生成的内容并没有被用在魔方的各款游戏中,其他厂商大多也是如此。 但因为 ai 可以 轻松面对需要大批量生成粗模的情况,所以他在游戏研发中的一些特定场景下,有时候是个好助手。比如,在当项目组考虑是否要加入一个新场景、新角色或新道具时,口头描述的画面往往不够具象,无法作为项目组其他成员想象实际效果的参考。 以往解决这个问题的方式可能是找一些相似效果的图片来示意,而现在可以直接根据描述或者直接用图片生成三 d 模型,极大的缩短了方案制作和决策的时间。 也许未来当 ai 可以 完全达到游戏美术要求的高质量几何和纹理生成时,又或是 ai 生成内容的版权问题得到了进一步的规范, ai 资产会被实际运用到游戏研发中。大家对这样的想象是怀抱期待还是保持质疑呢? 对游戏玩家来说, ai 也许意味着自由度更高的未来。当 ai 三 d 生产技术足够成熟时,玩家可以直接用它生成自己心仪的、定制化的游戏内容,如角色的不同服装、动作、武器、技能、特效等等。搭配上强大的 mod 工具,玩家甚至可以直接创造出属于自己的游戏世界。 不用再繁琐的一步步捏脸,而是直接生成自己想要的角色形象。在喜爱的游戏中,直接创造包含新角色、新剧情、新地图等供自己和同号直接游玩的全新 dlc。 这些目前看似困难的功能在 ai 的 帮助下都有可能最终实现。 从模糊的马赛克到精致的高模, ai 正以我们看得见的速度学会造物,它的进化无疑会给游戏开发者和游戏玩家带来不一样的未来,也许更快,也许更自由,也许更个性。 好了,今天的魔方研究就到这里,大家是否用 ai 工具亲自尝试了三 d 内容,生产体验如何?欢迎在评论区一起分享讨论。
