CVPR 2025满分论文:开源三维生成框架Craftsman3D&Dora革新三维资产生成与编辑
- 2025-03-24 10:30:00
- 刘大牛 转自文章
- 494
香港科技大学谭平教授团队在 CVPR 2025 发表两项三维生成技术框架,核心代码全部开源,助力三维生成技术的开放与进步。其中 Craftman3D 获得三个评委一致满分,并被全球多家知名企业如全球最大的多人在线游戏创作平台 Roblox, 腾讯混元 Hunyuan3D-2,XR 实验室的 XR-3DGen 和海外初创公司 CSM 的 3D 创作平台等重量级项目的引用与认可。
相关技术已融入光影焕像的三维生成平台及产品,用户只需简单操作,就能开启专属三维创作之旅。
光影焕像 3D 生成平台(主站):https://triverse.ai/zh-cn/
光影焕像 3D 生成平台(国内备用):https://triverse.lightillusions.com/zh-cn/
本文中 Craftman3D 的共同一作李威宇、刘嘉瑞和阎鸿禹均为香港科技大学博士研究生。Dora 的第一作者为香港科技大学博士陈锐。均为香港科技大学谭平教授组的在读博士生。
三维内容的创建对于游戏、影视、AR/VR 乃至具身智能的环境仿真中具备关键作用。不过,传统三维建模方式要求建模者掌握大量专业知识,且需投入大量人工操作,这使得建模过程极为耗时,极具挑战性,对于非专业用户而言更是如此。过高的时间与人力成本,已然成为限制这些领域发展的主要瓶颈。近年来,基于 AI 的三维内容生成技术逐步改变了这一局面。借助自动化生成技术,三维内容创建的门槛大幅降低,让更广泛的用户群体能够高效地构建三维数字内容。
当前原生三维生成模型主要由两部分构成:一是 3D-VAE(3D Variational Auto Encoder)变分自编码器,它通过 Encoder 网络将三维模型压缩编码至潜在空间(latent space),并通过 Decoder 网络解码重构出三维模型;二是基于 3D-VAE 构建的潜在扩散模型(latent diffusion model)用于处理文本或图像输入的三维模型生成。三维生成大模型所呈现的细节上限,在很大程度上取决于 3D-VAE 对三维几何的编码与重建能力。为提升三维模型编解码过程中的几何细节丰富度,香港科技大学谭平团队联合字节跳动豆包大模型团队与光影焕像团队,共同提出了 Dora 模型来改进三维原生 VAE。
在 3D-VAE 模型的基础上,香港科技大学与光影焕像团队进一步提出了 Craftsman3D 算法方案,该方案借鉴了传统建模流程,能够快速生成高质量的 3D 模型,以进一步生成满足设计师对高质量三维模型的生成要求。此方法在 CVPR 中获得审稿人一致满分评价,它融合了原生 3D 大模型以及实时几何细节优化两大部分:首先由原生三维大模型生成初始模型,随后通过实时可交互几何细化操作,短短几十秒内即可生成具备高质量几何细节的三维模型。
Dora 开源代码:https://github.com/Seed3D/Dora/ Dora 项目主页:https://aruichen.github.io/Dora/
由表面均匀采样点
与显著区域采样点
联合构成:
。
。对于每条由相邻面
和
共享的边
,研究人员通过下式计算其二面角
:
和
分别表示面
和
的法向量。显著边缘集合
包含所有二面角超过预设阈值
的边:
,令
表示显著边缘的数量。
,研究人员将其两个顶点
和
纳入显著顶点集合
,相连边缘产生的重复顶点仅保留一份:
。令
表示该集合中唯一几何顶点的数量。给定显著区域目标点数
,当显著顶点过多时,通过最远点采样法 (Farthest Point Sampling, FPS) 进行顶点下采样;当显著顶点不足,通过对显著边缘增加采样来补充数据,从而得到显著区域采样点
。
和显著区域采样点云
进行最远点下采样:
与
分别表示来自均匀采样点云
和显著区域采样点云
的下采样点云数量。研究人员随后分别计算均匀点与显著点的交叉注意力特征:
,整个模型
通过最小化均方误差损失进行优化:
Craftman3d开源代码:https://github.com/wyysf-98/CraftsMan3D/ Craftman3d项目主页:https://craftsman3d.github.io/
| 联系人: | 透明七彩巨人 |
|---|---|
| Email: | weok168@gmail.com |
| 网址: | ai.tmqcjr.com |