计算机科学 > 计算机视觉与模式识别
[提交于 2025年1月7日
(v1)
,最后修订 2025年3月28日 (此版本, v2)]
标题: Chirpy3D:通过部件采样进行创意细粒度3D物体制造
标题: Chirpy3D: Creative Fine-grained 3D Object Fabrication via Part Sampling
摘要: 我们提出Chirpy3D,一种用于细粒度3D物体生成的新方法,解决在零样本设置下合成创造性的3D物体的挑战性任务,仅能访问已见类别的无姿势2D图像。 在没有结构化监督的情况下——如相机姿态、3D部件注释或特定物体标签——模型必须推断出合理的3D结构,捕捉细粒度细节,并仅使用已见类别的类别级标签来推广到新物体。 为了解决这个问题,Chirpy3D引入了一个多视图扩散模型,以无监督的方式将训练物体分解为锚定部件,将已见和未见部件的潜在空间表示为连续分布。 这使得部件可以平滑插值和灵活重组,生成具有物种特异性细节的全新物体。 一种自监督特征一致性损失进一步确保了结构和语义的一致性。 结果是第一个能够通过灵活的部件采样和组合生成完全新颖的3D物体并具有物种特异性细粒度细节的系统。 我们的实验表明,Chirpy3D在生成高质量且具有细粒度细节的创造性3D物体方面优于现有方法。 代码将在https://github.com/kamwoh/chirpy3d发布。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.