计算机科学 > 计算机视觉与模式识别
[提交于 2025年7月17日
]
标题: DMQ:针对训练后量化扩散模型的异常值分析
标题: DMQ: Dissecting Outliers of Diffusion Models for Post-Training Quantization
摘要: 扩散模型在图像生成方面取得了显著的成功,但伴随着显著的计算成本,在资源受限的环境中部署时面临挑战。最近的训练后量化(PTQ)方法试图通过关注扩散模型的迭代特性来缓解这一问题。然而,这些方法常常忽略异常值,导致在低位宽下性能下降。在本文中,我们提出了一种DMQ,结合了学习等效缩放(LES)和通道级二进制幂缩放(PTS),以有效解决这些挑战。学习等效缩放优化通道级缩放因子,以在权重和激活之间重新分配量化难度,减少总体量化误差。认识到早期去噪步骤尽管具有小的量化误差,但由于误差累积,对最终输出至关重要,我们引入了一个自适应时间步 weighting 方案,在学习过程中优先考虑这些关键步骤。此外,识别出如跳跃连接等层表现出高的通道间方差,我们为激活引入了通道级二进制幂缩放。为了即使在小校准集的情况下也能确保PTS因子的鲁棒选择,我们引入了一种投票算法来提高可靠性。大量实验表明,我们的方法显著优于现有工作,特别是在低位宽如W4A6(4位权重,6位激活)和W4A8的情况下,保持了高质量的图像生成和模型稳定性。代码可在https://github.com/LeeDongYeun/dmq获取。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.