Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > physics > arXiv:2509.08369

帮助 | 高级搜索

物理学 > 大气与海洋物理

arXiv:2509.08369 (physics)
[提交于 2025年9月10日 ]

标题: 不要将均方根误差作为降水目标!

标题: Stop using root-mean-square error as a precipitation target!

Authors:Kieran M. R. Hunt
摘要: 均方根误差(RMSE)仍然是数据驱动的降水模型的默认训练损失,尽管降水是半连续的、零膨胀的、严格非负的且尾部厚重的。 这种高斯假设的目标函数错误地指定了数据生成过程,因为它容忍负预测,对罕见的极端事件惩罚不足,并忽略了零点的质量。 我们建议用Tweedie偏差代替RMSE,这是一种基于似然且可微的损失函数,属于指数-离散族,其方差函数为$V(\mu)=\mu^p$。 对于$1<p<2$,它产生一个在零点有质量点且$y>0$有连续密度的复合泊松-伽马分布,与观测到的降水特征相匹配。 我们(i)从方差-均值幂律估计$p$,并表明不同时间聚合下的降水远非高斯分布,Tweedie幂$p$随着累积长度的增加而向伽马极限增长;以及(ii)证明在使用Tweedie偏差代替RMSE训练深度数据驱动模型时,技能表现一致提高。 在北京的扩散模型降尺度中,Tweedie损失提高了湿像素的平均绝对误差和极端召回率($\sim0.60$与$0.50$在第99百分位)。 在加尔各答的ConvLSTM现在预测中,Tweedie损失提高了湿像元的MAE和干像元命中率,这些改进随着领先时间的增加而逐步累积(对于MAE,$\sim2%$在$t{+}1$增长到$\sim16%$在$t{+}4$)。 由于Tweedie偏差在$p$上是连续的,它在不同尺度上平滑适应,为基于降水的学习任务提供了统计上有依据的实际替代RMSE的方法。
摘要: Root-mean-square error (RMSE) remains the default training loss for data-driven precipitation models, despite precipitation being semi-continuous, zero-inflated, strictly non-negative, and heavy-tailed. This Gaussian-implied objective misspecifies the data-generating process because it tolerates negative predictions, underpenalises rare heavy events, and ignores the mass at zero. We propose replacing RMSE with the Tweedie deviance, a likelihood-based and differentiable loss from the exponential--dispersion family with variance function $V(\mu)=\mu^p$. For $1<p<2$ it yields a compound Poisson--Gamma distribution with a point mass at zero and a continuous density for $y>0$, matching observed precipitation characteristics. We (i) estimate $p$ from the variance--mean power law and show that precipitation across temporal aggregations is far from Gaussian, with the Tweedie power $p$ increasing with accumulation length towards a Gamma limit; and (ii) demonstrate consistent skill gains when training deep data-driven models with Tweedie deviance in place of RMSE. In diffusion-model downscaling over Beijing, Tweedie loss improves wet-pixel MAE and extreme recall ($\sim0.60$ vs $0.50$ at the 99th percentile). In ConvLSTM nowcasting over Kolkata, Tweedie loss yields improved wet-pixel MAE and dry-pixel hit rates, with improvements that compound autoregressively with lead time (for MAE, $\sim2%$ at $t{+}1$ growing to $\sim16%$ at $t{+}4$). Because the Tweedie deviance is continuous in $p$, it adapts smoothly across scales, offering a statistically justified, practical replacement for RMSE in precipitation-based learning tasks.
评论: 提交至AIES
主题: 大气与海洋物理 (physics.ao-ph)
引用方式: arXiv:2509.08369 [physics.ao-ph]
  (或者 arXiv:2509.08369v1 [physics.ao-ph] 对于此版本)
  https://doi.org/10.48550/arXiv.2509.08369
通过 DataCite 发表的 arXiv DOI(待注册)

提交历史

来自: Kieran Hunt [查看电子邮件]
[v1] 星期三, 2025 年 9 月 10 日 08:06:24 UTC (1,957 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
physics.ao-ph
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-09
切换浏览方式为:
physics

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号