物理学 > 大气与海洋物理
[提交于 2025年9月10日
]
标题: 不要将均方根误差作为降水目标!
标题: Stop using root-mean-square error as a precipitation target!
摘要: 均方根误差(RMSE)仍然是数据驱动的降水模型的默认训练损失,尽管降水是半连续的、零膨胀的、严格非负的且尾部厚重的。 这种高斯假设的目标函数错误地指定了数据生成过程,因为它容忍负预测,对罕见的极端事件惩罚不足,并忽略了零点的质量。 我们建议用Tweedie偏差代替RMSE,这是一种基于似然且可微的损失函数,属于指数-离散族,其方差函数为$V(\mu)=\mu^p$。 对于$1<p<2$,它产生一个在零点有质量点且$y>0$有连续密度的复合泊松-伽马分布,与观测到的降水特征相匹配。 我们(i)从方差-均值幂律估计$p$,并表明不同时间聚合下的降水远非高斯分布,Tweedie幂$p$随着累积长度的增加而向伽马极限增长;以及(ii)证明在使用Tweedie偏差代替RMSE训练深度数据驱动模型时,技能表现一致提高。 在北京的扩散模型降尺度中,Tweedie损失提高了湿像素的平均绝对误差和极端召回率($\sim0.60$与$0.50$在第99百分位)。 在加尔各答的ConvLSTM现在预测中,Tweedie损失提高了湿像元的MAE和干像元命中率,这些改进随着领先时间的增加而逐步累积(对于MAE,$\sim2%$在$t{+}1$增长到$\sim16%$在$t{+}4$)。 由于Tweedie偏差在$p$上是连续的,它在不同尺度上平滑适应,为基于降水的学习任务提供了统计上有依据的实际替代RMSE的方法。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.