统计学 > 应用
[提交于 2025年6月27日
]
标题: 在巴西累西腓登革热易感性映射:主成分分析和稳健回归的社会经济见解
标题: Mapping Dengue Vulnerability in Recife, Brazil: Socioeconomic Insights from PCA and Robust Regression
摘要: 基于2015年至2024年间在巴西东北部主要城市累西腓报告的约90,000例确诊登革热病例,我们进行了社区层面的空间分析。 2022年巴西人口普查的社会经济和人口统计指标被整合,以探讨与登革热发病率空间分布相关的因素。 为解决多重共线性和降低维度,我们对解释变量应用了主成分分析(PCA)。 使用生成的成分,我们通过普通最小二乘法(OLS)、稳健回归和随机森林算法构建了预测模型。 OLS模型解释了病例密度(每平方公里病例数)60.4%的方差,而更抗异常值的稳健模型则解释了43.2%。 随机森林模型捕捉到了非线性模式,达到了37.3%。 尽管非线性带来了一些局部改进,但线性模型表现出更大的整体稳定性和可解释性。 使用PCA得分,我们构建了社区的登革热风险排名,并将其与实际的2024年分布进行比较,相对顺序匹配度达到83.5%。 我们的研究结果表明,结合降维和预测建模的人口普查社会经济数据可以有效估计城市登革热风险,并指导空间针对性的公共卫生策略。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.