Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > stat > arXiv:2507.08814

帮助 | 高级搜索

统计学 > 应用

arXiv:2507.08814 (stat)
[提交于 2025年6月27日 ]

标题: 在巴西累西腓登革热易感性映射:主成分分析和稳健回归的社会经济见解

标题: Mapping Dengue Vulnerability in Recife, Brazil: Socioeconomic Insights from PCA and Robust Regression

Authors:Marcílio Ferreira dos Santos
摘要: 基于2015年至2024年间在巴西东北部主要城市累西腓报告的约90,000例确诊登革热病例,我们进行了社区层面的空间分析。 2022年巴西人口普查的社会经济和人口统计指标被整合,以探讨与登革热发病率空间分布相关的因素。 为解决多重共线性和降低维度,我们对解释变量应用了主成分分析(PCA)。 使用生成的成分,我们通过普通最小二乘法(OLS)、稳健回归和随机森林算法构建了预测模型。 OLS模型解释了病例密度(每平方公里病例数)60.4%的方差,而更抗异常值的稳健模型则解释了43.2%。 随机森林模型捕捉到了非线性模式,达到了37.3%。 尽管非线性带来了一些局部改进,但线性模型表现出更大的整体稳定性和可解释性。 使用PCA得分,我们构建了社区的登革热风险排名,并将其与实际的2024年分布进行比较,相对顺序匹配度达到83.5%。 我们的研究结果表明,结合降维和预测建模的人口普查社会经济数据可以有效估计城市登革热风险,并指导空间针对性的公共卫生策略。
摘要: Based on approximately 90,000 confirmed dengue cases reported in Recife - a major city in northeastern Brazil - between 2015 and 2024, we conducted a neighborhood-level spatial analysis. Socioeconomic and demographic indicators from the 2022 Brazilian Census were integrated to explore factors associated with the spatial distribution of dengue incidence. To address multicollinearity and reduce dimensionality, we applied Principal Component Analysis (PCA) to the explanatory variables. Using the resulting components, we built predictive models via Ordinary Least Squares (OLS), robust regression, and Random Forest algorithms. The OLS model explained 60.4% of the variance in case density (cases per square kilometer), while the robust model - more resilient to outliers - accounted for 43.2%. The Random Forest model, capturing nonlinear patterns, achieved 37.3%. Despite some localized gains from nonlinearity, linear models showed greater overall stability and interpretability. Using PCA scores, we constructed a dengue risk ranking of neighborhoods and compared it to the actual 2024 distribution, achieving an 83.5% match in relative ordering. Our findings indicate that census-based socioeconomic data, when combined with dimensionality reduction and predictive modeling, can effectively estimate urban dengue risk and guide spatially targeted public health strategies.
评论: 18页,4图,9表
主题: 应用 (stat.AP) ; 种群与进化 (q-bio.PE)
引用方式: arXiv:2507.08814 [stat.AP]
  (或者 arXiv:2507.08814v1 [stat.AP] 对于此版本)
  https://doi.org/10.48550/arXiv.2507.08814
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Marcílio Santos [查看电子邮件]
[v1] 星期五, 2025 年 6 月 27 日 11:19:20 UTC (1,179 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
stat.AP
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-07
切换浏览方式为:
q-bio
q-bio.PE
stat

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号