Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2507.10953v1

帮助 | 高级搜索

计算机科学 > 信息检索

arXiv:2507.10953v1 (cs)
[提交于 2025年7月15日 ]

标题: 高海拔疾病生物标志物前景的解析:基于文本挖掘构建的生物分子事件网络的见解

标题: Unraveling the Biomarker Prospects of High-Altitude Diseases: Insights from Biomolecular Event Network Constructed using Text Mining

Authors:Balu Bhasuran, Sabenabanu Abdulkadhar, Jeyakumar Natarajan
摘要: 高海拔疾病(HAD),包括急性高山病(AMS)、高原脑水肿(HACE)和高原肺水肿(HAPE),是由海拔2500米以上地区的低气压缺氧引起的。 这些状况会带来重大的健康风险,但其分子机制仍不够明确。 在本研究中,我们开发了一个生物分子事件抽取管道,结合监督机器学习与基于特征的多尺度拉普拉斯图核,以分析PubMed中的7847个精心整理的HAD相关摘要。 我们提取了超过150个独特的生物分子事件,包括基因表达、调控、结合和定位,并构建了一个包含97个节点和153条边的加权无向生物分子事件网络。 使用PageRank算法,我们根据事件网络中的中心性对关键生物分子进行了优先排序。 排名靠前的蛋白质包括促红细胞生成素(EPO)(0.0163)、血管内皮生长因子(VEGF)(0.0148)、缺氧诱导因子1(HIF-1)α(0.0136)、内皮 PAS 结构域蛋白1(EPAS1)和血管紧张素转换酶(ACE)(0.0119)、Egl九同源物1(EGLN1)、内皮素1(ET-1)和70千道尔顿热休克蛋白(Hsp70)(0.0118),所有这些蛋白质都在氧气感知、血管重塑、红细胞生成和血压调节中起着关键作用。 子网络分析揭示了三个以缺氧反应、炎症和应激适应通路为中心的主要功能簇。 我们的综合方法展示了大规模文本挖掘和基于图的分析在揭示机制性见解和优先考虑高海拔疾病潜在生物标志物方面的效用。
摘要: High-altitude diseases (HAD), encompassing acute mountain sickness (AMS), high-altitude cerebral edema (HACE), and high-altitude pulmonary edema (HAPE), are triggered by hypobaric hypoxia at elevations above 2,500 meters. These conditions pose significant health risks, yet the molecular mechanisms remain insufficiently understood. In this study, we developed a biomolecular event extraction pipeline integrating supervised machine learning with feature-based and multiscale Laplacian graph kernels to analyze 7,847 curated HAD-related abstracts from PubMed. We extracted over 150 unique biomolecular events including gene expression, regulation, binding, and localization and constructed a weighted, undirected biomolecular event network comprising 97 nodes and 153 edges. Using the PageRank algorithm, we prioritized key biomolecules based on their centrality within the event network. The top-ranked proteins included Erythropoietin (EPO) (0.0163), Vascular endothelial growth factor (VEGF) (0.0148), Hypoxia-inducible factor 1 (HIF-1) alpha (0.0136), Endothelial PAS Domain Protein 1 (EPAS1) and Angiotensin-Converting Enzyme (ACE) (0.0119), Egl nine homolog 1 (EGLN1), Endothelin 1 (ET-1), and 70 kilodalton heat shock protein (Hsp70)(0.0118), all of which play crucial roles in oxygen sensing, vascular remodeling, erythropoiesis, and blood pressure regulation. Subnetwork analysis revealed three major functional clusters centered on hypoxia response, inflammation, and stress adaptation pathways. Our integrative approach demonstrates the utility of large-scale text mining and graph-based analysis to uncover mechanistic insights and prioritize potential biomarkers for high-altitude disease.
主题: 信息检索 (cs.IR) ; 定量方法 (q-bio.QM)
引用方式: arXiv:2507.10953 [cs.IR]
  (或者 arXiv:2507.10953v1 [cs.IR] 对于此版本)
  https://doi.org/10.48550/arXiv.2507.10953
通过 DataCite 发表的 arXiv DOI(待注册)

提交历史

来自: Balu Bhasuran [查看电子邮件]
[v1] 星期二, 2025 年 7 月 15 日 03:34:00 UTC (2,539 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • 其他格式
许可图标 查看许可
当前浏览上下文:
cs.IR
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-07
切换浏览方式为:
cs
q-bio
q-bio.QM

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号