计算机科学 > 计算机视觉与模式识别
[提交于 2025年6月19日
(v1)
,最后修订 2025年6月29日 (此版本, v3)]
标题: HyperPath:基于知识引导的双曲语义层次结构建模用于WSI分析
标题: HyperPath: Knowledge-Guided Hyperbolic Semantic Hierarchy Modeling for WSI Analysis
摘要: 病理学对于癌症诊断至关重要,多实例学习(MIL)被广泛用于全切片图像(WSI)分析。 WSI表现出一种自然的层次结构——切片、区域和幻灯片——具有不同的语义关联。 虽然一些方法试图利用这种层次结构以改善表示,但它们主要依赖欧几里得嵌入,这难以完全捕捉语义层次结构。 为了解决这一限制,我们提出了HyperPath,这是一种新方法,通过整合文本描述的知识来指导WSI语义层次结构在双曲空间中的建模,从而提高WSI分类效果。 我们的方法将病理学视觉-语言基础模型提取的视觉和文本特征适应到双曲空间。 我们设计了一个角度模态对齐损失,以确保跨模态对齐的鲁棒性,同时一个语义层次一致性损失通过蕴含和矛盾关系进一步优化特征层次结构,从而增强语义连贯性。 分类是通过测地线距离进行的,该距离衡量双曲语义层次结构中实体之间的相似性。 这消除了对线性分类器的需求,并实现了面向几何的WSI分析方法。 大量实验表明,与现有方法相比,我们的方法在各项任务中都取得了优越的性能,突显了双曲嵌入在WSI分析中的潜力。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.