计算机科学 > 机器学习
[提交于 2025年7月8日
]
标题: 针对帕金森病深部脑刺激的样本高效强化学习控制器
标题: Sample-Efficient Reinforcement Learning Controller for Deep Brain Stimulation in Parkinson's Disease
摘要: 深部脑刺激(DBS)是帕金森病(PD)的一种已确立的干预方法,但传统的开环系统缺乏适应性,由于持续刺激而能效低下,并且对个体神经动态的个性化有限。自适应DBS(aDBS)提供了一种闭环替代方案,利用诸如β频段振荡等生物标志物来动态调节刺激。虽然强化学习(RL)在个性化aDBS控制方面具有前景,但现有方法存在高样本复杂度、二元动作空间中不稳定探索以及在资源受限硬件上的部署能力有限的问题。我们提出了SEA-DBS,这是一种样本高效的Actor-Critic框架,解决了基于RL的自适应神经刺激的核心挑战。SEA-DBS集成了一个预测奖励模型,以减少对实时反馈的依赖,并在二元动作空间中采用基于Gumbel Softmax的探索方法,实现稳定、可微分的策略更新。这些组件共同提高了样本效率、探索鲁棒性和与资源受限神经调节硬件的兼容性。我们在帕金森氏基底节活动的生物现实模拟上评估了SEA-DBS,证明了其收敛速度更快、对病理性β频段功率的抑制更强,并且对训练后的FP16量化具有韧性。我们的结果表明,SEA-DBS为实时、资源受限的神经调节提供了一个实用且有效的基于RL的aDBS框架。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.