物理学 > 光学
[提交于 2025年8月9日
]
标题: 用于脉冲强化学习的非线性光子神经形态芯片
标题: Nonlinear Photonic Neuromorphic Chips for Spiking Reinforcement Learning
摘要: 光子计算芯片在加速线性计算方面取得了显著进展,但非线性计算通常在数字域中实现,这会引入额外的系统延迟和功耗,并阻碍了全功能光子神经网络芯片的实现。 在这里,我们通过协同设计简化了MZI网格和分布式反馈激光器与饱和吸收器阵列,使用不同材料,提出了并制造了一个16通道可编程的非相干光子神经形态计算芯片,使得光学域中可以实现线性和非线性脉冲计算。 此外,以前的研究主要集中在监督学习和简单的图像分类任务上。 在这里,我们首次提出了一种光子脉冲强化学习(RL)架构,并开发了一个软硬件协同训练-推理框架,以解决脉冲RL模型训练的挑战。 我们实现了整个光子脉冲RL层的大规模、高效能(光子线性计算:1.39 TOPS/W,光子非线性计算:987.65 GOPS/W)和低延迟(320 ps)端到端部署。 两个RL基准测试包括离散的CartPole任务和连续的Pendulum任务,基于脉冲近端策略优化算法进行了实验演示。 硬件-软件协同计算奖励值分别收敛到200(-250),与传统PPO算法相当。 这一实验演示解决了大规模光子非线性脉冲计算和脉冲RL训练难度的问题,并展示了一种高速、低延迟的光子脉冲RL解决方案,在机器人和自动驾驶等实时决策和控制领域具有广阔的应用前景。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.