定量生物学 > 神经与认知
[提交于 2025年5月7日
]
标题: 迈向视觉-语言情景记忆框架:大规模预训练模型增强的海马吸引子动力学
标题: Towards a Vision-Language Episodic Memory Framework: Large-scale Pretrained Model-Augmented Hippocampal Attractor Dynamics
摘要: 建模情景记忆(EM)在神经科学和人工智能领域仍然是一个重大挑战,现有的模型要么缺乏可解释性,要么难以应用于实际场景。 本文提出了视觉-语言情景记忆(VLEM)框架,通过整合大规模预训练模型与海马体吸引子动力学来解决这些挑战。 VLEM 利用预训练模型强大的语义理解能力,将感觉输入转化为语义嵌入,类似于新皮层的功能,而海马体则通过吸引子动力学支持稳定的记忆存储和检索。 此外,VLEM 结合了前额叶工作记忆和内嗅皮层门户,允许新皮层与海马体之间的交互。 为了促进实际应用,我们引入了EpiGibson,这是一个三维模拟平台,用于生成情景记忆数据。 实验结果表明,VLEM 框架能够高效地从感觉输入中学习高层次的时间表示,展示了其在现实场景中的鲁棒性、可解释性和适用性。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.