计算机科学 > 神经与进化计算
[提交于 2024年12月12日
]
标题: 在保持相似性的稀疏随机嵌入中的设计选择
标题: On Design Choices in Similarity-Preserving Sparse Randomized Embeddings
摘要: 扩展与稀疏化是一个在解剖结构相似的神经回路中观察到的原则,这些回路存在于蘑菇体(昆虫)和小脑(哺乳动物)中。感官数据被随机投射到更高维度(扩展部分),其中只有少数最强烈兴奋的神经元被激活(稀疏化部分)。这一原则已被用于设计FlyHash算法,该算法形成保留相似性的稀疏嵌入,已被发现对新颖性检测、模式识别和相似性搜索等任务有用。尽管其简单性,FlyHash有许多需要设置的设计选择,例如输入数据的预处理、稀疏化激活函数的选择以及随机投影矩阵的形成。在本文中,我们探讨这些选择对使用FlyHash嵌入进行相似性搜索性能的影响。我们发现,设计选择的正确组合可能导致搜索性能的显著差异。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.