Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2003.02121

帮助 | 高级搜索

计算机科学 > 信息论

arXiv:2003.02121 (cs)
[提交于 2020年3月2日 (v1) ,最后修订 2021年6月28日 (此版本, v2)]

标题: 基于聚合物的数据存储编码

标题: Coding for Polymer-Based Data Storage

Authors:Srilakshmi Pattabiraman, Ryan Gabrys, Olgica Milenkovic
摘要: 受基于聚合物的数据存储平台的启发,这些平台使用二进制合成聚合物链作为记录介质,并通过串联质谱仪读取内容,我们提出了一种新的代码族,允许同时进行唯一字符串重建和多个质量误差的纠正。 我们考虑了两种方法:第一种方法涉及非对称错误,它基于引入冗余度,该冗余度与错误数量成线性关系,与字符串长度成对数关系。 该构造允许仅根据其有错误的子串组成多重集来唯一地重建字符串。 我们唯一重建方法的关键思想是将(移位的)Catalan-Bertrand路径与任意二进制字符串交错,并“反射”它们,以迫使相同长度的前缀和后缀具有不同的权重。 该方案的渐近码率是1,解码通过简化版本的回溯算法完成,该算法用于Turnpike问题。 对于对称错误,我们使用质量信息的多项式表征,并为此设置适应多项式评估码构造。 在此过程中,我们为常数个组成错误开发了新的高效解码算法,并表明该方案的冗余度与错误数量成二次关系,与码长成对数关系。
摘要: Motivated by polymer-based data-storage platforms that use chains of binary synthetic polymers as the recording media and read the content via tandem mass spectrometers, we propose a new family of codes that allows for both unique string reconstruction and correction of multiple mass errors. We consider two approaches: The first approach pertains to asymmetric errors and it is based on introducing redundancy that scales linearly with the number of errors and logarithmically with the length of the string. The construction allows for the string to be uniquely reconstructed based only on its erroneous substring composition multiset. The key idea behind our unique reconstruction approach is to interleave (shifted) Catalan-Bertrand paths with arbitrary binary strings and "reflect" them so as to force prefixes and suffixes of the same length to have different weights. The asymptotic code rate of the scheme is one, and decoding is accomplished via a simplified version of the backtracking algorithm used for the Turnpike problem. For symmetric errors, we use a polynomial characterization of the mass information and adapt polynomial evaluation code constructions for this setting. In the process, we develop new efficient decoding algorithms for a constant number of composition errors and show that the redundancy of the scheme scales quadratically with the number of errors and logarithmically with the codelength.
评论: arXiv管理员注释:与arXiv:1904.09280、arXiv:2001.04967存在大量文本重叠
主题: 信息论 (cs.IT)
引用方式: arXiv:2003.02121 [cs.IT]
  (或者 arXiv:2003.02121v2 [cs.IT] 对于此版本)
  https://doi.org/10.48550/arXiv.2003.02121
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Srilakshmi Pattabiraman [查看电子邮件]
[v1] 星期一, 2020 年 3 月 2 日 21:22:26 UTC (413 KB)
[v2] 星期一, 2021 年 6 月 28 日 16:36:37 UTC (419 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • TeX 源代码
查看许可
当前浏览上下文:
cs.IT
< 上一篇   |   下一篇 >
新的 | 最近的 | 2020-03
切换浏览方式为:
cs
math
math.IT

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号