计算机科学 > 形式语言与自动机理论
[提交于 2025年10月9日
]
标题: 关于概率词语言成员关系的复杂性
标题: On the Complexity of Language Membership for Probabilistic Words
摘要: 我们研究在概率词上上下文无关语言 L(CFL)的成员问题,这些概率词为每个位置指定一个字母的概率分布(假设各位置之间相互独立)。 我们的任务是,给定一个概率词,计算根据该分布生成的词属于 L 的概率。这个问题推广了计算长度为 n 的词中有多少属于 L 的问题,或者计算部分词的完成中有多少属于 L 的问题。 我们证明,对于无歧义上下文无关语言(uCFLs),这个问题可以在多项式时间内解决,但对于两个线性 uCFL 的并集,可能已经是 #P 困难的。 更一般地,我们证明对于所谓的多项分片无歧义语言,这个问题可以在多项式时间内解决,其中给定长度 n,可以高效计算出该语言中长度为 n 的词的 uCFL。 这类语言包括一些本质上存在歧义的语言,并暗示了有界 CFL 和由无歧义多项式时间计数器自动机识别的语言的可处理性;但我们证明,对于非确定性计数器自动机,这个问题可能是 #P 困难的,即使对于只有一个计数器的帕里克自动机也是如此。 然后,我们引入来自知识编译的知识电路类,用于可处理的计数,并表明这涵盖了多项分片无歧义语言和一些不是多项分片无歧义的 CFL 的可处理性。 将这些电路扩展为包含否定进一步允许我们证明原始词语言和两个回文串接语言的可处理性。 最后,我们展示了元问题的条件不可判定性,该元问题询问,给定一个 CFG,该 CFG 的概率成员问题是否是可处理的或 #P 困难的。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.