Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2510.08127

帮助 | 高级搜索

计算机科学 > 形式语言与自动机理论

arXiv:2510.08127 (cs)
[提交于 2025年10月9日 ]

标题: 关于概率词语言成员关系的复杂性

标题: On the Complexity of Language Membership for Probabilistic Words

Authors:Antoine Amarilli, Mikaël Monet, Paul Raphaël, Sylvain Salvati
摘要: 我们研究在概率词上上下文无关语言 L(CFL)的成员问题,这些概率词为每个位置指定一个字母的概率分布(假设各位置之间相互独立)。 我们的任务是,给定一个概率词,计算根据该分布生成的词属于 L 的概率。这个问题推广了计算长度为 n 的词中有多少属于 L 的问题,或者计算部分词的完成中有多少属于 L 的问题。 我们证明,对于无歧义上下文无关语言(uCFLs),这个问题可以在多项式时间内解决,但对于两个线性 uCFL 的并集,可能已经是 #P 困难的。 更一般地,我们证明对于所谓的多项分片无歧义语言,这个问题可以在多项式时间内解决,其中给定长度 n,可以高效计算出该语言中长度为 n 的词的 uCFL。 这类语言包括一些本质上存在歧义的语言,并暗示了有界 CFL 和由无歧义多项式时间计数器自动机识别的语言的可处理性;但我们证明,对于非确定性计数器自动机,这个问题可能是 #P 困难的,即使对于只有一个计数器的帕里克自动机也是如此。 然后,我们引入来自知识编译的知识电路类,用于可处理的计数,并表明这涵盖了多项分片无歧义语言和一些不是多项分片无歧义的 CFL 的可处理性。 将这些电路扩展为包含否定进一步允许我们证明原始词语言和两个回文串接语言的可处理性。 最后,我们展示了元问题的条件不可判定性,该元问题询问,给定一个 CFG,该 CFG 的概率成员问题是否是可处理的或 #P 困难的。
摘要: We study the membership problem to context-free languages L (CFLs) on probabilistic words, that specify for each position a probability distribution on the letters (assuming independence across positions). Our task is to compute, given a probabilistic word, what is the probability that a word drawn according to the distribution belongs to L. This problem generalizes the problem of counting how many words of length n belong to L, or of counting how many completions of a partial word belong to L. We show that this problem is in polynomial time for unambiguous context-free languages (uCFLs), but can be #P-hard already for unions of two linear uCFLs. More generally, we show that the problem is in polynomial time for so-called poly-slicewise-unambiguous languages, where given a length n we can tractably compute an uCFL for the words of length n in the language. This class includes some inherently ambiguous languages, and implies the tractability of bounded CFLs and of languages recognized by unambiguous polynomial-time counter automata; but we show that the problem can be #P-hard for nondeterministic counter automata, even for Parikh automata with a single counter. We then introduce classes of circuits from knowledge compilation which we use for tractable counting, and show that this covers the tractability of poly-slicewise-unambiguous languages and of some CFLs that are not poly-slicewise-unambiguous. Extending these circuits with negation further allows us to show tractability for the language of primitive words, and for the language of concatenations of two palindromes. We finally show the conditional undecidability of the meta-problem that asks, given a CFG, whether the probabilistic membership problem for that CFG is tractable or #P-hard.
评论: 35页,包括1页标题页、15页正文、4页参考文献和附录
主题: 形式语言与自动机理论 (cs.FL)
引用方式: arXiv:2510.08127 [cs.FL]
  (或者 arXiv:2510.08127v1 [cs.FL] 对于此版本)
  https://doi.org/10.48550/arXiv.2510.08127
通过 DataCite 发表的 arXiv DOI(待注册)

提交历史

来自: Antoine Amarilli [查看电子邮件]
[v1] 星期四, 2025 年 10 月 9 日 12:13:34 UTC (261 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
许可图标 查看许可
当前浏览上下文:
cs.FL
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-10
切换浏览方式为:
cs

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号