Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:1510.00229

帮助 | 高级搜索

计算机科学 > 计算复杂性

arXiv:1510.00229 (cs)
[提交于 2015年10月1日 ]

标题: 通过预处理生成多项式对数大小的输出来使大规模数据上的问题变得易处理

标题: Making problems tractable on big data via preprocessing with polylog-size output

Authors:Jiannan Yang, Hanpin Wang, Yongzhi Cao
摘要: 为了在经过适当预处理后可以在大数据上实现可行的查询和预处理无帮助的查询之间提供二分法,Fan等人开发了$\sqcap$-可 tractability 理论。该理论为理解大数据背景下查询类的可 tractability 提供了正式的基础。在此基础上,本文引入了一个新的$\sqcap'$-可 tractability 概念。受一些用于处理大数据的技术启发,我们对预处理函数施加了限制,该限制使函数只能产生相对较小的数据库作为输出,最多为输入数据库的多项式对数大小。同时,我们对重新分解数据和查询时的冗余信息进行了限制。这些变化旨在使我们的理论更贴近实际。我们设定了两个复杂度类,分别表示自身为$\sqcap'$-可 tractable 的布尔查询类和可以变为$\sqcap'$-可 tractable 的查询类。基于我们复杂度类中的新分解方法,我们研究了两种归约,这两种归约的不同之处在于是否允许重新分解数据和查询部分。我们验证了归约的传递性和兼容性,并分析了复杂度类的完整问题和大小。我们得出结论,所有布尔查询的PTIME类都可以变为$\sqcap'$-可 tractable,类似于$\sqcap$-可 tractability 理论的情况。 带着一点惊讶,我们证明了所有$\sqcap'$-可处理查询的集合严格小于所有$\sqcap$-可处理查询的集合,因此所有$\sqcap'$-可处理查询的集合是 PTIME 查询集合的真子集。 以这种方式,我们在 PTIME 查询的复杂度类内部获得了一个新的复杂度类。
摘要: To provide a dichotomy between those queries that can be made feasible on big data after appropriate preprocessing and those for which preprocessing does not help, Fan et al. developed the $\sqcap$-tractability theory. This theory provides a formal foundation for understanding the tractability of query classes in the context of big data. Along this line, we introduce a novel notion of $\sqcap'$-tractability in this paper. Inspired by some technologies used to deal big data, we place a restriction on preprocessing function, which limits the function to produce a relatively small database as output, at most polylog-size of the input database. At the same time, we bound the redundancy information when re-factorizing data and queries for preprocessing. These changes aim to make our theory more closely linked to practice. We set two complexity classes to denote the classes of Boolean queries that are $\sqcap'$-tractable themselves and that can be made $\sqcap'$-tractable, respectively. Based on a new factorization in our complexity classes, we investigate two reductions, which differ from whether allowing re-factorizing data and query parts. We verify the transitive and compatible properties of the reductions and analysis the complete problems and sizes of the complexity classes. We conclude that all PTIME classes of Boolean queries can be made $\sqcap'$-tractable, similar to that of the $\sqcap$-tractability theory. With a little surprise, we prove that the set of all $\sqcap'$-tractable queries is strictly smaller than that of all $\sqcap$-tractable queries, and thus the set of $\sqcap'$-tractable queries is properly contained in that of PTIME queries. In this way, we attain a new complexity class inside the complexity class of PTIME queries.
评论: 16页,2图
主题: 计算复杂性 (cs.CC)
引用方式: arXiv:1510.00229 [cs.CC]
  (或者 arXiv:1510.00229v1 [cs.CC] 对于此版本)
  https://doi.org/10.48550/arXiv.1510.00229
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Yongzhi Cao [查看电子邮件]
[v1] 星期四, 2015 年 10 月 1 日 13:43:24 UTC (308 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
cs.CC
< 上一篇   |   下一篇 >
新的 | 最近的 | 2015-10
切换浏览方式为:
cs

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号