Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > stat > arXiv:1706.00103

帮助 | 高级搜索

统计学 > 方法论

arXiv:1706.00103 (stat)
[提交于 2017年5月31日 ]

标题: 从模式化的响应依赖性到结构化的协变量依赖性:类别模式匹配

标题: From patterned response dependency to structured covariate dependency: categorical-pattern-matching

Authors:Hsieh Fushing, Shan-Yu Liu, Yin-Chen Hsieh, Brenda McCowan
摘要: 来自感兴趣系统的数据通常由多个响应和协变量特征的受试者集合测量值组成,自然表示为一个响应矩阵与一个协变量矩阵相对应。 很可能这两个矩阵同时涵盖了异构数据类型:连续型、离散型和类别型。 这里使用矩阵作为一种实用平台,以理想方式在其格点上保持受试者之间以及特征之间的隐藏依赖关系完整。 响应和协变量依赖性通过一种新开发的计算范式——数据力学,分别进行计算并通过多尺度块表达。 我们提出了一种基于分类模式匹配的方法,用于以信息流的形式建立从模式化响应依赖性到结构化协变量依赖性的因果联系。 信息流的强度通过组合信息论来评估。 这个用于系统知识发现的统一平台通过五个数据集进行了说明。 在每个说明性案例中,通过出现的可见可读异质性展示了信息流如何作为发现的知识位点的组织形式。 这种统一方法从根本上解决了数据分析中的许多长期存在的问题,包括统计建模、多响应、重整化和特征选择,但没有涉及人为结构和分布假设。 这里报告的结果增强了这样一个观点:将响应依赖性的模式与协变量依赖性的结构联系起来,是科学领域数据驱动计算和学习的真正哲学基础。
摘要: Data generated from a system of interest typically consists of measurements from an ensemble of subjects across multiple response and covariate features, and is naturally represented by one response-matrix against one covariate-matrix. Likely each of these two matrices simultaneously embraces heterogeneous data types: continuous, discrete and categorical. Here a matrix is used as a practical platform to ideally keep hidden dependency among/between subjects and features intact on its lattice. Response and covariate dependency is individually computed and expressed through mutliscale blocks via a newly developed computing paradigm named Data Mechanics. We propose a categorical pattern matching approach to establish causal linkages in a form of information flows from patterned response dependency to structured covariate dependency. The strength of an information flow is evaluated by applying the combinatorial information theory. This unified platform for system knowledge discovery is illustrated through five data sets. In each illustrative case, an information flow is demonstrated as an organization of discovered knowledge loci via emergent visible and readable heterogeneity. This unified approach fundamentally resolves many long standing issues, including statistical modeling, multiple response, renormalization and feature selections, in data analysis, but without involving man-made structures and distribution assumptions. The results reported here enhance the idea that linking patterns of response dependency to structures of covariate dependency is the true philosophical foundation underlying data-driven computing and learning in sciences.
评论: 32页,10幅图,3张插图
主题: 方法论 (stat.ME)
引用方式: arXiv:1706.00103 [stat.ME]
  (或者 arXiv:1706.00103v1 [stat.ME] 对于此版本)
  https://doi.org/10.48550/arXiv.1706.00103
通过 DataCite 发表的 arXiv DOI
相关 DOI: https://doi.org/10.1371/journal.pone.0198253
链接到相关资源的 DOI

提交历史

来自: Shan-Yu Liu [查看电子邮件]
[v1] 星期三, 2017 年 5 月 31 日 21:43:36 UTC (879 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
stat.ME
< 上一篇   |   下一篇 >
新的 | 最近的 | 2017-06
切换浏览方式为:
stat

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号