Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > stat > arXiv:1106.1451

帮助 | 高级搜索

统计学 > 方法论

arXiv:1106.1451 (stat)
[提交于 2011年6月7日 (v1) ,最后修订 2011年6月16日 (此版本, v2)]

标题: 基于数据的成分数据幂变换

标题: A data-based power transformation for compositional data

Authors:Michail T. Tsagris, Simon Preston, Andrew T.A. Wood
摘要: 成分数据分析要么通过忽略成分约束并应用标准多元数据分析,要么通过对分量比的对数变换来转换数据。 在这项工作中,我们考察了一种更通用的变换,它包含了这两种方法作为特殊情况。 这是一种幂变换,并且涉及一个单一参数 {\alpha }。 这种变换有两个等价版本。 第一个是保持在单纯形中的版本,即 Aitchison 在 1986 年定义的幂变换。 第二个版本是这种幂变换的线性变换,是一种 Box-Cox 类型的变换。 我们讨论了一种估计 {\alpha } 值的参数化方法,即最大化其轮廓似然(假设变换后的数据服从多元正态分布),并展示了两种版本之间的等价性。 其他方法包括判别分析中的正确分类概率最大化以及线性回归中 Aitchison 在 1986 年定义的伪 \( R^2 \) 的最大化。 我们研究了 {\alpha }-变换、原始数据方法和等距对数比变换之间的关系。 此外,我们还定义了与 {\alpha }-变换族相对应的一组合适的度量,并考虑了相应的 Fréchet 均值族。
摘要: Compositional data analysis is carried out either by neglecting the compositional constraint and applying standard multivariate data analysis, or by transforming the data using the logs of the ratios of the components. In this work we examine a more general transformation which includes both approaches as special cases. It is a power transformation and involves a single parameter, {\alpha}. The transformation has two equivalent versions. The first is the stay-in-the-simplex version, which is the power transformation as defined by Aitchison in 1986. The second version, which is a linear transformation of the power transformation, is a Box-Cox type transformation. We discuss a parametric way of estimating the value of {\alpha}, which is maximization of its profile likelihood (assuming multivariate normality of the transformed data) and the equivalence between the two versions is exhibited. Other ways include maximization of the correct classification probability in discriminant analysis and maximization of the pseudo R-squared (as defined by Aitchison in 1986) in linear regression. We examine the relationship between the {\alpha}-transformation, the raw data approach and the isometric log-ratio transformation. Furthermore, we also define a suitable family of metrics corresponding to the family of {\alpha}-transformation and consider the corresponding family of Frechet means.
评论: 发表于第四届国际组合数据分析研讨会 proceedings 中 http://congress.cimne.com/codawork11/frontal/default.asp
主题: 方法论 (stat.ME)
引用方式: arXiv:1106.1451 [stat.ME]
  (或者 arXiv:1106.1451v2 [stat.ME] 对于此版本)
  https://doi.org/10.48550/arXiv.1106.1451
通过 DataCite 发表的 arXiv DOI
期刊参考: Proceedings of CoDaWork'11: 4th international workshop on Compositional Data Analysis, Egozcue, J.J., Tolosana-Delgado, R. and Ortego, M.I. (eds.) 2011. ISBN: 978-84-87867-76-7

提交历史

来自: Tsagris Michail [查看电子邮件]
[v1] 星期二, 2011 年 6 月 7 日 20:35:58 UTC (11 KB)
[v2] 星期四, 2011 年 6 月 16 日 11:56:33 UTC (11 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
stat.ME
< 上一篇   |   下一篇 >
新的 | 最近的 | 2011-06
切换浏览方式为:
stat

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号