Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > stat > arXiv:2507.10945

帮助 | 高级搜索

统计学 > 方法论

arXiv:2507.10945 (stat)
[提交于 2025年7月15日 ]

标题: 大规模选择集和样本量下的多项式概率模型的可扩展变分推断

标题: Scalable Variational Inference for Multinomial Probit Models under Large Choice Sets and Sample Sizes

Authors:Gyeongjun Kim, Yeseul Kang, Lucas Kock, Prateek Bansal, Keemin Sohn
摘要: 多元概率模型(MNP)由于能够捕捉不同选择之间的灵活替代模式,被广泛用于分析分类结果。在高维选择设置中,传统的基于似然和马尔可夫链蒙特卡洛(MCMC)估计器变得计算上不可行。本研究引入了一种快速且准确的条件变分推断(CVI)方法来校准MNP模型参数,该方法可扩展到大样本和大选择集。使用神经嵌入定义了相关潜在效用上的灵活变分分布,并使用重参数化技巧确保生成协方差矩阵的正定性。所得的CVI估计器类似于变分自编码器,其中变分模型是编码器,MNP的数据生成过程是解码器。采用直接估计和Gumbel SoftMax近似来进行argmax操作以选择具有最高潜在效用的选项。这消除了从高维截断正态分布中抽样的需求,随着选项数量的增长显著降低了计算成本。所提出的方法在参数恢复方面与MCMC相当。它可以在大约28分钟内校准包含20个选项和一百万条观测值的MNP参数,比现有基准快约36倍且更准确。
摘要: The multinomial probit (MNP) model is widely used to analyze categorical outcomes due to its ability to capture flexible substitution patterns among alternatives. Conventional likelihood based and Markov chain Monte Carlo (MCMC) estimators become computationally prohibitive in high dimensional choice settings. This study introduces a fast and accurate conditional variational inference (CVI) approach to calibrate MNP model parameters, which is scalable to large samples and large choice sets. A flexible variational distribution on correlated latent utilities is defined using neural embeddings, and a reparameterization trick is used to ensure the positive definiteness of the resulting covariance matrix. The resulting CVI estimator is similar to a variational autoencoder, with the variational model being the encoder and the MNP's data generating process being the decoder. Straight through estimation and Gumbel SoftMax approximation are adopted for the argmax operation to select an alternative with the highest latent utility. This eliminates the need to sample from high dimensional truncated Gaussian distributions, significantly reducing computational costs as the number of alternatives grows. The proposed method achieves parameter recovery comparable to MCMC. It can calibrate MNP parameters with 20 alternatives and one million observations in approximately 28 minutes roughly 36 times faster and more accurate than the existing benchmarks in recovering model parameters.
评论: 35页,19图
主题: 方法论 (stat.ME)
引用方式: arXiv:2507.10945 [stat.ME]
  (或者 arXiv:2507.10945v1 [stat.ME] 对于此版本)
  https://doi.org/10.48550/arXiv.2507.10945
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Keemin Sohn [查看电子邮件]
[v1] 星期二, 2025 年 7 月 15 日 03:17:13 UTC (5,896 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
stat
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-07
切换浏览方式为:
stat.ME

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号