Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > econ > arXiv:2505.23025v1

帮助 | 高级搜索

经济学 > 一般经济学

arXiv:2505.23025v1 (econ)
[提交于 2025年5月29日 ]

标题: 学习调控:资本控制措施的新事件级数据集

标题: Learning to Regulate: A New Event-Level Dataset of Capital Control Measures

Authors:Geyue Sun, Xiao Liu, Tomas Williams, Roberto Samaniego
摘要: 我们利用基于提示的大型语言模型(LLMs),构建了一个新颖的事件级资本管制措施(CCM)数据集,涵盖从1999年到2023年的196个国家。 该数据集支持基于丰富政策属性(包括行动类型、强度、方向、实施实体及其他多维特征)的事件研究分析和跨国比较。 使用GPT-4.1的两步提示框架,我们从国际货币基金组织(IMF)的《汇率安排与外汇限制年度报告》(AREAER)中提取结构化信息,生成了5,198个资本管制事件,包含27个标注字段及相关模型推理。 其次,为了促进实时分类和外部资源扩展,我们微调了一个开源的Meta Llama 3.1-8B模型,命名为CCM-Llama,训练数据来自AREAER变更日志和最终状态报告。 该模型在类别分类上的准确率为90.09%,在状态预测上的准确率为99.55%。 最后,我们在一个实证应用中使用了CCM数据集:对中国、澳大利亚和美国进行了事件研究。 结果显示,向内资本管制措施显著减少了一个月内的资金流入,且限制性政策的效果往往强于自由化政策,各国之间存在显著异质性。 我们的工作通过提供一个新颖的高频政策数据集以及从多样化和动态变化的信息源自动分类资本管制事件的可复制框架,为经济学领域中LLMs的应用文献做出了贡献。
摘要: We construct a novel event-level Capital Control Measures (CCM) dataset covering 196 countries from 1999 to 2023 by leveraging prompt-based large language models (LLMs). The dataset enables event study analysis and cross-country comparisons based on rich policy attributes, including action type, intensity, direction, implementing entity, and other multidimensional characteristics. Using a two-step prompt framework with GPT-4.1, we extract structured information from the IMF's Annual Report on Exchange Arrangements and Exchange Restrictions (AREAER), resulting in 5,198 capital control events with 27 annotated fields and corresponding model reasoning. Secondly, to facilitate real-time classification and extension to external sources, we fine-tune an open-source Meta Llama 3.1-8B model, named CCM-Llama, trained on AREAER change logs and final status reports. The model achieves 90.09\% accuracy in category classification and 99.55\% in status prediction. Finally, we apply the CCM dataset in an empirical application: an event study on China, Australia, and the US. The results show that inward capital control measures significantly reduce fund inflows within one month, and restrictive policies tend to have stronger effects than liberalizing ones, with notable heterogeneity across countries. Our work contributes to the growing literature on the use of LLMs in economics by providing both a novel high-frequency policy dataset and a replicable framework for automated classification of capital control events from diverse and evolving information sources.
评论: 进行中
主题: 一般经济学 (econ.GN)
引用方式: arXiv:2505.23025 [econ.GN]
  (或者 arXiv:2505.23025v1 [econ.GN] 对于此版本)
  https://doi.org/10.48550/arXiv.2505.23025
通过 DataCite 发表的 arXiv DOI(待注册)

提交历史

来自: Geyue Sun [查看电子邮件]
[v1] 星期四, 2025 年 5 月 29 日 03:11:46 UTC (3,974 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
econ.GN
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-05
切换浏览方式为:
econ
q-fin
q-fin.EC

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号