Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > physics > arXiv:2311.06310

帮助 | 高级搜索

物理学 > 物理与社会

arXiv:2311.06310 (physics)
[提交于 2023年11月9日 (v1) ,最后修订 2024年2月27日 (此版本, v3)]

标题: 劳动空间:通过大型语言模型对劳动力市场的统一表示

标题: Labor Space: A Unifying Representation of the Labor Market via Large Language Models

Authors:Seongwoon Kim, Yong-Yeol Ahn, Jaehyuk Park
摘要: 劳动力市场是一个由多种相互关联的实体组成的复杂生态系统,如行业、职业、技能和公司。 由于缺乏系统的方法来将这些异构实体整合在一起,每个实体都被孤立分析,或者仅通过成对关系进行分析,这阻碍了对整个生态系统的全面理解。 在此,我们引入了$\textit{Labor Space}$,这是一种通过微调大型语言模型得到的异构劳动力市场实体的向量空间嵌入。 劳动空间揭示了各种劳动力市场组成成分的复杂关系网络,促进了对行业、职业、技能和公司的连贯综合分析,同时保留了类型特定的聚类。 我们展示了其前所未有的分析能力,包括在经济轴上定位异构实体,例如 `制造业--医疗保健'。 此外,通过允许这些实体的向量运算,劳动空间能够探索复杂的单元间关系,并随后估计经济冲击对单个单元及其在整个劳动力市场中的连锁反应的影响。 我们认为,劳动空间为政策制定者和企业领导者提供了劳动力市场分析和模拟的全面统一框架,促进了更细致和有效的战略决策。
摘要: The labor market is a complex ecosystem comprising diverse, interconnected entities, such as industries, occupations, skills, and firms. Due to the lack of a systematic method to map these heterogeneous entities together, each entity has been analyzed in isolation or only through pairwise relationships, inhibiting comprehensive understanding of the whole ecosystem. Here, we introduce $\textit{Labor Space}$, a vector-space embedding of heterogeneous labor market entities, derived through applying a large language model with fine-tuning. Labor Space exposes the complex relational fabric of various labor market constituents, facilitating coherent integrative analysis of industries, occupations, skills, and firms, while retaining type-specific clustering. We demonstrate its unprecedented analytical capacities, including positioning heterogeneous entities on an economic axes, such as `Manufacturing--Healthcare'. Furthermore, by allowing vector arithmetic of these entities, Labor Space enables the exploration of complex inter-unit relations, and subsequently the estimation of the ramifications of economic shocks on individual units and their ripple effect across the labor market. We posit that Labor Space provides policymakers and business leaders with a comprehensive unifying framework for labor market analysis and simulation, fostering more nuanced and effective strategic decision-making.
评论: 11页,5图
主题: 物理与社会 (physics.soc-ph) ; 人工智能 (cs.AI)
引用方式: arXiv:2311.06310 [physics.soc-ph]
  (或者 arXiv:2311.06310v3 [physics.soc-ph] 对于此版本)
  https://doi.org/10.48550/arXiv.2311.06310
通过 DataCite 发表的 arXiv DOI
相关 DOI: https://doi.org/10.1145/3589334.3645464
链接到相关资源的 DOI

提交历史

来自: Seongwoon Kim [查看电子邮件]
[v1] 星期四, 2023 年 11 月 9 日 06:41:10 UTC (1,562 KB)
[v2] 星期一, 2023 年 11 月 20 日 06:22:21 UTC (1,562 KB)
[v3] 星期二, 2024 年 2 月 27 日 01:20:07 UTC (2,109 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
physics.soc-ph
< 上一篇   |   下一篇 >
新的 | 最近的 | 2023-11
切换浏览方式为:
cs
cs.AI
physics

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号