Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2505.00321v1

帮助 | 高级搜索

计算机科学 > 网络与互联网架构

arXiv:2505.00321v1 (cs)
[提交于 2025年5月1日 ]

标题: 边缘大型人工智能模型:革命性6G网络

标题: Edge Large AI Models: Revolutionizing 6G Networks

Authors:Zixin Wang, Yuanming Shi, Yong Zhou, Jingyang Zhu, Khaled. B. Letaief
摘要: 大型人工智能模型(LAMs)具备类似人类的能力,能够解决各种现实世界中的问题,展示了各领域和模态专家的潜力。通过利用地理分布的边缘设备的通信和计算能力,边缘LAM成为了一项使能技术,能够支持在6G中提供各种实时智能服务。 与主要使用小型模型支持单一任务的传统边缘人工智能(AI)不同,边缘LAM的特点在于需要对大型模型进行分解和分布式部署,并且能够支持高度泛化和多样化的任务。 然而,由于无线网络中的通信、计算和存储资源有限,大量的可训练神经元和显著的通信开销构成了边缘LAM实际部署的巨大障碍。 本文从模型分解和资源配置的角度探讨了边缘LAM的机会和挑战。具体而言,我们提出了协作微调和全参数训练框架,以及辅助推理架构,以增强边缘LAM在无线网络中的部署。 此外,我们研究了边缘LAM在空口设计中的应用,重点关注信道预测和波束成形。 这些创新的框架和应用为推进6G技术提供了有价值的见解和解决方案。
摘要: Large artificial intelligence models (LAMs) possess human-like abilities to solve a wide range of real-world problems, exemplifying the potential of experts in various domains and modalities. By leveraging the communication and computation capabilities of geographically dispersed edge devices, edge LAM emerges as an enabling technology to empower the delivery of various real-time intelligent services in 6G. Unlike traditional edge artificial intelligence (AI) that primarily supports a single task using small models, edge LAM is featured by the need of the decomposition and distributed deployment of large models, and the ability to support highly generalized and diverse tasks. However, due to limited communication, computation, and storage resources over wireless networks, the vast number of trainable neurons and the substantial communication overhead pose a formidable hurdle to the practical deployment of edge LAMs. In this paper, we investigate the opportunities and challenges of edge LAMs from the perspectives of model decomposition and resource management. Specifically, we propose collaborative fine-tuning and full-parameter training frameworks, alongside a microservice-assisted inference architecture, to enhance the deployment of edge LAM over wireless networks. Additionally, we investigate the application of edge LAM in air-interface designs, focusing on channel prediction and beamforming. These innovative frameworks and applications offer valuable insights and solutions for advancing 6G technology.
主题: 网络与互联网架构 (cs.NI) ; 机器学习 (cs.LG); 信号处理 (eess.SP)
引用方式: arXiv:2505.00321 [cs.NI]
  (或者 arXiv:2505.00321v1 [cs.NI] 对于此版本)
  https://doi.org/10.48550/arXiv.2505.00321
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Zixin Wang [查看电子邮件]
[v1] 星期四, 2025 年 5 月 1 日 05:44:00 UTC (595 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
cs.NI
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-05
切换浏览方式为:
cs
cs.LG
eess
eess.SP

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号