Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2501.06410

帮助 | 高级搜索

计算机科学 > 机器学习

arXiv:2501.06410 (cs)
[提交于 2025年1月11日 ]

标题: 低空MEC的任务延迟和能耗最小化通过进化多目标深度强化学习

标题: Task Delay and Energy Consumption Minimization for Low-altitude MEC via Evolutionary Multi-objective Deep Reinforcement Learning

Authors:Geng Sun, Weilong Ma, Jiahui Li, Zemin Sun, Jiacheng Wang, Dusit Niyato, Shiwen Mao
摘要: 低空经济(LAE),由无人机(UAV)和其他飞行器驱动,已经彻底改变了交通、农业和环境监测等领域。 在即将到来的第六代(6G)时代, 无人机辅助的移动边缘计算(MEC)在山区或受灾等困难环境中尤为重要。 计算任务卸载问题是无人机辅助MEC中的关键问题,主要解决最小化任务延迟和无人机能耗之间的权衡。 在本文中,我们考虑了一个无人机辅助MEC系统,其中无人机携带边缘服务器以帮助地面设备(GDs)进行任务卸载,并制定一个计算延迟和能耗多目标优化问题(CDECMOP),以同时提高系统的性能并降低成本。 然后,通过将制定的问题建模为多目标马尔可夫决策过程(MOMDP),我们在进化框架内提出了一种多目标深度强化学习(DRL)算法,以动态调整权重并获得非支配策略。 此外,为了确保稳定的收敛并提高性能,我们结合了一种目标分布学习(TDL)算法。 仿真结果表明,所提出的算法能够更好地平衡多个优化目标,并相比其他方法获得更优的非支配解。
摘要: The low-altitude economy (LAE), driven by unmanned aerial vehicles (UAVs) and other aircraft, has revolutionized fields such as transportation, agriculture, and environmental monitoring. In the upcoming six-generation (6G) era, UAV-assisted mobile edge computing (MEC) is particularly crucial in challenging environments such as mountainous or disaster-stricken areas. The computation task offloading problem is one of the key issues in UAV-assisted MEC, primarily addressing the trade-off between minimizing the task delay and the energy consumption of the UAV. In this paper, we consider a UAV-assisted MEC system where the UAV carries the edge servers to facilitate task offloading for ground devices (GDs), and formulate a calculation delay and energy consumption multi-objective optimization problem (CDECMOP) to simultaneously improve the performance and reduce the cost of the system. Then, by modeling the formulated problem as a multi-objective Markov decision process (MOMDP), we propose a multi-objective deep reinforcement learning (DRL) algorithm within an evolutionary framework to dynamically adjust the weights and obtain non-dominated policies. Moreover, to ensure stable convergence and improve performance, we incorporate a target distribution learning (TDL) algorithm. Simulation results demonstrate that the proposed algorithm can better balance multiple optimization objectives and obtain superior non-dominated solutions compared to other methods.
主题: 机器学习 (cs.LG) ; 神经与进化计算 (cs.NE); 网络与互联网架构 (cs.NI)
引用方式: arXiv:2501.06410 [cs.LG]
  (或者 arXiv:2501.06410v1 [cs.LG] 对于此版本)
  https://doi.org/10.48550/arXiv.2501.06410
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Jiahui Li [查看电子邮件]
[v1] 星期六, 2025 年 1 月 11 日 02:32:42 UTC (5,179 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
cs.LG
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-01
切换浏览方式为:
cs
cs.NE
cs.NI

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号