实验室博士生张帆的论文被国际顶级期刊 ieee transactions on network science and engineering (if=3.894)录用,祝贺!
deep reinforcement learning based cooperative partial task offloading and resource allocation for iiot applications
ieee transactions on network science and engineering,
2022 (sci index, if=3.894)
工业物联网(iiot)被认为是支撑工业4.0范式的支柱之一。与传统的云计算方案相比,边缘计算为缓解回程链路和核心网络的拥塞提供了一种有效的z6尊龙旗舰厅的解决方案,同时满足了计算密集型和时延敏感型iiot应用的实时性、安全性和可靠性要求。现有研究只对端-边-云协同任务卸载进行了优化,而忽视了通信和计算资源分配。因此,本文研究了协作式部分任务卸载与资源分配(cptora)的联合优化问题。首先,本文设计了cptora框架,该框架综合考虑了各种iiot设备、本地边缘计算服务器、非本地边缘计算服务器和云计算服务器之间的协作,以平衡本地边缘计算服务器的负载,提高资源利用率。然后,考虑到iiot环境的动态性和不可预测性,将联合优化问题建模为带约束的马尔可夫决策过程。此外,还提出了一种基于改进软actor-critic的cptora算法(isac-cptora),负责为每个iiot设备做出任务卸载和资源分配决策。该算法创新性地将分布式强化学习的思想引入到软actor-critic算法中,有效地减少了q值的高估或低估问题。同时,该算法采用了优先的经验回放,提高了学习效率。大量实验表明,与各种基准框架和算法相比,所提出的cptora框架和isac-cptora算法有效地降低了总的系统成本(即延迟成本和能量成本)。