基于优先记忆库结合竞争深度Q网络的动态功率控制

被引:9
作者
叶梓峰
王永华
万频
杨贺淞
黄沛濠
机构
[1] 广东工业大学自动化学院
关键词
认知无线网络; 频谱分配; 功率控制; 深度强化学习;
D O I
暂无
中图分类号
TN925 [无线电中继通信、微波通信]; TP273 [自动控制、自动控制系统];
学科分类号
080802 [电力系统及其自动化]; 080904 [电磁场与微波技术];
摘要
针对认知无线电多用户的动态功率控制策略问题,提出了一种基于优先记忆库(Prioritized Experience Replay,PER)结合竞争深度Q网络(Dueling Deep Q Network,Dueling DQN)的功率控制方法。在不知道主用户的控制策略及发射功率情况下,次用户以下垫式接入到主用户信道进行传输任务。微基站收集到的接收信号强度信息作为环境状态信息输入到竞争深度Q网络中,经过训练和学习后,得到次用户的动态功率控制策略。实验结果表明,次用户经过深度强化学习后能够找到最优的功率控制策略,并且在环境参数发生变化时也能快速调整自身的行为和控制策略,提高了频谱利用率和网络能效。
引用
收藏
页码:1132 / 1139
页数:8
相关论文
共 5 条
[1]
认知无线电系统的频谱分配算法研究 [D]. 
廖楚林 .
电子科技大学,
2007
[2]
认知无线网络中基于Stackelberg博弈的功率控制新算法 [J].
朱江 ;
蒋涛涛 .
电讯技术, 2018, 58 (04) :363-369
[3]
Deep Learning for Wireless Physical Layer: Opportunities and Challenges [J].
Tianqi Wang ;
ChaoKai Wen ;
Hanqing Wang ;
Feifei Gao ;
Tao Jiang ;
Shi Jin .
中国通信, 2017, 14 (11) :92-111
[4]
Wireless sensor network survey [J].
Yick, Jennifer ;
Mukherjee, Biswanath ;
Ghosal, Dipak .
COMPUTER NETWORKS, 2008, 52 (12) :2292-2330
[5]
Constrained power control.[J].Sudheer A. Grandhi;Jens Zander;Roy Yates.Wireless Personal Communications.1994, 4