高级搜索

虚拟化云无线接入网络下基于在线学习的网络切片虚拟资源分配算法

唐伦 魏延南 马润琳 贺小雨 陈前斌

引用本文: 唐伦, 魏延南, 马润琳, 贺小雨, 陈前斌. 虚拟化云无线接入网络下基于在线学习的网络切片虚拟资源分配算法[J]. 电子与信息学报, 2019, 41(7): 1533-1539. doi: 10.11999/JEIT180771 shu
Citation:  Lun TANG, Yannan WEI, Runlin MA, Xiaoyu HE, Qianbin CHEN. Online Learning-based Virtual Resource Allocation for Network Slicing in Virtualized Cloud Radio Access Network[J]. Journal of Electronics and Information Technology, 2019, 41(7): 1533-1539. doi: 10.11999/JEIT180771 shu

虚拟化云无线接入网络下基于在线学习的网络切片虚拟资源分配算法

    作者简介: 唐伦: 男,1973年生,教授,主要研究方向为下一代无线通信网络、异构蜂窝网络、软件定义无线网络等;
    魏延南: 男,1995年生,硕士生,研究方向为5G网络切片、虚拟资源分配、随机优化理论;
    马润琳: 女,1993年生,硕士生,研究方向为5G网络切片、网络功能虚拟化、无线资源分配;
    贺小雨: 女,1995年生,硕士生,研究方向为5G网络切片、无线网络虚拟化、智能优化理论;
    陈前斌: 男,1967年生,教授,博士生导师,主要研究方向为个人通信、多媒体信息处理与传输、异构蜂窝网络等
    通讯作者: 魏延南,weiyannan_cqupt@163.com
  • 基金项目: 国家自然科学基金(61571073),重庆市教委科学技术研究项目(KJZD-M201800601)

摘要: 针对现有研究中缺乏云无线接入网络(C-RAN)场景下对网络切片高效的动态资源分配方案的问题,该文提出一种虚拟化C-RAN网络下的网络切片虚拟资源分配算法。首先基于受限马尔可夫决策过程(CMDP)理论建立了一个虚拟化C-RAN场景下的随机优化模型,该模型以最大化平均切片和速率为目标,同时受限于各切片平均时延约束以及网络平均回传链路带宽消耗约束。其次,为了克服CMDP优化问题中难以准确掌握系统状态转移概率的问题,引入决策后状态(PDS)的概念,将其作为一种“中间状态”描述系统在已知动态发生后,但在未知动态发生前所处的状态,其包含了所有与系统状态转移有关的已知信息。最后,提出一种基于在线学习的网络切片虚拟资源分配算法,其在每个离散的资源调度时隙内会根据当前系统状态为每个网络切片分配合适的资源块数量以及缓存资源。仿真结果表明,该算法能有效地满足各切片的服务质量(QoS)需求,降低网络回传链路带宽消耗的压力并同时提升系统吞吐量。

English

    1. [1]

      HOSSAIN E and HASAN M. 5G cellular: Key enabling technologies and research challenges[J]. IEEE Instrumentation & Measurement Magazine, 2015, 18(3): 11–21. doi: 10.1109/MIM.2015.7108393

    2. [2]

      CHECKO A, CHRISTIANSEN H L, YAN Ying, et al. Cloud RAN for mobile networks-A technology overview[J]. IEEE Communications Surveys & Tutorials, 2015, 17(1): 405–426. doi: 10.1109/COMST.2014.2355255

    3. [3]

      NIU Binglai, ZHOU Yong, SHAH-MANSOURI H, et al. A dynamic resource sharing mechanism for cloud radio access networks[J]. IEEE Transactions on Wireless Communications, 2016, 15(12): 8325–8338. doi: 10.1109/TWC.2016.2613896

    4. [4]

      KALIL M, Al-DWEIK A, SHARKH M F A, et al. A framework for joint wireless network virtualization and cloud radio access networks for next generation wireless networks[J]. IEEE Access, 2017, 5: 20814–20827. doi: 10.1109/ACCESS.2017.2746666

    5. [5]

      BERTSEKAS D and GALLAGER R. Data Networks[M]. Englewood Cliffs: Prentice-Hall, 1991, 152–162.

    6. [6]

      YANG Jian, ZHANG Shuben, WU Xiaomin, et al. Online learning-based server provisioning for electricity cost reduction in data center[J]. IEEE Transactions on Control Systems Technology, 2017, 25(3): 1044–1051. doi: 10.1109/TCST.2016.2575801

    7. [7]

      KALIL M, SHAMI A, and YE Yinghua. Wireless resources virtualization in LTE systems[C]. Proceedings of 2014 IEEE Conference on Computer Communications Workshops, Toronto, Canada, 2014: 363–368. doi: 10.1109/INFCOMW.2014.6849259.

    8. [8]

      POWELL W B. Approximate Dynamic Programming: Solving the Curses of Dimensionality[M]. Hoboken, USA: Wiley, 2011, 289–388.

    9. [9]

      LAKSHMINARAYANAN C and BHATNAGAR S. Approximate dynamic programming with (min, +) linear function approximation for Markov decision processes[J]. arXiv preprint arXiv: 1403.4179, 2014.

    10. [10]

      LI Rongpeng, ZHAO Zhifeng, CHEN Xianfu, et al. TACT: A transfer actor-critic learning framework for energy saving in cellular radio access networks[J]. IEEE Transactions on Wireless Communications, 2014, 13(4): 2000–2011. doi: 10.1109/TWC.2014.022014.130840

    11. [11]

      HE Xiaoming, WANG Kun, HUANG Huawei, et al. Green resource allocation based on deep reinforcement learning in content-centric IoT[J]. IEEE Transactions on Emerging Topics in Computing, 2019. doi: 10.1109/TETC.2018.2805718

    1. [1]

      缪祥华, 单小撤. 基于密集连接卷积神经网络的入侵检测技术研究. 电子与信息学报, 2020, 41(0): 1-7.

    2. [2]

      游凌, 李伟浩, 张文林, 王科人. 基于深度神经网络的Morse码自动译码算法. 电子与信息学报, 2020, 41(0): 1-6.

    3. [3]

      向敏, 饶华阳, 张进进, 陈梦鑫. 基于GCN的软件定义电力通信网络路由控制策略. 电子与信息学报, 2020, 42(0): 1-8.

    4. [4]

      李劲松, 彭建华, 刘树新, 季新生. 一种基于线性规划的有向网络链路预测方法. 电子与信息学报, 2020, 41(0): 1-9.

  • 图 1  虚拟化C-RAN网络系统场景

    图 2  不同平均时延约束下的平均切片和速率

    图 3  不同平均时延约束下的平均切片总时延

    图 4  不同数据包到达率${\lambda _1}$下的平均切片和速率

    图 5  不同数据包到达率${\lambda _1}$下的平均切片总时延

    表 1  虚拟化C-RAN网络下基于在线学习的网络切片虚拟资源分配算法

     输入 系统状态空间$C$,动作空间$A$,拉格朗日回报函数
    $g({c_t}, {\text{π}} ({c_t}))$,有限信道状态集合${\text{H}}$。
     初始化:初始化决策后状态的状态值函数${\tilde V_0}(\tilde c) \in R, \forall \tilde c \in C\,$,令
    $t \leftarrow 0$, ${c_t} \leftarrow c \in C\,$。
     学习阶段:
      (1) 求解
    ${a_t} = \mathop {\arg \min }\limits_{a \in A} \left\{ {g({c_t}, a) + \gamma {{\tilde V}_t}({S^{M, a}}({c_t}, a))} \right\}$; (27)
      (2) 观察PDS状态${\tilde c_t}$和下一时隙状态${c_{t + 1}}$:${\tilde c_t} = {S^{M, a}}({c_t}, {a_t})$,
    ${c_{t + 1}} = {S^{M, W}}({\tilde c_t}, {{\text{A}}_t}, {{\text{H}}_{t + 1}})$;
      (3) 计算${c_{t + 1}}$的状态值函数:
       ${V_t}({c_{t + 1}}) = \mathop {\min }\limits_{a \in A} \left\{ {g({c_{t + 1}}, a) + \gamma {{\tilde V}_t}({S^{M, a}}({c_{t + 1}}, a))} \right\}$; (28)
      (4) 更新${\tilde V_{t + 1}}({\tilde c_t})$:
       ${\tilde V_{t + 1}}({\tilde c_t}) = (1 - {\alpha _t}){\tilde V_t}({\tilde c_t}) + {\alpha _t}{V_t}({c_{t + 1}})$;      (29)
      (5) 利用随机次梯度法更新拉格朗日乘子${\text{β}} :{\beta _i} \ge 0$。
     输出 最优策略${\text{π}} _{{\rm{PDS}}}^ * $。
    下载: 导出CSV

    表 2  仿真参数

    仿真参数
    远端射频头(RRH)最大发射功率20 dBm
    各切片最大队列长度${Q_{s, \max }}$20 packets
    噪声功率谱密度–174 dBm/Hz
    数据包大小$L$4 kbit/packet
    路径损耗模型104.5+20lg(d) (d[km])
    时隙长度$\tau $1 ms
    下载: 导出CSV
  • 加载中
图(5)表(2)
计量
  • PDF下载量:  74
  • 文章访问数:  1094
  • HTML全文浏览量:  550
文章相关
  • 通讯作者:  魏延南, weiyannan_cqupt@163.com
  • 收稿日期:  2018-08-03
  • 录用日期:  2019-02-20
  • 网络出版日期:  2019-03-19
  • 刊出日期:  2019-07-01
通讯作者: 陈斌, bchen63@163.com
  • 1. 

    沈阳化工大学材料科学与工程学院 沈阳 110142

  1. 本站搜索
  2. 百度学术搜索
  3. 万方数据库搜索
  4. CNKI搜索

/

返回文章