1.本发明涉及无线传感器网络领域,尤其涉及一种虚拟化无线传感器网络的能耗与时延优化方 法。
背景技术:
2.无线传感器网络作为物联网的感知层,由物理节点、感知对象和观察者组成。此前,以任务为 导向进行物理资源部署的传统无线传感器网络无法满足物联网发展的需求,因此,可改善网络“僵 化”的虚拟化技术被无线传感器网络的研究人员和拥有者广泛关注,继而产生了许多实现虚拟化无 线传感器网络的方案。然而,虚拟化无线传感器网络打破了传统无线传感器网络专网专用的特性, 在资源争用紧张的状态下,必将引发网络拥塞或服务时延高的问题。另外,物理节点部署密集,且 大多采用嵌入式电池共供电,能量耗尽时将无法及时更换电池而退出网络,因此在保障用户的时延 需求的同时需将能源优化放在同等重要的位置。
3.当前,物联网应用多样性特征显著。虚拟化无线传感器网络实现底层物理资源的共享后,单个 物理节点可同时为多个应用终端提供服务,基于此,无线传感器网络的资源利用率得到大幅度地提 高。然而,爆发式增长的时延敏感应用,要求物理节点将监测到的数据迅速回传到应用终端,辅助 下一步行动决策。因此,已有的虚拟化无线传感器网络方案需要考虑资源争用时的优先级排队传输 调度以及有效多跳传输策略。与此同时,为了延长网络寿命,减少物理节点的能量消耗尤为关键。 然而,现有的能量补偿技术大多通过太阳板采集外界能量补充物理节点的能量消耗,具有极大不确 定因素。
技术实现要素:
4.为解决现有技术中的不足,本发明提供一种虚拟化无线传感器网络的能耗与时延优化方法,不 仅解决了虚拟化无线传感器网络中同时承载多个应用,易造成物理节点能量耗尽退出网络的问题, 同时避免了打破传统专网专用的模式后,物理节点发生争用带来的任务积压、高时延等问题,可有 效地平衡物理节点的能量消耗和物理节点传输时带来的网络时延。
5.本发明中主要采用的技术方案为:
6.一种虚拟化无线传感器网络的能耗与时延优化方法,包括如下步骤:
7.s1、应用向虚拟化无线传感器网络发起任务请求,网络服务层中的中央控制器凭借自身的全局 视角,依据物理区域内物理节点的类型、物理节点的剩余能量、物理节点传输的有效距离和物理节 点置信度为帧内接入的应用挑选物理节点,组建虚拟传感网,当单个应用发起请求时,中央控制器 构建一个与之对应的虚拟传感网;当同时有多个应用发起请求时,则构建多个与应用一对一的虚拟 传感网,并将虚拟的计算、存储和通信资源进行迁移和隔离;
8.s2、物理节点时隙划分:物理节点根据自身的负载按比例划分无线能量传输的时
隙和无线信息 传输的时隙;
9.s3、构建物理节点能量消耗模型:根据步骤s2分配到的无线能量传输的时隙,量化各物理节 点收集到的能量,根据物理节点传输各应用数据的功率,量化源节点处传输和多跳传输时产生的能 耗,得到基础设施层的整体能耗;
10.s4、构建网络时延模型:物理节点被争用时承载着多个应用,根据各应用的需求量进行优先级 划分,数据感知完成后,源节点的接收单元记录累计到达量和累计服务量,得到各数据包的到达曲 线和服务曲线,整合应用在多个物理节点上总体的到达曲线和服务曲线,得到协作处理的时延分布, 构建具有服务质量保证的多跳传输链路,结合有效容量和有效带宽得到数据传播时的时延分布;
11.s5、功率分配:根据步骤s3和步骤s4得出的物理节点的能耗模型和应用的请求任务的网络时 延模型,在保障业务时延需求的条件下,最小化基础设施层中物理节点的能量消耗,并基于强化学 习得出最佳的功率分配方案。
12.优选地,所述步骤s2中,以帧作为优化单元,记帧长为t
max
,帧内有k个应用,其集合表示 为a=(a1,a2,
…
,aj,
…
,ak),k个应用共同占用n个物理节点,第j个应用对应的虚拟传感网vsnj包含|sj|个物理节点,其集合表示为物理节点i时隙划分包括以下两个部分:
13.s2-1:划分出下行无线能量传输时隙τh,在这段时间内,簇内物理节点收集簇头发送的射频 信号中包含的能量并将其整流为数据感知和信号传输可利用的形式;
14.s2-2:划分出上行无线信号传输时隙t
max-τh,若k=1,则虚拟传感网内唯一应用独占所有 资源,进行无线信号传输,即表示物理节点i占用帧内除去无线能量传输以外 的时间进行信号传输;若k>1,则表示底层基础设施发生争用,需对发生争用的物理节点进行时 隙分配,物理节点i为应用j分配到的时隙记作
15.优选地,所述步骤s3中,记虚拟化无线传感器网络内各应用的需求矢量为其中,表示第j个应用所需的数据量、表示第j个应用最大延迟容 忍、εj表示第j个应用容忍违规概率,应用提请的需求由虚拟传感网内的虚拟节点共同完成,映射 回物理节点上,其能量消耗模型具体如下:
16.s3-1:基础设施层帧内物理节点因感知数据消耗的能量总和如公式(1)所示:
[0017][0018]
其中,κi表示为第i个物理节点采集1比特数据需要的能量,d
ij
表示基础设施层帧内第i个物 理节点承载网内第j个应用的数据量;考虑数据的冗余度μ,第i个物理节点在帧内需要感知的数 据量为
[0019]
s3-2:根据步骤2-1得到的无线能量传输时隙,结合簇头到物理节点的信道状态以及发送端和 接收端的自身条件,计算发生争用的物理节点因无线能量传输带来的能耗增益如公式(2)所示:
[0020][0021]
其中,τh表示无线能量传输时隙,p0表示簇头的发射功率,hi表示簇头到第i个物理
节点的信 道增益,ζi表示第i个物理节点对射频信号的接收比例,ηi(p0)表示第i个物理节点的转换效率与簇 头发射功率呈非线性关系;
[0022]
s3-3:根据步骤s2-2得到的无线信息传输时隙,结合簇头到物理节点的信道状态,按无线信 息传输时隙累计各应用在各物理节点上带来能量消耗的总和,即为源节点数据发送带来的能量消 耗,如公式(3)所示:
[0023][0024]
其中,p
ij
表示第i个物理节点占用时隙τ
ij
发送应用j所需的数据时对应的功率;
[0025]
s3-4:感知数据从源节点转发时,需要n个簇头作为中继将数据传输到汇聚节点,结合簇头与 簇头之间的信道状态,按跳数累计感知数据在多跳传输阶段带来的能量消耗,其中,第i个物理节 点每跳传输的能耗如公式(4)所示:
[0026][0027]
其中,在第i个物理节点的第k跳时,b
ik
表示信道的带宽,p
ik
表示转发数据时的功率,g
ik
表 示信道增益;
[0028]
则合计基础设施层帧内因多跳传输带来的能量消耗如公式(5)所示:
[0029][0030]
s3-5:综合步骤s3-1-s3-4得到虚拟化无线传感器网络基础设施层单帧的能量消耗总和,即得 到基础设施层物理节点的能耗模型,如公式(6)所示:
[0031]etot
=e
c-eh e
st
e
ht
(6)。
[0032]
优选地,所述步骤s4中网络时延模型的具体构建步骤如下:
[0033]
s4-1、对物理节点上承载的多个应用进行优先级设置,假设物理节点所有采集到的数据都是在 短时间间隔内到达,物理节点i承载的总的数据量为根据应用本身的时延敏感需求得到物理节点上的优先级调度向量其中, 表示优先级最低,针对每个物理节点i都一定存在gi→
a=(a1,a2,
…
,aj,
…
,ak)是一对一满映 射的关系,以gi映射原有的应用请求,得到帧内应用优先级,记为j
′
;
[0034]
s4-2、源节点的接收单元记录物理节点i上各应用感知数据的累计到达量和累计服务量,并以 和分别表示在t时刻物理节点i上应用j的累计到达量和累计输出量,以表示应用j 的数据包在物理节点i上到达等待发送时刻,在该时刻缓冲区没有该应用的数据积压,即必有 [0035]
根据物理节点i上各应用感知数据的累计到达量和累计服务量演算出物理节点i对应各应用部 分数据量的到达曲线和服务曲线,即帧内应用优先级为j
′
的累计到达量为,其到达曲 线满足公式(7):
[0036][0037]
其中,αj′
(0,t)表示优先级为j
′
的应用的到达曲线,θj′
表示优先级为j
′
的应用的自 由优化参数,e[
·
]表示期望,f
1j
′
(x)为优先级为j
′
的应用的到达数据的违约概率函数;
[0038]
针对服务曲线,由于应用由多个节点协同完成,则在一定程度上可视作并联服务模型,但在物 理节点上同时存在多个优先级不同的业务,故考虑整体的服务曲线如下:选取物理节点i上优先级 最低的应用,即优先级为k
′
应用,该应用在物理节点i上请求的数据包在时刻到达,在的时间内,系统总的输出量为存在关系如公式(8)所示:
[0039][0040]
由无积压时存在的关系可得:
[0041][0042]
根据如下数据输入输出约束判断系统是否正常:
[0043][0044]
若不满足式(10),表示输入输出异常,则丢弃数据包,该应用在下一帧再按需接入网络,若 满足式(10),表示输入输出正常,则有:
[0045][0046]
式中,式中,为物理节点i上优先级为j
′
的应用的 数据包在u时段内的累计到达量,且规定[
·
]
=max(
·
,0);当s(u)是广义增函数时,可作 为物理节点i上优先级为k
′
的应用的服务曲线,同理可得任意优先级的应用服务曲线为:
[0047][0048]
其中,表示物理节点i上优先级为j
′
的应用在u时段的服务曲线;
[0049]
根据并联服务器系统特性,得到基础设施层对应用的整体服务曲线β(0,t)和违规概率函数 f2(x)如公式(13)所示:
[0050][0051]
其中,θj′
表示优先级为j
′
的应用的自由优化参数,通过系统稳定条件确定;
[0052]
s4-3、根据步骤4-2得出的整体达到曲线和服务曲线以及对应的违约概率函数,得到源节点传 输阶段业务的时延概率分布函数,即
[0053][0054]
s4-4、数据在进行多跳传输产生的时延是每一跳产生的时延总和,根据业务时延得到对应的 qos保障指数,根据每跳的链路有效容量和有效带宽,得到单跳的时延部分概率分布函数,进而得 到单一路由上感知数据在多跳链路上的时延分布函数,最终选取时延最长路由作为整体传播时延, 在簇头充当中继进行多跳传输时,源节点i涉及的多跳路由带来的传播时延为 其中表示物理节点i在第k跳时产生的传播时延,且 前一个中继节点的服务速率等于下一个中继节点的到达速率,即存在其中,为源节点i在第k跳时需要保障的服务质量参数;为源节点i在第k跳时的链路有效带宽,由 得出;为链路有效容量,由得出;由此得到单跳时延部分分布函数则得出源节点i发出的数据经n跳 后的时延分布函数为:
[0055][0056]
其中,不等式成立的条件为各跳为独立随机过程;
[0057]
应用由多个物理节点协同完成,故在多跳回传数据包时有多条链路,因此,多跳间应用总的时 延分布为
[0058]
s4-6、结合步骤s4-3和s4-4,得到各应用总的时延分布为:
[0059][0060]
其中,g1(x)为源节点传输时延分布的概率密度函数,由获取; g2(x)为多跳传输时延分布的概率密度函数,由g2(x)=d(1-pr{d
hops
>x})/dx获取。
[0061]
优选地,所述步骤s5中,基础设施层中物理节点的最小化能量消耗如下:
[0062]
[0063]
其中,p
ij
表示源节点i传输应用j所请求的数据所采用的功率大小,p
ik
表示源节点i所在路径 在多跳传播的第k跳时的传输功率大小,表示应用j所请求的数据量大小,表示第j个应用 最大延迟容忍,表示应用j数据传输过程中总的时延,εj表示第j个应用容忍违规概率。
[0064]
优选地,所述步骤s5中得出最佳功率分配方案的具体步骤如下:
[0065]
s5-1:根据所需优化的时延-能耗问题,构建包含状态集合、动作集合、状态转移概率、回报 值和折扣因子的马尔可夫决策模型{s,a,p,dr,γ},其中,
[0066]
s={s}表示状态集合,a={a}表示动作集合,p=p(s
t 1
|s
t 1
,a
t
)表示状态转移概率,r表示 回报值,γ表示折扣因子;
[0067]
对于第i个物理节点,其状态表示为si={sv,s
τ
,sd,s
κ
,s
p
,sd},其中sv表示虚拟传感网所属关系,s
τ
表示时间资源分配状态,sd表示承载的业务量,s
κ
,s
p
分别表示物理节点采集和传输的硬件指标, sd表示链路是否满足时延需求,ai={p
ij
,p
ik
},其中,p
ij
表示源物理节点i发送应用j需求数据的 功率,p
ik
表示源物理节点i所在路由簇间多跳时节点k的数据转发功率;
[0068]
s5-2:构建回报值函数其中,e
tot
为优化目标,c为时延的权重系数,为第k个节点带来的传播延迟,为时延无法满足时,对回报值的惩罚;
[0069]
s5-3:构造q函数,其中,γ
t
表示在t时刻的 折扣因子,r
t
(s
t,i
,a
t,i
)表示在t时刻节点i在状态s
t,i
下采取动作a
t,i
的回报值,基于此,采用蚁群系统 方法对智能体进行分组,组内的链路共享信息,并协调各自的策略,对于任意第g组智能体,其等 效q函数如公式(18)所示:
[0070][0071]
其中,ng表示该组中智能体的数量;
[0072]
s5-4:基于深度学习算法得到第g组智能体在状态sg下的最优策略πg(sg),具体策略为:在第 g组智能体中,选取状态sg时带来q值最大的动作ag,即:
[0073][0074]
有益效果:本发明提供一种虚拟化无线传感器网络的能耗与时延优化方法,具有如下优点:
[0075]
(1)在保障业务实时性的同时,减少物理节点的能量消耗,该方法可以有效延长物理节点的 寿命,提升用户体验,具有广阔的运用场景。
[0076]
(2)本发明对发生争用的物理节点进行时隙分配,较大程度避免数据传输发生冲突;
[0077]
(3)本发明采用多智能体协同学习的思路将不同智能体所观察到的局部信息进行共享,提升 网络的整体性能。
附图说明
[0078]
图1为实施例1的系统架构图;
[0079]
图2为实施例1的算法流程图;
[0080]
图3为实施例1中网络的整体通信过程;
[0081]
图4为实施例1强化学习算法示意图。
具体实施方式
[0082]
为了使本技术领域的人员更好地理解本技术中的技术方案,下面对本技术实施例中的技术方案 进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。 基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施 例,都应当属于本技术保护的范围。
[0083]
如图1所示,为本发明的系统架构图,主要包括能量消耗模型和网络时延模型,其中能量消耗模型 的整体能量消耗包括感知数据能耗、无线能量传输能耗增益、源节点数据发送能耗和簇间多跳传输 能耗,网络时延模型的总体时延分布包括簇内排队时延、簇内发送时延和簇内传播时延,基于这两 个模型,本发明在保障业务时延需求的条件下,最小化基础设施层中物理节点的能量消耗,并基于 强化学习得出最佳的功率分配方案。
[0084]
实施例1
[0085]
一种虚拟化无线传感器网络的能耗与时延优化方法,如图2所示,具体步骤如下:
[0086]
s1、应用向虚拟化无线传感器网络发起任务请求,网络服务层中的中央控制器凭借自身的全局 视角,依据物理区域内物理节点的类型、物理节点的剩余能量、物理节点传输的有效距离和物理节 点置信度为帧内接入的应用挑选物理节点,组建虚拟传感网,当单个应用发起请求时,中央控制器 构建一个与之对应的虚拟传感网;当同时有多个应用发起请求时,则构建多个与应用一对一的虚拟 传感网,并将虚拟的计算、存储和通信资源进行迁移和隔离;s2、物理节点时隙划分:以帧作为优 化单元,记帧长为t
max
,帧内有k个应用,其集合表示为a=(a1,a2,
…
,aj,
…
,ak),k个应用共同 占用n个物理节点,中央控制器为每个应用会在n个节点中挑选部分|sj|个节点作为虚拟传感网, 第j个应用对应的虚拟传感网vsnj包含|sj|个物理节点,其集合表示为图3 为本发明中网络的整体通信过程,物理节点i时隙划分包括以下两个部分:
[0087]
s2-1:划分出下行无线能量传输时隙τh,在这段时间内,簇内物理节点收集簇头发送的射频 信号中包含的能量并将其整流为数据感知和信号传输可利用的形式,由此,可以较大程度避免数据 传输发生冲突;
[0088]
s2-2:划分出上行无线信号传输时隙t
max-τh,若k=1,则虚拟传感网内唯一应用独占所有 资源,进行无线信号传输,即表示物理节点i占用帧内除去无线能量传输以外 的时间进行信号传输;若k>1,则表示底层基础设施发生争用,需对发生争用的物理节点进行时 隙分配,物理节点i为应用j分配到的时隙记作
[0089]
s3、构建物理节点能量消耗模型:根据步骤s2分配到的无线能量传输的时隙,物理节点每一 个帧内包含两个阶段无线能量传输的时隙和无线信息传输的时隙,量化各物理节点收集到的能量, 根据物理节点传输各应用数据的功率,量化源节点处传输和多跳传输
时产生的能耗,得到基础设施 层的整体能耗;记虚拟化无线传感器网络内各应用的需求矢量为其中,表示第j个应用所需的数据量(n,是need的缩写,也就是应用需求的数据量)、表示第j个应 用最大延迟容忍、εj表示第j个应用容忍违规概率,应用提请的需求由虚拟传感网内的虚拟节点共 同完成,虚拟链路映射到的物理节点在数据感知、源节点发送、多跳传输均存在能量消耗,另外, 簇头与传感器节点之间的无线能量传输会带来一定的能量增益,其能量消耗模型具体如下:
[0090]
s3-1:基础设施层帧内物理节点因感知数据消耗的能量总和如公式(1)所示:
[0091][0092]
其中,κi表示为第i个物理节点采集1比特数据需要的能量,d
ij
表示基础设施层帧内第i个物 理节点承载网内第j个应用的数据量;考虑数据的冗余度μ,第i个物理节点在帧内需要感知的数 据量为
[0093]
s3-2:根据步骤2-1得到的无线能量传输时隙,结合簇头到物理节点的信道状态以及发送端和 接收端的自身条件,计算发生争用的物理节点因无线能量传输带来的能耗增益如公式(2)所示:
[0094][0095]
其中,τh表示无线能量传输时隙(在一个帧内,所有参与服务的物理节点的无线能量传输时 隙都是τh),p0表示簇头的发射功率,hi表示簇头到第i个物理节点的信道增益,ζi表示第i个物 理节点对射频信号的接收比例,ηi(p0)表示第i个物理节点的转换效率与簇头发射功率呈非线性关 系;
[0096]
s3-3:根据步骤s2-2得到的无线信息传输时隙,结合簇头到物理节点的信道状态,按无线信 息传输时隙累计各应用在各物理节点上带来能量消耗的总和,即为源节点数据发送带来的能量消 耗,如公式(3)所示:
[0097][0098]
其中,p
ij
表示第i个物理节点占用时隙τ
ij
发送应用j所需的数据时对应的功率;
[0099]
s3-4:感知数据从源节点转发时,需要n个簇头作为中继将数据传输到汇聚节点,结合簇头与 簇头之间的信道状态,按跳数累计感知数据在多跳传输阶段带来的能量消耗,其中,第i个物理节 点每跳传输的能耗如公式(4)所示:
[0100][0101]
其中,在第i个物理节点的第k跳时,b
ik
表示信道的带宽,p
ik
表示转发数据时的功率,g
ik
表 示信道增益,
[0102]
则合计基础设施层帧内因多跳传输带来的能量消耗如公式(5)所示:
[0103][0104]
s3-5:综合步骤s3-1-s3-4得到虚拟化无线传感器网络基础设施层单帧的能量消耗总和,即得 到基础设施层物理节点的能耗模型,如公式(6)所示:
[0105]etot
=e
c-eh e
st
e
ht
(6)。
[0106]
s4:构建网络时延模型:物理节点被争用时承载着多个应用,根据各应用的需求量进行优先级 划分,数据感知完成后,源节点的接收单元记录累计到达量和累计服务量,得到各数据包的到达曲 线和服务曲线,整合应用在多个物理节点上总体的到达曲线和服务曲线,得到协作处理的时延分布, 构建具有服务质量保证的多跳传输链路,结合有效容量和有效带宽得到数据传播时的时延分布;
[0107]
s4-1、对物理节点上承载的多个应用进行优先级设置,假设物理节点所有采集到的数据都是在 短时间间隔内到达,物理节点i承载的总的数据量为,根据应用本身的时延敏感需求得到物理节点上的优先级调度向量
[0108][0109]
其中,表示优先级最低,针对每个物理节点i都一定存在gi→
a=(a1,a2,
…
,aj,
…
,ak)是 一对一满映射的关系,以gi映射原有的应用请求,得到帧内应用优先级,记为j
′
;
[0110]
s4-2、源节点的接收单元记录物理节点i上各应用感知数据的累计到达量和累计服务量,并以 和分别表示在t时刻物理节点i上应用j的累计到达量和累计输出量,以表示应用j 的数据包在物理节点i上到达等待发送时刻,在该时刻缓冲区没有该应用的数据积压,即必有 根据物理节点i上各应用感知数据的累计到达量和累计服务量演算出物理节点 i对应各应用部分数据量的到达曲线和服务曲线,即帧内应用优先级为j
′
的累计到达量为本发明中对物理节点承载的应用进行了优先级划分,之前的应用索引是 (1,2,
…
,j,
…
k),现在有了优先级划分后,对应用的索引是(1
′
,2
′
,
…
,j
′
,
…k′
),其到达曲线满足公式 (7):
[0111][0112]
其中,αj′
(0,t)表示优先级为j
′
的应用的到达曲线,θj′
表示优先级为j
′
的应用的自 由优化参数,e[
·
]表示期望,f
1j
′
(x)为优先级为j
′
的应用的到达数据的违约概率函数;
[0113]
针对服务曲线,由于应用由多个节点协同完成,则在一定程度上可视作并联服务模型,但在物 理节点上同时存在多个优先级不同的业务,本发明中,一个应用需要多个节点协作完成任务,因此, 整体的服务曲线以性能最差的为包络,故考虑整体的服务曲线如下:选取物理节点i上优先级最低 的应用,即优先级为k
′
应用,该应用在物理节点i上请求的数据包在时刻到达,在(的 时间内,系统总的输出量为,存在关系如公式(8)所示:
[0114][0115]
由无积压时存在的关系可得:
[0116]
[0117]
根据如下数据输入输出约束判断系统是否正常:
[0118][0119]
若不满足式(10),表示输入输出异常,则丢弃数据包,该应用在下一帧再按需接入网络,若 满足式(10),表示输入输出正常,则有:
[0120][0121]
式中,式中,为物理节点i上优先级为j
′
的应用的 数据包在u时段内的累计到达量,且规定[
·
]
=max(
·
,0);当s(u)是广义增函数时,可作 为物理节点i上优先级为k
′
的应用的服务曲线,同理可得任意优先级的应用服务曲线为:
[0122][0123]
其中,表示物理节点i上优先级为j
′
的应用在u时段的服务曲线;
[0124]
根据并联服务器系统特性,得到基础设施层对应用的整体服务曲线β(0,t)和违规概率函数 f2(x)如公式(13)所示:
[0125][0126]
其中,θj′
表示优先级为j
′
的应用的自由优化参数,通过系统稳定条件确定;
[0127]
s4-3、根据步骤4-2得出的整体达到曲线和服务曲线以及对应的违约概率函数,得到源节点传 输阶段业务的时延概率分布函数,即
[0128][0129]
s4-4、数据在进行多跳传输产生的时延是每一跳产生的时延总和,根据业务时延得到对应的 qos保障指数,根据每跳的链路有效容量和有效带宽,得到单跳的时延部分概率分布函数,进而得 到单一路由上感知数据在多跳链路上的时延分布函数,最终选取时延最长路由作为整体传播时延, 在簇头充当中继进行多跳传输时,源节点i涉及的多跳路由带来的传播时延为 本发明中,源节点即为进行数据感知的物理节点其中 表示物理节点i在第k跳时产生的传播时延,且前一个中继节点的服务速率等于下一个中继节 点的到达速率,即存在其中,为源节点i在第k跳时需要保障的服务质量参 数,其值越大,服务质量要求越高;为节点i在第k跳时的链路有效带宽,由 得出;为链路有效容量,由得出;由此得到单跳时延部分分布函数
则源节点i发出的数据经n跳后的 时延分布函数为:
[0130][0131]
其中,不等式成立的条件为各跳为独立随机过程;
[0132]
应用由多个物理节点协同完成,故在多跳回传数据包时有多条链路,因此,多跳间应用总的时 延分布为
[0133]
s4-6、结合步骤s4-3和s4-4,得到各应用总的时延分布为:
[0134][0135]
其中,g1(x)为源节点传输时延分布的概率密度函数,由获取; g2(x)为多跳传输时延分布的概率密度函数,由g2(x)=d(1-pr{d
hops
>x})/dx获取。
[0136]
s5、功率分配:根据步骤s3和步骤s4得出的物理节点的能耗模型和应用的请求任务的网络时 延模型,在保障业务时延需求的条件下,最小化基础设施层中物理节点的能量消耗,如公式(17) 所示:
[0137]
min e
tot
[0138][0139][0140]
其中,p
ij
表示源节点i传输应用j所请求的数据所采用的功率大小,p
ik
表示源节点i所在路径 在多跳传播的第k跳时的传输功率大小,表示应用j所请求的数据量大小,表示第j个应用 最大延迟容忍,表示应用j数据传输过程中总的时延,εj表示第j个应用容忍违规概率。
[0141]
因此,基于强化学习得出最佳的功率分配方案,如图4所示为本实施例强化学习算法示意 图。
[0142]
s5-1:根据所需优化的时延-能耗问题,构建包含状态集合、动作集合、状态转移概率、回报 值和折扣因子的马尔可夫决策模型{s,a,p,dr,γ},其中,
[0143]
s={s}表示状态集合,a={a}表示动作集合,p=p(s
t 1
|s
t 1
,a
t
)表示状态转移概率,r表示 回报值,γ表示折扣因子;
[0144]
对于第i个物理节点,其状态表示为si={sv,s
τ
,sd,s
κ
,s
p
,sd},其中sv表示虚拟传感
网所属关系, s
τ
表示时间资源分配状态,sd表示承载的业务量,s
κ
,s
p
分别表示物理节点采集和传输的硬件指标, sd表示链路是否满足时延需求,ai={p
ij
,p
ik
},其中,p
ij
表示源物理节点i发送应用j需求数据的 功率,p
ik
表示源物理节点i所在路由簇间多跳时簇头k的数据转发功率;
[0145]
s5-2:构建回报值函数其中,e
tot
为优化目标,c为时延的权重系数,c 值越大,网络对用户时延的保障越重视。为第k个节点带来的传播延迟,为时延无 法满足时,对回报值的惩罚;
[0146]
s5-3:构造q函数,其中,γ
t
表示在t时刻的 折扣因子,r
t
(s
t,i
,a
t,i
)表示在t时刻节点i在状态s
t,i
下采取动作a
t,i
的回报值,基于此,采用蚁群系统 方法对智能体进行分组,组内的链路共享信息,并协调各自的策略,对于任意第g组智能体,其等 效q函数如公式(18)所示:
[0147][0148]
其中,ng表示该组中智能体的数量;
[0149]
s5-4:基于深度学习算法得到第g组智能体在状态sg下的最优策略πg(sg),具体策略为:在第 g组智能体中,选取状态sg时带来q值最大的动作ag,即:
[0150][0151]
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离 本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
转载请注明原文地址:https://tc.8miu.com/read-3902.html