本技术涉及通信,尤其涉及一种宽带实时交互场景下的智能预编码方法与装置。
背景技术:
1、在无线通信网络中,扩展现实(extended reality,xr)技术具有多视角、交互性强等优点,能够为用户提供了一种全新的视觉体验,具有极大的应用价值和商业潜力。
2、宽带实时交互(real-time broadband communication,rtbc)是5.5g愿景定义的三大新场景之一,主要指的是以云扩展现实(cloud xr)、触觉互联网等代表的需要收发两端实时交互的多媒体传输技术,具有大数据量、高可靠、低时延、业务来包呈现准周期性等特点,但是,低时延的业务要求会降低有效信道容量,并且数据量大导致此类业务的用户容量极其受限。以当前时隙传输速率最大化为目标的传统预编码技术无法满足rtbc业务系统长期效用(多传输时隙联合)最大化的需求。
3、rtbc业务需要通过设计多个传输时隙联合的预编码方案来提高用户的的数据接收率,进而提高系统的用户容量。因此,如何设计一种宽带实时交互场景下的智能预编码方法是个亟待解决的问题。
技术实现思路
1、第一方面,本技术实施例提供一种通信方法,该方法可以由无线接入网设备执行,也可以由无线接入网设备的部件(例如处理器、芯片、或芯片系统等)执行,还可以由能实现全部或部分无线接入网设备功能的逻辑节点、逻辑模块或软件实现。该方法包括:获得至少一个终端的第一待传输数据的预编码矩阵,上述预编码矩阵与上述至少一个终端的优先级权重存在对应关系,上述优先级权重与第一因子对应,上述第一因子与第一状态信息存在对应关系,上述第一状态信息与上述至少一个终端的上述第一待传输数据对应。根据上述预编码矩阵完成上述至少一个终端的上述第一待传输数据的预编码。输出第一数据,上述第一数据是对上述至少一个终端的上述第一待传输数据进行上述预编码后的数据。
2、通过上述方法,基站获得了用于至少一个终端预编码的预编码矩阵,该预编码矩阵和第一时隙的第一待传输数据接收正确率、第一时隙的第一待传输数据的第一状态信息以及第二时隙的第二待传输数据的第二状态信息存在对应关系,采用强化学习方法训练的自适应调控预编码方案,通过深度强化学习(deep reinforcement learning,drl)网络与传统预编码级联的架构,求得多个时隙跨度下预编码的全局最优解,解决单时隙最优解无法满足用户时隙间动态变化的传输需求的问题。
3、结合第一方面,在第一方面的某些实施方式中,上述第一待传输数据为单模态待传输数据。
4、结合第一方面,在第一方面的某些实施方式中,上述第一待传输数据为多模态待传输数据。
5、结合第一方面,在第一方面的某些实施方式中,上述第一状态信息包括上述至少一个终端的激活状态和期望平均传输速率。
6、结合第一方面,在第一方面的某些实施方式中,上述第一状态信息与上述至少一个终端的上述第一待传输数据对应,包括:根据上述第一待传输数据的到达时间确定上述至少一个终端的上述激活状态。
7、结合第一方面,在第一方面的某些实施方式中,上述第一状态信息与上述至少一个终端的上述第一待传输数据对应,包括:根据第一终端的待传输数据的数据量和上述第一终端传输上述待传输数据的剩余传输时间确定上述第一终端的上述期望平均传输速率,上述第一终端为上述至少一个终端中的一个终端,上述第一待传输数据包含上述待传输数据。
8、结合第一方面,在第一方面的某些实施方式中,上述期望平均传输速率满足:
9、
10、其中,rk为上述至少一个终端中的一个终端k的上述期望平均传输速率,qk为上述第一待传输数据中上述一个终端k的待传输数据量总数,τk为上述一个终端k剩余的传输上述一个终端k的上述待传输数据的传输时间。
11、结合第一方面,在第一方面的某些实施方式中,上述期望平均传输速率满足:
12、
13、其中,rk为上述至少一个终端中的一个终端k的上述期望平均传输速率,qk,n为上述第一待传输数据中上述一个终端k的待传输数据中第n个模态待传输数据量总数,τk,n为上述一个终端k剩余的传输上述第n个模态待传输数据的传输时间,n小于或等于n的正整数。
14、结合第一方面,在第一方面的某些实施方式中,上述第一因子与第一状态信息存在对应关系,包括:drl网络根据上述第一状态信息确定上述第一因子。
15、结合第一方面,在第一方面的某些实施方式中,上述优先级权重与上述第一因子对应,包括:根据上述第一因子和上述期望平均传输速率确定上述优先级权重。
16、结合第一方面,在第一方面的某些实施方式中,上述优先级权重满足:
17、
18、其中,αk为上述至少一个终端中的一个终端k的上述优先级权重,c为上述一个终端k的第一因子,rk为上述一个终端k的上述期望平均传输速率,rmax为上述至少一个终端的上述期望平均传输速率中的最大值。
19、结合第一方面,在第一方面的某些实施方式中,上述方法还包括:获得第一比值,上述第一比值与上述第一数据对应,上述第一比值为上述第一数据中被正确接收的数据的数据量占上述第一数据的数据量的比例。
20、结合第一方面,在第一方面的某些实施方式中,上述第一比值和第二状态信息用于更新上述drl网络,上述第二状态信息与上述至少一个终端的第二待传输数据对应,上述第二待传输数据为上述第一待传输数据传输后的下一个待传输数据。
21、结合第一方面,在第一方面的某些实施方式中,上述第一待传输数据为第一时隙待传输数据,上述第二待传输数据为第二时隙待传输数据,上述第一时隙和上述第二时隙在时域上连续,且上述第二时隙位于上述第一时隙之后。
22、第二方面,本技术实施例提供一种通信方法,该方法可以由终端执行,也可以由终端的部件(例如处理器、芯片、或芯片系统等)执行,还可以由能实现全部或部分终端功能的逻辑节点、逻辑模块或软件实现。该方法包括:接收第二数据,第一数据包含上述第二数据,上述第一数据是对至少一个终端的第一待传输数据进行预编码后的数据,上述预编码与预编码矩阵对应,上述预编码矩阵与上述至少一个终端的优先级权重存在对应关系,上述优先级权重与第一因子对应,上述第一因子与第一状态信息存在对应关系,上述第一状态信息与上述至少一个终端的上述第一待传输数据对应。根据上述第二数据确定第二比值,上述第二比值与上述第二数据对应,上述第二比值为上述第二数据中被正确接收的数据的数据量占上述第二数据的数据量的比例。发送上述第二比值。
23、通过这种方式,基站获得了用于至少一个终端预编码的预编码矩阵,该预编码矩阵和第一时隙的第一待传输数据接收正确率、第一时隙的第一待传输数据的第一状态信息以及第二时隙的第二待传输数据的第二状态信息存在对应关系,采用强化学习方法训练的自适应调控预编码方案,通过drl网络与传统预编码级联的架构,求得多个时隙跨度下预编码的全局最优解,解决单时隙最优解无法满足用户时隙间动态变化的传输需求的问题。
24、结合第二方面,在第二方面的某些实施方式中,上述第一待传输数据为单模态待传输数据。
25、结合第二方面,在第二方面的某些实施方式中,上述第一待传输数据为多模态待传输数据。
26、结合第二方面,在第二方面的某些实施方式中,上述第一状态信息包括上述至少一个终端的激活状态和期望平均传输速率。
27、结合第二方面,在第二方面的某些实施方式中,上述第一状态信息与上述至少一个终端的上述第一待传输数据对应,包括:根据上述第一待传输数据的到达时间确定上述至少一个终端的上述激活状态。
28、结合第二方面,在第二方面的某些实施方式中,上述第一状态信息与上述至少一个终端的上述第一待传输数据对应,包括:根据第一终端的待传输数据的数据量和上述第一终端传输上述待传输数据的剩余传输时间确定上述第一终端的上述期望平均传输速率,上述第一终端为上述至少一个终端中的一个终端,上述第一待传输数据包含上述待传输数据。
29、结合第二方面,在第二方面的某些实施方式中,上述期望平均传输速率满足:
30、
31、其中,rk为上述至少一个终端中的一个终端k的上述期望平均传输速率,qk为上述第一待传输数据中上述一个终端k的待传输数据量总数,τk为上述一个终端k剩余的传输上述一个终端k的上述待传输数据的传输时间。
32、结合第二方面,在第二方面的某些实施方式中,上述期望平均传输速率满足:
33、
34、其中,rk为上述至少一个终端中的一个终端k的上述期望平均传输速率,qk,n为上述第一待传输数据中上述一个终端k的待传输数据中第n个模态待传输数据量总数,τk,n为上述一个终端k剩余的传输上述第n个模态待传输数据的传输时间,n小于或等于n的正整数。
35、结合第二方面,在第二方面的某些实施方式中,上述第一因子与第一状态信息存在对应关系,包括:深度强化学习drl网络根据上述第一状态信息确定上述第一因子。
36、结合第二方面,在第二方面的某些实施方式中,上述第二比值和第二状态信息用于更新上述drl网络,上述第二状态信息与上述至少一个终端的第二待传输数据对应,上述第二待传输数据为上述第一待传输数据传输后的下一个待传输数据。
37、结合第二方面,在第二方面的某些实施方式中,上述第一待传输数据为第一时隙待传输数据,上述第二待传输数据为第二时隙待传输数据,上述第一时隙和上述第二时隙在时域上连续,且上述第二时隙位于上述第一时隙之后
38、第三方面,本技术实施例提供一种装置,可以实现上述第一方面、或第一方面任一种可能的实施方式中的方法。该装置包括用于执行上述方法的相应的单元或模块。该装置包括的单元或模块可以通过软件和/或硬件方式实现。该装置例如可以为无线接入网设备,也可以为支持无线接入网设备实现上述方法的芯片、芯片系统、或处理器等,还可以为能实现全部或部分无线接入网设备功能的逻辑节点、逻辑模块或软件。
39、第四方面,本技术实施例提供一种装置,可以实现上述第二方面、或第二方面任一种可能的实施方式中的方法。该装置包括用于执行上述方法的相应的单元或模块。该装置包括的单元或模块可以通过软件和/或硬件方式实现。该装置例如可以为终端,也可以为支持终端实现上述方法的芯片、芯片系统、或处理器等,还可以为能实现全部或部分终端功能的逻辑节点、逻辑模块或软件。
40、第五方面,本技术实施例提供一种装置,包括:处理器,该处理器与存储器耦合,该存储器用于存储指令,当指令被处理器执行时,使得该装置实现上述第一方面、或第一方面任一种可能的实施方式中的方法。
41、第六方面,本技术实施例提供一种装置,包括:处理器,该处理器与存储器耦合,该存储器用于存储指令,当指令被处理器执行时,使得该装置实现上述第二方面、或第二方面任一种可能的实施方式中的方法。
42、第七方面,本技术实施例提供一种计算机可读存储介质,其上存储有指令,指令被执行时使得计算机执行上述第一方面、或第一方面任一种可能的实施方式中的方法。
43、第八方面,本技术实施例提供一种计算机可读存储介质,其上存储有指令,指令被执行时使得计算机执行上述第二方面、或第二方面任一种可能的实施方式中的方法。
44、第九方面,本技术实施例提供一种计算机程序产品,其包括计算机程序代码,计算机程序代码在计算机上运行时,使得计算机执行上述第一方面、或第一方面任一种可能的实施方式中的方法。
45、第十方面,本技术实施例提供一种计算机程序产品,其包括计算机程序代码,计算机程序代码在计算机上运行时,使得计算机执行上述第二方面、或第二方面任一种可能的实施方式中的方法。
46、第十一方面,本技术实施例提供一种芯片,包括:处理器,该处理器与存储器耦合,该存储器用于存储指令,当指令被处理器执行时,使得该芯片实现上述第一方面、第二方面、第一方面任一种可能的实施方式、或第二方面任一种可能的实施方式中的方法。
47、第十二方面,本技术实施例提供一种通信系统,包括:上述第三方面的装置和上述第四方面的装置。
48、第十三方面,本技术实施例提供一种通信系统,包括:上述第五方面的装置和上述第六方面的装置。
49、可以理解,第三方面至第十三方面中与第一方面、第二方面对应特征的有益效果,请参见第一方面、第二方面中的有关描述,不重复赘述。
1.一种通信方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述第一待传输数据为单模态待传输数据。
3.根据权利要求1所述的方法,其特征在于,所述第一待传输数据为多模态待传输数据。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述第一状态信息包括所述至少一个终端的激活状态和期望平均传输速率。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述第一状态信息与所述至少一个终端的所述第一待传输数据对应,包括:
6.根据权利要求1、2、4或5所述的方法,其特征在于,所述第一状态信息与所述至少一个终端的所述第一待传输数据对应,包括:
7.根据权利要求2或4-6所述的方法,其特征在于,所述期望平均传输速率满足:
8.根据权利要求3或4-6所述的方法,其特征在于,所述期望平均传输速率满足:
9.根据权利要求1-8中任一项所述的方法,其特征在于,所述第一因子与第一状态信息存在对应关系,包括:
10.根据权利要求2-9中任一项所述的方法,其特征在于,所述优先级权重与所述第一因子对应,包括:
11.根据权利要求2-10中任一项所述的方法,其特征在于,所述优先级权重满足:
12.根据权利要求1所述的方法,其特征在于,所述方法还包括:
13.根据权利要求9或12所述的方法,其特征在于,所述第一比值和第二状态信息用于更新所述drl网络,所述第二状态信息与所述至少一个终端的第二待传输数据对应,所述第二待传输数据为所述第一待传输数据传输后的下一个待传输数据。
14.根据权利要求13所述的方法,其特征在于,所述第一待传输数据为第一时隙待传输数据,所述第二待传输数据为第二时隙待传输数据,所述第一时隙和所述第二时隙在时域上连续,且所述第二时隙位于所述第一时隙之后。
15.一种通信方法,其特征在于,包括:
16.根据权利要求15所述的方法,其特征在于,所述第一待传输数据为单模态待传输数据。
17.根据权利要求15所述的方法,其特征在于,所述第一待传输数据为多模态待传输数据。
18.根据权利要求15-17中任一项所述的方法,其特征在于,所述第一状态信息包括所述至少一个终端的激活状态和期望平均传输速率。
19.根据权利要求15-18中任一项所述的方法,其特征在于,所述第一状态信息与所述至少一个终端的所述第一待传输数据对应,包括:
20.根据权利要求15、16、18或19所述的方法,其特征在于,所述第一状态信息与所述至少一个终端的所述第一待传输数据对应,包括:
21.根据权利要求16或18-20所述的方法,其特征在于,所述期望平均传输速率满足:
22.根据权利要求17或18-20所述的方法,其特征在于,所述期望平均传输速率满足:
23.根据权利要求15-22中任一项所述的方法,其特征在于,所述第一因子与第一状态信息存在对应关系,包括:
24.根据权利要求15或23所述的方法,其特征在于,所述第二比值和第二状态信息用于更新所述drl网络,所述第二状态信息与所述至少一个终端的第二待传输数据对应,所述第二待传输数据为所述第一待传输数据传输后的下一个待传输数据。
25.根据权利要求24所述的方法,其特征在于,所述第一待传输数据为第一时隙待传输数据,所述第二待传输数据为第二时隙待传输数据,所述第一时隙和所述第二时隙在时域上连续,且所述第二时隙位于所述第一时隙之后。
26.一种通信装置,其特征在于,包括:处理器,所述处理器与存储器耦合,所述存储器用于存储程序或指令,当所述程序或指令被所述处理器执行时,使得所述装置执行如权利要求1至14中任一项所述的方法。
27.一种通信装置,其特征在于,包括:处理器,所述处理器与存储器耦合,所述存储器用于存储程序或指令,当所述程序或指令被所述处理器执行时,使得所述装置执行如权利要求15至25中任一项所述的方法。
28.一种计算机可读存储介质,其上存储有指令,其特征在于,所述指令被执行时使得计算机执行如权利要求1至14中任一项所述的方法,或者执行如权利要求15至25中任一项所述的方法。
29.一种计算机程序产品,其特征在于,包括计算机程序代码,当所述计算机程序代码被运行时,实现如权利要求1至14中任一项所述的方法,或者实现如权利要求15至25中任一项所述的方法。
