执行信息生成方法、电子设备、存储介质和芯片系统与流程

    专利查询2026-06-13  4


    本技术涉及人工智能,尤其涉及一种执行信息生成方法、电子设备、存储介质和芯片系统。


    背景技术:

    1、真实应用场景中面临的许多实际问题,如排产问题等,可以采用线性规划等规划模型方式来处理。例如,供应链的生产计划需要满足工厂需求最大化、总成本最小化等目标,同时满足实际业务场景指定的约束,生产变量、目标与约束之间复杂的关系,可以归纳为线性规划模型,通过求解该线性规划模型,来获得生产策略信息,进而合理安排生产计划,使产出与需求更匹配,提高生产效率,避免无效作业。

    2、求解器是求解线性规划模型的工具之一。目前,有的求解器在预处理阶段,执行流程策略为全遍历策略,例如,一种开源求解器,会顺序执行各个预处理单元,且每个预处理单元执行的轮数固定。而实际应用中,不同的应用场景、不同的问题所需执行的预处理单元是不同的,这种全遍历策略会导致执行了一些无效但非常耗时的预处理单元,拖延求解时间,降低了求解器的响应速度。


    技术实现思路

    1、本技术提供一种执行信息生成方法、电子设备、存储介质和芯片系统,通过优化预处理单元的执行顺序,来减少无效预处理单元的执行,节约预处理阶段消耗的时间,进而提高求解器的求解效率。

    2、第一方面,本技术技术方案提供了一种求解器预处理阶段的执行信息生成方法,预处理包括执行n个预处理单元以化简目标模型,n为大于1的整数,目标模型基于应用场景中待求解的问题构建,求解器用于求解化简后的目标模型;该方法具体包括:通过机器学习,确定目标模型对应的转移概率矩阵;转移概率矩阵中的元素,表示多个单元中的一个单元转移到下一个单元的概率;多个单元包括n个预处理单元;基于转移概率矩阵,生成预处理单元序列;预处理单元序列用于限定至少一个预处理单元的执行顺序。如此,根据转移概率矩阵生成相应的预处理单元序列,获得优化后的序列,按照预该序列来执行模型化简,可以减少无效预处理单元的执行,降低预处理过程消耗的时间,提高求解效率,进而加快求解器响应实际问题的速度。

    3、作为一种可能的实现方式,确定目标模型对应的转移概率矩阵,包括:构建目标模型对应的第一二部图;根据第一二部图,获得第一特征向量;将第一特征向量输入第一神经网络;根据第一神经网络的输出,生成第一转移概率矩阵。构建目标模型的二部图并根据二部图来获得特征向量,能够以二部图的结构形式提取目标模型中各个节点之间关系,并体现在特征向量中,实现规划问题与神经网络的对接。

    4、作为一种可能的实现方式,多个单元包括1个空单元和n个预处理单元;基于转移概率矩阵,生成预处理单元序列,包括:根据转移概率矩阵中空单元对应的n+1个概率值,选择出第一个单元;其中,空单元对应的n+1个概率值,为空单元分别转移到1个空单元和n个预处理单元的概率值;第一个单元为空单元的情况下,生成空序列;第一个单元为非空单元的情况下,根据第i个单元对应的n+1个元素的概率值,选择出第i+1个单元;其中,第i个单元对应的n+1个元素的概率值,为第i个单元分别转移到1个空单元和n个预处理单元的概率值,1≤i≤n;第i+1个单元为空单元的情况下,停止生成序列,将前i个单元构成的序列作为预处理单元序列。该实施方式提供了一种切实可行的基于转移概率矩阵生成序列的逻辑机制,空单元作为一个结束标识符,其引入之后,可以使得神经网络学习到各个预处理单元与结束标识符之间的转移关系,因而在无需执行后续预处理单元的情况下,及时停止执行,节省时间。

    5、作为一种可能的实现方式,根据第i个单元对应的n+1个元素的概率值,选择出第i+1个单元,包括:基于概率抽样,生成第i个单元对应的第i个随机概率值;将[0,1]划分为与n+1个元素对应的多个区间;确定第i个随机概率值所属的区间为采样区间,选择采样区间对应的元素指向的下一个单元,作为第i+1个单元。基于概率抽样的选择方式,可以让每个预处理单元都有被均等选择的机会,进而在训练阶段,可以根据各种序列所带来的反馈进行充分学习,避免欠拟合。

    6、作为一种可能的实现方式,生成预处理单元序列之后,方法还包括:在当前生成的预处理单元序列为非空序列的情况下,按照预处理单元序列限定的执行顺序,依次执行相应的预处理单元,化简目标模型。在该实现方式中,提供预处理单元序列之后,还提供化简服务,以满足用户多样化需求。

    7、作为一种可能的实现方式,化简目标模型之后,方法还包括:获得化简后的目标模型对应的第二二部图;根据化简后的第二二部图,通过图神经网络执行图嵌入,获得第二特征向量;将第二特征向量输入第一神经网络;根据第一神经网络的输出,生成第二转移概率矩阵;基于第二转移概率矩阵,生成第二预处理单元序列;第二预处理单元序列,用于限定第二轮模型化简中预处理单元的执行顺序。预处理单元序列的输出,至少是一轮,多轮序列的输出,可以对目标模型进行多轮化简,化简效果更充分。

    8、作为一种可能的实现方式,方法包括训练阶段和应用阶段;在训练阶段,获得化简后的目标模型对应的二部图之后,方法还包括:根据第二二部图相比于第一二部图的化简程度,确定第一值;根据第一值,确定第一奖励函数的值;将第一奖励函数的值反向传播至第一神经网络,更新第一神经网络中的参数。第一奖励函数相当于环境对于化简动作的反馈,通过该反馈,第一神经网络可以确定参数调整的方向,进而调整参数。

    9、作为一种可能的实现方式,生成预处理单元序列之后,方法还包括:在预处理单元序列为空序列的情况下,停止模型化简,采用求解器对化简后的目标模型进行求解。提供求解服务,可以满足用户的求解需求。

    10、作为一种可能的实现方式,在训练阶段,采用求解器对化简后的目标模型进行求解之后,方法还包括:根据求解器对化简后的目标模型进行求解的求解效率,确定第二值;根据第二值,确定第二奖励函数的值;将第二奖励函数的值反向传播至第一神经网络,更新第一神经网络中的参数。第二奖励函数相当于环境对于整个求解动作(包括预处理)的反馈,通过该反馈,第一神经网络可以确定参数调整的方向,进而调整参数。

    11、作为一种可能的实现方式,第一神经网络,包括输入层、输出层和至少两个隐藏层。

    12、作为一种可能的实现方式,第一神经网络,包括多层感知机mlp、全连接神经网络fcnn、前馈神经网络fnn、反向传播bp神经网络中的至少一种。该实现方式提供了一种切实可行的第一神经网络的具体网络结构。

    13、作为一种可能的实现方式,机器学习,包括强化学习;第一神经网络部署于强化学习的智能体中。发明人在研究过程中发现,基于强化学习的基础网络架构来解决mp问题,相比于其他机器学习技术,获得的实际训练效果较好,具体效果请参考说明书具体实施方式。

    14、作为一种可能的实现方式,在强化学习的训练阶段,对于第一神经网络的训练,采用深度增强学习ppo算法。ppo算法训练机制,相比于单一的value机制或策略机制,训练效果更好。

    15、第二方面,本技术技术方案还提供一种电子设备,用于通过数据传输接口发送数据,该电子设备包括:一个或多个处理器;存储器;至少一个应用程序;以及一个或多个计算机程序,其中一个或多个计算机程序被存储在存储器中,一个或多个计算机程序包括指令,当指令被电子设备执行时,使得电子设备执行如上述第一方面中任一项的方法。

    16、第三方面,本技术技术方案还提供一种存储介质,包括计算机指令,当计算机指令在电子设备上运行时,使得电子设备执行如上述第一方面中任一项所述的方法。

    17、第四方面,本技术技术方案还提供一种芯片系统,包括:通信接口,用于输入和/或输出数据;处理器,用于执行计算机可执行程序,使得安装有芯片系统的设备执行如上述第一方面中任一项所述的方法。

    18、本技术实施例提供的执行信息生成方法、电子设备、存储介质和芯片系统,通过机器学习,来获知对于不同的模型均能够获得较好的模型化简效果和/或求解效率的转移概率矩阵,然后根据转移概率矩阵生成相应的预处理单元序列,获得了优化后的序列,按照预该序列来执行模型化简,可以减少无效预处理单元的执行,相比于全遍历策略中固定的执行顺序和执行轮数,本技术提出的方案,在保证模型化简效果的同时,进一步降低消耗的时间,提高求解效率,进而加快求解器响应实际问题的速度。


    技术特征:

    1.求解器预处理阶段的执行信息生成方法,其特征在于,预处理包括执行n个预处理单元以化简目标模型,n为大于1的整数,所述目标模型基于应用场景中待求解的问题构建,所述求解器用于求解化简后的目标模型;

    2.如权利要求1所述的方法,其特征在于,

    3.如权利要求1所述的方法,其特征在于,

    4.如权利要求3所述的方法,其特征在于,

    5.如权利要求1-4中任一项所述的方法,其特征在于,

    6.如权利要求5所述的方法,其特征在于,

    7.如权利要求6所述的方法,其特征在于,

    8.如权利要求7所述的方法,其特征在于,

    9.如权利要求8所述的方法,其特征在于,

    10.如权利要求1-4、6-9中任一项所述的方法,其特征在于,

    11.如权利要求10所述的方法,其特征在于,

    12.如权利要求1-4、6-9中任一项所述的方法,其特征在于,

    13.如权利要求12所述的方法,其特征在于,

    14.一种电子设备,其特征在于,所述电子设备包括:

    15.一种存储介质,其特征在于,包括计算机指令,当所述计算机指令在电子设备上运行时,使得所述电子设备执行如权利要求1-13中任一项所述的方法。

    16.一种芯片系统,其特征在于,包括:


    技术总结
    本申请提供了一种执行信息生成方法、电子设备、存储介质和芯片系统,涉及人工智能技术领域,能够提升求解器的求解效率。该方法包括:通过机器学习,确定目标模型对应的转移概率矩阵;转移概率矩阵中的元素,表示多个单元中的一个单元转移到下一个单元的概率;多个单元包括N个预处理单元;基于转移概率矩阵,生成预处理单元序列;预处理单元序列用于限定至少一个预处理单元的执行顺序。

    技术研发人员:匡宇飞,陆梦,朱方舟,李希君,曾嘉
    受保护的技术使用者:华为技术有限公司
    技术研发日:
    技术公布日:2024/11/26
    转载请注明原文地址:https://tc.8miu.com/read-36108.html

    最新回复(0)