一种基于神经网络结构搜索的食源性病菌分类方法

    专利查询2025-12-08  1


    本发明涉及拉曼光谱、神经网络搜索、食品安全检测,更具体的说是涉及一种基于神经网络结构搜索的食源性病菌分类方法。


    背景技术:

    1、食源性病原体如沙门氏菌、副溶血性弧菌、单核细胞增生李斯特氏菌、大肠杆菌o157:h7 和志贺氏菌等,危害人类身体健康。传统的食源性病原体检测方法主要依赖于琼脂平板培养,这需要较长时间的培养和基于生理生化特征的鉴定。尽管这些方法在历史上具有重要意义,但它们在紧急检测需求下显得耗时且繁琐。

    2、另外,随着技术的发展,免疫测定、生物传感器、基因探针和阻抗方法等先进技术逐渐应用于病原体检测。然而,由于细菌种类的多样性和培养的复杂性,这些方法在检测速度、成本和灵敏度方面仍面临挑战。

    3、表面增强拉曼光谱(sers)作为一种快速、灵敏、无损的分析工具,在食源性致病菌检测应用中能够实现无标记快速识别,克服了传统检测方法耗时的缺点。通过显微拉曼光谱仪系统,可以实现对亚微米级的细菌光谱的采样,为食源性疾病即时诊断提供了新的技术方案。然而,由于不同食源性病原菌的主要生物成分(如核酸、蛋白质、脂质、碳水化合物等)相似,导致拉曼光谱的产生相似性,并且光谱中噪声的干扰也增加了区分食源性病菌的难度,一般的机器学习算法无法满足高噪声条件下的光谱分类。因此,必须采用一种准确的方法来提取和学习拉曼光谱数据中的特征,以便准确地对食源性病菌进行识别和分类。

    4、相关深度学习技术,特别是卷积神经网络(cnn),在图像识别和分类任务中显示出强大的性能,能够识别拉曼光谱图中的微妙差异。然而,选择合适的网络架构对于分类性能至关重要。现有的研究,如基于resnet的网络架构、相互学习网络(cm-net)和基于transformer的网络模型,都展示了深度学习在处理高维度和复杂数据方面的能力。

    5、因此,如何实现基于深度学习技术实现提取和学习拉曼光谱数据中的特征,以便准确地对食源性病菌进行识别和分类,是本领域技术人员亟需解决的问题。


    技术实现思路

    1、有鉴于此,本发明提供了一种基于神经网络结构搜索的食源性病菌分类方法,旨在通过自动化设计混合网络(automated design of mixed networks)架构,结合神经架构搜索(nas)技术,优化深度神经网络(dnn)结构,以提高食源性病菌分类的准确性和效率。通过实施分块可微分nas(bdnas)算法,本发明能够在预定义的宏观网络架构基础上进行优化搜索,得到最优化的模型,从而在拉曼光谱识别任务中实现高准确性和设计效率。

    2、为了实现上述目的,本发明采用如下技术方案:

    3、本发明提供一种基于神经网络结构搜索的食源性病菌分类方法,包括以下步骤:

    4、s10、采集多种食源性病菌各自对应的多种子类病菌的表面增强拉曼光谱数据,进行预处理后分为测试集、训练集和验证集;

    5、s20、根据混合网络自动化设计u-net神经网络模型架构;

    6、s30、采用预处理后的训练集数据,对u-net神经网络模型进行训练,使用分块可微分神经架构搜索策略,根据验证集的反馈结果,调整u-net神经网络模型各个模块的权重;

    7、s40、经过预训练优化的权重分布,对超网络进行采样,确定u-net神经网络模型每一层的最优模块组合;使用采样得到的架构信息,构建一个新的u-net结构,形成最终的模型架构;

    8、s50、训练最终的模型架构,生成分类器;

    9、s60、利用训练好的神经网络分类器,对未知食源性病菌样本进行分类。

    10、进一步地,所述步骤s10中,进行预处理,包括:

    11、采用otsu方法计算每个拉曼光谱数据与平均光谱之间的均方误差;

    12、将所述均方误差从最小值到最大值的千分之一作为搜索步长,确定分割阈值;

    13、根据所述分割阈值将所述拉曼光谱数据分成两组;一组为均方误差小于或等于该分割阈值的数据;另一组为均方误差大于该分割阈值的数据;

    14、遍历n次,寻找让这两组数据之间的差异最大的阈值,作为最佳分类阈值;

    15、保留小于所述最佳分类阈值的所有数据,得到清洗后滤除异常数据的光谱数据。

    16、进一步地,所述步骤s20,包括:

    17、建立具有上下采样位置空缺的u-net网络结构;

    18、为u-net网络的每一层预设候选模块集,包括残差模块、transformer模块、图卷积模块和门控卷积模块;

    19、构建超网络,使每一层的模块从预设的候选模块集中选择。

    20、进一步地,所述预设候选模块集中,候选块使用倒置残差形式进行统一表征,允许输入通道扩展和潜在的残差连接,候选块的公式表示为:

    21、         (1)

    22、公式(1)中,proj表示线性投影,输入通道扩展比率表示为e,原始通道数为c,ac表示扩展后的最终通道数;op表示残差模块、transformer模块、图卷积模块或门控卷积模块的算子;x和y分别表示输入和输出特征。

    23、进一步地,所述transformer模块算子由多个注意力头h组成,每个注意力头通过测量token之间的成对相关性来捕获不同的全局上下文信息,公式定义如下:

    24、        (2)

    25、  (3)

    26、公式(3)中 h表示注意力头的数量,i表示注意力头的索引值;q、k、v表示通过线性投影长度为 n的输入序列获得的隐藏维度为的查询、键和值向量编码;表示k的维度大小; softmax 表示对得到的注意力分数进行归一化,concat表示将所有头的结果连接操作,表示权重矩阵输出,w为权重矩阵。

    27、进一步地,所述图卷积模块算子用于对非欧几里得空间中的图数据进行卷积运算;图的定义为:

    28、                               (4)

    29、其中, 分别表示图的节点和边;所述图卷积模块算子定义为:

    30、             (5)

    31、其中,表示拉普拉斯矩阵,w为权重矩阵,d表示图的度矩阵,a表示可学习的邻接矩阵,描述不同节点之间的连接关系。

    32、进一步地,所述门控卷积模块算子用于增强模型对特征的动态选择能力;作为一个具有门控机制的空间注意力单元,在前向传播过程中,通过卷积和归一化操作来实现特征的动态调整;实现公式如下:

    33、                (6)

    34、  (7)

    35、公式(6)、(7)中,conv和dwconv表示卷积和深度可分离卷积操作,x表示输入的原始数据,a和表示经过通道拆分后的两个特征图;scale表示一个可学习的参数,用于控制门控卷积的强度;表示所述门控卷积模块算子最终的输出。

    36、进一步地,所述残差模块算子结合了点卷积、深度可分离卷积、批量归一化、激活函数,以及可选的通道混合和压缩激励模块;使用了残差连接来将输入直接添加到经过处理后的输出上;所述残差模块算子的公式表达如下:

    37、        (8)

    38、公式(8)中,表示所述残差模块算子的输出,x表示输入的原始数据,residual表示残差卷积操作,为可选操作,在搜索过程中确定是否应用点卷积、通道混合操作和/或深度可分离卷积操作。

    39、进一步地, 所述步骤s30,包括:

    40、采用预处理后的训练集数据,对u-net神经网络模型进行训练;在预训练时,超网络使用gumbel-softmax策略进行搜索;

    41、并在每次验证时,评估当前模型架构在验证集上的表现,作为反馈信息,调整各个模块的权重。

    42、进一步地,所述步骤s30,还包括:

    43、在u-net神经网络模型的输出部分引入注意力模块,辅助神经网络搜索,加速神经网络搜索收敛速度。

    44、经由上述的技术方案可知,与现有技术相比,本发明具有如下优势:

    45、1. 提高分类精度

    46、自适应网络架构设计:通过混合网络自动化设计u-net模型架构,并结合分块可微分神经架构搜索策略,能够自适应地优化网络的结构和参数,使得模型在不同子类病菌分类时表现更优,从而显著提高了分类的准确性。

    47、2. 加速模型优化和收敛

    48、预训练与自动搜索结合:采用分块可微分神经架构搜索策略,能够根据验证集的反馈实时调整模型各模块的权重,并在训练前进行预训练优化,这种方法加速了模型的优化过程,使得模型能更快收敛,减少训练时间。

    49、3. 创新的数据清洗方案

    50、本发明使用otsu阈值分割算法作为对异常数据的清洗算法,将图像处理领域的otsu算法移植到拉曼光谱领域,优化了原始数据集,提高了数据质量,减少模型训练过程中的干扰,可以帮助模型更好地学习数据中的潜在模式。

    51、4. 基于u-net架构的混合网络自动化设计

    52、算法构建了一个具有上下采样位置空缺的u-net结构作为超网络,并设定了4种搜索空间模块,包括残差模块、transformer模块、图卷积模块以及门控卷积模块。多种模块的设计,增加了搜索空间的多样性,有助于发现更优的架构。另外,u-net其特有的u形结构有助于对受噪声影响较为严重的生物样本的拉曼光谱进行上下文信息的捕获和精确定位。通过自动化搜索得到的架构会比手工设计的架构更优,因为搜索过程可以探索到人类难以穷尽的架构组合。

    53、5. 分块可微分神经架构搜索策略

    54、通过综合损失函数将原本离散的模块选择问题转换为连续优化问题,简化了搜索过程。使用gumbel-softmax函数并利用验证集损失函数获得反馈,提高了搜索效率,也使得算法可以轻松地添加或替换搜索空间中的模块,适应不同的任务和需求。结合权重和随机扰动的采样策略,增加了搜索过程中的随机性和多样性,有助于避免局部最优。

    55、6. 注意力模块辅助搜索

    56、通过在输出网络部分增加注意力模块,将注意力模块结果的输出的0.1作为最终结果的参考,因此在同步搜索中,能加快网络的收敛速度,提升效率。并且,注意力模块还会返回光谱数据的权重向量,让网络可以更好地关注特定位置的数据并提高模型对拉曼光谱的理解。


    技术特征:

    1.一种基于神经网络结构搜索的食源性病菌分类方法,其特征在于,包括以下步骤:

    2.根据权利要求1所述的一种基于神经网络结构搜索的食源性病菌分类方法,其特征在于,所述步骤s10中,进行预处理,包括:

    3.根据权利要求1所述的一种基于神经网络结构搜索的食源性病菌分类方法,其特征在于,所述步骤s20,包括:

    4.根据权利要求3所述的一种基于神经网络结构搜索的食源性病菌分类方法,其特征在于,所述预设候选模块集中,候选块使用倒置残差形式进行统一表征,允许输入通道扩展和潜在的残差连接,候选块的公式表示为:

    5.根据权利要求4所述的一种基于神经网络结构搜索的食源性病菌分类方法,其特征在于,所述transformer模块算子由多个注意力头h组成,每个注意力头通过测量token之间的成对相关性来捕获不同的全局上下文信息,公式定义如下:

    6.根据权利要求5所述的一种基于神经网络结构搜索的食源性病菌分类方法,其特征在于,所述图卷积模块算子用于对非欧几里得空间中的图数据进行卷积运算;图的定义为:

    7.根据权利要求6所述的一种基于神经网络结构搜索的食源性病菌分类方法,其特征在于,所述门控卷积模块算子用于增强模型对特征的动态选择能力;作为一个具有门控机制的空间注意力单元,在前向传播过程中,通过卷积和归一化操作来实现特征的动态调整;实现公式如下:

    8.根据权利要求7所述的一种基于神经网络结构搜索的食源性病菌分类方法,其特征在于,所述残差模块算子结合了点卷积、深度可分离卷积、批量归一化、激活函数,以及可选的通道混合和压缩激励模块;使用了残差连接来将输入直接添加到经过处理后的输出上;所述残差模块算子的公式表达如下:

    9.根据权利要求1所述的一种基于神经网络结构搜索的食源性病菌分类方法,其特征在于, 所述步骤s30,包括:

    10.根据权利要求9所述的一种基于神经网络结构搜索的食源性病菌分类方法,其特征在于, 所述步骤s30,还包括:


    技术总结
    本发明公开了一种基于神经网络结构搜索的食源性病菌分类方法,包括:采集多种食源性病菌各自对应的多种子类病菌的表面增强拉曼光谱数据,进行预处理;根据混合网络自动化设计U‑Net神经网络模型架构;对U‑Net神经网络模型进行训练,使用分块可微分神经架构搜索策略,调整U‑Net神经网络模型各个模块的权重;经过预训练优化的权重分布,对超网络进行采样,确定U‑Net神经网络模型每一层的最优模块组合;使用采样得到的架构信息,构建新的U‑Net结构,训练并生成分类器,实现对未知食源性病菌样本进行分类。该方法通过混合网络自动化设计U‑Net模型架构,能够自适应地优化网络的结构和参数,使得模型在不同子类病菌分类时表现更优,显著提高了分类的准确性。

    技术研发人员:梁培,王子龙,陈歆,孙彪,陈强
    受保护的技术使用者:中国计量大学
    技术研发日:
    技术公布日:2024/11/26
    转载请注明原文地址:https://tc.8miu.com/read-32544.html

    最新回复(0)