一种心音信号识别方法

专利查询2026-02-19 13

本发明涉及信号处理，尤其涉及一种心音信号识别方法。

背景技术：

1、心血管疾病对人类健康造成很大威胁，因此其早期诊断显得尤为重要，心音信号是反应心脏功能的关键指标，广泛用于心血管疾病的诊断，通过分析心音信号中的异常声音，可以识别出多种心脏疾病，心音信号的复杂性与多样性，如多变的波形模式、潜在的杂音干扰以及显著的个体差异，增加了心音信号有效检测的难度。

2、当前，心音信号分类方法主要集中在两大方向：一是基于传统机器学习的方法，这些方法依赖于从信号中提取的人工设计的特征，如时域特征和频域特征。例如，一些研究提取了每个频段的shannon熵和谱熵，并将其作为支持向量机的输入；还有研究通过提取功率特征，并对比了支持向量机、随机森林和多层感知器在分类性能上的表现。然而，传统的特征提取和选择过程在捕捉心音信号的复杂性和非线性关系方面仍显不足，无法全面反映心音信号的特性，进而限制了模型的性能。

3、二是基于深度学习的方法，这类方法能够自动提取特征，尤其是卷积神经网络在处理心音信号的非线性特征时展现出明显优势。为增强卷积神经网络的信息流，有研究引入了双向连接结构，取得了良好的分类效果。另有研究探讨了时频分布作为卷积神经网络的输入，从而为心音信号的深度学习自动诊断提供了新的思路。然而，尽管这些方法展现了优越性能，但在捕捉心音信号中的非线性特征及其复杂的相互作用方面仍然存在一定局限性。

4、为此，提出一种心音信号识别方法，能够更好地捕捉心音信号的复杂特征。

技术实现思路

1、本发明的目的是为了解决现有技术中的问题，而提出的一种心音信号识别方法。

2、一种心音信号识别方法，包括以下步骤：

3、s1、对原始音频信号进行预处理；

4、s2、对音频信号进行两组特征提取，两组特征分别是传统音频特征和高阶谱特征；

5、s3、模型搭建，构建双分支特征提取网络；

6、s4、对模型训练和验证；

7、s5、评估模型在独立测试集上的表现。

8、优选地，所述步骤s1中，对原始音频信号进行预处理包括以下步骤：

9、(1)对原始音频数据应用带通滤波器，保留25hz至400hz之间的频率范围；

10、(2)将滤波后的音频信号重新采样；

11、(3)对音频信号进行标准化处理，使其最大绝对值为1，统一数据的幅度范围；

12、(4)将数据集按照8：1：1的比率划分为训练集、验证集和测试集。

13、优选地，所述步骤s2中，对音频信号进行传统音频特征提取包含以下步骤：

14、(1)选择音频信号的零交叉率、频谱质心、频谱带宽、频谱滚降和梅尔频率倒谱系数。

15、(2)对上述传统音频特征的均值和标准差进行计算，并将其整合形成最终的特征向量。

16、优选地，所述步骤s2中，对音频信号进行高阶谱特征提取包含以下步骤：

17、(1)首先计算音频信号的频谱，通过短时傅里叶变换进行计算，短时傅里叶变换公式定义为：

18、

19、其中，x(τ)是输入信号，ω(t-τ)是窗口函数；

20、(2)接着选择频率范围，将两个频率设置为最大频率值减去所有频率偏移量的总和，定义为：

21、

22、其中，max(f)表示最大频率，∑ofreqs表示所有频率偏移量的和；

23、(3)通过短时傅里叶变换计算得到的频谱数据，计算各个频率分量之间的乘积，通过频率分量的乘积来分析信号中不同频率之间的非线性相互作用，频谱乘积的计算定义为：

24、temp(f1,f2)＝x(t,f1)·x(t,f2)·x*(f1+f2+fofreqs,t)

25、其中，其中f1和f2是上一步中确定的频率范围内的频率分量，x(t,f1)是信号在频率处f1的短时傅里叶变换分量，x(t,f2)是信号在频率处f2的短时傅里叶变换分量，x*(f1+f2+fofreqs,t)是这些频率之和的共轭频谱；

26、(4)进行归一化处理，确保相干性结果的合理性，最后得到归一化的结果定义为：

27、

28、其中，t表示样本数量，temp2表示由频谱乘积的模计算得到的归一化因子，定义为：

29、

30、优选地，所述步骤s3中，构建双分支特征提取网络包含以下步骤：

31、(1)使用一维卷积神经网络对传统音频特征进行特征提取，其中，块1包括卷积层、批归一化、激活函数和池化层，设传统特征表示为a，经过块1得到特征定义为：

32、xchannel＝maxpool(relu(bn1d(conv1d(a))))

33、其中，maxpool表示最大池化操作，relu表示修正线性单元，conv1d表示一维卷积操作，channel表示不同的通道，然后经过注意力在通道维度上重新调整特征的权重，使网络更加关注重要的特征，经过3个块一后得到的特征图是x，挤压操作定义为：

34、

35、其中，h和w是特征图的高度和宽度，zc是第c个通道的全局平均值，xc(i,j)是输入特征图在通道c上的位置(i,j)的值，激励操作由两个全连接层组成，定义为：

36、s＝σ(w2·relu(w1·z))

37、其中，z是由所有zc组成的向量，w1和w2是两个全连接层的权重矩阵，σ(·)表示sigmoid函数，将激励操作产生的缩放因子s重新调整每个通道的特征图，得到通道c上重新标定后的特征图定义为：

38、

39、其中，sc是第c个通道的缩放因子，将senet的输出重新调整形状，以适应全局信息处理，使用全连接层，将输入特征的映射分布到全连接层上，得到输出特征f′；

40、(2)使用二维卷积神经网络对高阶谱特征进行特征提取，其中，块2包括卷积层、批归一化、激活函数和池化层，设传统特征输入为b，经过块2得到特征图定义为：

41、xc′hannel＝maxpool(relu(bn2d(conv2d(b))))

42、其中，conv2d表示二维卷积操作，channel表示不同的通道，卷积层用于进一步提取高阶特征的高级特征，进行批量归一化，将多维特征图展平成一维向量，便于输入到全连接层，全连接层将展平后的特征映射到目标维度，得到输出特征f″

43、(3)双分支网络融合，将分支1的输出f′和分支2的输出f″进行特征融合得到ffusion，ffusion表示为：

44、ffusion＝cat(f′,f″)

45、应用dropout操作，防止过拟合，最终输出f定义为：

46、f＝dropout(ffusion)。

47、优选地，所述步骤s4中，对搭建好的模型进行训练，在验证集上评估准确率、召回率、精确率和f1分数指标。

48、与现有的技术相比，本发明优点在于：

49、1、本发明通过并行提取高阶谱特征和传统音频特征的方式，有效捕捉了音频信号中的复杂频率关系和关键特征，高阶谱特征能够揭示信号中的非线性频率耦合，而传统音频特征则捕捉了信号的整体时频特性，通过结合这些不同类型的特征，模型可以获得更全面的信号描述，进而提高识别准确性。

50、2、本发明创新的采用了两组卷积神经网络分别处理不同类型的特征，其中针对传统音频特征的一维卷积神经网络引入了通道注意力机制，这种架构设计允许模型动态地关注音频信号中的重要区域，从而提高了特征表示能力，减少了由于不相关或噪声特征引起的误差，进一步提升了模型的性能。

技术特征：

1.一种心音信号识别方法，其特征在于：包括以下步骤：

2.根据权利要求1所述的一种心音信号识别方法，其特征在于：所述步骤s1中，对原始音频信号进行预处理包括以下步骤：

3.根据权利要求1所述的一种心音信号识别方法，其特征在于：所述步骤s2中，对音频信号进行传统音频特征提取包含以下步骤：

4.根据权利要求1所述的一种心音信号识别方法，其特征在于：所述步骤s2中，对音频信号进行高阶谱特征提取包含以下步骤：

5.根据权利要求1所述的一种心音信号识别方法，其特征在于：所述步骤s3中，构建双分支特征提取网络包含以下步骤：

6.根据权利要求1所述的一种心音信号识别方法，其特征在于：所述步骤s4中，对搭建好的模型进行训练，在验证集上评估准确率、召回率、精确率和f1分数指标。

技术总结
本发明公开了一种心音信号识别方法，涉及信号处理技术领域，包括以下步骤：S1、对原始音频信号进行预处理；S2、对音频信号进行两组特征提取，两组特征分别是传统音频特征和高阶谱特征；S3、模型搭建，构建双分支特征提取网络；S4、对模型训练和验证；S5、评估模型在独立测试集上的表现，本发明通过并行提取高阶谱特征和传统音频特征的方式，有效捕捉了音频信号中的复杂频率关系和关键特征，高阶谱特征能够揭示信号中的非线性频率耦合，而传统音频特征则捕捉了信号的整体时频特性，通过结合这些不同类型的特征，模型可以获得更全面的信号描述，进而提高识别准确性。

技术研发人员：陈浩,顾文烨
受保护的技术使用者：南通理工学院
技术研发日：
技术公布日：2024/11/26

转载请注明原文地址:https://tc.8miu.com/read-34479.html

专利

最新回复(0)