当前位置：首页 > news >正文

信号处理学习——文献精读与code复现之TFN——嵌入时频变换的可解释神经网络（上）

news 2025/6/29 13:40:29

TFN: An interpretable neural network with time-frequency transform embedded for intelligent fault diagnosis - ScienceDirecthttps://www.sciencedirect.com/science/article/abs/pii/S0888327023008609?via%3Dihub

（看看玲娜贝儿，安慰一下自己，

抚平咱们在家还要开电脑干活的情绪……）

一. 文献阅读

1. 引言

本研究的主要贡献可概括如下：

（1）提出了具有优异可解释性的TFconv层，该层能提取时频信息以获得更佳诊断性能；

（2）所有基于内积的时频变换方法均可作为核函数嵌入TFconv层，本文选取三种典型时频变换方法构建对应TFconv层并展开分析；

（3）通过频响分析阐释了时频网络在频域进行特征提取与预测决策的逻辑基础。实验结果表明，所提出的TFconv层在收敛速度、小样本适应性和泛化能力方面具有显著优势。

2.准备工作

输入信号 x(t)：表示原始的振动信号（如滚动轴承故障信号），可能包含瞬时冲击与频率变化。

与多个核函数 $\psi_f(t)$ 的内积操作：每个 $\psi_f(t)$ 对应一个特定频率；每个内积计算等价于提取该频率分量在该时刻的能量。

Hadamard product、求和与模值操作：模块化（modulo operator）处理实部与虚部能量；得到的是复数形式的时频分布。

输出为二维图像 TF(t, f)：横轴为时间，纵轴为频率，颜色表示幅值（能量）。

接着文献介绍了一下一维CNN。

3. 方法

3.1. Structure of TFconv layer

图 3 展示了 TFconv 层的完整处理流程：

a. 输入信号：为原始的机械振动信号 x(t)，是时间序列数据。

b. 卷积操作：用到两个卷积核，实部核与虚部核（分别代表时频核函数的实部与虚部）

分别与输入信号卷积，得到实部特征 $h_{\text{real}}$ 和虚部特征 $h_{\text{imag}}$ 。

c. 双向传播（forward & back-forward） 表示在训练过程中进行梯度反向传播更新核函数中的可训练参数。

d. 合并操作：对实部与虚部进行 模长计算 $h = \sqrt{h_{\text{real}}^2 + h_{\text{imag}}^2}$ ，对应于复数信号的模，用以得到最终的 时频分布图，即输出特征。

e. 最终输出得到类似于时频图的 2D 特征图，既包含时域信息，又具备频域分布结构，可直接用于下游分类任务。

对比	传统卷积层	TFconv 层（创新点）
实虚结构	实值卷积核	拆分为实部核和虚部核，输出合成采用模长运算
核函数生成	卷积核权重随机初始化并训练	卷积核由具有物理意义的核函数（如 STFT/小波）构造，训练的是核函数的控制参数
可训练参数	每个卷积核的所有参数（如每个权重）均为可训练	仅训练核函数的结构控制参数（如频率因子 f，尺度因子 s，时间平移等）

对比

传统卷积层

TFconv 层（创新点）

实虚

结构

实值卷积核

拆分为实部核和虚部核，输出合成采用模长运算

核函数生成

卷积核权重随机初始化并训练

卷积核由具有物理意义的核函数（如 STFT/小波）构造，训练的是核函数的控制参数

可训练参数

每个卷积核的所有参数（如每个权重）均为可训练

仅训练核函数的结构控制参数（如频率因子 f，尺度因子 s，时间平移等）

3.2 Kernel function of TFconv layer

该部分主要解释了 TFconv 层中的核函数来自于传统时频变换（TFT）中的内积窗口函数（inner product window function），并介绍了三种典型的时频核函数（STFT、chirplet、Morlet wavelet）及其参数含义和区别。

本文考虑三种典型的时频核函数来构造 TFconv 卷积核：

STFT（Short-Time Fourier Transform）核函数
CT（Chirplet Transform）核函数
Morlet WT（Wavelet Transform）核函数

它们的核函数在 TFconv 中用于构造可调卷积核，并拥有各自独立的可调参数，后文将表格中说明。

核函数	中心频率调节	带宽调节方式	控制参数
STTF（图4a）	固定中心频率	固定带宽	f：频率因子
Chirplet（图4b）	可调中心频率	由调频因子 α\alpha 控制线性扩展	f0,α：调频参数
Morlet Wavelet（图4c）	中心频率可调	由尺度因子 ss 控制可伸缩带宽	s：尺度因子

3.3 Interpretability of TFconv layer

图	内容说明
5(a)	传统卷积层的 C-FR，响应图呈现随机分布，没有明确频率偏好，解释性差。
5(b)	TFconv + STFT核的 C-FR，具有明确的频率聚焦，响应集中在某些频带，受核函数调控。
5(c)	TFconv + Morlet核的 C-FR，响应更光滑，带宽受核函数参数控制。
5(d)	O-FR 对比图：实线为 TFconv 层，虚线为传统卷积层。可见 TFconv 在0.2~0.3附近有明显响应峰值，表示其能更好“关注”故障频率所在频段。

TFconv层中的O-FR可以视为模型关注频率的指示器，揭示CNN“关注了哪些频段”，对模型输出影响最大的频段即是关键故障频带。相比传统卷积层，TFconv层具有“可控核函数”和“频域解释性”，对频谱进行结构化选择而非盲目学习。

推论： 若TFconv层输出的 O-FR 与实际机械故障频谱吻合，表明模型确实学会关注关键特征频率。

为验证TFconv层的有效性，本研究选用相对较浅的CNN作为主干网络，所得TFN架构如表3所示。其中𝑛𝑐、𝑁和𝑛𝑝分别代表预处理层通道数、TFconv层长度以及分类类别数。𝑛𝑐和𝑁在TFconv层设计过程中确定，𝑛𝑝则由诊断任务决定。

Part	层编号	网络结构	输出维度
TFconv	1	TFconv(xtx_t)，输入尺寸为1×1024	nc×1024
Backbone	2	卷积（16卷积核，步长1）+BN+ReLU	16×1010
	3	卷积（32核，步长1）+BN+ReLU+最大池化（步长2）	32×504
	4	卷积（64核，步长1）+BN+ReLU	64×502
	5	卷积（128核，步长1）+BN+ReLU+自适应池化	128×4
	6	Flatten	512
	7	Dense(256)+ReLU+Dense(npn_p)	np