当前位置: 首页 > news >正文

信号处理学习——文献精读与code复现之TFN——嵌入时频变换的可解释神经网络(上)

​​​​​​​​​​​​​​TFN: An interpretable neural network with time-frequency transform embedded for intelligent fault diagnosis - ScienceDirecthttps://www.sciencedirect.com/science/article/abs/pii/S0888327023008609?via%3Dihub

(看看玲娜贝儿,安慰一下自己,

抚平咱们在家还要开电脑干活的情绪……)

一. 文献阅读

1. 引言

本研究的主要贡献可概括如下:

(1)提出了具有优异可解释性的TFconv层,该层能提取时频信息以获得更佳诊断性能;

(2)所有基于内积的时频变换方法均可作为核函数嵌入TFconv层,本文选取三种典型时频变换方法构建对应TFconv层并展开分析;

(3)通过频响分析阐释了时频网络在频域进行特征提取与预测决策的逻辑基础。实验结果表明,所提出的TFconv层在收敛速度、小样本适应性和泛化能力方面具有显著优势。

2.准备工作

输入信号 x(t):表示原始的振动信号(如滚动轴承故障信号),可能包含瞬时冲击与频率变化。

与多个核函数  \psi_f(t)的内积操作:每个 \psi_f(t) 对应一个特定频率;每个内积计算等价于提取该频率分量在该时刻的能量。

Hadamard product、求和与模值操作:模块化(modulo operator)处理实部与虚部能量;得到的是复数形式的时频分布

输出为二维图像 TF(t, f):横轴为时间,纵轴为频率,颜色表示幅值(能量)。

接着文献介绍了一下一维CNN。

3. 方法

3.1. Structure of TFconv layer

图 3 展示了 TFconv 层的完整处理流程:

a. 输入信号:为原始的机械振动信号 x(t),是时间序列数据。

b. 卷积操作:用到两个卷积核,实部核虚部核(分别代表时频核函数的实部虚部

分别与输入信号卷积,得到实部特征 h_{\text{real}}和虚部特征 ​h_{\text{imag}}

c. 双向传播(forward & back-forward) 表示在训练过程中进行梯度反向传播更新核函数中的可训练参数。

d. 合并操作:对实部与虚部进行 模长计算 h = \sqrt{h_{\text{real}}^2 + h_{\text{imag}}^2}​​,对应于复数信号的模,用以得到最终的 时频分布图,即输出特征。

e. 最终输出得到类似于时频图的 2D 特征图,既包含时域信息,又具备频域分布结构,可直接用于下游分类任务。

对比

传统卷积层TFconv 层(创新点)

实虚

结构

实值卷积核拆分为实部核和虚部核,输出合成采用模长运算
核函数生成卷积核权重随机初始化并训练卷积核由具有物理意义的核函数(如 STFT/小波)构造,训练的是核函数的控制参数
可训练参数每个卷积核的所有参数(如每个权重)均为可训练仅训练核函数的结构控制参数(如频率因子 f,尺度因子 s,时间平移等)

3.2 Kernel function of TFconv layer

该部分主要解释了 TFconv 层中的核函数来自于传统时频变换(TFT)中的内积窗口函数(inner product window function),并介绍了三种典型的时频核函数(STFT、chirplet、Morlet wavelet)及其参数含义和区别。

本文考虑三种典型的时频核函数来构造 TFconv 卷积核:

  • STFT(Short-Time Fourier Transform)核函数
  • CT(Chirplet Transform)核函数

  • Morlet WT(Wavelet Transform)核函数

它们的核函数在 TFconv 中用于构造可调卷积核,并拥有各自独立的可调参数,后文将表格中说明。

核函数中心频率调节带宽调节方式控制参数
STTF(图4a)固定中心频率固定带宽f:频率因子
Chirplet(图4b)可调中心频率由调频因子 α\alpha 控制线性扩展f0,α:调频参数
Morlet Wavelet(图4c)中心频率可调由尺度因子 ss 控制可伸缩带宽s:尺度因子

3.3 Interpretability of TFconv layer

内容说明
5(a)传统卷积层的 C-FR,响应图呈现随机分布,没有明确频率偏好,解释性差。
5(b)TFconv + STFT核的 C-FR,具有明确的频率聚焦,响应集中在某些频带,受核函数调控。
5(c)TFconv + Morlet核的 C-FR,响应更光滑,带宽受核函数参数控制。
5(d)O-FR 对比图:实线为 TFconv 层,虚线为传统卷积层。可见 TFconv 在0.2~0.3附近有明显响应峰值,表示其能更好“关注”故障频率所在频段。

TFconv层中的O-FR可以视为模型关注频率的指示器,揭示CNN“关注了哪些频段”,对模型输出影响最大的频段即是关键故障频带。相比传统卷积层,TFconv层具有“可控核函数”和“频域解释性”,对频谱进行结构化选择而非盲目学习。

推论: 若TFconv层输出的 O-FR 与实际机械故障频谱吻合,表明模型确实学会关注关键特征频率。

为验证TFconv层的有效性,本研究选用相对较浅的CNN作为主干网络,所得TFN架构如表3所示。其中𝑛𝑐、𝑁和𝑛𝑝分别代表预处理层通道数、TFconv层长度以及分类类别数。𝑛𝑐和𝑁在TFconv层设计过程中确定,𝑛𝑝则由诊断任务决定。

Part层编号网络结构输出维度
TFconv1TFconv(xtx_t),输入尺寸为1×1024nc×1024
Backbone2卷积(16卷积核,步长1)+BN+ReLU16×1010
3卷积(32核,步长1)+BN+ReLU+最大池化(步长2)32×504
4卷积(64核,步长1)+BN+ReLU64×502
5卷积(128核,步长1)+BN+ReLU+自适应池化128×4
6Flatten512
7Dense(256)+ReLU+Dense(npn_p)np

代码复现已更新!

信号处理学习——文献精读与code复现之TFN——嵌入时频变换的可解释神经网络(下)-CSDN博客

http://www.lqws.cn/news/560377.html

相关文章:

  • 数据湖 vs 数据仓库:数据界的“自来水厂”与“瓶装水厂”?
  • 阿里 Qwen3 模型更新,吉卜力风格get
  • 对话式数据分析与Text2SQL Agent产品可行性分析思考
  • 安卓中静态和动态添加子 View 到容器
  • Zotero 7 插件:翻译与护眼主题
  • 如何快速学习一门新编程语言
  • 使用asyncio构建高性能网络爬虫
  • Vue 项目中 Excel 导入导出功能笔记
  • 开疆智能CCLinkIE转ModbusTCP网关连接傲博机器人配置案例
  • 道路交通标志检测数据集-智能地图与导航 交通监控与执法 智慧城市交通管理-2,000 张图像
  • 鸿蒙5:ArkTS基本介绍
  • Ubuntu20.04离线安装Realtek b852无线网卡驱动
  • Note2.2 机器学习训练技巧:Batch and Momentum(Machine Learning by Hung-yi Lee)
  • vue-29(创建 Nuxt.js 项目)
  • 创客匠人视角:创始人 IP 打造为何成为知识变现的核心竞争力
  • electron中显示echarts
  • 微机系统 第八章 模拟接口
  • Windows 合并多个txt到一个txt文件中 (txt文件的合并与拆分)
  • 【Go语言-Day 10】深入指针应用:解锁函数“引用传递”与内存分配的秘密
  • 如何让ChatGPT模仿人类写作,降低AIGC率?
  • 设计模式-代理模式、装饰者模式
  • [Java 基础]LinkedList
  • 告别脚本!用浏览器为 AWS CLI 实现真正的 Cognito 单点登录
  • 基于Spring Boot的网上购物平台设计与实现
  • 【软考--软件设计师】10.2 关系型数据库
  • 网络安全体系结构和安全防护
  • Linux内核网络协议栈深度解析:面向连接的INET套接字实现
  • 【AI实践】Mac一天熟悉AI模型智能体应用(百炼版)
  • 前端React和Vue框架的区别
  • Spring AI Alibaba 入门指南:打造企业级 AI 应用