当前位置：首页 > news >正文

04-GRU模型

news 2025/6/30 17:14:01

RNN及其变体

GRU模型

内部结构
- 更新门
- 重置门
GRU模型：

GRU模型代码实现

# coding:utf-8
import torch
import torch.nn as nn

# 模型参数发生变化对其他输入参数的影响
def  dm01_gru_():'''第一个参数：input_size(输入张量x的维度)第二个参数：hidden_size(隐藏层的维度， 隐藏层的神经元个数)第三个参数：num_layer(隐藏层的数量)# batch_first = True，代表batch_size 放在第一位'''gru = nn.GRU(5, 6, 1, batch_first=True)print(gru.all_weights)print(gru.all_weights[0][0].shape)print(gru.all_weights[0][1].shape)
'''第一个参数：batch_size(批次的样本数量)第二个参数：sequence_length(输入序列的长度)第三个参数：input_size(输入张量的维度)'''input = torch.randn(4, 3, 5)
'''第一个参数：num_layer * num_directions(层数*网络方向)第二个参数：batch_size(批次的样本数)第三个参数：hidden_size(隐藏层的维度， 隐藏层神经元的个数)'''
h0 = torch.randn(1, 4, 6)
# 将数据送入模型得到结果output, hn = gru(input, h0)print(f'output--》{output}')print(f'hn--》{hn}')

if __name__ == '__main__':dm01_gru_()

BI-GRU

定义: 不改变原始的GRU模型内部结构，只是将文本从左到右计算一遍，再从右到左计算一遍，把最终的输出结果拼接得到模型的完整输出

优缺点
- 优点：相比LSTM，结构较为简单，能够和lstm一样缓解梯度消失问题
- 缺点：RNN系列模型不能实现并行运算，数据量大的话，效率比较低

http://www.lqws.cn/news/574417.html

相关文章：

python中多线程：线程插队方法join详解、线程停止、通过变量来让线程停止

Linux中ssh无法使用配置的环境变量，ssh（非登录环境）环境变量和登录环境变量不同步问题

document.write 和 innerHTML、innerText 的区别

MATLAB仿真：经过大气湍流的涡旋光束的光斑漂移

Transformer超详细全解！含代码实战

双指针的用法

指针篇（6）- sizeof和strlen,数组和指针笔试题

请求转发，响应重定向

在Linux系统中部署Java项目

边界的艺术：支持向量机与统计学习时代的王者

学习日志02 ETF 基础数据可视化分析与简易管理系统

从身体营养元素方向考虑，缺乏哪些元素会导致我偏头痛？

GAN的思考及应用

04_JSP进阶_EL_JSTL

养老保险交得越久越好

Python爬虫：Requests与Beautiful Soup库详解

机器学习9——决策树

矩阵及矩阵快速幂

【算法设计与分析】（四）Strassen 矩阵

免费SSL证书一键申请与自动续期

贝叶斯自学笔记——基础工具篇（一）

数据库-事务

大数据Hadoop之——Flume安装与使用（详细）

sqlserver函数与过程（二）

【Docker基础】Docker容器管理：docker inspect及其参数详解

使用component封装组件和h函数的用法

Win10/Win11电源和电池设置打不开/卡住的解决方案（查看电池健康度报告）

【无标题】linux系统中无法删除文件后空间没有被释放还在被占用

AI智能体|扣子(Coze)搭建【沉浸式历史故事解说视频】工作流

设计模式 | 过滤器模式