当前位置: 首页 > news >正文

04-GRU模型

RNN及其变体

GRU模型

  • 内部结构

    • 更新门

    • 重置门

  • GRU模型:

  • GRU模型代码实现

    # coding:utf-8
    import torch
    import torch.nn as nn
    ​
    # 模型参数发生变化对其他输入参数的影响
    def  dm01_gru_():'''第一个参数:input_size(输入张量x的维度)第二个参数:hidden_size(隐藏层的维度, 隐藏层的神经元个数)第三个参数:num_layer(隐藏层的数量)# batch_first = True,代表batch_size 放在第一位'''gru = nn.GRU(5, 6, 1, batch_first=True)print(gru.all_weights)print(gru.all_weights[0][0].shape)print(gru.all_weights[0][1].shape)
    ​'''第一个参数:batch_size(批次的样本数量)第二个参数:sequence_length(输入序列的长度)第三个参数:input_size(输入张量的维度)'''input = torch.randn(4, 3, 5)
    ​'''第一个参数:num_layer * num_directions(层数*网络方向)第二个参数:batch_size(批次的样本数)第三个参数:hidden_size(隐藏层的维度, 隐藏层神经元的个数)'''
    ​h0 = torch.randn(1, 4, 6)
    ​# 将数据送入模型得到结果output, hn = gru(input, h0)print(f'output--》{output}')print(f'hn--》{hn}')
    ​
    if __name__ == '__main__':dm01_gru_()

  • BI-GRU

定义: 不改变原始的GRU模型内部结构,只是将文本从左到右计算一遍,再从右到左计算一遍,把最终的输出结果拼接得到模型的完整输出

  • 优缺点

    • 优点:相比LSTM,结构较为简单,能够和lstm一样缓解梯度消失问题

    • 缺点:RNN系列模型不能实现并行运算,数据量大的话,效率比较低

http://www.lqws.cn/news/574417.html

相关文章:

  • python中多线程:线程插队方法join详解、线程停止、通过变量来让线程停止
  • Linux中ssh无法使用配置的环境变量,ssh(非登录环境)环境变量和登录环境变量不同步问题
  • document.write 和 innerHTML、innerText 的区别
  • MATLAB仿真:经过大气湍流的涡旋光束的光斑漂移
  • Transformer超详细全解!含代码实战
  • 双指针的用法
  • 指针篇(6)- sizeof和strlen,数组和指针笔试题
  • 请求转发,响应重定向
  • 在Linux系统中部署Java项目
  • 边界的艺术:支持向量机与统计学习时代的王者
  • 学习日志02 ETF 基础数据可视化分析与简易管理系统
  • 从身体营养元素方向考虑,缺乏哪些元素会导致我偏头痛?
  • GAN的思考及应用
  • 04_JSP进阶_EL_JSTL
  • 养老保险交得越久越好
  • Python爬虫:Requests与Beautiful Soup库详解
  • 机器学习9——决策树
  • 矩阵及矩阵快速幂
  • 【算法设计与分析】(四)Strassen 矩阵
  • 免费SSL证书一键申请与自动续期
  • 贝叶斯自学笔记——基础工具篇(一)
  • 数据库-事务
  • 大数据Hadoop之——Flume安装与使用(详细)
  • sqlserver函数与过程(二)
  • 【Docker基础】Docker容器管理:docker inspect及其参数详解
  • 使用component封装组件和h函数的用法
  • Win10/Win11电源和电池设置打不开/卡住的解决方案(查看 电池健康度报告)
  • 【无标题】linux系统中无法删除文件后空间没有被释放还在被占用
  • AI智能体|扣子(Coze)搭建【沉浸式历史故事解说视频】工作流
  • 设计模式 | 过滤器模式