当前位置: 首页 > news >正文

5.基于神经网络的时间序列预测

        近年来,已经开发了一些深度学习方法并将其应用于单变量时间预测场景,其中时间序列由在等时间增量上按顺序记录的单个观测数据组成。

5.1 将深度学习用于时间序列预测的原因

        机器学习的目标是提取特征来训练模型。模型将输入数据(例如图片,时间序列或音频)转换为给定的输出(例如字幕、价格值或转录)。深度学习是机器学习算法的子集。它通过经输入数据表示为向量并将其通过一系列线性代数运算转换为给定的输出来学习并提取特征。为了进一步阐明深度学习和机器学习之间的区别,我们首先分别定义这两个研究领域:

        1.机器学习 是一直使用算法来分析数据,从中学习并随后使用此数据对某种现象做出一写预测的实践。这个学习过程通常基于以下步骤:

                a.向算法中填充数据;

                b.使用这些数据来从以前的观测值中学习并训练数据。

                c.运行测试来检查模型是否从以前的观测值中进行了足够的学习并对其性能进行评估。

                d.如果模型表现良好,我们将其部署并投入生产阶段,以供组织中或企业外部的其他利益相关者使用。

                e.最后,使用部署的模型来执行某些自动化的预测任务。

        2.深度学习是机器学习的子集。深度学习算法基于人工神经网络,是一种特定类型的机器学习算法,是因为算法的结构基于人工神经网络。人工神经网络由多个输入、输出和隐藏层组成,其中包含一些单元。一旦部署了深度学习模型,这些单元就可以就将输入数据转换为一些信息,供下一层用于执行某些自动化预测任务。

        深度学习神经网络具有三个主要的内在特性:

        a.深度学习神经网络能够自动从原始数据中学习和提取特征。

        b.深度学习支持多个输入和输出。

        c.循环神经网络,特别是LSTM和门控循环单元(GRU),擅长提取跨越相对较长序列的输入数据中的模式。

        5.1.1 深度学习神经网络能够自动从原始数据中学习和提取特征

        5.1.2 深度学习支持多个输入和输出

        5.1.3 循环神经网络擅长从输入数据中提取模式

5.2 基于循环神经网络的时间序列预测

        5.2.1 循环神经网络 RNN

        5.2.2 长短期记忆 LSTM

        5.2.3 门控循环单元 GRU(Gated Recurrent Unit)

        GRU是传统RNN的变体,同LSTM一样neg有效捕捉长序列之间的语义关联,缓解梯度消失或爆炸现象。同时它的结构和计算要比LSTM更简单,它的核心结构可以分为两个部分去解析:

        更新门

        用于控制上一时间步的隐藏状态是否对当前时间步的输入进行更新。更新门的作用类似于LSTM中的遗忘门和输入门的组合,它决定了新信息进入当前隐藏状态的比例,以及保留多少旧信息。

        重置门

        用于控制如何使用历史信息。当重置门接近0时,它几乎会忽略掉所有的历史信息,而只关注当前输入。这有助于模型在处理新的输入时能够“忘记”不相关的信息,从而更好地捕捉序列中的长期依赖关系。

        内部结构图:

                

        结构解析图:

            

        GRU的更新门和重置门结构图    :

                

        GRU的优点:

         GRU和LSTM作用相同, 在捕捉长序列语义关联时, 能有效抑制梯度消失或爆炸, 效果都优于传统RNN且计算复杂度相比LSTM要小.

        GRU的缺点:

        GRU仍然不能完全解决梯度消失问题, 同时其作用RNN的变体, 有着RNN结构本身的一大弊端, 即不可并行计算, 这在数据量和模型体量逐步增大的未来, 是RNN发展的关键瓶颈.

5.3 如何开发用于时间序列的GRU和LSTM

        5.3.1 Keras

        5.3.2Tensorflow

        5.3.3 单变量模型

        5.3.4 多变量模型

5.4 总结

                

        

参考:【机器学习】探索GRU:深度学习中门控循环单元的魅力-腾讯云开发者社区-腾讯云

        

        

http://www.lqws.cn/news/459649.html

相关文章:

  • 数据库中间件ShardingSphere5
  • Vue学习笔记
  • Dify动手实战教程(进阶-知识库:新生入学指南)
  • 让大模型“更懂人话”:对齐训练(RLHF DPO)全流程实战解析
  • 《王者荣耀》系统架构深度技术解析
  • 进阶五 按键切换不同led流水效果
  • 李宏毅 《生成式人工智能导论》| 第6讲-第8讲:大语言模型修炼史
  • 关于ubuntu环境下vscode进行debug的随笔
  • 【工具教程】识别PDF中文字内容,根据文字内容对PDF批量重命名,提取识别PDF内容给图片重新命名的操作步骤和注意事项
  • 第十三章 模板
  • 机器学习流量识别(pytorch+NSL-KDD+多分类建模)
  • 自动化性能回退机制——蓝绿部署与灰度发布
  • 前端 CSS 框架:分类、选择与应用
  • 「AI高校」| 《清华大学:AI赋能教育高考志愿填报工具使用指南》
  • 新品上市 | 尺寸小且具有丰富接口的读卡器:RFID高频系列CK-FR06
  • MySQL之事务深度解析
  • django FileSystemStorage is located outside of the base path component
  • Android Studio报错:Could not move temporary workspace () to immutable location
  • NY339NY341美光固态闪存NW841NW843
  • MySQL入门初解
  • 数据分析和可视化:Py爬虫-XPath解析章节要点总结
  • 【Dify学习笔记】:RagFlow接入Dify基础教程
  • Real-World Deep Local Motion Deblurring论文阅读
  • Linux——linux的基本命令
  • ceph 自动调整 pg_num
  • 链接过程使用链接器将该目标文件与其他目标文件、库文件、启动文件等链接起来生成可执行文件。附加的目标文件包括静态连接库和动态连接库。其中的启动文件是什么意思?
  • SpringMVC知识点总结
  • python自助棋牌室管理系统
  • golang编译时传递参数或注入变量值到程序中
  • JVM对象内存分配机制全解析