当前位置: 首页 > news >正文

自编码器Auto-encoder(李宏毅)

目录

编码器的概念:

为什么需要编码器?

编码器什么原理?

去噪自编码器:

自编码器的应用:

特征解耦

离散隐表征


编码器的概念:

重构:输入一张图片,通过编码器转化成向量,要求再通过解码器解码这个向量,要求得到的东西越接近输入越好。

编码器要做的:输入的东西是一个高维度的,转换成低纬度的向量,然后让解码器可以借助这个低维度的向量来输出这个图片的低纬度版本

为什么需要编码器?

向量维度太高了,没办法处理,需要借助编码器降维减少运算量。

编码器什么原理?

假如输入的图片是一个3×3的矩阵,但是矩阵有很多种变化,但是图片的变化是有限的,可能在图像中这个矩阵只有两种类型,那么就可以用一个2×1的就可以描述这个矩阵的变化。

去噪自编码器:

原来的高清图片在输入的时候加上了杂讯,要编码再解码之后,输出的图片要尽可能还原为高清图片。

之前学的BERT要把台*大学尽可能地还原为台湾大学,就可以看作一个de-noising  auto-encoder

自编码器的应用:

特征解耦

输入图片得到向量,向量里面都存储着什么?图片的细节、纹理、大小、色泽?

输入音频得到向量,向量里面都存储着什么?音频的内容、音色?

把这些内容解耦合,输入迪丽热巴的一段话,提取迪丽热巴的音色,和我想说的内容组成一个新的向量,“让迪丽热巴替我说话”

离散隐表征

输入的这个图片有什么特征?男的女的?戴眼镜否?

用向量的一个部分预测一个特征

但是这个特征不一定要是一个属性,也可以是一段文字,做文章自动摘要器。

http://www.lqws.cn/news/65971.html

相关文章:

  • WSL2 安装与Docker安装
  • CP4-OFDM模糊函数原理及仿真
  • HTTPS
  • Flickr30k Entities短语定位评测指南
  • 微调大模型:什么时候该做,什么时候不该做?
  • 湖北理元理律师事务所:企业债务优化的科学路径与人文关怀
  • vscode编辑器怎么使用提高开发uVision 项目的效率,如何编译Keil MDK项目?
  • Nginx反向代理
  • Pull Request Integration 拉取请求集成
  • Mybatis-Plus 学习
  • JMeter 直连数据库
  • 设备驱动与文件系统:01 I/O与显示器
  • linux信号详解
  • Java正则表达式完全指南
  • Java实现中文姓名转拼音生成用户信息并写入文件
  • Java函数式编程(上)
  • 象棋里的卧槽马、侧面虎、金钩马的方位与解析
  • OpenLayers 地图标注之图文标注
  • [Python] Python中的多重继承
  • 儿童节快乐,聊聊数字的规律和同余原理
  • STM32——CAN总线
  • 助力高校AI教学与科研:GpuGeek推出618算力支持活动
  • Launcher3体系化之路
  • python打卡day42
  • vscode 代理模式(agent mode),简单尝试一下。
  • 02.05、链表求和
  • debian12.9或ubuntu,vagrant离线安装插件vagrant-libvirt,20250601
  • Maven(黑马)
  • mybatis02
  • while循环判断数字位数