当前位置: 首页 > news >正文

【深度学习基础与概念】笔记(一)深度学习革命

datawhale组队学习,共读ai新圣经

一、深度学习革命的核心概念

  1. 机器学习 vs 深度学习

    • 机器学习:通过数据训练算法,替代传统手工设计规则(如分类、回归)
    • 深度学习:机器学习的分支,基于神经网络,模拟人脑信息处理机制,可处理高维复杂数据(如图像、语言)
    • 通用人工智能(AGI):大语言模型(如GPT-4)展现的跨任务能力被视为AGI雏形
  2. 关键术语对比

    概念定义示例
    监督学习使用标注数据训练模型皮肤癌分类、蛋白质结构预测
    无监督学习从无标注数据中发现模式人脸图像生成
    自监督学习自动从数据中生成标签大语言模型(预测下一个词)
    迁移学习预训练模型微调适应新任务医疗诊断模型复用日常图像特征

二、深度学习的四大应用场景

  1. 医疗诊断

    • 案例:黑色素瘤分类模型(准确率超专业医生)
    • 技术要点:使用迁移学习解决数据稀缺
  2. 蛋白质结构预测

    • AlphaFold突破:通过氨基酸序列预测3D结构,误差接近实验测定水平
    • 意义:加速新药研发与生物过程理解。
  3. 图像合成

    生成式模型:如GAN、扩散模型,生成与训练数据统计特性一致的新样
  4. 大语言模型(LLM)

    核心机制:自回归预测(根据上文生成下文),通过海量文本自监督训练。

三、教学示例:多项式拟合中的机器学习原理

误差函数:用来确定多项式系数

  1. 过拟合与泛化

    • 问题:高阶多项式(如M=9)完美拟合训练数据但测试误差剧增。
    • 根源:模型复杂度过高,拟合了噪声而非真实规律。
  2. 正则化技术

    • 方法:在误差函数中添加权重惩罚项
    • 效果:抑制系数幅值,提升泛化能力
  3. 模型选择与验证

    • 交叉验证:将数据分为S份,轮流用S-1份训练、1份验证,避免过拟合(图1.12)。问题:模型训练成本大幅提升,与超参数结合训练成本指数级提高。
    • 超参数调优:通过验证集选择最佳多项式阶数M或正则化强度λ。

四、神经网络发展简史与技术突破

  1. 三个阶段演进

    • 单层网络(1950s-1980s):感知机受限(仅线性可分问题)。
    • 反向传播(1980s-2000s):引入梯度下降与可微激活函数,训练多层网络
    • 深度网络(2010s至今):GPU算力 + 大数据 + 架构创新(如残差连接)推动爆发
  2. 残差连接(ResNet)

    原理:学习残差而非直接映射,提高深层网络训练效率。
http://www.lqws.cn/news/453025.html

相关文章:

  • 【Golang】go build 命令选项-ldflags用法
  • Spring @ModelAttribute注解全解析:数据绑定与模型管理
  • ceph 通过 crush rule 修改故障域
  • DataWhale-零基础络网爬虫技术(二er数据的解析与提取)
  • LeetCode热题100—— 169. 多数元素
  • leetcode 291. Word Pattern II和290. Word Pattern
  • 解锁数据宝藏:数据挖掘之数据预处理全解析
  • 在Django中把Base64字符串保存为ImageField
  • 思辨场域丨AR技术如何重塑未来学术会议体验?
  • LVS vs Nginx 负载均衡对比:全面解析
  • leetcode-2966.划分数组并满足最大差限制
  • 多相机三维人脸扫描仪:超写实数字人模型制作“加速器”
  • Android Java语言转Kotlin语言学习指导实用攻略
  • 单片机3种按键程序消抖方法
  • DB-GPT启动提示please install by running `pip install cryptography`
  • 函数指针的回调函数与函数跳转执行
  • 国产芯片能在服务器领域替代Intel(经验总结贴)
  • Git——分布式版本控制工具
  • 【MySQL篇07】:redo log日志与buffer pool详解
  • Vue2 ElementUI Tree 拖动目标节点能否被放置及获取放置位置
  • 内存的代价:如何正确与 WASM 模块传值交互
  • 大内存对电脑性能有哪些提升
  • Docker容器常用命令汇总
  • 游戏架构中的第三方SDK集成艺术:构建安全高效的接入体系
  • 16、Redis底层数据结构
  • 网站如何启用HTTPS访问?本地内网部署的https网站怎么在外网打开?
  • FPGA--hello
  • http通信测试,模拟客户端
  • 【动手学深度学习】4.5. 权重衰减
  • Hollywood: The World’s Most Effective Propaganda System