当前位置: 首页 > news >正文

02 Deep learning神经网络的编程基础 逻辑回归--吴恩达

逻辑回归

逻辑回归是一种用于解决二分类任务(如预测是否是猫咪等)的统计学习方法。尽管名称中包含“回归”,但其本质是通过线性回归的变体输出概率值,并使用Sigmoid函数将线性结果映射到[0,1]区间。

以猫咪预测为例

假设单个样本/单张图片为( x \mathbf{x} x y \mathbf{y} y),特征向量X = x \mathbf{x} x,则 y ^ \hat{y} y^即为X的预测值, y ^ \hat{y} y^=P(y= y \mathbf{y} y/ x \mathbf{x} x), y ^ \hat{y} y^∈(0,1)。
假设特征权重参数为 w \mathbf{w} w,是一个nx维的向量,则有:
y ^ \hat{y} y^= σ \sigma σ w ⊤ w^\top w x \mathcal{x} x+ b \mathcal{b} b
z \mathcal{z} z = w ⊤ w^\top w x \mathcal{x} x+ b \mathcal{b} b
y ^ \hat{y} y^= σ ( z ) \sigma(z) σz

Sigmoid函数

Sigmoid函数是一种常用的S型激活函数,数学表达式为:
σ ( z ) = 1 1 + e − z \sigma(z) = \frac{1}{1 + e^{-z}} σ(z)=1+ez1
在这里插入图片描述
机器学习便是学习参数 x \mathcal{x} x b \mathcal{b} b,使得 y ^ \hat{y} y^尽可能接近实际值 y \mathcal{y} y

符号惯例介绍

定义一个额外特征向量 x 0 \mathcal{x_0} x0 =1,
y ^ \hat{y} y^= σ \sigma σ( θ T \theta^{T} θT x \mathcal{x} x ),其中 θ 0 \theta_0 θ0充当 b \mathcal{b} b,其余 θ 1 \theta_1 θ1 θ n x \theta_{nx} θnx充当 w \mathbf{w} w

核心特性
  1. 输出范围:$ (0,1) $,适合概率映射
  2. 单调性:全程可导且导数最大值为$ 0.25 (出现在 (出现在 (出现在x=0$处)
  3. 导数特性 σ ′ ( x ) = σ ( x ) ( 1 − σ ( x ) ) \sigma'(x) = \sigma(x)(1 - \sigma(x)) σ(x)=σ(x)(1σ(x)),便于梯度计算
Python实现
import numpy as npdef sigmoid(x):return 1 / (1 + np.exp(-x))# 支持向量化计算
print(sigmoid(np.array([-1.0, 0.0, 1.0])))  # 输出:[0.2689, 0.5, 0.7311]
典型应用
  1. 逻辑回归中的概率转换
  2. 神经网络隐藏层的激活函数
  3. 强化学习中的动作选择概率
局限说明
  • 深层网络易出现梯度消失(导数值随网络深度指数衰减)
  • 输出不以零为中心可能影响优化效率
  • 现多被ReLU系列函数替代用于隐藏层
http://www.lqws.cn/news/148897.html

相关文章:

  • calico/node is not ready: BIRD is not ready: BGP not established with xxx
  • 使用 Docker Compose 安装 PostgreSQL 16
  • 网络安全面试题目(无答案)
  • Tailwind CSS 实战:基于 Kooboo 构建 AI 对话框页面(七):消息框交互功能添加
  • 招工招聘系统开发,重塑人才招聘新格局
  • Life:Internship finding
  • 【6.2-6.9学习周报】
  • SpringBoot EhCache 缓存
  • 国产linux系统(银河麒麟,统信uos)使用 PageOffice在线编辑word文件保存数据同时保存文件
  • NVM!(可以快速替换你的node版本)
  • 无人机军用与民用技术对比分析
  • 购物商城网站 Java+Vue.js+SpringBoot,包括商家管理、商品分类管理、商品管理、在线客服管理、购物订单模块
  • 神经网络与深度学习 网络优化与正则化
  • vue3+ts+vite:详细、完整的 tsconfig.json 示例 / 常见配置项及其用途
  • 在word中点击zotero Add/Edit Citation没有反应的解决办法
  • 【HTML】HTML 与 CSS 基础教程
  • 低功耗高安全:蓝牙模块在安防系统中的应用方案
  • python版若依框架开发:项目结构解析
  • 使用Node.js分片上传大文件到阿里云OSS
  • 【深度学习】为什么2个3×3的卷积可以相当于一个5×5的卷积核?为什么3个3×3的卷积相当于一个7×7的卷积核,到底区别在哪里?我们该如何使用?
  • 从零搭建到 App Store 上架:跨平台开发者使用 Appuploader与其他工具的实战经验
  • 金融系统功能测试:科技赋能,安全护航
  • 总结HTML中的文本标签
  • 深入浅出玩转物联网时间同步:基于BC260Y的NTP实验与嵌入式仿真教学革命
  • HTML中各种标签的作用
  • Apache Doris + MCP:Agent 时代的实时数据分析底座
  • OrCAD X Capture CIS设计小诀窍系列第二季--03.如何在Capture中输出带有目录和元器件信息的PDF
  • javaweb -html -CSS
  • 专业级PDF转CAD解决方案
  • php apache构建 Web 服务器