当前位置: 首页 > news >正文

从0开始学习计算机视觉--Day04--损失函数

在上次学习中,我们知道了线性分类的函数是f(x,W),但并没有解释要怎么得到W权重矩阵的值,以及我们要怎么用训练数据来确定它的最优权重矩阵。在之前我们知道,假设用了10种类别的图片用于训练,将其中一种图片输入模型后,会根据W输出每个类别所对应的分数,但是并不是所属的类别分数就一定高,这时我们把这个W作为输入放入一个函数中,由这个函数根据是否图片对应的类别分数最高,来判断W的好坏,也就是能知道这个W距离真正好的W差了多少,我们把这个函数称之为损失函数(cost function),而不断地输入不同的W来找到损失最小的W的过程,就叫做优化过程。

一般会采用一个通用定义L=\frac{1}{N}\sum_{}^{}{L_{i}(f(x_{i},W),y_{i})},x和y就是训练集里的像素点数据和图片的标签,f是损失函数,L是输入N个样本后的平均损失值。在这个图片分类的例子中,采用的是多分类SVM的损失函数,如下图所示:

与二分类的分类函数有点类似,后者是只要计算A的损失值比B类大得多,就认为损失值为0(即为A类),前者只是把所有错误的类别放在了一起(可以理解为B类是一个错误类别的集合),计算过程与其类似。而图中的s_y_i代表的是正确的类别的分数,s_j则代表的是剩余错误的类比的分数和,图像里的意思就是当正确类别的分数,大于错误类比的分数和再加上1,即认为大于这个数值就认为这个图片被正确分类了,1是认为设定的安全边界,可以根据实际情况调整。将图中类别的分数分别带入公式计算得到猫的损失值为2.9,汽车的损失值为0,青蛙损失值为12.9,求得平均值为5.3。

值得注意的是,在训练的过程中,可以先不着急训练完整个模型,而是先输出损失值来判断,假如有C个类别,而输出的结果不是接近于C-1(假设设置边界为1),我们就需要检查一下是否有问题,因为C-1就代表正确类别的分数与错误类别的分数很接近,每个错误类别的损失值都接近于1。

学习来自于斯坦福教程:Stanford University CS231n: Deep Learning for Computer Vision

http://www.lqws.cn/news/541315.html

相关文章:

  • 杭州西湖断桥不断:3D扫描还原‘残雪‘视觉骗局
  • 在反向代理环境下精准获取客户端真实 IP 的最佳实践
  • Linux journal 日志大小限制与管理详解
  • vue-27(实践练习:将现有组件重构为使用组合式 API)
  • 七天学会SpringCloud分布式微服务——04——Nacos配置中心
  • 便携式水质检测仪的功能
  • 基于 SpringBoot+Vue 的台球厅管理系统的设计与实现(毕业论文)
  • [ linux-系统 ] 磁盘与文件系统
  • 排查 WebView 中 touch、click 事件失效:移动端调试过程详解
  • PIXHAWK(ardupilot4.52)NMEA的解析bug
  • EXCEL数据报表
  • 接口自动化测试框架(pytest+allure+aiohttp+用例自动生成)
  • 【Python基础】05 Python视频压缩技术深度解析
  • 商务创业项目策划计划书PPT模版
  • [Meetily后端框架] 配置指南 | 后端API网关 | API文档体系
  • VB.NET,C#字典对象来保存用户数据,支持大小写
  • Unreal引擎——Chaos物理引擎(不)详解
  • 官方 Linker Scripts 语法和规则解析(2)
  • 《算力迁徙:WebAssembly如何将C++算法炼成前端》
  • 临床项目范围管理:确保项目聚焦与成功交付
  • Flutter 网络请求指南, 从 iOS 到 Flutter 的 Dio + Retrofit 组合
  • 【组管理】创建组删除组修改文件/目录所属组
  • Windows11系统上安装WM虚拟机及Ubuntu 22.04系统
  • 小型软件开发的三重境界:从混沌编码到结构化设计
  • 用3个字符表示2字节二进制数据
  • 【菜狗的记录】模糊聚类最大树、图神经网络、大模型量化——20250627
  • [论文阅读] 人工智能 | 真实场景下 RAG 系统的工程实践指南
  • 机器学习基础 多层感知机
  • C++动态链接库之非托管封装Invoke,供C#/C++ 等编程语言使用,小白教程——C++动态链接库(一)
  • 【 MyBatis-Plus | 精讲 】