当前位置: 首页 > news >正文

《Pytorch深度学习实践》ch8-多分类

                                                        ------B站《刘二大人》

1.Softmax Layer

  • 在多分类问题中,输出的是每类的概率:

  • 计算公式:保证了每类概率大于 0 ,又由保证了概率之和为 1;

  • 举例如下:

2.Cross Entropy

  • 计算损失:

  • y = np.array([1, 0, 0]):是目标标签的 one-hot 编码。假设有 3 个类别,这里表示正确的类别是第一个类别;
import numpy as np
y = np.array([1, 0, 0])
z = np.array([0.2, 0.1, -0.1])
y_pred = np.exp(z) / np.exp(z).sum()
loss = (-y * np.log(y_pred)).sum()
print(loss) # 0.9729189131256584
  • 交叉熵损失函数: 

  • y 是一个长度为 1 的长整型张量,是标签类别的 索引[0] 表示正确的类别是类别 0;
import torch
y = torch.LongTensor([0])
z = torch.Tensor([[0.2, 0.1, -0.1]])
criterion = torch.nn.CrossEntropyLoss()
loss = criterion(z, y)
print(loss) # tensor(0.9729)
  • Mini - Batch
import torch
criterion = torch.nn.CrossEntropyLoss()
Y = torch.LongTensor([2, 0, 1])Y_pred1 = torch.Tensor([[0.1, 0.2, 0.9],[1.1, 0.1, 0.2],[0.2, 2.1, 0.1]])
Y_pred2 = torch.Tensor([[0.8, 0.2, 0.3],[0.2, 0.3, 0.5],[0.2, 0.2, 0.5]])loss1 = criterion(Y_pred1, Y) # Batch Loss1 =  tensor(0.4966)
loss2 = criterion(Y_pred2, Y) # Batch Loss2 =  tensor(1.2389)
print('Batch Loss1 = ', loss1.data, '\nBatch Loss2 = ', loss2.data)

3.MNIST

  • 导包
import torch
from torchvision import datasets
from torchvision import transforms
from torch.utils.data import DataLoader
import torch.nn.functional as F
import torch.optim as optim
  • 准备数据集
    • ToTensor():将图片转换为PyTorch的张量。
    • Normalize(mean, std):使用指定的均值和标准差对图片进行标准化。

batch_size = 64transform = transforms.Compose([transforms.ToTensor(),transforms.Normalize((0.1307, ), (0.3081, ))
])train_dataset = datasets.MNIST('data/MNIST/', train=True, transform=transform, download=True)
train_loader = DataLoader(dataset=train_dataset, batch_size=batch_size, shuffle=True)test_dataset = datasets.MNIST('data/MNIST/', train=False, transform=transform, download=True)
test_loader = DataLoader(dataset=test_dataset, batch_size=batch_size, shuffle=False)
  • 构造模型
    • 输入层:784个神经元(因为每张图片是28x28,展平后变成784维)。
    • 隐藏层:4个全连接层,神经元数量分别为512、256、128和64。
    • 输出层:10个神经元,分别对应数字0到9。
    • 最后一层不做激活,因为后面调用 torch.nn.CrossEntropyLoss。
class Net(torch.nn.Module):def __init__(self):super(Net, self).__init__()self.linear1 = torch.nn.Linear(784, 512)self.linear2 = torch.nn.Linear(512, 256)self.linear3 = torch.nn.Linear(256, 128)self.linear4 = torch.nn.Linear(128, 64)self.linear5 = torch.nn.Linear(64, 10)def forward(self, x):x = x.view(-1, 784)x = F.relu(self.linear1(x))x = F.relu(self.linear2(x))x = F.relu(self.linear3(x))x = F.relu(self.linear4(x))x = self.linear5(x) # 不用激活函数,因为 torch.nn.CrossEntropyLoss = softmax + nlllossreturn xmodel = Net()
  • 损失与优化器
criterion = torch.nn.CrossEntropyLoss()
optimizer = optim.SGD(model.parameters(), lr=0.01, momentum=0.5)
  • 训练与测试
    • torch.max:返回最大值和对应的下标。
    • dim=1,说明是在行的维度。 0是列,1是行。
# training
def train(epoch):running_loss = 0.0for batch_idx, data in enumerate(train_loader, 0):inputs, target = dataoptimizer.zero_grad()outputs = model(inputs)loss = criterion(outputs, target)loss.backward()optimizer.step()running_loss += loss.item()if batch_idx % 300 == 299:print('[%d, %5d] loss: %.3f' % (epoch+1, batch_idx+1, running_loss/300))running_loss = 0.0# test
def test():correct = 0total = 0with torch.no_grad():for data in test_loader:inputs, labels = dataoutputs = model(inputs)_, predicted = torch.max(outputs.data, dim=1)total += labels.size(0)correct += (predicted == labels).sum().item()print('Accuracy on test set: %d %%' %(100*correct/total))if __name__ == '__main__':for epoch in range(10):train(epoch)if epoch % 10 == 0:test()
http://www.lqws.cn/news/147925.html

相关文章:

  • Python基于蒙特卡罗方法实现投资组合风险管理的VaR与ES模型项目实战
  • Spring Boot 启动流程及配置类解析原理
  • ZooKeeper 安装教程(Windows + Linux 双平台)
  • React 样式方案与状态方案初探
  • 【JavaEE】Spring Boot项目创建
  • Neko虚拟浏览器远程协作方案:Docker+内网穿透技术部署实践
  • 【时时三省】(C语言基础)多维数组名作函数参数
  • Vim 设置搜索高亮底色
  • Flink 高可用集群部署指南
  • linux 故障处置通用流程-36计-14-27
  • Windows 10 IoT 系统深度定制指南:从环境搭建到工业部署
  • Web 架构相关文章目录(持续更新中)
  • Monorepo架构: Nx Cloud 扩展能力与缓存加速
  • 【深尚想】OPA855QDSGRQ1运算放大器IC德州仪器TI汽车级高速8GHz增益带宽的全面解析
  • AI编程助手入门指南:GitHub Copilot、Cursor与Claude的安装与基础使用
  • 【Zephyr 系列 10】实战项目:打造一个蓝牙传感器终端 + 网关系统(完整架构与全栈实现)
  • 20250605使用boot-repair来恢复WIN10和ubuntu22.04.6双系统的启动
  • 案例分享--汽车制动卡钳DIC测量
  • Hive的TextFile格式优化方法
  • 【深尚想】TPS54618CQRTERQ1汽车级同步降压转换器电源芯片全面解析
  • 14.AI搭建preparationのBERT预训练模型进行文本分类
  • LeetCode 1356.根据数字二进制下1的数目排序
  • Linux(13)——Ext系列⽂件系统
  • 【缺陷】温度对半导体缺陷电荷态跃迁能级的影响
  • PostgreSQL 技术峰会,为您打造深度交流优质平台
  • [10-1]I2C通信协议 江协科技学习笔记(17个知识点)
  • MATLAB读取文件内容:Excel、CSV和TXT文件解析
  • 「深度拆解」Spring Boot如何用DeepSeek重构MCP通信层?从线程模型到分布式推理的架构进化
  • 基于LocalAI与cpolar技术协同的本地化AI模型部署与远程访问方案解析
  • 阿里云域名怎么绑定