当前位置：首页 > news >正文

day 39 打卡

news 2025/7/6 20:19:00

结构化数据（如表格）的形状通常是 (样本数, 特征数)，例如 (1000, 5) 表示 1000 个样本，每个样本有 5 个特征。图像数据的形状更复杂，需要保留空间信息（高度、宽度、通道），因此不能直接用一维向量表示。其中颜色信息往往是最开始输入数据的通道的含义，因为每个颜色可以用红绿蓝三原色表示，因此一般输入数据的通道数是 3。

维度索引	含义	数值说明
`0`	通道数（Channels）	`1` 表示这是一张灰度图（仅有一个颜色通道，如黑白照片）。如果是彩色图（如RGB），通道数为 `3`。
`1`	高度（Height）	`28` 表示图像的垂直像素数为28像素。
`2`	宽度（Width）	`28` 表示图像的水平像素数为28像素。

MNIST 数据集是手写数字的灰度图像，每个像素点的取值范围为 0-255（黑白程度），因此通道数为 1。图像尺寸统一为 28×28 像素。

# 打印下图片的形状
image.shape

torch.Size([1, 28, 28])

彩色图像

在 PyTorch 中，图像数据的形状通常遵循 (通道数, 高度, 宽度) 的格式（即 Channel First 格式），这与常见的 (高度, 宽度, 通道数)（Channel Last，如 NumPy 数组）不同。---注意顺序关系，

注意点：

如果用matplotlib库来画图，需要转换下顺序，我们后续介绍
模型输入通常需要批次维度（Batch Size），形状变为 (批次大小, 通道数, 高度, 宽度)。例如，批量输入 10 张 MNIST 图像时，形状为 (10, 1, 28, 28)。

因为这里设计到图像的显示，所以就需要调整维度顺序：(通道,高,宽) → (高,宽,通道)

模型定义与batchsize的关系

实际定义中，输入图像还存在batchsize这一维度

在 PyTorch 中，模型定义和输入尺寸的指定不依赖于 batch_size，无论设置多大的 batch_size，模型结构和输入尺寸的写法都是不变的。

PyTorch 模型会自动处理 batch 维度（即第一维），无论 batch_size 是多少，模型的计算逻辑都不变。batch_size 是在数据加载阶段定义的，与模型结构无关。
summary(model, input_size=(1, 28, 28))中的input_size不包含 batch 维度，只需指定样本的形状（通道 × 高 × 宽）。
总结：batch_size与模型定义的关系**

@浙大疏锦行