当前位置: 首页 > news >正文

PyTorch 中contiguous函数使用详解和代码演示

在 PyTorch 中,contiguous() 是一个用于 张量内存布局优化 的函数。它的作用是在需要时返回一个内存布局为连续(contiguous)的张量,常用于 transpose、permute 等操作后。


一、为什么需要 contiguous()

PyTorch 的张量是以 行优先(row-major)顺序 存储的。当你对张量使用 transpose()permute() 等操作时,虽然张量的维度看起来改变了,但底层的内存并没有重新排列,只是修改了索引方式。

一些 PyTorch 函数(如 .view())要求输入张量必须是 连续的内存块,否则就会报错。


二、函数定义与用法

Tensor.contiguous(memory_format=torch.contiguous_format) → Tensor

返回值:

返回一个与当前张量具有相同数据但在内存中 连续排列 的副本。如果当前张量已经是连续的,就直接返回自身。


三、典型使用场景

1. view() 前需要 .contiguous()

x = torch.randn(2, 3, 4)
y = x.permute(1, 0, 2)  # 改变维度顺序
z = y.contiguous().view(3, 8)  # 安全 reshape

如果不加 .contiguous()

z = y.view(3, 8)  # ⚠️ 报错:RuntimeError: view size is not compatible with input tensor's size and stride

2. 使用 transpose() 后需要 .contiguous() 参与后续操作

a = torch.randn(10, 20)
b = a.transpose(0, 1)  # Not contiguous now
b = b.contiguous()     # 重新在内存中复制数据为连续块

四、查看是否是连续的

x.is_contiguous()

五、底层原理简要

PyTorch 张量有 .stride() 属性定义每一维的跳步。连续的张量满足:

x.stride()[i] = product(x.shape[i+1:])

一旦 .transpose() / .permute() 修改了维度顺序,这个规则就被破坏,因此 .contiguous() 会重新分配内存来确保是连续的。


六、contiguous()项目演示

下面是一个完整的 PyTorch 小项目,演示 .contiguous() 的必要性与作用。将看到在对张量进行 permute() 后,使用 .view() reshape 会失败,只有 .contiguous() 可以解决问题。

项目内容:张量维度变换与 .contiguous() 对比演示

项目结构:

contiguous_demo/
├── main.py
└── requirements.txt

requirements.txt

torch>=2.0

main.py

import torchdef describe_tensor(tensor, name):print(f"{name}: shape={tensor.shape}, strides={tensor.stride()}, is_contiguous={tensor.is_contiguous()}")def main():print("=== 创建张量 ===")x = torch.randn(2, 3, 4)  # 原始张量 shape [2, 3, 4]describe_tensor(x, "x")print("\n=== 进行 permute 操作(交换维度) ===")y = x.permute(1, 0, 2)  # shape: [3, 2, 4]describe_tensor(y, "y (after permute)")print("\n尝试 view reshape 到 [3, 8](不使用 contiguous)")try:z = y.view(3, 8)  # ⚠️ 报错:因为 y 的内存不是连续的except RuntimeError as e:print(f"RuntimeError: {e}")print("\n=== 使用 .contiguous() 后 reshape ===")y_contig = y.contiguous()describe_tensor(y_contig, "y_contig (after .contiguous())")z = y_contig.view(3, 8)describe_tensor(z, "z (reshaped)")print("\n✅ reshape 成功,结果如下:")print(z)if __name__ == "__main__":main()

运行方法

  1. 安装依赖:
pip install -r requirements.txt
  1. 运行程序:
python main.py

运行结果概览

将看到:

  • 原始张量是连续的;
  • permute() 后变成非连续;
  • 使用 .view() 报错;
  • .contiguous() 修复内存后成功 reshape。

小总结要点

操作是否连续能否 .view()
原始张量✅ 是✅ 是
permute()❌ 否❌ 报错
.contiguous()✅ 是✅ 是

总结记忆:

操作是否影响连续性?是否需要 .contiguous()
view()❗ 需要连续✅ 是
permute() / transpose()破坏连续性✅ 是
reshape()自动处理❌ 不需要(内部处理)
http://www.lqws.cn/news/201871.html

相关文章:

  • Linux(14)——库的制作与原理
  • 华为云Flexus+DeepSeek征文 | 从零到一:用Flexus云服务打造低延迟联网搜索Agent
  • 为什么React列表项需要key?(React key)(稳定的唯一标识key有助于React虚拟DOM优化重绘大型列表)
  • Vue3中computed和watch的区别
  • CSS3 的特性
  • redis分布式锁
  • DAY 24 元组和OS模块
  • 机器学习期末复习
  • 【leetcode】递归,回溯思想 + 巧妙解法-解决“N皇后”,以及“解数独”题目
  • 16-Oracle 23 ai-JSON-Relational Duality-知识准备
  • Java并发编程之并发编程的调试与测试
  • 性能测试-jmeter实战2
  • 打卡第38天:早停策略和模型权重的保存
  • 企业微信授权登录(uniapp项目)
  • 数据通信与计算机网络——数据与信号
  • Nodejs工程化实践:构建高性能前后端交互系统
  • html如何在一张图片上的某一个区域做到点击事件
  • JUC并发编程(四)常见模式
  • 功能安全实战系列09-英飞凌TC3xx LBIST开发详解
  • keil 5打开编译keil 4解决方案,兼容exe查找下载
  • C++11 Token Bucket (令牌桶)算法的锁无实现及应用
  • Android座舱系统Agent改造方案
  • DeepSeek08-ollama使用
  • Linux编程:2、进程基础知识
  • MCP和A2A实战教程:构建智能客服系统
  • SQLMesh实战:用虚拟数据环境和自动化测试重新定义数据工程
  • 【K8S系列】Kubernetes 中 Pod(Java服务)启动缓慢的深度分析与解决方案
  • 文档极速转换器 - 免费批量Word转PDF工具
  • 【软件工具】批量OCR指定区域图片自动识别内容重命名软件使用教程及注意事项
  • Xilinx IP 解析之 Block Memory Generator v8.4 ——01-手册重点解读(仅 Native R