当前位置: 首页 > news >正文

GPU加速与非加速的深度学习张量计算对比Demo,使用PyTorch展示关键差异


import torch
import time

# 创建大型随机张量 (10000x10000)
tensor_size = 10000
x_cpu = torch.randn(tensor_size, tensor_size)
x_gpu = x_cpu.cuda()  # 转移到GPU

# CPU矩阵乘法
start = time.time()
result_cpu = torch.mm(x_cpu, x_cpu.t())
cpu_time = time.time() - start

# GPU矩阵乘法
torch.cuda.synchronize()  # 确保GPU计时准确
start = time.time()
result_gpu = torch.mm(x_gpu, x_gpu.t())
torch.cuda.synchronize()
gpu_time = time.time() - start

print(f"CPU计算时间: {cpu_time:.4f}秒")
print(f"GPU计算时间: {gpu_time:.4f}秒")
print(f"加速比: {cpu_time/gpu_time:.1f}倍")
 

http://www.lqws.cn/news/145909.html

相关文章:

  • 视频爬虫的Python库
  • 如何在电脑上轻松访问 iPhone 文件
  • 我认为STM32输入只分为模拟输入 与 数字输入
  • 密码工程原理与技术——概述
  • Flask+LayUI开发手记(八):通用封面缩略图上传实现
  • OpenBayes 一周速览|TransPixeler 实现透明化文本到视频生成;统一图像定制框架 DreamO 上线,一键处理多种图像生成任务
  • 比特币:固若金汤的数字堡垒与它的四道防线
  • 【学习分享】shell基础-参数传递
  • 数据结构第八章(二)-交换排序
  • 【p2p、分布式,区块链笔记 MESH】Bluetooth蓝牙通信拓扑与操作 BR/EDR(经典蓝牙)和 BLE
  • 软件测试全攻略:Postman工具的使用
  • Apache Druid 架构深度解析:构建高性能分布式数据存储系统
  • BeeWorks 协同办公能力:局域网内企业级协作的全场景重构
  • Elastic 获得 AWS 教育 ISV 合作伙伴资质,进一步增强教育解决方案产品组合
  • v1.0.1版本更新·2025年5月22日发布-优雅草星云物联网AI智控系统
  • BIM Revit教程(十一)如何使用机器学习实现 MEP 布局自动化?
  • 破局新能源消纳难题!安科瑞智慧能源平台助力10KV配电网重构未来
  • 上门服务小程序会员系统框架设计
  • 余氯传感器在智慧水务系统中如何实现IoT集成
  • iOS 项目怎么构建稳定性保障机制?一次系统性防错经验分享(含 KeyMob 工具应用)
  • sentinel规则持久化
  • 「数据分析 - Pandas 函数」【数据分析全栈攻略:爬虫+处理+可视化+报告】
  • 重启路由器ip不变怎么回事?原因分析与解决方法
  • Java Lambda表达式深度解析:从入门到实战
  • 探秘 MyBatis:开启你的数据库操作「智能之旅」
  • 家庭智能监控系统的安全性
  • Spring Boot 常用注解面试题深度解析
  • Java + Spring Boot + Mybatis 插入数据后,获取自增 id 的方法
  • QT开发技术【ffmpeg + QAudioOutput】音乐播放器 完善
  • 自定义事件wpf