PyTorch 与 NVIDIA GPU 的适配版本需要通过 CUDA 和 cuDNN 来实现。以下是详细的安装教程,包括如何选择合适的 PyTorch 版本以及如何配置 NVIDIA GPU 环境。
1. 检查 NVIDIA GPU 和驱动
1.1 检查 GPU 型号
确保你的机器上有 NVIDIA GPU,并知道其型号。可以通过以下命令检查:
nvidia-smi
 
输出示例:
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 510.47.03    Driver Version: 510.47.03    CUDA Version: 11.6     |
|-------------------------------+----------------------+----------------------+
| GPU  Name            TCC/WDDM | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  NVIDIA GeForce ...  WDDM | 00000000:01:00.0  On |                  N/A |
| N/A   45C    P8    N/A /  N/A |    100MiB /  8192MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+
 
- Driver Version:NVIDIA 驱动版本。
 - CUDA Version:当前安装的 CUDA 版本。
 
1.2 更新 NVIDIA 驱动
如果驱动版本过旧,建议更新到最新版本。可以从 NVIDIA 官网 下载并安装适合你 GPU 的驱动。
2. 安装 CUDA 和 cuDNN
2.1 安装 CUDA
CUDA 是 NVIDIA 提供的并行计算平台和编程模型。PyTorch 需要 CUDA 来支持 GPU 加速。
-  
查看 PyTorch 支持的 CUDA 版本:
访问 PyTorch 官网,查看你需要的 PyTorch 版本支持的 CUDA 版本。 -  
下载并安装 CUDA:
- 访问 CUDA Toolkit 下载页面。
 - 选择与 PyTorch 兼容的 CUDA 版本(如 CUDA 11.7)。
 - 按照官方文档安装 CUDA。
 
 -  
验证 CUDA 安装:
nvcc --version输出示例:
nvcc: NVIDIA (R) Cuda compiler driver Copyright (c) 2005-2022 NVIDIA Corporation Built on Sun_Sep_18_21:16:01_PDT_2022 Cuda compilation tools, release 11.7, V11.7.64 
2.2 安装 cuDNN
cuDNN 是 NVIDIA 提供的深度学习加速库。
-  
下载 cuDNN:
- 访问 cuDNN 下载页面。
 - 选择与 CUDA 版本匹配的 cuDNN 版本(如 cuDNN for CUDA 11.x)。
 
 -  
安装 cuDNN:
- 解压下载的文件,并将其中的文件复制到 CUDA 安装目录中。
 - 例如:
tar -xzvf cudnn-11.7-linux-x64-v8.5.0.96.tgz sudo cp cuda/include/cudnn*.h /usr/local/cuda/include sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64 sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn* 
 -  
验证 cuDNN 安装:
- 检查 cuDNN 版本:
cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2 
 - 检查 cuDNN 版本:
 
3. 安装 PyTorch
3.1 选择合适的 PyTorch 版本
访问 PyTorch 官网,选择与你的 CUDA 版本匹配的 PyTorch 版本。
3.2 使用 pip 安装 PyTorch
例如,安装支持 CUDA 11.7 的 PyTorch:
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117
 
3.3 使用 conda 安装 PyTorch
如果你使用 Anaconda,可以通过以下命令安装:
conda install pytorch torchvision torchaudio pytorch-cuda=11.7 -c pytorch -c nvidia
 
4. 验证 PyTorch 是否支持 GPU
4.1 检查 PyTorch 是否检测到 GPU
import torch
print(torch.cuda.is_available())  # 输出: True 表示 GPU 可用
 
4.2 查看当前使用的 GPU 设备
print(torch.cuda.current_device())  # 输出当前 GPU 设备的索引
print(torch.cuda.get_device_name(0))  # 输出 GPU 设备名称
 
4.3 将张量移动到 GPU
x = torch.tensor([1.0, 2.0, 3.0])
x = x.to('cuda')  # 将张量移动到 GPU
print(x.device)  # 输出: cuda:0
 
5. 常见问题
5.1 PyTorch 找不到 GPU
- 确保安装了正确版本的 CUDA 和 cuDNN。
 - 确保 PyTorch 版本与 CUDA 版本匹配。
 - 检查 NVIDIA 驱动是否已正确安装。
 
5.2 多 GPU 支持
如果需要使用多 GPU,可以通过以下方式启用:
model = nn.DataParallel(model)  # 使用多 GPU
 
总结
通过以上步骤,你可以成功安装支持 NVIDIA GPU 的 PyTorch 版本,并验证其是否正常工作。确保 CUDA、cuDNN 和 PyTorch 版本匹配是关键。
