文章首發於若綾 [Linux 指南] 手把手教你配置 Ubuntu 下的 CUDA、cuDNN 環境,轉載請註明出處。
導言#
作為深度學習和並行計算的核心工具,CUDA(Compute Unified Device Architecture)為 NVIDIA 顯卡提供了並行計算的能力。在本教程中,我們將詳細介紹如何在 Ubuntu 操作系統下配置 CUDA。本教程以 CUDA 12.1 和 Ubuntu 20.04 為例進行說明,但對於其他版本的 CUDA 和 Ubuntu,配置過程也相差無幾。
安裝 CUDA#
步驟 1:確認系統相容性#
在配置 CUDA 之前,首先要確保你的系統滿足安裝要求。以下是需要檢查的項目:
- 確保你的 GPU 是 NVIDIA GPU,並支援 CUDA 計算能力。可以通過 NVIDIA 官方網站查看支援的 GPU 列表。
- 確保你的系統是 64 位元的 Ubuntu 操作系統。
- 安裝 Linux 內核版本在 4.4 及以上的版本。
步驟 2:更新系統軟體包#
打開終端並輸入以下命令更新系統軟體包:
sudo apt update
sudo apt upgrade
步驟 3:安裝 NVIDIA 顯卡驅動#
如果你的系統尚未安裝 NVIDIA 顯卡驅動,可使用以下命令安裝:
sudo ubuntu-drivers autoinstall
安裝完成後,重啟計算機以確保驅動程式正確載入。
步驟 4:下載 CUDA 工具包#
前往CUDA ToolKit 官方網站下載相應版本的 CUDA Toolkit,的安裝包(以 CUDA 12.1 為例)
步驟 5:安裝 CUDA Toolkit#
你可以執行以下命令下載並安裝 CUDA Toolkit:
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin
sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/12.1.0/local_installers/cuda-repo-ubuntu2004-12-1-local_12.1.0-530.30.02-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu2004-12-1-local_12.1.0-530.30.02-1_amd64.deb
sudo cp /var/cuda-repo-ubuntu2004-12-1-local/cuda-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cuda
步驟 6:配置環境變數#
為了確保系統能夠正確識別 CUDA Toolkit 的安裝位置,需要設定環境變數。打開~/.bashrc 文件,添加以下內容:
#打開~/.bashrc
sudo vim ~/.bashrc
#在文末添加下兩行並保存關閉
export PATH=/usr/local/cuda-12.1/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-12.1/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
保存文件並執行以下命令使環境變數生效:
source ~/.bashrc
步驟 7:驗證 CUDA 安裝#
執行以下命令驗證 CUDA 是否已正確安裝
nvcc --version
如果安裝成功,你將看到類似於以下的輸出,其中顯示了 CUDA 編譯器(nvcc)的版本資訊:
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2021 NVIDIA Corporation
Built on Tue_Sep_21_19:24:46_PDT_2021
Cuda compilation tools, release 12.1, VXX.X.X
Build cuda_12.1.r12.1/compiler.XX
安裝 cuDNN 庫(可選)#
cuDNN 是一款深度學習框架的 GPU 加速庫,支援 TensorFlow、PyTorch 等框架。要安裝 cuDNN,請按照以下步驟操作:
- 前往 NVIDIA 官方網站註冊並登錄,然後進入cuDNN 下載頁面。
- 選擇與你安裝的 CUDA 版本相容的 cuDNN 版本,下載對應的壓縮包。
- 解壓縮下載的檔案。假設檔案解壓縮到了~/Downloads/cudnn-local-repo-ubuntu2004-8.8.1.3_1.0-1_amd64.deb 目錄。
- 在終端中執行以下命令安裝 cuDNN 庫,在置行以下命令之前,您必須將 X.Y 和 8.x.x.x 替換為您特定的 CUDA 和 cuDNN 版本。:
cd ~/Downloads/
sudo dpkg -i cudnn-local-repo-${OS}-8.x.x.x_1.0-1_amd64.deb
#導入GPG key
sudo cp /var/cudnn-local-repo-*/cudnn-local-*-keyring.gpg /usr/share/keyrings/
#刷新apt源
sudo apt-get update
#安裝庫
sudo apt-get install libcudnn8=8.x.x.x-1+cudaX.Y
sudo apt-get install libcudnn8-dev=8.x.x.x-1+cudaX.Y
sudo apt-get install libcudnn8-samples=8.x.x.x-1+cudaX.Y
總結#
至此,你已經成功配置了 Ubuntu 下的 CUDA 環境。現在,你可以使用 GPU 進行深度學習和高性能計算了。在接下來的工作中,你可能還需要根據實際需求安裝和配置深度學習框架,例如 TensorFlow 或 PyTorch。