NVIDIA GPU環境の準備
NVIDIA GPUを使用するには、まずはそのドライバと開発環境であるNVIDIA CUDA Toolkit(単にCUDAとも表現される)をインストールする必要がある。
また、ディープラーニング環境を構築するためには、ディープ・ニューラル・ネットワーク(DNN)ライブラリのcuDNNをインストールする必要がある。
さらに必要に応じて、GPUが使えるDockerであるnvidia-dockerのインストールもこのタイミングで行うとよい。
と書かれていました.
サーバーOS : Ubuntu 22.04.1 LTS (GNU/Linux 5.15.0-56-generic x86_64)
このサーバーにインストールしたのは、NVIDIA GeForce GTX1060 というビデオカードです.
$ lspci | grep -i nvidia
で確認してみます.
$ lspci | grep -i nvidia
01:00.0 VGA compatible controller: NVIDIA Corporation GP106 [GeForce GTX 1060 6GB] (rev a1)
01:00.1 Audio device: NVIDIA Corporation GP106 High Definition Audio Controller (rev a1)
CUDA(Compute Unified Device Architecture:クーダ)とは、NVIDIAが開発・提供している、GPU向けの汎用並列コンピューティングプラットフォーム(並列コンピューティングアーキテクチャ)およびプログラミングモデルである。
wikipedia
NVIDIAドライバ(=CUDAドライバ)
$ wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-keyring_1.0-1_all.deb
$ sudo dpkg -i cuda-keyring_1.0-1_all.deb
$ sudo apt-get update
$ sudo apt-get -y install cuda
丁寧にインストールの方法が書かれていたので、その通り実行する.
1時間くらいかかったかもしれませんが、インストールできたようです.
再起動します.
$ sudo reboot
NVIDIAのシステム管理インタフェースを意味するnvidia-smiコマンドを実行して、NVIDIA GPUが利用可能な状態かを確認してみよう。
$ nvidia-smi
Thu Dec 29 06:41:31 2022
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 525.60.13 Driver Version: 525.60.13 CUDA Version: 12.0 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 NVIDIA GeForce ... On | 00000000:01:00.0 Off | N/A |
| 27% 37C P8 6W / 120W | 18MiB / 6144MiB | 0% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=============================================================================|
| 0 N/A N/A 1124 G /usr/lib/xorg/Xorg 15MiB |
+-----------------------------------------------------------------------------+
リアルタイムで監視したい場合は、watch を使って
終える時は、
ctr + c
$ watch -n1 "nvidia-smi"