Ubuntu 18.04 LTS + RTX2070でDeep Learning環境を整えるまでの備忘録
既に何度も環境構築をしたことがあるけど,毎回調べていると情報が錯綜しすぎてて苦労するので備忘録として残しておく.
OSの種類とかバージョンとか載ってるGPUだとかで,バージョンだけでなく使える方法も変わってくるので注意が必要.
事前準備
nvidia driverのバージョン確認
以下URLからnvidia driverの対応バージョンを調べておく.
https://www.nvidia.co.jp/Download/index.aspx?lang=jp
tensorflowの対応バージョン確認
tensorflowは結構厳密にバージョン指定をしているので以下URLで事前に確認しておく. 今回はtensorflow 1.13を入れる.
https://www.tensorflow.org/install/source
python
とりあえず3系をインストールしておく.
tensorflowのバージョンによって対応しているpythonバージョンも異なるので注意.
(nvidia driverのインストール)
もしかすると必要のないかもしれない手順(次のcudaインストールでドライバーごとインストールされているっぽい?).
nvidia driverの入っているリポジトリを追加し,aptからnvidia driverをインストールする.
今回はUbuntu 18.04 TLS & RTX2070に対応しているバージョン430をインストール.
$ sudo add-apt-repository ppa:graphics-drivers/ppa $ sudo apt update $ sudo apt install nvidia-driver-430
$ nvidia-smi
で確認
cuda10.0のインストール
ネットワーク経由のインストーラータイプでCUDA 10をインストール.
$ sudo apt install cuda
でもインストールは可能だが,tensorflowはCUDA 10.0に対応しており,デフォルトだと最新版である10.1(10.2?)がインストールされるためバージョンを指定してインストール.
$ sudo apt-key adv --fetch-keys http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub $ wget http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-repo-ubuntu1804_10.1.168-1_amd64.deb $ sudo dpkg -i cuda-repo-ubuntu1804_10.1.168-1_amd64.deb $ sudo apt update $ sudo apt install cuda-10-0 $ reboot $ export PATH="/usr/local/cuda/bin:$PATH" $ export LD_LIBRARY_PATH="/usr/local/cuda/lib64:$LD_LIBRARY_PATH"
$ nvcc -V
で確認.
この時,nvidia-smiとnvccで表示されるCUDAバージョンが異なる場合があるが,気にしないで大丈夫そう.
cuDNN7.4のインストール
以下URLよりcuDNNをダウンロード(登録が必要).
https://developer.nvidia.com/rdp/cudnn-download
- cuDNN Runtime Library for Ubuntu18.04 (Deb)
- cuDNN Developer Library for Ubuntu18.04 (Deb)
- cuDNN Code Samples and User Guide for Ubuntu18.04 (Deb)
この3つをダウンロードする.
以下コマンドでcuDNNをインストール
$ sudo dpkg -i libcudnn7_7.4.2.24-1+cuda10.0_amd64.deb $ sudo dpkg -i libcudnn7-dev_7.4.2.24-1+cuda10.0_amd64.deb $ sudo dpkg -i libcudnn7-doc_7.4.2.24-1+cuda10.0_amd64.deb
以下のようにコマンドだけでもインストールは可能とのこと(試していない). 以下のコマンドだとcuDNN 7.5が入る.
$ echo "deb https://developer.download.nvidia.com/compute/machine-learning/repos/ubuntu1804/x86_64 /" | sudo tee /etc/apt/sources.list.d/nvidia-ml.list $ sudo apt update $ sudo apt install libcudnn7-dev=7.5.0.56-1+cuda10.0
各種フレームワークのインストール
tensorflow 1.13
pip installで必要なものは全部入る.
基本的にデフォルトだと最新のものが入るので必要ならバージョン指定する.
$ pip install numpy scipy scikit-learn pillow h5py $ pip install tensorflow-gpu
keras
tensorflowが入っている環境でpip installするだけ.
$ pip install keras
chainer
numpy, cupyも含めてまとめてpip installするだけ.
$ pip install numpy cupy chainer
参考
UbuntuにNvidia GPUのDriver + CUDAをInstallする(GTX1080対応版) - Qiita