# GPU 환경 구성하기

## 현재 내 PC 상황
- Python version: 3.10.6 (또는 책 버전 python 3.6.7)
- GPU: GTX 1060
- GPU 에 맞는 Compute capability (version): 6.1
- Compute capability 에 맞는 CUDA SDK Version(s): 8.0
- Tensorflow version: 2.16.1 (python 3.6 에서는 1.15)
- Tensorflow에 맞는 CUDA, cuDNN version: 12.3, 8.9 (tensorflow 1.15 에서는 10, 7.4, tensorflow 1.4 에서는 8, 6)

(GPU 별 Compute capability 및 SDK Version 참고: https://en.wikipedia.org/wiki/CUDA#GPUs_supported)

#### Tensorflow 별 CUDA, cuDNN version
https://www.tensorflow.org/install/source?hl=ko&_gl=1*1u5i9g*_up*MQ..*_ga*Njg5MDg4OTcwLjE3MTUzMTk1MzQ.*_ga_W0YLR4190T*MTcxNTMxOTUzMy4xLjAuMTcxNTMxOTUzMy4wLjAuMA..
<img src="img/tensorflow_cuda_cudnn.png" width="800px" alt="tensorflow CUDA cuDNN" />

python 3.6 버전을 위한 tensorflow (책 버전 tensorflow 1.15 와 GPU 에 맞는 CUDA 호환 버전 1.4)
<img src="img/tensorflow1.15_cuda_cudnn.png" width="800px" alt="tensorflow1.15_cuda_cudnn" />

### 아래 보면 CUDA SDK 8.0 설치시 Windows 11 은 없어서 CUDA 설치 불가하다.
### 우분투 16.04 설치해서 해야겠다.
<img src="img/cuda_toolkit_unable.png" width="400px" alt="CUDA Toolkit 불가" /><img src="img/cuda_toolkit_able.png" width="400px" alt="CUDA Toolkit 가능" />

## Ubuntu 16.04 설치(python 3.6 에서는 안함)

참고: https://learn.microsoft.com/ko-kr/windows/wsl/install-manual

### 1단계 - Linux용 Windows 하위 시스템 사용
```PowerShell
dism.exe /online /enable-feature /featurename:Microsoft-Windows-Subsystem-Linux /all /norestart
```

### 2단계 - WSL 2 실행을 위한 요구 사항 확인
WSL 2로 업데이트하려면 Windows 10을 실행해야 합니다.

x64 시스템의 경우: 버전 1903 이상, 빌드 18362.1049 이상.
ARM64 시스템의 경우: 버전 2004 이상, 빌드 19041 이상
또는 Windows 11.

### 3단계 - Virtual Machine 기능 사용
```PowerShell
dism.exe /online /enable-feature /featurename:VirtualMachinePlatform /all /norestart
```

### 4단계 - Linux 커널 업데이트 패키지 다운로드
최신 패키지 다운로드 및 실행

https://wslstorestorage.blob.core.windows.net/wslblob/wsl_update_x64.msi

### 5단계 - WSL 2를 기본 버전으로 설정
```PowerShell
wsl --set-default-version 2
```

### 6단계 - 선택한 Linux 배포 설치
Ubuntu 16.04 설치

https://aka.ms/wsl-ubuntu-1604

## WSL 명령어
PowerShell 에서 Ubuntu 접속
```bash
wsl
```
WSL(Windows Subsystem for Linux)에서 현재 사용 중인 우분투 배포판의 버전을 확인
```bash
lsb_release -a
```

## CUDA Toolkit 8.0 설치
CUDA Toolkit 과 CUDA 는 같은 의미로 사용한다.

https://developer.nvidia.com/cuda-80-ga2-download-archive

<img src="img/cuda_toolkit_8.0.png" width="400px" alt="cuda_toolkit_8.0 이미지" />

#### 파일을 다운로드 받는다. 다운로드 받은 폴더에서 명령어를 실행한다.

```bash
sudo dpkg -i cuda-repo-ubuntu1604_8.0.61-1_amd64.deb
sudo apt-get update
sudo apt-get install cuda
```

#### 이 방법대로 하니 에러 나서 정상 설치되지 않는다.
  deb (local) 로 받아서 다시 설치해본다. (D:\Users\USER\aiproject)

```bash
sudo dpkg -i cuda-repo-ubuntu1604-8-0-local-ga2_8.0.61-1_amd64.deb
sudo apt-get update
sudo apt-get install cuda
```

#### 설치 안돼서 runfile (local) 받아서 다시 해본다.

```bash
Run `sudo sh cuda_8.0.61_375.26_linux.run`
Follow the command-line prompts
```

#### 그래도 안돼서 로그 chatGPT 에 물어보니 드라이버가 없단다.
### 드라이버 다운해서 설치(불가)
https://www.nvidia.co.kr/Download/index.aspx?lang=kr

<img src="img/nvidia_gpu_driver.png" alt="nvidia_gpu_driver.png" width="800px" />

설치 명령어

```bash
./NVIDIA-Linux-x86_64-550.78.run
```

실행시 아래 에러 발생한다.

chatGPT는 log 파일 권한 없어서 안된다고 아래 명령어 사용하란다.

```bash
./NVIDIA-Linux-x86_64-550.78.run --log-file ~/nvidia-installer.log
```

--log-file 옵션이 없다고 에러 떠서 chatGPT 물어보니 아래 명령어 사용하란다.

```bash
sudo ./NVIDIA-Linux-x86_64-550.78.run --target /tmp/nvidia-installer.log
```

또 에러 발생해서 nvidia gpu driver 를 window 용으로 받아서 설치한다.

<img src="img/nvidia_gpu_driver_window.png" alt="nvidia gpu driver window" width="800px" />

아래 명령어 실행하니 또 에러난다.

```
Run `sudo sh cuda_8.0.61_375.26_linux.run`
```

### 드라이버 설치하지 않고 바로 CUDA 8.0 설치(가능)
windows 10 버전으로 설치했다.
설치 후 화면 안나와서 강제 재부팅 하니 화면 나온다.
CUDA 버전 확인 명령어에 다음과 같이 나온다.
```bash
# CUDA 버전 확인 명령어
> nvcc --version

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2016 NVIDIA Corporation
Built on Mon_Jan__9_17:32:33_CST_2017
Cuda compilation tools, release 8.0, V8.0.60
```

## cuDNN 설치
최신 버전 다운로드 링크: https://developer.nvidia.com/cudnn-downloads
아카이브 다운로드 링크: https://developer.nvidia.com/rdp/cudnn-archive

다운받은 파일을 압축 해제하면 bin, include, lib 폴더가 있다.
폴더 내부 파일을 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0 의 동일한 폴더 내에 복사한다.

시스템 환경변수에서 Path 에 아래 경로 추가한다.
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\bin
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\libnvvp
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\lib
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\include

#### tensorflow 를 삭제하고 tensorflow-gpu 를 설치한다.
```bash
> pip uninstall tensorflow
> pip install tensorflow-gpu==1.4
```

#### tensorflow 1.4 에서 GPU 사용 가능여부 확인 명령어
```bash
tf.test.gpu_device_name() is not None

2024-05-18 14:40:18.344623: I C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\36\tensorflow\core\common_runtime\gpu\gpu_device.cc:1120] Creating TensorFlow device (/device:GPU:0) -> (device: 0, name: GeForce GTX 1060 3GB, pci bus id: 0000:1f:00.0, compute capability: 6.1)
True
```

## 코드 돌려보니 GPU 사용하는게 보이며, 학습 속도도 빨라졌다.