# Dokumentasi Instalasi CUDA dan Tensorflow-gpu untuk Deep Learning

Kebutuhan untuk mempelajari dan melakukan *Deep Learning* semakin meningkat. Oleh karena itu, diperlukan sebuah teknologi yang cukup mumpuni dan dapat memecahkan permasalahan yang jauh lebih kompleks dan bahkan membutuhkan kemampuan komputasi yang handal. Pada Deep Learning kita dapat melihat bahwa teknik *Convolutional Neural Network*(CNN) yang biasanya digunakan untuk proses klasifikasi gambar merupakan salah satu teknik *Deep Learning* yang sangat kompleks. Pemrosesan gambar yang sangat besar dan dengan hanya mengunakan *Central Processing Unit* (CPU) akan memakan waktu yang sangat lama sehigga perlu hardware yang komputasinya dapat mempercepat pemrosesan gambar. Dengan menggunakan *Graphics Processing Unit* (GPU) untuk CNN, maka kecepatan komputasi akan berkurang drastis. Semakin mahal GPU maka biasanya performanya juga semakin bagus. Apakah wajib menggunakan GPU untuk kebutuhan *Deep Learning* utamanya ketika kita menggunakan CNN? Yang perlu diperhatikan bahwa CPU melakukan komputasi secara serial(berurutan). Akan tetapi jika kita menggunakan CNN untuk memproses sebuah gambar maka komputasinya bukan lagi serial melainkan komputasi secara paralel(bersamaan). Pada keadaan seperti ini GPU dinilai lebih bagus dibandingkan dengan CPU. Oleh karenanya, ketika kita menggunakan CNN lebih disarankan pemakaiannya diimbangi dengan menggunakan GPU.

## CUDA (*Compute Unified Device Architecture*)
CUDA adalah arsitektur pemrosesan paralel dan model *Application Programming Interface*(API) yang dibuat oleh NVIDIA. Hal ini memungkinkan pengembang perangkat lunak untuk menggunakan *Graphics Processing Unit CUDA-enabled* (GPU) untuk tujuan umum pemrosesan dengan pendekatan yang disebut GPGPU (General-Purpose Graphics Processing Unit). Setiap GPU dapat berisi ratusan hingga ribuan CUDA core. Core bertanggung jawab untuk memproses semua data yang dimasukkan ke dalam dan keluar dari GPU. Intinya CUDA (Compute Unified Device Architecture)  adalah arsitektur khusus yang dapat memanfaatkan GPU dengan cara tertentu untuk melakukan tugas dengan kinerja yang lebih besar.

## Instalasi CUDA
### Spesifikasi Komputer
Pada percobaan instalasi CUDA ini, saya menggunakan sebuah personal computer dengan spesifikasi sebagai berikut:
- Processor Intel Core i7-7500U
- Windows 10 64-bit Operating System
- Kartu grafis NVIDIA Geforce 940MX(sudah terinstall)
Sampai dokumentasi ini ditulis, instalasi CUDA ini hanya bisa dilakukan untuk kartu grafis dengan merk NVIDIA. Untuk dapat melihat spesifikasi kartu grafis, lakukan klik kanan pada desktop -> pilih NVIDIA Control Panel. Setelah kotak dialog terbuka, pada bagian kiri bawah pilih System Information.

Setelah memastikan dan mengecek versi kartu grafis NVIDIA, langkah selanjutnya dalah mengecek apakah versi kartu grafis tersebut compatible untuk diintegrasikan dengan CUDA. Pada tahap ini Anda dapat mengecek di link [NVIDIA](https://developer.nvidia.com/cuda-gpus#collapse4) berikut. Pastikan versi kartu grafis anda tercantum namanya disana.

### Kebutuhan Instalasi Software
Jika telah selesai dengan tahap sebelumnya, langkah selanjutnya adalah melakukan instalasi untuk beberapa software yang dibutuhkan untuk menjalankan CUDA. Berikut ini daftar software yang harus diinstal:
- [Microsoft Studio](https://visualstudio.microsoft.com/downloads/)

Microsoft Studio dibutuhkan karena Nvidia memerlukan komponen C++ yang ada di Visual Studio untuk menjalankan proses *deep learning*.
- [CUDA Toolkit](https://developer.nvidia.com/cuda-downloads)

CUDA Toolkit menyediakan lingkungan pengembangan untuk membuat aplikasi berakselerasi GPU yang mempunyai kinerja tinggi. Dengan CUDA Toolkit, kita dapat mengembangkan, mengoptimalkan, dan membangun sebuah aplikasi pada sistem tertanam berakselerasi GPU. Download sesuai dengan spesifikasi komputer Anda. Pilih file .exe local karena untuk pengguna pemula mungkin tidak tahu juga mana modul yang harus didownload mana yang tidak. Pada contoh berikut saya mengunduh CUDA Toolkit 10.1.
<img src="assets/cuda_toolkit.png">

- [cuDNN](https://developer.nvidia.com/cudnn)

cuDNN adalah library berakselerasi GPU untuk *deep neural network*. cuDNN menyediakan implementasi yang sangat disesuaikan untuk rutinitas standar seperti forward and backward convolution, pooling, normalization, and activation layers. Untuk dapat mengunduh cuDNN ini, Anda diharuskan untuk login pada akun NVIDIA yang Anda miliki. Pastikan Anda mendownload file sesuai dengan spesifikasi CUDA Tollkit dan operating system komputer Anda. Pada contoh berikut saya mengunduh cuDNN v7.6.5.
<img src="assets/cudnn.png">

- Python dan Tensorflow-GPU
Pada tahap ini saya membuat sebuah virtual environment dengan nama `TensorFlow-GPU` sekaligus menginstall python 3.6.

### Proses Instalasi
#### CUDA Toolkit

Untuk proses instalasi CUDA Toolkit, klik 2 kali file CUDA Toolkit yang telah di download. Pilih folder untuk menyimpan hasil instalasi. Klik OK untuk melanjutkan ke tahap selanjutnya.
<img src="assets/setting_path.png" width=400><br>
Selanjutnya CUDA installer akan diextract pada komputer. Hal ini membutuhkan beberapa waktu. Setelah selesai proses extract, muncul kotak dialog CUDA NVIDIA. Disana terdapat 5 menu utama yang saling berurutan. Langkah pertama adalah proses license agreement. Pada tahap ini pilih `Agree and Continue`.
<img src="assets/agree_cuda.png" width=400><br>
Untuk opsi instalasi pilih `Express` kemudian pilih `Next`.
<img src="assets/install_opt.png" width=400><br>
Selanjutnya Proses instlasi berlangsung selama beberapa menit. Jika instalasi berhasil maka akan muncul summary instalasi yang sudah berhasil diinstal maupun tidak. 
<img src="assets/install.png" width=400>
<br>
Selanjutnya pilih `Next` lalu `Finish`.

#### cuDNN

Pada tahap ini, kita hanya perlu untuk mengextract file zip yang telah didownload sebelumnya. Setelah diextract, pada folder tersebut terdapat 3 sub folder yaitu lib, bin, dan include. Langkah selanjutnya yang perlu dilakukan adalah memindahkan file pada masing-masing folder tersebut ke dalam folder CUDA yang ada pada komputer yang telah disetting saat instalasi CUDA Toolkit. Contoh pada tahap ini, folder CUDA pda komputer saya ada pada path `C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1`. Berikut ini beberapa yang harus diperhatikan:
- lib\cudnn.lib 

Pindahkan file ini ke path folder `C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\lib`
- include\cudnn.h

Pindahkan file ini ke path folder `C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\include`
- bin\cudnn64_7.dll

Pindahkan file ini ke path folder `C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\bin`
 
 #### Cek Environment Variable

Setelah selesai memindahkan masing-masing file ke folder CUDA, langkah selanjutnya adalah mengecek environment variables di komputer. Pastikan pada bagian Path sudah ada 3 path ini:
    - `C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\libnvvp`
    - `C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\bin`
    - `C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\lib\x64`
Jika belum ada, Anda dapat menambahkannya dengan klik 2 kali pada Path di kolom System Variable seperti gambar berikut.
<img src="assets/path_new.png" width=400>
Kemudian akan muncul daftar path yang ada di system environment variabel komputer Anda. Untuk menambah path klik New pada bagian pojok kanan atas.
<img src="assets/add_path.png" width=400>

#### Membuat Virtual Environment dan Install Tensorflow GPU

Setelah selesai dengan proses instalasi CUDA Toolkit dan cuDNN, selanjutnya adalah membuat virtual environment baru untuk menjalankan tensorflow-gpu di python. Langkah-langkahnya adalah sebagai berikut:
- Buka Anaconda Prompt lalu pada environment base tulisakan perintah `conda create -n *nama_environment* python=3`. Pada contoh ini saya menggunakan nama environment `TensorFlow-GPU`. 
- Setelah selesai membuat environment baru, langkah selanjutnya adalah melakukan instalasi `tensorflow-gpu` dengan mengetikkan perintah `pip install tensorflow-gpu`. Jika proses instalasi selesai, lakukan pengecekan apakah tensorflow gpu tersebut berhasil dijalankan di python atau tidak. 
- Untuk mengecek tensorflow berhasil dijalankan atau tidak, ketikkan perintah `python`. Kemudian coba untuk import package tensorflow dengan mengetikkan perintah `import tensorflow as tf`. Jika tidak ada notifikasi `ERROR` yang muncul berarti instalasi tensorflow-gpu telah berhasil dilakukan atau juga bisa dengan menggunakan cara di bawah ini:
<img src="assets/cektf.png" width=700>

## Kesimpulan
Instalasi CUDA dan Tensorflow-GPU untuk Deep Learning cukup mudah. NVIDIA juga telah menyediakan alur instalasinya untuk OS [Windows](https://docs.nvidia.com/cuda/cuda-installation-guide-microsoft-windows/index.html). Ada bebrapa hal yang perlu diperhatikan ketika akan menginstall CUDA, yaitu:
1. Kartu grafis yang mendukung instlasi CUDA hanya untuk merk NVIDIA karena CUDA adalah produk keluaran NVIDIA dan sampai saat ini hanya bisa diinstall pada komputer dengan kartu grafis keluaran NVIDIA.
2. Pastikan kartu grafis NVIDIA pada komputer Anda masuk dalam list kartu grafis didukung untuk instalasi CUDA. 
3. Saat mengunduh cuDNN, pastikan versi yang diunduh support untuk versi CUDA Toolkit yang telah diunduh sebelumnya.
4. Jangan lupa untuk menambahkan path pada system environment variables di komputer Anda.
5. Setelah instalasi tensorflow-gpu, cek apakah tensorflow yang telah diinstal dapat berjalan dengan baik atau tidak.

Dengan menggunakan CUDA dan GPU, komputasi yang terjadi jauh lebih cepat dibandingkan bila hanya menggunakan CPU. Hal ini dikarenakan GPU memiliki lebih banyak core dan dapat melakukan komputasi secara paralel. Hal ini tentunya dapat mereduksi waktu eksekusi ketika kita menggunakan Deep Learning dengan teknik yang sangat kompleks.

## References
- [NVIDIA CUDA Instalation for Windows 10](https://docs.nvidia.com/cuda/cuda-installation-guide-microsoft-windows/index.html)

