In [1]:
# How to Install Nvidia Drivers on Ubuntu 18.04

# 1. ubuntu-drivers devices
# 2. Download Nvidia Graphics Card Driver
###    build-essential 같은 경우는 리처드 스톨만이 만든 소프트웨어 개발 툴들임
###    gcc - C 컴파일러, g++ - C++, gcj - 자바, gdb - 디버거,
###    binutils - 어셈블러, 링커, cmake, make는 빌드 자동화 도구
# 3. sudo apt-get install build-essential
###    (gcc, gdb, g++, gcj, binutils, cmake, make 같은
###     개발 필수 소프트웨어 자동 설치)
###    부팅할 때 디바이스 드라이버를 모듈 형식으로 삽입한다.
###    이때 블랙리스트 처리할 장치를 설정하는 작업
###    ACPI - 전원 관리 모듈(디바이스 드라이버)
###    nouveau는 리눅스에 해킹을 통해서 만든 디바이스 드라이버(모니터용)
###    제조사가 만든 장치의 전압과 전류 차이로 컴퓨터가 오동작하는 것을 방지!
# 4. sudo bash -c "echo blacklist nouveau > /etc/modprobe.d/blacklist-nvidia-nouveau.conf"
#    sudo bash -c "echo options nouveau modeset=0 >> /etc/modprobe.d/blacklist-nvidia-nouveau.conf"
# 5. cat /etc/modprobe.d/blacklist-nvidia-nouveau.conf
###    운영체제의 ram File System을 업데이트해서
###    사용하는 펌웨어 및 드라이버 이미지를 갱신해준다.
# 6. sudo update-initramfs -u
# 7. sudo reboot
###    그래픽 드라이버를 설치하므로 그래픽 드라이버 사용을 중지하기 위한 과정
###    순수하게 터미널 작업만 하게 된다.
# 8. ctrl + alt + F2 or F3 .... F8
# 9. 로그인해야 한다 - id: bitai, pw - 456123
#    시간초 제한이 있으므로 최대한 빠르게 입력해야 처리됨
###     현재 구동중인 그래픽 드라이버를 정지
# 10. sudo /etc/init.d/lightdm stop
###     리눅스 런 레벨을 3 으로 강제한다(네트워킹, 그래픽 x, 터미널)
# 11. sudo telinit 3
### 실행 권한을 줘야 한다.
# 12. cd ~/Downloads 혹은 cd ~/sw
# 13. chmod +x NVIDIA-Linux-x86_64-440.100.run
### 첫 번째 실행을 해본다.
# 14. sudo ./NVIDIA-Linux-x86_64-440.100.run
### 에러 메시지를 파악하는 과정(컴퓨터마다 다름)
### Intel의 32비트 시스템에 대한 하위 호환을 지원해줌
# 15. sudo dpkg --add-architecture i386
### 위의 32비트 하위 호환을 적용한 소프트웨어를 업데이트할 수 있게 된다.
# 16. sudo apt-get update
### 32비트 호환 C Library를 설치한다.
# 17. sudo apt-get install libc6:i386
### Intel Xeon 버전이라 추가로 설치해야하는 SW가 존재한다.
# 18. sudo apt-get install libglvnd-dev
# 19. sudo apt-get install libncurses5-dev
### BIOS Secure Boot 기능을 해제하는 것이 여러모로 편하다.
### 현재 만약 Secure Boot가 해제가 안되었다면
### Secure Boot 해제후 sudo telinit 3 을 반드시 다시 해줘야 한다.
# 20. sudo ./NVIDIA-Linux-x86_64-440.100.run

In [2]:
# (1) TensorFlow 일반 버전(CPU)를 사용하는 버전
# (2) TensorFlow GPU 버전이 별도로 존재한다(그래픽 카드 기반 가속)
# (3) Vitis AI TensorFlow - FPGA 버전
# CUDA(2)라는 Nvidia GPU HW 가속 라이브러리가 필요함!

# 1. 우선 구글에서 Nvidia CUDA라고 검색한다.
# 2. wget http://developer.download.nvidia.com/compute/cuda/11.0.1/local_installers/cuda_11.0.1_450.36.06_linux.run
# 3. chmod +x cuda_11.0.1_450.36.06_linux.run
### CUDA가 디바이스 드라이버의 기능을 활용하기 때문에
### 해당 정보를 CUDA 소프트웨어가 알 필요성이 있기 때문에
### 입력하는 명령어에 해당한다.
# 4. sudo apt-get install linux-headers-$(uname -r)
# 5. sudo ./cuda_11.0.1_450.36.06_linux.run
# 6. 설치가 완료된 이후에 vi ~/.bashrc를 연다.
#    맨 밑에 아래의 쉘 스크립트를 작성하도록 한다.
#    export PATH=$PATH:/usr/local/cuda-11.0/bin
### 변경 사항 적용!
# 7. source ~/.bashrc

In [3]:
### Nvidia Driver Check 명령어
# 1. nvidia-smi
### cuDNN을 설치하기 위해 cuDNN 검색
# 2. https://developer.nvidia.com/cudnn으로 이동
### 회원가입 및 라이센스 동의하고 cuDNN Library for Linux (x86)을 다운로드
# 3. 다운 받은 내용을 압축해제한다.
#    tar -zxvf cudnn-11.0-linux-x64-v8.0.1.13.tgz
# 4. sudo vi /etc/ld.so.conf.d/cuda-11-0.conf
#    아래의 두 개 내용을 기록해준다.
#    /usr/local/cuda-11.0/targets/x86_64-linux/lib
#    /usr/local/cuda-11.0/lib64
# 4. sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
#    sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
#    sudo cp cuda/lib64/libcudnn* /usr/local/cuda-11.0/lib64/
#    sudo cp cuda/include/cudnn.h /usr/local/cuda-11.0/include/
# 5. 권한을 부여한다.
#    sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
#    sudo chmod a+r /usr/local/cuda-11.0/include/cudnn.h /usr/local/cuda-11.0/lib64/libcudnn*
# 6. sudo apt-get install libcupti-dev
# 7. pip3 install tensorflow-gpu  # 컴퓨터마다 다를 수 있음
#    pip install tensorflow-gpu   # 아나콘다 경로로 작업해야함

# 만약 pip가 안먹으면 아나콘다 설정이 날아간 것이다.
# 아래 내용을 그대로 땡겨다가 ~/.bashrc 맨 아래쪽에 복사붙여넣기한다.

In [None]:
__conda_setup="$('/home/bitai/anaconda3/bin/conda' 'shell.bash' 'hook' 2> /dev/null)"
if [ $? -eq 0 ]; then
    eval "$__conda_setup"
else
    if [ -f "/home/bitai/anaconda3/etc/profile.d/conda.sh" ]; then
        . "/home/bitai/anaconda3/etc/profile.d/conda.sh"
    else
        export PATH="/home/bitai/anaconda3/bin:$PATH"
    fi
fi
unset __conda_setup

In [4]:
from tensorflow.python.client import device_lib

device_lib.list_local_devices()

[name: "/device:CPU:0"
 device_type: "CPU"
 memory_limit: 268435456
 locality {
 }
 incarnation: 814794961526074448,
 name: "/device:XLA_CPU:0"
 device_type: "XLA_CPU"
 memory_limit: 17179869184
 locality {
 }
 incarnation: 11239367205578341596
 physical_device_desc: "device: XLA_CPU device",
 name: "/device:XLA_GPU:0"
 device_type: "XLA_GPU"
 memory_limit: 17179869184
 locality {
 }
 incarnation: 5595094722316160787
 physical_device_desc: "device: XLA_GPU device"]

In [5]:
# 프로세스와 스레드
# 윈도우 vs 리눅스, 유닉스
# 윈도우는 프로세스내에서 스레드가 쪼개지는 개념

# 리눅스에서는 프로세스와 스레드가 모두 개별적인 Task 구조를 가진다.
# Thread ID가 있어서 Thread ID 묶여있는 녀석들은 전부
# 메모리 섹션의 Data 영역을 공유하게 된다.

# 보통 스레드는 CPU 코어의 개수만큼 만들게 된다
# (특정 하나의 연산을 극대화하고자 할 때)

# 시나리오.
# 스레드 A vs 스레드 B
# 전역변수 D를 공통적으로 공유하고 있는 상태 <<< Critical Section(크리티컬 섹션)
# 스레드 A가 하는 일은 ++
# 스레드 B가 하는 일은 --
# 프로세스란 CPU의 추상화다!
# 우리가 구동하는 모든 프로그램은 CPU에게 제어권이 넘어가야만 실행이 가능하다.
# 컴퓨터 구조론에서 제일 강조하는 것중 하나!
# CPU는 오직 한 순간에 한 가지 일만 한다.
# ???? 이게 왜 가능하지 ????
# (1) Multi Tasking
# (2) Context Switching

# 위의 크리티컬 섹션이 된 녀석들의 데이터를
# 안정적으로 보장해주기 위해 필요한 것이
# 바로 Semaphore, Mutex, Spinlock 같은 녀석들이다.

In [None]:
# CPU 스펙 보기
# cat /proc/cpuinfo

In [None]:
# 내일 할 것들
# 1. Multi Tasking - 이론
# 2. Context Switching - 이론
# 3. Semaphore vs Spinlock - 실습
# 4. 멀티 스레드 및 프로세스 vs 일반 작업의 성능 테스트

# 1, 2번 설명 2 ~ 3 시간
# 3 번은 실습만 끝날때까지