<a href="https://colab.research.google.com/github/uoneway/Notion-to-GitHub-Pages/blob/master/0_2_Google_Colab_tips.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

Written by uoneway(Kim Hangil)   
https://github.com/uoneway/python_note

## Google Colaboratory 이란?
- https://colab.research.google.com 접속

### 왜 Colab을 사용해야 하는가? 
- Google Colab = Jupyter Notebook + **GPU**
- 링크만으로 접근 / 협업 가능
- 자주 사용하는 DL 관련 모듈이 기본 설치되어 있음

### 단점
- 실행중에 창을 꺼도 계속 실행됨.   
단 아무것도 안 하는 idle 상태 돌입 이후 90분에 런타임 자동으로 shutdown
- GPU는 *연속*으로 최대 12시간을 지원   
그 이후에도 런타임 재시작으로 VM 교체 후 이용 가능하나 변수 및 초기화됨 -> 구글드라이브 연동 필!
- 코드 실행 시 딜레이 존재

In [None]:
# 기본으로 깔려있는 라이브러리 목록 확인하기
!pip list

Package                  Version        
------------------------ ---------------
absl-py                  0.9.0          
alabaster                0.7.12         
albumentations           0.1.12         
altair                   4.1.0          
asgiref                  3.2.10         
astor                    0.8.1          
astropy                  4.0.1.post1    
astunparse               1.6.3          
atari-py                 0.2.6          
atomicwrites             1.4.0          
attrs                    19.3.0         
audioread                2.1.8          
autograd                 1.3            
Babel                    2.8.0          
backcall                 0.2.0          
beautifulsoup4           4.6.3          
bleach                   3.1.5          
blis                     0.4.1          
bokeh                    1.4.0          
boto                     2.49.0         
boto3                    1.14.9         
botocore                 1.17.9         
Bottleneck      

## 환경 세팅하기


#### HW 확인하기
GPU 설정하기
- 런타임 -> 런타임 유형 변경 -> 하드웨어 가속기를 GPU로 변경 

In [None]:
import tensorflow as tf
print(tf.__version__)
print(tf.config.list_physical_devices('GPU'))
print(tf.test.gpu_device_name())
!nvidia-smi  # GPU 확인

2.2.0
[]

NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.



In [None]:
# !cat /proc/cpuinfo # CPU 확인
# !cat /proc/meminfo  # Memory 확인
# !df -h  # Disk 확인

#### 구글 드라이브 연동
- 자신의 구글 드라이브를 연동하여 중간 결과를 저장하거나 데이터를 불러오는데 이용
- 만약 apt-key output should not be parsed (stdout is not a terminal)란 Warning이 나오면 이미 인증이 완료되었다는 뜻이므로 바로 mount하면 됨
- 요즘 많은 대학교에서 졸업생에게까지 구글드라이브 무제한 서비스를 제공하고 있으니 찾아보길 바람

In [None]:
from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


#### 작업폴더 경로 설정하기
파일을 읽어드리거나 모듈 import를 하려면 구글드라이브 마운트 후 다음 중 하나를 실행해야한다

1. 경로를 변수로 넣어서 매번 활용하기

In [None]:
data_dir_path = "/drive/My Drive/Colab Notebooks/NLP"

2. `sys.path.append()`를 이용하여 원하는 경로를 시스템 경로로 등록해주기

In [None]:
import sys

my_root = "/content/drive/My Drive/Colab Notebooks"
sys.path.append(my_root)

In [None]:
sys.path[-1]

'/content/drive/My Drive/Colab Notebooks'

In [None]:
from import_test import is_imported
is_imported()

yes!


3. 이용할 파일을 로컬 메인(임시폴더)에 복사해온 후 사용하기

In [None]:
!cp "drive/My Drive/Colab Notebooks/import_test.py" .

4. 경로 이동 후 명령어 실행하기
(매번 고려하기 어려울 수 있어 비추함)

In [None]:
%cd /content/drive/My Drive/Colab Notebooks

/content/drive/My Drive/Colab Notebooks


#### 로컬에 있는 데이터 파일 업로드 하기

In [None]:
from google.colab import files
uploaded = files.upload()

![title](images/py.png)


/bin/bash: -c: line 0: syntax error near unexpected token `('
/bin/bash: -c: line 0: `[대체 텍스트](https://drive.google.com/file/d/1zhJx2yIO9FQJLl2W4mN7deKBJZBzLtZi/view?usp=sharing)'


## 기본 이용법



### 단축키
편집모드를 빠져나온 후 실행
- 코드 셀 생성: A(B)
- 코드 셀 실행 
    – Ctrl+Enter
    - Shift+Enter
    - 드래그 후 Ctrl + Shift + Enter
- 셀 복사: Ctrl+M C,   (V, X)
- 셀 삭제: Ctrl+M D

- 코드(텍스트) 셀로 변환: Ctrl+M Y(M)
- 셀 나누기: Ctrl+M -

- 마지막 셀 작업 실행취소: Ctrl+Shift+Z
- 실행중인 셀 중단: Ctrl+M I
- 런타임 다시 시작: Ctrl+M .

### 터미널 명령어 실행하기
앞에 `!`를 붙이고 터미널 명령어를 넣어주면 됨
- 예외로 cd 명령어는 %cd /your/desired/path


In [None]:
!pip install sentencepiece

Collecting sentencepiece
[?25l  Downloading https://files.pythonhosted.org/packages/d4/a4/d0a884c4300004a78cca907a6ff9a5e9fe4f090f5d95ab341c53d28cbc58/sentencepiece-0.1.91-cp36-cp36m-manylinux1_x86_64.whl (1.1MB)
[K     |▎                               | 10kB 16.5MB/s eta 0:00:01[K     |▋                               | 20kB 1.7MB/s eta 0:00:01[K     |█                               | 30kB 2.2MB/s eta 0:00:01[K     |█▏                              | 40kB 2.5MB/s eta 0:00:01[K     |█▌                              | 51kB 2.0MB/s eta 0:00:01[K     |█▉                              | 61kB 2.3MB/s eta 0:00:01[K     |██▏                             | 71kB 2.5MB/s eta 0:00:01[K     |██▍                             | 81kB 2.7MB/s eta 0:00:01[K     |██▊                             | 92kB 2.9MB/s eta 0:00:01[K     |███                             | 102kB 2.8MB/s eta 0:00:01[K     |███▍                            | 112kB 2.8MB/s eta 0:00:01[K     |███▋                     

### 기타 Tips
- 별도로 저장하지 않아도 주기적으로 자동 저장되나 완전한 실시간은 아니므로 `Ctrl+s`로 저장 후 창을 닫기   
(물론 다른 사람이 공유해준 것을 저장하려면 본인 `드라이브에 사본저장` 해줘야함
- *Github에 사본저장*으로 colab 파일을 github에 바로 업로드 할 수 있음



https://amitness.com/2020/06/google-colaboratory-tips/?fbclid=IwAR3Gl6zSJpMm-LoH37c_5hbdUvZgifJ5dqYLF4RvbvHABPsFk6RJVa5K6Dc

- 2. 셀 실행에 걸린 시간 보기
실행 이후, 플레이버튼에 마우스를 올려놓으면 확인 가능
- 6. 깃헙의 ipynb 파일을 코랩에서 열기
크롬 익스텐션 설치
깃헙의 원하는 ipynb 파일에 접근 후, 익스텐션 클릭

- 기타 
    - 11. 인터렉티브 쉘 실행하기
셀에 "!bash" 라고 실행하면, 출력화면에서 shell로의 세션이 연결되어, 직접적으로 인터렉션이 가능
    - 13. "Open in Colab" 뱃지
깃헙에서, "Open in Colab" 뱃지를 단 저장소를 많이 볼 수 있는데, 이를 만드는 방법
특정 URL 주소가 들어간 그림 링크가 필요함
    - 15. conda 환경 설정하기
아나콘다 가상 환경을 만들고, activate 하기 위한 방법
    - 16. 로컬환경에서 Colab 노트북을 CLI로 관리하는 방법
colab-cli 라는 라이브러리를 이용해서, 노트북을 gdrive로 업로드, 업로드된 노트북을 즉각적으로 colab으로 열 수 있는 링크 생성 등이 가능



### image 넣기
원래 됐었는데... 링크 규칙이 바뀐듯함
[참고 링크](https://www.youtube.com/watch?v=vlheEeZd6lY)
- 구글 드라이브에 이미지 업로드하기
- 해당 이미지 파일에서 마우스 오른쪽 눌러 `get sharable link` 클릭
- 접근권한을 `링크가 있는 모든 사용자에게 공개`로 설정해주기   
(원래는 안해도 됐었는데 변경된듯 함)
- 링크를 아래와 같이 수정하여 삽입

https://support.google.com/drive/thread/34363118?hl=en
- for embed > `https://drive.google.com/file/d/file's ID/preview`
- for direct link > `https://drive.google.com/uc?export=view&id=file's ID`
- for share > `https://drive.google.com/file/d/file's ID/view?usp=sharing`

![대체 텍스트](https://drive.google.com/uc?id=1enr1y05D56nvF7QVdnx6GagY7trx9tbr)

## 참고: 마크다운(Markdown) 문법
구글코랩, jupyter notebook, Notion 등 마크다운 문법을 지원하는 경우, 이를 잘 이용하면 깔끔한 문서를 만들 수 있음

###  제목
- *기울임*
- **볼드체**
- `코드표현`
    - 목록 depth 주기 tab

1. 숫자 목록
2. 숫자 목록

> 인용표시는 `<` 로 합니다

수식은 $\sqrt{3x-1}+(1+x)^2.$

### 줄바꿈하기
줄 바꿈하려면 문장 끝 SPACE 3개 이상 넣어줘야 함    
그래야 줄바꿈됩니다.

이렇게 하면 줄바꿈 안돼요
알겠죠?

