## I. Settings
- 우선 드라이브와 구글 코랩을 마운트할 수 있도록 다음 코드를 순서대로 실행한다.

In [1]:
# Mount Google Drive
from google.colab import drive # import drive from google colab

ROOT = "/content/drive"     # default location for the drive
print(ROOT)                 # print content of ROOT (Optional)
drive.mount(ROOT)           # we mount the google drive at /content/drive

/content/drive
Go to this URL in a browser: https://accounts.google.com/o/oauth2/auth?client_id=947318989803-6bn6qk8qdgf4n4g3pfee6491hc0brc4i.apps.googleusercontent.com&redirect_uri=urn%3aietf%3awg%3aoauth%3a2.0%3aoob&response_type=code&scope=email%20https%3a%2f%2fwww.googleapis.com%2fauth%2fdocs.test%20https%3a%2f%2fwww.googleapis.com%2fauth%2fdrive%20https%3a%2f%2fwww.googleapis.com%2fauth%2fdrive.photos.readonly%20https%3a%2f%2fwww.googleapis.com%2fauth%2fpeopleapi.readonly

Enter your authorization code:
··········
Mounted at /content/drive


- 현재 경로를 확인한다.

In [2]:
%pwd
%cd drive/'My Drive'/'Colab Notebooks'

/content/drive/My Drive/Colab Notebooks


- 해당 경로에 `hkit301`폴더를 만드는 것을 추천한다. `mkdir`를 통해서 만들수도 있기도 하지만, 터미널 명령어가 약한 분들을 위해서 사전에 미리 폴더를 만드는 것을 추천한다. 
- `hkit301`로 이동한다. 

In [3]:
%cd hkit301

/content/drive/My Drive/Colab Notebooks/hkit301


- 이제 본인의 `git` 계정에 연동하도록 한다.
  + step 1. `git config --global user.name "your_username"`
  + step 2. `git config --global user.email "your_email_address"`

In [0]:
!git config --global user.name "chloevan"
!git config --global user.email "j2hoon85@gmail.com"

- 이제 프로젝트 `Repo`를 다운로드 받는다.
- 이 소스 코드는 실행시키지 않는다. (향후 새로운 작업을 할 때 실행시킨다.)

In [0]:
# !git clone https://github.com/hkit301/kaggle.git

Cloning into 'kaggle'...
remote: Enumerating objects: 3, done.[K
remote: Counting objects: 100% (3/3), done.[K
remote: Total 3 (delta 0), reused 3 (delta 0), pack-reused 0[K
Unpacking objects: 100% (3/3), done.


- 파일 작성이 다 끝나면 아래와 같이 코드를 입력한다.

In [7]:
# Clone github repository setup
# import join used to join ROOT path and MY_GOOGLE_DRIVE_PATH
from os.path import join  

# path to your project on Google Drive
MY_GOOGLE_DRIVE_PATH = 'My Drive/Colab Notebooks/'

# replace with your github username
GIT_USERNAME = "hkit301"

# definitely replace with your
GIT_TOKEN = "007bb5f5cb4d770834b0763fcd1bf12b4a5f30ea" # this is temporary, whenever you add, need to get token number

# Replace with your github repository in this case we want 
# to clone deep-learning-v2-pytorch repository
GIT_REPOSITORY = "kaggle"

PROJECT_PATH = join(ROOT, MY_GOOGLE_DRIVE_PATH)

# It's good to print out the value if you are not sure 
print("PROJECT_PATH: ", PROJECT_PATH)  

# In case we haven't created the folder already; we will create a folder in the project path 
# !mkdir "{PROJECT_PATH}"    

#GIT_PATH = "https://{GIT_TOKEN}@github.com/{GIT_USERNAME}/{GIT_REPOSITORY}.git" this return 400 Bad Request for me
GIT_PATH = "https://" + GIT_TOKEN + "@github.com/" + GIT_USERNAME + "/" + GIT_REPOSITORY + ".git"
print("GIT_PATH: ", GIT_PATH)

PROJECT_PATH:  /content/drive/My Drive/Colab Notebooks/
GIT_PATH:  https://007bb5f5cb4d770834b0763fcd1bf12b4a5f30ea@github.com/hkit301/kaggle.git


In [9]:
!git remote set-url origin "{GIT_PATH}"
!git add *
!git commit -m "commit"
!git push

^C
On branch master
Your branch is up to date with 'origin/master'.

Changes not staged for commit:
	[31mmodified:   hkit301.ipynb[m
	[31mdeleted:    setting.ipynb[m
	[31mdeleted:    sungsik/sungsik_WBS.md[m

Untracked files:
	[31m.gitignore.md[m
	[31mpython_external_packages/[m

no changes added to commit
Everything up-to-date


## II. Branch 생성 및 이동 
- 우선 `kaggle` 폴더로 이동한다.  

In [0]:
%cd kaggle
!ls

/content/drive/My Drive/Colab Notebooks/hkit301/kaggle
hajin  hkit301.ipynb  jongmin  README.md  sungsik


In [10]:
!ls

hajin  hkit301.ipynb  jongmin  python_external_packages  README.md  seongsik


### (1) 브랜치 생성 (주 사용자만 해당)
- 브랜치 이름을 생성한다. 
- 브랜치 이름은 슬래시(/)를 사용하여 계층적인 구조로 만들어서 사용할 수 있으며, 작성 규칙은 다음과 같다. 
  + 기호(-)로 시작할 수 없다. 
  + 연속적인 마침표(..)를 포함할 수 없다. 
  + 빈간, 공백 문자, 물결(~), 캐럿(^), 물음표(?), 별표(*), 대괄호([]) 등은 포함할 수 없다. 
  + 브랜치 이름은 중복해서 사용할 수 없다. 

In [0]:
!git branch hajin

In [0]:
!git branch jongmin

In [0]:
!git branch seongsik

### (2) 브랜치 확인
- 브랜치 목록을 확인하는 방법은 매우 간단하다. 

In [0]:
!git branch

  hajin[m
  jongmin[m
* [32mmaster[m
  seongsik[m


- 여기에서 `별표(*)`는 현재 선택된 브랜치를 의미한다.
- 브랜치의 세부 사항을 확인하기 위해서는 `git branch -v`를 실행한다. 

In [0]:
!git branch -v

  hajin   [m cc21763 commit
  jongmin [m cc21763 commit
* [32mmaster  [m cc21763 commit
  seongsik[m cc21763 commit


### (3) 브랜치 이동 및 작업 예제
- checkout 명령어는 호텔에서 퇴실할 때의 체크아웃을 떠올리면 이해하기 쉬울 것이다. 
- 지금 현재 `master` 상태에서 이제 각각의 브랜치로 이동하도록 한다. 
- 이 때, 중요한 것은 팀프로젝트이지만, 각각의 폴더로 이동 후 `git checkout` 을 실행하는 것을 권한다. 
- 우선 `hajin`의 예를 들면 다음과 같다. 
  + 먼저 구글 코랩 `CELL`안에서 `%cd hajin` 실행하여 이동한다. 

In [0]:
%cd hajin/
!ls

/content/drive/My Drive/Colab Notebooks/hkit301/kaggle/hajin
hajin_WBS.md


- 실제로 이동이 되었는지 확인한다. 

In [0]:
%pwd

'/content/drive/My Drive/Colab Notebooks/hkit301/kaggle/hajin'

- 이제 `git checkout hajin`을 실행한다.

In [0]:
!git checkout hajin

M	hkit301.ipynb
D	setting.ipynb
D	sungsik/sungsik_WBS.md
Switched to branch 'hajin'


- `Switched to branch 'hajin'`으로 변경된 것을 확인할 수 있다. 
- 변경된 브랜치에서 작업하면 된다. 
- 간단하게 `temp.ipynb`를 생성했다. 

In [0]:
!ls

hajin_WBS.md  temp.ipynb


### (4) 원격 저장소에 push 하기
- 현재 로컬에서만 `branch`를 생성한 상태이기 때문에 아래 명령을 입력해서 upstream branch로 만들어준다. 
- master의 remote 정보를 새로운 브랜치에도 그대로 가져온다.

In [0]:
!git push --set-upstream origin hajin

Total 0 (delta 0), reused 0 (delta 0)
remote: 
remote: Create a pull request for 'hajin' on GitHub by visiting:[K
remote:      https://github.com/hkit301/kaggle/pull/new/hajin[K
remote: 
To https://github.com/hkit301/kaggle.git
 * [new branch]      hajin -> hajin
Branch 'hajin' set up to track remote branch 'hajin' from 'origin'.


- 이렇게 한번 `upstream`을 진행한 이후에는 `git add .`와 `git commit -m "your_message"` 명령어만 입력하면 된다. 

In [11]:
!git add .
!git commit -m "hajin commit"

^C
On branch master
Your branch is up to date with 'origin/master'.

Changes not staged for commit:
	[31mmodified:   hkit301.ipynb[m
	[31mdeleted:    setting.ipynb[m
	[31mdeleted:    sungsik/sungsik_WBS.md[m

Untracked files:
	[31m.gitignore.md[m
	[31mpython_external_packages/[m

no changes added to commit


### (4) 브랜치 병합 및 마지막 커밋(주 사용자가 실행)
- 이제 `checkout master`로 들어간 이후에 병합과 최종 push를 진행한다.
- `git merge`를 할 때에는 꼭 자신의 `branch 이름`을 명기해야 한다. 
  + `!git merge hajin`
  + `!git merge jongmin`
  + `!git merge seongsik`

In [0]:
!git checkout master
!git merge hajin

M	hkit301.ipynb
D	setting.ipynb
D	sungsik/sungsik_WBS.md
Switched to branch 'master'
Your branch is up to date with 'origin/master'.
Updating cc21763..e91d409
Fast-forward
 hajin/temp.ipynb | 1 [32m+[m
 1 file changed, 1 insertion(+)
 create mode 100644 hajin/temp.ipynb


- 이제 최종적인 `push`만 남았다. 

In [0]:
!git push origin master

Counting objects: 4, done.
Delta compression using up to 2 threads.
Compressing objects:  25% (1/4)   Compressing objects:  50% (2/4)   Compressing objects:  75% (3/4)   Compressing objects: 100% (4/4)   Compressing objects: 100% (4/4), done.
Writing objects:  25% (1/4)   Writing objects:  50% (2/4)   Writing objects:  75% (3/4)   Writing objects: 100% (4/4)   Writing objects: 100% (4/4), 593 bytes | 148.00 KiB/s, done.
Total 4 (delta 1), reused 0 (delta 0)
remote: Resolving deltas:   0% (0/1)[Kremote: Resolving deltas: 100% (1/1)[Kremote: Resolving deltas: 100% (1/1), completed with 1 local object.[K
To https://github.com/hkit301/kaggle.git
   cc21763..e91d409  master -> master


In [0]:
%cd ..
%ls

/content/drive/My Drive/Colab Notebooks/hkit301/kaggle
[0m[01;34mhajin[0m/  hkit301.ipynb  [01;34mjongmin[0m/  README.md  [01;34mseongsik[0m/


In [0]:
!git add *
!git commit -m "commit"
!git push origin master

[master af9a9b3] commit
 1 file changed, 151 insertions(+)
fatal: could not read Password for 'https://42971973bda7ff1c65d0981d86a124b6bbb7c193@github.com': No such device or address


- 이제 이와 같은 방식으로 진행하면 된다.

## III. 외부 패키지 설치 및 관리
- 구글 Colab에서 패키지 세팅과 관련된 문서는 [Python Package Settings on Google Colab](https://chloevan.github.io/settings/colab_package_settings/)을 참조한다. 

### (1) 외부 패키지 설치
- 아래 소스코드를 실행한다. 이 때 중요한 것은 결국 경로다. 

In [1]:
import os, sys
from google.colab import drive
drive.mount('/content/mnt')
my_path = '/content/notebooks'
os.symlink('/content/mnt/My Drive/Colab Notebooks/hkit301/kaggle/python_external_packages', my_path)
sys.path.insert(0,my_path)

Go to this URL in a browser: https://accounts.google.com/o/oauth2/auth?client_id=947318989803-6bn6qk8qdgf4n4g3pfee6491hc0brc4i.apps.googleusercontent.com&redirect_uri=urn%3aietf%3awg%3aoauth%3a2.0%3aoob&response_type=code&scope=email%20https%3a%2f%2fwww.googleapis.com%2fauth%2fdocs.test%20https%3a%2f%2fwww.googleapis.com%2fauth%2fdrive%20https%3a%2f%2fwww.googleapis.com%2fauth%2fdrive.photos.readonly%20https%3a%2f%2fwww.googleapis.com%2fauth%2fpeopleapi.readonly

Enter your authorization code:
··········
Mounted at /content/mnt


- 한글 형태소 관련 패키지인 `konlpy`를 설치해보자. 

In [2]:
!apt-get update
!apt-get install g++ openjdk-8-jdk 
!pip3 install --target=$my_path konlpy

0% [Working]            Ign:1 https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64  InRelease
0% [Waiting for headers] [Waiting for headers] [Connecting to cloud.r-project.o                                                                               Get:2 http://security.ubuntu.com/ubuntu bionic-security InRelease [88.7 kB]
0% [Waiting for headers] [2 InRelease 5,482 B/88.7 kB 6%] [Connected to cloud.r                                                                               Hit:3 http://ppa.launchpad.net/graphics-drivers/ppa/ubuntu bionic InRelease
0% [Waiting for headers] [2 InRelease 14.2 kB/88.7 kB 16%] [Connected to cloud.0% [3 InRelease gpgv 21.3 kB] [Waiting for headers] [2 InRelease 14.2 kB/88.7 k                                                                               Ign:4 https://developer.download.nvidia.com/compute/machine-learning/repos/ubuntu1804/x86_64  InRelease
0% [3 InRelease gpgv 21.3 kB] [Waiting for headers] [2 InRele

- 설치 후에, `Google Drive`에서 설치가 되었는지 꼭 확인해본다.
- 이제 `Sample Code`를 실행하여 정상적으로 설치가 되었는지 재차 확인한다. 

In [3]:
from konlpy.tag import Twitter

twitter = Twitter()
twitter.pos("질문이나 건의사항은 깃헙 이슈 트래커에 남겨주세요")

  warn('"Twitter" has changed to "Okt" since KoNLPy v0.4.5.')


[('질문', 'Noun'),
 ('이나', 'Josa'),
 ('건의', 'Noun'),
 ('사항', 'Noun'),
 ('은', 'Josa'),
 ('깃', 'Noun'),
 ('헙', 'Verb'),
 ('이슈', 'Noun'),
 ('트래커', 'Noun'),
 ('에', 'Josa'),
 ('남겨주세요', 'Verb')]

## IV. 데이터셋 및 패키지 폴더 관리
- 대용량의 데이터셋은 모두 구글 드라이브에 올려서 작업하는 것을 권장한다. 
- 다만 데이터를 불러올 때는 아래 코드를 따라서 각 개인 폴더에서 불러오면 된다.



### (1) 데이터셋 연동
- 각 데이터는 모두 `data` 폴더에 올려놓도록 한다. 

In [13]:
!ls

data   hkit301.ipynb  python_external_packages	seongsik
hajin  jongmin	      README.md


In [14]:
import pandas as pd 

credits = pd.read_csv('data/tmdb_5000_credits.csv')
credits.head(5)

Unnamed: 0,movie_id,title,cast,crew
0,19995,Avatar,"[{""cast_id"": 242, ""character"": ""Jake Sully"", ""...","[{""credit_id"": ""52fe48009251416c750aca23"", ""de..."
1,285,Pirates of the Caribbean: At World's End,"[{""cast_id"": 4, ""character"": ""Captain Jack Spa...","[{""credit_id"": ""52fe4232c3a36847f800b579"", ""de..."
2,206647,Spectre,"[{""cast_id"": 1, ""character"": ""James Bond"", ""cr...","[{""credit_id"": ""54805967c3a36829b5002c41"", ""de..."
3,49026,The Dark Knight Rises,"[{""cast_id"": 2, ""character"": ""Bruce Wayne / Ba...","[{""credit_id"": ""52fe4781c3a36847f81398c3"", ""de..."
4,49529,John Carter,"[{""cast_id"": 5, ""character"": ""John Carter"", ""c...","[{""credit_id"": ""52fe479ac3a36847f813eaa3"", ""de..."


In [15]:
movies = pd.read_csv('data/tmdb_5000_movies.csv')
movies.head(5)

Unnamed: 0,budget,genres,homepage,id,keywords,original_language,original_title,overview,popularity,production_companies,production_countries,release_date,revenue,runtime,spoken_languages,status,tagline,title,vote_average,vote_count
0,237000000,"[{""id"": 28, ""name"": ""Action""}, {""id"": 12, ""nam...",http://www.avatarmovie.com/,19995,"[{""id"": 1463, ""name"": ""culture clash""}, {""id"":...",en,Avatar,"In the 22nd century, a paraplegic Marine is di...",150.437577,"[{""name"": ""Ingenious Film Partners"", ""id"": 289...","[{""iso_3166_1"": ""US"", ""name"": ""United States o...",2009-12-10,2787965087,162.0,"[{""iso_639_1"": ""en"", ""name"": ""English""}, {""iso...",Released,Enter the World of Pandora.,Avatar,7.2,11800
1,300000000,"[{""id"": 12, ""name"": ""Adventure""}, {""id"": 14, ""...",http://disney.go.com/disneypictures/pirates/,285,"[{""id"": 270, ""name"": ""ocean""}, {""id"": 726, ""na...",en,Pirates of the Caribbean: At World's End,"Captain Barbossa, long believed to be dead, ha...",139.082615,"[{""name"": ""Walt Disney Pictures"", ""id"": 2}, {""...","[{""iso_3166_1"": ""US"", ""name"": ""United States o...",2007-05-19,961000000,169.0,"[{""iso_639_1"": ""en"", ""name"": ""English""}]",Released,"At the end of the world, the adventure begins.",Pirates of the Caribbean: At World's End,6.9,4500
2,245000000,"[{""id"": 28, ""name"": ""Action""}, {""id"": 12, ""nam...",http://www.sonypictures.com/movies/spectre/,206647,"[{""id"": 470, ""name"": ""spy""}, {""id"": 818, ""name...",en,Spectre,A cryptic message from Bond’s past sends him o...,107.376788,"[{""name"": ""Columbia Pictures"", ""id"": 5}, {""nam...","[{""iso_3166_1"": ""GB"", ""name"": ""United Kingdom""...",2015-10-26,880674609,148.0,"[{""iso_639_1"": ""fr"", ""name"": ""Fran\u00e7ais""},...",Released,A Plan No One Escapes,Spectre,6.3,4466
3,250000000,"[{""id"": 28, ""name"": ""Action""}, {""id"": 80, ""nam...",http://www.thedarkknightrises.com/,49026,"[{""id"": 849, ""name"": ""dc comics""}, {""id"": 853,...",en,The Dark Knight Rises,Following the death of District Attorney Harve...,112.31295,"[{""name"": ""Legendary Pictures"", ""id"": 923}, {""...","[{""iso_3166_1"": ""US"", ""name"": ""United States o...",2012-07-16,1084939099,165.0,"[{""iso_639_1"": ""en"", ""name"": ""English""}]",Released,The Legend Ends,The Dark Knight Rises,7.6,9106
4,260000000,"[{""id"": 28, ""name"": ""Action""}, {""id"": 12, ""nam...",http://movies.disney.com/john-carter,49529,"[{""id"": 818, ""name"": ""based on novel""}, {""id"":...",en,John Carter,"John Carter is a war-weary, former military ca...",43.926995,"[{""name"": ""Walt Disney Pictures"", ""id"": 2}]","[{""iso_3166_1"": ""US"", ""name"": ""United States o...",2012-03-07,284139100,132.0,"[{""iso_639_1"": ""en"", ""name"": ""English""}]",Released,"Lost in our world, found in another.",John Carter,6.1,2124


- 정상적으로 불러온 것을 확인할 수 있다. 

### (2) .gitignore 파일 작성
- 100MB 이상의 데이터가 올라가는 방지 하기 위해 패키지 폴더와 모든 `.json & .csv 파일`은 깃허브에 업데이트 되지 않도록 파일을 작성하였다. 

```
# exclude data files
*.json
*.csv

# ignore package folder
python_external_packages/
```
