# Jupyter Notebook 활용 및 Python 분석 환경 설정

### 주요 내용

1. Jupyter notebook의 주요 기능 및 단축키 등 설명
2. pip를 활용한 라이브러리 설치 및 import를 활용한 라이브러리 불러오기

<br>

### 목표 
1. Jupyter Notebook을 활용해서 Python 코드를 작성하고 실행할 수 있다.
2. 라이브러리(library) 활용 목적과 절차를 이해한다.


<br>
<hr>
<br>

## 1. Jupyter Notebook 사용법, 기능 및 단축키 소개  

가장 먼저 jupyter notebook의 사용법을 살펴보겠습니다.  

jupyter notebook은 여러 cell을 수직적으로 결합해서 문서를 만들거나 분석을 수행합니다. 상단 메뉴바와 아이콘을 활용하여 cell을 추가, 제거, 이동, 복사 할 수 있고 명령어를 실행하고 결과를 확인할 수 있습니다. 이 과정에서 주로 활용되는 cell과 관련된 기본적인 단축키를 알아두면 편합니다.  


* 셀 외곽 클릭(파란색) : 명령 모드(cell의 추가, 복사, 삭제 등), "ESC"
  - `H` : 단축키 목록 팝업
  - `A` : 위에 cell 추가 
  - `B` : 아래에 cell 추가
  - `위/아래 화살표` : cell 이동
  - `D, D` : cell 삭제
  - `z` : 삭제된 셀 되돌리기
  - `M` : cell을 Markdown(문서 작성) 형식으로 변경
  - `Y` : cell을 Code(명령어 작성) 형식으로 변경
  - `S`, `Ctrl + S` : 저장
  - `ctrl(mac_command) + shift + - ` : 셀 나누기
  - `shift + m` : 셀 합치기
    
* 셀 내부 클릭(초록색) : 코드 입력 모드(각 cell 안에서 명령어 등 입력), "ENTER"
  - `Ctrl + /` : 주석처리/해제

* cell 실행 
  - `Shift + Enter` : 실행하고 다음 cell로 이동
  - `Ctrl + Enter` : 실행
  

<br>





In [None]:
# "#"을 붙여서 주석(comment)을 달 수 있습니다.

In [38]:
# 이 cell에 간단한 사칙 연산을 입력하고 실행해 봅시다.
1+1

2

In [None]:
# A

In [None]:
# B

In [None]:
# DD(셀 삭제) 후 z로 되돌리기


<br>
<hr>
<br>

## 2. pip를 활용한 Library 설치

Python을 활용해 데이터를 분석하기 위해서는 pandas와 같은 라이브러리 설치가 필수(pandas는 이미 설치되어 있음)
<span style='color:blue;font-weight:bold'>pip</span> 명령어를 활용해서 라이브러리를 설치 가능  
jupyter notebook 안에서 shell command를 실행하기 위해서 <span style='color:purple;font-weight:bold'>!</span>를 앞에 붙임    

> 라이브러리를 설치하기 위해서는 외부망 접속이 가능해야하고, 외부망에서 소스 파일을 다운받아 압축을 풀기 위해서는 특정 폴더에 대한 권한도 필요합니다. 

In [3]:
!pip install numpy pandas matplotlib seaborn plotly openpyxl scipy statsmodels sklearn 



<br>
<hr>
<br>

## 3. Library 활용 예제

*import*를 활용해서 특정 라이브러리를 불러오기  
이후 해당 라이브러리에 포함된 객체나 기능, 함수 등을 활용 가능

In [4]:
import os

> 아래의 cell에 *os.* 을 입력하고 **Tab**키를 누릅니다. 자동 완성(Auto-completion) 기능을 활용해서 함수 *getcwd()* 를 찾고 **Enter**키를 눌러서 선택합니다.  
소괄호를 열고 **Shift+Tab**을 눌러 함수의 도움말을 확인할 수 있습니다.  

### [실습] 
위와 같은 방법으로 **os** 라이브러리의 함수 *listdir()* 과 *mkdir()* 을 선택하고 자유롭게 실행하기

In [39]:
os.listdir()

In [40]:
%pwd

In [12]:
# 현재 경로에 tmp 폴더 생성하기
path = './tmp'
os.mkdir(path)

> 물론 라이브러리를 불러오지 않아도 활용가능한 여러가지 함수와 명령어들도 있습니다. 그중 **%** 로 시작하는 매직 명령어(magic commands)는 **os** 라이브러리의 함수를 대신하기도 합니다.

In [None]:
# 현재 작업경로 출력
%pwd

In [21]:
# 폴더 생성
%mkdir temp

이렇게 각 라이브러리마다 역할이 있고, 필요에 따라 *import*로 불러와 활용합니다.  
특히 **os** 라이브러리는 작업 폴더(working directory)를 확인하거나 바꾸고, 폴더를 생성하는 등 일반적인 파일작업 등이 가능하기 때문에 개발이나 업무자동화에서 필수적으로 활용됩니다.

<br>

### [실습] 

1. *import*로 **random** 라이브러리 불러오기
2. **random** 라이브러리의 *randint()* 함수를 활용해서 1부터 100까지 숫자 중에서 랜덤으로 하나 선택하기 
3. **datetime** 라이브러리를 불러와서 *datetime.datetime.now()* 로 현재 시간 확인하기


In [22]:
import random

In [65]:
random.randint(1, 46)

20

In [66]:
random.random()

0.1524020660400892

In [67]:
random.choice([1, 2, 3, 4, 5])

3

In [74]:
import datetime
print(datetime.datetime.now())

2023-04-11 07:54:28.704276


<br>

### 3.1. from과 as를 활용한 라이브러리 불러오기 

라이브러리는 몇개의 모듈로 구성되고, 각 모듈 안에 함수 등이 포함되어 있음  
*import*로 를 활용해서 라이브러리를 불러올 때 *as*를 활용해서 별명을 지정 가능  
*from*을 활용해서 라이브러리 내 특정 모듈을 지정해서 불러오는 것도 가능 


In [34]:
# import를 활용한 라이브러리 호출
import pandas
# pandas.read_csv()

In [35]:
# as를 활용한 별명 지정 
import pandas as pd
# pd.read_csv()

In [36]:
# 라이브러리 내 특정 함수 불러오기
from pandas import read_csv
# read_csv()

In [37]:
# 라이브러리 내 모든 함수 불러오기
from pandas import * 
# read_csv()
# read_excel()

#### End of script