# Jupyter Notebook 활용 및 Python 분석 환경 설정

### 주요 내용

1. Jupyter notebook의 주요 기능 및 단축키 등 설명
2. pip를 활용한 라이브러리 설치
3. import를 활용한 라이브러리 불러오기

<br>

### 목표 
1. Jupyter Notebook을 활용해서 Python 코드를 작성하고 실행할 수 있다.
2. 작업 폴더(working directory)의 개념을 이해한다.
3. 라이브러리(library) 활용 목적과 절차를 이해한다.


<br>
<hr>
<br>

## 1. Jupyter Notebook 사용법, 기능 및 단축키 소개  


jupyter notebook은 여러 cell을 수직적으로 결합해서 문서를 만들거나 분석을 수행  
상단 메뉴바와 아이콘을 활용하여 cell을 추가, 제거, 이동, 복사 가능  
cell에 명령어를 입력하고 실행해서 결과 확인  

### 1.1. Jupyter notebok 주요 단축키 목록


* 파란색 : 명령 모드(cell의 추가, 복사, 삭제 등), "ESC"
  - `H` : 단축키 목록 팝업
  - `A` : 위에 cell 추가 
  - `B` : 아래에 cell 추가
  - `위/아래 화살표` : cell 이동
  - `D, D` : cell 삭제
  - `M` : cell을 Markdown(문서 작성) 형식으로 변경
  - `Y` : cell을 Code(명령어 작성) 형식으로 변경
  - `S`, `Ctrl + S` : 저장
  
  
* 초록색 : 수정 모드(각 cell 안에서 명령어 등 입력), "ENTER"
  - `Tab` : 들여쓰기 혹은 코드 완성
  - `Shift + Tab` : 들여쓰기 취소 혹은 툴팁(도움말)
  - `Ctrl + /` : 주석처리/해제

* cell 실행 
  - `Shift + Enter` : 실행하고 다음 cell로 이동
  - `Ctrl + Enter` : 실행
  

<br>





In [2]:
# "#"을 붙여서 주석(comment)을 달 수 있습니다.

In [3]:
# 이 cell에 간단한 사칙 연산을 입력하고 실행해 봅시다.
7*11

77

In [None]:
##### 이 cell을 클릭하고 "M"을 누르면 Markdown으로 바뀝니다.


#### 이 cell을 클릭하고 "Y"를 누르면 Code로 바뀝니다.


<br>

## 2. 새 폴더와 새 노트북 파일 만들기

jupyter 메인 페이지에서 경로를 이동하거나 새 폴더 생성 가능  
jupyter 메인 페이지 및 노트북 내 상단 메뉴 [File] > [New Notebook]에서 새 노트북 파일 생성  
  
  

### 2.1. 간단한 실습  

> 새 노트북 파일에서 `A`, `B` 를 눌러 새로운 cell을 추가하고, `M`, `Y`를 눌러 마크다운과 코드로 형식을 바꿔봅시다. `Enter`를 누른 수정모드에서 간단한 수식을 넣고 `Ctrl+Enter`로 실행하고, `Shift+Enter`로 다시 한번 실행한 다음 차이를 확인합니다. 다시 방향키로 위의 cell로 이동한 다음 수정모드에서 `Ctrl+/`를 눌러 작성한 스크립트를 주석 처리하거나 직접 `#`을 써서 주석을 입력해봅시다.  

[File] > [Download as]로 다양한 형식으로 노트북을 저장 가능  
[Cell] > [All output] > [Clear]로 모든 실행 결과를 지울 수 있음



<br>
<hr>
<br>

## 3. pip를 활용한 Library 설치

Python을 활용해 데이터를 분석하기 위해서는 pandas와 같은 라이브러리 설치가 필수
<span style='color:blue;font-weight:bold'>pip</span> 명령어를 활용해서 라이브러리를 설치 가능  
jupyter notebook 안에서 shell command를 실행하기 위해서 <span style='color:purple;font-weight:bold'>!</span>를 앞에 붙임    

> 라이브러리를 설치하기 위해서는 외부망 접속이 가능해야하고, 외부망에서 소스 파일을 다운받아 압축을 풀기 위해서는 특정 폴더에 대한 권한도 필요합니다.

In [None]:
#!pip install numpy pandas matplotlib seaborn plotly xlrd openpyxl

<br>

## 4. Library 설치 확인

* 4개 결과 출력여부 확인
    - openpyxl
    - pandas
    - plotly
    - seaborn
    

In [1]:
# Windows 
!pip list --format=freeze | findstr /r "pandas seaborn plotly openpyxl"

openpyxl==3.0.10
pandas==1.5.3
plotly==5.9.0
seaborn==0.12.2


<br>
<hr>
<br>

## 5. Library 활용 예제

*import*를 활용해서 특정 라이브러리를 불러오기  
이후 해당 라이브러리에 포함된 객체나 기능, 함수 등을 활용 가능

In [4]:
import os

> 아래의 cell에 *os.* 을 입력하고 **Tab**키를 누릅니다. 자동 완성(Auto-completion) 기능을 활용해서 함수 *getcwd()* 를 찾고 **Enter**키를 눌러서 선택합니다.  
소괄호를 열고 **Shift+Tab**을 눌러 함수의 도움말을 확인할 수 있습니다.  

In [5]:
os.getcwd()

'C:\\Users\\jhpark\\Desktop\\실습자료_Python 데이터 분석'

### [실습] 
위와 같은 방법으로 **os** 라이브러리의 함수 *listdir()* 과 *mkdir()* 을 선택하고 자유롭게 실행하기

In [6]:
os.listdir()

['.ipynb_checkpoints',
 '01_Jupyter Notebook 활용 및 라이브러리 설치.ipynb',
 '02_Python 기초 문법.ipynb',
 '03_데이터 불러오기.ipynb',
 '04_데이터 결합 및 부분 선택.ipynb',
 '05_데이터 집계와 시각화.ipynb',
 '06_변수 형식 처리 및 파생변수 생성.ipynb',
 'data',
 'test_notebook.ipynb']

In [16]:
os.mkdir()

TypeError: mkdir() missing required argument 'path' (pos 1)

> 물론 라이브러리를 불러오지 않아도 활용가능한 여러가지 함수와 명령어들도 있습니다. 그중 **%** 로 시작하는 매직 명령어(magic commands)는 **os** 라이브러리의 함수를 대신하기도 합니다.

In [9]:
# 작업 폴더 출력
%pwd

'C:\\Users\\jhpark\\Desktop\\실습자료_Python 데이터 분석'

In [10]:
# 폴더 생성
%mkdir temp

<br>

### [실습] 

1. *import*로 **random** 라이브러리 불러오기
2. **random** 라이브러리의 *randint()* 함수를 활용해서 1부터 100까지 숫자 중에서 랜덤으로 하나 선택하기 
3. **datetime** 라이브러리를 불러와서 *datetime.datetime.now()* 로 현재 시간 확인하기


In [11]:
import random

In [22]:
random.randint(1,100)

2

In [24]:
import datetime

datetime.datetime.now()

datetime.datetime(2023, 7, 11, 11, 21, 44, 883610)

<br>

### 5.1. from과 as를 활용한 라이브러리 불러오기 

라이브러리는 몇개의 모듈로 구성되고, 각 모듈 안에 함수 등이 포함되어 있음  
*import*로 를 활용해서 라이브러리를 불러올 때 *as*를 활용해서 별명을 지정 가능  
*from*을 활용해서 라이브러리 내 특정 모듈을 지정해서 불러오는 것도 가능 


In [None]:
# import를 활용한 라이브러리 호출
import pandas

pandas.read_csv()

In [None]:
# as를 활용한 별명 지정 
import pandas as pd

pd.read_csv()

In [None]:
# 라이브러리 내 특정 함수 불러오기
from pandas import read_csv, ... , ... , ...

read_csv()

In [None]:
# 라이브러리 내 모든 함수 불러오기
from pandas import * 

read_csv()
# read_excel()

#### End of script