# 1. 기본 패키지 소개와 특징
- 머신러닝과 모든 종류의 데이터 분석 업무에 공통적으로 사용된다.

## 1-1. numpy
- 수치해석, 선형대수 계산
- 자료형이 고정된 다차원 배열 클래스(n-dimensional array), 벡터화 연산(vectorized operation) 지원
- 수학연산에서 기본이 되는 패키지

```
* 설치   pip install numpy
* 임포트 import numpy as np
```

## 1-2. scipy
- 과학 기술 계산 기능
    - 고급 수학 함수
    - 수치적 미적분
    - 미분 방정식 계산
    - 최적화
    - 신호 처리 등

```
* 설치   pip install scipy
* 임포트 import scipy as sp
```    

## 1-3. pandas
- 테이블 형태의 데이터를 다룰 수 있는 데이터 프레임 자료형 기능 제공
- 자료 탐색 및 정리에 유용하다.
- 데이터 분석의 필수 패키지이다.

```
* 설치   pip install pandas
* 임포트 import pandas as pd
```

## 1-4. matplotlib
- 파이썬에서 그래프, 차트 등을 그리는 시각화 기능 제공
- 다양한 그래픽 엔진 사용 가능 : Tkinter, wxPython, Qt, GTK+ 등
- MATLAB의 그래프 기능을 동일하게 사용할 수 있다. : pylab 서브패키지

```
* 설치   pip install matplotlib
* 임포트 import matplotlib.pyplot as plt
```

## 1-5. seaborn
- matplotlib 패키지에서 지원하지 않는 고급 통계 차트를 그리는 기능 제공
- 통계용 시각화 기능 제공

```
* 설치   pip install seaborn
* 임포트 import seaborn as sns
```

# 2. 머신러닝 패키지

## 2-1. statsmodels
- 추정, 검정, 회귀분석, 시계열분석 등의 기능을 제공하는 파이썬 패키지
    - **예제 데이터셋**
    - **검정 및 모수추정**
    - **회귀분석**
    - **선형회귀**
    - 강건회귀
    - 일반화 선형모형
    - 혼합효과모형
    - 이산종족변수
    - **시계열분석**
    - SARIMAX 모형
    - 상태공간 모형
    - 벡터 AR 모형
    - 생존분석
    - 요인분석 등

```
* 설치   pip install statsmodels
* 임포트 import statsmodels.api as sm
```

## 2-2. scikit-learn
- 머신러닝 활용의 가장 적합한 파이썬 패키지
- 다양한 머신러닝 모형을 하나의 패키지에서 모두 제공한다.
- **데이터셋**
    - 회귀분석, 분류, 클러스터링용 가상 데이터셋 생성
    - 각종 벤치마크 데이터셋
- **전처리**    
    - 스케일링
    - 누락데이터 처리
    - 텍스트 토큰화
- **지도학습**
    - 회귀분석
    - LDA/QDA
    - 서포트벡터머신
    - 퍼셉트론, SGD
    - KNN
    - 가우스프로세스
    - 나이브베이즈
    - 의사결정나무
    - 랜덤포레스트, 부스팅
- **비지도학습**
    - 가우스 혼합모형
    - 클러스터링
    - PCA
- **성능최적화**    
- **교차검증**
- **특징선택**
- **하이퍼파라미터 최적화**

```
* 설치   pip install sklearn
* 임포트 import sklearn as sk
```

# 3. 데이터 전처리용 패키지

## 3-1. missingno
- pandas 데이터프레임에서 누락된 데이터를 찾고 시각화 하는 기능 제공

```
* 설치   pip install missingno
* 임포트 import sklearn as sk
```

## 3-2. patsy
- pandas 데이터프레임 데이터에서 선택, 변형하는 기능 제공
    - statsmodels가 의존하는 패키지, statsmodels 설치하면 함께 설치됨
    
# 4. 그 밖의 패키지

## 4-1. 텍스트 전처리용 패키지
- nltk
- spacy
- konlpy
- soynlp
- gensim

## 4-2. 이미지 전처리용 패키지
- opencv

## 4-3. 지리정보 전처리용 패키지
- geopandas