# 머신러닝 패키지

## 개요

머신러닝에 많이 사용되는 파이썬 패키지

### 일반적인 패키지

#### numpy

파이썬에서 수치 해석, 특히 선형대수 계산 기능을 제공

자료형이 고정된 다차원 배열 클래스(n-dimensional array)와 벡터화 연산(vectorized operation)을 지원하며 수학 연산에서 가장 기본적이고 중요한 패키지

In [1]:
!pip install numpy



In [2]:
# 임포트
import numpy as np

#### pandas

테이블 형태의 데이터를 다루는 데이터프레임(DataFrame) 자료형을 제공

자료 탐색과 정리에 아주 유용하여 데이터 분석 필수 패키지임

In [3]:
!pip install pandas



In [4]:
# 임포트
import pandas as pd

#### matplotlib

각종 그래프나 챠트 등을 그리는 시각화 기능을 제공

In [5]:
!pip install matplotlib



In [6]:
# 임포트
import matplotlib as mpl
import matplotlib.pyplot as plt

#### seaborn

맷플롯립 패키지에서 지원하지 않는 고급 통계 차트를 그리는 통계용 시각화 기능을 제공

In [7]:
!pip install seaborn



In [8]:
# 임포트
import seaborn as sns

#### scipy

고급 수학 함수, 수치적 미적분, 미분 방정식 계산, 최적화, 신호 처리 등에 사용하는 다양한 과학 기술 계산 기능을 제공

In [9]:
!pip install scipy



In [10]:
import scipy as sp

### 데이터 전처리 패키지

#### missingno

pandas 데이터프레임 데이터에서 누락된 데이터를 찾고 시각화기능 제공

In [16]:
!pip install missingno

Collecting missingno
  Downloading missingno-0.5.1-py3-none-any.whl (8.7 kB)
Installing collected packages: missingno
Successfully installed missingno-0.5.1


In [17]:
# 임포트
import missingno as mn

### 머신러닝 패키지

#### statsmodel

추정 및 검정, 회귀분석, 시계열분석 등의 기능을 제공하는 파이썬 패키지

- 예제 데이터셋
- 검정 및 모수추정
- 회귀분석
- 선형회귀
- 강건회귀
- 일반화 선형모형
- 혼합효과모형
- 이산종속변수
- 시계열 분석
- SARIMAX 모형
- 상태공간 모형
- 벡터 AR 모형
- 생존분석
- 요인분석

In [11]:
!pip install statsmodels



In [12]:
# 임포트
import statsmodels.api as sm

#### 사이킷런

머신러닝 교육을 위한 최고의 파이썬 패키지

scikit-learn 패키지의 장점은 다양한 머신러닝 모형을 하나의 패키지에서 모두 제공

- 데이터셋
    - 회귀분석, 분류, 클러스터링용 가상 데이터셋 생성
    - 각종 벤치마크 데이터셋
- 전처리
    - 스케일링
    - 누락데이터 처리
    -   텍스트 토큰화
- 지도학습
    - 회귀분석
    - LDA/QDA
    - 서포트벡터머신
    - 퍼셉트론, SGD
    - KNN
    - 가우스프로세스
    - 나이브베이즈
    - 의사결정나무
    - 랜덤포레스트, 부스팅
- 비지도학습
    - 가우스 혼합모형
    - 클러스터링
    - PCA
- 성능 최적화
- 교차검증
- 특징선택
- 하이퍼파라미터 최적화

In [14]:
!pip install sklearn

Collecting sklearn
  Downloading sklearn-0.0.tar.gz (1.1 kB)
  Preparing metadata (setup.py): started
  Preparing metadata (setup.py): finished with status 'done'
Collecting scikit-learn
  Downloading scikit_learn-1.1.2-cp310-cp310-win_amd64.whl (7.4 MB)
     ---------------------------------------- 7.4/7.4 MB 21.3 MB/s eta 0:00:00
Collecting threadpoolctl>=2.0.0
  Downloading threadpoolctl-3.1.0-py3-none-any.whl (14 kB)
Using legacy 'setup.py install' for sklearn, since package 'wheel' is not installed.
Installing collected packages: threadpoolctl, scikit-learn, sklearn
  Running setup.py install for sklearn: started
  Running setup.py install for sklearn: finished with status 'done'
Successfully installed scikit-learn-1.1.2 sklearn-0.0 threadpoolctl-3.1.0


In [15]:
# 임포트
import sklearn as sk