# 로지스틱 회귀(Logistic Regression)

- 선형회귀방식을 분류에 적용한 알고리즘

### 사이킷런의 로지스틱 회귀 클래스 LogistricRegression

**주요 매개변수**
- penalty : 규제 유형, 'l1', 'l2'
- C : 규제 강도 조절 alpha의 역수, C값이 클수록 규제강도가 큼

### 유방암 분류 문제

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline

from sklearn.datasets import load_breast_cancer
from sklearn.linear_model import LogisticRegression

cancer = load_breast_cancer()

In [None]:
cancerDF = pd.DataFrame(data=cancer.data, columns=cancer.feature_names)
cancerDF.head()

In [None]:
# 각 피처에 대한 분포도 확인


**피처변수들의 Z-스케일링**

In [None]:
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split

# StandardScaler( )로 평균이 0, 분산 1로 데이터 분포도 변환


In [None]:
# 각 피처에 대한 분포도 확인


**로지스틱 회귀를 이용하여 학습 및 예측 수행**

In [None]:
from sklearn.metrics import accuracy_score, roc_auc_score

# 로지스틱 회귀를 이용하여 학습 및 예측 수행. 

# accuracy와 roc_auc 측정


**로지스틱회귀에서 규제를 적용한 최적의 모델 검증**

In [None]:
from sklearn.model_selection import GridSearchCV
import warnings
warnings.filterwarnings('ignore')



# 회귀 트리(Regression Tree)

- 트리 기반의 회귀 알고리즘
- 트리 생성 방식은 분류 트리와 같으나, 리프 노드에서 예측 결정 값을 만드는 과정이 다름
    - 리프 노드에 속하는 데이터 값의 평균값을 구해 회귀 예측값으로 결정

### 사이킷런의 회귀를 위한 결정 트리 기반의 클래스들

- 결정트리, 랜덤포레스트, GBM, XGBoost, LightGBM 모두 회귀 분석 가능

![image.png](attachment:image.png)

### 보스턴 주택 가격 예측 문제

In [None]:
from sklearn.datasets import load_boston
from sklearn.model_selection import cross_val_score
from sklearn.ensemble import RandomForestRegressor
import pandas as pd
import numpy as np



In [None]:
def get_model_cv_prediction(model, X_data, y_target):


**다양한 유형의 회귀트리를 생성하고 보스턴 주택 가격 예측**

In [None]:
from sklearn.tree import DecisionTreeRegressor
from sklearn.ensemble import GradientBoostingRegressor
from xgboost import XGBRegressor
from lightgbm import LGBMRegressor


# 트리 기반의 회귀 모델을 반복하면서 평가 수행 


**회귀트리의 피처변수별 중요도**
- Regressor 클래스는 회귀계수 제공 속성 coef_ 가 없음
- 대신 feature_importances_를 이용해 피처별 중요도 제공

### 주택가격 데이터 셋에서  'RM' 변수와 'PRICE' 변수 만 선택하여 단순회귀분석
- 독립변수 : 'RM' (거주할 수 있는 방의 수)
- 종속변수 : 'PRICE' (주택 가격)
- 데이터 개수 : 100

**회귀트리로 주택가격 예측**

**에측한 회귀직선 시각화**