## 1. Regularized regressions:

In [1]:
import numpy as np
import pandas as pd
import os
import matplotlib.pyplot as plt
from sklearn.metrics import mean_squared_error
from sklearn.model_selection import train_test_split
from sklearn.linear_model import Ridge, Lasso  

### 1.1. Read in data:
1974 MotoTrend US Magazine에서 발표한 데이터 가져온다

In [2]:
os.chdir(r'C:\Users\Gram\Desktop\myPyCode\04 머신러닝 - 실습\data')                  

In [3]:
df = pd.read_csv('data_mtcars.csv', header='infer')

In [4]:
df.shape  #32개 차종, 11개 스펙

(32, 12)

In [5]:
df.head(5)  

Unnamed: 0,model,mpg,cyl,disp,hp,drat,wt,qsec,vs,am,gear,carb
0,Mazda RX4,21.0,6,160.0,110,3.9,2.62,16.46,0,1,4,4
1,Mazda RX4 Wag,21.0,6,160.0,110,3.9,2.875,17.02,0,1,4,4
2,Datsun 710,22.8,4,108.0,93,3.85,2.32,18.61,1,1,4,1
3,Hornet 4 Drive,21.4,6,258.0,110,3.08,3.215,19.44,1,0,3,1
4,Hornet Sportabout,18.7,8,360.0,175,3.15,3.44,17.02,0,0,3,2


In [6]:
# Separate into X and Y.
X=df.drop(columns=['model','mpg'])  #model, mpg제거함
Y=df.mpg   

In [7]:
# 데이터 셋 쪼갬
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.3, random_state=123)

### 1.2. Ridge regression: 릿지회귀

In [16]:
lambdaRange = range(1,100)  #람다를 1~100까지 가져옴

In [9]:
#릿지회귀로 학습해 베스트람다에 해당하는 결정계수 보기
bestRsq = 0.0          #R^2
bestLambda = 0.0       #람다                    

for aLambda in lambdaRange:  #베스트람다 찾기 위한 for문
    ridge = Ridge(aLambda)   #range(1,100)에 해당하는 람다로 릿지회귀객체 만듬
    ridge.fit(X_train,Y_train)          #학습
    rsq = ridge.score(X_test,Y_test)    #test로 R^2 계산
    
    if (rsq > bestRsq):        #결정계수 좋으면 해당 람다를 베스트람다로 대체, 결정계수 출력, 그게 아니면 넘어감                             
        bestRsq = rsq    
        bestLambda = aLambda
        print("Lambda = ", bestLambda, " and  R^2 = ", np.round(rsq,3))

ridge = Ridge(bestLambda)        #베스트람다로 최종실행                             
ridge.fit(X,Y)     

#1,2,3,4,5 까지는 좋아지다가 그 이후로는 쪼여진것
#5까지가 좋은 람다임을 알수 있음

Lambda =  1  and  R^2 =  0.779
Lambda =  2  and  R^2 =  0.813
Lambda =  3  and  R^2 =  0.822
Lambda =  4  and  R^2 =  0.825
Lambda =  5  and  R^2 =  0.825


Ridge(alpha=5, copy_X=True, fit_intercept=True, max_iter=None, normalize=False,
      random_state=None, solver='auto', tol=0.001)

In [10]:
# Show the intercept.
ridge.intercept_     #선형회귀와 같은 의미인데 억제가 됨

28.58776326642279

In [11]:
# Show other parameters.
ridge.coef_   

#릿지에서는 선형회귀해석을 할 수 없음 => 이 수치들은 이제 해석할 필요 없다

array([-0.51185256, -0.00768344, -0.01533332,  0.61667067, -1.39209019,
       -0.00709397,  0.11850925,  0.94390866,  0.71148287, -0.7038523 ])

**NOTE: 릿지회귀에서 람다가 커져도 정확히 0이 되는 수치는 없다**

### 1.3. Lasso regression: 래소회귀

In [12]:
lambdaRange = range(1,100)

In [13]:
bestRsq = 0.0                 #R^2                               
bestLambda = 0.0              #람다                             

for aLambda in lambdaRange:       #베스트람다 찾기 위한 for문
    lasso = Lasso(aLambda  )      #range(1,100)에 해당하는 람다로 래소회귀객체 만듬
    lasso.fit(X_train,Y_train)           #학습                        
    rsq = lasso.score(X_test,Y_test)     #test로 R^2 계산
       
    if (rsq > bestRsq):         #결정계수 좋으면 해당 람다를 베스트람다로 대체, 결정계수 출력, 그게 아니면 넘어감.
        bestRsq = rsq
        bestLambda = aLambda
        print("Lambda = ", bestLambda, " and  R^2 = ", np.round(rsq,3))
        
lasso = Lasso(bestLambda)  #베스트람다로 최종실행                                      
lasso.fit(X,Y) 

#결정계수가 최고인 람다를 가져옴
#결정계수가 릿지보다 못함

Lambda =  1  and  R^2 =  0.735
Lambda =  2  and  R^2 =  0.743
Lambda =  3  and  R^2 =  0.744
Lambda =  4  and  R^2 =  0.744
Lambda =  5  and  R^2 =  0.744
Lambda =  6  and  R^2 =  0.745
Lambda =  7  and  R^2 =  0.745
Lambda =  8  and  R^2 =  0.745
Lambda =  9  and  R^2 =  0.746
Lambda =  10  and  R^2 =  0.746
Lambda =  11  and  R^2 =  0.746
Lambda =  12  and  R^2 =  0.747
Lambda =  13  and  R^2 =  0.747
Lambda =  14  and  R^2 =  0.747
Lambda =  15  and  R^2 =  0.747
Lambda =  16  and  R^2 =  0.747
Lambda =  17  and  R^2 =  0.748
Lambda =  18  and  R^2 =  0.748
Lambda =  19  and  R^2 =  0.748
Lambda =  20  and  R^2 =  0.748
Lambda =  21  and  R^2 =  0.749
Lambda =  22  and  R^2 =  0.749
Lambda =  23  and  R^2 =  0.749
Lambda =  24  and  R^2 =  0.749
Lambda =  25  and  R^2 =  0.749
Lambda =  26  and  R^2 =  0.749
Lambda =  27  and  R^2 =  0.749
Lambda =  28  and  R^2 =  0.75
Lambda =  29  and  R^2 =  0.75
Lambda =  30  and  R^2 =  0.75
Lambda =  31  and  R^2 =  0.75
Lambda =  32  and  R^

Lasso(alpha=41, copy_X=True, fit_intercept=True, max_iter=1000, normalize=False,
      positive=False, precompute=False, random_state=None, selection='cyclic',
      tol=0.0001, warm_start=False)

In [14]:
# Show the intercept.
lasso.intercept_

29.481705776221872

In [15]:
# Show other parameters.
lasso.coef_

#두개만 나오고 나머지는 정확하게 0 나옴

array([-0.       , -0.0335117, -0.0113111,  0.       , -0.       ,
        0.       ,  0.       ,  0.       ,  0.       , -0.       ])

**NOTE: 래소회귀에서 람다가 커지면 정확히 0이 되는 수치가 있다.** 

래소는 릿지와 다르게 정확하게 0으로 만들어준다는 차이있음 단, 2개 변수만 살아남아 해석 못함<br>

따라서 릿지가 더 선호됨<br>
래소는 변수가 사라져 모형이 너무 단순해짐<br>

릿지회귀와 래소회귀는 과도기적 알고리즘이다.<br>
이 2개는 해석통찰력이 없음<br>
따라서, 머신러닝 배우기는 싫고 선형회귀에서 변질된거 사용하고플 때 사용<br>

최근에 릿지와 래소는 고전방법으로 사용이 줄음<br>