## . 다중공선성이 존재하는가?
- 다중공선성은 회귀분석에서 독립변수들 간에 강한 상관관계가 나타나는 문제
- 다중공선성의 문제가 존재하면 정확한 회귀계수 추정이 어려움 
- 독립변수들간의 상관관계를 파악한 후, 다중공선성이 발생하면 변수를 제거하거나 주성분, Ridge회귀 등을 적용하여 문제를 해결 
- 다중공선성을 검사하는 방법 
> <b>1) 독립변수들 간의 상관계수</b>를 구하여 상관성을 직접 파악 0.9 이상이면 다중공선성이 있다고 판단 <br>
> <b>2) 허용 오차</b>를 구했을 때 0.1이하면 다중공선성 문제가 심각하다고 할 수 있음 <br>
     허용오차 = (1-Ri^2) : 한 독립변수의 분산 중 다른 독립변수들에 의해서 설명되지 않는 부분을 의미함,  <br>
     즉 그 값이 작을 수록 공선성은 높다고 볼 수 있음. <br>
> <b>3) 분산팽창요인(VIF)</b>은 허용오차의 역수로 그 값이 클수록 독립변수들 간의 상관성이 높다. 일반적으로 VIF가 10 이상이면 공선성의 문제가 심각하다고 본다. <br>

In [2]:
import pandas as pd

# 데이터 불러오기
Cars = pd.read_csv('./data/Cars93.csv')

Cars.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 93 entries, 0 to 92
Data columns (total 27 columns):
 #   Column              Non-Null Count  Dtype  
---  ------              --------------  -----  
 0   Manufacturer        93 non-null     object 
 1   Model               93 non-null     object 
 2   Type                93 non-null     object 
 3   Min.Price           93 non-null     float64
 4   Price               93 non-null     float64
 5   Max.Price           93 non-null     float64
 6   MPG.city            93 non-null     int64  
 7   MPG.highway         93 non-null     int64  
 8   AirBags             93 non-null     object 
 9   DriveTrain          93 non-null     object 
 10  Cylinders           93 non-null     object 
 11  EngineSize          93 non-null     float64
 12  Horsepower          93 non-null     int64  
 13  RPM                 93 non-null     int64  
 14  Rev.per.mile        93 non-null     int64  
 15  Man.trans.avail     93 non-null     object 
 16  Fuel.tank.

In [3]:
Cars

Unnamed: 0,Manufacturer,Model,Type,Min.Price,Price,Max.Price,MPG.city,MPG.highway,AirBags,DriveTrain,...,Passengers,Length,Wheelbase,Width,Turn.circle,Rear.seat.room,Luggage.room,Weight,Origin,Make
0,Acura,Integra,Small,12.9,15.9,18.8,25,31,,Front,...,5,177,102,68,37,26.5,11,2705,non-USA,Acura Integra
1,Acura,Legend,Midsize,29.2,33.9,38.7,18,25,Driver & Passenger,Front,...,5,195,115,71,38,30.0,15,3560,non-USA,Acura Legend
2,Audi,90,Compact,25.9,29.1,32.3,20,26,Driver only,Front,...,5,180,102,67,37,28.0,14,3375,non-USA,Audi 90
3,Audi,100,Midsize,30.8,37.7,44.6,19,26,Driver & Passenger,Front,...,6,193,106,70,37,31.0,17,3405,non-USA,Audi 100
4,BMW,535i,Midsize,23.7,30.0,36.2,22,30,Driver only,Rear,...,4,186,109,69,39,27.0,13,3640,non-USA,BMW 535i
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
88,Volkswagen,Eurovan,Van,16.6,19.7,22.7,17,21,,Front,...,7,187,115,72,38,34.0,-2147483648,3960,non-USA,Volkswagen Eurovan
89,Volkswagen,Passat,Compact,17.6,20.0,22.4,21,30,,Front,...,5,180,103,67,35,31.5,14,2985,non-USA,Volkswagen Passat
90,Volkswagen,Corrado,Sporty,22.9,23.3,23.7,18,25,,Front,...,4,159,97,66,36,26.0,15,2810,non-USA,Volkswagen Corrado
91,Volvo,240,Compact,21.8,22.7,23.5,21,28,Driver only,Rear,...,5,190,104,67,37,29.5,14,2985,non-USA,Volvo 240


In [5]:
Cars[['EngineSize', 'RPM', 'Weight', 'Length']]

Unnamed: 0,EngineSize,RPM,Weight,Length
0,1.8,6300,2705,177
1,3.2,5500,3560,195
2,2.8,5500,3375,180
3,2.8,5500,3405,193
4,3.5,5700,3640,186
...,...,...,...,...
88,2.5,4500,3960,187
89,2.0,5800,2985,180
90,2.8,5800,2810,159
91,2.3,5400,2985,190
