# 스케일링 종류
1. StandardScaler:	기본 스케일. 평균과 표준편차 사용

2.	MinMaxScaler:	최대/최소값이 각각 1, 0이 되도록 스케일링

3.	MaxAbsScaler:	최대절대값과 0이 각각 1, 0이 되도록 스케일링

4.	RobustScaler:	중앙값(median)과 IQR(interquartile range) 사용. 아웃라이어의 영향을 최소화

# **1. MinMaxScaler**

In [1]:
import pandas as pd
from sklearn.preprocessing import MinMaxScaler

data = pd.read_csv('/content/mtcars.csv')

s=pd.DataFrame(data['qsec'])

scaler = MinMaxScaler()
scaler.fit(s)

s=scaler.transform(s)
print(s)
count=0
for c in s:
	if c>0.5:
		count+=1
print(count)

[[0.23333333]
 [0.3       ]
 [0.48928571]
 [0.58809524]
 [0.3       ]
 [0.68095238]
 [0.15952381]
 [0.6547619 ]
 [1.        ]
 [0.45238095]
 [0.52380952]
 [0.3452381 ]
 [0.36904762]
 [0.41666667]
 [0.41428571]
 [0.3952381 ]
 [0.34761905]
 [0.59166667]
 [0.47857143]
 [0.64285714]
 [0.65595238]
 [0.28214286]
 [0.33333333]
 [0.10833333]
 [0.30357143]
 [0.52380952]
 [0.26190476]
 [0.28571429]
 [0.        ]
 [0.11904762]
 [0.01190476]
 [0.48809524]]
9


# **2. MaxAbsScaler**

In [2]:
from sklearn.preprocessing import MaxAbsScaler
#절대값이 0~1사이에 매핑되도록 한다. 즉 -1~1 사이로 재조정한다.
scaler = MaxAbsScaler()

z = pd.DataFrame(data['qsec'])

scaler.fit(z)
z=scaler.transform(z)

print(z)

[[0.71877729]
 [0.74323144]
 [0.81266376]
 [0.8489083 ]
 [0.74323144]
 [0.88296943]
 [0.69170306]
 [0.87336245]
 [1.        ]
 [0.79912664]
 [0.82532751]
 [0.75982533]
 [0.76855895]
 [0.7860262 ]
 [0.78515284]
 [0.77816594]
 [0.76069869]
 [0.85021834]
 [0.80873362]
 [0.86899563]
 [0.87379913]
 [0.73668122]
 [0.75545852]
 [0.67292576]
 [0.74454148]
 [0.82532751]
 [0.72925764]
 [0.73799127]
 [0.63318777]
 [0.6768559 ]
 [0.63755459]
 [0.81222707]]


# **3. RobustScaler**

아웃라이어의 영향을 최소화한 기법이다. 중앙값(median)과 IQR(interquartile range)을 사용하기 때문에 StandardScaler와 비교해보면 표준화 후 동일한 값을 더 넓게 분포 시키고 있음을 확인 할 수 있다.

In [3]:
from sklearn.preprocessing import RobustScaler

scaler = RobustScaler()

z=pd.DataFrame(data['qsec'])
scaler.fit(z)

z=scaler.transform(z)
print(z)

[[-0.62266501]
 [-0.34371108]
 [ 0.4483188 ]
 [ 0.86176837]
 [-0.34371108]
 [ 1.25031133]
 [-0.93150685]
 [ 1.14072229]
 [ 2.58530511]
 [ 0.29389788]
 [ 0.59277709]
 [-0.15442092]
 [-0.05479452]
 [ 0.14445828]
 [ 0.13449564]
 [ 0.05479452]
 [-0.14445828]
 [ 0.87671233]
 [ 0.40348692]
 [ 1.09090909]
 [ 1.14570361]
 [-0.41843088]
 [-0.20423412]
 [-1.14570361]
 [-0.32876712]
 [ 0.59277709]
 [-0.50311333]
 [-0.40348692]
 [-1.59900374]
 [-1.10087173]
 [-1.54919054]
 [ 0.44333748]]


# **4. StandardScaler**

In [4]:
from sklearn.preprocessing import StandardScaler

scaler = StandardScaler()
z=pd.DataFrame(data['qsec'])

scaler.fit(z)
z=scaler.transform(z)

print(z)

[[-0.78960058]
 [-0.47120178]
 [ 0.43282336]
 [ 0.90473586]
 [-0.47120178]
 [ 1.34821989]
 [-1.14211353]
 [ 1.22313465]
 [ 2.87198554]
 [ 0.25656688]
 [ 0.59770845]
 [-0.25514546]
 [-0.14143161]
 [ 0.0859961 ]
 [ 0.07462472]
 [-0.01634637]
 [-0.24377408]
 [ 0.92179293]
 [ 0.38165212]
 [ 1.16627772]
 [ 1.22882034]
 [-0.55648718]
 [-0.31200239]
 [-1.38659831]
 [-0.45414471]
 [ 0.59770845]
 [-0.65314395]
 [-0.5394301 ]
 [-1.90399635]
 [-1.33542708]
 [-1.84713942]
 [ 0.42713767]]
