# RobusterScaler
Es una herramienta de preprocesamiento en la biblioteca scikitlearn, que utiliza para escalar caracteristicas donde se elimina la mediana y escalando los datos de acuerdo con el intercuartilico(IQR). Este enfoque es especialmente util para datos con valores atípicos, ya que no es sensible a ellos como otros métodos de escalado, como el standarScaler o el minMaxScaler.

# 1. Como funciona ?
- Sustituye la media de los datos por la mediana, lo que hace que sea más robusto frente a valores extremos.
- Escalado: Escala los datos dividiendo el rango intercuartilico, que es la diferencia entre el tercer cuartil(75) y el primer cuartil (25)
  
- ![cuartiles.png](attachment:f5fa3b94-f2fd-4a08-aa54-fabf69c63a71.png)

El robuster escaler centra las caracteristicas alrededor de la mediana y las escala usando el rango intercuartílico, lo que hace que las caracteristica esten menos afectadas por valores atipicos.

## Parametros importantes:
- quantile_range: Define los percentiles utilizados para calcular el rango intercuartílico. el valor predeterminado es (25, 75) que corresponde al IQR clásico, pero puede ajustarse según las necesidades.
- with_scaling: Si es True (Por defecto), las caracteristicas se escalan dividiendo por el IQR.
- with_centering: Si es True(Por defecto), las caracteristicas se centran utilizando la mediana.
- uniy_cariance: Si es True, las caracteristicas se escalan para tener varianza unitaria, despues del escalado.
- 
## Vantajas
1. Robustez contra valores atípicos.
2. Flexibilidad: Permite ajustar los percentiles para adaptar el rango de scalado.

## Desventajas.
1. No garantiza valores entre un rango fijo: A diferencia de MinMaxScaler, los datos transformados no estan garantizados en el rango específico [0, 1]
2. Puede ser computacionalmente más costoso: Calcular la mediana y los cuartiles puede ser má lento para grandes conjuntos de datos.

# Ejemplo   


In [3]:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import RobustScaler
import pandas as pd

In [9]:
iris = load_iris()
X=iris.data           #Las caracteristicas
y = iris.target       # Etiquetas
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size =0.2, random_state=42)

#Creamos instancia de RobustScaler
scaler = RobustScaler()
X_train_scaled = scaler.fit_transform(X_train)

df_original = pd.DataFrame(X_train, columns = iris.feature_names)
df_scaled = pd.DataFrame(X_train_scaled, columns = iris.feature_names)
print("Datos originales")
print(df_original)

print("Datos escalados\n")
print(df_scaled)


Datos originales
     sepal length (cm)  sepal width (cm)  petal length (cm)  petal width (cm)
0                  4.6               3.6                1.0               0.2
1                  5.7               4.4                1.5               0.4
2                  6.7               3.1                4.4               1.4
3                  4.8               3.4                1.6               0.2
4                  4.4               3.2                1.3               0.2
..                 ...               ...                ...               ...
115                6.1               2.8                4.0               1.3
116                4.9               2.5                4.5               1.7
117                5.8               4.0                1.2               0.2
118                5.8               2.6                4.0               1.2
119                7.1               3.0                5.9               2.1

[120 rows x 4 columns]
Datos escalados

     s

# Conclusiones generales RobustScaler

![RobustEscaler.png](attachment:a72dbb02-280d-4feb-ab62-31dcd7b68a6e.png

El Robust Scaler puede se mas costoso en terminos computacionales