<p align = "center"><strong>NORMALITY ASSESSMENT <strong></p>

<p><b>By: Jefferson C.</p>

---

### __Box - Cox Transformation__

Transformación paramétrica que __modifica la escala de los datos__ mediante un parámetro $\lambda$ para __reducir la asimetría y aproximar la normalidad__, facilitando el uso de métodos paramétricos.
$$Y(\lambda) =
\begin{cases}
 \frac{x_i^\lambda-1}{\lambda} \qquad \lambda \neq 0 \\
 \ln(x_i) \qquad \lambda = 0 \\ 
\end{cases}
\qquad 
,x_i>0
$$

Donde : 

- $x_i$ : Original Data

- $\lambda$: Transformation Paramether


__Table Transform__

<div align= 'center'>

| Lambda Value| Transformation     | Typical use                              |
|------------------|--------------------|-------------------------------------------|
| $\lambda \approx 2$   | Cuadrado           | Datos muy comprimidos o con leve asimetría |
| $\lambda \approx 1$   | Sin transformación | Datos aproximadamente normales |
| $\lambda \approx 0.5$ | Raíz cuadrada      | Datos de conteo, distribución Poisson |
| $\lambda \approx 0$   | Logaritmo          | Colas derechas largas |
| $\lambda \approx -1$  | Inversa            | Datos extremadamente sesgados positivamente |

</div>

In [1]:
# INPUT 
import pandas as pd 
data = pd.DataFrame({
    "Resistencia_terreno": [
        78.65, 105.06, 105.94, 111.84, 115.93, 122.15, 121.39, 120.14,
        79.95, 83.44, 98.39, 109.58, 111.21, 113.10, 113.91, 111.09,
        85.65, 95.85, 107.67, 110.34
    ],
})

In [2]:
from scipy.stats import boxcox
y = data['Resistencia_terreno'].to_numpy()

# data are not negative 
print(f'min: {min(y)}')

# Box-Cox transformation 
y_bc,lambda_bc= boxcox(y)
data['y_boxcox'] = y_bc
data.head(4)

min: 78.65


Unnamed: 0,Resistencia_terreno,y_boxcox
0,78.65,26353950.0
1,105.06,90096980.0
2,105.94,93344990.0
3,111.84,117496700.0


---