# Normalización
- Realizaremos una normalización con el Dataset completo para usarlo en el siguiente Notebook de Visualización.
- Usaremos la **Z-score normalization** que estandariza los datos para que tengan media 0 y desviación estándar 1.
- Se generará el archivo: `data/processed/zscore_normalized_all.csv`

In [1]:
import numpy as np
import pandas as pd

## Cargar los datos del archivo `cleaned_data.csv`

### Leer el Dataset

In [2]:
# Cargar el dataset desde el archivo CSV
df = pd.read_csv('../data/processed/cleaned_data.csv')

## Normalización Z-score
Aplicamos la normalización Z-score:
$$ X_{\text{norm}} = \frac{X - \mu}{\sigma} $$
donde $\mu$ es la media y $\sigma$ es la desviación estándar.  
Calculamos estos parámetros sobre el dataset completo y normalizamos todas las columnas numéricas (excluyendo 'diagnosis').

### Función de Normalización

In [5]:
X = df.select_dtypes(include=['float64'])

# Calcular media y desviación estándar
mean_vals = X.mean()
std_vals = X.std()

# Normalizar las características
X_normalized = (X - mean_vals) / std_vals

In [7]:
# Crear DataFrame añadiendo al inicio 'diagnosis'
df_normalized = pd.DataFrame(X_normalized)
df_normalized.insert(0, 'diagnosis', df['diagnosis'])  # Insertar diagnosis al principio
df_normalized.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 569 entries, 0 to 568
Data columns (total 31 columns):
 #   Column     Non-Null Count  Dtype  
---  ------     --------------  -----  
 0   diagnosis  569 non-null    int64  
 1   f01        569 non-null    float64
 2   f02        569 non-null    float64
 3   f03        569 non-null    float64
 4   f04        569 non-null    float64
 5   f05        569 non-null    float64
 6   f06        569 non-null    float64
 7   f07        569 non-null    float64
 8   f08        569 non-null    float64
 9   f09        569 non-null    float64
 10  f10        569 non-null    float64
 11  f11        569 non-null    float64
 12  f12        569 non-null    float64
 13  f13        569 non-null    float64
 14  f14        569 non-null    float64
 15  f15        569 non-null    float64
 16  f16        569 non-null    float64
 17  f17        569 non-null    float64
 18  f18        569 non-null    float64
 19  f19        569 non-null    float64
 20  f20       