In [None]:
# Importación de las librerías necesarias
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# Configuración de visualización
%matplotlib inline
sns.set(style="whitegrid")

# Carga del dataset
df = pd.read_csv('/datos/oasis_longitudinal.csv')  

# Visualización de las primeras filas del dataset
print(df.head())

# Estadísticas descriptivas del dataset
print(df.describe(include='all'))

# Verificación de valores faltantes
print(df.isnull().sum())

# Visualizaciones para el EDA
# Distribución de la edad
plt.figure(figsize=(10, 6))
sns.histplot(df['Age'], kde=True, bins=30)
plt.title('Distribución de la Edad')

# Relación entre la edad y el diagnóstico de demencia
plt.figure(figsize=(10, 6))
sns.boxplot(x='Group', y='Age', data=df)
plt.title('Relación entre la Edad y el Diagnóstico de Demencia')

# Preparación del Dataset
# Limpieza de valores faltantes
df.dropna(inplace=True)  # Ejemplo de eliminación 

# Transformación de variables categóricas a numéricas
df['Group'] = df['Group'].map({'Nondemented': 0, 'Demented': 1, 'Converted': 2})

# Normalización o estandarización de características numéricas 
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()

#  estandarizar la columna 'Age'
df['Age_scaled'] = scaler.fit_transform(df[['Age']])

# Verificación final del dataset preparado
print(df.head())
