# Cargar Datos

Este notebook contiene pasos de ejemplo para cargar el dataset (CSV).

**Nota**: Este notebook es de ejemplo y no está pensado para producción. En un entorno real, los datos estarían en un Data Warehouse o Data Lake.

In [None]:
import pandas as pd
import numpy as np
import json

## Cargar configuración

In [None]:
# Cargar configuración desde config.json
with open('../../config.json', 'r') as f:
    config = json.load(f)

print('Configuración cargada:')
print(json.dumps(config, indent=2))

## Cargar dataset

In [None]:
# Cargar el dataset
data_path = f'../../{config["data_path"]}'
df = pd.read_csv(data_path, sep=';')

print(f'Dataset cargado: {df.shape[0]} filas, {df.shape[1]} columnas')
df.head()

## Información básica del dataset

In [None]:
# Información general
print('\n=== Información del Dataset ===')
df.info()

In [None]:
# Verificar valores nulos
print('\n=== Valores Nulos ===')
print(df.isnull().sum())

In [None]:
# Estadísticas descriptivas
print('\n=== Estadísticas Descriptivas ===')
df.describe()

## Verificar variable objetivo

In [None]:
# Distribución de la variable objetivo (Response)
if 'Response' in df.columns:
    print('\n=== Distribución de Response ===')
    print(df['Response'].value_counts())
    print(f'\nPorcentaje de respuestas positivas: {df["Response"].mean()*100:.2f}%')
else:
    print('Advertencia: Variable Response no encontrada en el dataset')

## Guardar dataset limpio (opcional)

In [None]:
# Opcional: guardar una versión limpia del dataset
# df.to_csv('../../data_cleaned.csv', index=False)
print('Dataset listo para análisis exploratorio (EDA)')