# Análisis de Datos del Titanic

Este notebook proporciona un análisis interactivo de los datos del Titanic.

## Contenido
1. Carga de datos
2. Análisis exploratorio
3. Visualizaciones
4. Preprocesamiento
5. Modelos de Machine Learning
6. Resultados

In [None]:
# Importar las bibliotecas necesarias
import sys
sys.path.append('../src')

from analisis_titanic import TitanicAnalysis
import pandas as pd
import matplotlib.pyplot as plt

%matplotlib inline

## 1. Crear instancia del análisis y cargar datos

In [None]:
# Crear instancia del análisis
analysis = TitanicAnalysis(data_path='../data/titanic.csv')

# Cargar datos
df = analysis.load_data()

## 2. Análisis Exploratorio

In [None]:
# Realizar análisis exploratorio
stats = analysis.exploratory_analysis()

## 3. Visualizaciones

In [None]:
# Generar visualizaciones
analysis.visualize_data()

## 4. Preprocesamiento de Datos

In [None]:
# Preprocesar datos
X_train, X_test, y_train, y_test = analysis.preprocess_data()

## 5. Entrenar Modelos

In [None]:
# Entrenar modelos
models = analysis.train_models()

## 6. Evaluar Modelos

In [None]:
# Evaluar modelos
analysis.evaluate_models()

## 7. Generar Reporte Final

In [None]:
# Generar reporte
analysis.generate_report()

## Análisis Adicional

Puedes realizar análisis adicionales aquí:

In [None]:
# Ejemplo: Análisis de supervivencia por edad
plt.figure(figsize=(12, 6))
plt.subplot(1, 2, 1)
df[df['survived'] == 0]['age'].hist(bins=20, alpha=0.5, label='No Sobrevivió', color='red')
df[df['survived'] == 1]['age'].hist(bins=20, alpha=0.5, label='Sobrevivió', color='green')
plt.xlabel('Edad')
plt.ylabel('Frecuencia')
plt.legend()
plt.title('Distribución de Edad por Supervivencia')

plt.subplot(1, 2, 2)
df.groupby('age')['survived'].mean().plot()
plt.xlabel('Edad')
plt.ylabel('Tasa de Supervivencia')
plt.title('Tasa de Supervivencia por Edad')

plt.tight_layout()
plt.show()