# Importar librerías necesarias
Importamos pandas, numpy, scikit-learn y Keras.

In [7]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder, StandardScaler
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Input

# Cargar y preparar el dataset
Leemos el archivo CSV y seleccionamos las columnas relevantes.

In [8]:
# Cargar el dataset
datos = pd.read_csv("data/train.csv")

# Eliminar columnas que no vamos a usar
datos = datos[['Survived', 'Pclass', 'Sex', 'Age', 'Fare']]

# Manejar valores nulos
Rellenamos los valores nulos de la edad con la mediana.

In [9]:
datos['Age'] = datos['Age'].fillna(datos['Age'].median())

# Codificar variables categóricas
Convertimos la columna 'Sex' a valores numéricos.

In [10]:
datos['Sex'] = LabelEncoder().fit_transform(datos['Sex'])

# Separar variables independientes y objetivo
Definimos las variables predictoras y la variable objetivo.

In [11]:
X = datos[['Pclass', 'Sex', 'Age', 'Fare']]
y = datos['Survived']

# Escalar los datos
Normalizamos los datos para mejorar el rendimiento del modelo.

In [12]:
escalador = StandardScaler()
X_escalado = escalador.fit_transform(X)

# Separar en entrenamiento y prueba
Dividimos los datos en conjuntos de entrenamiento y prueba.

In [13]:
X_entrenamiento, X_prueba, y_entrenamiento, y_prueba = train_test_split(X_escalado, y, test_size=0.2, random_state=42)

# Crear el modelo de regresión logística con Keras
Definimos y compilamos el modelo.

In [14]:
modelo = Sequential()
modelo.add(Input(shape=(X_entrenamiento.shape[1],)))
modelo.add(Dense(1, activation='sigmoid'))

modelo.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

# Entrenar el modelo
Entrenamos el modelo con los datos de entrenamiento.

In [15]:
modelo.fit(X_entrenamiento, y_entrenamiento, epochs=50, batch_size=16, validation_data=(X_prueba, y_prueba))

Epoch 1/50
[1m45/45[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 12ms/step - accuracy: 0.3522 - loss: 1.1265 - val_accuracy: 0.3352 - val_loss: 1.1623
Epoch 2/50
[1m45/45[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 12ms/step - accuracy: 0.3522 - loss: 1.1265 - val_accuracy: 0.3352 - val_loss: 1.1623
Epoch 2/50
[1m45/45[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 6ms/step - accuracy: 0.3993 - loss: 1.0520 - val_accuracy: 0.3464 - val_loss: 1.1203
Epoch 3/50
[1m45/45[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 6ms/step - accuracy: 0.3993 - loss: 1.0520 - val_accuracy: 0.3464 - val_loss: 1.1203
Epoch 3/50
[1m45/45[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 6ms/step - accuracy: 0.3885 - loss: 1.0572 - val_accuracy: 0.3520 - val_loss: 1.0807
Epoch 4/50
[1m45/45[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 6ms/step - accuracy: 0.3885 - loss: 1.0572 - val_accuracy: 0.3520 - val_loss: 1.0807
Epoch 4/50
[1m45/45[0m [32m━━━━━━━━

<keras.src.callbacks.history.History at 0x1a98fb5ddd0>

# Realizar predicciones y evaluar el modelo
Obtenemos las predicciones y mostramos el reporte de clasificación.

In [16]:
predicciones = modelo.predict(X_prueba)
clases_predichas = (predicciones > 0.5).astype(int).reshape(-1)

from sklearn.metrics import classification_report
print("Reporte de Clasificación:\n", classification_report(y_prueba, clases_predichas))

[1m6/6[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 17ms/step
[1m6/6[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 17ms/step
Reporte de Clasificación:
               precision    recall  f1-score   support

           0       0.80      0.84      0.82       105
           1       0.75      0.70      0.73        74

    accuracy                           0.78       179
   macro avg       0.78      0.77      0.77       179
weighted avg       0.78      0.78      0.78       179

Reporte de Clasificación:
               precision    recall  f1-score   support

           0       0.80      0.84      0.82       105
           1       0.75      0.70      0.73        74

    accuracy                           0.78       179
   macro avg       0.78      0.77      0.77       179
weighted avg       0.78      0.78      0.78       179

