In [None]:
#
# 1. Visualizaciones de los datos de analisis con relacion de variables identificando relaciones
#

###
# Importar librerias necesarias para el procesamiento del dataframe
###

'''Pandas para la lectura del archivo'''
import pandas as pd

'''Sns y plt para organizar los graficos visuales'''
import matplotlib.pyplot as plt
import seaborn as sns

#
# Carga de datos
#
data = pd.read_csv('/content/sample_data/Titanic-Dataset.csv')

#
# Visualización básica de los datos
#
print(data.head())

#
# Estadísticas descriptivas
#
print(data.describe())

#
# Distribución de variables numéricas
#
sns.histplot(data['Age'].dropna(), kde=True, color='blue', label='Age')
plt.show()

#
# Distribución de la variable 'Survived'
#
sns.countplot(x='Survived', data=data)
plt.title('Survival Count')
plt.show()

#
# Relaciones entre 'Pclass', 'Sex', 'Age' y 'Survived'
#
sns.pairplot(data.dropna(), vars=['Age', 'Pclass', 'Fare'], hue='Survived', height=3)
plt.show()

In [None]:
#
# 2. Preprocesamiento de los Datos
#

###
# Importar librerias necesarias para el procesamiento del dataframe
###

'''SimpleImputer para la gestión de caracteristicas de valores faltantes'''
from sklearn.impute import SimpleImputer

'''LabelEncoder Para codificar variables categóricas y StandardScaler'''
'''para escalar las características'''
from sklearn.preprocessing import LabelEncoder, StandardScaler

#
# Tratamiento de valores faltantes
#
imputer = SimpleImputer(strategy='mean')
data['Age'] = imputer.fit_transform(data[['Age']])

#
# Codificación de variables categóricas
#
encoder = LabelEncoder()
data['Sex'] = encoder.fit_transform(data['Sex'])

#
# Escalado de características
#
scaler = StandardScaler()
data['Fare'] = scaler.fit_transform(data[['Fare']])

#
# Visualización de los datos después del preprocesamiento
#
print(data.head())


In [None]:
#
# 3. Selección de características
#
features = data[['Pclass', 'Sex', 'Age', 'SibSp', 'Parch', 'Fare']]
target = data['Survived']

In [None]:
#
# 4. División del conjunto de datos
#

###
# Importar librerias necesarias del modelo, el entrenamiendo y las métricas
###

'''Train test split para dividir el data frame en partes'''
from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(features, target, test_size=0.2, random_state=42)

In [None]:
#
# 5. Entrenamiento del Modelo de Regresión Lineal
#

###
# Importar librerias necesarias del modelo, el entrenamiendo y las métricas
###

'''Modelo de ejecución de entrenamiento'''
from sklearn.linear_model import LogisticRegression

model = LogisticRegression()
model.fit(X_train, y_train)

In [None]:
#
# 6. Evaluación del modelo
#

###
# Importar librerias necesarias del modelo, el entrenamiendo y las métricas
###

'''Metricas de desempeño'''
from sklearn.metrics import accuracy_score, classification_report

# Predicción en el conjunto de test
predictions = model.predict(X_test)

# Métricas de evaluación
print(f'Accuracy: {accuracy_score(y_test, predictions)}')
print(classification_report(y_test, predictions))

In [None]:
#
# 7. Visualización de resultados
#

###
# Importar librerias necesarias del modelo, el entrenamiendo y las métricas
###

'''Metricas de desempeño'''
from sklearn.metrics import confusion_matrix

#
# Matriz de confusión
#
conf_mat = confusion_matrix(y_test, predictions)
sns.heatmap(conf_mat, annot=True, fmt='d')
plt.title('Confusion Matrix')
plt.ylabel('Actual')
plt.xlabel('Predicted')
plt.show()