## Entrenamiento y Preparación del Modelo Final para Producción

En esta sección, seleccionaremos el mejor modelo basado en los resultados anteriores, entrenaremos el modelo con todos los datos disponibles y prepararemos el modelo para su despliegue en producción.

### Selección del Mejor Modelo

Basado en los resultados anteriores, seleccionamos el modelo **Random Forest (SMOTE)** como el mejor modelo debido a su balance entre precisión, recall y F1-Score.

### Entrenamiento del Modelo Final

Entrenaremos el modelo **Random Forest (SMOTE)** utilizando todos los datos disponibles y los mejores hiperparámetros encontrados durante la búsqueda de hiperparámetros.

In [None]:
import joblib
from sklearn.ensemble import RandomForestClassifier
from imblearn.over_sampling import SMOTE

# Usar las variables preprocesadas directamente
X = features  # Características preprocesadas
y = target    # Etiquetas preprocesadas

# Aplicar SMOTE para balancear las clases
smote = SMOTE(random_state=42)
X_smote, y_smote = smote.fit_resample(X, y)

# Crear el modelo Random Forest con los mejores hiperparámetros
best_params = {'max_depth': 20, 'n_estimators': 187}
model = RandomForestClassifier(**best_params, random_state=42)

# Entrenar el modelo con todos los datos disponibles
model.fit(X_smote, y_smote)

# Guardar el modelo entrenado para su despliegue
joblib.dump(model, 'random_forest_smote_model.pkl')

### Preparación del Modelo para Despliegue

El modelo entrenado se ha guardado en un archivo `random_forest_smote_model.pkl` utilizando la biblioteca `joblib`. Este archivo puede ser cargado y utilizado para realizar predicciones en un entorno de producción.

### Código para Cargar y Utilizar el Modelo en Producción

A continuación se muestra un ejemplo de cómo cargar el modelo guardado y utilizarlo para realizar predicciones en nuevos datos.

In [None]:
import joblib
import pandas as pd

# Cargar el modelo guardado
model = joblib.load('random_forest_smote_model.pkl')

# Función para solicitar los datos del paciente
def get_patient_data():
    data = {}
    data['age'] = float(input("Ingrese la edad del paciente: "))
    data['hypertension'] = int(input("¿El paciente tiene hipertensión? (1 para Sí, 0 para No): "))
    data['heart_disease'] = int(input("¿El paciente tiene enfermedad cardíaca? (1 para Sí, 0 para No): "))
    data['avg_glucose_level'] = float(input("Ingrese el nivel promedio de glucosa del paciente: "))
    data['bmi'] = float(input("Ingrese el índice de masa corporal (BMI) del paciente: "))
    data['gender_Male'] = int(input("¿El paciente es masculino? (1 para Sí, 0 para No): "))
    data['ever_married_Yes'] = int(input("¿El paciente alguna vez se ha casado? (1 para Sí, 0 para No): "))
    data['work_type_Never_worked'] = int(input("¿El paciente nunca ha trabajado? (1 para Sí, 0 para No): "))
    data['work_type_Private'] = int(input("¿El paciente trabaja en el sector privado? (1 para Sí, 0 para No): "))
    data['work_type_Self-employed'] = int(input("¿El paciente es autónomo? (1 para Sí, 0 para No): "))
    data['work_type_children'] = int(input("¿El paciente es un niño? (1 para Sí, 0 para No): "))
    data['Residence_type_Urban'] = int(input("¿El paciente vive en una zona urbana? (1 para Sí, 0 para No): "))
    data['smoking_status_formerly smoked'] = int(input("¿El paciente fumaba anteriormente? (1 para Sí, 0 para No): "))
    data['smoking_status_never smoked'] = int(input("¿El paciente nunca ha fumado? (1 para Sí, 0 para No): "))
    data['smoking_status_smokes'] = int(input("¿El paciente fuma actualmente? (1 para Sí, 0 para No): "))
    
    return pd.DataFrame([data])

# Solicitar los datos del paciente
patient_data = get_patient_data()

# Realizar predicciones con el modelo cargado
prediction = model.predict(patient_data)

# Mostrar las predicciones
if prediction[0] == 1:
    print("El paciente tiene un riesgo de sufrir un accidente cerebrovascular.")
else:
    print("El paciente no tiene un riesgo significativo de sufrir un accidente cerebrovascular.")vvvvvvvvvvvvvvvv