In [None]:
# Paso 1: Importar las bibliotecas necesarias
import autosklearn.classification  # Para problemas de clasificación
import autosklearn.regression      # Para problemas de regresión
import sklearn.model_selection
import sklearn.datasets

# Paso 2: Cargar los datos de entrenamiento
# Reemplaza 'X_train' y 'y_train' con tus propios datos
X_train, y_train = sklearn.datasets.load_breast_cancer(return_X_y=True)

# Paso 3: Dividir el conjunto de datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = sklearn.model_selection.train_test_split(X_train, y_train, random_state=1)

# Paso 4: Configurar AutoSklearn
# Puedes ajustar los hiperparámetros según tus necesidades
automl = autosklearn.classification.AutoSklearnClassifier(
    time_left_for_this_task=3600,  # Tiempo máximo en segundos
    per_run_time_limit=300,        # Tiempo máximo por modelo en segundos
    ensemble_size=50,             # Tamaño del conjunto de modelos
    ensemble_nbest=10,            # Número de modelos para el conjunto
    seed=1,                        # Semilla para reproducibilidad
)

# Paso 5: Entrenar el modelo AutoSklearn
automl.fit(X_train, y_train)

# Paso 6: Evaluar el modelo en el conjunto de prueba
y_pred = automl.predict(X_test)
accuracy = sklearn.metrics.accuracy_score(y_test, y_pred)

print(f"Puntuación de precisión: {accuracy}")

# Paso 7: Obtener el mejor modelo entrenado
best_model = automl.get_models_with_weights()[0][1]

# Paso 8: Guardar el mejor modelo en un archivo
import joblib
joblib.dump(best_model, 'best_model.pkl')

# Paso 9: Cargar el mejor modelo entrenado desde un archivo
loaded_model = joblib.load('best_model.pkl')

# Ahora puedes usar 'loaded_model' para hacer predicciones en nuevos datos

# Paso 10: Obtener información sobre el rendimiento de AutoSklearn
print(automl.sprint_statistics())

# Paso 11: Obtener el mejor modelo entrenado en formato de cadena
print(best_model)

# Paso 12: Visualizar la importancia de las características (solo para problemas de clasificación)
import matplotlib.pyplot as plt
autosklearn.plot.importance(automl, X_train, title="Importancia de características")
plt.show()
