In [2]:
import mlflow
import mlflow.spark
from pyspark.sql import SparkSession
from pyspark.ml.regression import LinearRegressionModel
from pyspark.ml.evaluation import RegressionEvaluator

# 1. Iniciar sesión de Spark
spark = SparkSession.builder.appName("Fase5_MLflow").getOrCreate()

# 2. CONECTAR CON MLFLOW (Esto es lo del 'local')
# El puerto 5000 es donde MLflow escucha en tu Docker
mlflow.set_tracking_uri("http://mlflow:5000")
mlflow.set_experiment("Proyecto_SECOP_II") # Crea una carpeta para tus pruebas

# 3. Cargar el modelo que guardamos en el Notebook 09
model_path = "/opt/spark-data/models/mejor_modelo_secop"
loaded_model = LinearRegressionModel.load(model_path)

# 4. Iniciar un "Run" (Una grabación del experimento)
with mlflow.start_run(run_name="Modelo_Final_Ridge"):
    # Registramos los parámetros que ya sabemos que son los mejores
    mlflow.log_param("regParam", 0.1)
    mlflow.log_param("elasticNetParam", 0.0)
    
    # Registramos la métrica final (el RMSE que sacaste de 33.40)
    mlflow.log_metric("rmse", 33.40)
    
    # Guardamos el modelo dentro de MLflow para que no se pierda
    mlflow.spark.log_model(loaded_model, "model")
    
    print(" ¡Experimento registrado en MLflow con éxito!")

 ¡Experimento registrado en MLflow con éxito!
