# Entrenar un modelo con mlflow

Cargar el dataset.

Aquí vamos a coger el dataset de prueba del iris que viene en scikitlearn

In [1]:
from sklearn.datasets import load_iris
X, y = load_iris(return_X_y=True)

Preparamos **mlflow**

In [2]:
import mlflow
import mlflow.sklearn
# Indicar dónde está el tracking server (si lo tuviéramos)
#mlflow.set_tracking_uri('http://localhost:8000')
# Crear un “experimento”
mlflow.set_experiment('iris_example')
# (si no existe, lo crea; y si ya existe, te “mete” en él)

INFO: 'iris_example' does not exist. Creating a new experiment


Crear un modelo.

Vamos a utilizar unas SVM para clasificación (SVC en scikitlearn)

In [4]:
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score
from datetime import datetime
clf = SVC()

Entrenamos el modelo con ciertos parámetros

En el ejemplo vamos a probar a utilizar un kernel lineal (`kernel='linear'`) y un kernel gaussiano (`kernel='rbf'`)

In [7]:
# Parámetros de la ejecución
kernel = 'linear'   # vamos a probar con 'linear' y 'rbf'

# Arrancar una "ejecución"
#mlflow.start_run()
timestamp = datetime.now().strftime('%F %T')
run_name = f"iris_{kernel}_{timestamp}"
mlflow.start_run(run_name=run_name)  # el nombre es opcional

# Apuntamos los parámetros de la ejecución
mlflow.log_param('kernel', kernel)

# Entrenamos
clf.set_params(kernel=kernel)
clf.fit(X, y)

# Guardamos el modelo entrenado
mlflow.sklearn.log_model(clf, 'model')

# Calculamos el acierto
score = accuracy_score(y, clf.predict(X))
print(kernel, score)

# Guardamos el score obtenido
mlflow.log_metric('score', score)

# Terminamos la ejecución
mlflow.end_run()

linear 0.9933333333333333


  and should_run_async(code)


Podemos consultar las ejecuciones que hemos hecho

In [8]:
mlflow.search_runs()

  and should_run_async(code)


Unnamed: 0,run_id,experiment_id,status,artifact_uri,start_time,end_time,metrics.score,params.kernel,tags.mlflow.source.name,tags.mlflow.user,tags.mlflow.runName,tags.mlflow.log-model.history,tags.mlflow.source.type
0,f973a41ce2564d5689b96b6124e3ccb5,1,FINISHED,file:///home/sergio/taller-datahack-mlflow/mlr...,2020-09-15 19:28:57.723000+00:00,2020-09-15 19:28:57.782000+00:00,0.993333,linear,/home/sergio/miniconda3/envs/taller/lib/python...,sergio,iris_linear_2020-09-15 21:28:57,"[{""run_id"": ""f973a41ce2564d5689b96b6124e3ccb5""...",LOCAL
1,9aa6964ebfe6431095d42c2739c9dff0,1,FINISHED,file:///home/sergio/taller-datahack-mlflow/mlr...,2020-09-15 19:28:36.150000+00:00,2020-09-15 19:28:36.213000+00:00,0.993333,linear,/home/sergio/miniconda3/envs/taller/lib/python...,sergio,iris_linear_2020-09-15 21:28:36,"[{""run_id"": ""9aa6964ebfe6431095d42c2739c9dff0""...",LOCAL
2,756e99db261d43ec8b05f8bad2359940,1,FINISHED,file:///home/sergio/taller-datahack-mlflow/mlr...,2020-09-15 19:28:23.592000+00:00,2020-09-15 19:28:23.637000+00:00,0.973333,rbf,/home/sergio/miniconda3/envs/taller/lib/python...,sergio,iris_rbf_2020-09-15 21:28:23,"[{""run_id"": ""756e99db261d43ec8b05f8bad2359940""...",LOCAL


Podemos arrancar la UI de mlflow ejecutando en consola:
```
mlflow ui
```
La interfaz estará en http://localhost:5000