# Entrenar un modelo con mlflow

Cargar el dataset.

Aquí vamos a coger el dataset de prueba del iris que viene en scikitlearn

In [3]:
from sklearn.datasets import load_iris
X, y = load_iris(return_X_y=True)

Preparamos **mlflow**

In [7]:
import mlflow
import mlflow.sklearn
# Indicar dónde está el tracking server (si lo tuviéramos)
#mlflow.set_tracking_uri('http://localhost:8000')
# Crear un “experimento”
mlflow.set_experiment('iris_example')
# (si no existe, lo crea; y si ya existe, te “mete” en él)

Crear un modelo.

Vamos a utilizar unas SVM para clasificación (SVC en scikitlearn)

In [32]:
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score
from datetime import datetime
clf = SVC()

Entrenamos el modelo con ciertos parámetros

En el ejemplo vamos a probar a utilizar un kernel lineal (`kernel='linear'`) y un kernel gaussiano (`kernel='rbf'`)

In [43]:
# Parámetros de la ejecución
kernel = 'rbf'   # vamos a probar con 'linear' y 'rbf'
# Arrancar una "ejecución"
#mlflow.start_run()
run_name = 'iris_'+kernel+'_'+datetime.now().strftime('%F %T')
mlflow.start_run(run_name=run_name)  # el nombre es opcional
# Apuntamos los parámetros de la ejecución
mlflow.log_param('kernel', kernel)
# Entrenamos
clf.set_params(kernel=kernel)
clf.fit(X, y)
# Guardamos el modelo entrenado
mlflow.sklearn.log_model(clf, 'model')
# Calculamos el acierto
score = accuracy_score(y, clf.predict(X))
print(kernel, score)
# Guardamos el score obtenido
mlflow.log_metric('score', score)
# Terminamos la ejecución
mlflow.end_run()

rbf 0.9733333333333334


Podemos consultar las ejecuciones que hemos hecho

In [44]:
mlflow.search_runs()

Unnamed: 0,run_id,experiment_id,status,artifact_uri,start_time,end_time,metrics.score,params.kernel,tags.mlflow.user,tags.mlflow.source.name,tags.mlflow.runName,tags.mlflow.source.type
0,4258d5bb0c1644d48894d8a5ee7d3123,1,FINISHED,file:///C:/Users/snkre/afeedmebackend/mlruns/1...,2020-02-18 01:43:14.619000+00:00,2020-02-18 01:43:14.735000+00:00,0.973333,rbf,snkre,C:\Users\snkre\Anaconda3\lib\site-packages\ipy...,iris_rbf_2020-02-18 02:43:14,LOCAL
1,865efe68a75d44cebda2a954a25e9864,1,FINISHED,file:///C:/Users/snkre/afeedmebackend/mlruns/1...,2020-02-18 01:43:11.055000+00:00,2020-02-18 01:43:11.175000+00:00,0.993333,linear,snkre,C:\Users\snkre\Anaconda3\lib\site-packages\ipy...,iris_linear_2020-02-18 02:43:11,LOCAL


Podemos arrancar la UI de mlflow ejecutando en consola:
```
mlflow ui
```
La interfaz estará en http://localhost:5000