# Vamos utilizar o mlflow para ler um modelo registado

Neste notebook iremos utilizar o modelo que registamos no notebook anterior para fazer previsões.

Referências:
* [Model Registry API](https://www.mlflow.org/docs/latest/model-registry.html#fetching-an-mlflow-model-from-the-model-registry)
    * [Ir buscar um modelo ao Model Registry](https://www.mlflow.org/docs/latest/model-registry.html#fetching-an-mlflow-model-from-the-model-registry)
* [mlflow python model interface](https://www.mlflow.org/docs/latest/python_api/mlflow.pyfunc.html#module-mlflow.pyfunc)
    * [mlflow.pyfunc.load_model()](https://www.mlflow.org/docs/latest/python_api/mlflow.pyfunc.html#mlflow.pyfunc.load_model)

In [1]:
import mlflow
import pandas as pd

In [2]:
pip install mlflow

Note: you may need to restart the kernel to use updated packages.


In [3]:
# Temos que especificar onde estão os nossos modelos registrados
# Como vimos no notebook anterior eles vão estar guardados numa db
mlflow.set_tracking_uri("sqlite:///../../mlruns/mlflow.db")

In [4]:
# Fazer load da versão 1 do modelo "random_forest" que registamos no notebook anterior
model_name = "random_forest"
model_version = 1

model = mlflow.pyfunc.load_model(
    model_uri=f"models:/{model_name}/{model_version}"
)

## Vamos utilizar o modelo lido para fazer previsões

Referências:
* [Inference API](https://www.mlflow.org/docs/latest/python_api/mlflow.pyfunc.html#inference-api)
    * [predict](https://www.mlflow.org/docs/latest/python_api/mlflow.pyfunc.html#mlflow.pyfunc.PyFuncModel.predict)

In [5]:
# Ler os dados
data_path = '../../data/diabetes_test.csv'
df = pd.read_csv(data_path)

Vamos usar uma linha do nosso dataset como input ao nosso modelo, apenas para testar que de facto ele consegue devolver previsões

In [6]:
# vamos usar uma linha aleatória do nosso dataframe apenas para ter um exemplo de input
df.sample(1)

Unnamed: 0,Pregnancies,Glucose,BloodPressure,SkinThickness,Insulin,BMI,DiabetesPedigreeFunction,Age,Outcome
111,11,143,94,33,146,36.6,0.254,51,1


In [7]:
# retiramos o target (Outcome) dos dados, para termos o input que o nosso modelo está à espera 
input_data = df.loc[df.Outcome == 1].sample(1).drop("Outcome", axis=1)

In [8]:
model.predict(data=input_data)

  if not hasattr(array, "sparse") and array.dtypes.apply(is_sparse).any():


array([1], dtype=int64)

In [9]:
# retiramos o target (Outcome) dos dados, para termos o input que o nosso modelo está à espera 
input_data = df.loc[df.Outcome == 0].sample(1).drop("Outcome", axis=1)

In [10]:
# chamamos o predict do modelo e vemos que temos a sua previsão
model.predict(data=input_data)

  if not hasattr(array, "sparse") and array.dtypes.apply(is_sparse).any():


array([1], dtype=int64)

In [11]:
# retiramos o target (Outcome) dos dados, para termos o input que o nosso modelo está à espera 
input_data = df.loc[df.Outcome == 0].sample(1).drop("Outcome", axis=1)

In [12]:
# chamamos o predict do modelo e vemos que temos a sua previsão
model.predict(data=input_data)

  if not hasattr(array, "sparse") and array.dtypes.apply(is_sparse).any():


array([1], dtype=int64)