In [1]:
pip install mlflow

Collecting mlflow
  Downloading mlflow-2.11.1-py3-none-any.whl (19.7 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m19.7/19.7 MB[0m [31m31.6 MB/s[0m eta [36m0:00:00[0m
Collecting gitpython<4,>=3.1.9 (from mlflow)
  Downloading GitPython-3.1.42-py3-none-any.whl (195 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m195.4/195.4 kB[0m [31m16.9 MB/s[0m eta [36m0:00:00[0m
Collecting packaging<24 (from mlflow)
  Downloading packaging-23.2-py3-none-any.whl (53 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m53.0/53.0 kB[0m [31m700.7 kB/s[0m eta [36m0:00:00[0m
Collecting alembic!=1.10.0,<2 (from mlflow)
  Downloading alembic-1.13.1-py3-none-any.whl (233 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m233.4/233.4 kB[0m [31m13.1 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting docker<8,>=4.0.0 (from mlflow)
  Downloading docker-7.0.0-py3-none-any.whl (147 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

 É preciso iniciar um experimento. Um experimento no MLflow é uma execução de treinamento específica, com seus próprios conjuntos de parâmetros e métricas. Isso é feito com o comando mlflow.start_run().

In [4]:
import mlflow
import mlflow.sklearn
from sklearn.datasets import load_iris
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

In [6]:
data = load_iris()
X, y = data.data, data.target
X_train, X_test, y_train, y_test = train_test_split(X,
                                                    y,
                                                    test_size = 0.2,
                                                    random_state = 42)

mlflow.start_run()

model = LogisticRegression(max_iter = 1000)
model.fit(X_train, y_train)

y_pred = model.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)

mlflow.log_param("max_iter", model.max_iter)
mlflow.log_metric("accuracy", accuracy)
mlflow.sklearn.log_model(model, "model")

mlflow.end_run()



Posteriormente, o treinamento do modelo pode ser realizado como de costume. No exemplo fornecido, uma regressão logística é treinada utilizando o conjunto de dados Iris. Durante o treinamento, é possível registrar parâmetros e métricas relevantes no MLflow. Por exemplo, os parâmetros do modelo podem ser registrados com mlflow.log_param() e as métricas de desempenho, como a acurácia, podem ser registradas com mlflow.log_metric().

Ao concluir o treinamento e registrar os parâmetros e métricas, é importante encerrar o experimento usando mlflow.end_run(). Isso assegura que o experimento seja finalizado adequadamente e os resultados sejam devidamente registrados.

Para visualizar os resultados do experimento, o servidor web do MLflow pode ser iniciado com o comando mlflow ui. Isso abrirá uma interface no navegador, permitindo a visualização dos experimentos, métricas, modelos e outras informações relevantes.

Adotando esses passos, os desenvolvedores podem efetivamente utilizar o MLflow para monitorar o treinamento de modelos de Machine Learning, mantendo um registro detalhado de parâmetros e métricas. Essa prática é essencial para o gerenciamento eficiente de experimentos no contexto de projetos de ML