# Model Registry

## 목표
- Docker Compose 를 이용하여 실제 서비스 환경과 비슷한 형태로 MLflow 서버를 띄워봅니다.
- 서비스 상황을 가정하여 MLflow 의 구성 요소들을 이해합니다.

## 스펙 명세서
- Docker Compose 파일에 MLflow 의 운영 정보, 모델 결과 등을 저장할 물리적인 PostgreSQL DB 서버 스펙을 정의합니다.
    - POSTGRES_USER : mlflowuser
    - POSTGRES_PASSWORD : mlflowpassword
    - POSTGRES_DB : mlflowdatabase
- Docker Compose 파일에 학습된 모델을 저장할 물리적인 저장 공간인 MinIO 서버 스펙을 정의합니다.
    - MINIO_ROOT_USER : minio
    - MINO_ROOT_PASSWORD : miniostorage
    - Port forwarding :
        - api: 9000:9000
        - console: 9001:9001
- Docker Compose 파일에 모델과 모델의 결과들을 관리할 MLFlow 서버를 정의합니다.
    - 환경 변수를 이용하여 MLflow 서버에서 앞서 띄워둔 PostgreSQL DB 와 MinIO 두 가지 서버에 접근이 가능하도록 연결합니다.

    - Dockerfile
        - MLflow 에 관련된 패키지가 설치된 이미지를 생성하기 위한 Dockerfile 을 정의합니다.
        - MinIO 에 모델 저장을 위한 초기 버켓을 생성 하기 위해 MinIO Client 도 함께 설치되도록 합니다.
    - Docker Compose
        - MinIO 의 접속 정보를 AWS_ACCESS_KEY_ID , AWS_SECRET_ACCESS_KEY 환경 변수를 통해 적절하게 설정합니다.
        - MinIO Client 를 설치하고, MinIO 의 초기 버켓을 생성하도록 명령어를 작성합니다.
        - MLflow 서버를 띄우는 명령어를 작성합니다.
        - Port forwarding : 5001:5000
            - MLflow 에서는 기본값으로 5000 포트를 사용합니다.
            - 하지만 실습에서 MacOS 를 사용하는 경우 AirPlay 기능이 5000번 포트를 사용하기 때문에 중복을 피하기 위해 5001번 포트를 사용합니다.
            - 일반적인 경우 5000번 포트를 사용하면 됩니다.
    - 정의된 스펙에 따라 서비스들을 띄웁니다.
        - localhost:9001 에 접속하여 MinIO 로그인 페이지가 잘 동작하는지 확인합니다.
        - localhost:5001 에 접속하여 MLflow 페이지가 잘 동작하는지 확인합니다.

해당 파트의 전체 코드는 [mlops-for-mle/part3/](https://github.com/mlops-for-mle/mlops-for-mle/tree/main/part3) 에서 확인할 수 있습니다.

## 1. MLflow Backend Store
### 1.1 Backend Store
Backend Store 란 수치 데이터와 MLflow 서버의 정보들을 체계적으로 관리하기 위한 DB 입니다. Backend Store 에는 모델의 학습 결과인 accuracy, f1-score, 모델이 학습되면서 생기는 loss, 모델 자체의 정보인 hyperparmameters 등의 수치 데이터와 run_id, run_name, experiment_name 등의 MLflow 의 메타 데이터가 저장됩니다.

이번 파트에서는 Backend Store 로 사용하기 위해 01. Database 파트에서 사용되었던 PostgreSQL DB 를 새롭게 생성하겠습니다.

### 1.2 PostgreSQL DB Server
PostgreSQL DB 서버의 스펙을 Docker Compose 파일에 서비스 이름, 유저 이름, 비밀번호, DB 이름을 환경변수로 설정합니다.

In [3]:
%%writefile docker-compose.yaml
version: "3"

services:
  mlflow-backend-store:
    image: postgres:14.0
    container_name: mlflow-backend-store
    environment:
      POSTGRES_USER: mlflowuser
      POSTGRES_PASSWORD: mlflowpassword
      POSTGRES_DB: mlflowdatabase
    healthcheck:
      test: ["CMD", "pg_isready", "-q", "-U", "mlflowuser", "-d", "mlflowdatabase"]
      interval: 10s
      timeout: 5s
      retries: 5

Overwriting docker-compose.yaml


## 2. MLflow Artifact Store

### 2.1 Artifact Store
Artifact Store 란 MLflow 에서 학습된 모델을 저장하는 Model Registry 로써 이용하기 위한 스토리지 (storage) 서버입니다. Artifact Store 를 이용하면 기본적인 파일 시스템 보다 체계적으로 관리 할 수 있으며 외부에 있는 스토리지 서버도 사용 할 수 있다는 장점이 있습니다.

### 2.2 Why MinIO?
이번 파트에서는 Artifact Store 로 MinIO 서버를 사용하는데 그 이유는 다음과 같습니다.

MinIO 는 S3 를 대체할 수 있는 오픈 소스 고성능 개체 스토리지입니다.
AWS S3 의 API 와도 호환되어 SDK 도 동일하게 사용 할 수 있습니다.
MLflow 에서는 AWS S3 를 모델을 저장하기 위한 스토리지로 사용하도록 권장하고 있기 때문에 MinIO 를 사용합니다.
실습에서 AWS credential 을 통해 MinIO 대신 AWS S3 를 사용해도 같은 결과를 얻을 수 있습니다.

### 2.3 MinIO Server
MinIO의 스펙을 Compose 파일에 서비스 이름, 유저 이름, 비밀번호를 환경변수로 정의하고 호스트와 연결되는 포트 또한 정의합니다.

In [None]:
version: "3"

services:
  mlflow-artifact-store:
    image: minio/minio:RELEASE.2024-01-18T22-51-28Z
    container_name: mlflow-artifact-store
    ports:
      - 9000:9000
      - 9001:9001
    environment:
      MINIO_ROOT_USER: minio
      MINIO_ROOT_PASSWORD: miniostorage
    command: server /data/minio --console-address :9001
    healthcheck:
      test: ["CMD", "mc", "ready", "local"]
      interval: 5s
      timeout: 5s
      retries: 5

## 3. MLflow Server
앞서 만든 Backend Store 와 Artifact Store 에 접근 가능한 MLflow 서버를 생성합니다.

### 3.1 Dockerfile
MLflow 서버에 필요한 패키지가 설치된 이미지를 build 할 Dockerfile 을 작성합니다.
서버를 띄울 때, MinIO 에 초기 bucket 을 생성하기 위해 MinIO Client 도 함께 설치합니다.

In [2]:
%%writefile Dockerfile
FROM amd64/python:3.9-slim

RUN apt-get update && apt-get install -y \

    git \
    wget \
    && rm -rf /var/lib/apt/lists/*

RUN pip install -U pip &&\

    pip install mlflow psycopg2-binary boto3

RUN cd /tmp && \

    wget https://dl.min.io/client/mc/release/linux-amd64/mc && \
    chmod +x mc && \
    mv mc /usr/bin/mc

Overwriting Dockerfile


## 4. Docker Compose 를 이용하여 서비스 띄우기
완성된 Dockerfile 과 Compose 파일은 아래와 같습니다.

### 4.1 Dockerfile

In [4]:
%%writefile Dockerfile
FROM amd64/python:3.9-slim

RUN apt-get update && apt-get install -y \

    git \
    wget \
    && rm -rf /var/lib/apt/lists/*

RUN pip install -U pip &&\

    pip install boto3==1.26.8 mlflow==1.30.0 psycopg2-binary

RUN cd /tmp && \

    wget https://dl.min.io/client/mc/release/linux-amd64/mc && \
    chmod +x mc && \
    mv mc /usr/bin/mc

Overwriting Dockerfile


### 4.2 Docker Compose

In [5]:
%%writefile docker-compose.yaml
version: "3"

services:
  mlflow-backend-store:
    image: postgres:14.0
    container_name: mlflow-backend-store
    environment:
      POSTGRES_USER: mlflowuser
      POSTGRES_PASSWORD: mlflowpassword
      POSTGRES_DB: mlflowdatabase
    healthcheck:
      test: ["CMD", "pg_isready", "-q", "-U", "mlflowuser", "-d", "mlflowdatabase"]
      interval: 10s
      timeout: 5s
      retries: 5

  mlflow-artifact-store:
    image: minio/minio:RELEASE.2024-01-18T22-51-28Z
    container_name: mlflow-artifact-store
    ports:
      - 9000:9000
      - 9001:9001
    environment:
      MINIO_ROOT_USER: minio
      MINIO_ROOT_PASSWORD: miniostorage
    command: server /data/minio --console-address :9001
    healthcheck:
      test: ["CMD", "mc", "ready", "local"]
      interval: 5s
      timeout: 5s
      retries: 5

  mlflow-server:
    build:
      context: .
      dockerfile: Dockerfile
    container_name: mlflow-server
    depends_on:
      mlflow-backend-store:
        condition: service_healthy
      mlflow-artifact-store:
        condition: service_healthy
    ports:
      - 5001:5000
    environment:
      AWS_ACCESS_KEY_ID: minio
      AWS_SECRET_ACCESS_KEY: miniostorage
      MLFLOW_S3_ENDPOINT_URL: http://mlflow-artifact-store:9000
    command:
      - /bin/sh
      - -c
      - |
        mc config host add mlflowminio http://mlflow-artifact-store:9000 minio miniostorage &&
        mc mb --ignore-existing mlflowminio/mlflow
        mlflow server \
        --backend-store-uri postgresql://mlflowuser:mlflowpassword@mlflow-backend-store/mlflowdatabase \
        --default-artifact-root s3://mlflow/ \
        --host 0.0.0.0

Overwriting docker-compose.yaml


# Save Model to Registry

## 목표
- 모델을 학습하고 MLflow 서버에 저장합니다.
- MLflow 의 모델 저장 구조를 이해합니다.

## 스펙 명세서
- `02. Model Development` 파트에서 사용한 코드를 이용하여 모델을 학습합니다.
- 학습이 끝난 모델을 MLflow 의 built-in method 를 사용해 MLflow 서버에 저장합니다.
    - Python의 mlflow 패키지를 이용합니다.
        - pip install mlflow
    - mlflow 패키지를 이용하여 모델을 1) MLflow Setup 챕터에서 띄운 MLflow 서버에 저장합니다.
    - mlflow 패키지를 이용하여 모델을 저장하는 방법은 두 가지가 있습니다.
        - Artifact 처럼 다루기 [MLFLow log_artifact]
        - built-in method 사용하기
            - MLFlow built-in Model Flavors
            - MLFLow pyfunc log_model
    - 이번 챕터에서는 sklearn 모델을 저장하기 위해 mlflow.sklean built-in method 를 사용합니다.
- 저장된 모델을 작동 중인 MLflow 서버에서 확인합니다.
    - 모델이 어떻게 저장되어 있는지 확인합니다. [MLFlow Storage Format]

해당 파트의 전체 코드는 mlops-for-mle/part3/ 에서 확인할 수 있습니다.

## 0. 패키지 설치
아래 명령어를 통해 관련 패키지를 설치합니다.

# terminal-command

    pip install boto3==1.26.8 mlflow==1.30.0 scikit-learn

## 1. 모델 저장하기
### 1.1 기존 코드 확인 & 환경 변수 설정
#### 1.1.1 db_train.py

In [6]:
%%writefile db_train.py
import joblib
import pandas as pd
import psycopg2
from sklearn.metrics import accuracy_score
from sklearn.model_selection import train_test_split
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler
from sklearn.svm import SVC

# 1. get data
db_connect = psycopg2.connect(
    user="myuser",
    password="mypassword",
    host="localhost",
    port=5432,
    database="mydatabase",
)
df = pd.read_sql("SELECT * FROM iris_data ORDER BY id DESC LIMIT 100", db_connect)
X = df.drop(["id", "timestamp", "target"], axis="columns")
y = df["target"]
X_train, X_valid, y_train, y_valid = train_test_split(X, y, train_size=0.8, random_state=2022)

# 2. model development and train
model_pipeline = Pipeline([("scaler", StandardScaler()), ("svc", SVC())])
model_pipeline.fit(X_train, y_train)

train_pred = model_pipeline.predict(X_train)
valid_pred = model_pipeline.predict(X_valid)

train_acc = accuracy_score(y_true=y_train, y_pred=train_pred)
valid_acc = accuracy_score(y_true=y_valid, y_pred=valid_pred)

print("Train Accuracy :", train_acc)
print("Valid Accuracy :", valid_acc)

# 3. save model
joblib.dump(model_pipeline, "db_pipeline.joblib")

# 4. save data
df.to_csv("data.csv", index=False)

Writing db_train.py


### 1.1.2 환경 변수 추가
MLflow 와 통신하기 위해서는 몇 가지 환경 변수가 설정되어야 합니다.

[그림 3-6]을 보면 유저가 학습한 모델을 MLflow 서버를 통해 Artifact Store 인 MinIO 에 저장합니다. 이 과정에서 MinIO 의 접근 권한이 필요하게 됩니다. 이 접근 권한 정보는 1) MLflow Setup 챕터의 Docker Compose 파일에서 설정한 mlflow-server , mlflow-artifact-store 의 정보와 같습니다. 접근에 사용할 아이디와 비밀번호는 사전에 정의된 시스템 환경 변수에 설정해야 MinIO 에 접근할 수 있습니다. 같은 방식으로 서비스가 띄워져있는 MLflow 서버와 S3 (MinIO) 의 URI 도 함께 설정합니다.



In [None]:
import os

os.environ["MLFLOW_S3_ENDPOINT_URL"] = "http://localhost:9000"
os.environ["MLFLOW_TRACKING_URI"] = "http://localhost:5001"
os.environ["AWS_ACCESS_KEY_ID"] = "minio"
os.environ["AWS_SECRET_ACCESS_KEY"] = "miniostorage"

## 1.2 모델 저장하기


MLflow 는 정보를 저장하기 위해 experiment 와 run 을 사용합니다.

- MLflow 에 정보를 저장하는 경우 Default 라는 이름의 experiment 에 저장됩니다.
- run : experiment 에 저장되는 모델 실험 결과 입니다. 해당 run 에 실제 정보들이 저장되게 되며, experiment/run 의 구조로 저장됩니다.

MLflow 는 정보 저장에 관련된 스크립트를 실행 할 때 명시된 experiment 에 run 을 동적으로 생성합니다. 이 때, 각각의 run 은 unique 한 해쉬값인 run_id 를 부여받게 되며 이를 이용하여 저장된 후에도 해당 정보에 접근할 수 있습니다.
     
앞서 설명한대로 정보를 저장 할 가장 큰 카테고리인 experiment 의 이름을 지정하지 않는 경우 기본 값으로 Default 라는 이름의 experiment 에 run 이 생성됩니다. 실습에서는 new-exp 라는 이름을 가진 새로운 experiment 를 생성하고, 생성된 new-exp 에 run 을 생성하는 방식으로 진행합니다.
     
02. Model Development 파트의 모델과 모델의 결과 metric 인 정확도를 저장해보겠습니다.
     
mlflow 클래스를 이용하여 다음과 같이 작성합니다.

1. 모델의 이름을 설정할 수 있는 외부 변수를 설정합니다. MLflow 에서는 모델을 저장할 때 이름을 설정하여 관리하게 됩니다. 이번 챕터에서는 기본값으로 sk_model 을 사용하겠습니다.

2. experiment 를 설정합니다. mlflow.set_experiment 함수는 experiment 가 존재하지 않는 경우 새로 생성되며, 존재하는 경우 해당 experiment 를 사용합니다.
3. 추후 잘못된 정보들이 들어올 경우 에러를 발생시키기 위해, 모델에 입력값 정보들을 설정합니다.
4. run 을 생성하고 정보를 저장합니다.

## 2. 전체 코드 완성 및 모델 확인
추가 작성한 코드를 전체 코드에 적용하여 완성합니다.

### 2.1 save_model_to_registry.py

In [7]:
%%writefile save_model_to_registry.py
# save_model_to_registry.py
import os
from argparse import ArgumentParser

import mlflow
import pandas as pd
import psycopg2
from sklearn.metrics import accuracy_score
from sklearn.model_selection import train_test_split
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler
from sklearn.svm import SVC

# 0. set mlflow environments
os.environ["MLFLOW_S3_ENDPOINT_URL"] = "http://localhost:9000"
os.environ["MLFLOW_TRACKING_URI"] = "http://localhost:5001"
os.environ["AWS_ACCESS_KEY_ID"] = "minio"
os.environ["AWS_SECRET_ACCESS_KEY"] = "miniostorage"

# 1. get data
db_connect = psycopg2.connect(
    user="myuser",
    password="mypassword",
    host="localhost",
    port=5432,
    database="mydatabase",
)
df = pd.read_sql("SELECT * FROM iris_data ORDER BY id DESC LIMIT 100", db_connect)

X = df.drop(["id", "timestamp", "target"], axis="columns")
y = df["target"]
X_train, X_valid, y_train, y_valid = train_test_split(X, y, train_size=0.8, random_state=2022)

# 2. model development and train
model_pipeline = Pipeline([("scaler", StandardScaler()), ("svc", SVC())])
model_pipeline.fit(X_train, y_train)

train_pred = model_pipeline.predict(X_train)
valid_pred = model_pipeline.predict(X_valid)

train_acc = accuracy_score(y_true=y_train, y_pred=train_pred)
valid_acc = accuracy_score(y_true=y_valid, y_pred=valid_pred)

print("Train Accuracy :", train_acc)
print("Valid Accuracy :", valid_acc)

# 3. save model
parser = ArgumentParser()
parser.add_argument("--model-name", dest="model_name", type=str, default="sk_model")
args = parser.parse_args()

mlflow.set_experiment("new-exp")

signature = mlflow.models.signature.infer_signature(model_input=X_train, model_output=train_pred)
input_sample = X_train.iloc[:10]

with mlflow.start_run():
    mlflow.log_metrics({"train_acc": train_acc, "valid_acc": valid_acc})
    mlflow.sklearn.log_model(
        sk_model=model_pipeline,
        artifact_path=args.model_name,
        signature=signature,
        input_example=input_sample,
    )

# 4. save data
df.to_csv("data.csv", index=False)

Writing save_model_to_registry.py


# Load Model from Registry

## 목표
- MLflow 에 저장된 모델을 불러올 수 있는 스크립트를 작성합니다.
- 불러온 모델을 통해 추론하고 결과를 확인합니다.

## 스펙 명세서
- 학습이 끝난 모델을 MLflow built-in method 를 사용하여 MLflow 서버에서 불러옵니다.
    - `2) Save Model to Registry` 챕터에서 설치한 mlflow 패키지를 사용합니다.
    - 학습에 관련된 정보가 저장 되어있는 run 의 run_id 를 사용하여 모델을 불러옵니다.
    - mlflow 패키지를 이용하여 모델을 불러오는 방법은 두 가지가 있습니다.
        - 1. MLFlow built-in Model Flavors
        - 2. MLFLow pyfunc load_model
    - 이번 챕터에서는 sklearn 의 모델을 불러오기 위해 mlflow.sklean.load_model 을 사용합니다.

- 불러온 모델을 이용하여 2) Save Model to Registry 챕터에서 저장해두었던 학습 데이터의 결과를 추론합니다.

## 1. 모델 불러오기
2) Save Model to Registry 챕터에서 작성한 코드로 학습된 모델을 서버로부터 불러오는 코드를 작성합니다.

### 1.1 환경 변수 설정
2) Save Model to Registry 챕터와 같이 MLflow 서버에 접근하기 위한 환경 변수를 설정합니다.



In [9]:
import os

os.environ["MLFLOW_S3_ENDPOINT_URL"] = "http://localhost:9000"
os.environ["MLFLOW_TRACKING_URI"] = "http://localhost:5001"
os.environ["AWS_ACCESS_KEY_ID"] = "minio"
os.environ["AWS_SECRET_ACCESS_KEY"] = "miniostorage"

### 1.2 모델 불러오기

#### 1.2.1 sklearn 모델 불러오기
2) Save Model to Registry 챕터에서 저장했던 모델을 불러오기 위해, mlflow.sklearn.load_model 함수를 사용하여 저장된 모델을 불러옵니다. 모델을 포함하고 있는 run_id 와 모델을 저장할 때 설정했던 모델 이름을 받을 수 있도록 외부 변수를 설정합니다.

In [10]:
parser = ArgumentParser()
parser.add_argument("--run-id", dest="run_id", type=str)
parser.add_argument("--model-name", dest="model_name", type=str, default="sk_model")
args = parser.parse_args()

NameError: name 'ArgumentParser' is not defined

### 1.3 추론 코드 작성하기

## 2. 전체 코드 완성

### 2.1 load_model_from_registry.py

In [11]:
%%writefile load_model_from_registry.py
# load_model_from_registry.py
import os
from argparse import ArgumentParser

import mlflow
import pandas as pd
from sklearn.metrics import accuracy_score
from sklearn.model_selection import train_test_split

# 0. set mlflow environments
os.environ["MLFLOW_S3_ENDPOINT_URL"] = "http://localhost:9000"
os.environ["MLFLOW_TRACKING_URI"] = "http://localhost:5001"
os.environ["AWS_ACCESS_KEY_ID"] = "minio"
os.environ["AWS_SECRET_ACCESS_KEY"] = "miniostorage"

# 1. load model from mlflow
parser = ArgumentParser()
parser.add_argument("--model-name", dest="model_name", type=str, default="sk_model")
parser.add_argument("--run-id", dest="run_id", type=str)
args = parser.parse_args()

model_pipeline = mlflow.sklearn.load_model(f"runs:/{args.run_id}/{args.model_name}")

# 2. get data
df = pd.read_csv("data.csv")

X = df.drop(["id", "timestamp", "target"], axis="columns")
y = df["target"]
X_train, X_valid, y_train, y_valid = train_test_split(X, y, train_size=0.8, random_state=2022)

# 3. predict results
train_pred = model_pipeline.predict(X_train)
valid_pred = model_pipeline.predict(X_valid)

train_acc = accuracy_score(y_true=y_train, y_pred=train_pred)
valid_acc = accuracy_score(y_true=y_valid, y_pred=valid_pred)

print("Train Accuracy :", train_acc)
print("Valid Accuracy :", valid_acc)

Writing load_model_from_registry.py


In [None]:
RUN_ID = 'a840406cd56d415db2a9f6db40321cb6'