# MLflow

*** MLflow Documentation 첫 설명은 다음과 같음 ***

- MLflow는 엔드 투 엔드 머신 러닝 라이프사이클을 관리하기 위한 오픈 소스 플랫폼
1. 파라미터와 결과를 기록하고 비교하기 위한 실험 추적
2. 다른 데이터 과학자와 공유하거나 프로덕션으로 이전하기 위해 재사용 가능하고 재현 가능한 형태로 ML 코드 패키징
3. 다양한 ML 라이브러리에서 다양한 모델 서비스 및 추론 플랫폼으로 모델 관리 및 배포
4. 모델 버전 관리, 단계 전환 및 주석을 포함하여 MLFlow 모델의 전체 라이프사이클을 공동으로 관리할 수 있는 중앙 모델 저장소 제공
5. MLFlow는 라이브러리에 구애받지 않습니다. REST API와 CLI를 통해 모든 기능에 액세스할 수 있으므로 모든 기계 학습 라이브러리와 프로그래밍 언어에서 사용할 수 있음. 편의를 위해 이 프로젝트에는 파이썬 API, R API, 자바 API도 포함되어 있음

# MLflow 설치

In [None]:
# Install MLflow
pip install mlflow

# Install MLflow with the experimental MLflow Pipelines component
pip install mlflow[pipelines]

# Install MLflow with extra ML libraries and 3rd-party tools
pip install mlflow[extras]

# Install a lightweight version of MLflow
pip install mlflow-skinny

## 성공 결과

![image.png](attachment:image.png)

# Git Quick Start 다운로드

1. git clone https://github.com/mlflow/mlflow
2. cd examples

## 성공 결과

![image.png](attachment:image.png)

# Using the Tracking API

- examples/quickstart/mlflow_tracking.py 동일

In [None]:
import os
from random import random, randint
from mlflow import log_metric, log_param, log_artifacts

if __name__ == "__main__":
    # Log a parameter (key-value pair)
    log_param("param1", randint(0, 100))

    # Log a metric; metrics can be updated throughout the run
    log_metric("foo", random())
    log_metric("foo", random() + 1)
    log_metric("foo", random() + 2)

    # Log an artifact (output file)
    if not os.path.exists("outputs"):
        os.makedirs("outputs")
    with open("outputs/test.txt", "w") as f:
        f.write("hello world!")
    log_artifacts("outputs")

## 성공 결과

![image.png](attachment:image.png)

# Viewing the Tracking UI


- http://localhost:5000. 확인 가능

In [None]:
mlflow ui

## 성공 결과

![image.png](attachment:image.png)

![image.png](attachment:image.png)

# Running MLflow Projects

- MLflow를 사용하면 코드와 해당 종속성을 다른 데이터에 대해 재현 가능한 방식으로 실행할 수 있는 프로젝트로 패키징할 수 있음
- 각 프로젝트에는 코드와 종속성(예: Python 환경)을 정의하는 ML 프로젝트 파일뿐만 아니라 프로젝트에 실행할 수 있는 명령어와 인수도 포함
- 로컬 디렉터리 또는 GitHub URI에서 프로젝트를 실행하는 mlflow run 명령을 사용하여 기존 프로젝트를 쉽게 실행할 수 있음

In [None]:
mlflow run sklearn_elasticnet_wine -P alpha=0.5

mlflow run https://github.com/mlflow/mlflow-example.git -P alpha=5.0

## 성공 결과

![image.png](attachment:image.png)

![image.png](attachment:image.png)

![image.png](attachment:image.png)

# Saving and Serving Models

In [None]:
python sklearn_logistic_regression/train.py

mlflow models serve -m runs:/<RUN_ID>/model

# By default the server runs on port 5000. If that port is already in use, use the –port option to specify a different port. For example: 
mlflow models serve -m runs:/<RUN_ID>/model --port 1234

# docs 코드 치면 에러
curl -d '{"columns":["x"], "data":[[1], [-1]]}' -H 'Content-Type: application/json; format=pandas-split' -X POST localhost:1234/invocations
    
# 수정 
curl -d "{\"columns\":[0],\"index\":[0,1],\"data\":[[1],[-1]]}" -H "Content-Type: application/json"  localhost:1234/invocations

## 성공 결과

![image.png](attachment:image.png)

![image.png](attachment:image.png)

![image.png](attachment:image.png)

# 레퍼런스

- 구글 검색어
1. Formats: ['pandas-records', 'pandas-split'].

- 블로그
1. https://stackoverflow.com/questions/67445132/having-problem-pass-data-with-curl-into-established-mlflow-models