## [MLflow](https://pypi.org/project/mlflow/)

1. MLflow `Tracking` (เหมือนเป็นการเก็บ log)
    - Record metrics and parameters from training runs  
    - Query data from exprtiments
    - Store models, artifacts and code
2. MLflow `Models`
    - Standardize models for deployment
    - Build customized models 
3. Model `Registry`
    - Store and version ML models
    - Load and deploy ML models
4. MLflow `Projects`
    - Package ML code for reproducibility (ความสามารถในการทำซ้ำทั้งหมด , re + product)
    - Package ML code for repeatability  (ความสามารถในการวัดผลซ้ำๆด้วยเงื่อนไขเดิมเพื่อหา variation)

In [5]:
import mlflow
# Create new Experiment
mlflow.create_experiment("My Experiment")
# Tag new experiment
mlflow.set_experiment_tag("scikit-learn", "lr")
# Set the experiment
mlflow.set_experiment("My Experiment") # ต้องชื่อเดียวกับที่ Create 

<Experiment: artifact_location='file:///d:/Learn/MLflow/mlruns/461920538239138280', creation_time=1696515714439, experiment_id='461920538239138280', last_update_time=1696515714439, lifecycle_stage='active', name='My Experiment', tags={}>

In [10]:
# Start a run
mlflow.start_run() # ถ้า start แล้วครั้งหนึ่งก็ไม่ต้องรันซ้ำ เว้นแต่จะ end_run()

<ActiveRun: >

In [58]:
# End a run
mlflow.end_run() # ก่อนจะ end ก็ต้อง start ก่อน

#### Setting a training run variable

In [27]:
import mlflow
# Set the experiment
mlflow.set_experiment("My Experiment") 
# Start a run
run = mlflow.start_run() 
# Print run.info
print(run.info)

## ถ้าขึ้น error อาจจะเป็นเพราะยังไม่ได้ end_run() ให้กลับไปรันโค้ดดังกล่าวก่อนหน้านี้ก่อน
## ถ้าไปตามดูในคอมเราตามตำแหน่งที่เราเก็บไฟล์ไว้จะเห็นว่ามีการสร้าง folder ตามชื่อตัวแปร experiment_id ขึ้นมาใหม่ ซึ่งภายในนั้นจะมีข้อมูลต่างๆเก็บไว้อยู่
## ถ้าอยากรู้ว่าสร้างเพิ่มจริงไหมลอง end_run() แล้วกด start_run() ใหม่เรือยๆดูจะเห็นว่ามี folder เพิ่มขึ้นจริงๆ

<RunInfo: artifact_uri='file:///d:/Learn/MLflow/mlruns/461920538239138280/45e8a097218549e9af87bba6a324b9e4/artifacts', end_time=None, experiment_id='461920538239138280', lifecycle_stage='active', run_id='45e8a097218549e9af87bba6a324b9e4', run_name='selective-fly-822', run_uuid='45e8a097218549e9af87bba6a324b9e4', start_time=1696518208777, status='RUNNING', user_id='aspir'>


#### Logging to MLflow Tracking
1. Metrics
    - log_metric("accuracy", 0.90)
    - log_metrics({"accuracy":0.90, "loss":0.50})
2. Parameters
    - log_param("n_jobs",1)
    - log_params({"n_jobs":1, "fit_intercept":False})
3. Artifacts
    - log_artifact("file.py")
    - log_artifacts("./directory/")

https://mlflow.org/docs/latest/tracking.html#automatic-logging เดียวมาลองหลายๆโมเดล

In [62]:
import mlflow
from sklearn.datasets import load_iris
from sklearn.linear_model import LogisticRegression # https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html
import os

# Set the experiment
mlflow.set_experiment("My Experiment") 

# Start a run
try: run = mlflow.start_run() 
except:
    mlflow.end_run()
    mlflow.start_run()


##################### Model  #######################
# Import data
X, y = load_iris(return_X_y=True)

#  training
lr = LogisticRegression(n_jobs=1)

# Model evaluation 
lr.fit(X,y)
score = lr.score(X,y)

####################################################

# Log a metric 
mlflow.log_metric("score", score)

# Log a parameter
mlflow.log_param("n_jobs",1)

# Log an artifact
path = 'D:\Learn\MLflow\log_artifacts'
if not os.path.exists(path):
    os.makedirs(path)
with open(os.path.join(path, 'test.txt'), "w") as f:
    f.write("hello world!")
mlflow.log_artifacts(path)

# End a run
mlflow.end_run()

STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(


#### View MLflow runs and experiments
`$ mlflow ui`

จากการรันคำสั่งดังกล่าวจะทำให้เราสามารถกด [http://localhost:5000](http://localhost:5000) ซึ่งจะแสดงหน้าเว็ปของ MLflow ที่ทำให้เราสามารถจัดการหลายๆได้ง่ายขึ้น <br>
ส่วนทำอะไรได้บ้างแนะนำให้ไปอ่านในเอกสารของ Library   -> [MLflow Quick Start](https://mlflow.org/docs/latest/quickstart.html)