## Обзор MLflow: Теория и основные аспекты

### Введение
MLflow — это платформа с открытым исходным кодом, предназначенная для управления жизненным циклом машинного обучения. Она помогает разработчикам и исследователям автоматизировать и отслеживать все стадии разработки моделей машинного обучения: от экспериментов до деплоя. В этой статье мы рассмотрим основные компоненты MLflow и покажем мини-примеры использования.


### Основные компоненты MLflow

MLflow состоит из четырех основных компонентов:

1. **MLflow Tracking**: позволяет вести журнал экспериментов, параметров, метрик и артефактов.
2. **MLflow Projects**: упрощает воспроизводимость проектов с использованием стандартных форматов.
3. **MLflow Models**: стандартизирует формат хранения моделей, что облегчает их деплой.
4. **MLflow Registry**: управляет жизненным циклом моделей, включая версионирование и деплой.


#### 1. MLflow Tracking
Это API для фиксации параметров, метрик и прочих артефактов при запуске экспериментов по машинному обучению, а также пользовательский интерфейс для визуализации полученных результатов. MLflow Tracking позволяет сохранять результаты экспериментов и запрашивать их с помощью API Python, REST, R API и Java API.

Основная концепция MLflow Tracking run - единичная итерация эксперимента. Также в MLflow присутствует понятие Experiment, который позволяет логически сгруппировать несколько запусков (run). 
- Параметры: значения входных данных.
- Метрики: результаты и показатели качества модели.
- Артефакты: файлы, создаваемые в ходе экспериментов (например, обученные модели).
- Журналы: текстовые файлы с логами выполнения.


In [None]:
import mlflow

# Начало нового эксперимента
with mlflow.start_run():
	# Логирование параметров
	mlflow.log_param("alpha", 0.5)
	mlflow.log_param("l1_ratio", 0.1)

	# Логирование метрик
	mlflow.log_metric("rmse", 0.78)

	# Логирование артефактов
	mlflow.log_artifact("model.pkl")


#### 2. MLflow Projects
MLflow Projects помогает стандартизировать и управлять проектами машинного обучения. Основные компоненты:
- `MLproject` файл: описание проекта.
- Среды выполнения: Docker, Conda.


In [None]:
name: MyProject
conda_env: conda.yaml
entry_points:
  main:
	parameters:
  	alpha: {type: float, default: 0.5}
  	l1_ratio: {type: float, default: 0.1}
	command: "python train.py --alpha {alpha} --l1_ratio {l1_ratio}"


#### 3. MLflow Models
MLflow Models стандартизирует формат хранения моделей, что упрощает их деплой и интеграцию с различными инструментами.

In [None]:
import mlflow.sklearn
from sklearn.ensemble import RandomForestClassifier

# Обучение модели
model = RandomForestClassifier()
model.fit(X_train, y_train)

# Сохранение модели
mlflow.sklearn.log_model(model, "random_forest_model")

#### 4. MLflow Registry
MLflow Registry управляет версиями моделей и упрощает их деплой. Он включает в себя:
- Регистрирование моделей.
- Верификацию и одобрение моделей.
- Деплой моделей.


In [None]:
from mlflow.tracking import MlflowClient

client = MlflowClient()
client.create_registered_model("MyModel")

# Регистрирование версии модели
client.create_model_version(
	name="MyModel",
	source="path/to/model",
	run_id="some_run_id"
)


### Важные аспекты использования MLflow

1. **Отслеживание экспериментов**: Обязательно логируйте все параметры, метрики и артефакты, чтобы иметь возможность воспроизвести результаты.
2. **Стандартизация проектов**: Используйте `MLproject` для описания вашего проекта, что облегчит совместную работу и воспроизводимость.
3. **Управление моделями**: Регистрируйте версии моделей, чтобы отслеживать их изменения и деплой.
4. **Интеграция с CI/CD**: Интегрируйте MLflow с вашими пайплайнами CI/CD для автоматизации деплоя моделей.


### Полезная литература и ресурсы

Для более глубокого изучения MLflow и эффективного использования его возможностей, рекомендуем ознакомиться с следующими материалами:

1. **Официальная документация MLflow**:
   - https://mlflow.org/docs/latest/index.html

2. **Учебные курсы и руководства**:
    - https://www.coursera.org/learn/mlops-mlflow-huggingface-duke&ved=2ahUKEwjwm63Y0qiHAxUwppUCHYdJCBIQFnoECBkQAQ&usg=AOvVaw2nyCGO_azbYNj7j9N6Y9Bu

3. **Статьи и блоги**:
   - https://habr.com/ru/companies/croc/articles/507314/
   - https://habr.com/ru/companies/X5Tech/articles/593263/
   - https://habr.com/ru/companies/digdes/articles/673324/
4. **Видео**:
   - https://youtu.be/-dJPoLm_gtE?si=FY44wEK2usgw5CFB
   - https://www.youtube.com/playlist?list=PLQqR_3C2fhUUkoXAcomOxcvfPwRn90U-g