# Scenariusz alpha testów aplikacji [MLOps](https://github.com/mlops-ai/mlops)

**Witaj użytkowniku!** Na wstępie serdecznie dziękujemy za chęć udziału w alpha testach, a co za tym idzie wsparciu naszej aplikacji. <br><br>
W poniższych komórkach znajdziesz polecenia, które należy wykonać. Po każdym poleceniu jest pusta komórka na (jeśli jest taka potrzeba) kod po stronie biblioteki oraz kolejna komórka na komentarz odnośnie tego jak oceniasz łatwość wykonania polecenia, ewentualne uwagi oraz wskazówki. :) 

## 0. Setup środowiska

### 0.1 Instalacja aplikacji oraz bilbioteki

Aby uruchomić aplikację lokalnie, pobierz nasze repepozytorium z [GitHuba](https://github.com/mlops-ai/mlops), a następnie w celu instalacji postępuj zgodnie z krokami wymienionymi w sekcji [Installation & usage](https://github.com/mlops-ai/mlops#installation--usage).

### <font color='red'>UWAGA! </font> 
Upewnij się, że włącznie z biblioteką zainstalowały Ci się wersje bibliotek `scikit-learn==1.3.0` oraz `torch==2.1.1`. Jest to kluczowe w kontekście monitorowanych modeli, aby zachować te same wersje między biliboteką, a serwerem aplikacji.

In [1]:
# pip install mlops-ai

In [2]:
# pip show mlops-ai

### 0.2 Dokumentacja

Szczegółową dokumentacje biblioteki aplikacji możesz znaleźć [**tutaj**](https://mlops-ai.github.io/mlops/library_docs/library_overview.html). Jeśli jednak tak jak my, nie jesteś fanem czytania szczegółowej dokumentacji, przygotowaliśmy także przykładowe notebooki prezentujące kluczowe funkcjonalności aplikacji, które możesz znaleźć wewnątrz folderu `library/tests/notebooks`

## 1. Moduł tworzenia

### 1.1 Tworzenie projektu po stronie biblioteki

Utwórz pusty projekt wykorzystując odpowiednie funkcje po stronie biblioteki

**Komentarz**: 

### 1.2 Usuwanie oraz tworzenie projektu po stronie aplikacji webowej

Usuń wcześniej utworzony projekt po stronie aplikacji webowej oraz utwórz analogiczny projekt tym razem z aplikacji webowej.

**Komentarz:**

### 1.3 Tworzenie eksperymentu

Po stronie biblioteki utwórzy przykładowy eksperyment o nazwie *Initial modeling*.

**Komentarz:**

### 1.4 Ustawienie projektu oraz eksperymentu jako aktywne

Ustaw uprzednio utworzony projekt oraz eksperyment jako aktywny projekt/aktywny eksperyment. <br> Dzięki temu, za każdym razem kiedy będziesz tworzył iteracje nie będziesz musiał się do nich odwoływać.

**Hint:** `set_active_project()`, `set_active_experiment()`

**Komentarz:**

### 1.5 Utworzenie datasetu

Będziesz pracował na dobrze znanym zbiorze danych [Iris dataset]('https://raw.githubusercontent.com/TripathiAshutosh/dataset/main/iris.csv'). Utwórz dataset po stronie bilbioteki, podaj parametry takie jak link, tagi czy wersja. Alternatywnie, możesz go również stworzyć po stronie aplikacji webowej i zaciągnąć do biblioteki za pomocą odpowiedniej funkcji.

**Komentarz:**

### 1.5 Utworzenie pierwszej iteracji

Przygotuj dane treningowe do utworzenia pierwszej iteracji (pomocny może się okazać poniższy kod).
```python
import pandas as pd 
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder

url = 'https://raw.githubusercontent.com/TripathiAshutosh/dataset/main/iris.csv'
df = pd.read_csv(filepath_or_buffer=url, sep=',')
y = LabelEncoder().fit_transform(df['class'])
X = df.drop(columns=['class'])
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.5, stratify = y, random_state=42)
```

Następnie, wytrenuj model [LogisticRegression](http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) z biblioteki scikit-learn. Zaloguj swoją pierwszą iteracje, logując informacje takie jak: 
- nazwa iteracji
- parametry 
- metryki na zbiorze testowym (accuracy, precision, recall, f1)
- odnośnik do datasetu

**Komentarz:**

### 1.6 Iteracje modeli KNN

Utwórz nowy eksperyment o nazwie *KNN models*. Wytrenuj 3-4 modele [KNN](http://scikit-learn.org/stable/modules/generated/sklearn.neighbors.KNeighborsClassifier.html) każdy z nieco różnymi parametrami. Porównaj wyniki iteracji/eksperymentów zaznaczając je i klikając przycisk compare po stronie aplikacji webowej.

Dodatkowo, najlepszy z modeli zapisz lokalnie z wykorzystaniem biblioteki pickle oraz podczas logowania iteracji zaloguj jego ścieżkę (**ważne aby była to ścieżka absolutna, nie względna**).

**Komentarz:**

### 1.7 Logowanie wykresu Pythonowego

Utwórz osobny eksperyment o nazwie *Image charts*.
Następnie, utwórz dwa dowolne wykresy wykorzystując bibliotekę seaborn lub matplotlib (może być to np. wykres dot. zależności między cechami / predykcji). Następnie zapisz wykresy na dysku do formatu .png / .jpg i zaloguj je podczas dowolnej iteracji z wykorzysteniem, któregoś z wcześniej utworzonych modeli.

**Komentarz:**

### 1.8 Logowanie interaktywnych wykresów z danych (quite hard one, sorry://)

Wytrenuj prostą sieć neuronową z wykorzystaniem bilbioteki [tensorflow](https://keras.io/) lub [pyTorch](https://pytorch.org/). Następnie zaloguj jak zmieniał się błąd modelu podczas końca każdej z epok na zbiorze treningowym / walidacyjnym. Dodaj 2-3 iteracje dla trenowanych sieci z różnymi hiperparametrami (tak żeby wyniki metryk na zbiorze testowym się różniły). **Podczas logowania iteracji zaloguj informacje o wcześniej zalogowanych błędach z epok z wykorzystaniem funkcji `log_chart`**.

Po pomyślnym dodaniu iteracji, wyświetl wykresy na stronie webowej oraz porównaj iteracje między sobą za pomocą opcji compare.

**Hint:**
```python
iteration.log_chart(
        chart_name=..., chart_type=...,
        x_data=...,
        y_data=...,
        y_data_names=...,
        x_label=..., y_label=..., 
        chart_title=...,
        comparable=True)
```

**Hint 2:**
W razie dalszych problemów odsyłam do notebooka `library/tests/notebooks/mlops-ai-library-showcase.ipynb`, sekcja **Creating iterations with Interactive Charts**.

**Komentarz:**

## 2. Moduł monitorowania

### 2.1 Dodanie monitorowanego modelu

Wybierz dowolną iteracje z modeli utworzonych z bilblioteki scikit-learn na zbiorze danych Iris, który ma poprawną ścieżkę do pickla na dysku. Następnie, wystaw iteracje na monitorowany model. (wszystko po stronie aplikacji webowej)

**Komentarz:**

### 2.2 Predykcje dla monitorowanego modelu

Wyślij predykcje na wystawiony monitorowany model (np. cały DataFrame X_test ze zbioru Iris) lub pojedyncze, samemu utworzone wiersze.

**Komentarz:**

### 2.3 Niepoprawne predykcje dla monitorowanego modelu

**(Ćwiczenie kreatywne)** Postaraj się popsuć predykcje dla monitorowanego modelu wysyłając zapytania o predykcje w niepoprawnym formacie, z niepoprawnymi typami danych etc. Zbadaj czy biblioteka zwraca poprawne komunikaty dot. błędów.

**Komentarz:**

### (Opcjonalnie) 2.4 Dodanie monitorowanego modelu spoza biliboteki scikit-learn

Jeśli poprawnie wykonałeś zadanie 1.8, możesz wystawić jedną z wytrenowanych tam sieci neuronowych. Chodzi o to żeby model był spoza API scikit-learnowego i nie miał atrybutu `.predict()`. Następnie, skorzystaj z przykładowego wrappera, który znajduje się wew. `server/app/models/monitored_model_wrapper.py`, nadpisz go swoim kodem oraz zapisz pickla z tej klasy jako ścieżka do modelu iteracji. Dzięki temu wrapperowi twój customowy model będzie miał atrybut `.predict()` będzie mógł być poprawnie wystawiony do monitorowania.

**Komentarz:**

## 3. Alerty mailowe

### (Opcjonalnie) 3.1 Załóż konto na platformie [Mailgun](https://www.mailgun.com/).

W celu poprawnego skonfigurowania modułu dot. wysyłania altertów mailowych założ konto na platformie [Mailgun](https://www.mailgun.com/) w celu poprawnego skonfigurowania API keya oraz nazwy domeny (patrz `library/tests/notebooks/06-email-alerts.ipynb`). Jeśli jednak nie chcesz tworzyć swojego konta, skontaktuj się z nami i podaj nam swój adres e-mail, a my podamy Ci nasz klucz API i nazwę domeny. :)

**Komentarz:**

### 3.2 Alert e-mail w przypadku dodania (nie)prawidłowej iteracji.

Dodaj dowolną iteracje (możesz wykorzystać jakąś z utworzonych wcześniej), tym razem jednak ustaw opcję dot. wysyłania e-maili na `True`. Dodaj dwa typy iteracji, jedną prawidłową i drugą nieprawidłową, tak aby otrzymać oba komunikaty błędów.

**Komentarz:**

### 3.3 Alert e-mail w przypadku (nie)poprawnych predykcji monitorowanego modelu.

Podobnie jak wyżej, tym razem jednak alerty mailowe dot. wysyłania predykcji na monitorowany model. Dla poprawnej oraz niepoprawnej predykcji, tak aby otrzymać oba komunikaty błędów.

**Komentarz:**