# ✋ **Z punktów do gestów – rozpoznawanie dłoni w akcji!**
Cześć! Miło nam powitać Was na naszym workshopie dotyczącym wizji komputerowej, a konkretnie - klasyfikacji gestów. W tym notatniku postaramy się zaimplementować rozwiązanie, które pozwoli w czasie rzeczywistym odgadywać gest pokazywany przez Ciebie do kamery. Jeśli cokolwiek będzie niejasne, nie wahaj się pytać :)

## **0. Zapoznanie z MediaPipe**
Czas wykryć pierwsze punkty kluczowe! Uruchom plik `data_collection.py`, a rozpocznie się zczytywanie obrazu z Twojej kamery. Możesz włączyć lub wyłączyć dodatkowe wyświetlanie punktów wciskając 'k', a wyjść przy użyciu 'q'.

## **1. Dane**
Aby rozwiązać nasz problem wykorzystując nadzorowane uczenie maszynowe, naturalnie będziemy potrzebowali zbioru oetykietowanych danych. W tym celu zebraliśmy kilkadziesiąt klatek, na których pokazujemy 5 różnych gestów:
- **palm up** ✋
- **fist** 👊
- **peace** ✌
- **thumbs up** 👍
- **ok sign** 👌<br/>

Aby uzyskać do nich dostęp, wczytaj i wyświetl zawartość plików `data_train.csv` oraz `data_test.csv`:

In [4]:
import os
import pandas as pd

if not os.path.exists('models'):
    os.mkdir('models')

url_train = "data_train.csv"
url_test = "data_test.csv"

# Załaduj dane treningowe i testowe do dwóch DataFrame'ów

**Odpowiedz na pytanie**: ile przykładów występuje w każdym ze zbiorów dla poszczególnych gestów?

In [5]:
# Czy na pewno wszystkie kolumny będą nam potrzebne?
# Rozdziel oba DataFrame'y na część danych (X) oraz etykiet (y).

**Uwaga**: Kolejną komórkę możesz na razie pominąć. Wrócimy do niej później ;)

In [None]:
# Miejsce na implementację odpowiednich przekształceń (transformów)
def transform1(X):
    landmarks = X.reshape(-1, 21, 3).copy()
    # ???
    return landmarks.reshape(-1, 63)

def transform2(X):
    landmarks = X.reshape(-1, 21, 3)
    # ???
    return landmarks.reshape(-1, 21)

## **2. Model**

Mając przygotowane dane do naszego zadania, możemy przystąpić do trenowania modelu dokonującego klasyfikacji gestów.

Biorąc pod uwagę punkty charaktetystyczne z pojedynczej klatki podczas inferencji, mamy do czynienia z danymi de facto tabelarycznymi, zatem rozsądnym wyborem modelu może być KNN, SVM, Random Forest (bądź inne modele drzewkowe) lub sieć neuronowa MLP.

W poniższej komórce znajdują się importy i wstępne ustawienia potrzebne do użycia każdego z wymienionych modeli.

### Zadanie

Wytrenuj każdy z powyższych modeli i zapisz je do osobnych plików pickle, by móc wykorzystać je później w inferencji przy użyciu skryptu Pythonowego. Zwróć uwagę na różnice w dokładności między modelami oraz wpływ różnych wartości hiperparametrów na wyniki.

In [6]:
import numpy as np
from sklearn.metrics import classification_report, accuracy_score
from sklearn.neighbors import KNeighborsClassifier
from sklearn.svm import SVC
from sklearn.ensemble import RandomForestClassifier
import keras
import pickle
import os

### **2.1 K-NearestNeighbors**
Na początek spróbujemy zaklasyfikować gesty używając klasyfikatora KNN. Dla klasycznych algorytmów uczenia maszynowego wykorzystamy pakiet `scikit-learn`. Oto dokumentacja: https://scikit-learn.org/stable/modules/generated/sklearn.neighbors.KNeighborsClassifier.html <br />

Jakie hiperparametry możemy modyfikować? Poeksperymentuj z różnymi wartościami podczas treningu.

In [None]:
knn = KNeighborsClassifier()
# Miejsce na wytrenowanie modelu i wyświetlenie wyników

In [None]:
knn_path = f'models/knn_model.pkl'
# Miejsce na zapisanie modelu

### **2.2 Support Vector Machine**
Teraz czas na SVM. Oto dokumentacja: https://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.html <br />

Jakie hiperparametry możemy modyfikować? Poeksperymentuj z różnymi wartościami podczas treningu.

In [None]:
svc = SVC()
# Miejsce na wytrenowanie modelu  i wyświetlenie wyników

In [None]:
svc_path = f'models/svc_model.pkl'
# Miejsce na zapisanie modelu

### **2.3 Random Forest**
Teraz wykorzystamy Random Forest. Oto dokumentacja: https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html <br />

Jakie hiperparametry możemy modyfikować? Poeksperymentuj z różnymi wartościami podczas treningu.

In [None]:
rfc = RandomForestClassifier()
# Miejsce na wytrenowanie modelu i wyświetlenie wyników

In [None]:
rfc_path = f'models/rfc_model.pkl'
# Miejsce na zapisanie modelu

### **2.4 Sieć neuronowa**
Czas na sieć neuronową! Tu mamy okazję wykazać się nieco większą kreatywnością. Oto dokumentacja: https://keras.io/guides/sequential_model/ <br />

Ile warstw ukrytych powinna mieć sieć? Po ile neuronów powinno się w nich znaleźć? Przez ile epok powinna się uczyć? Poeksperymentuj z różnymi wartościami podczas treningu. Jako metrykę przyjmij `accuracy`.

In [None]:
nn = keras.models.Sequential()
# Miejsce na wytrenowanie modelu i wyświetlenie wyników

In [None]:
nn.save('models/nn_model')

## **3. Inferencja**
Czas przetestować modele w akcji! Uruchom plik `inference.py` w terminalu przy użyciu komendy `py inference.py` lub ulubionym edytorze kodu. Uwaga! Uruchomi się Twoja kamera. Możesz wyłączyć proces wciskając klawisz `q`. Przełączaj się między modelami przy użyciu klawiszy `a` i `d`.