# Algoritmy Machine Learning
- využijeme připravené algoritmy knihovny `scikit-learn`
- cílem je
  - ukázat si použití jednotlivých algoritmů
  - ověřit si vliv přípravy vstupních a tréninkových dat


## Import knihoven a konstanty

In [None]:
import os
import pandas
import matplotlib.pyplot as plt

In [None]:
__file__ = __vsc_ipynb_file__  
SCRIPT_FOLDER = os.path.dirname(__file__)
PROJECT_FOLDER = os.path.dirname(SCRIPT_FOLDER)
kskore_FOLDER = os.path.join(PROJECT_FOLDER,'data')
WORK_FOLDER = os.path.join(kskore_FOLDER,'work')

PRQT = os.path.join(WORK_FOLDER,'roboti.prqt')

COL_ROBOT = 'robot'
COL_TIME = 'cas_robota'
COL_DAY = 'day'
COL_SENZOR = 'senzor'
COL_ZPRAVA = 'zprava'

COLS_KOSTKY = ['kostka1','kostka2','kostka3','kostka4','kostka5','kostka6']

def kostky_score(row):
    '''
    vypočítá skóre hodu 6 kostkami a vrátí výsledek
    Výpočet má následující pravidla:
    1. hodnotí se jen postupky začínající jedničkou /ostatní čísla nehrají roli/
    2. body za postupky jsou následující:
    | Postupka     | Body |
    |--------------|------|
    | 1-2          |  20  |
    | 1-2-3        |  30  |
    | 1-2-3-4      |  50  |
    | 1-2-3-4-5    |  90  |
    | 1-2-3-4-5-6  |  200  |
    
    Parameters
    ----------
    throw: neuspořádaný seznam hodnot kostek 
    
    Returns
    -------
    numeric
    
    '''
    throw = (row['kostka1'],row['kostka2'],row['kostka3'],row['kostka4'],row['kostka5'],row['kostka6'])
    score = 0
    ########## prostor pro splnění úkolu #########

    if len(throw) == 6 and 1 in throw and 2 in throw:
        score = 20
        if 3 in throw:
            score = 30
            if 4 in throw:
                score = 50
                if 5 in throw:
                    score = 90
                    if 6 in throw:
                        score = 200

    ##############################################
    return score



## Sada algoritmu `scikit-learn`

In [None]:
from sklearn.neighbors import KNeighborsClassifier,KNeighborsRegressor
from sklearn.ensemble import RandomForestClassifier,ExtraTreesClassifier,ExtraTreesRegressor,RandomForestRegressor
from sklearn.tree import DecisionTreeClassifier,ExtraTreeClassifier,DecisionTreeRegressor
from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import StandardScaler, OneHotEncoder,LabelEncoder
from sklearn.model_selection import train_test_split,TimeSeriesSplit
from sklearn.linear_model import LinearRegression,Ridge,Lasso
from sklearn.isotonic import IsotonicRegression
from sklearn.feature_extraction.text import CountVectorizer

from skforecast.recursive import ForecasterRecursive
from skforecast.direct import ForecasterDirect

CLASSIFIERS_MCMO = {    # Support multiclass-multioutput
	'DecisionTreeClassifier': DecisionTreeClassifier(),
	'ExtraTreeClassifier': ExtraTreeClassifier(),
	'ExtraTreesClassifier': ExtraTreesClassifier(),
	'KNeighborsClassifier': KNeighborsClassifier(3),
	#'RadiusNeighborsClassifier': RadiusNeighborsClassifier(),
	'RandomForestClassifier': RandomForestClassifier(max_depth=5, n_estimators=10, max_features=6, random_state=42)
}

REGRESSORS = {
    'LinearRegression': LinearRegression(),
    #'IsotonicRegression': IsotonicRegression(out_of_bounds="clip"),
    'Ridge': Ridge(),
    'KNeighborsRegressor': KNeighborsRegressor(n_neighbors=4,weights = 'uniform'),
    'DecisionTreeRegressor': DecisionTreeRegressor(max_depth=10),
    'ExtraTreesRegressor': ExtraTreesRegressor(max_depth=10),
	'RandomForestRegressor': RandomForestRegressor(max_depth=5, n_estimators=10, max_features=6, random_state=42)
}


## Získání zdrojových dat
### Přečtení dat robotů

### Extrakce dat vlastního robota

## Využití klasifikátorů
Algoritmy "s učitelem", které slouží k třídění a klasifikaci dat ...

Každý algoritmus musíme nejdříve "naučit":
1. potředujeme datovou sadu se známými výsledky
2. rozdělíme data na tréninkovou a ověřovací část
3. naučíme algoritmus na tréninkové části
4. otestujeme ho na ověřovací části a zjistíme si úspěšnost učení
5. pokud je přesnost dostatečná, můžeme algoritmus použít na data s neznámým výsledkem

### Funkce, kterou budeme používat k trénování a testování algoritmů

### Hrajeme kostky
naučíme "systém" počítat skóre postupek na datech našeho robota  
=> spočítáme skore postupek "naší" známou funkcí

=> otestujeme algoritmy

Dosažená úspěšnost není uspokojivá pokusíme se tedy upravit vstupní data do podoby vhodnější pro klasifikaci.   

### Upravíme zdrojová data použitím `Vectorizer`u
a opět je rozdělíme na tréninkovou a testovací sadu

[`CountVectorizer`](https://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.text.CountVectorizer.html) vytvoří mapu s počtem výskytů 'tokenu' v řetězci

### Použítí naučených algoritmů

## Práce s textem

### 1. Příprava výsledků

### 2. Příprava dat
[`CountVectorizer`](https://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.text.CountVectorizer.html) vytvoří mapu s počtem výskytů 'tokenu' v řetězci

### 3. Trénování algoritmů

### Použití na všech robotech

### 1. Příprava výsledků

### 2. Příprava dat
[`CountVectorizer`](https://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.text.CountVectorizer.html) vytvoří mapu s počtem výskytů 'tokenu' v řetězci

### 3. Použití algoritmů

## Regresní algoritmy
Algoritmy, které se snaží modelovat průběh/závislosti hodnot

### Příprava dat a učení algoritmů

### Použití na celou datovou sadu

### Rozdělení na samostatné grafy
#### 1. připravíme pracovní plochu

#### 2. vygenerujeme grafy

## Predikce budoucnosti
použijeme `cenu robota`

### 1. Rozdělíme data na tréninková a testovací

### 2. Připravíme si předpovídátko

### 3. Předpovíme budoucí hodnoty