# MIPY test - ukázka

Vytvořte čtyři funkce: `sse`, `lin_model`, `kombinace`, `odhad`

1. Funkce `sse` bude počítat sumu čtverců rozdílu (SSE = Sum of Squares Error) mezi prvky dvou kolekcí `x`, `y` délky `n` podle následujícího vzorce:

    $$
    \sum_{i=1}^n (x_i-y_i)^2
    $$

    Tedy `sse(x = [1, 1, 0, 5], y = [2, 3, 1, 6])` navrátí hodnotu `7`.

    Tuto funkci implementujte pomocí _list comprehension_.
2. Funkce `lin_model` vyčíslí přímku danou parametry `c`, `beta` pro každé číslo v kolekci `x`, tj.

    $$
    c + \beta \cdot x_i,\ \textrm{pro }i=1,\ldots n,
    $$

   Tedy `lin_model(c=2, beta=-1.2, x=[1, 0, 4, 5, 10])` navrátí kolekci `[0.8, 2.0, -2.8, -4.0, -10.0]`

3. Funkce `kombinace` sestaví všechny kombinace konstant $c$ a parametrů $\beta$ ze zadaných kolekcí. Na vstupu bude pouze kolekce konstant `constants` a kolekce parametrů $\beta$ `betas`, výstupem bude list listů všech kombinací.

    Tedy `kombinace(constants=[1,2,3], betas=[2,5,7])` navrátí `[[1, 2], [1, 5], [1, 7], [2, 2], [2, 5], [2, 7], [3, 2], [3, 5], [3, 7]]`

4. Funkce `odhad` pro zadané kolekce `x` a `y` otestuje všechny kombinace parametrů $\beta$ a konstant $c$, které sestaví funkce `kombinace`, a navrátí takovou kombinaci `[c, beta]`, která lineárním modelem `lin_model` na kolekci na datech v `x` nejlépe zreprodukuje data v `y`, měřeno funkcí `sse` (tj. hodnota `sse(y_lin_model, y)` bude nejmenší). Funkce tedy přijímá čtyři argumenty: `constants`, `betas`, `x`, `y`.

    Kromě toho funkce `odhad` ověří, že vstupní kolekce dat `x` a `y` jsou stejné délky a v opačném případě vyvolá vhodnou výjimku.

    Funkce `odhad` v bodech:
    - Zkontroluje vstupní data.
    - Sestaví všechny kombinace bet a konstant pomocí funkce `kombinace`.
    - Vloží do funkce `lin_model` každou kombinaci bet a konstant vždy při stejné kolekci `x` a tím získá `y_lin_model`.
    - Výsledek získaný z funkce `lin_model` vloží do funkce `sse` spolu s kolekcí y: `sse(y_lin_model, y)`.
    - Tiskne průběžně do konzole zpracovávanou kombinaci parametrů a hodnotu SSE. Výstup bude formátovaný do třech bloků, z nichž každý blok bude mít 20 znaků + jeden znak pro ohraničení. V každém bloku bude vlevo popisek a vpravo hodnota zaokrouhlená vždy na 2 desetinná místa.
    - Pro zjednodušení neřešte situace, kdy vícero kombinací bude mít stejnou hodnotu `sse`.
    - Výstup z funkce `odhad` formátujte jako slovník, v němž budou výstupní parametry a hodnota sse pod příslušnými názvy - viz. ukázkový výstup.

Ukázka výstupu z konzole, pro možný vstup `odhad(c = [0,1], beta = [1,2,3], x = [1,1,2,3], y = [1,2,1,12])`:

```       
| c:            0.00 | beta:         1.00 | sse:         83.00 |
| c:            0.00 | beta:         2.00 | sse:         46.00 |
| c:            0.00 | beta:         3.00 | sse:         39.00 |
| c:            1.00 | beta:         1.00 | sse:         69.00 |
| c:            1.00 | beta:         2.00 | sse:         46.00 |
| c:            1.00 | beta:         3.00 | sse:         53.00 |
{'c': 0, 'beta': 3, 'sse': 39}
```

## 1

In [19]:
def sse(x_list : list, y_list: list) -> float:
    if len(x_list) != len(y_list):
        return 0
    return sum([ (x-y)**2 for x, y in zip(x_list, y_list)])

In [20]:
sse([1, 1, 0, 5], [2, 3, 1, 6])

7

## 2

In [23]:
def lin_model(c: float, beta: float, x: list) -> list:
    output = []
    for item in x:
        output.append(c + beta * item)
    return output

In [24]:
lin_model(c=2, beta=-1.2, x=[1, 0, 4, 5, 10])

[0.8, 2.0, -2.8, -4.0, -10.0]

## 3

In [25]:
def kombinace(constants: list, betas: list) -> list:
    output = []
    for const in constants:
        for beta in betas:
            output.append( (const, beta) )

    return output

In [26]:
kombinace(constants=[1,2,3], betas=[2,5,7])

[(1, 2), (1, 5), (1, 7), (2, 2), (2, 5), (2, 7), (3, 2), (3, 5), (3, 7)]

## 4

In [42]:
def odhad(c: list, beta: list, x: list, y: list) -> dict:
    if len(x) != len(y):
        raise ValueError

    combos = kombinace(c, beta)
    lowest_sse = float('inf') 
    output = {}
    
    for combo in combos:
        y_lin_model = lin_model(combo[0], combo[1], x)
        error = sse(y_lin_model, y)
        if error < lowest_sse:
            lowest_sse = error
            output = {
                'c': combo[0],
                'beta': combo[1],
                'sse': error
            }
        print( f"| c:{combo[0]: >{20}.2f} | beta:{combo[1]: >{20}.2f} | sse:{error: >{20}.2f} |" )

    return output

In [43]:
odhad(c = [0,1], beta = [1,2,3], x = [1,1,2,3], y = [1,2,1,12])

| c:                0.00 | beta:                1.00 | sse:               83.00 |
| c:                0.00 | beta:                2.00 | sse:               46.00 |
| c:                0.00 | beta:                3.00 | sse:               39.00 |
| c:                1.00 | beta:                1.00 | sse:               69.00 |
| c:                1.00 | beta:                2.00 | sse:               46.00 |
| c:                1.00 | beta:                3.00 | sse:               53.00 |


{'c': 0, 'beta': 3, 'sse': 39}