# MIPY test - ukázka

Vytvořte čtyři funkce: `sse`, `lin_model`, `kombinace`, `odhad`

1. Funkce `sse` bude počítat sumu čtverců rozdílu (SSE = Sum of Squares Error) mezi prvky dvou kolekcí `x`, `y` délky `n` podle následujícího vzorce:

    $$
    \sum_{i=1}^n (x_i-y_i)^2
    $$

    Tedy `sse(x = [1, 1, 0, 5], y = [2, 3, 1, 6])` navrátí hodnotu `7`.

    Tuto funkci implementujte pomocí _list comprehension_.
2. Funkce `lin_model` vyčíslí přímku danou parametry `c`, `beta` pro každé číslo v kolekci `x`, tj.

    $$
    c + \beta \cdot x_i,\ \textrm{pro }i=1,\ldots n,
    $$

   Tedy `lin_model(c=2, beta=-1.2, x=[1, 0, 4, 5, 10])` navrátí kolekci `[0.8, 2.0, -2.8, -4.0, -10.0]`

3. Funkce `kombinace` sestaví všechny kombinace konstant $c$ a parametrů $\beta$ ze zadaných kolekcí. Na vstupu bude pouze kolekce konstant `constants` a kolekce parametrů $\beta$ `betas`, výstupem bude list listů všech kombinací.

    Tedy `kombinace(constants=[1,2,3], betas=[2,5,7])` navrátí `[[1, 2], [1, 5], [1, 7], [2, 2], [2, 5], [2, 7], [3, 2], [3, 5], [3, 7]]`

4. Funkce `odhad` pro zadané kolekce `x` a `y` otestuje všechny kombinace parametrů $\beta$ a konstant $c$, které sestaví funkce `kombinace`, a navrátí takovou kombinaci `[c, beta]`, která lineárním modelem `lin_model` na kolekci na datech v `x` nejlépe zreprodukuje data v `y`, měřeno funkcí `sse` (tj. hodnota `sse(y_lin_model, y)` bude nejmenší). Funkce tedy přijímá čtyři argumenty: `constants`, `betas`, `x`, `y`.

    Kromě toho funkce `odhad` ověří, že vstupní kolekce dat `x` a `y` jsou stejné délky a v opačném případě vyvolá vhodnou výjimku.

    Funkce `odhad` v bodech:
    - Zkontroluje vstupní data.
    - Sestaví všechny kombinace bet a konstant pomocí funkce `kombinace`.
    - Vloží do funkce `lin_model` každou kombinaci bet a konstant vždy při stejné kolekci `x` a tím získá `y_lin_model`.
    - Výsledek získaný z funkce `lin_model` vloží do funkce `sse` spolu s kolekcí y: `sse(y_lin_model, y)`.
    - Tiskne průběžně do konzole zpracovávanou kombinaci parametrů a hodnotu SSE. Výstup bude formátovaný do třech bloků, z nichž každý blok bude mít 20 znaků + jeden znak pro ohraničení. V každém bloku bude vlevo popisek a vpravo hodnota zaokrouhlená vždy na 2 desetinná místa.
    - Pro zjednodušení neřešte situace, kdy vícero kombinací bude mít stejnou hodnotu `sse`.
    - Výstup z funkce `odhad` formátujte jako slovník, v němž budou výstupní parametry a hodnota sse pod příslušnými názvy - viz. ukázkový výstup.

Ukázka výstupu z konzole, pro možný vstup `odhad(c = [0,1], beta = [1,2,3], x = [1,1,2,3], y = [1,2,1,12])`:

```       
| c:            0.00 | beta:         1.00 | sse:         83.00 |
| c:            0.00 | beta:         2.00 | sse:         46.00 |
| c:            0.00 | beta:         3.00 | sse:         39.00 |
| c:            1.00 | beta:         1.00 | sse:         69.00 |
| c:            1.00 | beta:         2.00 | sse:         46.00 |
| c:            1.00 | beta:         3.00 | sse:         53.00 |
{'c': 0, 'beta': 3, 'sse': 39}
```

In [None]:
from itertools import product

Data = list[float | int]


def sse(xs: Data, ys: Data) -> float:
    return sum((x - y)**2 for x, y in zip(xs, ys))


def lin_model(c: float | int, beta: float | int, xs: Data) -> Data:
    return [c + beta * x for x in xs]


def kombinace(constants: Data, betas: Data) -> list[list[float | int]]:
    return [[c, b] for c, b in product(constants, betas)]


def odhad(constants: Data, betas: Data, xs: Data, ys: Data):
    if len(xs) != len(ys):
        raise AttributeError("arrays do no have the same length")

    komb = kombinace(constants, betas)

    min_pars = None
    min_sse = 1e300

    for c, b in komb:
        y_lin_model = lin_model(c=c, beta=b, xs=xs)
        curr_sse = sse(y_lin_model, ys)

        print(f"| c:{c: >16.2f} | beta:{b: >13.2f} | sse:{curr_sse: >14.2f} |")
        if curr_sse < min_sse:
            min_pars = c, b
            min_sse = curr_sse

    return {
        "c": min_pars[0],
        "beta": min_pars[1],
        "sse": min_sse
    }


In [None]:
constants = [0, 1]
betas = [1, 2, 3]
xs = [1, 1, 2, 3]
ys = [1, 2, 1, 12]

res = odhad(constants, betas, xs, ys)
print(res)