# Cvičenie 5: Defenzívne programovanie

Jedna z veľkých životných právd je, že všetko čo sa pokaziť, skôr či neskôr sa aj pokazí. Nie je to inak ani s programami, ale vďaka niekoľkým šikovným riešeniam a konštruktom vieme pravdepodobnosť chyby a zlyhania programu znížiť. Na dnešnom cvičení sa pozrieme na to, ako môžeme predísť chybám v programe, a ako napísať naše kódy tak, aby boli odolné voči nesprávnemu použitiu.

## 1. Validácia vstupu

Prvým základným krokom v defenzívnom programovaní je validácia vstupných údajov. Ak váš kód zdokumentujete dôsledne, dokumentácia bude obsahovať všetky predpoklady vášho kódu, ale aj tak sa môže stať, že používateľ alebo ďalší programátor bude mať inú predstavu o tom, ako váš kód funguje a čo všetko dokáže. Takémuto nesprávnemu použitiu môžeme predísť poctivou kontrolou všetkých vstupných parametrov našich funkcií.

Ako ukážku použijeme jednoduchú funkciu `is_right_triangle`, ktorá zistí, či trojuholník s danými dĺžkami strán je pravouhlý. Jednu z možných implementácií nájdete nižšie. Intuitívnym predpokladom pre funkciu je, že všetky strany budú mať kladnú dĺžku, túto kontrolu ale kód nikde neimplementuje, a kvôli tomu môže mať nesprávnu návratovú hodnotu, ako vidíte na príklade nižšie.

**Úloha:** Doplňte implementáciu funkcie `is_right_triangle` o kontrolu vhodnej formy vstupných parametrov: funkcia nech vráti `False` ak niektoré číslo na vstupe nie je kladné číslo.

In [None]:
def is_right_triangle(a, b, c):
    all_sides = [a, b, c]
    longest = max(all_sides)
    all_sides.remove(longest)
    side1, side2 = all_sides
    return side1 ** 2 + side2 ** 2 == longest **2

print(is_right_triangle(3, 4, 5))
print(is_right_triangle(1, 1, 1))
print(is_right_triangle(2, 1, 0.5))
print(is_right_triangle(-3, 4, 5))

Samozrejme vyššie riešenie nie je úplne ideálne, pretože vracia zmysluplnú hodnotu v každom prípade. Tak používateľ nemusí vedieť, či vstup reprezentuje nepravouhlý trojuholník alebo úplne neplatný vstup. Validáciu je preto lepšie riešiť často cez použitie výnimiek.

**Úloha:** Validáciu vstupu opravte tak, aby funkcia vyhodila `TypeError`, ak na vstupe nemáme iba číselné hodnoty, a `ValueError` ak niektorý vstup nereprezentuje kladné číslo.

## 2. Validácia výstupu

Na druhej strane, ak už od používateľa vyžadujeme, aby naše funkcie používal správne, bolo by fér, keby sme dodržiavala aj naše sľuby, teda určenú formu návratovej hodnoty funkcií. Síce každý programátor je presvedčený o tom, že jeho program beží vždy bezchybne a pokrýva všetky možné prípady, skutočnosť je zriedkakedy taká. Práve preto je dobrým zvykom, najmä pri kritických častiach programu, skontrolovať výstup funkcií ešte pred ukončením vykonávania danej funkcie.

Spomeňte si na funkciu `load_score` z minulého týždňa, ktorá ako vstup zobrala jeden riadok zo súboru s futbalovými výsledkami a vrátila štvoricu údajov: meno domáceho tímu, počet gólov domácich, meno hosťujúceho tímu, počet gólov hostí. Síce intuitívne sme si mysleli, že návratová hodnota bude n-tica reťazcov a celých čísel, pri niektorých vstupoch môžu nastať problémy, vďaka ktorým funkcia buď nevráti žiadnu hodnotu a zlyhá kvôli chybe, alebo vráti hodnotu s inými typmi.

**Úloha:** Validujte vstupný parameter a výstup funkcie `load_score` tak, aby spracúvala iba reťazcový vstup vo forme `domáci_tím góly_domácich - góly_hostí hosťujúci_tím`, a vždy vrátila štvoricu hodnôt: meno domáceho tímu (*string*), počet gólov domácich (*int*), meno hosťujúceho tímu (*string*), a počet gólov hostí (*int*). Funkcia nech vyhodí chybu informujúcu používateľa o zlyhaní operácie v prípade akejkoľvek chyby.

Pri práci vám môže pomôcť [dokumentácia funkcie `split`](https://docs.python.org/3/library/stdtypes.html#str.split). Ukážkové nesprávne vstupy nájdete v komentároch v bloku nižšie.

In [None]:
def load_score(line):
    home_score, away_score = line[:-1].split(' - ')
    home_team, home_goals = home_score.rsplit(' ', 1)
    away_goals, away_team = away_score.split(' ', 1)
    return (home_team, int(home_goals), away_team, int(away_goals))

# Borussia Mönchengladbach 1 : 1 FC Bayern München
# Borussia Mönchengladbach - 1 FC Bayern München
# Borussia Mönchengladbach 1 - FC Bayern München
# Borussia Mönchengladbach 1.0 - 1 FC Bayern München
# Borussia Mönchengladbach 1 - o FC Bayern München

## 3. Defenzívny kód

V tomto kroku implementujeme jednoduchý program, ktorý vypočíta priemerný vek pre mužov a ženy zo zoznamu. V zozname máme popísaných ľudí ako n-tice. Každá n-tica v zozname obsahuje dve hodnoty: prvá hodnota udáva pohlavie (muž `M` alebo žena `F`), a druhá je vek.

Vaše riešenie obsahuje tri funkcie:
* `validate_data`: skontroluje dodržanie predpokladov na vstupné hodnoty (`data_list`) - vstup musí byť zoznam dvojíc, kde prvý člen každej dvojice je string s hodnotou `M` alebo `F`, a druhá hodnota je kladné celé číslo;
* `split_data`: rozdelí vstupné hodnoty (`data_list`) do dictionary podľa kategórií; prvá hodnota udáva kategóriu, druhá sa pridá do zoznamu hodnôt pre danú kategóriu. Návratová hodnota je dictionary, kde kľúče sú reťazce reprezentujúce kategórie a hodnoty sú zoznamy celočíselných hodnôt;
* `calculate_averages`: vypočíta priemernú hodnou pre všetky kategórie, ako vstup (`data`) dostane dictionary, ktorý spĺňa podmienky výstupu funkcie `split_data`. Výstupom je zoznam dvojíc, kde prvá hodnota je reťazec reprezentujúci kategóriu a druhá hodnota je priemer číselných hodnôt pre danú kategóriu v `data`.

**Úloha:** Implementujte funkcie `validate_data`, `split_data` a `calculate_averages` podľa dokumentácie a dodržaním princípov defenzívneho programovania. [Kostra riešenia je dostupná aj ako súbor.](sources/lab05/lab05.py)

In [None]:
test1 = [
    ('M', 34), ('F', 42), ('M', 23), ('F', 26), ('M', 42), ('F', 27),
    ('M', 17), ('F', 28), ('M', 32), ('F', 41), ('M', 56), ('F', 62),
    ('M', 28), ('F', 55), ('M', 33), ('F', 32), ('M', 26), ('F', 14),
    ('M', 19), ('F', 22), ('M', 21), ('F', 37), ('M', 38), ('F', 45),
    ('M', 34), ('F', 41), ('M', 29), ('F', 31), ('M', 30), ('F', 20),
    ('F', 52), ('F', 29), ('F', 38)
]


def validate_data(data_list):
    # checks if data conforms to the rules:
    # input is a list of tuples, where
    # the first element must be a string (either M or F)
    # the second element is an integer bigger than zero
    # returns True if data are valid, False otherwise
    pass


def split_data(data_list):
    # splits data into categories and stores them in a dictionary
    # returns the dictionary
    pass


def calculate_averages(data):
    # calculates the average for all categories in a dictionary
    # returns the averages as a list of tuples with pairs: category - average
    # returns None if input is not dictionary
    pass


if validate_data(test1):
    data_dct = split_data(test1)
    avgs = calculate_averages(data_dct)
    for cat, avg in avgs:
        print("Category {}, average: {:.2f}".format(cat, avg))


## Doplňujúce úlohy

**Úloha:** Upravte riešenie z minulého cvičenia tak, že pridáte generovanie výnimiek, ktoré používateľa budú informovať o zlyhaní programu a jeho príčiny. Vaše riešenia porovnajte so spolužiakmi.

[Ako kód môžete použiť aj ukážkové riešenie z minulého týždňa.](sources/lab05/lab04_solution.py)