# Cvičenie 11: Evolučné algoritmy

Evolučné algoritmy sú optimalizačné algoritmy inšpirované prírodou. Kým väčšina optimalizačných algoritmov používa priamočiary proces optimalizácie (zvyčajne založený na derivácii), evolučné algoritmy napodobňujú prirodzený proces evolúcie, v ktorom prežijú najlepší jedinci. Pri použití evolučných algoritmov hrá dôležitú rolu aj náhodnosť, vďaka čomu evolučné algoritmy nájdu globálny extrém a nezastavia vyhľadávanie v lokálnych extrémnych bodov.

Samotný proces optimalizácie pomocou evolučných algoritmov je iteratívna a skladá sa z nasledujúcich krokov:
1. vytvorenie prvej generácie - náhodná inicializácia jedincov
2. vyhodnotenie jedincov - pre optimalizáciu sa stanoví kriteriálna funkcia, ktorá určuje vhodnosť riešení, ktoré sú vyjadrené jedincami
3. výber najlepších jedincov - jedincov, ktorí majú najvyššiu vhodnosť
4. párovanie jedincov - rôzne spôsoby, tieto dvojice slúžia ako rodičia jedincov novej generácie
5. reprodukcia - vytvorenie nových jedincov z rodičov
6. mutácia - náhodná mutácia jedincov, čo výrazne môže zmeniť riešenie, ktoré reprezentujú
7. vytvorenie novej generácie - do novej generácie sa dostanú najlepší jedinci z predošlej a vytvorení potomkovia
8. opakuj od bodu 2 až kým nenájdeš optimálne riešenie (riešenie, ktoré spĺňa kriteriálnu funkciu)

![Všeobecný algoritmus evolúcie](figures/lab11/11.1-ga-general.png)

Na dnešnom cvičení si vysvetlíme tieto kroky na jednoduchom príklade. Následne svoje poznatky viete aplikovať aj na konkrétnejšie a rozsiahlejšie úlohy. V našom príklade bude každý jedinec reprezentovaný ako zoznam 20 hodnôt (0 alebo 1). Na začiatku náhodne nainicializujeme týchto jedincov a naším cieľom bude dopracovať sa k jedincom, v ktorých suma čísel presahuje 19.

Kostru riešenie si môžete stiahnuť [tu](codes/lab11-genetic-algorithms.py).

## Krok 1: Inicializácia parametrov

Ako všetky metódy umelej inteligencie, aj evolučné algoritmy majú svoje parametre, ktoré presnejšie definujú proces priebehu algoritmov. Pri evolučných algoritmoch potrebujeme špecifikovať nasledujúce základné parametre:

* veľkosť populácie - koľko jedincov budeme mať v každej generácii
* veľkosť jedinca - z koľkých hodnôt sa skladá jedinec (tieto hodnoty môžu byť binárne alebo spojité)
* pravdepodobnosť mutácie - určuje pravdepodobnosť, s ktorou sa mení hodnota na niektorej pozícii pre jedinca
* kriteriálna funkcia - určuje spôsob vyhodnotenia jedincov
* spôsob párovania - ako sa vyberú dvojice rodičov pred vytvorením potomkov
* spôsob náhrady - ako sa vytvorí nová generácia.

Posledné tri body budeme definovať až pri vytvorení príslušných funkcií, na začiatku nášho skriptu teda zadefinujeme iba ostatné parametre:

In [1]:
import random


POPULATION_SIZE = 10
INDIVIDUAL_LENGTH = 20
MUTATION_CHANCE = 0.1

TARGET_VALUE = 19

Premenná `TARGET_VALUE` určuje požadovanú sumu hodnôt (génov) jedinca. Okrem zadefinovania premenných sme takisto importovali aj knižnicu `random`, ktorú využijeme pre generovanie náhodných čísel pri inicializácii generácie a pri mutácie.

## Krok 2: Inicializácia prvej generácie

Ďalšou úlohou je vytvoriť prvú generáciu, pričom potrebujeme vygenerovať určený počet jedincov a každý jedinec sa skladá z požadovaného počtu génov. Každý gén nadobudne hodnotu 0 alebo 1 (vyberie sa náhodne pri generovaní):

In [None]:
def generate_starting_generation():
    generation = []
    # TODO initialize first generation
    return generation

## Krok 3: Kriteriálna funkcia a vyhodnocovanie

V ďalšom kroku vytvoríme kriteriálnu funkciu, ktorá nám vráti sumu hodnôt (génov) jedinca:

In [None]:
def fitness(individual):
    # TODO: return sum of values in individual
    return 0

Na vyhodnocovanie slúži už implementovaná metóda `rank_generation`, ktorá zoradí zoznam jedincov podľa ich vhodnosti od najlepšieho po najhorší a vráti nový zoznam:

In [None]:
def rank_generation(generation):
    return sorted(generation, key=lambda ind: fitness(ind), reverse=True)

## Krok 4: Párovanie

Pomocou kriteriálnej funkcie vieme zoradiť jedincov z ľubovoľnej generácie na základe ich vhodnosti. Potom našou úlohou je vytvoriť rôzne dvojice, ktoré slúžia ako páry rodičov pre jedincov z ďalšej generácie. Na vytvorenie takýchto dvojíc existuje niekoľko metód, najpopulárnejšie sú nasledovné:

* párovanie podľa vhodnosti - v tejto metóde sa vytvoria páry najlepšieho s druhým najlepším, tretieho najlepšieho so štvrtým najlepším, atď.
* náhodné párovanie - rodičia sú spárovaní úplne náhodne
* vážené párovanie - výber je náhodný, avšak ako váha sa použije vhodnosť jedincov, tým pádom lepší jedinci majú vyššiu šancu na výber.

V našom riešení použijeme najjednoduchšie párovanie podľa vhodnosti, teda zo zoradeného zoznamu jedincov vytvoríme dvojice podľa ich umiestnenia v zozname (1. s 2., 3. s 4., atď.).

In [None]:
 def pair(generation):
    # TODO: return a list of couples, the input is an already sorted list
    return []

## Krok 5: Reprodukcia

Ďalším krokom je reprodukcia, teda vytvorenie nových jedincov - potomkov. Vo väčšine implementácií sa definuje spolu s párovaním, my ale zadefinujeme samostatnú funkciu, ktorá ako parameter dostane prvého a druhého rodiča. Ako pri párovaní, aj tu existuje niekoľko metód (genetických operátorov) pre vytvorenie potomka, najčastejšie používané sú:

* jednobodové kríženie - gény oboch rodičov sú rozdelené na dve časti v rovnakom bode a potomok sa vytvorí z prvej časti prvého rodiča a z druhej časti druhého rodiča (môžu byť vytvorení dvaja potomkovia)
* mnohobodové kríženie - gény sú rozsekané vo viacerých bodoch, vytvorí sa niekoľko potomkov
* uniformné kríženie - maska určí, či gén na danej pozícii je prekopírovaný od prvého alebo od druhého rodiča.

V našom riešení použijeme jednobodové kríženie a vytvoríme iba jedného jedinca (pre jednoduchosť):

In [None]:
def mate(individual1, individual2):
    # TODO: return child
    # first half is copied from parent1 the rest from parent2
    return []

## Krok 6: Mutácia

Mutácia je dodatočný krok pred vytvorením novej generácie a môže byť aplikovaná iba na potomkov alebo aj na rodičov. Pri binárnych génoch je mutácia jednoznačná: 0 nahradíme hodnotou 1, 1 zase hodnotou 0. Mutáciu implementujeme nasledovne: pre každý gén jedinca zmeníme hodnotu na opačnú s pravdepodobnosťou mutácie (premenná `MUTATION_CHANCE`):

In [None]:
def mutate(individual):
    # TODO: mutate genes at each position with MUTATION_CHANCE probability
    pass

## Krok 7: Generovanie novej generácie

V ďalšom kroku môžeme vygenerovať novú generáciu použitím už existujúcich funkcií. V našom príklade novú generáciu vytvoríme nasledovne:

1. zoradíme jedincov podľa ich vhodnosti
2. ponecháme 5 najlepších jedincov (prvú polovicu)
3. vytvoríme páry rodičov
4. vygenerujeme potomkov (bude ich dvakrát menej ako veľkosť populácie)
5. aplikujeme mutáciu na najlepších jedincov a potomkov
6. vrátime zoznam s najlepšími jedincami a potomkami (jedinci v ďalšej generácii)

In [None]:
def generate_new_generation(generation):
    # TODO: generate new generation like so
    # keep the first half of the current population (the best individuals)
    # generate new children using pairing and mating
    return []

## Krok 8: Testovanie

Ak ste implementovali všetky funkcie, vaše riešenie môžete otestovať pomocou funkcie `main`:

In [None]:
if __name__ == '__main__':
    counter = 1
    current = generate_starting_generation()
    while fitness(rank_generation(current)[0]) < TARGET_VALUE:
        print("GENERATION", counter)
        print('best fitness:', fitness(rank_generation(current)[0]))
        print()
        current = generate_new_generation(current)
        counter += 1

    print(current)
    for individual in current:
        print(fitness(individual))

Ak sa vám zapáčili evolučné algoritmy, môžete ich využiť napríklad [pri vytvorení samojazdiacich aút](https://www.youtube.com/watch?v=Qv7dhms5dDQ). Ďalšie informácie o evolučných algoritmoch nájdete [v tejto učebnici](http://www2.fiit.stuba.sk/~kvasnicka/Free%20books/Mach_Evolucne%20algoritmy_kniha.pdf).

**Poznámka**: ukážkové riešenie nájdete [tu](solutions/lab11_solution.py).