# Cvičenie 1: Nastavenie programátorského prostredia a OpenAI gym

Na tomto cvičení si pripravíte programátorské prostredie a oboznámite sa s knižnicu OpenAI gym a s niektorými štandardnými úlohami pre riešenie pomocou učenia posilňovaním, teda *reinforcement learning*om.

## Krok 1: Príprava prostredia

Na tomto predmete budeme programovať v jazyku Python, konkrétne vo verzii **3.8**. Vzhľadom na veľký počet potrebných knižníc odporúčame používať distribúciu Anaconda, ktorá obsahuje mnoho z potrebných knižníc, avšak knižnice môžete aj doinštalovať do štandardnej verzie Pythonu. Ak Python alebo Anacondu máte nainštalovanú, môžete pokračovať krokom 1.2.

### Krok 1.1: Inštalácia Anacondy

Najnovšiu verziu Anacondy s Pythonom 3.8 si môžete stiahnuť z [web stránky Anacondy](https://www.anaconda.com/products/individual). Vyberte si inštalačný súbor pre váš operačný systém, a postupujte podľa inštrukcií počas inštalácie (podrobné návody nájdete aj [tu](https://docs.anaconda.com/anaconda/install/)). Ak používate Windows OS, odporúčame už počas inštalácie pridať do zoznamu systémových premenných cestu k inštalácii Anacondy.

<img src="sources/lab01/anaconda_installation.jpg" width="400">

Po ukončení inštalácie môžete skontrolovať jej úspešnosť cez príkazový riadok alebo terminál zadaním príkazu `python --version`. Mal by sa zobraziť výpis typu `Python 3.8.X`. Anaconda má aj vlastný príkazový riadok Anaconda Prompt, kde môžete interagovať priamo s inštaláciou.

### Krok 1.2: Vytvorenie virtuálneho prostredia

Aby sme neovplyvnili základnú inštaláciu Anacondy, resp. Pythonu, vytvoríme si virtuálne prostredie, kde doinštalujeme potrebné knižnice. Virtuálne prostredie vytvoríme zadaním príkazu v Anaconda Prompt (prompt spustite ako administrátor):

`conda create --name rl-env python=3.8`

kde `rl-env` je názov prostredia. Následe vybrané prostredie aktivujeme príkazom:

`conda activate rl-env`.

Zoznam nainštalovaných knižníc vo virtuálnom prostredí viete dať vypísať pomocou príkazu `conda list`. Ako môžete vidieť, v novom prostredí máme iba niekoľko knižníc, preto potrebujeme doinštalovať potrebné knižnice.

**Poznámka:** Ak pracujete iba so štandardným Pythonom, virtuálne prostredie viete vytvoriť cez knižnicu `venv`. Podrobné informácie a návod nájdete napríklad [tu](https://docs.python.org/3/library/venv.html).

### Krok 1.3: Inštalácia OpenAI gym

Knižnicu OpenAI gym (ako aj ostatné pythonovské knižnice) nainštalujeme príkazom `pip`. Pred tým si ale skontrolujte, či máte aktivované virtuálne prostredie. Gym sa nainštaluje príkazom:

`python -m pip install gym`.

Príkaz navyše nainštaluje všetky dependencies knižnice gym. O úspešnosti inštalácie sa uistíte opätovným zadaním príkazu `conda list`, resp. skúste importnúť knižnciu OpenAI gym príkazmi (stále v Anaconda Prompt):

```
python
import gym
```

Ak sa nevypíše chybová hláška, vaše prostredie je pripravené na použitie.

### Krok 1.4: Nastavenie IDE

Ak pri programovaní a spustení kódu používate IDE, nezabudnite nastaviť cestu k virtuálnemu prostrediu. K ceste sa dopracujete príkazom `where python` v Anaconda Prompt pri aktivovanom virtuálnom prostredí. Vypíše sa vám niekoľko inštalácií, potrebujete cestu s názvom virtuálneho prostredia, napríklad:

`C:\ProgramData\Anaconda3\envs\rl-env\python.exe`.

Alternatívne vaše kódy môžete spustiť priamo cez Anaconda Prompt po aktivácii virtuálneho prostredia a zadaní príkazu:

`python script_name.py`

## Krok 2: OpenAI gym

V ďalšej časti cvičenia sa oboznámime s knižnicou [OpenAI gym](https://gym.openai.com).

### Krok 2.1: Interakcia s prostrediami

Vyskúšaje základnú interakciu s prostrediami OpenAI gym pomocou príkladu nižšie. Prezrite si základné funkcie a ich návratové hodnoty. Pritom sa môžete riadiť [dokumentáciou](https://gym.openai.com/docs/).

In [None]:
import gym

env = gym.make('CartPole-v0')
env.reset()
for _ in range(1000):
    env.render()
    env.step(env.action_space.sample())  # take a random action
env.close()

### Krok 2.2: Typy prostredí

Web stránka knižnice ponúka aj [zoznam všetkých základných prostredí](https://gym.openai.com/envs/#classic_control). Popíšte niekoľko prostredí a kategorizujte ich podľa niektorých vlastností, ako napríklad:

* stavový priestor - počet parametrov, diskrétny/spojitý?
* priestor akcií - dostupné akcie a ich typy
* odmena - spôsob odmeňovania, hodnota odmeny
* dynamika prostredia - deterministické/nedeterministické