# Základy jazyka R

R není jenom obyčejný statistický program, ale zároveň i plnohodnotný programovací jazyk. V tomto tutoriálu si ukážeme to nejzákladnější, co budeme z tohoto jazyka potřebovat. 

## Operátory

Dříve už jsme si tak trochu ukázali, jak v R asi provádět základní výpočty. Pojďme teď na to trochu systematičtěji:

In [1]:
# základní matematické operátory
3 + 3 # sčítání
1 - 5 # odčítání
3 * 4 # násobení
25 / 2 # dělení

# další číselné operátory
2 ^ 8 # mocnina
3 %% 2 # modulo (zbytek po dělení)
5 %/% 2 # dělení beze zbytku
-5 # unární minus (násobení jedničkou)

Výsledky programu výše asi nikoho nepřekvapí a pokud jste již někdy používali nějaký matematický program, tak vás ani synatxe nijak zvlášť nevyvede z míry. 

Mimochodem veškerý obsah až do konce řádky, který v R začíná znakem *#*, je při interpretaci vašeho kódu vždy ignorován. Této vlastnosti se doporučuje často využívat, neboť po čase budete mít i vy sami problém číst váš vlastní kód a každá indicie, která vám pomůže rozšifrovat, co jste vlastně při psaní vašeho programu zamýšleli, se vám bude hodit. Minimálně tak alespoň můžete pobavit někoho, kdo bude číst kód po vás, jako například některé [komentáře](https://openvz.org/Kernel_code_quotes) v jádře systému Linux.

Jako každý jiný programovací jazyk, R též zvládá i porovnávací a logické operátory:

In [2]:
3 > 2 # větší
3 < 2 # menší
3 == 3 # rovno
!TRUE # negace
T && F # and
T || FALSE # or

Jak je demonstrováno v programu výše, jazyk též nabízí zkrácené verze konstant `TRUE` a `FALSE`, `T` a `F`. Pro exkluzivní or v R operátor neexistuje, avšak lze použít funkci `xor`:

In [3]:
xor(TRUE, TRUE) # exkluzivní or

Při psaní složitějších výrazů je též třeba dbát na [pořadí a asociativitu](https://www.programiz.com/r-programming/precedence-associativity) operátorů a popřípadě si pomoci závorkami. Např:

In [4]:
256 ^ 1/8
256 ^ (1/8)

nebo

In [5]:
15 / 5 / 3
15 / (5 / 3)

V budoucnu se ještě setkáme s dalšími operátory, které se používají s komplexnějšími datovými strukturami, ale ty zatím necháme být.

## Proměnné a datové typy

Jak přiřazovat proměnné jsme si už dříve také ukázali:

In [6]:
x <- 1
x

Toto je preferovaný a nejčastější způsob, avšak přiřazovacích operátorů je více:

In [7]:
x = x + 1
x
x <<- x + 1
x

Operátor `=` byl do R přidán později a má stejný význam jako `<-`. Doporučuje se však používat starší variantu, ze které je vždy zřejmé co a kam přiřazujete, neboť tento operátor má 'směr'. Lze jej spolu s operátorem `<<-` totiž použít i takto: 

In [8]:
x + 1 -> x
x
x + 1 ->> x
x

Operátory `<<-` a `->>` mají speciální význam a souvisí s pokročilejší znalostí jazyka R a budou vysvětleny později. Ve většině případů je však nebudete potřebovat. Mohou vám jen někdy trochu usnadnit práci.

Každá proměnná i konstanta v R má daný nějaký datový typ, který určuje její vnitřní uspořádání v paměti počítače. My jsme zatím pracovali jen s těmi nejzákladnějšími:

In [9]:
typeof("ahoj")
typeof(1)
typeof(1L)
typeof(1.5)
typeof(T)
typeof(1 + 4i)

Funkce `typeof` se nám vždy pokusí co nejpřesněji sdělit, o jaký datový typ se jedná. Podobně lze též použít i funkci `class`, která dělá to samé ale na trochu vyšší (více lidské) úrovni:

In [10]:
class("ahoj")
class(1)
class(1L)
class(1.5)
class(T)
class(1 + 4i)

Z příkladů výše je vidět, že všechna čísla v R jsou implicitně reprezentována jako datový typ `double`. Pokud z nějakého důvodu chcete, aby bylo vaše číslo reprezentováno jinak, musíte si to explicitně vyžádat (například písmeno `L` za literálem vašeho čísla z něj udělá obyčejný `integer`; stejně funguje i funkce `as.integer`).

TODO: vektory

## Funkce

Co dělá R tak užitečným, je právě široký výběr funkcí, které můžete ve svých programech využít. Díky funkcím je možné snadno zapouzdřovat kód pro opakované použití. Když v R zavoláte funkci (např. `print`), děje se na pozadí hodně věcí, o kterých většinou [raději ani nechcete vědět](http://sourceware.org/git/?p=glibc.git;a=blob;f=stdio-common/vfprintf.c;h=fc370e8cbc4e9652a2ed377b1c6f2324f15b1bf9;hb=3321010338384ecdc6633a8b032bb0ed6aa9b19a). 

Bylo by tedy neefektivní, kdybyste například při každém pokusu o zápis obsahu vaší proměnné na výstup programu museli řešit věci jako otevření a zavření textového bufferu a formátování na konzoli pořád dokola. Je mnohem praktičtější napsat kód jednou a předem definovat proměnné, které se budou měnit v závislosti na kontextu, ve kterém se kód bude vykonávat. V R se funkce definují následujícím způsobem (samotnou syntaxi definice funkce napravo od operátoru `<-` si probereme později):

In [11]:
odmocnina <- function(cislo, odmocnitCim) {
    # spočítá odmocninu z daného čísla

    cislo ^ (1 / odmocnitCim)
}

odmocnina(2, 2)

Jelikož se v R k funkcím přistupuje jako k tzv. 'first-class citizens', není funkce ve výsledku nic jiného, než vytvoření nového objektu a jeho přiřazení do proměnné. Následující kód tedy též funguje, jenom je třeba uzavřít definici funkce do závorek (proč, to zatím necháme být):

In [12]:
(function(cislo, odmocnitCim) {
    # spočítá odmocninu z daného čísla
    
    cislo ^ (1 / odmocnitCim)
}) -> odmocnina_jinak

odmocnina_jinak(2, 2)

Pro nikoho tedy asi již není záhadou následující kód (všimněte si, že funkce se chová jinak při zavolání a jinak pokud k ní přistupujeme jako k proměnné):

In [13]:
class(print)
spit_out <- print
spit_out("hello")

[1] "hello"


Můžeme si takto ovšem i hodně zavařit:

In [14]:
odmocnina <- "Ooops..."
odmocnina(2, 2)

ERROR: Error in eval(expr, envir, enclos): could not find function "odmocnina"


Kupodivu se nám nic takového nestane, pokud uděláme toto:

In [15]:
print <- "Ooops..."
print("Ahoj")

[1] "Ahoj"


Interní funkce v R se totiž řídí trochu jinou politikou. Souvisí to s tím, jakým způsobem jsou jednotlivé objekty navzájem uspořádány a jak probíhá vyhledevání funkcí a proměnných, ale o tom si řekneme více trochu později. Pro zvědavce je možné vřele doporučit [tento článek](http://blog.obeautifulcode.com/R/How-R-Searches-And-Finds-Stuff/).

Vraťme se teď k syntaxi samotné definice funkce, tedy ke konstruktu:

```R
function(x, y) {
    # tělo funkce
}
```

Klíčovým slovem `function` říkáme programu R, že chceme definovat funkci. Závorky jsou vždy povinné a zapisují se do nich jména jejích parametrů. Parametry tvoří kontext, ve kterém se kód bude vykonávat. Ten se píše do kudrnatých závorek a je interpretován stejným způsobem jako jakýkoliv jiný kód, který v R napíšeme, ale vyhodnotí se ve speciálně vytvořeném prostředí s hodnotami parametrů, které se nastaví při volání. Kód v kudrnatých závorkách se často označuje jako tzv. tělo funkce.

Není vždy nutné uzavírat tělo funkce do kudrnatých závorek, takže následující kód je též v pořádku:

In [16]:
moje_kecy <- function()
    print("Ahoj, já jsem ukecaná funkce a tohle je moje tělo.")
    print("Tohle už není tělo funkce.")

moje_kecy()

[1] "Tohle už není tělo funkce."
[1] "Ahoj, já jsem ukecaná funkce a tohle je moje tělo."


V tomto případě se totiž první příkaz po použití klíčového slova `function` automaticky interpretuje jako její tělo. Druhé volání funkce `print` už se vykoná jako normální příkaz hned po definici funkce a je tedy ve výstupu na prvním místě, i když se díky našemu formátování tváří jako součást funkce `moje_kecy`. Pokud tedy potřebujete definovat funkci, která obsahuje více než pouze jeden příkaz, musíte je uzavřít do kudrnatých závorek. Takto uzavřený blok kódu se pak interpretuje jako jeden celek. I když nemusíte kudrnaté závorky vždy používat, je dobré je při definicích vašich funkcí vždy uvést, aby bylo jasné, kde přesně tělo začíná a končí.

Toto chování též vysvětluje, proč je třeba uzavřít výraz s definicí funkce do závorek, pokud se pokoušíme o její obskurní přiřazení do proměnné operátorem `->`. Tento operátor je v tomto případě interpretován jako součást těla funkce, i v případě že leží mimo kudrnaté závorky. Následující kód totiž taky platí:

In [17]:
{
    print("ahoj")
    1 + 1
    5
} -> y

[1] "ahoj"


In [18]:
y

Kód uzavřený do kudrnatých závorek má totiž zajímavou vlastnost. Příkazy uvnitř se všechny vykonají a hodnota posledního z nich se intepretuje jako výsledek celého bloku. Díky tomu lze získat výsledek funkce a uložit jej do proměnné:

In [20]:
odmocnina <- function(cislo, odmocnitCim) {
    # spočítá odmocninu z daného čísla

    cislo ^ (1 / odmocnitCim)
}

výsledek <- odmocnina(4, 2)
výsledek

Tomu, co z funkce 'vypadne', se říká návratová hodnota a pokud není explicitně řečeno jinak, interpretuje se tak vždy výsledek posledního příkazu z bloku kódu, který tvoří její tělo. V tomto případě tedy výsledek výrazu `cislo ^ (1 / odmocnitCim)`.

Pokud chceme specifikovat jinou návratovou hodnotu, můžeme tak učinit funkcí `return`:

In [22]:
{
    print("hi")
    return(42)
    print("ahoj")
}

[1] "hi"


Jak vidíte, funkce `return` též ukončí vykonávání aktuálního bloku kódu a použije námi specifikovaný argument (zde pouze číslo 42) jako návratovou hodnotu. Návratovou hodnotu však nemusíme vždy specifikovat. Funkci 'return' lze totiž použít i bez parametrů:

In [23]:
{
    print("hi")
    return()
    print("ahoj")
}

[1] "hi"


NULL

V tomto případě je návratová hodnota rovna `NULL`, což je v R a jiných programovacích jazycích univerzální objekt pro reprezentaci 'ničeho'. Nulovou návratovou hodnotu má i následující funkce:

In [24]:
nic <- function() {
    # prázdný blok
}

nic()

NULL

Praktické využití funkce `return` a hodnoty `NULL` vám teď zřejmě uniká, ale vše se vyjasní v další kapitole, kde si představíme [řídící struktury](#%C5%98%C3%ADd%C3%ADc%C3%AD-struktury).

Na závěr ještě několik poznámek k volání funkcí. Už jsme si ukázali, že pokud chceme vykonat blok funkce, musíme vždy specifikovat kontext v podobě jejích parametrů (pokud tedy funkce nějaké má): 

In [25]:
odmocnina(3, 2)

Parametry (nebo také argumenty) můžeme řadit do dvou kategorií:

1. poziční
2. pojmenované

My jsme zatím v našem kódu používali pouze agrumenty poziční, ale naší funkci `odmocnina` bychom mohli též zavolat následujícím způsobem pomocí pojmenovaných argumentů:

In [27]:
odmocnina(odmocnitCim = 2, cislo = 3)

Všimněte si, že v případě pojmenovaných argumentů není třeba, aby byly argumenty uvedeny ve stejném pořadí jako v definici funkce. Vidíme zde i další význam operátoru `=`, který zde slouží jako operátor pro přiřazení hodnoty do parametru funkce. Parametry funkce totiž žijí pouze v kontextu dané funkce, na rozdíl od běžných proměnných.

Pojmenované a poziční argumenty lze též kombinovat:

In [28]:
odmocnina(3, odmocnitCim = 2)

V jazyce R dokonce ani není třeba zadávat poziční argumenty před pojmenovanými jako v jiných jazycích. V následujícím případě program sám uhodne, co jste chtěli daným voláním říci:

In [29]:
odmocnina(odmocnitCim = 2, 3)

Pro přehlednost je však vždy dobré nejprve uvést poziční argumenty a až potom argumenty pojmenované, neboť poziční argumenty jsou zpravidla ty nejdůležitější, které je vždy třeba při volání funkce dodat. Funkce totiž mohou být definovány i s implicitními hodnotami argumentů. Naší funkci `odmocnina` bychom totiž mohli definovat a volat i takto:

In [33]:
odmocnina <- function(cislo, odmocnitCim = 2) {
    # spočítá odmocninu z daného čísla

    cislo ^ (1 / odmocnitCim)
}

odmocnina(2)
odmocnina(2, 3)
odmocnina(2, odmocnitCim = 3)

Pokud tedy má funkce nastavenou implicitní hodnotu parametru a tento parametr není při jejím volání nastaven uživatelem, použije se při vykonávání právě tato implicitní hodnota.

Poslední věc kterou si o funkcích řekneme bude k samotnému kontextu jejího vykonávávní. Dříve bylo řečeno, že funkce se vždy vykonává v kontextu jejích argumentů, ale v R to není úplně pravda. Následující funkci totiž můžeme v klidu nadefinovat a zavolat:

In [40]:
show_x <- function () {print(x)}

In [41]:
show_x()

[1] 5


Možná jste to již zapomněli, ale v [předchozí kapitole](#Prom%C4%9Bnn%C3%A9-a-datov%C3%A9-typy) jsme si nadefinovali proměnnou `x` a postupně do ní ukládali různé hodnoty. R se tedy při vyhledávání proměnných neomezuje pouze na svoje parametry a kontext, ale pokud nějakou proměnnou nenajde zkusí to i tzv. 'výše', což v tomto případě znamená kontext našeho celého programu.

Kontext není v R pouze nějaký abstraktní pojem, ale lze si na něj i přímo sáhnout:

In [45]:
kontext = environment() # získej aktuálně aktivní prostředí
print(kontext)
ls(envir = kontext) # vypiš proměnné

<environment: R_GlobalEnv>


Proměnné totiž v R 'žijí' vždy v nějakém prostředí (environment). Pro všechny proměnné v našem programu je to vždy implicitně globální prostředí (`R_GlobalEnv`). Když zavoláme funkci, tak se pro blok jejího kódu vytvoří prostředí nové, které je podřazené prostředí, ze kterého byla funkce zavolána. Díky tomu se R při interpretaci vašich příkazů může pohybovat skrz různé kontexty a podaří se mu tak naléz i proměnné, které funkce nemá přímo k dispozici ve svém vlastním prostředí. Díky stejné vlastnosti lze ve funkci `show_x` též použít funkci `print` bez toho aniž bychom jí museli v těle funkce nějak definovat. Vzájemná organizace prostředí je poměrně složitá a mi se jí zde nebudeme podrobně věnovat, ale opět lze vřele doporučit rozsáhlý [článek](http://blog.obeautifulcode.com/R/How-R-Searches-And-Finds-Stuff/), který se tímto zabývá. Na závěr ještě jeden příklad k tomuto tématu:

In [57]:
a <- "a (globální)"
c_ <- "c_ (globální)"

printer <- function() {
    a <- "a (ve funkci)"
    print(a)
    b <- "b (ve funkci)"
    c_ <<- "c_ (ve funkci)"
}

print(a)
print(c_)
printer()
print(a)
print(c_)
b

[1] "a (globální)"
[1] "c_ (globální)"
[1] "a (ve funkci)"
[1] "a (globální)"
[1] "c_ (ve funkci)"


ERROR: Error in eval(expr, envir, enclos): object 'b' not found


Proměnné se tedy vždy zapisují pouze do kontextu, ve kterém k přiřazení dochází. Hierarchie prostředí se prohledává pouze přičtení. Všechny proměnné, které vytvoříte ve funkci, jsou dostupné pouze v jejím těle. Vyjímkou je pouze operátor `<<-`, který vyhledá 

TODO: finish this

http://adv-r.had.co.nz/Functions.html

## Řídící struktury

TODO

## Dokumentace

R má rozsáhlou dokumentaci a kdykoliv si nevíte rady s nějakou funkcí, je veliká šance, že odpověď najdete právě tam. Pokud přesně víte, jak se vaše funkce jmenuje stačí vám dotázat se funkce `help`:

In [None]:
help("typeof")

In [None]:
help("class")

In [None]:
apropos("svd")