# Rdionica: priprema datoteke `podaci_upitnik.csv`

## Uvod - osnove jezika R

U ovom dijelu proći ćemo kroz osnove programskog jezika R. Obradit ćemo osnove njegove sintakse te tipove varijabli. Ovdje ćemo proći kroz neke jako bazične stvari. Većina nekih "naprednijih" stvari provlačit će se kroz ostatak radionice.

### Osnovne matematičke operacije

Za početak, pogledat ćemo kako možemo izvršavati jednostavne naredbe direktno u R konzoli. Kad god u R** konzolu unesemo naredbu koju R smatra valjanom te pritisnemo `Enter` (također poznat kao `Return`), R će u konzoli izbaciti rezultat izvršavanja te naredbe. Na primjer, ako u konzolu unesemo `2 + 2`, R će izbaciti rezultat te operacije.

In [4]:
2 + 2

Isto možemo napraviti s dijeljenjem (`/`), množenjem (`*`), oduzimanjem (`-`) i potenciranjem (`^`).

In [10]:
4 / 2

2 * 3

5 - 1

3^2

Poseban operator koji nekad zna biti koristan je *modulo* - `%%` - koji vraća cijelobrojni dio dijeljenja dvaju brojeva. Na primjer:

In [9]:
# (Linije koje sadrže komentare započinju sa znakom #. R ne interpretira te linije.)
# Obično dijeljenje:
5 / 2

# Modulo
5 %% 2

Naravno, kao i u pješačkoj matematici, i u R-u je potrebno paziti na grupiranje matematičkih izraza.

`x + y / z` je $ x + (y / z) $ je $ x + \frac{z}{y} $

`(x + y) / z` je $ (x + y) / z $ je $ \frac{x+y}{z} $.

### Funkcije

Sa samim matematičkim operacijama nećemo daleko doći. R ima i funkcije - operacije koje primaju parametre (eng. *argument*) i vraćaju neke vrijednosti.

Funkcije u R-u imaju opći oblik `funkcija(argument1, argument2, ... , argumentN)`. 

Prva funkcija koju ćemo pogledati, a koja nadopunjava "osnovne" matematičke operacije s kojima smo započeli je `sqrt`, kojom možemo dobiti korijen nekog broja.

In [11]:
sqrt(4)

Druga, koja se u R-u javlja **jako** često, je `c` (što je, prema Adleru [2012] skraćeno za *combine*). `c` uzima $N$ argumenata i spaja ih u **vektor**.

In [32]:
# navodnici su bitni! ali mogu biti jednostruki ili dvostruki, bitno je samo da je riječ omeđena jednakim parom
# nrp 'a' je oke, "a' nije oke, ali zato "a" je
c('patka', "krava", 'pile', "krumpir")

c(5, 4, 3, 2, 1)

Koristeći `c`, stvorili smo dva vektora. Vektori spadaju među osnovne strukture podataka u R-u. Vektori mogu sadržavati proizvoljan broj elemenata **istog tipa**. O tipovima ćemo pričati malo kasnije.

Sada ćemo se pozabaviti varijablama.

### Varijable

Kad god smo dosad izvršavali neke funkcije, baratali smo konkretnim vrijednostima (npr. `2 + 2`), a rezultati su ostali lebdjeti u eteru, nedostupni običnim ljudima.

Kako bismo mogli baratati proizovljnim vrijednostima te kako bismo rezultati izvukli iz etera, uvodimo **varijable**.

Varijablu imenujemo (eng. *declare*) tako što neki poluproizvoljan naziv spojimo s nekom vrijednosti, koristeći operator `<-`. Na pimjer:

In [18]:
a <- 2

Ako sad u konzolu unesemo `a`, konzola će nam vratiti vrijednost te varijable. Isti rezultat dobili bismo ako bismo `a` iskoristili kao argument `print` funkcije (`print(a)`).

In [21]:
a

Vrijednosti varijablama možemo pridavati (eng. *assign*) i koristeći znak `=` (razlikovati od `==`!), no to se **ne preporučuje**. Osim toga, vrijednosti možemo pridavati i s lijeva na desno, koristeći `->`:

In [23]:
3 -> b
b

Imena varijabli mogu sadržavati slova, brojeve, točke (`.`) i underscoreove (čija hrvatska imena ne znam; `_`). Imena varijabli ne mogu započinjati s točkom koju prati broj. Na primjer:

In [24]:
.3 <- 5

ERROR: Error in 0.3 <- 5: invalid (do_set) left-hand side to assignment


Također, imena varijabli ne mogu biti izrazi koji su rezervirani u samom programskom jeziku, kao što je `for` (koji se koristi za iniciranje petlji).

In [25]:
for <- 5

ERROR: Error in parse(text = x, srcfile = src): <text>:1:5: unexpected assignment
1: for <-
        ^


Funkcija koja zna biti zgodna kod imenovanja varijabli je `exists`, koja kao argument prima izraz u navodnicima (što je poznato kao **string**) te vraća `TRUE` ili `FALSE` ovisno o tom je li objekt istog imena pronađen ili ne.

In [30]:
# varijabla koju smo ranije stvorili
exists('a')

# ključna riječ, definirana u R-u, ne smijemo koristiti
exists('for')

# ključna riječ, definirana u R-u, ne smijemo koristiti
exists('if')

# ime koje nije iskorišteno
exists('maca')

Sad kad znamo kako varijablama pripisati vrijednosti, možemo spremiti vektore koje smo ranije napravili koristeći `c`. Neovisno o tome što *možemo* koristiti svašta za imena varijabli, trebali bismo se truditi imena učiniti smislenima. Dugoročno, to će nas poštedjeti puno mentalnog (a nekad i R-ovskog) napora. Također, savjetovao bih da izbjegavate korištenje "hrvatskih" znakova (č, ć, ž, š, đ) u svom kodu; korištenje tih znakova može izazvati snažne glavobolje.

In [36]:
domace_zivotinje_i_krumpir <- c('patka', 'krava', 'pile', 'krumpir')

brojevi.5.do.1 <- c(5, 4, 3, 2, 1)

Kao i kad smo varijabli `a` pripisali vrijednost `2`, ni sada ne dobivamo nikakav output u konzoli. Ali možemo koristiti `print` ili samo upisati ime varijable u konzolu kako bismo dobili njenu vrijednost.

In [37]:
print(domace_zivotinje_i_krumpir)

[1] "patka"   "krava"   "pile"    "krumpir"


In [38]:
brojevi.5.do.1

Sad kad smo svoje vektore pripisali varijablama, možemo dohvaćati pojedine vrijednosti iz njih. Na primjer, ako želimo dohvatiti prvu vrijednost iz vektora `domace_zivotinje_i_krumpir`, možemo učiniti ovo:

In [46]:
domace_zivotinje_i_krumpir[1]

`1` je, u ovom slučaju, **indeks**. U R-u, za razliku od većine drugih programskih jezika, indeksiranje započinje s `1`, a ne s `0`.

Za dohvaćanje trećeg elementa iz vektora `brojevi.5.do.1` izvršili bismo:

In [42]:
brojevi.5.do.1[3]

## Reference

Adler, J. (2012). *R in a nutshell: A desktop quick reference*, 2. izdanje. O'Reilly Media, Inc.