# Uvod v funkcijsko programiranje

In [23]:
(* Ko se v Jupytru prvič požene OCaml, program Findlib izpiše neko sporočilo. Da se to sporočilo ne bi videlo v zapiskih, je tu ta celica, ki sproži izpis, vendar ima nastavljeno, da je v zapiskih v celoti skrita. *)

Prednosti funkcijskega programiranja ne bomo posebej naštevali, a v obzir moramo vzeti tudi dve njegovi slabosti. Prva je ta, da so funkcijski jeziki namenjeni izražanju idej in so zato precej oddaljeni od dejanskih strojnih ukazov, ki smo jih spoznali v prejšnjem poglavju. Zaradi tega je potrebnega kar nekaj truda za njihovo učinkovito izvajanje. Druga pa je višji nivo abstrakcije, ki seveda vodi do bolj jedrnatih programov, a hkrati tudi ni pisan na kožo vsakemu programerju.

Glede prve slabosti vam ni treba skrbeti, saj so večino truda opravile že generacije raziskovalcev in inženirjev pred vami. Po izbiri študija sodeč pa vam tudi druga ne bi smela predstavljati večjih ovir. Se bosta pa obe vseeno poznali, saj se zaradi njuju funkcijske ideje niso tako hitro prijele, funkcijski jeziki pa so v praksi ostali nedodelani in malo ezoterični. Ideje, ki so jih prevzeli uveljavljeni jeziki, pa je treba seveda združiti z vsemi obstoječimi, kar zopet vodi v svoje težave. V zadnjih letih se situacija spreminja na bolje, vendar še vedno nismo na točki, ko bi imeli dobro podprt jezik z jasno izraženimi funkcijskimi ideji.

Ker so ideje seveda pomembnejše, si bomo ogledali programski jezik OCaml, ki je bil eden prvih in je še danes eden najbolj popularnih funkcijskih jezikov. OCaml morda ni najbolj razširjen funkcijski jezik, so pa v njem ideje izražene najbolj neposredno.

## Osnove OCamla

### Matematični izrazi

(Imperativna) navada zapoveduje, da mora prvi program na zaslon izpisati "Hello, world!". Mi bomo začeli drugače, bolj matematično, in raje začeli z enostavnim izračunom:

In [5]:
7 * 6

- : int = 42


Opazimo lahko, da je OCaml je poleg končne vrednosti izpisal tudi njen tip `int`. Tipom se bomo še posvetili, mi pa izračun naredimo še malo bolj zapleten z uporabo funkcije `succ`, ki izračuna naslednika:

In [7]:
succ 6 * 6

- : int = 42


V funkcijskih jezikih je uporaba funkcij tako pogosta, da jo želimo napisati na čim krajši način. Zato argumentov ni treba pisati v oklepajih. Tako kot ima množenje prednost pred seštevanjem, ima uporaba funkcije (oz. _aplikacija_) višjo prioriteto kot računske operacije, zato se je izračun izvedel kot `(succ 6) * 6 = 7 * 6 = 42` in ne kot `succ (6 * 6) = succ 36 = 37`.

Uporabimo lahko tudi funkcijo več argumentov, v kateri argumente zopet ločimo kar s presledkom:

In [8]:
min 8 7 * 6

- : int = 42


### Definicije

Z ukazom `let ime = ...` lahko vrednost izračuna poimenujemo za kasnejšo uporabo:

In [10]:
let odgovor = min 8 7 * 6

val odgovor : int = 42


In [11]:
let malo_slabsi_odgovor = odgovor - 1

val malo_slabsi_odgovor : int = 41


Vrednosti lahko definiramo tudi lokalno z izrazom `let ime = ... in ...`. V tem primeru bodo definicije na voljo v delu `in ...`, izven pa ne.

In [19]:
let odgovor =
  let prvi_delni_izracun = min 8 7 in
  let drugi_delni_izracun = max 6 5 in
  prvi_delni_izracun * drugi_delni_izracun

val odgovor : int = 42


In [13]:
prvi_delni_izracun

error: compile_error

Če želimo, lahko več lokalnih definicij hkrati podamo tako, da jih ločimo z `and`.

In [18]:
let odgovor =
  let prvi_delni_izracun = min 8 7
  and drugi_delni_izracun = max 6 5 in
  prvi_delni_izracun * drugi_delni_izracun

val odgovor : int = 42


Razlika med tem in gnezdenimi lokalnimi definicijami je v tem, da so vrednosti definirane hkrati, zato se ne morejo nanašati ena na drugo:

In [21]:
let odgovor =
  let prvi_delni_izracun = min 8 7 in
  let drugi_delni_izracun = prvi_delni_izracun - 1 in
  prvi_delni_izracun * drugi_delni_izracun

val odgovor : int = 42


In [22]:
let odgovor =
  let prvi_delni_izracun = min 8 7
  and drugi_delni_izracun = prvi_delni_izracun - 1 in
  prvi_delni_izracun * drugi_delni_izracun

error: compile_error

### Definicije funkcij

Funkcije v OCamlu definiramo podobno kot vrednosti, le da za njihovim imenom naštejemo še imena argumentov:

In [None]:
let kvadriraj x = x * x

val kvadriraj : int -> int = <fun>


K tipu funkcije se bomo vrnili kasneje. Funkcije potem uporabimo kot običajno:

In [None]:
kvadriraj 8

- : int = 64


In [None]:
let absolutna_vrednost x =
  if x < 0 then -x else x

val absolutna_vrednost : int -> int = <fun>


In [None]:
absolutna_vrednost (-8)

- : int = 8


Tu smo morali uporabiti oklepaje, saj OCaml ni občutljiv na presledke in bi izraz `absolutna_vrednost -8` razumel kot odštevanje `absolutna_vrednost - 8`.

### Funkcije več argumentov

Na podoben način lahko definiramo funkcije več argumentov:

In [None]:
let obseg_pravokotnika a b =
  2 * (a + b)

val obseg_pravokotnika : int -> int -> int = <fun>


In [None]:
obseg_pravokotnika 6 15

- : int = 42


In [None]:
let povrsina_kvadra a b c =
  2 * (a * b + a * c + b * c)

val povrsina_kvadra : int -> int -> int -> int = <fun>


### Simbolne operacije

In [None]:
let ( // ) a b =
  if a > b then a / b else b / a 

val ( // ) : int -> int -> int = <fun>


In [None]:
120 // 3

- : int = 40


In [None]:
3 // 120

- : int = 40


### Rekurzivne funkcije


Če želimo definirati rekurzivno funkcijo, jo moramo podati z `let rec`:

In [None]:
let rec vsota_prvih n =
  if n = 0 then 0 else vsota_prvih (n - 1) + n

val vsota_prvih : int -> int = <fun>


In [None]:
vsota_prvih 100

- : int = 5050


Seveda ne gre brez klasičnih primerov rekurzivnih funkcij: fakultete in Fibonaccijevih števil.

In [41]:
let rec fakulteta = function
  | 0 -> 1
  | n -> n * fakulteta (n - 1)

val fakulteta : int -> int = <fun>


In [42]:
fakulteta 10

- : int = 3628800


In [43]:
let rec fib = function
  | 0 -> 0
  | 1 -> 1
  | n -> fib (n - 1) + fib (n - 2)

val fib : int -> int = <fun>


Zgornja definicija je precej neučinkovita, zato si lahko pomagamo s pomožno funkcijo, ki deluje veliko hitreje.

In [44]:
let hitri_fib n =
  let rec aux n a b =
    if n = 0 then a else aux (n - 1) b (a + b)
  in aux n 0 1

val hitri_fib : int -> int = <fun>


Z uporabo `and` lahko hkrati definiramo tudi več rekurzivnih funkcij:

In [45]:
let rec je_sodo = function
  | 0 -> true
  | n -> je_liho (n - 1)

and je_liho = function
  | 0 -> false
  | n -> je_sodo (n - 1)

val je_sodo : int -> bool = <fun>
val je_liho : int -> bool = <fun>


O učinkovitosti funkcij v zgornjem primeru raje ne izgubljajmo besed.

## Osnovni tipi

Ena izmed največjih prednosti OCamla je njegov bogat in dovršen sistem tipov. Vsak pravilen program v OCamlu ima svoj tip, ki ga OCaml samodejno preveri pred vsakim izvajanjem, kar polovi ogromno napak.

### Cela števila `int`

Cela števila pripadajo tipu `int`, z njimi pa delamo podobno kot v drugih jezikih:

In [None]:
12 * (34 + 67) - 89

Za razliko od Pythona celoštevilsko delimo z `/`, ostanek pa izračunamo z `mod`:

In [None]:
1024 / 100

In [None]:
1024 mod 100

Prav tako za razliko od Pythona OCamlov tip `int` ne podpira poljubno velikih števil, zato lahko pri nekaterih operacijah pride do prekoračitve obsega:

In [24]:
4611686018427387902 + 1

- : int = 4611686018427387903


In [25]:
4611686018427387902 + 2

- : int = -4611686018427387904


### Števila s plavajočo vejico `float`

Tipu `float` pripadajo števila s plavajočo vejico, ki jih pišemo kot drugod, razlika pa se pojavi pri operacijah, saj OCaml loči med operacijami na celih številih ter operacijami na številih s plavajočo vejico, ki se končajo s piko.

In [None]:
12.0 *. (34.0 +. 67.0) -. 89.0

In [None]:
1024. /. 100.

In [None]:
sqrt 2.

 Kot smo že omenili, OCaml preverja ustreznost tipov, in tako na primer operacija `*` sprejme dva argumenta tipa `int` in `int` tudi vrne. Če ji damo argumente tipa `float`, se bo OCaml pritožil, saj med tema dvema tipoma strogo loči:

In [None]:
2 * 3.141592

In [None]:
float_of_int 10

In [None]:
int_of_float 3.141592

### Nizi `string`

Nizi pripadajo tipu `string`, pišemo pa jih med dvojne narekovaje. Stikanje nizov je pogosta operacija, ki jo pišemo kot `^`:

In [2]:
let fun_prog = "Funkcijsko " ^ "programiranje"

val fun_prog : string = "Funkcijsko programiranje"


Na voljo imamo tudi funkcije za pretvorbo v nize in iz nizov, pri čemer slednje lahko sprožijo napako:

In [4]:
string_of_int 100


- : string = "100"


In [5]:
int_of_string "100"

- : int = 100


In [6]:
int_of_string "sto"

error: runtime_error

Več funkcij za delo z nizi najdemo v [standardni knjižnici](http://caml.inria.fr/pub/docs/manual-ocaml/libref/), ki je razdeljena na module, na primer:

- osnovni modul [`Stdlib`](http://caml.inria.fr/pub/docs/manual-ocaml/libref/Stdlib.html), ki je vedno naložen in ga ni treba posebej navajati,
- modul [`String`](http://caml.inria.fr/pub/docs/manual-ocaml/libref/String.html) za delo z nizi,
- modul [`List`](http://caml.inria.fr/pub/docs/manual-ocaml/libref/List.html) za delo s seznami ali
- modul [`Random`](http://caml.inria.fr/pub/docs/manual-ocaml/libref/Random.html) za delo s psevdonaključnimi vrednostmi.

Do funkcij iz danega modula dostopamo prek zapisa `ImeModula.ime_funkcije`:

In [None]:
String.length fun_prog

In [None]:
String.cat "Uvod v " (String.lowercase_ascii fun_prog)

In [None]:
"Uvod v " ^ String.lowercase_ascii fun_prog

### Logične vrednosti `bool`


Tipu `bool` pripadajo logične vrednosti, kjer imamo na voljo obe logični konstanti ter običajne logične operacije, pri čemer konjunkcijo _in_ pišemo kot `&&`, disjunkcijo _ali_ pa kot `||`. Na voljo imamo tudi običajne relacije za primerjavo:

In [None]:
3 <= 8

In [None]:
3 <= 8 && 8 <= 6

Logične vrednosti lahko uporabljamo v pogojnih izrazih:

In [None]:
let abs x =
  if x < 0 then -x else x

Pogojni izrazi so lahko tudi vsebovani v drugih izrazih. Na primer, funkcija v spodnjem izrazu je rezultat pogojnega izraza:

In [32]:
(if 1 = 3 then pred else succ) 5 * 7

- : int = 42


Za primerjavo enakosti uporabljamo operaciji `=` in `<>`, ki argumente primerjata glede na vrednosti. Na voljo sta tudi primerjavi `==` in `!=`, ki gledata identičnost argumentov in ju uporabljamo le takrat, kadar smo v to popolnoma prepričani, saj nam sicer dajeta nepričakovane odgovore:

In [26]:
"A" == "A"

- : bool = false


Dobili smo `false`, ker je za vsako stran OCaml naredil svoj niz in ta niza shranil na dve različni mesti v pomnilniku. Če bi naredili en sam niz, bi enakost veljala:

In [86]:
let a = "A"

val a : string = "A"


In [87]:
a == a

- : bool = true


### Enotski tip `unit`

V OCamlu imamo tudi enotski tip `unit`, ki vsebuje samo eno vrednost:

In [10]:
()

- : unit = ()


Toda če je `()` edina vrednost svojega tipa, kakšen je njen namen, saj ne nosi nobene informacije?

Poglejmo si najprej funkcijo `Random.int`, ki za argument sprejme celo število `n` in vrne naključno število med `0` in `n - 1`:

In [21]:
Random.int 6

- : int = 3


Podobno kot si lahko izberemo naključno število, lahko izberemo tudi naključno logično vrednost s pomočjo funkcije `Random.bool`. Toda `Random.bool` ne potrebuje nobenega argumenta, ki bi določal množico vrednosti, med katerimi izbiramo. Toda funkcijo moramo vseeno poklicati na nekem argumentu, zato v tem primeru uporabimo `()`:

In [25]:
Random.bool ()

- : bool = false


Podobno lahko s funkcijo `print_endline` na zaslon izpišemo podani niz. Toda izpisani niz ni rezultat, ki bi ga vrnila funkcija, temveč njen _stranski učinek_. A vsaka funkcija mora imeti rezultat, zato v tem primeru zopet vrnemo `()`:

In [26]:
print_endline "Hello, world!"

Hello, world!


- : unit = ()


Vidimo, da OCaml najprej izpiše niz, nato pa vrne `()`.

### Znaki `char`

Tipu `char` pripadajo posamezni znaki, ki jih pišemo med enojne narekovaje.

In [None]:
'a'

Funkcije za delo z znaki so na voljo v modulu `Char`. Dva primera sta funkciji `code`, ki znak pretvori v njegovo ASCII kodo, ter `chr`, ki naredi ravno obratno.

In [None]:
Char.code 'x'

In [None]:
Char.code 'y'

In [None]:
Char.chr 122

### Primer: Cezarjeva šifra

Za malo večji primer si oglejmo Cezarjevo šifro, ki je ena najstarejših šifrirnih tehnik. Pri Cezarjevi šifri vsak znak zamenjamo z ustrezno zamaknjenim znakom v abecedi. Na primer, pri zamiku 10 bi `A` zamenjali s `K`, `B` z `L` in tako naprej. Cezarjev znameniti citat "Veni, vidi, vici" bi tako postal "Foxs, fsns, fsms".

    ABCDEFGHIJKLMNOPQRSTUVWXYZ    VENI, VIDI, VICI
    KLMNOPQRSTUVWXYZABCDEFGHIJ    FOXS, FSNS, FSMS

Najprej napišimo funkcijo, ki zamakne en sam znak. Pri tem menjamo samo velike tiskane črke, ostale znake (npr. ločila in presledke) pa pustimo nespremenjene.

In [27]:
let cezarjeva_sifra zamik znak =
  if 'A' <= znak && znak <= 'Z' then
    let mesto_znaka = Char.code znak - Char.code 'A' in
    let novo_mesto = (mesto_znaka + zamik) mod 26 in
    Char.chr (Char.code 'A' + novo_mesto)
  else
    znak

val cezarjeva_sifra : int -> char -> char = <fun>


In [28]:
cezarjeva_sifra 10 'R'

- : char = 'B'


Šifriranje celotnega niza enostavno naredimo tako, da s pomočjo funkcije `String.map` funkcijo za šifriranje znaka uporabimo na vsakem znaku posebej.

In [29]:
let zasifriraj zamik niz =
    let zasifriraj_znak znak = cezarjeva_sifra zamik znak in
    String.map zasifriraj_znak niz

val zasifriraj : int -> string -> string = <fun>


In [30]:
zasifriraj 10 "VENI, VIDI, VICI"

- : string = "FOXS, FSNS, FSMS"


Sporočilo lahko odšifriramo tako, da uporabimo ravno obratni zamik.

In [32]:
zasifriraj (26 - 10) "FOXS, FSNS, FSMS"

- : string = "VENI, VIDI, VICI"


## Funkcije

### Funkcijski tipi

Vsaka vrednost v OCamlu ima svoj tip, tudi funkcije. Tip funkcije je oblike <code>tip<sub>arg</sub> -> tip<sub>rez</sub></code>, kjer je <code>tip<sub>arg</sub></code> tip argumenta funkcije, <code>tip<sub>rez</sub></code> pa tip njenega rezultata. Na primer `float_of_int` vzame `int` in vrne `float`:


In [1]:
float_of_int

- : int -> float = <fun>


Podobno je z ostalimi funkcijami, ki smo jih spoznali:

In [2]:
int_of_float

- : float -> int = <fun>


In [3]:
String.length

- : string -> int = <fun>


In [4]:
print_endline

- : string -> unit = <fun>


Prisotnost tipa `unit` v argumentih ali rezultatih funkcije nakazuje, da se bodo najverjetneje zgodili učinki, saj ni razloga, da bi funkcija izračunala samo trivialni rezultat `()`. Podobno funkcija iz prazne vrednosti `()` težko izračuna kaj zanimivega.

### Funkcije več argumentov

Podoben tip imajo tudi funkcije več argumentov:

In [5]:
let zmnozi x y = x * y

val zmnozi : int -> int -> int = <fun>


Funkcija `zmnozi` sprejme dve celi števili tipa `int` in vrne njun produkt, ki je ravno tako tipa `int`. Podobno funkcija `String.cat` sprejme dva niza vrne njun stik.

In [33]:
String.cat

- : string -> string -> string = <fun>


Seveda ni treba, da so vsi tipi enaki. Funkcija `cezarjeva_sifra`, ki smo jo spoznali malo prej, vzame zamik tipa `int` in znak tipa `char` ter vrne zašifrirani znak, ki je ravno tako tipa `char`.

In [34]:
let cezarjeva_sifra zamik znak =
  if 'A' <= znak && znak <= 'Z' then
    let mesto_znaka = Char.code znak - Char.code 'A' in
    let novo_mesto = (mesto_znaka + zamik) mod 26 in
    Char.chr (Char.code 'A' + novo_mesto)
  else
    znak

val cezarjeva_sifra : int -> char -> char = <fun>


### Delna uporaba

Najpomembnejša lastnost funkcij, ki sprejmejo več argumentov, je ta, da jih lahko tudi delno uporabimo tako, da jim podamo samo nekaj argumentov. Za primer vzemimo funkcijo `zasifriraj`, ki sprejme zamik in niz ter vrne zasifriran niz:

In [35]:
let zasifriraj zamik niz =
  let zasifriraj_znak znak = cezarjeva_sifra zamik znak in
  String.map zasifriraj_znak niz

val zasifriraj : int -> string -> string = <fun>


Če funkciji podamo samo zamik, ne dobimo napake, kot bi jo v večini programskih jezikov, temveč funkcijo, ki čaka še na drugi argument:

In [37]:
let rot13 = zasifriraj 13

val rot13 : string -> string = <fun>


V tem primeru uporabimo zamik 13 in dobimo funkcijo, ki vsak niz zašifrira z zamikom 13. Ta zamik je poseben, saj je sam svoj obrat, zato lahko isto funkcijo uporabimo za šifriranje in odšifriranje.

In [38]:
rot13 "VENI, VIDI, VICI"

- : string = "IRAV, IVQV, IVPV"


In [39]:
rot13 "IRAV, IVQV, IVPV"

- : string = "VENI, VIDI, VICI"


Z delno uporabo lahko programe precej skrajšamo. Za primer si spet oglejmo funkcijo `zasifriraj`.

In [None]:
let zasifriraj zamik niz =
  let zasifriraj_znak znak = cezarjeva_sifra zamik znak in
  String.map zasifriraj_znak niz

V njej smo uporabili pomožno funkcijo `zasifriraj_znak : char -> char`, ki znak zašifrira z poprej podanim zamikom. Ta funkcija se obnaša tako, kot da funkciji `cezarjeva_sifra` podali samo zamik. Zato lahko zgornjo vrstico na krajše napišemo kot:

In [None]:
let zasifriraj zamik niz =
  let zasifriraj_znak = cezarjeva_sifra zamik in
  String.map zasifriraj_znak niz

Ker je definicija `zasifriraj_znak` precej preprosta, jo lahko vstavimo kar neposredno:

In [None]:
let zasifriraj zamik niz =
  String.map (cezarjeva_sifra zamik) niz

Tudi `String.map` lahko delno uporabimo tako, da ji podamo samo funkcijo, ki jo želimo uporabiti na vsakem znaku, in nazaj dobimo funkcijo iz nizov v nize:

In [None]:
let zasifriraj zamik =
  String.map (cezarjeva_sifra zamik)

Končna definicija je precej bolj jedrnata: na vsakem znaku uporabi cezarjevo šifro z danim zamikom. Ko se bomo navadili na osnovne tehnike funkcijskega programiranja, bo taka definicija tudi bolj pregledna.

### Funkcije višjega reda

Funkcije so lahko tudi argumenti drugih funkcij. Na primer funkcija `String.exists` sprejme funkcijo tipa `char -> bool` in niz ter vrne `true`, če funkcija najde znak, za katerega je funkcija resnična. Na primer, če gledamo, ali niz vsebuje samoglasnik, lahko definiramo:

In [None]:
let je_samoglasnik znak =
  String.contains "aeiou" (Char.lowercase_ascii znak)

In [None]:
je_samoglasnik 'A'

Če bi radi vedeli, ali `niz` vsebuje samoglasnik, bi lahko napisali `String.exists je_samoglasnik niz`. Z delno uporabo pa lahko napišemo kar:

In [None]:
let vsebuje_samoglasnik =
  String.exists je_samoglasnik

In [None]:
vsebuje_samoglasnik "čmrlj"

Tudi tip funkcije `String.exists` kaže, da sprejme dva argumenta: funkcijo tipa `char -> bool` in niz `string`.

In [4]:
String.exists

- : (char -> bool) -> string -> bool = <fun>


Pri tem je treba biti pozoren na postavitev oklepajev. Če bi jih izpustili, bi dobili tip `char -> bool -> string -> bool`, kar pa je funkcija, ki sprejme tri argumente, znak `char`, logično vrednost `bool` in niz `string`.

Kadar funkcija za argument sprejme drugo funkcijo, govorimo o funkcijah višjega reda. Običajne funkcije med števili, nizi, seznami in podobnimi vrednostmi so funkcije prvega reda. Funkcija $n$-tega reda pa je taka, ki za argument sprejme funkcijo $n - 1$-tega reda. Pri tem predmetu bomo spoznali tudi funkcije tretjega reda, velika večina funkcij, s katerimi se bomo ukvarjali, pa bodo funkcije prvega ali drugega reda.

### Anonimne funkcije

Napišimo funkcijo, ki vrne prezrcaljen niz:

In [41]:
let zrcali niz =
  let n = String.length niz in
  let znak_na_zrcalnem_mestu i = String.get niz (n - i - 1) in
  String.init n znak_na_zrcalnem_mestu

val zrcali : string -> string = <fun>


In [42]:
zrcali "perica reze raci rep"

- : string = "per icar ezer acirep"


Včasih majhnih funkcij kot je zgornja ni smiselno poimenovati. Precejšen del pisanja si prihranimo z uporabo _anonimnih_, torej nepoimenovanih funkcij, ki so oblike `fun arg -> ...`. Na primer, zgornjo funkcijo bi lahko napisali preprosto kot:

In [43]:
let zrcali niz =
  let n = String.length niz in
  String.init n (fun i -> String.get niz (n - i - 1))

val zrcali : string -> string = <fun>


ki deluje enako kot zgornja definicija, le da nam pomožne funkcije ni bilo treba poimenovati. Še en primer je funkcija, ki preveri, ali so vsi znaki v nizu števke:

In [44]:
let je_stevilo niz =
  String.for_all (fun znak -> '0' <= znak && znak <= '9') niz

val je_stevilo : string -> bool = <fun>


Anonimne funkcije lahko sprejmejo tudi več argumentov. Za primer si najprej oglejmo funkcijo `String.mapi`, ki deluje podobno kot `String.map`, le da poleg znaka sprejme še njegov indeks:

In [66]:
let povej_sarkasticno niz =
  let soda_malo_liha_veliko i c =
    if i mod 2 = 0 then Char.lowercase_ascii c else Char.uppercase_ascii c
  in
  String.mapi soda_malo_liha_veliko niz

val povej_sarkasticno : string -> string = <fun>


In [67]:
povej_sarkasticno "Ja, funkcijsko programiranje je res najboljše!"

- : string = "jA, fUnKcIjSkO PrOgRaMiRaNjE Je rEs nAjBoLjšE!"


S pomočjo anonimnih funkcij bi to na krajše napisali kot:

In [68]:
let povej_sarkasticno niz =
  String.mapi
    (fun i c -> if i mod 2 = 0 then Char.lowercase_ascii c else Char.uppercase_ascii c)
    niz

val povej_sarkasticno : string -> string = <fun>


In [71]:
povej_sarkasticno "Anonimne funkcije mi prihranijo toliko truda pri poimenovanju."

- : string = "aNoNiMnE FuNkCiJe mI PrIhRaNiJo tOlIkO TrUdA PrI PoImEnOvAnJu."


Z delno uporabo pa vse skupaj napišemo še na krajše:

In [69]:
let povej_sarkasticno =
  String.mapi (fun i -> if i mod 2 = 0 then Char.lowercase_ascii else Char.uppercase_ascii)

val povej_sarkasticno : string -> string = <fun>


In [73]:
povej_sarkasticno "Delna uporaba definicije naredi sploh zelo pregledne."

- : string = "dElNa uPoRaBa dEfInIcIjE NaReDi sPlOh zElO PrEgLeDnE."


## Sestavljeni tipi

Poleg preprostih vrednosti poznamo tudi sestavljene.

### Seznami

Sezname v OCamlu pišemo med oglate oklepaje, vrednosti pa ločimo s podpičji. Vse vrednosti v seznamih morajo biti enakega tipa, seznam pa ima potem tip oblike <code>tip<sub>el</sub> list</code>, kjer je <code>tip<sub>el</sub></code> tip komponent.

In [None]:
[1; 2; 3; 4]

In [None]:
['a'; 'b'; 'c'; 'd']

Sezname sestavljamo z dvema operacijama. Z `::` sestavimo nov seznam z dano glavo in repom:

In [None]:
"a" :: "b" :: ["c"; "d"]

Kasneje bomo videli, da ima `::` prav posebno vlogo, saj je tako imenovani _konstruktor_ seznamov. Vsak neprazen seznam je namreč prek `::` sestavljen iz glave in repa. Tudi `[1; 2; 3; 4]` je v resnici samo okrajšava za `1 :: (2 :: (3 :: (4 :: []))))`.

Če želimo stakniti dva seznama, pa uporabimo operator `@`.

In [45]:
[1; 2; 3] @ [4; 5; 6]

- : int list = [1; 2; 3; 4; 5; 6]


In [46]:
String.split_on_char ' ' "Uvod v funkcijsko programiranje"

- : string list = ["Uvod"; "v"; "funkcijsko"; "programiranje"]


Najkoristnejše funkcije za delo s seznami so v modulu `List`:

In [None]:
List.map String.length ["Uvod"; "v"; "funkcijsko"; "programiranje"]

In [None]:
List.filter (fun x -> x < 5) [3; 1; 4; 1; 5; 9; 2; 6; 5; 3; 5; 9]

In [None]:
List.flatten [[1; 2; 3]; [4; 5; 6]; [7; 8; 9]]

Za vajo lahko preverite, kateri izmed spodnjih seznamov so veljavni:

<details>
    <summary><code>[1; 2] :: [3; 4]</code></summary>
    NE
</details>
<details>
    <summary><code>1 :: 2 :: 3 :: []</code></summary>
    DA
</details>
<details>
    <summary><code>[1; 2] @ [3; 4]</code></summary>
    DA
</details>
<details>
    <summary><code>1 @ 2 @ [3]</code></summary>
    NE
</details>
<details>
    <summary><code>[1, 2] @ [3]</code></summary>
    NE
</details>
<details>
    <summary><code>1 :: 2 :: 3</code></summary>
    NE
</details>
<details>
    <summary><code>[1; 2] @ []</code></summary>
    DA
</details>
<details>
    <summary><code>[1; 2] :: []</code></summary>
    DA, presenetljivo je tudi to veljaven seznam in sicer <code>[[1; 2]]</code>.
</details>

### Nabori

Poleg seznamov, ki vsebujejo poljubno število vrednosti istega tipa, pozna OCaml tudi nabore, ki vsebujejo fiksno število vrednosti različnih tipov. Nabore pišemo med navadne oklepaje, komponente pa ločimo z vejico.

In [2]:
(25, "junij", 1991)

- : int * string * int = (25, "junij", 1991)


In [3]:
(4220, "Škofja Loka")

- : int * string = (4220, "Škofja Loka")


Kot vidimo, imajo nabori tip označen s kartezičnim produktom <code>τ<sub>1</sub> * τ<sub>2</sub> * ... * τ<sub>n</sub></code>, kjer so <code>τ<sub>i</sub></code> tipi posameznih komponent. Naborov velikosti ena ni, ker niso potrebni, nabor velikosti 0 pa je natanko en in smo ga že spoznali. To je `()`. Ker kartezičnega produkta nič tipov ne moremo zapisati, tip praznega nabora označujemo z `unit`.


Poglavitni namen naborov je pisanje funkcij, ki vrnejo več rezultatov:

In [1]:
List.partition (fun x -> x < 5) [3; 1; 4; 1; 5; 9; 2; 6; 5; 3; 5; 9]

- : int list * int list = ([3; 1; 4; 1; 2; 3], [5; 9; 6; 5; 5; 9])


Pri zapisu naborov lahko oklepaje tudi izpustimo, vendar tega raje ne počnimo.

In [36]:
1, 2 < 3, "abc"

- : int * bool * string = (1, true, "abc")


To možnost omenjamo samo zato, da boste lahko razumeli pogosto napako: če se pri pisanju seznamov zmotimo in namesto podpičij pišemo vejice, dobimo seznam z enim elementom, ki je nabor:

In [37]:
[1, 2, 3, 4]

- : (int * int * int * int) list = [(1, 2, 3, 4)]


In [39]:
[1; 2; 3; 4]

- : int list = [1; 2; 3; 4]


### Razstavljanje z vzorci

Na parih (torej naborih velikosti 2) imamo na voljo funkciji `fst` in `snd`, ki projecirata na prvo in drugo komponento.

In [4]:
fst (5, true)

- : int = 5


V lokalnih definicijah in argumentih funkcij lahko nabore razstavimo s pomočjo vzorcev. Na primer, namesto:

In [5]:
let raztegni faktor koord =
  (faktor *. fst koord, faktor *. snd koord)

val raztegni : float -> float * float -> float * float = <fun>


lahko pišemo:

In [None]:
let raztegni faktor koord =
  let (x, y) = koord in
  (faktor *. x, faktor *. y)

ali še bolje kot:

In [None]:
let raztegni faktor (x, y) =
  (faktor *. x, faktor *. y)

Vrednosti lahko ignoriramo z vzorcem `_`

In [80]:
let poste = [(1000, "Ljubljana"); (2000, "Maribor"); (3000, "Celje")]

val poste : (int * string) list =
  [(1000, "Ljubljana"); (2000, "Maribor"); (3000, "Celje")]


In [81]:
List.split poste

- : int list * string list =
([1000; 2000; 3000], ["Ljubljana"; "Maribor"; "Celje"])


In [82]:
let (_, imena_krajev) = List.split poste

val imena_krajev : string list = ["Ljubljana"; "Maribor"; "Celje"]


Vzorce lahko uporabljamo tudi v definicijah funkcij in anonimnih funkcijah:

In [84]:
let stara_posta (postna, ime) = (60000 + postna, ime) in
List.map stara_posta poste

- : (int * string) list =
[(61000, "Ljubljana"); (62000, "Maribor"); (63000, "Celje")]


In [85]:
List.map (fun (postna, ime) -> (60000 + postna, ime)) poste

- : (int * string) list =
[(61000, "Ljubljana"); (62000, "Maribor"); (63000, "Celje")]


### Delne vrednosti `τ option`

Včasih imamo opravka s funkcijami, ki jih ne moremo povsod dobro definirati. Na primer, vsak niz ne predstavlja števila. Če funkcijo `int_of_string` uporabimo na takem nizu, bomo dobili napako ob izvajanju.

In [None]:
int_of_string "100"

In [None]:
int_of_string "sto"

Varnejši način je, da uporabimo tip `'a option`, ki predstavlja morebitno vrednost tipa `'a`:

In [None]:
int_of_string_opt "100"

In [None]:
int_of_string_opt

In [None]:
List.filter_map int_of_string_opt ["100"; "sto"; "123"; "tisoč"]

## Polimorfizem

Vsaka vrednost v OCamlu ima natančno določen tip. Kakšen pa je tip funkcije `@`, saj lahko z njo stikamo tako sezname logičnih vrednosti, sezname števil, sezname seznamov števil, ...

In [None]:
[true; false] @ [false; true]

In [None]:
[1; 2] @ [3; 4; 5]

Je `@` torej tipa `bool list -> bool list -> bool list` ali `int list -> int list -> int list` ali `int list list -> int list list -> int list list`? V resnici je lahko tipa `α list -> α list -> α list` za poljuben tip `α`. To v OCamlu označimo kot `'a list -> 'a list -> 'a list`. In res:

In [None]:
( @ )

### Parametrično polimorfne vrednosti

Vrednostim, ki imajo v tipih spremenljivke, pravimo _parametrično polimorfne_. Polimorfne zaradi tega, ker lahko delujejo pri več tipih, parametrično pa zato, ker pri vseh tipih delujejo na enak način.

In [None]:
List.flatten

In [None]:
List.filter

Tudi nekatere vrednosti so parametrično polimorfne:

In [None]:
[]

In [1]:
([], [[]], ([], 3))

- : 'a list * 'b list list * ('c list * int) = ([], [[]], ([], 3))



Poznamo tudi tako imenovani _ad hoc_ polimorfizem, kjer pri nekaterih tipih funkcije delujejo na en način, pri nekaterih na drugačen, pri tretjih pa sploh ne. Primer takega polimorfizma je na primer `+` v Pythonu: števila sešteva, sezname in nize stika, na funkcijah pa ne deluje. OCaml ad hoc polimorfizma nima, ker povzroča težave pri določanju tipov.

### Polimorfni tipi z več parametri

V parametrično polimorfnih funkcijah lahko nastopa več parametrov. Na primer, projekcija na prvo komponento vzame par iz kartezičnega produkta poljubnih dveh tipov in slika v drugega:

In [None]:
snd

In [None]:
List.map

In [None]:
List.filter_map

In [None]:
List.combine

### Primer: veriženje

Funkcije verižimo z operacijo `|>`

In [None]:
let ( |> ) x f = f x

In [None]:
String.length (String.trim "   beseda   ")

In [None]:
"   beseda   " |> String.trim |> String.length

In [None]:
"100,sto,123,tisoč"
|> String.split_on_char ','
|> List.filter_map int_of_string_opt


Recimo, da bi radi izločili vsa števila v posameznih vrsticah besedila.

    1000,Ljubljana        [[1000];
    sto,100          ~>    [100];
    1,a,2,b,3              [1; 2; 3]]

In [None]:
let stevila_v_vrstici vrstica =
  vrstica |> String.split_on_char ',' |> List.filter_map int_of_string_opt

In [None]:
let stevila_v_besedilu besedilo =
  besedilo |> String.split_on_char '\n' |> List.map stevila_v_vrstici

In [None]:
"1000,Ljubljana
sto,100
1,a,2,b,3
" |> stevila_v_besedilu

## Curryrane funkcije

Funkcijam več argumentov, kot jih poznamo v OCamlu, pravimo **curryrane**. Imenujejo se po logiku ([Haskellu Brooksu Curryju](https://en.wikipedia.org/wiki/Haskell_Curry), 1900–1982), ki je bil eden prvih raziskovalcev idej, na katerih temeljijo funkcijski jeziki. Na curryrane funkcije dveh argumentov lahko gledamo kot na funkcije _enega_ argumenta (prvega), ki vrnejo funkcijo _enega_ argumenta (drugega). Ko ta funkcija dobi še drugi argument, ima na voljo vse, kar potrebuje, in lahko izračuna končno vrednost.


Tako je definicija funkcija več argumentov `fun x y -> ...` v resnici samo okrajšava za gnezdeni funkciji enega argumenta `fun x -> fun y -> ...`. Prav tako je `f arg1 arg2` samo okrajšava za `(f arg1) arg2`, saj `f` uporabimo na prvem argumentu `arg1` in dobimo funkcijo `f arg1`, ki jo uporabimo še na drugem argumentu `arg2`. Pravimo, da je aplikacija _levo asociativna_.

Če bi želeli, bi se lahko odločili, da bi bila aplikacija desno asociativna, torej da bi `a b c` pomenilo `a (b c)`, kar bi bilo koristno za veriženje funkcij, saj bi namesto `f (g x)` lahko pisali kar `f g x`. Vendar je takih primerov veliko manj kot klicev funkcij več argumentov, zato je leva asociativnost boljša izbira. Veriženje pa lahko tako ali tako pišemo kot `x |> g |> f` ali `f @@ g @@ x`.

Funkcijski tip `A -> B -> C` predpisujemo funkcijam, ki sprejemajo dva argumenta: najprej sprejmejo argument tipa `A`, nato pa vrnejo funkcijo, ki čaka še drugi argument tipa `B`. Torej je `A -> B -> C` okrajšava za `A -> (B -> C)`. Podobno je `A -> B -> C -> D` okrajšava za `A -> (B -> (C -> D))`. Operacija `->` ki iz dveh tipov vrne tip funkcij med njima je torej _desno_ asociativna.

Lahko bi se dogovorili tudi drugače in rekli, da je `->` levo asociativna operacija. S tem bi bil tip `A -> B -> C` okrajšava za tip funkcij drugega reda `(A -> B) -> C`. Ker je koristnih funkcij višjega veliko manj kot funkcij več argumentov, je desna asociativnost boljša izbira.

Namesto curryranih funkcij bi za funkcije več argumentov lahko uporabili tudi običajne funkcije, ki sprejmejo par:

In [95]:
let zmnozi x y = x * y
let zmnozi' (x, y) = x * y

val zmnozi : int -> int -> int = <fun>


val zmnozi' : int * int -> int = <fun>


In [96]:
zmnozi 6 7

- : int = 42


In [97]:
zmnozi' (6, 7)

- : int = 42


V tem primeru jih seveda ne moremo uporabiti samo na enem argumentu:

In [98]:
zmnozi 6

- : int -> int = <fun>


In [99]:
zmnozi' 6

error: compile_error

Prednost Curryranih funkcij je, da jih lahko uporabimo delno, nato pa dobljeno funkcijo preostalih argumentov uporabimo v kakšni funkciji drugega reda:

In [100]:
List.map (zmnozi 6) [1; 2; 3; 4; 5; 6; 7]

- : int list = [6; 12; 18; 24; 30; 36; 42]


Seveda pa sta tipa `A * B -> C` in `A -> B -> C` izomorfna, saj vsebujeta vsebinsko enake, le po obliki različne funkcije. Med njima obstaja izomorfizem, tako kot med množicama $C^{A \times B} \cong (C^B)^A$. Postopku pretvorbe iz običajne funkcije v curryrano pravimo _curryranje_:

In [101]:
let curry f = fun x y -> f (x, y)

val curry : ('a * 'b -> 'c) -> 'a -> 'b -> 'c = <fun>


In [102]:
let zmnozi'' = curry zmnozi'

val zmnozi'' : int -> int -> int = <fun>


In [104]:
List.map (zmnozi'' 2) [1; 2; 3; 4; 5; 6; 7]

- : int list = [2; 4; 6; 8; 10; 12; 14]


Kot vsak izomorfizem ima tudi curryranje svoj inverz, ki mu pravimo _razcurriranje_

In [105]:
let uncurry g = fun (x, y) -> g x y

val uncurry : ('a -> 'b -> 'c) -> 'a * 'b -> 'c = <fun>


In [107]:
(uncurry zmnozi) (6, 7)

- : int = 42


## Vaje

### Vektorji

1. Napišite funkcijo `skaliraj : float -> float list -> float list`, ki vektor, predstavljen s seznamom števil s plavajočo vejico, pomnoži z danim skalarjem.

In [3]:
let skaliraj k = List.map (( *. ) k)

val skaliraj : float -> float list -> float list = <fun>


In [4]:
skaliraj 2.0 [1.0; 2.0; 3.0]

- : float list = [2.; 4.; 6.]


2. Napišite funkcijo `sestej : float list -> float list -> float list`, ki vrne vsoto dveh vektorjev.

In [5]:
let sestej v1 v2 = List.map2 (+.) v1 v2

val sestej : float list -> float list -> float list = <fun>


In [6]:
sestej [1.0; 2.0; 3.0] [4.0; 5.0; 6.0]

- : float list = [5.; 7.; 9.]


3. Napišite funkcijo `skalarni_produkt : float list -> float list -> float`, ki izračuna skalarni produkt dveh vektorjev. Pri tem si lahko pomagate s funkcijo `vsota_seznama : float list -> float`, definirano prek funkcije `List.fold_left`, ki jo bomo spoznali kasneje:

In [7]:
let vsota_seznama = List.fold_left (+.) 0.

val vsota_seznama : float list -> float = <fun>


In [8]:
let skalarni_produkt v1 v2 =
  (* List.fold_left2 ( +. ) 0. v1 v2 *)
  vsota_seznama @@ List.map2 ( *. ) v1 v2

val skalarni_produkt : float list -> float list -> float = <fun>


In [9]:

skalarni_produkt [1.0; 2.0; 3.0] [4.0; 5.0; 6.0]

- : float = 32.


4. Napišite funkcijo `norma : float list -> float`, ki vrne evklidsko normo vektorja.

In [10]:
let norma v = sqrt (skalarni_produkt v v)

val norma : float list -> float = <fun>


In [11]:
norma [3.0; 4.0]

- : float = 5.


5. Napišite funkcijo `kot_med_vektorjema : float list -> float list -> float`, ki izračuna kot med dvema vektorjema v radianih.

In [12]:
let kot_med_vektorjema v1 v2 =
  acos (skalarni_produkt v1 v2 /. (norma v1 *. norma v2))

val kot_med_vektorjema : float list -> float list -> float = <fun>


In [13]:
kot_med_vektorjema [1.0; 0.0] [0.0; 1.0]

- : float = 1.57079632679489656


6. Napišite funkcijo `normiraj : float list -> float list`, ki normira dani vektor.

In [14]:
let normiraj v = skaliraj (1.0 /. norma v) v

val normiraj : float list -> float list = <fun>


In [15]:
normiraj [3.0; 4.0]

- : float list = [0.600000000000000089; 0.8]


7. Napišite funkcijo `projeciraj : float list -> float list -> float list`, ki izračuna projekcijo prvega vektorja na drugega.


In [16]:
let projeciraj v1 v2 =
  skaliraj (skalarni_produkt v1 v2) (normiraj v2)

val projeciraj : float list -> float list -> float list = <fun>


In [17]:
projeciraj [3.0; 4.0] [1.0; 0.0]

- : float list = [3.; 0.]


### Generiranje HTML-ja

1. Napišite funkcijo `wrap : string -> string -> string`, ki sprejme ime HTML oznake in vsebino ter vrne niz, ki predstavlja ustrezno HTML oznako.

In [20]:
let wrap tag content =
  (* Printf.sprintf "<%s>%s</%s>" tag content tag *)
  "<" ^ tag ^ ">" ^ content ^ "</" ^ tag ^ ">"

val wrap : string -> string -> string = <fun>


In [None]:
wrap "h1" "Hello, world!"

- : string = "<h1>Hello, world!</h1>"



2. Napišite funkcijo `indent : int -> string -> string`, ki sprejme število presledkov in niz ter vrne niz, v katerem je vsaka vrstica zamaknjena za ustrezno število presledkov.


In [21]:
let indent n content =
  let spaces = String.make n ' ' in
  content
  |> String.split_on_char '\n'
  |> List.map (String.cat spaces)
  |> String.concat "\n"

val indent : int -> string -> string = <fun>


In [22]:
indent 4 "Hello,\nworld!"

- : string = "    Hello,\n    world!"


3. Napišite funkcijo `unordered_list : string list -> string`, ki sprejme seznam nizov in vrne niz, ki predstavlja ustrezno zamaknjen neurejeni seznam v HTML-ju:


In [23]:
let unordered_list items =
  items
  |> List.map (wrap "li")
  |> String.concat "\n"
  |> indent 2
  |> (fun content -> "\n" ^ content ^ "\n")
  |> wrap "ul"

val unordered_list : string list -> string = <fun>


In [24]:
print_endline @@ unordered_list ["apple"; "banana"; "cherry"]

<ul>
  <li>apple</li>
  <li>banana</li>
  <li>cherry</li>
</ul>


- : unit = ()


### Nakupovalni seznam

1.	Napišite funkcijo `razdeli_vrstico : string -> string * string`, ki sprejme niz, ki vsebuje vejico, loči na del pred in del za njo.

In [26]:
let razdeli_vrstico vrstica =
  let indeks = String.index vrstica ',' in
  let prvi = String.sub vrstica 0 indeks
  and drugi = String.sub vrstica (indeks + 1) (String.length vrstica - indeks - 1) in
  (String.trim prvi, String.trim drugi)

val razdeli_vrstico : string -> string * string = <fun>


In [27]:
razdeli_vrstico "mleko, 2"

- : string * string = ("mleko", "2")



2.	Napišite funkcijo `pretvori_v_seznam_parov : string -> (string * string) list`, ki sprejme večvrstični niz, kjer je vsaka vrstica niz oblike `"izdelek, vrednost"`, in vrne seznam ustreznih parov.


In [28]:
let pretvori_v_seznam_parov niz =
  niz
  |> String.trim
  |> String.split_on_char '\n'
  |> List.map razdeli_vrstico

val pretvori_v_seznam_parov : string -> (string * string) list = <fun>


In [33]:
pretvori_v_seznam_parov "mleko, 2\nkruh, 1\njabolko, 5"

- : (string * string) list =
[("mleko", "2"); ("kruh", "1"); ("jabolko", "5")]



3.	Napišite funkcijo `pretvori_druge_komponente : ('a -> 'b) -> (string * 'a) list -> (string * 'b) list`, ki dano funkcijo uporabi na vseh drugih komponentah elementov seznama.


In [30]:
let pretvori_druge_komponente f =
  List.map (fun (x, y) -> (x, f y))

val pretvori_druge_komponente :
  ('a -> 'b) -> ('c * 'a) list -> ('c * 'b) list = <fun>


In [34]:
let seznam = [("ata", "mama"); ("teta", "stric")] in
pretvori_druge_komponente String.length seznam

- : (string * int) list = [("ata", 4); ("teta", 5)]



4.	Napišite funkcijo `izracunaj_skupni_znesek : string -> string -> float`, ki sprejme večvrstična niza nakupovalnega seznama in cenika in izračuna skupni znesek nakupa.


In [47]:
let izracunaj_skupni_znesek cenik seznam =
  let cenik =
    cenik
    |> pretvori_v_seznam_parov
    |> pretvori_druge_komponente float_of_string
  in
  let cena_izdelka (izdelek, kolicina) =
    let cena = List.assoc izdelek cenik in
    float_of_int kolicina *. cena
  in
  seznam
  |> pretvori_v_seznam_parov
  |> pretvori_druge_komponente int_of_string
  |> List.map cena_izdelka
  |> vsota_seznama

val izracunaj_skupni_znesek : string -> string -> float list = <fun>


In [50]:
let nakupovalni_seznam = "mleko, 2\njabolka, 5"
and cenik = "jabolka, 0.5\nkruh, 2\nmleko, 1.5" in
izracunaj_skupni_znesek cenik nakupovalni_seznam

- : float list = [3.; 2.5]
