# Lijsten en lijst-operaties

We hebben in het vorige hoofdstuk gezien hoe je kunt werken met recursieve zelf-gedefinieerde data-types. De structuur van de operaties daarvoor volgt de structuur van het data-type.

Lijsten in Haskell zijn op dezelfde manier gemaakt. We behandelen eerst zelf-gedefinieerde lijsten van Ints. Daarna laten we zien hoe Haskell-lijsten werken met elementen van een willekeurig type.


In [1]:
data List = Empty | Cons Int List

Een functie op zo'n List volgt de structuur van deze List, bijvoorbeeld:

In [2]:
length :: List -> Int
length Empty = 0
length (Cons x xs) = 1 + (length xs)

In [3]:
length (Cons 3 (Cons 4 (Cons 5 Empty)))

3


In [4]:
lst1 = (Cons 3 (Cons 4 (Cons 5 Empty)))

In [5]:
length lst1 

3


## Lijsten in Haskell

Lijsten in Haskell zijn op dezelfde manier gedefinieerd:

```Haskell
data [a] = [] 
         | a:[a]
```

of ook wel, als we de operator `:` (cons) als functie schrijven

```Haskell
data [a] = []
         | (:) a [a]
```

met andere woorden:
- `[]` is de lege lijst
- `:` is de cons-operator (constructor)

In dit geval is `a` een type-*parameter*: het eigenlijke type is nog niet bekend, maar het type moet links en rechts consistent gebruikt worden. Dit betekent dat alle elementen in de lijst van hetzelfde type moeten zijn.

Bovenstaande lijst-definitie is ingebouwd in Haskell, o.m. vanwege de notatie van lijst-waarden als `[1,3,5]`. We kunnen deze notatie niet zelf definiëren. Maar type-parameters kunnen we ook zelf gebruiken, en daarmee onze eigen generieke lijsten maken (zie verderop).

Aan de hand van deze data-type definitie kunnen we nu lijst-functies definiëren, waarbij we de structuur van de lijst-waarde terugzien in de functie-definitie. 
In het type van de functie zien we, net als in de definitie van het datatype, ook weer de type-parameter terug

In [6]:
length :: [a] -> Int
length [] = 0
length (x:xs) = 1 + (length xs)

In [7]:
length "noot"

4


**Opmerking** de laatste regel van `length` kun je ook schrijven als:
```Haskell
length ((:) x xs) = 1 + (length xs)
```
Daarmee laat je duidelijk zien dat `:` ("cons") een "normale" *constructor* is: een functie die een waarde van het betreffende type (list) construeert.

Merk op:
- de definitie van de recursieve functie `length` volgt de structuur van het data-type
- een recursieve functie heeft, naast één of meer recursieve alternatieven, altijd een niet-recursief alternatief, "om de recursie te stoppen"

Op eenzelfde manier kunnen we een functie schrijven voor het sommeren van alle elementen van een `Int`-lijst:

In [8]:
sum :: [Int] -> Int
sum [] = 0
sum (x:xs) = x + (sum xs)

In [9]:
sum [1,2,3]

6


Merk op dat we deze sum-functie niet voor lijsten van een willekeurig type kunnen definiëren: de `+` operator is alleen gedefinieerd voor getallen. We hebben deze functie nu alleen gedefinieerd voor gehele getallen.

We zullen later zien hoe je zo'n functie kunt definiëren voor lijsten van getallen: `Int`, `Float`, enz. 

## Geparametriseerde types

Hierboven hebben we het lijst-data type gezien geparametriseerd met een type. Ook de lijst-functies hebben een geparametriseerd type.

We kunnen ons zelf-gedefinieerde lijst-type ook op een dergelijke manier parametriseren met een type, net als de functies die we daarvoor definiëren.

In [10]:
data List a = Empty | Cons a (List a)

In [11]:
length :: List a -> Int
length Empty = 0
length (Cons x xs) = 1 + (length xs)

In [12]:
length (Cons 'n' (Cons 'o' (Cons 'o' (Cons 't' Empty))))

4


In [13]:
length (Cons 3 (Cons 4 (Cons 5 Empty)))

3


### map, fold

We definiëren hier `map` en `fold` als *generieke* functies, die voor alle soorten lijsten gebruikt kunnen worden. In de typering van de functie gebruiken we daarvoor type-parameters, in plaats van concrete types als `Int` of `[Char]`.

(We gebruiken hier de namen `mapx` en `foldx`, om mogelijke verwarring met de ingebouwde functies te voorkomen.)

In [14]:
mapx :: (a -> b) -> [a] -> [b]
mapx f [] = []
mapx f (x:xs) = (f x) : (mapx f xs)

In [15]:
mapx (\x -> x*2) [1,2,3]

[2,4,6]


In [16]:
import Data.Char

In [17]:
mapx toUpper "aap"

"AAP"


Bij de `fold`-functie moeten we er rekening mee houden dat het type van het resultaat kan verschillen van het type van de lijst-elementen; bijvoorbeeld als we `fold` gebruiken om het aantal tekens in een string te tellen. De string is een lijst van tekens - `[Char]`, en het resultaat is een `Int`.

`fold` heeft als parameters:
- een functie met twee parameters: `a -> b -> b`
- een nul-element (bij die functie, voor de lege lijst), van type `b`
- een lijst van `a`-elementen: `[a]`

In [18]:
foldx :: (a -> b -> b) -> b -> [a] -> b
foldx f y [] = y
foldx f y (x:xs) = f x (foldx f y xs)

In [19]:
foldx (+) 0 [1,2,3]

6


In het onderstaande geval is het type van de lijst: `[Char]`, en het type van het resultaat: `Int`. In termen van de type-parameters van `foldx`: `a == Char, b == Int`.

In [20]:
foldx (\x y -> y + 1) 0 "aap"

3


## Opdrachten

definieer de volgende functies op lijsten (zonder gebruik van ingebouwde lijst-functies):

* prod (mul)
* reverse
* sqr (waarbij alle elementen gekwadrateerd worden)