## Listas em Haskell ##

Este notebook apresenta o uso de listas em Haskell. Listas são estruturas frequentemente utilizadas em diferentes cenários.

O Wiki deste link https://wiki.haskell.org/How_to_work_on_lists contém informações adicionais.


Uma lista em Haskell é uma estrutura formada por uma cabeça (**head**) e uma cauda (**tail**). 

A cauda pode ser uma outra lista, e assim por diante. Desta forma, é possível definir uma lista contendo um conjunto de elementos.

Na lista (h:t), o elemento **h** é a cabeça e o elemento **t** é a cauda. A lista [] é uma lista vazia.

Listas podem ser definidas de diferentes formas. Abaixo três possibilidades:
- Lista x: notação completa, explicitando todos os elementos (head and tail)
- Lista y: notação explicitando todos os elementos, porém simplificada
- Lista z: notação mais comum, que abstrai os elementos explícitos das notações anteriores

A aplicação da função `length` sobre cada uma das listas retorna o mesmo resultado. O interpretador sugere a utilização da notação mais direta.

In [1]:
x = 10 : (20 : (30 : []))
y = 10 : 20 : 30 : []
z = [10, 20, 30]

length x
length y
length z

3

3

3

Existem várias funções pré-definidas na linguagem para manipulação de listas. Abaixo algumas funções disponíveis.

In [2]:
l = ['a', 'b', 'c', 'd']

length l -- tamanho da lista
length [1, 3, 5, 7]
length ["Sim", "Não", "Talvez"]

head l -- cabeça
tail l -- cauda

l!!3 -- retorna o 3o elemento
take 3 l -- retorna uma lista com os 3 primeiros elementos 
drop 2 l -- exclui os 2 elementos iniciais

l ++ ['e','f'] -- adiciona dois elementos
reverse l -- inverte
null l -- verifica se a lista está vazia
splitAt 2 l -- divide em 2 na posicao 2

4

4

3

'a'

"bcd"

'd'

"abc"

"cd"

"abcdef"

"dcba"

False

("ab","cd")

Implementação da função head.

In [3]:
head :: [a] -> a
head (h : _) = h

head [1,2,3]

1

Implementação da função tail.

In [4]:
tail :: [a] -> [a]
tail (_ : t) = t

tail [1,2,3]

[2,3]

Implementação recursiva da função length.

In [5]:
length :: [a]->Int
length [] = 0
length (_ : t) = 1 + length t

length [1,2,3,4,5]

5

A implementação acima usa casamento de padrões na definição da função. Este tipo de implementação nem sempre é natural para compreender, pois não é comum em linguagens não funcionalistas.

A função acima poderia também ser implementada usando uma expressão condicional, conforme código abaixo.

In [1]:
length :: [a]->Int
length (_ : t) =
   if null t then
      1
   else
      1 + length t

length [1,2,3,4,5]

5

Implementação da função splitAt.

In [6]:
splitAt :: Int -> [a] -> ([a], [a])
splitAt n l = (take n l, drop n l)

splitAt 2 [2, 3, 4 , 5, 6]

([2,3],[4,5,6])

Implementação da função **take** usando casamento de padrões e chamadas recursivas.

Os dois primeiros padrões testam se o `n` é 0 e se a lista está vazia.

O último padrão é usado quando a lista ainda possui elementos. A função é chamada recursivamente até quando `n` for igual a 0, e desempilha e monta a lista resultante.

In [7]:
take :: Int-> [a] -> [a]
take n l = case (n,l) of
    (0,_)       ->  []
    (_,[])      ->  []
    (n,h:t)    ->  h : take (n-1) t 
                            
take 2 [1,2,3,4,5]

[1,2]

### List comprehensions 

Expressão que constroi um conjunto usando uma expressão geradora. Um exemplo simples pode ser : {x | x ∈ {1..5}}

In [19]:
[x | x <- [1..5]]
[y^2 | y <- [1..7]]

[1,2,3,4,5]

[1,4,9,16,25,36,49]

A expressão abaixo gera o produto cartesiano de x,y. Possui 2 geradores.

In [18]:
[(x,y) | x <- [1,2,3], y <- [4,5]]

[(1,4),(1,5),(2,4),(2,5),(3,4),(3,5)]

Expressões geradoras podem ter guardas, para filtrar um subconjunto dos elementos.

In [17]:
[x | x <- [1..10], x > 5]

[6,7,8,9,10]

In [16]:
[ odd x | x <- [1..20]]

[True,False,True,False,True,False,True,False,True,False,True,False,True,False,True,False,True,False,True,False]

Expressões geradoras podem ser usadas em funções

In [11]:
geraN n = [ x*2 | x <- [1..n]]

geraN 10

[2,4,6,8,10,12,14,16,18,20]

### Expressões que aplicam funções sobre elementos da lista (FOLD)

Expressões de manipulação de listas são frequentemente usadas em linguagens funcionalistas.

Um tipo específico de expressões são expressões que aplicam funções sobre todos os elementos da lista, e acumulam ou não o resultado. Estas expressões são frequentemente chamadas de __folding__.

Abaixo alguns exemplos:
- soma : aplicação do operador + em todos os elementos, começando pela direita
- subtração : aplicação do operador + em todos os elementos, começando pela esquerda
- filtro: dada uma lista, aplica uma expressão booleana em todos os elementos e retorna uma nova lista.
- soma : soma todos os elementos (operador + implícito)
- any : aplica uma expressão booleana e retorna verdadeiro se avaliou verdadeiro para ao menos 1 elemento.
- all : aplica uma expressão booleana e retorna verdadeiro se avaliou verdadeiro para todos os elementos.

Existem funções com o operador pré-definido, como `sum`, `maximum`, `minimum`, `product`, e funções que recebem também o operador como parâmetro: `foldr`, `foldl`, `filter`, etc. O operador pode ser uma expressão lambda, isto é, uma função é passada como parâmetro. 

In [2]:
foldr (+) 0 [1,2,3,4] -- soma todos os elementos e ZERO
foldl (-) 0 [1,2,3,4] -- diminui todos os elementos e ZERO
filter (\x -> x `mod` 2 == 0) [1,2,3,4,5] -- retorno todos os elementos pares
sum [1,2,3,4,5] -- soma todos os elementos
sum [1..10] -- soma todos os elementos de 0 a 10
any (> 10) [5,3,20,40,50] -- retorna verdadeiro se ao menos 1 elemento é maior que 10
all (> 10) [5,3,20,40,50] -- retorna verdadeiro se todos os elementos são maior que 10
zip [0..20] [3..] -- retorna todos os elementos, e atribui um índice para cada elemento

10

-10

[2,4]

15

55

True

False

[(0,3),(1,4),(2,5),(3,6),(4,7),(5,8),(6,9),(7,10),(8,11),(9,12),(10,13),(11,14),(12,15),(13,16),(14,17),(15,18),(16,19),(17,20),(18,21),(19,22),(20,23)]

Implementando a função **foldr**. Se a lista é vazia, retorna o número. Senão, aplica a função passada como parâmetro no número e chama a função recursivamente.

As aplicações exemplo passam os operadores (*), (+), uma expressão lambda e a função soma.

In [20]:
soma x y = x + y

foldR :: (Int -> Int -> Int) -> Int -> [Int] -> Int
foldR f nro []    = nro
foldR f nro (h:t) = f h (foldR f nro t) 

foldR (*) 1 [1,2,3,4]
foldR (+) 0 [1,2,3,4]
foldR (\x y -> 2*x - y) 0 [1,2,3,4]
foldR soma 0 [1,2,3,4]

24

10

-4

10

Implementação do fold left, começando pela esquerda

In [25]:
foldL :: (Int -> Int -> Int) -> Int -> [Int] -> Int
foldL f nro [] = nro
foldL f nro (h:t) = foldL f (f nro h) t

foldL (*) 1 [1,2,3,4,5]
foldL (+) 0 [1,2,3,4,5]

120

15

Implementação da função filtro.

In [38]:
filtro :: (Int -> Bool) -> [Int] -> [Int]
filtro condicao l = [x | x <- l, condicao x]

filtro (> 5) [3, 4, 5, 6]
filtro (\x -> x `mod` 2 == 0) [3, 4, 5, 6]

[6]

[4,6]

### Recursão pela cauda

As funções acima fazem chamadas recursivas e a aplicação da função `f` passada como parâmetro é feita apenas no retorno da recursão. Esta é uma implementação comum de recursividade, porém pode estourar a pilha de processamento rapidamente, pois os valores não avaliados estão todos na memória.

Recursão pela cauda, ou __tail recursion__, é uma técnica de implementação de recursão onde o operador (função passada como parâmetro) é avaliado **ANTES** da chamada recursiva. Não há o empilhamento de todos os valores.

Abaixo a implementação da função foldAcc. Note que a função `f` é avaliada antes da avaliação da `foldAcc`.

Os 2 links abaixo, do site oficial da linguagem Haskell, tem ilustrações completas sobre estes aspectos.
https://wiki.haskell.org/Fold
https://wiki.haskell.org/Foldr_Foldl_Foldl'

In [41]:
foldAcc f nro []     = nro
foldAcc f nro (h:t) = fold_acc f (f nro h) t

foldAcc (+) 0 [1,2,3,4,5]

15