# Tipos de Datos, Firmas y Polimorfismo


## Indice

- Introducción pragmática a tipos
- Firmas de funciones
- Trabajando con funciones
    - Variables en Haskell
    - Funciones infijas y prefijas    
- Tipos de Datos comunes
- Valores polimórficos y tipos de variables
- Diversión con listas!

## Introducción pragmática a tipos

### El `::`

Un tipo es una etiqueta que cada expresión tiene y restringe su uso.

Utilizamos el símbolo *dos puntos duplicado* para mostrar o asignar el tipo de una expresión. Por ejemplo, el código

``` haskell
miexpresion :: MiTipo
```

nos indica que la expresión `miexpresión` tiene tipo `MiTipo`.

### Tipos usados frecuentemente

Existen tipos estándar que son utilizados frecuentemente en Haskell:

* `Int` y `Integer` para números enteros.
* `Float` y `Double` para números de punto flotante y reales.
* `Bool` para `True` y `False`.
* `Char` para caracteres.
* `String` para cadenas de texto.

### Cómo chequear un tipo?


El comando `:type` (o en forma abreviada `:t`) utilizado en el intérprete GHCI, seguido por una expresión válida , nos indicará su tipo.
 

In [1]:
:type True

:type False

:t (3 < 5)

:t 'A'

:t "Hello world!"    

## Firma de una función

El símbolo `::` debe ser leído como "es del tipo", e indica el tipo de la *firma*. Expliquemos que es el el tipo de la firma con el siguiente ejemplo. En Haskell, una función que eleva al cuadrado su argumento se define de la siguiente forma:

In [None]:
cuadrado :: Int -> Int
cuadrado v = v * v

La primera línea contiene la  **firma**, la segunda línea contiene la  **definición** de la función `cuadrado`.


* La **firma** de una función es un mensaje a todo elmundo de la existencia de dicha función, este es su nombre y estos son los tipos con los cuales trabaja. 

* La **definición** de una función es información respecto a lo que exactamente hace dicha función

En la firma

```haskell
cuadrado :: Int -> Int
```

dos partes están *separadas* por doble dos puntos en 


* el **nombre** de la función a la izquierda

* el **tipo de función** a la derecha.

**Todo dato en un programa Haskell es de un tipo específico.** Y considerando que las funciones trabajan con datos, su **firma contiene los tipos de sus entradas y salidas, separadas por flechas `->`**.

La firma de la función para elevar al cuadrado `cuadrado` nos indica que acepta un *único* argumento del tipo `Int` y retorna un valor del mismo tipo `Int`.

Si hay más de un argumento, la firma se adapta. Por ejemplo, la firma de la función `producto` que retorna el producto de dos enteros recibidos como argumentos, puede verse así: 

In [2]:
producto :: Int -> Int -> Int
producto x y = x * y

Tiene dos argumentos de tipo `Int` , y su salida también es de tipo `Int`. 

En la  **definición** de una función, el signo de `=` separa el código en dos partes.


* **Cabezal** es el código a la izquierda de `=` y consiste en el  **nombre de una función** y **nombres de argumentos** (nombres, no tipos!), separados por espacios.
 
* **Cuerpo** es el código a la derecha de `=` expresa la esencia de la función, su contenido.

### Que nos indica la firma de una función?

Haskell es un lenguaje de programación *funcional* y cada programa consiste en *funciones*. Cada función toma un número fijo de parámetros de ciertos tipos y retorna un valor que también tiene un tipo determinado. Por ejemplo, la función

``` haskell
not :: Bool -> Bool
``` 

toma un parámtero de tipo `Bool` y retorna su negación, la cual también es de tipo `Bool`. 


Observando la *flecha más a la derecha `->`* en la firma, se entiende que
* todo lo que está a la izquierda de ella son **tipos de argumentos**, los cuales a su vez también pueden estar separados por flechas `->`,
* todo lo que está a la derecha de ella es **el tipo del valor calculado**.

## Trabajando con funciones

### Variables en Haskell (nombres/definiciones)

Observa la siguiente función:

In [1]:
nombre = "Bob"

Si no tenemos parámetros, tenemos una función que siempre retorna el mismo valor -un `String`-

O sea, tenemos una expresión de tipo:

In [2]:
nombre :: String
nombre = "Bob"

**Este tipo de funciones que no toman parámetros son llamadas usualmente definición o nombre**

De todas formas, también pueden ser llamadas variables, ya que así son llamadas en la mayoría de los lenguajes de programación. Pero "variable" no siempre significa lo mismo.

Considerando que no podemos cambiar el valor de una definición (la expresión a la derecha de `=` siempre evaluará al mismo resultado), `nombre`y `Bob` son esencialmente la misma cosa. Y los podemos utilizar indistintamente.

Cuando hablamos de los lenguajes de programación en general, una variable es como una caja que contiene un valor. El nombre de la variable se encuentra escrito al costado de la caja. Se pueden poner valores adentro de la caja, y -en la mayoría de los lenguajes de programación- se podrá cambiar el valor dentro de la caja.

```haskell
-- ESTO NO ES CODIGO HASKELL VALIDO!!!
x = 3
7 + x   -- 10
x = 5
7 + x   -- 12
```

OOOOOOOOhhhhhh pero no con Haskell, no, no, no! Una vez se le ha indicado a Haskell que `x` significa `3`, el `3` se mantendrá para siempre!


En términos técnicos: 

Las variables en Haskell son **inmutables.**

En Haskell el concepto de variable es diferente. Haskell tiene variables, pero en un sentido matemático. En el sentido de cuando decimos: 

```Haskell
x = 3
pais = "Paris"
letra = 'a'
esVerdadero = True
```

Estamos estableciendo que los términos a la izquierda del signo `=` son **intercambiables** con los términos a la derecha. 

Y esto también aplica a los parámetros de la función:

In [None]:
volumenCilindro r h = pi * r^2 * h 

En este caso, una vez que le pasamos los valores a los parámetros de `volumenCilindro`, no podemos cambiarlos en el cuerpo de la función. Podemos utilizar la función nuevamente y pasarle parámetros diferentes, pero no los podemos *cambiar* una vez que los hemos pasado.

## Notación Prefija e Infija

Las funciones pueden ser aplicadas (utilizadas) en dos notaciones diferentes: prefija e infija.

### Prefija

Observemos la siguiente expresión: 

In [None]:
prod x y = x * y
prod 4  5

`prod` es utilizada en **forma prefija**, o sea **antes de sus argumentos**. 

### Infija


Observemos la siguiente expresión: 

In [None]:
1 + 2

`+` es de hecho una función! Y está siendo utilizada en su **forma infija**, o sea **entre sus argumentos**.

Las funciones definidas para una forma de aplicación infija son llamadas **operadores.**

Y como sabemos si una función es infija o prefija? Bueno...

Las funciones definidas **solamente con símbolos** serán automáticamente consideradas como **funciones infijas**, sino serán funciones prefijas.

De todas formas una función infija puede ser utilizada en su forma prefija y visceversa.

### Infija a Prefija y visceversa

Utilizaremos paréntesis en torno a una función infija para utilizarla en forma prefija: 

In [None]:
(+) 1 2

Para chequear el tipo de una función infija, también debemos rodearla con paréntesis:

In [None]:
:t (+)

<div class="alert alert-block alert-info">
Estoy seguro que habrás notado que el tipo en la firma de `+` luce diferente a otros previos. Esto se debe a que utiliza tipos polimórficos y tipos de clases. Estudiaremos los tipos polimórficos en el día de hoy y tipos de clasees en lecciones futuras. Por ahora, no te preocupes demasiado.
</div>

Utilizamos el tilde invertido \` rodeando una función prefija para utilizarla como infija:

In [None]:
4 `prod` 5

## Tipos de datos comunes


### Tipos de datos Enteros: `Int` y `Integer`


- `Integer` es un tipo con precisión arbitraria: podrá contener cualquier entero -sin importar cuan grande sea- hasta el límite de la memoria de la máquina.

Esto significa que nunca tendrás desbordamientos (overflows) aritméticos, pero eso también implica que la aritmética es relativamente lenta.

- En cambio los valores de tipo `Int`, encuentran acotados en el rango $±2^{63}$ *(para CPUs de 64-bit)*.

Esto limita los valores que `Int` puede contener, pero lo hace más eficiente.

Veamos esto en la práctica:

In [None]:
2^62 :: Int -- Todo bien

In [None]:
2^64 :: Int -- Oh no!

In [None]:
2^127 :: Integer -- Todo bien nuevamente

Pero y que pasa con los números reales? Números con lugares decimales?. Para ello tenemos `Float` y `Double`.

### Tipos de número con punto flotante: `Float` y ` Double`

`Float` es un tipo real de punto flotante con precisión simple (32 bits), mientras `Double` es un tipo real de punto flotante con precisión doble (64 bits).

Veamos que ocurre si queremos mostrar los primeros 20 dígitos de pi (π) en ambos casos: 

In [None]:
3.14159265358979323846 :: Float

3.14159265358979323846 :: Double

Puedes decir que `Double` es muuuuucho más preciso que `Float`.

Teóricamente, las razones para utilizar un tipo u otro son de alguna forma análogas a los casos `Int` y `Integer`.
`Double` tiene doble precisión, pero consume más memoria ya que utiliza el doble de bits para representar los números. 

PERO!

Recomendación basada en usos reales:

- **Aunque no te importen especialmente los valores exactos, utiliza `Double.`** En las computadoras modernas, rara vez hay una desventaja respecto a la velocidad, y con `Double`, tienes mucha menos probabilidad de pegarte un tiro en el pie por errores de redondeo.

- Si te encuentras en una configuración en la cual **las cantidades exactas son críticas** (p.ej: finanzas y contabilidad), una buena idea puede ser **utiliza los tipos de datos `Rational` o `Decimal`**. Estos tipos evitan por completo los errores de redondeo. Los veremos en futuras lecciones.

### Tipo de datos Booleano `Bool`



El tipo de datos `Bool` contiene únicamente dos valores: `True` y `False`.

Números, caracteres y cadenas de caracteres pueden ser comparados utilizando los usuales **operadores de comparación** para producir un valor `Bool`: $$==,~~/=,~~<=,~~>=,~~<,~~>$$

In [None]:

5 /= 0 -- True

3 >= 0 -- True

7.2 < 6.1 -- False

pi > 3.14 -- True

También tenemos los operadores `&&` (**AND**) y `||` (**OR**) que nos permiten la combinación de valores:

- El operador `&&` (AND) returna `True` si ambos booleanos a su izquierda y derecha son `True`.
- El operador `||` (OR) returna `True` si alguno de ellos es `True`.

In [None]:
:t (&&)
:t (||)

True && False
True || False

### Tipo de datos Carácter  `Char`

`Char` es el tipo que usamos para representar un caráctere *Unicode*

<div class="alert alert-block alert-info">
<p>
El estándar Unicode (Unicode) es un conjunto de reglas que imponen una forma de tratar y expresar texto. Esto es necesario debido a que las computadoras piensan en números (ceros y unos), y debemos decidir colectivamente que números representan que caracteres.
</p>
<p>
Actualmente es un poco complicado (ver: <a href="https://en.wikipedia.org/wiki/Character_encoding">Character encoding</a>). Pero para nuestro propósito, sólo nos interesa saber que podemos utilizar casi cualquier símbolo que alguna vez necesitaremos utilizando caracteres Unicode. Letras, números y más 140K símbolos.
</p>
</div>

Escribimos valores del tipo Char (caracteres Unicode) entre tildes simples. Así: 

In [None]:
'a'
'@'
'7'

Notar que si tu escribes un número rodeado de tildes simpoles (como en la última expresión), Haskell no lo tratará como un número. Lo tratará como cualquier otro carácter. O sea no se puede realizar matemática con `'7'` (con tildes simples), pero sí se puede con `7` (sin tildes simples).

<div class="alert alert-block alert-warning">
Importante: Puedes escribir caracteres simples uno por vez! Algo como <code>'hi'</code> no es un <code>Char</code>valido! 
</div>

Entonces, como puedes escribir oraciones enteras? Ya te lo diré, pero antes de eso debes aprender acerca de listas.

### Listas

En Haskell, **las listas son una estructura de datos homogénea**

Esta simplemente es una forma elegante de decir que las listas almacenan elementos del mismo tipo. O sea, podemos tener un lista de `Int` o una lista de `Char`, pero no una lista de una mezcla de ellos.

* Las listas se indican mediante paréntesis rectos `[1,5,3,-4,0]` y los valores dentro de las listas  **se separan con comas**.

* El tipo de una lista se expresa como el tipo de los elementos que la misma contiene, redeados de corchetes rectos. Una lista de tipo `[Int]` contiene números de tipo `Int`. Una lista de tipo `[Char]` contiene elementos de tipo `Char`.

In [None]:
:t ['a', 'b', 'c', 'd']

:t [True,False, 3 > 2, 'a' == 'b']

### Strings

**Strings respresenta lista de caracteres.** Puedes utilizar el tipo `String` para escribir mensajes, valores alfanuméricos, símbolos, etc. A diferencia de `Char`s, los `String`s deben ser escritos entre **tildes dobles** así:

In [None]:
"Hellooooooo!"

Lo cual siginifica que los siguientes dos valores son lo mismo!:

In [None]:
['H','i','!'] == "Hi!"

Y también que `String` y `[Char]` son el mismo tipo! Más específicamente, `String` es azúcar sintáctico (sintaxis diseñada para facilitar la lectura y expresión) para `[Char]`! Por lo tanto pueden ser utilizados indistintamente!

Lo que no es intercambiable en Haskell son los tildes simples con los dobles. `String` (escrito entre tildes dobles) son listas de `Char` (escrito entre tildes simples). No son lo mismo!:

In [None]:
:t "A"
:t 'A'

Todo codificador sabe que las listas son extremadamente útiles. Pero y si queremos colocar juntos valores de tipos diferentes? Ahí es cuando las tuples son útiles!

### Tuplas

Las Tuplas son estructuras utilizadas para almacenar **elementos heterogéneos** como un solo valor.

Representamos las tuplas comenzando con un paréntesis de apertura, escribiendo todos los elementos separadso por una coma y finalizamos con un paréntesis de cierre. Este es un ejemplo de una tupla con 3 elementos:

In [None]:
('a', 3, True)

Se parecen mucho a las listas, pero son hay dos diferencias esenciales: 

* **Las tuplas pueden almacenar elementos de tipos diferentes:** como puedes ver en el ejemplo previo, las tuplas pueden almacenar elementos de diferentes tipos, mientras que las listas no.

* **Las tuplas tienen un tamaño fijo:**. Tu puedes incrementar el tamaño de una lista mediante la concatenación o de otras formas, pero el tamaño de una tupla no puede ser incrementado o disminuído. Una vez se ha indicado que una tupla tiene N elementos, permanece siempre teniendo N elementos.

**Y estas diferencias esenciales se reflejan en el tipo de las tuplas**

El tipo tupla depende de: 
- El tipo de sus elementos
- El orden de los elementos
- La cantidad de elementos

Por ejemplo:

In [None]:
:t ('a', True)

:t (True, 'a')

:t (True, 'a', 'b')

:t (True)

Como puedes ver `('a', True) :: (Char, Bool)`, `(True, 'a') :: (Bool, Char)`, y `('a', True, True) :: (Char, Bool, Bool)` todos tiene diferentes tipos. En lo que respecta al compilador, esas tres tuplas son tan diferentes entre ellas como lo son `Float` y `Char`.

Te has dado cuenta que si tratas de crear una tupla con un solo elemneto, GHCi retorna solamente el elemento? (Ver las últimas dos expresiones del bloque de código anterior). Esto se debe a que no hay tuplas de un solo elmento! Tener una tupla de un solo elemento no aportaría ningún valor extra. Por lo tanto, Haskell ignora la tupla y evalúa sólo el elemento.

## Polymorphic values and type variables



The great thing about types is that they protect us from ourselves! If we say that a function takes an input of type `[Char]`, Haskell will check that we meet that requirement each time we use that function. If we pass a `Double`, the compiler will yell at us to correct that mistake!

But now we have a problem! Imagine that we create the `prod` function:

In [None]:
prod :: Int -> Int -> Int
prod x y = x * y

It works perfectly for values of type `Int`. But what if we need it for values of type `Dobule`? We know that it'll work because they're still numbers, and the formula will provide the correct answer.

We *could* create a new function that does the same but specifies a different type:

In [None]:
prodForDubles :: Double -> Double -> Double
prodForDoubles x y = x * y

Technically, it works. But now, what about `Float` and `Integer` types? If we need to create duplicate functions for every case, this quickly becomes unsustainable!

**Polymorphic types to the rescue!**

Polymorphic means something that has multiple forms. And **a polymorphic value is a value that can have multiple types**. (For example, `4` can be `Int`, `Integer`, `Float`, ...)

For example, imagine that we want to create a function that takes a tuple with two values (also called pair) and returns the first value. Like this:

In [None]:
first (x,y) = x

Which type should it have? I don't particularly care about the types of the elements because I don't do anything with them! I don't do arithmetic, text-related stuff, or anything! Furthermore, I just got the first element back, and that's it!

In these cases, we specify a signature with type variables!

In [None]:
first :: (a, b) -> a
first (x,y) = x

first ('a', "hi!")

That signature reads: "The `first` function takes a pair of type `(a, b)` and returns a value of type `a`."

<div class="alert alert-block alert-warning">
<b>Important:</b> Specific types (i.e., <code>Char</code>, <code>Bool</code>, <code>Int</code>) start with capital letters. But polymorphic types start with lower case letters. We can use longer names for polymorphic types, but the usual is to use single letters (i.e., <code>a</code>, <code>b</code>, <code>c</code>).
</div>

This "`first`" function we just created actually comes with Haskell, but it's named `fst`! And it comes with its counterpart: `snd`!:

In [None]:
:t fst
:t snd

fst (1,2)
snd (1,2)

`a` and `b` are type variables, meaning they can be of any type. And no matter the type, the value returned by `first` has to be of the same type as the first element of the pair (because they are both of type `a`).

By using type variables, we can use the `first` function with pairs of any type (polymorphic values)!

Notice that `a` and `b` both CAN be of any type AND different types from each other. But they don't HAVE to be. You can use `first` on a tuple with values of the same type: `('a','b') :: (Char, Char)`.

Another example of polymorphic function is the `head` and `tail` functions.

You can use `head` to get the first element of the list and `tail` to get all the elements of the list *except* for the first one.

In [None]:
list = [1,2,3,4]
list

:t head
head list

:t tail
tail list

We don't care about the specific types. We're just extracting an element. So, the parameter is a polymorphic list (a list of any type, let's call it `[a]`). And the result has to be an element of the same type as the elements on the list. That's why it has to be `a`.

Now that we're familiar with all these types, let's have some fun with lists! (We'll leave fun with tuples after we learn pattern matching. It'll be more fun that way.)

## Fun with lists!

 Every element has an index determined by its position inside the list — starting at 0 (zero).

We use the `!!` operator to access a specific element inside a list by using its index:

In [None]:
:t (!!)
"abc" !! 1         
[12,13,16,18] !! 3 

Tuples don't have indices, so one cannot easily extract elements of tuples like this. But, we can use `fst` and `snd` for pairs and pattern matching for longer tuples. (See pattern matching lesson to know how.)

Lists can be defined by a range: 

In [None]:
[3..22]

And we can also specify a step between the items of the range:

In [None]:
[3,5..22]
['a','c'..'z']

The result of the first expression will hold all elements starting from `3` with a step `2 = 5 - 3` that doesn't exceed `22` (if the last element doesn't fit in a defined step pattern, it will be omitted from the result).

The result of the second expression will hold every other lower-case letter from the alphabet.

It's important to notice that you can only specify one-step size!

If the increment is negative, the elements will be listed in deceasing order:

In [None]:
[17,14..3]

You can also use ranges to make infinite lists by just not specifying an upper limit.


* `[1..]` is the infinite list $[1,2,3,4,5,...]$.



* `[1,3..]` is the infinite list $[1,3,5,7,9,...]$. 

Now, if we just evaluate the list by itself, the program will run forever (or until it crashes). So, infinite lists are usually used as part of expressions.

We also have the function `take` returns a list containing the first `n` elements in a (potentially infinite) list `l`.

In [None]:
:t take

take 3 ['x'..]

take 20 [1,3..]

take 7 [5,3..]  

We use the *cons* operator (denoted by a colon `:`) to prepend an element: 

In [None]:
:t (:)
2 : [3,4,5]

 And we use the **concatenation** `++` operator to put two lists together:

In [None]:
:t (++)
[1,3,7,9] ++ [3,3,1]

Notice that `++` is a function that takes two lists, and `:` is a function that takes an element and a list.

**Warning** Repeated usage of the `++` operator on long lists (even if you append a singleton list to a list, for instance: `[1,2,3] ++ [4]`), forces Haskell has to **walk through the whole list** on the left side of `++`. Therefore, putting something at the end of a list that's fifty million entries long, is going to take a while! However, putting something at the beginning of a list using the cons operator `:` is instantaneous! 

Among many other useful functions defined for lists, we briefly mention the following:

* `length` takes a list and returns its length;

* `null` checks if a list is empty;

* `sum` takes a list of numbers and returns their sum;

* `elem` takes an element `x` and a list of elements `l` of the same type and checks if `x` is an element of the list `l`.

In [None]:
length [2,4,5,6,7]

null [2]

sum [-1,0,1,6,-5,-1]

5 `elem` [6,3,5,7,5]

That's it about lists for now. But we'll keep learning more about them through the course!

### Joining and breaking text

There are situations when what you want to do with your list is specifically a text-related thing. Haskell has specific functions for that out of the box.

For example:

* `words :: String -> [String]`    breaks a `String` up into a list of words, which were delimited by white space.

* `unwords :: [String] -> String`  is an inverse operation to words. It joins words with separating spaces.

* `lines :: String -> [String]`    splits the argument into a list of lines, with new line characters (`\n`) serving as separators.

* `unlines :: [String] -> String`  creates a  `String` from an array of strings, appending new line characters (`\n`) between original strings. 

In [None]:
words "To be or not to be?"

lines "How are you doing? \n I'm fine, how about you?"