# Tipos de Datos, Firmas y Polimorfismo


## Indice

- Introducción pragmática a tipos
- Firmas de funciones
- Trabajando con funciones
    - Variables en Haskell
    - Funciones infijas y prefijas    
- Tipos de Datos comunes
- Valores polimórficos y variables de tipo
- Diversión con listas!

## Introducción pragmática a tipos

### El `::`

Un tipo es una etiqueta que cada expresión tiene y restringe su uso.

Utilizamos el símbolo *dos puntos duplicado* para mostrar o asignar el tipo de una expresión. Por ejemplo, el código

``` haskell
miexpresion :: MiTipo
```

nos indica que la expresión `miexpresión` tiene tipo `MiTipo`.

### Tipos usados frecuentemente

Existen tipos estándar que son utilizados frecuentemente en Haskell:

* `Int` y `Integer` para números enteros.
* `Float` y `Double` para números de punto flotante y reales.
* `Bool` para `True` y `False`.
* `Char` para caracteres.
* `String` para cadenas de texto.

### Cómo chequear un tipo?


El comando `:type` (o en forma abreviada `:t`) utilizado en el intérprete GHCI, seguido por una expresión válida , nos indicará su tipo.
 

In [1]:
:type True

:type False

:t (3 < 5)

:t 'A'

:t "Hello world!"    

## Firma de una función

El símbolo `::` debe ser leído como "es del tipo", e indica el tipo de la *firma*. Expliquemos que es el el tipo de la firma con el siguiente ejemplo. En Haskell, una función que eleva al cuadrado su argumento se define de la siguiente forma:

In [None]:
cuadrado :: Int -> Int
cuadrado v = v * v

La primera línea contiene la  **firma**, la segunda línea contiene la  **definición** de la función `cuadrado`.


* La **firma** de una función es un mensaje a todo elmundo de la existencia de dicha función, este es su nombre y estos son los tipos con los cuales trabaja. 

* La **definición** de una función es información respecto a lo que exactamente hace dicha función

En la firma

```haskell
cuadrado :: Int -> Int
```

dos partes están *separadas* por doble dos puntos en 


* el **nombre** de la función a la izquierda

* el **tipo de función** a la derecha.

**Todo dato en un programa Haskell es de un tipo específico.** Y considerando que las funciones trabajan con datos, su **firma contiene los tipos de sus entradas y salidas, separadas por flechas `->`**.

La firma de la función para elevar al cuadrado `cuadrado` nos indica que acepta un *único* argumento del tipo `Int` y retorna un valor del mismo tipo `Int`.

Si hay más de un argumento, la firma se adapta. Por ejemplo, la firma de la función `producto` que retorna el producto de dos enteros recibidos como argumentos, puede verse así: 

In [2]:
producto :: Int -> Int -> Int
producto x y = x * y

Tiene dos argumentos de tipo `Int` , y su salida también es de tipo `Int`. 

En la  **definición** de una función, el signo de `=` separa el código en dos partes.


* **Cabezal** es el código a la izquierda de `=` y consiste en el  **nombre de una función** y **nombres de argumentos** (nombres, no tipos!), separados por espacios.
 
* **Cuerpo** es el código a la derecha de `=` expresa la esencia de la función, su contenido.

### Que nos indica la firma de una función?

Haskell es un lenguaje de programación *funcional* y cada programa consiste en *funciones*. Cada función toma un número fijo de parámetros de ciertos tipos y retorna un valor que también tiene un tipo determinado. Por ejemplo, la función

``` haskell
not :: Bool -> Bool
``` 

toma un parámtero de tipo `Bool` y retorna su negación, la cual también es de tipo `Bool`. 


Observando la *flecha más a la derecha `->`* en la firma, se entiende que
* todo lo que está a la izquierda de ella son **tipos de argumentos**, los cuales a su vez también pueden estar separados por flechas `->`,
* todo lo que está a la derecha de ella es **el tipo del valor calculado**.

## Trabajando con funciones

### Variables en Haskell (nombres/definiciones)

Observa la siguiente función:

In [1]:
nombre = "Bob"

Si no tenemos parámetros, tenemos una función que siempre retorna el mismo valor -un `String`-

O sea, tenemos una expresión de tipo:

In [2]:
nombre :: String
nombre = "Bob"

**Este tipo de funciones que no toman parámetros son llamadas usualmente definición o nombre**

De todas formas, también pueden ser llamadas variables, ya que así son llamadas en la mayoría de los lenguajes de programación. Pero "variable" no siempre significa lo mismo.

Considerando que no podemos cambiar el valor de una definición (la expresión a la derecha de `=` siempre evaluará al mismo resultado), `nombre`y `Bob` son esencialmente la misma cosa. Y los podemos utilizar indistintamente.

Cuando hablamos de los lenguajes de programación en general, una variable es como una caja que contiene un valor. El nombre de la variable se encuentra escrito al costado de la caja. Se pueden poner valores adentro de la caja, y -en la mayoría de los lenguajes de programación- se podrá cambiar el valor dentro de la caja.

```haskell
-- ESTO NO ES CODIGO HASKELL VALIDO!!!
x = 3
7 + x   -- 10
x = 5
7 + x   -- 12
```

OOOOOOOOhhhhhh pero no con Haskell, no, no, no! Una vez se le ha indicado a Haskell que `x` significa `3`, el `3` se mantendrá para siempre!


En términos técnicos: 

Las variables en Haskell son **inmutables.**

En Haskell el concepto de variable es diferente. Haskell tiene variables, pero en un sentido matemático. En el sentido de cuando decimos: 

```Haskell
x = 3
pais = "Paris"
letra = 'a'
esVerdadero = True
```

Estamos estableciendo que los términos a la izquierda del signo `=` son **intercambiables** con los términos a la derecha. 

Y esto también aplica a los parámetros de la función:

In [None]:
volumenCilindro r h = pi * r^2 * h 

En este caso, una vez que le pasamos los valores a los parámetros de `volumenCilindro`, no podemos cambiarlos en el cuerpo de la función. Podemos utilizar la función nuevamente y pasarle parámetros diferentes, pero no los podemos *cambiar* una vez que los hemos pasado.

## Notación Prefija e Infija

Las funciones pueden ser aplicadas (utilizadas) en dos notaciones diferentes: prefija e infija.

### Prefija

Observemos la siguiente expresión: 

In [None]:
prod x y = x * y
prod 4  5

`prod` es utilizada en **forma prefija**, o sea **antes de sus argumentos**. 

### Infija


Observemos la siguiente expresión: 

In [None]:
1 + 2

`+` es de hecho una función! Y está siendo utilizada en su **forma infija**, o sea **entre sus argumentos**.

Las funciones definidas para una forma de aplicación infija son llamadas **operadores.**

Y como sabemos si una función es infija o prefija? Bueno...

Las funciones definidas **solamente con símbolos** serán automáticamente consideradas como **funciones infijas**, sino serán funciones prefijas.

De todas formas una función infija puede ser utilizada en su forma prefija y visceversa.

### Infija a Prefija y visceversa

Utilizaremos paréntesis en torno a una función infija para utilizarla en forma prefija: 

In [None]:
(+) 1 2

Para chequear el tipo de una función infija, también debemos rodearla con paréntesis:

In [None]:
:t (+)

<div class="alert alert-block alert-info">
Estoy seguro que habrás notado que el tipo en la firma de `+` luce diferente a otros previos. Esto se debe a que utiliza tipos polimórficos y tipos de clases. Estudiaremos los tipos polimórficos en el día de hoy y tipos de clasees en lecciones futuras. Por ahora, no te preocupes demasiado.
</div>

Utilizamos el tilde invertido \` rodeando una función prefija para utilizarla como infija:

In [None]:
4 `prod` 5

## Tipos de datos comunes


### Tipos de datos Enteros: `Int` y `Integer`


- `Integer` es un tipo con precisión arbitraria: podrá contener cualquier entero -sin importar cuan grande sea- hasta el límite de la memoria de la máquina.

Esto significa que nunca tendrás desbordamientos (overflows) aritméticos, pero eso también implica que la aritmética es relativamente lenta.

- En cambio los valores de tipo `Int`, encuentran acotados en el rango $±2^{63}$ *(para CPUs de 64-bit)*.

Esto limita los valores que `Int` puede contener, pero lo hace más eficiente.

Veamos esto en la práctica:

In [None]:
2^62 :: Int -- Todo bien

In [None]:
2^64 :: Int -- Oh no!

In [None]:
2^127 :: Integer -- Todo bien nuevamente

Pero y que pasa con los números reales? Números con lugares decimales?. Para ello tenemos `Float` y `Double`.

### Tipos de número con punto flotante: `Float` y ` Double`

`Float` es un tipo real de punto flotante con precisión simple (32 bits), mientras `Double` es un tipo real de punto flotante con precisión doble (64 bits).

Veamos que ocurre si queremos mostrar los primeros 20 dígitos de pi (π) en ambos casos: 

In [None]:
3.14159265358979323846 :: Float

3.14159265358979323846 :: Double

Puedes decir que `Double` es muuuuucho más preciso que `Float`.

Teóricamente, las razones para utilizar un tipo u otro son de alguna forma análogas a los casos `Int` y `Integer`.
`Double` tiene doble precisión, pero consume más memoria ya que utiliza el doble de bits para representar los números. 

PERO!

Recomendación basada en usos reales:

- **Aunque no te importen especialmente los valores exactos, utiliza `Double.`** En las computadoras modernas, rara vez hay una desventaja respecto a la velocidad, y con `Double`, tienes mucha menos probabilidad de pegarte un tiro en el pie por errores de redondeo.

- Si te encuentras en una configuración en la cual **las cantidades exactas son críticas** (p.ej: finanzas y contabilidad), una buena idea puede ser **utiliza los tipos de datos `Rational` o `Decimal`**. Estos tipos evitan por completo los errores de redondeo. Los veremos en futuras lecciones.

### Tipo de datos Booleano `Bool`



El tipo de datos `Bool` contiene únicamente dos valores: `True` y `False`.

Números, caracteres y cadenas de caracteres pueden ser comparados utilizando los usuales **operadores de comparación** para producir un valor `Bool`: $$==,~~/=,~~<=,~~>=,~~<,~~>$$

In [None]:

5 /= 0 -- True

3 >= 0 -- True

7.2 < 6.1 -- False

pi > 3.14 -- True

También tenemos los operadores `&&` (**AND**) y `||` (**OR**) que nos permiten la combinación de valores:

- El operador `&&` (AND) returna `True` si ambos booleanos a su izquierda y derecha son `True`.
- El operador `||` (OR) returna `True` si alguno de ellos es `True`.

In [None]:
:t (&&)
:t (||)

True && False
True || False

### Tipo de datos Carácter  `Char`

`Char` es el tipo que usamos para representar un caráctere *Unicode*

<div class="alert alert-block alert-info">
<p>
El estándar Unicode (Unicode) es un conjunto de reglas que imponen una forma de tratar y expresar texto. Esto es necesario debido a que las computadoras piensan en números (ceros y unos), y debemos decidir colectivamente que números representan que caracteres.
</p>
<p>
Actualmente es un poco complicado (ver: <a href="https://en.wikipedia.org/wiki/Character_encoding">Character encoding</a>). Pero para nuestro propósito, sólo nos interesa saber que podemos utilizar casi cualquier símbolo que alguna vez necesitaremos utilizando caracteres Unicode. Letras, números y más 140K símbolos.
</p>
</div>

Escribimos valores del tipo Char (caracteres Unicode) entre tildes simples. Así: 

In [None]:
'a'
'@'
'7'

Notar que si tu escribes un número rodeado de tildes simpoles (como en la última expresión), Haskell no lo tratará como un número. Lo tratará como cualquier otro carácter. O sea no se puede realizar matemática con `'7'` (con tildes simples), pero sí se puede con `7` (sin tildes simples).

<div class="alert alert-block alert-warning">
Importante: Puedes escribir caracteres simples uno por vez! Algo como <code>'hi'</code> no es un <code>Char</code>valido! 
</div>

Entonces, como puedes escribir oraciones enteras? Ya te lo diré, pero antes de eso debes aprender acerca de listas.

### Listas

En Haskell, **las listas son una estructura de datos homogénea**

Esta simplemente es una forma elegante de decir que las listas almacenan elementos del mismo tipo. O sea, podemos tener un lista de `Int` o una lista de `Char`, pero no una lista de una mezcla de ellos.

* Las listas se indican mediante paréntesis rectos `[1,5,3,-4,0]` y los valores dentro de las listas  **se separan con comas**.

* El tipo de una lista se expresa como el tipo de los elementos que la misma contiene, redeados de corchetes rectos. Una lista de tipo `[Int]` contiene números de tipo `Int`. Una lista de tipo `[Char]` contiene elementos de tipo `Char`.

In [None]:
:t ['a', 'b', 'c', 'd']

:t [True,False, 3 > 2, 'a' == 'b']

### Strings

**Strings respresenta lista de caracteres.** Puedes utilizar el tipo `String` para escribir mensajes, valores alfanuméricos, símbolos, etc. A diferencia de `Char`s, los `String`s deben ser escritos entre **tildes dobles** así:

In [None]:
"Hellooooooo!"

Lo cual siginifica que los siguientes dos valores son lo mismo!:

In [None]:
['H','i','!'] == "Hi!"

Y también que `String` y `[Char]` son el mismo tipo! Más específicamente, `String` es azúcar sintáctico (sintaxis diseñada para facilitar la lectura y expresión) para `[Char]`! Por lo tanto pueden ser utilizados indistintamente!

Lo que no es intercambiable en Haskell son los tildes simples con los dobles. `String` (escrito entre tildes dobles) son listas de `Char` (escrito entre tildes simples). No son lo mismo!:

In [None]:
:t "A"
:t 'A'

Todo codificador sabe que las listas son extremadamente útiles. Pero y si queremos colocar juntos valores de tipos diferentes? Ahí es cuando las tuples son útiles!

### Tuplas

Las Tuplas son estructuras utilizadas para almacenar **elementos heterogéneos** como un solo valor.

Representamos las tuplas comenzando con un paréntesis de apertura, escribiendo todos los elementos separadso por una coma y finalizamos con un paréntesis de cierre. Este es un ejemplo de una tupla con 3 elementos:

In [None]:
('a', 3, True)

Se parecen mucho a las listas, pero son hay dos diferencias esenciales: 

* **Las tuplas pueden almacenar elementos de tipos diferentes:** como puedes ver en el ejemplo previo, las tuplas pueden almacenar elementos de diferentes tipos, mientras que las listas no.

* **Las tuplas tienen un tamaño fijo:**. Tu puedes incrementar el tamaño de una lista mediante la concatenación o de otras formas, pero el tamaño de una tupla no puede ser incrementado o disminuído. Una vez se ha indicado que una tupla tiene N elementos, permanece siempre teniendo N elementos.

**Y estas diferencias esenciales se reflejan en el tipo de las tuplas**

El tipo tupla depende de: 
- El tipo de sus elementos
- El orden de los elementos
- La cantidad de elementos

Por ejemplo:

In [None]:
:t ('a', True)

:t (True, 'a')

:t (True, 'a', 'b')

:t (True)

Como puedes ver `('a', True) :: (Char, Bool)`, `(True, 'a') :: (Bool, Char)`, y `('a', True, True) :: (Char, Bool, Bool)` todos tiene diferentes tipos. En lo que respecta al compilador, esas tres tuplas son tan diferentes entre ellas como lo son `Float` y `Char`.

Te has dado cuenta que si tratas de crear una tupla con un solo elemneto, GHCi retorna solamente el elemento? (Ver las últimas dos expresiones del bloque de código anterior). Esto se debe a que no hay tuplas de un solo elmento! Tener una tupla de un solo elemento no aportaría ningún valor extra. Por lo tanto, Haskell ignora la tupla y evalúa sólo el elemento.

## Valores Polimórficos y variables de Tipo

Lo grandeza de los tipos es que nos protegen de nosotros mismos! Si decimos que una función toma como tipo de entrada `[Char]`, Haskell chequeará que cumplamos con dicho requerimiento cada vez que usemos dicha función. Si le pasamos un `Double` el compilador nos gritará para que corrijamos el error!

Pero ahora tenemos un problema! Imagina que creamos la función `prod`:

In [None]:
prod :: Int -> Int -> Int
prod x y = x * y

La misma funciona perfectamente para valores de tipo `Int`. ¿Pero que pasa si la precisamos para valores de tipo `Double`? Sabemos que funcionará debido a siguen siendo números y la fórmula proveerá la respuesta correcta.

*Podríamos* crear una nueva función que haga lo mismo pero especificando un tipo diferente:

In [None]:
prodForDubles :: Double -> Double -> Double
prodForDoubles x y = x * y

Técnicamente funciona. Pero y que pasa con los tipos `Float`y `Integer`? Si tenemos que duplicar las funciones para cada caso, eso se vuelve rápidamente insostenible!

**Tipos Polimórficos al rescate!**

Polimórfico significa que algo tiene muchas formas. Y **un valor polimórfico es un valor que puede tener múltiples tipos** (Por ejemplo, `4` puede ser `Int`, `Integer`, `Float`, ...)

Por ejemplo, imagina que queremos crear una función que toma una tupla con dos valores (también llamada par) y retorna el primer valor. Como esto: 

In [None]:
first (x,y) = x

¿Que tipo debe tener? No me preocupan particularmente los tipos de los elementos, ya que no hacemos nada con ellos! No hago operaciones aritméticas, manipulación de texto o alguna otra cosa! Es más, solamente retorno el primer elemento y listo!

En estos casos, especificamos una firma con variables de Tipo!

In [None]:
first :: (a, b) -> a
first (x,y) = x

first ('a', "hi!")

Esta firma se le de la siguiente forma: "La función `first` recibe un par de tipo (a,b) y retorna un valor del tipo `a`."

<div class="alert alert-block alert-warning">
<b>Importante:</b> Tipos específicos (p.ej., <code>Char</code>, <code>Bool</code>, <code>Int</code>) comienzan con mayúsculas. Pero los tipos polimórficos comienzan con minúsculas. Podemos utilizar nombres largos para los tipos polimórficos, pero lo usual es utilizar una letra.(p.ej., <code>a</code>, <code>b</code>, <code>c</code>).
</div>

Esta función "`first`" que hemos creado actualemente ya viene con Haskell, pero su nombre es `fst`! Y viene con su contraparte `snd`!:

In [None]:
:t fst
:t snd

fst (1,2)
snd (1,2)

`a` y `b` son variables de tipo, lo que significa que pueden ser de cualquier tipos. Independientemente del tipo, el valor retornado por `first` tiene que ser del mismo tipo que el primer elemento del par (ya que los dos son de tipo `a`).

Al utilizar variables de tipo, podemos utilizar la función `first` con pares de cualquier tipo (valores polimórficos)!

Observa que `a` y `b` ambos PUEDEN ser de cualquier tipo Y de tipos diferentes. Pero no TIENEN que serlo. Puedes utilizar `first` en una tupla con valores del mismo tipo: `('a','b') :: (Char, Char)`.

Otro ejemplo de funciones polimórficas son las funciones `head` y `tail`.

Puedes utilizar `head` para obtener el primer elemento de una lista y `tail` para obtener todos los elementos de una lista *excepto* el primero.

In [None]:
list = [1,2,3,4]
list

:t head
head list

:t tail
tail list

No nos importan los tipos específicos. Estamos simplemente extrayendo un elemento. Entonces, el parámetro es una lista polimórfica (una lista de cualquier tipo, llamémosla `[a]`). El resultado tiene que ser un elemento del mismo tipo que los elementos de la lista. Por ese motivo tiene que ser `a`.

Ahora que nos hemos familiarizado con todos esetos tipos, tengamos un poco de diversión con listas! (Dejaremos la diversión con tuplas una vez que estudiemos concordancia de patrones (pattern matching). De esa forma será más divertido.)

## Diversión con listas!

 Cada elemento tiene un índice determinado por su posición en la lista - comenzando en 0 (cero).

Utilizaremos el operador `!!` para acceder a un elemento específico adentro de la lista utiliando su índice:

In [None]:
:t (!!)
"abc" !! 1         
[12,13,16,18] !! 3 

Las tuplas no tienen índices, o sea que no es posible extraer elementos de una tupla de esa forma. Pero podemos utilizar `fst` y `snd` para pares y concordancia de patrones para tuplas con más elementos. (Ver lección concordancia de patrones.)

Las listas pueden ser definidas por un rango: 

In [None]:
[3..22]

También podemos especificar el paso de incremento entre los elementos del rango:

In [None]:
[3,5..22]
['a','c'..'z']

El resultado de la primer expresión contendrá todos los elementos comenzando en `3` con un paso `2=5-3` que no exceden el `22` (si el último elemento no se ajusa al patrón del paso definido, será omitido del resultado final).

El resultado de la segunda expresión contendrá todas las minúsculas del alfabeto, excepto la `b`.

Es importante destacar que sólo es posible especificar un tamaño de paso!

Si el incremento es negativo, los elementos serán en orden decreciente:

In [None]:
[17,14..3]

También puedes utilizar rangos para crear listas infinitas, simplemente no indicando el límite superior.

* `[1..]` is the infinite list $[1,2,3,4,5,...]$.



* `[1,3..]` is the infinite list $[1,3,5,7,9,...]$. 

Ahora, si simplemente evaluamos la lista por si misma, el programa se ejecutará para siempre (o hasta que aborte). Entonces, las listas infinitas usualmente son utilizadas como parte de expresiones.

También tenemos la función `take` que retorna una lista conteniendo los primeros `n` elementos de una lista `l` (potencialmente infinita).

In [None]:
:t take

take 3 ['x'..]

take 20 [1,3..]

take 7 [5,3..]  

Utilizamos el operador *cons* (notación `:`) para añadir un elemento al inicio de la lista:

In [None]:
:t (:)
2 : [3,4,5]

 Y utilizamos el operador `++` para la **concatenación** de dos listas:

In [None]:
:t (++)
[1,3,7,9] ++ [3,3,1]

Observar que `++` es una función que tomas dos listas, y `:` es una función que toma un elemento y una lista. 

**Atención** El uso repetido del operador `++` en listas largas (independientemente que estés anexando un solo elemento a una lista, (p.ej: `[1,2,3] ++ [4]`), fuerza a Haskell a **recorrer toda la lista** de la parte izquierad de `++`.  Entonces, anexar algo al final de una lista con cincuenta millones de elementos, tomará un tiempo! Sin embargo, añadir algo al comienzo de una lista utilizando el operador cons `:` es instantáneo!

Entre las varias funciones definidas sobre listas, mencionamos brevemente las siguientes:

* `length` recibe una lista y retorna su largo;

* `null` chequea si una lista es vacía;

* `sum` recibe una lista de númerso y retorna su suma;

* `elem` recibe un elemento `x` y una lista de elementos `l` del mismo tipo y chequea si `x` es un elemento de la lista `l`.

In [None]:
length [2,4,5,6,7]

null [2]

sum [-1,0,1,6,-5,-1]

5 `elem` [6,3,5,7,5]

Esto es todo sobre listas por ahora. Durante el curso seguiremos aprendiendo más acerca de ellas!

### Juntando y separando texto

Existen situaciones en las cuales lo que quieres hacer con tu lista son cosas específicamente relacionadas con texto. Haskell tiene funciones específicas para ese tipo de situaciones.

Por ejemplo:

* `words :: String -> [String]`    separa a `String` en una lisa de palabras, delimitadas por espacio en blanco.

* `unwords :: [String] -> String`  es la operación inversa a words. Junta las palabras delimitándolas con un espacio en blanco.

* `lines :: String -> [String]`    divide el argumento en una lista de líneas, utilizando el carácter nueva línea (`\n`) como separador.

* `unlines :: [String] -> String`  crea un `String` a partir de una lista de strings, agregando el carácter nueva línea (`\n`) entre las líneas originales.

In [None]:
words "Ser o no ser?"

lines "Cómo has estado?? \n Estoy bien, y tú?"