# Implementación funcional (Haskell)

Haskell es un lenguaje de programación funcional puro, estáticamente tipificado, concurrente y perezoso. 

En este **Notebook** estará dividido en dos partes, la primera mostrará la implementación del algoritmo de Euclides y la segunda parte mostraremos la invocación del algoritmo desde la parte que se encarga de leer los valores de entrada y procesarlos.

## Implementación del algoritmo de Euclides en Haskell
    
En los lenguajes funcionales puros como Haskell, la definición de funciones se hace a través de la declaración por partes y algunos casos haciendo uso de la recursividad. 

La definición del algoritmo de Euclides en el [lenguaje de programación Haskell](https://www.haskell.org/) se muestra a continuación:

In [None]:
gcd' :: Int -> Int -> Int
gcd' a b
  | a == b    = a
  | a <  b    = gcd' a       (b - a)
  | otherwise = gcd' (a - b) b

Observe en primer lugar, que el nombre de la función `gcd’` nos muestra la manera que Haskell permite nombrar a sus funciones muy cercana como lo hacen los matemáticos: $f$, $f'$, $f''$, etc. El nombre utilizado aquí `gcd'` se hace porque la biblioteca `Prelude` (base en Haskell) ya tiene definida una función `gcd` y lo que queremos es mostrar una implementación de dicha función en Haskell, por eso la comilla extra al final del nombre, para indicar que es una versión alternativa. 

Pero volvamos a la definición de la función, la primera línea nos muestra la firma (*signature*) de la función, ésta indica que se reciben dos parámetros de tipo entero y retorna un valor entero, los parámetros se separan utilizando el *operador* `->`. La segunda línea, nos muestra que se reciben dos parámetros nombrados `a` y `b`, luego viene lo que se conoce como un sistema de guardas, indicado por el símbolo `|` cada guarda. El objetivo de una guarda es establecer el valor de verdad del *predicado* que se encuentra después del símbolo '|', si este es verdadero se realiza la expresión que aparece después del símbolo igual (`=`), tenga en cuenta que aquí el símbolo `=` significa definición. Si el valor del predicado no es verdadero se sigue con el siguiente predicado hasta que se encuentre uno que sea verdadero o hasta que examinen todas en cuyo caso se genera un error.

El primer predicado `a = b`, nos indica que el valor el máximo común divisor ya se encuentra en la variable `a`. El siguiente predicado `a < b` indica que se debe invocar la función de máximo común divisor `gcd’` nuevamente (*invocación recursiva*) con dos parámetros el valor de `a` y la diferencia entre `b - a`. La última guarda utiliza la palabra reservada `otherwise` para indicar que siempre es verdad (por eso se ubica siempre de última, sino solaparía las demás guardas) y se invoca la función `gcd’` (*invocación recursiva*) pasando como primer parámetro la diferencia entre `a - b` y el segundo parámetro `b`.

## Plan A

### Preguntas y ejercicios

1. En la declaración de una función en Haskell el objetivo de la firma (*signatures*) es la definir un tipo de dato (las funciones son tipos de datos) a través del operador `->`. Como todo operador en lo lenguajes de programación tiene precedencia y asociatividad, como ocurre con el operador `+` que es asociativo por la izquierda y en muchos lenguajes tiene menos precedencia que el operador `*` (multiplicación). En el caso particular del operador  `->` este tiene una asociatividad por la derecha, lo que implica el orden de evaluación, es como si se utilizara paréntesis. De los tres esquemas de paréntesis, cuál aplica a la firma de la función de `gcd’`
  1. `((Int -> Int) -> Int)`
  2. `(Int -> Int -> Int)`
  3. `(Int -> (Int -> Int))`
  

En este caso la respuesta es: C. `(Int -> (Int -> Int))`. Porque el operador es asociativo por la derecha. Entonces, primero asocia el operador más a la derecha y luego el siguiente más remanente más a la derecha.

2. La sintaxis del lenguaje de programación Haskell está lleno de características novedosas para muchos programadores, ya sean *Seniors* o *Juniors*, una de ella es la invocación de funciones, que está basada  funciones prefijas, es decir que la invocación de función siempre lleva el nombre de la función primero seguida de los argumentos **Todos ellos separados por espacios**, cómo puedes ver en una de las expresiones de las guardas: `gcd' a (b-a)`. Algo que debe causar curiosidad y algo de escosor, que pasa por los operadores aritméticos tradicionales, estos no debería parecer también así, por ejemplo: `3 + 4` debería haber sido escrito `+ 3 4`. Y la verdad es que esto ocurre así en una parte de la compilacion, pero de esta forma: `(+) 3 4`. Los paréntesis son adicionados para indicar que se quiere trabajar con la función suma y no el operador binario. Esto ocurre por que los operadores binarios puede ser trabajados de esta forma al indicar que ellos son operadores `infix`. Si has observado bien `gcd'` también puede comportarse como un operador binario. Reescribe la siguiente invocación de `gcd'` de forma que sea utilizada como un operador infijo. **Nota** Cualquier función binaria, por ejemplo `bin` puedes convertirla en infija `` `bin` ``. 
  

In [None]:
gcd' 12 4 == 4
gcd' 16 3 == 1
gcd' 20 4 == 4

In [None]:
12 `gcd'` 4 == 4
16 `gcd'` 3 == 1
20 `gcd'` 4 == 4

3. Las declaraciones de funciones en Haskell pueden ser realizadas por partes como se observa en la definición anterior. La idea es que cada parte debe excluyentes entre ellas, por que la primera debe ser verdad de arriba hacia abajo, hace que se reemplace la regla por la parte derecha de la parte. ¿Qué significa la opción otherwise? 
  1. `a >= b`
  2. `True`
  3. `False`
  4. Indefinido

La instrucción `otherwise` es un predicado que siempre significa `True`.

## Plan B

### Preguntas y ejercicios

1. Ejecute la celda anterior para cargar la definición de la función y luego ejecute el siguiente codigo,  reemplazando las variables `a` con 18 y `b` con `9`, luego `a` con `18` y `b` con `6`.

In [None]:
let a = 0; b = 0 in gcd' a b

In [None]:
let a = 18; b = 9 in gcd' a b

let a = 18; b = 6 in gcd' a b

2. Observe bien el código anterior, las operaciones = que tenemos en la expresión let no son asignaciones como pudieran ocurrir en un lenguaje de programación imperativo, sino que cada operación igual es un enlace (en Inglés 
Binding), esto significa que el valor que a es ligado a ese valor y no puede ser cambiando internanmente. Antes de ejecutar responda estas preguntas y basado en su conocimiento de otros lenguajes de programación responda lo sigiente:
  1. El código siguiente se ejecuta correctamente.
  2. El código siguiente no se ejecuta correctamente.

In [None]:
let a = 10
    b = 20
    a = b
 in a + b


El código no se ejecuta correctamente. Esto se debe a un aspecto que los lenguajes de programación definen con respecto a la declaración y uso de las variables llamado *reglas de ámbito*. Las reglas de ámbito establece el alcance y visibilidad de las variables dentro del cuerpo de un programa, dentro de un bloque (iniciado por el constructor `let`) en el lenguaje de programación Haskell no se puede re-ligar variables y esto lo que ocurren dentro del bloque anterior.

3. Observa el siguiente código. Y antes de ejecutarlo responde las siguientes preguntas:
  1. El código siguiente se ejecuta correctamente.
  2. El código siguiente no se ejecuta correctamente.

In [None]:
let a = 10
 in let b = 20
    in let a = b
       in a + b

El código se ejecuta correctamente. De nuevo se aplica las *reglas de ámbito*. Cada `let` anidado permite la ligas (relaciona con un valor) las variables anteriores en el nuevo contexto, así que estas variables no tienen relación alguna con las variables más externas y sus nombres pueden ser reutilizados, si una variable extenrna no se utiliza (o re-liga) en ninguno de los `let` más internos, esta sigue siendo visible, mientras que las variables re-ligas más externas se vuelven invisibles.

## Implementación del código principal del programa en Haskell

El siguiente fragmento de código muestra la implementación del cuerpo principal del programa en Haskell. Ejecutelo, y observe que aparentemente no ha pasado nada.

In [12]:
-- module Main where
import System.IO(hGetLine,openFile,IOMode(..))

gcd' :: Int -> Int -> Int
gcd' a b
  | a == b    = a
  | a <  b    = gcd' a       (b - a)
  | otherwise = gcd' (a - b) b

readInts :: FilePath -> IO (Int,Int,Int)
readInts fileName = do
   h   <- openFile fileName ReadMode
   str <- hGetLine h 
   let [s1,s2,s3] = words str
   return (read s1, read s2, read s3)
   
main :: IO ()
main = do
   (a,b,c) <- readInts "data/data01.in"
   putStrLn ("The minimum size to cut is: " ++ show ( gcd' c (gcd' a b)))

Después de haber ejecutando el anterior código, ejecute el siguiente:

In [None]:
main 

En Haskell las funciones que interactúan con el mundo exterior tiene como constructor `IO` y como valor de retorno que se indica después, en este caso `()` que indica que el valor es un valor de tipo `void` (semejante al `void` en Java, C ó C++). Se han definido dos funciones que interactúan con el mundo exterior, la primera `readInts` se encarga de obtener los tres valores de las longitudes de los segmentos a ser procesados, esta función interactúa con el mundo exterior (leyendo de un fichero)  y retorna una tupla con los tres valores leídos.

Aunque el código anterior sea semejante a un código imperativo que encontramos en muchos de nuestro lenguajes de programación conocidos (como C, C++, Java, C#, etc), en el cual las instrucciones se ejecutan en secuencia, dentro de Haskell es realmente una simulación de la interacción con el mundo exterior, el sistema de tipos de Haskell garantiza que la función siempre se evalúa en el tiempo obtiene los mismos resultados siempre (esto nos puede parecer extraño al principio, pero es la realidad). 

La segunda función llamada `main` es la encargada de dar inicio al programa, es semejante a la ejecución de una función también llamada `main` en los programas escritos en el lenguaje de programación C++, pero es importante notar, que debido al compromiso de no modificar el estado del programa en Haskell, este programa es diferente en algunas partes, como por ejemplo en la parte de la invocación de la función `gcd’` que si observa bien los parámetros son tratados individualmente y estos parámetros no puede ser modificados, puesto que todos los valores son inmutables. 

Observe en el siguiente segmento de código:

In [None]:
let a = 12
    b = 18
    c = 9
 in gcd' c (gcd' a b)

La primera función trabajo con dos parámetros, `c` y el resultado de la invocación de la función interna `gcd’` que a su vez recibe dos parámetros `a` y `b`. 

## Plan A

### Preguntas y ejercicios

1. Este programa no tiene declaraciones como sucede con el programa en C++. Esto se debe porque un lenguaje como Haskell utiliza un mecanismo llamado *inferencia de tipos* y la declaración puede determinar el tipo de la función a partir de los valores manipulados por la misma. La función `read` es una función genérica con esta firma: `read :: (Read a) => String -> a`, que lee de esta forma: la variable de tipo `a` es un tipo de la clase (No hay clases en Haskell, aquí una clase significa una agrupación de elementos con funciones comunes) que se puede leer, que dado una cadena de caracteres lo convierte a cualquier tipo. El problema es: ¿cómo sabemos a que tipo que convierte? Observe la firma de la función `readInts :: FilePath -> (Int,Int,Int)`. Esta no indica que de la ruta a un fichero `FilePath`(muchos lo llama miga de pan) se obtiene tres enteros (`Int`); la función `read` sustituye esa `a` por `Int` y se obtiene un versión específica `read :: (Read Int) => String -> Int`. Conociendo como cambiariamos la firma de la función para leer un entero al inicio y dos flotantes (solamente la firma tiene que ser cambiada, no hay que hacer nada más por la inferencia de tipos). ¿Cuál de las siguientes firmas sería la válida para el cambio propuesto?
  1. `readInts :: FilePath -> (Int,Int,Float)`
  2. `readInts :: FilePath -> (Int,Int,Int)`
  3. `readInts :: FilePath -> (Float,Float,Float)`
  4. `readInts :: FilePath -> (Float,Int,Float)`
  5. `readInts :: FilePath -> (Int,Float,Float)`   

La respuesta correcta es la 5. Esto debido a la solicitud del problema un entero inicial y dos subsecuentes valores de tipo Flotante.

Ahora suponga que la función `readInts` fue cambiada para leer cuatro segmentos de tipo `Int`. La firma queda así: `readInts2 :: FilePath -> (Int,Int,Int,Int)`. Y el cuerpo de código quedaría así: 

In [16]:
readInts2 :: FilePath -> IO (Int, Int, Int, Int)
readInts2 fileName = undefined -- Esto se hará en un ejercicio siguiente en plan B, supongan que funciona.

(a,b,c,d) <- readInts2 "data/data02.in"

2. Ahora sabiendo que ya tiene leído los cuatro valores enteros en las correspondientes variables: `a`, `b`, `c` y `d`. Cuál de las siguientes invocaciones te permiten obtener el valor del corte común a los 4 segmentos.
  1. `gcd' (gcd' a b) (gcd' c d)`
  2. `gcd' a (gcd 'b (gcd' c d))`
  3. `gcd' (gcd' (gcd' a b) c) d`
  4. `gcd' (gcd' a (gcd ' b c)) d`

Todos los anteriores. En primer lugar, la operación es conmutativa, y también asociativa por lo tanto todas las operaciones son anteriores porque son diferentes formas de asociatividad y conmutatividad. 

## Plan B

### Preguntas y ejercicios

1. El siguiente código ha sido modificado para leer cuatro segmentos de un fichero llamado `"data/data02.in"`, pero falta modificar el programa principal `main` para que utilice los cuatro segmentos. Reescriba el siguiente código de forma que pueda utilizar los 4 segmentos y computar el valor de corte común en todos ellos.

In [None]:
-- module Main where
import System.IO(hGetLine,openFile,IOMode(..))

gcd' :: Int -> Int -> Int
gcd' a b
  | a == b    = a
  | a <  b    = gcd' a       (b - a)
  | otherwise = gcd' (a - b) b

readInts :: FilePath -> IO (Int,Int,Int,Int)
readInts fileName = do
   h   <- openFile fileName ReadMode
   str <- hGetLine h 
   let [s1,s2,s3,s4] = words str
   return (read s1, read s2, read s3, read s4)
   
main :: IO ()
main = do
   (a,b,c,d) <- readInts "data/data02.in"
   putStrLn ("The minimum size to cut is: " ++ show ( gcd' c (gcd' a b)))

In [None]:
-- module Main where
import System.IO(hGetLine,openFile,IOMode(..))

gcd' :: Int -> Int -> Int
gcd' a b
  | a == b    = a
  | a <  b    = gcd' a       (b - a)
  | otherwise = gcd' (a - b) b

readInts :: FilePath -> IO (Int,Int,Int,Int)
readInts fileName = do
   h   <- openFile fileName ReadMode
   str <- hGetLine h 
   let [s1,s2,s3,s4] = words str
   return (read s1, read s2, read s3, read s4)
   
main :: IO ()
main = do
   (a,b,c,d) <- readInts "data/data02.in"
   putStrLn ("The minimum size to cut is: " ++ show (gcd' d (gcd' c (gcd' a b)))

2. El siguiente código es una versión generalizada del problema de tres segmentos a $n$ segmentos donde $n > 1$. Pero esta versión contiene un error, corrígalo de forma que sea capaz de resolver el problema del máximo común divisor para $n > 1$.

**Nota**: La solución es reemplazar una línea. Observe bien que la función `main` a `process` y este `cio`. Haskell no puede tener ciclos, por lo que debe utilizar la recursividad para inovocar el siguiente valor. Si observa es el trabajo de `cio`, pero esto no esta calculado el valor 

In [None]:
module Main where

import System.IO(hPutStrLn,stdout,stdin,stderr,
                 hFlush,hGetLine,
                 hPutStr,openFile,IOMode(..),FilePath,Handle)
import System.IO.Error(IOError(..),catchIOError)
import System.Exit(exitSuccess,exitFailure)
import System.Environment(getArgs)

gcd' :: Int -> Int -> Int
gcd' a b
  | a ==  b   = a
  | a <   b   = gcd' a       (b - a)
  | otherwise = gcd' (a - b) b

readInt :: Handle -> IO Int
readInt h = do
 str <- hGetLine h
 return (read str)

readFirst :: Handle -> IO Int
readFirst h = do
  a <- readInt h
  return a

cio :: Handle -> Int -> IO ()
cio h g = catchIOError
  (readNxtSeg h g)
  (\e -> do {hPutStrLn stdout ("gcd is: " ++ (show g)); exitSuccess})

readNxtSeg :: Handle -> Int -> IO ()
readNxtSeg h g = do
  a <- readInt h
  cio h a

process :: FilePath -> IO ()
process fp = do
  h <- openFile fp ReadMode
  g <- (catchIOError (readFirst h)
        (\e -> do {exitSuccess; return 0}))
  cio h g

main :: IO ()
main = do
  let fileName = "data/data03.in"
  catchIOError (process fileName)
               (\e -> do {hPutStrLn stderr ("cannot open file: " ++ fileName); exitFailure})

Para ejecutar simplemente ejecute la siguiente celda. Puede cambiar el fichero con los siguientes nombres de ficheros: `"data/data03.in"` (esta invocación retorna $12$), `"data/data04.in"` (esta invocación retorna $5$).

In [None]:
main

In [21]:
module Main where

import System.IO(hPutStrLn,stdout,stdin,stderr,
                 hFlush,hGetLine,
                 hPutStr,openFile,IOMode(..),FilePath,Handle)
import System.IO.Error(IOError(..),catchIOError)
import System.Exit(exitSuccess,exitFailure)
import System.Environment(getArgs)

gcd' :: Int -> Int -> Int
gcd' a b
  | a ==  b   = a
  | a <   b   = gcd' a       (b - a)
  | otherwise = gcd' (a - b) b

readInt :: Handle -> IO Int
readInt h = do
 str <- hGetLine h
 return (read str)

readFirst :: Handle -> IO Int
readFirst h = do readInt h 

cio :: Handle -> Int -> IO ()
cio h g = catchIOError
  (readNxtSeg h g)
  (\e -> do {hPutStrLn stdout ("gcd is: " ++ show g); exitSuccess})

readNxtSeg :: Handle -> Int -> IO ()
readNxtSeg h g = do
  a <- readInt h
  cio h (gcd' a g)

process :: FilePath -> IO ()
process fp = do
  h <- openFile fp ReadMode
  g <- catchIOError (readFirst h)
        (\e -> do {exitSuccess; return 0})
  cio h g

main :: IO ()
main = do
  let fileName = "data/data03.in"
  catchIOError (process fileName)
               (\e -> do {hPutStrLn stderr ("cannot open file: " ++ fileName); exitFailure})

In [None]:
main