# Haskell con sabor a categorías.

En este documento encontrarás una mezcla extraña entre síntesis, resumen, y notas de diversas fuentes pero principalmente de _"Programming with Categories"_ de Brendan Fong, Bartosz Milewski y David I. Spivak para la parte de Haskell y Categorías, y _"Lecture notes on the Curry-Howard Isomorphism"_ de Morten Heine B. Sorensen y Pawel Urzyczyn. Los posibles errores que puedan contener estas notas me los atribuyo y cualquier corrección es bienvenida.

La intención de esta exposición y de estas notas es invitar a quien esté interesado al mundo de las ciencias de la computación, las matemáticas y, sobre todo, al de las ideas.

## Primeras nociones y algunos ejemplos

### Definición

Dos funciones $f:X \to Y$ y $g:X \to Y$ son iguales si $f(x) = g(x)$ para toda $x \in X$. 

### Definición

> Una categoría $\mathfrak{C}$ consta de lo siguiente: 
> 1) Una colección $\mathrm{Obj}(\mathfrak{C})$. Los elementos de dicha colección reciben el nombre de objetos de > $\mathfrak{C}$
> 
>  2) Para cada par de objetos $A,B \in \mathrm{Obj}(\mathfrak{C})$ una coleccioón de $\mathfrak{C}(A,B)$ cuyos elementos reciben el nombre de morfismos de $A$ en $B$ y se denotan por $A \to B$;
>  
> 3) Para cada objeto $D \in \mathrm{Obj}(\mathfrak{C})$, un morfismo $\mathrm{id}_D \in \mathfrak{C}(D,D)$ denominado _morfismo identidad_ para $C$, y
> 
> 4) Para cada tres objetos $A,B,D$ y morfismos $f:A \to B, g:B \to C$, existe un tercer morfismo $(g \circ f): A \to C$.
>
>Los componentes de una categoría están sujetos a las siguientes restricciones:
> * Para cada morfismo $f:A \to B$, con $A,B \in \mathrm{Obj}(\mathfrak{C})$ arbitrarios, $\mathrm{id}_A \circ f = f$ y $f \circ \mathrm{id}_B = f$
> 
> * Para cualesquiera objetos $A,B,C,D \in \mathrm{Obj}(\mathfrak{C})$ y morfismos $f:A \to B,g:B \to C,h:C \to D$ se tiene que
> $h \circ (g \circ f) = (h \circ g) \circ f$

### Ejemplo: La categoría **1**

>Existe una categoría $\mathbf{1}$ con un solo objeto, el cual llamaremos $1$, y con un solo morfismo, $\mathrm{id}_1$.
>La composición se define como $\mathrm{id}_1 \circ \mathrm{id}_1 = \mathrm{id}_1$.

<a><img src="https://i.postimg.cc/25S62Nj4/cat-1.png"></a>

> Así como definimos una categoría con un solo objeto, podemos definir otras con $n$ número de objetos. Dependiendo el número de objetos serán nuestros morfismos. Por ejemplo, en la categoría $\mathbf{2}$ con dos objetos, $1$ y $2$, tenemos 3 morfismos: dos identidades (una para cada objeto) y una flecha $f:1 \to 2$

<a><img src="https://i.postimg.cc/gjzGsfPC/Cat-2.jpg" width="400"></a>

### Ejemplo: Categorías libres

> Una gráfica $G$ consiste de un par ordenado $G = (V,E)$ donde $V, E$ son dos conjuntos y dos funciones $orgn: E \to V$ y >$dstno: E \to V$. Los elementos de $V$ reciben el nombre de vértices y los elementos de $E$ aristas, y para cada arista $e \in E$, el vértice $\mathrm{orgn}(e)$ recibe el nombre de origen y el v'ertice $\mathrm{dstno}(e)$ el destino.
>
>Dada una grafica $G$ podemos asociarle una categoría; esta categoría recibe el nombre de categoría libre en $G$ y se denota por $\mathrm{Free}(G)$. Los morfismos en $\mathrm{Free}(G)$ son los caminos en $G$ (sucesiones de aristas contiguas). Para cada vertice, el camino trivial es un morfismo y juega el papel de la identidad. La composicion se define como la concatenacion de caminos y esta composicion es asociativa.

<a><img src="https://i.postimg.cc/ZYGGJGg4/cat-libre.jpg" width=500></a>

## Monoides

Un **monoide** es una terna $(M, \star, e)$ con $M$ un conjunto no vacío, $\star: M \times M \to M$ una operaci'on y $e \in M$ un elemento llamado unidad tales que:
 1. $\forall m \in M(m\star e = m = e \star m)$
 2. $\forall m,n,k \in M (m \star (n \star k)) = (m \star n) \star k$
 

Si uno se pone las gafas categóricas, y observa detenidamente, se puede apreciar que podemos construir una categoría a partir de un monoide y, más aún, esta categoría tiene un solo objeto.

Denotemos por $\mathfrak{M}$ a la categoría tal que:
1. $\mathrm{Obj}(\mathfrak{M}) = \{\cdot\}$
2. $\mathrm{Hom}(\mathfrak{M}) = \mathfrak{M}(\cdot, \cdot)$

¿Cómo es que a partir de un monoide $(M, \star, e)$ podemos construir una categoría con un solo objeto?
Notemos que la misma definición nos da ya algunas pistas. La operación en $M$, $\star$, satisface ya la asociatividad y por si misma es una especie de composición en tanto que dados dos elementos de $M$, recibimos otro elemento de $M$, semejante a la composicion que, dado dos morfismos al componerlos obtenemos otro. Además, la operación satisface algo semejante a la composcion respecto a las identidades.

Así, dadas estas pistas, suena razonable considerar como composición a la operaci'on $\star$ en $M$, como objeto a un único $\{\cdot\}$, y como morfismos a los elementos de $M$.

### Ejemplo:

> Consideremos la terna $(\mathbb{N}, +, 0)$. Claramente es un monoide.
> Si nos colocamos nuestras gafas categóricas, ¿cómo se vería esta categoría?

Por los argumentos de arriba, $Obj(\mathfrak{M}) = \{\cdot\}$
Y $\mathfrak{M}(\cdot, \cdot) = \{f:\cdot \to \cdot \vert f \text{ es funci'on}\}$
Pero esto está muy abstracto. Que mas sabemos? Sabemos que al tener un solo objeto en la categoria, entonces al componer dos morfismos $f:\cdot \to \cdot$, $g: \cdot \to \cdot$ tenemos un morfismo $f\star g: \cdot \to \cdot$. Con esto en mente, recordemos que la operaci'on suma en $\mathbb{N}$ por ser operaci'on es cerrada. Siguiendo esta linea de pensamiento, notemos que $$ 1 + 1 = 2 $$, es decir, al componer $1$ con $1$ obtenemos un segundo morfismo $2$... Aja! Ya tenemos una forma de pensar a los morfismos del monoide $(\mathbb{N}, +, 0)$ de una forma menos abstracta! Asi pues, consideramos a los morfismos de la categoria como los elementos de $\mathbb{N}$, aunque no son los 'unicos en virtud de que $\mathfrak{M}(\cdot, \cdot)$ son todos los morfismos de $\cdot \to \cdot$.

Una observación clave, es que podemos generar a todos los elementos de $\mathbb{N}$ a partir de una funcion muy sencilla: la funci'on sucesor $s:\cdot \to \cdot$, que se puede interpretar como componer con $1$ cualquier morfismo. Notemos que el morfismo $5$ es lo mismo que componer $1$ consigo mismo 5 veces!
$$ (1 + 1 ) + (1 + 1 + 1) = (2 + 1) + (1 + 1) = (3 + 1 ) + 1 = 4 + 1 = 5 $$

Por la asociatividad podemos escribir al morfismo $5$ de diversas formas:
$$ 5 = 2 + 3 = 1 + 4 = \dots$$

Y bueno, hemos dejado muy olvidado a la unidad $0$. Notemos que en el contexto de los naturales con la suma como monoide el 0 act'ua de una forma muy particular:

$$ \forall n \in \mathbb{N}: n + 0 = 0 + n = n $$

Una especie de morfismo **identidad** y en efecto:

$$ 1 + 0 = 0 = 0 + 1 $$

## Ejemplo:

Una cadena en 0 y 1 es una sucesión (posiblemente vacia) de 0s y 1s; por ejemplo 01, 0,[], 11111 son cadenas. Denotamos por [] a la cadena vacia. Sea $\mathcal{L}$ el conjunto de todas las cadenas de 0s y 1s. Dadas dos cadenas $a$ y $b$ podemos concatenarlas para formar una nueva cadena; por ejemplo si a = 1 y b = 0100 entonces ab = 10100 y ba = 01001. Nótese que la concatenacion no es conmutativa (en general). Es fácil de ver que $(\mathcal{L}, \cdot, [])$ forma un monoide.

Una observación valiosa es que la composición en un monoide se comporta como una especie de "concatenación" (reflexione con este enfoque los anteriores dos ejemplos).

Notemos que un monoide es una categoria en cierta forma "degenerada", en tanto que sólo tenemos un solo objeto.
Con esto en mente, que tal si consideramos ahora una categoria con muchos objetos pero un solo morfismo entre estos? Es decir, si $\mathcal{C}$ es la categoria, entonces $\forall a,b \in \mathrm{Obj}(\mathcal{C}): \mathcal{C}(a,b) = {a\to b}$

Los preordenes son estructuras que, al verlas con gafas categoricas tienen esta caracteristica como consecuencia de su definición

## Preordenes

Una tupla $(\mathcal{P}, \leq)$ donde $\mathcal{P}$ es un conjunto y $\leqslant \subseteq \mathcal{P} \times \mathcal{P}$ una relación es un preorden si satisface lo siguiente:

1. $\forall a, b, c \in \mathcal{P}: (a \leqslant b \wedge b \leqslant c) \implies a \leqslant c$ (Transitividad)
2. $\forall a \in \mathcal{P}: a \leqslant a$ (Reflexividad)

Con lentes categoricos, la categoria preorden $\mathfrak{P}$
* $\mathrm{Obj}(\mathfrak{P}) = P$
* $\forall a,b \in \mathrm{Obj}(\mathfrak{P}): \mathfrak{P}(a,b) = \{x: a \to b\}$

Y la transitividad nos brinda una forma de componer, en tanto que si $x:a\to b$ y $y:b \to c$ son morfismos, entonces existe $y\circ x: a \to c$, y la reflexividad nos garantiza las identidades.

### Ejemplo:

En $(\mathbb{Z}^+, \sim)$ con $\sim$ la relación de división:
1. $\mathrm{Obj}(\mathfrak{P}) = \mathbb{Z}^+$
2. $\forall a,b \in \mathrm{Obj}(\mathfrak{P}): \mathfrak{P}(a,b) = \{x \in \mathbb{N}: a\cdot x = b\}$

Utilizando el algoritmo de la división es posible argumentar que $\mathfrak{P}(a,b) = \{x: a\to b\}$ o $\mathfrak{P}(a,b) = \varnothing$.

Aterrizando más el ejemplo, notemos que el morfismo identidad en, por ejemplo, $12 \in \mathbb{Z}^+$ es $1: 12 \to 12$, pues
por el algoritmo de la división $1$ es el único entero positivo tal que $12\cdot 1 = 12$. Además, dados dos morfismos $x:a \to b$, $y:b \to c$, existe un tercer morfismo $y \circ x: a\to b$ en tanto que $a\cdot x = b \wedge b\cdot y = c \implies a(xy) = c$. Aquí, la composición se comporta como un producto.

## La categoria opuesta

Para cualquier categoría $\mathfrak{C}$, existe una categoría $\mathfrak{C}^{op}$ con los mismos objetos que $\mathfrak{C}$, pero con sus flechas volteadas, esto es, $\mathfrak{C}^{op}(a, b) = \mathfrak{C}(b, a)$. 

# Morfismos: ¿Un objeto desde la perspectiva de otro?

## Elementos generalizados

## Isomorfismos

# Categorias y Haskell

El enfoque de las funciones en Haskell es la de capturar la sintaxis de la descripción de una función sobre la noción matemática pura como un conjunto de pares ordenados que satisfacen ciertas reglas para abstraer esta noción de máquinas que al recibir una entrada produce una única salida. Así, una función en Haskell es un término que puede ser construido con el lenguaje de programación que puede ser pensado como una función.

La sintaxis de Haskell está basada en el cálculo lambda, un lenguaje compacto que permite modelar funciones con dos nociones primitivas: abstracción lambda y aplicación de función.

El cálculo lambda surgió como una propuesta a fundamento de las matemáticas por parte de Church y Curry. En 1935 se exhibió su inconsistencia por Kleene y Rosser. Sin embargo, un subsistema del cálculo lambda resultó útil para formalizar la idea de computabilidad. Church y Rosser probaron su consistencia en 1936. 


En este lenguaje tenemos símbolos variables: $x,y,z$ por ejemplo; y también están los paréntesis. Las oraciones en el lenguaje reciben el nombre de términos lambda, y los símbolos variables son términos lambda.

Dados un término lambda $A$, y una variable $x$, una abstracción lambda crea un nuevo término $$\lambda x.A$$ y se interpreta como "Cualquier instancia de $x$ en $A$ es una variable"; en otras palabras, una función.

Dados dos términos lambda $A,B$, una aplicación de función genera un término lambda $AB$. Supóngase que $A$ es una función de variable $x$, entonces $AB$ es el proceso de sustituir todas las instancias de $x$ en $A$ con $B$.

### Términos lambda

Sea $V = \{v_0, v_1, \dots\}$ un alfabeto infinito. Un pre-término lambda son las cadenas generadas por la gramática

$$ \Lambda^{-}::\Lambda^{-} \lvert (\Lambda^{-}\Lambda^{-}) \lvert (\lambda V \Lambda^{-})$$

Es decir, son las cadenas de forma: 
1. $v$ con $v \in V$,
2. ($AB$) con $A$ y $B$ pre-términos lambda, o 
3. $\lambda v B$ con $B$ un pre-término lambda y $v \in V$

Un pretérmino de la forma (1.) recibe el nombre de variable, un pre-término de la forma (2.) se denomina por una aplicación (de $A$ en $B$), y un pre-término de la forma (3.) se le llama abstracción sobre $v$.

#### Ejemplo:

Son pre-términos lambda:
* $v_0$
* $(v_0 (v_0 v_0))$
* $((v_0 v_0) v_0)$
* $(\lambda v_1 ((v_0 v_0) v_0))$
* $(\lambda v_1 \lambda v_{420} v_{69})$
* $((v_0 \lambda v_9 v_9)v_6)$
* $(\lambda v_1 (v_1 v_1))((v_0 \lambda v_9 v_9)v_6)$
* $(\lambda v_0 (\lambda v_1 (\lambda v_2 (\lambda_{22} v_1 v_0))))$

Como la notación es bastante engorrosa se suelen tomar los siguientes convenios:

* Se suelen denotar por letras mayúsculas a los elementos de $\Lambda ^{-}$ y por letras minúsculas a los elementos de $V$.
* $(K L M)$ es lo mismo que $((K L) M)$
* $(\lambda x \lambda y M)$ en lugar de $(\lambda x (\lambda y M))$
* $(\lambda x M N)$ es equivalente a $(\lambda x (M N))$
* $(M \lambda x N)$ es igual que escribir $(M (\lambda x N))$
* $(\lambda x_1 (\lambda x_2 \dots (\lambda x_n M))\dots )))$ como $(\lambda x_1 x_2 \dots x_n)$
* Escribimos $(\lambda x.M$) en lugar de $(\lambda x M)$
* Se suele no escribir los paréntesis más exteriores

---

#### Ejercicio 1 
> Escribir los pre-términos lambda del ejemplo pasado según las convenciones.

Dado $M \in \Lambda^{-}$ definimos el conjunto de variables libres de $M$, $\mathrm{FV}(M) \subseteq V$, como a continuación:
* $\mathrm{FV}(x) = \{x\}$
* $\mathrm{FV}(\lambda x.P) = FV(P)\setminus \{x\}$
* $\mathrm{FV}((\lambda x. x\ x)) = \{\}$

Si $\mathrm{FV}(M) = \{\}$ entonces decimos que $M$ es cerrado.

---

#### Ejemplo:

* $\mathrm{FV}(x\ y\ z) = \{x,y,z\}$
* $\mathrm{FV}(\lambda x. x y) = {y}$
* $\mathrm{FV}((\lambda x. x x) \lambda y. y y)) = \{\}$

## Reglas de sustitución y equivalencia alpha

Para $M,N \in \Lambda^{-}$ y $x \in V$, la sustitución de $N$ por $x$ en $M$, denotada por $M[x:=N] \in \Lambda^{-}$ (en $M$, remplaza cada $x$ por $N$) se define para $x \neq y$ como a continuación

1) $x[x:=N] = N$

2) $y[x:=N] = y$

3) $(P\ Q)[x:=N] = P[x:=N]\ Q[x:=N]$

4) $(\lambda x. P)[x:=N] = \lambda x. P$ (Como $x$ no es una variable libre de $P$, no podemos sustituir nada y por lo tanto la expresión se queda inmutada, como pasó en el inciso 2).

5) $(\lambda y. P)[x:=N] = \lambda y. P[x:=N]$ si $y \not \in FV(N)$ o $x \not \in FV(P)$

6) $(\lambda y. P)[x:=N] = \lambda z. P[y:=z][x:=N]$ si $y \in FV(N)$ y $x \in FV(P)$
donde $z = v_i \in V$ con $i$ el mínimo tal que $v_i \not \in FV(N) \cup FV(P)$.

#### Ejemplo:

Si $x,y,z$ son variables distintas, y $u$ es una variable, entonces:
$$ ((\lambda x.xyz)(\lambda y.xyz)(\lambda z.xyz))[x:=y] = (\lambda x.xyz)[x:=y](\lambda y.xyz)[x:=y](\lambda z.xyz)[x:=y]\newline =
(\lambda x.xyz)(\lambda u.yuz)(\lambda z.yyz)$$


Lo anterior es importante porque nos brinda una forma de definir una relación de equivalencia en $\Lambda^{-}$ la cual recibe el nombre de **equivalencia $\alpha$**. Por definición, $=_{\alpha}$ es la relación más peque~na en $\Lambda^{-}$ tal que 
$$ P =_{\alpha} P \quad \forall P \in \Lambda^{-}$$
$$\lambda x. P =_{\alpha} \lambda y. P[x:=y] \text{ si $y \not \in \mathrm{FV}(P)$}$$


Siendo que la equivalencia $\alpha$ es una relación de equivalencia, esta es reflexiva, transitiva y simétrica. Con respecto a la estructura, la equivalencia $\alpha$ respeta aplicaciones por la izquierda y derecha y, abstracciones; esto último, en símbolos:

Si $P =_\alpha P'$, entonces:
$$\forall x \in V:\ \lambda x. P =_{\alpha} \lambda x. P'$$
$$\forall Z \in \Lambda^{-}:\ Z P = Z P'$$
$$\forall Z \in \Lambda^{-}:\ P Z = P' Z$$

Finalmente, definimos al conjunto de **términos lambda**, $\Lambda$, como

$$ \Lambda := \Lambda^{-}/=_\alpha $$

La construcción de las variables libres, y la sustitución en $\Lambda$ son completamente análogas a lo hecho ya en $\Lambda^{-}$. Es importante mencionar que existe una diferencia entre la sustitución en pre-términos y la sustitución en términos $\lambda$.


Para $M,N \in \Lambda$ y $x \in V$, la sustitución de $x$ por $N$ en $M$, $M[x:=N]$ se define como a continuación:

1) $x[x:=N] = N$

2) $y[x:=N] = y$    si $x \neq y$

3) $(P\ Q)[x:=N] = P[x:=N]\ Q[x:=N]$

4) $(\lambda y. P)[x:=N] = \lambda y. P[x:=N]$ si $x \neq y$, donde $y \not \in FV(N)$.


En términos más computacionales, lo que codifica la equivalencia $\alpha$ es que si tienes una variable fija en un término, y la intercambias por otro símbolo, entonces debes intercambiar todas las instancias de la variable fija por el mismo símbolo. Haciendo la analogía a una prueba, si fijas al principio una variable, haces tu prueba con dicha variable, y al final deseeas modificar el símbolo de la variable, entonces debes modificar todas las instancias de dicho símbolo en tu prueba por el nuevo elegido *mientras sea aplicable la sustitución*.

Por ejemplo, considerese la siguiente fórmula:

$$ \exists z\ (\forall x \in A: (x = y \implies x \sim y \wedge y \sim x )) \vee z$$

Claramente esta fórmula es equivalente a

$$ \exists k\ (\forall x \in A: (x = y \implies x \sim y \wedge y \sim x )) \vee k$$
$$ \exists z\ (\forall m \in A: (m = y \implies m \sim y \wedge y \sim m )) \vee z$$

y modificamos sólo aquellas que están en el alcance de dicha variable fija ($z$ en el primero, y $x$ en el segundo);
por otro lado, las siguientes fórmulas no son equivalentes:

$$ \exists k\ (\forall x \in A: (s = y \implies s \sim y \wedge y \sim s )) \vee k$$
$$ \exists m\ (\forall x \in A: (x = y \iff x \sim y \wedge y \sim x )) \vee k$$
$$ \exists k\ (\forall x \in A: (k = y \iff k \sim y \wedge y \sim k )) \vee k$$

En resumidas cuentas, la equivalencia $\alpha$ captura la noción de alcance de una variable.

#### Ejemplo:

1. $\lambda x. x =_\alpha \lambda y.y$
2. $\lambda x. \lambda y. x y =_\alpha \lambda y. \lambda x. y x$
3. $\lambda x. x y \neq_\alpha \lambda x. x z$, puesto que $z$ a pesar de que no es una variable libre de $P = x y$, no aparece después de $\lambda$.





## Reducci'on

Sea $\rightarrow_\beta$ la relación más pequeña en $\Lambda$ tal que
$$(\lambda x. P) Q \rightarrow_\beta P[x:=Q]$$

y si dados $P, P' \in \Lambda$ tales que $P \rightarrow_\beta P'$ entonces se satisface que:

1. $\forall x \in V: \lambda x. P \rightarrow_\beta\lambda x. P'$
2. $\forall Z \in \Lambda: P\ Z \rightarrow_\beta P'\ Z$
2. $\forall Z \in \Lambda: Z\ P \rightarrow_\beta Z\ P'$

Un término de la forma $(\lambda x. P) Q$ se llama un $\beta$ redex (sepa Dios qué significa eso) y a un término de la forma $P[x:=Q]$ se le llama $\beta$ contractum. Si $M$ es tal que no existe un término $N$ tal que $M \rightarrow_\beta N$, entonces decimos que $M$ es una forma normal $\beta$.

Si pedimos a la reducción $\beta$ que sea además transitiva y reflexiva, entonces tenemos una nueva relación, $\twoheadrightarrow_\beta$ denominada por *reducción $\beta$ en múltiples pasos (multi-step $\beta$ reduction)*; esto último en símbolos:

$$P \rightarrow_\beta P' \implies P \twoheadrightarrow_\beta P'$$
$$ P \twoheadrightarrow_\beta P' \wedge P' \twoheadrightarrow_\beta P'' \implies P \twoheadrightarrow_\beta P'' $$
$$ P \twoheadrightarrow_\beta P''$$

Si además extendemos a $\twoheadrightarrow_\beta$ para que sea simétrica, entonces tendremos una relación de equivalencia denotada por $=_\beta$ denominada *$\beta-$igualdad* (súper original jajaja).

$$P \rightarrow_\beta P' \implies P =_\beta P'$$
$$ P =_\beta P' \wedge P' =_\beta P'' \implies P =_\beta P'' $$
$$ P =_\beta P''$$
$$ P =_\beta P' \implies P' =_\beta P $$

### Ejemplo:

1) $(\lambda x. x\ x) \lambda z. z \rightarrow_\beta (x\ x)[x := \lambda z. z] = (\lambda z. z) \lambda z. z$

2) $(\lambda x. x) \lambda y. y \rightarrow_\beta x [x := \lambda y. y] = \lambda y. y$

3) $(\lambda x. x x)\lambda y. y \twoheadrightarrow_\beta \lambda z. z$

> En efecto, de 1) sabemos que $(\lambda x. x x)(\lambda z. z) \rightarrow_\beta (\lambda z. z)(\lambda z. z)$. 
  Además, $(\lambda z. z)(\lambda z. z) \rightarrow_\beta z[z := \lambda z.z]$. Puesto que
$z = z$, entonces aplicamos nuestra regla de sustitución 1. para términos lambda, de modo que $z[z := \lambda z.z] = \lambda z.z$ 
    
4) $(\lambda x. x)(y\ z) =_\beta y ((\lambda x.x)z)$

> En efecto. Obsérvese que $$(\lambda x. x)(y\ z) \rightarrow_\beta (x)[x:=(y\ z)] = (y\ z)$$ por lo que $(\lambda x. x)(y\ z) =_\beta (y\ z)$ y por simetr'ia, $(y\ z) =_\beta (\lambda x. x)(y\ z)$; por otro lado, $$y((\lambda x. x)\ z) \rightarrow_\beta y(x[x:=z]) = (y\ z)$$ y por lo tanto $y((\lambda x. x)\ z) =_\beta (y\ z)$ y de esta forma, aplicando transitividad tenemos que $$y((\lambda x. x)\ z) =_\beta (\lambda x. x)(y\ z)$$.

## El teorema de Church-Rosser y la "consistencia" del c'alculo $\lambda$

Notemos que nuestros t'erminos $\lambda$ pueden tener muchos subt'erminos de la forma $(\lambda x.\ P)\ Q$, y estas se reducen a t'erminos $N$ de la forma $P[x:=Q]$, es decir, pueden existir varios t'erminos $N$ tales que $M \twoheadrightarrow_\beta N$.

### Ejemplo:

Considerese

$$ I = \lambda x. x $$
$$ K = \lambda y.\lambda x. y $$

Entonces

$ K\ (I\ I) = (\lambda y.\lambda x. y)(\lambda x. x)(\lambda x. x)$

Por un lado,
$$(\lambda x. x)(\lambda x. x) \rightarrow_\beta (\lambda x. x)$$
$$ \therefore K\ (I\ I) \rightarrow_\beta K I $$

Por otro lado, 

$$ (\lambda y.\lambda x. y)(I\ I) \rightarrow_\beta (\lambda x. y)[y:= (I\ I)] = \lambda x. (I\ I) $$


$$ \therefore K\ (I\ I) \rightarrow_\beta \lambda x.\ (I\ I) $$

As'i, $K\ (I\ I) \twoheadrightarrow_\beta \lambda x. (I\ I)$ y $K\ (I\ I) \twoheadrightarrow_\beta (K\ I)$.
Observe tambi'en que $\lambda x. (I\ I)$ y $K\ (I\ I)$ se reducen en $\lambda x. \lambda x. x$.

El teorema de Church-Rosser nos dice que si $M_1 \twoheadrightarrow_\beta M_3$ y $M_2 \twoheadrightarrow_\beta M_3$ entonces existe $M_4$ tal que $M_2 \twoheadrightarrow_\beta M_4$ y $M_3 \twoheadrightarrow_\beta M_4$. Para probar este teorema, se requiere introducir una nueva relaci'on y enunciar tres distintos lemas. Sin embargo, no presentar'e la prueba, la cual se puede consultar en (Notas de Brendan Fong sobre el Isomorfismo de Curry-Howard).

Si aplicamos el teorema de Church-Rosser a nuestro ejemplo anterior, debe ser que existe un tercer t'ermino $M_3$ tal que $(K\ I) \twoheadrightarrow_\beta M_{3}$ y $\lambda x. (I\ I) \twoheadrightarrow_\beta M_{3}$. Notemos que una particularidad del teorema de Church-Rosser nos permite hablar de cierta equivalencia:

### Corolario:
Sea $M$ un t'ermino y $N_1, N_2$ dos t'erminos $\beta-$normales tales que $M\twoheadrightarrow_\beta N_1$ y $M\twoheadrightarrow_\beta N_2$. Entonces $N_1 = N_2$

#### Prueba:

(Ejercicio 2)
> Soluci'on: Como $M$ se reduce en $N_1$ y $N_2$ t'erminos normales, entonces cualquier reducci'on $\beta$ de $N_1$ y $N_2$ seran ellos mismos. Aplicando Church-Rosser tenemos que $N_1 \twoheadrightarrow_\beta N$ y $N_2 \twoheadrightarrow_\beta N$, por lo que $N = N_1$ y $N=N_2$. As'i, $N_1 = N_2$.

De inmediato tenemos como corolario la contrapuesta del corolario anterior:

### Corolario:
Sean $M, N \in \Lambda$. Si existen $L_1, L_2 \in \Lambda$ $\beta-$normales tales que $M \twoheadrightarrow_\beta L_1$ y $N \twoheadrightarrow_\beta L_2$ y $L_1 \neq L_2$, entonces $M \neq_\beta N$ 

#### Prueba:

(Ejercicio 3)
> TODO


Dicho esto último, consideremos $K = \lambda y. \lambda x. y$ e $I = \lambda x. x$ como los hemos estado trabajando. Notemos que $K$ e $I$ son $\beta-$normales y son tales que sintácticamente son distintos, i.e. $K \neq I$. Qué podemos decir sobre su igualdad $=_\beta$? Por el corolario anterior, como $K$ e $I$ son $\beta-$normales, entonces se reducen en si mismos, y $K \neq I$, por lo que entonces $K \neq_\beta I$.

Lo que nos dice el corolario anterior es que el cálculo Lambda es consistente, en el sentido de que no toda fórmula es igual bajo $\beta$; esto es, existen dos términos tales que son distintos; por consiguiente tenemos cierto límite en nuestra expresividad: si dos términos $M,N$ no comparten la misma forma $\beta-$normal, entonces $M \neq_\beta N$. Aterrizando un poco esto último, si consideramos al cálculo lambda como una teoría donde las fórmulas son de la forma $M =_\beta N$, entonces lo que nos dice el enunciado del corolario anterior es que existe una fórmula tal que $M \neq_\beta N$ y esta no se puede deducir a partir de nuestra teoría.

Más aún, se puede demostrar que el cálculo lambda es indecidible, esto es, la teoría formal de la $\beta-$ igualdad es indecidible, en tanto que $\{M \in \Lambda \ \vert \ M =_\beta \mathbf{verdadero}\}$ no es recursivo, donde $\mathbf{verdadero} = \lambda x. \lambda y. x$ y como su nombre pareciera indicar, modela el máximo en el álgebra de Boole $\mathbf{2}$.

Podríamos seguir hablando sobre las propiedades del cálculo lambda, pero no es la intención de esta exposición, por lo que se alienta a que la persona interesada en seguir explorando estos temas consulte la bibliografía recomendada.


## Cálculo lambda como un lenguaje para hablar sobre funciones a partir de su sintaxis

De manera informal, como quizás ya se hayan dado cuenta, los términos $\lambda$ expresan funciones y aplicaciones de estas.

Considerese $I = \lambda x. x$. En qué se reduce $I$ si aplicamos el término $z$ por la derecha?
$$(I z) \rightarrow_\beta x[x:= z] = z$$
$$ \therefore (I z) =_\beta z$$

Se comporta como la función identidad, no? Y la misma sintaxis de $I$ lo sugiere. Note que no hay mucha diferencia entre escribir $x \mapsto x$ y $\lambda x. x$. A pesar de esto último, es importante remarcar que existe una diferencia entre la función $x \mapsto x$ y el término $I$: la primera es una función, $\{(x,x): x \in X\}$; y la segunda es una cadena de un alfabeto de un lenguaje. Esta misma es la diferencia que hay entre una función como objeto matemático, y una función como subrutina en un programa que computa a la función como objeto matemático.

Notemos que el cálculo lambda, bajo esta nueva perspectiva, nos permite expresar una función que toma un argumento cualquiera y lo mapea en una función: $\mathbf{verdadero} = \lambda x. \lambda y. x$ por ejemplo. Dependiendo del lenguaje de programación con que uno trabaje será la facilidad de definir funciones que devuelvan funciones.

Consideremos ahora $K = \lambda y. \lambda x. y$. Bien podemos hacer la aplicación

$$ (I K) \rightarrow_\beta x[x:= \lambda y. \lambda x. y] =  \lambda y. \lambda x. y $$

de forma que, análogo a un lenguaje de programación, podemos componer subrutinas.

De lo anterior podemos rescatar la siguiente **intuición**: si $\lambda x. M$ denota una función, y $N$ denota un argumento entonces el valor de la función evaluada en el argumento resulta de sustituir a $x$ por $N$ en todas las instancias de $x$ que ocurren en $M$, esto es:

$$ (\lambda x. M)N = M[x:=N] $$

y es completamente análogo a lo que hacemos en matemáticas: si $f(x) = x^2$ y queremos evaluar $2$ en $f$, entonces $f(2)$ es el valor que resulta de sustituir en $x^2$ todas las instancias de $x$ por $2$ y hacer los cálculos correspondientes, i.e.
$f(2) = 2^2 = 2*2 = 4$.

Note que en lo anterior, para calcular $f(2)$ primero debimos calcular $2^2$, que se resuelve en calcular $2*2$, y esto último se resuelve en calcular $s(s(s(2)))$ donde $s:\mathbb{N} \to \mathbb{N}$ es la función sucesor. Este proceso es codificado en el cálculo lambda mediante la reducción $\beta$. Siguiendo esta línea de pensamiento, la igualdad $\beta$ codifica cuándo dos funciones son semánticamente iguales, esto es análogo a nuestra idea de igualdad de funciones en matemáticas: dos funciones $f,g$ son iguales si tienen mismo dominio y codominio, y si para todo elemento $x$ del dominio se tiene que $f(x) = g(x)$.

Notemos que en lo anterior, no requerimos de dominios y codominios **mientras** hablamamos del cálculo lambda por si mismo, y que cuando echábamos nuestras ideas matemáticas a la cazuela, ya requeríamos hablar de dominios y codominios. Decimos que el cálculo lambda es de **tipado libre**.

### Ejemplo (ejercicio 4):

Considere $\omega = \lambda x. x x$ y $\Omega = \omega \omega$. A qué se reduce $\Omega$?

Es posible que ocurra algo como lo observado con las funciones en matemáticas? 🤔

### Ejemplo (ejercicio 5):

Sean $B, P, Q \in \Lambda$ y definimos:

$$ \mathbf{verdadero} = \lambda x. \lambda y. x $$
$$ \mathbf{falso} = \lambda y. \lambda x. x $$
$$ \mathbf{si-entonces-sino} = B\ P\ Q $$

Entonces:

$$\mathbf{si-entonces-sino} (\mathbf{verdadero}\ P\ Q) =_\beta P$$
$$\mathbf{si-entonces-sino} (\mathbf{falso}\ P\ Q) =_\beta Q$$

### Ejemplo (ejercicio 6):

Sean $P, Q \in \Lambda$. Definimos

$$[P, Q] = \lambda x.x P Q$$
$$ \pi_1 = \lambda x.\lambda y. x$$
$$ \pi_2 = \lambda x. \lambda y. y$$

Entonces:

$$[P, Q]\pi_1 = P$$
$$[P, Q]\pi_2 = Q$$

## Oye, ¿y Haskell?

Haskell nos permite usar una notación bastante semejante a la del cálculo $\lambda$ para expresar funciones. Donde escribiríamos $\lambda$ escribimos el caracter `\`, y donde escribíamos un punto (.) escribimos en su lugar una flecha `->`.
Para nuestra conveniencia Haskell provee una sintaxis alternativa para definir funciones usando coincidencia de patrones de la siguiente forma:

Donde escribimos `f = \x -> M` podemos escribir de manera alternativa `f x = M`, donde `M` es un término válido.

### Ejemplo:

Recordemos la función identidad:

$$ I = \lambda x. x $$

En Haskell se escribe como:
`
\x -> x
`;
y también podemos asignarles un identificador único:
`
I = \x -> x
`
Usando la sintaxis alternativa, podemos escribir `I x = x`.

---

### Ejercicio 7: 

Intenta definir una función que eleve al cuadrado el argumento. ¿Puedes definir una función que se comporta como el conectivo lógico $\implies$?

Prueba tu función con diversas entradas y observa qué es lo que ocurre. Pon especial atención en cómo afecta el orden de la aplicación de los argumentos a la función que modela el conectivo $\implies$. ¿Puedes dar una hipótesis de por qué ocurre esto?

---

In [12]:
cuadrado = \x -> x^2
implica = \x -> \y -> not y || x

implica True False

True

## Tipos

Ya habrás notado que el cálculo lambda tiene ciertas desventajas a la hora de querer expresar algo. Tan solo la expresión que codifica tautología, $verdadero = \lambda x. y. x$, es bastante confuso a primera vista. Ahora imagina que quieres hacer un programa y, tu única forma de codificarlo es mediante el cálculo lambda... 🤯; un dolor de cabeza corregir errores de sintaxis, y semántica. Otro inconveniente es el de términos "absurdos".

Considera el siguiente término:

$$K = \lambda x. x x $$

¿Qué es lo que hace? dado un argumento $N$, $K N \rightarrow_\beta (x x)[x:=N] = N N$, es decir, ¡aplicamos a $N$ si mismo!
Para evitar este tipo de comportamientos relativamente extraños (dependiendo a quién le preguntes) Haskell implementa el cálculo $\lambda$ simplemente tipado de Curry Howard. Un problema que solucionan los tipos es el de ¿qué términos lambda debemos evaluar?, y esto lo hace poniendo restricciones en la aplicación de términos; en Haskell, esto último se traduce a que todo término tiene un tipo y, no podemos componer funciones y términos como querramos, debemos respetar la siguiente regla:

> El tipo codominio debe coincidir con el tipo dominio del siguiente término

En Haskell, para decir que un término `x` tiene tipo `A` escribimos

`x::A`

el cual coincide con la notación que se suele usar en la teoría de tipos. Dado un término `M`, le podemos preguntar a Haskell cuál es el tipo de `M` escribiendo `:t M`.

---

### Ejercicio 8:

Determina el tipo en Haskell de los siguientes términos:

1. `True`
2. `42`
3. `id`
4. `"Mi nombre es:_____"`
5. `\x -> x x` ¿puedes explicar por qué ocurre lo que sea que haya pasado al evaluar el tipo de este término?
6. `not`

---

In [14]:
:t True
:t 42
:t id
:t "Mi nombre es Nicky"
:t \x -> x x

: 

Para nuestros propósitos, un tipo es algo que describe el tipo de dato que se supone representa; por ejemplo, `Int` representa un número entero y hay que hacer énfasis en "representa", pues los términos de tipo `Int` están acotados (Para hallar la cota superior e inferior puede probar escribiendo `maxBound Int`y `minBound Int` respectivamente. `Char`es otro tipo, que representa un caracter. Cabe mencionar que en algunos casos no es importante que el programador declare explícitamente cuál es el tipo de un término, pero es recomendable hacerlo siempre.

### Notación:

En Haskell los tipos suelen comenzar con mayúscula, y las variables y parámetros de tipo con minúscula. Un parámetro de tipo es, como dice su nombre, un tipo sustituible por otro según el contexto. Los parámetros de tipo permiten implementar funciones polimorfas. En Haskell, una función polimorfa es definida para todos los tipos. La palabra reservada `forall` indica que la definición de una función es polimorfa.

#### Ejemplo (de una función polimorfa):

Considera una función `martillar_con`. Es sentido común que podemos martillar un clavo con un martillo, pero también es cierto que podemos martillar un clavo con una roca, o podemos martillar con otra herramienta. El polimorfismo nos permite implementar solo una función y especificar la acción de la función sobre el argumento según el tipo. De otra forma, sin polimorfismo, por cada tipo deseado tendríamos que crear una función distinta.

Otro ejemplo de una función polimorfa es la función identidad `I x = x`. Observa que no se especificó el tipo, pero funciona para cualquier argumento sin importar su tipo.

Es tentador pensar a los tipos como conjuntos en tanto que decir "`x` es de tipo `A`" incita uno a pensar que "$x$ está en el conjunto $A$"; sin embargo los tipos no tienen elementos, más bien los términos tienen tipos. En sentido estricto, $x \in A$ es una proposición demostrable, mientras que decir $x::A$ es una aserción en tanto que estámos definiendo en cierto sentido que $x$ es de tipo $A$.

## Construyendo tipos a partir de otros: tipos de datos algebraicos

La expresividad de Haskell nos permite construir nuestros propios tipos a partir de otros tipos ya existentes mediante operaciones entre estos: la suma, el producto, y la exponenciación. Como es de esperarse, estas operaciones nos definen cierta estructura algebraica sobre los tipos.

### Ejemplo

Supongamos que queremos modelar un juego de cartas. Abstrayendo un poco, una carta tiene un número o rango y una clase (corazones, picas, etc), por lo que suena sensible que si queremos modelar un juego de cartas requerimos un tipo `Carta`.
Supongamos que ya tenemos dos tipos: `Rango` y `Clase`. Dados estos dos tipos, y en virtud de que una carta queda determinada por estos dos atributos, podemos considerar que `Carta` está compuesto de `Rango` y `Clase`. Abstrayendo un poco más, podemos considerar que una carta entonces es un tipo con estructura `(Rango,Clase)`, i.e. `Carta` $=$ `Rango` $\times$ `Clase`. Un tipo construido como `Carta` recibe el nombre de _Tipo Producto_. Es importante remarcar que esta construcción surgió de considerar un tipo **y** otro en conjunto.

---

### Ejercicio
¿Puedes dar algún otro tipo producto? ¿Satisface esta "propiedad" en su condición de querer un tipo **y** otro en conjunto?

---

Como buenos matemáticos que son, ya habrán intuido para dónde va esto. Así, una parte fundamental de los tipos producto son funciones que nos permiten obtener alguno de los tipos que actúan en conjunto (piensa en proyecciones), de modo que, para nuestro ejemplo anterior, deberíamos considerar dos funciones

`` 
    getRango :: Carta -> Rango
``

``
    getClase :: Carta -> Clase
``

Ahora consideremos el siguiente escenario:

Deseas modelar un sistema de inicio de sesión, donde un usuario puede iniciar sesión con su correo electrónico **o** su número telefónico. Tenemos entonces ya dados dos tipos: `Telefono` e `Email`. Podemos considerar entonces un nuevo tipo de dato que contempla alguno de los dos, o ambos: `IdentificarUsuario`. Ahora, ¿cómo se debería comportar `IdentificarUsuario` en relación con `Telefono` e `Email` dado que queremos modelar un sistema de inicio de sesión donde un usuario puede iniciar sesión al dar su correo o su número telefónico? Suena coherente con esto último entonces dar dos funciones:

``
    telInicio :: Telefono -> IdentificarUsuario
``

``
    mailInicio :: Email -> IdentificarUsuario
``

**Observación:** Compara la orientación de las funciones que definimos en el producto y las funciones inmediatamente anteriores. ¿'Ta chistoso, no? 😉

A los tipos construidos de esta forma se les llama tipos suma, y para abreviar esta construcción escribiremos `S` = `A` + `B`.

Finalmente, están los tipos de datos exponenciales (o tipo de dato funcional). Dados dos tipos `A`,`B` podemos construir un tercer tipo `A->B`, el tipo de las funciones que toman como argumento un término de tipo `A`, y regresan un término de tipo `B`. Hablaremos en la siguiente subsección sobre estos tipos de datos.

## Tipos, funciones y composiciones

Considera la función `not`, la cual está implementada en `Prelude`.

In [16]:
:t not

Observa que el tipo de `not` es `Bool -> Bool`, es decir, `not` es una función con argumento de tipo `Bool` y dominio `Bool`.
Esto último es análogo a lo que hacemos con categorías: dados dos objetos $A$, $B$ cualquier elemento de $\mathrm{Hom}(A,B)$ es una flecha de $A$ en $B$. En este sentido, los términos de tipo `Bool -> Bool` son funciones que toman argumentos de tipo `Bool` y producen términos de tipo `Bool`.

Para definir una función en Haskell especificando su tipo, la sintaxis es la siguiente:

``
f :: A -> B
f x = x
``

La signatura de tipo de una función siempre debe ser acompañada de una implementación

---

### Ejercicio 9:

> ¿Qué tipo tiene la función que eleva al cuadrado del ejercicio 7?

> Considera las siguientes funciones:

``
g':: Integer -> Integer
g' x = x + 1
``

``
g'':: Int -> Int
g'' x = x + 1
``

¿Son las mismas?¿Qué relación guardan con la función matemática $g: \mathbb{Z} \to \mathbb{Z},\ g(z) = z + 1$?

---

Una operación muy importante es la composición de funciones. En Haskell, dadas dos funciones `f :: a -> b` y `g :: b -> c`, la composición de `g` con `f`, `g.f` es escrita en orden de aplicación, y tiene por tipo, como es de esperarse, `a -> c`. Otra forma de escribir a la composición de funciones es mediante la aplicación (como lo haríamos en el cálculo $\lambda$): `(.) g f`.

En Haskell, como es natural pensar, la composición de funciones es una función también.

In [19]:
:t (.)

Podemos interpretar a la composición de dos formas:

1. La composición es una función que toma dos funciones `g`y `f` y regresa una tercer función `g.f` (guiño guiño 😉)

2. La composición `g.f` es una aplicación `g f z` donde `z` es un argumento válido para `f` y `g (f z)` es un término válido del cálculo $\lambda$ simplemente tipado.

¡Nota que estamos recibiendo como argumento dos funciones! La forma en que Haskell maneja múltiples argumentos es mediante el _currying_, una técnica que seguramente haz usado en alguna prueba de cálculo 3:

Considera $H: \mathbb{R}\times\mathbb{R} \to \mathbb{R}$ dada por $H(x,y) = x+y$ ¿Cómo podemos ver a $h$ como una función de un solo argumento? Fácil, toma $h_x: \mathbb{R} \to \mathbb{R}$ dada por $h_x(y) = x + y$. Así, podemos ver a $H$ como una función que toma por argumento **funciones de $\mathbb{R}$ en $\mathbb{R}$** y regresa un real, i.e.
$$
    H':\mathbb{R}^{\mathbb{R}} \to \mathbb{R}
$$

**Observación:** Esto ya lo haz escuchado en el curso de Lógica 3 😉

Algo que es importante remarcar es que el símbolo `->` asocia hacia la derecha. Por lo tanto `(b -> c) -> ((a -> b) -> a -> c))` es equivalente a `(b -> c) -> (a -> b) -> a -> c`

### Ejercicio 10:
¿Importa el orden de los paréntesis en `(.) :: (b -> c) -> (a -> b) -> a -> c`? ¿La expresión sigue siendo no ambigua si quitamos los paréntesis?

### Ejemplo:

`words` es una función que, dada una cadena, separa las palabras y las coloca en una lista. 
Por ejemplo:

In [20]:
words "hola mundo!"

["hola","mundo!"]

`concat`es una función que, como su nombre lo indica, concatena. Su tipo es `concat :: [[a]] -> [a]`. Entonces, deberíamos ser capaces de concatenar el resultado que nos dió `words` en la línea anterior.

In [25]:
concat (words "hola mundo!")

"holamundo!"

Pero tenemos otra forma de pensar a la composición de funciones igualmente válida a la anterior:

In [None]:
(concat . words) "hola mundo!"

"holamundo!"

### Ejercicio 11:

1. ¿Qué pasa si intentas ejecutar `concat . (words "hola mundo!")`? ¿por qué ocurre esto?
2. ¿La composición de funciones en Haskell es asociativa? ¿Existe un neutro?
3. Considera las siguientes funciones:
$$f: \mathbb{Z} \to \mathbb{Z}$$
$$z \mapsto z^2$$

$$g: \mathbb{Z} \to \mathbb{Z}$$
$$z \mapsto z+1$$

$$ h = f \circ g $$
$$ i = g \circ f $$
$$ j = f \circ g \circ f $$

> Implementa cada una de estas funciones en Haskell y determina los siguientes valores a mano:

 * $h(2)$

 * $i(2)$

 * $j(2)$

Ahora, compara los valores que obtuviste a mano contra los que obtuviste con Haskell.

: 

## ¿Haskell como categoría?

Hasta ahora, en las últimas secciones hemos encontrado muchas similitudes entre Haskell y la estructura matemática de Categoría. Resulta natural querer preguntarse si Haskell es una categoría 🤔. La respuesta es que no pues es una especificación y todas las posibles implementaciones que permite dicha especificación; aunque querramos hacer esta analogía más precisa, un primer obstáculo que ya hemos encontrado en nuestro camino hasta acá es que no es trivial decir cuando dos funciones de Haskell son iguales; a pesar de lo anterior Haskell *es como* una categoría: tenemos funciones, una noción de composición, una identidad, y cosas que podemos usar como objetos (los tipos). En la sección que sigue exploraremos brevemente algunas construcciones conocidas y su implementación en Haskell, y algunas consecuencias favorables de este cambio de paradigma en la forma de escribir programas con Haskell.

# Construcciones universales

Hemos visto en la sección pasada que tenemos formas de generar nuevos tipos a partir de otros: producto, suma y exponenciación. Estas operaciones, como es de esperarse, están caracterizadas por propiedades universales. Dado que estamos interesados en explorar la relación que guardan nuestros tipos con otros para construir comportamientos complejos que modelen lo que querramos, cobra relevancia bajo este paradigma el querer definir tipos a partir de propiedades universales y, por universales, me refiero a que su comportamiento está definido en relación a todos los tipos.

## Objetos terminales

### Definición:

Sea $\mathfrak{C}$ una categoría. Un objeto $1$ en $\mathfrak{C}$ es llamado objeto terminal si para cada objeto $a \in \mathrm{Obj}(\mathfrak{C})$ existe una única flecha
$$!_{a}: a \to 1$$

#### Ejemplos:

1. En la categoría de conjuntos abstractos, cualquier objeto $\mathbf{1}$ con un solo elemento tiene un morfismo de cada objeto $X$ a $\mathbf{1}$.
2. $(F, \leq)$ con $F \subseteq \mathbb{N}$ finito y $\leq$ el orden usual en $\mathbb{N}$ induce una categoría con objeto terminal $\max F$.
3. Dada una gráfica completa, en la categoría libre inducida por esta gráfica todos sus objetos son terminales.

#### Ejercicio 11:

Puedes dar un ejemplo de una categoría sin objeto terminal?

### Proposición:

Si $S_1$ y $S_2$ son ambos objetos terminales en la categoría $\mathfrak{C}$, entonces hay exactamente un morfismo $S_1 \to S_2$ y dicho morfismo es isomorfismo.

### Dem:

La vimos en clase :)

### Definición:

Sea $\mathfrak{C}$ una categoría con objeto terminal $1$. Un elemento global de $\mathfrak{C}$ es una flecha $1 \to a$. También se le conoce como un **punto** de $a$.

### Definición:

Sea $\mathfrak{C}$ una categoría y sea $c \in \mathrm{Obj}(\mathfrak{C})$. Dado $a \in \mathrm{Obj}(\mathfrak{C})$, decimos que $e: c \to a$ es un objeto generalizado de $a$ con forma $c$.

**Observación:** Un objeto en una categoría está completamente determinado por sus elementos generalizados de todas las formas.

## Objetos iniciales

### Definición:

Sea $\mathfrak{C}$ una categoría. Un objeto $0$ en $\mathfrak{C}$ es llamado objeto inicial si para cada objeto $a \in \mathrm{Obj}(\mathfrak{C})$ existe una única flecha
$$!_{a}: 0 \to a$$

**Observación:** El objeto inicial es un objeto terminal en $\mathfrak{C}^{op}$ y viceversa. Como conceptos son duales.

### Ejemplos:

1. En la categoría de conjuntos abstractos, el conjunto vacío es un objeto inicial.
2. Considera la categoría inducida por el preorden $(F, \leq)$ con $F \subseteq \mathbb{N}$ finito y $\leq$ el orden usual en $\mathbb{N}$. Entonces $0 = \min F$ es un objeto terminal.
3. Considera $(\mathbb{N}, \leq)$. Entonces $0 \in \mathbb{N}$ es un objeto inicial de la categoría inducida por el preorden. 

Consideremos una categoría $\mathfrak{C}$ con objeto inicial $0$. Por la propiedad universal del objeto inicial, para toda $a \in \mathrm{Obj}(\mathfrak{C})$ existe una única flecha $0 \to a$, esto es, desde la perspectiva de Yoneda, que todo objeto $a$ de $\mathfrak{C}$ tiene un objeto generalizado con forma $0$. El objeto inicial está definido por su propiedad de _ir hacia todos_. Desde la perspectiva de Yoneda puede ser pensado como una forma sin forma. Esta forma está presente en cualquier objeto y en si mismo, pues al ser $0$ también un objeto de la categoría, se satisface que $0\to 0$ es una flecha de $\mathfrak{C}$.

## Productos

Construyamos a los productos abstrayendo los productos cartesianos mediante sus relaciones con otros objetos.
Consideremos los conjuntos $X,Y,A$ y tomemos $X \times Y$ el producto cartesiano. ¿Cómo debería relacionarse el conjunto $A$ con el producto? Pensemos categóricamente: supongamos que queremos definir una función de $A$ en $X\times Y$, a saber $f: A \to X \times Y$. Suena sensato tomar otras dos funciones que nos digan cómo se relaciona $A$ con $X$ y con $Y$, de esta forma sabríamos cómo se comporta en conjunto $A$ en relación a $X$ y $Y$ simultáneamente (dividir y conquistar): $f_X: A \to X$, $f_Y: A \to Y$. Ahora bien, ya sabemos cómo se comporta $A$ en relación a $X$ y $Y$ ($f_X$ es un objeto generalizado de $X$ con forma $A$, y $f_Y$ es un objeto generalizado de $Y$ con forma $A$; o como me gusta pensarlo, la forma de $A$ en $X$ y la forma de $A$ en $Y$). En tanto que el producto encapsula esta noción de combinar objetos respetando comportamientos en cierta manera, es adecuado pedir que $f(a) = (f_X(a), f_Y(a)) \forall a \in A$. Así, $f:A \to X\times Y$ es en cierta forma una pareja de morfismos $f_X$ y $f_Y$, i.e. un producto en una categoría es una pareja de morfismos.


### Definición:

Sea $\mathfrak{C}$ una categoría y sean $x, y \in \mathrm{Obj}(\mathfrak{C})$. Un producto de $x$ y $y$ consiste de tres cosas:
1. un objeto, denotado por $x \times y$
2. un morfismo $\pi_1: x\times y \to x$
3. un morfismo $\pi_2: x\times y \to y$

tales que para cualesquier objeto $a$, y dos flechas $f:a \to x$ y $g:a \to y$, se tiene que existe un único morfismo $h:a \to x\times y$ tal que el siguiente diagrama conmuta:

<a><img src="https://i.postimg.cc/YSVHYhXm/def-producto.png" width=350></a>

### Ejemplo:

Considera $(\mathbb{N}, \leq)$ y su categoría de orden asociada. Quién es el producto de 3 y 4?
Apliquemos la definición:

> El producto $3 \times 4$ es un objeto de la categoría (i.e. es un elemento de $\mathbb{N}$) tal que:
>1. $3\times 4 \leq 3$, y $3 \times 4 \leq 4$
>2. Existe $k \in \mathbb{N}$ tal que $k \leq 3 \times 4$.

De 1 podemos ver que $3 \times 4$ es una cota inferior de $\{3,4\}$. De 2, existe $k \in \mathbb{N}$ tal que $k \leq 3\times 4$ i.e. $k \leq 3 \times 4 \leq 3$ y $k \leq 3\times 4 \leq 4$. Por lo tanto, el producto en $(\mathbb{N}, \leq)$ de $3$ y $4$ es la máxima cota inferior de $\{3, 4\}$. En general, en los poset el producto es la máxima cota inferior.

### Ejemplo:

Considera $(\mathbb{Z}^+, \sim)$ donde $\sim$ es la relación de división y su categoría de orden asociada. Quién es el producto de 12 y 27?

Denotemos por $p$ a $12 \times 27$. Entonces, por definición
1. $p \sim 12$
2. $p \sim 27$
3. $\exists k(k \sim p)$.

Notemos que los divisores de 12 y 27 son
$$ D_{12} = \{1, 2, 3, 4, 6, 12\} $$
$$ D_{27} = \{1, 3, 9, 27\} $$

respectivamente, y el $\mathrm{mcd}(12,27) = \max D_12 \cap D_27 = 3$. Además, si $d = \mathrm{mcd}(12, 27)$, entonces
1. $d \leq 12$, y $d \leq 27$
2. $1 \leq d \leq 12$ y $1 \leq d \leq 27$.

Entonces, el producto de $12$ y $27$ es $3$!
Pareciera que, en general, el producto en $(\mathbb{Z}^+, \sim)$ es el $\mathrm{mcd}$. Qué curioso que en álgebra el $\mathrm{mcd}$ de $a,b \in \mathbb{Z}^+$ se denota por $(a,b)$.

**Observación:** El producto $x \times y$ recibe una única función $h$ de cada objeto $a$ para el cual existen $a \to x$ y $a \to y$. Así, podríamos pensar esta propiedad como "si quiero un morfismo que vaya a $x$ y a $y$, basta que exista un morfismo hacia $x\times y$".

Ahora bien, ¿por qué esta idea es importante en programación? Cuando estabamos pensando en cómo abstraer el producto cartesiano, observamos que el producto engloba una estrategia muy importante en la resolución de problemas: divide y conquista. En si, el problema que resuelve el producto es el de definir una función $h:a \to x\times y$. Podemos usar entonces esto para descomponer el problema en dos más sencillos: definir $a \to x$ y $a \to y$ Así, definir $h:a \to x\times y$ es equivalente a definir $a \to x$ y $a \to y$ (tentador pensar que $\mathrm{Hom}(a, x\times y) \simeq \mathrm{Hom}(a, x) \times \mathrm{Hom}(a, y)$, pero no lo afirmo porque no lo he probado.) Un ejemplo de este principio de descomposición puede apreciarse cuando definimos un tipo `Carta` a partir de otros dos tipos `Rango` y `Clase`.

Podemos generalizar el producto binario a uno $n-$ario aplicando los mismos principios que cuando generalizamos el producto cartesiano. Veamos cómo se hace para $n=3$.

### Definición:

Sea $\mathfrak{C}$ una categoría. Dados tres objetos $x,y,z$ de $\mathfrak{C}$ definimos su producto ternario $P_{x,y,z}$ como un objeto en $\mathfrak{C}$ para el cual existen tres morfismos $\pi_1:P_{x,y,z} \to x$, $\pi_2: P_{x,y,z} \to y$, $\pi_3: P_{x,y,z} \to z$ y, si para cualquier otro objeto $a$ para el cual existen morfismos $f_1: a \to x$, $f_2: a \to y$ y $f_3: a \to z$, se tiene que existe un único morfismo $k:a \to P_{x,y,z}$ tal que $f_i = \pi_i \circ k\ \forall i \in \{1,2,3\}$

<a><img src="https://i.postimg.cc/SNqp60GV/def-producto-ternario.png" width=250></a>

### Proposición:

 Sea $\mathfrak{C}$ una categoría y sean $x,y,z \in \mathrm{Obj}(\mathfrak{C})$. Si $\mathfrak{C}$ tiene productos (binarios), entonces tambien tiene productos ternarios; esto es, $(x \times y)\times z \simeq P_{x,y,z}$.
 
#### Dem:

Veamos que $(x \times y) \times z$ satisface la propiedad universal del producto ternario.
Sea $b \in \mathrm{Obj}(\mathfrak{C})$ tal que existen $f_{x\times y}: b \to x\times y$ y $f_z:b \to z$ morfismos. Por propiedad universal del producto binario, existe un único morfismo $k: b \to (x\times y)\times z$ que hace conmutar al siguiente diagrama:

<a><img src="https://i.postimg.cc/66CX46Cy/prueba-producto-pt-1.png" width=350></a>

Luego, como existe una flecha $b \to x\times y$ entonces por propiedad universal del producto debe ser que existen flechas $f_x:b \to x$ y $f_y: b \to y$ tales que el siguiente diagrama conmuta:

<a><img src="https://i.postimg.cc/mkWWpKWL/prueba-producto-pt-2.png" width=270></a>

En resumen, hemos exhibido la existencia de las siguientes flechas:

$$ \begin{matrix}
    f_{x\times y} = \pi_{x\times y} \circ k && f_x = \pi_x \circ f_{x\times y} = (\pi_x \circ \pi_{x\times y})\circ k \\
    f_z = \pi_z \circ k && f_y = \pi_y \circ f_{x\times y} = (\pi_y \circ \pi_{x\times y}) \circ k
\end{matrix}$$

Por lo tanto, tenemos que $(x \times y)\times z$ satisface la propiedad universal del producto ternario.

<a><img src="https://i.postimg.cc/sDcCKn6z/prueba-producto-pt-3.png" width=350></a>

$\therefore \ (x \times y)\times z \simeq P_{x,y,z} \ \blacksquare$

#### Ejercicio 12:

Probar que si $\mathfrak{C}$ es una categoría con producto ternario y objeto terminal, entonces tiene producto binario.

### Definición:

Decimos que una categoría es una categoría cartesiana si tiene todos los productos finitos.

## Coproductos

Un coproducto es la noción dual de un producto. Así como en los productos la flecha va "hacia dentro" en el mismo sentido que el objeto terminal va hacia dentro, en los coproductos la flecha va "hacia afuera" en el mismo sentido que el objeto inicial va hacia fuera.


### Definición:

Sean $x, y$ objetos de una categoría $\mathfrak{C}$. Un coproducto de $x$ y $y$, denotado por $x + y$, es un objeto acompa~nado de morfismos $i_1:x \to x+y$, $i_2: y \to x+y$, tal que para cualquier otro objeto $a$ junto con morfismos $f: x \to a$ y $g: y \to a$ existe un único morfismo $h:x + y \to a$ tal que el siguiente diagrama conmuta:

<a><img src="https://i.postimg.cc/43nGYz1g/def-coproducto.png" width=350></a>

Los morfismos $i_1, i_2$ reciben el nombre de inclusiones, y se suele denotar a $h$ por $[f,g]$.

Notemos que si queremos definir una función $h:a+b \to c$, el coproducto descompone esta función en dos: $a\to c$ y $b \to c$.

#### Ejercicio 13:

¿Cuál es el coproducto en un poset?

### Definición:

Decimos que una categoría es cocartesiana si tiene un objeto inicial y cada par de objetos tiene un coproducto. Decimos además que una categoría es bicartesiana si es cartesiana y cocartesiana.

## Distributividad



##  Exponenciales y tipos funcionales

### Distributividad

### Objetos exponenciales

### Tipos funcionales y currying

# Funtores

## Funtores

### Ejemplo: List es un funtor

## Clases de tipos

## Transformaciones naturales

# Monadas

## Monadas en términos de join

## Listas como monada