# Autómata de Pila (AP)
---

## Definición

* También llamados autómatas "push-down"
* Permiten analizar palabras para reconocer si pertenecen o no a LIC
* Misma estructura que los AF, pero se agrega una pila (memoria auxiliar con método LIFO) para guardar información que podrá ser útil durante el análisis
* Más poderosos que los AF, porque reconocen: LR + LIC
* Por ejemplo: balanceo de paréntesis

| AF                  | AP |
| --                  | -- |
| imposible controlar | ponen en la pila un elemento por cada paréntesis de apertura leído, y sacan de la pila un elemento por cada paréntesis de cierre leído |

## Definición formal

* Formalmente un AP se define como una 7-upla: $M = <\Sigma, \Gamma, Q, q_0, p_0, F, \delta>$

|          |                                                                         |
| --       | --                                                                      |
| $\Sigma$ | alfabeto de entrada                                                     |
| $\Gamma$ | alfabeto de pila, algunos autores $\Sigma \cap \Gamma = \emptyset$      |
| $Q$      | conjunto finito de estados                                              |
| $q_0$    | estado inicial, $q_0 \in Q$                                             |
| $p_0$    | símbolo inicial de pila, $p_0 \in \Gamma$. Convención: $\$, \#, Z_0$    |
| $F$      | conjunto de estados finales o de aceptación, $F ⊆ Q \vee F = \emptyset$ |
| $\delta$ | función de transición de estados, $\delta: Q$ x $\Sigma \cup \{\lambda\}$ x $\Gamma^* \rightarrow Q$ x $\Gamma^*$ (algunos autores se saca un solo símbolo de la pila) |

* La pila puede estar o no inicializada con $p_0$

![AP](img/ap.png)

## Ejemplo AP

$L = \{1^n 0^n / n ≥ 1\}$

![AP para L = {1^n 0^n / n ≥ 1}](img/ap1.png)

* $\Sigma = \{0, 1\}$
* $\Gamma = \{\$, 1\}$
* $Q = \{q0, q1\}$
* $q0 = q0$
* $p0 = \$$
* $F = \{\}$
* $\delta = \{\delta(q0,1,\$)=(q0,1\$), \delta(q0,1,1)=(q0,11), \delta(q0,0,1)=(q1,\lambda), \delta(q1,0,1)=(q1,\lambda), \delta(q1,\lambda,\$)=(q1,\lambda)\}$

| TM       | $1$        | $0$            | $\lambda$      |
| --       | --         | --             | --             |
| >$q0,\$$ | $(q0,1\$)$ | -              | -              |
| $q0,1$   | $(q0,11)$  | $(q1,\lambda)$ | -              |
| $q1,\$$  | -          | -              | $(q1,\lambda)$ |
| $q1,1$   | -          | $(q1,\lambda)$ | -              |

## Funcionamiento

* Cuando lee un $1$ en la entrada y está en el estado $q0$, pone el $1$ en la pila, para memorizar cuantos ha leído
* Cuando lee un $0$, transita al estado $q1$ que se dedica a eliminar un $1$ de la pila por cada $0$ que lee
* Así, si la pila se queda vacía es porque ha leído el mismo número de $1s$ que de $0s$
* Ejemplo de análisis (parsing) por cadena aceptada

| Pila      | Cadena    | Transición                           |
| --        | --        | --                                   |
| $ \$ $    | $1100$    | $\delta(q0,1,\$)=(q0,1\$)$           |
| $ \$ 1$   | $100$     | $\delta(q0,1,1)=(q0,11)$             |
| $ \$ 11$  | $00$      | $\delta(q0,0,1)=(q1,\lambda)$        |
| $ \$ 1$   | $0$       | $\delta(q1,0,1)=(q1,\lambda)$        |
| $ \$ $    | $\lambda$ | $\delta(q1,\lambda,\$)=(q1,\lambda)$ |
| $\lambda$ | $\lambda$ | accept                               |

* Ejemplo de análisis (parsing) por cadena rechazada

| Pila     | Cadena    | Transición                    |
| --       | --        | --                            |
| $ \$ $   | $110$     | $\delta(q0,1,\$)=(q0,1\$)$    |
| $ \$ 1$  | $10$      | $\delta(q0,1,1)=(q0,11)$      |
| $ \$ 11$ | $0$       | $\delta(q0,0,1)=(q1,\lambda)$ |
| $ \$ 1$  | $\lambda$ | fail                          |

## Tipos de transiciones

| Transición                              | Descripción                                                               |
| --                                      | --                                                                        |
| $\delta(p,a,Z)=(q,z)$                   | Transita avanzando en la cadena de entrada, sacando y poniendo en la pila |
| $\delta(p,x,\lambda)=(q,z)$             | Transita sin sacar nada de la pila                                        |
| $\delta(p,\lambda,s)=(q,\lambda)$       | Transita sin avanzar en la cadena de entrada                              |
| $\delta(p,\lambda,\lambda)=(q,\lambda)$ | Transita sin avanzar en la cadena de entrada y sin sacar nada de la pila  |
| $\delta(p,x,\lambda)=(q,\lambda)$       | AF                                                                        |

## Descripción instantánea

* Permite describir la configuración del AP en cada momento
* Es una terna $(q, w, z)$

|     |                  |                                                      |
| --  | --               | --                                                   |
| $q$ | $q \in Q$        | estado actual                                        |
| $w$ | $w \in \Sigma^*$ | el resto de la palabra de entrada que queda por leer |
| $z$ | $z \in \Gamma^*$ | la situación de la pila en ese instante              |

* El primer símbolo de la palabra de entrada representa el puntero de lectura de la cinta de entrada, y el primer símbolo de la pila representa el tope de la pila
* Ejemplos:

| Momentos      |                          |
| --            | --                       |
| **inicial**   | $(q0, 1100, \$)$         |
| **siguiente** | $(q0, 100, 1\$)$         |
| **final**     | $(q1, \lambda, \lambda)$ |

## Movimientos

* Si $(p, x) \in \delta(q, a, Z)$, con $p, q \in Q, a \in \Sigma \cup \{\lambda\}, Z \in \Gamma, x \in \Gamma^*$
* Entonces, de la descripción instantánea $(q, ay, ZX)$, se puede pasar a la descripción instantánea $(p, y, xX)$, representándose como: $(q, ay, ZX) ├ (p, y, xX)$
* ├ significa "se puede probar que"
* Ejemplo:

| Movimientos                                  |
| --                                           |
| $(q0, 1100, \$) ├ (q0, 100, 1\$)$            |
| $(q0, 100, 1\$) ├ (q0, 00, 11\$)$            |
| $(q0, 00, 11\$) ├ (q1, 0, 1\$)$              |
| $(q1, 0, 1\$) ├ (q1, \lambda, \$)$           |
| $(q1, \lambda, \$) ├ (q1, \lambda, \lambda)$ |

## Sucesión de movimientos

* Para representar el hecho de que se puede alcanzar la descripción instantánea d2 a partir de la d1, se utilizará la siguiente notación: $d1 ├^* d2$
* Ejemplo:

| Sucesión                                   |
| --                                         |
| $(q0, 1100, \$) ├^* (q1, \lambda, \lambda)$ |

## Tipos de AP

### Autómatas de Pila Deterministas (APD)

* Un AP es APD cuando si hay alguna transición $\lambda$ dados un estado $q$ y un símbolo de la pila, entonces no puede haber transición con ningún símbolo de entrada, y, además, no puede haber más de una transición dados el mismo estado $q$ y símbolo de la pila en el tope de la pila, incluyendo las transiciones $\lambda$

### Autómatas de Pila No Deterministas (APN)

![APN](img/apn.png)

| TM       | $1$                               | $0$                        | $\lambda$      |
| --       | --                                | --                         | --             |
| >$q0,\$$ | $(q0,1\$)$                        | $(q0,0\$)$                 | -              |
| $q0,0$   | $(q0,10)$                         | $\{(q0,00),(q1,\lambda)\}$ | -              |
| $q0,1$   | $\{(q0,11),(q1,1),(q1,\lambda)\}$ | $(q0,01)$                  | -              |
| $q1,\$$  | -                                 | -                          | $(q1,\lambda)$ |
| $q1,0$   | -                                 | $(q1,\lambda)$             | -              |
| $q1,1$   | $(q1,\lambda)$                    | -                          | -              |

* Es APN debido a que, para las transiciones con $(q0,0,0)$ y $(q0,1,1)$, hay más de una posible transición
  * $\delta(qorigen, \alpha, A) = (qdestino, \lambda)$
  * $\delta(qorigen, \lambda, A) = (qdestino, A)$

* Las transiciones anteriores generan no determinismo debido a que se debe interpretar como:
  * Leo $\alpha$ en la cadena de entrada y teniendo A en el tope de la pila, desapilo, o
  * Sin leer ningún elemento en la cadena de entrada y teniendo A en el tope de la pila, dejo A en el tope

* Todo LIC no puede ser reconocido por un APD, por lo tanto, habrá lenguajes que son sólo reconocidos por APN

## Lenguaje aceptado por un AP: L(M)

* Es el lenguaje L aceptado por el AP M
* Es la colección de todas las palabras que acepta M
* Los lenguajes aceptados por los AP incluyen los LR
* Hay dos formas equivalentes de caracterizar el lenguaje aceptado por un AP (reconocimiento):
  * Por vaciado de pila
  * Por estado final

### Por vaciado de pila

* El lenguaje aceptado es el conjunto de palabras que permiten transitar desde $q0$ hasta una descripción instantánea en la que tanto la entrada como la pila estén vacías

$$LVAP = \{w / (q0, w, p0) ├^* (p, \lambda, \lambda) \wedge p \in Q, w \in \Sigma^*\}$$

![LVAP](img/ap1.png)

### Por estado final

* El lenguaje aceptado es el equivalente al de los AF: todas las palabras que permiten transitar desde el estado inicial a uno final
* Se aceptarán todas las palabras que permitan pasar de la configuración inicial a una en la que se haya leído toda la palabra de entrada y el autómata esté en uno de los estado finales, independientemente del contenido de la pila

$$LFAP = \{w / (q0, w, p0) ├^* (p, \lambda, \chi) \wedge p \in F, w \in \Sigma^*, \chi \in \Gamma^*\}$$

![LFAP](img/lfap.png)

## AP y GIC

* Obtención del AP correspondiente a una GIC y viceversa:
  * **AP asociado a una GIC**: para cada GIC existe un AP que reconoce el lenguaje generado por esta
  * **GIC asociada a un AP**: a partir de cualquier AP, se puede construir una GIC que genera el lenguaje aceptado por el AP

### AP que reconoce por vaciado de pila el lenguaje generado por una GIC

* Entrada: $G = <\Sigma_T, \Sigma_N, S, P>$ en FNG
* Salida: $AP = <\Sigma = \Sigma_T, \Gamma = \Sigma_N, Q = \{q0\}, q0 = q0, p0 = S, \{\}, \delta>$ donde $\delta$:

| Si ...                                                                       | Entonces ...                             |
| --                                                                           | --                                       |
| $A \rightarrow aB \in P, (a \in \Sigma_T, A \in \Sigma_N, B \in \Sigma_N^*)$ | $(q, B) \in \delta(q, a, A)$             |
| $S \rightarrow \lambda \in P$                                                | $(q, \lambda) \in \delta(q, \lambda, S)$ |

* Ejemplo: $S \rightarrow (S) \mid ()$

$$S \rightarrow (SA \mid (A$$
$$A \rightarrow )$$ 

![VAP](img/vap.png)

| Pila      | Cadena    | Transición                       |
| --        | --        | --                               |
| $S$       | $(())$    | $\delta(q0,(,S) = (q0, SA)$      |
| $AS$      | $())$     | $\delta(q0,(,S) = (q0, A)$       |
| $AA$      | $))$      | $\delta(q0,),A) = (q0, \lambda)$ |
| $A$       | $)$       | $\delta(q0,),A) = (q0, \lambda)$ |
| $\lambda$ | $\lambda$ | accept                           |

### AP que reconoce por estado final el lenguaje generado por una GIC

* Entrada: $G = <\Sigma_T, \Sigma_N, S, P>$
* Salida: $AP = <\Sigma = \Sigma_T, \Gamma = \Sigma_T \cup \Sigma_N \cup \{p0\}, Q = \{q0, q1, q2\}, q0, p0, \{q2\}, \delta>$ donde $\delta$:

|                                                                                                                     |
| --                                                                                                                  |
| $\delta(q0, \lambda, p0) = \{q1, Sp0\}$                                                                             |
| $\forall A \in \Sigma_N, si A \rightarrow a \in P, (a \in \Sigma^*)$, entonces $(q1, a) \in \delta(q1, \lambda, A)$ |
| $\forall a \in \Sigma_T, (q1, \lambda) \in \delta(q1, a, a)$                                                        |
| $\delta(q1, \lambda, p0) = \{q2, p0\}$                                                                              |

* Ejemplo: $S \rightarrow (S) \mid ()$

![FAP](img/fap.png)

| Pila      | Cadena    | Transición                          |
| --        | --        | --                                  |
| $ \$ $    | $(())$    | $\delta(q0,\lambda,\$) = (q1, S\$)$ |
| $ \$ S$   | $(())$    | $\delta(q1,\lambda,S) = (q1, (S))$  |
| $ \$ )S($ | $(())$    | $\delta(q1,(,() = (q1,\lambda)$     |
| $ \$ )S$  | $())$     | $\delta(q1,\lambda,S) = (q1,())$    |
| $ \$ ))($ | $())$     | $\delta(q1,(,() = (q1,\lambda)$     |
| $ \$ ))$  | $))$      | $\delta(q1,),)) = (q1,\lambda)$     |
| $ \$ )$   | $)$       | $\delta(q1,),)) = (q1,\lambda)$     |
| $ \$ $    | $\lambda$ | $\delta(q1,\lambda, \$) = (q2,\$)$  |
| $\lambda$ | $\lambda$ | accept                              |

* Ejemplo:

$$S \rightarrow zMNz$$
$$M \rightarrow aMa \mid z$$
$$N \rightarrow bNb \mid z$$

![FAP](img/fap2.png)

## Lema del bombeo para LIC

* Se utiliza para demostrar que determinados lenguajes no son LIC
* Las GIC en FNC permiten obtener la relación que existe entre la longitud de una palabra y el número de pasos de su derivación
* Se puede probar mediante inducción, que si se puede derivar $w$ y $|w| > 0$, entonces la derivación tiene exactamente $2|w|$ etapas (sustitución)
* El conocimiento de la relación existente entre la $|w|$ y su derivación en una GIC permite demostrar el lema del bombeo para los LIC

* Sea $L$ un LIC
* Existe una constante $n$ tal que para toda palabra $w$ perteneciente a $L$ con $|w| ≥ n$, se puede descomponer $w$ en 5 palabras $w = uvxyz$ de modo que:
  * $v ≠ λ \vee y ≠ \lambda$, es decir, $|vy| > 0$
  * $|vxy| ≤ n$
  * $\forall k ≥ 0$, la palabra $uv^kxy^kz \in L$

* Con otras palabras...
  * En cualquier palabra lo suficientemente larga de un LIC, es posible encontrar a los sumo dos subpalabras cortas y muy próximas que pueden "bombearse" en tándem. Es decir, se puede repetir ambas palabras k veces, para cualquier entero k, y la palabra resultante pertenecerá al lenguaje
  * El lema del bombeo para los LIC es bastante similar al lema de bombeo para los LR, pero se descompone cada palabra w del LIC L en 5 partes y se bombean en tándem la segunda y la cuarta partes

* Este lema define una condición necesaria, pero no suficiente para que un L = LIC
* Por ello, del hecho de que un lenguaje cumpla la conclusión del lema no se sigue que sea independiente de contexto
* Sin embargo, si no la cumple, queda demostrado que no lo es

### Ejemplo: $L = \{a^nb^n / n > 0\}$ es LIC. No es suficiente

![Bombeo L = {a^nb^n / n > 0}](img/bombeo1.png)

### Ejemplo: $L = \{a^nb^nc^n / n > 0\}$ no es LIC. Es suficiente

![Bombeo L = {a^nb^nc^n / n> 0}](img/bombeo2.png)

## Propiedades de los LIC

* Las GIC son incapaces de expresar las restricciones de que:
  * diferentes variables no pueden tener el mismo nombre
  * el número de parámetros formales de una función debe ser igual al número de parámetros actuales cuando se llama a la función
  * las referencias a identificadores no declarados son ilegales
* No obstante, lo anterior, el poder de las GIC permite incluir un considerable número de reglas de sintaxis de los LP actuales
* Las características del LP que se salen del alcance de las GIC se manejan como casos especiales o se evalúan como parte del análisis semántico, en vez de hacerlo en las rutinas de análisis sintáctico

## Estructura interna de un Compilador

![Compilador](img/compilador.png)