# Gramáticas
---

* Son **descripciones estructurales de las sentencias** de los lenguajes ("cómo se pueden generar")
* Es un conjunto de producciones (reglas de reescritura) que se aplican para **generar** cada una de las **palabras** del lenguaje formal definido sobre un $\Sigma$
* Ejemplo:

| Lenguaje    | Gramática         | Se lee               |
| --          | --                | --                   |
| $L = \{a\}$ | $S \rightarrow a$ | "S produce/deriva a" |

## Producción

* $\alpha \rightarrow \beta$
* Es una regla de reescritura formada por 3 partes:
  * lado izquierdo
  * lado derecho
  * flecha: indica que el lado izquierdo "produce" (o "es reemplazado por" o "equivale a") el lado derecho 

## Definición formal

* Toda gramática formal G, se define como una cuádrupla $G = (\Sigma_T, \Sigma_N, S, P)$ donde:

|            |                                          |    | Ejemplo |
| --         | --                                       | -- | -- |
| $\Sigma_T$ | alfabeto de símbolos terminales          | alfabeto sobre el cual se construye el lenguaje formal | $\Sigma_T = \{0, 1\}$ |
| $\Sigma_N$ | alfabeto de símbolos no terminales       | permiten representar estados intermedios de la generación de las palabras del lenguaje, $\Sigma_T \cap \Sigma_N = \{\}$ | $\Sigma_N = \{S, A\}$ |
| $S$        | axioma o símbolo start o distinguido     | siempre debe comenzar a aplicarse las producciones que generan todas las palabras de un determinado lenguaje formal, $S \in \Sigma_N$ | $S = S$ |
| $P$        | conjunto finito no vacío de producciones | permiten generar palabras a partir de $S$, $P = \{(xAy \rightarrow v) / v, x, y \in \Sigma^*, A \in \Sigma_N\}$ | $P = \{(A \rightarrow 1B1), (A \rightarrow 0B0), (B \rightarrow A), (B \rightarrow 1), (B \rightarrow 0), (B \rightarrow \lambda)\}$ |

* Ejemplo:

|            |                                                                |
| --         | --                                                             |
| $\Sigma_N$ | $\{S, T\}$                                                     |
| $\Sigma_T$ | $\{a, b\}$                                                     |
| $S$        | $S$                                                            |
| $P$        | $\{(S \rightarrow aT), (T \rightarrow a), (T \rightarrow b)\}$ |
| $L$        | $\{aa, ab\}$                                                   |

## Regla compresora

* Aquella cuya parte derecha está formada por menos símbolos que la parte izquierda: $|\beta| < |\alpha|$
* Transforma una palabra en otra de menor longitud

| Ejemplos                |
| --                      |
| $0C0 \rightarrow 1$     |
| $A \rightarrow \lambda$ |

## Regla recursiva

* Si el mismo símbolo no terminal aparece en los dos lados de la producción
* Es decir, $\exists A \in \Sigma_N / (A \rightarrow xAy) \in P, (x, y \in \Sigma^*)$

| Ejemplos             |
| --                   |
| $A \rightarrow 0A0$  |
| $B \rightarrow B10$  |
| $C \rightarrow 111C$ |

## Tipos

|       |                                                                       |         |                                                     |
| --    | --                                                                    | --      | --                                                  |
| $G_3$ | Gramática Tipo 3 o Regular                                            | **LR**  | Lenguaje Regular                                    |
| $G_2$ | Gramática Tipo 2 o Independiente (libre) de Contexto (incontextuales) | **LIC** | Lenguaje Independiente de Contexto                  |
| $G_1$ | Gramática Tipo 1 o Dependiente (sensible) de Contexto (contextuales)  | **LDC** | Lenguaje Dependiente de Contexto                    |
| $G_0$ | Gramática Tipo 0 o Sin restricciones (Irrestricta)                    | **LRE** | Lenguaje Recursivamente Enumerable o No Restringido |

![Tipos de Gramáticas](img/tipos-gramaticas.png)

## Gramáticas Regulares (GR)

* Generan las palabras de los LR
* Son las más restrictivas
* Restricciones:
  
|                    |                                                                       |
| --                 | --                                                                    |
| **lado izquierdo** | un solo no terminal                                                   |
| **lado derecho**   | formado por un solo terminal, o un no terminal seguido de un terminal |
| **axioma**         | puede o no derivar a $\lambda$                                        |

* Pueden ser:

|                               |      |                                                                                                                         |
| --                            | --   | --                                                                                                                      |
| **Lineales por la izquierda** | GRLI | $P = \{(S \rightarrow \lambda) \mid (A \rightarrow Bv) \mid (A \rightarrow v) / (A, B) \in \Sigma_N, v \in \Sigma_T \}$ |
| **Lineales por la derecha**   | GRLD | $P = \{(S \rightarrow \lambda) \mid (A \rightarrow vB) \mid (A \rightarrow v) / (A, B) \in \Sigma_N, v \in \Sigma_T \}$ |

* Ejemplos:

|                                                                                                                                                                       |
| --                                                                                                                                                                    |
| $P = \{(S \rightarrow C0), (S \rightarrow D1), (C \rightarrow 1), (D \rightarrow C1)\}$                                                                               |
| $P = \{(A \rightarrow 1B), (B \rightarrow 1), (B \rightarrow 0C), (B \rightarrow 1C), (C \rightarrow 1)\}$                                                            |
| $P = \{(S \rightarrow \lambda), (S \rightarrow aA), (A \rightarrow aB), (A \rightarrow a), (B \rightarrow aA)\}$                                                      |
| $P = \{(S \rightarrow \lambda), (S \rightarrow Ca), (C \rightarrow Da), (C \rightarrow a), (D \rightarrow Ca)\}$                                                      |
| $P = \{(S \rightarrow a), (S \rightarrow aB), (B \rightarrow bB), (B \rightarrow aB), (B \rightarrow a), (B \rightarrow b)\}$ para el $L = \{aw / w \in \{a, b\}^*\}$ |

## Gramáticas Quasi Regulares (GQR)

* Vinculadas a la sintaxis de los lenguajes de programación
* Abrevia la escritura de una GR
* Ejemplo:

| L | GR | GQR |
| -- | -- | -- |
| $\{w_1 w_2 / w_1 \in \{a, b, c\} \wedge w_2 \in \{a, b, c\}^* \}$ | $S \rightarrow aS \mid bS \mid cS \mid a \mid b \mid c$ | $S \rightarrow A \mid AS \;A \rightarrow a \mid b \mid c$ |

## Derivación

* Es el proceso que permite obtener cada una de las palabras de un LF a partir del axioma de una GF que lo genera y aplicando sucesivamente las producciones convenientes de esa GF
* Existen diferentes formas de representar una derivación:
  * Horizontal
  * Vertical

### Derivación Horizontal

* Utilizando el símbolo $\Rightarrow$ en cada paso de una derivación
* Ejemplo: $L = \{a^nb / n > 0\}$  $P = \{(S \rightarrow aA), (A \rightarrow aA), (A \rightarrow b)\}$
  * $S \Rightarrow aA \Rightarrow ab$ entonces $ab \in L$
  * $S \Rightarrow aA \Rightarrow aaA \Rightarrow aab$ entonces $aab \in L$
  * $S \Rightarrow aA \Rightarrow aaA \Rightarrow aaaA \Rightarrow aaab$ entonces $aaab \in L$

### Derivación Vertical

* **Árbol de derivación**: permite mostrar gráficamente cómo se puede derivar cualquier palabra de un lenguaje a partir del axioma de una gramática que genera ese lenguaje
* Reemplazado un no terminal por su lado derecho para producir un nuevo subárbol
* Son utilizados en la construcción de compiladores para representar el análisis sintáctico de los programas fuente y sirviendo de base para la generación de código
* Ejemplo: $L = \{a^nb / n > 0\}$  $P = \{(S \rightarrow aA), (A \rightarrow aA), (A \rightarrow b)\}$

             S
            / \
            a  A
               |
               b

## Lenguaje generado por una gramática L(G)

* Es el conjunto de todas las palabras que se pueden obtener a partir del axioma de la gramática por la aplicación de derivaciones:
* $L(G) = \{w \in \Sigma_T^* : S \Rightarrow w\}$
* Ejemplo: $L(G) = \{ab, aab, aaab, aaaab, ...\}$

## Gramáticas equivalentes

* Dos gramáticas G y G’ son equivalentes si generan el mismo lenguaje, es decir, si $L(G) = L(G’)$
* Ejemplo G

    $S \rightarrow c A d$
    
    $A \rightarrow ab \mid a$
      
* Ejemplo G'
  
    $S \rightarrow cabd \mid cad$

## Gramáticas ambiguas

* Una gramática es ambigua si tiene al menos una sentencia ambigua
* Una sentencia es ambigua si tiene más de una derivación o árbol de derivación
* Un lenguaje es ambiguo si existe una gramática ambigua que lo genera
* En algunos casos, dada una gramática ambigua, se puede encontrar otra gramática que produzca el mismo lenguaje pero que no sea ambigua
* Ejemplo 1:

  $S \rightarrow 1B \mid 11$

  $B \rightarrow 1$
      
  * Dos derivaciones para 11:
    * $S \Rightarrow 1B \Rightarrow 11$
    * $S \Rightarrow 11$

* Ejemplo 2:

  $E \rightarrow E+E \mid E-E \mid num \mid id \mid (E)$

  * Dos derivaciones para id+id-id (una por la izquierda y otra por la derecha)
    * $E \Rightarrow E-E \Rightarrow E+E-E \Rightarrow id+E-E \Rightarrow id+id-E \Rightarrow id+id-id$
    * $E \Rightarrow E-E \Rightarrow E-id \Rightarrow E+E-id \Rightarrow E+id-id \Rightarrow id+id-id$

* Si una gramática tiene alguna de estas características, se podrá afirmar que es ambigua:
  * Con ciclos: $S \rightarrow A \mid a$     $A \rightarrow S$
  * Con alguna regla de la forma: $E \rightarrow E...E$
  * Con reglas que ofrecen caminos alternativos entre dos puntos: $S \rightarrow B \mid C$   $B \rightarrow C$
  * Producciones recursivas en las que las variables no recursivas de la producción puedan derivar a la palabra vacía. Ejemplo:


    $S \rightarrow A B S \mid s$

    $A \rightarrow a \mid \lambda$

    $B \rightarrow b \mid \lambda$

  * Símbolos no terminales que puedan derivar a la palabra vacía y a la misma palabra de terminales, y que aparezcan juntas en la parte derecha de una regla o en alguna forma sentencial. Ejemplo:


    $A \rightarrow A B \mid a \mid \lambda$
    
    $B \rightarrow b \mid a \mid \lambda$

## Factorización a izquierda

* Proceso que elimina el problema de que aparezcan producciones de un mismo símbolo no terminal en cuya parte derecha, la primera parte sea común
* Ejemplo:


    $S \rightarrow if \, C \, then \, S \, else \, S \mid if \, C \, then \, S \mid repeat \, S \, until \, C \mid repeat \, S \, forever$



* Algoritmo:

    * Por cada $A \in \Sigma_N$
    * Si $A \rightarrow \beta \alpha_1 \mid \beta \alpha_2$ cambiar esas reglas por:
      * $A \rightarrow \beta A’$
      * $A’\rightarrow \alpha_1 \mid \alpha_2$


* Salida del algoritmo:


  $S  \rightarrow if \, C \, then \, S \, A’\mid repeat \, S \, S’$
  
  $A’ \rightarrow else \, S \mid \lambda$

  $S’ \rightarrow until \, C \mid forever$    