# Gramática Independiente de Contexto (GIC)
---

* También llamadas Gramáticas Libres de Contexto o Incontextuales
* Generan las palabras de los LIC (tipo de LF)
* Son de gran utilidad en la representación de la sintaxis de los Lenguajes de Programación (expresiones aritméticas, sentencias de un lenguaje de programación, etc.)

## Ejemplo

$L = \{A:=A+B, C:=D-E*F, ...\}$

$$<sent asig> ::= <var> := <expresion>$$
$$<expresion> ::= <expresion> + <termino> \mid <expresion> - <termino> \mid <termino>$$
$$<termino> ::= <termino> * <factor> \mid <termino> / <factor> \mid <factor>$$
$$<factor> ::= (<expresion>) \mid <var> \mid <num>$$
$$<var> ::= A \mid ... \mid Z$$
$$<num> ::= 0 \mid ... \mid 9$$

## Restricciones

|                |                                         |
| --             | --                                      |
| lado izquierdo | un solo no terminal                     |
| lado derecho   | secuencia de terminales y no terminales |
| axioma         | puede o no derivar a $\lambda$          |

|                                             |
| --                                          |
| $P = \{(S \rightarrow \lambda) \mid (A \rightarrow v) / A \in \Sigma_N, v \in \Sigma^+\}$ |

* Ejemplo 1

$$S \rightarrow \lambda \mid 01S1 \mid 0S10 \mid A1$$
$$A \rightarrow 0S10$$

* Ejemplo 2

$$A \rightarrow 1B1 \mid 11$$
$$B \rightarrow 1 \mid 0$$

* Ejemplo 3

$$S \rightarrow A$$
$$A \rightarrow aAa \mid bAb \mid c$$

* Ejemplo 4

$$S \rightarrow ABC \mid AC \mid BC \mid C$$
$$A \rightarrow 0A1 \mid 01$$
$$B \rightarrow 1B2 \mid 12$$
$$C \rightarrow 3C \mid 3$$

## Ejemplos

$L = \{a^n b^n / n ≥ 1\}$

$$S \rightarrow aSb \mid ab$$

$L = \{a^n b^{2n+1} c^r / n ≥ 0, r ≥ 1\}$

$$S \rightarrow bC \mid AC$$
$$A \rightarrow abbb \mid aAbb$$
$$C \rightarrow cC \mid c$$

$L = \{0^n 1^m / n > 0 \wedge n > m\}$

$$S \rightarrow 0 \mid 0S \mid 0S1$$

* $L = \{xyx y^p z y^{2p+1} a^i b^k c^n / p, i, k ≥ 0 \wedge n > i+k \}$
* $L = \{xyx y^p z y^{2p+1} a^i b^k c^{i+k+a} / p, i, k ≥ 0 \wedge n = i+k+a, a>0 \}$
* $L = \{xyx y^p z y^{2p+1} a^i b^k c^a c^k c^i / p, i, k ≥ 0; a>0 \}$

$$S \rightarrow xyxAB$$
$$A \rightarrow yAyy \mid zy$$
$$B \rightarrow aBc \mid C$$
$$C \rightarrow bCc \mid D$$
$$D \rightarrow cD \mid c$$

![GIC colchita](img/gic.jpg)

## Eficiencia en el diseño de gramáticas

### Gramática limpia: si no tiene reglas innecesarias y símbolos inaccesibles

* **Reglas innecesarias**: son las que tienen la forma $A \rightarrow A$ donde $(A \in \Sigma_N)$. Se deben eliminar de las gramáticas, ya que no generan derivaciones útiles

$$S \rightarrow aA$$
$$A \rightarrow aA \mid A \mid a$$

* **Símbolos inaccesibles**: aquellos símbolos no terminales $A \in \Sigma_N$  que no pueden ser alcanzados por derivaciones desde el axioma de la gramática

$$S \rightarrow D0 \mid E10 \mid \lambda$$
$$B \rightarrow 1C3$$
$$C \rightarrow C$$
$$D \rightarrow 1S$$
$$E \rightarrow 1E$$

### Gramática bien formada: si está limpia, no tiene reglas generativas y no tiene reglas de redenominación

* **Reglas no generativas**: una regla es no generativa cuando $A \rightarrow \lambda$,  $A ≠ S$

$$S \rightarrow C0B \mid \lambda$$
$$B \rightarrow BC \mid \lambda$$
$$C \rightarrow 0B \mid \lambda$$

* Para eliminarlas, se puede seguir el algoritmo:

```plain
P’ = P
Repetir
  Por cada P = (A -> λ) ∈ P’ ^ (A ≠ S)
    P’ = P’ – {P}
    Por cada P’ = (B -> xAy) ∈ P’ (x, y ∈ Σ*)
      P’ = P’ U {(B -> xy)} – {P’}
Hasta que todas las reglas sean generativas
```

* **Reglas de redenominación**: una regla es de redenominación cuando $A \rightarrow B$ con  $A, B \in \Sigma_N$. Para eliminarlas, se borra esa regla y se genera una nueva producción $A \rightarrow x$ por cada $B \rightarrow x$, con $x \in \Sigma^*$

$$S \rightarrow C0B \mid 0B \mid C0 \mid 0 \mid \lambda$$
$$B \rightarrow BC \mid C$$
$$C \rightarrow 0B \mid 0$$

## Formas Normales

* Son simplificaciones a las reglas de producción de una GIC
* Uso en compiladores más eficientes para diversos lenguajes de programación
* Tipos:

| Siglas en Ingles | Siglas en Español | Nombre                      |
| --               | --                | --                          |
| CNF              | FNC               | Forma Normal de Chomsky     |
| GNG              | FNG               | Forma Normal de Greibach    |
| BNF              | FNB               | Forma Normal de Backus-Naur |

### Forma Normal de Chomsky

$$P = \{(S \rightarrow \lambda) \mid (A \rightarrow BC) \mid (A \rightarrow a) / A, B, C \in \Sigma_N, a \in \Sigma_T\}$$

* Ejemplo 1

$$S \rightarrow AB \mid b$$
$$A \rightarrow a$$
$$B \rightarrow SA$$

* Ejemplo 2

$$A \rightarrow CD \mid EB \mid \lambda$$
$$B \rightarrow BC \mid 1$$
$$C \rightarrow 2$$
$$D \rightarrow BC$$
$$E \rightarrow 1$$

| Ventajas                                                                                          |
| --                                                                                                |
| Todo árbol de derivación es de tipo binario                                                       |
| Toda palabra de longitud n es derivable en 2n-1 pasos                                             |
| Estos elementos son de importancia teórica y práctica (por ejemplo, programación de compiladores) |

#### Algoritmo GIC -> FNC

* Entrada: $G = (\Sigma_N, \Sigma_T, S, P)$
* Salida:  $G’= (\Sigma_N’, \Sigma_T, S, P’)$ en FNC

```plain
Mientras existen producciones cuyo lado derecho no respeta la FNC hacer:
  1. Reemplazar cada producción A -> B / B -> v1 | v2 | ... | vn por la producción A -> v1 | v2 | ... | vn 

  A -> B 
  B -> a | b | c

  A -> a | b | c

  2. Para cada producción, si su lado derecho tiene dos o más símbolos y contiene algún terminal v, reemplace las apariciones de v por un nuevo no terminal V. Agregue la regla V -> v. Es decir, para un no terminal V / V ∉ ΣN, ΣN’ = ΣN ∪ {V},  P’ = P ∪ {V -> v}

  A -> pBq

  A  -> PBQ   
  P  -> p
  Q -> q

  3. Para cada producción B -> C1C2...Cn, donde n > 2, reemplazar la producción por B -> C1D, y D -> C2...Cn, que introducen un nuevo no terminal D

  A -> BCDE

  A  -> BC1   
  C1 -> CDE
```

* Ejemplo:


$$S \rightarrow aSa \mid T$$
$$T \rightarrow b$$ 

$$\Huge \downarrow$$

$$S \rightarrow aSa$$
$$S \rightarrow b$$

$$\Huge \downarrow$$

$$S \rightarrow ASA$$
$$S \rightarrow b$$
$$A \rightarrow a$$

$$\Huge \downarrow$$

$$S \rightarrow AB$$
$$S \rightarrow b$$
$$A \rightarrow a$$
$$B \rightarrow SA$$

### Forma Normal de Greibach

$$P = \{(S \rightarrow \lambda) \mid (A \rightarrow aX)  / A \in \Sigma_N,  X \in \Sigma_N^*, a \in \Sigma_T\}$$

* Ejemplo:

$$A  \rightarrow 2BC \mid 1B \mid \lambda$$
$$B  \rightarrow 1B’ \mid 1$$
$$B’ \rightarrow 2B’ \mid 2$$
$$C  \rightarrow 2$$

| Ventaja                                                          |
| --                                                               |
| Se conoce que cada palabra de longitud n es derivable en n pasos |

#### Algoritmo GIC -> FNG

* Entrada: $G = (\Sigma_N, \Sigma_T, S, P)$
* Salida: $G’ = (\Sigma_N’, \Sigma_T, S, P’)$ en FNG
  
```plain
1. Eliminar la recursión a izquierda (por ejemplo: A -> Aa) sustituyendo cada sublenguaje generado recursivamente por un conjunto de reglas equivalente,  pero sin recursión
2. Agregar nuevas reglas de reescritura y no terminales para llevar las reglas existentes a la forma de Greibach:
  a. Reemplazar A ∈ ΣN en cada α -> β, de a una por vez, para introducir terminales a izquierda
  b. Reemplazar cada a ∈ ΣT que no está en la parte izquierda de β por nuevos A’ ∈ ΣN (esto deja solo no terminales a derecha)
```

* Ejemplo 1:

  
$$S \rightarrow AB$$
$$S \rightarrow B$$
$$A \rightarrow Aa$$
$$A \rightarrow b$$
$$B \rightarrow Ab$$
$$B \rightarrow c$$

$$\Huge \downarrow$$

$$S \rightarrow AB$$
$$S \rightarrow B$$
$$A \rightarrow b$$
$$A \rightarrow bD$$
$$D \rightarrow aD$$
$$D \rightarrow a$$
$$B \rightarrow Ab$$
$$B \rightarrow c$$

$$\Huge \downarrow$$

$$S \rightarrow bB$$
$$S \rightarrow bDB$$
$$S \rightarrow bb$$
$$S \rightarrow bDb$$
$$S \rightarrow c$$
$$D \rightarrow aD$$
$$D \rightarrow a$$
$$B \rightarrow bb$$
$$B \rightarrow bDb$$
$$B \rightarrow c$$

$$\Huge \downarrow$$

$$S \rightarrow bB$$
$$S \rightarrow bDB$$
$$S \rightarrow bE$$
$$S \rightarrow bDE$$
$$S \rightarrow c$$
$$D \rightarrow aD$$
$$D \rightarrow a$$
$$B \rightarrow bE$$
$$B \rightarrow bDE$$
$$B \rightarrow c$$
$$E \rightarrow b$$

* Ejemplo 2:

$$S \rightarrow xyxAB$$
$$A \rightarrow yAyy \mid zy$$
$$B \rightarrow aBc \mid C$$
$$C \rightarrow bCc \mid D$$
$$D \rightarrow cD \mid c$$

$$\Huge \downarrow$$

$$S \rightarrow xYXAB$$
$$A \rightarrow yAYY \mid zY$$
$$B \rightarrow aBE \mid bCE \mid cD \mid c$$
$$C \rightarrow bCE \mid cD \mid c$$
$$D \rightarrow cD \mid c$$
$$Y \rightarrow y$$
$$X \rightarrow x$$
$$E \rightarrow c$$

### Forma Normal de Backus-Naur

* En 1959, John Backus (Fortran) y Peter Naur (Algol) desarrollaron la notación BNF
* BNF fue desarrollada en paralelo con las GIC de Chomsky
* La notación BNF es equivalente a usar Diagramas de Conway
* Conjunto de reglas que definen, con precisión, la sintaxis de los componentes y de las estructuras de un Lenguaje de Programación
* Cada regla BNF se forma con elementos provenientes de 3 conjuntos disjuntos (convenciones):

| Elementos                        |                                                 | Ejemplos                                 |
| --                               | --                                              | --                                       |
| **Metavariables o noterminales** | palabras encerradas entre corchetes angulares   | \<identificador\>, \<letra\>, \<digito\> |
| **Terminales**                   | símbolos del alfabeto                           | if, else, while, =, !=                   |
| **Metasímbolos**                 | ayudan a representar estas reglas               | <>, ::=, \|                              |

#### BNF para validar la correcta apertura y cierre de una palabra de paréntesis

$$<palabra \quad par>  ::=  <palabra \quad par> <parentesis> \mid <parentesis>$$
$$<parentesis>  ::=  (<palabra \quad par>) \mid ()$$

#### BNF de un identificador en ALGOL

$$<identificador> ::= <letra> \mid <identificador> <letra> \mid <identificador> <dígito>$$
$$<letra> ::= a \mid b \mid c \mid ... \mid z \mid A \mid B \mid C \mid ... \mid Z$$
$$<dígito> ::= 0 \mid 1 \mid 2 \mid ... \mid 9$$

#### BNF de números enteros en ALGOL

$$<número \quad entero> ::= <entero \quad sin \quad signo> \mid + <entero \quad sin \quad signo> \mid - <entero \quad sin \quad signo>$$
$$<entero \quad sin \quad signo> ::= <dígito> \mid <entero \quad sin \quad signo> <dígito>$$
$$<dígito> ::= 0 \mid 1 \mid 2 \mid ... \mid 9$$

#### BNF para un mini lenguaje

$$<program> ::= begin <stmt \quad list> end$$
$$<stmt \quad list> ::= <stmt> \mid <stmt> ; <stmt \quad list>$$
$$<stmt> ::= <var> = <expression>$$
$$<var> ::= A \mid B \mid C$$
$$<expression> ::= <var> + <var> \mid <var> - <var> \mid <var>$$