<a href="https://colab.research.google.com/github/AmrChetibi/MC/blob/main/Grammar.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

Lo primero que debemos hacer es importar la clase GenerativeGrammar, que es la que nos permite trabajar con gramáticas independientes del contexto. También importamos la clase ProductionRule, que es la que nos permite trabajar con las producciones de las gramáticas.


In [None]:
from grammar import GenerativeGrammar
from production_rule import ProductionRule

# Lectura y escritura de gramáticas en ficheros

La gramática la podemos crear leyéndola desde un fichero. Dicho fichero tendrá la siguiente estructura:

- La primera línea contiene las variables de la gramática. Tal línea siempre empezará por "V = " para indicar que se está especificando el conjunto de variables. Dicho conjunto irá comprendido entre llaves. Las variables siempre empezarán por letra mayúscula. Cuando una variable tiene más de un símbolo empezará por '<' y terminará por '>', clarificando así que es una variable compuesta por más de un símbolo. Esto sirve, por ejemplo, para no confundir '<A1>' con el símbolo A seguido de un 1. Siempre la primera variable será la variable inicial.
    
- La segunda línea contiene los símbolos terminales de la gramática. Para indicar que se está especificando el conjunto de símbolos terminales, dicha línea empezará por "T = ". El conjunto de símbolos terminales estará delimitado por llaves y los símbolos terminales irán separados por comas.
    
- A partir de la cuarta línea (tras una línea en blanco) irán las producciones. Habrá una línea por cada variable que aparezca en la parte de la izquierda de las producciones. Dicha línea siempre empezará por esa variable seguido de " -> ". Después aparecerán las partes derechas de cada una de esas producciones separadas por "|".
    
Una vez que tenemos creado este fichero, debemos indicar la ruta relativa donde se encuentra. Después debemos de llamar al método de clase readGrammar pasando como parámetro dicha ruta para tener generada la gramática.

In [None]:
path_read = "grammar_proof.txt"
generated_grammar = GenerativeGrammar.readGrammar(path_read)

Del mismo modo, dado un objeto de la clase GenerativeGrammar, podemos escribir la gramática en un fichero especificando la
ruta de dicho fichero. Para ello, hemos emplear el método writeGrammar. El formato de escritura de la gramática es el mismo que el de lectura.

In [None]:
path_write = "grammar_written.txt"
generated_grammar.writeGrammar(path_write)

# Derivación de palabras con una gramática independiente del contexto

El método applyProductionRule recibe como parámetros una palabra, el comienzo y el fin de una regla de producción y la regla de producción a aplicar a una palabra y devuelve la palabra resultante de aplicar esa regla en las posiciones indicadas.

Mostramos debajo cómo obtener la palabra **aabbaa** mediante derivaciones sucesivas en la gramática anterior.

In [None]:
initial_word = generated_grammar.getInitialSymbol()
first_rule = generated_grammar.getProductionRules()[0]

second_word = generated_grammar.applyProductionRule(initial_word,0,0,first_rule)
print(second_word)

second_rule = generated_grammar.getProductionRules()[2]
third_word = generated_grammar.applyProductionRule(second_word,1,1,second_rule)
print(third_word)

third_rule = generated_grammar.getProductionRules()[1]
fourth_word = generated_grammar.applyProductionRule(third_word,1,1,third_rule)
print(fourth_word)

fourth_rule = generated_grammar.getProductionRules()[4]
fifth_word = generated_grammar.applyProductionRule(fourth_word,3,3,fourth_rule)
print(fifth_word)

final_word = generated_grammar.applyProductionRule(fifth_word,5,5,third_rule)
print(final_word)



aAS
aSbAS
aabAS
aabbaS
aabbaa


# Gramáticas lineales

Una gramática independiente del contexto es lineal por la derecha (izquierda) si todas las producciones son de la forma $A \rightarrow uB$ ($A \rightarrow Bu$), donde u es un símbolo terminal y B es una variable. Los métodos linearRight y linearLeft nos permiten comprobar si una gramática independiente del contexto es lineal por la derecha o por la izquierda, respectivamente

In [None]:
lineal_right = generated_grammar.linearRight()
lineal_right

False

In [None]:
lineal_left = generated_grammar.linearLeft()
lineal_left

False

# Eliminación de símbolos y producciones inútiles

Lo primero que se debe de hacer cuando se tiene una gramática independiente del contexto es eliminar símbolos y producciones inútiles, es decir, símbolos y producciones que nunca se usan en la derivación de una palabra. El algoritmo para eliminar símbolos y producciones inútiles consta de dos pasos:

1. Eliminar las variables desde las que no se puede alcanzar una cadena de símbolos terminales, así como las producciones donde aparezan estas variables.

2. Eliminar las variables y símbolos terminales que no son alcanzables desde el símbolo inicial, así como las producciones donde aparezcan estas variables y símbolos.

Los símbolos y producciones nulas de la gramática pueden eliminarse con el método deleteUselessSymbolsProductions. A continuación mostramos un ejemplo donde leemos una gramática, eliminamos los símbolos y producciones inútiles y volvemos a escribir la gramática con dichos símbolos y producciones eliminados.

In [None]:
path_useless = "grammar_useless.txt"
grammar_useless = GenerativeGrammar.readGrammar(path_useless)
grammar_useless.deleteUselessSymbolsProductions(True)

path_write_useless = "grammar_written_without_useless.txt"
grammar_useless.writeGrammar(path_write_useless)

Deleting the variables that cannot be replaced by terminal symbols
Deleting the productions with symbol X
Deleting the symbol X
Deleting the productions with symbol Y
Deleting the symbol Y
Deleting the productions with symbol Z
Deleting the symbol Z
Deleting the variables and symbols not reachable from the initial symbol
Deleting the productions with the variable B
Deleting the variable B
Deleting the productions with the variable D
Deleting the variable D
Deleting the productions with the variable U
Deleting the variable U
Deleting the productions with the variable W
Deleting the variable W
Deleting the terminal symbol a
Deleting the terminal symbol b
Deleting the terminal symbol c
Deleting the terminal symbol d
Deleting the terminal symbol f
Deleting the terminal symbol h
Deleting the terminal symbol j
Deleting the terminal symbol k
Deleting the terminal symbol m
Deleting the terminal symbol n


# Formas normales de la Gramática

Para poder pasar la gramática a formas normales primero debemos de eliminar las producciones nulas y unitarias. El método deleteNullProductions nos permite eliminar las producciones nulas de la gramática. Las producciones unitarias se eliminan con el método deleteUnitaryProductions.

A continuación mostramos un ejemplo donde se lee una gramática de fichero, se eliminan las producciones nulas y se escribe la gramática en otro fichero con las producciones nulas eliminadas. Lo mismo con las producciones unitarias.



In [None]:
path_null_productions = "grammar_null_productions.txt"
grammar_null_productions = GenerativeGrammar.readGrammar(path_null_productions)
grammar_null_productions.deleteNullProductions(True)

path_write_null = "grammar_written_without_null.txt"
grammar_null_productions.writeGrammar(path_write_null)

List of nullable variables 
['A', 'B', 'C', 'S']
Removing the production 
Left part: 
A
Right part: 
[]

Removing the production 
Left part: 
B
Right part: 
[]

Adding the production 
Left part: 
S
Right part: 
['B', 'b']

Adding the production 
Left part: 
S
Right part: 
['A', 'b']

Adding the production 
Left part: 
S
Right part: 
['b']

Adding the production 
Left part: 
S
Right part: 
['B', 'C']

Adding the production 
Left part: 
S
Right part: 
['A', 'C']

Adding the production 
Left part: 
S
Right part: 
['C']

Adding the production 
Left part: 
S
Right part: 
['A', 'B']

Adding the production 
Left part: 
S
Right part: 
['B']

Adding the production 
Left part: 
S
Right part: 
['A']

Adding the production 
Left part: 
A
Right part: 
['a']

Adding the production 
Left part: 
B
Right part: 
['b']

Adding the production 
Left part: 
C
Right part: 
['a', 'b']

Adding the production 
Left part: 
C
Right part: 
['B']

Adding the production 
Left part: 
C
Right part: 
['A']



In [None]:
path_unitary_productions = "grammar_unitary_productions.txt"
grammar_unitary_productions = GenerativeGrammar.readGrammar(path_unitary_productions)
grammar_unitary_productions.deleteUnitaryProductions(True)

path_write_unitary = "grammar_written_without_unitary.txt"
grammar_unitary_productions.writeGrammar(path_write_unitary)

List of derivable pairs 
[('S', 'A'), ('A', 'B'), ('S', 'B')]
Deleting the production 
Left part: 
S
Right part: 
['A']

Deleting the production 
Left part: 
A
Right part: 
['B']

Adding the production 
Left part: 
S
Right part: 
['a', 'A', 'b']

Adding the production 
Left part: 
S
Right part: 
['c', 'd']

Adding the production 
Left part: 
A
Right part: 
['c', 'c', 'B', 'S']

Adding the production 
Left part: 
A
Right part: 
['d', 'c']

Adding the production 
Left part: 
S
Right part: 
['c', 'c', 'B', 'S']

Adding the production 
Left part: 
S
Right part: 
['d', 'c']



## Forma Normal de Chomsky

Una vez eliminadas las producciones nulas y unitarias, podemos pasar la gramática a Forma Normal de Chomsky. Recordar que una gramática independiente del contexto está en forma Normal de Chomsky si todas las producciones son de la forma $A \rightarrow BC$ o $A \rightarrow a$, donde $B$ y $C$ son variables y $a$ es un símbolo terminal. El método transformChomsky transforma una gramática en forma normal de Chomsky.

A continuación mostramos un ejemplo donde se lee una gramática, se tranforma a forma Normal de Chomsky y se vuelve a escribir la gramática en esta forma normal.

In [None]:
path_Chomsky = "grammar_Chomsky.txt"
grammar_Chomsky = GenerativeGrammar.readGrammar(path_Chomsky)
grammar_Chomsky.transformChomsky(True)

path_write_Chomsky = "grammar_written_Chomsky.txt"
grammar_Chomsky.writeGrammar(path_write_Chomsky)

List of nullable variables 
[]
List of derivable pairs 
[]
Adding the variable <Cb>
Adding the production 
Left part: 
<Cb>
Right part: 
['b']

Adding the variable <Ca>
Adding the production 
Left part: 
<Ca>
Right part: 
['a']

Adding the variable <D1>
Adding the production 
Left part: 
A
Right part: 
['<Cb>', '<D1>']

Adding the production 
Left part: 
<D1>
Right part: 
['A', 'A']

Removing the production 
Left part: 
A
Right part: 
['<Cb>', 'A', 'A']

Adding the variable <D2>
Adding the production 
Left part: 
B
Right part: 
['<Ca>', '<D2>']

Adding the production 
Left part: 
<D2>
Right part: 
['B', 'B']

Removing the production 
Left part: 
B
Right part: 
['<Ca>', 'B', 'B']



## Forma Normal de Greibach


Para poder pasar una gramática a Formal Normal de Greibach todas las producciones han de ser de la forma $A \rightarrow a$ o $A \rightarrow \alpha$, donde $\alpha \in V^{*}$. El método greibachAppliable comprueba si una gramática cumple estos requisitos y, por consiguiente, está en condiciones de transformarse a forma Normal de Greibach. La transformación de una gramática a forma normal de Greibach puede hacerse mediante el método transformGreibach.

En el siguiente ejemplo leemos una gramática desde un fichero, comprobamos si está en condiciones de ser transformada a Forma Normal de Greibach y la transformamos a dicha forma normal. Finalmente, escribimos la gramática en Forma Normal de Greibach en un fichero.

In [None]:
path_Greibach = "grammar_Greibach.txt"
grammar_Greibach = GenerativeGrammar.readGrammar(path_Greibach)

greibach_appliable = grammar_Greibach.greibachAppliable(True)
print(greibach_appliable)

True


In [None]:
grammar_Greibach.transformGreibach(True)

path_write_Greibach = "grammar_written_Greibach.txt"
grammar_Greibach.writeGrammar(path_write_Greibach)

Running the first part of the Greibach algorithm
Making the first deletion of the Greibach algorithm with the production 
Left part: 
<A3>
Right part: 
['<A2>', '<A3>', '<A2>']

Making the second deletion of the Greibach algorithm with the variable <A3>
Running the second part of the Greibach algorithm
Making the first deletion of the Greibach algorithm with the production 
Left part: 
<A2>
Right part: 
['<A3>', '<A1>']

Making the first deletion of the Greibach algorithm with the production 
Left part: 
<A1>
Right part: 
['<A2>', '<A3>']

Making the first deletion of the Greibach algorithm with the production
Left part: 
<B<A3>>
Right part: 
['<A1>', '<A3>', '<A2>']

Making the first deletion of the Greibach algorithm with the production
Left part: 
<B<A3>>
Right part: 
['<A1>', '<A3>', '<A2>', '<B<A3>>']



# Problema de la pertenencia con gramáticas en forma Normal de Greibach

Como sabemos, la forma Normal de Greibach sirve para poder determinar si una palabra puede ser generada por la gramática con un árbol con una profundidad máxima igual a la longitud de la palabra. En cada nivel del árbol se genera un símbolo terminal. El método checkBelongingRecursiveGreibach sirve para realizar esta búsqueda recursiva en forma normal de Greibach

In [None]:
word1 = "ba"
belonging_word1 = grammar_Greibach.wordBelongsGreibach(word1, True)
print(belonging_word1)

Running the first part of the Greibach algorithm
Running the second part of the Greibach algorithm
True


# Ejercicios

1. Se considera la gramática $(\{S,A,B\},\{0,1\},P,S)$, donde $P$ viene determinado por las siguientes producciones:

$S \rightarrow 0A0 \mid 1B1, \quad A \rightarrow 0A0\mid 1B1, \quad B \rightarrow 1B1 $.

Se pide leer la gramática desde un fichero que tendrá el formato especificado anteriormente y obtener la palabra $00111100$ mediante sucesivas derivaciones.



2. Sea la gramática $(\{S,A\}, \{a,b,z\}, P, S)$, siendo $P$ el siguiente conjunto de producciones:

$S \rightarrow aSA \mid \epsilon, \quad A \rightarrow bA \mid z \mid \epsilon$

a) Leer la gramática desde fichero.

b) Demostrar que es ambigua obteniendo dos cadenas de derivación diferentes para una misma palabra.

3. Dada la gramática $(\{S,A,B\}, \{a\}, P, S)$, donde $P$  es el siguiente conjunto de producciones:

$S \rightarrow A \mid B, \quad A \rightarrow aaA \mid \epsilon, \quad B \rightarrow aaaB \mid \epsilon$

a) Leer la gramática desde fichero

b) Demostrar que es ambigua

c) Crear una gramática no ambigua lineal por la izquierda que genera el mismo lenguaje y escribirla en un fichero

d) Comprobar que la gramática generada es lineal por la izquierda

4. Construir una gramática lineal por la izquierda que genera el lenguaje formado por las subcadenas sobre el alfabeto $\{0,1\}$ que contienen un número impar de 0 y 1.

Comprobar que la gramática generada es lineal por la izquierda y escribirla en un fichero.

5. Leyendo desde fichero, crear la siguiente gramática:

 $S \rightarrow aAb\mid cEB \mid CE \quad A \rightarrow dBE \mid eeC \quad B \rightarrow ff \mid D \quad C \rightarrow gFB\mid ae \quad D \rightarrow h$

Eliminar símbolos y producciones inútiles. Intentar comprobar que el lenguaje generado por la gramática no cambia.



6. Crear la siguiente gramática leyéndola desde fichero:

 $ S \rightarrow ABaC \quad A \rightarrow AB \quad B \rightarrow b\mid \epsilon \quad C \rightarrow B \mid \epsilon \quad D \rightarrow d$

 Eliminar producciones unitarias. Comprobar que, con estas eliminaciones, que no cambia la pertenencia de algunas palabras al lenguaje generado por la gramática.

7. Se considera la siguiente gramática $(V,T,P,S)$, donde V = $\{S,A,B,C,D,E\}, \quad T = \{a,b,c,d\}$ y $P$ viene determinado por las siguientes producciones:

$S \rightarrow AB \mid C \mid BE, \quad A \rightarrow aAb \mid \epsilon, \quad B \rightarrow cBd \mid \epsilon, \quad C \rightarrow aCd \mid aDd, \quad D \rightarrow bDc \mid \epsilon$.

Se pide:

a) Leerla desde fichero

b) Eliminar símbolos y producciones inútiles.

c) Eliminar producciones nulas y unitarias.

d) Pasar la gramática a Forma Normal de Chomsky.

8.   Obtener la forma normal de Greibach para la siguiente gramática, leyéndola previamente desde fichero

$< \{ S_1, S_2, S_3 \}, \{ a,b,c,d,e \}, P., S_1 >$
donde

$ P = \{ S_1 \rightarrow S_1 S_2 c, S_3, S_3 b S_3; S_2 \rightarrow S_1 S_1, d; S_3 \rightarrow S_2 e \}$.

Escribir la gramática resultante en un fichero.

9. Leer desde fichero la siguiente gramática:

$S\rightarrow AAA \mid B, \quad A \rightarrow aA \mid B, \quad B \rightarrow \epsilon$.

Obtener la forma Normal de Greibach de esta gramática mediante el método correspondiente. Usando esta forma normal de Greibach, comprobar la pertenencia de algunas palabras al lenguaje generado por la gramática, seleccionando tanto palabras que pertenecen como palabras que no.

10. Se considera la gramática independiente del contexto dada por las siguientes producciones:

$ S \rightarrow aABb \mid aBA \mid \epsilon, \quad A \rightarrow aS \mid bAAA, \quad  B \rightarrow aABB \mid aBAB \mid aBBA \mid bS$


Pasarla a Forma Normal de Greibach. Utilizando esta forma normal, comprobar si las cadenas $aabaab$ y las cadenas $bbaaa$ son generadas por esta gramática.
