# Parsers para Gramáticas independientes de contexto

In [None]:
import nltk
import re

In [None]:
# Recursive Descent Parser

def rd_parser(oracion, gramatica):                  # Definimos una función llamada rd_parser con dos argumentos.
    oracion = oracion.lower()                       # Convertimos a minúscula la oración utilizando una función nativa de la cadena de caracteres: lower(). 
        
    if oracion.endswith('.'):                       # Otra función nativa de las strings nos ayuda a chequear si la cadena termina en x argumento.
        oracion = re.sub('\.',' ',oracion)          # En este caso, si la oración termina con un punto, se lo quita utilizando la librería de expresiones regulares "re".
    else:                                           # Si no termina con un punto, 
        oracion = oracion                           # toma la oración como estaba originalmente.
    lista_palabras = oracion.split()              # Dividimos la oración en palabras tomando como separador el espacio en blanco  con otra función nativa de las strings: split.
    print("- Esta es la lista de palabras resultante: ", lista_palabras) # Split nos devuelve una lista (ordenada) de strings.
      
    gramatica = nltk.data.load(gramatica)           # Usamos la función de la sub librería "data" que nos permite cargar una gramática para que pueda ser usada luego por el parser.    
    rd_parser = nltk.RecursiveDescentParser(gramatica) # Instanciamos la clase del parser que nos da NLTK pasandole un argumento obligatorio: la gramática.
    for arbol in rd_parser.parse(lista_palabras):    # Una vez que instanciamos la clase, podemos usar sus funciones mientras le pasemos los argumentos requeridos. En este caso, usamos la función "parser" a la que le pasaremos nuestra lista de palabras, y la función nos devolverá cada árbol posible en mi gramática para esa oración.
        print("- Este es el árbol resultante: ", arbol.draw()) # Imprimimos cada árbol en la consola.

In [None]:
#Para correr el Recursive Descent Parser

print('Escribí una oración:')                          # Para que me pida que escriba una oración
oracion1 = input()                                     # Para que me abra un campo en el que escriba la oración
gramatica = 'gramaticas/prueba2.cfg'                       # Indicamos el path a nuestra gramatica
rd_parser(oracion1, gramatica)                         # Llamamos a la función que creamos con los dos argumentos que establecimos como obligatorios.

# Oraciones que acepta la gramática: 
# Cata/Martín/Julia/Maca/Pablo fuma
# Cata/Martín/Julia/Maca/Pablo entregó/envió el/la/un/una plaza/facultad/regalo/globo/tabaco

In [None]:
# Primera iteraciòn: todas las reglas que contengan la categorìa
# Segunda iteraciòn: borrar todas las reglas que no tengan nodo terminal
{'SV': ['FV', 'FV SP', 'V']}
{'SV': ['SV -> FV', 'FV SP', 'V']}

In [None]:
def test_given_categorial_grammar_when_translator_runs_then_return_CFG():
        expected: """S -> SN SV
        SN -> PRO
        SN -> D NC
        SN -> NP
        NP ->  'julia' | 'cata' | 'fede' | 'martín' | 'pablo' | 'fer' | 'vicky'
        NC -> 'regalo' | 'globo' | 'plaza' | 'facultad' | 'tabaco'
        D -> 'el' | 'la' | 'una' | 'un'
        PRO -> 'él' | 'ella'
        PART -> 'enviado' | 'entregado' | 'explotado' | 'fumado'
        IV -> 'fuma' | 'habla'
        TV -> 'fumó' | 'explotó'
        DTV -> 'envió' | 'entregó'
        SV -> TV SN
        SV -> DTV SN
        SV -> DTV SN SN
        SV -> IV
        SV -> FV
        SV -> FV SP
        SV -> FV SN
        FV -> AUX PART
        FV -> DTV
        AUX -> 'fue'
        SP -> P SN
        P -> 'a' | 'por' | 'en'"""
        categorial = """:- S, NP, NC, PARTP, PP
            D :: NP/NC
            PRO :: NP

            TV :: (S\NP)/NP
            DTV :: TV/PP


            el => D
            la => D
            una => D
            un => D

            julia => NP
            cata => NP
            fede => NP
            martín => NP
            pablo => NP
            fer => NP
            vicky => NP

            él => PRO
            ella => PRO

            regalo => NC
            globo => NC
            plaza => NC
            facultad => NC
            tabaco => NC

            fuma => S\NP

            fumó => TV
            explotó => TV

            envió => DTV
            entregó => DTV

            a => PP/NP
            por => PP/NP
            en => PP/NP

            fumado => PARTP/PP
            enviado => PARTP/PP
            entregado => PARTP/PP
            explotado => PARTP/PP

            fue => (S\NP)/PARTP

            explotó => S\NP
            habla => S\NP
            """
        result = translator(categorial)
        assert result == expected

{% include additional_content.html %}

{% include copybutton.html %}