In [1]:
pip install nltk

Note: you may need to restart the kernel to use updated packages.
You should consider upgrading via the 'C:\Users\gino_\AppData\Local\Programs\Python\Python39\python.exe -m pip install --upgrade pip' command.


## Gramáticas

In [2]:
import nltk
from nltk import CFG
from nltk.parse.generate import generate

In [3]:
gramatica = CFG.fromstring(""" 
F -> SUJETO PREDICADO
SUJETO -> 'juan' | 'pedro' | 'maria' | 'salgado'
PREDICADO -> VT OD
PREDICADO -> VI
VT -> 'ama'  | 'lava' | 'peina' | 'adora'
OD -> 'paula' | 'antonio' | 'sultan'
VI -> 'corre' | 'salta' | 'camina'
""")

## Mostramos la gramática

In [4]:
print('La gramática: ', gramatica)
# 17 reglas o producciones

La gramática:  Grammar with 17 productions (start state = F)
    F -> SUJETO PREDICADO
    SUJETO -> 'juan'
    SUJETO -> 'pedro'
    SUJETO -> 'maria'
    SUJETO -> 'salgado'
    PREDICADO -> VT OD
    PREDICADO -> VI
    VT -> 'ama'
    VT -> 'lava'
    VT -> 'peina'
    VT -> 'adora'
    OD -> 'paula'
    OD -> 'antonio'
    OD -> 'sultan'
    VI -> 'corre'
    VI -> 'salta'
    VI -> 'camina'


## El axioma o punto de partida

In [5]:
print('Inicio: ', gramatica.start())

Inicio:  F


## Producciones

In [6]:
print(gramatica.productions())

[F -> SUJETO PREDICADO, SUJETO -> 'juan', SUJETO -> 'pedro', SUJETO -> 'maria', SUJETO -> 'salgado', PREDICADO -> VT OD, PREDICADO -> VI, VT -> 'ama', VT -> 'lava', VT -> 'peina', VT -> 'adora', OD -> 'paula', OD -> 'antonio', OD -> 'sultan', VI -> 'corre', VI -> 'salta', VI -> 'camina']


## Verificar si una frase corresponde a la gramática

In [7]:
try:
    gramatica.check_coverage(['maria','ama','antonio'])
    print('Esta correctamente escrito')
except:
    print('La frase no esta en la gramática')

Esta correctamente escrito


## Generación del lenguaje

In [8]:
# limitar la cantidad de frases que se genere en casos de recursividad, para esto el valor de n
# En la realidad todos los lenguajes tienen recursividad
for sentence in generate(gramatica, n = 50):
    print(' '.join(sentence))

juan ama paula
juan ama antonio
juan ama sultan
juan lava paula
juan lava antonio
juan lava sultan
juan peina paula
juan peina antonio
juan peina sultan
juan adora paula
juan adora antonio
juan adora sultan
juan corre
juan salta
juan camina
pedro ama paula
pedro ama antonio
pedro ama sultan
pedro lava paula
pedro lava antonio
pedro lava sultan
pedro peina paula
pedro peina antonio
pedro peina sultan
pedro adora paula
pedro adora antonio
pedro adora sultan
pedro corre
pedro salta
pedro camina
maria ama paula
maria ama antonio
maria ama sultan
maria lava paula
maria lava antonio
maria lava sultan
maria peina paula
maria peina antonio
maria peina sultan
maria adora paula
maria adora antonio
maria adora sultan
maria corre
maria salta
maria camina
salgado ama paula
salgado ama antonio
salgado ama sultan
salgado lava paula
salgado lava antonio


## Generar Arbol derivacional

In [9]:
frase = ['maria','ama','antonio']
parser = nltk.ChartParser(gramatica)
for arbol in parser.parse(frase):
    print(arbol)

(F (SUJETO maria) (PREDICADO (VT ama) (OD antonio)))
