# Elaborazione del linguaggio naturale

## Le grammatiche context free

Per poter eseguire questo notebook dobbiamo installare la libreria nltk (Natural Language Toolkit).
Quindi apriamo la finestra dei comandi di Windows o il terminale del Mac e facciamo eseguire i seguenti comandi:
```
pip install nltk
```
Se ottenete un errore di installazione come: 
ERROR: Could not install packages due to an OSError: [WinError 2] Impossibile trovare il file specificato:...
potete provare a installare la libreria con il seguente comando:
```
pip install nltk --user
```


Adesso importiamo la libreria nltk e creiamo una grammatica context free per una frase tipo composta da un frase nominale seguita da una frase verbale.

La frase nominale è composta da un articolo determinativo e un nome oppure da un nome oppure da un articolo non determinativo e un nome.

La frase verbale è composta da un verbo o da un verbo seguito da una frase nominale.


In [5]:
import nltk

grammatica = nltk.CFG.fromstring("""
    S1 -> FN FV

    FN -> D N | N | ND N
    FV -> V | V FN

    D -> "la" | "il"
    ND -> "un" | "una"
    N -> "lei" | "lui" | "macchina" | "mela" | "io"
    V -> "vedeva" | "camminava" | "è" | "mangia" | "mangio" | "guidava"
""")

analizzatore = nltk.ChartParser(grammatica)

Come potete vedere la descrizione della grammatica della struttura della frase che vogliamo analizzare è molto semplice:
```
S1 -> FN FV

    FN -> D N | N | ND N
    FV -> V | V FN

    D -> "la" | "il"
    ND -> "un" | "una"
    N -> "lei" | "lui" | "macchina" | "mela" | "io"
    V -> "vedeva" | "camminava" | "è" | "mangia" | "mangio" 
```
Se fate eseguire la cella di codice qui sotto vi sarà chiesto di inserire una frase in Italiano da esaminare.
Se il parser

In [6]:
frase = input("Digita una frase: ").split()
print(frase)
try:
    for alberoSintattico in analizzatore.parse(frase):
        alberoSintattico.pretty_print()
        alberoSintattico.draw()
except ValueError:
    print("Non è possibile creare un albero di analisi sintattica. La frase inserita non segue la grammatica definita")

['lei', 'guidava', 'la', 'macchina']
             S1                 
  ___________|___                
 |               FV             
 |      _________|___            
 FN    |             FN         
 |     |          ___|_____      
 N     V         D         N    
 |     |         |         |     
lei guidava      la     macchina



Possiamo inserire una grammatica più complessa per analizzare una varietà maggiore di frasi

In [8]:
grammatica2 = nltk.CFG.fromstring("""
    S -> NP VP

    AP -> A | A AP
    NP -> N | D NP | AP NP | N PP
    PP -> P NP
    VP -> V | V NP | V NP PP

    A -> "big" | "blue" | "small" | "dry" | "wide"
    D -> "the" | "a" | "an"
    N -> "she" | "city" | "car" | "street" | "dog" | "binoculars" | "Mario" | "apple" | "table" | "truck"
    P -> "on" | "over" | "before" | "below" | "with"
    V -> "saw" | "walked" | "parked" 
""")

analizzatoreSintattico2 = nltk.ChartParser(grammatica2)

frase = input("Digita una frase: ").split()
print(frase)
try:
    for tree in analizzatoreSintattico2.parse(frase):
        tree.pretty_print()
        tree.draw()
        break
except ValueError:
    print("Non è possibile creare un albero di analisi sintattica. La frase inserita non segue la grammatica definita")

['she', 'saw', 'the', 'car']
         S             
  _______|___           
 |           VP        
 |    _______|___       
 |   |           NP    
 |   |        ___|___   
 NP  |       |       NP
 |   |       |       |  
 N   V       D       N 
 |   |       |       |  
she saw     the     car

