# Gramáticas categoriales con rasgos

## Requerimientos

In [1]:
import nltk 
import re 
from nltk.ccg import lexicon, chart 
from nltk.ccg.chart import printCCGDerivation

Las gramáticas categoriales están conformadas principalmente por un conjunto reducido de reglas y un léxico sumamente rico.
Las reglas que utiliza OpenCCG, que es el parser categorial que vamos a ver son las siguientes:

![reglas categoriales](reglascategorialesopenccg.png)

Construir una gramática categorial consiste principalmente en elaborar un léxico lo suficientemente rico, ya que las gramáticas categoriales son fuertemente lexicalistas. En ellas, la categoría a la que pertenece cada entrada léxica codifica sus posibilidades combinatorias.

## Gramática categorial combinatoria con rasgos en NLTK

In [2]:
#Combinatory Categorial Grammar with features
# Esta hay que revisarla y ver cómo se corrige para que funcione

def combinatory_parser(sentence, grammar):   
    sentence = sentence.lower()                                     # convierte a minúscula
    if sentence.endswith('.'):                                      # si la oración termina con un punto
        sent = re.sub('\.',' ',sentence)                            # se lo quita
    else:                                                           # si no
        sent = sentence                                             # la toma como está
    sent = sent.split()
    codigogram = nltk.data.load(grammar, cache=False)              # carga la gramática a nltk
    lex = lexicon.fromstring(codigogram)
    print(lex)
    parser = chart.CCGChartParser(lex, chart.DefaultRuleSet)
    parses = list(parser.parse(sent))
    quantparses = len(parses)
    print(str(quantparses) + " parses")
    print(sent)
    parseslist = 0
    def showccgparses(parseslist1, quantparses1):
        if parseslist1 < quantparses1:
            printCCGDerivation(parses[parseslist1])
            parseslist2 = parseslist1 + 1
            showccgparses(parseslist2, quantparses1)
        elif parseslist == quantparses: 
            printCCGDerivation(parses[parseslist])
    if quantparses == 0:
        print('No se encontraron estructuras para imprimir')
    elif quantparses > 0:
        showccgparses(parseslist, quantparses)

In [3]:
grammar = 'gramaticas/FCG1.txt'
oracion5 = 'julia fuma'
combinatory_parser(oracion5, grammar)

cata => NP['tres']
el => (NP['tres']/NC['masc'])
explotó => (S\NP['tres'])
facultad => NC['fem']
fede => NP['tres']
fer => NP['tres']
fuma => (S\NP['tres'])
fumó => (S\NP['tres'])
globo => NC['masc']
habla => (S\NP['tres'])
julia => NP['tres']
la => (NP['tres']/NC['fem'])
martín => NP['tres']
pablo => NP['tres']
plaza => NC['fem']
regalo => NC['masc']
tabaco => NC['masc']
un => (NP['tres']/NC['masc'])
una => (NP['tres']/NC['fem'])
vicky => NP['tres']
1 parses
['julia', 'fuma']
   julia          fuma
 NP['tres']  (S\NP['tres'])
----------------------------<
             S


In [4]:
grammar = 'gramaticas/FCG2.txt'
oracion6 = 'ella fuma'
#oracion6 = 'la persona fuma'
#oracion6 = 'la persona fuma el cigarrillo' 
#oracion6 = 'la plaza fuma' # Pregunta a estudiantes: ¿por qué da agramatical?
#oracion6 = 'la persona fuma y yo hablo'
combinatory_parser(oracion6, grammar)

agarra => ((S\NP['tres','anim'])/NP['inanim'])
agarro => ((S\NP['uno','anim'])/NP['inanim'])
agarrás => ((S\NP['dos','anim'])/NP['inanim'])
cata => NP['tres','anim']
cigarrillo => NC['masc','inanim']
el => (NP['tres','anim']/NC['masc','anim']) | (NP['tres','inanim']/NC['masc','inanim'])
ella => NP['tres','anim']
explotó => (S\NP['tres','inanim'])
facultad => NC['fem','inanim']
fede => NP['tres','anim']
fer => NP['tres','anim']
fuma => (S\NP['tres','anim']) | ((S\NP['tres','anim'])/NP['inanim'])
fumo => (S\NP['uno','anim']) | ((S\NP['uno','anim'])/NP['inanim'])
fumás => (S\NP['dos','anim']) | ((S\NP['dos','anim'])/NP['inanim'])
fumó => (S\NP['tres','anim'])
globo => NC['masc','inanim']
habla => (S\NP['tres','anim'])
hablo => (S\NP['uno','anim'])
hablás => (S\NP['dos','anim'])
julia => NP['tres','anim']
la => (NP['tres','anim']/NC['fem','anim']) | (NP['tres','inanim']/NC['fem','inanim'])
martín => NP['tres','anim']
mira => ((S\NP['tres','anim'])/NP['inanim'])
miro => ((S\NP['uno','anim']

## Gramática categorial con anotación semántica

In [5]:
def ccgsemparse(sentence, grammar):
    sentence = sentence.lower()                                     # convierte a minúscula
    if sentence.endswith('.'):                                      # si la oración termina con un punto
        sent = re.sub('\.',' ',sentence)                            # se lo quita
    else:                                                           # si no
        sent = sentence                                             # la toma como está
    sent = sent.split()   
    codigogram = nltk.data.load(grammar, cache=False)              # carga la gramática a nltk
    print(codigogram)
    print(type(codigogram))
    lex = lexicon.fromstring(codigogram, True)
    print(lex)
    parser = chart.CCGChartParser(lex, chart.DefaultRuleSet)
    parses = list(parser.parse(sent))
    quantparses = len(parses)
    print(str(quantparses) + " parses")
    print(sent)
    parseslist = 0
    def showccgparses(parseslist1, quantparses1):
        if parseslist1 < quantparses1:
            printCCGDerivation(parses[parseslist1])
            parseslist2 = parseslist1 + 1
            showccgparses(parseslist2, quantparses1)
        elif parseslist == quantparses: 
            printCCGDerivation(parses[parseslist])
    if quantparses == 0:
        print('No se encontraron estructuras para imprimir')
    elif quantparses > 0:
        showccgparses(parseslist, quantparses)

In [6]:
oracion6= "pablo fuma"
#oracion6 = 'juan dio fernando a romi'
grammar3 = 'gramaticas/SCG1.txt'
ccgsemparse(oracion6, grammar3)

:- S, NP, PP
juan => NP {juan}
pablo => NP {pablo}
romi => NP {romi}
fernando => NP {fernando}
maca => NP {maca}
fuma => (S\NP) {\x.fumar(x)}
explota => (S\NP) {\x.explotar(x)}
corre => (S\NP) {\x.correr(x)}
nada => (S\NP) {\x.nadar(x)}
dio => ((S\NP)/PP)/NP {\x y z.dar(y,x,z)}
a => PP/NP {\x P.P(x)}

<class 'str'>
a => (PP/NP) {\x P.P(x)}
corre => (S\NP) {\x.correr(x)}
dio => (((S\NP)/PP)/NP) {\x y z.dar(y,x,z)}
explota => (S\NP) {\x.explotar(x)}
fernando => NP {fernando}
fuma => (S\NP) {\x.fumar(x)}
juan => NP {juan}
maca => NP {maca}
nada => (S\NP) {\x.nadar(x)}
pablo => NP {pablo}
romi => NP {romi}
1 parses
['pablo', 'fuma']
   pablo             fuma
 NP {pablo}  (S\NP) {\x.fumar(x)}
----------------------------------<
         S {fumar(pablo)}


In [7]:
oracion6 = 'I give them money'
grammar3 = 'gramaticas/SCG2.txt'
ccgsemparse(oracion6, grammar3)

:- S, NP
i => NP {I}
give => ((S\NP)/NP)/NP {\x y z.give(y,x,z)}
them => NP {them}
money => NP {money}

<class 'str'>
give => (((S\NP)/NP)/NP) {\x y z.give(y,x,z)}
i => NP {I}
money => NP {money}
them => NP {them}
3 parses
['i', 'give', 'them', 'money']
   i                     give                     them       money
 NP {I}  (((S\NP)/NP)/NP) {\x y z.give(y,x,z)}  NP {them}  NP {money}
        -------------------------------------------------->
                ((S\NP)/NP) {\y z.give(y,them,z)}
        -------------------------------------------------------------->
                        (S\NP) {\z.give(money,them,z)}
----------------------------------------------------------------------<
                        S {give(money,them,I)}
   i                     give                     them       money
 NP {I}  (((S\NP)/NP)/NP) {\x y z.give(y,x,z)}  NP {them}  NP {money}
-------->T
(S/(S\NP)) {\F.F(I)}
        -------------------------------------------------->
                ((S\NP)/

## Para TP4

In [20]:
grammar = 'gramaticas/tp4.txt'
#oraciontp = 'El leon corre'
#oraciontp = 'La leona corre'
#oraciontp = 'El leona corre'
#oraciontp = 'La leon corre'
#oraciontp = 'El leon esta cansado'
#oraciontp = 'El leon esta cansada'
#oraciontp = 'El leona esta cansado'
#oraciontp = 'El leona esta cansada'
#oraciontp = 'La leon esta cansado'
#oraciontp = 'La leon esta cansada'
#oraciontp = 'La leona esta cansado'
#oraciontp = 'La leona esta cansada'
#oraciontp = 'El leon come la carne'
#oraciontp = 'La leona come la carne'
#oraciontp = 'La carne come el león'
#oraciontp= 'La carne como la leona'
combinatory_parser(oraciontp, grammar)

cansada => NP['fem']
cansado => NP['masc']
corre => (S\NP)
el => (NP['masc']/NP['masc'])
esta => ((S\NP['masc'])/NP['masc']) | ((S\NP['fem'])/NP['fem'])
la => (NP['fem']/NP['fem'])
leon => NP['masc']
leona => NP['fem']
3 parses
['la', 'leona', 'esta', 'cansada']
          la              leona              esta              cansada
 (NP['fem']/NP['fem'])  NP['fem']  ((S\NP['fem'])/NP['fem'])  NP['fem']
---------------------------------->
            NP['fem']
                                  -------------------------------------->
                                              (S\NP['fem'])
------------------------------------------------------------------------<
                                   S
          la              leona              esta              cansada
 (NP['fem']/NP['fem'])  NP['fem']  ((S\NP['fem'])/NP['fem'])  NP['fem']
---------------------------------->
            NP['fem']
---------------------------------->T
        (S/(S\NP['fem']))
                           

{% include additional_content.html %}

{% include copybutton.html %}