# Gramáticas Categoriales Combinatorias (GCC)

La entrega de laboratorio de GCC consiste en la resolución del presente *notebook*. 

A lo largo de este *notebook* encontrará bloques de código a completar y preguntas a responder. Se divide principalmente en dos partes, en la primera construirá las entradas léxicas y un parser de GCC utilizando NLTK para un conjunto de oraciones simples. En la segunda parte se consideran casos de mayor complejidad.

A lo largo de este *notebook*, usted:

- Interactuará con las representaciones para GCC de NLTK.
- Construirá las entradas léxicas necesarias para resolver los casos presentados.
- Construirá analizadores para GCC en NLTK y estudiará los resultados obtendidos.
- Se enfrentará a los principales problemas del enfoque y abordará algunos de ellos.


**Importante**: Ajústese en todo momento a las nociones linguísticas impartidas en el curso.


**Fecha de entrega**: Jueves 15 de junio.


### Pregunta

Comente brevemente en qué consiste el formalismo de GCC y enumere las reglas de derivación presentadas en el curso.

### Respuesta

*Escriba aquí su respuesta.*

## Construcción de una GCC con NLTK
 
Ejecute el siguiente fragmento de código para importar módulos y ajustes iniciales que serán utilizados a lo largo de este notebook.

In [1]:
# Imports
from __future__ import print_function
from IPython.display import display

import nltk
from nltk.ccg import chart, lexicon
from nltk.ccg.chart import ApplicationRuleSet, CompositionRuleSet, TypeRaiseRuleSet

def display_derivation(p):
    chart.printCCGDerivation(p)


## Oraciones Simples

A continuación se construirá una GCC para el siguiente conjunto de oraciones.


In [86]:
oraciones_simples = [
    u"la ballena atraviesa el mar".split(),
    u"la ballena y el tiburón nadan".split(),
    u"la tortuga pone sus huevos en la costa".split(),
    u"la ballena atraviesa lentamente el mar".split(),
    u"lentamente las tortugas despiertan".split(),
    u"el tiburón blanco y azul nada con sus crías".split(),
]


En el bloque a continuación defina las entradas léxicas correspondientes.

Tenga en cuenta las siguientes consideraciones: 

- Utilice el conjunto de categorías simples: S, NP, N, PP.
- Considere las siguientes aridades para los verbos:
    - atravesar - 2 argumentos
    - nadar, despertar - 1 argumento
    - poner - 3 argumentos
- Considere una única categoría para la conjunción.
- No incluya las representaciones semánticas.

     

In [85]:
lex_simple_str = u'''
:- S, NP, N, PP
la => NP/N
las => NP/N
el => NP/N
sus => NP/N
ballena => N
tiburón => N
tortuga => N
tortugas => N
huevos => N
crías => N
mar => N
costa => N
atraviesa => (S\\NP)/NP
nadan => S\\NP
nada => S\\NP
pone => ((S\\NP)/PP)/NP
despiertan => S\\NP
y => var\\.,var/.,var
en => PP/NP
con => ((S\\NP)\\(S\\NP))/NP
lentamente => S/S
lentamente => ((S\\NP)/NP)\\((S\\NP)/NP)
blanco => N\\N
azul => N\\N
'''

lex_simple = lexicon.fromstring(lex_simple_str)

Ejecute el bloque de código a continuación para construir el analizador y analizar las oraciones presentadas.

In [87]:
parser_simple = chart.CCGChartParser(lex_simple, ApplicationRuleSet)

Escriba en el siguiente bloque la rutina para desplegar todos los árboles de cada oración presentada. Utilice la función 'display_derivation' definida en el primer bloque.

In [88]:
# Despliegue de todos los árboles de cada oración

#
# Completar.
#
for sentence in oraciones_simples:
    print("Oracion: \t", ' '.join(sentence), "\n")
    for parse in parser_simple.parse(sentence):  
        display_derivation(parse)

Oracion: 	 la ballena atraviesa el mar 

   la    ballena   atraviesa     el    mar
 (NP/N)     N     ((S\NP)/NP)  (NP/N)   N
----------------->
       NP
                              ------------->
                                   NP
                 -------------------------->
                           (S\NP)
-------------------------------------------<
                     S
Oracion: 	 la ballena y el tiburón nadan 

   la    ballena              y                el    tiburón  nadan
 (NP/N)     N     ((_var0\.,_var0)/.,_var0)  (NP/N)     N     (S\NP)
----------------->
       NP
                                            ----------------->
                                                   NP
                 -------------------------------------------->
                                  (NP\.,NP)
-------------------------------------------------------------<
                             NP
---------------------------------------------------------------------<
                

### Pregunta

¿Este formalismo considera el problema de la concordancia? En caso afirmativo justifique, o proponga una extensión en caso contrario.

### Respuesta

*Escriba aquí su respuesta.*

## Oraciones más complejas

A continuación se extiende el conjunto de oraciones utilizado anteriormente.


In [121]:
oraciones_complejas = [
    u"la tortuga que el tiburón persiguió afortunadamente escapó".split(),
    u"la tortuga que nada lentamente atraviesa el mar".split(),
    
]

En el bloque a continuación extienda el léxico anteriormente construido para considerar las nuevas oraciones.

In [126]:
lex_str = lex_simple_str + u'''
persiguió => S\\NP
escapó => S\\NP
afortunadamente => (S\\NP)/(S\\NP)
lentamente => ((S\\NP))\\((S\\NP))
que => (NP\\NP)/S
que => (NP\\NP)/(S\\NP)
'''

lex = lexicon.fromstring(lex_str)

Utilice el siguiente bloque de código para construir el parser para el léxico extendido y despliegue los árboles para todas las oraciones. 

Tenga en cuenta las siguientes consideraciones: 

- Utilice únicamente lo que ya ha sido importado.
- El código no debe superar las 10 lineas.


In [131]:
# Completar!
parser_complex = chart.CCGChartParser(lex, ApplicationRuleSet + CompositionRuleSet + TypeRaiseRuleSet)
for sentence in oraciones_complejas +  oraciones_simples:
    print("Oracion: \t", ' '.join(sentence), "\n")
    for parse in parser_complex.parse(sentence):  
        display_derivation(parse)

Oracion: 	 la tortuga que el tiburón persiguió afortunadamente escapó 

   la    tortuga      que        el    tiburón  persiguió  afortunadamente  escapó
 (NP/N)     N     ((NP\NP)/S)  (NP/N)     N      (S\NP)    ((S\NP)/(S\NP))  (S\NP)
----------------->
       NP
                              ----------------->
                                     NP
                              ----------------------------<
                                           S
                 ----------------------------------------->
                                  (NP\NP)
                                                          ------------------------->
                                                                   (S\NP)
                 ------------------------------------------------------------------<B
                                               (S\NP)
-----------------------------------------------------------------------------------<
                                         S
   la    t

### Pregunta

¿Cuántas derivaciones obtuvo para cada una de las dos oraciones complejas? ¿Por qué ocurre esto? 

Indique para cada caso cuáles son correctas.

### Respuesta

*Escriba aquí su respuesta.*

### Pregunta

Explique la ambigüedad (no espúrea) que presenta la oración: "la tortuga que nada lentamente atraviesa el mar".

¿Es la única oración que presenta ambigüedad? Justifique.

### Respuesta

*Escriba aquí su respuesta.*

### Pregunta

¿Cambiaron las derivaciones de las oraciones simples? Justifique.

### Respuesta

*Escriba aquí su respuesta.*