# Gramáticas categoriales

## Requerimientos

In [None]:
import nltk 
import re 
from nltk.ccg import chart, lexicon

Las gramáticas categoriales están conformadas principalmente por un conjunto reducido de reglas y un léxico sumamente rico.
Las reglas que utiliza OpenCCG, que es el parser categorial que vamos a ver son las siguientes:

![reglas categoriales](reglascategorialesopenccg.png)

Construir una gramática categorial consiste principalmente en elaborar un léxico lo suficientemente rico, ya que las gramáticas categoriales son fuertemente lexicalistas. En ellas, la categoría a la que pertenece cada entrada léxica codifica sus posibilidades combinatorias.

## Combinatory Categorial Grammar

In [None]:
#Combinatory Categorial Grammar

def combinatory_parser(sentence, grammar):   
    sentence = sentence.lower()                                 # convierte a minúscula
    if sentence.endswith('.'):                                  # si la oración termina con un punto
        sent = re.sub('\.',' ',sentence)                        # se lo quita
    else:                                                       # si no
        sent = sentence                                         # la toma como está
    sent = sent.split()                                         # divide la oración en palabras
    archivo = open(grammar, 'r')                                # abre el archivo que se especifica en grammar
    codigogram = archivo.read()                                 # lee el archivo
    lex = lexicon.fromstring(codigogram)                        # carga el léxico alojado en el archivo
    print(lex)                                                  # lo imprime
    parser = chart.CCGChartParser(lex, chart.DefaultRuleSet)    # parsea
    archivo.close()                                             # cierra el archivo
    for parse in parser.parse(sent):  # doctest: +SKIP          # imprime los parseos disponibles
         chart.printCCGDerivation(parse)
         #break       


### Una gramática con categorías primitivas S y N

In [None]:
grammar = 'gramaticas/CG1.txt'
print('Escribí una oración')
oracion5 = input()
combinatory_parser(oracion5, grammar)

# él/ella/julia/maca/fer/pablo fuma
# él/ella/julia/maca/pablo/fer conoce un regalo
# él/ella/julia/maca/pablo/fer conoce a él/ella/julia/maca/pablo/fer
# él/ella/julia/maca/pablo/fer mira un regalo/globo
# él/ella/julia/maca/pablo/fer envió/entregó un regalo/globo a él/ella/julia/maca/pablo/fer

### Una gramática con categorías primitivas S y N y categorías derivadas

In [None]:
grammar = 'gramaticas/CG2.txt'
print('Escribí una oración')
oracion5 = input()
combinatory_parser(oracion5, grammar)

# él/ella/julia/maca/fer/pablo fuma
# él/ella/julia/maca/pablo/fer conoce un regalo
# él/ella/julia/maca/pablo/fer conoce a él/ella/julia/maca/pablo/fer
# él/ella/julia/maca/pablo/fer mira un regalo/globo
# él/ella/julia/maca/pablo/fer envió/entregó un regalo/globo a él/ella/julia/maca/pablo/fer

In [None]:
grammar = 'gramaticas/CG3.txt'
print('Escribí una oración')
oracion5 = input()
combinatory_parser(oracion5, grammar)

### Gramáticas con más categorías primitivas

Si bien ya en los primeros trabajos se postulaba la necesidad de agregar más categorías, el hecho de que cada categoría que se agregara al sistema tuviera que estar debidamente justificada hizo que en los primeros sistemas solo se aceptaran s y n. Posteriormente se agregó una distinción entre nombres propios y nombres comunes y una categoría para preposiciones.

In [None]:
grammar = 'gramaticas/CG4.txt'
print('Escribí una oración')
oracion5 = input()
combinatory_parser(oracion5, grammar)

# él/ella/julia/maca/fer/pablo fuma
# él/ella/julia/maca/pablo/fer conoce un regalo
# él/ella/julia/maca/pablo/fer conoce a él/ella/julia/maca/pablo/fer
# él/ella/julia/maca/pablo/fer mira un regalo/globo
# él/ella/julia/maca/pablo/fer envió/entregó un regalo/globo a él/ella/julia/maca/pablo/fer

{% include additional_content.html %}

{% include copybutton.html %}