**Parte 1**

En esta parte se implementarán gramáticas con rasgos, Feature Grammars: https://www.nltk.org/howto/featgram.html, utilizando las estructuras de rasgos que provee la librería NLTK: https://www.nltk.org/howto/featstruct.html.

Se partirá de un ejemplo simple, inspirado en los links antes mencionados, que se expandirá para resolver lo que se pide en la letra de la tarea.


In [None]:
from nltk.grammar import FeatStructNonterminal, FeatureGrammar
from nltk import grammar, parse

grammar = '''

% start S

#####################
# Grammar Rules

S -> NP[NUM=?n, PER=?p] VP[NUM=?n, PER=?p]
NP[GEN=?g, NUM=?n, PER=?p] -> D[GEN=?g, NUM=?n] N[GEN=?g, NUM=?n, PER=?p]
VP[NUM=?n, PER=?p] -> V[NUM=?n, PER=?p]


# ###################
# Lexical Rules

D[GEN=m, NUM=sg]  -> 'el'
D[GEN=m, NUM=pl]  -> 'los'
D[GEN=f, NUM=sg]  -> 'la'
D[GEN=f, NUM=pl]  -> 'las'

N[GEN=m, NUM=sg, PER=ter] -> 'perro'
N[GEN=m, NUM=pl, PER=ter] -> 'perros'
N[GEN=f, NUM=sg, PER=ter] -> 'perra'
N[GEN=f, NUM=pl, PER=ter] -> 'perras'

V[NUM=sg, PER=ter] -> 'ladra'
V[NUM=pl, PER=ter] -> 'ladran'


'''

gram = FeatureGrammar.fromstring(grammar)

parser = parse.FeatureEarleyChartParser(gram)

trees = list(parser.parse(['el', 'perro', 'ladra']))

for tree in trees:
    print(tree)


In [None]:
# Escriba su gramática aquí


**Parte 2**

En esta parte se trabajará con el parser de dependencias de Spacy para el español. Se usará un modelo para el español entrenado utilizando BERT.

Referencias:

https://spacy.io/

https://spacy.io/models/es

https://colab.research.google.com/github/DerwenAI/spaCy_tuTorial/blob/master/spaCy_tuTorial.ipynb#scrollTo=5f6yzdylViJ6

Nota: se recomienda habilitar el uso de GPU (Runtime -> Change runtime type)


In [None]:
!pip install https://huggingface.co/spacy/es_dep_news_trf/resolve/main/es_dep_news_trf-any-py3-none-any.whl

import spacy
from spacy import displacy

nlp = spacy.load("es_dep_news_trf")


In [None]:
ej = nlp("El perro ladra.")

for token in ej:
    print(token.text, token.lemma_, token.pos_, token.dep_, token.head)

displacy.render(ej, style="dep", jupyter=True)


In [None]:
# Realice el parsing de los ejemplos de la letra aquí


**Parte 3**

Ejemplo de uso de transformers para question answering
En este ejemplo se usa un modelo entrenado para la tarea QA, disponible en el sitio https://huggingface.co/ (https://huggingface.co/mrm8488/distill-bert-base-spanish-wwm-cased-finetuned-spa-squad2-es).

El modelo se basa en un modelo de lenguaje de la familia BERT (https://www.aclweb.org/anthology/N19-1423/), sobre el cual se hizo fine tuning usando el corpus SQuAD-es (https://www.aclweb.org/anthology/2020.lrec-1.677/), una adaptación al español del corpus SQuAD (https://rajpurkar.github.io/SQuAD-explorer/).

El modelo para QA recibe un texto y una pregunta, y devuelve un substring del texto candidato a ser una respuesta a la pregunta. También devuelve un score que indica qué tan confiable es el resultado.

In [None]:
!pip install torch
!pip install transformers

from transformers import pipeline

qa_pipeline = pipeline(
    'question-answering',
    model='mrm8488/distill-bert-base-spanish-wwm-cased-finetuned-spa-squad2-es',
    tokenizer=(
        'mrm8488/distill-bert-base-spanish-wwm-cased-finetuned-spa-squad2-es',
        {"use_fast": False}
    )
)


In [None]:
respuesta = [qa_pipeline({'question': '¿Quién informó sobre los pacientes con neumonía?', 'context': 'La primera aparición pública ocurre el 31 de ese mes, cuando la Organización Mundial de la Salud (OMS) fue informada por funcionarios de salud chinos sobre un grupo de 41 pacientes con una misteriosa neumonía.'})]
print(respuesta)


In [None]:
# Analice los ejemplos de la letra aquí


In [None]:
# Parte opcional aquí
