In [1]:
import spacy
spacy.__version__

'3.3.1'

In [2]:
nlp = spacy.load("es_core_news_md")

# Análisis lingüístico


## Etiquetado gramatical (POS tagging)
Proceso en el que dado un texto, se asigna la __[categoría gramatical](https://es.wikipedia.org/wiki/Categor%C3%ADa_gramatical)__ a cada token (sustantivo, verbo, adjetivo, etc.),  tomando en cuenta el contexto de la palabra (una palabra puede variar su categoría gramatical dependiendo del contexto en el que aparece).

- <code>Juan ha pescado un salmón</code>
- <code>Juan come un pescado</code>


El etiquetado gramatical puede ayudar a identificar la intención del usuario cuando la tokenización y la lematización no son suficientes. Por ejemplo, empleando sólamente lematización no es posible diferenciar entre estas dos oraciones
- <code>Quise volar a Cocha</code>
- <code>Quiero volar a Cocha</code>

Luego de la lematización ambas oraciones resultarían en "Querer volar a Cocha"; sin embargo, sólo la segunda expresa la intención del cliente de reservar un boleto de avión a Cochabamba. Un análisis rápido revela que el tiempo del verbo es lo que permite establecer la diferencia.

El etiquetado gramatical es extremadamente importante cuando se requiere identificar alguna entidad en una oración

**Referencias**

- __[Part-of-speech tagging](https://spacy.io/usage/linguistic-features#pos-tagging)__
- __[SpaCy - MorphAnalysis class](https://spacy.io/api/morphology#morphanalysis)__
- __[Universal POS tags](https://universaldependencies.org/u/pos/index.html)__

In [3]:
#Note que la categoría gramatical asociada a la palabra 'pescado' cambia dependiendo del contexto
doc = nlp('Juan ha pescado un salmón')
for token in doc:
    print(f"{token.text} (POS: {token.pos_} / {spacy.explain(token.pos_)} : {token.morph}")
    print(token.morph.get('Tense'))

Juan (POS: PROPN / proper noun : 
[]
ha (POS: AUX / auxiliary : Mood=Ind|Number=Sing|Person=3|Tense=Pres|VerbForm=Fin
['Pres']
pescado (POS: VERB / verb : Gender=Masc|Number=Sing|Tense=Past|VerbForm=Part
['Past']
un (POS: DET / determiner : Definite=Ind|Gender=Masc|Number=Sing|PronType=Art
[]
salmón (POS: NOUN / noun : Gender=Masc|Number=Sing
[]


In [11]:
doc = nlp('Juan come un pescado')
for token in doc:
    print(f"{token.text} (POS: {token.pos_} / {spacy.explain(token.pos_)} : {token.morph}")

Juan (POS: PROPN / proper noun : 
come (POS: VERB / verb : Mood=Ind|Number=Sing|Person=3|Tense=Past|VerbForm=Fin
un (POS: DET / determiner : Definite=Ind|Gender=Masc|Number=Sing|PronType=Art
pescado (POS: NOUN / noun : Gender=Masc|Number=Sing


In [12]:
doc = nlp('Quise volar a Cocha')
for token in doc:
    print(f"{token.text} (POS: {token.pos_} / {spacy.explain(token.pos_)} : {token.morph}")

Quise (POS: VERB / verb : Mood=Ind|Number=Sing|Person=1|Tense=Past|VerbForm=Fin
volar (POS: VERB / verb : VerbForm=Inf
a (POS: ADP / adposition : 
Cocha (POS: PROPN / proper noun : 


In [13]:
doc = nlp('Quiero volar a Cocha')
for token in doc:
    print(f"{token.text} (POS: {token.pos_} / {spacy.explain(token.pos_)} : {token.morph}")

Quiero (POS: VERB / verb : Mood=Ind|Number=Sing|Person=1|Tense=Pres|VerbForm=Fin
volar (POS: VERB / verb : VerbForm=Inf
a (POS: ADP / adposition : 
Cocha (POS: PROPN / proper noun : 


### Ejercicios

Empleando el etiquetado gramatical, agrupe las siguientes oraciones en dos categorías: reclamos y pedidos.

- Volé a Lima hace tres días. Todavía no me enviaron la factura, por favor envíenla a la brevedad posible. 
- He volado a Lima esta mañana y olvidé mi laptop en el avión. Necesito recuperar mi laptop, por favor.
- Estoy volando a Lima la siguiente semana. ¿Podría realizar una reserva?
- Necesito volar a Lima. Tiene pasajes para el siguiente miércoles?


In [5]:
doc = nlp('Volé a Lima hace tres días. Todavía no me enviaron la factura, por favor envíenla a la brevedad posible.')
for token in doc:
    print(f"{token.text} (POS: {token.pos_} / {spacy.explain(token.pos_)} : {token.morph}")

Volé (POS: VERB / verb : Mood=Ind|Number=Sing|Person=1|Tense=Past|VerbForm=Fin
a (POS: ADP / adposition : 
Lima (POS: PROPN / proper noun : 
hace (POS: VERB / verb : Mood=Ind|Number=Sing|Person=3|Tense=Pres|VerbForm=Fin
tres (POS: NUM / numeral : NumType=Card|Number=Plur
días (POS: NOUN / noun : Gender=Masc|Number=Plur
. (POS: PUNCT / punctuation : PunctType=Peri
Todavía (POS: ADV / adverb : 
no (POS: ADV / adverb : Polarity=Neg
me (POS: PRON / pronoun : Case=Dat|Number=Sing|Person=1|PrepCase=Npr|PronType=Prs
enviaron (POS: VERB / verb : Mood=Ind|Number=Plur|Person=3|Tense=Past|VerbForm=Fin
la (POS: DET / determiner : Definite=Def|Gender=Fem|Number=Sing|PronType=Art
factura (POS: NOUN / noun : Gender=Fem|Number=Sing
, (POS: PUNCT / punctuation : PunctType=Comm
por (POS: ADP / adposition : 
favor (POS: NOUN / noun : 
envíenla (POS: NOUN / noun : Gender=Masc|Number=Sing
a (POS: ADP / adposition : 
la (POS: DET / determiner : Definite=Def|Gender=Fem|Number=Sing|PronType=Art
brevedad (POS:

In [6]:
doc = nlp('He volado a Lima esta mañana y olvidé mi laptop en el avión. Necesito recuperar mi laptop, por favor.')
for token in doc:
    print(f"{token.text} (POS: {token.pos_} / {spacy.explain(token.pos_)} : {token.morph}")

He (POS: AUX / auxiliary : Mood=Ind|Number=Sing|Person=1|Tense=Pres|VerbForm=Fin
volado (POS: VERB / verb : Gender=Masc|Number=Sing|Tense=Past|VerbForm=Part
a (POS: ADP / adposition : 
Lima (POS: PROPN / proper noun : 
esta (POS: DET / determiner : Gender=Fem|Number=Sing|PronType=Dem
mañana (POS: NOUN / noun : Gender=Fem|Number=Sing
y (POS: CCONJ / coordinating conjunction : 
olvidé (POS: VERB / verb : Mood=Ind|Number=Sing|Person=3|Tense=Past|VerbForm=Fin
mi (POS: DET / determiner : Number=Sing|Number[psor]=Sing|Person=1|Poss=Yes|PronType=Prs
laptop (POS: PROPN / proper noun : 
en (POS: ADP / adposition : 
el (POS: DET / determiner : Definite=Def|Gender=Masc|Number=Sing|PronType=Art
avión (POS: NOUN / noun : Gender=Masc|Number=Sing
. (POS: PUNCT / punctuation : PunctType=Peri
Necesito (POS: VERB / verb : Mood=Ind|Number=Sing|Person=1|Tense=Pres|VerbForm=Fin
recuperar (POS: VERB / verb : VerbForm=Inf
mi (POS: DET / determiner : Number=Sing|Number[psor]=Sing|Person=1|Poss=Yes|PronType=Pr

In [7]:
doc = nlp('Estoy volando a Lima la siguiente semana. ¿Podría realizar una reserva?')
for token in doc:
    print(f"{token.text} (POS: {token.pos_} / {spacy.explain(token.pos_)} : {token.morph}")

Estoy (POS: AUX / auxiliary : Mood=Ind|Number=Sing|Person=1|Tense=Pres|VerbForm=Fin
volando (POS: VERB / verb : VerbForm=Ger
a (POS: ADP / adposition : 
Lima (POS: PROPN / proper noun : 
la (POS: DET / determiner : Definite=Def|Gender=Fem|Number=Sing|PronType=Art
siguiente (POS: ADJ / adjective : Number=Sing
semana (POS: NOUN / noun : Gender=Fem|Number=Sing
. (POS: PUNCT / punctuation : PunctType=Peri
¿ (POS: PUNCT / punctuation : PunctSide=Ini|PunctType=Qest
Podría (POS: AUX / auxiliary : Mood=Cnd|Number=Sing|Person=3|VerbForm=Fin
realizar (POS: VERB / verb : VerbForm=Inf
una (POS: DET / determiner : Definite=Ind|Gender=Fem|Number=Sing|PronType=Art
reserva (POS: NOUN / noun : Gender=Fem|Number=Sing
? (POS: PUNCT / punctuation : PunctSide=Fin|PunctType=Qest


In [8]:
doc = nlp('Necesito volar a Lima. Tiene pasajes para el siguiente miércoles?')
for token in doc:
    print(f"{token.text} (POS: {token.pos_} / {spacy.explain(token.pos_)} : {token.morph}")

Necesito (POS: VERB / verb : Mood=Ind|Number=Sing|Person=1|Tense=Pres|VerbForm=Fin
volar (POS: VERB / verb : VerbForm=Inf
a (POS: ADP / adposition : 
Lima (POS: PROPN / proper noun : 
. (POS: PUNCT / punctuation : PunctType=Peri
Tiene (POS: VERB / verb : Mood=Ind|Number=Sing|Person=3|Tense=Pres|VerbForm=Fin
pasajes (POS: NOUN / noun : Gender=Masc|Number=Plur
para (POS: ADP / adposition : 
el (POS: DET / determiner : Definite=Def|Gender=Masc|Number=Sing|PronType=Art
siguiente (POS: ADJ / adjective : Number=Sing
miércoles (POS: NOUN / noun : AdvType=Tim
? (POS: PUNCT / punctuation : PunctSide=Fin|PunctType=Qest
