In [25]:
!pip install spacy
!python -m spacy download es_core_news_md

Collecting es-core-news-md==3.8.0
  Downloading https://github.com/explosion/spacy-models/releases/download/es_core_news_md-3.8.0/es_core_news_md-3.8.0-py3-none-any.whl (42.3 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m42.3/42.3 MB[0m [31m12.3 MB/s[0m eta [36m0:00:00[0m
[?25h[38;5;2m✔ Download and installation successful[0m
You can now load the package via spacy.load('es_core_news_md')
[38;5;3m⚠ Restart to reload dependencies[0m
If you are in a Jupyter or Colab notebook, you may need to restart Python in
order to load all the package's dependencies. You can do this by selecting the
'Restart kernel' or 'Restart runtime' option.


In [26]:
# Importa las librerías necesarias

from collections import Counter
from spacy import displacy

In [27]:
# Carga el modelo de lenguaje de spaCy

nlp = spacy.load("es_core_news_md")

# Define una frase

frase = nlp("El gato saltó sobre el teclado y escribió un correo sin querer.")

# Imprime los tokens y la cantidad de tokens en la frase

print("Tokens: ",[(t.text) for t in frase],"\n"
      "Cantidad de Tokens: ",len(frase))

Tokens:  ['El', 'gato', 'saltó', 'sobre', 'el', 'teclado', 'y', 'escribió', 'un', 'correo', 'sin', 'querer', '.'] 
Cantidad de Tokens:  13


In [28]:
# Calcula la frecuencia de cada token en la frase

frecuencia = Counter([token.text for token in frase])
print(frecuencia)

Counter({'El': 1, 'gato': 1, 'saltó': 1, 'sobre': 1, 'el': 1, 'teclado': 1, 'y': 1, 'escribió': 1, 'un': 1, 'correo': 1, 'sin': 1, 'querer': 1, '.': 1})


In [29]:
# Itera sobre cada token en la frase
# e imprime el texto del token, su categoría gramatical (POS) y la explicación de su dependencia

for token in frase:
   print(token.text, "-" , token.pos_, "-" , spacy.explain(token.dep_))

El - DET - determiner
gato - NOUN - nominal subject
saltó - VERB - root
sobre - ADP - case marking
el - DET - determiner
teclado - NOUN - oblique nominal
y - CCONJ - coordinating conjunction
escribió - VERB - conjunct
un - DET - determiner
correo - NOUN - object
sin - ADP - marker
querer - VERB - adverbial clause modifier
. - PUNCT - punctuation


In [30]:
# Visualiza las entidades nombradas en la frase

displacy.render(frase, style="ent", jupyter=True, options={"distance": 200})

In [31]:
# Visualiza las dependencias sintácticas de la frase

displacy.render(frase, style='dep', jupyter=True, options={'distance': 200, 'color': 'blue', 'bg': 'white', 'font': 'Arial'})