# `spacy`: el *Ruby on Rails* del PLN

[spacy](http://www.spacy.io/) es una librería de procesamiento del lenguaje natural, robusta, rápida, fácil de instalar y utilizar e integrable con [otras librerías de *NLP* y de *deep learning*](https://spacy.io/usage/facts-figures#section-other-libraries). 

Tiene modelos entrenados en varios idiomas y permite realizar las [típicas tareas](https://spacy.io/usage/facts-figures) de segmentación por oraciones, tokenizanción, análisis morfológico, extracción de entidades y análisis de opinión.

Veamos cómo funciona. Lo primero es instalar algunos modelos, en inglés y español. Desde la línea de comandos, ejecuta:

In [None]:
!python -m spacy download en
!python -m spacy download es

Una vez instalados los modelos, podemos importarlos fácilmente:

In [None]:
import spacy

# cargamos el modelo entrenado en español
nlp = spacy.load('es')

texto = '''España incumple la regla del déficit del euro y queda como único país bajo el control de Bruselas. 
España no aprobará finalmente la regla europa del déficit y se quedará como único país de la Eurozona que 
suspende y sigue bajo vigilancia. El Gobierno se salta finalmente el requisito de saneamiento presupuestario 
del Tratado de Maastricht y obtiene así más margen de gasto en 2018.'''

# y procesamos el texto
doc = nlp(texto)

## Procesando oraciones, palabras y entidades

Podemos iterar fácilmente sobre la lista de oraciones y recorrer los tokens para acceder a su información morfo-sintáctica:

In [None]:
for sentence in doc.sents:
    print('Oración: {}'.format(sentence))
    for token in sentence:
        print("{} con lema '{}', tiene la categoría gramatical {}/{} y la dependencia {}".format(token, token.lemma_, token.pos_, token.tag_, token.dep_))

El elemeno `doc` tiene una propiedad `.ents` que permite acceder a las entidades nombradas que hayan sido localizadas:

In [None]:
print(doc.ents)

for entity in doc.ents:
    print('{} es de tipo {}'.format(entity, entity.label_))

## Visualizando árboles de dependencias y entidades

Podemos acceder al árbol completo a través del método `.print_tree()`:

In [None]:
doc.print_tree()

Pero también se puede dibujar el grafo con las dependencias:

In [None]:
from spacy import displacy
displacy.serve(doc, style='dep')

O el de las entidades:

In [None]:
displacy.serve(doc, style='ent')