In [4]:
import spacy

In [5]:
nlp = spacy.load("es_core_news_sm")

In [6]:
doc = nlp("Esto es una frase de pruebas, para analizar el documento.")

In [7]:
for palabra in doc:
    print (palabra, palabra.pos_, palabra.dep_)

Esto PRON nsubj
es AUX cop
una DET det
frase NOUN ROOT
de ADP case
pruebas NOUN nmod
, PUNCT punct
para ADP mark
analizar VERB acl
el DET det
documento NOUN obj
. PUNCT punct


In [8]:
for token in doc:
    print (token.text)

Esto
es
una
frase
de
pruebas
,
para
analizar
el
documento
.


In [9]:
doc2 = nlp("Esta es la primera frase. Esta es la segunda frase. Esta es la tercera frase")

In [10]:
for frase in doc2.sents:
    print(frase)

Esta es la primera frase.
Esta es la segunda frase.
Esta es la tercera frase


In [11]:
doc3 = nlp("Los carros electricos seran decisivos para afrontar las nuevas megatendencias de la sociedad del futuro.")

In [12]:
for partes in doc3.noun_chunks:
    print(partes)

Los carros electricos
las nuevas megatendencias
la sociedad
futuro


In [13]:
from spacy import displacy

In [14]:
doc4 = nlp("Google ha comprado una empresa por 5 millones de dolares")

In [15]:
displacy.render(doc4, style="dep", options={"distance":100})

In [16]:
displacy.render(doc4, style="ent")

In [26]:
texto = """
Muy buenas tardes.
Señor alcalde de Quito, Pabel Muñoz, un gusto tenerlo aquí
de nuevo. A todos nuestros ministros que están peleando día
a día para sacar adelante el país, un gran saludo a todo su
equipo de trabajo y a todo el equipo del Municipio de Quito.
Algunas caras conocidas aquí, a algunos los conocí en la
Asamblea. Siempre tuve una gran admiración por su equipo
de trabajo, por la gente que conocí durante ese tiempo.
Uno tiene que ser agradecido en la vida. Gracias a Quito es
que estoy parado aquí. Gracias a Quito soy Presidente de la
República.
El apoyo que la ciudad de Quito me dio en cada uno de sus
rincones fue determinante. Inclusive, también en los días
bajos, cuando hacíamos campaña en Quito, siempre era una
manera de levantarnos el ánimo y el pensar que sí era
posible hacer las cosas diferentes y que sí era posible que un
joven candidato pueda ser presidente de la república.
Para mí, Quito estará siempre en mi corazón, y siempre
tendrá mi respeto y apoyo. Si Quito está bien, el resto del
país progresará. Si Quito logra tener la paz, podremos
también replicarlo en el resto de la nación.
Entonces, una vez más agradecerles por su atención.
Agradecerles por este detalle. Nunca me olvidaré. Y ahora,
pues, a celebrar juntos, a bailar juntos, a cantar juntos.
Es un momento de alegría. Son las fiestas de Quito y
debemos de disfrutarla, y debemos de celebrarla como la
ciudad se merece.
Muchas gracias.
"""

In [19]:
doc = nlp(texto)

In [20]:
print("Token\t\tPOS")
for token in doc:
    print(f"{token.text}\t\t{token.pos_}")

Token		POS

		SPACE
Muy		ADV
buenas		ADJ
tardes		NOUN
.		PUNCT

		SPACE
Señor		NOUN
alcalde		NOUN
de		ADP
Quito		PROPN
,		PUNCT
Pabel		PROPN
Muñoz		PROPN
,		PUNCT
un		DET
gusto		NOUN
tenerlo		VERB
aquí		ADV

		SPACE
de		ADP
nuevo		ADJ
.		PUNCT
A		ADP
todos		DET
nuestros		DET
ministros		NOUN
que		PRON
están		AUX
peleando		VERB
día		NOUN

		SPACE
a		ADP
día		NOUN
para		ADP
sacar		VERB
adelante		NOUN
el		DET
país		NOUN
,		PUNCT
un		DET
gran		ADJ
saludo		NOUN
a		ADP
todo		DET
su		DET

		SPACE
equipo		NOUN
de		ADP
trabajo		NOUN
y		CCONJ
a		ADP
todo		DET
el		DET
equipo		NOUN
del		ADP
Municipio		PROPN
de		ADP
Quito		PROPN
.		PUNCT

		SPACE
Algunas		DET
caras		NOUN
conocidas		ADJ
aquí		ADV
,		PUNCT
a		ADP
algunos		PRON
los		DET
conocí		VERB
en		ADP
la		DET

		SPACE
Asamblea		PROPN
.		PUNCT
Siempre		ADV
tuve		VERB
una		DET
gran		ADJ
admiración		NOUN
por		ADP
su		DET
equipo		NOUN

		SPACE
de		ADP
trabajo		NOUN
,		PUNCT
por		ADP
la		DET
gente		NOUN
que		PRON
conocí		VERB
durante		ADP
ese		DET
tie

In [21]:
print("\nEntidades Nombradas:")
for ent in doc.ents:
    print(ent.text, ent.label_)


Entidades Nombradas:
Señor LOC
Quito LOC
Pabel Muñoz PER
Municipio de Quito LOC
Asamblea ORG
Uno LOC
Gracias LOC
Quito LOC
Gracias LOC
Quito LOC
Presidente de la
República MISC
Quito LOC
Inclusive MISC
días
bajos LOC
Quito LOC
Para mí MISC
Quito LOC
corazón LOC
Si Quito PER
Si Quito ORG
Agradecerles LOC
Quito LOC


In [28]:
print("\nDependencias Sintácticas:")
for token in doc:
    print(token.text, token.dep_, token.head.text)


Dependencias Sintácticas:

 dep 

Muy advmod tardes
buenas amod tardes
tardes ROOT tardes
. punct tardes

 dep .
Señor ROOT Señor
alcalde appos Señor
de case Quito
Quito nmod alcalde
, punct Pabel
Pabel appos alcalde
Muñoz flat Pabel
, punct gusto
un det gusto
gusto appos Señor
tenerlo acl gusto
aquí advmod tenerlo

 dep aquí
de advmod tenerlo
nuevo fixed de
. punct Señor
A case ministros
todos det nuestros
nuestros det ministros
ministros ROOT ministros
que nsubj peleando
están aux peleando
peleando acl ministros
día obj peleando

 dep día
a case día
día nmod día
para mark sacar
sacar advcl peleando
adelante advmod sacar
el det país
país obj sacar
, punct saludo
un det saludo
gran amod saludo
saludo appos país
a case equipo
todo det su
su det equipo

 dep su
equipo nmod saludo
de case trabajo
trabajo nmod equipo
y cc equipo
a case equipo
todo det el
el det equipo
equipo conj equipo
del case Municipio
Municipio nmod equipo
de case Quito
Quito flat Municipio
. punct ministros

 dep .
A

In [23]:
print("\nLematización:")
for token in doc:
    print(token.text, token.lemma_)


Lematización:

 

Muy mucho
buenas buena
tardes tarde
. .

 

Señor señor
alcalde alcalde
de de
Quito Quito
, ,
Pabel Pabel
Muñoz Muñoz
, ,
un uno
gusto gusto
tenerlo tener él
aquí aquí

 

de de
nuevo nuevo
. .
A a
todos todo
nuestros nuestro
ministros ministro
que que
están estar
peleando pelear
día día

 

a a
día día
para para
sacar sacar
adelante adelante
el el
país país
, ,
un uno
gran gran
saludo saludo
a a
todo todo
su su

 

equipo equipo
de de
trabajo trabajo
y y
a a
todo todo
el el
equipo equipo
del del
Municipio Municipio
de de
Quito Quito
. .

 

Algunas alguno
caras cara
conocidas conocido
aquí aquí
, ,
a a
algunos alguno
los el
conocí conocer
en en
la el

 

Asamblea Asamblea
. .
Siempre siempre
tuve tener
una uno
gran gran
admiración admiración
por por
su su
equipo equipo

 

de de
trabajo trabajo
, ,
por por
la el
gente gente
que que
conocí conocer
durante durante
ese ese
tiempo tiempo
. .

 

Uno uno
tiene tener
que que
ser ser
agradecido agradecer
en en
la el
vida v

In [24]:
displacy.render(doc, style="dep", jupyter=True)

In [29]:
print("\nOraciones más importantes:")
for sent in doc.sents:
    if "Q" in sent.text:
        print(sent.text.strip())


Oraciones más importantes:
Señor alcalde de Quito, Pabel Muñoz, un gusto tenerlo aquí
de nuevo.
A todos nuestros ministros que están peleando día
a día para sacar adelante el país, un gran saludo a todo su
equipo de trabajo y a todo el equipo del Municipio de Quito.
Gracias a Quito es
que estoy parado aquí.
Gracias a Quito soy Presidente de la
República.
El apoyo que la ciudad de Quito me dio en cada uno de sus
rincones fue determinante.
Inclusive, también en los días
bajos, cuando hacíamos campaña en Quito, siempre era una
manera de levantarnos el ánimo y el pensar que sí era
posible hacer las cosas diferentes y que sí era posible que un
joven candidato pueda ser presidente de la república.
Para mí, Quito estará siempre en mi corazón, y siempre
tendrá mi respeto y apoyo.
Si Quito está bien, el resto del
país progresará.
Si Quito logra tener la paz, podremos
también replicarlo en el resto de la nación.
Son las fiestas de Quito y
debemos de disfrutarla, y debemos de celebrarla como la
