# Spanish pre-processing
This notebook is for anyone who wants to try the TF-IDF or Topic Modeling lessons on Spanish text. Before continuing with those lessons, you need to create a *lemmatized derivative* of your original Spanish text, which replaces all the words with their dictionary form, which will work much better with the word-count based methods.

## Install spaCy

In [None]:
!pip install -U spacy

## Download Language Model

In [2]:
!python -m spacy download es_core_news_md

Collecting es_core_news_md==2.3.1
  Downloading https://github.com/explosion/spacy-models/releases/download/es_core_news_md-2.3.1/es_core_news_md-2.3.1.tar.gz (47.4 MB)
[K     |████████████████████████████████| 47.4 MB 2.7 MB/s eta 0:00:01
Building wheels for collected packages: es-core-news-md
  Building wheel for es-core-news-md (setup.py) ... [?25ldone
[?25h  Created wheel for es-core-news-md: filename=es_core_news_md-2.3.1-py3-none-any.whl size=47447386 sha256=0772774b4fa427f450615059564340db4619414d2ed8d371eb74503d866fee90
  Stored in directory: /private/var/folders/3r/55b5kjpd4s14_tg80r24vs7r0000gq/T/pip-ephem-wheel-cache-k7dt1wht/wheels/aa/54/74/4321c6870ef754164bdc2d3b59dedca7de7270250c6c653ce7
Successfully built es-core-news-md
Installing collected packages: es-core-news-md
Successfully installed es-core-news-md-2.3.1
[38;5;2m✔ Download and installation successful[0m
You can now load the model via spacy.load('es_core_news_md')


## Import Libraries

In [3]:
import spacy

## Load Language Model
Once the model is downloaded, we need to load it. There are two ways to load a spaCy language model.

1. We can import the model as a module and then load it from the module.

In [4]:
import es_core_news_md
nlp = es_core_news_md.load()

2. We can load the model by name.

In [None]:
#nlp = spacy.load('es_core_news_md')

If you just downloaded the model for the first time, it’s advisable to use Option 1. Then you can use the model immediately. Otherwise, you’ll likely need to restart your Jupyter kernel (which you can do by clicking Kernel -> Restart Kernel… in the Jupyter Lab menu).

## Process Document
To create a derivative text file that we can use with TF-IDF, topic modeling, or other word-count based methods, we need to use spaCy to *lemmatize* the text, replacing each word with its dictionary form. The result will be an ungrammatical text that will produce better results than the original version when used with word-count methods.

The example text for Spanish is *Oasis en la vida* by Juana Manuela Gorriti [from Project Gutenberg](http://www.gutenberg.org/ebooks/62564).

In [5]:
filepath = '../texts/other-languages/es.txt'
text = open(filepath, encoding='utf-8').read()
document = nlp(text)

In [6]:
outname = filepath.replace('.txt', '-lemmatized.txt')
with open(outname, 'w', encoding='utf8') as out:
    for token in document:
        out.write(token.lemma_.lower())
        out.write(' ')

## Examine Differences
The code cell below prints the original word in the text, a dash, then the lemmatized form that was written to the derivative text document that you'll use for TF-IDF and topic modeling. It's a good idea to take a look at this so you can see if there are places where the model consistently makes mistakes.

For instance, an earlier version of spaCy often associated the Spanish preposition `para` 'for' with the verb `parar` 'to stop'. If you just took that derivative file and used it for TF-IDF or topic modeling without realizing what was happening, you might reach the surprising conclusion that "stop" is a very frequent word in your text, when actually it's lemmatization problem.

In [7]:
for token in document:
    print(token.text + ' - ' + token.lemma_)

﻿INTRODUCCION - ﻿INTRODUCCION
. - .



 - 



ECONOMÍA - ECONOMÍA
POLÍTICA - POLÍTICA
. - .


 - 


El - El
sombrío - sombrío
Prudhon - Prudhon
, - ,
imbuído - imbuído
, - ,
sin - sin
duda - dudar
, - ,
en - en
las - los
ideas - ideo
de - de
los - lo
Santos - Santos

 - 

Padres - Padres
de - de
la - lo
Iglesia - Iglesia
que - que
predicaban - predicar
el - el
desden - desden
por - por
los - lo
bienes - bien

 - 

terrenales - terrenal
, - ,
decía - decir
que - que
la - lo
pobreza - pobreza
es - ser
una - uno
ley - ley
de - de
nuestra - nuestro
naturaleza - naturaleza
, - ,

 - 

ley - ley
bajo - bajar
la - lo
cual - cual
hemos - hemo
sido - ser
constituídos - constituídos
, - ,
de - de
donde - donde
se - se
deduce - deducir
que - que
el - el

 - 

pauperismo - pauperismo
es - ser
mal - mal
que - que
no - no
tiene - tener
remedio - remediar
ni - ni
cura - curar
. - .


 - 


Muy - Muy
desconsolados - desconsolar
debieron - deber
quedar - quedar
los - lo
menesterosos - menesteroso
con -

; - ;
y - y
sentía - sentir
el - el
dulce - dulce

 - 

bienestar - bienestar
del - del
que - que
renace - renacer
á - á
la - lo
salud - salud
despues - despues
de - de
una - uno
larga - largo
enfermedad - enfermedad
. - .





 - 





III - III



 - 



Los - Los
años - año
trascurrieron - trascurrir
así - asir
, - ,
con - con
sus - su
épocas - época
clásicas - clásico
, - ,
en - en
la - lo
vida - vida
del - del

 - 

niño - niño
. - .
Los - Los
exámenes - examen
; - ;
los - lo
premios - premio
; - ;
el - el
paso - pasar
á - á
estudios - estudio
superiores - superior
; - ;
el - el
del - del

 - 

vestido - vestir
infantil - infantil
al - al
traje - traer
viril - viril
; - ;
la - lo
primera - primero
comunion - comunion
..... - .....


 - 


¡ - ¡
Qué - Qué
ceremonia - ceremonia
, - ,
á - á
la - lo
vez - vez
tan - tan
imponente - imponente
y - y
tierna - tierno
! - !


 - 


Cumplido - Cumplido
en - en
él - él
, - ,
el - el
divino - divino
misterio - misterio
, - ,
de - de
rodillas -

angustioso - angustioso
ruego - rogar
, - ,
que - que
me - me
hizo - hacer
aceptarla - aceptarla
. - .


   - 

  
« - «
Ella - Ella
entónces - entónces
suspiró - suspirar
como - comer
aliviada - aliviar
de - de
una - uno
grave - gravar
preocupacion - preocupacion
; - ;

   - 
  
estrechó - estrechar
mi - mi
mano - manir
con - con
gratitud - gratitud
, - ,
y - y
murió - morir
en - en
paz - paz
. - .


   - 

  
« - «
Yo - Yo
he - haber
cumplido - cumplir
fielmente - fielmente
el - el
deber - deber
que - que
me - me
impuse - imponer
: - :
he - haber
administrado - administrar

   - 
  
esos - ese
bienes - bien
con - con
el - el
acierto - acertar
que - que
dá - dá
una - uno
larga - largo
experiencia - experiencia
en - en
los - lo

   - 
  
negocios - negocio
; - ;
los - lo
he - haber
conservado - conservar
, - ,
los - lo
he - haber
hecho - hacer
fructificar - fructificar
: - :
pero - pero
siempre - siempre

   - 
  
en - en
el - el
limite - limitar
que - que
mi - mi
delicadeza - delicade


Sangraba - Sangraba
su - su
corazon - corazon
al - al
dejar - dejar
aquel - aquel
país - país
riente - riente
y - y
hospitalario - hospitalario
; - ;
al - al
decir - decir

 - 

adios - adios
á - á
sus - su
amigos - amigo
, - ,
á - á
sus - su
compañeros - compañero
en - en
las - los
tareas - tarea
del - del
espíritu - espíritu
; - ;
á - á
sus - su

 - 

antiguos - antiguo
profesores - profesor
; - ;
al - al
sábio - sábio
Blain - Blain
y - y
hasta - hasta
á - á
la - lo
buena - bueno
Colombe - Colombe
: - :
á - á
ella - él

 - 

sobre - sobrar
todo - todo
, - ,
tan - tan
buena - bueno
y - y
maternal - maternal
para - parir
él - él
, - ,
en - en
la - lo
orfandad - orfandad
de - de
su - su
infancia - infancia
. - .


 - 


Al - Al
separarse - separarse
de - de
ellos - ellos
, - ,
al - al
alejarse - alejarse
de - de
Paris - Paris
, - ,
llorando - llorar
, - ,
Mauricio - Mauricio
recordó - recordar

 - 

el - el
dia - dia
que - que
, - ,
llorando - llorar
tambien - tambien
, - ,
allí - allí

las - los
prescripciones - prescripción
de - de

 - 

la - lo
etiqueta - etiquetar
, - ,
que - que
le - le
prohibían - prohibir
presentarse - presentarse
á - á
sí - sí
propio - propio
á - á
la - lo
interesante - interesante

 - 

jóven - jóven
, - ,
invocar - invocar
el - el
nombre - nombrar
del - del
anciano - anciano
Vice-Cónsul - Vice-Cónsul
, - ,
y - y
ofrecerla - ofrecerla
sus - su

 - 

servicios - servicio
? - ?


 - 


Mauricio - Mauricio
se - se
sorprendió - sorprender
anhelando - anhelar
una - uno
tempestad - tempestad
, - ,
la - lo
inminencia - inminencia
de - de
un - uno

 - 

peligro - peligrar
, - ,
que - que
le - le
diera - dar
el - el
derecho - derecho
de - de
salvarla - salvarla
en - en
sus - su
brazos - brazo
. - .


 - 


Pero - Pero
¡ - ¡
ah - ah
! - !
una - uno
implacable - implacable
bonanza - bonanza
acompañó - acompañar
al - al
« - «
Senegal - Senegal
» - »
en - en
esos - ese
temibles - temible

 - 

mares - mar
, - ,
el - el
resto - restar
de - de
su - su
viaje

damasco - damasco
azul - azul
, - ,
hacía - hacer
veces - vez
de - de
ropero - ropero
, - ,
cegando - cegar
la - lo

 - 

comunicacion - comunicacion
con - con
la - lo
vivienda - vivienda
vecina - vecino
. - .


 - 


Cubría - Cubría
el - el
piso - pisar
un - uno
tapiz - tapiz
de - de
hule - hule
; - ;
y - y
el - el
mobiliario - mobiliario
componíanlo - componíanlo
una - uno
cama - cama

 - 

de - de
nogal - nogal
con - con
dos - do
colchones - colchón
, - ,
dos - do
almohadas - almohada
y - y
mosquitero - mosquitero
de - de
gasa - gasa
blanca - blanco
; - ;

 - 

un - uno
velador - velador
, - ,
un - uno
lavabo - lavabo
con - con
juego - jugar
de - de
porcelana - porcelana
, - ,
una - uno
cómoda - cómodo
, - ,
dos - do
sillas - silla
y - y

 - 

una - uno
mesita - mesita
central - central
. - .


 - 


--¡Magnífico - --¡Magnífico
! - !
Hé - Hé
aquí - aquí
cuanto - cuanto
necesito--dijo - necesito--dijo
Mauricio - Mauricio
, - ,
estrechando - estrechar

 - 

gozoso - gozoso
la - lo
man

tan - tan
pintoresco - pintoresco
y - y
gracioso - gracioso
como - comer
nuestra - nuestro
_ - _
toilette - toilette
_ - _
en - en
la - lo
mesa - mesar
, - ,

 - 

en - en
los - lo
paseos - paseo
al - al
jardin - jardin
, - ,
y - y
en - en
las - los
visitas - visitar
de - de
vivienda - vivienda
. - .


 - 


_ - _
Toilette - Toilette
_ - _
sencilla - sencillo
, - ,
pero - pero
con - con
el - el
realce - realzar
de - de
caprichosas - caprichoso
fantasias - fantasias
. - .
La - La

 - 

túnica - túnica
griega - griego
, - ,
el - el
peplum - peplum
romano - romano
, - ,
la - lo
castellana - castellano
escarcela - escarcela
..... - .....


 - 


A - A
propósito - propósito
¿ - ¿
dónde - dónde
está - estar
la - lo
mia - mia
? - ?
..... - .....
¡ - ¡
Ah - Ah
! - !
hela - hela
aquí - aquí
. - .
Ayer - Ayer
la - lo
llevé - llevar
en - en

 - 

la - lo
comida - comer
. - .
Por - Por
más - más
señas - seña
, - ,
á - á
los - lo
postres - postre
, - ,
llenéla - llenéla
de - de
confites - confite
.


tales - talar
desequilibrios - desequilibrio
en - en
un - uno
hogar - hogar
. - .


 - 


Así - Así
, - ,
cuando - cuando
dejé - dejar
aquella - aquel
casa - casar
al - al
propietario - propietario
que - que
quería - querer
habitarla - habitarla
, - ,

 - 

aunque - aunque
hacía - hacer
años - año
que - que
moraba - morar
en - en
ella - él
, - ,
me - me
plació - placer
alejarme - alejarme
de - de
la - lo

 - 

proximidad - proximidad
de - de
aquel - aquel
infierno - infierno
..... - .....


 - 


¿ - ¿
Sonrien - Sonrien
Vds. - -PRON-
? - ?
¡ - ¡
Ah - Ah
! - !
otra - otro
cosa - coser
era - ser
oirlo - oirlo
. - .
Aquel - Aquel
eterno - eterno
contrariar - contrariar
cuanto - cuanto

 - 

pensaba - pensar
ó - ó
deseaba - desear
el - el
esposo - esposar
. - .


 - 


¡ - ¡
Y - Y
este - este
! - !
... - ...
El - El
desventurado - desventurado
, - ,
por - por
más - más
que - que
ante - ante
ella - él
sonreia - sonreia
siempre - siempre
, - ,
á - á

 - 

vueltas - vuelta
de - de
esa - ese


de - de
plata - plata
. - .


 - 


Los - Los
primeros - primero
, - ,
creyendo - creer
sobre - sobrar
ellos - ellos
la - lo
policía - policía
, - ,
dejaron - dejar
á - á
la - lo
mujer - mujer
, - ,
y - y

 - 

abriendo - abrir
la - lo
puerta - puerta
, - ,
huyeron - huir
á - á
tiempo - tiempo
que - que
Mauricio - Mauricio
les - les
enviaba - enviar
dos - do
balas - balar

 - 

de - de
su - su
revólver - revólver
. - .


 - 


El - El
otro - otro
, - ,
sin - sin
soltar - soltar
su - su
presa - preso
, - ,
quiso - querer
huir - huir
; - ;
pero - pero
Mauricio - Mauricio
, - ,
tomándolo - tomándolo
por - por

 - 

el - el
cuello - cuello
, - ,
lo - el
arrinconó - arrinconar
en - en
un - uno
ángulo - ángulo
del - del
cuarto - cuartar
. - .


 - 


El - El
bandido - bandido
logró - lograr
echar - echar
al - al
seno - seno
el - el
paquete - paquete
; - ;
y - y
sin - sin
desprenderse - desprenderse
del - del

 - 

cofre - cofre
, - ,
con - con
la - lo
mano - manir
libre - librar
, - ,
sacó -

dos - do
años - año
de - de
un - uno

 - 

cortesito - cortesito
en - en
la - lo
mano - manir
, - ,
convertido - convertir
en - en
una - uno
grande - grande
llaga - llagar
, - ,
por - por
el - el
uso - usar
de - de

 - 

ciertas - cierto
hilas - hilar
que - que
, - ,
averiguado - averiguar
su - su
orígen - orígen
, - ,
resultaron - resultar
ser - ser
despojo - despojar
de - de
la - lo

 - 

sábana - sábana
de - de
un - uno
enfermo - enfermar
de - de
viruelas - viruela
. - .


 - 


--¡Qué - --¡Qué
horror - horror
! - !


 - 


--¿Y - --¿Y
ha - haber
escrito - escribir
Fernando - Fernando
B - B
... - ...
? - ?


 - 


--De - --De
todos - todo
los - lo
lugares - lugar
donde - donde
se - se
ha - haber
detenido - detener
: - :
de - de
Barcelona - Barcelona
, - ,
de - de
Valencia - Valencia
, - ,

 - 

de - de
Sevilla - Sevilla
. - .
Encantados - Encantados
él - él
y - y
Carmencita - Carmencita
. - .


 - 


--¡El - --¡El
, - ,
desde - desde
luego - luego
! - !
Es - Es
su - su
patria - patr


 - 

perteneció - pertenecer
á - á
mi - mi
madre - madre
porque - porque
lleva - llevar
sus - su
iniciales - inicial
y - y
la - lo
fecha - fecho
de - de
su - su

 - 

matrimonio.-- - matrimonio.--


 - 


Hablando - Hablando
así - asir
, - ,
Mauricio - Mauricio
quitó - quitar
del - del
dedo - dedo
meñique - meñique
de - de
su - su
mano - manir
un - uno
anillo - anillar
de - de

 - 

oro - orar
y - y
lo - el
pasó - pasar
al - al
anular - anular
de - de
la - lo
de - de
Julia - Julia
. - .


 - 


La - La
jóven - jóven
besó - besar
aquella - aquel
reliquia - reliquia
con - con
religiosa - religioso
uncion - uncion
. - .


 - 


Su - Su
bello - bello
semblante - semblante
habíase - habíase
tornado - tornar
grave - gravar
; - ;
su - su
voz - voz
suavísima - suavísima
tomó - tomar
un - uno

 - 

acento - acento
solemne - solemne
. - .


 - 


--Si - --Si
yo - yo
dudase--dijo--si - dudase--dijo--si
yo - yo
dudase - dudar
de - de
la - lo
intervencion - intervencion
sobrenatural - sobrenatural

Bastaría - Bastaría
un - uno
documento - documentar
del - del
señor - señor
, - ,
con - con
la - lo

 - 

declaracion - declaracion
de - de
único - único
heredero - heredero
; - ;
el - el
certificado - certificar
del - del
médico - médico
y - y
la - lo
partida - partir

 - 

de - de
defuncion - defuncion
. - .
Veremos - Veremos
la - lo
resolucion - resolucion
del - del
Directorio - Directorio
. - .
Si - Si
fuera - ser
favorable - favorable
, - ,

 - 

para - parir
llenar - llenar
ciertas - cierto
fórmulas - fórmula
, - ,
se - se
pondrán - poner
avisos - aviso
por - por
seis - seis
dias - dias
, - ,

 - 

solicitando - solicitar
la - lo
póliza - póliza
de - de
vida - vida
del - del
señor - señor
Cárlos - Cárlos
Ridel - Ridel
. - .





 - 





XXX - XXX



 - 



Antes - Antes
de - de
aquel - aquel
término - término
el - el
Gerente - Gerente
de - de
« - «
La - La
Buenos - Buenos
Aires - Aires
» - »
recibía - recibir
una - uno

 - 

citacion - citacion
del - del
Banco - Banco
Nacional -