# **Entrenamiento**

## Preprocesamiento

Antes de entrenar los modelos de n-gramas, realizaremos un procedimiento para indicar que tan seguido las distintas oraciones empiezan o terminan con cierto token. 

La idea general es agregar el token \<s> al inicio de cada oración, y \</s> al final de estas. Para esto, se utiliza la función padded_everygram_pipeline, la cual recibe el orden de n-gramas mas alto, y el texto donde se va a iterar la función.


In [43]:
from nltk.lm.preprocessing import padded_everygram_pipeline

text=[['La', 'mafia', 'del', 'poder', 'me', 'ataca', 'sin', 'cesar']]
test=[]

train1,vocab1=padded_everygram_pipeline(1,text)
train2,vocab2=padded_everygram_pipeline(2,text)
train3,vocab3=padded_everygram_pipeline(2,text)
train4,vocab4=padded_everygram_pipeline(2,text)

## Entrenamiento

Despues del procedimiento previo, procedemos a entrenar los modelos. Entrenaremos el Estimador de Máxima Verosimilitud (Maximum Likelihood Estimator o MLE), especificando el orden más alto de n-gramas a utilizar. Además, en el penúltimo modelo se aplicará suavizado de Laplace, y en el último el suavizado de Kneser-Ney.

La función MLE crea un vocabulario vacío, el cual se llena al ajustar el modelo con la función fit.


In [44]:
from nltk.lm import MLE
from nltk.lm import Laplace
from nltk.lm import KneserNeyInterpolated

Lm1=MLE(1)
Lm2=MLE(2)
Lm3=Laplace(2)
Lm4=KneserNeyInterpolated(2)

Lm1.fit(train1,vocab1)
Lm2.fit(train2,vocab2)
Lm3.fit(train3,vocab3)
Lm4.fit(train4,vocab4)

## Evaluando y utilizando modelos entrenados

Para evaluar a nuestros modelos, no utilizamos la probabilidad como una métrica, si no la perplejidad,
la cual es una cantidad que nos dice que tan bien una distribución de probabilidad o un modelo predice una muestra. Cuando un modelo de n-gramas predice bien a la muestra, la perplejidad estará mas cerca a 1.

En la evaluación del modelo se utiliza el conjunto de prueba test, utilizando la función lm.perplexity(test).



In [None]:
print("La perplejidad del modelo de unigramas es: " + str(Lm1.perplexity(test)))
print("La perplejidad del modelo de bigramas es: " + str(Lm2.perplexity(test)))
print("La perplejidad del modelo con suavizado de Laplace es: " + str(Lm3.perplexity(test)))
print("La perplejidad del modelo con suavizado de Kneser-Ney es: " + str(Lm4.perplexity(test)))

Generación de frases.

Se utiliza lm.generate(Numero de palabras, random seed)

In [48]:
print("Frases con modelo de unigramas:")
for i in range(3):
    text=""
    for word in Lm1.generate(7):
        text=text+word+" "
    print(text)
print("\n")

print("Frases con modelo de bigramas:")
for i in range(3):
    text=""
    for word in Lm2.generate(7):
        text=text+word+" "
    print(text)
print("\n")

print("Frases con modelo de suavizado de Laplace:")
for i in range(3):
    text=""
    for word in Lm3.generate(7):
        text=text+word+" "
    print(text)
print("\n")

print("Frases con modelo de suavizado de Kneser-Ney:")
for i in range(3):
    text=""
    for word in Lm4.generate(7):
        text=text+word+" "
    print(text)

Frases con modelo de unigramas:
poder me cesar cesar poder poder sin 
sin mafia poder poder La sin del 
del cesar poder cesar poder del me 


Frases con modelo de bigramas:
cesar </s> del poder me ataca sin 
<s> La mafia del poder me ataca 
mafia del poder me ataca sin cesar 


Frases con modelo de suavizado de Laplace:
cesar </s> del poder me ataca sin 
mafia del poder me ataca sin cesar 
cesar </s> del poder me ataca sin 


Frases con modelo de suavizado de Kneser-Ney:
La mafia del poder me ataca sin 
sin cesar </s> me ataca sin cesar 
cesar </s> cesar </s> poder me ataca 


## Conclusiones finales