<h2><font color="#004D7F" size=6>Módulo 6. Fase de optimización y forecasting</font></h2>



<h1><font color="#004D7F" size=5>4. Fase de Forecasting</font></h1>

<br><br>
<div style="text-align: right">
<font color="#004D7F" size=3>Manuel Castillo-Cara</font><br>
<font color="#004D7F" size=3>Machine Learning con Python</font><br>

---

<h2><font color="#004D7F" size=5>Índice</font></h2>
<a id="indice"></a>

* [1. Introducción](#section1)
    * [1.1. Librerías](#section11)
    * [1.2. CSV](#section12)
* [2. Pickle](#section2)
* [3. Joblib](#section3)

In [1]:
# Permite ajustar la anchura de la parte útil de la libreta (reduce los márgenes)
from IPython.core.display import display, HTML
display(HTML("<style>.container{ width:98% }</style>"))

  from IPython.core.display import display, HTML


---

<a id="section1"></a>
# <font color="#004D7F"> 1. Introducción </font>


En esta sección descubrirá cómo guardar y cargar su modelo en Python usando scikit-learn. Esto le permite guardar su modelo en un archivo y cargarlo más tarde para hacer predicciones. 

<a id="section11"></a>
## <font color="#004D7F"> 1.1. Librerías</font>

Vamos a declarar algunas librerías generales que ya hemos estado trabajando y que usaremos a lo largo de la sección.

In [2]:
#importing libraries
import pandas as pd
import numpy as np
# Metrics
from sklearn.model_selection import train_test_split
# Algortihms
from sklearn.linear_model import LogisticRegression

<a id="section12"></a>
## <font color="#004D7F"> 1.2. CSV</font>

En esta lección, se muestran varias métricas de evaluación de algoritmos diferentes para problemas de Machine Learning de clasificación y regresión. En cada código, el conjunto de datos se descarga directamente del repositorio de UCI Machine Learning.

Se utilizará el conjunto de datos de Pima Indians Diabetes con una validación cruzada 10-folds para demostrar cómo verificar cada algoritmo de ML y se utilizan medidas de precisión promedio para indicar el rendimiento del algoritmo.

In [3]:
import pandas as pd
# load data
filename = 'data/pima-indians-diabetes.data.csv'
names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class']
dataframe = pd.read_csv(filename, names=names)
array = dataframe.values
X = array[:,0:8]
Y = array[:,8]

<div style="text-align: right"> <font size=5>
    <a href="#indice"><i class="fa fa-arrow-circle-up" aria-hidden="true" style="color:#004D7F"></i></a>
</font></div>

---

<a id="section2"></a>
# <font color="#004D7F"> 2. Pickle</font>

El siguiente ejemplo muestra cómo se puede entrenar un modelo LoR, guardar el modelo en un archivo y cargarlo para hacer predicciones en el conjunto de datos no etiquetados.

La ejecución del ejemplo guarda el modelo en `model.sav` finalizado en su directorio de trabajo local. Cargue el modelo guardado y evaluarlo proporciona una estimación de la accuracy del modelo en datos no etiquetados.

In [5]:
# Save Model Using Pickle
import pickle as pkl

# Train/test
X_train, X_test, Y_train, Y_test = train_test_split(X,Y, test_size=0.33, random_state=7)

# Fit the model on 33%
model = LogisticRegression(solver='lbfgs', max_iter=1000)
model.fit(X_train, Y_train)

# save the model to disk
filename = 'finalized_model_pkl.sav'
pkl.dump(model, open(filename, 'wb'))

In [6]:
# load the model from disk
loaded_model = pkl.load(open(filename, 'rb'))
results = loaded_model.score(X_test, Y_test)
print(f"Accuracy: {results.mean()}")

Accuracy: 0.7874015748031497


<div class="alert alert-block alert-info">
    
<i class="fa fa-exclamation-circle" aria-hidden="true"></i>
Documentación oficial de la clase [`pickle`](https://docs.python.org/2/library/pickle.html).
</div> 

<div style="text-align: right"> <font size=5>
    <a href="#indice"><i class="fa fa-arrow-circle-up" aria-hidden="true" style="color:#004D7F"></i></a>
</font></div>

---

<a id="section3"></a>
# <font color="#004D7F"> 3. Joblib</font>

La biblioteca `Joblib` es parte del ecosistema SciPy y proporciona utilidades para canalizar trabajos de Python. Proporciona utilidades para guardar y cargar objetos de Python que utilizan las estructuras de datos de NumPy de manera eficiente.

El siguiente ejemplo muestra cómo se puede entrenar un modelo de LoR, guardar el modelo en un archivo usando `Joblib` y cargarlo para hacer predicciones.

La ejecución del ejemplo guarda el modelo en un archivo como `model.sav` finalizado y también crea un archivo para cada matriz NumPy en el modelo (cuatro archivos adicionales). Después de cargar el modelo, se informa una estimación del accuracy del modelo en datos no etiquetados.

In [5]:
#!pip install joblib



In [9]:
# Save Model Using joblib
???
# Train / Test
???
# Fit the model on 33%
???
# save the model to disk
???

['finalized_model.sav']

In [11]:
# load the model from disk
???

Accuracy: 78.74%


<div class="alert alert-block alert-info">
    
<i class="fa fa-exclamation-circle" aria-hidden="true"></i>
Documentación oficial de la clase [`Joblib`](https://pypi.python.org/pypi/joblib). 
</div> 

<div style="text-align: right"> <font size=5>
    <a href="#indice"><i class="fa fa-arrow-circle-up" aria-hidden="true" style="color:#004D7F"></i></a>
</font></div>

---

<div style="text-align: right"> <font size=6><i class="fa fa-coffee" aria-hidden="true" style="color:#004D7F"></i> </font></div>