**Ejercicio: Utilizar un modelo entrenado con nuevos datos**

* Previamente creamos un modelo básico que nos permitía encontrar la relación entre el tamaño del arnés de un perro y el tamaño de sus botas. 

* Mostramos cómo este modelo podía utilizarse para hacer una predicción sobre un nuevo perro no visto anteriormente.

* Es habitual construir, entrenar y luego utilizar un modelo mientras estamos aprendiendo sobre el aprendizaje automático, pero en el mundo real no queremos entrenar el modelo cada vez que queremos hacer una predicción.

**Consideremos nuestro escenario de la tienda de equipos para perros de avalancha:**

* Queremos entrenar el modelo sólo una vez, y luego cargar ese modelo en el servidor que gestiona nuestra tienda online.

* Aunque el modelo se ha entrenado en un conjunto de datos que hemos descargado de Internet, en realidad queremos utilizarlo para estimar el tamaño de las botas de los perros de nuestros clientes que no están en este conjunto de datos.
¿Cómo podemos hacerlo?

**¿ Qué vamos a hacer ?**

* Crear un modelo básico
* Guardarlo en el disco
* Cargarlo desde el disco
* Usarlo para hacer predicciones sobre un perro que no estaba en el conjunto de datos de entrenamiento.

**Cargamos el dataset**

In [1]:
import pandas
import statsmodels
!wget https://raw.githubusercontent.com/MicrosoftDocs/mslearn-introduction-to-machine-learning/main/Data/doggy-boot-harness.csv

--2022-10-26 22:56:24--  https://raw.githubusercontent.com/MicrosoftDocs/mslearn-introduction-to-machine-learning/main/Data/doggy-boot-harness.csv
Resolving raw.githubusercontent.com (raw.githubusercontent.com)... 185.199.108.133, 185.199.109.133, 185.199.110.133, ...
Connecting to raw.githubusercontent.com (raw.githubusercontent.com)|185.199.108.133|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 838 [text/plain]
Saving to: ‘doggy-boot-harness.csv’


2022-10-26 22:56:25 (19.0 MB/s) - ‘doggy-boot-harness.csv’ saved [838/838]



In [2]:
# Cargar un archivo con las tallas de botas y arneses del perro
data = pandas.read_csv('doggy-boot-harness.csv')

# Imprimimos algunos registros
data.head()

Unnamed: 0,boot_size,harness_size,sex,age_years
0,39,58,male,12.0
1,38,58,male,9.6
2,37,52,female,8.6
3,39,58,male,10.2
4,38,57,male,7.8


**Crear y entrenar un modelo**

Como hemos hecho antes, crearemos un modelo de regresión lineal simple y lo entrenaremos en nuestro conjunto de datos.

In [3]:
import statsmodels.formula.api as smf

# Ajustar un modelo simple que encuentre una relación lineal
# entre el tamaño de la bota y el tamaño del arnés, que podemos utilizar más tarde
# para predecir el tamaño de la bota de un perro, dado su tamaño de arnés

formula = "boot_size ~ harness_size"

model = smf.ols(formula = formula, data = data);
model = model.fit()

print("Modelo entrenado!")

Modelo entrenado!


**Guardar y cargar un modelo**

Nuestro modelo está listo para ser utilizado, pero aún no lo necesitamos. Vamos a guardarlo en el disco.

In [4]:
import joblib

#pickle

model_filename = './avalanche_dog_boot_model.pkl'
joblib.dump(model, model_filename)

print("Modelo grabado!")

Modelo grabado!


**Cargar nuestro modelo es igual de fácil:**

In [5]:
model_filename = './avalanche_dog_boot_model.pkl'
model_loaded = joblib.load(model_filename)

print("El modelo se ha cargado con los siguientes parámetros:")
print(model_loaded.params)

El modelo se ha cargado con los siguientes parámetros:
Intercept       5.719110
harness_size    0.585925
dtype: float64


**Poniendo todo junto**

En nuestro sitio web, vamos a querer tomar el arnés del perro de nuestro cliente, y luego calcular el tamaño de las botas de su perro utilizando el modelo que ya hemos entrenado.

Hagamos una función que cargue el modelo desde el disco, y luego lo use para predecir la altura del tamaño de la bota del perro de nuestro cliente.

In [6]:
harness_size = int(input("Ingrese tamaño del arnés: "))

Ingrese tamaño del arnés: 20


In [7]:
# Preparar los datos de entrada para el modelo
inputs = { 'harness_size' : [harness_size] }

# Usamos el modelo para hacer predicciones
predicted_boot_size = model_loaded.predict(inputs)[0] #devuelve una serie, usamos el [0] para que me de el valor de la celda con el resultado

predicted_boot_size

17.43761814744801

# Ejercicio

**Uso en el mundo real**

Lo hemos conseguido: podemos predecir la talla de las botas de un perro en caso de avalancha, basándonos en el tamaño de su arnés.

Nuestro último paso es utilizar esto para advertir a la gente si puede estar comprando botas de perro de tamaño incorrecto.

Como ejemplo, haremos código que acepte la talla del arnés, la talla de las botas seleccionadas, y devuelva un mensaje para el cliente.

In [None]:
arnes = int(input("Ingrese tamaño del arnés: "))
botas = int(input("Ingrese tamaño de las botas: "))

Ingrese tamaño del arnés: 52
Ingrese tamaño de las botas: 52


In [None]:
# Preparar los datos de entrada para el modelo
inputs = { 'harness_size' : [harness_size] }

# Usamos el modelo para hacer predicciones
predicted_boot_size = model_loaded.predict(inputs)[0] #devuelve una serie, usamos el [0] para que me de el valor de la celda con el resultado
predicted_boot_size = round(predicted_boot_size)

predicted_boot_size

29

In [None]:
# Verificar si el tamaño de la bota es el apropiado
if int(botas) == predicted_boot_size:
  # Las botas probablemente están OK
  print("¡Gran elección! Creemos que estas botas se adaptarán bien a su perro.")

if int(botas) < predicted_boot_size:
   # Las botas seleccionadas podrían ser muy pequeñas 
   print("Las botas que has seleccionado podrían ser DEMASIADO PEQUEÑAS para un perro tan "\
               f"grande como el suyo. Recomendamos unas botas de tamaño {predicted_boot_size}.")

if int(botas) >predicted_boot_size:
  # Las botas selecionadas podrian ser muy grandes 
  print("Las botas que has seleccionado podrían ser DEMASIADO GRANDES para un perro tan "\
               f"pequeño como el suyo. Recomendamos unas botas de tamaño {predicted_boot_size}.")

Las botas que has seleccionado podrían ser DEMASIADO GRANDES para un perro tan pequeño como el suyo. Recomendamos unas botas de tamaño 29.


# Resumen
¡Genial! 
Hemos creado un sistema que puede predecir si los clientes están comprando botas para perros que pueden no ajustarse a su perro de avalancha, basándose únicamente en el tamaño del arnés que están comprando.

En este ejercicio, hemos practicado:

* Crear un modelo básico
* Entrenarlos y guardarlos en el disco
* Cargarlos desde el disco
* Hacer predicciones con ellos utilizando nuevos conjuntos de datos