# Clase 13: Despliegue

**MDS7202: Laboratorio de Programación Científica para Ciencia de Datos**


## Objetivo

- Conocer diferentes herramientas de despliegue de modelos: `Gradio`, `FastAPI`
- Comprender los distintos componentes de los sistemas basados en ML como la arquitectura cliente-servidor, URL, HTTP, APIs REST, etc...

## Datos de esta clase

Para esta clase, ejemplificaremos lo aprendido utilizando el clásico **Iris Dataset**. El objetivo es simple: entrenar un modelo de ML para clasificar flores del tipo iris en sus 3 categorías: setosa, versicolor y virginica. Las características disponibles son 4: el largo y ancho del pétalo y sépalo.

![Iris Dataset](../../recursos/2024-01/despliegue/images/iris.png)

Comencemos primero importando los datos. Podemos hacer esto de manera simple usando la API de `sklearn`:

In [7]:
from sklearn.datasets import load_iris

iris_df = load_iris(as_frame=True) # cargar dataset
X = iris_df["data"] # features para predecir
y = iris_df["target"] # variable target, 0: setosa, 1: versicolor, 2: viginica

# features disponibles
X 

Unnamed: 0,sepal length (cm),sepal width (cm),petal length (cm),petal width (cm)
0,5.1,3.5,1.4,0.2
1,4.9,3.0,1.4,0.2
2,4.7,3.2,1.3,0.2
3,4.6,3.1,1.5,0.2
4,5.0,3.6,1.4,0.2
...,...,...,...,...
145,6.7,3.0,5.2,2.3
146,6.3,2.5,5.0,1.9
147,6.5,3.0,5.2,2.0
148,6.2,3.4,5.4,2.3


In [None]:
# variable a predecir
y

0      0
1      0
2      0
3      0
4      0
      ..
145    2
146    2
147    2
148    2
149    2
Name: target, Length: 150, dtype: int64

Con los datos ya ingestados, podemos entrenar un clasificador de `RandomForest` de manera simple:

In [9]:
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report

seed = 3380

# separamos los datos
X_train, X_test, y_train, y_test = train_test_split(X.values, y.values, test_size=0.3, random_state = seed)

model = RandomForestClassifier(random_state = seed) # instanciar modelo
model.fit(X_train, y_train) # fit

y_pred = model.predict(X_test) # predict sobre X_test
print(classification_report(y_test, y_pred)) # performance

              precision    recall  f1-score   support

           0       1.00      1.00      1.00        13
           1       0.95      1.00      0.97        18
           2       1.00      0.93      0.96        14

    accuracy                           0.98        45
   macro avg       0.98      0.98      0.98        45
weighted avg       0.98      0.98      0.98        45



Genial! Entrenamos efectivamente un modelo de ML para resolver nuestro problema :)

Del entrenamiento, notamos que nuestro modelo tiene una alta capacidad de predicción, acertando el 98% de los casos en el conjunto de test.

## Entrené mi modelo... y ahora qué?

Supongamos que tenemos un cercano (jefe, colega, mamá, hermano, perro, etc) al que queramos mostrarle el funcionamiento de nuestro modelo. ¿Qué es lo que tendríamos que hacer para lograr esto?

Una primera idea sería mostrarles directamente nuestro código montado en nuestro equipo y mostrar como se ejecuta... aunque esto dificilmente es una solución aceptable en términos profesionales. Para atacar este problema de manera efectiva, nos dedicaremos el resto de la clase a aprender diferentes técnicas de **despliegue** de nuestro modelo.



## Pasos previos

Antes de desplegar el modelo, una buena idea es **re entrenarlo con todos los datos disponibles**. Recuerden que hasta ahora su modelo solo fue entrenado con los datos `X_train`, por lo que si desean llevar su modelo a *producción* deberían llevarlo usando el máximo de datos disponible (siempre y cuando esto sea deseable, porsupuesto). 

Podemos lograr lo anterior de manera simple por medio de:

In [10]:
model.fit(X, y)

0,1,2
,n_estimators,100
,criterion,'gini'
,max_depth,
,min_samples_split,2
,min_samples_leaf,1
,min_weight_fraction_leaf,0.0
,max_features,'sqrt'
,max_leaf_nodes,
,min_impurity_decrease,0.0
,bootstrap,True


Después de entrenar el modelo con todos los datos, podemos ahora serializar nuestro modelo usando la librería `pickle`: 

In [11]:
import pickle

# crear "model.pkl" con nuestro modelo serializado
with open('./model.pkl', 'wb') as file:
    pickle.dump(model, file)

Podemos que nuestro modelo se carga de manera efectiva:

In [12]:
# borramos modelo
del model

# noten como ya no podemos predecir sobre X pues model ya no existe
model.predict(X)

NameError: name 'model' is not defined

In [13]:
# cargamos modelo
with open('model.pkl', 'rb') as file:
    model = pickle.load(file)

# verificamos funcionamiento
model.predict(X)

array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,
       2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,
       2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2])

## Esencia del despliegue

<div style="text-align: center;">
<img src='../../recursos/2024-01/despliegue/images/diagrama_despliegue.png' width = 650/>
</div>

Cualquier herramienta de despliegue debería ser capaz de:

0. Cargar nuestro modelo 
1. Recibir nuevos datos (i.e una nueva *fila* de X)
2. Pre procesar los datos de manera adecuada (escalar, transformar a one_hot, crear nuevas features, etc)
3. Generar una predicción sobre los datos procesados
4. Retornar la predicción generada

> **Pregunta:** Qué herramienta aprendida en el curso nos puede ayudar a los pasos 2 y 3?

Veamos como se vería esto de manera conceptual en el código:

In [14]:
import warnings
warnings.filterwarnings("ignore")

# cargar modelo
with open('model.pkl', 'rb') as file:
  model = pickle.load(file)

labels_dict = {0: 'setosa', 1: 'versicolor', 2: 'virginica'} # diccionario de etiquetas
def make_prediction(
  sepal_length: float,
  sepal_width: float,
  petal_length: float,
  petal_width: float
):
  '''
  función que devuelve la predicción del modelo dado un set de atributos
  '''

  # mantener el orden!
  features = [
      [sepal_length, sepal_width, petal_length, petal_width] # obs a predecir, OJO con el orden!! 
  ]
  
  prediction = model.predict(features).item() # generar prediccion
  label = labels_dict[prediction] # transformar a etiqueta

  return label # retornar prediccion

make_prediction(sepal_length=2, sepal_width=1, petal_length=1, petal_width=1)

'setosa'

Noten que si queremos cambiar los atributos de entrada, simplemente debemos cambiar los valores de los parámetros de la función:

In [15]:
make_prediction(sepal_length=5, sepal_width=4, petal_length=5, petal_width=3)

'virginica'

In [16]:
make_prediction(sepal_length=1, sepal_width=7, petal_length=1.7, petal_width=0.5)

'setosa'

Guardaremos una copia de esta función en `recursos/2025-02/13-Despliegue/make_prediction.py` para volver a utilizarla más adelante.

## Ambientes virtuales

La idea de esta sección es generar las condiciones necesarias para que nuestro proyecto pueda ser ejecutado otros dispositivos de manera fácil. Una primera aproximación para lograr esto es a través de **entornos virtuales**, los cuales pueden ser interpretados como un espacio virtual aislado donde podemos instalar y levantar configuraciones *custom* de nuestro proyecto.

> **Pregunta:** Se les ocurre algún ejemplo donde sea útil hacer uso de estos ambientes?

### ¿Cómo crear nuestro ambiente virtual?

El primer paso para trabajar sobre ambientes virtuales es instalar [anaconda](https://www.anaconda.com). Con la distribución instalada, podemos levantar un ambiente virtual ejecutando en la terminal los siguientes comandos:

`conda create --name nombre_ambiente python=version_python -y` # crear ambiente virtual

donde *version_python* equivale a la versión de python deseada (3.9, 3.10, 3.11, etc). Luego de crear nuestro ambiente, es necesario entrar a este por medio de:

`conda activate nombre_ambiente` # activar ambiente virtual

`conda deactivate` # desactivar ambiente virtual

### Levantando un proyecto en un ambiente virtual

Para levantar un proyecto en un ambiente virtual, necesitaremos de los siguientes elementos:

- **main.py:** Código python a ejecutar (basicamente el código python que programaron en su proyecto)
- **requirements.txt:** Archivo con las liberias necesarias para ejecutar `main.py` (pandas==2.2.2, etc.)
- **.env:** Archivo con las credenciales necesarias para ejecutar el proyecto (API KEYS, etc.)

Noten que este ambiente de python es un ambiente *virgen* y no tiene ninguna librería instalada. Pueden verificar lo anterior por medio de:

`pip freeze` # printear librerias instaladas por pip

Para instalar las librerias necesarias, lo pueden realizar de manera simple por medio de:

`pip install -r requirements.txt`

Al contrario, si desean exportar las librerias utilizadas en su proyecto a un archivo `requirements.txt`:

`pip freeze > requirements.txt`

> **Pregunta**: Conocen otra herramienta que pueda resolver el mismo problema?

**Importante**: Noten que usando ambientes virtuales, somos capaces de montar nuestro modelo de manera fácil en otro equipo! Sólo necesitaríamos:
- Modelo (`model.pkl`)
- Librerías (`requirements.txt`)
- Código de ejecución (`make_predictions.py` o `main.py`)

## Gradio

*Tutorial basado en https://www.youtube.com/watch?v=97KxA1r184o y https://github.com/gradio-app/gradio/*

![Gradio](https://encrypted-tbn0.gstatic.com/images?q=tbn:ANd9GcQdC1xNkDaMNEbtQRyupw5v32HSGVA6w0zNjA&s)

[gradio](https://www.gradio.app) es una librería de Python similar a `Streamlit` que permite generar **demos** de manera simple especificando los **componentes** de entrada y salida esperados por tu modelo de machine learning.

¿A qué nos referimos con componentes de entrada y salida? Gradio viene con diferentes componentes para diferentes tipos de modelos de machine learning. Algunos ejemplos:

*   Para un **clasificador de imágenes**, el input esperado es de tipo `Image` y la salida es del tipo `Label`.
*   Para un modelo de **speech recognition**, el input esperado es del tipo `Microphone` (lo que permite al usuario grabar desde el navegador) o `Audio` (lo que permite a los usuarios subir sus propios archivos de audio), mientras que la salida es del tipo `Text`.
* Para un modelo de **questiong answering**, se esperan dos entradas: [`Text`, `Text`], una entrada de texto para el párrafo y otro texto para la pregunta, mientras que la salida es del tipo `Text` para contener la respuesta generada.

Una lista completa de los componentes habilitados se puede encontrar en la [documentación](https://gradio.app/docs/).

Además de los componentes de entrada y salida, Gradio espera un tercer parámetro: **la función de predicción**. Este parámetro puede ser ***cualquier* función regular de Python** que reciba los parámetros correspondientes a los componentes de entrada y retorne una salida congruente con los componentes de salida.

Veamos esto en código!

In [17]:
import gradio as gr

demo = gr.Interface(
  fn = make_prediction, # noten como estamos usando la función que generamos anteriormente
  inputs = ["number", "number", "number", "number"], # valores de entrada
  outputs = ["text"]
) # valor de salida

demo.launch(share=True) # share = True: nos permite compartir el demo con quien queramos!

* Running on local URL:  http://127.0.0.1:7860


* Running on public URL: https://cfb90248d25b4348c8.gradio.live

This share link expires in 1 week. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)




In [None]:
!pip install gradio

Collecting gradio
  Downloading gradio-5.49.0-py3-none-any.whl.metadata (16 kB)
Collecting aiofiles<25.0,>=22.0 (from gradio)
  Using cached aiofiles-24.1.0-py3-none-any.whl.metadata (10 kB)
Collecting brotli>=1.1.0 (from gradio)
  Downloading Brotli-1.1.0-cp310-cp310-manylinux_2_5_x86_64.manylinux1_x86_64.manylinux_2_12_x86_64.manylinux2010_x86_64.whl.metadata (5.5 kB)
Collecting ffmpy (from gradio)
  Downloading ffmpy-0.6.1-py3-none-any.whl.metadata (2.9 kB)
Collecting gradio-client==1.13.3 (from gradio)
  Downloading gradio_client-1.13.3-py3-none-any.whl.metadata (7.1 kB)
Collecting groovy~=0.1 (from gradio)
  Downloading groovy-0.1.2-py3-none-any.whl.metadata (6.1 kB)
Collecting pydub (from gradio)
  Downloading pydub-0.25.1-py2.py3-none-any.whl.metadata (1.4 kB)
Collecting ruff>=0.9.3 (from gradio)
  Downloading ruff-0.13.3-py3-none-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (25 kB)
Collecting safehttpx<0.2.0,>=0.1.6 (from gradio)
  Downloading safehttpx-0.1.6-py3-non

In [18]:
demo.close()

Closing server running on port: 7860


Genial! Ahora que tenemos una primera versión, veamos como podemos mejorarla un poco en términos estéticos:

In [20]:
demo = gr.Interface(
  fn = make_prediction,
  inputs = [ # definimos el intervalo y asignamos un nombre a cada input
      gr.Slider(label = 'Sepal Length', minimum = 0, maximum = 10),
      gr.Slider(label = 'Sepal Width', minimum = 0, maximum = 10), 
      gr.Slider(label = 'Petal Length', minimum = 0, maximum = 10), 
      gr.Slider(label = 'Petal Width', minimum = 0, maximum = 10)],
  outputs = gr.Text(label = 'Predicted Label'), # se define un nombre para la salida
  title = 'Iris ML Demo', # asignar un titulo al demo
  examples=[[0.5, 1.5, 2.5, 3.5], [1, 3, 5, 7]], # generar ejemplos
)

demo.launch()

* Running on local URL:  http://127.0.0.1:7861
* To create a public link, set `share=True` in `launch()`.




In [None]:
demo.close()

Closing server running on port: 7860


Genial! Revisemos ahora como customizar aun más el *display* de nuestra aplicación mediante `gr.Blocks`:

In [21]:
with gr.Blocks(theme = gr.themes.Base()) as demo:

  # agregamos un markdown para describir la aplicacion
  gr.Markdown(
  """
  # Iris ML Demo
  Bienvenid@ a Iris ML demo! Esta herramienta esta diseñada para predecir la clase de una flor a partir de sus características usando Machine Learning.
  ## Cómo usar este demo?
  Usar esta herramienta es fácil! Sólo debes seguir los siguientes pasos:
  1. Fijar los valores de **Sepal Length**, **Sepal Width**, **Petal Length** y **Petal Width**.
  2. Observar el tipo de flor que predice el modelo.
  
  Eso es todo! Estás list@ para explorar y predecir diferentes tipos de flores. Que lo disfrutes!
  """)

  # definimos explicitamente la posicion de los elementos
  with gr.Row():
      with gr.Column():
          sepal_length_slider = gr.Slider(label = 'Sepal Length', minimum = 0, maximum = 10)
          sepal_width_slider = gr.Slider(label = 'Sepal Width', minimum = 0, maximum = 10)
          petal_length_slider = gr.Slider(label = 'Petal Length', minimum = 0, maximum = 10)
          petal_width_slider = gr.Slider(label = 'Petal Width', minimum = 0, maximum = 10)

      with gr.Column():
          label = gr.Text(label = 'Predicted Label') # se define un nombre para la salida
  
  with gr.Row():
      button = gr.Button(value = 'Predict!')

  # setear interactividad
  inputs = [sepal_length_slider, sepal_width_slider, petal_length_slider, petal_width_slider]
  outputs = [label]
  button.click(fn = make_prediction, inputs = inputs, outputs = outputs)

  examples = [
      [0.5, 1.5, 2.5, 3.5], # example 1
      [1, 3, 5, 7], # example 2
  ]
  gr.Examples(examples = examples, inputs = inputs) 

demo.launch(share=True)

* Running on local URL:  http://127.0.0.1:7862
* Running on public URL: https://0784a32ec734320b2f.gradio.live

This share link expires in 1 week. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)




In [None]:
demo.close()

Closing server running on port: 7860


Pueden encontrar la totalidad del código en `recursos/2025-02/13-Despliegue/gradio_app.py`.

**Bonus:** [Tutorial para Desplegar su aplicación de gradio en HuggingFace](https://www.youtube.com/watch?v=97KxA1r184o).

## FastAPI

<img src='../../recursos/2024-01/despliegue/images/fastapi.png'/>

La idea de esta sección es que aprendamos a desplegar nuestra solución de ML por medio de una API usando `FastAPI`. Cabe decir que esta es la manera mas usual y "profesional" para desplegar modelos, por lo que es de suma importancia que sepan como realizar este tipo de procedimientos.

Antes de sumergirnos en el código, un poco de contexto:

### Arquitectura Cliente-Servidor

Según [Wikipedia](https://es.wikipedia.org/wiki/Cliente-servidor):

> La arquitectura cliente-servidor es un modelo de diseño de software en el que las tareas se reparten entre los proveedores de recursos o servicios, llamados servidores, y los demandantes, llamados clientes. Un cliente realiza peticiones a otro programa, el servidor, quien le da respuesta. 

<div align='center'>
<img alt='Arquitectura Cliente Servidor' src='https://raw.githubusercontent.com/MDS7202/MDS7202/main/recursos/2023-01/27_puesta_en_produccion/cliente_servidor.png' width=800/>
</div>

#### Cliente 

Demanda algún servicio. Sus características principales son:

- Inicia solicitudes (peticiones) y espera respuestas del servidor.
- Puede ser a través de una *interfaz de programación de aplicaciones (API en inglés) o una interfaz gráfica* (como el navegador o un juego ejecutable).

#### Servidor

Provee de servicios. Sus características principales son:

- Reciben las solicitudes de los clientes, las procesan y luego envían una respuesta.
- Pueden aceptar varias solicitudes de distintos clientes a la vez.


### Características de esta arquitectura

Una de las principales ventajas es que permite centralizar la información y las responsabilidades de proveer servicios.
Es decir, solo el servidor será el encargado de manejar las solicitudes, acceder y modificar a las bases de datos, procesar dicha información y responder a sus clientes.


### Opciones y Frameworks

Según [Wikipedia](https://es.wikipedia.org/wiki/Framework): 

> *Framework*: Un entorno de trabajo es un conjunto estandarizado de conceptos, prácticas y criterios para resolver un tipo de problemática particular y que sirve como referencia, para enfrentar y resolver nuevos problemas de índole similar. 

*¡Ya han estado utilizando un framework todo este tiempo!: `scikit-learn` y sus famosos `fit` y `predict`.*


Existe una gigantezca variedad de frameworks (y combinaciones de estos) que implementan esta arquitectura.

##### Servidor (y ocasionalmente también clientes) o *Backend*:

- `Django`
- `Flask`
- `FastAPI`


##### Clientes (Interfaces Gráficas) (la mayoría en JavaScript) o *Frontend*: 

- `React`
- `Vue`


Una combinación de estas tecnologías se denomina *stack tecnológico*.


> **Pregunta**: ¿Conocen alguno de estos? ¿En que consisten?

Visiten los siguientes links para ver buenas comparativas entre estos frameworks: 

- https://www.section.io/engineering-education/choosing-between-django-flask-and-fastapi/
- https://www.analyticsvidhya.com/blog/2020/11/fastapi-the-right-replacement-for-flask/


**En nuestro caso en particular, veremos el framework (de moda) `FastAPI`.**

> **Pregunta:** ¿Qué es una API?

---

### Interfaz de Programación de Aplicaciones / Application Programming Interface (API)

Es un conjunto de reglas, funciones o endpoints que permiten que diferentes aplicaciones interactuen entre sí. Un ejemplo podrían ser las librerías que utilizamos constantemente, en donde un conjunto de funciones se exponen para interactuar con ella.
<div align='center'>
<img src='https://raw.githubusercontent.com/MDS7202/MDS7202/main/recursos/2023-01/27_puesta_en_produccion/pandas_api.png' width=800/>
</div>

<div align='center'>
<p>Ejemplo de una API: la API de pandas</p>
</div>

---

En el caso en particular de los servidores web, la API es el conjunto de funciones (también conocidas como **Endpoints**) que nos permiten interactuar con el servidor. Comunmente esto se hace a través de **URLs** parametrizadas:

<div align='center'>
<img src='https://raw.githubusercontent.com/MDS7202/MDS7202/main/recursos/2023-01/27_puesta_en_produccion/api_maps.png' width=800/>
</div>

<div align='center'>
<img src='https://raw.githubusercontent.com/MDS7202/MDS7202/main/recursos/2023-01/27_puesta_en_produccion/api_maps_2.png' width=800/>
</div>

<div align='center'>
Ejemplo de una web API: La API de <a href='https://developers.google.com/maps/documentation/urls/get-started/'>Google Maps</a>
</div>

#### URL

Una Localizador de recursos uniforme o **Uniform Resource Locator (URL)** es simplemente un localizador de un recurso web más un protocolo que permite acceder a este.

Ejemplo: 

De: https://en.wikipedia.org/wiki/URL

- Protocolo: `https`
- Dirección del recurso: `en.wikipedia.org`
- Archivo: `wiki/URL` (que se interpreta como html)


##### Sintaxis de una URL

<img src='../../recursos/2025-01/13-Despliegue/sinxtaxis_uri.png' />


<div align='center'>
Fuente:  <a href='https://en.wikipedia.org/wiki/URL' />URL en Wikipedia</a>
</div>



#### Protocolo de transferencia de hipertexto o HTTP y HTTPS

[Protocolo de Comunicaciones según Wikipedia](https://es.wikipedia.org/wiki/Protocolo_de_comunicaciones):

> Es un sistema de reglas que permiten que dos o más entidades (computadoras, teléfonos celulares, etc.) de un sistema de comunicación se comuniquen entre ellas con el fin de transmitir información por medio de cualquier tipo de variación de una magnitud física.

> Se trata de las reglas o el estándar que define la sintaxis, semántica y sincronización de la comunicación, así como también los posibles métodos de recuperación de errores


HTTP permite la transmisión de información a través de archivos html y otros formatos.
Esta especifica en los mensajes:

- Cabeceras (Headers) que contienen metadatos.
     - `Host`: Indica el nombre del dominio destino.
     - `User-Agent`: Identifica al cliente que hace la solicitud (navegador, app, etc).
     - `Accept`: Declara qué tipo de contenido espera (`application/json`, `text/html`).
     - `Content-type`: Indica el tipo de dato enviado en el cuerpo (`application/json`, etc).
- Método de petición (`GET`, `POST`, `PUT`, `DELETE`, `HEAD`, `OPTION`, etc...)
     - `GET`: Solicitud para pedir datos.
     - `POST`: Enviar datos (en el cuerpo de la solicitud) comunmente para ser procesados y guardados.
     - `DELETE`: Elimina un dato.
     - `PUT`: Actualiza un dato.


- Códigos de respuesta (https://http.cat/)
  - `1xx` - Respuestas informativas
  - `2xx` - Respuestas satisfactorias 
  - `3xx` - Redirecciones 
  - `4xx` - Errores de los clientes 
  - `5xx` - Errores de los servidores 
  
  
- Cuerpo del mensaje


#### Ejemplo: 

Petición del Cliente:

     GET /index.html HTTP/1.1
     Host: www.example.com
     User-Agent: Mozilla/5.0 (X11; Linux x86_64; rv:45.0) Gecko/20100101 Firefox/45.0
     Accept: text/html


Respuesta del Servidor:

    HTTP/1.1 200 OK
    Date: Fri, 31 Dec 2003 23:59:59 GMT
    Content-Type: text/html
    Content-Length: 1221

    <html lang="eo">
    <head>
    <meta charset="utf-8">
    <title>Título del sitio</title>
    </head>
    <body>
    <h1>Página principal de tuHost</h1>
    (Contenido)
      .
      .
      .
    </body>
    </html>


HTTPS indica que el protocolo es seguro mediante cifrado de la información.

### API REST

Lo último antes de empezar a ver código es hacer una recapitulación de todo lo que hemos visto, lo que puede ser agrupado dentro de un cómodo conjunto de principios llamado **Transferencia de estado representacional o representational state transfer (REST)**.

Según [Wikipedia](https://es.wikipedia.org/wiki/Protocolo_de_transferencia_de_hipertexto), es un conjunto de principios para diseñar aplicaciones web:

- **Un protocolo cliente/servidor sin estado:** cada mensaje HTTP contiene toda la información necesaria para comprender la petición. Como resultado, ni el cliente ni el servidor necesitan recordar ningún estado de las comunicaciones entre mensajes. En la práctica, muchas aplicaciones utilizan cookies y otros mecanismos para mantener el estado de la sesión.

- Posee un conjunto de operaciones bien definidas que se aplican a todos los recursos de información: HTTP en sí define un conjunto pequeño de operaciones, las más importantes son **POST, GET, PUT y DELETE**. Con frecuencia estas operaciones se equiparan a las operaciones **CRUD en bases de datos** (CLAB en castellano: crear,leer,actualizar,borrar) que se requieren para la persistencia de datos.

- **Una sintaxis universal para identificar los recursos.** En un sistema REST, cada recurso es direccionable únicamente a través de su **URI**.

    ``/usuarios``

    ``/usuarios/42``

    ``/productos/15/comentarios``

### Desplegando nuestro modelo con FastAPI

Ya que conocemos lo que es una API REST, revisemos como podemos usar `FastAPI` para implementar nuestra propia API.

[FastAPI](https://fastapi.tiangolo.com) es un framework moderno y de alto rendimiento para construir APIs con Python, que destaca por su simplicidad, rapidez y eficiencia. FastAPI permite desarrollar aplicaciones web rápidamente utilizando la tipificación de Python para generar documentación automática y validaciones de datos sin esfuerzo adicional. Con una curva de aprendizaje amigable, FastAPI es una excelente elección para aprender y dominar el desarrollo de APIs en Python.

Comencemos instalando la libreria:

In [None]:
!pip install "fastapi[all]"

Collecting fastapi-cli>=0.0.8 (from fastapi-cli[standard]>=0.0.8; extra == "all"->fastapi[all])
  Downloading fastapi_cli-0.0.13-py3-none-any.whl.metadata (6.3 kB)
Collecting ujson!=4.0.2,!=4.1.0,!=4.2.0,!=4.3.0,!=5.0.0,!=5.1.0,>=4.0.1 (from fastapi[all])
  Downloading ujson-5.11.0-cp310-cp310-manylinux_2_24_x86_64.manylinux_2_28_x86_64.whl.metadata (9.4 kB)
Collecting email-validator>=2.0.0 (from fastapi[all])
  Downloading email_validator-2.3.0-py3-none-any.whl.metadata (26 kB)
Collecting pydantic-extra-types>=2.0.0 (from fastapi[all])
  Downloading pydantic_extra_types-2.10.5-py3-none-any.whl.metadata (3.9 kB)
Collecting dnspython>=2.0.0 (from email-validator>=2.0.0->fastapi[all])
  Downloading dnspython-2.8.0-py3-none-any.whl.metadata (5.7 kB)
Collecting rich-toolkit>=0.14.8 (from fastapi-cli>=0.0.8->fastapi-cli[standard]>=0.0.8; extra == "all"->fastapi[all])
  Downloading rich_toolkit-0.15.1-py3-none-any.whl.metadata (1.0 kB)
Collecting fastapi-cloud-cli>=0.1.1 (from fastapi-cli[s

Con la libreria instalada, pasemos ahora a escribir nuestra API!

**Nota importante: A diferencia de la sección de `gradio`, será necesario ejecutar nuestro código usando la terminal. Encontrarán el código completo de la API en `recursos/2025-02/13-Despliegue/fastapi_app.py`**

Para usar `fastapi`, lo primero que se debe realizar es generar una instancia del módulo FastAPI:

In [22]:
from fastapi import FastAPI

# crear aplicación
app = FastAPI()

Para levantar nuestra aplicación, tenemos 2 opciones:

1. Escribir en la terminal el siguiente comando:

```{python}
uvicorn nombre_script:app --port 8000
```

2. Adjuntar al final del código de la aplicación el siguiente *chunk*:

```{python}
if __name__ == '__main__':
    uvicorn.run('fastapi_app:app', port = 8000)
```

Si siguieron todos los pasos correctamente, deberia levantarse su aplicación en la siguiente ruta: [http://127.0.0.1:8000](http://127.0.0.1:8000)

> **Pregunta:** ¿Qué les muestra el anterior link? ¿A qué se podría deber esto?

El siguiente paso es crear un *home* o vista default de nuestra aplicación. Usualmente, esta vista está hecha para introducir al usuario al funcionamiento de la aplicación.

Veamos como podemos implementar esto en nuestra aplicación:

In [23]:
from fastapi import FastAPI

app = FastAPI()

@app.get('/') # ruta
async def home(): 
    return {'Hello': 'World'}

Noten como FastAPI hace uso de *decoradores* para definir las rutas de la aplicación (donde en este caso, estamos definiendo un `GET`).

Luego si levantamos nuestra aplicación de nuevo e ingresamos a [http://127.0.0.1:8000](http://127.0.0.1:8000), deberiamos obtener como respuesta:

```{python}
{'Hello': 'World'}
```

> **Pregunta: ¿Qué es un json? ¿Porqué es deseable hacer uso de este tipo en nuestra API?**

Veamos ahora como definir una segunda ruta de acceso:

In [None]:
from fastapi import FastAPI
# from make_prediction import make_prediction

# init app
app = FastAPI()

# def home
@app.get('/') # ruta
async def home():
    return {'Hello': 'World'}

@app.get('/classroom') # ruta
async def classroom():
    return {'Message': 'This is my first API :)'}

Donde si ingresan a [http://127.0.0.1:8000/classroom](http://127.0.0.1:8000/classroom) deberian observar:

```{python}
{'Message': 'This is my first API :)'}
```

Genial! Ahora que ya sabemos como definir algunas rutas de acceso en nuestra aplicación, veamos como implementar un método `POST` para desplegar nuestro modelo.

> **Pregunta:** ¿Porqué es deseable generar un método `POST` para el despliegue de nuestra solución?

In [None]:
from fastapi import FastAPI

# init app
app = FastAPI()

# def home
@app.get('/') # ruta
async def home():
    return {'Hello': 'World'}

@app.get('/classroom') # ruta
def classroom():
    return {'Message': 'This is my first API :)'}

# def predict method
@app.post("/predict") # ruta
async def predict(sepal_length: float, sepal_width: float, petal_length: float, petal_width: float): # parametros de entrada

    label = make_prediction(sepal_length, sepal_width, petal_length, petal_width) # generar prediccion

    return {"label": label} # retornar prediccion

Como pueden ver, desplegar nuestra solución fue sumamente simple ya que pudimos reciclar gran parte de lo hecho en `make_prediction`. Probemos ahora nuestra API!

> **Pregunta:** ¿Qué deberia pasar si ingresamos a [http://127.0.0.1:8000/predict](http://127.0.0.1:8000/predict)? ¿Porqué?

Para probar que el método `POST` funciona, `FastAPI` nos habilita la ruta [http://127.0.0.1:8000/docs](http://127.0.0.1:8000/docs) por defecto en donde podemos probar lo que hemos desarrollado en la API.

Veamos ahora en vivo como probar nuestra aplicación!

<p align="center">
  <img src="https://media.tenor.com/ug1DBRF_MjIAAAAC/bill-oreilly-well-do-it-live.gif" width="400">
</p>