## Aprendiendo a utilizar Docker

![](https://craft-code.com/wp-content/uploads/2021/08/docker_facebook_share.png)



Veamos la siguiente introducción y guía rápida a Docker:

In [1]:
from IPython.display import YouTubeVideo

YouTubeVideo('_dfLOzuIg2o?t=17', width=800, height=450)

## 🐳 ¿Qué es Docker?
Docker es una plataforma de código abierto que automatiza la creación, el despliegue y la ejecución de aplicaciones en **contenedores**. Estos contenedores permiten empaquetar una aplicación con todas sus dependencias, asegurando que funcione de manera consistente en cualquier entorno.

## 📦 Imágenes y Contenedores
- **Imagen**: Una imagen de Docker es una plantilla inmutable que contiene todo lo necesario para ejecutar una aplicación: código, dependencias, librerías y el sistema operativo. Es un archivo estático que define el entorno de ejecución.

- **Contenedor**: Un contenedor es una instancia en ejecución de una imagen. A diferencia de la imagen, el contenedor está en movimiento y puede procesar tareas. Piensa en el contenedor como una "copia funcional" de la imagen.

📖 **Analogía**: La imagen es como una receta de cocina (la descripción de cómo hacer un plato), mientras que el contenedor es el plato ya preparado y listo para servirse. Puedes crear múltiples platos idénticos a partir de la misma receta.

## 📥 Registro de Docker y Docker Hub
- **Registro de Docker**: Un registro de Docker es un servicio que almacena imágenes de Docker. Es un lugar donde puedes subir, gestionar y compartir imágenes.

- **Docker Hub**: Es el registro público de Docker más utilizado. Es una plataforma en línea donde los usuarios pueden encontrar y descargar imágenes de Docker creadas por otros o subir sus propias imágenes.

## 📝 Dockerfile
El **Dockerfile** es un archivo de texto que contiene un conjunto de instrucciones paso a paso para construir una imagen de Docker. Describe cómo debe configurarse el entorno de ejecución (sistema operativo, dependencias, variables de entorno, etc.).

## 💾 Volúmenes
Un **volumen** es una forma de almacenar datos en Docker de manera persistente. Los volúmenes permiten que los datos de una aplicación no se borren cuando se elimina el contenedor. Son útiles para mantener datos importantes fuera del ciclo de vida temporal del contenedor.

## Por qué utilizar un contenedor?
Los contenedores permiten separar las aplicaciones del entorno en el que se ejecutan, lo que facilita su despliegue en cualquier lugar, ya sea un centro de datos privado, la nube pública o la computadora de un desarrollador. Esto brinda a los desarrolladores la capacidad de crear entornos predecibles y aislados, mientras que desde el punto de vista operativo, los contenedores ofrecen un mayor control sobre los recursos, mejorando la eficiencia de la infraestructura.

![docker_components.png](images/docker_components.png)

## Ejemplo de Dockerfile
```dockerfile
FROM python:3.11

WORKDIR /code

COPY ./requirements.txt /code/requirements.txt

RUN apt-get update && apt-get install -y procps && pip install -U pip && rm /etc/localtime && ln -s /usr/share/zoneinfo/America/Mexico_City /etc/localtime
RUN pip install -r ./requirements.txt

COPY ./source /code/source

EXPOSE 5000
CMD ["uvicorn","source.main:app", "--host", "0.0.0.0", "--port", "5000"]
``

## 🐳 Versiones de imágenes de Docker de Python

### 1. **python** (imagen completa)
Esta es la imagen **estándar** de Python en Docker. Viene con todo el entorno necesario para desarrollar y ejecutar aplicaciones en Python, incluyendo todas las bibliotecas del sistema y herramientas necesarias para compilar extensiones de Python.

**Ventajas**:
- Lista para usar sin necesidad de configuraciones adicionales.
- Incluye herramientas de desarrollo como `gcc`, `make`, etc.

**Desventajas**:
- **Tamaño** considerablemente más grande (~900 MB o más).

**Cuándo usarla**:
- Cuando necesitas un entorno de desarrollo completo para Python, incluyendo compiladores para instalar bibliotecas con extensiones C (como `numpy` o `pandas`).

```dockerfile
FROM python:3.11
```

---

### 2. **python:slim** (imagen ligera)
La variante **slim** es una versión recortada de la imagen estándar de Python. No incluye las herramientas de compilación ni algunas bibliotecas del sistema, por lo que es mucho más ligera (~50-70 MB).

**Ventajas**:
- **Mucho más ligera** que la imagen estándar, lo que significa tiempos de descarga y despliegue más rápidos.

**Desventajas**:
- No incluye herramientas de compilación (como `gcc`), lo que puede ser un problema si necesitas instalar dependencias que requieren ser compiladas.

**Cuándo usarla**:
- Cuando tu aplicación no necesita **compilar extensiones en C** ni instalar bibliotecas que dependan de herramientas del sistema.
- Ideal para aplicaciones en producción o entornos en los que necesitas reducir el tamaño de la imagen.

```dockerfile
FROM python:3.11-slim
```

---

### 3. **python:alpine** (imagen ultraligera)
La imagen **alpine** está basada en Alpine Linux, una distribución de Linux extremadamente pequeña. Esta imagen es la más ligera de todas, con un tamaño de alrededor de **5 MB**.

**Ventajas**:
- **Extremadamente ligera**, ideal para situaciones donde cada MB cuenta.

**Desventajas**:
- Puede ser más complicada de usar, ya que **no incluye muchas bibliotecas del sistema** que suelen ser necesarias para compilar extensiones de Python.
- Algunas bibliotecas pueden requerir ajustes específicos para ser instaladas en Alpine debido a su sistema de paquetes `apk`.

**Cuándo usarla**:
- Cuando la prioridad es **minimizar el tamaño de la imagen** y estás dispuesto a lidiar con posibles complicaciones en la instalación de dependencias.

```dockerfile
FROM python:3.11-alpine
```
---

### 4. **python:windowsservercore** (imagen para Windows)
Esta imagen está basada en **Windows Server Core** y está diseñada para ejecutar Python en entornos Windows.

**Ventajas**:
- Ideal para aplicaciones que dependen de herramientas o bibliotecas específicas de **Windows**.

**Desventajas**:
- Mucho más pesada que las imágenes basadas en Linux.
- Menos popular y con menos soporte que las imágenes basadas en Linux.

**Cuándo usarla**:
- Cuando tu aplicación está diseñada para correr en **Windows** o depende de bibliotecas y herramientas de Windows.

```dockerfile
FROM python:3.11-windowsservercore
```

---

### 5. **python:<version>-buster** o **python:<version>-bullseye**
Estas variantes están basadas en distribuciones de **Debian** como Buster o Bullseye. Son versiones más completas de las imágenes `slim`, pero con un enfoque en estabilidad y compatibilidad.

**Ventajas**:
- Basadas en distribuciones **estables y seguras** de Debian, lo que garantiza compatibilidad y soporte a largo plazo.
- Menos pesada que la imagen estándar, pero más completa que `slim`.

**Desventajas**:
- Más pesada que `slim` y `alpine`, pero no tanto como la imagen completa.

**Cuándo usarla**:
- Cuando necesitas una imagen estable y más ligera que la estándar, pero con más herramientas del sistema que `slim`.
```dockerfile
FROM python:3.11-buster
```

## Construir la imagen de Docker

Abre una terminal y navega al directorio donde tienes tu `Dockerfile`. Luego, ejecuta el siguiente comando para construir la imagen:

```bash
docker build -t mi-imagen-python .
```

## Ejecutar el contenedor

Después de construir la imagen, puedes ejecutar un contenedor basado en ella con el siguiente comando:

```bash
docker run -p 5000:5000 --name mi-contenedor-python mi-imagen-python
```

## 🏗️ Construcción Incremental y Cacheo en Docker

### ¿Cómo funciona el caché?

1. **Capa por instrucción**:
   - Cada instrucción en un `Dockerfile` (como `FROM`, `RUN`, `COPY`, `ADD`, etc.) crea una nueva **capa**.
   - Si Docker detecta que una instrucción no ha cambiado desde la última construcción, reutiliza la capa existente en lugar de crear una nueva.

2. **Caché de capas**:
   - Docker almacena estas capas en caché.
   - Si modificas una línea en el `Dockerfile`, todas las capas siguientes deben ser reconstruidas, pero las capas anteriores (que no han cambiado) se reutilizan.

### Impacto de la posición de los comandos

La posición de los comandos en el `Dockerfile` afecta directamente cómo se utiliza el caché:

1. **Modificaciones**:
   - Si cambias una línea en el `Dockerfile`, todas las líneas siguientes se volverán a ejecutar.
   - Por ejemplo, si tienes un `COPY` que copia tu código fuente y está después de varios comandos `RUN`, si cambias tu código, todos los comandos `RUN` que vienen después también se ejecutarán de nuevo, aunque no hayan cambiado.

   ```dockerfile
   FROM python:3.11-slim

   RUN apt-get update && apt-get install -y build-essential
   COPY . /app
   RUN pip install -r /app/requirements.txt
   ```

   En este ejemplo, si cambias el código fuente en el directorio que se copia, el `RUN pip install` se volverá a ejecutar, incluso si no has cambiado las dependencias.

2. **Optimización del caché**:
   - Para optimizar el uso del caché, es recomendable colocar las instrucciones que cambian con menos frecuencia al principio del `Dockerfile`.
   - Esto permite que las capas que no cambian (como la instalación de dependencias) se reutilicen en construcciones posteriores.

### Ejemplo de optimización

```dockerfile
FROM python:3.11-slim

# Instalar dependencias del sistema
RUN apt-get update && apt-get install -y build-essential

# Copiar solo los archivos de requisitos primero
COPY requirements.txt /app/
WORKDIR /app
RUN pip install --no-cache-dir -r requirements.txt

# Ahora copiar el resto del código
COPY . /app
```

En este caso, si solo cambias el código fuente y no los requisitos, la instalación de paquetes se utilizará desde el caché, acelerando la construcción.

# Network en Docker

Docker Network es una funcionalidad que permite a los contenedores comunicarse entre sí y con el mundo exterior. Docker maneja redes virtuales que conectan los contenedores, proporcionando un aislamiento seguro y una manera de establecer comunicación entre contenedores y también con otros hosts.

Hay varios tipos de redes en Docker, incluyendo:

- *bridge:* El tipo predeterminado de red que se crea automáticamente con Docker. Permite que los contenedores conectados a la misma red de puente se comuniquen, mientras que los aísla de los contenedores en otras redes de puente.

- *host:* Este tipo elimina el aislamiento entre los contenedores y el host, permitiendo que los contenedores accedan directamente a la red del host.

- *overlay:* Facilita la comunicación entre contenedores en diferentes hosts, usado principalmente en configuraciones de Docker Swarm.

- *macvlan:* Permite asignar una dirección MAC a un contenedor, haciendo que parezca un dispositivo físico en la red.


## Crear una red en Docker:
```
docker network create my-network
```

## Correr contenedores en la misma red:
```
docker run --network my-network -p 5000:5000 --name container-1 your-model-image

docker run --network my-network -p 8501:8501 --name container-2 your-ui-image
```

Desde el frontend, llamar directamente al nombre del contenedor como parte de la url. Es decir:

```
http://container-1:5000/predict
```


# 🐳 Docker Compose

### ¿Qué es Docker Compose?

Docker Compose es una herramienta para definir y ejecutar aplicaciones multi-contenedor en `Docker`. Utiliza un archivo de configuración YAML para definir los servicios, redes y volúmenes necesarios para ejecutar tu aplicación. Esto simplifica la gestión de múltiples contenedores al permitirte describir la configuración de tu aplicación en un solo lugar.

### ¿Por qué usar Docker Compose?

- **Facilidad de uso**: Permite iniciar y detener múltiples contenedores con un solo comando, en lugar de manejar cada contenedor individualmente.
- **Configuración centralizada**: Todos los servicios y sus configuraciones están en un solo archivo (`docker-compose.yml`).
- **Escalabilidad**: Puedes escalar fácilmente servicios a más instancias con un simple cambio en el archivo de configuración.

### Estructura de un archivo `docker-compose.yml`

Un archivo `docker-compose.yml` tiene una estructura sencilla. Aquí hay un ejemplo básico que define una aplicación web que usa un servicio de base de datos:

```yaml
version: '3.8'  # Versión del formato de Compose

services:       # Definición de servicios
  web:          # Servicio web
    build: .    # Construir desde el Dockerfile en el directorio actual
    ports:
      - "5000:5000"  # Mapear el puerto 5000 del contenedor al puerto 5000 del host
    volumes:
      - .:/app   # Montar el directorio actual en /app del contenedor

  db:           # Servicio de base de datos
    image: postgres:13  # Usar la imagen de PostgreSQL
    environment:  # Variables de entorno para la base de datos
      POSTGRES_DB: mydatabase
      POSTGRES_USER: user
      POSTGRES_PASSWORD: password
    volumes:
      - db_data:/var/lib/postgresql/data  # Persistir datos

volumes:       # Definición de volúmenes
  db_data:     # Volumen para datos de la base de datos
```

## 🛠️ Comandos de Docker Compose

### 1. Construir imágenes
- Para volver a construir las imágenes de los servicios definidos en tu archivo `docker-compose.yml`:
  ```bash
  docker-compose build
  ```

### 2. Opciones adicionales para el comando build
- **Reconstruir sin caché**:
  Para forzar la reconstrucción de las imágenes sin utilizar el caché:
  ```bash
  docker-compose build --no-cache
  ```

- **Reconstruir y ejecutar**:
  Para reconstruir las imágenes y luego iniciar los servicios en un solo comando:
  ```bash
  docker-compose up --build
  ```

### 3. Iniciar servicios
- Para construir y ejecutar todos los servicios definidos en el archivo:
  ```bash
  docker-compose up
  ```

- **Ejecutar en segundo plano**:
  Para ejecutar los contenedores en modo desacoplado:
  ```bash
  docker-compose up -d
  ```

### 4. Detener servicios
- Para detener y eliminar todos los contenedores definidos en el archivo:
  ```bash
  docker-compose down
  ```

### 5. Ver logs de los servicios
- Para mostrar los logs de todos los servicios:
  ```bash
  docker-compose logs
  ```


Crear un archivo `docker-compose.yaml`

```yaml
version: '3.8'
services:

  model:
    build: ./app/model
    ports:
      - "5000:5000"

  ui:
    build: ./app/ui
    ports:
      - "8501:8501"
```


| PULocationID | DOLocationID | trip_distance | duration          |
|--------------|--------------|---------------|--------------------|
| 236          | 239          | 1.98          | 11.5               |
| 65           | 170          | 6.54          | 20.87              |
| 74           | 262          | 3.08          | 19.03              |
| 74           | 116          | 2.40          | 11.87              |
| 74           | 243          | 5.14          | 10.98              |
| 33           | 209          | 2.00          | 16.70              |
| 74           | 238          | 3.20          | 16.22              |
| 166          | 239          | 2.01          | 11.45              |
| 226          | 226          | 0.31          | 1.27               |
| 7            | 129          | 2.32          | 13.38              |
| 42           | 75           | 2.69          | 16.65              |
