<img src="http://lssds.aura-astronomy.org/winter_school/sites/default/files/sods_atfdds_header01.jpg" alt="La Serena School for Data Science: Applied Tools for Data-driven Sciences" />


## 1. Introducción:

Un Dockerfile es un archivo de configuración en formato de texto plano utilizado para definir los pasos para construir una imagen de Docker. Es un componente crítico del ecosistema de Docker, que permite a los desarrolladores automatizar el proceso de creación de imágenes de contenedor reproducibles y consistentes. Los Dockerfiles se utilizan para encapsular la configuración y dependencias de una aplicación o servicio, lo que facilita empaquetar, distribuir e implementar software en forma de contenedores.

El Dockerfile incluye típicamente una serie de instrucciones, cada una en una línea separada, que dictan cómo debe construirse la imagen. El motor de Docker interpreta estas instrucciones y construye la imagen capa por capa. Cuando se crea un nuevo contenedor a partir de la imagen, el sistema de archivos se construye en base a estas capas, lo que lo hace eficiente y rápido.

A continuación se muestra un ejemplo de un Dockerfile para crear un servidor de Jupyter Notebook utilizando la imagen oficial de Jupyter Docker Stacks:

In [1]:
!cat Dockerfile

FROM jupyter/base-notebook:latest

WORKDIR /home/jovyan/work

COPY . /home/jovyan/work

EXPOSE 8889

RUN pip install pandas matplotlib

CMD ["jupyter", "notebook", "--ip=0.0.0.0", "--port=8889","--no-browser"]


## 2. Componentes clave de un Dockerfile:

- **2.1 Imagen Base:**

El Dockerfile comienza especificando la imagen base sobre la cual se construirá la imagen personalizada. La imagen base es el punto de partida para la imagen de tu aplicación y contiene el sistema operativo y otro software o bibliotecas preinstaladas.
La imagen base se define utilizando la instrucción FROM. Por ejemplo:

In [None]:
FROM jupyter/minimal-notebook

- **2.2 Configuración del Entorno:**

El Dockerfile puede incluir configuraciones del entorno que definan variables, especifiquen directorios de trabajo y establezcan otros comportamientos en tiempo de ejecución.
La configuración del entorno se establece utilizando la instrucción ENV. Por ejemplo:

In [None]:
ENV NODE_ENV=production

- **2.3 Copiar Archivos:**

La instrucción COPY te permite copiar archivos y directorios desde el sistema anfitrión al sistema de archivos de la imagen. Este paso es esencial para agregar el código de tu aplicación y cualquier recurso necesario a la imagen.
Por ejemplo:

In [None]:
COPY . /app

- **2.4 Ejecución de Comandos:**

La instrucción RUN se utiliza para ejecutar comandos dentro del sistema de archivos de la imagen. Esto se utiliza comúnmente para instalar paquetes, dependencias y otro software necesario para que tu aplicación funcione.

Por ejemplo, para una aplicación Node.js, podrías ejecutar el siguiente comando para instalar las dependencias de Node.js:

In [None]:
RUN npm install

- **2.5 Exposición de Puertos:**

La instrucción EXPOSE se utiliza para especificar en qué puertos debe escuchar el contenedor. No publica los puertos en realidad, sino que sirve como documentación para los desarrolladores y usuarios de la imagen.

Por ejemplo, para indicar que el contenedor escucha en el puerto 3000, agregarías la siguiente línea:

In [None]:
EXPOSE 3000

- **2.6 Comando de Ejecución del Contenedor:**

La instrucción ***CMD*** o ***ENTRYPOINT*** define el comando que se debe ejecutar cuando se inicia un contenedor a partir de la imagen. Por lo general, este es el proceso principal de tu aplicación.

Por ejemplo, para una aplicación Node.js, podrías usar:

In [None]:
CMD ["node", "app.js"]

Una vez que hayas definido tu Dockerfile, puedes usar el comando ***docker build*** para construir la imagen de Docker basada en las instrucciones proporcionadas en el archivo. Esto creará una imagen de contenedor que contiene todas las configuraciones, dependencias y código especificados necesarios para ejecutar tu aplicación.

Los Dockerfiles son una herramienta poderosa para crear imágenes de contenedor consistentes y reproducibles. Permiten a los desarrolladores definir el entorno exacto necesario para sus aplicaciones, lo que facilita compartir y distribuir el software en diferentes entornos y sistemas.

## 3. Crear un Dockerfile paso a paso:

Vamos a crear un Dockerfile paso a paso para un servidor de Jupyter Notebook utilizando la imagen oficial de Jupyter Docker Stacks:

- **3.1: Elegir la Imagen Base**

Utilizaremos la imagen oficial de Jupyter Notebook de Jupyter Docker Stacks como imagen base. Esta imagen incluye la instalación básica de Jupyter Notebook.
Elige la etiqueta (tag) de la imagen base según tus requisitos. En este ejemplo, utilizaremos la etiqueta ***base-notebook***.

In [None]:
FROM jupyter/base-notebook:latest

- **3.2: Establecer el Directorio de Trabajo**

Es una buena práctica establecer el directorio de trabajo dentro del contenedor donde se ubicarán tus archivos de Jupyter Notebook.
Lo estableceremos en ***/home/jovyan/work***, que es el directorio predeterminado para los archivos de Jupyter Notebook en la imagen base.

In [None]:
WORKDIR /home/jovyan/work

- **3.3: Copiar Archivos de Notebooks**

A continuación, copiaremos los archivos de Jupyter Notebook desde el directorio local (donde se encuentra el Dockerfile) al directorio de trabajo del contenedor.
Asegúrate de que tus archivos de Jupyter Notebook (por ejemplo, archivos ***.ipynb***) estén presentes en el mismo directorio que el Dockerfile.

In [None]:
COPY . /home/jovyan/work

- **3.4: Exponer Puerto**

El Jupyter Notebook se ejecuta de forma predeterminada en el puerto 8888, pero puede haber casos en los que se use este puerto, por lo que lo cambiaremos a 8889. Para acceder a él desde la máquina anfitriona, necesitamos exponer este puerto desde el contenedor.

In [None]:
EXPOSE 8889

- **3.5: Instalar Paquetes Adicionales (Opcional)**

Si tus Jupyter Notebooks requieren paquetes o bibliotecas adicionales de Python, puedes instalarlos utilizando pip o conda.
En este ejemplo, utilizaremos pip para instalar pandas y matplotlib.

In [None]:
RUN pip install pandas matplotlib

- **3.6: Iniciar Servidor de Jupyter Notebook**

Finalmente, agregaremos el comando para iniciar el servidor de Jupyter Notebook cuando se ejecute el contenedor.
La opción --ip=0.0.0.0 permite el acceso al servidor desde todas las direcciones IP, y --no-browser evita que Jupyter intente abrir un navegador dentro del contenedor.

In [None]:
CMD ["jupyter", "notebook", "--ip=0.0.0.0", "--port=8889","--no-browser"]

El Dockerfile completo se verá así:

In [6]:
!cat Dockerfile

FROM jupyter/base-notebook:latest

WORKDIR /home/jovyan/work

COPY . /home/jovyan/work

EXPOSE 8889

RUN pip install pandas matplotlib

CMD ["jupyter", "notebook", "--ip=0.0.0.0", "--port=8889","--no-browser"]


To build the Docker image, save the above code into a file named Dockerfile in the same directory as your Jupyter Notebook files. Then, open a terminal or command prompt, navigate to the directory containing the Dockerfile, and run the following command:

In [7]:
!docker build -t jupyter_server .

[1A[1B[0G[?25l[+] Building 0.0s (0/1)                                                         
[?25h[1A[0G[?25l[+] Building 0.1s (2/3)                                                         
[34m => [internal] load build definition from Dockerfile                       0.0s
[0m[34m => => transferring dockerfile: 37B                                        0.0s
[0m[34m => [internal] load .dockerignore                                          0.0s
[0m[34m => => transferring context: 2B                                            0.0s
[0m => [internal] load metadata for docker.io/jupyter/base-notebook:latest    0.0s
[?25h[1A[1A[1A[1A[1A[1A[0G[?25l[+] Building 0.3s (7/8)                                                         
[34m => [internal] load build definition from Dockerfile                       0.0s
[0m[34m => => transferring dockerfile: 37B                                        0.0s
[0m[34m => [internal] load .dockerignore                           

The build process will create a Docker image with your Jupyter Notebook server configuration.

To run the Jupyter Notebook server in a container based on the image you just built, use the following command:

In [8]:
!docker run -p 8889:8889 jupyter_server

[I 2023-08-12 19:19:48.106 ServerApp] Package notebook took 0.0000s to import
[I 2023-08-12 19:19:48.131 ServerApp] Package jupyter_lsp took 0.0172s to import
[W 2023-08-12 19:19:48.131 ServerApp] A `_jupyter_server_extension_points` function was not found in jupyter_lsp. Instead, a `_jupyter_server_extension_paths` function was found and will be used for now. This function name will be deprecated in future releases of Jupyter Server.
[I 2023-08-12 19:19:48.140 ServerApp] Package jupyter_server_terminals took 0.0086s to import
[I 2023-08-12 19:19:48.141 ServerApp] Package jupyterlab took 0.0000s to import
[I 2023-08-12 19:19:48.705 ServerApp] Package nbclassic took 0.0019s to import
[W 2023-08-12 19:19:48.707 ServerApp] A `_jupyter_server_extension_points` function was not found in nbclassic. Instead, a `_jupyter_server_extension_paths` function was found and will be used for now. This function name will be deprecated in future releases of Jupyter Server.
[I 2023-08-12 19:19:48.707 Ser

El **-p 8889:8889** mapea el puerto 8889 del contenedor al puerto 8889 de la máquina anfitriona. Luego, puedes acceder al servidor de Jupyter Notebook abriendo un navegador web y navegando a http://localhost:8889 en la máquina anfitriona. Verás la interfaz de Jupyter Notebook y podrás comenzar a trabajar con tus notebooks.