# Visión por Computación con PyTorch

### Part 3 of "Deep Learning with Pytorch: Zero to GANs"

This tutorial series is a hands-on beginner-friendly introduction to deep learning using [PyTorch](https://pytorch.org), an open-source neural networks library. These tutorials take a practical and coding-focused approach. The best way to learn the material is to execute the code and experiment with it yourself.

# Trabajar con imágenes y regresión logística en PyTorch

### Parte 3 de "Aprendizaje profundo con Pytorch: de cero a GAN"

Esta serie de didácticas es una introducción práctica y amena para principiantes en aprender en profundidad con la ayuda de [PyTorch](https://pytorch.org), una biblioteca de recursos de neuronas de código abierto. Estos tutoriales adoptan un enfoque práctico centrado en la codificación. La mejor manera de aprender hardware es ejecutar el código y experimentarlo usted mismo.

Este tutorial cubre los siguientes temas:
    
* Trabajar con imágenes en PyTorch (usando el conjunto de datos MNIST)
* Dividir un conjunto de datos en conjuntos de entrenamiento, validación y prueba
* Creación de modelos PyTorch con lógica personalizada mediante la ampliación de la clase `nn.Module`
* Interpretar los resultados del modelo como probabilidades utilizando Softmax y seleccionando etiquetas predichas
* Elegir una métrica de evaluación útil (precisión) y una función de pérdida (entropía cruzada) para problemas de clasificación
* Configuración de un ciclo de entrenamiento que también evalúa el modelo utilizando el conjunto de validación
* Probar el modelo manualmente en ejemplos seleccionados al azar* Guardar y cargar puntos de control del modelo para evitar volver a entrenar desde cero

### Cómo ejecutar el código

Este tutorial es un ejecutable [Jupyter notebook](https://jupyter.org) alojado en [Jovian](https://www.jovian.ai). Puede _ejecutar_ este tutorial y experimentar con los ejemplos de código de varias maneras: *usando recursos gratuitos en línea* (recomendado) o *en su computadora*.

#### Opción 1: Ejecutar usando recursos en línea gratuitos (1-clic, recomendado)

La forma más fácil de comenzar a ejecutar el código es hacer clic en el botón **Ejecutar** en la parte superior de esta página y seleccionar **Ejecutar en Colab**. [Google Colab](https://colab.research.google.com) es una plataforma en línea gratuita para ejecutar portátiles Jupyter utilizando la infraestructura de nube de Google. También puede seleccionar "Ejecutar en Binder" o "Ejecutar en Kaggle" si tiene problemas para ejecutar el cuaderno en Google Colab.


#### Opción 2: Ejecutar en su computadora localmente

Para ejecutar el código en su computadora localmente, deberá configurar [Python](https://www.python.org), descargar el cuaderno e instalar las bibliotecas requeridas. Recomendamos usar la distribución [Conda](https://docs.conda.io/projects/conda/en/latest/user-guide/install/) de Python. Haga clic en el botón **Ejecutar** en la parte superior de esta página, seleccione la opción **Ejecutar localmente** y siga las instrucciones.

> **Cuadernos de Jupyter**: Este tutorial es un [Cuaderno de Jupyter](https://jupyter.org) - un documento hecho de _celdas_. Cada celda puede contener código escrito en Python o explicaciones en inglés sencillo. Puede ejecutar celdas de código y ver los resultados, por ejemplo, números, mensajes, gráficos, tablas, archivos, etc., instantáneamente dentro del cuaderno. Jupyter es una poderosa plataforma para la experimentación y el análisis. No tenga miedo de perder el tiempo con el código y romper cosas: aprenderá mucho al encontrar y corregir errores. Puede utilizar la opción de menú "Kernel > Reiniciar y borrar salida" o "Editar > Borrar salidas" para borrar todas las salidas y empezar de nuevo desde arriba.

## Trabajar con imágenes

En este tutorial, usaremos nuestro conocimiento existente de PyTorch y la regresión lineal para resolver un tipo de problema muy diferente: *clasificación de imágenes*. Usaremos la famosa [*Base de datos de dígitos escritos a mano del MNIST*](http://yann.lecun.com/exdb/mnist/) como nuestro conjunto de datos de entrenamiento. Consiste en imágenes en escala de grises de 28 px por 28 px de dígitos escritos a mano (0 a 9) y etiquetas para cada imagen que indican qué dígito representa. Aquí hay algunas imágenes de muestra del conjunto de datos:

![muestra-mnist](https://i.imgur.com/CAYnuo1.jpg)

Comenzamos instalando e importando `torch` y `torchvision`. `torchvision` contiene algunas utilidades para trabajar con datos de imagen. También proporciona clases auxiliares para descargar e importar conjuntos de datos populares como MNIST automáticamente.

In [5]:
# Imports
import torch
import torchvision
from torchvision.datasets import MNIST

In [6]:
# Download training dataset
dataset = MNIST(root='data/', download=True)

Cuando esta instrucción se ejecuta por primera vez, descarga los datos en el directorio `data/` al lado del cuaderno y crea un PyTorch `Dataset`. En ejecuciones posteriores, la descarga se omite porque los datos ya se han descargado. Vamos a comprobar el tamaño del conjunto de datos.

El conjunto de datos tiene 60 000 imágenes que usaremos para entrenar el modelo. También hay un conjunto de prueba adicional de 10 000 imágenes que se utilizan para evaluar modelos y reportar métricas en documentos e informes. Podemos crear el conjunto de datos de prueba usando la clase `MNIST` pasando `train=False` al constructor.

Veamos un elemento de muestra del conjunto de datos de entrenamiento.

In [9]:
dataset[0]

(<PIL.Image.Image image mode=L size=28x28 at 0x1A79439D198>, 5)