# Jugando con datos: imágenes y texto

En esta libreta vamos a cargar conjutos de imágenes y manipularlas un poco. Vamos a hacer esto para poder utilizarlas para entrenar modelos de aprendizaje automático. Si no entiendes lo que estoy diciendo, no te preocupes... vamos a ir paso por paso.

En este curso vamos a utilizar TensorFlow y Keras, que es una API que nos hace la vida fácil.

In [1]:
from __future__ import absolute_import, division, print_function

# TensorFlow y tf.keras
import tensorflow as tf
from tensorflow import keras

# Bibliotecas de apoyo
import numpy as np
import matplotlib.pyplot as plt

# vamos a ver qué versión de TensorFlow estamos utilizando
print(tf.__version__)

1.14.0


## Imágenes

### Imágenes en escala de grises
Primero vamos a descargar un grupo de imágenes en blanco y negro... cuando hablamos de blanco y negro, en realidad hablamos de una escala de grises. Para la computadora, una imagen en escala de grises es una colección de números. Cada número representa un pixel. Estos números van del 0 (negro) hasta el 255 (blanco). Todos los demás números son una escala de grises. Entre más pequeño es un número, más oscuro el gris que representa.

Para este ejemplo, vamos a utilizar un grupo de imágenes llamado **Fashion MNIST** que incluye 70,000 imágenes. Cada una de estas imágenes pertenece a una de diz categorías posibles. Todas las categorías están relacionadas con ropa. Las imágenes con las que vamos a jugar son muy pequeñas (28 por 28 pixels).

En general, uno tiene que trabajar con imágenes de mayor resolución pero vamos a utilizar estas imágenes pequeñas por lo siguinete: Para entrenar modelos de aprendizaje automático normalmente tenemos que reducir el tamaño de las imágenes porque si no tendríamos que hacer montones de operaciones (sumas y multiplicaciones, principalmente). Además, lo meas imprtante es que sepamos modificar imágenes... ya que seamos expertos podemos traer imágenes más complicadas (recuerda que ahorita son en esacala de grises pero luego vamos a trabajar con imágenes a color).

Keras nos hace la vida fácil porque ya tiene este conjunto de imágenes **Fashion MNIST** (porque se llama así este grupo de imágenes te lo dejo de tarea). No sólo vamos a subir estas imágenes sino que las vamos a dividir en dos grupos: un grupo de 60,000 imágenes que vamos a usar para entrenar nuestros modelos y otro grupo con las 10,000 imágenes restantes que vamos a utiilizar para probar si los modelos que entrenamos realmente están funcionando bien. Además de las imágenes, vamos a guardar las etiquetas correspondientes. Cada imagen tiene una etiqueta asociada a ella y nos indica a qué clase de ropa pertenece la imagen.


In [0]:
fashion_mnist = keras.datasets.fashion_mnist

(imagenes_entrenamiento, etiquetas_entrenamiento), (imagenes_prueba, etiquetas_prueba) = fashion_mnist.load_data()

Recuerda que las imágenes tienen 28 x 28 pixels. Para la computadora, una imagen es un arreglo NumPy y cada pixel va de 0 (negro) and 255 (blanco).

Las etiquetas son números del 0 al 9. Cada número es una tipo de ropa distinto.

<table>
  <tr>
    <th>Etiqueta</th>
    <th>Clase</th>
  </tr>
  <tr>
    <td>0</td>
    <td>Playera</td>
  </tr>
  <tr>
    <td>1</td>
    <td>Pantalón</td>
  </tr>
    <tr>
    <td>2</td>
    <td>Sweater</td>
  </tr>
    <tr>
    <td>3</td>
    <td>Vestido</td>
  </tr>
    <tr>
    <td>4</td>
    <td>Abrigo</td>
  </tr>
    <tr>
    <td>5</td>
    <td>Sandalia</td>
  </tr>
    <tr>
    <td>6</td>
    <td>Camisa</td>
  </tr>
    <tr>
    <td>7</td>
    <td>Zapato</td>
  </tr>
    <tr>
    <td>8</td>
    <td>Bolsa</td>
  </tr>
    <tr>
    <td>9</td>
    <td>Bota</td>
  </tr>
</table>

Como mencionamos previamente, cada imagen tiene una etiqueta asociada a ella. Los nombres de las clases no están incluidos con este grupo de imágenes así que tenemos que relacionar cada clase con el tipo de ropa correcto:

In [0]:
nombres_clases = ['Playera', 'Pantalón', 'Sweater', 'Vestido', 'Abrigo',
                 'Sandalia', 'Camisa', 'Zapato', 'Bolsa', 'Bota']

## Jugando con las imágenes
Vamos primero a revisar que efectivamente tenemos 70,000 imágenes de tamaño 28 x 28 pixels.

Esperamos que 60,000 estén en las imágenes de entrenamiento y 10,000 en las imágenes de prueba

In [9]:
imagenes_entrenamiento.shape

(60000, 28, 28)

In [10]:
imagenes_prueba.shape

(10000, 28, 28)

Ahora hay que revisar que también tenemos 60,000 etiquetas para entrenar y 10,000 para hacer pruebas:

In [11]:
len(etiquetas_entrenamiento)

60000

In [12]:
len(etiquetas_prueba)

10000