# Clasificador paisajes
Para este ejercicio vas a crear un clasificador automático de paisajes. Los datos los encontrarás en el Classroom como `seg_train.zip` y `seg_test.zip`. Se pide:
1. Cargar las imágenes. Mira cómo están almacenados los datos. Tendrás que recorrer las carpetas, cargar las imágenes en memoria y etiquetarlas con los nombres de las carpetas. Realiza un reshape de cada imagen (comienza el ejercicio con 32x32, para ir más rápido en las ejecuciones).
2. Investiga las imágenes, comprueba con algunas muestras que has cargado bien los datos.
3. Normaliza
4. Diseña la arquitectura de la red. Recuerda que es un algiritmo de clasificación. Ojo con las dimensiones de la entrada
5. Reserva un 20% de los datos del entrenamiento para validar.
6. Representa el objeto history
7. Evalua el modelo con los datos de test
8. Representa algunos de los paisajes donde el modelo comete errores
9. Crea una matriz de confusión con los errores del modelo

**NOTA apartado 1**: para el apartado 1 tendras que recorre las carpetas/imagenes con `os.listdir()`, e ir cargando todas las imagenes como arrays de numpy

**NOTA apartado 4**: empieza con un par de capas Conv2D + MaxPooling2D con activación relu y después la fully connected layer. on softmax como ultima capa

In [16]:
import numpy as np
import pandas as pd
import os
import matplotlib.pyplot as plt
import cv2
import tensorflow as tf

In [17]:
class_names = ['mountain','street','glacier', 'buildings','sea','forest']

IMAGE_SIZE = (32,32)

In [18]:
class_names_label = {class_name:i for i ,class_name in enumerate(class_names)}
class_names_label

{'mountain': 0,
 'street': 1,
 'glacier': 2,
 'buildings': 3,
 'sea': 4,
 'forest': 5}

In [19]:
import os

ROOT_PATH = os.getcwd()
TRAIN_PATH = "/Users/ivanlamb/Documents/GitHub/Machine_Learning/4-Deep_Learning/2-Redes_Convolucionales/ejercicios/train"
TEST_PATH = "/Users/ivanlamb/Documents/GitHub/Machine_Learning/4-Deep_Learning/2-Redes_Convolucionales/ejercicios/test"

In [20]:
def read_data(path, im_size, class_names_label):
    X = []
    y = []

    for folder in os.listdir(path):
        label = class_names_label[folder]
        folder_path = os.path.join(path,folder)
        # Iterar sobre todo lo que haya en path
        for file in os.listdir(folder_path):
            image_path = os.path.join(folder_path,file)
            image = cv2.imread(image_path)
            image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
            image = cv2.resize(image, im_size)
            X.append(image)
            y.append(label)
    
    
    return np.array(X), np.array(y)
    

X_train, y_train = read_data(TRAIN_PATH, IMAGE_SIZE, class_names_label)
X_test, y_test = read_data(TEST_PATH, IMAGE_SIZE, class_names_label)

print(X_train.shape)
print(X_test.shape)
print(y_train.shape)
print(y_test.shape)

(14034, 32, 32, 3)
(3000, 32, 32, 3)
(14034,)
(3000,)


In [21]:
print(pd.Series(y_train).value_counts(normalize=True))
print(pd.Series(y_train).value_counts(normalize=True))


0    0.178994
2    0.171298
1    0.169731
4    0.162035
5    0.161821
3    0.156121
dtype: float64
0    0.178994
2    0.171298
1    0.169731
4    0.162035
5    0.161821
3    0.156121
dtype: float64


In [23]:
from sklearn.utils import shuffle
X_train, y_train = shuffle(X_train, y_train, random_state=42)
X_test, y_test = shuffle(X_test, y_test,random_state=42)

In [26]:
X_train

array([[[[113, 159, 164],
         [ 40,  71,  71],
         [ 83, 136, 138],
         ...,
         [ 56, 108,  99],
         [ 74, 136, 128],
         [ 23,  66,  64]],

        [[ 56,  89,  97],
         [ 64, 102, 104],
         [ 36,  92,  89],
         ...,
         [ 55, 108,  98],
         [ 51,  79,  88],
         [104, 160, 159]],

        [[ 37,  63,  65],
         [ 69, 123, 125],
         [ 41, 101,  94],
         ...,
         [106, 147, 148],
         [ 98, 150, 157],
         [195, 218, 231]],

        ...,

        [[ 26,  33,  29],
         [ 29,  32,  31],
         [  7,   9,   8],
         ...,
         [ 71, 116, 123],
         [ 40,  65,  66],
         [ 23,  21,  24]],

        [[ 11,  11,  13],
         [ 10,  11,  10],
         [ 17,  22,  16],
         ...,
         [ 41,  76,  66],
         [ 31,  46,  48],
         [ 19,  19,  21]],

        [[ 30,  33,  31],
         [ 47,  52,  53],
         [ 33,  38,  34],
         ...,
         [ 34,  52,  44],
        

In [28]:
print("Min:", np.min(X_train))
print("Max:", np.max(X_train))

Min: 0
Max: 255
