# 0. Imports, configs y checks

In [None]:
import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2' # un poco menos de warnings de tensorflow
#os.environ["CUDA_VISIBLE_DEVICES"] = "-1" # deshabilitar la dGPU

# de python, para especificar rutas de archivos y directorios
from pathlib import Path

# lib para trabajar con arrays
import numpy as np

# lib que usamos para mostrar las imágenes
import matplotlib.pyplot as plt
#import plotly.express as px

# libs que usamos para construir y entrenar redes neuronales, y que además tiene utilidades para leer sets de 
# imágenes
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Input, Dropout, Convolution2D, MaxPooling2D, Flatten
from tensorflow.keras.preprocessing.image import load_img, img_to_array, ImageDataGenerator
from tensorflow.keras.callbacks import Callback
from tensorflow.keras.applications import VGG16

# pandas para el csv
import pandas as pd

# libs que usamos para tareas generales de machine learning. En este caso, métricas
from sklearn.metrics import accuracy_score, confusion_matrix

# configuración para que las imágenes se vean dentro del notebook
%matplotlib inline

In [None]:
# Ver si detecta la GPU en caso de haberla
import tensorflow as tf

gpus = tf.config.list_physical_devices("GPU")

if gpus:
 for gpu in gpus:
    print("Found a GPU with the name:", gpu)
else:
    print("Failed to detect a GPU.")

# 1. Análisis exploratorio sobre el conjunto de datos

In [None]:
# lo vamos a estar usando seguido
CATEGORIES = 'buildings', 'forest', 'glacier', 'mountain', 'sea', 'street'
# configurar de acuerdo a dónde bajaron los sets de imágenes
TRAIN_DIR = Path('./train')
TEST_DIR = Path('./test')
VALIDATION_DIR = Path('./validation')
SIZE = 150

Creamos datasets para Keras:

In [None]:
images_reader = ImageDataGenerator(
    rescale=1/255,
    rotation_range=10,
    #width_shift_range=0.3,
    #height_shift_range=0.3,
    brightness_range=(0.5, 1.5),
    horizontal_flip=True,
    #vertical_flip=True,
)

READ_PARAMS = dict(
    class_mode="categorical",  # tenemos N labels, queremos tuplas de 0s y 1s indicando cuál de los labels es
    classes=CATEGORIES,  # para usar el mismo orden en todos lados
    target_size=(SIZE, SIZE),
    color_mode="rgb",  # queremos trabajar con las imágenes a color
)

In [None]:
train = images_reader.flow_from_directory(TRAIN_DIR, **READ_PARAMS)
validation = images_reader.flow_from_directory(VALIDATION_DIR, **READ_PARAMS)

## Volumetría de los datos

El dataset de train y test cuenta con imágenes de escenas naturales de todo el mundo, train contiene 14034 imágenes y el dataset de test cuenta con 3000 imágenes, dando un total de 258 MB train y test juntos.
Las imagenes se dividiran en 6 categorias:

* "buildings": imagenes de edificios
* "forest": imagenes de bosques en diferentes estaciones y ambientes
* "glacier": imagenes de paisajes nevados
* "mountain": imagenes de montañas en distintos ambientes
* "sea": imagenes sobre oceanos y playas
* "street": imagenes de paisaje urbano

In [None]:
def sample_images(dataset):
    plt.figure(figsize=(10, 10))
    images, labels = next(dataset)
    for i in range(9):
        ax = plt.subplot(3, 3, i + 1)
        plt.imshow(images[i])
        plt.title(CATEGORIES[np.argmax(labels[i])])
        plt.axis("off")

In [None]:
sample_images(train)

Decidimos dividir la carpeta de train para crear una carpeta de validation, mediante el uso de un script externo "trainValidationSplit.sh"

## Estructura y tipo de las imágenes

Las diversas imagenes tienen una dimension de 150x150, y todas son del tipo "jpg"

## Distribución de la variable a predecir

Primero contamos con una carpeta "train" que contiene carpetas por cada  categoria de imagen
"buildings":  2191 imagenes
"forest": 2271 imagenes
"glacier": 2404 imagenes
"mountain": 2512 imagenes
"sea": 2274 imagenes
"street": 2382 imagenes

In [None]:
#algun grafico que muestre la distribucion

Mostramos la distribucion del dataset de Validation: 

#validation.show()

# 2. Modelado

### Funciones y variables

In [None]:
# el shape de los inputs es alto_imagen * ancho_imagen * cantidad_colores
input_shape = (SIZE, SIZE, 3)

In [None]:
model_weights_at_epochs = {}

class OurCustomCallback(Callback):
    def on_epoch_end(self, epoch, logs=None):
        model_weights_at_epochs[epoch] = self.model.get_weights()

In [None]:
datasets = (
    ('train', images_reader.flow_from_directory(TRAIN_DIR, **READ_PARAMS, batch_size=-1)),
    ('validation', images_reader.flow_from_directory(VALIDATION_DIR, **READ_PARAMS, batch_size=-1)),
)

def show_confusion_matrix(model):
    for dataset_name, dataset in datasets:
        print('#' * 25, dataset_name, '#' * 25)
    
        batch_images, batch_labels = next(dataset)
        
        # super importante: usamos argmax para convertir cosas de este formato:
        # [(0, 1, 0), (1, 0, 0), (1, 0, 0), (0, 0, 1)]
        # a este formato (donde tenemos el índice de la clase que tiene número más alto):
        # [1, 0, 0, 2]
        predictions = np.argmax(model.predict(batch_images), axis=-1)
        labels = np.argmax(batch_labels, axis=-1)
        
        print('Accuracy:', accuracy_score(labels, predictions))
    
        # graficamos la confussion matrix
        plt.figure(figsize=(3, 4))
            
        plt.xticks([0, 1, 2, 3, 4, 5], CATEGORIES, rotation=45)
        plt.yticks([0, 1, 2, 3, 4, 5], CATEGORIES)
        plt.xlabel('Predicted class')
        plt.ylabel('True class')
    
        plt.imshow(
            confusion_matrix(labels, predictions), 
            cmap=plt.cm.Blues,
            interpolation='nearest',
        )
    
        plt.show()

In [None]:
def compile_summarize(model):
    model.compile(
        optimizer='adam',
        loss='categorical_crossentropy',
        metrics=['accuracy',],
    )
    model.summary()

In [None]:
def accuracy_over_epochs(history):
    plt.plot(history.history['accuracy'], label='train')
    plt.plot(history.history['val_accuracy'], label='validation')
    plt.title('Accuracy over train epochs')
    plt.ylabel('Accuracy')
    plt.xlabel('Epoch')
    plt.legend(loc='upper left')
    plt.show()

In [None]:
def fit_model(model, n_epochs=5):
    return model.fit(
        train,
        epochs=n_epochs,
        batch_size=128,
        validation_data=validation,
        callbacks=[OurCustomCallback()]
    )

### Entrenamientos

#### MLP Simple

In [None]:
# MLP simple
model_mlp = Sequential([
    Input(input_shape),
    
    Flatten(),

    Dense(500, activation='tanh'),
    Dropout(0.25),
    
    Dense(len(CATEGORIES), activation='softmax'),
])

In [None]:
compile_summarize(model_mlp)

In [None]:
history_mlp = fit_model(model_mlp)

In [None]:
accuracy_over_epochs(history_mlp)

In [None]:
model_mlp.set_weights(model_weights_at_epochs[4])

In [None]:
show_confusion_matrix(model_mlp)

#### Convolucional

In [None]:
# Convolucional
model_convolutional = Sequential([
    Input(input_shape),

    Convolution2D(filters=10, kernel_size=(4, 4), strides=1, activation='relu'),
    Dropout(0.25),
    
    Convolution2D(filters=10, kernel_size=(4, 4), strides=1, activation='relu'),
    Dropout(0.25),
    
    MaxPooling2D(pool_size=(4, 4)),
    
    Flatten(),
    
    Dense(100, activation='tanh'),
    Dropout(0.25),
    
    Dense(len(CATEGORIES), activation='softmax'),
])

In [None]:
compile_summarize(model_convolutional)

In [None]:
history_convolutional = fit_model(model_convolutional)

In [None]:
accuracy_over_epochs(history_convolutional)

In [None]:
model_convolutional.set_weights(model_weights_at_epochs[4])

In [None]:
show_confusion_matrix(model_convolutional)

#### Convolucional VGG16

In [None]:
# Convolucional usando convoluciones ya entrenadas de VGG16
pretrained_model = VGG16(input_shape=input_shape, include_top=False)
pretrained_model.trainable = False

model_vgg16 = Sequential([
    pretrained_model,

    Flatten(),

    Dense(100, activation='tanh'),
    Dense(100, activation='tanh'),
    
    Dense(len(CATEGORIES), activation='softmax'),
])

In [None]:
compile_summarize(model_vgg16)

In [None]:
history_vgg16 = fit_model(model_vgg16)

In [None]:
accuracy_over_epochs(history_vgg16)

In [None]:
model_vgg16.set_weights(model_weights_at_epochs[1])

In [None]:
show_confusion_matrix(model_vgg16)

In [None]:
# copia del contenido de la función de la celda anterior para debugging

datasets = (
    ('train', images_reader.flow_from_directory(TRAIN_DIR, **READ_PARAMS, batch_size=-1)),
    ('validation', images_reader.flow_from_directory(VALIDATION_DIR, **READ_PARAMS, batch_size=-1)),
)

for dataset_name, dataset in datasets:
    print('#' * 25, dataset_name, '#' * 25)

    batch_images, batch_labels = next(dataset)
    
    # super importante: usamos argmax para convertir cosas de este formato:
    # [(0, 1, 0), (1, 0, 0), (1, 0, 0), (0, 0, 1)]
    # a este formato (donde tenemos el índice de la clase que tiene número más alto):
    # [1, 0, 0, 2]
    predictions = np.argmax(model_convolutional.predict(batch_images), axis=-1)
    labels = np.argmax(batch_labels, axis=-1)
    
    print('Accuracy:', accuracy_score(labels, predictions))

    # graficamos la confussion matrix
    plt.figure(figsize=(3, 4))
        
    plt.xticks([0, 1, 2, 3, 4, 5], CATEGORIES, rotation=45)
    plt.yticks([0, 1, 2, 3, 4, 5], CATEGORIES)
    plt.xlabel('Predicted class')
    plt.ylabel('True class')

    plt.imshow(
        confusion_matrix(labels, predictions), 
        cmap=plt.cm.Blues,
        interpolation='nearest',
    )

    plt.show()

# 3. Conclusiones

# 4. Competencia

Creación de archivos CSV para la submission

In [None]:
CSV_FILENAME = "ConvolutionalDefault"
MODEL = model

images = []
labels = []

for image in os.listdir(TEST_DIR):
    image_path = os.path.join(TEST_DIR, image)
    image_array = img_to_array(load_img(image_path, target_size=(SIZE, SIZE)))
    images.append(image_array)

inputs = np.array(images) / 255.0

predictions = MODEL.predict(inputs)

for i, filename in enumerate(os.listdir(TEST_DIR)):
    predicted_label = CATEGORIES[np.argmax(predictions[i])]
    labels.append([filename, predicted_label])

df = pd.DataFrame(labels, columns=["ID", "Label"])
df.to_csv(CSV_FILENAME+".csv", index=False)