# Trabalho #1 - Biblioteca de dados e RNAs pré-treinadas

Nesse trabalho você vai criar e treinar uma RNA, usando como base uma rede pré-treinada, para resolver um problema de classificação multiclasse.

Para fazer isso você usará os vetores de características da RNA EfficientNet e um conjunto de dados de imagens de satélite para treinar uma nova RNA para classificar tipos de áreas a partir de imagens de satélites. 


## Coloque o seu nome aqui:

Nome:

## 1. Importar bibliotecas

Execute a célula abaixo para importar as bilbiotecas necessárias.

In [None]:
import tensorflow as tf
print("Using TensorFlow Version:", tf.__version__)

import tensorflow_datasets as tfds
import tensorflow_hub as hub
import matplotlib.pyplot as plt
import numpy as np

## 2. Carregar dados do TensorFlow Data Service (TFDS)

O conjunto de dados EuroSAT é baseado nas imagens do satélite Sentinel-2 e consiste de 27.000 imagens coloridas de dimensão 64x64x3 com 10 classes.  

Dois conjuntos de dados são disponibilizados: (1) eurosat/rgb que contém imagens no formato RGB, que é o que usaremos; e (2) eurosat/all com imagens de 13 canais diferentes.


### Exercício #1: Carregar dados

A primeira etapa é carregar as imagens. Esse conjunto de dados está disponível no TFDS com o nome `eurosat/rgb`. Os dados estão em um único conjunto de nome "train" e, portanto precisam ser divididos em pelo menos dois conjuntos: dados de treinamento e de validação.

Na célula abaixo inclua o seu código para carregar esse conjunto de dados. Mais detalhes de como carregar esse dados podem ser vistos em https://www.tensorflow.org/datasets.

Ao carregar os dados, use o argumento `split` com porcentagens para separar os dados em dois conjuntos: dados de treinamento (80% dos dados) e de validação (20% dos dados). Para obter maiores detalhes de como usar o  método `tfds.load` pode ser obtido em https://www.tensorflow.org/datasets/splits.

In [None]:
# Carrega dados do TFDS
# Inclua seu código aqui
train_data, info = 
val_data =

Execute a célula abaixo para visualizar as informações sobre esse o conjunto de dados `eurosat/rgb`. 

In [None]:
info

Verifique o número de exemplos de treinamento e de validação executando a célula abaixo.

In [None]:
print('Número exemplos de treinamento =', len(list(train_data)))
print('Número exemplos de treinamento =', len(list(val_data)))

**Saída esperada:**

    Número exemplos de treinamento = 21600
    Número exemplos de treinamento = 5400

Execute a célula abaixo para definir a lista com os nomes das classes existentes no conjutno de dados.

In [None]:
labels_list = ['AnnualCrop', 'Forest', 'HerbaceousVegetation', 'Highway', 'Industrial',
               'Pasture', 'PermanentCrop', 'Residential', 'River', 'SeaLake']
print(labels_list)

### Exercíco #2: Visualização dos dados

Na célula abaixo escreva um código para obter 5 exemplos dos dados de treinamento e visualizá-los juntamento com os nomes (`labels_list`) e números das classes.

Para fazer isso você vai precisar de um laço `for`, dos comandos `print`, `plt.imshow()`, `plt.show()`, e do método `take()`. 

In [None]:
# Itera no conjunto de dados pegando exemplos
for data in train_data.take(5):
# Inclua seu código aqui

**Exemplo de saída esperada (sem as figuras):**

    Classe: Industrial - 4
    Classe: River - 8
    Classe: River - 8
    


## 3. Processamento dos dados

Após carregar os dados, você tem que processá-los para poderem ser usados pela RNA.

O módulo de vetores de características da EfficientNet permite que as imagens tenham em princípio qualquer dimensão, assim, não é necessário redimensionar as imagens. Porém, os valores dos pixels devem estar entre 0 e 1, conforme mencionado nas instruções de uso desse módulo, que podem ser vistas em https://tfhub.dev/tensorflow/efficientnet/b0/feature-vector/1. 

### Exercício #3: Normalização das imagens

Na célula abaixo escreva um código para normalizar um lote de imagens e depois crie os lotes de dados de treinamento e de validação. A normalização deve transformar os valores dos pixels das imagens para números reais entre 0 e 1.

Conforme vimos na aula, ao importar os dados do TF Data Services, os dados são armazenados em objetos e para podermos usar esses dados de forma eficiente temos que usar os métodos fornecidos para esse tipo de objeto.

Para normalizar as imagens crie uma função de nome `format_image` e a utilize chamando o método `map()`. Para normalizar os dados você vai precisar primeiramente transformá-los em `float32`, para isso use a função do TensorFlow `tf.cast()`. As instruções de uso dessa função podem ser vistas em https://www.tensorflow.org/api_docs/python/tf/cast.

In [None]:
# Definição da dimensão das imagens para processamento e do tamanho dos lotes de dados
# Inclua seu código aqui
IMAGE_SIZE = 
BATCH_SIZE = 

# Função usada para redimensionar e normalizar as imagens
def format_image(image, label):
    # Inclua seu código aqui )
    

# Cria lotes de dados usando o método map() para chamar a função format_image()
# Inclua seu código aqui
train_batches = 
val_batches = 

train_batches

**Saída espeada:**

    <DatasetV1Adapter shapes: ((None, 64, 64, 3), (None,)), types: (tf.float32, tf.int64)>

## 4.  Criação da RNA

Nesse trabalho você vai criar e treinar uma RNA para identificar tipos de áreas a partir de imagens do satélite Sentinel-2.

Para isso você vai criar uma RNA usando como base o módulo de vetor de características da rede EfficientNet, que foi treinada com as imagens da ImageNet. 

As redes EfficientNets são utilizadas para classificar imagens e apresentam um desempenho similar a outras redes mais conhecidas, porém, possui um número muito menor de parâmetros e é muito mais rápida. O trabalho que originou essa RNA é 
Mingxing Tan and Quoc V. Le: EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks, ICML 2019. 

### Exercício #4: Carregar vetor de características do TF-Hub

Na célula abaixo crie um código que importa o módulo de vetores de características da EfficientNet e o coloca no objeto `feature_extractor`. Essa rede estão no TF-Hub e as informações de como usá-la podem ser obtidas no link https://tfhub.dev/tensorflow/efficientnet/b0/feature-vector/1.

Pra fazer isso você vai precisar definir a dimensão do tensor de entrada da rede usando o argumento `input_shape` e a função `hub.KerasLayer()`.

In [None]:
# Dimensão das imagens para argumento input_shape
# Inclua seu código aqui 
IMAGE_DIM = 

# Carrega vetores de características com a URL do módulo
# Inclua seu código aqui 
MODULE_HANDLE =
feature_extractor = 
feature_extractor

**Saída espeada:**

    <tensorflow_hub.keras_layer.KerasLayer at 0x7ff58df7ae48>

### Exercício #5: Criação da RNA como o Keras

Na célula abaixo crie um código que incorpora o `feature_extractor`, criado no exercício #4, em uma rede sequencial do Keras para realizar a tarefa de classificação multiclasse com 10 classes.

Após criar a RNA utilize o método `summary()` para apresentá-la.

In [None]:
# Número de classes da RNA
# Inclua seu código aqui 
NUM_CLASSES 

# Cria modelo seguencial do Keras para problema de classificação com 10 classes
# Inclua seu código aqui 


# Apresenta configuração da RNA
# Inclua seu código aqui 



**Saída esperada:**

    Model: "sequential"
    _________________________________________________________________
    Layer (type)                 Output Shape              Param #   
    =================================================================
    keras_layer (KerasLayer)     (None, 1280)              4049564   
    _________________________________________________________________
    dense (Dense)                (None, 10)                12810     
    =================================================================
    Total params: 4,062,374
    Trainable params: 12,810
    Non-trainable params: 4,049,564
    _________________________________________________________________

## 5. Compilação e treinamento da RNA

Como visto em aula, o treinamento da RNA deve ser realizado de forma que somente os parâmetros da camada densa, adicionada ao extrator de características, sejam alterados durante o treinamento. Isso é necessário para não destrui a parte da RNA que corresponde à EfficientNet, que já foi previamente treinada com um conjunto de centenas de milhares de imagens. Assim, você tem que "congelar" os parâmetros do extrator e características.

### Exercício #6: Compilação da RNA

Na célula abaixo crie um código que congela os parâmetros do `feature_extractor` e compila a RNA usando os seguintes parâmetros:

- Método de otimização: Adam;
- Fução de custo: `sparse_categorical_crossentropy`;
- Métrica: `accuracy`.

In [None]:
# Congela parâmetros da MobiliNet
# Inclua seu código aqui 


# Define método de otimização
# Inclua seu código aqui 


# Compila RNA
# Inclua seu código aqui 



### Exercício #7: Treinamento da RNA

O treinamento da RNA deve ser realizado com o método `fit` e os dados de treinamento e validação são fornecidos por meio dos objetos `train_batches` e `val_batches`. 

Na célula abaixo crie um código que realiza o treinameto da RNA usando 10 épocas de treinamento. 

In [None]:
# Define número de épocas de treinamento
# Inclua seu código aqui 


# Realiza o treinamento usando os dados de treinamento e validação
# Inclua seu código aqui (~1 comando)



**Saída esperada:**

    Epoch 1/10
    675/675 [==============================] - 13s 19ms/step - loss: 0.5030 - accuracy: 0.8542 - val_loss: 0.3120 - val_accuracy: 0.9002
    .
    .
    .
    Epoch 10/10
    675/675 [==============================] - 12s 18ms/step - loss: 0.1355 - accuracy: 0.9574 - val_loss: 0.2189 - val_accuracy: 0.9244   

### Exercício #8: Resultados do treinamento

Na célula abaixo crie um código que apresenta os resultados do treinamento em função das épocas. Você deve fazer dois gráficos:

1. Valores da função de custo para os dados de treinamento e de validação;
2. Valores da métrica para os dados de treinamento e de validação.

In [None]:
# Definir vetores com valores da função de custo e da métrica para os dados de treinamento e de validação
# Inclua seu código aqui 


# Criar vetor de épocas
# Inclua seu código aqui 


# Fazer o gráfico dos valores da função de custo
# Inclua seu código aqui 



# Fazer o gráfico dos valores da métrica
# Inclua seu código aqui 



## 6.4 Teste da RNA

Após o treinamento é necessário verificar o desempenho da RNA. paar isso vamos calcular os valores da função de custo e da métrica para as imagens do conjunto de validação e depois vamos usar o método `predict` para prever as classes de algumas imagens.

O código da célula abaixo calcula o resultado da função de custo e da exatidão para os exemplos validação usando o método `evaluate`.

### Exercício #9: Avaliação do desempenho da RNA

Na célula abaixo determine o desemepnho da RNA usando o método `evaluate` para calcular o valor da função d ecusto e da métrica para os dados de validação.

In [None]:
# Avalia desempenho da RNA para os dados de validação
# Inclua seu código aqui 


# Apresenta os resultados
# Inclua seu código aqui


**Saída esperada:**

    loss: 0.2189
    accuracy: 0.9244

### Exercício #10: Teste de classificação de imagens

Para poder fornecer as imagens para a RNA usando o método `predict` você precisa extrai-las do objeto `val_data` e processá-las com a função `format_image`, que por sua vez é chamada pelo método `map()`. Além disso, você tem que incluir o eixo dos exemplos na imagem de acordo com o esperado por uma RNA do Keras.

Na célula baixo crie um código que calcula as classes previstas para os 5 primeiros exemplos do conjunto de validação usando o método `predict` e apresenta os resultados junto com as imagens e as classes previstas e reais.

In [None]:
# Itera no objeto val_data para pegar 5 imagens e aplica função format_image
# Inclua seu código aqui (~1 linha)
for data in val_data.map(format_image).take(5):
    
    # Extrai imagem e classe prevista
    # Inclua seu código aqui 

    # Adiciona eixo dos exemplos
    # Inclua seu código aqui 


    # Calcula probabilidades previstas pela RNA
    # Inclua seu código aqui

    
    # Determina classe prevista
    # Inclua seu código aqui 


    # Apresenta resultados das classes e mostra imagem
    # Inclua seu código aqui


**Saída esperada (sem incluir as imagens):**

    Classe prevista = Industrial , Classe real = Industrial
    Classe prevista = AnnualCrop , Classe real = AnnualCrop
    Classe prevista = HerbaceousVegetation , Classe real = HerbaceousVegetation
    Classe prevista = River , Classe real = River
    Classe prevista = Residential , Classe real = Residential