# Tutorial sobre Deep Learning em Python para iniciantes 

Neste tutorial passo-a-passo de Keras, você vai aprender como construir uma rede neural convolucional (CNN) em Python!

Na verdade, estaremos treinando um classificador de dígitos manuscritos que possui mais de 98% de precisão no famoso banco de dados MNIST.

Antes de começarmos, você deve saber que este guia é voltado para iniciantes que estão interessados em _Deep Learning_ aplicada.

Nosso objetivo é apresentá-lo a uma das bibliotecas mais populares e poderosas para a construção de redes neurais do Python. Isso significa que vamos pular uma grande parte da teoria e da matemática, mas também vamos te indicar recursos excelentes para que você possa aprender sobre esses temas.

## Passo 1: Importar bibliotecas e módulos

Vamos começar importando _NumPy_ e definindo uma seed para o gerador de números pseudoaleatórios do computador. Isso nos permite reproduzir os resultados do nosso script:

In [1]:
# NumPy
import numpy as np
np.random.seed(123) 

A seguir, vamos importar o modelo **Sequential** do Keras. Ou seja, uma pilha linear de camadas de redes neurais, e é perfeito para o tipo de _CNN feed-forward_ que estamos construindo neste tutorial.

In [2]:
# Modelo do Keras
from keras.models import Sequential

Using TensorFlow backend.


Em seguida, vamos importar as camadas principais do Keras. Estas são as camadas que são usadas em praticamente qualquer rede neural:

In [3]:
# Camadas principais do Keras
from keras.layers import Dense, Dropout, Activation, Flatten

Agora vamos importar as camadas CNN do Keras. Estas são as camadas convolucionais que nos ajudarão a treinar eficientemente em dados de imagem:

In [4]:
# Camadas CNN do Keras
from keras.layers import Convolution2D, MaxPooling2D

Finalmente, vamos importar alguns utilitários. Isso nos ajudará a transformar nossos dados mais tarde:

In [5]:
# Utilitários
from keras.utils import np_utils

## Passo 2: Carregar dados de imagens do MNIST 

MNIST é um ótimo banco de dados para começar a aprender profundamente sobre _Deep Learning_ e visão computacional. É um desafio suficientemente grande para necessitar o uso de redes neurais, mas pode ser feito em um único computador.

Convenientemente, a biblioteca Keras também o inclui. Podemos carregá-lo assim:

In [6]:
# Carregando dados do MNIST
from keras.datasets import mnist
 
# Carrega dados já embaralhados do MNIST para os train e test sets.
(X_train, y_train), (X_test, y_test) = mnist.load_data()

Podemos observar a forma do banco de dados:

In [7]:
X_train.shape

(60000, 28, 28)

Ótimo, então parece que temos 60 mil amostras em nosso banco de dados de treino, e essas imagens possuem dimensões de 28 pixels x 28 pixels cada.

Em geral, quando se trabalha com visão computacional, é útil plotar visualmente os dados antes de trabalhar com qualquer algoritmo. É uma verificação rápida que pode evitar erros que são facilmente evitáveis (como uma interpretação errada das dimensões dos dados).

## Passo 3: Pré-processar dados de entrada para o Keras

Ao usar o _backend_ Theano, você deve declarar explicitamente uma dimensão para a profundidade da imagem de entrada. Por exemplo, uma imagem colorida com todos os 3 canais RGB terá uma profundidade de 3.

Nossas imagens MNIST possuem apenas uma profundidade de 1, mas devemos declarar explicitamente isso.

Em outras palavras, queremos transformar nosso conjunto de dados de forma (n, largura, altura) para (n, profundidade, largura, altura).

Veja como podemos fazer isso:

In [8]:
# Remodelando dados de entrada
X_train = X_train.reshape(X_train.shape[0], 28, 28, 1)
X_test = X_test.reshape(X_test.shape[0], 28, 28, 1)

Para confirmar, podemos imprimir novamente as dimensões de **X_train**:

In [10]:
X_train.shape

(60000, 28, 28, 1)

O passo final de pré-processamento dos dados de entrada é converter o nosso tipo de dados para **float32** e normalizar nossos valores de dados para o intervalo [0, 1].

In [11]:
# Convertendo tipo de dados e normalizando valores
X_train = X_train.astype('float32')
X_test = X_test.astype('float32')
X_train /= 255
X_test /= 255

Agora, nossos dados de entrada estão prontos para treinamento de modelo.

## Passo 4: Pré-processar rótulos de classe para o Keras

Em seguida, vamos dar uma olhada no formato dos nossos _labels_ (rótulos) de dados da classe:

In [12]:
y_train.shape

(60000,)

Hmm ... temos um problema. Deveríamos ter 10 classes diferentes, uma para cada dígito, mas parece que só temos um _array_ de 1 dimensão. Vamos dar uma olhada nos _labels_ das primeiras 10 amostras de treinamento:

In [13]:
y_train[:10]

array([5, 0, 4, 1, 9, 2, 1, 3, 1, 4], dtype=uint8)

Aí está o problema. Os dados **y_train** e **y_test** não estão divididos em 10 _labels_ de classe distintos, mas estão sendo representados por um único _array_ com os valores da classe.

Podemos resolver isso facilmente:

In [18]:
# Convertendo arrays unidimensionais para matrizes de 10 dimensões
Y_train = np_utils.to_categorical(y_train, 10)
Y_test = np_utils.to_categorical(y_test, 10)

Agora podemos dar uma outra olhada:

In [19]:
Y_train.shape

(60000, 10)

Aí sim, muito melhor!

## Passo 5: Definir a arquitetura do modelo

Agora estamos prontos para definir nossa arquitetura do modelo. Num trabalho real de P&D (Pesquisa e Desenvolvimento), os pesquisadores passarão uma quantidade considerável de tempo estudando arquiteturas de modelos.

Para não travar nosso andamento, não vamos discutir a teoria ou a matemática aqui.

Além disso, quando você está apenas começando, você pode apenas replicar arquiteturas comprovadas de documentos acadêmicos ou usar exemplos existentes. Aqui está uma lista de [exemplos de implementações em Keras](https://github.com/fchollet/keras/tree/master/examples).

Vamos começar por declarar um formato de modelo seqüencial:

In [20]:
# Declarando modelo "Sequential"
model = Sequential()

Em seguida, declaramos a camada de entrada:

In [21]:
# Camada de entrada da CNN
model.add(Convolution2D(32, (3, 3), activation='relu', input_shape=(28,28,1)))

O parâmetro de entrada do formato deve possuir o formato de 1 amostra. Neste caso, é o mesmo (28, 28, 1) que corresponde à (largura, altura, profundidade) de cada imagem de dígito.

Mas o que representam os três primeiros parâmetros? Eles correspondem ao número de linhas em cada núcleo de convolução, o número de colunas em cada núcleo de convolução e o número de filtros de convolução a se usar, respectivamente.

* Nota: O tamanho do passo é (1,1) por definição, e pode ser ajustado usando o parâmetro '_subsample_'.

Podemos confirmar isso imprimindo a forma da saída atual do modelo:

In [22]:
model.output_shape

(None, 26, 26, 32)

Em seguida, podemos simplesmente adicionar mais camadas ao nosso modelo, como se estivéssemos construindo legos:

In [23]:
model.add(Convolution2D(32, (3, 3), activation='relu'))
model.add(MaxPooling2D(pool_size=(2,2)))
model.add(Dropout(0.25))

Mais uma vez, não vamos entrar demais na teoria, mas é importante destacar a camada **Dropout** que acabamos de adicionar. Este é um método para regularizar o nosso modelo de modo a evitar a superposição. Você pode ler mais sobre isso [aqui](https://www.quora.com/How-does-the-dropout-method-work-in-deep-learning-And-why-is-it-claimed-to-be-an-effective-trick-to-improve-your-network).

O **MaxPooling2D** é uma maneira de reduzir o número de parâmetros em nosso modelo, passando um filtro de agrupamento 2x2 na camada anterior e pegando valor o máximo dos 4 valores do filtro 2x2.

Até agora, para os parâmetros do modelo, adicionamos duas camadas de convolução. Para completar a arquitetura do nosso modelo, vamos adicionar uma camada totalmente conectada e depois a camada de saída:

In [24]:
# Camadas profundas totalmente conectadas
model.add(Flatten())
model.add(Dense(128, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(10, activation='softmax'))

Para camadas densas, o primeiro parâmetro é o tamanho da saída (_output size_) da camada. O Keras administra automaticamente as conexões entre as camadas.

Observe que a camada final possui saídas com tamanho 10, que correspondem às 10 classes de dígitos.

Observe também que os pesos das camadas de convolução devem ser achatados (transformados em unidimensionais) antes de serem passados para a camada densa completamente conectada.

Agora, tudo o que precisamos fazer é definir a função de perda e o otimizador, e então estaremos prontos para treiná-lo.

## Passo 6: Compilar o modelo

Agora estamos quase lá! A parte difícil já acabou.

Nós precisamos apenas compilar o modelo e estaremos prontos para treiná-lo. Quando compilamos o modelo, declaramos a função de perda e o otimizador (SGD, Adam, etc.).

In [25]:
# Compilando modelo
model.compile(loss='categorical_crossentropy',
              optimizer='adam',
              metrics=['accuracy'])

O Keras possui uma variedade de [funções de perda](https://keras.io/losses/) e [otimizadores](https://keras.io/optimizers/) à disposição.

## Passo 7: Adequar o modelo aos dados de treino

Para adequar o modelo, tudo que precisamos fazer é declarar o tamanho do lote (batch_size) e o número de épocas (epochs) a serem treinados, e depois passá-los no dados de treino.

In [26]:
# Adequando modelo do Keras
model.fit(X_train, Y_train, 
          batch_size=75, epochs=5, verbose=1)
# Epoch 1/10
# 7744/60000 [==>...........................] - ETA: 96s - loss: 0.5806 - acc: 0.8164

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x7ff5eda12b38>

Fácil, não?

Você também pode usar uma variedade de [callbacks](https://keras.io/callbacks/) para definir regras de parada antecipada, salvar os pesos do modelo ao longo do caminho ou registrar o histórico de cada período de treinamento.

## Passo 8: Avaliar modelo com os dados de treino

Finalmente, podemos avaliar o nosso modelo com os dados para testes:

In [28]:
# Avaliando modelos do Keras
score = model.evaluate(X_test, Y_test, verbose=0)
score

[0.030081725770416234, 0.99060000000000004]

Parabéns ... você chegou ao final deste tutorial de Keras!

Acabamos de concluir um tour com um turbilhão de funcionalidades do Keras, mas nós apenas tocamos o começo. Espero que você tenha adquirido as bases para explorar ainda mais o que o Keras tem a oferecer.