## Deep Learning + Colaboratory

### “Colaboratory is a Google research project created to help disseminate machine learning education and research. It's a Jupyter notebook environment that requires no setup to use and runs entirely in the cloud.”

<i>Utilizando a ferramenta Colaboratory para criar projetos de machine learning.</i>

<b>Dados utilizados:</b> 

Dataset of handwritten digits - MNIST ("Modified National Institute of Standards and Technology").

Cada imagem, em tons de cinza, possui definição de 28x28 pixels, totalizando 784 pixels. Cada pixels é representado por um valor, que varia entre 0 e 255, e indica o quão claro ou escuro é esse pixel.

Os dados utilizados podem ser encontrados <a href = 'https://www.kaggle.com/c/digit-recognizer'> aqui</a>.
                                      
<img src="digit.png" height="212" width="400">                                       

### O problema!

Você já tentou treinar uma rede neural artificial (RNA) um pouco mais complexa (no contexto deep learning, convolutional neural network) no seu notebook? Eu já. E essa experiência não foi muito agradável. Horas a esperar o resultado, para constatar que poderia ter modificado um parâmetro, ou mudado alguma coisa. Ao tentar obter melhores resultados a rede fica mais complexa, e o tempo de treinamento torna o projeto inviável. 

Foi esse o cenário que me deparei ao tentar utilizar uma RNA um pouco mais elaborada para realizar a identificação de dígitos manuscritos. 

Iniciei uma pesquisa para tentar resolver meu problema. A melhor opção que encontrei foi a ferramenta disponibilizada pelo Google, chamada Colaboratory. 


### Mas o que é o Colaboratory?

Como explica o texto de introdução, Colaboratory é um projeto criado para auxiliar o estudo e pesquisa em aprendizado de máquinas, no qual você tem acesso a uma GPU de 80K! E o melhor....de graça.

O projeto é baseado no Jupyter Notebook, rodando completamente em nuvem, de simples utilização, mas com resultados animadores. 


### Objetivos

Como foi falado, esse pequeno tutorial terá como objetivo auxiliar no desenvolvimento de um projeto utilizando a ferramenta Colaboratory. Os dados utilizados são bem conhecidos e exigem pouco pré-processamento. O resultado poderia ser melhorado? Sim. Mas o objetivo principal aqui é mostrar o funcionamento da ferramenta Colab, de forma que você possa aplicá-la em seus projetos pessoais. 

### Ao trabalho!

Ao pesquisar por Google Colaboratory você será direcionado à página inicial do projeto:

<img src="fig1.png" height="150" width="300">

Ao clicar em “GO to Colaboratory” você será direcionado para a página de acesso do Gmail.  Ao entrar com sua senha, você já estará no Colaboratory.

<img src="fig2.png" height="250" width="300">

Agora, o processo é bem simples: File > New Python 3 notebook.

<img src="fig3.png" height="250" width="300">

E voilà...temos um novo notebook!

<img src="fig4.png" height="600" width="800">

Após a criação do notebook você poderá fazer as modificações iniciais de costume como alterar nomes, modificar aparência, etc.

Vamos agora acrescentar a GPU ao nosso notebook. O processo é simples: Runtime > Change runtime type . 


<img src="fig5.png" height="300" width="400">

Em “Notebook settings” você mudará o “Hardware accelerator”, de “None”, para “GPU”. Após realizar essas operações clique em “Save”, e já temos uma ótima GPU para o nosso trabalho.

<img src="fig6.png" height="400" width="500">

Agora temos que realizar uma pequena operação que vai nos salvar de muita dor de cabeça. Não se preocupe, é rápido.

Se você está trabalhando com data science, com certeza você precisará de um dataset. Como todo o nosso trabalho está em nuvem, teremos que perder algum tempo para fazer o upload desses dados.  

Esse processo pode ser feito com o auxílio do código fornecido nas páginas iniciais do Colaboratory:


In [None]:
from google.colab import files

uploaded = files.upload()

for fn in uploaded.keys():
  print('User uploaded file "{name}" with length {length} bytes'.format(
      name=fn, length=len(uploaded[fn])))

Ao rodar esse código poderemos escolher os arquivos, fazer o upload e trabalhar com os dados. O problema é que teríamos que refazer esse processo toda vez que o notebook fosse reiniciado. E você sabe que subir dados pode ser um processo demorado. E não temos muito tempo para perder. 

Em minhas pesquisas descobri uma melhor forma de trabalho. Na realidade eu fiz um pequeno Frankenstein: copiando um pedaço de código aqui...outro ali....e assim foi. Vamos a isso.

Como nosso projeto no Colab fica guardado no Google Drive, vamos criar uma pasta no nosso Drive e vamos guardar nessa pasta nosso notebook e todos os nossos dados. Vamos criar uma “conexão” entre nosso notebook e nossos dados, que estarão disponíveis para todo o sempre depois de feito o upload.


Rodando o seguinte código, você instalará o “FUSE wrapper”, necessário para os próximos passos.

In [None]:
# Instalando o Drive FUSE wrapper.
# https://github.com/astrada/google-drive-ocamlfuse
!apt-get install -y -qq software-properties-common python-software-properties module-init-tools
!add-apt-repository -y ppa:alessandro-strada/ppa 2>&1 > /dev/null
!apt-get update -qq 2>&1 > /dev/null
!apt-get -y install -qq google-drive-ocamlfuse fuse

A seguir você deverá rodar o seguinte código que criará um “token” de conexão.

In [None]:
# Generate auth tokens for Colab
from google.colab import auth
auth.authenticate_user()

<img src="fig8.png" height="200" width="300">

<img src="fig7.png" height="400" width="500">

Ao clicar no link, você será direcionado ao seu e-mail, e ao entrar com a senha, você será direcionado a uma página que pede acesso ao seu Drive. Pode aceitar sem medo.

Ao clicar em “Permitir”, o sistema criará uma senha de acesso:

<img src="fig9.png" height="400" width="500">

Você vai copiar esse código e colar lá no seu do notebook.

Agora você fará o mesmo processo com o seguinte código:

In [None]:
# Generate creds for the Drive FUSE library.
from oauth2client.client import GoogleCredentials
creds = GoogleCredentials.get_application_default()
import getpass
!google-drive-ocamlfuse -headless -id={creds.client_id} -secret={creds.client_secret} < /dev/null 2>&1 | grep URL
vcode = getpass.getpass()
!echo {vcode} | google-drive-ocamlfuse -headless -id={creds.client_id} -secret={creds.client_secret}

Ao permitir o acesso, novo token será criado, e ao entrar com esse passe você terá a seguinte saída: <b> Access token retrieved correctly.</b>

Por fim esses últimos comandos nos permitem acesso ao nosso drive.   

In [None]:
# Create a directory and mount Google Drive using that directory.
!mkdir -p drive
!google-drive-ocamlfuse drive

Agora sim! A conexão entre o seu programa e seus arquivos já foi estabelecida. Você já pode trabalhar. O processo parece complicado, mas não é. O código já está todo pronto, você não precisa modificar nada, e tudo pode ser feito em menos de 2 minutos. 

Lá no Google Drive eu vou criar uma nova pasta, e vou fazer o upload de todos dos dados que eu preciso.

Bom... a minha pasta chama-se <b>Digit_recognition</b>, e nessa pasta eu guardei os arquivos “<b>train</b>” e “<b>test</b>”.




<img src="fig10.png" height="200" width="300">

Posso verificar quais arquivos estão presentes em meu drive com o comando:

In [None]:
print ("Files in my drive:")
!ls drive/

<img src="fig11.png" height="500" width="600">

Lá está nossa pasta! 

Agora, com tudo pronto, todas as conexões estabelecidas, e todos os dados disponíveis....vamos ao que interessa... <i>let’s have some fun!!</i>

### Trabalhando com os dados

Como foi falado anteriormente, o objetivo aqui é mostrar como utilizar o Colaboratory. Não vou entrar em maiores detalhes sobre técnicas de machine learning. Isso fica para uma próxima oportunidade.

As principais bibliotecas utilizadas em data science já estão presentes no Colab. O restante você poderá instalar de forma muito fácil utilizando “pip” do Python. “A única diferença é que se deve acrescentar o símbolo <b>"!"</b> antes de cada comando”. 

Vamos agora carregar os dados que estão na pasta Digit_recognition:


In [None]:
import pandas as pd

train = pd.read_csv('drive/Digit_recognition/train.csv', encoding = 'utf8') 
test = pd.read_csv('drive/Digit_recognition/test.csv', encoding = 'utf8')

Vamos observar nossos dados:

In [None]:
import matplotlib.pyplot as plt
# Plotar alguns valores do banco de dados:
X_train = X_train.reshape(X_train.shape[0], 28, 28)

plt.subplot(221)
plt.imshow(X_train[3], cmap=plt.get_cmap('gray'))
plt.subplot(222)
plt.imshow(X_train[1], cmap=plt.get_cmap('gray'))
plt.subplot(223)
plt.imshow(X_train[8], cmap=plt.get_cmap('gray'))
plt.subplot(224)
plt.imshow(X_train[9], cmap=plt.get_cmap('gray'))

plt.show()

<img src="fig12.png" height="300" width="400">

Nosso classificador será desenvolvido com o auxílio do Keras, que é uma high-level neural network API. É Uma forma mais fácil de desenvolver protótipos em deep learning, CNNs, etc.

<img src="fig13.png" height="300" width="400">

Se você não conhece o Keras vale a pena conferir <a href =  https://keras.io/> aqui </a>

Utilizando o comando <b>”!pip”</b> instalamos o Keras, com backend tensorflow. Se você prefere trabalhar com o theano, a troca é simples.

In [None]:
!pip install keras

<img src="fig14.png" height="500" width="600">

Nosso banco de dados é composto por imagens de caracteres manuscritos de 28x28 pixels, em tons de cinza. Essas imagens foram rearranjadas em vetores com 784 elementos. 

Para adequar esses dados ao nosso classificador vamos realizar alguns processos básicos: normalizar, codificar e dividir o dataset em conjunto de treino e teste.

Uma observação: como esses dados serão utilizados em uma competição (kaggle), nós vamos dividir o conjunto de treino em treino e teste. O conjunto de testes <i>"pra valer"</i> será deixado para criar o arquivo final de submissão. Você não sabe como funcionam essas competições? Olhe <a href = https://www.kaggle.com/> aqui</a>


In [None]:
# Transformando os dados:
X_train = (train.ix[:,1:].values).astype('float32') 
y_train = train.ix[:,0].values.astype('int32') 
X_test = test.values.astype('float32')

In [None]:
# Separando o banco de dados em treino e teste
from sklearn.model_selection import train_test_split
train_X, test_X, train_y, test_y = train_test_split(X_train, y_train, test_size=0.20,random_state=0)

In [None]:
# Normalizando os dados: de 0-255 para 0-1
train_X = train_X / 255
test_X = test_X / 255

In [None]:
# Codificando o y:
from keras.utils import np_utils
train_y = np_utils.to_categorical(train_y)
test_y = np_utils.to_categorical(test_y)
num_classes = test_y.shape[1]

### Criando nossa rede neural convolucional (CNN)

Com os dados prontos, vamos iniciar o modelo de nossa rede neural convolucional (CNN). Vamos começar com uma rede mais simples:

In [None]:
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers import Dense
from keras.layers import Dropout

In [None]:
# Projetando a CNN:
import numpy as np
seed = 5
np.random.seed(seed)

In [None]:
# Modelo 1:
num_pixels = train_X.shape[1]
def model_1():
    model = Sequential()
    model.add(Dense(num_pixels, input_dim=num_pixels, kernel_initializer='normal', activation='relu'))
    model.add(Dense(num_classes, kernel_initializer='normal', activation='softmax'))
    model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])
    return model

Vamos treinar e avaliar esse modelo:

In [None]:
# Rodando modelo_1:
model = model_1()
model.fit(train_X, train_y, validation_data=(test_X, test_y), epochs=10, batch_size=200, verbose=2)
# Avaliando o modelo:
scores = model.evaluate(test_X, test_y, verbose=0)
print("Erro: %.2f%%" % (100-scores[1]*100))

No meu PC, que já está cansado, esse modelo demorou um pouco. Aqui a história é outra:

<img src="fig15.png" height="400" width="500">

Em poucos segundo o processo termina.

Bom...já temos um erro pequeno, em comparação com outros classificadores. Vamos implementar uma rede um pouco mais elaborada e ver o resultado:

In [None]:
from keras.layers import Flatten
from keras.layers.convolutional import Conv2D
from keras.layers.convolutional import MaxPooling2D
from keras import backend as K
K.set_image_dim_ordering('th')

In [None]:
def model_2():
    model = Sequential()
    model.add(Conv2D(32, (5, 5), input_shape=(1, 28, 28), activation='relu'))
    model.add(MaxPooling2D(pool_size=(2, 2)))
    model.add(Dropout(0.2))
    model.add(Flatten())
    model.add(Dense(128, activation='relu'))
    model.add(Dense(num_classes, activation='softmax'))
    model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])
    return model

Preparando os dados:

In [None]:
train_X = train_X.reshape(train_X.shape[0], 1, 28, 28).astype('float32')
test_X = test_X.reshape(test_X.shape[0], 1, 28, 28).astype('float32')

In [None]:
# Rodando modelo_2:
model = model_2()
model.fit(train_X, train_y, validation_data=(test_X, test_y), epochs=10, batch_size=200, verbose=2)
# Avaliando o modelo:
scores = model.evaluate(test_X, test_y, verbose=0)
print("Error: %.2f%%" % (100-scores[1]*100))

Treinando e avaliando esse modelo, teremos o seguinte resultado:

<img src="fig16.png" height="400" width="500">

Pode-se observar que o erro cai de 2,27% para 1,35% das classificações. Muito bom.

Para terminar, vamos tentar uma CNN mais complexa:

In [None]:
def model_3():
    model = Sequential()
    model.add(Conv2D(30, (5, 5), input_shape=(1, 28, 28), activation='relu'))
    model.add(MaxPooling2D(pool_size=(2, 2)))
    model.add(Conv2D(15, (3, 3), activation='relu'))
    model.add(MaxPooling2D(pool_size=(2, 2)))
    model.add(Dropout(0.2))
    model.add(Flatten())
    model.add(Dense(128, activation='relu'))
    model.add(Dense(50, activation='relu'))
    model.add(Dense(num_classes, activation='softmax'))
    model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])
    return model

In [None]:
# Rodando modelo_3:
model = model_3()
model.fit(train_X, train_y, validation_data=(test_X, test_y), epochs=10, batch_size=200)
# Avaliando o modelo:
scores = model.evaluate(test_X, test_y, verbose=0)
print("Large CNN Error: %.2f%%" % (100-scores[1]*100))

<img src="fig17.png" height="600" width="700">

Como é possível verificar, os resultados foram obtidos em poucos segundos.  Todo esse processo demoraria uma eternidade em meu PC, e no Colab a coisa terminou em segundos. Muito bom!

O erro final foi de 1,29%, e esse ultimo modelo será usado para criar o arquivo csv final. 

### Criando o arquivo de submissão 

Rodando esse pequeno código a seguir, nós criaremos um arquivo .csv que será armazenado na mesma pasta de nosso projeto, 
no Google drive. Agora é só baixar esse arquivo e submeter à competição. 

In [None]:
X_test = X_test/255
X_test = X_test.reshape(X_test.shape[0], 1, 28, 28).astype('float32')

In [None]:
model = model_3()
predictions = model.predict_classes(X_test, verbose=0)

submissions=pd.DataFrame({"ImageId": list(range(1,len(predictions)+1)),
                         "Label": predictions})
submissions.to_csv("drive/submissions_27_02.csv", index=False)

### Conclusão

Esse pequeno tutorial mostrou como configurar e trabalhar com o google Colaboratory. Demonstrou como fazer a conexão entre o Colaboratory e o Google Drive, e como instalar algumas importantes ferramentas. 

Espero ter ajudado de alguma forma. Para mim essa ferramenta foi de grande valia. O projeto poderia ser melhorado, muitos conceitos e técnicas poderiam ser aplicados para melhorar o resultado, mas o tutorial perderia um pouco o foco, e ficaria muito extenso. 

Se você não compreendeu algum ponto, ou gostaria de acrescentar alguma coisa, Fique a vontade para me escrever. Até a próxima.


### Referências

* https://machinelearningmastery.com/handwritten-digit-recognition-using-convolutional-neural-networks-python-keras/

* https://www.kaggle.com/serigne

* https://paulovasconcellos.com.br/como-criar-seu-primeiro-projeto-de-data-science-parte-2-de-2-cb9a2fe05eff