# Rede Neural Convolucional
## Reconhecimento e distinção de imagens de gatos e cachorros
### Este notebook traz a elaboração de uma rede neural convolucional com camadas Convolucionais, Pooling e Fully Connected. A máquina recebe instruções de Deep Learning, com treinamento, para reconhecimento e distinção de imagens de cachorros e gatos.
### Ao fim, o modelo é salvo em um banco de dados do MongoDB.

### Imports

In [None]:
#Dependências (já instaladas)
#!pip install pymongo
#!pip install opencv-python
#!pip install tflearn

### Definições e criação da rede neural

In [None]:
import cv2 #Trabalhar com imagens (converte imagens em Array)
import numpy as np 
import os #Trabalhar com gerenciamento de arquivos
from random import shuffle 
from tqdm import tqdm #Barrinha de carregamento
from pymongo import MongoClient

TRAIN_DIR = 'dataset/train'
TEST_DIR = 'dataset/test'

IMG_SIZE = 50

LR = 1e-3 #Learning Rate: 0.001 (1∗10−3=1∗1103=1∗11000 = 0.001) 

MODEL_NAME = 'dogsvscats'

In [None]:
def label_img(img):
    word_label = img.split('.')[-3] #Pegando o prefixo do nome da imagem
    if word_label == 'cat':
        return [1,0] #Label 1,0 = "Completamente" gato
    else:
        return [0,1] #Label 0,1 = "Completamente" cachorro


In [None]:
def create_train_data():
    training_data = []
    for img in tqdm(os.listdir(TRAIN_DIR)):
        label = label_img(img)#Dando [1,0] ou [0,1] para as imagens
        path = os.path.join(TRAIN_DIR, img) #Caminho completo da imagem
        img = cv2.resize(cv2.imread(path, cv2.IMREAD_GRAYSCALE), (IMG_SIZE, IMG_SIZE)) #Resize de 50x50, deixando em escala de cinza
        training_data.append([np.array(img), np.array(label)]) #Salva em lista, formato Numpy Array
    shuffle(training_data)
    np.save('train_data.npy', training_data) #Salva dados
    return training_data        

In [None]:
def process_test_data():
    testing_data = []
    for img in tqdm(os.listdir(TEST_DIR)):
            path= os.path.join(TEST_DIR, img)
            img_num = img.split('.')[0] #Renomea os arquivos para deixar apenas os números
            img = cv2.resize(cv2.imread(path, cv2.IMREAD_GRAYSCALE), (IMG_SIZE, IMG_SIZE), cv2.INTER_AREA)#Resize de 50x50, deixando em escala de cinza
            testing_data.append([np.array(img), img_num]) #Salvando em lista, formato Numpy Array
        
    np.save('test_data.npy', testing_data) #Salva dados
    return testing_data

In [None]:
train_data = create_train_data() #Chamada da função para criação do set de treino

In [None]:
#Criação/Organização da Rede Neural
#Rede neural de 8 neurônios convolucionais
import tensorflow
import tflearn
from tflearn.layers.conv import conv_2d, max_pool_2d
from tflearn.layers.core import input_data, dropout, fully_connected
from tflearn.layers.estimator import regression

convnet = input_data(shape=[None, IMG_SIZE, IMG_SIZE, 1], name='input')

convnet = conv_2d(convnet, 32, 2, activation='relu')
convnet = max_pool_2d(convnet, 2)

convnet = conv_2d(convnet, 64, 2, activation='relu')
convnet = max_pool_2d(convnet, 2)

convnet = conv_2d(convnet, 32, 2, activation='relu')
convnet = max_pool_2d(convnet, 2)

convnet = conv_2d(convnet, 64, 2, activation='relu')
convnet = max_pool_2d(convnet, 2)

convnet = conv_2d(convnet, 32, 2, activation='relu')
convnet = max_pool_2d(convnet, 2)

convnet = conv_2d(convnet, 64, 2, activation='relu')
convnet = max_pool_2d(convnet, 2)

convnet = conv_2d(convnet, 32, 2, activation='relu')
convnet = max_pool_2d(convnet, 2)

convnet = conv_2d(convnet, 64, 2, activation='relu')
convnet = max_pool_2d(convnet, 2)

convnet = fully_connected(convnet, 1024, activation='relu')
convnet = dropout(convnet, 0.8)

convnet = fully_connected(convnet, 2, activation='softmax')
convnet = regression(convnet, optimizer='adam', learning_rate=LR, loss='categorical_crossentropy', name='targets')

model = tflearn.DNN(convnet, tensorboard_dir='log')

### Treino do modelo

#### Caso já exista modelo na pasta:

In [None]:
#Carregamento do modelo, caso já exista
if os.path.exists('dogsvscats.meta'):
    model.load('dogsvscats')
else:
    print('Arquivos do modelo inexistente')

#### Caso não: Treinar o modelo

In [None]:
train = train_data[:-500]
test = train_data[-500:]

In [None]:
X = np.array([i[0] for i in train], dtype=np.float32).reshape(-1, IMG_SIZE, IMG_SIZE, 1)
Y = [i[1] for i in train]

test_x = np.array([i[0] for i in test], dtype=np.float32).reshape(-1, IMG_SIZE, IMG_SIZE, 1)
test_y = [i[1] for i in test]

In [None]:
#Celula que efetivamente treina o modelo
model.fit({'input': X}, {'targets': Y}, n_epoch=11, validation_set=({'input': test_x}, {'targets': test_y}), 
    snapshot_step=500, show_metric=True, run_id=MODEL_NAME)   #Treinando a rede Convolucional

In [None]:
model.save(MODEL_NAME) #Salva o modelo

## Output: Gerando tabela de imagens com rótulo Cat ou Dog

In [None]:
import matplotlib.pyplot as plt

test_data = process_test_data()

fig = plt.figure()

for num, data in enumerate(test_data[21:41]): #20 dados da lista
    img_num = data[1] #Tag da imagem/Nome do arquivo
    img_data = data[0] #Imagem em si
    
    y = fig.add_subplot(4, 5, num+1)
    orig = img_data
    data = img_data.reshape(IMG_SIZE, IMG_SIZE, 1)
    
    model_out = model.predict([data])[0]
    
    if np.argmax(model_out) == 1:
        str_label = "Dog"
    else:
        str_label = "Cat"
    
    y.imshow(cv2.cvtColor(orig, cv2.COLOR_BGR2RGB))
    plt.title(str_label)
    y.axes.get_xaxis().set_visible(False)
    y.axes.get_yaxis().set_visible(False)
plt.show()

### Conexão com MongoDB

In [None]:
from bson.binary import Binary
from bson import ObjectId
import pymongo, gridfs
from gridfs import GridFS
from pymongo import MongoClient


myclient = pymongo.MongoClient('mongodb://leonardolino:91525437@cluster0-shard-00-00.bbr4t.mongodb.net:27017,cluster0-shard-00-01.bbr4t.mongodb.net:27017,cluster0-shard-00-02.bbr4t.mongodb.net:27017/sprint3-pb-compass?ssl=true&replicaSet=atlas-qgdhlr-shard-0&authSource=admin&retryWrites=true&w=majority')
mydb = myclient['sprint3-pb-compass']
mycol = mydb['modelo']

# Salvando os arquivos meta, index, data e checkpoint no DB
# São necessários estes três arquivos para funcionar corretamente
with open("dogsvscats.meta", "rb") as f:
    encoded = Binary(f.read())
mycol.insert_one({"filename": "dogsvscats.meta", "file": encoded, "description": "Keras model" })

with open("checkpoint", "rb") as f:
    encoded = Binary(f.read())
mycol.insert_one({"filename": "checkpoint", "file": encoded, "description": "Keras model" })

with open("dogsvscats.data-00000-of-00001", "rb") as f:
    encoded = Binary(f.read())
mycol.insert_one({"filename": "dogsvscats.data-00000-of-00001", "file": encoded, "description": "Keras model" })

with open("dogsvscats.index", "rb") as f:
    encoded = Binary(f.read())
mycol.insert_one({"filename": "dogsvscats.index", "file": encoded, "description": "Keras model" })

In [None]:
#Trazendo de volta do DB
data1 = mycol.find_one({'filename': 'dogsvscats.meta'})
with open("dogsvscats.meta", "wb") as f:
    f.write(data1['file'])
    
data2 = mycol.find_one({'filename': 'checkpoint'})
with open("checkpoint", "wb") as f:
    f.write(data2['file'])
    
data3 = mycol.find_one({'filename': 'dogsvscats.data-00000-of-00001'})
with open("dogsvscats.data-00000-of-00001", "wb") as f:
    f.write(data3['file'])
    
data4 = mycol.find_one({'filename': 'dogsvscats.index'})
with open("dogsvscats.index", "wb") as f:
    f.write(data4['file'])
    
    