<a href="https://colab.research.google.com/github/nilobarrantes/Proyetos_Deep_Learning/blob/master/Projeto_Reconhecer_Cabalo_Humano.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

##### Copyright 2019 The TensorFlow Authors.

# **Cavalos vs Humanos**

![](https://drive.google.com/uc?export=view&id=1a7xwLCdqovYxoJq3M4CM8v6cZX-k16KT)

O conjunto de dados Cavalos vs. Humanos é um conjunto de dados de visão computacional padrão que envolve a classificação de fotos como contendo um cavalo ou um humano.

Embora o problema pareça simples, ele só foi abordado de forma eficaz nos últimos anos usando redes neurais convolucionais (CNN) de aprendizado profundo.

### **Como funcionam as CNNs?**
As redes convolucionais funcionam transformando os pixels de uma imagem em informações que podem ser entendidas pela máquina. As etapas envolvidas no reconhecimento de imagem são:



* Convolution
* Pooling
* Flattening
* Fully connected layer



## **Importando Imagens de Treinamento e validaçao.**
Usaremos um conjunto de imagens (treinamento) para ``ensinar'' à rede neural a diferença entre um cavalo e um humano. Ou seja, o conjunto de treinamento são os dados usados para informar ao modelo de rede neural que 'é assim que se parece um cavalo', 'é assim que se parece um humano' etc.

Outro conjunto de imagens (validação), será usado para testar se nossa rede, já treinada, consegue distinguir um cavalo de um humano. 


In [None]:
!wget --no-check-certificate \
    https://storage.googleapis.com/laurencemoroney-blog.appspot.com/horse-or-human.zip \
    -O /tmp/horse-or-human.zip

In [None]:
!wget --no-check-certificate \
    https://storage.googleapis.com/laurencemoroney-blog.appspot.com/validation-horse-or-human.zip \
    -O /tmp/validation-horse-or-human.zip

O código python a seguir usará a biblioteca OS para usar as bibliotecas do sistema operacional, fornecendo acesso ao sistema de arquivos e a biblioteca zipfile, permitindo a descompactação dos dados.

In [None]:
import os
import zipfile

local_zip = '/tmp/horse-or-human.zip'
zip_ref = zipfile.ZipFile(local_zip, 'r')
zip_ref.extractall('/tmp/horse-or-human')
local_zip = '/tmp/validation-horse-or-human.zip'
zip_ref = zipfile.ZipFile(local_zip, 'r')
zip_ref.extractall('/tmp/validation-horse-or-human')
zip_ref.close()

O conteúdo do .zip é extraído para o diretório base `/ tmp / horse-or-human`, que por sua vez contém subdiretórios` horses` e `humanos`.

Vamos definir cada um desses diretórios:

In [None]:
# Directory with our training horse pictures
train_horse_dir = os.path.join('/tmp/horse-or-human/horses')

# Directory with our training human pictures
train_human_dir = os.path.join('/tmp/horse-or-human/humans')

# Directory with our training horse pictures
validation_horse_dir = os.path.join('/tmp/validation-horse-or-human/horses')

# Directory with our training human pictures
validation_human_dir = os.path.join('/tmp/validation-horse-or-human/humans')

In [None]:
train_horse_names = os.listdir(train_horse_dir)
train_human_names = os.listdir(train_human_dir)

validation_horse_hames = os.listdir(validation_horse_dir)
validation_human_names = os.listdir(validation_human_dir)

## Construindo um pequeno modelo do zero

Mas antes de continuar, vamos começar a definir o modelo:

A etapa 1 será importar a biblioteca TensorFlow.

**TensorFlow** é uma biblioteca de código aberto compatível com Python para computaçao numérica que torna o *,achine learning* mais rápido e fácil.

In [None]:
import tensorflow as tf

Em seguida, adicionamos camadas convolucionais e achatamos(flatten) o resultado final para alimentar as camadas densamente conectadas.

Finalmente, adicionamos as camadas densamente conectadas.

Observe que, como estamos enfrentando um problema de classificação de duas classes, ou seja, um *problema de classificação binária*, finalizaremos  nossa rede com uma [ativação sigmoide](https://wikipedia.org/wiki/Sigmoid_function), de modo que a saída de nossa rede será um único escalar entre 0 e 1, codificando a probabilidade de que a imagem atual seja da classe 1 (em oposição à classe 0).

In [None]:
model = tf.keras.models.Sequential([
    # Note the input shape is the desired size of the image 150x150 with 3 bytes color
    # This is the first convolution
    tf.keras.layers.Conv2D(16, (3,3), activation='relu', input_shape=(150, 150, 3)),
    tf.keras.layers.MaxPooling2D(2, 2),
    # The second convolution
    tf.keras.layers.Conv2D(32, (3,3), activation='relu'),
    tf.keras.layers.MaxPooling2D(2,2),
    # The third convolution
    tf.keras.layers.Conv2D(64, (3,3), activation='relu'),
    tf.keras.layers.MaxPooling2D(2,2),
    # The fourth convolution
    tf.keras.layers.Conv2D(64, (3,3), activation='relu'),
    tf.keras.layers.MaxPooling2D(2,2),
    # The fifth convolution
    tf.keras.layers.Conv2D(64, (3,3), activation='relu'),
    tf.keras.layers.MaxPooling2D(2,2),
    # Flatten the results to feed into a DNN
    tf.keras.layers.Flatten(),
    # 512 neuron hidden layer
    tf.keras.layers.Dense(512, activation='relu'),
    # Only 1 output neuron. It will contain a value from 0-1 where 0 for 1 class ('horses') and 1 for the other ('humans')
    tf.keras.layers.Dense(1, activation='sigmoid')
])

A chamada do método model.summary () imprime um resumo da rede neural.

In [None]:
model.summary()


A coluna "formato de saída" mostra como o tamanho do seu mapa de carateristicas evolui em cada camada sucessiva. As camadas de **convolução** reduzem um pouco o tamanho dos mapas de carateristicas devido ao preenchimento, e cada camada de agrupamento (**pooling**) divide as dimensões pela metade.

A seguir, vamos configurar as especificações para o treinamento do modelo. Vamos treinar nosso modelo com a perda `binary_crossentropy`, porque é um problema de classificação binária e nossa ativação final é um sigmóide. Nós usaremos o otimizador `rmsprop` com uma taxa de aprendizagem de` 0,001`. Durante o treinamento, vamos monitorar a precisão da classificação.

**NOTA**: Neste caso, usar o [algoritmo de otimização RMSprop](https://wikipedia.org/wiki/Stochastic_gradient_descent#RMSProp) é preferível a [descida gradiente estocástico](https://developers.google.com/machine-learning/glossary/#SGD) (SGD), porque o RMSprop automatiza o ajuste da taxa de aprendizagem para nós. (Outros otimizadores, como [Adam](https://wikipedia.org/wiki/Stochastic_gradient_descent#Adam) e [Adagrad](https://developers.google.com/machine-learning/glossary/#AdaGrad), também adaptarao automaticamente a taxa de aprendizagem durante o treinamento e funcionariam igualmente bem.)

In [None]:
from tensorflow.keras.optimizers import RMSprop

model.compile(loss='binary_crossentropy',
              optimizer=RMSprop(lr=0.001),
              metrics=['accuracy'])

### Pré-processamento de dados

Vamos configurar geradores de dados que irão ler imagens em nossas pastas de origem, convertê-los em tensores `float32` e alimentá-los (com seus rótulos) para nossa rede. Teremos um gerador para as imagens de treinamento e outro para as imagens de validação. Nossos geradores produzirão lotes de imagens de tamanho 300x300 e seus rótulos (binários).

Os dados que vão para as redes neurais geralmente devem ser normalizados para torná-los mais receptivos ao processamento pela rede. Em nosso caso, iremos pré-processar nossas imagens normalizando os valores de pixel para que fiquem no intervalo `[0, 1]` (originalmente todos os valores estão no intervalo `[0, 255]` intervalo).

No Keras, isso pode ser feito por meio da classe `keras.preprocessing.image.ImageDataGenerator` usando o parâmetro` rescale`. Esta classe `ImageDataGenerator` permite que você instancie geradores de lotes de imagens aumentadas (e seus rótulos) via `.flow(data, labels)` ou `.flow_from_directory(directory)`. Esses geradores podem então ser usados ​​com os métodos do modelo Keras que aceitam geradores de dados como entradas: `fit`,` evaluate_generator` e `predict_generator`.

In [None]:
from tensorflow.keras.preprocessing.image import ImageDataGenerator

# All images will be rescaled by 1./255
train_datagen = ImageDataGenerator(rescale=1/255)
validation_datagen = ImageDataGenerator(rescale=1/255)

# Flow training images in batches of 128 using train_datagen generator
train_generator = train_datagen.flow_from_directory(
        '/tmp/horse-or-human/',  # This is the source directory for training images
        target_size=(150, 150),  # All images will be resized to 150x150
        batch_size=128,
        # Since we use binary_crossentropy loss, we need binary labels
        class_mode='binary')

# Flow training images in batches of 128 using train_datagen generator
validation_generator = validation_datagen.flow_from_directory(
        '/tmp/validation-horse-or-human/',  # This is the source directory for training images
        target_size=(150, 150),  # All images will be resized to 150x150
        batch_size=32,
        # Since we use binary_crossentropy loss, we need binary labels
        class_mode='binary')

### Treinamento
Vamos treinar por 15 épocas (epoch) - isso pode levar alguns minutos para ser executado.

*Loss* e *accuracy*  são ótimos indicadores do progresso do treinamento. Se intenta adivinhar a classificação dos dados de treinamento e, en seguida, compara-los com a etiqueta conhecida, calculando o resultado. O *accuracy* é a parte das suposições corretas.

In [None]:
history = model.fit(
      train_generator,
      steps_per_epoch=8,  
      epochs=15,
      verbose=1,
      validation_data = validation_generator,
      validation_steps=8)

Geralmente teremos exactitudes altas como 1.000, que es probablemente una señal de *overfiting*. El conjunto de validación es de 0.81, que está bastante bien, pero pongámoslo a prueba con unas imágenes reales.


### Rodando o modelo

Agora vamos dar uma olhada na execução de uma predição usando o modelo. Este código permitirá que você escolha um ou mais arquivos do seu sistema de arquivos, ele os carregará e os executará no modelo, dando uma indicação se o objeto é um cavalo ou um humano.

In [None]:
import numpy as np
from google.colab import files
from keras.preprocessing import image

uploaded = files.upload()

for fn in uploaded.keys():
 
  # predicting images
  path = '/content/' + fn
  img = image.load_img(path, target_size=(150, 150))
  x = image.img_to_array(img)
  x = np.expand_dims(x, axis=0)

  images = np.vstack([x])
  classes = model.predict(images, batch_size=10)
  print(classes[0])
  if classes[0]>0.5:
    print(fn + " is a human")
  else:
    print(fn + " is a horse")
 

## Limpeza
Para encerrar o kernel e liberar recursos de memória, executar:

In [None]:
import os, signal
os.kill(os.getpid(), signal.SIGKILL)