# Redes Neurais Convolucionais

### Descriçao

---
1. O objetivo deste notebook é Redes Neurais Convolucionais.
2. Os dados para usar serão clonados do nosso próprio github, pela pasta dataset.
3. Vamos treinar nosso modelo para que ele aprenda a detectar doença em plantações de tomate.
---

# Instalação de pacotes

In [1]:
!pip install torch torchvision torchaudio pandas numpy keras

Collecting nvidia-cuda-nvrtc-cu12==12.4.127 (from torch)
  Downloading nvidia_cuda_nvrtc_cu12-12.4.127-py3-none-manylinux2014_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-cuda-runtime-cu12==12.4.127 (from torch)
  Downloading nvidia_cuda_runtime_cu12-12.4.127-py3-none-manylinux2014_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-cuda-cupti-cu12==12.4.127 (from torch)
  Downloading nvidia_cuda_cupti_cu12-12.4.127-py3-none-manylinux2014_x86_64.whl.metadata (1.6 kB)
Collecting nvidia-cudnn-cu12==9.1.0.70 (from torch)
  Downloading nvidia_cudnn_cu12-9.1.0.70-py3-none-manylinux2014_x86_64.whl.metadata (1.6 kB)
Collecting nvidia-cublas-cu12==12.4.5.8 (from torch)
  Downloading nvidia_cublas_cu12-12.4.5.8-py3-none-manylinux2014_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-cufft-cu12==11.2.1.3 (from torch)
  Downloading nvidia_cufft_cu12-11.2.1.3-py3-none-manylinux2014_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-curand-cu12==10.3.5.147 (from torch)
  Downloading nvidia_curand_cu12-10.3.5

# Obtendo o dataset

In [2]:
# Clona o repositório do GitHub contendo o material necessário
!git clone https://github.com/batestin1/coding_the_future_dio_redes_neurais.git

# Move apenas a pasta 'dataset' para o diretório atual ('/content/')
!mv coding_the_future_dio_redes_neurais/dataset /content/

# Remove o restante do repositório, já que não será mais utilizado
!rm -rf coding_the_future_dio_redes_neurais

Cloning into 'coding_the_future_dio_redes_neurais'...
remote: Enumerating objects: 11037, done.[K
remote: Counting objects: 100% (105/105), done.[K
remote: Compressing objects: 100% (79/79), done.[K
remote: Total 11037 (delta 50), reused 74 (delta 24), pack-reused 10932 (from 1)[K
Receiving objects: 100% (11037/11037), 196.13 MiB | 29.36 MiB/s, done.
Resolving deltas: 100% (73/73), done.
Updating files: 100% (11028/11028), done.


# Bibliotecas

In [6]:
# Importa o NumPy para criação e manipulação de matrizes
import numpy as np

# Importa o módulo OS para manipulação de pastas e arquivos
import os

# Importa as bibliotecas necessárias do Keras para construção da rede neural
from keras.models import Sequential          # Para iniciar o modelo sequencial da rede neural
from keras.layers import Conv2D               # Camada de convolução (extração de características)
from keras.layers import MaxPooling2D         # Camada de max pooling (redução de dimensionalidade)
from keras.layers import Flatten              # Camada de flatten (transformação dos dados para a camada densa)
from keras.layers import Dense                # Camada densa (camada totalmente conectada)
from keras.layers import Dropout              # Camada de dropout (redução de overfitting)

from keras.preprocessing import image         # Para carregar e testar imagens manualmente

from keras.layers import Rescaling             # Para normalizar os valores dos pixels (RGB entre 0 e 1)

from tensorflow.keras.preprocessing.image import ImageDataGenerator  # CORRETO: Para o pré-processamento e aumento de imagens (data augmentation)

from tensorflow.keras.utils import plot_model  # Para visualizar a arquitetura do modelo

from keras.models import load_model            # Para salvar e carregar modelos treinados

# Construindo a RNC

In [7]:
# Inicializando a rede neural convolucional (CNN) com o modelo sequencial
rnc = Sequential()

In [8]:
# Criando Camadas Convolucionais

# Adiciona uma camada de pré-processamento para normalizar os valores dos pixels (de 0 a 255 para 0 a 1)
rnc.add(Rescaling(scale=1.0/255))

# Adiciona a primeira camada convolucional
# Conv2D(32, (3, 3)) -> 32 filtros (detectores de características), cada um de tamanho 3x3
# input_shape -> Formato da imagem de entrada: 128x128 pixels e 3 canais (RGB)
# activation='relu' -> Função de ativação ReLU (Rectified Linear Unit)
rnc.add(Conv2D(32, (3, 3), input_shape=(128, 128, 3), activation='relu'))

# Adiciona a primeira camada de MaxPooling
# Reduz a dimensionalidade da imagem (pooling de 2x2) preservando as características principais
rnc.add(MaxPooling2D(pool_size=(2, 2)))

# Adiciona a segunda camada convolucional
# 16 filtros de 3x3 e função de ativação ReLU
rnc.add(Conv2D(16, (3, 3), activation='relu'))

# Adiciona a segunda camada de MaxPooling
rnc.add(MaxPooling2D(pool_size=(2, 2)))

# Adiciona a terceira camada convolucional
# 8 filtros de 3x3 e função de ativação ReLU
rnc.add(Conv2D(8, (3, 3), activation='relu'))

# Adiciona a terceira camada de MaxPooling
rnc.add(MaxPooling2D(pool_size=(2, 2)))

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


In [9]:
# Flattening

# A camada Flatten "achata" (flatten) a matriz 3D de saída das camadas convolucionais e de pooling
# Transforma em um vetor 1D para poder ser usado nas camadas densas (camadas totalmente conectadas)
rnc.add(Flatten())

In [10]:
# Full Connect (Camadas totalmente conectadas)

# Adicionando uma camada densa (fully connected)
# 128 neurônios, todos conectados com a camada anterior (Flatten)
# Função de ativação ReLU para adicionar não-linearidade
rnc.add(Dense(units=128, activation='relu'))

# Adicionando uma camada de Dropout
# Durante o treinamento, "desliga" 50% dos neurônios aleatoriamente
# Isso ajuda a evitar overfitting (modelo aprender demais os dados de treino)
rnc.add(Dropout(rate=0.5))

In [11]:
# Camada de Saída (Output Layer)

# Adicionando uma camada densa com 10 unidades (neurônios)
# Cada unidade corresponde a uma classe de saída (supondo 10 classes)
# Função de ativação softmax para gerar probabilidades (valores entre 0 e 1 que somam 1)
rnc.add(Dense(units=10, activation='softmax'))

In [12]:
# Compilando a rede neural

# Define o otimizador que ajustará os pesos da rede durante o treinamento (Adam é uma escolha popular por ser eficiente)
# Define a função de perda (loss function) usada para calcular o erro — categorical_crossentropy é apropriado para problemas de múltiplas classes (10 classes aqui)
# Define as métricas que queremos acompanhar durante o treinamento — no caso, a acurácia
rnc.compile(
  optimizer='adam',                 # Otimizador Adam
  loss='categorical_crossentropy',   # Função de perda para classificação multiclasse
  metrics=['accuracy']               # Métrica de avaliação: acurácia
)

# Pré-processamento das imagens


#### Treino

In [13]:
# Criando um gerador de imagens para treinamento
# O ImageDataGenerator aplica transformações nas imagens para aumentar a variedade do dataset (data augmentation)

train_datagen = ImageDataGenerator(
  shear_range=0.2,        # Aplica distorções aleatórias (cisalhamento) nas imagens
  zoom_range=0.2,         # Aplica zoom aleatório nas imagens
  horizontal_flip=True    # Inverte as imagens horizontalmente de forma aleatória
)

In [14]:
# Criando um gerador de imagens para teste
# No conjunto de teste, normalmente só normalizamos as imagens, sem data augmentation

test_datagen = ImageDataGenerator(
  rescale=1./255  # Normaliza os valores dos pixels para o intervalo [0, 1]
)

In [15]:
# Cria o conjunto de treinamento a partir das imagens no diretório especificado
training_set = train_datagen.flow_from_directory(
  '/content/dataset/rnc/train',  # Caminho onde estão as imagens de treino organizadas por pastas (uma pasta por classe)
  target_size=(128, 128),        # Redimensiona todas as imagens para 128x128 pixels
  batch_size=128,                # Número de imagens carregadas por vez (batch)
  class_mode='categorical'       # Tipo de classificação: múltiplas classes (one-hot encoding)
)

Found 10000 images belonging to 10 classes.


In [16]:
# Visualiza o mapeamento das classes (índices das classes) identificadas no conjunto de treinamento
label_map = (training_set.class_indices)

In [17]:
label_map

{'Bacterial_spot': 0,
 'Early_blight': 1,
 'Late_blight': 2,
 'Leaf_Mold': 3,
 'Septoria_leaf_spot': 4,
 'Spider_mites Two-spotted_spider_mite': 5,
 'Target_Spot': 6,
 'Tomato_Yellow_Leaf_Curl_Virus': 7,
 'Tomato_mosaic_virus': 8,
 'healthy': 9}

#### Teste

In [18]:
# Carrega o conjunto de teste
test_set = test_datagen.flow_from_directory(
  '/content/dataset/rnc/test',   # Caminho da pasta que contém as imagens de teste organizadas por classe
  target_size=(128, 128),         # Redimensiona todas as imagens para 128x128 pixels
  batch_size=128,                 # Número de imagens carregadas por vez
  class_mode='categorical')       # Tipo de classificação (multiclasse, cada imagem pertence a uma única classe)

Found 1000 images belonging to 10 classes.


 # Treinando A Rede Neural

In [20]:
# Treinando a rede neural convolucional (forma atualizada)
rnc.fit(
  training_set,          # Dados de treino
  steps_per_epoch=1,     # Número de lotes de imagens por época
  epochs=4,              # Número de épocas
  validation_data=test_set,  # Dados de validação
  validation_steps=1     # Número de lotes de validação por época
)

  self._warn_if_super_not_called()


Epoch 1/4
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m8s[0m 8s/step - accuracy: 0.0938 - loss: 2.3042 - val_accuracy: 0.0781 - val_loss: 2.3026
Epoch 2/4
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 5s/step - accuracy: 0.1406 - loss: 2.2947 - val_accuracy: 0.0938 - val_loss: 2.3024
Epoch 3/4
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 5s/step - accuracy: 0.0938 - loss: 2.2901 - val_accuracy: 0.0391 - val_loss: 2.3032
Epoch 4/4
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 3s/step - accuracy: 0.0859 - loss: 2.3066 - val_accuracy: 0.0859 - val_loss: 2.3026


<keras.src.callbacks.history.History at 0x7cf15c118790>

#### avaliação do modelo

In [24]:
# Avaliando o modelo no conjunto de teste

# 'evaluate' calcula a loss (erro) e a acurácia no conjunto de teste
test_loss, test_accuracy = rnc.evaluate(
  test_set,     # dados de teste
  steps=50      # número de batches para avaliação (ajustar conforme o tamanho do dataset)
)

# Exibe a loss (erro) no conjunto de teste
print(f'Test loss: {test_loss}')

# Exibe a acurácia no conjunto de teste
print(f'Test accuracy: {test_accuracy}')

[1m50/50[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 89ms/step - accuracy: 0.1014 - loss: 2.3030  




Test loss: 2.303351879119873
Test accuracy: 0.10000000149011612


# Testando a performance

In [25]:
# Visualizando as classes identificadas no conjunto de treinamento
label_map.keys()

dict_keys(['Bacterial_spot', 'Early_blight', 'Late_blight', 'Leaf_Mold', 'Septoria_leaf_spot', 'Spider_mites Two-spotted_spider_mite', 'Target_Spot', 'Tomato_Yellow_Leaf_Curl_Virus', 'Tomato_mosaic_virus', 'healthy'])

In [26]:
# Carregar uma imagem para fazer a previsão
img_path = '/content/dataset/rnc/test/Bacterial_spot/01a3cf3f-94c1-44d5-8972-8c509d62558e___GCREC_Bact.Sp 3396.JPG'

# Carrega a imagem e redimensiona para o tamanho usado no treinamento
img = image.load_img(img_path, target_size=(128, 128))

# Converte a imagem para um array NumPy
img_array = image.img_to_array(img)

# Adiciona uma dimensão extra para simular um "batch" (lote de imagens)
img_array = np.expand_dims(img_array, axis=0)

# Normaliza os pixels para o intervalo [0, 1]
img_array /= 255.0

# Faz a previsão usando o modelo treinado
prediction = rnc.predict(img_array)

# Obtém o índice da classe com a maior probabilidade
predicted_class = np.argmax(prediction, axis=1)[0]

# Cria um dicionário invertido para mapear índice para nome da classe
inverse_label_map = {v: k for k, v in label_map.items()}

# Usa o índice para buscar o nome da classe
predicted_class_name = inverse_label_map[predicted_class]

# Imprime o nome da classe predita (removendo alguns termos para deixar mais limpo)
print(f"A imagem é: {predicted_class_name.replace('_', ' ').replace('Tomato', '').replace(' ', '')}")

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 158ms/step
A imagem é: YellowLeafCurlVirus


# Salvando o modelo

In [28]:
# Define o nome da pasta onde o modelo será salvo
folder = 'rnc/'

# Verifica se o diretório existe; se não existir, cria o diretório
if not os.path.exists(folder):
  os.makedirs(folder)

# Salva apenas os pesos da rede neural convolucional no diretório especificado
rnc.save_weights(os.path.join(folder, 'rede_neural_convolucional.weights.h5'))