In [10]:
import numpy as np
import pandas as pd
import os
import matplotlib.pyplot as plt
import seaborn as sns

import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout, Input
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from sklearn.metrics import classification_report, confusion_matrix

In [11]:
import kagglehub
import os

# --- Constantes (mesmas de antes) ---
IMG_WIDTH = 224
IMG_HEIGHT = 224
IMG_SIZE = (IMG_WIDTH, IMG_HEIGHT)
IMG_SHAPE = (IMG_WIDTH, IMG_HEIGHT, 3)
BATCH_SIZE = 32

# 1. Baixa o dataset
print("Baixando o dataset...")
base_download_path = kagglehub.dataset_download("asdasdasasdas/garbage-classification")
print(f"Dataset baixado para: {base_download_path}")

# 2. PROCURAR o caminho certo
# Vamos procurar pela pasta que contém as 6 classes (ex: 'cardboard', 'glass')
correct_path = None
for dirpath, dirnames, filenames in os.walk(base_download_path):
    # Verifica se as pastas das classes estão DENTRO do diretório atual
    if 'cardboard' in dirnames and 'glass' in dirnames and 'metal' in dirnames:
        correct_path = dirpath # Encontramos!
        break

# 3. Definir o caminho final
if correct_path:
    path = correct_path
    print(f"\n--- SUCESSO! ---")
    print(f"O caminho correto para o gerador é: {path}")
    print(f"Conteúdo deste caminho (deve ter 6 pastas): {os.listdir(path)}")
else:
    # Caso a lógica falhe, tentamos o caminho base (o que estávamos fazendo)
    path = base_download_path
    print(f"\n--- ATENÇÃO ---")
    print("Não foi possível encontrar as subpastas automaticamente.")
    print(f"Tentando usar o caminho base: {path}")
    print(f"Conteúdo do caminho base: {os.listdir(path)}")

Baixando o dataset...
Using Colab cache for faster access to the 'garbage-classification' dataset.
Dataset baixado para: /kaggle/input/garbage-classification

--- SUCESSO! ---
O caminho correto para o gerador é: /kaggle/input/garbage-classification/Garbage classification/Garbage classification
Conteúdo deste caminho (deve ter 6 pastas): ['metal', 'glass', 'paper', 'trash', 'cardboard', 'plastic']


In [12]:
# Configura o Data Augmentation para o gerador de treino
train_datagen = ImageDataGenerator(
    rescale=1./255,         # Normaliza os pixels (0-1)
    rotation_range=20,      # Rotação
    zoom_range=0.2,         # Zoom
    horizontal_flip=True,   # Inversão horizontal
    fill_mode='nearest',
    validation_split=0.2    # Separa 20% para validação
)

# O gerador de validação/teste só precisa normalizar os pixels
test_datagen = ImageDataGenerator(
    rescale=1./255,
    validation_split=0.2  # Deve ser o mesmo split
)

In [13]:
# Gerador de TREINO (usa data augmentation)
train_generator = train_datagen.flow_from_directory(
    directory=path,
    target_size=IMG_SIZE,       # <--- MUDANÇA: Usa 224x224
    batch_size=BATCH_SIZE,
    class_mode='categorical',
    subset='training',          # Define como conjunto de treino
    shuffle=True
)

# Gerador de VALIDAÇÃO (não usa data augmentation)
validation_generator = test_datagen.flow_from_directory(
    directory=path,
    target_size=IMG_SIZE,       # <--- MUDANÇA: Usa 224x224
    batch_size=BATCH_SIZE,
    class_mode='categorical',
    subset='validation',        # Define como conjunto de validação
    shuffle=False               # Importante: False para matriz de confusão
)

# Imprime as classes encontradas
print(f"Classes encontradas: {train_generator.class_indices}")

Found 2024 images belonging to 6 classes.
Found 503 images belonging to 6 classes.
Classes encontradas: {'cardboard': 0, 'glass': 1, 'metal': 2, 'paper': 3, 'plastic': 4, 'trash': 5}


In [14]:
model = Sequential()

# --- Bloco 1 ---
# Especificação de Entrada: (224, 224, 3)
model.add(Input(shape=IMG_SHAPE))
model.add(Conv2D(32, (3, 3), activation='relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))

# --- Bloco 2 ---
model.add(Conv2D(64, (3, 3), activation='relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))

# --- Bloco 3 ---
model.add(Conv2D(128, (3, 3), activation='relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))

# --- Classificador ---
model.add(Flatten())
model.add(Dense(512, activation='relu'))
model.add(Dropout(0.5)) # Dropout para evitar overfitting

# --- Camada de Saída ---
# Especificação de Saída: 6 neurônios com softmax
model.add(Dense(6, activation='softmax'))

# Exibe o resumo do modelo
model.summary()

In [15]:
model.compile(
    optimizer='adam',
    loss='categorical_crossentropy',
    metrics=['accuracy']
)

In [None]:
# Define um número de épocas (ex: 20)
EPOCHS = 20

history = model.fit(
    train_generator,
    steps_per_epoch=train_generator.samples // BATCH_SIZE,
    validation_data=validation_generator,
    validation_steps=validation_generator.samples // BATCH_SIZE,
    epochs=EPOCHS
)

Epoch 1/20
[1m63/63[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m294s[0m 5s/step - accuracy: 0.2738 - loss: 2.1337 - val_accuracy: 0.2958 - val_loss: 1.6311
Epoch 2/20
[1m 1/63[0m [37m━━━━━━━━━━━━━━━━━━━━[0m [1m3:42[0m 4s/step - accuracy: 0.3125 - loss: 1.6942



[1m63/63[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m21s[0m 282ms/step - accuracy: 0.3125 - loss: 1.6942 - val_accuracy: 0.3104 - val_loss: 1.6152
Epoch 3/20
[1m63/63[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m322s[0m 5s/step - accuracy: 0.4225 - loss: 1.4020 - val_accuracy: 0.4146 - val_loss: 1.3586
Epoch 4/20
[1m63/63[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m20s[0m 264ms/step - accuracy: 0.5000 - loss: 1.3202 - val_accuracy: 0.3938 - val_loss: 1.3514
Epoch 5/20
[1m10/63[0m [32m━━━[0m[37m━━━━━━━━━━━━━━━━━[0m [1m3:53[0m 4s/step - accuracy: 0.5256 - loss: 1.1849

In [None]:
# 1. Avaliar a Acurácia Categórica final
print("\n--- Avaliação Final no Conjunto de Validação ---")
scores = model.evaluate(validation_generator)
print(f"Acurácia de Validação: {scores[1] * 100:.2f}%")
print(f"Loss de Validação: {scores[0]:.4f}")

# 2. Gerar a Matriz de Confusão
print("\n--- Gerando Matriz de Confusão ---")

# Obter as previsões
# (Usamos o validation_generator que já está com shuffle=False)
y_pred_probs = model.predict(validation_generator)
y_pred_classes = np.argmax(y_pred_probs, axis=1)

# Obter os rótulos verdadeiros
true_classes = validation_generator.classes

# Obter os nomes das classes
class_labels = list(validation_generator.class_indices.keys())

# Calcular a Matriz
cm = confusion_matrix(true_classes, y_pred_classes)

# Plotar a Matriz
plt.figure(figsize=(10, 8))
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues',
            xticklabels=class_labels,
            yticklabels=class_labels)
plt.title('Matriz de Confusão')
plt.ylabel('Classe Verdadeira')
plt.xlabel('Classe Prevista')
plt.show()