# 1. Configuração do ambiente

In [1]:
!pip install opencv-python numpy google-cloud-storage



In [2]:
!pip install google-cloud-vision
!pip install tensorflow-io



In [3]:
!pip install gcsfs



In [4]:
!pip install --upgrade tensorflow keras protobuf
!pip install --upgrade google-cloud-storage



In [5]:
import numpy as np
import cv2
from google.cloud import storage
from google.cloud import vision
import io
import os
import tensorflow as tf
from tensorflow import keras
import matplotlib.pyplot as plt
from sklearn.metrics import confusion_matrix
import shutil
import pathlib
import seaborn as sns

In [6]:
from tensorflow.keras.applications import MobileNetV2
from tensorflow.keras.layers import Dense, GlobalAveragePooling2D, Dropout, Activation
from tensorflow.keras.preprocessing import image_dataset_from_directory
from tensorflow.keras.models import Model
from tensorflow.keras.optimizers import Adam
from tensorflow.keras.callbacks import EarlyStopping, ModelCheckpoint
from tensorflow.keras.preprocessing.image import ImageDataGenerator
import itertools

In [7]:
# Inicializa o cliente do GCS
BUCKET_NAME = 'moedasbrasileiras'
storage_client = storage.Client()
bucket = storage_client.bucket(BUCKET_NAME)
vision_client = vision.ImageAnnotatorClient()


# Treinamento

In [8]:
#1. CONFIGURAÇÕES E PARÂMETROS

# Informações do Bucket GCS
BUCKET_NAME = 'moedasbrasileiras'
DATA_DIR_GCS = f'gs://{BUCKET_NAME}/classes/'

# Parâmetros de Treinamento
TARGET_SIZE = (224, 224)
BATCH_SIZE = 32
VALIDATION_SPLIT = 0.2
LEARNING_RATE = 0.0001
NUM_EPOCHS = 250
AUTOTUNE = tf.data.AUTOTUNE # Otimização de I/O

# Nomes das classes (baseados nas subpastas)
CLASS_NAMES = ['cincocentavos', 'cinquentacentavos', 'dezcentavos',
               'umcentavo', 'umreal', 'vinteecincocentavos']
NUM_CLASSES = len(CLASS_NAMES)

# Inicializa os clientes (Para autenticação GCS)
try:
    storage_client = storage.Client()
    bucket = storage_client.bucket(BUCKET_NAME)
    vision_client = vision.ImageAnnotatorClient()
except Exception as e:
    print(f"Aviso: Falha ao inicializar clientes GCS/Vision. O acesso ao GCS pode falhar se o ambiente não estiver autenticado. Erro: {e}")


In [9]:
# 2. FUNÇÕES PARA tf.data.Dataset

def get_label(filepath):
    """Extrai o nome da classe do caminho do arquivo e converte para one-hot."""
    parts = tf.strings.split(filepath, os.path.sep)
    class_name = parts[-2]
    return tf.cast(class_name == CLASS_NAMES, tf.float32)

def decode_img(img_bytes):
    """Decodifica, redimensiona e normaliza (rescale=1./255) a imagem.
       Adiciona tratamento para diferentes formatos de imagem."""

    # Decodificação robusta:
    image = tf.io.decode_image(img_bytes, channels=3, expand_animations=False)

    # Redimensionamento
    image = tf.image.resize(image, TARGET_SIZE)

    # Normalização
    return image / 255.0

def apply_augmentation(img, label):
    """Implementa as transformações de Data Augmentation."""
    # Rotação (rotation_range=7) - implementado como rotação aleatória (simples)
    img = tf.image.rot90(img, k=tf.random.uniform(shape=[], minval=0, maxval=4, dtype=tf.int32))
    # Flip Horizontal (horizontal_flip=True)
    img = tf.image.random_flip_left_right(img)
    return img, label

def process_path(filepath):
    """Processa o caminho do arquivo para obter a imagem e o rótulo."""
    label = get_label(filepath)
    # tf.io.read_file é seguro para caminhos GCS
    img_bytes = tf.io.read_file(filepath)
    img = decode_img(img_bytes)
    return img, label


In [10]:
# 3. CRIAÇÃO E CONFIGURAÇÃO DO DATASET

# 1. Lista todos os arquivos (incluindo subpastas)
# Lista arquivos JPEG
jpg_ds = tf.data.Dataset.list_files(str(DATA_DIR_GCS + '*/' + '*.jpg'))
jpeg_ds = tf.data.Dataset.list_files(str(DATA_DIR_GCS + '*/' + '*.jpeg'))

# Lista arquivos PNG (se houver)
png_ds = tf.data.Dataset.list_files(str(DATA_DIR_GCS + '*/' + '*.png'))

# Concatena todos os Datasets de imagem válidos
list_ds = jpg_ds.concatenate(jpeg_ds).concatenate(png_ds)

# Determina o tamanho do dataset e mapeia
DATASET_SIZE = tf.data.experimental.cardinality(list_ds).numpy()

# Mapeia os caminhos para as imagens e rótulos
ds = list_ds.map(process_path, num_parallel_calls=AUTOTUNE)

# Separação Treinamento/Validação (80%/20%)
TRAIN_SIZE = int((1 - VALIDATION_SPLIT) * DATASET_SIZE)

train_ds = ds.take(TRAIN_SIZE).cache()
val_ds = ds.skip(TRAIN_SIZE).cache()

# Aplica aumento de dados SÓ no conjunto de treinamento
train_ds = train_ds.map(apply_augmentation, num_parallel_calls=AUTOTUNE)

# Configuração final do pipeline
train_ds = train_ds.shuffle(buffer_size=1000).batch(BATCH_SIZE).repeat().prefetch(AUTOTUNE)
val_ds = val_ds.batch(BATCH_SIZE).prefetch(AUTOTUNE)

print(f"\n--- Detecção de Dados ---")
print(f"Total de imagens detectadas: {DATASET_SIZE}")
print(f"Imagens para Treinamento: {TRAIN_SIZE}")
print(f"Imagens para Validação: {DATASET_SIZE - TRAIN_SIZE}")
print(f"Classes: {CLASS_NAMES}")



--- Detecção de Dados ---
Total de imagens detectadas: 186
Imagens para Treinamento: 148
Imagens para Validação: 38
Classes: ['cincocentavos', 'cinquentacentavos', 'dezcentavos', 'umcentavo', 'umreal', 'vinteecincocentavos']


In [11]:
# 4. CONSTRUÇÃO E COMPILAÇÃO DO MODELO

# Criação do Modelo MobileNetV2 (Transfer Learning)
base_model = MobileNetV2(
    input_shape=(*TARGET_SIZE, 3),
    include_top=False,
    weights='imagenet'
)

# Congela TODAS as camadas do modelo base para Fine-Tuning
for layer in base_model.layers:
    layer.trainable = False

# Adicionar as Camadas Finais (Head)
x = base_model.output
x = GlobalAveragePooling2D()(x)
predictions = Dense(NUM_CLASSES, activation='softmax')(x)
model = Model(inputs=base_model.input, outputs=predictions)

# Compilação do Modelo
adam_optimizer = tf.keras.optimizers.Adam(learning_rate=LEARNING_RATE)
model.compile(
    optimizer=adam_optimizer,
    loss='categorical_crossentropy',
    metrics=['accuracy']
)

print("\n--- Sumário do Modelo ---")
model.summary()



--- Sumário do Modelo ---


In [None]:
# 5. TREINAMENTO DO MODELO
print(f"\n--- Iniciando Treinamento ({NUM_EPOCHS} Épocas) ---")

steps_per_epoch_train = TRAIN_SIZE // BATCH_SIZE
steps_per_epoch_val = (DATASET_SIZE - TRAIN_SIZE) // BATCH_SIZE

history = model.fit(
    train_ds,
    steps_per_epoch=steps_per_epoch_train,
    epochs=NUM_EPOCHS,
    validation_data=val_ds,
    validation_steps=steps_per_epoch_val
)

print("\nTreinamento concluído!")


--- Iniciando Treinamento (250 Épocas) ---
Epoch 1/250
[1m4/4[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m28s[0m 5s/step - accuracy: 0.1484 - loss: 2.1610 - val_accuracy: 0.1250 - val_loss: 2.1713
Epoch 2/250
[1m4/4[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m12s[0m 4s/step - accuracy: 0.1207 - loss: 2.2343 - val_accuracy: 0.0938 - val_loss: 2.0929
Epoch 3/250
[1m4/4[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 1s/step - accuracy: 0.1207 - loss: 2.0521 - val_accuracy: 0.1875 - val_loss: 2.0288
Epoch 4/250
[1m4/4[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 904ms/step - accuracy: 0.1810 - loss: 1.9658 - val_accuracy: 0.1875 - val_loss: 1.9779
Epoch 5/250
[1m4/4[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 1s/step - accuracy: 0.1897 - loss: 1.9413 - val_accuracy: 0.1875 - val_loss: 1.9349
Epoch 6/250
[1m4/4[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 1s/step - accuracy: 0.2422 - loss: 1.8426 - val_accuracy: 0.2188 - val_loss: 1.9006
Epo

# Validação

In [None]:
# Criei um conjunto de teste final a partir do seu dataset de validação
# Usei .unbatch() e .map() para preparar os dados para o Scikit-Learn
test_ds = val_ds.unbatch()

# Extrai as imagens e os rótulos verdadeiros
y_true = []
test_images = []

# Iterar sobre o Dataset para coletar os dados
# ATENÇÃO: Se o val_ds for muito grande, essa etapa pode levar tempo!
for image, label in test_ds:
    test_images.append(image.numpy())
    # O rótulo é um vetor one-hot, precisamos do índice (argmax)
    y_true.append(np.argmax(label.numpy()))

# Converte a lista de imagens de volta para um array NumPy
test_images = np.array(test_images)
y_true = np.array(y_true)


#Fazer as Previsões com o Modelo Treinado
# model.predict retorna as probabilidades (vetor one-hot)
y_pred_probs = model.predict(test_images, batch_size=BATCH_SIZE)

# Converte as probabilidades em classes (o índice de maior probabilidade)
y_pred = np.argmax(y_pred_probs, axis=1)

In [None]:
#  Gerar e Plotar a Matriz de Confusão
cm = confusion_matrix(y_true, y_pred)
class_names = CLASS_NAMES

print("\n Resultado da Matriz de Confusão")
print(cm)

# Plotagem Estilizada
plt.figure(figsize=(10, 8))
sns.heatmap(
    cm,
    annot=True,
    fmt='d',
    cmap='Blues',
    xticklabels=class_names,
    yticklabels=class_names
)
plt.title('Matriz de Confusão do Modelo MobileNetV2', fontsize=16)
plt.ylabel('Rótulo Verdadeiro', fontsize=12)
plt.xlabel('Previsão do Modelo', fontsize=12)
plt.yticks(rotation=0)
plt.show()