# Primeiro rascunho das funções do modelo de difusão (PREPARAÇÃO DAS IMAGENS E TESTES)

## Importações e testes

In [None]:
import tensorflow as tf
import tensorflow_datasets as tfds
import os

# desativar erros de Cuda (verificar versão do tensorflow utilizada)
os.environ["CUDA_VISIBLE_DEVICES"] = "-1"
tf.config.set_visible_devices([], 'GPU')

2024-11-12 19:35:41.559092: I tensorflow/core/util/port.cc:153] oneDNN custom operations are on. You may see slightly different numerical results due to floating-point round-off errors from different computation orders. To turn them off, set the environment variable `TF_ENABLE_ONEDNN_OPTS=0`.
2024-11-12 19:35:41.559782: I external/local_xla/xla/tsl/cuda/cudart_stub.cc:32] Could not find cuda drivers on your machine, GPU will not be used.
2024-11-12 19:35:41.562368: I external/local_xla/xla/tsl/cuda/cudart_stub.cc:32] Could not find cuda drivers on your machine, GPU will not be used.
2024-11-12 19:35:41.568697: E external/local_xla/xla/stream_executor/cuda/cuda_fft.cc:477] Unable to register cuFFT factory: Attempting to register factory for plugin cuFFT when one has already been registered
E0000 00:00:1731440141.578992    1152 cuda_dnn.cc:8310] Unable to register cuDNN factory: Attempting to register factory for plugin cuDNN when one has already been registered
E0000 00:00:1731440141.58

In [2]:
# testar tensforflow:
print(tf.__version__)
tensor = tf.constant([1, 2, 3, 4, 5])
print(tensor)

2.18.0
tf.Tensor([1 2 3 4 5], shape=(5,), dtype=int32)


## 1. Carregar dataset

Aqui estamos assumindo que o conjunto de imagens vem como imagem + rotulo. O rotulo da imagem é o próprio nome do arquivo


In [3]:
# Definir constantes (rascunho)
IMG_SIZE = 256  
BATCH_SIZE = 32  
TRAIN_SPLIT = 0.8  
VAL_SPLIT = 0.2  

In [4]:
def load_and_preprocess_image(image, label):
    image = tf.image.resize(image, [IMG_SIZE, IMG_SIZE])
    
    image = tf.cast(image, tf.float32) / 255.0
    return image, label

### load_and_preprocess_image: Redimensiona e normaliza uma imagem. Retorna a imagem normalizada e o label/rotulo
    
- Parâmetros:
    - image: A imagem a ser processada.
    - label: O label associado à imagem.

- (Resize): função tf.cast(image, tf.float32): Converte os valores de pixel da imagem para float. Geralmente, imagens carregadas de arquivos têm valores de pixel inteiros entre 0 e 255. Para redes neurais, aparentemente trabalhar com float32 é a maneira mais comum.

- (Normalize): Divisão por 255.0 (normalização): Após a conversão, cada valor de pixel é dividido por 255.0 para ajustar o intervalo dos valores de pixel de [0, 255] para [0, 1]. 

## 2 Divisão em Conjuntos de Treinamento, Validação e Teste

In [5]:
def split_dataset(dataset, train_split=TRAIN_SPLIT, val_split=VAL_SPLIT):
    # Calcular o número total de exemplos
    total_examples = dataset.cardinality().numpy()
    
    # Calcular o número de exemplos para cada conjunto
    train_size = int(total_examples * train_split)
    val_size = int(total_examples * val_split)
    
    # Dividir o dataset
    train_ds = dataset.take(train_size)
    remaining_ds = dataset.skip(train_size)
    val_ds = remaining_ds.take(val_size)
    
    return train_ds, val_ds

### load_and_preprocess_image: Divide o conjunto de dados em treinamento, validação e teste. Retorna os conjuntos de treino e validação

- Parâmetros:
    - dataset: O conjunto de dados completo.
    - train_split: Proporção de dados para treinamento.
    - val_split: Proporção de dados para validação.

total_examples: A primeira coisa que a função faz é calcular o número total de exemplos presentes no dataset usando a propriedade .cardinality(), que retorna o número de elementos no tf.data.Dataset. Esse valor é convertido para numpy() para ser manipulado como um número inteiro.

## 3. Carregar e Pré-processar a Base de Dados, Dividir Conjuntos e Preparar Pipeline para Treinamento

In [6]:
def prepare_dataset(batch_size=BATCH_SIZE):
    # Carregar o dataset CIFAR-10 (apenas dados de treino)
    dataset, info = tfds.load('cifar10', split='train', as_supervised=True, with_info=True)
    
    # Aplicar pré-processamento em cada exemplo do dataset
    dataset = dataset.map(load_and_preprocess_image, num_parallel_calls=tf.data.AUTOTUNE)
    
    # Dividir o dataset
    train_ds, val_ds = split_dataset(dataset)
    
    # Configurar o conjunto de treinamento e validação com embaralhamento, batch e prefetching -  estudar casos de uso e importância
    train_ds = train_ds.shuffle(1000).batch(batch_size).prefetch(tf.data.AUTOTUNE)
    val_ds = val_ds.batch(batch_size).prefetch(tf.data.AUTOTUNE)
    
    return train_ds, val_ds

### prepare_dataset: Prepara o dataset para o treinamento, incluindo carregamento, pré-processamento e divisão. Retorna o dataset de treino e o de validação
    
- Parâmetros:
    - batch_size: Tamanho do batch.

- shuffle: Garante que o modelo não aprenda padrões artificiais devido à ordem dos dados. Se os dados forem processados na ordem em que foram carregados, pode haver correlação entre exemplos consecutivos (como, por exemplo, uma sequência de imagens de uma única classe). Isso pode levar a overfitting ou a um treinamento menos eficaz.

- batching: Divide o dataset em pequenos batches ou lotes de dados. Cada lote contém um número fixo de exemplos, que são processados juntos durante a fase de treinamento. O batching é essencial para permitir que o modelo seja treinado em grandes volumes de dados sem sobrecarregar a memória.

- prefetch: Carrega os próximos batches de dados enquanto o modelo ainda está treinando no batch atual. Isso garante que o modelo tenha dados prontos para o próximo passo de treinamento sem esperar pelo carregamento.

## 4*. Testar funções

1.  Testar implementação da função load_and_preprocess_image com nomes genericos
2. Testar implementação para nomes que representam mais detalhadamente a imagem

In [None]:
image_filenames = ["cats_00001.png", "cats_00002.png", "cats_00003.png",
                   "dogs_00001.png", "dogs_00002", "dogs_00003",
                   "panda_00001.png", "panda_00002.png", "panda_00003.png"] 

# dataset = tf.data.Dataset.from_tensor_slices(image_filenames)
# dataset = dataset.map(lambda x: load_image_from_name(x), num_parallel_calls=tf.data.AUTOTUNE)

In [None]:
train_ds, val_ds = prepare_dataset()

for images, labels in train_ds.take(1):
    print("Batch de imagens (forma):", images.shape)
    print("Labels correspondentes:", labels.numpy())