# 1. Exploração e Pré-processamento dos Dados

Neste notebook, vamos explorar o dataset de imagens de lixo eletrônico e aplicar as primeiras etapas de pré-processamento.

## 1.1. Importação das Bibliotecas

In [None]:
import os
import cv2
import numpy as np
import matplotlib.pyplot as plt
import yaml

## 1.2. Carregando as Configurações do Dataset

In [None]:
DATASET_PATH = '../dataset/
DATA_YAML_PATH = os.path.join(DATASET_PATH, 'data.yaml')

with open(DATA_YAML_PATH, 'r') as file:
    data_config = yaml.safe_load(file)

print("Configurações do dataset:")
print(data_config)

## 1.3. Exploração das Imagens

Vamos carregar e visualizar algumas imagens dos conjuntos de treino, validação e teste para entender suas características.

In [None]:
def display_sample_images(image_folder, num_images=3):
    plt.figure(figsize=(15, 5))
    image_files = [f for f in os.listdir(image_folder) if f.endswith(('.jpg', '.jpeg', '.png'))][:num_images]
    
    for i, image_file in enumerate(image_files):
        img_path = os.path.join(image_folder, image_file)
        img = cv2.imread(img_path)
        img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) # Converter de BGR para RGB para Matplotlib
        
        plt.subplot(1, num_images, i + 1)
        plt.imshow(img)
        plt.title(f'Imagem {i+1}')
        plt.axis('off')
        
    plt.show()

print("Amostras do conjunto de treino:")
display_sample_images(os.path.join(DATASET_PATH, data_config['train']))

print("
Amostras do conjunto de validação:")
display_sample_images(os.path.join(DATASET_PATH, data_config['val']))

print("
Amostras do conjunto de teste:")
display_sample_images(os.path.join(DATASET_PATH, data_config['test']))