PARTE 1: Pr√©-processamento e Organiza√ß√£o de Imagens M√©dicas
CardioIA - A Nova Era da Cardiologia Inteligente

Este notebook implementa o pipeline completo de pr√©-processamento de imagens m√©dicas
para classifica√ß√£o com CNN, incluindo:
- Download e explora√ß√£o do dataset
- Redimensionamento e normaliza√ß√£o
- Convers√£o de formatos
- Cria√ß√£o de conjuntos treino, valida√ß√£o e teste

In [1]:
import os
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from PIL import Image
import cv2
import shutil
from pathlib import Path
import json
from datetime import datetime

In [2]:
# Configura√ß√µes
SEED = 42
np.random.seed(SEED)

print("=" * 80)
print("PARTE 1: PR√â-PROCESSAMENTO E ORGANIZA√á√ÉO DE IMAGENS M√âDICAS")
print("CardioIA - A Nova Era da Cardiologia Inteligente")
print("=" * 80)
print(f"\nData de execu√ß√£o: {datetime.now().strftime('%d/%m/%Y %H:%M:%S')}")
print(f"Seed para reprodutibilidade: {SEED}\n")

PARTE 1: PR√â-PROCESSAMENTO E ORGANIZA√á√ÉO DE IMAGENS M√âDICAS
CardioIA - A Nova Era da Cardiologia Inteligente

Data de execu√ß√£o: 06/12/2025 22:46:56
Seed para reprodutibilidade: 42



In [7]:
# ============================================================================
# SE√á√ÉO 1: DOWNLOAD E EXPLORA√á√ÉO DO DATASET
# ============================================================================
print("\n" + "=" * 80)
print("SE√á√ÉO 1: DOWNLOAD E EXPLORA√á√ÉO DO DATASET")
print("=" * 80)

# dataset sint√©tico que simula radiografias de t√≥rax com classifica√ß√µes card√≠acas
# Em produ√ß√£o, voc√™ baixaria de: https://www.kaggle.com/datasets/

def criar_dataset_sintetico(num_amostras=200, tamanho_imagem=(224, 224)):
    """
    Cria um dataset sint√©tico de imagens m√©dicas para demonstra√ß√£o.
    Em um cen√°rio real, isso seria substitu√≠do pelo download do dataset real.
    
    Args:
        num_amostras: N√∫mero total de imagens a gerar
        tamanho_imagem: Dimens√µes das imagens (altura, largura)
    
    Returns:
        Dicion√°rio com informa√ß√µes das imagens e labels
    """
    print(f"\n‚úì Criando dataset sint√©tico com {num_amostras} imagens...")
    print(f"  Dimens√µes: {tamanho_imagem[0]}x{tamanho_imagem[1]} pixels")
    
    dataset_info = {
        'imagens': [],
        'labels': [],
        'caminhos': [],
        'descricoes': []
    }
    
    # Classes: 0 = Normal, 1 = Cardiomegalia, 2 = Outras Patologias
    classes = {
        0: 'Normal',
        1: 'Cardiomegalia',
        2: 'Outras_Patologias'
    }
    
    data_dir = Path('/home/ubuntu/CardioIA/data/raw_images')
    data_dir.mkdir(parents=True, exist_ok=True)
    
    # Criar subdiret√≥rios para cada classe
    for class_id, class_name in classes.items():
        class_dir = data_dir / class_name
        class_dir.mkdir(exist_ok=True)
    
    # Gerar imagens sint√©ticas
    amostras_por_classe = num_amostras // len(classes)
    
    for class_id, class_name in classes.items():
        for i in range(amostras_por_classe):
            # Gerar imagem sint√©tica (simulando radiografia)
            if class_id == 0:  # Normal
                # Imagem com padr√£o mais uniforme
                img = np.random.normal(100, 20, tamanho_imagem).astype(np.uint8)
            elif class_id == 1:  # Cardiomegalia
                # Imagem com √°rea card√≠aca aumentada (mais branca no centro)
                img = np.random.normal(80, 25, tamanho_imagem).astype(np.uint8)
                y, x = np.ogrid[:tamanho_imagem[0], :tamanho_imagem[1]]
                mask = (x - tamanho_imagem[1]//2)**2 + (y - tamanho_imagem[0]//2)**2 <= (tamanho_imagem[0]//3)**2
                img[mask] = np.clip(img[mask] + 50, 0, 255).astype(np.uint8)
            else:  # Outras patologias
                # Imagem com padr√£o irregular
                img = np.random.normal(90, 30, tamanho_imagem).astype(np.uint8)
                img = cv2.GaussianBlur(img, (5, 5), 0)
            
            # Salvar imagem
            img_path = data_dir / class_name / f'{class_name}_{i:04d}.png'
            Image.fromarray(img).save(str(img_path))
            
            dataset_info['imagens'].append(img)
            dataset_info['labels'].append(class_id)
            dataset_info['caminhos'].append(str(img_path))
            dataset_info['descricoes'].append(f'{class_name} - Amostra {i}')
    
    print(f"‚úì Dataset sint√©tico criado com sucesso!")
    print(f"  Total de imagens: {len(dataset_info['imagens'])}")
    for class_id, class_name in classes.items():
        count = sum(1 for l in dataset_info['labels'] if l == class_id)
        print(f"  - {class_name}: {count} imagens")
    
    return dataset_info, classes

# Criar dataset
dataset_info, classes = criar_dataset_sintetico(num_amostras=200, tamanho_imagem=(224, 224))


SE√á√ÉO 1: DOWNLOAD E EXPLORA√á√ÉO DO DATASET


In [10]:
# ============================================================================
# SE√á√ÉO 2: EXPLORA√á√ÉO E VISUALIZA√á√ÉO DO DATASET
# ============================================================================
print("\n" + "=" * 80)
print("SE√á√ÉO 2: EXPLORA√á√ÉO E VISUALIZA√á√ÉO DO DATASET")
print("=" * 80)

# Estat√≠sticas do dataset
print("\n‚úì Estat√≠sticas do Dataset:")
print(f"  Total de imagens: {len(dataset_info['imagens'])}")
print(f"  N√∫mero de classes: {len(classes)}")
print(f"  Dimens√µes das imagens: {dataset_info['imagens'][0].shape}")
print(f"  Tipo de dados: {dataset_info['imagens'][0].dtype}")

# Distribui√ß√£o de classes
print("\n‚úì Distribui√ß√£o de Classes:")
class_counts = pd.Series(dataset_info['labels']).value_counts().sort_index()
for class_id, count in class_counts.items():
    percentage = (count / len(dataset_info['labels'])) * 100
    print(f"  {classes[class_id]}: {count} ({percentage:.1f}%)")

# Visualizar amostras
fig, axes = plt.subplots(2, 3, figsize=(12, 8))
fig.suptitle('Amostras do Dataset - Pr√©-processamento', fontsize=14, fontweight='bold')

for idx, (ax, class_id) in enumerate(zip(axes.flatten(), [0, 0, 1, 1, 2, 2])):
    # Encontrar primeira imagem de cada classe
    img_idx = dataset_info['labels'].index(class_id)
    img = dataset_info['imagens'][img_idx]
    
    ax.imshow(img, cmap='gray')
    ax.set_title(f'{classes[class_id]}')
    ax.axis('off')

plt.tight_layout()
plt.savefig('../reports/01_amostras_dataset.png', dpi=150, bbox_inches='tight')
print("\n‚úì Visualiza√ß√£o salva: 01_amostras_dataset.png")
plt.close()


SE√á√ÉO 2: EXPLORA√á√ÉO E VISUALIZA√á√ÉO DO DATASET

‚úì Estat√≠sticas do Dataset:
  Total de imagens: 198
  N√∫mero de classes: 3
  Dimens√µes das imagens: (224, 224)
  Tipo de dados: uint8

‚úì Distribui√ß√£o de Classes:
  Normal: 66 (33.3%)
  Cardiomegalia: 66 (33.3%)
  Outras_Patologias: 66 (33.3%)

‚úì Visualiza√ß√£o salva: 01_amostras_dataset.png


In [14]:
# ============================================================================
# SE√á√ÉO 3: PR√â-PROCESSAMENTO DE IMAGENS
# ============================================================================
print("\n" + "=" * 80)
print("SE√á√ÉO 3: PR√â-PROCESSAMENTO DE IMAGENS")
print("=" * 80)

class PreprocessadorImagens:
    """
    Classe para centralizar todas as opera√ß√µes de pr√©-processamento de imagens.
    """
    
    def __init__(self, tamanho_alvo=(224, 224)):
        """
        Inicializa o preprocessador.
        
        Args:
            tamanho_alvo: Dimens√µes alvo para redimensionamento
        """
        self.tamanho_alvo = tamanho_alvo
        self.historico = []
    
    def redimensionar(self, imagem):
        """
        Redimensiona a imagem para o tamanho alvo usando interpola√ß√£o c√∫bica.
        
        Args:
            imagem: Array numpy da imagem
        
        Returns:
            Imagem redimensionada
        """
        img_redimensionada = cv2.resize(imagem, self.tamanho_alvo, interpolation=cv2.INTER_CUBIC)
        return img_redimensionada
    
    def normalizar(self, imagem):
        """
        Normaliza a imagem para o intervalo [0, 1].
        
        Args:
            imagem: Array numpy da imagem
        
        Returns:
            Imagem normalizada
        """
        img_normalizada = imagem.astype(np.float32) / 255.0
        return img_normalizada
    
    def padronizar(self, imagem, media=0.5, desvio=0.2):
        """
        Padroniza a imagem (z-score normalization).
        
        Args:
            imagem: Array numpy da imagem (normalizada entre 0 e 1)
            media: M√©dia para padroniza√ß√£o
            desvio: Desvio padr√£o para padroniza√ß√£o
        
        Returns:
            Imagem padronizada
        """
        img_padronizada = (imagem - media) / desvio
        return img_padronizada
    
    def aplicar_histogram_equalization(self, imagem):
        """
        Aplica equaliza√ß√£o de histograma para melhorar contraste.
        
        Args:
            imagem: Array numpy da imagem (valores 0-255)
        
        Returns:
            Imagem com contraste aprimorado
        """
        img_uint8 = (imagem * 255).astype(np.uint8) if imagem.max() <= 1 else imagem.astype(np.uint8)
        img_equalizado = cv2.equalizeHist(img_uint8)
        return img_equalizado.astype(np.float32) / 255.0
    
    def pipeline_completo(self, imagem, aplicar_equalizacao=True):
        """
        Aplica o pipeline completo de pr√©-processamento.
        
        Args:
            imagem: Array numpy da imagem
            aplicar_equalizacao: Se deve aplicar equaliza√ß√£o de histograma
        
        Returns:
            Imagem pr√©-processada
        """
        # 1. Redimensionar
        img = self.redimensionar(imagem)
        
        # 2. Aplicar equaliza√ß√£o (opcional)
        if aplicar_equalizacao:
            img = self.aplicar_histogram_equalization(img)
        
        # 3. Normalizar
        img = self.normalizar(img)
        
        # 4. Padronizar
        img = self.padronizar(img)
        
        return img
    
# Inicializar preprocessador
preprocessador = PreprocessadorImagens(tamanho_alvo=(224, 224))

print("\n‚úì T√©cnicas de Pr√©-processamento Implementadas:")
print("  1. Redimensionamento (interpola√ß√£o c√∫bica)")
print("  2. Equaliza√ß√£o de Histograma (para melhorar contraste)")
print("  3. Normaliza√ß√£o (escala 0-1)")
print("  4. Padroniza√ß√£o (z-score normalization)")

# Aplicar pr√©-processamento a todas as imagens
print("\n‚úì Aplicando pr√©-processamento a todas as imagens...")
imagens_processadas = []
for idx, img in enumerate(dataset_info['imagens']):
    img_processada = preprocessador.pipeline_completo(img)
    imagens_processadas.append(img_processada)
    if (idx + 1) % 50 == 0:
        print(f"  Processadas {idx + 1}/{len(dataset_info['imagens'])} imagens")

print(f"‚úì Pr√©-processamento conclu√≠do!")
print(f"  Forma das imagens processadas: {imagens_processadas[0].shape}")
print(f"  Tipo de dados: {imagens_processadas[0].dtype}")
print(f"  Intervalo de valores: [{imagens_processadas[0].min():.3f}, {imagens_processadas[0].max():.3f}]")

# Visualizar antes e depois
fig, axes = plt.subplots(3, 4, figsize=(14, 10))
fig.suptitle('Compara√ß√£o: Antes e Depois do Pr√©-processamento', fontsize=14, fontweight='bold')

for row, class_id in enumerate([0, 1, 2]):
    # Encontrar primeira imagem de cada classe
    img_idx = dataset_info['labels'].index(class_id)
    
    # Antes
    img_original = dataset_info['imagens'][img_idx]
    axes[row, 0].imshow(img_original, cmap='gray')
    axes[row, 0].set_title(f'{classes[class_id]} - Original')
    axes[row, 0].axis('off')
    
    # Redimensionado
    img_redim = preprocessador.redimensionar(img_original)
    axes[row, 1].imshow(img_redim, cmap='gray')
    axes[row, 1].set_title('Redimensionado')
    axes[row, 1].axis('off')
    
    # Com Equaliza√ß√£o
    img_eq = preprocessador.aplicar_histogram_equalization(img_redim)
    axes[row, 2].imshow(img_eq, cmap='gray')
    axes[row, 2].set_title('Com Equaliza√ß√£o')
    axes[row, 2].axis('off')
    
    # Processado Completo
    img_processada = imagens_processadas[img_idx]
    axes[row, 3].imshow(img_processada, cmap='gray')
    axes[row, 3].set_title('Processado Completo')
    axes[row, 3].axis('off')

plt.tight_layout()
plt.savefig('../reports/02_antes_depois_preprocessamento.png', dpi=150, bbox_inches='tight')
print("\n‚úì Visualiza√ß√£o salva: 02_antes_depois_preprocessamento.png")
plt.close()


SE√á√ÉO 3: PR√â-PROCESSAMENTO DE IMAGENS

‚úì T√©cnicas de Pr√©-processamento Implementadas:
  1. Redimensionamento (interpola√ß√£o c√∫bica)
  2. Equaliza√ß√£o de Histograma (para melhorar contraste)
  3. Normaliza√ß√£o (escala 0-1)
  4. Padroniza√ß√£o (z-score normalization)

‚úì Aplicando pr√©-processamento a todas as imagens...
  Processadas 50/198 imagens
  Processadas 100/198 imagens
  Processadas 150/198 imagens
‚úì Pr√©-processamento conclu√≠do!
  Forma das imagens processadas: (224, 224)
  Tipo de dados: float32
  Intervalo de valores: [-2.500, -2.480]

‚úì Visualiza√ß√£o salva: 02_antes_depois_preprocessamento.png


In [16]:
# ============================================================================
# SE√á√ÉO 4: CRIA√á√ÉO DE CONJUNTOS TREINO, VALIDA√á√ÉO E TESTE
# ============================================================================
print("\n" + "=" * 80)
print("SE√á√ÉO 4: CRIA√á√ÉO DE CONJUNTOS TREINO, VALIDA√á√ÉO E TESTE")
print("=" * 80)

# Converter para arrays numpy
X = np.array(imagens_processadas)
y = np.array(dataset_info['labels'])

print(f"\n‚úì Dados preparados para divis√£o:")
print(f"  X shape: {X.shape}")
print(f"  y shape: {y.shape}")

# Primeira divis√£o: 70% treino+valida√ß√£o, 30% teste
X_temp, X_test, y_temp, y_test = train_test_split(
    X, y, test_size=0.30, random_state=SEED, stratify=y
)

# Segunda divis√£o: 70% treino, 30% valida√ß√£o (do conjunto temp)
X_train, X_val, y_train, y_val = train_test_split(
    X_temp, y_temp, test_size=0.30, random_state=SEED, stratify=y_temp
)

print(f"\n‚úì Divis√£o dos Dados:")
print(f"  Treino:     {len(X_train)} imagens ({len(X_train)/len(X)*100:.1f}%)")
print(f"  Valida√ß√£o:  {len(X_val)} imagens ({len(X_val)/len(X)*100:.1f}%)")
print(f"  Teste:      {len(X_test)} imagens ({len(X_test)/len(X)*100:.1f}%)")

# Verificar distribui√ß√£o de classes em cada conjunto
print(f"\n‚úì Distribui√ß√£o de Classes por Conjunto:")
for conjunto_nome, y_conjunto in [('Treino', y_train), ('Valida√ß√£o', y_val), ('Teste', y_test)]:
    print(f"\n  {conjunto_nome}:")
    for class_id in range(len(classes)):
        count = np.sum(y_conjunto == class_id)
        percentage = (count / len(y_conjunto)) * 100
        print(f"    {classes[class_id]}: {count} ({percentage:.1f}%)")

# Salvar conjuntos em arquivos
print(f"\n‚úì Salvando conjuntos de dados...")

data_processed_dir = Path('/home/ubuntu/CardioIA/data/processed')
data_processed_dir.mkdir(parents=True, exist_ok=True)

np.save(str(data_processed_dir / 'X_train.npy'), X_train)
np.save(str(data_processed_dir / 'X_val.npy'), X_val)
np.save(str(data_processed_dir / 'X_test.npy'), X_test)
np.save(str(data_processed_dir / 'y_train.npy'), y_train)
np.save(str(data_processed_dir / 'y_val.npy'), y_val)
np.save(str(data_processed_dir / 'y_test.npy'), y_test)

print(f"‚úì Arquivos salvos em: {data_processed_dir}")

# Visualizar distribui√ß√£o
fig, axes = plt.subplots(1, 3, figsize=(14, 4))
fig.suptitle('Distribui√ß√£o de Classes nos Conjuntos de Dados', fontsize=14, fontweight='bold')

for ax, (conjunto_nome, y_conjunto) in zip(axes, [('Treino', y_train), ('Valida√ß√£o', y_val), ('Teste', y_test)]):
    class_counts = pd.Series(y_conjunto).value_counts().sort_index()
    class_names = [classes[i] for i in class_counts.index]
    
    bars = ax.bar(class_names, class_counts.values, color=['#3498db', '#e74c3c', '#f39c12'])
    ax.set_title(f'{conjunto_nome} (n={len(y_conjunto)})')
    ax.set_ylabel('N√∫mero de Imagens')
    ax.set_ylim(0, max(class_counts.values) * 1.2)
    
    # Adicionar valores nas barras
    for bar in bars:
        height = bar.get_height()
        ax.text(bar.get_x() + bar.get_width()/2., height,
                f'{int(height)}',
                ha='center', va='bottom', fontweight='bold')

plt.tight_layout()
plt.savefig('../reports/03_distribuicao_conjuntos.png', dpi=150, bbox_inches='tight')
print("‚úì Visualiza√ß√£o salva: 03_distribuicao_conjuntos.png")
plt.close()


SE√á√ÉO 4: CRIA√á√ÉO DE CONJUNTOS TREINO, VALIDA√á√ÉO E TESTE

‚úì Dados preparados para divis√£o:
  X shape: (198, 224, 224)
  y shape: (198,)

‚úì Divis√£o dos Dados:
  Treino:     96 imagens (48.5%)
  Valida√ß√£o:  42 imagens (21.2%)
  Teste:      60 imagens (30.3%)

‚úì Distribui√ß√£o de Classes por Conjunto:

  Treino:
    Normal: 32 (33.3%)
    Cardiomegalia: 32 (33.3%)
    Outras_Patologias: 32 (33.3%)

  Valida√ß√£o:
    Normal: 14 (33.3%)
    Cardiomegalia: 14 (33.3%)
    Outras_Patologias: 14 (33.3%)

  Teste:
    Normal: 20 (33.3%)
    Cardiomegalia: 20 (33.3%)
    Outras_Patologias: 20 (33.3%)

‚úì Salvando conjuntos de dados...
‚úì Arquivos salvos em: /home/ubuntu/CardioIA/data/processed
‚úì Visualiza√ß√£o salva: 03_distribuicao_conjuntos.png


In [17]:
# ============================================================================
# SE√á√ÉO 5: DOCUMENTA√á√ÉO DO PIPELINE
# ============================================================================
print("\n" + "=" * 80)
print("SE√á√ÉO 5: DOCUMENTA√á√ÉO DO PIPELINE")
print("=" * 80)

pipeline_info = {
    'data_execucao': datetime.now().isoformat(),
    'seed': SEED,
    'dataset': {
        'total_imagens': len(X),
        'dimensoes': list(X.shape),
        'classes': classes,
        'distribuicao': {
            'treino': {
                'total': int(len(X_train)),
                'percentual': float(len(X_train)/len(X)*100)
            },
            'validacao': {
                'total': int(len(X_val)),
                'percentual': float(len(X_val)/len(X)*100)
            },
            'teste': {
                'total': int(len(X_test)),
                'percentual': float(len(X_test)/len(X)*100)
            }
        }
    },
    'preprocessamento': {
        'tecnicas_aplicadas': [
            'Redimensionamento (interpola√ß√£o c√∫bica)',
            'Equaliza√ß√£o de Histograma',
            'Normaliza√ß√£o (0-1)',
            'Padroniza√ß√£o (z-score)'
        ],
        'tamanho_alvo': list(preprocessador.tamanho_alvo),
        'intervalo_valores': [float(X.min()), float(X.max())]
    }
}

# Salvar como JSON
with open('/home/ubuntu/CardioIA/data/processed/pipeline_info.json', 'w', encoding='utf-8') as f:
    json.dump(pipeline_info, f, indent=2, ensure_ascii=False)

print("\n‚úì Informa√ß√µes do Pipeline salvas em: pipeline_info.json")


SE√á√ÉO 5: DOCUMENTA√á√ÉO DO PIPELINE

‚úì Informa√ß√µes do Pipeline salvas em: pipeline_info.json


In [19]:
# ============================================================================
# RESUMO FINAL
# ============================================================================
print("\n" + "=" * 80)
print("RESUMO FINAL - PARTE 1")
print("=" * 80)

print(f"""
‚úì PR√â-PROCESSAMENTO CONCLU√çDO COM SUCESSO!

üìä Estat√≠sticas do Dataset:
   ‚Ä¢ Total de imagens: {len(X)}
   ‚Ä¢ Dimens√µes: {X.shape[1]}x{X.shape[2]} pixels
   ‚Ä¢ N√∫mero de canais: {X.shape[3] if len(X.shape) > 3 else 1}
   ‚Ä¢ N√∫mero de classes: {len(classes)}

üìÅ Divis√£o dos Dados:
   ‚Ä¢ Treino:     {len(X_train)} imagens ({len(X_train)/len(X)*100:.1f}%)
   ‚Ä¢ Valida√ß√£o:  {len(X_val)} imagens ({len(X_val)/len(X)*100:.1f}%)
   ‚Ä¢ Teste:      {len(X_test)} imagens ({len(X_test)/len(X)*100:.1f}%)

üîß T√©cnicas de Pr√©-processamento Aplicadas:
   1. Redimensionamento (interpola√ß√£o c√∫bica)
   2. Equaliza√ß√£o de Histograma
   3. Normaliza√ß√£o (escala 0-1)
   4. Padroniza√ß√£o (z-score normalization)

üìà Intervalo de Valores dos Dados:
   ‚Ä¢ M√≠nimo: {X.min():.4f}
   ‚Ä¢ M√°ximo: {X.max():.4f}
   ‚Ä¢ M√©dia: {X.mean():.4f}
   ‚Ä¢ Desvio Padr√£o: {X.std():.4f}

üíæ Arquivos Gerados:
   ‚Ä¢ X_train.npy, y_train.npy
   ‚Ä¢ X_val.npy, y_val.npy
   ‚Ä¢ X_test.npy, y_test.npy
   ‚Ä¢ pipeline_info.json

üìä Relat√≥rios Visuais:
   ‚Ä¢ 01_amostras_dataset.png
   ‚Ä¢ 02_antes_depois_preprocessamento.png
   ‚Ä¢ 03_distribuicao_conjuntos.png

‚úÖ Pr√≥ximo passo: Implementar modelos CNN (PARTE 2)
""")

print("=" * 80)
print("Fim da PARTE 1")
print("=" * 80)


RESUMO FINAL - PARTE 1

‚úì PR√â-PROCESSAMENTO CONCLU√çDO COM SUCESSO!

üìä Estat√≠sticas do Dataset:
   ‚Ä¢ Total de imagens: 198
   ‚Ä¢ Dimens√µes: 224x224 pixels
   ‚Ä¢ N√∫mero de canais: 1
   ‚Ä¢ N√∫mero de classes: 3

üìÅ Divis√£o dos Dados:
   ‚Ä¢ Treino:     96 imagens (48.5%)
   ‚Ä¢ Valida√ß√£o:  42 imagens (21.2%)
   ‚Ä¢ Teste:      60 imagens (30.3%)

üîß T√©cnicas de Pr√©-processamento Aplicadas:
   1. Redimensionamento (interpola√ß√£o c√∫bica)
   2. Equaliza√ß√£o de Histograma
   3. Normaliza√ß√£o (escala 0-1)
   4. Padroniza√ß√£o (z-score normalization)

üìà Intervalo de Valores dos Dados:
   ‚Ä¢ M√≠nimo: -2.5000
   ‚Ä¢ M√°ximo: -2.4804
   ‚Ä¢ M√©dia: -2.4900
   ‚Ä¢ Desvio Padr√£o: 0.0057

üíæ Arquivos Gerados:
   ‚Ä¢ X_train.npy, y_train.npy
   ‚Ä¢ X_val.npy, y_val.npy
   ‚Ä¢ X_test.npy, y_test.npy
   ‚Ä¢ pipeline_info.json

üìä Relat√≥rios Visuais:
   ‚Ä¢ 01_amostras_dataset.png
   ‚Ä¢ 02_antes_depois_preprocessamento.png
   ‚Ä¢ 03_distribuicao_conjuntos.png

‚úÖ 