In [None]:
import os
import random
from sklearn.model_selection import train_test_split
from torchvision import datasets, transforms
from torch.utils.data import DataLoader, Subset

output_dir = "/mnt/d/Documentos Gustavo/TCC/processed_heatmaps"

# Listar IDs dos pacientes
healthy_patients = [p for p in os.listdir(os.path.join(output_dir, "Healthy")) if os.path.isdir(os.path.join(output_dir, "Healthy", p))]
sick_patients = [p for p in os.listdir(os.path.join(output_dir, "Sick")) if os.path.isdir(os.path.join(output_dir, "Sick", p))]

# Garantir aleatoriedade na separação
random.seed(42)
random.shuffle(healthy_patients)
random.shuffle(sick_patients)

# Definir proporção (70% treino, 15% validação, 15% teste)
train_healthy, temp_healthy = train_test_split(healthy_patients, test_size=0.3, random_state=42)
val_healthy, test_healthy = train_test_split(temp_healthy, test_size=0.5, random_state=42)

train_sick, temp_sick = train_test_split(sick_patients, test_size=0.3, random_state=42)
val_sick, test_sick = train_test_split(temp_sick, test_size=0.5, random_state=42)

# Transformação das imagens
transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Resize((224, 224)),
    transforms.Normalize(mean=[0.5, 0.5, 0.5], std=[0.5, 0.5, 0.5])
])

# Criar dataset completo
dataset = datasets.ImageFolder(root=output_dir, transform=transform)

# Função para obter índices de imagens pertencentes a pacientes específicos
def get_patient_indices(dataset, selected_patients, max_samples):
    indices = []
    for i, (path, _) in enumerate(dataset.samples):
        paciente_id = os.path.basename(os.path.dirname(path))  # Extrai "p01", "p02", etc.

        if paciente_id in selected_patients:
            indices.append(i)
    
    # Garantir que pegamos exatamente 'max_samples' aleatórios
    return random.sample(indices, min(max_samples, len(indices)))

# Obter os índices das imagens de acordo com os pacientes
train_indicesH = get_patient_indices(dataset, train_healthy, 500)
val_indicesH = get_patient_indices(dataset, val_healthy, 250)
test_indicesH = get_patient_indices(dataset, test_healthy, 250)

train_indicesS = get_patient_indices(dataset, train_sick, 500)
val_indicesS = get_patient_indices(dataset, val_sick, 250)
test_indicesS = get_patient_indices(dataset, test_sick, 250)

# Juntar Healthy + Sick para cada conjunto
train_indices = train_indicesH + train_indicesS
val_indices = val_indicesH + val_indicesS
test_indices = test_indicesH + test_indicesS

# Criando datasets e DataLoaders
train_dataset = Subset(dataset, train_indices)
val_dataset = Subset(dataset, val_indices)
test_dataset = Subset(dataset, test_indices)

train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True)
val_loader = DataLoader(val_dataset, batch_size=32, shuffle=False)
test_loader = DataLoader(test_dataset, batch_size=32, shuffle=False)

# Exibir quantidades finais
print(f"Tamanho do conjunto de treino: {len(train_dataset)}")
print(f"Tamanho do conjunto de validação: {len(val_dataset)}")
print(f"Tamanho do conjunto de teste: {len(test_dataset)}")


<torch.utils.data.dataset.Subset object at 0x7fc62a3801a0>
Tamanho do conjunto de treino: 1000
Tamanho do conjunto de validação: 500
Tamanho do conjunto de teste: 500


In [None]:
import os

# Caminho do diretório onde estão as imagens
input_dir = "/mnt/d/Documentos Gustavo/TCC/processed_heatmaps - Copia"
output_dir = "/mnt/d/Documentos Gustavo/TCC/processed_heatmaps3"

# Percorrer todas as subpastas
for root, _, files in os.walk(diretorio):
    for file in files:
        partes = file.split(".")  # Divide o nome do arquivo por "."
        
        if len(partes) > 2 and partes[2] != "1":
            caminho_arquivo = os.path.join(root, file)
            os.remove(caminho_arquivo)  # Remove o arquivo
            print(f"🗑️ Removido: {caminho_arquivo}")

print("✅ Remoção concluída!")


🗑️ Removido: /mnt/d/Documentos Gustavo/TCC/processed_heatmaps - Copia/Healthy/p01/T0001.1.2.S.2012-10-08.00.jpg
🗑️ Removido: /mnt/d/Documentos Gustavo/TCC/processed_heatmaps - Copia/Healthy/p01/T0001.1.3.D.2012-10-08.00.jpg
🗑️ Removido: /mnt/d/Documentos Gustavo/TCC/processed_heatmaps - Copia/Healthy/p01/T0001.1.3.S.2012-10-08.00.jpg
🗑️ Removido: /mnt/d/Documentos Gustavo/TCC/processed_heatmaps - Copia/Healthy/p01/T0001.1.4.S.2012-10-08.00.jpg
🗑️ Removido: /mnt/d/Documentos Gustavo/TCC/processed_heatmaps - Copia/Healthy/p01/T0001.1.5.D.2012-10-08.00.jpg
🗑️ Removido: /mnt/d/Documentos Gustavo/TCC/processed_heatmaps - Copia/Healthy/p01/T0001.1.5.S.2012-10-08.00.jpg
🗑️ Removido: /mnt/d/Documentos Gustavo/TCC/processed_heatmaps - Copia/Healthy/p02/T0002.1.2.S.2012-10-08.00.jpg
🗑️ Removido: /mnt/d/Documentos Gustavo/TCC/processed_heatmaps - Copia/Healthy/p02/T0002.1.3.D.2012-10-08.00.jpg
🗑️ Removido: /mnt/d/Documentos Gustavo/TCC/processed_heatmaps - Copia/Healthy/p02/T0002.1.3.S.2012-10-08