# Atividade 04 - Entrega 01 - Bootcamp Machine Learning Atlântico Avanti
## Equipe 04 - Flood Area Segmentation

### Integridade dos Arquivos 
■ Verifique se todas as imagens listadas no arquivo de informações 
realmente existem no diretório de imagens e vice-versa. 

### Qualidade das Imagens
■​ Identifique imagens corrompidas que não podem ser abertas ou
processadas.

In [None]:
import os
import hashlib
from PIL import Image

def verify_images(directory, generate_hashes=False):
    corrupted_files = []
    valid_hashes = {}
    
    # Percorre os arquivos no diretório recursivamente
    for root, dirs, files in os.walk(directory):
        for file in files:
            file_path = os.path.join(root, file)
            
            # Tratamento de exceções para leitura dos arquivos
            try:
                with open(file_path, 'rb') as f:
                    content = f.read()
                    if generate_hashes:
                        file_hash = hashlib.sha256(content).hexdigest() # Gera arquivo hash para cada imagem lida
                        valid_hashes[file] = file_hash # Armazena no dicionário
            except IOError:
                corrupted_files.append(file_path) # Armazena o caminho do arquivo se ele estiver corrompido
                continue
            
            # Tratamento de exceções para integridade do arquivo
            try:
                with Image.open(file_path) as img:
                    img.verify() # Verificação básica da integridade do arquivo
                with Image.open(file_path) as img:
                    img.load() # Carrega o arquivo na memória
                    img.transpose(Image.FLIP_LEFT_RIGHT) # Realiza testes adicionais de integridade
            except (IOError, OSError, Image.DecompressionBombError) as erro:
                corrupted_files.append(file_path) # Caso o arquivo esteja corrompido, adiciona o caminho dele em uma lista
                print(f"Arquivo corrompido: {file_path} - Erro: {str(erro)}") # Printa o código de erro para o arquivo corrompido
        
        #Retorno da função    
        return {
            'total_files': len(files),
            'corrupted_files': corrupted_files,
            'valid_hashes': valid_hashes if generate_hashes else None
        }

if __name__ == "__main__":
    diretorio_image = "/home/gabriel/Desktop/Gabriel/Codes/avanti-ML-course/Image" # Alterar path dos arquivos Image
    diretorio_mask = "/home/gabriel/Desktop/Gabriel/Codes/avanti-ML-course/Mask" # Alterar path  dos arquivos Mask
 
    print(f"Verificando existência dos diretórios:")
    print(f"Diretório de imagens existe: {"Sim" if os.path.exists(diretorio_image) else "Não"}")
    print(f"Diretório de máscaras existe: {"Sim" if os.path.exists(diretorio_mask) else "Não"}")
    
    report_image = verify_images(diretorio_image, generate_hashes=True)
    report_mask = verify_images(diretorio_mask, generate_hashes=True)
    
    print()
    print("Relatório de Integridade:")
    print(f"Arquivos de imagem: {report_image['total_files']} verificados")
    print(f"Arquivos de máscara: {report_mask['total_files']} verificados")
    print(f"Total geral: {report_image['total_files'] + report_mask['total_files']} arquivos\n")
    
 # Integridade pasta Image   
    if report_image['corrupted_files']:
        print("Lista de arquivos corrompidos:")
        for corrupted in report_image['corrupted_files']:
            print(f" - {corrupted}")
        print()
    else:
        print("Não foram encontrados arquivos da pasta Image corrompidos!\n")
   
    if report_image['valid_hashes']:
        print(f"Hashes válidos gerados para {len(report_image['valid_hashes'])} arquivos da pasta Image\n")
            
# Integridade pasta Mask
    if report_mask['corrupted_files']:
        print("Lista de arquivos corrompidos:")
        for corrupted in report_mask['corrupted_files']:
            print(f" - {corrupted}")
        print()
    else:
        print("Não foram encontrados arquivos da pasta Mask corrompidos!\n")
    
    if report_mask['valid_hashes']:
        print(f"Hashes válidos gerados para {len(report_mask['valid_hashes'])} arquivos da pasta Mask\n")

Verificando existência dos diretórios:
Diretório de imagens existe: Sim
Diretório de máscaras existe: Sim

Relatório de Integridade:
Arquivos de imagem: 290 verificados
Arquivos de máscara: 290 verificados
Total geral: 580 arquivos

Não foram encontrados arquivos da pasta Image corrompidos!

Hashes válidos gerados para 290 arquivos da pasta Image

Não foram encontrados arquivos da pasta Mask corrompidos!

Hashes válidos gerados para 290 arquivos da pasta Mask



■ Verifique se todas as imagens estão no mesmo formato, ex: JPEG, 
PNG, etc. 

In [2]:
# A ser implemetado