In [3]:
import os
from PIL import Image

In [4]:
# Caminho para a pasta das imagens
dataset_path = os.path.join('/content/drive/My Drive', 'melanoma_dataset')

In [5]:
# Verifica a quantidade de arquivos dentro das pastas e subpastas do dataset

def count_files(path):
  """Conta os arquivos em uma pasta e suas subpastas."""
  total = 0
  for dirpath, dirnames, filenames in os.walk(path):
    count = len(filenames)
    total += count
    print(f'{dirpath}: {count} arquivos')
  print(f'Total de arquivos: {total}')

count_files(dataset_path)


/content/drive/My Drive/melanoma_dataset: 0 arquivos
/content/drive/My Drive/melanoma_dataset/train: 0 arquivos
/content/drive/My Drive/melanoma_dataset/train/Malignant: 5630 arquivos
/content/drive/My Drive/melanoma_dataset/train/Benign: 6329 arquivos
/content/drive/My Drive/melanoma_dataset/test: 0 arquivos
/content/drive/My Drive/melanoma_dataset/test/Malignant: 1000 arquivos
/content/drive/My Drive/melanoma_dataset/test/Benign: 1000 arquivos
Total de arquivos: 13959


In [6]:
def get_image_dimensions(image_path):
  """Retorna as dimensões de uma imagem."""
  try:
    img = Image.open(image_path)
    width, height = img.size
    print(f"Dimensões da imagem {image_path}: {width}x{height}")
    return width, height
  except Exception as e:
    print(f"Erro ao abrir a imagem {image_path}: {e}")
    return None

# Teste de uma imagem:
image_path = os.path.join(dataset_path, 'test', 'Benign', '6299.jpg')
get_image_dimensions(image_path)


Dimensões da imagem /content/drive/My Drive/melanoma_dataset/test/Benign/6299.jpg: 224x224


(224, 224)

In [7]:
# Dimensões esperadas das imagens
width_esperada = 224
height_esperada = 224

In [8]:
# Listas para armazenar informações sobre imagens inconsistentes e corrompidas
imagens_inconsistentes = []
imagens_corrompidas = []


In [9]:
# Iterar sobre as pastas 'train' e 'test'
for subset in ['train', 'test']:
    subset_path = os.path.join(dataset_path, subset)

    # Iterar sobre as pastas 'Benign' e 'Malignant' dentro de cada subset
    for classe in ['Benign', 'Malignant']:
        classe_path = os.path.join(subset_path, classe)

        # Iterar sobre as imagens dentro de cada pasta
        for filename in os.listdir(classe_path):
            if filename.endswith(('.jpg', '.jpeg', '.png')):
                image_path = os.path.join(classe_path, filename)

                try:
                    # Abrir a imagem e verificar suas dimensões
                    img = Image.open(image_path)
                    width, height = img.size

                    if width != width_esperada or height != height_esperada:
                        imagens_inconsistentes.append(
                            {
                                "image_id": filename,
                                "subset": subset,
                                "classe": classe,
                                "width": width,
                                "height": height,
                            }
                        )

                except Exception as e:
                    print(f"Erro ao abrir a imagem {filename}: {e}")
                    imagens_corrompidas.append(
                        {"image_id": filename, "subset": subset, "classe": classe}
                    )

In [10]:
# Mostrar informações sobre imagens inconsistentes
if imagens_inconsistentes:
    print("\nImagens com dimensões inconsistentes:")
    for img_info in imagens_inconsistentes:
        print(img_info)
else:
    print("\nNenhuma imagem com dimensões inconsistentes encontrada.")


Nenhuma imagem com dimensões inconsistentes encontrada.


In [11]:
# Mostrar informações sobre imagens corrompidas
if imagens_corrompidas:
    print("\nImagens que não puderam ser abertas (potencialmente corrompidas):")
    for img_info in imagens_corrompidas:
        print(img_info)
else:
    print("\nNenhuma imagem potencialmente corrompida encontrada.")


Nenhuma imagem potencialmente corrompida encontrada.
