In [1]:
import os
import tensorflow as tf
from tensorflow.keras.preprocessing.image import ImageDataGenerator
import numpy as np
import random
import matplotlib.pyplot as plt
%matplotlib inline

2024-03-09 07:59:18.707525: E external/local_xla/xla/stream_executor/cuda/cuda_dnn.cc:9261] Unable to register cuDNN factory: Attempting to register factory for plugin cuDNN when one has already been registered
2024-03-09 07:59:18.707625: E external/local_xla/xla/stream_executor/cuda/cuda_fft.cc:607] Unable to register cuFFT factory: Attempting to register factory for plugin cuFFT when one has already been registered
2024-03-09 07:59:18.767480: E external/local_xla/xla/stream_executor/cuda/cuda_blas.cc:1515] Unable to register cuBLAS factory: Attempting to register factory for plugin cuBLAS when one has already been registered
2024-03-09 07:59:18.894173: I tensorflow/core/platform/cpu_feature_guard.cc:182] This TensorFlow binary is optimized to use available CPU instructions in performance-critical operations.
To enable the following instructions: AVX2 FMA, in other operations, rebuild TensorFlow with the appropriate compiler flags.


In [2]:
def reduce_images(folder_path, target_num_images=400):
    # Obtener la lista de archivos en la carpeta
    file_list = [f for f in os.listdir(folder_path) if f.lower().endswith(('.png', '.jpg', '.jpeg'))]

    # Verificar si hay más de 400 imágenes
    if len(file_list) <= target_num_images:
        print("El número actual de imágenes es igual o menor a 400. No se requiere reducción.")
        return

    # Calcular cuántas imágenes eliminar
    num_images_to_remove = len(file_list) - target_num_images

    # Eliminar imágenes al azar hasta que quede solo 400
    images_to_remove = random.sample(file_list, num_images_to_remove)
    i=1
    for image_file in images_to_remove:
        image_path = os.path.join(folder_path, image_file)
        os.remove(image_path)
        print(f"{i} Imagen eliminada: {image_file}")
        i = i + 1

    print(f"Se ha reducido el número de imágenes a {target_num_images}.")

In [3]:
def data_augmentation(folder_path, num_images=150):
    # Obtener la lista de archivos en la carpeta
    file_list = [f for f in os.listdir(folder_path) if f.lower().endswith(('.png', '.jpg', '.jpeg'))]

    # Escoger aleatoriamente 150 imágenes
    selected_images = random.sample(file_list, min(num_images, len(file_list)))

    # Configuración para augmentación usando ImageDataGenerator de TensorFlow
    datagen = ImageDataGenerator(
        rotation_range=20,
        width_shift_range=0.1,
        height_shift_range=0.1,
        shear_range=0.2,
        zoom_range=0.2,
        horizontal_flip=True,
        fill_mode='nearest'
    )
    i=1
    # Iterar sobre las imágenes seleccionadas
    for image_file in selected_images:
        image_path = os.path.join(folder_path, image_file)
        img = tf.keras.preprocessing.image.load_img(image_path)
        img_array = tf.keras.preprocessing.image.img_to_array(img)
        img_array = np.expand_dims(img_array, axis=0)

        # Crear un generador de imágenes augmentadas
        aug_iter = datagen.flow(img_array, batch_size=1)

        # Obtener la única imagen aumentada rotada
        augmented_img = aug_iter.next()[0].astype(np.uint8)

        # Guardar la imagen aumentada en la misma carpeta
        base_name, ext = os.path.splitext(image_file)
        new_file_name = f"{base_name}_aug{ext}"
        new_file_path = os.path.join(folder_path, new_file_name)
        tf.keras.preprocessing.image.save_img(new_file_path, augmented_img)

        print(f"{i} Data augmentation completada para la imagen: {image_file}")
        i = i+1

In [7]:
path = "./data/archive/train/sano_pecho"

In [14]:
reduce_images(path, target_num_images=400)

1 Imagen eliminada: telangiectasias-17.jpg
2 Imagen eliminada: venous-lake-31.jpg
3 Imagen eliminada: angiokeratomas-38.jpg
4 Imagen eliminada: hemangioma-traumatized-2.jpg
5 Imagen eliminada: telangiectasias-56.jpg
6 Imagen eliminada: spider-angioma-16.jpg
7 Imagen eliminada: av-malformation-1.jpg
8 Imagen eliminada: hemangioma-infancy-55.jpg
9 Imagen eliminada: venous-malformations-46.jpg
10 Imagen eliminada: angiokeratomas-28.jpg
11 Imagen eliminada: lymphangioma-circumscriptum-9.jpg
12 Imagen eliminada: pyogenic-granuloma-13.jpg
13 Imagen eliminada: hemangioma-9.jpg
14 Imagen eliminada: hemangioma-234.jpg
15 Imagen eliminada: kaposi-sarcoma-29.jpg
16 Imagen eliminada: telangiectasias-27.jpg
17 Imagen eliminada: pyogenic-granuloma-107.jpg
18 Imagen eliminada: av-malformation-4.jpg
19 Imagen eliminada: pyogenic-granuloma-41.jpg
20 Imagen eliminada: kaposi-sarcoma-3.jpg
21 Imagen eliminada: angiokeratomas-16.jpg
22 Imagen eliminada: hemangioma-infancy-13.jpg
23 Imagen eliminada: telan

In [8]:

data_augmentation(path, num_images=60)


1 Data augmentation completada para la imagen: Captura desde 2024-03-09 07-21-24.png
2 Data augmentation completada para la imagen: Captura desde 2024-03-09 07-36-40.png
3 Data augmentation completada para la imagen: Captura desde 2024-03-09 06-45-55.png
4 Data augmentation completada para la imagen: Captura desde 2024-03-09 07-18-12.png
5 Data augmentation completada para la imagen: Captura desde 2024-03-09 07-23-19.png
6 Data augmentation completada para la imagen: Captura desde 2024-03-09 06-52-06.png
7 Data augmentation completada para la imagen: Captura desde 2024-03-09 07-02-00.png
8 Data augmentation completada para la imagen: Captura desde 2024-03-09 06-43-52.png
9 Data augmentation completada para la imagen: Captura desde 2024-03-09 07-09-02.png
10 Data augmentation completada para la imagen: Captura desde 2024-03-09 07-17-18.png
11 Data augmentation completada para la imagen: Captura desde 2024-03-09 07-21-29.png
12 Data augmentation completada para la imagen: Captura desde 2