In [9]:
import pandas as pd
import numpy as np
from PIL import Image
import os
import pywt
from natsort import natsorted

In [10]:
IMG_PATH = 'data/'

In [11]:
def get_vector_from_image(image, iterations):
    """
    get_vector_from_image obtiene el vector característico de la imagen image

    :param image: Imagen en formato vector.
    :param iterations: Entero que indica la cantidad de veces que se aplica el wavelet a la imagen.
    :return LL.flatten(): Vector característico en 1D.
    """
    LL, (LH, HL, HH) = pywt.dwt2(image, 'haar')
    for _ in range(iterations - 1):
        LL, (LH, HL, HH) = pywt.dwt2(LL, 'haar')
    return LL.flatten()


In [12]:
def generate_data(src_dir, iterations, width=100, height=100):

    data = []

    for train_img in natsorted(os.listdir(src_dir + 'images/')):
        image_path = f"{src_dir}/images/{train_img}"
        img = Image.open(image_path)
        newsize = (width, height)
        img = img.resize(newsize)
        fv = get_vector_from_image(img, iterations)
        data.append(fv)
        np.savetxt(f"{src_dir}/{iterations}_cortes/{train_img[:-4]}.csv", fv, delimiter=',', fmt='%d')
    print(f"Tamaño del vector caracteristica con {iterations} cortes: {len(fv)}")
    return np.asarray(data)


In [13]:
for i in range(3,9):
    data = generate_data(src_dir= IMG_PATH, iterations=i, width=100, height=100)

Tamaño del vector caracteristica con 3 cortes: 1300
Tamaño del vector caracteristica con 4 cortes: 700
Tamaño del vector caracteristica con 5 cortes: 400
Tamaño del vector caracteristica con 6 cortes: 200
Tamaño del vector caracteristica con 7 cortes: 100
Tamaño del vector caracteristica con 8 cortes: 100
