In [4]:
import numpy as np
from PIL import Image  # Para leer imágenes si no están ya en formato numpy
from sklearn.decomposition import PCA
import matplotlib.pyplot as plt


In [5]:
def obtener_componentes_principales(imagenes, n_componentes=None):
    """
    Calcula los componentes principales de un conjunto de imágenes.

    Args:
        imagenes (list or numpy.ndarray): Lista de imágenes (numpy arrays)
                                        o un numpy array de imágenes.
                                        Cada imagen debe ser de 30x30.
        n_componentes (int, optional): Número de componentes principales a mantener.
                                      Si es None, se mantienen todos.  Por defecto None.

    Returns:
        tuple: Un tuple que contiene:
            - pca (sklearn.decomposition.PCA): El objeto PCA ajustado a los datos.
            - componentes_principales (numpy.ndarray): Los componentes principales.
                                                     Cada fila es un componente principal.
            - imagenes_transformadas (numpy.ndarray): Las imágenes transformadas al espacio de componentes principales.
            - varianza_explicada (numpy.ndarray): La varianza explicada por cada componente.
    """

    # 1. Preparar los datos: Aplanar las imágenes y apilarlas en una matriz
    n_imagenes = len(imagenes)
    filas, columnas = imagenes[0].shape  # Deberían ser 30x30
    datos = np.zeros((n_imagenes, filas * columnas))

    for i, imagen in enumerate(imagenes):
        # Convertir a numpy array si no lo es
        if not isinstance(imagen, np.ndarray):
            imagen = np.array(imagen)  # Asumiendo que 'imagen' puede ser convertida a numpy array
        datos[i, :] = imagen.flatten()  # Aplanar cada imagen en una fila

    # 2. Crear y ajustar el modelo PCA
    pca = PCA(n_components=n_componentes)  # n_components=None para mantener todos

    # Ajustar el modelo a los datos y transformar los datos
    imagenes_transformadas = pca.fit_transform(datos)

    # 3. Obtener los componentes principales
    componentes_principales = pca.components_

    # 4. Obtener la varianza explicada
    varianza_explicada = pca.explained_variance_ratio_

    return pca, componentes_principales, imagenes_transformadas, varianza_explicada



In [6]:

def visualizar_componentes(componentes, filas, columnas, n_componentes_a_mostrar=10):
    """
    Visualiza los primeros n componentes principales como imágenes.

    Args:
        componentes (numpy.ndarray): Los componentes principales (PCA.components_).
        filas (int): Número de filas de la imagen original.
        columnas (int): Número de columnas de la imagen original.
        n_componentes_a_mostrar (int): Número de componentes a mostrar.
    """

    plt.figure(figsize=(12, 6))
    for i in range(min(n_componentes_a_mostrar, componentes.shape[0])):
        componente = componentes[i, :].reshape(filas, columnas)
        plt.subplot(2, 5, i + 1)  # Ajustar subplot según sea necesario
        plt.imshow(componente, cmap='gray')  # Usar cmap='gray' para imágenes en escala de grises
        plt.title(f"Componente {i + 1}")
        plt.axis('off')
    plt.tight_layout()
    plt.show()



In [7]:

# Ejemplo de uso:
if __name__ == "__main__":
    # 1. Cargar las imágenes (reemplazar con tu lógica de carga)
    # Ejemplo: Crear imágenes de prueba aleatorias (simulando la lectura de archivos)
    n_imagenes = 100
    filas, columnas = 30, 30
    imagenes = [np.random.randint(0, 256, size=(filas, columnas)) for _ in range(n_imagenes)]

    # Otra forma de cargar imagenes, utilizando la libreria PIL
    #imagenes = []
    #for i in range(n_imagenes):
    #    # Puedes reemplazar 'imagen_{i}.png' con la ruta real a tus imágenes
    #    try:
    #        imagen = Image.open(f'imagen_{i}.png').convert('L')  # 'L' para escala de grises
    #        imagenes.append(np.array(imagen))
    #    except FileNotFoundError:
    #        print(f"No se encontró la imagen imagen_{i}.png. Creando una imagen aleatoria en su lugar.")
    #        imagenes.append(np.random.randint(0, 256, size=(filas, columnas)))

    # 3. Imprimir información relevante
    print("Forma de los componentes principales:", componentes_principales.shape)  # Debería ser (n_componentes, 30*30)
    print("Varianza explicada por cada componente:", varianza_explicada)
    print("Suma de la varianza explicada:", np.sum(varianza_explicada)) # Debería acercarse a 1 si retienes suficientes componentes

    # 4. Visualizar los componentes principales
    visualizar_componentes(componentes_principales, filas, columnas, n_componentes_a_mostrar=10)

    # 5. Reconstruir una imagen usando los componentes principales (opcional)
    # Selecciona una imagen original
    indice_imagen = 0
    imagen_original = imagenes[indice_imagen]

    # Transforma la imagen al espacio de componentes principales
    imagen_transformada = imagenes_transformadas[indice_imagen]

    # Reconstruye la imagen desde los componentes principales
    imagen_reconstruida = pca.inverse_transform(imagen_transformada).reshape(filas, columnas)

    # Visualizar la imagen original y la reconstruida
    plt.figure(figsize=(8, 4))
    plt.subplot(1, 2, 1)
    plt.imshow(imagen_original, cmap='gray')
    plt.title("Imagen Original")
    plt.axis('off')

    plt.subplot(1, 2, 2)
    plt.imshow(imagen_reconstruida, cmap='gray')
    plt.title("Imagen Reconstruida")
    plt.axis('off')

    plt.tight_layout()
    plt.show()

NameError: name 'componentes_principales' is not defined