In [1371]:
from PIL import Image
from pathlib import Path
import numpy as np
import os

os.chdir(r"C:\Users\Denis Wu\Desktop\TP2-Metodos")

print("Ahora estás en:", os.getcwd())


Ahora estás en: C:\Users\Denis Wu\Desktop\TP2-Metodos


Función para vectorizar la imagen en 256x256x1

In [1372]:
def vectorizar_imagen(ruta, size=(256, 256), normalizar=False):
    img = Image.open(ruta) 
    img = img.resize(size) # redimensiona la imagen
    gray = img.convert('L') # transforma a escala de grises
    vector = np.array(gray).flatten().reshape(-1, 1)
    
    if normalizar: # normalizar el vector
        vector = vector / 255.0

    return vector

Función para calcular la predicción del modelo

In [1373]:
def prediccion(i, w, b):
    z = np.dot(w.T, i) + b  # w.T tiene shape (1, 65536)
    return ((np.tanh(z) + 1) / 2).item()

Función para calcular el error cuadrático dado un w y b, utilizando el modelo propuesto

In [1374]:
def error_cuadratico(carpeta, w, b, size=(256, 256), normalizar=False):
    error_total = 0.0
    contador = 0
    
    for archivo in os.listdir(carpeta):
        if archivo.lower().endswith(('.png', '.jpg', '.jpeg')):
            # si tiene parkison, el diagnóstico es positivo (1), sino es negativo (0)
            if archivo.startswith("Healthy"): 
                d = 0
            elif archivo.startswith("Parkinson"):
                d = 1
            ruta = os.path.join(carpeta, archivo)
            i = vectorizar_imagen(ruta, size=size, normalizar=normalizar)
            pred = prediccion(i, w, b) # calculo la predicción
            error_total += (pred - d) ** 2 # sumo el error parcial al total
            contador += 1

    return error_total / contador

Función para calcular la derivada parcial contra w de la función de pérdida

In [1375]:
def derivada_parcial_w(carpeta, w, b, size=(256, 256), normalizar=False):
    derivada_w_total = np.zeros_like(w)
    
    for archivo in os.listdir(carpeta):
        if archivo.lower().endswith(('.png', '.jpg', '.jpeg')):
            if archivo.startswith("Healthy"):
                d = 0
            elif archivo.startswith("Parkinson"):
                d = 1

            ruta = os.path.join(carpeta, archivo)
            i = vectorizar_imagen(ruta, size=size, normalizar=normalizar)
            z = np.dot(w.T, i) + b
            t0 = np.tanh(z)
            pred = (t0 + 1) / 2
            derivada_w_total += (1 - t0**2) * (pred - d) * i
    
    return derivada_w_total

Función para calcular la derivada parcial contra b de la función de pérdida

In [1376]:
def derivada_parcial_b(carpeta, w, b, size=(256, 256), normalizar=False):
    derivada_b_total = 0.0

    for archivo in os.listdir(carpeta):
        if archivo.lower().endswith(('.png', '.jpg', '.jpeg')):
            if archivo.startswith("Healthy"):
                d = 0
            elif archivo.startswith("Parkinson"):
                d = 1
            ruta = os.path.join(carpeta, archivo)
            i = vectorizar_imagen(ruta, size=size, normalizar=normalizar)
            z = np.dot(w.T, i) + b
            t0 = np.tanh(z)
            pred = (t0 + 1) / 2
            derivada_b_total += (1 - t0**2) * (pred - d)
    
    return (derivada_b_total).item()

Función para aplicar la regla de actualización para w y b

In [1377]:
def actualizacion(carpeta, w, b, alpha, size=(256, 256), normalizar=False):
    derivada_w = derivada_parcial_w(carpeta, w, b, size=size, normalizar=normalizar)
    derivada_b = derivada_parcial_b(carpeta, w, b, size=size, normalizar=normalizar)
    w_nuevo = w - alpha * derivada_w
    b_nuevo = b - alpha * derivada_b
    return w_nuevo, b_nuevo

Función para recorrer por una única iteración el algoritmo de búsqueda

Función para repetir el método de descenso de gradiente por cierta cantidad de iteraciones

In [1378]:
def entrenar_descenso_gradiente(carpeta, w_inicial, b_inicial, alpha, size=(256, 256), normalizar=False, repeticiones=10, epsilon=0.0000001):
    w = w_inicial.copy()
    b = b_inicial
    
    # Listas para almacenar el historial de errores
    errores_entrenamiento = []
    
    error_anterior = error_cuadratico(carpeta, w, b, size=size, normalizar=normalizar)
    errores_entrenamiento.append(error_anterior)
    
    print(f"Error inicial: {error_anterior}")
    
    for i in range(repeticiones):
        # Actualizar parámetros
        w, b = actualizacion(carpeta, w, b, alpha, size=size, normalizar=normalizar)
        
        # Calcular nuevo error
        error_actual = error_cuadratico(carpeta, w, b, size=size, normalizar=normalizar)
        errores_entrenamiento.append(error_actual)
        
        # Mostrar progreso cada 100 iteraciones
        print(f"Iteración {i}, Error: {error_actual}")
        
        # Verificar convergencia
        if (abs(error_actual - error_anterior)) < epsilon:
            print(f"Convergencia alcanzada en la iteración {i}")
            break
        
        error_anterior = error_actual
    
    return w, b, errores_entrenamiento

In [1379]:
base = os.getcwd()


In [1380]:
def calcular_accuracy(carpeta, w, b, size=(256, 256), normalizar=False, umbral=0.5):
    correctos = 0
    total = 0
    
    for archivo in os.listdir(carpeta):
        if archivo.lower().endswith(('.png', '.jpg', '.jpeg')):
            if archivo.startswith("Healthy"): 
                d = 0
            elif archivo.startswith("Parkinson"):
                d = 1            
            ruta = os.path.join(carpeta, archivo)
            i = vectorizar_imagen(ruta, size=size, normalizar=normalizar)
            pred = prediccion(i, w, b)
            pred_clase = 1 if pred > umbral else 0
                
            if pred_clase == d:
                correctos += 1
            total += 1
    
    if total == 0:
        return 0.0
    
    return correctos / total

In [1381]:
def matriz_confusion(carpeta, w, b, size=(256, 256), normalizar=False, umbral=0.5):
    vp = 0
    fp = 0
    vn = 0
    fn = 0
    
    for archivo in os.listdir(carpeta):
        if archivo.lower().endswith(('.png', '.jpg', '.jpeg')):
            if archivo.startswith("Healthy"): 
                d = 0
            elif archivo.startswith("Parkinson"):
                d = 1

            ruta = os.path.join(carpeta, archivo)
            i = vectorizar_imagen(ruta, size=size, normalizar=normalizar)
            pred = prediccion(i, w, b)
            pred_clase = 1 if pred > umbral else 0

            if d == 1 and pred_clase == 1:
                vp += 1
            elif d == 0 and pred_clase == 1:
                fp += 1
            elif d == 0 and pred_clase == 0:
                vn += 1
            elif d == 1 and pred_clase == 0:
                fn += 1

    return vp, fp, vn, fn

In [1382]:
def visualizar_entrenamiento(errores):
    plt.figure(figsize=(10, 6))
    plt.plot(errores)
    plt.title('Evolución del Error Durante el Entrenamiento')
    plt.xlabel('Iteración')
    plt.ylabel('Error Cuadrático')
    plt.grid(True)
    plt.show()

In [1383]:
def ejecutar_entrenamiento(carpeta_entrenamiento, carpeta_testing=None, size=(256, 256), normalizar=False, alpha=0.01, repeticiones=1000):
    # Verificar que la carpeta existe
    if not os.path.exists(carpeta_entrenamiento):
        print(f"Error: La carpeta {carpeta_entrenamiento} no existe")
        print(f"Directorio actual: {os.getcwd()}")
        print("Archivos y carpetas disponibles:")
        for item in os.listdir('.'):
            print(f"  - {item}")
        return None, None, None

    # Inicializar parámetros
    n = size[0] * size[1]
    w = np.random.randn(n, 1) * (1 / np.sqrt(n))
    b = 0.0
    
    print(f"Iniciando entrenamiento con:")
    print(f"  - Tamaño de imagen: {size}")
    print(f"  - Normalización: {normalizar}")
    print(f"  - Alpha: {alpha}")
    print(f"  - Repeticiones: {repeticiones}")
    print(f"  - Dimensión de w: {w.shape}")

    # Entrenar el modelo
    w_final, b_final, errores = entrenar_descenso_gradiente(carpeta_entrenamiento, w, b, alpha, size=size, 
                                                            normalizar=normalizar, repeticiones=repeticiones)

    # Calcular accuracy en entrenamiento
    acc_entrenamiento = calcular_accuracy(carpeta_entrenamiento, w_final, b_final, size=size, normalizar=normalizar)
    print(f"Accuracy en entrenamiento: {acc_entrenamiento:.4f}")

    # Calcular accuracy en testing si se proporciona
    if carpeta_testing and os.path.exists(carpeta_testing):
        acc_testing = calcular_accuracy(carpeta_testing, w_final, b_final, size=size, normalizar=normalizar)
        print(f"Accuracy en testing: {acc_testing:.4f}")

    # Visualizar entrenamiento
    visualizar_entrenamiento(errores)
    
    return w_final, b_final, errores


In [1384]:
if __name__ == "__main__":
    carpeta_entrenamiento = r"C:\Users\Denis Wu\Desktop\TP2-Metodos\Entrenamiento"
    
    archivos = [f for f in os.listdir(carpeta_entrenamiento) if f.lower().endswith(('.png','.jpg','.jpeg'))]
    if not archivos:
        print("No se encontraron imágenes en la carpeta de entrenamiento")
        exit()
    
    ruta_ejemplo = os.path.join(carpeta_entrenamiento, archivos[0])
    vector = vectorizar_imagen(ruta_ejemplo, normalizar=False)
    
    print("Vector shape:", vector.shape)
    print("Valores min y max:", vector.min(), vector.max())

    escala = 5 / (128 * np.sqrt(256**2))  # estimación conservadora
    w_test = np.random.uniform(-escala, escala, size=(256**2, 1))

    b_test = 0.0

    pred = prediccion(vector, w_test, b_test)
    print("Predicción ejemplo:", pred)
    
    error = error_cuadratico(carpeta_entrenamiento, w_test, b_test, normalizar=False)
    print("Error cuadrático ejemplo:", error)
    
    dw = derivada_parcial_w(carpeta_entrenamiento, w_test, b_test, normalizar=False)
    db = derivada_parcial_b(carpeta_entrenamiento, w_test, b_test, normalizar=False)
    print("Derivada parcial w - norma:", np.linalg.norm(dw))
    print("Derivada parcial b:", db)

    alpha = 1e-2 / np.linalg.norm(dw)
    w_n, b_n = actualizacion(carpeta_entrenamiento, w_test, b_test, alpha=alpha, normalizar=False)
    print("Cambio relativo en w:", np.linalg.norm(w_n - w_test) / np.linalg.norm(w_test))
    print("Nuevo b:", b_n)

    print("\nProbando accuracy...")
    acc = calcular_accuracy(carpeta_entrenamiento, w_n, b_n, normalizar=False)
    print("Accuracy ejemplo:", acc)
    
    print("\nProbando matriz de confusión...")
    vp, fp, vn, fn = matriz_confusion(carpeta_entrenamiento, w_n, b_n, normalizar=False)
    print(f"VP: {vp}, FP: {fp}, VN: {vn}, FN: {fn}")

    w_nuevo, b_nuevo, errores = entrenar_descenso_gradiente(carpeta_entrenamiento, w_test, b_test, alpha=0.001)

    print("\nProbando accuracy...")
    acc = calcular_accuracy(carpeta_entrenamiento, w_nuevo, b_nuevo, normalizar=False)
    print("Accuracy ejemplo:", acc)
    
    print("\nProbando matriz de confusión...")
    vp, fp, vn, fn = matriz_confusion(carpeta_entrenamiento, w_nuevo, b_nuevo, normalizar=False)
    print(f"VP: {vp}, FP: {fp}, VN: {vn}, FN: {fn}")

    print("\nPesos finales w:")
    print(w_test)
    print(w_n)
    print(w_nuevo)

Vector shape: (65536, 1)
Valores min y max: 0 255
Predicción ejemplo: 0.9999571337952923
Error cuadrático ejemplo: 0.4999140206614317
Derivada parcial w - norma: 12984.060744451122
Derivada parcial b: 0.2578212058385838
Cambio relativo en w: 0.444276321879054
Nuevo b: -1.9856746738401272e-07

Probando accuracy...
Accuracy ejemplo: 0.5

Probando matriz de confusión...
VP: 0, FP: 0, VN: 750, FN: 750
Error inicial: 0.4999140206614317
Iteración 0, Error: 0.5
Iteración 1, Error: 0.5
Convergencia alcanzada en la iteración 1

Probando accuracy...
Accuracy ejemplo: 0.5

Probando matriz de confusión...
VP: 0, FP: 0, VN: 750, FN: 750

Pesos finales w:
[[-7.08698064e-05]
 [ 3.94720857e-06]
 [ 3.14872424e-05]
 ...
 [-1.30911325e-04]
 [ 1.30189012e-04]
 [-1.52069291e-04]]
[[-1.07195630e-04]
 [-3.23730825e-05]
 [-4.96092681e-06]
 ...
 [-1.67309810e-04]
 [ 9.39317995e-05]
 [-1.88379192e-04]]
[[-0.04723654]
 [-0.04715454]
 [-0.04729304]
 ...
 [-0.04739092]
 [-0.0469464 ]
 [-0.04729707]]
