# Trabájo Practico 2 - Métodos Computacionales

### Camila Cauzzo, Catalina Dolhare

In [2]:
import numpy as np
import matplotlib.pyplot as plt
from PIL import Image
import os
import time
import random

In [3]:
def abrirImagenesEscaladas( carpeta, escala=32 ):
    # abre todas las imagenes de la carpeta, y las escala de tal forma que midan (escala x escala)px
    # devuelve las imagenes aplanadas -> vectores de tamano escala^2 con valores entre 0 y 1
    imagenes = []

    for dirpath, dirnames, filenames in os.walk(carpeta):
        for file in filenames:
            img = Image.open( os.path.join(carpeta, file) )
            img = img.resize((escala, escala))
            img.convert('1')
            img = np.asarray(img)
            if len(img.shape)==3:
                img = img[:,:,0].reshape((escala**2 )) / 255
            else:
                img = img.reshape((escala**2 )) / 255
            
            imagenes.append( img )

    return imagenes

In [4]:
def balancear_datos(imagenes1, imagenes2):
    cantidad_imagenes = min(len(imagenes1), len(imagenes2))
    imagenes1 = imagenes1[:cantidad_imagenes]
    imagenes2 = imagenes2[:cantidad_imagenes]

    imagenes = imagenes1 + imagenes2

    return imagenes

### Ejercicio 1

Calcular las derivadas parciales de la funci ́on L con respecto a w y b 

In [5]:
def L_w(i, w, b, d):
    t0 = np.tanh(np.dot(w, i) + b)
    return (1 - t0**2) * (((1 + t0) / 2) - d) * i

In [6]:
def L_b(i, w, b, d):
    t0 = np.tanh(np.dot(w, i) + b)
    return (1 - t0**2) * (((1 + t0) / 2) - d)

In [7]:
def f(i, w, b):
    tan = np.tanh(np.dot(w, i) + b)
    return (tan + 1) / 2

In [8]:
def dL_dw(w, b, imagenes, diagnosticos):
    gradiente = np.zeros_like(w)
    for i, imagen in enumerate(imagenes):
        gradiente += L_w(imagen, w, b, diagnosticos[i])
    return gradiente / len(imagenes)

In [9]:
def dL_db(w, b, imagenes, diagnosticos):
    gradiente = 0
    for i, imagen in enumerate(imagenes):
        gradiente += L_b(imagen, w, b, diagnosticos[i])
    return gradiente / len(imagenes)

In [10]:
def func_L(w, b, imagenes, diagnosticos):
    error = 0
    for i, imagen in enumerate(imagenes):
        prediccion = f(imagen, w, b)
        error += (prediccion - diagnosticos[i])**2
    return error / len(imagenes)

### Ejercicio 2

Implementar el método de descenso por gradiente y optimizar los parámetros de la función f para
el conjunto de datos de entrenamiento

In [11]:
def gradiente_descendiente(imagenes1, imagenes2):
    imagenes_normal = abrirImagenesEscaladas(imagenes1)
    diagnosticos_normal = [0] * len(imagenes_normal)

    imagenes_neumonia = abrirImagenesEscaladas(imagenes2)
    diagnosticos_neumonia = [1] * len(imagenes_neumonia)

    imagenes = balancear_datos(imagenes_normal, imagenes_neumonia)
    diagnosticos = diagnosticos_normal + diagnosticos_neumonia

    w0 = np.zeros(imagenes[0].shape[0])
    b0 = 0
    alpha = 0.001

    MAX_ITER = 1000
    TOLERANCIA = 1e-8
    iter = 0

    w = w0
    b = b0

    while iter <= MAX_ITER:
        print("Iteración: ", iter, "- Mínimo alcanzado hasta el momento: ", func_L(w, b, imagenes, diagnosticos))

        gradient_dw = dL_dw(w, b, imagenes, diagnosticos)
        gradient_db = dL_db(w, b, imagenes, diagnosticos)

        print("gradient_dw:", gradient_dw)
        print("gradient_db:", gradient_db)

        prox_w = w - alpha * gradient_dw
        prox_b = b - alpha * gradient_db

        diferencia = func_L(prox_w, prox_b, imagenes, diagnosticos) - func_L(w, b, imagenes, diagnosticos)

        if abs(diferencia) < TOLERANCIA:
            break

        w = prox_w
        b = prox_b

        iter += 1
    
    return w, b, imagenes, diagnosticos

In [14]:
w_opt, b_opt, imagenes, diagnosticos = gradiente_descendiente("chest_xray/train/NORMAL", "chest_xray/train/PNEUMONIA")
print("El mínimo local ocurre en w = ", w_opt, "b = ", b_opt, " y L vale: ", func_L(w_opt, b_opt, imagenes, diagnosticos))

Iteración:  0 - Mínimo alcanzado hasta el momento:  0.25
gradient_dw: [-0.00302548 -0.00258652  0.00540269 ...  0.01649806 -0.00212067
 -0.01401329]
gradient_db: 0.0
Iteración:  1 - Mínimo alcanzado hasta el momento:  0.2497635922203209
gradient_dw: [-0.00280938 -0.00230019  0.00572585 ...  0.01674872 -0.00200119
 -0.01394313]
gradient_db: 0.0010226066051596562
Iteración:  2 - Mínimo alcanzado hasta el momento:  0.2495312324593706
gradient_dw: [-0.00262433 -0.00205524  0.00600178 ...  0.01696042 -0.00189898
 -0.01388162]
gradient_db: 0.0018983761251779917
Iteración:  3 - Mínimo alcanzado hasta el momento:  0.2493019422638432
gradient_dw: [-0.00246593 -0.00184581  0.0062372  ...  0.01713873 -0.00181158
 -0.01382758]
gradient_db: 0.00264815186633958
Iteración:  4 - Mínimo alcanzado hasta el momento:  0.2490750031769165
gradient_dw: [-0.0023304  -0.00166684  0.00643786 ...  0.0172884  -0.0017369
 -0.01377996]
gradient_db: 0.003289857763202141
Iteración:  5 - Mínimo alcanzado hasta el mome

### Ejercicio 3

Calcular el error cuadrático durante la optimización para el conjunto de entrenamiento y para
el conjunto de testing. Generar las visualizaciones correspondientes.

In [None]:
def error_cuadratico_medio(imagenes, w, b):
    imagenes_normal = imagenes[0]
    imagenes_pneumonia = imagenes[1]

    error_total = 0
    for i in imagenes_normal:
        error = (f(i, w, b) - 0)**2
        error_total += error
    
    for i in imagenes_pneumonia:
        error = (f(i, w, b) - 1)**2
        error_total += error

    return error_total/(len(imagenes_normal) + len(imagenes_pneumonia))

Generamos un grafico para ver como varia el error a medida que avanzan las iteraciones

In [None]:
plt.plot(errores, range(len(errores)))
plt.xlabel("Iteraciones")
plt.ylabel("Error")
plt.title("Error cuadrático medio en el entrenamiento")
plt.show()

NameError: name 'errores' is not defined

##### Como es con testing? Hay que hacer gradiente descendiente en estos datos tambien y ver el error o hay que usar el w y b optimo del train y ver que tanto error da cuando se aplica f a cada imagen?

### Ejercicio 4

##### Otra vez misma duda. Hay que hacer gradiente descendiente para test o optimizar b y w y ver como queda f para cada imagen de test? Como veo la convergencia???????????

Analizar el impacto del parámetro α en la convergencia del método. Tomar un rango
de 5 valores posibles y analizar la convergencia para el conjunto de testing para los distintos valores de α.

El parametro alpha es muy importante a la hora de encontrar el minimo. Este determina cuanto vamos a movernos en dirección al gradiente. Si este es muy chico, encontrar el minimo va a tardar muchos iteración y, dependiendo de el valor maximo, es posible que no se encuentre. Si se elige un valor muy grande, es posible que nos pasemos del valor minimo local.

In [None]:
alpha = [0.0000001, 0.0001, 0.01, 1, 10]
for a in alpha:
    w_opt, b_opt = gradiente_descendiente(imagenes, a)
    print("Alpha: ", a, "- L = ", L(imagenes, w_opt, b_opt), " - Error cuadrático medio: ", error_cuadratico_medio(imagenes, w_opt, b_opt))

Iteración:  0 - Mínimo alcanzado hasta el momento:  60.67761335170323
w: [-3.06642722e-07 -4.30690102e-07 -4.30929655e-07 ...  1.15433243e-07
  1.55135632e-07  1.69193019e-07]
b: 0.4999963656900931
L nuevo: 53.07365823098891
L viejo: 60.67761335170323
diferencia L: 7.603955120714318
Iteración:  1 - Mínimo alcanzado hasta el momento:  53.07365823098891
w: [-1.81921134e-07 -4.30774881e-07 -4.34814820e-07 ...  4.02058690e-07
  5.08398319e-07  5.49468263e-07]
b: 0.4999940570316326
L nuevo: 50.42672157639585
L viejo: 53.07365823098891
diferencia L: 2.6469366545930626
Iteración:  2 - Mínimo alcanzado hasta el momento:  50.42672157639585
w: [ 3.04826898e-07 -5.81612696e-08 -6.84936028e-08 ...  8.09714086e-07
  1.00032642e-06  1.07714779e-06]
b: 0.4999930844972514
L nuevo: 49.771893872707835
L viejo: 50.42672157639585
diferencia L: 0.6548277036880137
Iteración:  3 - Mínimo alcanzado hasta el momento:  49.771893872707835
w: [9.30270381e-07 4.59395080e-07 4.41864898e-07 ... 1.25962754e-06
 1.540

KeyboardInterrupt: 

### Ejercicio 5

¿Cómo impacta el tamaño del escalado de las imágenes en la efectividad del método? ¿Y en el
tiempo de cómputo?. Realizar los experimentos y gráficos acordes para estudiar estas limitaciones

In [None]:
escalado = [16, 32, 64, 128, 256, 512]

for e in escalado:
    imagenes_normal = abrirImagenesEscaladas("chest_xray/small_train/NORMAL", e)
    imagenes_pneumonia = abrirImagenesEscaladas("chest_xray/small_train/PNEUMONIA", e)
    imagenes = [imagenes_normal, imagenes_pneumonia]

    tiempo_inicial = time.time()
    w_opt, b_opt = gradiente_descendiente(imagenes, 0.001)
    tiempo_final = time.time()
    print("Tiempo de ejecución: ", tiempo_final-tiempo_inicial)
    print("Escala: ", e, "- L = ", L(imagenes, w_opt, b_opt), "- Error cuadrático medio: ", error_cuadratico_medio(imagenes, w_opt, b_opt))

Iteración:  0 - Mínimo alcanzado hasta el momento:  50.0
Iteración:  1 - Mínimo alcanzado hasta el momento:  47.37579165693172
Iteración:  2 - Mínimo alcanzado hasta el momento:  54.40794117059423
Iteración:  3 - Mínimo alcanzado hasta el momento:  96.60520972069014
Iteración:  4 - Mínimo alcanzado hasta el momento:  92.70278868357126
Iteración:  5 - Mínimo alcanzado hasta el momento:  69.75197786150365
Iteración:  6 - Mínimo alcanzado hasta el momento:  94.28938051439916
Iteración:  7 - Mínimo alcanzado hasta el momento:  79.86667296177323
Iteración:  8 - Mínimo alcanzado hasta el momento:  74.54716144111538
Iteración:  9 - Mínimo alcanzado hasta el momento:  87.4604925217846
Iteración:  10 - Mínimo alcanzado hasta el momento:  37.70919849237352
Iteración:  11 - Mínimo alcanzado hasta el momento:  37.5991346070351
Iteración:  12 - Mínimo alcanzado hasta el momento:  72.82041175355346
Iteración:  13 - Mínimo alcanzado hasta el momento:  87.60263641799033
Iteración:  14 - Mínimo alcanza

### Ejercicio 6

Para el valor de α que tenga mejor valor de convergencia, generar la matriz de confusión y analizar
brevemente la efectividad del método.