# Experimentación con filtros de imagenes.
Para analizar el uso de threads en los filtros de imágenes podemos contemplar varios factores: **Cantidad de threads**, **tipo de filtro**, **tamaño de imagen** y **hardware usado**. Cada factor, inicialmente, se va a contemplar de forma aislada para poder tener una visión separada de cada parámetro y poder encontrar la forma óptima de usar los filtros. A su vez, más adelante se van a mezclar algunos parámetros para poder seguir sacando conclusiones.
## Tamaño de imagen
Mi hipótesis inicial es que, claramente mientras mas grande sea la imagen más tiempo va a tardar en aplicar el filtro seleccionado. Pero igualmente voy a comprobarlo. Tengo preparadas 10 imagenes desde 100x100 pixeles hasta 1000x1000 pixeles avanzando de 100 en 100. Para tener mayor exactitud voy a probarlo 50 veces con cada imagen


In [6]:
# preparaciones iniciales
import os
import pandas
import matplotlib.pyplot as plt
import numpy as np
! echo "" > ../out/info.csv

def plot(ths, time, std, title, xlabel, ylabel):

    fig, ax = plt.subplots()
    ax.plot(ths, time, 'b-', color = 'blue')
    if np.any(std) != 0:
        ax.fill_between(ths, time - std, time + std, color = 'turquoise')


    ax.set(xlabel = xlabel, ylabel = ylabel, title=title)
    ax.grid()
    fig.savefig("test.png")
    plt.show()

In [7]:
# ejecuto los tests
for i in range(1, 11):
    for _ in range(50):
        w = i * 100
        f = f"../out/{w}.ppm"
        os.system(f"../main bw 1 {f}")

KeyboardInterrupt: 

In [None]:
# levanto los datos
dataframe = pandas.read_csv("../out/info.csv", names=["Threads", "Time", "Tamaño imagen"])
dataframe

In [None]:
plot(np.array(range(1, 1000, 100)),
     dataframe.groupby("Tamaño imagen")["Time"].mean(),
     dataframe.groupby("Tamaño imagen")["Time"].std(),
     "Performance del filtro del brillo segun el tamaño",
     "Tamaño imagen(width and height)",
     "Tiempo (s)")

Claramente mientras mas grande sea la imagen, más tiempo va a costar procesarla.
## Cantidad de threads
Ahora voy a comprobar como cambia el tiempo de procesamiento si agregamos cada vez más threads, la primera hipótesis que se me ocurre es que mientras más threads, más performance, pero también es verdad que hay que contemplar que el thread tarda un tiempo en crearse, además del "precio" que hay que pagar del context switch. Igualmente, voy a correr los tests para estar seguros.

In [None]:
# ejecuto los tests
! echo "" > ../out/info.csv
for i in range(1, 21):
    for _ in range(20):
        f = f"../img/800.ppm"
        os.system(f"../out/a.out br {i} {f} .5")

In [None]:
# levanto los datos
dataframe = pandas.read_csv("../out/info.csv", names=["Threads", "Time", "Tamaño imagen"])
dataframe

In [None]:
plot(np.array(range(1, 21)),
     dataframe.groupby("Threads")["Time"].mean(),
     dataframe.groupby("Threads")["Time"].std(),
     "Performance del filtro brillo según la cantidad de threads usados.",
     "Threads (u)",
     "Tiempo (s)")