In [1]:
import numpy as np
import random
import pandas as pd
import subprocess
import os

In [2]:
sizes = [16 * i for i in range(4, 65, 4)]

In [3]:
def correr_experimento_para(filtro, tecnica, lenguaje, img_size):
    imagen1 = './img/afghanGirl{i2}.bmp'.format(i2 = img_size)
    command = ['./build/{tecnica}/tp2'.format(tecnica = tecnica), '-i', '{lang}'.format(lang = lenguaje), '-o', 'outputImg', '{filtro}'.format(filtro = filtro), '{img}'.format(img = imagen1)]
    if filtro == 'Ocultar':
        command.append(imagen1)
    result = subprocess.run(command, stdout=subprocess.PIPE)
    ciclos = result.stdout.decode("utf-8").split('\n')
    return float(ciclos[-2].split()[-1])

In [21]:
def correr_experimento_comparar(tecnicas):
    lang = 'asm'
    filtro = 'Zigzag'
    rows = []
    for tecnica in tecnicas:
        for size in sizes:
            for i in range(0, 30):
                res = correr_experimento_para(filtro, tecnica, lang, size)
                rows.append([filtro, lang, tecnica, size, size**2, res])
                print('Computing', filtro, 'en', lang, 'con técnica', tecnica, 'y tamaño', size, '.', end='\r')
    return pd.DataFrame(rows, columns=[filtro, 'Lenguaje', 'Técnica', 'Resolucion', 'Píxeles', 'Ciclos'])


In [22]:
def correr_experimento_c_asm(filtro):
    lenguajes = {
        'c' : ['normal', 'normal-01', 'normal-02', 'normal-03'],
        'asm' : ['normal']
    }

    rows = []
    for lang in lenguajes:
        for tecnica in lenguajes[lang]:
            for size in sizes:
                for i in range(0, 30):
                    res = correr_experimento_para(filtro, tecnica, lang, size)
                    rows.append([filtro, lang, tecnica, size, size**2, res])
                    print('Computing', filtro, 'en', lang, 'con técnica', tecnica, 'y tamaño', size, '.', end='\r')
    return pd.DataFrame(rows, columns=[filtro, 'Lenguaje', 'Técnica', 'Resolucion', 'Píxeles', 'Ciclos'])


#### Prueba

In [4]:
correr_experimento_para('Ocultar', 'normal', 'c', 256)

11609388.0

## Experimentos

![Imagen para pruebas](img/afghanGirl128.bmp)

Para todos los experimentos, el set de pruebas consistirá de la imagen de pruebas en las siguientes resoluciones:
- 64 x 64
- 128 x 128
- 192 x 192
- 256 x 256
- 320 x 320
- 384 x 384
- 448 x 448
- 512 x 512
- 576 x 576
- 640 x 640
- 704 x 704
- 768 x 768
- 832 x 832
- 896 x 896
- 960 x 960
- 1024 x 1024

Notar que el alto y ancho de todas las resoluciones son múltiplo de 16.

### 1 - ASM vs C
 
La idea de este experimento es comparar nuestras implementaciones de los filtros en `ASM` contra las implementaciones en `C` provistas por la cátedra. Para las implementaciones en `C`, vamos utilizar 4 variantes, de acuerdo a los diferentes niveles de optimización que ofrece el compilador `GCC` (O0, O1, O2 y O3).
Vamos a mostrar un gráfico para cada filtro, dentro del cual figurarán las relaciones entre cantidad de ciclos y cantidad de píxeles en la imagen.

#### Zigzag

In [6]:
df_zigzag_c_asm = correr_experimento_c_asm('Zigzag')

Computing Zigzag en asm con técnica normal y tamaño 1024 ..Zigzag en c con técnica normal-01 y tamaño 832 .

In [7]:
df_zigzag_c_asm

Unnamed: 0,Zigzag,Lenguaje,Técnica,Resolucion,Píxeles,Ciclos
0,Zigzag,c,normal,64,4096,207424.0
1,Zigzag,c,normal,64,4096,205844.0
2,Zigzag,c,normal,64,4096,207592.0
3,Zigzag,c,normal,64,4096,246980.0
4,Zigzag,c,normal,64,4096,207784.0
...,...,...,...,...,...,...
2395,Zigzag,asm,normal,1024,1048576,7174184.0
2396,Zigzag,asm,normal,1024,1048576,7699125.0
2397,Zigzag,asm,normal,1024,1048576,7865757.0
2398,Zigzag,asm,normal,1024,1048576,8005498.0


In [35]:
df_zigzag_c_asm.to_csv('zigzag_asm_c.csv')

#### Ocultar

In [8]:
df_ocultar_c_asm = correr_experimento_c_asm('Ocultar')

Computing Ocultar en asm con técnica normal y tamaño 1024 ..

In [9]:
df_ocultar_c_asm

Unnamed: 0,Ocultar,Lenguaje,Técnica,Resolucion,Píxeles,Ciclos
0,Ocultar,c,normal,64,4096,409508.0
1,Ocultar,c,normal,64,4096,530636.0
2,Ocultar,c,normal,64,4096,281376.0
3,Ocultar,c,normal,64,4096,281360.0
4,Ocultar,c,normal,64,4096,284144.0
...,...,...,...,...,...,...
2395,Ocultar,asm,normal,1024,1048576,7118821.0
2396,Ocultar,asm,normal,1024,1048576,6682218.0
2397,Ocultar,asm,normal,1024,1048576,6643721.0
2398,Ocultar,asm,normal,1024,1048576,19325420.0


In [34]:
df_ocultar_c_asm.to_csv('ocultar_asm_c.csv')

#### Descubrir

In [10]:
df_descubrir_c_asm = correr_experimento_c_asm('Descubrir')

Computing Descubrir en asm con técnica normal y tamaño 1024 ..

In [11]:
df_descubrir_c_asm

Unnamed: 0,Descubrir,Lenguaje,Técnica,Resolucion,Píxeles,Ciclos
0,Descubrir,c,normal,64,4096,231292.0
1,Descubrir,c,normal,64,4096,233024.0
2,Descubrir,c,normal,64,4096,231740.0
3,Descubrir,c,normal,64,4096,232084.0
4,Descubrir,c,normal,64,4096,457348.0
...,...,...,...,...,...,...
2395,Descubrir,asm,normal,1024,1048576,3801593.0
2396,Descubrir,asm,normal,1024,1048576,3892912.0
2397,Descubrir,asm,normal,1024,1048576,4041009.0
2398,Descubrir,asm,normal,1024,1048576,14853848.0


In [33]:
df_descubrir_c_asm.to_csv('descubrir_asm_c.csv')

### 2 - Recorrido por filas vs columnas
La idea de este experimento es explotar y estudiar el correcto uso de la caché, y el impacto temporal del mismo en nuestro algoritmo.
El estudio lo vamos a hacer sobre el filtro **Zigzag**, comparando la implementación estándar en `asm` contra la análoga por columnas.

In [19]:
df_zigzag_filas_columnas = correr_experimento_comparar(['normal', 'columnas'])

Computing Zigzag en asm con técnica columnas y tamaño 1024 .

In [20]:
df_zigzag_filas_columnas

Unnamed: 0,Zigzag,Lenguaje,Técnica,Resolucion,Píxeles,Ciclos
0,Zigzag,asm,normal,64,4096,28788.0
1,Zigzag,asm,normal,64,4096,28968.0
2,Zigzag,asm,normal,64,4096,28552.0
3,Zigzag,asm,normal,64,4096,28616.0
4,Zigzag,asm,normal,64,4096,28880.0
...,...,...,...,...,...,...
955,Zigzag,asm,columnas,1024,1048576,72271616.0
956,Zigzag,asm,columnas,1024,1048576,65389644.0
957,Zigzag,asm,columnas,1024,1048576,64444356.0
958,Zigzag,asm,columnas,1024,1048576,69439776.0


In [36]:
df_zigzag_filas_columnas.to_csv('filas_columnas.csv')

### 2 - Branch Penalty
La idea de este experimento es observar el impacto de la minimización de branch penalties, comparando la implementación estándar, contra una que minimiza los saltos condicionales dentro del loop principal.
El experimento se realiza sobre el filtro **Zigzag**.

In [24]:
df_zigzag_branch_penalty = correr_experimento_comparar(['normal', 'no-branch-penalty'])

Computing Zigzag en asm con técnica no-branch-penalty y tamaño 1024 .sm con técnica normal y tamaño 768 .

In [25]:
df_zigzag_branch_penalty

Unnamed: 0,Zigzag,Lenguaje,Técnica,Resolucion,Píxeles,Ciclos
0,Zigzag,asm,normal,64,4096,29020.0
1,Zigzag,asm,normal,64,4096,28776.0
2,Zigzag,asm,normal,64,4096,28944.0
3,Zigzag,asm,normal,64,4096,28656.0
4,Zigzag,asm,normal,64,4096,29676.0
...,...,...,...,...,...,...
955,Zigzag,asm,no-branch-penalty,1024,1048576,8114799.0
956,Zigzag,asm,no-branch-penalty,1024,1048576,7770277.0
957,Zigzag,asm,no-branch-penalty,1024,1048576,7742259.0
958,Zigzag,asm,no-branch-penalty,1024,1048576,7517461.0


In [37]:
df_zigzag_branch_penalty.to_csv('branch_penalty.csv')

### 3 - Máscaras desde memoria
La idea de este experimento es observar el impacto de las lecturas a memoria, en contraposición con lecturas en registros, diferenciando lecturas alineadas y no alineadas. Para ello vamos a comparar nuestra implementación estándar con dos implementaciones que leen las máscaras desde memoria, en lugar de cargarlas en registros. Una de esas implementaciones realizará lecturas alineadas y la otra no. El experimento se realiza sobre el filtro **Zigzag**.

In [26]:
df_zigzag_mascaras_memoria = correr_experimento_comparar(['normal', 'mascara-memoria-con-align', 'mascara-memoria-sin-align'])

Computing Zigzag en asm con técnica mascara-memoria-sin-align y tamaño 1024 .

In [27]:
df_zigzag_mascaras_memoria

Unnamed: 0,Zigzag,Lenguaje,Técnica,Resolucion,Píxeles,Ciclos
0,Zigzag,asm,normal,64,4096,28544.0
1,Zigzag,asm,normal,64,4096,29104.0
2,Zigzag,asm,normal,64,4096,29416.0
3,Zigzag,asm,normal,64,4096,28916.0
4,Zigzag,asm,normal,64,4096,34660.0
...,...,...,...,...,...,...
1435,Zigzag,asm,mascara-memoria-sin-align,1024,1048576,8152977.0
1436,Zigzag,asm,mascara-memoria-sin-align,1024,1048576,7980456.0
1437,Zigzag,asm,mascara-memoria-sin-align,1024,1048576,8884734.0
1438,Zigzag,asm,mascara-memoria-sin-align,1024,1048576,7826712.0


In [38]:
df_zigzag_mascaras_memoria.to_csv('mascaras_memoria.csv')

### 3 - Conversión a Float para división
El filtro **Zigzag** requiere realizar una división entera en su algoritmo. El set de instrucciones *SIMD* no provee ninguna instrucción para división entera. Para solventar ésto, nuestra implementación estándar utilizó una técnica para dividir mediante una multiplicación y un shifteo. Ésto nos evita tener que caer en instrucciones de conversión, que son muy caras en términos temporales. La idea de este experimento es, entonces, comparar el overhead de dicha conversión a `float`.

In [28]:
df_zigzag_float_conversion = correr_experimento_comparar(['normal', 'convert'])

Computing Zigzag en asm con técnica convert y tamaño 1024 .

In [29]:
df_zigzag_float_conversion

Unnamed: 0,Zigzag,Lenguaje,Técnica,Resolucion,Píxeles,Ciclos
0,Zigzag,asm,normal,64,4096,29268.0
1,Zigzag,asm,normal,64,4096,29112.0
2,Zigzag,asm,normal,64,4096,28676.0
3,Zigzag,asm,normal,64,4096,28816.0
4,Zigzag,asm,normal,64,4096,29024.0
...,...,...,...,...,...,...
955,Zigzag,asm,convert,1024,1048576,19480108.0
956,Zigzag,asm,convert,1024,1048576,11445611.0
957,Zigzag,asm,convert,1024,1048576,10058729.0
958,Zigzag,asm,convert,1024,1048576,33302348.0


In [39]:
df_zigzag_float_conversion.to_csv('zigzag_convert.csv')