# Trabajo en grupo 2018 - Filtros de imágenes

## Versión: monohilo

### Autores:
 - Alejandro León Pereira, UO258774.
 - Álvaro Baños Gomez, UO245853.
 - Iñaki Salgado Uralde, UO237133.
 - Guillermo Facundo Colunga, UO236856.

### Enunciado

Programa monohilo secuencial en C/C++ que implemente operaciones vectoriales sobre las componentes de imágenes digitales. El programa monohilo a desarrollar consiste en la implementación básica de las operaciones y se tomará como referencia para el cálculo de las aceleraciones obtenidas en las implementaciones posteriores.

> Nota: _Para mejorar la resolución de la medida de intervalos de tiempo, el procesamiento vectorial debería tener una duración entre 5 y 10 segundos, por lo que si una sola ejecución del algoritmo no dura lo suficiente, se repetirá (en bucle) el número de veces necesario para alcanzar esos tiempos._

Una vez realizado el programa, éste debe ejecutarse 10 veces en modo Release y calcular la media y la desviación típica del tiempo de respuesta, reflejando todas las medidas obtenidas y las estadísticas en una tabla de la documentación.

#### Representación del problema

Para representar las imágenes en C++ utilizaremos la librería CImg con el formato `float`. Esta librería carga la imágen en un único vector compuesto por todas las componentes de la imágen. Pra nuetro problema serán imágenes RGB. De forma que:

$$imagen_x = [ r_{x1}, r_{x2}, r_{x3},...,r_{xn}, g_{x1}, g_{x2}, g_{x3},...,g_{xn}, b_{x1}, b_{x2}, b_{x3},...,b_{xn}]$$

Para cada componente tenemos $ancho \cdot alto$ elementos. Para esta fase crearemos 3 punteros para cada imagen, uno para cada componente de la imagen $x$: rojo, verde y azul. Y se inicializan de la siguiente forma:

$$rojo_x = r_{x1}$$

$$verde_x = g_{x1}$$

$$azul_x = b_{x1}$$

### Algoritmo a imlementar

El algoritmo asignado es el de fusionar dos imágenes con el modo amplitud. Para conseguir el modo amplitud los vectores R' G' y B', que representan las componentes de la imagen resultante, se calculan de la siguente manera:

$${R'} = \frac{\sqrt{Ra^{2} + Rb^{2}}}{\sqrt{2}}$$

$${G'} = \frac{\sqrt{Ga^{2} + Gb^{2}}}{\sqrt{2}}$$

$${B'} = \frac{\sqrt{Ba^{2} + Bb^{2}}}{\sqrt{2}}$$

De las fórmulas anteriores se podría extrapolar lasiguiente función de transformación sobre los vectores de información de $imagen_{x}$ e $imagen_{y}$:

$$f(imagen_{xi}, imagen_{yi}) = \left ( \frac{\sqrt{imagen_{xi}^{2} + imagen_{yi}^{2}}}{\sqrt{2}} \right )$$

Y por lo tanto usar un único bucle que recorriera todo el vector de información de las imágenes aplicando la fórmula de transformación anterior. Pero por simplificar, se usarán los punteros anteriormente definidos y las fórmulas individuales de las componentes.

Para entender mejor el modo de fusión de imágenes puedes leerte este [notebook](image-amplitude-fusion.ipynb).

### Entorno de trabajo.

Como entorno de trabajo se usará una máquina virtual ubuntu y el IDE Eclipse para C/C++. A continuación se explica como se configura dicha máquina virtual.

Se configura la máquina virtual con 4 procesadores, que se corresponde con el máximo del sistema, como se puede observar en la siguiente imagen:

![conf_img](data/configuration.png)

#### Información del sistema (cpu-info):

```
processor	: 0
vendor_id	: GenuineIntel
cpu family	: 6
model		: 58
model name	: Intel(R) Core(TM) i7-3770 CPU @ 3.40GHz
stepping	: 9
microcode	: 0x19
cpu MHz		: 3392.270
cache size	: 8192 KB
physical id	: 0
siblings	: 4
core id		: 0
cpu cores	: 4
apicid		: 0
initial apicid	: 0
fpu		: yes
fpu_exception	: yes
cpuid level	: 13
wp		: yes
flags		: fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx rdtscp lm constant_tsc rep_good nopl xtopology nonstop_tsc cpuid pni pclmulqdq ssse3 cx16 pcid sse4_1 sse4_2 x2apic popcnt aes xsave avx rdrand hypervisor lahf_lm pti fsgsbase flush_l1d
bugs		: cpu_meltdown spectre_v1 spectre_v2 spec_store_bypass l1tf
bogomips	: 6784.54
clflush size	: 64
cache_alignment	: 64
address sizes	: 36 bits physical, 48 bits virtual
power management:

processor	: 1
vendor_id	: GenuineIntel
cpu family	: 6
model		: 58
model name	: Intel(R) Core(TM) i7-3770 CPU @ 3.40GHz
stepping	: 9
microcode	: 0x19
cpu MHz		: 3392.270
cache size	: 8192 KB
physical id	: 0
siblings	: 4
core id		: 1
cpu cores	: 4
apicid		: 1
initial apicid	: 1
fpu		: yes
fpu_exception	: yes
cpuid level	: 13
wp		: yes
flags		: fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx rdtscp lm constant_tsc rep_good nopl xtopology nonstop_tsc cpuid pni pclmulqdq ssse3 cx16 pcid sse4_1 sse4_2 x2apic popcnt aes xsave avx rdrand hypervisor lahf_lm pti fsgsbase flush_l1d
bugs		: cpu_meltdown spectre_v1 spectre_v2 spec_store_bypass l1tf
bogomips	: 6784.54
clflush size	: 64
cache_alignment	: 64
address sizes	: 36 bits physical, 48 bits virtual
power management:

processor	: 2
vendor_id	: GenuineIntel
cpu family	: 6
model		: 58
model name	: Intel(R) Core(TM) i7-3770 CPU @ 3.40GHz
stepping	: 9
microcode	: 0x19
cpu MHz		: 3392.270
cache size	: 8192 KB
physical id	: 0
siblings	: 4
core id		: 2
cpu cores	: 4
apicid		: 2
initial apicid	: 2
fpu		: yes
fpu_exception	: yes
cpuid level	: 13
wp		: yes
flags		: fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx rdtscp lm constant_tsc rep_good nopl xtopology nonstop_tsc cpuid pni pclmulqdq ssse3 cx16 pcid sse4_1 sse4_2 x2apic popcnt aes xsave avx rdrand hypervisor lahf_lm pti fsgsbase flush_l1d
bugs		: cpu_meltdown spectre_v1 spectre_v2 spec_store_bypass l1tf
bogomips	: 6784.54
clflush size	: 64
cache_alignment	: 64
address sizes	: 36 bits physical, 48 bits virtual
power management:

processor	: 3
vendor_id	: GenuineIntel
cpu family	: 6
model		: 58
model name	: Intel(R) Core(TM) i7-3770 CPU @ 3.40GHz
stepping	: 9
microcode	: 0x19
cpu MHz		: 3392.270
cache size	: 8192 KB
physical id	: 0
siblings	: 4
core id		: 3
cpu cores	: 4
apicid		: 3
initial apicid	: 3
fpu		: yes
fpu_exception	: yes
cpuid level	: 13
wp		: yes
flags		: fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx rdtscp lm constant_tsc rep_good nopl xtopology nonstop_tsc cpuid pni pclmulqdq ssse3 cx16 pcid sse4_1 sse4_2 x2apic popcnt aes xsave avx rdrand hypervisor lahf_lm pti fsgsbase flush_l1d
bugs		: cpu_meltdown spectre_v1 spectre_v2 spec_store_bypass l1tf
bogomips	: 6784.54
clflush size	: 64
cache_alignment	: 64
address sizes	: 36 bits physical, 48 bits virtual
power management:
```

### Algoritmo implementado
Para resolver el problema anterior se implementa el siguiente algoritmo en c++ que se incluye en la clase [Main.cpp](https://github.com/thewilly/GIISOF01-2-002-Arquitectura-Computadores/blob/master/Singlethread/Src/Main.cpp) del proyecto Singlethread proporcionado.


#### Pseudo-código
```
PARA CADA i DESDE i=0 HASTA i < número_pixeles_imagen
        
    comp_rojo_img_c[i] = sqrt(comp_rojo_img_a[i]^2 + comp_rojo_img_b[i]^2) / sqrt(2)
        
    comp_verde_img_c[i] = sqrt(comp_verde_img_a[i]^2 + comp_verde_img_b[i]^2) / sqrt(2)
        
    comp_azul_img_c[i] = sqrt(comp_azul_img_a[i]^2 + comp_azul_img_b[i]^2) / sqrt(2)
```

#### C++
```c++
for (int i = 0; i < nPixels; i++) {
    *pRnew = sqrtf(pow(*pRcomp_1, 2.0f) + pow(*pRcomp_2, 2.0f)) / SQRT2;
    *pGnew = sqrtf(pow(*pGcomp_1, 2.0f) + pow(*pGcomp_2, 2.0f)) / SQRT2;
    *pBnew = sqrtf(pow(*pBcomp_1, 2.0f) + pow(*pBcomp_2, 2.0f)) / SQRT2;

    pRnew++; pRcomp_1++; pRcomp_2++;
    pGnew++; pGcomp_1++; pGcomp_2++;
    pBnew++; pBcomp_1++; pBcomp_2++;
}
```

> **Nota**: _Como la ejecucion del algoritmo dura menos de 5 segundos se anida el anterior algoritmo dentro de un bucle for que lo repetirá 3 veces con lo que el tiempo de la ejecución del programa será superior a los 5 segundos, **pero se estará ejecutando el algoritmo 3 veces**._

> **Nota**: _En el agortimo anterior se ha realizado en lugar de computar el valor sqrt(2) cada vez que se necesita se abstrae a una constante definida al inicio del Main.cpp._

#### Explicación del algoritmo
El algoritmo anterior lo que hace es recorrer las imágenes pixel a pixel, para ello se emplean dos bucles `for`, uno para la altura y otro para la anchura de las imágenes. A continuación para cada pixel `i` se realiza la operación indicada para fusionar imágenes con el modo amplitud: `c[i] = sqrt(a[i]^2 + b[i]^2) / sqrt(2)`.

### Análisis del algoritmo implementado
Para la ejecución del algoritmo anterior se obtienen los siguientes datos tras realizar 10 ejecuciones en modo release:

In [1]:
import pandas as pd
executions = 3.0
data = pd.Series([7.203385, 7.176692, 7.184928, 7.125511, 7.112396, 7.099702, 7.109414, 7.149219, 7.209500, 7.171152],
                 index=['1', '2', '3', '4', '5', '6', '7', '8', '9', '10'])
table = pd.DataFrame({'Duración (s)':data})
table

Unnamed: 0,Duración (s)
1,7.203385
2,7.176692
3,7.184928
4,7.125511
5,7.112396
6,7.099702
7,7.109414
8,7.149219
9,7.2095
10,7.171152


In [2]:
import numpy as np
mean = np.mean(data)
std = np.std(data)
print("Media 3 ejecuciones:", mean, "s.")
print("Desviación estándar 3 ejecuciones:", std)
print("Media 1 ejecución:", mean/executions, "s.")
data = data/executions
std = np.std(data)
print("Desviación estándar 3 ejecuciones:", std)

Media 3 ejecuciones: 7.154189900000001 s.
Desviación estándar 3 ejecuciones: 0.03845254849148494
Media 1 ejecución: 2.3847299666666673 s.
Desviación estándar 3 ejecuciones: 0.012817516163828344
