## UNIVERSIDAD DE SANTIAGO DE CHILE FACULTAD DE INGENIERÍA DEPARTAMENTO DE INGENIERÍA INFORMÁTICA



# LAB1: SIMD – PARALELISMO A NIVEL DE INSTRUCCIÓN TALLER DE PROGRAMACIÓN PARALELA

#### Datos del alumno:

Nombre completo: Marcial Natalio Hernández Sánchez

RUT: 17386509-0

Número de teléfono: 569-72825633

E-mail: marcial.hernandez@usach.cl

Profesor: Fernando Rannou

Santiago - Chile 2015

## **RESUMEN EJECUTIVO**

El presente informe tiene como objetivo mostrar la forma de implementación de la parte SIMD de la presente experiencia. Compuesto de cuatro diagramas, que detallan la traza de los algoritmos utilizados. Se optó por dibujar y detallar en su mayoría solo trazas, debido a que el algoritmo en detalle se puede encontrar en la investigación que se menciona en la bibliografía. Los algoritmos que se grafican son "Ordenamiento in Register", "Bitonic Merge Network" y "Merge SIMD de secuencias".

### Ordenamiento por columna (lane)



Traspuesta del resultado anterior

Para realizar la traspuesta de:

| 1  | 8  | 3  | 0  |
|----|----|----|----|
| 5  | 11 | 4  | 7  |
| 9  | 14 | 6  | 10 |
| 12 | 21 | 15 | 13 |

Se aplicó la función

 $\_MM\_TRANSPOSE4\_PS (\_\_m128 \ row0, \ \_\_m128 \ row1, \ \_\_m128 \ row2, \ \_\_m128 \ row3)$ 

Que realiza la operación \_\_m128 tmp3, tmp2, tmp1, tmp0; tmp0 = \_mm\_unpacklo\_ps(row0, row1); tmp2 = \_mm\_unpacklo\_ps(row2, row3); tmp1 = \_mm\_unpackhi\_ps(row0, row1); tmp3 = \_mm\_unpackhi\_ps(row2, row3); row0 = \_mm\_movelh\_ps(tmp0, tmp2); row1 = \_mm\_movelh\_ps(tmp0, tmp0); row2 = \_mm\_movelh\_ps(tmp1, tmp0); row3 = \_mm\_movelh\_ps(tmp1, tmp3); row3 = \_mm\_movelh\_ps(tmp3, tmp1);

|             | 1 | 5  | 9  | 12 |
|-------------|---|----|----|----|
| Retornando: | 8 | 11 | 14 | 21 |
|             | 3 | 4  | 6  | 15 |
|             | 0 | 7  | 10 | 13 |

A=

2

L3-0

H3-0

L3-1

H3-1

7

9

18



L3-2

H3-2

L3-3 H3-3

30

25

20

5

B=

# Algoritmo ordenamiento Merge SIMD



#### Traza ordenamiento Merge SIMD



Algoritmo obtenido de la investigación de Jatin Chhugani, Anthony D. Nguyen, Victor W. Lee, William Macy, Mostafa Hagog, Yen-Kuang Chen, Akram Baransi, Sanjeev Kumar, and Pradeep Dubey. (2008)

## BIBLIOGRAFÍA:

Jatin Chhugani, Anthony D. Nguyen, Victor W. Lee, William Macy, Mostafa Hagog, Yen-Kuang Chen, Akram Baransi, Sanjeev Kumar, and Pradeep Dubey. 2008. Efficient implementation of sorting on multi-core SIMD CPU architecture. *Proc. VLDB Endow.* 1, 2 (August 2008), 1313-1324. DOI=10.14778/1454159.1454171 http://dx.doi.org/10.14778/1454159.1454171