# Санкт-Петербургский политехнический университет Петра Великого Институт компьютерных наук и технологий Кафедра компьютерных систем и программных технологий

# Отчет по лабораторной работе №8\_3 Курс: «Проектирование реконфигурируемых гибридных вычислительных систем»

**Tema: Dataflow. Conditional Execution of Tasks** 

| Выполнил студент гр. 3540901/81501 |           | Селиверстов Я.А |
|------------------------------------|-----------|-----------------|
|                                    | (подпись) |                 |
| Руководитель                       |           | Антонов А.П.    |
|                                    | (подпись) |                 |
|                                    |           | 2019 г.         |

Санкт – Петербург 2019

# ОГЛАВЛЕНИЕ

| 1. Задание                          | 3  |
|-------------------------------------|----|
| 2. Скрипт                           | 5  |
| 3.Решение №1.                       | 6  |
| 3.1. Исходный код программы и теста | 6  |
| 3.2.Моделирование                   | 7  |
| 3.3.Синтез                          | 7  |
| 4. Решение №2.                      | 10 |
| 4.1. Исходный код программы и теста | 10 |
| 4.3. Моделирование                  | 11 |
| 4.4. Синтез                         | 11 |
| 4.5. C/RTL моделирование            | 13 |
| 5. Решение №3.                      | 14 |
| 5.1. Исходный код программы и теста | 14 |
| 5.3. Моделирование                  | 15 |
| 5.4. Синтез                         | 15 |
| 6 Rupon                             | 17 |

## 1. Задание

- Создать проект lab8 3
- Микросхема: xa7a12tcsg325-1q
- Создать две функции (см. Текст ниже) исходную и модифицированную и провести их анализ.
- Conditional Execution of Tasks

The DATAFLOW optimization does not optimize tasks that are conditionally executed. The following example highlights this limitation. In this example, the conditional execution of Loop1 and Loop2 prevents Vivado HLS from optimization the data flow between these loops, because the data does not flow from one loop into the next.

```
 \begin{array}{l} void \ foo\_b(int \ data\_in1[N], \ int \ data\_out[N], \ int \ temp1[N], \ temp2[N]; \\ if \ (sel) \ \{ \\ Loop1: \ for(int \ i = 0; \ i < N; \ i++) \ \{ \\ temp1[i] = \ data\_in[i] * 123; \\ temp2[i] = \ data\_in[i]; \\ \} \ \} \ else \ \{ \\ Loop2: \ for(int \ j = 0; \ j < N; \ j++) \ \{ \\ temp1[j] = \ data\_in[j] * 321; \\ temp2[j] = \ data\_in[j]; \\ \} \ \} \ Loop3: \ for(int \ k = 0; \ k < N; \ k++) \ \{ \\ data\_out[k] = temp1[k] * temp2[k]; \\ \} \ \} \ \\ \end{array}
```

To ensure each loop is executed in all cases, you must transform the code as shown in the following example. In this example, the conditional statement is moved into the first loop. Both loops are always executed, and data always flows from one loop to the next.

```
 \begin{array}{l} void \ foo\_m(int \ data\_in[N], \ int \ data\_out[N], \ int \ temp1[N], \ temp2[N]; \\ Loop1: \ for(int \ i = 0; \ i < N; \ i++) \ \{ \\ \ if \ (sel) \ \{ \\ \ temp1[i] = data\_in[i] * 123; \\ \} \ else \ \{ \\ \ temp1[i] = data\_in[i] * 321; \\ \} \\ Loop2: \ for(int \ j = 0; \ j < N; \ j++) \ \{ \\ \ temp2[j] = data\_in[j]; \\ \} \\ Loop3: \ for(int \ k = 0; \ k < N; \ k++) \ \{ \\ \ data\_out[k] = temp1[k] * temp2[k]; \\ \} \\ \} \\ \end{array}
```

• Создать тест lab8 3 test.с для проверки функций выше.

- Для функции **foo b** 
  - о задать: clock period 10; clock\_uncertainty 0.1
  - о осуществить моделирование (с выводом результатов в консоль)
  - о осуществить синтез для:
    - привести в отчете:
      - performance estimates=>summary
      - utilization estimates=>summary
      - scheduler viewer (выполнить Zoom to Fit)
        - о На скриншоте показать Latency
        - о На скриншоте показать Initiation Interval
      - resource viewer (выполнить Zoom to Fit)
        - о На скриншоте показать Latency
        - о На скриншоте показать Initiation Interval
- Для функции foo\_m
  - о задать: clock period 10; clock\_uncertainty 0.1
  - о осуществить моделирование (с выводом результатов в консоль)
  - о осуществить синтез для случая **FIFO for the memory buffers**:
    - привести в отчете:
      - performance estimates=>summary
      - utilization estimates=>summary
      - scheduler viewer (выполнить Zoom to Fit)
        - о На скриншоте показать Latency
        - о На скриншоте показать Initiation Interval
      - resource viewer (выполнить Zoom to Fit)
        - о На скриншоте показать Latency
        - о На скриншоте показать Initiation Interval
      - Dataflow viewer
  - о осуществить синтез для случая ping-pong buffers:
    - привести в отчете:
      - performance estimates=>summary
      - utilization estimates=>summary
      - scheduler viewer (выполнить Zoom to Fit)
        - На скриншоте показать Latency
        - о На скриншоте показать Initiation Interval
      - resource viewer (выполнить Zoom to Fit)
        - о На скриншоте показать Latency
        - о На скриншоте показать Initiation Interval
      - Dataflow viewer
  - O Осуществить C|RTL моделирование для случая **FIFO for the memory buffers** 
    - Привести результаты из консоли
    - Открыть временную диаграмму (все сигналы)
      - Отобразить два цикла обработки на одном экране
        - о На скриншоте показать Latency
        - о На скриншоте показать Initiation Interval
- Выводы
  - о Объяснить отличия в синтезе foo b и двух вариантов foo m между собой

# 2. Скрипт

Представим на рис. 2.1 скрипт, для автоматизации выполнения лабораторной работы.

```
open_project -reset lab8_3_b
add_files lab8_3_b.c
set_top foo
add files -tb lab8 3 test.c
open_solution solution 1 -reset
set_part {xa7a12tcsg325-1q}
create_clock -period 10ns
set_clock_uncertainty 0.1
csim_design
csynth_design
open_project -reset lab8_3_m
add_files lab8_3_m. c
set_top foo
add_files -tb lab8_3_test . c
open_solution solution_ping_pong -reset
set_part {xa7a12tcsg325-1q}
create_clock -period 10ns
set_clock_uncertainty 0.1
config_dataflow -default_channel pingpong
set directive dataflow foo
csim_design
csynth_design
open_solution solution_fifo -reset
set_part {xa7a12tcsg325-1q}
create_clock -period 10ns
set_clock_uncertainty 0.1
config_dataflow -default_channel fifo
set_directive_dataflow foo
csim_design
csynth_design
cosim_design -trace_level all
```

Рис. 2.1. Скрипт

## 3.Решение №1.

## 3.1. Исходный код программы и теста

```
#include "lab8_3 .h"

void foo ( int data_in [N] , int sel , int data_out [N]) {
    int temp1 [N] , temp2 [N] ;
    if ( sel ) {
        Loop1 : for ( int i = 0; i < N; i++) {
            temp1 [ i ] = data_in [ i ] * 123;
            temp2 [ i ] = data_in [ i ] ;
        }
    } else {
        Loop2 : for ( int j = 0; j < N; j++) {
            temp1 [ j ] = data_in [ j ] * 321;
            temp2 [ j ] = data_in [ j ];
        }
    }
    Loop3 : for ( int k = 0; k < N; k++) {
        data_out [ k ] = temp1 [ k ] * temp2 [ k ];
    }
}</pre>
```

Рис. 3.1. Исходный код устройства

#### #define N 10

Рис. 3.2. Заголовочный файл

```
#include <stdio.h>
#include "lab8_3.h"
int main() {
       int pass = 1;
       int data_in [N];
       int scale = 2;
       int data_out[N];
       int data_out_expected [N];
       int i, j;
       for (int i = 0; i < N; i++) {
           data_in [ i ] = 211*i\% 9;
           int temp1 = data_in [ i ] * scale + 123;
           int temp2 = data_in [ i ] >> scale;
           data_out_expected [ i ] = temp1 + temp2;
        }
       foo_b(data_out, data_in, scale);
```

```
for ( i = 0; i < N; i++) {
    printf ("Expected:[%d], _\tActual:[%d]\n",data_out_expected [ i ], data_out [ i ]
    if (data_out_expected [ i ] != data_out [ i ] ) {
        pass = 0;
    }

if (pass) {
        fprintf ("------Pass!-----\n");
        return 0;
    } else {
            fprintf ( "------Fail!-----\n");
            return 1;
    }
}</pre>
```

Рис. 3.3. Исходный код теста

## 3.2. Моделирование

Ниже приведены результаты успешного моделирования.

```
Generating csim.exe
Expected: [0], Actual: [0]
Expected: [1968],
                         Actual: [1968]
Expected: [7872],
                         Actual: [7872]
Expected: [1107],
                         Actual: [1107]
Expected: [6027],
                         Actual: [6027]
Expected: [492],
                         Actual: [492]
Expected: [4428],
                        Actual: [4428]
Expected: [123],
                        Actual:[123]
Expected: [3075],
                        Actual: [3075]
Expected: [0],
                Actual:[0]
    -----Pass!----
INFO: [SIM 211-1] CSim done with 0 errors.
INFO: [SIM 211-3] *********** CSIM finish **********
```

Рис. 3.4. Результаты моделирования

#### 3.3.Синтез

По оценке производительности видно, что устройство соответствует заданным критериям.





Рис. 3.6. Utilization estimates



Рис. 3.7. Performance profile



Рис. 3.8. Scheduler viewer

|    | Resource\Control Step | C0   | C1      | C2 | C3    | C4    | C5 | C6    | C7    | C8      | C9 | C10 | C11   |
|----|-----------------------|------|---------|----|-------|-------|----|-------|-------|---------|----|-----|-------|
| 1  | ⊡I/O Ports            |      |         |    |       |       |    | 100   |       |         |    |     |       |
| 2  | sel                   | read |         |    |       |       |    |       |       |         |    |     |       |
| 3  | data_in(p0)           |      | re      | ad |       |       |    |       |       |         |    |     |       |
| 4  | data_out(p0)          |      |         |    |       |       |    |       |       |         |    |     | write |
| 5  | ⊟Memory Ports         |      |         |    |       |       |    |       |       |         |    |     |       |
| 6  | data_in(p0)           |      | re      | ad |       |       |    |       |       |         |    |     |       |
| 7  | temp2(p0)             |      |         |    | write |       |    | write |       | re      | ad |     |       |
| 8  | temp1(p0)             |      |         |    |       | write |    |       | write | re      | ad |     |       |
| 9  | data_out(p0)          |      |         |    |       |       |    |       |       |         |    |     | write |
| 10 | ⊟Expressions          |      |         |    |       |       |    |       |       |         |    |     |       |
| 11 | tmp_fu_180            | icmp |         |    |       |       |    |       |       |         |    |     |       |
| 12 | j_1_fu_209            |      | +       |    |       |       |    |       |       |         |    |     |       |
| 13 | i_1_fu_192            |      | +       |    |       |       |    |       |       |         |    |     |       |
| 14 | j_phi_fu_157          |      | phi_mux |    |       |       |    |       |       |         |    |     |       |
| 15 | i_phi_fu_146          |      | phi_mux |    |       |       |    |       |       |         |    |     |       |
| 16 | exitcondl_fu_203      |      | icmp    |    |       |       |    |       |       |         |    |     |       |
| 17 | exitcond2_fu_186      |      | icmp    |    |       |       |    |       |       |         |    |     |       |
| 18 | tmp_5_fu_220          |      |         |    | *     |       |    |       |       |         |    |     |       |
| 19 | tmp_2_fu_226          |      |         |    |       |       |    | *     |       |         |    |     |       |
| 20 | k_1_fu_238            |      |         |    |       |       |    |       |       | +       |    |     |       |
| 21 | k_phi_fu_168          |      |         |    |       |       |    |       |       | phi_mux |    |     |       |
| 22 | exitcond_fu_232       |      |         |    |       |       |    |       |       | icmp    |    |     |       |
| 23 | tmp_8_fu_250          |      |         |    |       |       |    |       |       |         |    | *   |       |

Рис. 3.9. Resource viewer

## 4. Решение №2.

## 4.1. Исходный код программы и теста

```
#include "lab8_3 .h"

void foo ( int data_in [N] , int sel , int data_out [N]) {
    int temp1 [N] , temp2 [N] ;
    Loop1 : for ( int i = 0; i < N; i++) {
        if ( sel ) {
            temp1 [ i ] = data_in [ i ] * 123;
        } else {
            temp1 [ i ] = data_in [ i ] * 321 ;
        }
        Loop2 : for ( int j = 0; j < N; j++) {
            temp2 [ j ] = data_in [ j ];
        }
        Loop3 : for ( int k = 0; k < N; k++) {
            data_out [ k ] = temp1 [ k ] * temp2 [ k ];
        }
    }
}</pre>
```

Рис. 4.1. Исходный код устройства

#### #define N 10

Рис. 4.2. Заголовочный файл

```
#include <stdio.h>
#include "lab8_3.h"
int main() {
       int pass = 1;
       int data in [N];
       int scale = 2;
       int data_out[N];
       int data_out_expected [N];
       int i, j;
       for (int i = 0; i < N; i++) {
           data_in [ i ] = 211*i\% 9;
           int temp1 = data_in [i] * 123;
           int temp2 = data_in[i];
           data_out_expected [ i ] = temp1 * temp2;
       foo_b(data_out, data_in, scale);
       for (i = 0; i < N; i++) {
           printf ("Expected:[%d], _\tActual:[%d]\n",data_out_expected [i], data_out [i]
           if (data_out_expected [ i ] != data_out [ i ] ) {
```

```
pass = 0;
}

if (pass) {
    fprintf ("-----Pass!-----\n");
    return 0;
} else {
    fprintf ( "-----Fail!-----\n");
    return 1;
}
```

Рис. 4.3. Исходный код теста

## 4.3. Моделирование

Ниже приведены результаты моделирования.

```
INFO: [APCC 202-1] APCC is done.
   Generating csim.exe
Expected:[0], Actual:[0]
Expected:[1968],
                        Actual:[1968]
Expected:[7872],
                        Actual: [7872]
Expected:[1107],
                        Actual:[1107]
Expected:[6027],
                        Actual: [6027]
Expected:[492],
                        Actual:[492]
Expected:[4428],
                        Actual: [4428]
Expected:[123],
                        Actual: [123]
Expected:[3075],
                        Actual: [3075]
Expected:[0], Actual:[0]
    ----Pass!---
INFO: [SIM 211-1] CSim done with 0 errors.
INFO: [SIM 211-3] ************ CSIM finish *****
```

Рис. 4.4. Результаты моделирования

По результатам моделирования видно, что устройство работает корректно.

#### 4.4. Синтез

По оценке производительности видно, что устройство соответствует заданным критериям.



Рис. 4.5. Performance estimates



Рис. 4.6. Utilization estimates



Рис. 4.7. Performance profile



Рис. 4.9. Resource viewer



Рис. 4.10. Dataflow viewer

# 4.5. C/RTL моделирование



Рис. 4.11. Временная диаграмма

### 5. Решение №3.

## 5.1. Исходный код программы и теста

```
#include "lab8_3 .h"

void foo ( int data_in [N] , int sel , int data_out [N]) {
    int temp1 [N] , temp2 [N] ;
    Loop1 : for ( int i = 0; i < N; i++) {
        if ( sel ) {
            temp1 [ i ] = data_in [ i ] * 123;
        } else {
            temp1 [ i ] = data_in [ i ] * 321 ;
        }
        Loop2 : for ( int j = 0; j < N; j++) {
            temp2 [ j ] = data_in [ j ];
        }
        Loop3 : for ( int k = 0; k < N; k++) {
            data_out [ k ] = temp1 [ k ] * temp2 [ k ];
        }
    }
}</pre>
```

Рис. 5.1. Исходный код устройства

#### #define N 10

Рис. 5.2. Заголовочный файл

```
#include <stdio.h>
#include "lab8_3.h"
int main() {
       int pass = 1;
       int data_in [N];
       int scale = 2;
       int data_out[N];
       int data_out_expected [N];
       int i, j;
       for (int i = 0; i < N; i++) {
           data_in [ i ] = 211*i\% 9;
           int temp1 = data_in [i] * 123;
           int temp2 = data_in[i];
           data_out_expected [ i ] = temp1 * temp2;
       foo_b(data_out, data_in, scale);
       for (i = 0; i < N; i++)
           printf ("Expected:[%d], _\tActual:[%d]\n",data_out_expected [i], data_out [i]
           if (data_out_expected [ i ] != data_out [ i ] ) {
```

```
pass = 0;
}

if (pass) {
    fprintf ("-----Pass!-----\n");
    return 0;
} else {
    fprintf ( "-----Fail!-----\n");
    return 1;
}
```

Рис. 5.3. Исходный код теста

## 5.3. Моделирование

Ниже приведены результаты моделирования.

```
INFO: [APCC 202-1] APCC is done.
   Generating csim.exe
Expected:[0], Actual:[0]
Expected:[1968],
                        Actual:[1968]
Expected:[7872],
                        Actual: [7872]
Expected:[1107],
                        Actual:[1107]
Expected:[6027],
                        Actual: [6027]
Expected:[492],
                        Actual:[492]
Expected:[4428],
                        Actual: [4428]
Expected:[123],
                        Actual: [123]
Expected:[3075],
                        Actual: [3075]
              Actual:[0]
Expected:[0],
    ----Pass!---
INFO: [SIM 211-1] CSim done with 0 errors.
INFO: [SIM 211-3] ************ CSIM finish *****
```

Рис. 5.4. Результаты моделирования

По результатам моделирования видно, что устройство работает корректно.

#### 5.4. Синтез

По оценке производительности видно, что устройство соответствует заданным критериям.



Рис. 5.5. Performance estimates



Рис. 5.6. Utilization estimates



Рис. 5.7. Performance profile



Рис. 5.8. Scheduler viewer

|   | Resource\Control Step | C0   | C1 |
|---|-----------------------|------|----|
| 1 | ⊡I/O Ports            |      |    |
| 2 | sel                   | read |    |
| 3 | ∃ Instances           |      |    |
| 4 | Loop_Loop1_proc4_U0   | cal  | 11 |

Рис. 5.9. Resource viewer



Рис. 5.10. Dataflow viewer

# 6. Вывод

В данной лабораторной работе были рассмотрены варианты применения директивы DATAFLOW.

В первом решении не используются директивы, выполнение циклов в функции происходит последовательно.

В остальных решениях, добавление директивы ухудшают ситуацию, так как к данным функциям не применима оптимизация потока данных.