

Dokumentace k projektu pro předmět HSC

Projekt č. 1

17. prosince 2016

Autor: Lukáš Pelánek, xpelan03@stud.fit.vutbr.cz

## Obsah

| Tabulka a graf výsledků analýzy algoritmu z programu gprofgraf výsledků analýzy algoritmu z programu gprof | 3 |
|------------------------------------------------------------------------------------------------------------|---|
| Vlastnosti obvodu FPGA                                                                                     | 4 |
| Porovnání čistě softwarové a rozdělené implementace                                                        | 4 |
| Shrnutí                                                                                                    | 4 |

# Tabulka a graf výsledků analýzy algoritmu z programu gprof

| Název funkce     | Čas strávený ve funkci [%] |  |
|------------------|----------------------------|--|
| median           | 64,46                      |  |
| gen_pixel        | 11,79                      |  |
| clip_window      | 8,06                       |  |
| buffer           | 5,60                       |  |
| pixel_processing | 5,23                       |  |
| shift_window     | 4,70                       |  |
| system_input     | 2,54                       |  |
| thresholding     | 1,05                       |  |
| histogram_clean  | 0,22                       |  |
| otsu             | 0,22                       |  |
| main             | 0,15                       |  |
| update_base_pos  | 0,07                       |  |
| print_results    | 0,00                       |  |

Tabulka 1: Tabulka znázorňující čas procesoru strávený ve funkci



Graf 1: Graf znázorňující čas procesoru strávený ve funkci

#### Vlastnosti obvodu FPGA

| Inicializační interval hlavní smyčky | 4                  |
|--------------------------------------|--------------------|
| Latence obvodu                       | 4                  |
| Number of Slice Flip Flops           | 556 out of 1,536   |
| Number of 4 input LUTs               | 1,152 out of 1,536 |
| Number of occupied Slices            | 766 out of 768     |
| Total Number of 4 input LUTs         | 1,241 out of 1,536 |
| Number used as logic                 | 1,152              |
| Number used as a route-thru          | 89                 |

Tabulka 2: Tabulka obsahující vlastnosti obvodu FPGA

### Porovnání čistě softwarové a rozdělené implementace

|                                      | SW        | HW/SW        |
|--------------------------------------|-----------|--------------|
| Prům. doba zpracování pixelu         | 183 µs    | 0,16 μs      |
| Počet zpracovaných pixelů za vteřinu | 5464 px/s | 6250000 px/s |
| Zrychlení                            | 1x        | 1143x        |

Tabulka 3: Tabulka porovnávající vlastností softwarové a rozdělené implementace

#### Shrnutí

Čistě softwarová implementace je nedostačující, protože nedokáže vygenerovat dostatečný počet snímků za vteřinu při rozlišení 320x240 px. Po rozdělení implementace mezi HW a SW se podařilo zrychlit aplikací 1143x a počet snímků za vteřinu zvýšit na 81 z původních 0,07. Aplikaci lze dále urychlit umístěním všech funkcí do HW části. Toto urychlení by potřebovalo více prostoru v FPGA části, a proto by bylo ekonomicky náročnější a tudíž je potřeba zvážit, zda by se takové zrychlení vyplatilo za cenu vyšších finančních nákladů. Během implementace jsem narazil na problém s programem Catapult, kde testbench souboru filter trval zhruba 17 minut.