# Efektivní výpočty
### Aleš Křenek, Jiří Filipovič, David Střelák, Jaroslav Olha
#### Sitsem, 9.9.2021, Telč

# Proč počítat?

- Digitální multimédia
- Střílečky a animáky
- Sociální sítě a velká data
- Kryptoměny
- Inženýrské aplikace, digitální dvojčata
- Aplikace ve vědě, zpracování dat, simulace

## Mooreův zákon
- Za stejné peníze dostanu každých 18-24 měsíců dvojnásobný výkon
- Exponenciální růst posledních téměř 50 let
- Stále je třeba dostupný výkon umět využít

## Složitost a efektivita

- Matematik: konečné problémy nejsou zajímavé
- Teoretický informatik: zajímavé jsou NP-úplné problémy
- Praktický informatik: co není polynomiální, to nespočítám
- Opravdový výpočtář
  - s asymptotickou složitostí musím žít
  - **na konstatntním faktoru záleží**

In [4]:
import random
from timeit import default_timer as timer

N = 300
A = [ [ random.random() for _ in range(N)] for _ in range(N)]
B = [ [ random.random() for _ in range(N)] for _ in range(N)]
C = [ [ 0. for _ in range(N)] for _ in range(N)]

start = timer()
for i in range(N):
    for j in range(N):
        for k in range(N):
            C[i][j] += A[i][k] * B[k][j]
            
end = timer()

In [6]:
# Pozorovaný výkon (GFLOPS)
time = end-start
ops = 2 * N**3
measured = ops / time / 1e9
measured

0.008676875559147526

In [11]:
# Očekávaný teoretický výkon (32bit float, jedno jádro tohoto CPU)
expect = 128

# Doba potřebná k "dohnání" Moorovým zákonem
# ... za předpokladu, že stroje budoucnosti můj hloupý kód využije aspoň stejně dobře
import math
math.log2(expect/measured)*18/12

20.772912969001574

## Hrubá síla nevítězí

- Dostupný výkon současného hardware (CPU, GPU, ...) je impozantní
- Dosažen je komplikovanými technickými prostředky
- Využít ho alespoň uspokojivě není jednoduché
- Řešení "koupím lepší počítač" v případě výpočetních problémů příliš nefunguje
    


## Přehled bloku

- Interpretované jazyky
  - rychlá implementace, první volba při řešení nového problému
  - i v nich lze řadu problému vyřešit s uspokojivou efektivitou
- Kompilace
  - identifikovali jsme výkonově problematickou část, v Pythonu/R/... s ní už nic nenaděláme
  - kód přepíšeme do C/C++, co s ním poté umí provést kompilátor a jak ho k tomu přimět
- Profilování 
  - funkčně je kód v C/C++ v pořádku, výkonově to stále ještě není ono
  - jak najít, co je špatně


## Přehled bloku
- Optimalizační triky
  - ne všechny implementace jsou stejně dobré, jak jim lze pomoci
- Zahodit i s rukama
  - v jistých situacích má smysl (se znalostí podstaty výkonového problému) část kódu úplně přepsat
- A konečně ta věda
  - přístupy a techniky, kterými naše HPC skupina posouvá oblast efektivních výpočtů dál
