# Performance e Operações Paralelas

In [3]:
using Pkg

using BenchmarkTools
using LoopVectorization
using Plots
using StaticArrays
using ThreadsX

using CUDA # há vá?!?!

using Random: seed!, shuffle
using Statistics: mean

# Random Seed
seed!(123)

# Printar cores no terminal
using ANSIColoredPrinters

# Checklist basico para _performance_

1. Arrumar instabilidade de tipo
2. Usar variáveis locais ao invés de gloabais
3. Deixar tudo imutável se possível
4. Desativar checagem de índice em operações com `Array`
5. Ativar suporte SIMD em todos os loops `for` (Single Instruction Multiple Data)

## Instabilidade de tipo

> Tipo de saída de uma função é __imprevisível__ a partir dos tipos de entradas. Em particular, isso significa que o tipo de saída __pode variar__ dependendo dos valores das entradas.

In [4]:
function positivo(x)
    if x > 0
        return x
    else
        return 0
    end
end

positivo (generic function with 1 method)

> função com untabilidade de tipo >>> `x` é o que?

`@code_warntype` avalia a função como um argumento e prenta um _Abstract Syntax Tree_ (AST)

In [5]:
@code_warntype positivo(-3.4)

Variables
  #self#[36m::Core.Const(positivo)[39m
  x[36m::Float64[39m

Body[91m[1m::Union{Float64, Int64}[22m[39m
[90m1 ─[39m %1 = (x > 0)[36m::Bool[39m
[90m└──[39m      goto #3 if not %1
[90m2 ─[39m      return x
[90m3 ─[39m      return 0


> onde ficou vermelho, tem algum problema de tipo

### Arrumando a instabilidade de tipo

Anotar os tipos!

In [6]:
function positivo_stabel(x::AbstractFloat)
    if x > 0
        return x 
    else
        return 0.0
    end
end

positivo_stabel (generic function with 1 method)

In [7]:
function positivo_stabel(x::Integer)
    if x > 0
        return x 
    else
        return 0
    end
end

positivo_stabel (generic function with 2 methods)

In [8]:
@code_warntype positivo_stabel(-3.4)

Variables
  #self#[36m::Core.Const(positivo_stabel)[39m
  x[36m::Float64[39m

Body[36m::Float64[39m
[90m1 ─[39m %1 = (x > 0)[36m::Bool[39m
[90m└──[39m      goto #3 if not %1
[90m2 ─[39m      return x
[90m3 ─[39m      return 0.0


In [9]:
@code_warntype positivo_stabel(-3)

Variables
  #self#[36m::Core.Const(positivo_stabel)[39m
  x[36m::Int64[39m

Body[36m::Int64[39m
[90m1 ─[39m %1 = (x > 0)[36m::Bool[39m
[90m└──[39m      goto #3 if not %1
[90m2 ─[39m      return x
[90m3 ─[39m      return 0


### Pq é importante anotar os tipos?

In [11]:
x = rand(1_000);

In [13]:
@benchmark positivo.($x)

BenchmarkTools.Trial: 10000 samples with 10 evaluations.
 Range [90m([39m[36m[1mmin[22m[39m … [35mmax[39m[90m):  [39m[36m[1m1.930 μs[22m[39m … [35m 1.357 ms[39m  [90m┊[39m GC [90m([39mmin … max[90m): [39m 0.00% … 99.49%
 Time  [90m([39m[34m[1mmedian[22m[39m[90m):     [39m[34m[1m3.980 μs              [22m[39m[90m┊[39m GC [90m([39mmedian[90m):    [39m 0.00%
 Time  [90m([39m[32m[1mmean[22m[39m ± [32mσ[39m[90m):   [39m[32m[1m7.814 μs[22m[39m ± [32m37.978 μs[39m  [90m┊[39m GC [90m([39mmean ± σ[90m):  [39m17.16% ±  3.58%

  [39m▄[39m▁[39m [39m▆[39m█[34m▅[39m[39m▃[39m▃[39m▃[39m▃[39m▂[39m [39m [39m [32m [39m[39m [39m▄[39m▃[39m▄[39m▅[39m▃[39m▂[39m▁[39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m▁
  [39m█[39m█[39m█[39m█[39m█[34m█[39m

In [14]:
@benchmark positivo_stabel.($x)

BenchmarkTools.Trial: 10000 samples with 186 evaluations.
 Range [90m([39m[36m[1mmin[22m[39m … [35mmax[39m[90m):  [39m[36m[1m803.763 ns[22m[39m … [35m348.528 μs[39m  [90m┊[39m GC [90m([39mmin … max[90m): [39m 0.00% … 96.99%
 Time  [90m([39m[34m[1mmedian[22m[39m[90m):     [39m[34m[1m  1.267 μs               [22m[39m[90m┊[39m GC [90m([39mmedian[90m):    [39m 0.00%
 Time  [90m([39m[32m[1mmean[22m[39m ± [32mσ[39m[90m):   [39m[32m[1m  2.478 μs[22m[39m ± [32m  6.365 μs[39m  [90m┊[39m GC [90m([39mmean ± σ[90m):  [39m20.15% ± 13.30%

  [39m▇[34m█[39m[39m▆[39m▄[39m▃[32m▃[39m[39m▂[39m▁[39m▂[39m▂[39m▁[39m▁[39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m▁
  [39m█[34m█

### Dicas!

Dar preferência para usar __tipos abstrtatos__ ao invés de tipos concretos.

`AbstractFlosa` >>> `Float64` or `Float32`  
`Integer` >>> `Int128` or `Int64` or `Int342`

### Tipos paramétricos

São introduzidos com as chaves `{}` e usando palavras-chave `where`

In [16]:
# por exemplo qualquer subtipo de `Real`
subtypes(Real)

8-element Vector{Any}:
 AbstractFloat
 AbstractIrrational
 FixedPointNumbers.FixedPoint
 Integer
 Rational
 StatsBase.PValue
 StatsBase.TestStat
 VectorizationBase.AbstractSIMD

In [17]:
function positivo_stable2(x::T) where T <: Real
    if x > 0
        return x
    else
        return 0::T
    end
end

positivo_stable2 (generic function with 1 method)

In [18]:
@code_warntype positivo_stable2(-3.4)

Variables
  #self#[36m::Core.Const(positivo_stable2)[39m
  x[36m::Float64[39m

Body[36m::Float64[39m
[90m1 ─[39m %1 = (x > 0)[36m::Bool[39m
[90m└──[39m      goto #3 if not %1
[90m2 ─[39m      return x
[90m3 ─[39m      Core.typeassert(0, $(Expr(:static_parameter, 1)))
[90m└──[39m      Core.Const(:(return %4))


In [19]:
@code_warntype positivo_stable2(-3)

Variables
  #self#[36m::Core.Const(positivo_stable2)[39m
  x[36m::Int64[39m

Body[36m::Int64[39m
[90m1 ─[39m %1 = (x > 0)[36m::Bool[39m
[90m└──[39m      goto #3 if not %1
[90m2 ─[39m      return x
[90m3 ─[39m %4 = Core.typeassert(0, $(Expr(:static_parameter, 1)))[36m::Core.Const(0)[39m
[90m└──[39m      return %4
