# Inferencia de tipos

En lenguajes como C, el programador debe dar los tipos explícitamente. Por ejemplo, la siguiente función toma dos `double` y devuelve otro:

```c
double f(double x, double y) {
    return 2*x + y;
}
```

Los tipos de las variables se conocen porque el programador los especifica obligatoriamente. De este modo el compilador puede generar código que haga la operación de manera eficiente.

Por el contrario, en lenguajes interpretados como Python, los tipos se chequean en tiempo de ejecución. Por ejemplo, tomemos el siguiente bloque de código:

```python
x = 1
y = 2
2*x + y
```

En la tercera línea, el intérprete de Python chequea el tipo de los objetos, y los usa para calcular el resultado. Esto genera dos fuentes de overhead:

 1. El chequeo de tipos
 2. La asignación de memoria dinámica, ya que es imposible saber cuánta memoria toma un valor, ni si seguirá tomando la misma cantidad de memoria en el futuro.

La solución de Julia es un híbrido. El código en Julia se ve como el de Python:

```julia
x = 1
y = 2
2*x + y
```

Sin embargo, antes de la compilación, Julia ejecuta un algoritmo de inferencia de tipos. Dado que `x` es un `Int`, e `y` es un `Int`, puede inferir que `2*x+y` también es un `Int`, para así compilar el método más eficiente para realizar la operación posteriormente. 

Para escribir código rápido en Julia, es importante que el algoritmo de inferencia pueda inferir los tipos correctamente y que éstos sean concretos, lo que se denomina "estabilidad con respecto al tipo". Esta propiedad tiene dos ventajas que impactan en la performance: 

1. El código se compila a instrucciones rápidas `GOTO`
2. Se conoce el espacio que ocupan las variables en memoria en tiempo de compilación

El segundo punto implica que la memoria puede asignarse en el *stack* (la sección de la memoria de acceso prácticamente inmediato)

Por el contrario, el código inestable corre con las siguientes desventajas: 
1. Cada llamado a una función debe recorrer la lista de métodos, buscando el que corresponde a los tipos de los argumentos
2. No se conoce el tamaño en memoria de las variables en tiempo de compilación, por lo que se les asigna punteros en el *heap*, donde acceso es mucho más lento. 

Veamos ejemplos de esto en Julia. Definimos, por ejemplo, una suma estable con respecto al tipo:

In [9]:
suma_estable(x,y) = x + y

suma_estable (generic function with 1 method)

Inspeccionemos el código LLVM (representación intermedia) al que se compila la suma cuando se llama con dos `Int`:

In [10]:
@code_llvm suma_estable(1,2)

[90m;  @ In[9]:1 within `suma_estable`[39m
[95mdefine[39m [36mi64[39m [93m@julia_suma_estable_2022[39m[33m([39m[36mi64[39m [95msignext[39m [0m%0[0m, [36mi64[39m [95msignext[39m [0m%1[33m)[39m [0m#0 [33m{[39m
[91mtop:[39m
[90m; ┌ @ int.jl:87 within `+`[39m
   [0m%2 [0m= [96m[1madd[22m[39m [36mi64[39m [0m%1[0m, [0m%0
[90m; └[39m
  [96m[1mret[22m[39m [36mi64[39m [0m%2
[33m}[39m


Ahora, con dos `Float64`:

In [25]:
@code_llvm suma_estable(1.0,2.0)

[90m;  @ In[24]:1 within `suma_estable`[39m
[95mdefine[39m [36mdouble[39m [93m@julia_suma_estable_3176[39m[33m([39m[36mdouble[39m [0m%0[0m, [36mdouble[39m [0m%1[33m)[39m [0m#0 [33m{[39m
[91mtop:[39m
[90m; ┌ @ float.jl:408 within `+`[39m
   [0m%2 [0m= [96m[1mfadd[22m[39m [36mdouble[39m [0m%0[0m, [0m%1
[90m; └[39m
  [96m[1mret[22m[39m [36mdouble[39m [0m%2
[33m}[39m


¿Qué pasa en el caso mixto?

In [26]:
@code_llvm suma_estable(1, 2.0)

[90m;  @ In[24]:1 within `suma_estable`[39m
[95mdefine[39m [36mdouble[39m [93m@julia_suma_estable_3180[39m[33m([39m[36mi64[39m [95msignext[39m [0m%0[0m, [36mdouble[39m [0m%1[33m)[39m [0m#0 [33m{[39m
[91mtop:[39m
[90m; ┌ @ promotion.jl:410 within `+`[39m
[90m; │┌ @ promotion.jl:381 within `promote`[39m
[90m; ││┌ @ promotion.jl:358 within `_promote`[39m
[90m; │││┌ @ number.jl:7 within `convert`[39m
[90m; ││││┌ @ float.jl:159 within `Float64`[39m
       [0m%2 [0m= [96m[1msitofp[22m[39m [36mi64[39m [0m%0 [95mto[39m [36mdouble[39m
[90m; │└└└└[39m
[90m; │ @ promotion.jl:410 within `+` @ float.jl:408[39m
   [0m%3 [0m= [96m[1mfadd[22m[39m [36mdouble[39m [0m%2[0m, [0m%1
[90m; └[39m
  [96m[1mret[22m[39m [36mdouble[39m [0m%3
[33m}[39m


Podemos usar `@code_warntype` para inspeccionar si el código es estable con respecto al tipo:

In [28]:
@code_warntype suma_estable(1.0,2.0)

MethodInstance for suma_estable(::Float64, ::Float64)
  from suma_estable([90mx[39m, [90my[39m)[90m @[39m [90mMain[39m [90m[4mIn[24]:1[24m[39m
Arguments
  #self#[36m::Core.Const(suma_estable)[39m
  x[36m::Float64[39m
  y[36m::Float64[39m
Body[36m::Float64[39m
[90m1 ─[39m %1 = (x + y)[36m::Float64[39m
[90m└──[39m      return %1



Definamos ahora una función inestable con respecto al tipo:

In [29]:
function suma_inestable(x,y)
    out = x + y
    rand(Bool) ? out : Float64(out)
end

suma_inestable (generic function with 1 method)

In [30]:
@code_warntype suma_inestable(1,2)

MethodInstance for suma_inestable(::Int64, ::Int64)
  from suma_inestable([90mx[39m, [90my[39m)[90m @[39m [90mMain[39m [90m[4mIn[29]:1[24m[39m
Arguments
  #self#[36m::Core.Const(suma_inestable)[39m
  x[36m::Int64[39m
  y[36m::Int64[39m
Locals
  out[36m::Int64[39m
Body[33m[1m::Union{Float64, Int64}[22m[39m
[90m1 ─[39m      (out = x + y)
[90m│  [39m %2 = Main.rand(Main.Bool)[36m::Bool[39m
[90m└──[39m      goto #3 if not %2
[90m2 ─[39m      return out
[90m3 ─[39m %5 = Main.Float64(out)[36m::Float64[39m
[90m└──[39m      return %5



Un patrón más común que puede llevar a inestabilidad con respecto al tipo es el siguiente (tomado de la documentación de Julia):

In [11]:
pos(x) = x < 0 ? 0 : x

pos (generic function with 1 method)

In [12]:
@code_warntype pos(1.0)

MethodInstance for pos(::Float64)
  from pos([90mx[39m)[90m @[39m [90mMain[39m [90m[4mIn[11]:1[24m[39m
Arguments
  #self#[36m::Core.Const(pos)[39m
  x[36m::Float64[39m
Body[33m[1m::Union{Float64, Int64}[22m[39m
[90m1 ─[39m %1 = (x < 0)[36m::Bool[39m
[90m└──[39m      goto #3 if not %1
[90m2 ─[39m      return 0
[90m3 ─[39m      return x



La solución estable sería la siguiente:

In [13]:
pos(x) = x < 0 ? zero(x) : x

pos (generic function with 1 method)

In [14]:
@code_warntype pos(1.0)

MethodInstance for pos(::Float64)
  from pos([90mx[39m)[90m @[39m [90mMain[39m [90m[4mIn[13]:1[24m[39m
Arguments
  #self#[36m::Core.Const(pos)[39m
  x[36m::Float64[39m
Body[36m::Float64[39m
[90m1 ─[39m %1 = (x < 0)[36m::Bool[39m
[90m└──[39m      goto #3 if not %1
[90m2 ─[39m %3 = Main.zero(x)[36m::Core.Const(0.0)[39m
[90m└──[39m      return %3
[90m3 ─[39m      return x



### Funciones barrera

Tomemos el siguiente ejemplo de una función inestable de la documentación de Julia:

In [8]:
function strange_twos(n)
    a = Vector{rand(Bool) ? Int64 : Float64}(undef, n)
    for i = 1:n
        a[i] = 2
    end
    return a
end

strange_twos (generic function with 1 method)

In [18]:
strange_twos(3)

3-element Vector{Float64}:
 2.0
 2.0
 2.0

In [19]:
@code_warntype strange_twos(3)

MethodInstance for strange_twos(::Int64)
  from strange_twos([90mn[39m)[90m @[39m [90mMain[39m [90m[4mIn[8]:1[24m[39m
Arguments
  #self#[36m::Core.Const(strange_twos)[39m
  n[36m::Int64[39m
Locals
  @_3[33m[1m::Union{Nothing, Tuple{Int64, Int64}}[22m[39m
  a[91m[1m::Vector[22m[39m
  i[36m::Int64[39m
  @_6[33m[1m::Union{Type{Float64}, Type{Int64}}[22m[39m
Body[91m[1m::Vector[22m[39m
[90m1 ─[39m       Core.NewvarNode(:(@_3))
[90m│  [39m       Core.NewvarNode(:(a))
[90m│  [39m %3  = Main.Vector[36m::Core.Const(Vector)[39m
[90m│  [39m %4  = Main.rand(Main.Bool)[36m::Bool[39m
[90m└──[39m       goto #3 if not %4
[90m2 ─[39m       (@_6 = Main.Int64)
[90m└──[39m       goto #4
[90m3 ─[39m       (@_6 = Main.Float64)
[90m4 ┄[39m %9  = @_6[33m[1m::Union{Type{Float64}, Type{Int64}}[22m[39m
[90m│  [39m %10 = Core.apply_type(%3, %9)[91m[1m::Type{Vector{_A}} where _A[22m[39m
[90m│  [39m %11 = Main.undef[36m::Core.Const(UndefInitializer

La inferencia de tipos ocurre en las fronteras entre funciones. Por lo tanto, introducir un llamado a una *función barrera* aliviana el problema, dando un nuevo punto de referencia para la inferencia de tipos.

In [21]:
function fill_twos!(a)
    for i = eachindex(a)
        a[i] = 2
    end
end

function strange_twos(n)
    a = Vector{rand(Bool) ? Int64 : Float64}(undef, n)
    fill_twos!(a)
    return a
end

strange_twos (generic function with 1 method)

Esta segunda versión es más rápida que la anterior, porque la función `fill_twos!` puede recompilarse para distintos tipos de `a`.