# Статическая и динамическая типизация

## Раннее и позднее связывание

**Связывание** -- соответствие между переменными / функциями и областью памяти, в которой хранятся данные.

Раннее связывание -- размещение переменных и функций в памяти планируется до выполнения программы. Значение всех имен в программе должно быть определено до выполнения.

Примеры: большинство статически компилируемых языков программирования -- Си, C++, Fortran, Rust, ...

Позднее связывание -- размещение переменных и функций определяется во время выполнения, поиск значения символов также происходит на этапе выполнения. Также к позднему связыванию относят использование ссылок на функции в Си и виртуальных методов в C++.

Примеры: почти все языки с динамической типизацией.

Раннее связывание в Си:

```c

int NEG_FLAG = 0;

// корректный код
int check(int x)
{
    if (x > 0) 
    {
        return 1;
    }
    else
    {
        return NEG_FLAG;
    }
}

// ошибка компиляции - POS_FLAG определена позже функции

int heck(int x)
{
    if (x > 0) 
    {
        return POS_FLAG;
    }
    else
    {
        return 0;
    }
}

int POS_FLAG = 1;
```

Позднее связывание в Julia:

In [1]:
function check(x)
    if x > 0
        return true
    else
        return FALSY
    end
end

check (generic function with 1 method)

Вызов функции с неопределенным символом не только не вызывает ошибку, но и дает верный результат, если мы не нарываемся на необходимость разрешения неизвестного символа.

In [2]:
check(25)

true

In [3]:
FALSY = false

false

In [4]:
check(-25)

false

### Преимущества разных видов связывания

Раннее связывание -- заранее известны размещение данных в памяти, размер данных, способ работы с ними. Поскольку производимые операции известны на этапе компиляции, компилятор может применить оптимизации - векторизацию, исключение повторных вычислений и т.д. В случае позднего связывания, например, нельзя автоматически исключить повторные вычисления, т.к. до этапа выполнения программы неизвестно, какие именно вычисления будут проводиться.

Позднее связывание -- гибкость, возможность обобщенного программирования.

Пример гибкости использования семантического позднего связывания в Julia:

In [5]:
using LinearAlgebra: norm

function newton_solver(func, df, x0, ftol)
    x = x0
    f = func(x)
    while norm(f) > ftol
        x -= df(x) \ f
        f = func(x)
    end
    return x
end

newton_solver (generic function with 1 method)

Решение скалярного уравнения

In [6]:
newton_solver(x -> x - cos(x), x -> 1 + sin(x), 0.0, 1e-5)

0.739085133385284

Решение системы уравнений

In [7]:
newton_solver(
    x -> [x[1]^2 + x[2]^2 - 4, 4*x[1]^2 - x[2]^2 - 4],
    x -> [
        2*x[1]  2*x[2]
        8*x[1] -2*x[2]
    ],
    [1.0, 1.0],
    1e-5
)

2-element Vector{Float64}:
 1.2649110640673549
 1.549193338549693

В данном случае программист заранее не заботится о том, как именно представлены в памяти x, f, df, что именно означают `norm` и `\` для введённых типов и т.д. При этом функция в итоге работает как для скалярных уравнений, так и для систем, если корректно задано начальное приближение, функция и производная или якобиан.

## Динамическая и статическая типизация

Особенности статической типизации:
1. Типы переменных указываются при объявлении
2. Результат выражения может быть типизирован до непосредственного вычисления.

Особенности динамической типизации:
1. Типы переменных определяются на этапе выполнения программы, переменная может менять свой тип
2. Тип выражения не определен, тип результата выводится на этапе выполнения.

### Связывание и типизация в Julia

Во множестве случаев чисто динамическая типизация приводит к неоправданно большому числу динамических проверок типа. Поэтому в Julia, несмотря на семантически динамическую типизацию и позднее связывание, реализована концепция "как можно более раннего связывания". Это значит, что если транслятор может по типам аргументов функции вывести типы промежуточных переменных и/или результата -- он это делает и компилирует метод для функции статически, близко к тому как это делается в C++.

К примеру, при использовании `newton_solver` со скалярной функцией, компилятор достаточно умён, чтобы определить, что `f = func(x)` всегда будет давать значение `Float64` и т.п.

Функция `code_typed` показывает типы, которые Julia выводит для аргументов функции и промежуточных значений. Макрос `@code_typed f(x, y, ...)` автоматически подставляет типы всех аргументов в вызове. Посмотрим результат для `newton_solver` на данных, тип которых известен:

In [8]:
@code_typed newton_solver(x -> x - cos(x), x -> 1 + sin(x), 0.0, 1e-5)

CodeInfo(
[90m1 ─[39m %1  = invoke Main.cos(x0::Float64)[36m::Float64[39m
[90m└──[39m %2  = Base.sub_float(x0, %1)[36m::Float64[39m
[90m2 ┄[39m %3  = φ (#1 => %2, #3 => %13)[36m::Float64[39m
[90m│  [39m %4  = φ (#1 => x0, #3 => %11)[36m::Float64[39m
[90m│  [39m %5  = Base.abs_float(%3)[36m::Float64[39m
[90m│  [39m %6  = Base.lt_float(ftol, %5)[36m::Bool[39m
[90m└──[39m       goto #4 if not %6
[90m3 ─[39m %8  = invoke Main.sin(%4::Float64)[36m::Float64[39m
[90m│  [39m %9  = Base.add_float(1.0, %8)[36m::Float64[39m
[90m│  [39m %10 = Base.div_float(%3, %9)[36m::Float64[39m
[90m│  [39m %11 = Base.sub_float(%4, %10)[36m::Float64[39m
[90m│  [39m %12 = invoke Main.cos(%11::Float64)[36m::Float64[39m
[90m│  [39m %13 = Base.sub_float(%11, %12)[36m::Float64[39m
[90m└──[39m       goto #2
[90m4 ─[39m       return %4
) => Float64

И в случае, когда все аргументы динамически типизированы (тип задан как `Any`):

In [9]:
code_typed(newton_solver, (Any, Any, Any, Any))

1-element Vector{Any}:
 CodeInfo(
[90m1 ─[39m %1  = (func)(x0)[36m::Any[39m
[90m2 ┄[39m %2  = φ (#1 => %1, #6 => %21)[36m::Any[39m
[90m│  [39m %3  = φ (#1 => x0, #6 => %20)[36m::Any[39m
[90m│  [39m %4  = Main.norm(%2)[36m::Any[39m
[90m│  [39m %5  = Main.:>[36m::typeof(>)[39m
[90m│  [39m %6  = (isa)(%4, BigFloat)[36m::Bool[39m
[90m│  [39m %7  = (isa)(ftol, BigFloat)[36m::Bool[39m
[90m│  [39m %8  = (Core.Intrinsics.and_int)(%6, %7)[36m::Bool[39m
[90m└──[39m       goto #4 if not %8
[90m3 ─[39m %10 = π (%4, [36mBigFloat[39m)
[90m│  [39m %11 = π (ftol, [36mBigFloat[39m)
[90m│  [39m %12 = invoke %5(%10::BigFloat, %11::BigFloat)[36m::Any[39m
[90m└──[39m       goto #5
[90m4 ─[39m %14 = (%4 > ftol)[36m::Any[39m
[90m└──[39m       goto #5
[90m5 ┄[39m %16 = φ (#3 => %12, #4 => %14)[36m::Any[39m
[90m└──[39m       goto #7 if not %16
[90m6 ─[39m %18 = (df)(%3)[36m::Any[39m
[90m│  [39m %19 = (%18 \ %2)[36m::Any[39m
[90m│  [39m %20 =

С помощью функции `code_native` и соответствующего макроса можно также посмотреть сгенерированный машинный код

In [10]:
@code_native newton_solver(x -> x - cos(x), x -> 1 + sin(x), 0.0, 1e-5)

	[0m.text
[90m; ┌ @ In[5]:3 within `newton_solver`[39m
	[96m[1mpushq[22m[39m	[0m%r14
	[96m[1mpushq[22m[39m	[0m%rbx
	[96m[1msubq[22m[39m	[33m$72[39m[0m, [0m%rsp
	[96m[1mvmovsd[22m[39m	[0m%xmm1[0m, [33m16[39m[33m([39m[0m%rsp[33m)[39m
	[96m[1mvmovsd[22m[39m	[0m%xmm0[0m, [33m8[39m[33m([39m[0m%rsp[33m)[39m
[90m; │ @ In[5]:5 within `newton_solver`[39m
[90m; │┌ @ In[10]:1 within `#15`[39m
	[96m[1mmovabsq[22m[39m	[93m$cos[39m[0m, [0m%r14
	[96m[1mcallq[22m[39m	[0m*[0m%r14
	[96m[1mvmovsd[22m[39m	[33m8[39m[33m([39m[0m%rsp[33m)[39m[0m, [0m%xmm1                  [90m# xmm1 = mem[0],zero[39m
[90m; ││┌ @ float.jl:402 within `-`[39m
	[96m[1mvsubsd[22m[39m	[0m%xmm0[0m, [0m%xmm1[0m, [0m%xmm2
	[96m[1mmovabsq[22m[39m	[93m$.rodata.cst16[39m[0m, [0m%rax
[90m; │└└[39m
[90m; │ @ In[5]:6 within `newton_solver`[39m
[90m; │┌ @ generic.jl:668 within `norm` @ generic.jl:668[39m
[90m; ││┌ @ float.jl:524 within 

In [11]:
code_native(newton_solver, (Any, Any, Any, Any))

	[0m.text
[90m; ┌ @ In[5]:3 within `newton_solver`[39m
	[96m[1mpushq[22m[39m	[0m%rbp
	[96m[1mmovq[22m[39m	[0m%rsp[0m, [0m%rbp
	[96m[1mpushq[22m[39m	[0m%r15
	[96m[1mpushq[22m[39m	[0m%r14
	[96m[1mpushq[22m[39m	[0m%r13
	[96m[1mpushq[22m[39m	[0m%r12
	[96m[1mpushq[22m[39m	[0m%rbx
	[96m[1mandq[22m[39m	[33m$-32[39m[0m, [0m%rsp
	[96m[1msubq[22m[39m	[33m$128[39m[0m, [0m%rsp
	[96m[1mvxorps[22m[39m	[0m%xmm0[0m, [0m%xmm0[0m, [0m%xmm0
	[96m[1mvmovaps[22m[39m	[0m%ymm0[0m, [33m32[39m[33m([39m[0m%rsp[33m)[39m
	[96m[1mmovq[22m[39m	[33m$0[39m[0m, [33m64[39m[33m([39m[0m%rsp[33m)[39m
	[96m[1mmovq[22m[39m	[0m%rsi[0m, [33m96[39m[33m([39m[0m%rsp[33m)[39m
	[96m[1mmovq[22m[39m	[0m%fs[0m:[33m0[39m[0m, [0m%rax
	[96m[1mmovq[22m[39m	[33m-8[39m[33m([39m[0m%rax[33m)[39m[0m, [0m%rcx
	[96m[1mmovq[22m[39m	[33m$12[39m[0m, [33m32[39m[33m([39m[0m%rsp[33m)[39m
	[96m[1mmovq[22m[39

Видно, что если компилятор не может делать предположения о типах, то машинный код занимает больше места даже с точки зрения листинга (больше 500 строчек против 200 для типизированной версии). Также в листинге для версии, которой дана информация о типах, видим выполнение операций на регистрах, в том числе активное использование регистров `xmm` -- регистров для чисел с плавающей точкой. Для нетипизированной версии же в листинге в основном операции с памятью и вызовы нижележащих функций, которые и должны в итоге сделать всю работу.

Таким образом, при выполнении вызова `newton_solver` с конкретными аргументами можно подгрузить вариант программного кода, в котором память под локальные переменные выделена статически.

Замер времени макросом `@benchmark` показывает, что для решения скалярного уравнения, действительно, не происходит динамического выделения памяти:

In [12]:
@benchmark newton_solver(x -> x - cos(x), x -> 1 + sin(x), 0.0, 1e-5)

BenchmarkTools.Trial: 10000 samples with 963 evaluations.
 Range [90m([39m[36m[1mmin[22m[39m … [35mmax[39m[90m):  [39m[36m[1m84.449 ns[22m[39m … [35m197.615 ns[39m  [90m┊[39m GC [90m([39mmin … max[90m): [39m0.00% … 0.00%
 Time  [90m([39m[34m[1mmedian[22m[39m[90m):     [39m[34m[1m87.171 ns               [22m[39m[90m┊[39m GC [90m([39mmedian[90m):    [39m0.00%
 Time  [90m([39m[32m[1mmean[22m[39m ± [32mσ[39m[90m):   [39m[32m[1m92.156 ns[22m[39m ± [32m 13.212 ns[39m  [90m┊[39m GC [90m([39mmean ± σ[90m):  [39m0.00% ± 0.00%

  [39m█[39m▅[34m█[39m[39m▄[39m▇[39m▃[39m▁[32m▂[39m[39m▃[39m▂[39m▃[39m▂[39m [39m▁[39m▁[39m▁[39m▁[39m [39m▁[39m [39m [39m [39m [39m▁[39m [39m [39m [39m [39m [39m [39m [39m▁[39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m [39m▂
  [39m█[39m█[34m█[39m[39