# Знакомство с <span style="font-weight:bold; color:#dc8a33">OCaml</span>

<div style="text-align:right;">Гейне М.А. <span style="font-style: italic;font-weight: bold;">(geine@bmstu.ru)</div>

Как запустить:

- [Установите OCaml](https://ocaml.org/install)
- Создайте OPAM-switch для занятия. Это должен быть switch с минимальным количеством установленных пакетов. Например, `opam switch create jptr ocaml-base-compiler.4.14.0`
- Установите OCaml-Jupyter с помощью `opam install jupyter`
- Также установите пакеты, необходимые для работы: `opam install ounit2 qcheck menhir zarith utop`
- Для удобства редактирования кода OCaml в VS Code во время работы с тетрадью также установите эти пакеты: `opam install ocaml-lsp-server ocamlformat`
- Запустите `ocaml-jupyter-opam-genspec`
- Выполните команду `jupyter kernelspec install --user --name ocaml-jupyter "$(opam var share)/jupyter"`

In [None]:
print_endline "Hello world!"

Вы уже умеете программировать на основных языках, таких как Python или Java? Отлично. Этот урок для вас. Пришло время научиться программировать лучше. Пришло время изучить функциональный язык <span style="font-weight:bold; color:#dc8a33">OCaml</span>.

Я верю, что изучение OCaml сделает вас лучшим программистом. Вот почему:

- Вы ощутите свободу _иммутабельности_, при которой значения так называемых "переменных" не могут меняться. Прощай, отладка.
- Вы станете лучше разбираться в _абстракции_ - практике избегания повторений путем вычитания общих черт. Прощай, раздутый код.
- Вы познакомитесь с системой _типов_, которую поначалу будете ненавидеть, потому что она отвергает программы, которые вы считаете правильными. Но вы полюбите ее, потому что смиренно поймете, что она была права, а ваши программы - ошибочны. Прощайте, неудачные тесты.
- Вы познакомитесь с теорией и реализацией языков программирования, что поможет вам понять основы того, что вы говорите компьютеру, когда пишете код. Прощайте, таинственные и волшебные заклинания.

## Основы языка

Все выражения занятия можно выполнять как в тетради, так и в REPL (*read-eval-print-loop*) `utop`.

In [None]:
42

`let` используется для *связывания* имени с его значением

In [None]:
let x = 42

В примере выше определено, что "x имеет тип int и значение 42"

Функции также могут быть определены через `let`

In [None]:
let increment x = x + 1

Синтаксис определения функций в Ocaml по сути такой же, как и синтаксис определения переменных, что делает еще более очевидным тот факт, что "функция - это тоже часть данных".

Вычислить значение функции можно следующими способами

In [None]:
increment 0

In [None]:
increment(21)

In [None]:
increment (increment 5)

In [None]:
increment increment 5

### Выражения

Целые числа

In [None]:
65 / 60

In [None]:
65 mod 60

In [None]:
65 / 0

`float`-ы в OCaml соответствуют `double` и пишутся обязательно с точкой

In [None]:
3.

In [None]:
3

В OCaml умышленно нет перегрузок операторов для чистоты типов

In [None]:
3.14 *. 2.

In [None]:
3.14 * 2.

В OCaml нет автоматического преобразования типов, оно должно быть явным

In [None]:
3.14 *. (float_of_int 2)

Символы записываются в одинарных кавычках

In [None]:
'c'

А строки - в двойных

In [None]:
"c"

Конкатенация строк записывается через оператор `^`

In [None]:
"abc" ^ "def"

In [None]:
string_of_int 42

In [None]:
int_of_string "123"

In [None]:
"abc".[0]

### Условия

In [None]:
if 3 + 5 > 2 then "yay!" else "boo!"

Если в привычных нам языках *if-then-else* является утверждением, конструкцией, то в OCaml *if-then-else* является выражением, точно таким же, как предыдущие. Это значит, что *if-then-else* может быть в любом месте, где корректно использовать выражение, и что выражение имеет значение

In [None]:
4 + (if 'a' = 'b' then 1 else 2)

### Области видимости

Выражение `let name = val in expr` связывает имя `name` с значением `value` и делает доступным это имя только в выражении `expr`

In [None]:
let x = 42 in
  (* y is not meaningful here *)
  x + (let y = "3110" in
         (* y is meaningful here *)
         int_of_string y)

In [None]:
let x = 5 in
  ((let x = 6 in x) + x)

Мы видим, что имена в контекстах могут совпадать, но это достаточно сильно может путать, поэтому так делать не стоит

### Аннотации типов

OCaml самостоятельно выводит типы выражений. Однако, иногда может быть полезным вручную указать тип

In [None]:
(5 : int)

In [None]:
(5 : float)

### Функции

Функции объявляются практически так же, как и имена связываются со значениями, но с небольшим отличием: помимо имени функции необходимо также перечислить имена её параметров

In [None]:
let add2 x =
  x + 2

Для объявления рекурсивной функции необходимо воспользоваться ключевым словом `rec`

In [None]:
let rec fact n = if n = 0 then 1 else n * fact (n - 1)

In [None]:
(** [pow x y] is [x] to the power of [y].
     Requires: [y >= 0]. *)
let rec pow x y = if y = 0 then 1 else x * pow x (y - 1)

In [None]:
pow 2 4

Взаимно рекурсивные функции определяются с помощью `and`

In [None]:
(** [even n] is whether [n] is even.
    Requires: [n >= 0]. *)
let rec even n =
  n = 0 || odd (n - 1)

(** [odd n] is whether [n] is odd.
    Requires: [n >= 0]. *)
and odd n =
  n <> 0 && even (n - 1);;

In [None]:
odd 12

Синтаксис для типов функций следующий:

```
t -> u
t1 -> t2 -> u
t1 -> ... -> tn -> u
```

`t` и `u` являются метапеременными, указывающими на типы. Тип `t -> u` - это тип функции, которая принимает вход типа `t` и возвращает выход типа `u`. Мы можем считать `t1 -> t2 -> u` типом функции, которая принимает два входа, первый из которых типа `t1`, а второй типа `t2`, и возвращает выход типа `u`. Аналогично для функции, принимающей `n` аргументов.

Анонимные функции задаются с помощью `fun`

In [None]:
let inc x = x + 1
let inc = fun x -> x + 1

### Pipeline

Можно связать несколько функций в цепь с помощью оператора `|>` (`|` и `>`). Pipeline подставит левую часть выражения в конец выражения в правой части

In [None]:
let square x = x * x

In [None]:
square (inc 5)

In [None]:
5 |> inc |> square

In [None]:
square (inc (inc (square (inc 5))))

In [None]:
5 |> inc |> square |> inc |> inc |> square

### Полиморфные функции

Не все функции строго определяют типы параметров. К примеру, функция определения:

In [None]:
let id x = x

`'a` - переменная типа. Она означает, что тип переменной не установлен и может быть любым. Часто используемые переменные типа включают `'a`, `'b` и `'c`, которые в OCaml обычно произносят по-гречески: альфа, бета и гамма.

In [None]:
id 42;;
id true;;
id "bigred";;

Если вручную аннотировать типы, то можно ограничить тип функции, который был бы выведен компилятором автоматически

In [None]:
let id_int (x : int) : int = x

In [None]:
id_int true

Другим способом записи `id_int` было бы выражение через `id`:

In [None]:
let id_int' : int -> int = id

Тип `id_int` определяет один из аспектов его ***поведения***: если на вход подается `int`, он обещает выдать `int` на выходе. Оказывается, что `id` тоже дает такое же обещание: если на вход подано `int`, то на выходе оно тоже вернет `int`. Но `id` дает еще больше обещаний, например: если на вход подается `bool`, то на выходе он вернет `bool`. Поэтому, привязав `id` к более строгому типу `int -> int`, мы отбросили все эти дополнительные обещания как несущественные. Конечно, это потерянная информация, но, по крайней мере, ни одно обещание не будет нарушено. Всегда будет безопасно использовать функцию типа `'a -> 'a`, когда нам нужна была функция типа `int -> int`.

Однако обратное утверждение невозможно. Мы не можем взять функцию типа `int -> int` и расширить до типа `'a -> 'a`. 

In [None]:
let id' : 'a -> 'a = fun x -> x + 1

In [None]:
id' true

Это приводит нас к другому, более механическому, способу думать обо всем этом в терминах **применения**. Под этим мы понимаем то же самое представление о том, как функция применяется к аргументам: при оценке выражения `id 5` аргумент `x` _инстанцируется_ со значением `5`. Аналогично, `'a` в типе `id` инстанцируется с типом `int` в этом применении.

### Именованные и опциональные аргументы

In [None]:
let f ~name1:arg1 ~name2:arg2 = arg1 + arg2

In [None]:
f ~name2:3 ~name1:4

In [None]:
let f ~name1:(arg1 : int) ~name2:(arg2 : int) = arg1 + arg2

In [None]:
let f ?name:(arg1=8) arg2 = arg1 + arg2

In [None]:
f ~name:2 7

In [None]:
f 7

### Частичное применение

In [None]:
let add x y = x + y

In [None]:
let addx x = fun y -> x + y

Функция `addx` принимает на вход целое число `x` и возвращает _функцию_ типа `int -> int`, которая добавит `x` к тому, что ей передано.

Тип `addx` - это `int -> int -> int`. Тип `add` также `int -> int -> int`. Таким образом, с точки зрения их типов, это одна и та же функция. Но форма `addx` предполагает нечто интересное: мы можем применять ее только к одному аргументу.

In [None]:
let add5 = addx 5

In [None]:
add5 2

In [None]:
let add5 = add 5

Оказывается, то же самое можно сделать с помощью `add`:

In [None]:
let add5 = add 5

In [None]:
add5 2

### Ассоциативность функций

Готовы ли вы к правде? Сделайте глубокий вдох. Начинаем...

**Каждая функция OCaml принимает ровно один аргумент.**

Почему? Рассмотрим `add`: хотя мы можем записать ее как `let add x y = x + y`, мы знаем, что семантически это эквивалентно `let add = fun x -> (fun y -> x + y)`. И вообще,

```
let f x1 x2 ... xn = e
```

семантически эквивалентно

```ocaml
let f =
  fun x1 ->
    (fun x2 ->
       (...
          (fun xn -> e)...))
```

Таким образом, даже если вы думаете о `f` как о функции, принимающей `n` аргументов, на самом деле это функция, которая принимает 1 аргумент и возвращает функцию.

Тип такой функции

```
t1 -> t2 -> t3 -> t4
```

на самом деле означает то же самое, что

```
t1 -> (t2 -> (t3 -> t4))
```

То есть типы функций являются _право-ассоциативными_: вокруг типов функций неявно расставлены круглые скобки, справа налево. Следует понимать, что функция принимает один аргумент и возвращает новую функцию, которая ожидает остальные аргументы.

Применение функций, с другой стороны, является _лево-ассоциативным_: вокруг приложений функций есть неявные круглые скобки, слева направо. Так что

```
e1 e2 e3 e4
```

на самом деле означает то же самое, что

```
((e1 e2) e3) e4
```

Следует понимать, что крайнее левое выражение берет в качестве единственного аргумента следующее справа от него выражение.

## Кратко о типах

В функциональных языках в целом и в OCaml в частности есть ещё множество интереснейших особенностей, однако для их полноценного рассмотрения потребуется целая дисциплина. Далее мы пропустим описания базовых типов и некоторых особенностей. Отметим лишь только, что:

- Списки определяются либо как совсем пустой список `[]`, либо как цепочка элементов, сцепленная с указателем на пустой список: `a :: b :: c :: []`
- Для работы со списками можно (и нужно) использовать паттерн-матчинг

In [None]:
let rec length lst =
  match lst with
  | [] -> 0
  | _ :: t -> 1 + length t


In [None]:
length [1; 2; 3]

- Существует тип данных `variant`, который в сущности означает, что он является одним из нескольких возможных значений

In [None]:
type day = Sun | Mon | Tue | Wed | Thu | Fri | Sat
let d = Tue

- Существует тип `option`, который сообщает, что данные либо есть, либо их нет

In [None]:
let extract o =
  match o with
  | Some i -> string_of_int i
  | None -> ""

In [None]:
extract (Some 42);;
extract None;;

In [None]:
let rec list_max = function
  | [] -> None
  | h :: t -> begin
      match list_max t with
        | None -> Some h
        | Some m -> Some (max h m)
      end

In [None]:
list_max [1; 5; 2; 7; 3; 4; 2]

In [None]:
list_max []

## Пример: натуральные числа

Рассмотрим пример того, как с помощью вариантов определить тип натуральных чисел.

Мы можем определить рекурсивный вариант, который действует как числа, демонстрируя, что на самом деле нам не обязательно иметь числа, встроенные в OCaml! (Хотя для эффективности хорошо, что они есть).

Натуральное число_ - это либо _ноль_, либо _преемник_ какого-то другого натурального числа. Именно так можно определить натуральные числа в курсе математической логики, и это естественным образом приводит к следующему типу OCaml `nat`:

In [None]:
type nat = Zero | Succ of nat

In [None]:
let zero = Zero
let one = Succ zero
let two = Succ one
let three = Succ two
let four = Succ three

In [None]:
let iszero = function
  | Zero -> true
  | Succ _ -> false

let pred = function
  | Zero -> failwith "pred Zero is undefined"
  | Succ m -> m

In [None]:
let rec add n1 n2 =
  match n1 with
  | Zero -> n2
  | Succ pred_n -> add pred_n (Succ n2)

In [None]:
let rec int_of_nat = function
  | Zero -> 0
  | Succ m -> 1 + int_of_nat m

let rec nat_of_int = function
  | i when i = 0 -> Zero
  | i when i > 0 -> Succ (nat_of_int (i - 1))
  | _ -> failwith "nat_of_int is undefined on negative ints"

In [None]:
let rec even = function Zero -> true | Succ m -> odd m
and odd = function Zero -> false | Succ m -> even m

## Источники

- [OCaml Programming: Correct + Efficient + Beautiful](https://cs3110.github.io/textbook/cover.html)