# Краткое введение в функциональное программирование на F#!

[Дмитрий Сошников](http://soshnikov.com)
 * Cloud Developer Advocate, Microsoft
 * доцент, МФТИ/НИУ ВШЭ/МАИ, к.ф.-м.н.
 * [vk](http://vk.com/shwars), [telegram-канал](http://t.me/shwarsx), [instagram](http://instagram.com/shwars), [twitter (en)](http://twitter.com/shwars)
 
Приветствую! Этот документ познакомит вас с основами функционального программирования на базе языка программирования [F#](http://fsharp.org). Это весьма краткое введение в основные понятия, полное описание языка и ссылки на другие полезные материалы можно найти в [официальной документации Microsoft](https://docs.microsoft.com/dotnet/fsharp/?WT.mc_id=fsharp-github-dmitryso). Также приглашаю вас посмотреть более подробные [**видео-уроки по функциональному программированию на F#**](https://channel9.msdn.com/Series/Exciting-introduction-to-functional-programming-in-F-rus/?WT.mc_id=fsharp-github-dmitryso).

Вы сейчас используете F# внутри так называемых [Azure Notebooks](https://docs.microsoft.com/azure/notebooks/azure-notebooks-overview/?WT.mc_id=fsharp-github-dmitryso), где в одном документе совмещается текст и исполняемые фрагменты кода. **Клонируйте** документ, и вы сможете исправлять код в любых ячейках и запускать его, нажатием кнопки **Run** или *Ctrl-Enter*. Подробнее о том, как и зачем использовать Azure Notebooks, [читайте тут](https://soshnikov.com/azure/8-reasons-why-you-absolutely-need-azure-notebooks-ru/).

F# также можно использовать для создания консольных приложений, [веб-приложений](https://fsharp.org/guides/web/), [мобильных приложений Xamarin](https://docs.microsoft.com/xamarin/cross-platform/platform/fsharp/?WT.mc_id=fsharp-github-dmitryso) и вообще всего что угодно. Он работает на разных операционных системах, в т.ч. Windows, Linux, MacOS. Его удобно использовать из [Visual Studio](http://visualstudio.com/?WT.mc_id=fsharp-github-dmitryso) ([инструкция](https://docs.microsoft.com/en-us/dotnet/fsharp/get-started/get-started-visual-studio/?WT.mc_id=fsharp-github-dmitryso)) или [Visual Studio Code](http://code.visualstudio.com/?WT.mc_id=fsharp-github-dmitryso) с [плагином Ionide](http://ionide.io/) ([инструкция](https://docs.microsoft.com/dotnet/fsharp/get-started/get-started-vscode/?WT.mc_id=fsharp-github-dmitryso)), или [других инструментов разработки](https://www.jetbrains.com/rider/).

Дла начала, давайте познакомимся с концепциями функционального программирования!

## Функциональное программирование - почти как математика

Рассмотрим решение квадратного уравнения $$ax^2+bx+c=0$$ 
Как известно, сначала мы вычисляем дискриминант $$D = b^2-4ac$$
При этом если $D<0$, то корней нет, в противном случае они будут равны $$x_{1,2} = \frac{-b\pm\sqrt{D}}{2a}$$

In [1]:
let a,b,c = 1.0,2.0,-3.0
let D = b*b-4.0*a*c
let x1 = (-b-sqrt(D))/(2.0*a)
let x2 = (-b+sqrt(D))/(2.0*a)
(x1,x2)

Item1,Item2
-3,1


Что тут важно:
 * Мы оперируем с вещественными числами, поэтому везде пишем `1.0` (можно сокращать до `1.`), а не просто `1`
 * Используем `*` для умножения, как это принятно в программировании
 * Для использования нового обозначения (переменной) используем `let`
 
Все значения в F# **имеют тип**, например:
 * `13` : `int`, целое число
 * `13.0` : `double`, вещественное число
 * `"hello"` : `string`, строка
 * `[1,2,3]` : `int list`, список целых чисел

## Функции

Функция перерабатывает входные значения в выходные. Например, мы можем описать функцию для решения квадратного уравнения `solve`:

In [2]:
let solve a b c = 
    let D = b*b-4.0*a*c
    let x1 = (-b-sqrt(D))/(2.0*a)
    let x2 = (-b+sqrt(D))/(2.0*a)
    (x1,x2)
    
solve 1.0 2.0 -3.0

Item1,Item2
-3,1


Обратите внимание:
 * Функция определяется тем же словом `let`, что и переменная
 * Важное значение имеют **отступы** в программе --- они показывают, что какие-то операции являюся вложенными. В данном случае с помощью отступов мы отделяем **тело функции** от дальнейшей программы 
 * Функция может иметь **аргументы**, которые указываются через пробел
 * Функция может **возвращать значение** -- это последнее значение, которое вычисляется в функции

## Условный оператор

Если функции передать нерешаемое уравнение, то она выдаст на выходе специальное значение **NaN**, что означает *Not a Number*:

In [3]:
solve 1. 2. 3.

Item1,Item2
,


Чтобы ответ был более понятным, мы можем в явном виде проверить на неотрицательность дискриминанта с помощью **условного оператора** `if-then-else`:

In [4]:
let solve a b c = 
    let D = b*b-4.0*a*c
    if D>=0. then
        let x1 = (-b-sqrt(D))/(2.0*a)
        let x2 = (-b+sqrt(D))/(2.0*a)
        (x1,x2)
    else
        failwith "Нет корней"
    
solve 1.0 2.0 3.0

Unhandled exception: System.Exception: Нет корней
   at FSI_0008.solve(Double a, Double b, Double c)
   at <StartupCode$FSI_0008>.$FSI_0008.main@()

Здесь операция `failwith` вызывает так называемое **исключение** --- аналог системного сообщения об ошибке.

## Композиция функций

Рассмотрим ещё простую функцию для удвоения числа:

In [5]:
let twice x = 2*x
twice

Мы видим, что такая функция **имеет тип** `int->int`, т.е. функция принимает на вход целое число и выдает тоже целое число.

Если мы применим функцию к числу 5, то получим значение 10 типа `int`:

In [6]:
twice 5

Если мы хотим применить функцию `twice` в числу 5 два раза, то мы можем это сделать несколькими способами:

In [7]:
twice (twice 5)

Здесь нам пришлось использовать скобки, чтобы указать порядок операций. Без скобок выражение `twice twice 5` понималось бы как `(twice twice) 5`, что привело бы к ошибке типа.

In [8]:
(twice >> twice) 5

Операция `>>` строит из двух функций их **композицию**, т.е. последовательное применение. И уже получившуюся функцию мы применяем к числу 5.

In [9]:
5 |> twice |> twice

Операция `|>` называется **pipe operator**, или **конвейером**. Мы подаём число 5 на вход конвейеру, потом пропускаем его через функцию `twice`, и потом результат снова пропускаем через функцию `twice`.

Итак, первое что мы поняли про функциональное программирование:

> **В функциональном программировании всё строится из функций, которые перерабатывают входные данные в выходные. Есть гибкие возможности по композиции функций.**

## Функции нескольих переменных, каррирование и частичное применение

Математики всегда стараются определять более сложные понятия на основе более простых. Поэтому в функциональном программировании все функции --- это функции одного аргумента. Однако можно определять функции нескольких аргументов разными способами.

Первый - передать пару значений как аргумент:

In [10]:
let plus (a,b) = a+b
plus(1,2)

Такой способ непопулярен. Другой - это сделать так, чтобы функция могла возвращать другую функцию. Смотрите:

In [11]:
let plus a b = a+b
let f1 = plus 1
f1 2

Определенная таким образом функция `plus`, хотя визуально и имеет два аргумента, на самом деле может быть вызвана с одним аргументом. В нашем случае, `plus 1` возвращает функцию, которая к любому своему аргументу прибавляет 1. Это называется **частичным применением** функции. Применив затем такую функцию `f1` к числу 2 мы получаем результат 1+2. Конечно, мы можем тоже самое записать естественным образом, не вводя промежуточных обозначений для `f1`:

In [12]:
plus 1 2

Такой способ описания функций, когда несколько аргументов являются последовательными шагами последовательного применения функции, называется **каррированием**, в честь математика Хаскеля Карри. [Подробнее про каррирование](https://docs.microsoft.com/dotnet/fsharp/introduction-to-functional-programming/first-class-functions#curried-functions/?WT.mc_id=fsharp-github-dmitryso) 

Мы можем использовать композицию и частичное применение для определения сложных функций через более простые. Например, функцию $f(x)=2x+1$ можно определить двумя способами:

In [13]:
let f1 x = 2*x+1
let f2 = (*) 2 >> (+) 1

printfn "f1(5)=%d, f2(5)=%d" (f1 5) (f2 5)

f1(5)=11, f2(5)=11


## Рекурсия

Компьютеры хороши тогда, когда они могут выполнять повторяющиеся действия. В фукциональном программировании мы не думаем о повторениях как таковых, мы просто определяем функцию для вычисления результата. Например, попробуем определить функцию для вычисления факториала
$$
\def\fact{\mathrm{fact}}
\fact(n)=1\cdot2\cdot\dots\cdot n
$$

Запись выше --- это не строгое определение факториала, потому что непонятно, что значит $\dots$. Строго факториал определяется так:
$$
\begin{split}
\fact(1) &= 1 \\
\fact(n) &= \fact(n-1)\cdot n, \mbox{ для } n>1
\end{split}
$$

Или, что тоже самое:
$$
\fact(n) = \Big\{
  \begin{split}
  1, & \mbox{ если } n=1 \\
  n\cdot\fact(n-1), & \mbox{ в противном случае}
  \end{split}
$$

Запишем это на F# ([подробнее про ключевое слово `rec`](https://docs.microsoft.com/dotnet/fsharp/language-reference/functions/index#recursive-functions/?WT.mc_id=fsharp-github-dmitryso)):

In [14]:
let rec fact n = 
    if n=1 then 1
    else n*fact(n-1)
    
fact 5

В отличие от циклов, где есть счетчик и зачастую аккумулятор, в рекурсивных функциях не возникает ситуация, когда переменная изменяет своё значение. Отсюда важное правило: 

> **Все переменные в функциональном программировании являются неизменяемыми** (immutable).
> **Вместо циклов применяется рекурсия**

Кстати, функцию вычисления факториала можно определить более красиво с помощью **шаблонов** и ключевого слова `function`:

In [15]:
let rec fact = function 
    | 1 -> 1
    | n -> n*fact(n-1)
    
fact 5

[Подробнее про шаблоны и передачу параметров](https://docs.microsoft.com/dotnet/fsharp/introduction-to-functional-programming/first-class-functions#curried-functions/?WT.mc_id=fsharp-github-dmitryso)

### Задание:

> Опишите функцию для вычисления $n$-го члена последовательности Фибоначчи:
$$
\begin{split}
\def\fib{\mathrm{fib}}
\fib(0) &= \fib(1) = 1 \\
\fib(n) &= \fib(n-1)+\fib(n-2), n>1
\end{split}
$$

> Подумайте, как описать эту функцию просто (и очень неэффективно), и более хитрым способом...

In [16]:
let fib n = 0 // Решение пишите тут!

## Параметры-функции

В случае факториала мы вычисляли произведение чисел от 1 до $n$. Но что если нам нужно вычислить сумму? Мы можем описать функцию общего вида, которая будет совершать повторения от $a$ до $b$, при этом применяя к числам некоторую другую функцию $f$. В случае факториала это будет функция умножения, в случае суммы --- сложения. При этом начинать вычисления мы будем с некоторого начального значения $i$.

In [17]:
let rec loop f i a b =
   if a<=b then f a (loop f i (a+1) b)
   else i
   
let fact n = loop (*) 1 1 n
let sum a b = loop (+) 0 a b

printfn "Fact 5 = %d, Sum(1,100) = %d" (fact 5) (sum 1 100)

Fact 5 = 120, Sum(1,100) = 5050


С учётом частичного применения функций, запись `let f n = some_func n` эквивалентна `let f = somefunc`, поэтому мы можем упростить наше определение:

In [18]:
let fact = loop (*) 1 1
let sum = loop (+) 0

printfn "Fact 5 = %d, Sum(1,100) = %d" (fact 5) (sum 1 100)

Fact 5 = 120, Sum(1,100) = 5050


## Замыкания и лямбда-выражения

Предположим, мы хотим теперь вычислить функцию $x^n$, т.е. нам нужно $n$ раз повторить процесс умножения $x$ сам на себя. В этом случае функция, которую мы должны передать нашей функции `loop` - это домножение на $x$, вне зависимости от того, какое текущее значение счетчика.

Это можно записать так:

In [19]:
let power x n =
   let mult_by_x i t = x*t
   loop mult_by_x 1 1 n
   
power 2 8

Здесь мы используем **вложенное определение функции** `mult_by_x`, которое видно только внутри функции `power`. Это определение *видит* переменную `x`, которая определена во внешней **области видимости**. Такая функция, которая *захватывает* переменные из внешней области видимости, называется **замыканием**. Мы не будем сейчас вдаваться в подробности, но это вообще отдельная интересная тема...

В функциональном программировании часто приходится определять какие-то небольшие функции. Чтобы это было проще делать, есть специальный синтаксис, называемый **лямбда-выражениями** (название происходит из математической теории, $\lambda$-исчисления, которое лежит в основе функционального программирования):

`fun x -> ....выражение от x...`

`function x -> ... выражение от x...`

Эти две формы немного различаются, но мы не будем вдаваться в подробности (подробности: [описание ключевого слова fun](https://docs.microsoft.com/dotnet/fsharp/language-reference/functions/lambda-expressions-the-fun-keyword/?WT.mc_id=fsharp-github-dmitryso), [описание match и function](https://docs.microsoft.com/dotnet/fsharp/language-reference/match-expressions/?WT.mc_id=fsharp-github-dmitryso))

С использование ламбда-выражения можно записать функцию возведения в степень так:

In [20]:
let power x n = loop (fun _ t -> x*t) 1 1 n

power 2 8

Мы поняли ещё одну важную мысль:

> **В функциональном программировании функции можно передавать в качестве параметров. В результате многие сложные операции можно свести к комбинации более простых понятий** (`loop`) 

### Задание:

> Если мы попробуем вычислять факториалы больших чисел с помощью описанных нами функций `fact`, то мы поймём, что они очень быстро "переваливают" за границу типа `int`. С помощью описанной функции `loop` и типа `BigInteger` опишите функцию `bigfact`, которая смогла бы вычислять факториалы для больших целых чисел.

In [21]:
let bigfact n = 1I // Решение пишите тут!

## Фракталы

Попробуем решить какую-нибудь интересную задачку, например, нарисовать множество Мандельброта:

<img src="https://upload.wikimedia.org/wikipedia/commons/2/21/Mandel_zoom_00_mandelbrot_set.jpg" width="40%"/>

Множество Мандельброта определяется так: рассмотрим последовательность комплесных чисел $z_i\in\mathbb{C}$, определяемую так:
$$
\begin{split}
z_0 &= 0 \\
z_n &= z_{n-1}^2+c
\end{split}
$$
где $c\in\mathbb{C}$ --- некоторая комплексная константа. Для некоторых $c$ такая последовательность будет ограничена --- именно это множество и будет множеством Мандельброта.

В нашем случае мы построим немного другое множество $M = \{ c : | z_{20}^{(c)} | < 1.0 \}$

Для начала опишем функцию вычисления последовательности для заданных $c$ и $z$:

In [22]:
open System.Numerics

let mandel_seq c (z:Complex) = z*z+c

Здесь нам надо указать тип хотя бы для одного аргумента, иначе функция по умолчанию будет использовать целый тип. Заметим, что функция `mandel_seq` при фиксированном `c` будет функцией из `Complex` в `Complex`.

Далее опишем функцию `rpt`, которая будет строить $n$-кратную композицию функции $f$, т.е. применять функцию $f$ $n$ раз:

In [23]:
let rpt n f = loop (fun _ t -> f>>t) (fun x->x) 1 n

rpt 8 ((*)2) 1

Наконец самая главная функция `is_mandel` будет определять, принадлежит ли комплексное число множеству или нет:

In [24]:
let is_mandel c = Complex.Abs(rpt 20 (mandel_seq c) Complex.Zero)<1.0

Теперь построим множество на экране:

In [25]:
for i = 0 to 20 do
  for j = 0 to 60 do
     let c = new Complex((float(j)-30.0)/20.0,(float(i)-10.0)/10.0)
     printf "%c" (if is_mandel c then '*' else ' ')
  printfn ""

                                                             
                           *                                 
                          ***                                
                          ****                               
                   ** ***********                            
                   ******************                        
                  *******************                        
          *     **********************                       
       *******  ***********************                      
      ********************************                       
************************************                         
      ********************************                       
       *******  ***********************                      
          *     **********************                       
                  *******************                        
                   ******************                        
        

In [26]:
open System.Drawing
let image = new Bitmap(400, 400)
for i = 0 to (image.Height-1) do
    for j = 0 to (image.Width-1) do
       let c = new Complex((float(i)-200.0)/100.0,(float(j)-200.0)/100.0)
       image.SetPixel(i,j,if is_mandel c then Color.Black else Color.White)
image.Save("mandelbrot.jpg")
{ Html = @"<img src=""mandelbrot.jpg""/>"}

Unhandled exception: input.fsx (2,17)-(2,23) typecheck error The type 'Bitmap' is not defined.
input.fsx (3,15)-(3,27) typecheck error Lookup on object of indeterminate type based on information prior to this program point. A type annotation may be needed prior to this program point to constrain the type of the object. This may allow the lookup to be resolved.
input.fsx (4,19)-(4,30) typecheck error Lookup on object of indeterminate type based on information prior to this program point. A type annotation may be needed prior to this program point to constrain the type of the object. This may allow the lookup to be resolved.
input.fsx (6,8)-(6,22) typecheck error Lookup on object of indeterminate type based on information prior to this program point. A type annotation may be needed prior to this program point to constrain the type of the object. This may allow the lookup to be resolved.
input.fsx (7,1)-(7,11) typecheck error Lookup on object of indeterminate type based on information prior to this program point. A type annotation may be needed prior to this program point to constrain the type of the object. This may allow the lookup to be resolved.
input.fsx (8,3)-(8,7) typecheck error The record label 'Html' is not defined.

## Списки, последовательности...

Важные возможности языка --- это возможности оперировать наборами данных. В F# есть два основных подхода к работе с данными --- это списки и последовательности.

* Списки `[1;2;3]` хранятся в памяти как набор элементов, объединённых отношением голова-хвост `::`
* Последовательности `{ 1;2;3 }` представляются **генераторами**, т.е. объектами, которые могут по требованию выдавать следующий элемент последовательности. Поэтому обработка последовательностей не требует размещения всех промежуточных результатов в памяти.

Есть много библиотечных функций для работы со списками (`List.*`) и последовательностями (`Seq.*`), но наиболее важные из них три.

**map** применяет некоторую функцию к каждому элементу списка и возвращает новый список с результатами:

In [27]:
List.map ((*)2) [1..100]

index,value
0,2
1,4
2,6
3,8
4,10
5,12
6,14
7,16
8,18
9,20


Функция **filter** оставляет только те элементы последовательности, которые удовлетворяют некоторой указанной функции-предикату:

In [28]:
List.filter (fun x->x%13=0) [1..100]

index,value
0,13
1,26
2,39
3,52
4,65
5,78
6,91


Функция **fold** (свёртка) применяется в том случае, когда нам нужно пройтись по всем элементам списка и вычислить какое-то агрегатное значение --- например, сумму или произведение. С помощью свёртки можно определить факториал: 

In [29]:
let fact n = {1..n} |> Seq.fold (*) 1

fact 5

## Ещё немного фракталов

Напоследок, вооруженные библиотекой для построения графиков, давайте построим ещё один интересный фрактал --- треугольник Серпинского:

<img src="https://i.stack.imgur.com/Z6ooj.png" width="40%" />

Алгоритм построения такого треугольника следующий:

* Берем произвольную точку внутри треугольника с координатами $(x_0,y_0)$
* Проделываем много раз:
    - Выбираем произвольно одну из трех вершин треугольника с координатами $(x,y)$
    - Для текущей точки $(x_i,y_i)$ вычисляем следующую точку $(x_{i+1},y_{i+1}) = (\frac{1}{2}(x+x_i),\frac{1}{2}(y+y_i))$
* В результате всё множество точек $\{ (x_i,y_i) \}_{i=1}^\infty$ образует треугольник Серпинского

Для описания такого треугольника мы используем **потенциально бесконечную последовательность**, которая возвращает свои элементы по-очереди с помощью операции `yield`. Такой способ называется **корекурсией**:

In [30]:
let rnd = new System.Random()
let vertices = [(0,600);(600,600);(300,0)]
let midpoint (x1,y1) (x2,y2) = ((x1+x2)/2,(y1+y2)/2)
let rec sierpinsky pt = seq {
     let i = rnd.Next(0,3)
     let v = vertices.[i]
     let pt' = midpoint pt v
     yield pt'
     yield! sierpinsky pt'
}
sierpinsky (300,300) |> Seq.take 10

index,Item1,Item2
0,150,450
1,225,225
2,112,412
3,56,506
4,328,553
5,314,276
6,307,138
7,153,369
8,376,484
9,188,542


Теперь построим все полученные точки уже известным нам способом:

In [31]:
let bi = new Bitmap(600,600)
sierpinsky (300,300)
|> Seq.take (1000000)
|> Seq.iter (fun (x,y) -> bi.SetPixel(x,y,Color.Black))
bi.Save("sierp.jpg")
{ Html = @"<img src=""sierp.jpg""/>"}

### Задание:

> Подумайте, как описать функцию, генерирующую потенциально бесконечную последовательность чисел Фибоначчи. Для этого можно воспользоваться одним из способов:
1. Синтаксисом описания последовательностей `seq`, который был показан выше
2. Функцией-генератором `Seq.unfold` ([читайте тут](https://msdn.microsoft.com/visualfsharpdocs/conceptual/seq.unfold%5B%27state%2C%27t%5D-function-%5Bfsharp%5D/?WT.mc_id=fsharp-github-dmitryso))

> С помощью этой функции, решите [задачу №2 из списка задач Эйлера](https://projecteuler.net/problem=2)

In [32]:
let fibs = seq { yield 1; yield 1; } // Решение пишите тут
let euler2 = 0

## Исследование данных

Попробуем для начала построить частотный словарь романа, например, найдём top 10 самых часто встречающихся слов. Сам роман уже находится в папке в файле `wap_en.txt`, прочитаем его в виде списка строк в переменную `book`:

In [33]:
open System.IO
let book = File.ReadAllLines "wap_en.txt"
book |> Seq.take 10

index,value
0,
1,"The Project Gutenberg EBook of War and Peace, by Leo Tolstoy"
2,
3,This eBook is for the use of anyone anywhere at no cost and with almost
4,"no restrictions whatsoever. You may copy it, give it away or re-use"
5,it under the terms of the Project Gutenberg License included with this
6,eBook or online at www.gutenberg.org
7,
8,
9,Title: War and Peace


Для получения последовательности слов применим к каждой строка операцию `Split`, которая разобьет строку по словам. Так мы получим последовательность списков слов, которую мы можем превратить в единую последовательносить операцией `concat`: 

In [34]:
book
|> Seq.map (fun x->x.Split([|' ';'.';'!';'?';'-';',';';';'(';')';':'|]))
|> Seq.concat
|> Seq.take 10

index,value
0,
1,The
2,Project
3,Gutenberg
4,EBook
5,of
6,War
7,and
8,Peace
9,


Теперь используем операцию `groupBy` для группировки всех слов вместе. `groupBy` принимает функцию, которая по каждому элементу возвращает ключ, и потом группирует элементы по этому ключу. В нашему случае в качестве ключа будем использовать слово, приведённое к нижнему регистру. Также удалим все коротки слова, короче 3 символов:

In [35]:
book
|> Seq.map (fun x->x.Split([|' ';'.';'!';'?';'-';',';';';'(';')';':'|]))
|> Seq.concat
|> Seq.filter (fun x->x.Length>3)
|> Seq.groupBy(fun x->x.ToLower())
|> Seq.take 10

index,Item1,Item2
0,project,"[ Project, Project, PROJECT, project, project, project, project, project, project, project ... (85 more) ]"
1,gutenberg,"[ Gutenberg, Gutenberg, gutenberg, GUTENBERG, Gutenberg, GUTENBERG, gutenberg, Gutenberg, GUTENBERG, Gutenberg ... (77 more) ]"
2,ebook,"[ EBook, eBook, eBook, EBOOK, EBook, EBOOK, eBook, eBook, eBook, eBook ]"
3,peace,"[ Peace, Peace, PEACE, PEACE, peace, peace, peace, peace, peace, peace ... (103 more) ]"
4,tolstoy,"[ Tolstoy, Tolstoy, Tolstoy ]"
5,this,"[ This, this, THIS, this, this, this, This, this, this, this ... (2047 more) ]"
6,anyone,"[ anyone, anyone, anyone, anyone, anyone, anyone, anyone, anyone, anyone, anyone ... (173 more) ]"
7,anywhere,"[ anywhere, anywhere, anywhere, anywhere, anywhere, anywhere, Anywhere, anywhere, anywhere, anywhere ... (16 more) ]"
8,cost,"[ cost, cost, cost, cost, cost, cost, cost, cost, cost, cost ... (16 more) ]"
9,with,"[ with, with, with, With, with, with, with, with, with, with ... (5670 more) ]"


Теперь нам осталось посчитать длину списка слов для каждого ключа, и отсортировать результат по убыванию:

In [36]:
book
|> Seq.map (fun x->x.Split([|' ';'.';'!';'?';'-';',';';';'(';')';':'|]))
|> Seq.concat
|> Seq.filter (fun x->x.Length>3)
|> Seq.groupBy(fun x->x.ToLower())
|> Seq.map (fun (k,v) -> (k,Seq.length v))
|> Seq.sortBy (fun (k,n) -> -n)
|> Seq.take 10

index,Item1,Item2
0,that,7712
1,with,5680
2,said,2834
3,from,2679
4,were,2405
5,they,2089
6,this,2057
7,which,2008
8,what,1984
9,have,1948


Теперь давайте посмотрим на результат в графическом виде. Для этого используем библиотеку `XPlot.Plotly`:

In [37]:
#load "XPlot.Plotly.Paket.fsx"
#load "XPlot.Plotly.fsx"
open XPlot.Plotly

Unhandled exception: input.fsx (1,1)-(1,31) interactive error Unable to find the file 'XPlot.Plotly.Paket.fsx' in any of
 D:\DEMO\funcpro

In [38]:
book
|> Seq.map (fun x->x.Split([|' ';'.';'!';'?';'-';',';';';'(';')';':'|]))
|> Seq.concat
|> Seq.filter (fun x->x.Length>3)
|> Seq.groupBy(fun x->x.ToLower())
|> Seq.map (fun (k,v) -> (k,Seq.length v))
|> Seq.sortBy (fun (k,n) -> -n)
|> Seq.take 10
|> Chart.Bar

Попробуем посмотреть на другую интересную статистику. Например, распределение количества слов определённой длины:

In [39]:
book
|> Seq.map (fun x->x.Split([|' ';'.';'!';'?';'-';',';';';'(';')';':'|]))
|> Seq.concat
|> Seq.filter (fun x->x.Length>0)
|> Seq.groupBy(fun x->x.Length)
|> Seq.map (fun (k,v) -> (k,Seq.length v))
|> Seq.sortBy (fun (k,n) -> k)
|> Chart.Bar

И кстати, давайте посмотрим на самое длинное слово:

In [40]:
book
|> Seq.map (fun x->x.Split([|' ';'.';'!';'?';'-';',';';';'(';')';':';'—';'/'|]))
|> Seq.concat
|> Seq.filter (fun x->x.Length>3)
|> Seq.maxBy(fun x->x.Length)

"characteristically"

Давайте теперь проанализируем, насколько роман "Война и Мир" позитивен. Для этого я использую файл с позитивными и негативными словами `words.txt` и загружу его в память в виде хеш-таблицы:

In [41]:
let wordmap = 
    File.ReadAllLines("words.txt") 
    |> Seq.map (fun x->x.Split()) 
    |> Seq.map (fun x->(x.[0],int(x.[1])))
    |> Map.ofSeq
wordmap

map
  [("absolutely", 1); ("abysmal", -1); ("accepted", 1); ("acclaimed", 1);
   ("accomplish", 1); ("accomplishment", 1); ("achievement", 1); ("action", 1);
   ("active", 1); ...]

Теперь построим функцию, возвращающую настроение (сентимент) строки:

In [42]:
let sentiment (w:string) = 
    w.ToLower().Split([|' ';'.';'!';'?';'-';',';';';'(';')';':';'—';'/'|])
    |> Seq.map (fun w->if wordmap.ContainsKey(w) then wordmap.[w] else 0)
    |> Seq.sum
    
sentiment "I live in a beautiful world, and that's nice!"

2

И проанализируем весь роман построчно:

In [43]:
book
|> Seq.map sentiment
|> Chart.Line

Поскольку такой график говорит нам лишь про позитивность или негативность отдельных строчек, он не очень информативен. Построим вместо этого кумулятивный график настроения:

In [44]:
book
|> Seq.map sentiment
|> Seq.scan (+) 0
|> Chart.Line

Напоследок --- сложное задание. Построим позитивность романа по главам. Попробуйте сами разобраться в коде (здесь встроенная функция `fst` берёт первый элемент из пары):

In [45]:
book
|> Seq.scan (fun (chap,_) line -> if line.StartsWith("CHAPTER") then (line,line) else (chap,line)) ("","")
|> Seq.filter (fun (x,_) -> x<>"")
|> Seq.groupBy(fst)
|> Seq.map (fun (chap, lines) -> (chap, lines |> Seq.map (snd>>sentiment) |> Seq.sum))
|> Seq.sortByDescending fst
|> Chart.Bar

Важные выводы из этого раздела:

> **В функциональном программировании есть гибкая работа с последовательностями, что позволяет нам эффективно обрабатывать и исследовать данные больших размеров. Это можно делать в интерактивном стиле.**

### Задание:

> В романе Война и Мир, посчитайте количество слов, начинающихся на разные буквы алфавита

> Посчитайте процент иностранной речи в романе Война и Мир (для определения иностранной речи используйте сравнение символов, например `let is_foreign x = (x>='a') and (x<='z')`

> Выведите самую негативную строку романа Война и Мир (или несколько самых негативных строк)

In [46]:
// Решение пишите здесь, по необходимости добавляя новые ячейки кнопкой **+**

## Немного REST и искусственного интеллекта

Давайте теперь посмотрим, как с помощью F# можно обращаться к сложным интернет-сервисам. Зададимся такой задачей --- найти самую удивлённую фотографию Билла Гейтса в Интернет! 

Подобные сложные задачи: анализ содержимого фотографий, сложный анализ текста и т.д. --- обычно решаются специализированными облачными сервисами. В нашем случае мы будем использовать [когнитивные сервисы Microsoft](http://aka.ms/cognitive_serv). 

Для решения этой задачи нам потребуется использовать два сервиса:

* [Bing Image Search](https://docs.microsoft.com/azure/cognitive-services/Bing-Web-Search/?WT.mc_id=fsharp-github-dmitryso) для поиска фотографий по ключевым словам
* [Microsoft Cognitive Services Face API](https://docs.microsoft.com/azure/cognitive-services/face/?WT.mc_id=fsharp-github-dmitryso) для определения эмоции человека на фотографии. Посмотреть на это API в действии, загрузив свою фотографию, можно [на этой страничке](https://azure.microsoft.com/en-us/services/cognitive-services/face/?WT.mc_id=fsharp-github-dmitryso) (перейдите ниже в раздел Emotion Recognition).

![My Face](img/shwars_face.png)

Для использования когнитивных сервисов нам необходим **ключ** и **endpoint URL** для каждого из сервисов. Их можно получить несколькими способами:

* Если у Вас уже есть подписка Azure, необходимо [создать службу когнитивных сервисов](https://docs.microsoft.com/azure/cognitive-services/cognitive-services-apis-create-account/?WT.mc_id=fsharp-github-dmitryso), и получить ключ и URL оттуда
* Вы всегда можете [создать бесплатную пробную подписку](https://azure.microsoft.com/free/?WT.mc_id=fsharp-github-dmitryso) (для этого понадобится кредитная карта, но зато вы сможете пользоваться некоторыми бесплатными ресурсами, включая когнитивные сервисы, целый год)
* Если Вы хотите просто немного поэкспериментировать --- [запросите пробный ключ](https://azure.microsoft.com/try/cognitive-services/my-apis/?api=face-api&WT.mc_id=fsharp-github-dmitryso), который будет действовать 7 дней.

Полученные ключи и URL запомним в переменных ниже:

In [47]:
let search_api_key = "--ВСТАВЬТЕ-СЮДА-СВОЙ-КЛЮЧ--"
let face_api_key = "--ВСТАВЬТЕ-СЮДА-СВОЙ-КЛЮЧ--"
let face_api_url = "https://faceap.cognitiveservices.azure.com/face/v1.0"

Для работы нам потребуется несколько полезных пакетов:

In [48]:
#load "Paket.fsx"
Paket.Package["FSharp.Data";"Newtonsoft.Json"]
   
#load "Paket.Generated.Refs.fsx"

Начнём с какой-нибудь фотографии в интернет:

In [49]:
let picture = "http://cms.kienthuc.net.vn/zoomh/500/uploaded/ctvkinhdoanh/2014_09_08/bg8_zxnl.jpg"
let img u = sprintf """<img src="%s" height="100" width="200"/>""" u
let html u = {Html=u}

picture |> img |> html

Для распознавания эмоций нам надо будет сделать запрос к облачному сервису. Для этого используем метод `Http.RequestString` --- с помощью него мы получает ответ от сервиса, и нам надо его правильно **разобрать**, т.е. разложить по разным полочкам. Для этого мы описываем структуру ответа в виде типов `Face`, `FaceAttrib` и т.д. -- и потом просим компьютер **десериализовать** текстовый ответ:

In [50]:
open FSharp.Data

type FaceRectangle = { Height: int; Width: int; Top: int; Left: int; }
type Scores = { Anger: float; Contempt: float; Disgust: float; Fear: float;
                Happiness: float; Neutral: float; Sadness: float; Surprise: float; }
type FaceAttrib = { Emotion : Scores }
type Face = { FaceRectangle: FaceRectangle; FaceAttributes: FaceAttrib }

let emotions u = 
   let resp = Http.RequestString
               ( face_api_url+"/detect?returnFaceAttributes=emotion", httpMethod = "POST",
                 body = TextRequest (sprintf """{"url":"%s"}""" u),
                 headers = [ "Ocp-Apim-Subscription-Key", face_api_key ; "Content-type", "application/json" ])
   Newtonsoft.Json.JsonConvert.DeserializeObject<Face[]>(resp)

Не пугайтесь, если вы не понимаете, что происходит --- далеко не все это понимают. Но это и не важно, потому что вы всё равно сможете использовать описанную нами функцию для распознавания эмоций на фото:

In [51]:
let em = emotions picture
em

[|{FaceRectangle = {Height = 257;
                    Width = 257;
                    Top = 105;
                    Left = 235;};
   FaceAttributes = {Emotion = {Anger = 0.0;
                                Contempt = 0.0;
                                Disgust = 0.0;
                                Fear = 0.0;
                                Happiness = 1.0;
                                Neutral = 0.0;
                                Sadness = 0.0;
                                Surprise = 0.0;};};}|]

Посмотрим на более интересную фотографию: интересно, какие эмоции испытывает эта девушка?

In [52]:
let picture = "http://www.askheartbeat.com/ahb2010/wp-content/uploads/2012/03/angry-black-woman.jpg"
let em = emotions(picture)
picture |> img |> html

In [53]:
let todouble (x:obj) = System.Double.Parse(x.ToString())
let sequify_props x = x.GetType().GetProperties() |> Seq.map (fun z -> z.Name,z.GetValue(x))

em.[0].FaceAttributes.Emotion |> sequify_props |> Seq.map(fun (a,b) -> (a,todouble b)) 
 |> Chart.Bar |> Chart.WithSize(700,400)

Теперь научимся искать фотографии в интернет по ключевому слову. Для этого используем аналогичный подход с вызовом облачного сервиса:

In [54]:
open FSharp.Data

type QueryResult = { name: string; contentUrl: string}
type QueryResults = { value: QueryResult[] } 

let query s = 
   let resp = Http.RequestString
               ( "https://api.cognitive.microsoft.com/bing/v5.0/images/search", httpMethod = "GET",
                 query   = [ "q", s ],
                 headers = [ "Ocp-Apim-Subscription-Key", search_api_key ])
   Newtonsoft.Json.JsonConvert.DeserializeObject<QueryResults>(resp).value

In [55]:
let gates = query "bill gates"
gates |> Seq.take 5 |> Seq.map (fun x->x.contentUrl |> img) |> Seq.reduce (sprintf "%s%s") |> html

Теперь нам осталось лишь перебрать все найденные фото, извлечь из них эмоции, и выбрать фото с максимальным удивлением! Поскольку мы тут сразу обрабатываем много картинок, эта ячейка может выполняться некоторое время.

In [56]:
let poker_face = { Anger=0.; Contempt=0.; Disgust=0.; Fear=0.;
                Happiness=0.; Neutral=0.; Sadness=0.; Surprise=0.; }
let safe_em (x:Face[]) = if x.Length>0 then x.[0].FaceAttributes.Emotion else poker_face

let print_status u = printfn "Processing %s..." u; u

let emresult = 
  gates
  |> Seq.take 10
  |> Seq.map (fun x->x.contentUrl, x.contentUrl|>print_status|>emotions|>safe_em) 
  |> Seq.toArray

Processing https://upload.wikimedia.org/wikipedia/commons/thumb/4/4a/BillGates2012.jpg/1200px-BillGates2012.jpg...
Processing https://upload.wikimedia.org/wikipedia/commons/a/a0/Bill_Gates_2018.jpg...
Processing https://moneydotcomvip.files.wordpress.com/2019/05/bill-gates-favorite-books-summer-2019-946971500.jpg?quality=85...
Processing https://heavyeditorial.files.wordpress.com/2018/04/billgates-e1526608219903.jpg?quality=65&strip=all...
Processing https://static2.businessinsider.com/image/5c744d4526289861807fa328-2400/rtr2nmcj.jpg...
Processing https://www.incimages.com/uploaded_files/image/1940x900/getty_946964370_200013332000928085_381902.jpg...
Processing https://fm.cnbc.com/applications/cnbc.com/resources/img/editorial/2018/07/11/105322791-1531301768595gettyimages-467620670.1910x1000.jpg?v=1545151032...
Processing https://cdn.vox-cdn.com/thumbor/YAXrxU8-yIxSt9nm3nvba3SeQHk=/0x0:3000x2000/1200x800/filters:focal(1256x678:1736x1158)/cdn.vox-cdn.com/uploads/chorus_image/image/631373

Теперь выбираем фото с максимальным уровнем удивления:

In [57]:
emresult
|> Seq.maxBy (fun (a,b)->b.Surprise)
|> fst |> img |> html

Ну и напоследок самую счастливую фото:

In [58]:
emresult
|> Seq.maxBy (fun (a,b)->b.Happiness)
|> fst |> img |> html

Вывод:

> **Функциональные языки содержат средства разработки современных систем, основанных на взаимодейстии веб-сервисов**.

## Выводы

Мы поговорили про функциональное программирование. Давайте вспомним основные моменты:

1. В функциональном программировании всё строится из функций, которые перерабатывают входные данные в выходные. Есть гибкие возможности по композиции функций.
2. Все переменные в функциональном программировании являются неизменяемыми (*immutable*). Вместо циклов применяется рекурсия.
3. В функциональном программировании функции можно передавать в качестве параметров. В результате многие сложные операции можно свести к комбинации более простых понятий
4. В функциональном программировании есть гибкая работа с последовательностями, что позволяет нам эффективно обрабатывать и исследовать данные больших размеров. Это можно делать в интерактивном стиле.
5. Функциональные языки содержат средства разработки современных систем, основанных на взаимодейстии веб-сервисов.

## Что дальше?

Если вы хотите продолжить изучать язык F#, то я могу рекомендовать следующее:

1. Попробуйте выполнить задания в этом файле
2. Посмотрите [видео-курс по F#](https://channel9.msdn.com/Series/Exciting-introduction-to-functional-programming-in-F-rus/?WT.mc_id=fsharp-github-dmitryso) чтобы освежить знания
3. Купите и почитайте [мою книгу](http://www.soshnikov.com/fsharp)
4. Начните разрабатывать на F# что-нибудь интересное или займитесь анализом данных в [Azure Notebooks](https://soshnikov.com/azure/8-reasons-why-you-absolutely-need-azure-notebooks-ru/)
5. Подпишитесь [на телеграм-канал](http://t.me/shwarsx) и оставайтесь в курсе разных интересных новостей, связанных с F#, искусственным интеллектом, облаком Azure и др.
6. Передайте ссылку на этот документ и видеозапись трем своим друзьям, чтобы они тоже изучили F#, и вам было с кем общаться.
7. Помните: F# позволяет вам меньше писать и больше думать, а это хорошо!

Будьте счастливы! 

[Дмитрий Сошников](http://soshnikov.com)