# Introduction

[[Good reference]](https://arxiv.org/pdf/1811.00116.pdf)

First of all we should distinguish between the 2 problem settings:
- Face Recognition - classify person whose face is on the picture
- Face Verification - check whether presented face corresponds to person



<img src="img/setting.png" width=700>

Typical process scheme:

1. Face detection 

        find face on the image 


2. Face alignment 

        normalize + denoise


3. Face description 

        featurize


4. Face recognition 

        classify

#### Problem setting
Stating the problem as a multicalss classification (one class for each person) is a bad idea because in general there are very few training examples for each class - we will have to do <u>one-shot learning</u>.

It's better to formulate the problem as similarity/distance learning.

It could be implemented via siamese network of two CNNs:

The standard loss for distance learning is triplet loss.
All weights are shared between two branches of the network.

### Triplet Loss

Triplet Loss uses triplets of data points (anchor, positive, negative). It stems from Metric Learning (Distance Learning) tasks - when we need to construct the optimal distance measure.

#### Idea
Distance btween similar images must be less than distance between disimilar images:

$$d(A,P) < d(A,N)$$

The distances are just regular L2 norms

- $d(A,P) = ||f(x_A) - f(x_P)||^2$
- $d(A,N) = ||f(x_A) - f(x_N)||^2$

So the loss function is written as 
<img src="img/triplet_loss.png" width=500>

**NOTE** To avoid situations when model assigns zeros to all points we add some buffer $\alpha$ into loss function.

Альтернативная постановка
Можно решать и бинарную задачу.

Сконкатенировать выходы сиамской сети, и пустить их в бинарную логистическую регрессию. Здесь y = {0 - люди отличаются, 1 - люди совпадают}



# DeepFace

[[arxiv]](https://www.cs.toronto.edu/~ranzato/publications/taigman_cvpr14.pdf)

In 2014 Facebook released article where thay described how face recognition on photos was implemented.

Перед тем как пускать регион с лицом на обучение фичей его нормализуют: главным образом поворачивают фронтально. Пердобработка фото выглядит примерно так:

<img src="img/deepface_preprocessing.png" width=500>


Из статьи не очень понятно, как именно обучалась модель. Но предполагаю что так:
1. для обучения весов модели решали задачу k-category classification на некоторой выборке фотографий людей.
2. для сравнения с базой строили фичи


NOTE
здесь они вполне себе решают задачу мультклассификации (one-shot learning)
правда датасет большой - 4000 людей по 1000 картинок каждого
здесь overfitting на последних слоях как раз неплохо
мне кажется supervised обучение нужно только для определения фичей лица, а дальше можно просто ближайших соседей в базе фотографий искать

<img src="img/deepface_preprocessing2.png" width=500>




# Face Recognition in pre deep learning era

### Gabor Filters

Gabor filter = 2D filter, used in CV mainly for detection of regular textures on images. 

Usually the bunch of such filters are used.

Here we can see that Gabor filter in its canonical form is a combnination of (1) gaussian and (2) sinusoid.

<img src="img/gabor_formula1.png" width=500>

Note that sinusoid here is represented as a complex exponent.

Formula parameters:
- $\alpha$ - speed of gaussian decay
- $\gamma$ - ellipsoid-ity of gaussian
- $\lambda$ - sinusoid frequency
- $\psi$ - shift



### Algorithm

1. Find anchor point of the face, for example center of eyes
делается сравнением разных регионов с шаблонной картинкой лица методом template matching (OpenCV)
2DNCC = 2d normalized cross-correlation - считается корреляция региона с шаблоном; если f - картинка, а t - шаблон, то:
<img src="img/gabor_formula_2.png" width=300>
normalized нужно делать потому что яркость может быть разная 


2. Detect face region


3. Normalize it

        a. rotate vertically
    
        b. map this region onto square 64 x 64
    
        c. average luminance in the region


4. Calculate convolutions for 40 gabor filters


5. Flatten it into one large vector


6. Feature selection using PCA


7. Vector compression using LDA


8. Classification




# Practice 

https://www.pyimagesearch.com/2018/09/24/opencv-face-recognition/

dlib - ML library that contains many functions for face recognition.

