## Metric Learning Approaches

Distance metric learning (или просто metric learning) направлено на автоматическое создание метрик размеченных из контролируемых данных в машинном обучении. Полученная метрика расстояния затем может быть использована для выполнения различных задач (например, классификации, кластеризации, информационного поиска).

В нашем случае наиболее высокую точность можно получить с использованием нейронных сетей, то есть deep metric learning. Поскольку для обучения нужны именно размеченные данные, в metric learning выделяется 2 основных подхода на основе исходной обучющей выборки:

1. Supervised learning: алгоритм имеет доступ к набору точек данных, каждая из которых принадлежит классу (метке), как в стандартной задаче классификации. В общих чертах, цель этой настройки — изучить метрику расстояния, которая помещает точки с одной и той же меткой близко друг к другу, а точки с разными метками отодвигает друг от друга.

2. Weakly supervised learning: алгоритм имеет доступ к набору точек данных с контролем только на уровне кортежа (обычно пары, тройки или четверки точек данных). Классическим примером такого более слабого контроля является набор положительных и отрицательных пар: в этом случае цель состоит в том, чтобы изучить метрику расстояния, которая помещает положительные пары близко друг к другу, а отрицательные пары — далеко.

А также 2 основных подхода на основе оценки близости обученных эмбеддингов:

1. Siamese. Нейронная сеть принимает на вход два объекта и возвращает вероятность, что они совпадают или похожи (в зависимости от постановки задачи). Данную вероятность можно использовать как меру похожести или «расстояние».

2. Representation learning. Нейронная сесть принимает на вход один объект и возвращает вектор, представляющий этот объект в некотором векторном пространстве. Далее между векторами вычисляется классическое расстояние, например, евклидово.



Для наших данных наиболее релевантно будет использовать подход Supervised learning, поскольку датасетов с полностью размеченными данными существует гораздо больше и точность обучения в этом случе будет выше. Также мы будем использовать Siamese в качестве подхода оценки близости, поскольку в этом случае сложность алгоритма обучения O(N), а алгоритма оценки O(N^2), что сильно быстрее, поскольку обучение гораздо более затратная операция, чем оценка косинусного расстония между векторами.

Реализация вышеперечисленных подходов может быть осуществлена люым способом, в том числе классическими PyTorch, TensorFlow, sckit-learn и т.д. , но кроме этого есть специализированные модули, как OpenMetricLearning, PyTorch Metric Learning. 

PML — популярная библиотека для metric learning, включающая богатую коллекцию функций потерь, майнеров, оценок расстояний и редукторов, однако OML содержит инструменты для более автоматизированного использования инструментов PML, поэтому наше дальнейшее использование этой библиотеки более обосновано.