# Непараметрические и параметрические методы

**Цель**: Понять как применять

## Задача классификации

**Гипотеза компактности**: Объекты одного класса близки друг к другу

Напомним:

**Аксиомы метрики**:
1. Симметрия
2. Неравенство треугольника
3. $\rho(x, y) \geq 0$

**Виды метрик:**
1. Расстояние Минковского:
    $p(a, b) = (\sum_i |a_i - b_i|^p)^{\frac{1}{p}$.
2. Косинусное сходство:
    $CosineSimilarity(a, b) = \frac{\sum_i a_i \cdot b_i}{\sqrt{\sum_i a_i^2} \cdot \sqrt{\sum_i b_i^2}}$.
3. Расстояние Махаланобиса
    $p(a, b) = \sqrt{(a-b)^T \cdot S^{-1} \cdot (a - b)}$, где $S$ - матрица ковариации между $a$ и $b$.
   * Метрика со встроенной нормализацией (ввиду матрицы ковариации)

### Методы

#### Метод ближайшего соседа (1NN)

**Описание**:

$\sqcup$ $x_{(u, 1)}$ - ближайший сосед объекта $u$
$x_{(u, 1)} = argmin_{x \in D_{train}} \rho(u, x)$
$a_{1NN} (u, D_{train}) = y(x_{(u,1)})$

**Достоинства**:
* Простота реализации
* Понятность
* Интерпретируемость

**Недостатки**:
* Чувствительность к шуму
* Низкое качество работы
* Нет явно заданных параметров


<img src="Pics/Noise.png" width="600">

### Метод $k$-ближайших соседей (kNN)

**Описание:**
* Выберем расстояние $\rho$ и число соседей $k$.
* Отсортируем объекты
    $\rho(u, x_{(u, 1)} \leq \rho(u, x_{(u, 2)| \leq ... \leq \rho(u, x_{(u, |D_{train}|)}$
$a_{kNN}(u, D_{train}) = argmax_{y \in Y} \sum_{i=1}^{\min(D_{train}, k)} (y(x_{(u, i)} = y))$

**Недостатки:**
* Когда мнение разделяется (объектов разных классов одинаково)
* Всё также нет явно заданных признаков

### Обобщённый метрический классификатор

**Описание:**
* Пусть $\omega_{(i, u)}$ - функция значимости $i$-го соседа. **Апостериорный вес**.
* Не путать с априорным весом, который не зависит от запроса $\omega_i$.
* Для учитывания обоих $\omega_{(i, u)} = \omega_i \cdot \omega_{(i, u)}$.
* $a_{GenDistClassifier} (u, D_{train}) = argmax_{y \in Y} \sum_{i = 1}^{D_{train}} (y(x_{(u, i)}) = y) \cdot \omega_{(i, u)}$

Единственное, что не ясно - как подбирать функцию

## Ядерное сглаживание

**Ядерная функция** $K(x)$ - симметричная неотрицательная функция, $\int_{-\infty}^{+\infty} K(x)dx = 1$

*Примеры*:
* Равномерное
* Нормальное

Как оценить плотность исходя только из выборки?

<img src="Pics/Cores.png" width="900">

<img src="Pics/Core_examples.png" width="900">

<img src="Pics/Core_view.png" width="800">

### Эмпирическая оценка вероятности с окном шириной $h$

$\bar p_h(x) = \frac{1}{2nh} \sum_{i=1}^{n} (|x - x_i| \leq h)$, $2h$ так как отклонение в обе стороны

### Окно Парзена-Розенблатта

$\bar p_h(x) = \frac{1}{2nh} \sum_{i=1}^n K(\frac{x - x_i}{h})$

*Для классификации:*
$a(u, D_{train}, h, K) = argmax_{y \in Y} \sum_{i=1}^{D_{train}} (y(x_{(u, i)}) = y) \cdot K(\frac{\rho(u, x_{(u, i)})}{h})$

*Оптимизация:* Вместо $h$ использовать $x_{(u, k+1)}$, иначе возможно такое:

<img src="Pics/Where.png" width="400">

## Непараметрическая регрессия

Имеет место **Гипотеза непрерывности**.

## Формула Надарая-Ватсона

* Ответ - средневзвешенное
* Веса вычисляются при помощи ядер

$a_{NRP}(x, D_{train}) = \frac{\sum_{x_i \in D_{train}} y_i \cdot \omega_i(x)}{\sum_{x_i \in D_{train}} \omega_i(x)}$, где $\omega_i = K(\frac{\rho(x_i, x)}{h})$.

**Теорема**
* Выборка $D_{train}$ простая, распределённая по $p(x, y)$
* $\int_0^{\infty} K(r) dr < \infty$, $\lim_{r \rightarrow \infty} r \cdot K(r) = 0$
* $\forall x \in X: E(y^2 | x) < \infty$
* $\lim_{i \rightarrow \infty} h_i = 0$, $\lim_{i \rightarrow \infty} i \cdot h_i = \infty$
Тогда $a_{NonParamRegh}(x, D_{train}) \overset{\mathbb{P}}{\to} E(y|x)$ в любой $x \in X$, где $E(y|x), p(x), D(y|x)$ непрерывны, а $p(x) > 0$

## Другие задачи с непараметрическими методами

### Few-Shot

* Обучение на малом количестве примеров
* Большое количество классов
* Множество классов может меняться
* Для каждого класса малое число примеров
* **Основная задача:** Классификация при помощи $1NN$
* **Подзадача:** Выделение признаков и подсчёт расстояния

### Tomek links

**Обоснование:** Объекты разных классов, которые находятся близко друг к другу - нарушают гипотезу компактности.

<img src="Pics/Tomek.png" width="500">

**Стратегии:**
* Удаление обоих объектов
* Удаление объекта мажоритарного класса