# Семинар 3

# Решение линейных систем

## Кластеризация и матричные разложения

- Задача кластеризации относится к классу задач обучения без учителя, в которой требуется разбить наборы объектов на группы, в которых содержатся похожие объекты

<img src="./clustering_demo.png">

Картинка из [этого](https://towardsdatascience.com/semantic-similarity-classifier-and-clustering-sentences-based-on-semantic-similarity-a5a564e22304) поста.

- Отличие от классификации - меток объектов нет
- Классический алгоритм решения такой задачи называется *k-means* или метод $k$-средних

### $k$-means

- Выбираем число кластеров $k$
- Выбираем так называемые центры кластеров
- Повторяем до сходимости
    - Размечаем объекты на основании того, к какому центру они ближе
    - Обновляем центр как среднее значение точек из каждого кластера

- Подробности будут в курсе по машинному обучению

### Визуализация

<img width=400 src="./K-means_convergence.gif">

### Причём тут матричные разложения?

- Пусть дано $N$ объектов, каждый из которых описывается $n$ числами.
- Данные $N$ объектов уложены по столбцам в матрицу $X$
- **Утверждение.** Алгоритм $k$-means решает следующую задачу оптимизации

$$ \| X - ZC\|^2_F \to \min, $$
 
где $X \in \mathbb{R}^{n \times N}$, $Z \in \mathbb{R}^{n \times k}$ и $C$ размера $k \times N$
- Матрица $C$ обладает следующим свойством

$$ C_{ij} = \begin{cases} 1, & x_j \in \mathcal{C}_i \\ 0, & \text{иначе}, \end{cases} $$

где $\mathcal{C}_i$ обозначает $i$-ый кластер, а $x_j$ – $j$-ый объект.

- В каждом столбце матрицы $C$ ровно одна 1

**Q:** что такое матрица $Z$?

**Q:** какая интерпретация у столбцов матрицы $X - ZC$?

### Моделирование миграции населения

- Пусть $x_t \in \mathbb{R}^{100}$ распределение населения по возрастам в год $t$
- Динамика этого распределения описывается во времени как 

$$ x_{t+1} = Ax_t + u $$

- Что такое $u$?
- Какой вид имеет матрица $A$ ?

#### Определение миграционной политики

- Дан вектор $x_1$, матрица $A$ и желаемое распределение $x_T = x_d$
- Необходимо найти такой вектор $u$, чтобы желаемое распределение было достигнуто

In [3]:
import numpy as np

A = np.array([[1, 2, 3, 4], [0.5, 0, 0, 0], [0, 0.6, 0, 0], [0, 0, 0.8, 0]])
print(A)
print(A @ A)
print(A @ A @ A)

[[1.  2.  3.  4. ]
 [0.5 0.  0.  0. ]
 [0.  0.6 0.  0. ]
 [0.  0.  0.8 0. ]]
[[2.   3.8  6.2  4.  ]
 [0.5  1.   1.5  2.  ]
 [0.3  0.   0.   0.  ]
 [0.   0.48 0.   0.  ]]
[[3.9  7.72 9.2  8.  ]
 [1.   1.9  3.1  2.  ]
 [0.3  0.6  0.9  1.2 ]
 [0.24 0.   0.   0.  ]]


### Томография сетей 

- Дана сеть из $n$ рёбер
- Каждое ребро вносит некоторую задержку $d_i$
- Чтобы выяснить характеристики сети, то есть найти вектор $d$, по сети запускают большое число сигналов по различным маршрутам и измеряют время прохождения сигнала $t_i$, $i=1,\ldots, N$ по известному маршруту
- Маршрут описывается бинарной матрицей $P$ размера $N \times n$ такой что

$$p_{ij} = \begin{cases} 1, & j \in \mathcal{P}_i\\ 0, & \text{иначе}, \end{cases} $$

где $\mathcal{P}_i$ – путь $i$.

- Необходимо по матрице $P$ и вектору $t$ определить вектор $d$, описывающий сеть

**Приложения**

- Дорожные сети
- Компьютерные сети

### Резюме

- Решение задачи кластеризации как вычисление матричного разложения
- Линейные системы и частные случаи их решения