In [1]:
# Helpful packages for working with images and factorizations
# using Pkg; Pkg.add("Images")
# using Pkg; Pkg.add("Interact")
# using Pkg; Pkg.add("ImageMagick") # And this allows us to load JPEG-encoded images
using Images, LinearAlgebra, Interact

### Использование SVD для сжатия изображения

В этом упражнении мы будем использовать разложение по сингулярным числам (SVD) для сжатия изображения, чтобы мы могли хранить изображение, не сохраняя «ненужную» информацию. Для начала давайте определим разложение по единственному значению. В SVD мы берем матрицу $A$ и разлагаем ее так, чтобы

$$A = USV^T$$

где матрицы $U$ и $V$ являются унитарными и содержат наши особые векторы. Матрица $S$ диагональна и хранит наши сингулярные значения в порядке убывания сверху/слева, снизу/справа. В Джулии наши изображения хранятся в виде массивов, поэтому мы можем рассматривать их как матрицы

In [None]:
file = download("https://uploads6.wikiart.org/images/salvador-dali/the-persistence-of-memory-1931.jpg!Large.jpg")

In [None]:
img = load(file)

In [None]:
size(img)

In [None]:
img[245,280]

In [None]:
img[140:145,220:225] # Each element in the array is a color

In [None]:
dump(img[24,24])

In [None]:
channels = Float64.(channelview(img))
Gray.(channels[1, :, :])

Теперь мы можем взять SVD этого изображения. Таким образом, мы можем хранить эту картинку как наборы сингулярных векторов и сингулярных значений. 

Это полезно, так как мы обнаружим, что нам не нужно отслеживать все особые векторы и все особые значения для хранения изображения, которое все еще выглядит как репродукция картины! Это означает, что мы можем хранить только важную информацию, отбрасывая остальную часть и тем самым «сжимая» изображение. 

Работать с изображениями в оттенках серого немного проще, поэтому давайте поработаем с серой версией.

Если мы не выбрасываем данные, то возвращаемся к тому, с чего начали:

In [None]:
U, S, V = svd(channels[1,:,:])
Gray.(U * Diagonal(S) * V')

Ну, конечно, мы не делаем здесь никакого сжатия - размеры U, S и V больше, чем наша исходная матрица! Это как противоположность сжатия. Ключевым моментом является то, что значения хранятся в порядке убывания, поэтому мы можем начать отбрасывать ненужности.

In [None]:
sum(length.((U, S, V)))

In [None]:
length(img)

In [None]:
Gray.(U[:, 1:25] * Diagonal(S[1:25]) * V[:, 1:25]')

In [None]:
sum(length.((U[:, 1:25], S[1:25], V[:, 1:25])))/length(img)

Конечно, это всего лишь один канал изображения. Давайте соберем все воедино и посмотрим, как мы можем сжать разные каналы, чтобы найти приемлемый уровень сжатия.

In [None]:
function rank_approx(M, k)
    U, S, V = svd(M)
    
    M = U[:, 1:k] * Diagonal(S[1:k]) * V[:, 1:k]'
    
    M = min.(max.(M, 0.0), 1.)
end

n = 100
@manipulate for k1 in 1:n, k2 in 1:n, k3 in 1:n
colorview(  RGB, 
            rank_approx(channels[1,:,:], k1),
            rank_approx(channels[2,:,:], k2),
            rank_approx(channels[3,:,:], k3)
)
end # ??? interact не отображается

**Итак, как мы можем использовать SVD, чтобы определить, какая информация на изображении действительно важна?**

Ответ кроется в сингулярных значениях!

Если у нас есть матрицы $U$, $S$, и $V$ Исходя из нашего изображения, мы можем восстановить это изображение с помощью матричного умножения $USV^T$. 

Взятие этого матричного произведения аналогично суммированию внешних произведений каждой соответствующей пары векторов из $ U $ и $ V $, масштабированных по сингулярному значению ($\sigma$) из $ S $. Другими словами, для (100 x 100) пиксельного изображения

$$A_{image} = USV^T = \sum_{i = 1}^{100} \sigma_i \mathbf{u_i}\mathbf{v_i'} $$

Каждый внешнее произведение $ u_i * v_i '$ создает  матрицу(100 x 100). Здесь мы суммируем сто  матриц(100 x 100), чтобы создать исходную матрицу $ A_ {image} $. Матрицы в начале ряда - те, которые масштабируются на большие особые значения - будут  намного более важны при воссоздании исходной матрицы

Это значит мы можем аппроксимировать $A_{image}$ как

$$A_{image} \approx \sum_{i = 1}^{n} \sigma_i \mathbf{u_i}\mathbf{v_i'}$$

где $n < 100$.

#### Упражнение

Напишите функцию под названием `compress_image`. Её входные аргументы должны быть изображением и фактором сжатия. Сжатое изображение в градациях серого должно отображаться при вызове `compress_image`.

Например,

```julia
compress_image("images/104_100.jpg", 33)
```

вернет сжатое изображение банана в градациях серого, построенного с использованием 3 особых значений. (Это изображение имеет 100 единичных значений, поэтому используйте `fld (100, 33)`, чтобы определить, сколько особенных значений следует сохранить. `Fld` выполняет `floor division`.)

*Намёки*: 

* Выполните SVD на «канале» изображения в градациях серого.
* В пустой ячейке ввода выполните `? Svd`, чтобы найти функцию, которая выполнит SVD для вас.