# Традиционный Марквардт-Левенберг

<img src="imgs/ml_dep.png" width="650" height="220" />

## Определения:
### $ F = F(x) \text{ -  наша целевая функция. Её мы будем минимизировать. }\\
\triangledown f(x) \text{ -  градиент функции } f \text{ в точке } x \text{ .} \\
x^* - x, \text{ при котором } F(x^*) \text{ является локальным минимумом.} \\
J_f=J_f(x) = J \text{— матрица Якоби для функции } f: R^n \to R^m \text{ в точке } x \text{. Т.е. это таблица всех частных производных первого порядка.} \\
H_f = H_f(x) = H \text{— матрица Гессе (матрица вторых производных).}  $

## Метод наискорейшего спуска(Steepest Descent)
### $ \text{Принимаем } F(x)=f(x) \text{, т.е. целевая функция совпадает с заданной.} \\
\text{Нужно найти } d_{нс}(x) \text{ — направление наискорейшего спуска функции } f \text{ в точке } x. \\
f(x) \text{ может быть линейно аппроксимирована в точке } x: \\
f(x+d) \approx f(x) + \nabla f(x)^Td, \ d \in R^n , ||d|| \to 0 \\
\lim_{d \to 0}f(x)-f(x+d) = - \nabla f(x)^Td  \stackrel{(3.a)} = - || \nabla f(x)^T|| \ ||d|| cos \theta $

### $ \text{Получаем, что направление равно: } d_{нс} =  -\alpha \nabla f(x)^T,  0 < \alpha < 1 $

## Метод Ньютона
### $ \text{Рассмотрим для } f(x): R \to R \\
\text{Принимаем } F(x)=f(x) \text{, т.е. целевая функция совпадает с заданной.} \\
\text{Разлагаем } f(x) \text{ в ряд Тейлора, только в отличии от МНС нам нужно квадратичное приближение:} \\
f(x+d) \approx f(x) + f^{'}(x)d + \frac{1}{2} f^{''}(x)d^2, \ d \in R^n , ||d|| \to 0$

### $ \text{Несложно показать, что если } f{'}(x) \ne 0 \text{, то функция не может иметь экстремум в } x \text{. Точка } x^* \text{ в которой } f{'}(x) = 0 \text{ называется стационарной.} $

### $ \text{Продифференцируем обе части по }d \text{. Наша цель, чтобы } f(x+d)^{'}=0 \text{, поэтому решаем уравнение:} \\
0 = f(x+d)^{'} = f^{'}(x) + f^{''}(x)d  \\
d_{н}=- \frac{f^{'}(x)}{f^{''}(x)} \\
d_{н} \text{ — это направление экстремума, но оно может быть как максимумом, так и минимумом.} \\
\text{Чтобы узнать — является ли точка } x+d_{н} \text{ минимумом — нужно проанализировать вторую производную.} \\
\text{Если }  f^{''}(x) > 0 \text{, то } f(x+d_{н}) \text{ является локальным минимумом, иначе — максимумом.}  $

### $ \text{В многомерном случае первая производная заменяется на градиент, вторая — на матрицу Гессе.} \\
\text{Делить матрицы нельзя, вместо этого умножают на обратную: } \\
f(x): R^n \to R \\
H(x)d_{н}=- \nabla f(x)\\
d_{н}=- H^{-1}(x)\nabla f(x) $

## Метод Гаусса-Ньютона
### $ \text{Если задано } m \text{  функций } r = (r_1, …, r_m) \text{ от } n \text{ переменных } \beta =(\beta_1, …, \beta_n) \text{, при } m≥n. \\
\text{Алгоритм Гаусса — Ньютона итеративно находит значения переменных,} \\
\text{которые минимизируют сумму квадратов. } \\
S \boldsymbol (\beta)= \sum_{i=1}^m r_i^2(\boldsymbol \beta).$

### $ \text{Начав с некоторого начального приближения } \boldsymbol \beta^{(0)} \text{, метод осуществляет итерации} \\
\boldsymbol \beta^{(s+1)} = \boldsymbol \beta^{(s)} - \left(\mathbf{J_r}^\mathsf{T} \mathbf{J_r} \right)^{-1} \mathbf{ J_r} ^\mathsf{T} \mathbf{r}(\boldsymbol \beta^{(s)}) $


### $ \text{При аппроксимации данных, где целью является поиск параметров } \beta \text{, таких, что заданная модель функций } \\
y=f(x, \beta) \text{ наилучшим образом приближает точки данных } (x_i, y_i),\\
\text{функции } r_i \text{ являются остаточными ошибками} \\
r_i(\boldsymbol \beta)= y_i - f(x_i, \boldsymbol \beta). \\
\text{ Тогда метод Гаусса — Ньютона можно выразить в терминах якобиана } J_f \text{ функции } f \\
\boldsymbol \beta^{(s+1)} = \boldsymbol \beta^{(s)} - \left(\mathbf{J_f}^\mathsf{T} \mathbf{J_f} \right)^{-1} \mathbf{ J_f} ^\mathsf{T}\mathbf{r}(\boldsymbol \beta^{(s)}). $

# Алгоритм Левенберга — Марквардта


In [1]:
from __future__ import print_function
from ipywidgets import interact, interactive, fixed, interact_manual
import ipywidgets as widgets
import numpy as np
import matplotlib.pyplot as plt
import cv2 as cv
from IPython.display import HTML
from IPython.display import Javascript

# https://docs.opencv.org/trunk/da/d54/group__imgproc__transform.html

# https://docs.opencv.org/trunk/d4/d35/samples_2cpp_2polar_transforms_8cpp-example.html#a16

# https://python-forum.io/Thread-Image-conversion-form-cartesian-to-polar-and-back-to-cartesian

#https://en.wikibooks.org/wiki/LaTeX/Mathematics

# НАДЕЖНАЯ РЕГИСТРАЦИЯ ИЗОБРАЖЕНИЙ С ИСПОЛЬЗОВАНИЕМ ЛОГ-ПОЛЯРНОГО ПРЕОБРАЗОВАНИЯ

In [2]:
src = cv.imread('/Users/kolsha/Pictures/i_m_pumpkin_rick__stencil_by_batnamz-dbrxwip.png')
src = cv.cvtColor(src, cv.COLOR_BGR2RGB)

rows, cols, ch = src.shape
crow, ccol = int(rows/2) , int(cols/2)

@interact_manual(rotate=(-ccol, ccol), scale=(-crow, crow))
def show_log_polar(rotate, scale):
         # center
    M = 121.0
    
    rotate *=4
    scale *=2

    #polar_img = cv.logPolar(src, (crow, ccol), M)

    img64_float = np.copy(src)#.astype(np.float64)

    center = (ccol, crow)

    #center = (0, 0)

    #M = np.sqrt(((img64_float.shape[0]/2.0)**2.0)+((img64_float.shape[1]/2.0)**2.0)) / 4
    print(M, src.shape)

    #log_polar_img = cv.logPolar(img64_float, center ,M ,cv.INTER_LINEAR + cv.WARP_FILL_OUTLIERS)
    #cv.linearPolar(img64_float,(img64_float.shape[0]/2, img64_float.shape[1]/2),Mvalue,cv.WARP_FILL_OUTLIERS)

    #cartisian_image = cv.linearPolar(ploar_image, (img64_float.shape[0]/2, img64_float.shape[1]/2),Mvalue, cv.WARP_INVERSE_MAP)
    flags = cv.INTER_LINEAR + cv.WARP_FILL_OUTLIERS + cv.WARP_POLAR_LOG

    maxRadius = 1.5 * np.max(center)
    #print(maxRadius)
    log_polar_img = cv.warpPolar(img64_float, (0,0) ,center, maxRadius, flags)


    #log_polar_img = log_polar_img/255

    log_polar_img = np.roll(log_polar_img, (rotate, scale), (0, 1))

    #cartisian_image  = cv.logPolar(log_polar_img, center, M, cv.WARP_INVERSE_MAP + cv.INTER_LINEAR + cv.WARP_FILL_OUTLIERS)


    cartisian_image = cv.warpPolar(log_polar_img, (cols,rows) ,center, maxRadius, flags + cv.WARP_INVERSE_MAP)
    
    
    titles = ['Original Image','Log Polar','Cartisian']
    images = [src, log_polar_img, cartisian_image]
    fig = plt.gcf()
    fig.set_size_inches(20, 15.5)
    for i in range(len(images)):
        plt.subplot(2, 3, i+1),
        plt.imshow(images[i], aspect='auto')
        plt.title(titles[i])
        plt.xticks([]),
        plt.yticks([])
    plt.show()

interactive(children=(IntSlider(value=0, description='rotate', max=400, min=-400), IntSlider(value=0, descript…

# Полярные координаты


## $r = \sqrt{(x-x_c)^2 + (y - y_c)^2}$


## $\varphi = \tan^{-1} (\frac{y - y_c}{x-x_c})$

# Алгоритм:

0. ## Вырезаем центральный регион $I^{'}_1$ из $I_1$

0. ## Переводим в лог-полярную ситему $I^{'}_1$ -> $I^{'}_1p$

0. ## Для всех позиций $(x,y)$ из второго изображения $(I_2)$: 
    0. ## Вырезаем регион $I^{'}_2$ из $I_2$
    0. ## Переводим в лог-полярную ситему $I^{'}_2$ -> $I^{'}_2p$
    
    0. ## Считаем кросс-корреляцию $I^{'}_1p$ и $I^{'}_2p$ -> $(dx,dy)$
    
    0. ## Если корреляция максимальна, сохраняем $(x,y)$ и $(dx,dy)$

0. ## Масштабируем на $(dx)$:
0. ## Вращаем на $(dy)$:
0. ## Сдвигаем в $(x,y)$

0. # You're great

# Пирамидный подход к субпиксельной регистрации на основе интенсивности

# Введение
<br/>

0. ### Используют неизмененную интенсивность всех пикселей изображения



0. ### Используют более высокий порядок интерполяции для минимизации размытия изображения и достижения согласованности в вычислении пространственных производных



0. ### Их модель деформации состоит из комбинации полного 3-D аффинного преобразования и дополнительного линейного изменения контраста. Они получают более простые модели, ограничивая аффинное преобразование конкретными подмножествами параметров, реализуя комбинации вращения, трансляции и изометрического масштабирования.


0. ### Нелинейный алгоритм оптимизации Марквардта-Левенберга:
    0. #### Они ускоряют его выполнение, используя особую структуру своей модели деформации.
    0. #### В частности, они переформулируют задачу оптимизации таким образом, чтобы они могли предварительно вычислить большинство терминов, необходимых для построения Гессиана и градиентного критерия, вместо того, чтобы переоценивать их на каждой итерации, как это требуется в традиционном подходе.
    0. #### Они включили Марквардта-Левенберга в мультиразрешающую структуру, используя стратегию итерации от грубого до тонкого и распространяя оценки для одного уровня пирамиды разрешения от ее предыдущего уровня.

# Критерий подобия тестовых данных эталонным

## $ \varepsilon^2 = \iint_{\{x\} \subset R^{q}} \mathrm{(f_R(x) - Q_p\{f_T(x)\})^2}\,\mathrm{d}x  $    (1)                

### $ f_R - \text{исходные данные} \\ f_T - \text{тестовые данные} \\ Q_p\{f\} - \text{преобразование осуществляющееся по } \textbf{p} \\ q - \text{размерность пространства} $

### $ \text{Такой критерий хорошо поддается минимизации по отношению к }\textbf{p}\text{ и хорошо понятен.} $



# Аффинное преобразование

### $ Q_p\{f\} - \text{рассмотрим общее аффинное преобразование, параметризованное матрицей  } \textbf{A} (3\times3), \text{вектором трансляции  } \textbf{b} \text{  и коэффициентом масштабирования серого уровня  } \gamma$


### Это глобальное преобразование охватывает любую комбинацию изменения контраста, перемещения, поворота вокруг любого центра, перекос, сдвиг и масштабирование.

### Разложим преобразование с помощью нескольких операторов, а именно оператора трансляции $T_b$, аффинного оператора $A_A$ и оператора контраста $C_\gamma$.

### $  \begin{cases} T_\mathbf{b}\{f(\mathbf{x})\} = f(\mathbf{x} + \mathbf{b}) \\ 
A_\mathbf{A}\{f(\mathbf{x})\} = f(\mathbf{Ax}) \\ 
C_\gamma\{f(\mathbf{x})\} = e^\gamma f(\mathbf{x})
\end{cases} $ (2)

<img src="imgs/table_1.png" width="823" height="498"/>

### Эти операторы подчиняются правилам композиции, приведенным в таблице I. Используя (2) , мы можем выразить наше первое преобразование как:

### $ Q_{\mathbf{b,A},\gamma}\{f(\mathbf{x})\} = T_\mathbf{b}\{ A_\mathbf{A}\{ C_\gamma\{ f(\mathbf{x}) \} \} \} 
 = e^\gamma f(\mathbf{Ax + b})$ (3)

# Гомоморфное преобразование

### В качестве альтернативы предлагается второе глобальное преобразование с явным ограничением. Оно может согласовывать изменение контраста, перемещение, вращение, и изометрическое масштабирование, но не искривление.

### Определим повороты вокруг осей координат с помощью:
<img src="imgs/rotations.png" width="400" height="400"/>

## $ \text{Определим оператор вращения как:} \\
R_{\phi, \theta,  \varphi} \{ f(\mathbf{x}) \} = f(\mathbf{A_x(\phi)   A_y(\theta)   A_z(\varphi)   \mathbf{x}})    $

## $ \text{Изотропный оператор масштабирования как:} \\
S_{k} \{ f(\mathbf{x}) \} = f(e^k\mathbf{x})    $

## $ \text{Исходя из этого дополним таблицу I: }$
<img src="imgs/table_2.png" width="823" height="498" />

## $ \text{Итоговое преобразование:} \\
 Q_{\mathbf{b},k,\phi, \theta,  \varphi, \gamma}\{f(\mathbf{x})\} = T_\mathbf{b}\{ S_k\{R_{\phi, \theta,  \varphi} \{ C_\gamma\{ f(\mathbf{x}) \} \} \} \} 
 = e^\gamma f(e^k\mathbf{R}(\phi, \theta,  \varphi)\mathbf{x} + \mathbf{b}) 
$ (3)


### $ \text{Свойство результирующего преобразования:} \\  Q_p\{ f(\mathbf{x}) + g(\mathbf{x})\} = Q_p\{ f(\mathbf{x})\} + Q_p\{g(\mathbf{x})\} $

# Традиционный Марквардт-Левенберг

<img src="imgs/ml.png" width="413" height="498" />

### $ \text{На каждом шаге  } f_T \text{  подвергается преобразованию  } Q_\mathbf{p} \text{  перед тем как сравнивается с  } f_R .\\
\text{Также вычисляется} \\
\mathbf{p}_{t+1} = \mathbf{p}_{t} + \delta\mathbf{p}_{t+1} \\
\text{При условии} \\
\displaystyle\sum_{l=1}^{M} \alpha_{kl} \delta\mathbf{p}_{l} = \beta_k \\
\text{Где } [\alpha_{kl}]_{M \times M} \text{  - выводится через матрицу Гессиана из матрицы кривизны.} \\
[\beta_k]_{M \times 1} \text{  - пропорциональна градиенту остатка.} $

## $ \varepsilon^2 \cong \chi^2(\mathbf{p}) =  \displaystyle\frac{1}{N}\sum_{i=1}^{N} \mathrm{(f_R(x_i) - Q_p\{f_T(x_i)\})^2}  $    (15) 

### $ N \text{  - количество пикселей,  } X_i \text{  - координаты пикселя} $