# IMAGE STITCHING

Aufbauend auf der Python-Funktion zur projektiven Entzerrung soll nun ein Panorama aus einer Serie von Bildern eines (möglichst ebenen) Objekts erstellt werden. Dazu gehen wir wie folgt vor:
1. Wie bei der projektiven Entzerrung vermessen wir in jedem Bild mindestens 4 Punkte, für die wir geschätzte Weltkoordinaten festlegen. Sinnvollerweise sollten einige dieser Punkte im Überlappungsbereich beider Bilder liegen.
2. Mithilfe der projektiven Entzerrung werden die Bilder in das Weltkoordinatensystem transformiert.
3. Die transformierten Bilder werden miteinander in einem Bild verschmolzen.

Idealerweise sollte jeder Pixel in den überlappenden Bereichen die gleiche Intensität haben, aber dies ist in der Realität nicht der Fall. Gründe dafür sind unterschiedliche Belichtungszeiten oder Blendenwahl, Vignettierung (Abnahme der Intensität zu den Bildrändern hin), Schätzungsfehler bei der projektiven Entzerrung, radiale Verzerrung der Kameraoptik usw.

Eine einfache Strategie ist die gewichtete Verschmelzung der Bilder. Dabei wird jeder Pixel mit seinem Abstand zu den Mittellinien gewichtet, so daß Pixel in der Bildmitte Gewicht 1 und Pixel an den Rändern Gewicht 0 haben. Für ein Bild mit Breite M und Höhe N und ein Pixel an der Position i, j berechnet sich das Gewicht als

$$
w_{ij} = \left( 1 - \frac{2}{M} \left| i - \frac{M}{2} \right| \right) \times \left(1 - \frac{2}{N} \left| j - \frac{N}{2} \right| \right)
$$

In überlappenden Bildbereichen wird entweder nur der Pixel mit dem höheren Gewicht übernommen, oder eine gewichtete Summe aus beiden Pixeln berechnet. Im ersten Fall besteht die Gefahr, daß sichtbare Diskontinuitäten entstehen, im zweiten Fall können aufgrund von Registrierungsfehlern Details verloren gehen. Die beste Vorgehensweise ist daher das sogenannte multi-band blending: Mit Hilfe eines Tiefpasses wird das Bild in einen hoch- und einen tieffrequentes Anteil zerlegt. Der tieffrequente Anteil, also die groben Strukturen, werden durch gewichtete Mittelung vereinigt, der hochfrequente Details durch Beibehaltung des Pixels mit dem höchsten Gewicht.

## Aufgaben

In [None]:
from scripts.utils import *

### Teil A

Erweitern Sie Ihre Python-Funktion zur projektiven Entzerrung so, daß sie mehr als 4 Passpunkte
verarbeiten kann.

In [None]:
import numpy as np


def projective_transform(H, img, dst_height, dst_width):
    target_matrix = np.zeros((dst_height, dst_width, img.shape[2]), dtype=img.dtype)

    if np.linalg.det(H) == 0:
        print("Transformation not possible: det(A^-1) = 0")
        return target_matrix

    for y in range(dst_height):
        for x in range(dst_width):

            loc_h = H.dot([x, y, 1])
            loc = loc_h[:2] / loc_h[2]

            target_matrix[y][x] = bilinear_neighbor(img, loc)

    return target_matrix

### Teil B
Nehmen Sie mit einer Kamera Ihrer Wahl eine Serie von mindestens 4 Aufnahmen eines ebenen Objektes (z.B. Fassaden, Häuserfront) von unterschiedlichen Standpunkten her auf. Legen Sie eine Liste von Passpunkten mit geschätzten Weltkoordinaten an, wobei pro Bild mindestens 4 Passpunkte (besser mehr) vorhanden sein sollten. Idealerweise sollten jeweils mindestens 2 Passpunkte im Überlappungsbereich liegen.

### Teil C
Schreiben Sie eine Funktion, die ein projektiv entzerrtes Bildpaar miteinander in ein neues, größeres Bild verschmelzen kann. Der Benutzer soll dabei wählen können, ob jeweils nur die Pixel mi dem größeren Gewicht beibehalten werden, oder ob ein gewichtetes Mittel aus allen Pixeln berechnet wird.

### Teil D
Schreiben SIe eine weitere Funktion, die ein projektiv entzerrtes Bildpaar in einen Hoch- und einen Tiefgasanteil zerlegt und dann über multi-band blending vereinigt. Der Tiefpass (z.B. ein Gauß-Tiefpass oder ein gleitender Mittelwert) kann hierzu mit der Matlab-Funktion filter2 realisiert werden. Den Hochpass Anteil erhält man einfach durch Subtraktion des Tiefpass Anteils vom Eingangsbild.

*Nützliche Python-Funktionen:*
- Die Pseudoinverse einer Matrix wird mithilfe von `numpy.linalg.pinv` berechnet.