# <small><i>Ulrich Klauck - Studiengang Informatik - Hochschule Aalen</i></small>

# Bildpyramiden in OpenCV

In [None]:
import cv2
from uk_utils import imshow
import numpy as np
import math
import sys

%matplotlib inline
from matplotlib import pyplot as plt

In [None]:
img_name = '../images/LenaBW.jpg'
img = cv2.imread(img_name, cv2.IMREAD_GRAYSCALE)

if img is None:
    print('Image ', img_name, ' not found')
else:
    imshow(img)

## Die Gauss-Pyramide mit der OpenCV-Funktion

Die OpenCV-Funktion pyrDown() berechnet jeweils die nächste Stufe einer Gaußpyramide, d.h. dass Bild wird mit einem Gaußfilter gefiltert und in jeder Richtung um den Faktor 2 verkleinert.

In [None]:
imgTmp = img.copy()
gPyr = []              # empty list for pyramid images

for i in range(1, int(math.log(max(img.shape), 2))+2):
    if imgTmp.shape[0] >= 2 and imgTmp.shape[1] >= 2:
        imgTmp = cv2.pyrDown(imgTmp)
        gPyr.append(imgTmp)
    else: break

Zur Darstellung der Pyramide werden die Einzelbilder der Pyramide in einer Bildmatrix zusammengefasst. 

In [None]:
def displayPyramid(pyr, norm=False):
    # compute total width of all pyramid images
    width = 0
    for p in pyr: width += p.shape[1]

    # image for collecting all pyramid images
    imgPyramid = np.ndarray((pyr[0].shape[0], width), dtype=img.dtype)
    imgPyramid[:,:] = 255

    # now collect all images
    col = 0
    for p in pyr:
        if norm:
            imgPyramid[0:p.shape[0], col:col+p.shape[1]] = \
                cv2.normalize(p.copy(), 0, 255, norm_type=cv2.NORM_MINMAX, dtype=cv2.CV_8U)
        else:
            imgPyramid[0:p.shape[0], col:col+p.shape[1]] = p.copy()
        col += p.shape[1]

    plt.figure(figsize=(15,100))
    imshow(imgPyramid)
    
displayPyramid(gPyr)

## Die Laplace-Pyramide aus der Gauß-Pyramide

In [None]:
lpPyr = []

for i in range(len(gPyr)-1):
    tmp = cv2.pyrUp(gPyr[i+1])
    diff = cv2.subtract(gPyr[i], tmp)
    lpPyr.append(diff)
    
displayPyramid(lpPyr, True)

## Pyramide durch Verkleinern mit beliebigem Faktor

Die Gaußpyramide verkleinert von einer Pyramidenstufe zur nächsten standardmäßig um den Faktor 2 in jeder Richtung. Mit einer selbst geschriebenen Funktion ist man flexibler und kann beliebige Verkleinerungsfaktoren realisieren. Die Funktion lässt zusätzlich die Tiefpassfilterung weg. Theoretisch entsteht dadurch Aliasing, was aber hier akzeptiert wird. In manchen Anwendungsfällen - vor allem, wenn Kanten im Bild eine Rolle spielen - ist das u.U. sogar günstiger. 

In [None]:
# function that resizes an image
def resize(img, factor=None, inter=cv2.INTER_AREA):
    
    if factor is None:
        return img

    (h, w) = img.shape[:2]

    dim = (int(w*factor), int(h*factor))
    imgResized = cv2.resize(img, dim, interpolation=inter)

    return imgResized

factor = 0.3          # factor for resizing
imgTmp = img.copy()
pyr = []              # empty list for pyramid images

for i in range(1, int(math.log(max(img.shape), 1.0/factor))+2):
    if imgTmp.shape[0] >= 1/factor and imgTmp.shape[1] >= 1/factor:
        imgTmp = resize(imgTmp, factor)
        pyr.append(imgTmp)
    else: break

displayPyramid(pyr)