# codecentric.AI Bootcamp
## Praxis: Computer Vision Basics

Willkommen bei der Lektion zu Computer Vision Basics.

In diesem Notebook lernen wir
- Bilder zu laden,
- Bilder abzuspeichern,
- Grundlegende Formen in Bildern zu zeichnen,
- und Augen in Bildern zu erkennen.

Um das Erklärvideo zu diesem Notebook zu laden, führe folgende Zelle aus oder öffne das Video in einem neuen Tab ( https://www.youtube.com/embed/DRDJqNZXYo4 ):

In [None]:
# lade Video
from IPython.display import IFrame    
IFrame('https://www.youtube.com/embed/DRDJqNZXYo4', width=850, height=650)

Um die Slides aus dem vorigen Video zu laden, führe die folgende Zelle aus:

In [None]:
# lade Slides
from IPython.display import IFrame    
IFrame('https://codecentric.slides.com/omoser/computer-vision-basics/', width=850, height=650)

Zu Beginn schauen wir uns nun ein paar grundlegende Befehle an, um Bilder zu laden und zu speichern. 

## Bilder laden

Laden des Bilds unter "resources/test-bild.png" und Darstellung im Jupyter Notebook.

In [None]:
%matplotlib inline

import cv2
import numpy as np
from matplotlib.pyplot import imshow
from PIL import Image

In [None]:
pil_im = Image.open('resources/test-bild.png', 'r')
imshow(np.asarray(pil_im))

### Bilder mit OpenCV laden

Nun laden wir das gleiche Bild - diesmal aber mit OpenCV. 
Man sieht, dass die Farben unterschiedlich dargestellt werden.

In OpenCV ist das standardmäßig eingestellte Farbschema BGR (und nicht RGB) - also Blau Grün Rot.

In [None]:
img = cv2.imread("./resources/test-bild.png")

In [None]:
imshow(img)

Jetzt verändern wir das geladene Bild. Wir überschreiben den Bereich von den Koordinaten x, y = (50, 50) bis x2, y2 = (250, 250) mit einem blauen Rechteck. Die Farbe ergibt sich aus Rot=0, Grün=0, Blau=255.

In [None]:
img[50:250, 50:250, :] = (0, 0, 255)

In [None]:
imshow(img)

Mit der Funktion `cv2.circle()` können wir einen weißen Kreis zeichnen. Wir zeichnen ihn im Folgenden in die Mitte des Bildes.

In [None]:
height, width = img.shape[:2]
img = cv2.circle(img, (width//2, height//2), 300, (255, 255, 255), thickness=-1)

In [None]:
imshow(img)

## Bilder abspeichern

In [None]:
cv2.imwrite("/tmp/bild.png", img)

Zur Überprüfung der erfolgreichen Speicherung laden und zeigen wir das Bild nun wieder an.

In [None]:
test_bild = cv2.imread("/tmp/bild.png")
imshow(test_bild)

## Bilder zeichnen

Nun zeichnen wir das Raster eines Tic Tac Toe Spiels...

In [None]:
width, height = 640, 480
color = (255, 255, 255)  # (255, 255, 255) entspricht weiss

# Erzeugen einer schwarze Leinwand mit 640 x 480px x 3 Farbkanälen
# np.zeros(h,w,3) erzeugt einen 3 dimensionalen Numpy Array mit 8-Bit Integern (0-255) mit Nullen gefüllt
canvas = np.zeros( (height, width, 3) , dtype=np.uint8)

# Zeichnen einer Linie auf die Leinwand - von links nach rechts
canvas = cv2.line(canvas, (0, height//3), (width, height//3), color, thickness=3)

In [None]:
imshow(canvas)

In [None]:
# Zeichnen einer Linie von oben nach unten
canvas = cv2.line(canvas, (width//3, 0), (width//3, height), color, thickness=3)
imshow(canvas)

## Objekte in einem Bild mit einem Detektor erkennen

Nun nutzen wir einen Standard-Detektor aus der OpenCV-Bibliothek, um Augen in einem Gesicht zu finden.

Die Datei `haarcascade_eye.xml` wird mit OpenCV mitgeliefert und enthält einen "Detektor", um Augen in einem Bild zu erkennen und zu lokalisieren:

In [None]:
cascade = cv2.CascadeClassifier('/usr/local/lib/python3.6/site-packages/cv2/data/haarcascade_eye.xml') 
face_orig = cv2.imread("./resources/frau.png")

Die Methode `detectMultiScale` scannt mehrfach das Bild mit einem gleitenden Fenster ab und variert dabei die Größe des Fensters um den Faktor `scaleFactor`.

Mit dem Parameter `minNeighbors` kann eingestellt werden, wie viele Detektionen mind. in einer Region vorhanden sein müssen, damit es tatsächlich als Detektion bewertet wird - je mehr, desto wahrscheinlicher handelt es sich um falsche Detektionen.

In [None]:
eyes = cascade.detectMultiScale(face_orig, 1.05, 5)

if len(eyes) > 0:
    print("Augen gefunden: {0}".format(eyes))
    for x, y, w, h in eyes:
        # wenn Augen gefunden wurden, zeichnen wir ein Rechteck an diese Stelle
        cv2.rectangle(face_orig, (x, y), (x+w, y+h), (255, 0, 0), 3)

Um das Bild größer darstellen zu können, können wir die `figure size` von matplotlib einstellen. Anschließend konvertieren wir das Bild in den "richtigen" Farbraum und zeigen es an. 

In [None]:
from matplotlib.pyplot import figure
figure(num=None, figsize=(16, 12))

# RGB-Konvertierung und Darstellung des Bilds
face_rgb = cv2.cvtColor(face_orig, cv2.COLOR_BGR2RGB)
imshow(face_rgb)