# 1. Image Centering

Image centering erfolgt so, dass der Mittelpunkt der Linie zwischen den Caruncula lacrimales bei y = Bildbreite/2 liegt. Die x-Position wird auf Nasenmitte festgelegt

### a) Import der Libraries

In [2]:
# Import der relevanten Libraries
import glob
import os
from pathlib import Path
import re

import cv2
import imageio.v2 as imageio
from PIL import Image, ImageEnhance

import mediapipe as mp
from mlxtend.image import extract_face_landmarks

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd

import tqdm

### b) Verzeichnisse festlegen

In [5]:
# root: Verzeichnis mit Bildern, die ausgerichtet werden sollen
root = r'C:\Users\calti\Documents\Masterarbeit\Bilder'

# orig_imgs: Verzeichnis mit Originalbildern (unbearbeitet)
imgs_orig = r'C:\Users\calti\Documents\Masterarbeit\Bilder\JPG'

# target: Verzeichnis, in dem die ausgerichteten Bilder abgespeichert werden sollen
# (nicht benötigtes auskommentieren)
#imgs_aligned = r'C:\Users\calti\Documents\Masterarbeit\Bilder\Mediapipe'
imgs_aligned = r'C:\Users\calti\Documents\Masterarbeit\Bilder\mlxtend'

# (opt): Verzeichnis, in dem die ausgerichteten und mit Photoshop per Content Aware Fill bearbeiteten Bilder liegen
imgs_aligned_caf = r'C:\Users\calti\Documents\Masterarbeit\Bilder\Mediapipe CAF'

# imgs_cropped: Verzeichnis, in das die gecroppten und resized images gespeichert werden sollen
imgs_cropped = root+os.sep+'Cropped'

# exp_dir: Verzeichnis des PsychoPy-Experimentes, in dem die Conditions-Datei mit den Bildpfaden gespeichert werden soll
exp = r'C:\Users\calti\Documents\Masterarbeit\PsychoPy'

### c) Helferfunktionen

#### i) Image centering (Mediapipe Face Mesh 468)

Code ist teilweise hier entnommen: [Stackoverflow](https://stackoverflow.com/questions/59525640/how-to-center-the-content-object-of-a-binary-image-in-python)

In [7]:
def center_image(image, landmark_results, lm1 = 133, lm2 = 362, lm3 = 168, suppress_output = True):
    """
    Centers an image based on the locations of specific facial landmarks detected by a landmark detection model.

    Parameters:
    image (numpy.ndarray): Input image to be centered.
    landmark_results (mediapipe.python.solutions.face_mesh.FaceMesh): Results of landmark detection model.
    lm1 (int, optional): Index of first landmark point to use for centering. Default is 133.
    lm2 (int, optional): Index of second landmark point to use for centering. Default is 362.
    lm3 (int, optional): Index of third landmark point to use for centering. Default is 168.
    suppress_output (bool, optional): If True, suppresses output of diagnostic message printed to console. Default is True.

    Returns:
    numpy.ndarray: Centered image.
    float: x-coordinate of midpoint between specified landmarks in pixels.
    float: y-coordinate of point to be centered in pixels.
    float: angle between the line connecting the specified landmarks and the horizontal axis in degrees.
    """
    
    
    # get image width, height and center coordinates
    height, width, chann = image.shape
    
    # Center of Original Input Image
    wi=(width/2)
    he=(height/2)

    # x, y, und z Koordinaten des relevanten Punktes
    # ipp1, ..., enthalten jeweils die x-, y- und z-Koordinaten der Landmark in normalisierter Einheit [0,1]
    ipp1 = landmark_results.multi_face_landmarks[0].landmark[lm1] # Auge Links (Caruncula lacrimalis)
    ipp2 = landmark_results.multi_face_landmarks[0].landmark[lm2] # Auge rechts (Caruncula lacrimalis)
    ipp3 = landmark_results.multi_face_landmarks[0].landmark[lm3] # (Punkt etwas oberhalb der Interpupillarlinie)
    
    # x und y Koordinaten in Pixeln [0,1] -> Pixel
    ipp1_x_px = ipp1.x*width
    ipp1_y_px = ipp1.y*height
    ipp2_x_px = ipp2.x*width
    ipp2_y_px = ipp2.y*height
    ipp3_y_px = ipp3.y*height
    ipp3_x_px = ipp3.x*width
    
    # Bestimmung der x-Koordinate des Mittelpunktes zwischen C. lacrimalis rechts und links
    # ipp2_x_px: x-Koordinate der C. lacrimalis rechts (landmark 362) [Pixel]
    # ipp1_x_px: x-Koordinate der C. lacrimalis links (landmark 133)  [Pixel]
    # ipp_half: x-Koordinate der C. lacrimalis links + die Hälfte der Distanz zwischen lm362 und lm133 [Pixel]
    #  - dies ist die x-Koordinate des Punktes, der später bei x = Bildbreite/2 liegen soll
    ipp_half = ipp1_x_px+(ipp2_x_px-ipp1_x_px)/2
    
    # Bestimmung der y-Koordinate des Punktes, der später bei y = Bildhöhe/2 liegen soll
    if ipp1_y_px < ipp2_y_px:
        ipp_half_2 = ipp1_y_px+(ipp2_y_px-ipp1_y_px)/2
    else:
        ipp_half_2 = ipp2_y_px+(ipp1_y_px-ipp2_y_px)/2
    
    # Bestimmung des Winkels zwischen der Linie zwischen C.l. sinister und dextra
    dX = ipp2_x_px - ipp1_x_px
    dY = ipp2_y_px - ipp1_y_px
    angle = np.degrees(np.arctan2(dY, dX))
    
    # Offset = Differenz zwischen (x,y) des Bildzentrums und (x,y) der Landmark
    #offsetX = (wi-ipp_half)
    #offsetY = (he-ipp_half_2)
    offsetX = (wi-ipp3_x_px)
    offsetY = (he-ipp_half_2)
    
    if suppress_output == False:
        msg = f'''
        EyeL x:   {ipp1_x_px}
        EyeR x:   {ipp2_x_px}
        EyeL y:   {ipp1_y_px}
        EyeR y:   {ipp2_y_px}
        IPP x:    {ipp_half}
        IPP y:    {ipp_half_2}
        Offset x: {offsetX}
        Offset y: {offsetY}
        Angle:    {angle}
        \n\n
        '''
        print(msg)
    
    # Affine matrix with Translations
    T = np.float32([[1, 0, offsetX], [0, 1, offsetY]]) 
    
    # WarpAffine
    centered_image = cv2.warpAffine(image, T, (width, height))
    
    # Return translated Image, x-Koordinate des Punktes zwischen C.l. sinistra und dextra, Winkel
    return centered_image, ipp_half, ipp_half_2, angle

#### ii) Image Centering (mlxtend, dlib68)

Code ist teilweise hier entnommen: [Stackoverflow](https://stackoverflow.com/questions/59525640/how-to-center-the-content-object-of-a-binary-image-in-python)

In [13]:
def center_image_mlx(image, landmarks, lm1 = 39, lm2 = 42, suppress_output = True):

    # get image width, height and center coordinates
    height, width, chann = image.shape
    
    # Center of Original Input Image
    wi=(width/2)
    he=(height/2)

    # x, y, und z Koordinaten des relevanten Punktes
    # ipp1, ..., enthalten jeweils die x-, y- und z-Koordinaten der Landmark in normalisierter Einheit [0,1]
    lm1_x = landmarks[lm1][0]
    lm1_y = landmarks[lm1][1]
    
    lm2_x = landmarks[lm2][0]
    lm2_y = landmarks[lm2][1]
    
    # Bestimmung der x-Koordinate des Mittelpunktes zwischen C. lacrimalis rechts und links
    # ipp2_x_px: x-Koordinate der C. lacrimalis rechts (landmark 362) [Pixel]
    # ipp1_x_px: x-Koordinate der C. lacrimalis links (landmark 133)  [Pixel]
    # ipp_half: x-Koordinate der C. lacrimalis links + die Hälfte der Distanz zwischen lm362 und lm133 [Pixel]
    #  - dies ist die x-Koordinate des Punktes, der später bei x = Bildbreite/2 liegen soll
    ipp_half = lm1_x+(lm2_x-lm1_x)/2
    
    # Bestimmung der y-Koordinate des Punktes, der später bei y = Bildhöhe/2 liegen soll
    if lm1_y < lm2_y:
        ipp_half_2 = lm1_y+(lm2_y-lm1_y)/2
    else:
        ipp_half_2 = lm2_y+(lm1_y-lm2_y)/2
    
    # Bestimmung des Winkels zwischen der Linie zwischen C.l. sinister und dextra
    dX = lm2_x - lm1_x
    dY = lm2_y - lm2_y
    angle = np.degrees(np.arctan2(dY, dX))
    
    # Offset = Differenz zwischen (x,y) des Bildzentrums und (x,y) der Landmark
    #offsetX = (wi-ipp_half)
    #offsetY = (he-ipp_half_2)
    offsetX = (wi-ipp_half)
    offsetY = (he-ipp_half_2)
    
    if suppress_output == False:
        msg = f'''
        EyeL x:   {lm1_x}
        EyeR x:   {lm2_x}
        EyeL y:   {lm1_y}
        EyeR y:   {lm2_y}
        IPP x:    {ipp_half}
        IPP y:    {ipp_half_2}
        Offset x: {offsetX}
        Offset y: {offsetY}
        Angle:    {angle}
        \n\n
        '''
        print(msg)
    
    # Affine matrix with Translations
    T = np.float32([[1, 0, offsetX], [0, 1, offsetY]]) 
    
    # WarpAffine
    centered_image = cv2.warpAffine(image, T, (width, height))
    
    # Return translated Image, x-Koordinate des Punktes zwischen C.l. sinistra und dextra, Winkel
    return centered_image, ipp_half, ipp_half_2, angle

#### iii) Bild zu Video Konvertierung

Code kommt in Teilen von diesen Seiten:  
[TheAILearner: openCV Img to Video](https://theailearner.com/2018/10/15/creating-video-from-images-using-opencv-python/)  
[TheAILearner: Image Resizing, wenn Input und Video Size unterschiedlich](https://theailearner.com/2018/11/15/changing-video-resolution-using-opencv-python/)

In [9]:
def img_to_video(image_path_list: list, target_folder: str, output_name: str, size:tuple, fps=20,):
    """
    Converts a list of images to a video and saves it to the specified target folder with the given output name and file format.

    Args:
    image_path_list (list): A list of file paths of the images to be included in the video.
    target_folder (str): The path to the directory where the video file will be saved.
    output_name (str): The name of the video file to be saved.
    size (tuple): A tuple of width and height values representing the size of the output video.
    fps (int, optional): The frame rate of the output video. Default is 20 frames per second.

    Returns:
    None
    """
    
    
    img_array = []
    
    for i, filename in enumerate(image_path_list):
        if i%20 == 0:
            print(f'Read Iteration: {i}')
        
        # Read Image
        img = cv2.imread(filename)

        # Resize Image
        img_resized = cv2.resize(img, 
                                 size, 
                                 fx=0,
                                 fy=0, 
                                 interpolation = cv2.INTER_CUBIC)

        # Append image to list 
        img_array.append(img_resized)

    # Open video writer
    out = cv2.VideoWriter(target_folder+os.sep+output_name+'.mp4',
                              cv2.VideoWriter_fourcc(*'mp4v'), 
                              fps, 
                              size)

    # write images
    for i in range(len(img_array)):
        out.write(img_array[i])

        if i%20 == 0:
            print(f'Write Iteration: {i}')
    
    # release video writer            
    out.release()

#### iv) Cropping und Resizing

Code ist z.T. entnommen aus der von [Gernot Horstmann](https://www.uni-bielefeld.de/fakultaeten/psychologie/abteilung/arbeitseinheiten/01/people/scientificstaff/horstmann/) zur Verfügung gestellten Datei `cutting.py`  

In [10]:
def crop_resize(input_folder: str, output_folder: str, output_width: int, output_height: int):
    """
    Crop and resize images from a source folder and save them in a target folder.

    Args:
        input_folder (str): The path to the folder containing the source images.
        output_folder (str): The path to the folder where the cropped and resized images will be saved.
        output_width (int): The desired width of the output images, in pixels.
        output_height (int): The desired height of the output images, in pixels.

    Returns:
        None.

    Raises:
        OSError: If the output folder cannot be created.

    The function crops and resizes images from the input folder, using a fixed aspect ratio and centering the
    cropping around the image center. The resulting images are saved in the output folder as JPEG files, with
    the same base name as the source files.

    """

    print(f'Lese Bilder aus dem Verzeichnis: {input_folder}.')
    print(f'Speichere cropped images in: {output_folder}.')
    
    # Check, ob Output-Folder existiert (falls nicht, wird Folder erstellt)
    if not os.path.exists(imgs_cropped):
        os.makedirs(imgs_cropped)

    # get a list of all file names in the image directory
    myImgList = os.listdir(input_folder)
    myImgListEncode = [x.encode('utf-8') for x in myImgList]

    # Iterieren über jedes Bild im Ordner img_aligned_caf
    for index, thisImg in enumerate(myImgList):

        # Öffnen des Bildes
        img =Image.open(os.path.join(input_folder, thisImg))

        # Optional: Image Enhancer (z.B. Helligkeit anpassen)
        #enhancer=ImageEnhance.Brightness(img)
        #img = enhancer.enhance(1.5)

        # Bildmitte des Input Images
        cenX = img.width//2
        cenY = img.height//2

        # Scaling Factor
        f=50

        # Cropping des Bildes
        cropped = img.crop((
                cenX-(100*f),
                cenY-(100*.682*f),
                cenX+(100*f),
                cenY+(100*.682*f)
                ))

        # Resizing
        x_factor = y_factor = 0.45
        img=cropped.resize( (int(img.size[0]*x_factor), int(img.size[1]*y_factor)), Image.ANTIALIAS)

        # Zentrum des cropped images
        cenX = img.width//2
        cenY = img.height//2

        # Cropping des Bildes
        cropped = img.crop((
                cenX-(output_width/2),
                cenY-(output_height/2),
                cenX+(output_width/2),
                cenY+(output_height/2)
                ))

        # Erstellen des Dateinamens
        imgName = os.path.splitext(thisImg)[0]
        outName = imgName+".jpg"
        outFile = os.path.join(output_folder, outName)

        # Speichern des Bildes
        cropped.save(outFile)

        if index%20 == 0:
            print(f'Itereation {index} done.')

### d) Eigentliches Centering

#### i) Mediapipe Library (468 landmarks)

__Googles MediaPipe__: [Github](https://github.com/google/mediapipe)

In [None]:
#mp_drawing = mp.solutions.drawing_utils
#mp_drawing_styles = mp.solutions.drawing_styles
mp_face_mesh = mp.solutions.face_mesh

# Checken, ob Output-Folder existiert
if os.path.exists(imgs_aligned) == False:
    os.mkdir(imgs_aligned)

# Liste mit absoluten Pfaden zu Originalbildern
IMAGE_FILES = glob.glob(imgs_orig+'\\*JPG')

print(f'''There are {len(IMAGE_FILES)} images in folder {imgs_orig}.\n
Target folder set to: {imgs_aligned}''')

# Liste für Winkel zwischen Caruncula lacrimalis sinistra und dextra
angles = []

# Liste für Bildnamen (ohne Dateiendung). Diese wird fürs Mergen des Datensatzes mit Winkeln und Experimentaldatensatz verwendet
names = []

# Liste für Pfade zu Bilden, in denen keine Landmarks gefunden wurden
landmarks_not_found = []

drawing_spec = mp_drawing.DrawingSpec(thickness=1, circle_radius=1)


with mp_face_mesh.FaceMesh(
    static_image_mode=True, # einzelne Bilder, kein Videostream
    max_num_faces=1, # Maximale Anzahl an Gesichtern (da nur 1 pro Bild --> 1)
    refine_landmarks=True, # Soll das Mesh um die Augenregion herum verfeinert werden?
    min_detection_confidence=0.5) as face_mesh:

    # über Bilddateipfade und Bilder iterieren
    for idx, file in enumerate(IMAGE_FILES):
        
        if idx%20 == 0:
            print(f'Processed image {idx} of {len(IMAGE_FILES)})
        
        # Einlesen des aktuellen Bildes
        image = cv2.imread(file)
        
        # Generate filename (preserve original Filename)
        img_path = Path(file)
        name_without_ext = img_path.stem
        name_with_ext = img_path.parts[-1]

        # Convert the BGR image to RGB before processing.
        # Results enthält die 468 landmarks
        results = face_mesh.process(cv2.cvtColor(image, cv2.COLOR_BGR2RGB))

    # Fahre mit nächster Iteration fort, wenn keine Landmarks gefunden wurden
    # Speichere die Bildpfade, für die keine Landmarks gefunden wurden
        if not results.multi_face_landmarks:
            print(f'Keine Landmarks gefunden in: {file}')
            landmarks_not_found.append(file)
            continue
        
        # Zentering des Bildes unter Verwendung der Standardeinstellungen (lm133, lm168, lm368)
        centered_image, _, _, angle = center_image(image, results)
        
        # Speichern der Winkel zwischen der Linie, die die C.l. sinistra und dextra verbindet
        angles.append(float(angle))
        
        # Speichern der Namen der Bilddateien ohne Dateiendung
        # In meinem Fall nutze ich diese Information, um die Winkel später dem Datensatz zu matchen
        names.append(name_without_ext)
        
        # Speichern des Bildes
        cv2.imwrite(imgs_aligned+os.sep+name_with_ext , centered_image)

# Erstellen eines Data Frames mit Winkeln und Bildnamen
# Export des Data Frames als csv
df = pd.DataFrame({"angles":angles, 
                   "looker":names})
df["angles"] = round(df["angles"], 3)
df.to_csv(root+os.sep+'angles.csv', float_format="%.3f", index=False)

#### ii) mlxtend Library (68 Landmarks)

__mlextend__: [GitHub](https://github.com/rasbt/mlxtend)

__Codebeispiele__ für mlxtend's `extract_face_landmarks`: [Sebastian Raschkas GitHub](https://rasbt.github.io/mlxtend/user_guide/image/extract_face_landmarks/#)

In [None]:
# Checken, ob Output-Folder existiert
if os.path.exists(imgs_aligned) == False:
    os.mkdir(imgs_aligned)

# Liste mit allen Originalbildern
imgs = glob.glob(imgs_orig + "\*.JPG")

print(f'''There are {len(imgs)} images in folder {imgs_orig}.\n
Target folder set to: {imgs_aligned}''')

# Liste für Angle zwischen Caruncula lacrimalis sinistra und dextra
angles = []

# Liste für Looker-IDs
lookerIDs = []

# Aus jedem Bild die Landmarks extrahieren
for file in imgs:
    
    # Einlesen der Bilder
    #img = imageio.imread(file)
    img = cv2.imread(file)
    
    # Extrahieren der 68 Landmarks (dlib)
    landmarks = extract_face_landmarks(img)
    
    # Zentrieren des Bildes
    centered_image, _, _, angle = center_image_mlx(img, landmarks, suppress_output=True)
    
    # Namen der Outputdatei und Looker-ID extrahieren
    img_path = Path(file)
    name_without_ext = img_path.stem # Looker ID
    name_with_ext = img_path.parts[-1] # Filename für zentriertes Bild
    
    # Speichern der Winkel zwischen der Linie, die die C.l. sinistra und dextra verbindet
    angles.append(float(angle))

    # Speichern der Namen der Bilddateien ohne Dateiendung
    # In meinem Fall nutze ich diese Information, um die Winkel später dem Datensatz zu matchen
    lookerIDs.append(name_without_ext)

    # Speichern des Bildes
    cv2.imwrite(imgs_aligned+os.sep+name_with_ext , centered_image)

    
# Erstellen eines Data Frames mit Winkeln und Bildnamen
# Export des Data Frames als csv
df = pd.DataFrame({"angles":angles, 
                   "looker":names})
df["angles"] = round(df["angles"], 3)
df.to_csv(root+os.sep+'angles.csv', float_format="%.3f", index=False)

There are 520 images in folder C:\Users\calti\Documents\Masterarbeit\Bilder\JPG.

Target folder set to: C:\Users\calti\Documents\Masterarbeit\Bilder\mlxtend


### e) (opt) Überprüfen der Ausrichtungen durch Erstellen von Video aus Original- und ausgerichteten Bildern

In [None]:
# Bilder (Original)
imgs_orig = glob.glob(imgs_orig+'\\*JPG')

# Bilder (resized)
imgs_aligned = glob.glob(imgs_aligned+'\\*jpg')

# Größe (w x h) der Output-Videodatei
size = (1920, 1080)

# Create Video of Original jpg files
img_to_video(imgs_orig,
             root,
            'Original_Images',
            size)

# Create Video of aligned jpg files
img_to_video(imgs_orig,
             root,
            'Aligned_Images',
            size)

# 2. Image Cropping and Resizing

In [None]:
crop_resize(imgs_aligned_caf, imgs_cropped, 1280, 1024)

# 3. Excel-Datei mit den Dateipfaden zu den Experimentalstimuli erstellen

In [27]:
train_img_paths = glob.glob(exp + os.sep + "img_train" + os.sep + "*.jpg")
exp_img_paths = glob.glob(exp + os.sep + "img_exp" + os.sep + "*.jpg")

all_paths = [train_img_paths, exp_img_paths]

# create training conditions file

for i, l in enumerate(all_paths):
    
    # Listen für Looker-ID, Blickrichtung in °Sehwinkeln und relative Bildpfade
    looker = []
    visAng = []
    rel_path = []
    visAng_corr = []
    
    # Iterieren über Bildpfade in entsprechender Liste "l"
    for paths in l:

        # split paths at each os sep, unterscore and dot
        split_parts = re.split(r'[\\/_.]', paths)

        # add looker id to looker list
        looker.append(split_parts[-3])
        
        # add visual angle to visAng list
        va = int(split_parts[-2])
        visAng.append(va)
        
        # Trainingsdaten
        if i == 1:
            # Korrektur des Sehwinkels
            if va == 0:
                visAng_corr.append(0)
            elif va == 1:
                visAng_corr.append(1.1)
            elif va == 2:
                visAng_corr.append(2.2)
            elif va == 3:
                visAng_corr.append(3.3)
            elif va == 4:
                visAng_corr.append(4.4)
            elif va == 5:
                visAng_corr.append(5.5)
            elif va == 6:
                visAng_corr.append(6.6)
            elif va == 7:
                visAng_corr.append(7.7)
            elif va == 8:
                visAng_corr.append(8.8)
            elif va == 9:
                visAng_corr.append(9.9)
            elif va == 10:
                visAng_corr.append(11.1)
            elif va == 11:
                visAng_corr.append(12.2)
            elif va == 12:
                visAng_corr.append(13.3)

        # add relative path of image file to list
        rel_path.append(os.sep.join(paths.split(os.sep)[-2:]))
    
    if i == 0:
        df_train = pd.DataFrame({'img_path': train_img_paths, 
                             'img_rel_path': rel_path, 
                             'looker': looker, 
                             'visAng': visAng})
    else:
        df_exp = pd.DataFrame({'img_path': exp_img_paths, 
                               'img_rel_path': rel_path, 
                               'looker': looker, 
                               'visAng': visAng,
                               'visAngCorr': visAng_corr})

In [37]:
# Speichern der Trainings-Conditionfile
#df_train.to_excel(exp+os.sep+"cond_training.xlsx", index=False)       

# Auswählen der relevanten Blickrichtungen
visAng_exp = [0.0, 2.2, 4.4, 6.6, 8.8, 13.3]

filtered_df = df_exp[df_exp.visAngCorr.isin(visAng_exp)].copy()

filtered_df["visAng"] = filtered_df["visAng"].astype('float64')
filtered_df["visAngCorr"] = filtered_df["visAngCorr"].astype('float64')

filtered_df.to_excel(exp+os.sep+"cond_exp.xlsx", index=False)