<a href="https://colab.research.google.com/github/MaschinenNah/ml_utils_develop_and_test/blob/main/ml_utils_frame_predict_develop_and_test.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

### Package ml_utils laden und importieren

In [1]:
!git clone https://github.com/MaschinenNah/ml_utils
from ml_utils import load
from ml_utils import convert
from ml_utils import show
from ml_utils import frame_predict as fp

Cloning into 'ml_utils'...
remote: Enumerating objects: 103, done.[K
remote: Counting objects: 100% (103/103), done.[K
remote: Compressing objects: 100% (73/73), done.[K
remote: Total 103 (delta 44), reused 73 (delta 21), pack-reused 0[K
Receiving objects: 100% (103/103), 11.38 KiB | 3.79 MiB/s, done.
Resolving deltas: 100% (44/44), done.


### Modul erneut importieren nach lokaler Veränderung

In [None]:
import importlib
importlib.reload(frame_predict)

<module 'ml_utils.load' from '/content/ml_utils/load.py'>

In [None]:
from tensorflow.keras.utils import Sequence
import numpy as np
from PIL import Image
import os
import random


class FramePredictionGenerator(Sequence):

  def __init__(self, dir_, frame_shape, n_frames, batch_size=50, validation_fraction=0.1):
    random.seed(0)

    self.frame_shape = frame_shape
    self.n_frames = n_frames
    self.batch_size = batch_size
    
    # Pfade zu allen Verzeichnissen, die Frames einer Szene enthalten:
    scene_dir_paths =  load.all_abs_paths_in_dir(dir_)
    
    # all_examples soll die PFADE zu allen Beispielen speichern. Wenn n_frames = 3, dann so:
    # [[frame0, frame1, frame2, frame3],
    #  [frame1, frame2, frame3, frame4],
    #  [frame2, frame3, frame4, frame5],
    #  ...
    self.all_examples = []
    
    # für jede Szene:
    for scene_dir_path in scene_dir_paths:
      # Pfade zu allen Dateien:
      all_frame_paths_in_scene = load.all_abs_paths_in_dir(scene_dir_path)
      list.sort(all_frame_paths_in_scene)

      # Wie viele Beispiele können aus einer Szene gewonnen werden?
      number_of_frames = len(all_frame_paths_in_scene)
      number_of_examples = number_of_frames - self.n_frames

      # Erzeugung der Beispiele:
      for example_index in range(number_of_examples):
        example = []
        for frame_index in range(self.n_frames+1):
          # Berechnung des Indices des aktuellen Beispiels:
          index = example_index + frame_index
          # Befüllung des Beipiels:
          example.append(all_frame_paths_in_scene[index])
        # Beispiel anhängen
        self.all_examples.append(example)
      
      # Beispiele mischen, ansonsten stehen sie in der vorgegebenen Reihenfolge in der Liste:
      random.shuffle(self.all_examples) 

      # Der Index der Stelle, die Trainings- und Validierungsbeispiele trennt:
      split_index = int(len(self.all_examples) * 1.0 - validation_fraction)

      # Trennung der Trainings- von den Validierungsbeispielen:
      self.train_examples = self.all_examples[:split_index]
      self.validation_examples = self.all_examples[split_index:]

      # Ermittlung der Länge des Generators, sprich:
      # Wie viele Batches kann der Generator pro Epoche liefern?
      self.len = int(len(self)/self.batch_size)

  def __len__(self):
    return self.len

  def __getitem__(self, batch_index):
    if batch_index >= self.len:
      raise IndexError("batch index out of range")
    else:
      # Wir erzeugen die Numpy-Arrays, welche die x und y Batches repräsentieren:
      batch_x, batch_y = self._get_empty_batches()
      # Indices der Beispiele, die in den aktuellen Batch hineingeschrieben werden sollen:
      start = int(batch_index * self.batch_size)
      stop = int((batch_index + 1) * self.batch_size)
      # Auswahl der Beispiele:
      selection = self.train_examples[start:stop]
      
      # Ausgehend von den Pfaden in den ausgewählten Beispielen...
      for example_idx, example in enumerate(selection):
        # Befüllen von batch_x:
        for frame_idx, img_path in enumerate(example[:-1]):
          img = Image.open(img_path)
          batch_x[example_idx, frame_idx] = load.img_path_to_np_array(img_path)
        # Befüllen von batch_y:
        img_path = example[-1]
        batch_y[example_idx] = load.img_path_to_np_array(img_path)

    return batch_x, batch_y

  # on_epoch_end wird automatisch nach jeder Epoche aufgerufen und mischt die Beispiele:
  def on_epoch_end(self):
    random.shuffle(self.train_examples)

  # Hilfsfunktion – Erzeugung leerer Batches:
  def _get_empty_batches(self):
    empty_batch_x = np.empty((self.batch_size,) + (self.n_frames,) + (self.frame_shape), "float32")
    empty_batch_y = np.empty((self.batch_size,) + (self.frame_shape), "float32")
    return empty_batch_x, empty_batch_y

  # Liefert die Daten, um einen Validierungs-Generator zu bauen:
  def get_validation_data(self):
    return self.validation_examples, self.frame_shape, self.batch_size

### Modul show auf GitHub aktualisieren

In [None]:
import getpass

def commit_to_github(file, message):
  github_pw = getpass.getpass();
  %cd /content/ml_utils
  !git config --global user.email "maschinennah@gmail.com"
  !git config --global user.name "MaschinenNah"
  !git add $file
  !git commit -m $message
  !git remote rm origin
  !git remote add origin https://MaschinenNah:{github_pw}@github.com/MaschinenNah/ml_utils.git
  !git push -u origin main
  %cd /content

In [None]:
commit_to_github("frame_predict.py", "rename")

··········
/content/ml_utils
[main 50db331] rename
 1 file changed, 1 insertion(+)
 create mode 100644 frame_predict.py
Counting objects: 2, done.
Delta compression using up to 2 threads.
Compressing objects: 100% (2/2), done.
Writing objects: 100% (2/2), 224 bytes | 224.00 KiB/s, done.
Total 2 (delta 1), reused 0 (delta 0)
remote: Resolving deltas: 100% (1/1), completed with 1 local object.[K
To https://github.com/MaschinenNah/ml_utils.git
   5678e54..50db331  main -> main
Branch 'main' set up to track remote branch 'main' from 'origin'.
/content
