# Woche 04 - Objektorientierte Programmierung und das Modul Numpy

In dieser Woche werden wir den Crashkurs in Python mit einem Ausflug in die objektorientierte Programmierung abschließen. Danach widmen wir uns dem Modul Numpy, das Klassen und Funktionen für numerisches Python enthält. Die Themen sind also:

* Objektorientierte Programmierung
    * Was ist Objektorientierung?
    * Klassen definieren: Attribute und Methoden
* Modul Numpy
    * Modulmechanismus in Python
    * Einführung in Numpy


## Objektorientierte Programmierung

In den ersten beiden Teilen unseres Crashkurses Python haben wir uns die Grundlagen der Programmierung erarbeitet:
* Datentypen (Integer, Float, String, Bool, List)
* Ein- und Ausgabe (input, print)
* Kontrollstrukturen 
    * Programmverzweigungen (if - elif - else)
    * Schleifen (while oder for)
* Funktionen.

In einigen Programmiersprachen wie beispielsweise C hätten wir damit auch alle Sprachelement kennengelernt. Diese Programmierung nennt man **prozedurale Programmierung**. Python gehört jedoch zu den objektorientierten Programmiersprachen, so dass wir uns diese Woche dem Thema Objektorientierung widmen.


### Was ist Objektorientierung?

Bei der bisherigen prozeduralen Programmierweise haben wir Funktionen und Daten getrennt. Die Daten werden in Variablen gespeichert. Funktionen funktionieren nach dem EVA-Prinzip. In der Regel erwartet eine Funktion eine Eingabe von Daten, verarbeitet diese Daten und gibt Daten zurück. 

Angenommen, wir wollten ein Programm zur Verwaltung von Lottoscheinen schreiben. Zu einem Lottoschein wollen wir Name, Adresse und die angekreuzten Zahlen speichern. Dann müssten wir mit unserem bisherigen Wissen folgende Variablen pro Lottoschein einführen:

* vorname
* nachname
* strasse
* postleitzahl
* stadt
* liste_mit_sechs_zahlen

Wenn jetzt viele Spielerinnen und Spieler Lotto spielen wollen, wie gehen wir jetzt mit den Daten um? Legen wir eine Liste für die Vornamen und eine Liste für die Nachnamen usw. an? Und wenn jetzt der 17. Eintrag in der Liste mit den sechs angekreuzten Lottozahlen sechs Richtige hat, suchen wir dann den 17. Eintrag in der Liste mit den Vornamen und den 17. Eintrag in der Liste mit den Nachnamen usw.? Umständlich...

Die Idee der objektorientierten Programmierung ist, für solche Szenarien **Objekte** einzuführen. Ein Objekt fasst verschiedene Eigenschaften wie hier Vorname, Nachname, Straße, usw. zu einem Objekt Lottoschein zusammen. In der Informatik wird eine Eigenschaft eines Objekts **Attribut** genannt. 

Damit hätten wir erst einmal nur einen neuen Datentyp. Ein Objekt macht noch mehr aus, denn zu dem neuen Datentyp kommen noch Funktionen dazu, die die Verwaltung des Objektes erleichtern. Funktionen, die zu einem Objekt gehören, nennt man **Methoden**.



<div class="alert alert-block alert-info">

Hier finden Sie ein YouTube-Video "Objektorientierung (Konzept)" aus dem Python-Tutorial Crashkurs:
> https://www.youtube.com/watch?v=46yolPy-2VQ&list=PL_pqkvxZ6ho3u8PJAsUU-rOAQ74D0TqZB&index=21    

</div>

### Klassen benutzen

Im Folgenden sehen Sie, wie ein Objekt in Python definiert wird. Die Implementierung erfolgt als sogenannte **Klasse**. 

In [None]:
class Beispiel:
    def __init__(self, vorname, nachname):
        self.vorname = vorname
        self.nachname = nachname
        
    def schreibe_vorname_nachname(self):
        print(self.vorname + ' ' + self.nachname)
        
    def schreibe_nachname_vorname(self):
        print(self.nachname + ', ' + self.vorname)
   

Jetzt erzeugen wir ein Objekt vom Typ `Beispiel` und speichern es in der Variable `person`. Mit der Funnktion `type()` checken wir kurz, welcher Datentyp in der Variablen `person`steckt:

In [None]:
person = Beispiel('Alice', 'Wunderland')
type(person)

Nun können wir auch die beiden Methoden ausprobieren, die zu dem Objekt gehören. Der Aufruf einer Methode funktioniert anders als eine Funktion. Man hängt an die Variable, in der das Objekt gespeichert wurde, einen Punkt und dann die Methode mit runden Klammern. Den Punkt nennt man in der Informatik **Punktoperator**. 

Hier ein Beispiel zu der Methode `schreibe_vorname_nachname()`: 

In [None]:
person.schreibe_vorname_nachname()

Dann die zweite Methode, also `schreibe_nachname_vorname()`:

In [None]:
person.schreibe_nachname_vorname()

<div class="alert alert-block alert-info">

Hier finden Sie das YouTube-Video "Klassen und Objekte" aus dem Python-Tutorial Crashkurs:
> https://www.youtube.com/watch?v=XxCZrT7Z3G4&list=PL_pqkvxZ6ho3u8PJAsUU-rOAQ74D0TqZB&index=22

</div>

### Klassen definieren - Attribute

Jetzt definieren wir eine eigene Klasse, die eine Adresse verwalten soll. Ein erstes Beispiel haben Sie ja oben schon gesehen.

Eingeleitet wird eine Klasse mit dem Schlüsselwort `class` und dann dem Namen der Klasse. Da Klassen Objekte sind, ist es Standard, den ersten Buchstaben des Klassennamens groß zu schreiben. 

```python
class Klassenname:
```

Bemerkung: Um Variablen von Objekten leichter zu unterscheiden, werden Variablennamen klein geschrieben.

Danach folgt ein Abschnitt namens `def __init__(self):`, in dem die Eigenschaften der Klasse aufgelistet werden. `init` steht dabei für initialisieren, also den ersten Zustand, den das Objekt später haben wird. 

```python
class Klassenname:
    def __init__(self, eigenschaft1, eigenschaft2):
        self.attribut1 = eigenschaft1
        self.attribut2 = eigenschaft2
```

Probieren wir es mit der Adresse aus:

In [None]:
class Adresse:
    def __init__(self, strasse, hausnummer, plz, stadt):
        self.strasse = strasse
        self.hausnummer = hausnummer
        self.postleitzahl = plz
        self.stadt = stadt

Wie Sie sehen, können die Eingabe-Parameter der `init()`-Methode die gleichen Namen tragen wie die Attribute der Klasse, also `self.strasse = strasse`, müssen sie aber nicht. Das Beispiel `self.postleitzahl = plz` zeigt, dass das Attribut `self.postleitzahl` einfach den Wert des 4. Parameters bekommt, egal wie der heißt.

Definieren wir jetzt unsere erste Adresse, der Eingabe-Parameter `self` wird dabei weggelassen (warum kommt später).

In [None]:
adresse_fra_uas = Adresse('Nibelungenplatz', 1, 60318, 'Frankfurt am Main')

Geben wir als nächstes aus, was in der Variable `adresse_fra_uas` gespeichert ist. Probieren wir es mit der `print()`-Funktion:

In [None]:
print(adresse_fra_uas)

Wie Sie sehen, wird der Name der Klasse und der Speicherort im RAM angegeben, aber nicht der Inhalt. Die Funktion `print()` ist nicht für den Datentyp `Adresse` entwickelt worden. Schließlich können die Python-Entwickler nicht wissen, welche Klassen Sie entwickeln... 

Aber wir kommen wir jetzt an den Inhalt des Objektes `adresse_fra_uas`? Mit dem Punktoperator.

In [None]:
print(adresse_fra_uas.strasse)

In [None]:
print(adresse_fra_uas.postleitzahl)

Damit können wir auch ganz normal rechnen, wenn das Attribut eine Zahl ist:

In [None]:
adresse_fra_uas.postleitzahl + 11111

Mit dem Punktoperator können wir Attribute eines Objektes auch verändern. Schauen wir uns zunächst an, welchen Inhalt `adress_fra_uas.postleitzahl` hat, dann setzen wir eine neue Postleitzahl und schauen erneut, welchen Inhalt `adress_fra_uas.postleitzahl` jetzt hat:

In [None]:
print('davor: ')
print(adresse_fra_uas.postleitzahl)

adresse_fra_uas.postleitzahl = 77777

print('danach: ')
print(adresse_fra_uas.postleitzahl)

**Mini-Übung**   

Schreiben Sie eine Klasse, die Studierende mit den Eigenschaften
* Vorname
* Nachname
* Matrikel-Nummer
verwalten kann.

Testen Sie anschließend Ihre Klasse, indem Sie ein Beispiel ausprobieren.

<div class="alert alert-block alert-info">

Hier finden Sie das YouTube-Video "Der self Parameter" aus dem Python-Tutorial Crashkurs:
> https://www.youtube.com/watch?v=CLoK-_qNTnU&list=PL_pqkvxZ6ho3u8PJAsUU-rOAQ74D0TqZB&index=23

</div>

### Klassen definieren - Methoden

Es ist bedauerlich, dass wir nicht eine `print()`-Funktion für unsere Adressen-Klasse zur Verfügung haben. Definieren wir uns einfach eine ...

Da diese Funktion nicht allgemeingültig sein kann, sondern nur für die Objekte `Adresse` funktionieren kann, gehört sie auch folgerichtig zur Klasse selbst. Sie ist also keine Funktion, sondern eine Methode. 

Eine Methode wird definiert, indem innerhalb des Anweisungsblocks der Klasse eine Funktion mit dem Schlüsselwort `def` definiert wird. Der erste Eingabewert muss zwingend der `self`-Parameter sein. Hier ein Beispiel für eine Print-Methode: 

In [None]:
class Adresse:
    def __init__(self, strasse, hausnummer, plz, stadt):
        self.strasse = strasse
        self.hausnummer = hausnummer
        self.postleitzahl = plz
        self.stadt = stadt
    
    def print(self):
        print('Straße: ', self.strasse)
        print('Hausnummer: ', self.hausnummer)
        print('Postleitzahl: ', self.postleitzahl)
        print('Stadt: ', self.stadt)

In [None]:
adresse_fra_uas = Adresse('Nibelungenplatz', 1, 60318, 'Frankfurt am Main')
adresse_fra_uas.print()

Vielleicht möchten wir die Print-Ausgabe unterschiedlich haben, z.B. alles in einer Zeile. Wir erweitern unsere Klasse mit einer neuen Methode namens `print_einzeilig()`:

In [None]:
class Adresse:
    def __init__(self, strasse, hausnummer, plz, stadt):
        self.strasse = strasse
        self.hausnummer = hausnummer
        self.postleitzahl = plz
        self.stadt = stadt
    
    def print(self):
        print('Straße: ', self.strasse)
        print('Hausnummer: ', self.hausnummer)
        print('Postleitzahl: ', self.postleitzahl)
        print('Stadt: ', self.stadt)
        
    def print_einzeilig(self):
        print('{} {}, {} {}'.format(self.strasse, self.hausnummer, self.postleitzahl, self.stadt ))

In [None]:
adresse_fra_uas = Adresse('Nibelungenplatz', 1, 60318, 'Frankfurt am Main')

print('zuerst so:')
adresse_fra_uas.print()

print('\n und \ndann einzeilig:')
adresse_fra_uas.print_einzeilig()

**Mini-Übung**

Fügen Sie Ihrer Klasse zum Verwalten von Studierenden zwei Print-Funktionen hinzu. Die erste Print-Funktion soll in einer Zeile `Vorname Nachname (xxxxxx)` ausgeben, wobei das xxxxxx für die Matrikel-Nummer steht, also z.B.

```
Alice Wunderland (123456)
```

ausgeben. Die zweite soll `Nachname, Vorname (Matrikel-Nummer: xxxxxx)` ausgeben, also z.B.

```
Wunderland, Alice (Matrikel-Nummer: 123456)
```

In [None]:
# Ihr Code:


Bisher hatten wir nur Methoden ohne weitere Eingabe-Parameter (natürlich mit dem self-Parameter, der gehört zu allen Methoden dazu). Methoden können aber auch weitere Parameter haben. Beispielsweise könnte man eine Print-Funktion schreiben, bei der durch einen Parameter gesteuert wird, ob die Adresse in vier oder in einer Zeile angezeigt wird:

In [None]:
class Adresse:
    def __init__(self, strasse, hausnummer, plz, stadt):
        self.strasse = strasse
        self.hausnummer = hausnummer
        self.postleitzahl = plz
        self.stadt = stadt
    
    def print(self, einzeilig):
        if einzeilig == True:
            print('{} {}, {} {}'.format(self.strasse, self.hausnummer, self.postleitzahl, self.stadt ))
        else:    
            print('Straße: ', self.strasse)
            print('Hausnummer: ', self.hausnummer)
            print('Postleitzahl: ', self.postleitzahl)
            print('Stadt: ', self.stadt)
    

Probieren wir es aus:

In [None]:
adresse_fra_uas = Adresse('Nibelungenplatz', 1, 60318, 'Frankfurt am Main')

print('zuerst einzeilig:')
adresse_fra_uas.print(True)

print('\nund dann vierzeilig:')
adresse_fra_uas.print(False)

Zuletzt betrachten wir noch Methoden mit Rückgabewert. Wie bei Funktionen auch genügt es mit dem Schlüsselwort `return` den Rückgabewert zu definieren. Sehr häufig ist dabei der Fall, dass eine Eigenschaft des Objektes zurückgegeben wird. Dann wird in der Regel der Methodenname

```
get_attribut()
```

gewählt.

Aber prinzipiell kann der Rückgabewert auch eine Berechnung oder ähnliches enthalten.

In [None]:
class Adresse:
    def __init__(self, strasse, hausnummer, plz, stadt):
        self.strasse = strasse
        self.hausnummer = hausnummer
        self.postleitzahl = plz
        self.stadt = stadt
    
    def print(self, einzeilig):
        if einzeilig == True:
            print('{} {}, {} {}'.format(self.strasse, self.hausnummer, self.postleitzahl, self.stadt ))
        else:    
            print('Straße: ', self.strasse)
            print('Hausnummer: ', self.hausnummer)
            print('Postleitzahl: ', self.postleitzahl)
            print('Stadt: ', self.stadt)
 
    def get_stadt(self, grossschreibung):
        if grossschreibung == True:
            return self.stadt.upper()
        else:
            return self.stadt

Und auch diese Methode probieren wir aus. Je nachdem, ob die Methode mit `True` oder `False` aufgerufen wird, gibt die Methode den String `self.stadt` zurück, entweder normal geschrieben oder in Großbuchstaben. Dabei haben wir die Methode `.upper()` verwendet, die alle Buchstaben eines Strings in Großbuchstaben verwandelt.

In [None]:
adresse_fra_uas = Adresse('Nibelungenplatz', 1, 60318, 'Frankfurt am Main')

print('zuerst normal:')
s = adresse_fra_uas.get_stadt(False)
print(s)

print('\nund dann groß geschrieben:')
s = adresse_fra_uas.get_stadt(True)
print(s)

**Mini-Übung**   
Erweitern Sie die Klasse zum Verwalten von Studierenden (Vorname, Name, Matrikel-Nummer) um ein Attribut vorleistung_bestanden. Anfangs sollte dieses Attribut auf `False` gesetzt werden. Implementieren Sie eine Methode, die es ermöglicht, dieses Attribut auf `True` zu setzen.

Testen Sie anschließend Ihre erweiterte Klasse.

In [None]:
# Hier Ihr Code:



<div class="alert alert-block alert-info">

Hier finden Sie das YouTube-Video "Methoden in Klassen" aus dem Python-Tutorial Crashkurs:
> https://www.youtube.com/watch?v=58IjjwHs_4A&list=PL_pqkvxZ6ho3u8PJAsUU-rOAQ74D0TqZB&index=24

</div>

## Module 

Python bietet schon einige Standard-Funktionen, die Sie ja bereits in den letzten Kapiteln kennengelernt haben. Natürlich gehören dazu Funktionen wie `input()` und `print()`, aber auch eingebaute Sprachelemente wie `if`, `while` und `for`. 

Rund um diesen Python-Kern haben Programmiererinnen und Programmierer neue Funktionen implementiert, meistens zusammenhängend zu einem bestimmten Thema. Zwei Module haben wir schon erwähnt, das `math`- und das `random`-Modul.

**Mini-Übung**   
Lesen Sie nach: Welche Funktionalitäten beinhaltet das `math`-Modul? Hier finden Sie die offizielle Dokumentation: 

> https://docs.python.org/3/library/math.html 

Bitte suchen Sie eine Funktion heraus und übersetzen Sie deren Beschreibung ins Deutsche:

#### Hier Ihre deutsche Übersetzung einer Funktionsbeschreibung des math-Moduls



Es gibt mehrere Möglichkeiten, die Funktionen eines Moduls zu laden. Üblicherweise werden alle benötigten Module zu Beginn geladen, auch wenn man sie erst später braucht. Mit

```python
from modul import funktion
```

importiert man aus dem Module `modul` die Funktion `funktion`. Beispielsweise importieren wir mit

```python
from math import sqrt
```

die Wurzelfunktion.


In [None]:
from math import sqrt
sqrt(49)

Zu einem Modul können nicht nur Funktionen gehören, sondern auch Konstanten. Hier sehen Sie $\pi$:

In [None]:
from math import pi
pi

Das andere Modul, das wir schon gesehen haben, ist eine Sammlung von Funktionen rund um alles, was mit Zufall zu tun hat. Raten Sie, was könnte folgender Code bedeuten?

In [None]:
from random import randint
x = randint(1,49)
print(x)

Oft ist es so, dass Sie eine bestimmte Problemstellung durch die Programmierung lösen wollen und daher sehr viele Funktionen oder Konstanten des gleichen Moduls benötigen. Wir können durch den Befehl

```python
from modul import *
```

*alle* Funktionen und Konstanten des Moduls gleichzeitig importieren. 

In [None]:
from math import *

print('Die Kreiszahl ist: ', pi)
print('Die eulersche Zahl ist: ', e)
print('Und exp(0) = ', exp(0))

Auch wenn diese Möglichkeit besteht, sollten Sie nur sehr selten und wohlüberlegt davon Gebrauch machen. In den seltesten Fällen kennen wir nämlich alle dort definierten Funktionen und Konstanten. Es könnte sein, dass Sie mit dem `import *` zufällig eine Konstante importieren, die Sie selbst schon definiert haben und damit Ihre Arbeit überschreiben.

Daher ist folgende Lösung die Variante, die von den meisten Programmiererinnen und Programmieren verwendet wird:

```python
import modul as modulabkuerzung
```

Dann müssen sämtliche Konstanten und Funktionen aufgerufen werden, indem wir den Abkürzungsnamen des Moduls mit einem Punkt vor die Funktion setzen.



In [None]:
import random as rnd

x = rnd.randint(1,49)
print(x)

Warum sollte man diese etwas kompliziertere Schreibweise nehmen? Viele Module haben Überschneidungen.  Die Konstante $\pi$ ist beispielsweise nicht nur im Modul `math`, sondern auch in den Modulen `sympy` und `numpy`. Wenn Sie jedoch explizit den Namen des Moduls davor schreiben, gibt es keine Verwechslungsgefahr. Bei einer Konstanten mag dieser Aufwand übertrieben wirken, aber bei Funktionen kann der Unterschied der verschiedenen Implementierungen zu völlig unerwarteten Verhalten führen.  

## Das Modul Numpy

NumPy ist die Abkürzung für numerisches Python. Die Internetseite

> https://numpy.org

behauptet sogar von ihrem eigenen Paket, dass NumPy das fundamentale Modul für alle wissenschaftlichen Programme in Python ist - stimmt wahrscheinlich!

Alle Daten lassen sich letztendlich als eine Folge von Zahlen schreiben. Beispielsweise kann ein Foto durch seine Pixel beschrieben werden zusammengesetzt aus den Werten RGB (rot - grün - blau). Python bietet dafür schon einen Datentyp, die Liste, in der Zahlen (Integer oder Float) gespeichert werden können. Da Python eine interpretierte Programmiersprache ist und da in der Liste auch andere Datentypen wie zum Beispiel Strings vorkommen dürfen, sind Listen für große Datenmengen nicht geeignet. Stattdessen stellt das Modul NumPy einen effizienten Datentyp zur Verfügung, das sogenannten **NumPy-Array**.  

Dazu kommen noch Funktionen, die wichtig für Arrays sind wir Vektoroperationen. Tatsächlich sind die meisten NumPy-Operationen nicht in Python programmiert, sondern in C. Damit sind NumPy-Funktionen sehr effizient und das tolle daran ist, dass wir uns keine Gedanken über hardwarenahe Programmierung mit C oder C++ machen müssen :-)

Schauen wir uns für das Bestimmen des Maximums einer Liste von zufällig erzeugten Zahlen zwischen 0 und 1 an. Zunächst erzeugen wir die Liste der 100 Zahlen. Dazu importieren wir NumPy mit seiner typischen Abkürzung `np`.

In [None]:
import numpy as np

# erzeuge Liste
M = np.random.random(100)

print(M)

Als nächstes berechnen wir das Maximum dieser Zahlen mit der eingebauten Standardfunktion `max`, dann mit `np.max`:

In [None]:
max_standard = max(M)
max_numpy = np.max(M)

print('Standard max = ', max_standard)
print('Numpy max = ', max_numpy)

Aber wie lange haben eigentlich die Berechnungen gedauert? Bei so kleinen Listen lohnt es nicht, die Berechnung mit der Stoppuhr zu ermitteln, die typischen Rechnenzeiten sind zu kurz. Aber JupyterLab bietet ein eingebautes Kommando, nämlich `%timeit`. Der Vorteil dieses Kommandos ist, dass der Python-Interpreter bei sehr kurzen Rechenzeiten einfach den Code mehrmals durchläuft und Mittelwerte bildet. 

In [None]:
%timeit max_standard = max(M)
%timeit max_numpy = np.max(M)

Sie sehen, die NumPy-Variante ist erheblich schneller als die Standard-Variante.

### Erzeugung von NumPy-Arrays

Im Gegensatz zu Python-Listen enthalten NumPy-Arrays nur Elemente des gleichen Datentyps. Aber wenn eine Liste nur aus gleichen Datentypen besteht, können wir direkt aus ihr ein NumPy-Array erzeugen:


In [None]:
liste = [1, 2, 3, 4, 5]
a = np.array(liste)

print(a)
print( type(a) )

Sehr häufig kommen auch zweidimensionale Arrays vor. In der Mathematik würde man ein eindimensionales Array als Vektor bezeichnen und ein zweidimensionales Array als Matrix. Dafür gibt es spezialisierte Erzeugungsmethoden:

In [None]:
# 1d-Array gefüllt mit Nullen
x = np.zeros(10)
print(x)

In [None]:
# 2d-Array gefüllt mit Nullen
x = np.zeros( (3,10) )
print(x)

In [None]:
# 1d-Array gefüllt mit Einsen
x = np.ones(7)
print(x)

In [None]:
# 2d-Array gefüllt mit Nullen
x = np.ones( (3,4) )
print(x)

In [None]:
# 2d-Array gefüllt mit einem konstanten Wert
x = np.full( (3,4), -17.7)
print(x)

In [None]:
# 1d-Array, das gleichmäßig zwischen start und stopp mit num Werten gefüllt wird
# im Beispiel: start = 1, stopp = 10, num = 25 
x = np.linspace(1, 10, 25)
print(x)

In [None]:
# 1d-Array, das bei start beginnt, step dazu addiert und bis kurz vor stopp geht
# im Beispiel: start = 1, stopp = 20, step = 2
x = np.arange(1, 20, 2)
print(x)

In [None]:
# 2d-Array mit gleichmäßig zwischen 0 und 1 verteilten Zufallszahlen
x = np.random.random( (2,3) )
print(x)

In [None]:
# 2d-Array mit normalverteilten Zufallszahlen 
x = np.random.normal(0, 1, (3,4) )
print(x)

In [None]:
# 2d-Array als Einheitsmatrix der Größe m x m, hier m = 5
x = np.eye(5)
print(x)

### Attribute von NumPy-Arrays

Damit wir besser verstehen, welche Attribute die NumPy-Arrays haben können, erzeugen wir uns zufällig drei NumPy-Arrays. Damit aber nicht bei jeder neuen Ausführung der Code-Zelle neue Zufallszahlen gezogen werden, fixieren wir den Seed des Zufallszahlengenerators (vereinfacht gesagt kommen jetzt immer die gleichen Zufallszahlen):


In [None]:
import numpy as np
       
np.random.seed(0)

x = np.random.randint(10, size=7)
y = np.random.randint(10, size=(2, 3))
z = np.random.randint(10, size=(2, 3, 4))

print('x = ')
print(x)

print('y = ')
print(y)

print('z = ')
print(z)

Bei den Listen haben wir eine Funktion kennengelernt, mit der die Anzahl der Elemente in der Liste bestimmt werden kann: `len()`. Listen sind eindimensional, aber NumPy-Arrays können mehrdimensional sein. Daher gibt es hier auch mehr Eigenschaften für die Beschreibung:

* Anzahl der Dimensionen: `.ndim`
* Größe der jeweiligen Dimension: `.shape`
* Gesamtgröße des Arrays: `.size`

In [None]:
print('x = ')
print(x)

print( x.ndim )
print( x.shape )
print( x.size )

In [None]:
print('y = ')
print(y)

print( y.ndim )
print( y.shape )
print( y.size )

In [None]:
print('z = ')
print(z)

print( z.ndim )
print( z.shape )
print( z.size )

### Zugriff (Indizierung) von NumPyy-Arrays

Der Zugriff bei eindimensionalen Arrays erfolgt genau wie bei Listen über den Operator `[]`. Auch hier wird ab 0 beginnend gezählt.

In [None]:
x = np.random.randint(10, size=7)
print(x)

drittes_element = x[2]
print( drittes_element )

Interessant wird es zu sehen, wie auf mehrdimensionale Arrays zugegriffen wird:

In [None]:
print('y = ')
print(y)

element = y[0,2]
print(element)

In [None]:
print('z = ')
print(z)

element = z[1,1,3]
print(element)

So kann man übrigens auch die Werte einzelner Elemente des Arrays ändern:

In [None]:
print('vorher z = ')
print(z)

z[1,1,3] = 777
print('nachher z = ', z)

### Slicing (Teilmengen eines Arrays)

Mit 

```python
x[start:stopp:schrittweite]
```

werden Teilmengen eines Arrays ausgewählt. Der Start- oder der Stoppwert darf auch weggelassen werden, dann wir einfach alles ab 0 oder alles bis zum Ende ausgewählt.

Achtung: Wieder geht es nur bis stopp - 1!

In [None]:
x = np.random.randint(100, size=10)
print('x: ', x)

auswahl1 = x[3:5]
print('Auswahl 1: ', auswahl1)

auswahl2 = x[ :5]
print('Auswahl 2: ', auswahl2)

auswahl3 = x[3: ]
print('Auswahl 3: ', auswahl3)

auswahl4 = x[3:10:2]
print('Auswahl 4: ', auswahl4)

Das geht auch genauso bei den mehrdimensionalen Arrays:

In [None]:
y = np.random.randint(100, size=(3,10))
print('y: ')
print(y)

auswahl1 = y[1, 3:5]
print('Auswahl 1: ', auswahl1)

auswahl2 = y[0, :5]
print('Auswahl 2: ', auswahl2)

auswahl3 = y[2, 3: ]
print('Auswahl 3: ', auswahl3)

auswahl4 = y[0:2, 3:10:2]
print('Auswahl 4: ')
print(auswahl4)

### Arrays verketten oder aufteilen

Sehr häufig passiert bei der Datenanalyse Folgendes: wir lesen einen Datensatz ein und möchten dann diesen Datensatz mit einem zweiten Datensatz gemeinsam analysieren. Dazu müssen wir die Datensätze vereinigen. Später werden wir maschinelle Lernverfahren verwenden. Um schon einmal einen Asublick auf säter zu geben, Datensätze werden normalerweise in einen Trainingsdatensatz und einen Testdatensatz aufgeteilt. Mit dem Trainingsdatensatz wird das maschinelle Lernverfahren trainiert und dann anschließend mit dem Testdatensatz überprüft, wie gut das gelernte ML-Verfahren funktioniert. Daher ist auch das Aufteilen von Daten win wichtiges Thema. 

Die Verkettung oder Vereinigung von NumPy-Arrays erfolgt mit der Funktion `np.concatenate`. Der einfachste Fall liegt vor, wenn wir zwei 1d-Arrays verketten möchten.

In [None]:
x1 = np.array([1, 2, 3, 4])
x2 = np.array([7, 8, 9])

x = np.concatenate( [x1, x2] )
print(x)

Dabei dürfen beliebig viele 1d-Arrays kombiniert werden, nicht nur zwei.

In [None]:
x1 = np.array([1, 2, 3, 4])
x2 = np.array([7, 8, 9])

x = np.concatenate( [x1, x2, x1, x1] )
print(x)

Mit zweidimensionalen Arrays funktioniert das Kommando `np.concatenate` auch, allerdings müssen wir darauf achten, ob wir entlang der Achse 0 oder entlang der Achse 1 die Arrays vereinigen möchten.

In [None]:
X1 = np.full( (3,4), 1 )
X2 = np.full( (2,4), 2 )

print(X1)
print(X2)

X = np.concatenate( [X1,X2], axis=0)
print(X)

Und hier ein Beispiel für eine Vereinigung entlang der Achse 1:

In [None]:
X1 = np.full( (3,4), 1 )
X2 = np.full( (3,2), 2 )

print(X1)
print(X2)

X = np.concatenate( [X1,X2], axis=1)
print(X)

Sozusagen das Gegenteil der Vereinigung, die Aufteilung oder in Informatik-Sprache der Split, erfolgt mit der Funktion `np.split(array, Liste mit Index)`. Diesmal beschränken wir uns auf 1d-Arrays (2d-Arrays können mit `np.hsplit()` und `np.vsplit()` geteilt werden, kommt selten vor). Wir teilen das Array an der Index-Position 4 auf, d.h. in der Liste zum Trennen ist nur ein Element, nämlich die 4:

In [None]:
x = np.linspace(1, 10, 9)
print('x: ', x)

x1, x2 = np.split(x, [4])
print(x1)
print(x2)

Aber wir können noch mehr Splits erzeugen:

In [None]:
x = np.linspace(1, 10, 9)
print('x: ', x)

x1, x2, x3 = np.split(x, [4, 6])
print(x1)
print(x2)
print(x3)

### Funktionen auf NumPy-Arrays anwenden

NumPy-Arrays ermöglichen die Verarbeitung mit den typischen mathematischen Funktionen und den üblichen Statistik-Größen. Schauen wir uns einfach ein paar Beispiele an: 

In [None]:
# erzeuge 11 x-Werte im Intervall [-2*pi, 2*pi]
x = np.linspace( -2*np.pi, 2*np.pi, 11)
print(x)

# Sinus-Funktion
y1 = np.sin(x)
print(y1)

# Kosinus-Funktion
y2 = np.cos(x)
print(y2)

# Exponentialfunktion
y3 = np.exp(x)
print(y3)

# Potenzfunktion, z.B. y = x hoch 5
y4 = np.power(x, 5)
print(y4)

In [None]:
# erzeuge 3x4-Matrix mit Zufallszahlen
X = np.random.random((3,4))
print(X)

# Summe über alle Elemente
s1 = np.sum(X)
print('s1', s1)

# Summe in Richtung Achse 0
s2 = np.sum(X, axis=0)
print('s2', s2)

# Summe in Richtung Achse 1
s3 = np.sum(X, axis=1)
print('s3', s3)

# Maximum über alle Elemente
max1 = np.max(X)
print('max1', max1)

# Maximum in Richtung Achse 0
max2 = np.sum(X, axis=0)
print('max2', max2)

# Maximum in Richtung Achse 1
max3 = np.sum(X, axis=1)
print('max3', max3)


# Übungsaufgaben

<div class="alert alert-block alert-success">
<b>Aufgabe 4.1: Datumsklasse </b> 

Implementieren Sie eine Klasse Datum. Diese Klasse speichert Tag, Monat und Jahr als Attribut. 
* Implementieren Sie Methoden, die diese Attribute verändern können. Dabei soll die Methode per Print()-Funktion warnen, wenn eine nicht zulässige Zahl verwendet wird und dann nicht die Änderung durchführen. 
* Implementieren Sie eine Methode `get_datum_deutsch()`, die das Datum als String nach dem Muster `TT.MM.JJJJ` zurückgibt, also z.B. '06.12.2021'.
* Implementieren Sie eine Methode `get_datum_britisch()`, die das Datum als String nach dem Muster `TT/MM/JJJJ` zurückgibt, also z.B. '06/12/2021'.
* Implementieren Sie eine Methode `get_datum_amerikanisch()`, die das Datum als String nach dem Muster `MM/TT/JJJJ` zurückgibt, also z.B. '12/06/2021'.

</div>

<div class="alert alert-block alert-success">
<b>Aufgabe 4.2: NumPy-Arrays </b> 

1. Erstellen Sie ein 5x5-Array, das mit Nullen gefüllt ist.

2. Erstellen Sie ein 3x3-Array, das an jeder Stelle mit $\pi$ gefüllt ist.

3. Erzeugen Sie ein 1d-Array mit den Zahlen von 1 bis 100.
    
4. Erzeugen Sie ein 1d-Array mit den Sinus-Werten an den Stellen von $-2\cdot\pi$ bis $2\cdot\pi$ mit eienr Schrittweite von $\frac{1}{4}\pi$.
    
5. Erzeugen Sie eine 30x10-Matrix, bei der in der 1, Zeile nur 1 stehen, in der 2. Zeile nur 2 usw.
    
6. Erzeugen Sie eine 30x5-Matrix, bei der auf der Diagonalen die Zahl $-100$ steht und ansonsten 0.
    
7. Bilden Sie die Vereinigung der beiden Arrays aus 5) und 6), indem Sie die beiden nebeneinander setzen.
    
8. Bilden Sie in jeder Spalte die Summe aller Elemente.
</div>