# Arrays in Python

Arrays in Python sind durch den Datentyp ```List``` implementiert. Dies ist für unsere Vorlesung etwas verwirrend, da wir meistens verkettete Listen meinen, wenn wir von Listen sprechen. Der Python Datentyp ```List``` ist aber ein Array im klassischen Sinn, welches Indexierung in konstanter Zeit erlaubt.  

#### Erzeugen von Arrays

Folgende Aufrufe illustrieren verschiedene Möglichkeiten ein Array in Python zu erzeugen.

Ein Array kann kreiert werden, indem die Elemente zwischen eckigen Klammern [] geschrieben werden. Hier wird ein leeres Array erstellt:

In [None]:
[]

Und hier ein Array mit 4 Elementen:

In [None]:
["a", "list", "of", "strings"]

Wenn wir ein Array der Grösse 10, welches alle Werte auf den Wert 0 initialisiert erzeugen wollen, schreiben wir das wie folgt.

In [None]:
[0] * 10

*Übung: Erzeugen Sie ein Array der Grösse 5, dessen Elemente leere Strings ("") sind*

#### Elemente lesen und setzen

Gegeben sei folgendes Testarray:

In [None]:
xs = ["a", "b", "c", "d"]

Lesen und setzen von Elementen machen wir mit dem [] Operator. Hier lesen wir das erste Element:

In [None]:
print(xs[0])

Python erlaubt auch negative Indices. Wenn der Index negativ ist, wird vom Ende gezählt:

In [None]:
print(xs[-1])

Für das Setzen eines Wertes weisen wir dem entsprechenden Arrayelement einfach einen Wert zu:

In [None]:
xs[2]="c'"

Wir sehen, dass hier wirklich der Wert verändert wurde. 

In [None]:
print(xs)

#### Länge eines Arrays

Die Länge eines Arrays kann mittels der Python Funktion ```len``` bestimmt werden. 

In [None]:
len(xs)

In [None]:
len([0]*100)

#### Finden eines Elements

Python erlaubt uns auch, nach Elementen in einem Array zu suchen. Die Syntax dafür ist jedoch etwas gewöhnungsbedürftig. Es wird der ```in``` Operator verwendet. 

Der Folgende Ausdruck ergibt ```true```, da das Element ```a``` in ```xs``` enthalten ist:

In [None]:
"a" in xs

Der folgende Ausdruck ergibt jedoch ```false```.

In [None]:
"I cannot be found " in xs

Mit der Methode ```index``` können wir uns auch die Position eines Elements im Array angeben lassen:

In [None]:
xs.index("b")

*Übung: Was passiert, wenn das Element nicht vorhanden ist?*

### Laufzeit 

Im Folgenden messen wir die Laufzeit der verschiedenen Operationen für Arrays von wachsender Grösse. Wir nutzen dazu die Funktion ```timeit``` aus dem gleichnamigen Modul ```timeit```, welche uns erlaubt eine Funktion ```n``` mal aufzurufen. Damit unser Experiment repräsentativ ist, wählen wir das Element zufällig aus. Dafür benötigen wir das Modul ```random```.

In [None]:
import timeit
import random

```timeit``` nimmt als erstes Argument eine Funktion ohne Argumente, welche von ```timeit``` ausgeführt wird, und ein Keyword-Argument ```number``` in dem die Anzahl Wiederholungen angegeben werden. 

Der folgende Aufruf führt also 10 Mal die Funktion aus, die "hallo" ausgibt und berechnet die Zeit, die dafür insgesamt benötigt wird. Dieses mehrmalige Durchführen eines Experiments ist wichtig, da die Laufzeit jedes einzelnen Aufrufs zufälligen Variationen, bedingt durch zum Beispiel die CPU Auslastung oder Betriebssysteminterne Funktionen, ausgesetzt ist. 

In [None]:
    
timeit.timeit(lambda: print("hallo"), number=10)

Der Aufruf ```lambda: print("hello")``` macht, dass ```print(hello)``` nicht direkt ausgeführt wird, sondern als Funktion an ```timeit``` übergeben wird, welche dann von ```timeit``` ausgeführt wird. Sie müssen die Details dieses Aufrufs nicht verstehen. 

Wir können ```timeit``` auch noch eine setup-Funktion übergeben, welche jeweils einmal am Anfang ausgeführt wird. 

In [None]:
timeit.timeit(lambda: print("hallo"), number=10, setup= lambda: print("called at the beginning"))

Bei unserem ersten Test experimentieren wir mit der Laufzeit für den Arrayzugriff. Wir schreiben dafür die Funktion ```accessArray```, welches jeweils auf einen zufälligen Index im übergebenen Array ```a``` zugreift.

In [None]:
def accessArray(a):
    r = random.randint(0, len(a)-1)
    a[r] = 10
    

Nun können wir die Zugriffszeit für die Arrays der Grösse 10 bis $10^7$ testen:

In [None]:
for i in range(1, 8):
    array = [0]*(10**i)
    t = timeit.timeit(lambda: accessArray(array), number=100000)
    print("Zeit für Array der Länge " + str(len(array)) + " = " + str(t))

Wir sehen, dass die Zugriffszeit immer etwa gleich bleibt, obwohl die Länge des Arrays jeweils um Faktor 10 zunimmt. Die Laufzeit, um ein Element an beliebiger Stelle zu lesen oder zu schreiben, ist also konstant.

Nun testen wir die Operation ```find```:

In [None]:
def findInArray(a):
   c = "you wont find me" in a

In [None]:
for i in range(1, 7):
    array = [0]*(10**i)
    t = timeit.timeit(lambda: findInArray(array), number=1000)
    print("Zeit für Array der Länge " + str(len(array)) + " = " + str(t))

Wir sehen, dass hier die Laufzeit ungefähr linear zunimmt. Auch dies entspricht unseren Erwartungen. 

*Übung: In diesem Experiment wurde das Element nie gefunden. Würde sich etwas ändern, wenn das Element gefunden wird? Experimentieren Sie!*

Zum Schluss wollen wir noch die Laufzeit der Operation ```len``` testen. Unsere Hypothesis ist, dass diese in konstanter Laufzeit berechnet werden kann, da wir einfach für jedes Array die Länge speichern können. Dass dies wirklich der Fall ist, zeigt folgendes Experiment. 

In [None]:
for i in range(1, 8):
    array = [0]*(10**i)
    t = timeit.timeit(lambda: len(array), number=100000)
    print("Zeit für Array der Länge " + str(len(array)) + " = " + str(t))