# Arrays in Python

Arrays in Python sind durch den Datentyp ```List``` implementiert. Dies ist für unsere Vorlesung etwas verwirrend, da wir wenn meistens verkettete Listen meinen, wenn wir von Listen sprechen. Der Python Datentyp ```List``` ist aber ein Array im klassischen Sinn, welches Indexierung in Konstanter Zeit erlaubt.  

#### Erzeugen von Arrays

Folgende Aufrufe illustrieren verschiedene Möglichkeiten ein Array in Python zu erzeugen.

Ein Array kann kreiert werden, indem die Elemente zwischen eckigen Klammern [] geschrieben werden. Hier wird ein leeres Array erstellt:

In [None]:
[]

Und hier ein Array mit 4 Elementen:

In [None]:
["a", "list", "of", "strings"]

Wenn wir ein Array der Grösse 10, welches alle Werte auf den Wert 0 initialisiert erzeugen wollen, schreiben wir das wie folgt.

In [2]:
[0] * 10

[0, 0, 0, 0, 0, 0, 0, 0, 0, 0]

*Übung: Erzeugen Sie ein Array der Grösse 5, dessen Elemente Leere String ("") sind*

#### Elemente lesen und setzten

Gegeben folgendes Testarray:

In [6]:
xs = ["a", "b", "c", "d"]

Lesen und setzen von Elementen machen wir mit dem [] Operator. Hier lesen wir das erste Element:

In [7]:
print(xs[0])

a


Python erlaubt auch negative Indices. Wenn der Index negativ ist, wird vom Ende gezählt:

In [8]:
print(xs[-1])

d


Für das setzen eines Wertes, weisen wir dem entsprechenden Arrayelement einfach einen Wert zu:

In [9]:
xs[2]="c'"

Wir sehen, dass hier wirklich der Wert verändert wurde. 

In [10]:
print(xs)

['a', 'b', "c'", 'd']


#### Länge eines Arrays

Die Länge eines Arrays kann mittels der Python Funktion ```len``` bestimmt werden. 

In [12]:
len(xs)

4

In [15]:
len([0]*100)

100

#### Finden eines Elements

Python erlaubt uns auch, nach Elementen in einem Array zu suchen. Die Syntax dafür ist jedoch etwas gewöhnungsbedürftig. Es wird der ```in``` Operator verwendet. 

Der Folgende Ausdruck ergibt ```true```, da das Element ```a``` in ```xs``` enthalten ist:

In [20]:
"a" in xs

True

Der folgende Ausdruck ergibt jedoch ```false```.

In [21]:
"I cannot be found " in xs

False

Mit der Methode ```index``` können wir uns auch die Position eines Elements im Array angeben lassen:

In [28]:
xs.index("b")

1

*Übung: Was passiert, wenn das Element nicht vorhanden ist?*

### Laufzeit 

Im folgenden messen wir die Laufzeit der verschiedenen Operationen für Arrays von wachsender Grösse. Wir nutzen dazu die Funktion ```timeit``` aus dem gleichnamigen Modul ```timeit```, welche uns erlaubt eine Funktion ```n``` mal aufzurufen. Damit unser Experiment repräsentativ ist, wählen wir das Element zufällig aus. Dafür benötigen wir das Modul ```random```.

In [29]:
import timeit
import random

```timeit```nimmt als erstes Argument eine funktion ohne Argumente, welche Ausgeführt wird, und ein Keyword-Argument ```number``` in dem die Anzahl Wiederholungen angegeben werden. Der folgende Aufruf führt also 10 mal die Funktion aus, die "hallo" ausgibt und berechnet die Zeit die dafür durchschnittlich benötigt wird. Dieses mehrmalige Durchführen eines Experiments ist wichtig, da die Laufzeit jedes einzelnen Aufrufs zufälligen Variationen, bedingt durch zum Beispiel die CPU Auslastung oder Betriebssysteminterne Funktionen, ausgesetzt ist. 

In [43]:
    
timeit.timeit(lambda: print("hallo"), number=10)

hallo
hallo
hallo
hallo
hallo
hallo
hallo
hallo
hallo
hallo


0.00037879999945289455

Wir setzen uns nun Testfunktionen auf um die Experimente mit den Arrays durchzuführen.

Als erstes schreiben wir eine Hilfsfunktion, welche uns 7 Arrays kreiert und zurückgibt. Das erste Array hat die Grösse 10 und das letzte die Grösse $10^7$.

In [39]:
def createArrays():
    return [ [0]*(10**i) for i in range(1, 8)]

Bei unserem ersten Test experimentieren wir mit der Laufzeit für den Arrayzugriff. Wir schreiben dafür die Funktion ```accessArray```, welches jeweils auf einen zufälligen Index im übergebenen Array ```a``` zugreift.

In [40]:
def accessArray(a):
    r = random.randint(0, len(a)-1)
    a[r] = 10
    

Nun können wir die Zugriffszeit für die Arrays der Grösse 10 bis $10^7$ testen:

In [48]:
for array in createArrays():
    t = timeit.timeit(lambda: accessArray(array), number=100000)
    print("Zeit für Array der Länge " + str(len(array)) + " = " + str(t))

Zeit für Array der Länge 10 = 0.1334937000010541
Zeit für Array der Länge 100 = 0.11824180000076012
Zeit für Array der Länge 1000 = 0.13340229999994335
Zeit für Array der Länge 10000 = 0.134355999998661
Zeit für Array der Länge 100000 = 0.13474929999938468
Zeit für Array der Länge 1000000 = 0.12925600000016857
Zeit für Array der Länge 10000000 = 0.1504967000000761


Wir sehen, dass die Zugriffszeit immer etwa gleich bleibt, obwohl die Länge des Arrays jeweils um Faktor 10 zunimmt. Die Laufzeit um ein Element an beliebiger Stelle zu lesen oder zu schreiben ist also konstant.

Nun testen wir die Operation ```find```:

In [51]:
def findInArray(a):
   c = "you wont find me" in a

In [55]:
for array in createArrays():
    t = timeit.timeit(lambda: findInArray(array), number=1000)
    print("Zeit für Array der Länge " + str(len(array)) + " = " + str(t))

Zeit für Array der Länge 10 = 0.0006816999994043726
Zeit für Array der Länge 100 = 0.002113200000167126
Zeit für Array der Länge 1000 = 0.0162319999999454
Zeit für Array der Länge 10000 = 0.1378740000000107
Zeit für Array der Länge 100000 = 1.3418303999987984
Zeit für Array der Länge 1000000 = 13.501658599998336
Zeit für Array der Länge 10000000 = 138.8809749000011


Wir sehen, dass hier die Laufzeit ungefähr linear zunimmt. Auch dies entspricht unseren Erwartungen. 

*Übung: In diesem Experiment wurde das Element nie gefunden. Würde sich etwas ändern, wenn das Element gefunden wird? Experimentieren Sie!*

Zum Schluss wollen wir noch die Laufzeit der Operation ```len``` testen. Unsere Hypothesis ist, dass diese in konstanter Laufzeit berechnet werden kann, da wir einfach für jedes Array die Länge speichern können. Das dies wirklich der Fall ist zeigt folgendes Experiment. 

In [58]:
for array in createArrays():
    t = timeit.timeit(lambda: len(array), number=100000)
    print("Zeit für Array der Länge " + str(len(array)) + " = " + str(t))

Zeit für Array der Länge 10 = 0.017624500000238186
Zeit für Array der Länge 100 = 0.013685600000826526
Zeit für Array der Länge 1000 = 0.013178100000004633
Zeit für Array der Länge 10000 = 0.012543900000309804
Zeit für Array der Länge 100000 = 0.0131279999986873
Zeit für Array der Länge 1000000 = 0.014077899999392685
Zeit für Array der Länge 10000000 = 0.018788699999277014
