# Arrays in Python

Arrays in Python sind durch den Datentyp ```List``` implementiert. Dies ist für unsere Vorlesung etwas verwirrend, da wir meistens verkettete Listen meinen, wenn wir von Listen sprechen. Der Python Datentyp ```List``` ist aber ein Array im klassischen Sinn, welches Indexierung in konstanter Zeit erlaubt.  

#### Erzeugen von Arrays

Folgende Aufrufe illustrieren verschiedene Möglichkeiten ein Array in Python zu erzeugen.

Ein Array kann kreiert werden, indem die Elemente zwischen eckigen Klammern [] geschrieben werden. Hier wird ein leeres Array erstellt:

In [9]:
[]

[]

Und hier ein Array mit 4 Elementen:

In [10]:
["a", "list", "of", "strings"]

['a', 'list', 'of', 'strings']

Wenn wir ein Array der Grösse 10, welches alle Werte auf den Wert 0 initialisiert erzeugen wollen, schreiben wir das wie folgt.

In [11]:
[0] * 10

[0, 0, 0, 0, 0, 0, 0, 0, 0, 0]

#### Miniübung: 

Erzeugen Sie ein Array der Grösse 5, dessen Elemente leere Strings ("") sind.

#### Lösung:

In [48]:
[""] * 5

['', '', '', '', '']

#### Elemente lesen und setzen

Gegeben sei folgendes Testarray:

In [12]:
xs = ["a", "b", "c", "d"]

Lesen und setzen von Elementen machen wir mit dem [] Operator. Hier lesen wir das erste Element:

In [13]:
print(xs[0])

a


Python erlaubt auch negative Indices. Wenn der Index negativ ist, wird vom Ende gezählt:

In [14]:
print(xs[-1])

d


Für das Setzen eines Wertes weisen wir dem entsprechenden Arrayelement einfach einen Wert zu:

In [15]:
xs[2]="c'"

Wir sehen, dass hier wirklich der Wert verändert wurde. 

In [16]:
print(xs)

['a', 'b', "c'", 'd']


#### Länge eines Arrays

Die Länge eines Arrays kann mittels der Python Funktion ```len``` bestimmt werden. 

In [17]:
len(xs)

4

In [18]:
len([0]*100)

100

#### Finden eines Elements

Python erlaubt uns auch, nach Elementen in einem Array zu suchen. Die Syntax dafür ist jedoch etwas gewöhnungsbedürftig. Es wird der ```in``` Operator verwendet. 

Der Folgende Ausdruck ergibt ```true```, da das Element ```a``` in ```xs``` enthalten ist:

In [19]:
"a" in xs

True

Der folgende Ausdruck ergibt jedoch ```false```.

In [20]:
"I cannot be found " in xs

False

Mit der Methode ```index``` können wir uns auch die Position eines Elements im Array angeben lassen:

In [23]:
xs.index("b")

1

#### Miniübung: 
Was passiert, wenn das Element nicht vorhanden ist?

#### Lösung:
Einfach ausprobieren!

### Laufzeit 

Im Folgenden messen wir die Laufzeit der verschiedenen Operationen für Arrays von wachsender Grösse. Wir nutzen dazu die Funktion ```timeit``` aus dem gleichnamigen Modul ```timeit```, welche uns erlaubt eine Funktion ```n``` mal aufzurufen. Damit unser Experiment repräsentativ ist, wählen wir das Element zufällig aus. Dafür benötigen wir das Modul ```random```.

In [24]:
import timeit
import random

```timeit``` nimmt als erstes Argument eine Funktion ohne Argumente, welche von ```timeit``` ausgeführt wird, und ein Keyword-Argument ```number``` in dem die Anzahl Wiederholungen angegeben werden. 

Der folgende Aufruf führt also 10 Mal die Funktion aus, die "hallo" ausgibt und berechnet die Zeit, die dafür insgesamt benötigt wird. Dieses mehrmalige Durchführen eines Experiments ist wichtig, da die Laufzeit jedes einzelnen Aufrufs zufälligen Variationen, bedingt durch zum Beispiel die CPU Auslastung oder Betriebssysteminterne Funktionen, ausgesetzt ist. 

In [25]:
    
timeit.timeit(lambda: print("hallo"), number=10)

hallo
hallo
hallo
hallo
hallo
hallo
hallo
hallo
hallo
hallo


0.0005137999999931253

Der Aufruf ```lambda: print("hello")``` macht, dass ```print(hello)``` nicht direkt ausgeführt wird, sondern als Funktion an ```timeit``` übergeben wird, welche dann von ```timeit``` ausgeführt wird. Sie müssen die Details dieses Aufrufs nicht verstehen. 

Wir können ```timeit``` auch noch eine setup-Funktion übergeben, welche jeweils einmal am Anfang ausgeführt wird. 

In [26]:
timeit.timeit(lambda: print("hallo"), number=10, setup= lambda: print("called at the beginning"))

called at the beginning
hallo
hallo
hallo
hallo
hallo
hallo
hallo
hallo
hallo
hallo


0.0005426999999968984

Bei unserem ersten Test experimentieren wir mit der Laufzeit für den Arrayzugriff. Wir schreiben dafür die Funktion ```accessArray```, welches jeweils auf einen zufälligen Index im übergebenen Array ```a``` zugreift.

In [46]:
def accessArray(a):
    r = random.randint(0, len(a)-1)
    a[r] = 10
    

Nun können wir die Zugriffszeit für die Arrays der Grösse 10 bis $10^7$ testen:

In [47]:
for i in range(1, 8):
    array = [0]*(10**i)
    t = timeit.timeit(lambda: accessArray(array), number=100000)
    print("Zeit für Array der Länge " + str(len(array)) + " = " + str(t))

Zeit für Array der Länge 10 = 0.18555560000004334
Zeit für Array der Länge 100 = 0.15925909999987198
Zeit für Array der Länge 1000 = 0.18292399999972986
Zeit für Array der Länge 10000 = 0.18036510000001726
Zeit für Array der Länge 100000 = 0.18666669999947771
Zeit für Array der Länge 1000000 = 0.1888448999998218
Zeit für Array der Länge 10000000 = 0.21542260000023816


Wir sehen, dass die Zugriffszeit immer etwa gleich bleibt, obwohl die Länge des Arrays jeweils um Faktor 10 zunimmt. Die Laufzeit, um ein Element an beliebiger Stelle zu lesen oder zu schreiben, ist also konstant.

Nun testen wir die Operation ```find```:

In [42]:
def findInArray(a):
    c = "you wont find me" in a

In [44]:
for i in range(1, 7):
    array = [0]*(10**i)
    t = timeit.timeit(lambda: findInArray(array), number=1000)
    print("Zeit für Array der Länge " + str(len(array)) + " = " + str(t))

Zeit für Array der Länge 10 = 0.000468500000010863
Zeit für Array der Länge 100 = 0.0019905999999991764
Zeit für Array der Länge 1000 = 0.019256200000029366
Zeit für Array der Länge 10000 = 0.18080630000002884
Zeit für Array der Länge 100000 = 2.0138292999999976
Zeit für Array der Länge 1000000 = 19.75726880000002


Wir sehen, dass hier die Laufzeit ungefähr linear zunimmt. Auch dies entspricht unseren Erwartungen. 

#### Miniübung 

In diesem Experiment wurde das Element nie gefunden. Würde sich etwas ändern, wenn das Element gefunden wird? Experimentieren Sie!

#### Lösung:

Grundsätzlich nicht. Die Laufzeit bleibt linear, wir brauchen aber im Durchschnitt nur halb so viele Operationen. Es geht deshalb in der praxis etwas schneller. 

Zum Schluss wollen wir noch die Laufzeit der Operation ```len``` testen. Unsere Hypothesis ist, dass diese in konstanter Laufzeit berechnet werden kann, da wir einfach für jedes Array die Länge speichern können. Dass dies wirklich der Fall ist, zeigt folgendes Experiment. 

In [45]:
for i in range(1, 8):
    array = [0]*(10**i)
    t = timeit.timeit(lambda: len(array), number=100000)
    print("Zeit für Array der Länge " + str(len(array)) + " = " + str(t))

Zeit für Array der Länge 10 = 0.013351100000022598
Zeit für Array der Länge 100 = 0.011748799999963921
Zeit für Array der Länge 1000 = 0.016889200000036908
Zeit für Array der Länge 10000 = 0.017001000000050226
Zeit für Array der Länge 100000 = 0.01399050000003399
Zeit für Array der Länge 1000000 = 0.016518499999961023
Zeit für Array der Länge 10000000 = 0.01589539999997669
