# for - Schleifen

Häufig ist es nötig, mit allen Einträgen einer Liste oder eines Vektors
eine Operation vorzunehmen. Dafür sind so genannte `for`-Schleifen
geeignet. Ist `liste` eine Liste, so führt

    for x in liste:
       ....
       ....
       ....

eine Schleife über alle Elemente `x` der Liste `liste` aus.

Ein Beispiel mit der Liste `kohl` vom letzten Notebook, zusammen mit der Ausgabe, die es hervorbringt:

In [None]:
kohl = ['Weißkohl', 'Rotkohl', 'Wirsing']

for sorte in kohl:
    print(sorte + " ist wohlschmeckend und gesund")

In [None]:
sorte

In [None]:
del(sorte) #damit laesst sich die variable sorte loeschen

In [None]:
sorte

Eine typische Form der for-Schleife zählt durch. Das lässt sich besonders einfach mit `range` bewerkstelligen.

In [None]:
for i in range(0, 10):
    print(i)

In [None]:
for a in 1, 2, 3, 5, 7:  #so gehts aber auch
    print(a**3)

Hier wird die for-Schleife mit einer if-Abfrage kombiniert.

In [None]:
for x in [1, 2.323, 1+1j, 'Katze']:
    if isinstance(x, complex):
        print(x, "gehört zum Datentyp 'complex'")
    if isinstance(x, int):
        print(x, "gehört zum Datentyp 'int'")
    else: print(x, "ist weder 'complex' noch 'int'")

### Worüber kann man eine  for-Schleife durchführen ?

Über Listen, Tupel, Strings (als Ketten von Zeichen), range-Objekte und noch allerlei. Der Idee nach taugt alles, was man durchzählen kann. In Python ist das dadurch gegeben, dass das Objekt einen Zufgriff auf Elemente durch ihren Index (`[...]`) erlaubt oder einen **Iterator** zur Verfügung stellt. Dabei handelt es sich um ein Objekt, das jeweils das nächste Element in der Aufzählung liefert und weiß, wann es fertig ist.

In [None]:
#mit der for-Schleife laesst sich auch ueber die Zeichen in einem String iterieren.
l = []
for buchstabe in 'Maus':
    print(buchstabe)
    l.append(10*buchstabe)
    print(10*buchstabe)

In [None]:
l

Im Folgenden wird mithilfe einer for-Schleife unter einer gewissen Bedingung ein Dictionary erstellt. Effektiv wird nun im Dicitonary angegeben, wie oft ein Wort in der Wortliste vorkommt. 

In [None]:
alle_woerter = ["Katze", "Katze", "Hand"]

wb = {}
for wort in alle_woerter:
    if wort in wb:
        wb[wort] += 1
    else:
        wb[wort] = 1
        
print(wb)

Wenn wir eine Schleife mit einer leeren Liste definieren, so wird der
Schleifenblock nie durchgeführt.

Indem wir die das `range`-Objekt (Python 3) aller ganzen Zahlen $n$ mit $a\leq n<b$
verwenden, können wir eine Schleife über diese Zahlen durchführen:


In [None]:
for i in range(10):
    print(i, i*i)
for i in range(5):
    print('__________________')
    print(i)
    for j in range(4):
        print(j)

In [None]:
for i in range(2,17):
    print (i)

In [None]:
for i in range(17,2,-1):
    print(i)

### break, continue

Wie bei while-Schleifen  gibt es die Möglichkeit, mit `continue` direkt zum nächsten Schleifendurchlauf zu springen und mit `break` die Schleife zu beenden.

In [None]:
# Was ist die Ausgabe dieses Codes?

for i in range(100):
    if i % 2 == 0:
        continue
    print(i)
    if i % 17 == 0:
        break

**Aufgabe:** Suchen Sie unter den Zahlen n$\in$1,..,10000 alle, für die $n^2+1$ durch 17 und $n^2-1$ durch 19 teilbar sind. Verwenden Sie dazu eine for-Schleife. Modifizieren Sie das Programm, so dass es nur die erste dieser Zahlen ausgibt.

### Beispiel: Einlesen einer Datentabelle in eine Liste

Diese Daten sind ein Auszug aus den vom statistischen Bundesamt zur Verfügung gestellten Daten
des Mikrozensus 2002 (nur vier von vielen Spalten).

In [None]:
# Zeige die ersten 20 Zeilen der Datei
l = []
datei = open("algebuei.csv", "r")
i = 0
for zeile in datei:
    i = i+1
    print(zeile)
    l.append(zeile)
    if i == 20:
        break
datei.close()

In [None]:
# Lies die ganze Datei
raw_input = []
datei = open("algebuei.csv", "r")
for zeile in datei:
    raw_input.append(zeile)
datei.close()

In [None]:
print(type(raw_input[0]))

In [None]:
processed_data = []
for index in range(len(raw_input)):
    processed_data.append(raw_input[index][:-1].split(";"))

In [None]:
for index in range(20):  #len(processed_data)):
    print(processed_data[index][1])

### Aufgabe zum gemeinsamen Bearbeiten

Wie viele Einträge der Tabelle haben das als "1" codierte Geschlecht?

### Aufgabe

Wandeln Sie diese Datei in eine Liste von Listen von Zahlen um.  Anschließend können Sie die Daten untersuchen.  Mittleres Einkommen in Abhängigkeit von Bundesland oder Geschlecht oder Alter?  



## List comprehensions (bitte beachten: praktisch!)
Um aus Listen neue Listen zu definieren gibt es so genannte <span>*list
comprehensions*</span>:
 
Abstrakt sieht die Syntax so aus:

    neue_liste=[funktion(element) for element in alte_liste if bedingung(element)]
    
Der Ausdruck ist strukturiert durch `for ... in  ... if`, dabei kann `if` entfallen. 

In [None]:
l1 = [2, 3, 4, 5, 9, 100]

l2 = []
for x in l1:
    if x < 10:
        l2.append(x**2)


l2 = [a*a for a in l1 if a < 10]

print(l2)

Die neue Liste besteht also aus den Quadraten $a*a$ aller Listenelemente
$a$ von $l1$, die die Bedingung $a<10$ erfüllen.

### Aufgabe

Stellen Sie mit Hilfe einer  *list comprehension* eine Liste der ungeraden Zahlen kleiner 100 her, die weder durch 3, noch durch 5 teilbar sind.

------------------------------------------

 # Generators, Iterators, Iterables
 

## range und list(range(...))

Was ist eigentlich  `range(10)` in Python 3? Erst die Funktion `list` macht daraus eine Liste.
`range(10)` hat einen besonderen `range`-Datentyp, der ermöglicht, wie mit einer
Liste umzugehen, ohne sie tatsächlich speichern zu müssen. Das ist zuweilen
sehr nützlich.

In [None]:
l = range(0, 10)

In [None]:
l

In [None]:
type(l)

In [None]:
list(l)



**Aufgabe:** Erzeugen Sie eine Liste, die alle durch 13 teilbaren natürlichen Zahlen,
die kleiner als 10000 sind, enthält. Sehen Sie sich die ersten 100
und die letzten 100 Elemente dieser Liste an.

Der folgende Ausdruck erzeugt in Python 3 eine Liste im Speicher:

In [None]:
l = list(range(1000))

Daher ist `range(10000000000)` auf den meisten Rechnern sinnlos, da der Speicher so eine Liste nicht aufnehmen kann.
Wenn wir aber nur `for i in range(10000000000):` durchführen wollen, brauchen wir die Liste gar nicht, sondern lediglich eine Struktur, die die Listenelemente generieren kann. In Python 3 liefert `range` tatsächlich nur so eine Struktur, in Python 2 leistet das `xrange`.

An dieser Stelle werden die Details etwas verwirrend, da es verschiedene Arten von erzeugenden Objekten gibt, über denen eine Python-For-Schleife iterieren kann: **Generatoren, Iteratoren, Iterable**.  Fürs erste müssen wir uns um die Implementierung nicht kümmern, um eine for-Schleife aufschreiben zu können.

In [None]:
for i in range(10000000000):
    pass

# Kein Problem, dauert aber eine Weile

## generator comprehensions statt list comprehensions

Wenn wir nun aus einer Liste oder einem Generator eine neue Liste durch `list comprehension` bauen, gilt dasselbe: Wir schreiben möglicherweise den Speicher voll, ohne das zu wollen. Immer, wenn wir nicht die Liste, sondern lediglich den Generator brauchen, sollten wir auch nur einen solchen erzeugen. So geht das:

In [None]:
odds_1 = [i for i in range(1000) if i%2==1] 
# erzeugt erst die Liste range(1000), dann die Liste odds_1

In [None]:
odds_2 = (i for i in range(1000) if i%2==1)
# alles mit Generatoren

Für Schleifen ist ein Generator ebenso gut wie eine Liste, bzw. besser, weil er weniger Ressourcen verbraucht. Wenn wir allerdings auf einzelne Elemente zugreifen wollen oder etwas die Zahle der Elemente (`len`) wissen wollen, brauchen wir eben doch eine Liste.

In [None]:
len(odds_1)

In [None]:
odds_1[2]

In [None]:
len(odds_2)

In [None]:
odds_2[2]

Außer for-Schleifen gibt es noch andere Funktionen, etwa `sum`, `map`, `reduce`, für die alle Elemente gebraucht werden, funktionieren mit Generatoren geradeso gut wie mit Listen.  Zeit- und Speicherverbrauch sind verschieden, im Einzelfall wäre eine Entscheidung zu treffen, welche Struktur  jeweils besser ist.

In [None]:
sum(odds_1)

In [None]:
sum(odds_2)

In [None]:
sum(odds_2)

Ei, was ist denn da passiert? Beim ersten Mal ergibt sich 250000, beim zweiten 0.

Die Antwort ist nicht ganz offensichtlich. Das Generator-Objekt hat eine Methode `next()`, die jeweils das nächste Element liefert.  Wenn alle Elemente ausgegeben wurde, verursacht `next()` einen besonderen Fehler, der als Schleifenende interpretiert wird. **Der Generator ist verbraucht.**

**Also:** Generatoren sollten immer nur zur **Einmalverwendung** benutzt werden, also gerade nicht wie im obigen Beispiel.  Es ist selten gut, einen Generator in einer Variable zu speichern, sondern meistens besser, den Generator direkt in einer for-Schleife oder einem anderen Ausdruck, wo er gebraucht wird, zu definieren.


In [None]:
%timeit sum([i for i in range(10000000) if i%2==1]) #mit %timeit wird die Zeit gemessen die der Prozess braucht

In [None]:
%timeit sum(( i for i in range(10000000) if i%2==1))

---------------------------------
# Nützliche Generatoren aus anderen 'Iterablen'

Besonders nützlich sind eine Reihe von Generatoren, die aus anderen iterierbaren Objekten (Listen, Tupeln, Strings, Generatoren) neue machen.

##  1. enumerate

Der pythonische Stil von for-Schleifen hat viel für sich. Die for-Schleife iteriert etwa über den Elementen einer Liste, ohne dass man mit deren Indices herumrechnen müsste. Das ist lesbarer und weniger fehlerträchtig.

Was aber tun, wenn man zu dem Eintrag in einer Liste auch den Index braucht? Die einfachste Idee wäre, doch über den Indices `range(0,len(l))` zu iterieren und mit dem Index auf die Listenelemente zuzugreifen. Dann aber wird der Code wieder schwerer lesbar und weniger pythonisch. 

Dafür gibt es `enumerate`. `enumerate(l)` liefert beispielsweise für eine Liste `l` (oder ein anderes iterables Objekt) in jedem Durchlauf ein Tupel `(index, element)`, also etwas `(0,l[0])`, dann `(1,l[1])` etc.

In [None]:
alle_kuchen = ['Apfelkuchen','Streuselkuchen', 'Pflaumenkuchen']

for kuchen in alle_kuchen:
    print(kuchen)

In [None]:
for i, kuchen in enumerate(alle_kuchen):
    print('%i. %s'%(i+1,kuchen))

## 2. zip

Eine andere häufige Situation besteht darin, mehrere Listen gleicher Länge zu haben. Ich möchte nun eine
Operation mit den ersten Elementen aller Listen, anschließend mit den zweiten, etc. Auch hier wäre eine einfache, aber eher unschöne Lösung, über die Indices zu iterieren und damit auf alle Listen zuzugreifen.

`zip(l1,l2,...)` liefert nun für zwei oder mehr Listen einen Generator, der beim ersten Mal das Tupel aller ersten Elemente, beim zweite Mal das Tupel aller zweiten Elemente etc. liefert. 

In [None]:
alle_getraenke = ['Tee', 'Kaffee', 'Wasser']

for kuchen, getraenk in zip(alle_kuchen, alle_getraenke):
    print(kuchen, ' mit ', getraenk)

## 3. Noch mehr davon: itertools

In dem Paket der Standardbibliothek `itertools` gibt es noch mehr nützliche Generatoren. 
Für Python 2 finden Sie die offizielle Dokumentation hier:

https://docs.python.org/2/library/itertools.html

Viele davon sind nützlich, nur einen will ich an dieser Stelle vorführen `product`. Er produziert einen Generator für das kartesische  Produkt zweier Mengen, also die Menge der Tupel, wobei das erste Element des Tupels aus der ersten Menge und das zweite aus der zweiten stammt.

In [None]:
from itertools import product

In [None]:

for kuchen, getraenk in product(alle_kuchen,alle_getraenke):
    print(kuchen,'mit', getraenk)


**Aufgabe:** Angenommen, wir haben noch zwei Listen

    kuchenpreise = [2,2.5,4]
    getraenkepreise = [1.5,2.5,2]
    
Verwenden Sie zip un eine Liste der Preise der Getränke und eine Liste der Preise der Kuchen auszugeben.
Verwenden Sie zip und product, um eine Liste aller Kombinationen mit den Gesamtpreisen auszugeben.


In [None]:
kuchenpreise = [2,2.5,4]
getraenkepreise = [1.5,2.5,2]

In [None]:
for (kpreis, gpreis), (kuchen, getraenk) in zip(product(kuchenpreise, getraenkepreise),product(alle_kuchen,alle_getraenke)):
    print(kuchen,'mit', getraenk, ' kostet ', kpreis+gpreis)

# Etwas mehr zu Generatoren

Ihr könnte auch selbst völlig neue Objekte definieren, die Generatoren sind.  Wer sich dafür interessiert, soll das in der Python-Dokumentation nachlesen.

Nur ein Beispiel:

In [None]:
def ewige_eingabe():
    while True:
        s = input("Bitte geben Sie was ein... (q zum Beenden)! ")
        if s=='q':
            break
        yield s

In [None]:
for s in ewige_eingabe():
    print("Sie haben gesagt: ",s) 

## Iterable und Iteratoren

Das lässt sich erst richtig nach der Einführung von Klassen erklären.

Iterable Objekte haben eine Methode `__iter__`, die eine Iterator liefert. Der Iterator wiederum ist ein spezieller Generator, der nacheinander bei Aufruf der Methode `next` die Elemente des iterablen Objekts liefert.

Eine for-Schleife über eine Liste funktioniert intern so. Erst wird ein iterator zur Liste erzeugt, dann solange
der Wert von `next()` in die Schleifenvariable geschrieben, bis es die Exception `StopIteration` gibt.

Sehen wir uns das mal an:

In [None]:
l = [2,4,5,7]  # eine Liste

In [None]:
iterator = l.__iter__()  # ein Iterator zu der Liste

In [None]:
next(iterator)

In [None]:
next(iterator)

In [None]:
next(iterator)

In [None]:
next(iterator)

In [None]:
next(iterator)

In [None]:
type(iterator)