# Sortieren
Listen (und einige andere Datentypen - allerdings wird hier das Resultat der Sortierung immer als Liste geliefert) können auf einfache Weise sortiert werden. Damit wir Daten zum Sortieren haben, lesen wir wieder die bereits mehrfach verwendeten
Vornamen ein:

In [None]:
with open('data/vornamen/names_short.txt', encoding='utf-8') as fh:
    clean_names = [line.rstrip() for line in fh.readlines()]

## sort()
Um die Namen zu sortieren, wenden wir die `sort()`-Methode des `list`-Objekts an:

In [None]:
print(clean_names)
clean_names.sort()
print(clean_names)

Wir sehen, dass `sort()` eine Liste *in-place* sortiert, es werden die Positionen der Werte innerhalb der
Liste, also die Liste selbst verändert. Wenn wir das nicht wollen (etwa, weil wir die Originalreihenfolge noch brauchen), können wir alternativ die Funktion `sorted()` verwenden, die ein neue, sortierte Liste erzeugt und dabei die Elementreihenfolge der originalen Liste nicht verändert.

## sorted()
`sorted()` verhält sich weitgehend wie `sort()`, erzeugt aber ein neues Listen-Objekt mit den sortierten Einträgen.

(Da wir `clean_names` bereits sortiert haben, lesen wir die Daten zuerst noch einmal ein):

In [None]:
with open('data/vornamen/names_short.txt', encoding='utf-8') as fh:
    clean_names = [line.rstrip() for line in fh.readlines()]
sorted_names = sorted(clean_names)
print(clean_names[:10])
print(sorted_names[:10])

Die Methode `sort()` muss von dem Datentyp bereit gestellt werden, dessen Methode sie ist. Von den bisher vorgestellten Typen hat nur `list` eine solche Methode. Die Funktion `sorted()` dagegen kann auf alle `Iterables` angewendet werden. Hier zuerst ein Beispiel mit einem Set:

In [None]:
distinct_names = set(clean_names)
print(type(distinct_names))
sorted_distinct_names = sorted(distinct_names)
print(sorted_distinct_names[:10])
print(type(sorted_distinct_names))

Wie wir sehen, liefert `sorted()`  hier eine sortierte Liste der Elemente des Sets. Das von `sorted()` gelieferte Ergebnis ist unabhängig vom zu sortierenden Datentyp immer eine Liste.

Zur Illustration hier noch ein weiteres Beispiel mit einem Dictionary:

In [None]:
mydict = {'X': 4, 'A': 3}
mydict

In [None]:
sorted(mydict)

Hier werden also die Keys sortiert. Eine sortierte Liste von Values bekommen wir so:

In [None]:
sorted(mydict.values())

Über die Methode `items()` bekommen wir eine sortierte Liste von Tupeln, die jeweils den Key und den Value aus dem Dictionary enthalten:

In [None]:
sorted(mydict.items())

## Sortierreihenfolge umkehren

Sowohl `sort()` als auch `sorted()` kennen den Parameter `reverse`. Wird dieser auf `True` gesetzt, wird die
Sortierreihenfolge umgekehrt.

In [None]:
sorted(clean_names, reverse=True)

## Sortieren von komlexeren Daten

Solange eine Liste nur aus einzelnen Werten besteht, ist die Sortierung einfach. Aber was, wenn wie eine Liste von Listen oder eine Liste von Tupeln sortieren wollen? Erinnern wir uns an das Beispiel mit den Temperaturmessungen im Notebook zu den Listen:

In [None]:
temperatures = [
    (20, 35, 29),
    (17, 28, 24),
    (20, 32, 29),
    (17, 31, 28)
]
sorted(temperatures)

Hier sehen wir, dass Listen von Tupeln zuerst nach dem Wert der ersten Elements (17, 17, 20, 20) sortiert werden, dann als zusätzlichem Sortierkriterium nach dem Wert des zweiten Elements usw.

### Nicht nach dem ersten Element sortieren
Was aber, wenn wir nicht nach den Morgentemperaturen sortieren wollen, sondern nach den Mittagstemperaturen?

Hier wird die Sache etwas komplizierter. Sowohl `sort()` als auch `sorted()` kennen einen Parameter `key=`, der als Argument eine Funktion erwartet, die den Wert zurückgibt, nach dem sortiert werden soll. 

In [None]:
def get_noon_temperature(day_temperatures):
    "Return the noon temperature"
    return day_temperatures[1]

sorted(temperatures, key=get_noon_temperature)

Sie sehen, dass hier die Tagesmessungen nach den Mittagstemperaturen sortiert wurden: 28, 31, 32, 35.

Da diese Funktion in unserem Fall nichts anderes tut, als den zweiten Wert eines jeden Tupels zurückzugeben, brauchen wir keine eigene Funktion zu schreiben, sondern können uns mit einem Lambda-Ausdruck begnügen. 

#### Exkurs: Lamba-Ausdrücke

Ein Lambda-Ausdruck ist eine Art einfache und anonyme Funktion und hat diese Form:

~~~
lambda argument[, argument]: aktion
~~~

~~~
lambda mytuple: mytuple[1]
~~~

tut also nichts anderes, als ein Tupel (`mytuple`) an den Lambda-Ausdruck zu übergeben, der den zweiten Wert des Tupels zurückgibt.

Um die nach den Mittagstemperaturen zu sortieren, können wir die oben verwendete Funktion durch einen Lambda-Ausdruck ersetzen, der den zweiten Wert eines jeden Tupels zurückgibt:

In [None]:
sorted(temperatures, key=lambda temperature: temperature[1])

<div class="alert alert-block alert-info">
<b>Übung Sort-1</b>
<p>Sortieren Sie die Temperaturen nach den Abend-Werten!
</div>

<div class="alert alert-block alert-info">
<b>Übung Sort-2</b>
<p>Sortieren Sie die Temperaturen nach den Morgen-Werten als primäres Sortierkriterium und nach den Abendwerten als sekundäres Sortierkriterium! D.h.: Wenn zwei Morgentemperaturen gleich sind, sollend diese nach den Abendtemperaturen sortiert werden.</p>
<p>Hinweis: Lassen Sie dazu den Lambda-Ausdruck statt eines Integers ein Tupel aus  zwei Integern zurückliefern.
</div>

### Dictionaries sortieren

Erinnern wir uns an das Dictionary zum Zählen der Vornamen aus dem Notebook zu Dictionaries. Dieses enthält die Namen als Keys und die Zahl der Vorkommen des Namens als Value.

In [None]:
with open('data/vornamen/names_short.txt', encoding='utf-8') as fh:
    clean_names = [line.rstrip() for line in fh.readlines()]

name_counter = {}
for name in clean_names:
    name_counter[name] = name_counter.get(name, 0) + 1
print(name_counter)

Die Variable `name_counter` enthält jetzt für jeden Namen (Key), wie oft er vorkommt (Value).

Dictionaries können wir nicht direkt sortieren, weil Sie kein `sort()`-Methode haben. Wir können aber, wie bereits bekannt, die Keys und Values des Dictionaries als eine Art Liste von Tuples liefern lassen:

In [None]:
name_counter.items()

Mit dieser Information sollten sich die beiden nächsten Aufgabe einfach lösen lassen:

<div class="alert alert-block alert-info">
<b>Übung Sort-3</b>
<p>Sortieren Sie das Dictionary <tt>name_counter</tt> so, dass die Namen (und die Zahl des Vorkommens dieses Namens) sortiert nach den Namen ausgegeben werden.
Die Ausgabe soll so aussehen:
<pre>
Anna: 3
Anna-Lena: 1
Astrid: 1
Bianca: 1
...
</pre>
</div>

<div class="alert alert-block alert-info">
<b>Übung Sort-4</b>
<p>Sortieren Sie das Dictionary <tt>name_counter</tt> so, dass die Zahl des Vorkommens und die Namen ausgegeben werden. Die Sortierung soll dabei absteigend (höchster Wert zuerst) nach der Zahl der Vorkommen erfolgen.
Die Ausgabe soll so aussehen:
<pre>
4: Thomas
4: Manuel
3: Florian
3: Christoph
3: Anna
2: Verena
2: Simon
...
</pre>
</div>

## Vertiefende Literatur
Ich empfehle ausdrücklich, mindestens eine der folgenden Ressourcen zur Vertiefung zu lesen!

  * Das Sorting HOW TO (http://docs.python.org/3/howto/sorting.html)
  * Klein, Buch: Kapitel 11.10




## Lizenz

This notebook ist part of the course [Grundlagen der Programmierung](https://github.com/gvasold/gdp) held by [Gunter Vasold](https://online.uni-graz.at/kfu_online/wbForschungsportal.cbShowPortal?pPersonNr=51488) at Graz University 2017&thinsp;ff. 

<p>
    It is licensed under <a href="https://creativecommons.org/licenses/by-nc-sa/4.0">CC BY-NC-SA 4.0</a>
</p>

<table>
    <tr>
    <td>
        <img style="height:22px" 
             src="https://mirrors.creativecommons.org/presskit/icons/cc.svg?ref=chooser-v1"/></li>
    </td>
    <td>
    <img style="height:22px;"
         src="https://mirrors.creativecommons.org/presskit/icons/by.svg?ref=chooser-v1" /></li>
    </td>
    <td>
        <img style="height:22px;"
         src="https://mirrors.creativecommons.org/presskit/icons/nc.svg?ref=chooser-v1" /></li>
    </td>
    <td>
        <img style="height:22px;"
             src="https://mirrors.creativecommons.org/presskit/icons/sa.svg?ref=chooser-v1" /></li>
    </td>
</tr>
</table>