# Passwörter

In diesem Teil beschäftigen wir uns mit Passwörtern. Zum einen geht es darum
wie Passwörter auf einem Webserver gespeichert werden. Wir schauen uns auch an
wie diese Passwörter gehackt werden können. Wir schauen uns dann noch sicherere
Methoden an um Passwörter zu speichern. Ganz am Ende schauen wir uns noch an
was ein sicheres Passwort ausmacht.

## Verschlüsselung

Schauen Sie sich zum Einstieg das folgende Video zu Verschlüsselung an: [https://www.youtube.com/watch?v=qpsCbQbbXk0](https://www.youtube.com/watch?v=qpsCbQbbXk0)

Starten wir mit einer ganz einfachen Verschlüsselung, die sogenannte
[Caesar-Verschlüsselung](https://de.wikipedia.org/wiki/Caesar-Verschl%C3%BCsselung).
Bei der Ceasar-Verschlüsselung wird das ganze Alphabet einfach um einen Teil
verschoben. In der nächsten Zelle finden Sie Code der Ihnen ein UI erzeugt mit
dem Sie die Ceasar-Verschlüsselung ausprobieren können.


In [None]:
import ipywidgets as wdg

html = wdg.HTML("<h1>Ceasar-Verschlüsselung</h1>")
in_text = wdg.Text(description="Text zum Verschlüsseln")
encode_shift = wdg.IntSlider(10, description="Verschiebung: ", min=0, max=255)
out_text = wdg.HTML("")
layout = wdg.VBox([html, in_text, encode_shift, out_text])

def ceasar_encrypt(text, shift=10):
    text = text.lower()
    res = ""
    for c in text:
        if ord(c) >= 97 and ord(c) <= 122:
            sc = ord(c) - 97
            sc = (sc + shift) % 26
            sc = sc + 97
        else:
            sc = ord(c)
        res += chr(sc)
    return res

def update(args):
    out_text.value = ceasar_encrypt(in_text.value, encode_shift.value)
    
in_text.observe(update)
encode_shift.observe(update)

layout

## Toll aber unsicher

Man kann sich einfach vorstellen das dieses Verfahren in alten Zeiten recht
praktisch war. Sie sehen aber bereits selbst das man das Verfahren sehr einfach
umkehren kann. Es braucht zwar ein wenig Arbeit um jeden Buchstaben im Alphabet
zu suchen und ihn um die richtige Ziffer zu verschieben, es kann aber noch ohne
Probleme von Hand gemacht werden. Das Problem ist noch die Verschiebungsziffer
zu erraten, aber gerade mit Computern geht das extrem schnell. Sie können das
ja mal als freiwillige Aufgabe mit Ihren aktuellen Programmierkenntnissen
versuchen.

**Aufgabe:**
> Entschlüsseln Sie den folgenden Text:
>
> `vsk akl waf kmhwj kauzwj nwjkuzdükkwdlwj lwpl vwf kaw fawesdk wflkuzdükkwdf owjvwf. kaw cöffwf vsk fguz kg dsfyw nwjkmuzwf! dwavwj kuzwafl vsk uswksj-nwjxszjwf vguz fauzl kg kauzwj rm kwaf, vwff kaw eükkwf espaesd 26 eöydauzcwalwf vmjuz hjgtawjwf, osk eal ugehmlwjf kwzj kuzfwdd ywzl.`

## Vor- und Nachteile von Verschlüsselung

Ein grosser Vorteil der Verschlüsselung, ist es dass der Prozess auch wieder
umgedreht werden kann. Die Daten können also wieder entschlüsselt werden, wenn
der Schlüssel bekannt ist. In Bezug auf Passwörter ist dies gleichzeitig der
grösste Nachteil von Verschlüsselung.

# Anmelden bei einem Online-Dienst

Wenn Sie sich bei einem Online-Dienst anmelden, dann muss dieser Dienst Ihr
Passwort speichern, damit er sicherstellen kann das es auch wirklich Sie sind
der sich anmelden möchte. Der Online Dienst speichert ihr Passwort in einer
Datenbank, und diese ist normalerweise sicher. Das Problem an diesem Schema
ist, die Datenbank ist interessant für Hacker. Wenn ein Angreifer Zugriff auf
eine Datenbank erhält in der sehr viele Benutzernamen (Email) und Passworte
gespeichert sind, kann dieser Angreifer die Daten nutzen, um sich bei anderen
Diensten anzumelden. Sie sehen hier bereits dass es für Sie extrem wichtig ist
für jeden Dienst ein anderes Passwort zu wählen.

**Aufgabe:**
> In der nächsten Zelle finden Sie Code der die Anmeldung an einem Webservice
> simuliert. Führen Sie die Zelle aus.
>
> Sie sollten nun ein UI sehen bei dem Sie sich anmelden können.
>
> Versuchen Sie sich anzumelden. Sie finden die folgenden beiden Benutzer auf dem System.

|Benutzername | Passwort|
|---|---|
|admin|1234|
|test|password|


In [None]:
import hashlib
import ipywidgets as wdg


def md5(input, silent=False):
    s = bytes(input, 'utf-8')
    res = hashlib.md5(s)
    res = res.hexdigest()
    if not silent:
        print(f'Der md5-Hash von "{input}" ist: {res}')
    else:
        return res


pw_list = {
    'test': 'password',
    'admin': '1234'
}

pw_list_hashed = {
    'test': md5('password', True),
    'admin': md5('1234', True)
}

rb_table = {
    md5('password', True): 'password',
    md5('1234', True): '1234'
}


def salted_hash(input, salt):
    hash = md5(input + salt, True)
    print(f'Der Hash-Wert von "{input}" mit dem Salz "{salt}" ist: {hash}')


def auth(username, password, db=pw_list):
    if username in db:
        if db[username] == password:
            return f'Erfolgreich! Der Benutzer "{username}" hat sich erfolgreich mit dem Passwort "{password}" angemeldet.'
        else:
            return f'Fehlgeschlagen! Das Passwort "{password}" für den Benutzer "{username}" ist falsch!!!'
    else:
        return f'Fehlgeschlagen! Konnte den Benutzer "{username}" nicht in der Datenbank finden.'

def auth_hashed(username, password):
    return auth(username, md5(password, True), pw_list_hashed)

def dump():
    print(pw_list)

def dump_hashed():
    print(pw_list_hashed)

def lookup(input):
    if input in rb_table:
        print(f'Die Eingabe für den Hash-Wert "{input}" ist: "{rb_table[input]}"')
    else:
        print(f'Konnte keine Eingabe für den Hash-Wert "{input}" finden.')
        
def auth_wrapper(args):
    success.value = auth(username.value, password.value)
    
def add_to_rainbow_table(pw, salt='', prepend=False):
    if prepend:
        rb_table[md5(salt + pw, True)] = salt + pw
    else:
        rb_table[md5(pw + salt, True)] = pw + salt

title = wdg.HTML("<h1>Anmelden</h1>")
username = wdg.Text(description="Benutzername")
password = wdg.Password(description="Passwort")
submit = wdg.Button(description="Anmelden")
success = wdg.HTML("")

submit.on_click(auth_wrapper)

layout = wdg.VBox([title, username, password, submit, success])
layout

## Bravo

Sie haben sich erfolgreich angemeldet!!

In der Ausgabe können Sie sehen das der Server unser Passwort im Klartext
gespeichert hat, denn er kann es uns gerade anzeigen. Ein Alternative dazu ist
das sogenannte Hashing von Passwörtern. Dabei werden die Passwörter unkenntlich
gemacht, aber nicht so wie beim Verschlüsseln. Beim Hashing gibt es keine
Umkehrung!

# Hash-Funktion

Eine **Hash-Funktion** nimmt eine Eingabe von beliebiger Länge und wandelt diese in eine Ausgabe von fixer Länge um und hat die weiteren Eigenschaften:
 
 - Gleiche Eingabe erzeugt **immer** die gleiche Ausgabe.
 - Bereits kleine Änderungen erzeugen eine komplet andere Ausgabe.
 - Ist **nicht** umkehrbar.
 - Verschiedene Eingaben haben nicht die gleichen Ausgaben.

Wir schauen uns als Beispiel für eine **Hash-Funktion** die Funktion `md5()` an. Dafür steht Ihnen in der nächsten Zelle die Funktion `md5('passwort')` zur Verfügung. Die Funktion nimmt die Eingabe entgegen und sagt Ihnen was der **Hash-Wert** dieser Eingabe ist.

> **Aufgabe:**  
> Überprüfen Sie dass die ersten beiden Eigenschaften einer **Hash-Funktion** erfüllt sind, und dass alle Ausgaben die gleiche Länge haben.  
> Dazu können Sie die Eingabe in der nächsten Zelle immer wieder ändern und ausführen, oder Sie Kopieren die Zeile und führen gleich mehrere Berechnungen in einer Zelle aus.

In [None]:
md5('passwort')

# Toll

Sehr gut gemacht! Wir haben nun eine Funktion gefunden, mit der wir Text für uns unleserlich machen können. Damit können wir nun *Passwörter* so abspeichern, dass sie nicht direkt ausgelesen werden können.

# Passwörter prüfen

Jetzt wo wir die *Passwörter* nicht mehr lesen können, wie können wir nun sicher sein das sich ein Benutzer mit dem richtigen *Passwort* angemeldet hat?

Das ist dank der Eigenschaften der **Hash-Funktion** zum Glück sehr einfach. Wir erinnern uns, das eine **Hash-Funktion** die gleiche Eingabe immer auf die gleiche Ausgabe umwandeln muss. Wir können also den **Hash-Wert** in der Datenbank speichern, und dann das *Passwort*, das wir erhalten, durch die **Hash-Funktion** geben, und dann die beiden vergleichen.

**Aufgabe:**  
> Wir simulieren nun die Anmeldung an einem Server der gehashte Passwörter
> verwendet. Führen Sie die nächste Zelle aus, und melden Sie sich mit `admin`
> und `1234` an.
>
> Was fällt Ihnen auf wenn Sie die Ausgabe betrachten?

In [None]:
def auth_wrapper(args):
    success.value = auth_hashed(username.value, password.value)

title = wdg.HTML("<h1>Anmelden</h1>")
username = wdg.Text(description="Benutzername")
password = wdg.Password(description="Passwort")
submit = wdg.Button(description="Anmelden")
success = wdg.HTML("")

submit.on_click(auth_wrapper)

layout = wdg.VBox([title, username, password, submit, success])
layout

# Wundervoll

Einfach toll wie Sie das machen. Sie haben sich jetzt bei einem Webservice mit einem gehashten *Passwort* angemeldet.

# Ist das wirklich sicher?

Wie sicher ist das ganze denn in Wirklichkeit? Gibt es wirklich keinen Weg wie ich vom **Hash-Wert** zum Passwort komme?

Die Eigenschaften einer **Hash-Funktion** macht es mathematisch Unmöglich die Umkehrfunktion zu berechnen. Wenn ich aber bereits weiss welche Eingabe in welchen **Hash-Wert** umgewandelt wird, kann ich mir das einfach merken und den **Hash-Wert** dann einfach in einer Tabelle nachschauen. Solche Tabellen nennt man auch **Rainbow-Tables**.

# Rainbow Tables

**Rainbow-Tables** sind Tabellen in denen die **Hash-Werte** für bekannte Eingaben gespeichert werden. Damit kann mit einem einfachen Nachschlagen die Eingabe bestimmt werden, die zu einem **Hash-Wert** gehört.

In der nächsten Zelle finden sie die Funktion `lookup('hashwert')` mit der Sie die Eingabe von bestimmten **Hash-Werten** bestimmen können.

> **Aufgabe:**  
> Bestimmen Sie die *Passwörter* für alle **Hash-Werte** die Ihnen die Funktion `dump_hashed()` liefert.

In [None]:
dump_hashed()

In [None]:
lookup('5f4dcc3b5aa765d61d8327deb882cf99')

# Schade

Wenn es so einfach ist für Angreifer, die Passwörter zu entschlüsseln, bringt das doch alles nichts.

# Salted Hashes

Wie wir bereits wissen, führt schon eine kleine Änderung in der Eingabe, zu einem komplett anderen **Hash-Wert**. Wir können diese Eigenschaft also ausnutzen um es Hackern schwer bis unmöglich zu machen, die **Rainbow-Tables** zu verwenden.

Dafür verwenden wir eine Technik die sich *salzen* nennt. Das bedeutet, dass wir eine beliebige Zeichenkette an das *Passwort* hängen, und dann den **Hash-Wert** davon bestimmen. Diese Zeichenkette nennen wir Salz. Das Salz ist pro Benutzer verschieden, und wird für jeden Benutzer in der Datenbank gespeichert. Wir können also mit dem Salz und dem *Passwort* den **Hash-Wert** berechnen den wir in der Datenbank gespeichert haben.

In der nächsten Zelle finden Sie die neue Funktion `salted_hash()`. Diese nimmt das *Passwort* und das Salz als Eingabe, und berechnet den **Hash-Wert** den beiden in Kombination. Die Funktion `md5()` kennen Sie bereits von weiter oben.

> **Aufgabe:**  
> Überprüfen Sie für verschiedene Werte für *Passwort* und Salz, dass die Funktion `salted_hash()` das gleiche berechnet wie `md5()` von der zusammengesetzten Eingabe.  
> Überprüfen Sie ausserdem, dass die **Hash-Werte** nicht übereinstimmen, wenn Sie den Salz bei der `md5()` Funktion weglassen.

In [None]:
salted_hash('passwort', 'abcd')
md5('passwortabcd')

# Hurra

Toll! Nun kenne wir eine kompliziertere Version wie ich das Passwort hashen kann.

Ich habe aber immer noch den Hash, den ich in einer **Rainbow-Table** nachschauen kann, und dann habe ich auch den Salz den ich einfach vom erhaltenen Wort abziehe, um das eigentliche Passwort zu erhalten. Bin ich jetzt also gleich weit wie zuvor?

> **Aufgabe:**  
> Überlegen Sie sich, wie man das Salz so wählen kann, dass die Methode sicher ist.

# Zusammenfassung

Schauen Sie sich das folgende Video an: [https://www.youtube.com/watch?v=KiypYcB6NZ8](https://www.youtube.com/watch?v=KiypYcB6NZ8)

# Passwörter knacken

Um zu zeigen wie schnell und einfach man Passwörter knacken kann, simulieren wir eine *Brute-Force-Attacke*. Dazu generieren wir alle möglichen Passwörter bis zu einer gewissen Länge, und generieren davon den `md5`-Hashwert.

Weil wir das hier nur als Beispiel machen, und nicht so starke Hardware verwenden, generieren wir nur Passwörter bis zur Länge 4, und auch nur aus den Kleinbuchstaben im Alphabet. Damit haben wir insgesamt $26^4$ mögliche Passwörter zur Verfügung. Wenn wir natürlich Sonderzeichen und längere Passwörter knacken möchten, brauchen wir dafür viel länger.

Der Code in der Zelle unten erzeugt Ihnen die Passwörter, und fügt Sie gerade zur Rainbow-Table hinzu.
Das machen Sie mit der Funktion `add_to_rainbow_table`. Dieser Funktion geben Sie als erstes das Passwort, und dann können Sie noch wählen ob Sie ein Salz übergeben. Mit `prepend=True` können Sie sagen ob das Salz vorne an das Passwort gehängt werden soll.

In [None]:
# Brute Force
from itertools import product

chars = "abcdefghijklmnopqrstuvwxyz"

word_list = list(product(list(chars), repeat=4))

for pw in word_list:
    pw = "".join(pw)
    add_to_rainbow_table(pw, salt='salt')

**Aufgabe:**
> Finden Sie heraus welches Passwort den folgenden Hash erzeugt: `f51c28cce6bd726c35d0cdd247f16368`.
>
> **Tipp:** Sie wissen das ein Salz verwendet wird, und Sie wissen auch dass das Salz eine Zahl ist.

In [None]:
lookup('f51c28cce6bd726c35d0cdd247f16368')

# Sind Ihre Passwörter sicher?

Gehen Sie auf die Webseite
[https://haveibeenpwned.com/](https://haveibeenpwned.com/) und prüfen Sie ob
einer Ihrer Accounts geleakt wurde. Wenn das der Fall ist, ändern Sie dort
sofort Ihr Passwort und überall wo Sie die gleiche Email und dieses Passwort
verwenden. Überlegen Sie sich einen Passwort-Manager zu verwenden.