# Funktionen und Methoden (Lösungen)

☝️ Beachte: es gibt beim Programmieren fast immer verschiedene Lösungswege. Deine Lösung mag anders aussehen, aber dennoch zum gewünschten Resultat führen. Das richtige Resultat ist das Wichtigste. 

✏️ **Lösung 1:** Finde heraus, welcher der beiden Koalitionsverträge länger ist.

In [1]:
#Achtung: anderere Pfade als im Notebook, da das Lösungsnotebook in einem anderen Verzeichnis liegt
#die zwei Punkte im Pfadnamen bedeuten "eine Ebene zurück im Pfad"
with open("../../3_Dateien/Koalitionsvertraege/koalitionsvertrag_2018.txt", encoding="utf-8") as f:
    kv18 = f.read()
    
with open("../../3_Dateien/Koalitionsvertraege/koalitionsvertrag_2021.txt", encoding="utf-8") as g:
    kv21 = g.read()
    
if len(kv18) > len(kv21):
    print("Der Koalitionsvertrag von 2018 ist länger.")
else:
    print("Koalitionsvertrag von 2021 ist länger.")

Der Koalitionsvertrag von 2018 ist länger.


*** 

✏️ **Lösung 2:** Die unten bereitgestellte Liste ```buzzwords``` enthält heuristisch zusammengetragene Schlagwörter aus der Politik – erweitere die Liste gerne um eigene Begriffe, die Dich interessieren. Um einen ersten inhaltlichen Eindruck der Koalitionsverträge zu bekommen, wollen wir herausfinden, wie oft diese Begriffe in ihnen vorkommen und wie sich ihre Frequenz zwischen den Texten entwickelt. Zu diesem Zweck können wir ```count``` für strings verwenden (```kv18``` und ```kv21``` sind ja wie gesagt string-Objekte). ```count``` erlaubt es uns, das Vorkommen einer bestimmten Zeichenkette innerhalb einer anderen Zeichenkette auszuzählen. ```count``` hat folgende Syntax:

```string.count("to_be_counted")```

```"Schifffahrtsgesellschaft".count("f")``` ergäbe etwa 4.

Was bei einem Wort funktioniert, geht auch bei langen strings wie bei unseren Koalitionsverträgen.

Berechne nun wie oft jeder Begriff  auf ```buzzwords``` in den beiden Verträgen vorkommt und verwende einen geeigneten Datentypen, um deine Ergebnisse (separat für jeden Vertrag) abzuspeichern. Lasse Dir anschließend für jeden Begriff die beiden Frequenzen sowie einen Trend über die Zeit (z.B. mittels der Emojis 📈, 📉, 🟰) ausgeben. Das Ergebnis für "Corona" sollte z.B. so aussehen:

<img src="../../3_Dateien/Grafiken_und_Videos/Frequenz_Corona.png"/>

In [2]:
buzzwords = ["Sozial", "Klima", "Europa", "Verkehr", "Landwirtschaft", "Umwelt", "Corona"]

count18 = {}
count21 = {}

for word in buzzwords:
    count18[word] = kv18.count(word)
    count21[word] = kv21.count(word)

for word in buzzwords:
    
    if count18[word] > count21[word]:
        trend = "📉"
    elif count18[word] < count21[word]:
        trend = "📈"
    else:
        trend = "🟰"
        
    print("word: ", word)
    print("2018: ", count18[word])
    print("2021: ", count21[word])
    print("trend:", trend, "\n")

word:  Sozial
2018:  71
2021:  41
trend: 📉 

word:  Klima
2018:  65
2021:  157
trend: 📈 

word:  Europa
2018:  98
2021:  53
trend: 📉 

word:  Verkehr
2018:  43
2021:  24
trend: 📉 

word:  Landwirtschaft
2018:  23
2021:  12
trend: 📉 

word:  Umwelt
2018:  33
2021:  28
trend: 📉 

word:  Corona
2018:  0
2021:  18
trend: 📈 



***
✏️ **Lösung 3:** Die beiden Koalitionsverträge stammen von unterschiedlichen Parteien (CDU, CSU, SPD resp. SPD, Grüne, FDP). Finde heraus, welche beiden Parteien es mit ihrem Kurznamen in beide Verträge geschafft haben. Stelle sicher, dass die Zelle mit dem Dateiinput oben ausgeführt ist, damit die Variablen ```kv18``` und ```kv21``` mit dem jeweiligen Text initialisiert sind.


In [3]:
parties = ["CDU", "CSU", "SPD", "Grüne", "FDP"]
for party in parties:
    if party in kv18 and party in kv21:
        print(party)

SPD
Grüne


***

✏️ **Lösung 4:** Anstelle von whitespace, das standardmäßig als Trennzeichen von ```split``` verwendet wird (und deswegen auch nicht angegeben werden muss), können wir strings auch bei anderen Trennzeichen aufsplitten. Dazu geben wir das gewünschte Trennzeichen in den Klammern an, etwa ```"."```, wenn wir einen string in Sätze aufsplitten wollen. 

Bringe die Geschichte, die in ```sentence``` in komischer Reihenfolge erzählt wird, in die richtige Reihenfolge. Das Resultat sollte ein string mit drei richtig geordneten Sätzen sein. 

💡 Tipp: Auf dem Weg dorthin solltest Du ```split```, Indexing und Konkatenation mithilfe des ```+```-Operators verwenden (beide Techniken haben wir in den vorigen Notebooks kennengelernt).

In [4]:
sentence = """Die beiden verliebten sich ineinander. Und wenn sie nicht gestorben sind, kann's sein dass, sie sich heute noch küssen.Es war einmal ein Hase und ein Fuchs."""

sentences = sentence.split(".")
newtext = sentences[2] + ". " + sentences[0] + "." + sentences[1]
newtext

"Es war einmal ein Hase und ein Fuchs. Die beiden verliebten sich ineinander. Und wenn sie nicht gestorben sind, kann's sein dass, sie sich heute noch küssen"

***

✏️ **Lösung 5:** Selbstverständlich kann man das Vorkommen eines Wortes auf einer Liste auszählen lassen (das lernen wir bei den Methoden für Listen). Hier wollen wir aber die oben bereits kennengelernte ```count```-Methode für strings noch einmal anwenden. Dazu müssen wir die Listenelemente wieder zu einem string konkatenieren. Verwende eine Dir bereits bekannte ```str```-Methode, um aus ```words``` wieder einen string zu kreieren. Eine Variable namens ```sentence_again``` soll auf diesen string zeigen. 

Benutze anschließend die ```count```-Methode, um "gesagt" in ```sentence_again``` zu zählen.  Das Resultat sollte natürlich zwei sein.

In [5]:
words = ['gesagt', 'ist', 'gesagt']
sentence_again = " ".join(words)
sentence_again.count("gesagt")

2

***
✏️ **Lösung 6:** Verwende ```str```-Methoden, um aus ```names``` eine Liste mit Namen wie folgt zu kreieren: ```['Martin Berger', 'Kirsten Hauser', 'Michaela Kircher', 'Fritz Hofer']```. Die Namen sollen vollkommen von leading und trailing whitespace bereingt und mit korrekter Groß-/Kleinschreibung vorliegen. 


In [6]:
names = "Name: Martin Berger name: Kirsten Hauser NAME: Michaela Kircher nAME: Fritz Hofer"
names = names.lstrip("Name: ")
names_list = names.lower().split(" name: ")
names_list_title = []
for name in names_list:
    names_list_title.append(name.title())
print(names_list_title)

#alternative Lösung
names = "Name: Martin Berger name: Kirsten Hauser NAME: Michaela Kircher nAME: Fritz Hofer"
names = names.lstrip("Name: ")
names = names.replace("name", "Name").replace("NAME", "Name").replace("nAME", "Name")
single_names = names.split(" Name: ")
print(single_names)

['Martin Berger', 'Kirsten Hauser', 'Michaela Kircher', 'Fritz Hofer']
['Martin Berger', 'Kirsten Hauser', 'Michaela Kircher', 'Fritz Hofer']


***
✏️ **Lösung 7:** Modifiziere den Code nun derart, dass bei sechs Teilnehmer:innen diejenige Person aus dem Spiel "gekickt" wird, die bereits am längsten daran teilnimmt (bzw. sich bereits am längsten auf der Teilnehmer:innenliste befindet). Im gleichen Zug soll die nächste Person aus ```participants_pool``` ins Spiel gelassen werden. Wie beim letzten Mal auch, möchten wir bei jeder Iteration informiert werden, wer gerade im Spiel ist.

In [7]:
# In diese Zelle kannst Du den Code zur Übung schreiben.

participants_pool = ["Max", "Moritz", "Janine", "Hussein", "Fritz", "Mia", "Marianne", "Dolores", "Yin", "Margareth", "Benni"]

participants_game = []

min_participants = 4
max_participants = 6

for name in participants_pool:
    if len(participants_game) < min_participants-1:
        participants_game.append(name)
        print("Noch nicht genügend Teilnehmer:innen, wir brauchen noch", 4-len(participants_game), "😬")
        
        #zur Überprüfung der aktuellen Teilnehmer:innenliste
        print("Aktuell auf der Liste:", participants_game, "\n")
        continue
        
    elif len(participants_game) >= max_participants:
        print("Leider muss uns nun", participants_game[0], "verlassen")
        participants_game.pop(0)
        
    participants_game.append(name)
    print("Das Spiel läuft 😍")
    
    #zur Überprüfung der aktuellen Teilnehmer:innenliste
    print("Aktuell auf der Liste:", participants_game, "\n")

Noch nicht genügend Teilnehmer:innen, wir brauchen noch 3 😬
Aktuell auf der Liste: ['Max'] 

Noch nicht genügend Teilnehmer:innen, wir brauchen noch 2 😬
Aktuell auf der Liste: ['Max', 'Moritz'] 

Noch nicht genügend Teilnehmer:innen, wir brauchen noch 1 😬
Aktuell auf der Liste: ['Max', 'Moritz', 'Janine'] 

Das Spiel läuft 😍
Aktuell auf der Liste: ['Max', 'Moritz', 'Janine', 'Hussein'] 

Das Spiel läuft 😍
Aktuell auf der Liste: ['Max', 'Moritz', 'Janine', 'Hussein', 'Fritz'] 

Das Spiel läuft 😍
Aktuell auf der Liste: ['Max', 'Moritz', 'Janine', 'Hussein', 'Fritz', 'Mia'] 

Leider muss uns nun Max verlassen
Das Spiel läuft 😍
Aktuell auf der Liste: ['Moritz', 'Janine', 'Hussein', 'Fritz', 'Mia', 'Marianne'] 

Leider muss uns nun Moritz verlassen
Das Spiel läuft 😍
Aktuell auf der Liste: ['Janine', 'Hussein', 'Fritz', 'Mia', 'Marianne', 'Dolores'] 

Leider muss uns nun Janine verlassen
Das Spiel läuft 😍
Aktuell auf der Liste: ['Hussein', 'Fritz', 'Mia', 'Marianne', 'Dolores', 'Yin'] 

Leid

*** 

✏️ **Lösung 8:** Deine Aufgabe ist es nun, ein Skript zu schreiben, dass den den oben im Beispiel verwendeten Satz nimmt und die darin vorkommenden Wort-Bigramme auf der Liste ```all_ngrams``` speichert. Neben ```all_ngrams``` wirst Du als Zwischenschritt beim Zusammentragen der Wort-Bigramme eine zweite Liste namens ```current_ngrams``` brauchen. Beide Listen sind bereits im Code gegeben und werden leer initialisiert. 

Wie erwähnt ist dieses Problem dem obigen im Gesellschaftsspiel-Skript sehr ähnlich. Denk daran, so wenig wie möglich zu hardcoden. Konkret: Verwende, wo möglich, Variablen, sodass Dein Skript problemlos auch für andere Sätze oder zum Errechnen von Tri-, Quadrigrammen etc. benutzt werden kann. 

In [8]:
sentence = "Ich gehe am Abend noch spazieren"

all_ngrams = []
current_ngram = []

words = sentence.split()
n = 2

for word in words:
    if len(current_ngram) < n:
        current_ngram.append(word)
        """Da wir an Bigrammen interessiert sind, und len(current_ngram) noch < 2 ist 
        (also noch keine zwei Wörter auf der Liste sind), überspringen wir den 
        Rest dieser Iteration mithilfe von 'continue'"""
        continue 
    
    """hier hängen wir das Bigramm an die Liste aller Bigramme"""
    all_ngrams.append(" ".join(current_ngram))

    """hier entfernen wir das erste Wort im Bigramm auf der Liste des gegenwärtigen Bigramms"""
    current_ngram.pop(0)
    
    """und hängen sogleich das nächste Wort an die Liste des gegenwärtigen Bigramms, wodurch wir wieder ein Bigramm erhalten, 
    welches zu Beginn der nächsten Iteration an die Liste aller Bigramme angehängt werden wird."""
    current_ngram.append(word) 

"""nach der letzten Iteration der for-Schleife müssen wir noch das letzte Bigramm an die Liste aller Bigramme anhängen, da
es sonst verloren geht (es würde ja erst zu Beginn der nächsten Iteration angehängt, nur gibt es keine nächste Iteration)"""
all_ngrams.append(" ".join(current_ngram)) 

print(all_ngrams)

['Ich gehe', 'gehe am', 'am Abend', 'Abend noch', 'noch spazieren']


***

✏️ **Lösung 9:** Erinnerst Du Dich an die Übung mit den beiden Einkaufslisten, die zu einer zusammengeführt werden sollten, aus dem zweiten Notebook? Damals haben wir mithilfe von ```set``` sichergestellt, dass keine doppelten Elemente auf der zusammengeführten Einkaufsliste vorkommen. In dieser Übung wollen wir es etwas manueller machen (zu Übungszwecken sehen wir vom oben verkündeten Code-Reuse-Mantra ab). Iteriere über eine der beiden Listen und füge der anderen Liste sämtliche Lebensmittel an, sofern sie nicht bereits auf dieser anderen Liste stehen. Gib Dir anschließend die andere Liste aus. Diese sollte dann einer zusammengeführten Liste entsprechen.

In [9]:
my_shopping_list = ["Brot", "Orangen", "Feldsalat", "Hafermilch"]
partner_shopping_list = ["Hafermilch", "Kekse", "Mehl", "Brot"]

for item in partner_shopping_list:
    if item not in my_shopping_list:
        my_shopping_list.append(item)

print(my_shopping_list)

['Brot', 'Orangen', 'Feldsalat', 'Hafermilch', 'Kekse', 'Mehl']


***

✏️ **Lösung 10:** ```temperatures``` ist eine Liste mit unterschiedlichen Messtemperaturen in Grad Celsius. Sie beinhält positive und negative Werte sowie fehlende Werte, die mit "NA" gekennzeichnet sind (für *not available*, etwa weil das Thermometer ausfiel). Erstelle nun mittels List Comprehension folgende neuen Listen. Überlege Dir jeweils genau, an welcher Stelle in der List Comprehension Du die bedingte Anweisung einbauen musst.   

1. ```temperatures_preprocessed``` soll eine Liste referenzieren, die nur numerische Werte enthält.

Erstelle ausgehend von ```temperatures_preprocessed``` diese zwei weiteren Listen.

2. ```positives_replaced``` soll eine Liste referenzieren, auf der sämtliche positiven Werte durch 0.0 ersetzt werden.
3. ```only_positives``` soll eine Liste referenzieren, die nur positive Werte beinhält.

In [10]:
temperatures = [18.6, 23.4, "NA", 12.2, -3.1, 33.7, -10.9, -17.8, "NA", 7.0, 9.1, -0.2, 0.0, 8.6, "NA", "NA", 39.4, -29.8]

temperatures_preprocessed = [value for value in temperatures if value != "NA"]

#alternativer Code
#temperatures_preprocessed = [value for value in temperatures if type(value) == float]

print("Temperaturen ohne fehlende Werte:", temperatures_preprocessed)

positives_replaced = [0.0 if value > 0 else value for value in temperatures_preprocessed]

print("Positive Messwerte genullt:", positives_replaced)

only_positives = [value for value in temperatures_preprocessed if value > 0]

print("Nur positive Messwerte:", only_positives)

Temperaturen ohne fehlende Werte: [18.6, 23.4, 12.2, -3.1, 33.7, -10.9, -17.8, 7.0, 9.1, -0.2, 0.0, 8.6, 39.4, -29.8]
Positive Messwerte genullt: [0.0, 0.0, 0.0, -3.1, 0.0, -10.9, -17.8, 0.0, 0.0, -0.2, 0.0, 0.0, 0.0, -29.8]
Nur positive Messwerte: [18.6, 23.4, 12.2, 33.7, 7.0, 9.1, 8.6, 39.4]


***

✏️ **Lösung 11:** Eine Funktion zum Sortieren von dictionaries kennst Du bereits von oben. Sortiere ```federal_states``` alphabetisch nach ihren Haupstädten. Das Resultat sollte eine Liste mit Tupeln bestehend aus Bundesland und Hauptstadt sein.

In [11]:
federal_states = {'Vorarlberg': 'Bregenz', 'Tirol': 'Innsbruck', 'Kärnten': 'Klagenfurt', 'Steiermark': 'Graz', 'Wien': 'Wien', 'Niederösterreich': 'Sankt Pölten', 'Oberösterreich': 'Linz', 'Salzburg': 'Salzburg', 'Burgenland': 'Eisenstadt'}

federal_states_sorted = sorted(federal_states.items(), key=lambda x: x[1])
print(federal_states_sorted)

[('Vorarlberg', 'Bregenz'), ('Burgenland', 'Eisenstadt'), ('Steiermark', 'Graz'), ('Tirol', 'Innsbruck'), ('Kärnten', 'Klagenfurt'), ('Oberösterreich', 'Linz'), ('Salzburg', 'Salzburg'), ('Niederösterreich', 'Sankt Pölten'), ('Wien', 'Wien')]


***

🔧 **Anwendungsfall (komplette Lösung):** Gegeben sind die Koalitionsverträge von 2018 und 2021 in ```kv18``` resp. ```kv21```. Zusätzlich ist ```stopwords``` gegeben, eine Liste mit sog. Stopwörtern, also hochfrequenten Wörtern wie *und*, *der*, *die*, *das* etc., die wir von der Berechnung von Schlüsselwörtern ausschließen wollen. 

Bereinige sämtliche Wörter und entferne alle Stopwörter. Errechne anschließend für jeden Wort*type* (vgl. zweites Notebook), wie oft er vorkommt und speichere diese paarweise Information in einem geeigneten Objekt ab. Sortiere dieses Objekt in absteigender Reihenfolge und lasse Dir die zehn häufigsten Schlüsselwörter ausgeben. Wiederhole diese Schritte für den zweiten Text, um die Schlüsselwörter vergleichen zu können.

In [12]:
#Lösung für kv18 

#Achtung: anderere Pfade als im Notebook, da das Lösungsnotebook in einem anderen Verzeichnis liegt
#die zwei Punkte im Pfadnamen bedeuten "eine Ebene zurück im Pfad"
with open("../../3_Dateien/Koalitionsvertraege/koalitionsvertrag_2018.txt", encoding="utf-8") as f:
    kv18 = f.read()
    
stopwords = []
        
with open("../../3_Dateien/Koalitionsvertraege/stopwords-de.txt", encoding="utf-8") as h:
    for line in h:
        stopwords.append(line.rstrip())
    
words = kv18.split()

preprocessed_words = []

for word in words:
    word = word.lower() 
    word = word.strip(".,():")
    if word in stopwords:
        continue
    preprocessed_words.append(word)

types = set(preprocessed_words)

freq_dict = {} 

for type_ in types:
    freq_dict[type_] = preprocessed_words.count(type_)

freq_sorted = sorted(freq_dict.items(), key = lambda x: x[1], reverse=True)

for i in range(10):
    print(freq_sorted[i][0], "kommt", freq_sorted[i][1], "oft vor.")

werden kommt 1032 oft vor.
wollen kommt 905 oft vor.
ist kommt 263 oft vor.
stärken kommt 215 oft vor.
deutschland kommt 194 oft vor.
wird kommt 186 oft vor.
sind kommt 178 oft vor.
insbesondere kommt 162 oft vor.
unterstützen kommt 143 oft vor.
dazu kommt 137 oft vor.


***

🔧 **Anwendungsfall (Schritt-für-Schritt-Lösung):**

1. Schritt (bereits gegeben):

In [13]:
with open("../../3_Dateien/Koalitionsvertraege/koalitionsvertrag_2018.txt", encoding="utf-8") as f:
    kv18 = f.read()
    
with open("../../3_Dateien/Koalitionsvertraege/koalitionsvertrag_2021.txt", encoding="utf-8") as g:
    kv21 = g.read()
    
stopwords = []

with open("../../3_Dateien/Koalitionsvertraege/stopwords-de.txt", encoding="utf-8") as h:
    for line in h:
        stopwords.append(line.rstrip())

2. Schritt:

In [14]:
words = kv18.split()
print(words[99:119])

['Nur', 'so', 'können', 'wir', 'das', 'Erreichte', 'sichern', 'und', 'ausbauen.', 'Unsere', 'Ausgangslage', 'ist', 'gut.', 'Die', 'Wirtschaft', 'boomt,', 'noch', 'nie', 'waren', 'so']


3. Schritt:

In [15]:
preprocessed_words = []

for word in words:
    word = word.lower() 
    word = word.strip(".,():")
    if word in stopwords:
        continue
    preprocessed_words.append(word)
    
print(preprocessed_words[99:119])

['deutschland', 'mobilisieren', 'chancen', 'digitalisierung', 'nutzen', 'deutschland', 'braucht', 'wirtschaftlichen', 'sozialen', 'fortschritt', 'teilhaben', 'wollen', 'wohlstand', 'menschen', 'ankommt', 'wahlergebnis', 'hat', 'gezeigt', 'menschen', 'unzufrieden']


4. Schritt:

In [16]:
types = set(preprocessed_words)

5., 6. und 7. Schritt:

In [17]:
freq_dict = {} 

#der Unterstrich nach "type" dient der Unterscheidung zum Python-Schlüsselwort "type"
for type_ in types:
    freq_dict[type_] = preprocessed_words.count(type_)

8. Schritt:

In [18]:
freq_sorted = sorted(freq_dict.items(), key = lambda x: x[1], reverse=True)

9. Schritt:

In [19]:
for i in range(10):
    print(freq_sorted[i][0], "kommt", freq_sorted[i][1], "oft vor.")

werden kommt 1032 oft vor.
wollen kommt 905 oft vor.
ist kommt 263 oft vor.
stärken kommt 215 oft vor.
deutschland kommt 194 oft vor.
wird kommt 186 oft vor.
sind kommt 178 oft vor.
insbesondere kommt 162 oft vor.
unterstützen kommt 143 oft vor.
dazu kommt 137 oft vor.


10. Schritt siehe komplette Lösung oben. 

***

✏️ **Lösung 12:** Definiere eine Funktion ```sum_div```, die drei Argumente nimmt. Das erste soll mit dem zweiten addiert werden. Das Ergebnis davon soll durch das dritte Argument geteilt werden. Dieses Ergebnis soll zurückgegeben werden. Entferne anschließend den Hashtag vor der bereits existierenden Code-Zeile. Wenn Du ```True``` erhältst, hast Du alles richtig gemacht!

In [20]:
def sum_div(a,b,c):
    return (a+b)/c

sum_div(2,3,2) == 2.5

True

***

✏️ **Lösung 13:** Importiere die Funktion ```sample``` des ```random```-Moduls. ```sample``` generiert eine zufällige Auswahl von Elementen, z.B. zehn zufällige Elemente, aus einer Grundgesamtheit mit allen Elementen. Die Funktion erwartet als erstes Argument die Grundgesamtheit in Form einer Liste und als zweites eine Ganzzahl, mit der die Anzahl der zufällig auszuwählenden Elemente definiert wird. Die Grundgesamtheit in dieser Übung ist das```participants_pool``` von der Übung von oben bzw. aus dem letzten Notebook. Die Anzahl der zufällig auszuwählenden Elemente beträgt in diesem Fall vier. Wir wollen also zufällige Spielzusammensetzungen mit jeweils vier Teilnehmer:innen erhalten.

Deine Aufgabe besteht nun darin, so viele zufällige Spielzusammensetzungen zu genererieren, bis eine Zusammensetzung doppelt vorkommt. Verwende dazu eine passende Kontrollstruktur, die Deinen Code so oft wiederholt, bis die Bedingung, dass eine zufällige Zusammensetzung bereits einmal zuvor generiert wurde, zutrifft. In diesem Fall soll die Iteration abbrechen und die Anzahl der notwendigen Wiederholungen bis zur identischen Zusammensetzung ausgegeben werden. 

Beachte, dass es für diese Anzahl der notwendigen Wiederholungen keine richtige Antwort gibt, da es in der Natur der zufälligen Auswahl liegt, dass es manchmal etwas mehr und manchmal etwas weniger Wiederholungen braucht.

Fortgeschritten: Wenn Du Dich herausfordern möchtest, kannst Du Deinen gesamten Code in eine (andere) Kontrollstruktur verpacken, die Deinen Code, sagen wir, 1000 Mal wiederholt. Bei jeder Wiederholung soll die notwendige Anzahl bis zwei Zusammensetzungen doppelt vorkommen auf einer Liste gespeichert werden. Berechne zum Schluss den Mittelwert dieser Liste, indem Du mittels der Funktion ```sum``` alle Werte auf der Liste addierst und die Summe durch die Länge der Liste dividierst. Bei wiederholter Ausführung dieses Codes sollten die Mittelwerte nur noch geringfügig schwanken.

In [21]:
#In diese Zelle kannst Du den Code zur Übung schreiben.

from random import sample

participants_pool = ["Max", "Moritz", "Janine", "Hussein", "Fritz", "Mia", "Marianne", "Dolores", "Yin", "Margareth", "Benni"]

count = 0

all_compositions = []

while True:
    
    current_composition = sample(participants_pool, 4)
    
    if current_composition in all_compositions:
        print(count)
        break
    
    all_compositions.append(current_composition)
    
    count += 1
    
#Fortgeschritten

all_counts = []

for i in range(1000):
    
    count = 0

    all_compositions = []

    while True:

        current_composition = sample(participants_pool, 4)

        if current_composition in all_compositions:
            break

        all_compositions.append(current_composition)

        count += 1
    
    all_counts.append(count)

print(sum(all_counts)/len(all_counts))

157


112.064
