In [None]:
# Library imports
import matplotlib.pyplot as plt
# https://github.com/konstantint/matplotlib-venn
from matplotlib_venn import *

# Mengen (Sets) in Python
In Python ist der Datentyp **Set** eine weitere Collection und hat die folgenden Eigenschaften:

* **Set**s sind eine Sammlung von ungeordneten Elementen
* Die Elemente eines **Set**s sind einmalig (unique). Ein Element kann in einem Set nicht mehrmals vorkommen
* Ein **Set** kann verändert werden (mutable), aber die Elemente müssen von einem unveränderbaren Datentyp sein (String, Int, Float, Tuple)


# Sets erstellen
**Set**s können auf verschiedene Arten erstellt werden.

In [None]:
set_x = set(["A", "B", "C"]) # Iterierbares Objekt (Liste, Tuple)

set_y = {} # Geschweifte Klammern



In [None]:
set_z = {1,1,1,1} # Was passiert?

In [None]:
chars=""

all_chars =list(chars)

unique_chars = set(chars) # Strings sind auch iterierbar
unique_chars

Zusammenfassung:

* Argument für `set()` ist ein iterierbares Objekt. Es wird eine Liste von einmaligen Elementen erstellt, die im **Set** landen.
* mit dem `{}`-Operator landen die Objekte direkt in der Liste.


In [None]:
{"text"} == set("text")

**Set**s können auch leer sein. `{}` sind aber schon für Dicts reserviert. Somit können leere Sets nur mit `set()` erstellt werden.

In [None]:
# leeres Set
empty_set = set() 

print(type(empty_set))

empty_set2 = {} # Funktioniert das ?

Die Elemente eines Sets können unterschiedliche Datentypen sein:

In [None]:
s = {"text", 1, 2, 3.0, (1, 3)}
s

Indexierung von Sets ist nicht möglich:

In [None]:
set_x = {"A", "B", "C"}
set_x[0]

# Set Grösse und Mitgliedschaft

Die `len()`-Funktion gibt die Anzahl Elemente eines Sets zurück.

Mit den `in`- und `not in`-Operator kann geprüft werden, ob ein Objekt in einem Set ist oder nicht:

In [None]:
set_x = {"A", "B", "C"}
"A" in set_x

In [None]:
2020 in set_x

In [None]:
2020 not in set_x

In [None]:
# Anzahl Elemente
len(empty_set)
len(set_x)

# Verändern von Sets
Auch wenn die Elemente unveränderbar sein müssen, so ist es möglich den Inhalt eines **Set**s mit `add()` anzupassen.

In [None]:
set_x = {"A", "B", "C"}
set_x.add("X")
set_x

In [None]:
set_x.update("Y")
set_x

In [None]:
set_x.remove("A")
set_x

In [None]:
set_x.remove("A") # Error, da "A" nicht in mehr in Set
set_x

In [None]:
set_x.discard("A") # Kein Error, obwohl "A" nicht in mehr in Set
set_x

# Frozensets

Frozensets sind eine spezielle Art von **Set**s, im Gegensatz zu den normalen **Set**s können sie nach der Erstellung nicht verändert werden. Sie sind also unveränderlich (immutable):

In [None]:
set_x = frozenset(["A", "B", "C"])
set_x.add("X")
set_x

# Operationen mit Sets
Viele der Operationen die bei den anderen Collection Datentypen verwendet werden können, sind bei **Set**s nicht möglich.

Indexierung und Sliceing werden von **Set**s nicht unterstützt.

Dafür gibt es diverse andere Operationen für **Set**s, die vor allem Mengen-Operationen nachbilden. 

## Operator vs. Methods
Die meisten **Set**-Operationen können auf zwei unterschiedliche Arten ausgeführt werden: Operator oder Methode.

## Vereinigung (Union)

Gegeben zwei Mengen *A* und *B*, die Vereinigung ergibt alle Elemente die in *A* oder *B* enthalten sind zurück.

Mit der Methode `set1.union(set2)` oder dem `|`-Operator:

In [None]:
x = {"A", "B", "C"}
y = {"A", "D"}
x.union(y)

In [None]:
x | y

Ein winziger Unterschied zwischen den beiden Varianten:

Wird der `|`-Operator verwendet, müssen die beiden Operanden Sets sein. Mit `.union()` kann auch ein beliebiges Iterable mitgegeben werden.  

In [None]:
x | ("X", "Y", "Z")

In [None]:
x.union("XYZ")

In [None]:
# Mehrere Sets
set_a = {1, 2, 3, 4}
set_b = {2, 3, 4, 5}
set_c = {3, 4, 5, 6}
set_d = {4, 5, 6, 7}

set_a.union(set_b, set_c, set_d)
set_a | set_b | set_c | set_d

# Schnittmenge
Die Schnittmenge kann mit `set_a.intersection(set_b [, set_c, ...])`  oder `set_a & set_b [& set_c ...]` berechnet werden.

`set_a.intersection(set_b)` und `set_a & set_b` geben alle Elemente zurück, die sowohl in `set_a` als auch in `set_b` enthalten sind.

In [None]:
set_a.intersection(set_b)

In [None]:
set_a & set_b

In [None]:
# Mehrere Sets
set_a = {1, 2, 3, 4}
set_b = {2, 3, 4, 5}
set_c = {3, 4, 5, 6}
set_d = {4, 5, 6, 7}

set_a.intersection(set_b, set_c, set_d)
set_a & set_b & set_c & set_d

In [None]:
# Differenz



In [None]:
set_a.difference(set_b)

In [None]:
set_a - set_b

In [None]:
# Mehrere Sets
set_a = {1, 2, 3, 4}
set_b = {2, 3, 4, 5}
set_c = {3, 4, 5, 6}

set_a.difference(set_b, set_c)
set_a - set_b - set_c

# Symmetrische Differenz
Alle Elemente die in set_a oder set_b sind, aber nicht in beiden.

In [None]:
set_a.symmetric_difference(set_b)

In [None]:
set_a ^ set_b

# Disjunktion

Prüft, ob set_a und set_b irgenwelche gemeinsame Elemente haben (False) oder nicht (True).

In [None]:
set_a.isdisjoint(set_b)

# Subset

In [None]:
set_a.issubset(set_b)

In [None]:
set_a <= set_b

In [None]:
# ein set ist ein subset von sich selbst
set_a <= set_a

In [None]:
set_a < set_a # proper subset: subset darf nicht identisch sein

Superset

## Übung
Erstelle 2-3 Sets für unterschiedliche Kategorien von Sportarten.

In [None]:
# TODO

## Venn Diagramme
Sets können graphisch mit Venn Diagrammen dargestellt werden. Siehe [Mengendiagramm](https://de.wikipedia.org/wiki/Mengendiagramm).

Die folgenden Funktionen können verwendet werden um Diagramme von zwei (`plot2`) und drei (`plot3`) Mengen anzuzeigen.

In [None]:
def plot2(set1, set2, labels=("Set 1", "Set 2")):
    set1 = {str(e) for e in set1}
    set2 = {str(e) for e in set2}
    
    plt.figure(figsize=(10,10))
    venn = venn2((set1, set2), labels)
    c = venn2_circles(subsets=(set1, set2), linestyle='dashed')
    
    for text in venn.set_labels:
        if text:
            text.set_fontsize(24)
        
    for text in venn.subset_labels:
        if text:
            text.set_fontsize(20)
    
    label_sets = {
        '10': ', '.join(set1 - set2),
        '11': ', '.join(set1 & set2),
        '01': ', '.join(set2 - set1)
    }
    
    for key, val in label_sets.items():
        if val:
            venn.get_label_by_id(key).set_text(val)
        elif venn.get_label_by_id(key):
                venn.get_label_by_id(key).set_text("")
        else:
            pass
    plt.show()

In [None]:
def plot3(set1, set2, set3, labels=("Set 1", "Set 2", "Set 3")):
    set1 = {str(e) for e in set1}
    set2 = {str(e) for e in set2}
    set3 = {str(e) for e in set3}
    plt.figure(figsize=(10,10))
    venn = venn3((set1, set2, set3), labels)
    c = venn3_circles(subsets=(set1, set2, set3), linestyle='dashed')
    
    for text in venn.set_labels:
        if text:
            text.set_fontsize(24)
        
    for text in venn.subset_labels:
        if text:
            text.set_fontsize(20)
    
    label_sets = {
        '100': ', '.join(set1 - set2 - set3),
        '110': ', '.join(set1 & set2 - set3),
        '010': ', '.join(set2 - set3 - set1),
        '101': ', '.join(set1 & set3 - set2),
        '111': ', '.join(set1 & set2 & set3),
        '011': ', '.join(set2 & set3 - set1),
        '001': ', '.join(set3 - set2 - set1)
    }
    
    for key, val in label_sets.items():
        if val:
            venn.get_label_by_id(key).set_text(val)
        elif venn.get_label_by_id(key):
                venn.get_label_by_id(key).set_text("")
        else:
            pass
    plt.show()

In [None]:
plot2({1,2,3},{1,2,3,4,5})

In [None]:
plot3({1,2,3, 5},{1,3,4,5},{5, 6})