<a href="https://colab.research.google.com/github/URK-KIPLiIS/Python-lessons/blob/main/Python_Zbi%C3%B3r_(Set).ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Struktury danych. Zbiór (`Set`)

* Krzysztof Molenda (2021-05-01)

---

<a href="https://colab.research.google.com/github/URK-KIPLiIS/Python-lessons/blob/main/03.%20Struktury%20danych/Krotka.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

Zbiór (ang. _set_) w sensie Pythona, to kolekcja elementów rozumiana tak, jak rozumiana jest w sensie matematycznym - można dodawać elementy, usuwać, wyszukiwać, ale elementy przechowywane w zbiorze są **bez duplikatów** i **nie można ich modyfikować** (elementy zbioru muszą być niezmiennicze). Do zbioru można dodawać i usuwać elementy.

Przykłady:

In [1]:
# zbiór 3 liczb całkowityych
zbior1 = {1, 2, 3}
print(zbior1)

# zbiór 3 liczb całkowitych, duplikaty nie są brane pod uwagę
zbior2 = {1, 1, 2, 3}
print(zbior2)

# zbiór elementów różnego typu
zbiór3 = {1, "Krzysztof", (1, 2, 3), 23.1}
print(zbiór3)

{1, 2, 3}
{1, 2, 3}
{'Krzysztof', 1, 23.1, (1, 2, 3)}


Zbiór, w swojej konstrukcji przypomina listę. Jest jednak kilka znaczących różnic między tymi strukturami danych. Cechy zbioru:

* jest strukturą **nieuporządkowaną** - elementy zbioru nie są indeksowane, nie mają określonego porządku, do elementów zbioru nie można odnieść się przez indeks podany nawiasach kwadratowych, wypisanie elementów zbioru w różnym czasie może powodować różne wyniki
* jest strukturą **częściowo niezmienniczą** (ang. _immutable_) - po utworzeniu nie można zmienić **wartości** elementów, ale można do zbioru dodać nowe lub usunać już istniejące wpisy
* elementami zbioru mogą być tylko wartości (niezmiennicze), zatem elementem zbioru może być krotka, ale nie może być lista
* w zbiorze nie ma duplikatów
* jest strukturą iterowalną (mozna przeglądać za pomocą petli `for-in`), ale nie indeksowalną (nie jest sekwencją). Podczas przeglądania (również podczas wypisywania) tworzona jest lista elementów zbioru i to ona jest przetwarzana

Przykład:

In [2]:
# utworzenie zbioru
liczby = {1, 4}
print(liczby)           # {1, 4}
print( type(liczby) )   # <class 'set'>

# dodanie nowego elementu
liczby.add(3)
print(liczby)           # {1, 3, 4}
liczby.add(0)
print(liczby)           # {0, 1, 3, 4}
# print( liczby[1] )    # błąd, zbiór nie jest strukturą indeksowaną

{1, 4}
<class 'set'>
{1, 3, 4}
{0, 1, 3, 4}


## Tworzenie

Standardowo, zbiór tworzymy wymieniając - w nawiasach klamrowych - jego elementy, oddzielone przecinkami.

In [None]:
zbior = {"A", 2.1, 10, (1,2)}

Zbiór pusty jest szczególnym przypadkiem. Tworzymy go za pomocą konstruktora bez podania argumentów. Zbiór, w kontekście wyrażeń logicznych, ma wartość logiczną:
* `False` - jeśli zbiór jest pusty
* `True` - jeśli zbiór nie jest pusty
Upraszcza to czasami podawanie warunków w `if` lub `while`.


In [3]:
x = set()           # utworzenie zbioru pustego za pomocą konstruktora
print( type(x) )    # sprawdzenie typu zmiennej x
x.add(7)
if x :
    print(x)
else:
    print("zbiór pusty")


<class 'set'>
{7}


Ponieważ zbiór - w sensie języka Python - jest obiektem, możemy go jawnie utworzyć za pomocą konstruktora. Parametrem konstruktora musi być inna kolekcja (np. krotka, lista)

In [None]:
zbior = set( (1, 2, 3) ) # zewnetrzne nawiasy konstruktor, wewnętrzne - krotka
print( zbior )
zbior = set( ['a', 'b', 'c'] )
print( zbior )
zbior = set( [ (1,2), (2,1), (3,0) ] ) # zbiór krotek - punktów na płaszczyźnie
print( zbior )

{1, 2, 3}
{'a', 'b', 'c'}
{(1, 2), (3, 0), (2, 1)}


## Dostęp do elementów zbioru

Inaczej jak dla listy, dostęp do elementów zbioru nie może być realizowany za pomocą odwołania do ich indeksów (nawiasy kwadratowe `[]`) - zbiór nie jest sekwencją. Zatem podstawowym sposobem dostępu do elementów zbioru jest jego przeglądanie (iterowanie)

In [6]:
zbior = set( [ (1,2), (2,1), (3,0) ] )

for element in zbior:
  print(element)

for (x,y) in zbior:          # rozpakowujemy element
  print( f"x={x}, y={y}")

(1, 2)
(3, 0)
(2, 1)
x=1, y=2
x=3, y=0
x=2, y=1


Możemy sprawdzić, czy określony element należy do zbioru (operator `in`):

In [None]:
zbior = set( [ (1,2), (2,1), (3,0) ] )
if (0,0) in zbior:
    print("znaleziono")
else:
    print(f"elementu (0,0) nie ma w zbiorze")

elementu (0,0) nie ma w zbiorze


Aktualny rozmiar zbioru otrzymamy, wywołując funkcję `len()`

## Operacje na zbiorach

### Liczebność zbioru

Podobnie jak dla innych struktur (kolekcji) można określić rozmiar krotki za pomocą funkcji `len()`:

In [None]:
zbior = set( [ (1,2), (2,1), (3,0) ] )
print( len(zbior) )

3


### Dodawanie elementów do zbioru (metoda `add`)

In [None]:
zbior = set( [ (1,2), (2,1), (3,0) ] )
zbior.add( (0,0) )                     # dodaje pojedynczy element
print( zbior )
zbior.update( [(0,0), (1,1), (2,2)]  ) # dodaje wiele elementów
print( zbior )

{(1, 2), (3, 0), (0, 0), (2, 1)}
{(1, 2), (0, 0), (3, 0), (2, 1), (2, 2), (1, 1)}


### Usuwanie elementów ze zbioru (metoda `remove`)

In [None]:
zbior = set( [ (1, 2), (2, 1), (0, 0), (1, 1), (3, 0), (2, 2) ] )
print( zbior )
zbior.remove( (0,0) )   # usunięcie konkretnego elementu
print( zbior )
x = zbior.pop()         # usunięcie losowego elementu
print( zbior )
print( "usunięto", x )

{(1, 2), (0, 0), (3, 0), (2, 1), (2, 2), (1, 1)}
{(1, 2), (3, 0), (2, 1), (2, 2), (1, 1)}
{(3, 0), (2, 1), (2, 2), (1, 1)}
usunięto (1, 2)


UWAGA: Próba usunięcia konkretnego elementu, którego nie ma w zbiorze, spowoduje błąd. Zatem, przed usunięciem powinniśmy zweryfikować jego przynależenie do zbioru:

In [None]:
zbior = set( [ (1, 2), (2, 1), (0, 0), (1, 1), (3, 0), (2, 2) ] )
punkt_do_usuniecia = (0,0)
zbior.remove( punkt_do_usuniecia )
# zbior.remove( punkt_do_usuniecia ) # błąd, elementu nie ma w zbiorze
if punkt_do_usuniecia in zbior:
    zbior.remove(punkt_do_usuniecia)
else:
    print("punktu nie ma w zbiorze")

punktu nie ma w zbiorze


Wygodniejszym sposobem usunięcia elementu _pod warunkiem, że jest w zbiorze_ jest uzycie metody `discard`:

In [None]:
zbior = set( [ (1, 2), (2, 1), (0, 0), (1, 1), (3, 0), (2, 2) ] )
punkt_do_usuniecia = (0,0)
zbior.remove( punkt_do_usuniecia )
zbior.discard( punkt_do_usuniecia ) # elelementu nie ma, ale błąd nie zostanie zgłoszony

### Operacje teoriomnogościowe

Operacje teoriomnogościowe to: suma zbiorów, część wspólna, różnica, różnica symetryczna. Do operacji tych zaliczamy również sprawdzenia, czy zbiory są rozłączne, czy jeden zawiera się w drugim ...

In [None]:
# suma zbiorów
z1 = {1, 2, 3}
z2 = { 2, 3, 4}
z3 = { 'a', 'b', 'c' }
suma = z1.union(z2) # suma zbiorów, metoda union
print(suma)
suma1 = z1 | z2     # suma zbiorów, operator |
print(suma1)
suma2 = z1 | z3 | z2
print(suma2)
suma3 = z1.union( z3.union(z2) )
print(suma3)

{1, 2, 3, 4}
{1, 2, 3, 4}
{1, 2, 3, 'c', 4, 'b', 'a'}
{1, 2, 3, 'c', 4, 'b', 'a'}


In [None]:
# iloczyn (część wspólna) zbiorów
z1 = {1, 2, 3}
z2 = { 2, 3, 4}
z3 = { 3, 4, 5 }
czesc_wspolna = z1.intersection(z2)  # metoda intersection
print( czesc_wspolna )
czesc_wspolna1 = z1 & z2             # operator &
print( czesc_wspolna1 )
czesc_wspolna2 = z1 & z3 & z2
print( czesc_wspolna2 )

{2, 3}
{2, 3}
{3}


In [None]:
# różnica zbiorów
z1 = {1, 2, 3}
z2 = { 2, 3, 4}
z3 = { 3, 4, 5 }
print( z1.difference(z2) )       # metoda difference
print( z1 - z2 )                 # operator +
print( z2.difference(z1) )
print( z2 - z1 )
print( z3 - z1 - z2 )

{1}
{1}
{4}
{4}
{5}


In [None]:
# różnica symetryczna
z1 = { 1, 2, 3 }
z2 = { 2, 3, 4 }
z3 = { 3, 4, 5 }
print( z1.symmetric_difference(z2) ) # metoda symmetric_difference
print( z1^z2 )                       # operator ^

{1, 4}
{1, 4}


In [None]:
# czy zbiory są rozłączne
z1 = { 1, 2, 3 }
z2 = { 2, 3, 4 }
z3 = { 8, 9, 10 }
print( z1.isdisjoint(z2) )
print( z1.isdisjoint(z3) )

False
True


In [None]:
# czy zbiór zawiera się w innym
z1 = { 1, 2, 3 }
z2 = { 2, 3 }
z3 = { 8, 9, 10 }
print( z2.issubset(z1) )    # metoda issubset
print( z2 < z1 )            # operatorowo, silna inkluzja

print( z1.issuperset(z2) )  # metoda issuperset
print( z1 > z2 )            # operatorowo

print( z3.issubset(z1) )

print ( z1 < z1 )           # silna inkluzja
print (z1 <= z1 )           # słaba inkluzja

True
True
True
True
False
False
True


Operacje na zwbiorach występują również w wariantach `_update`. Wywołanie tych metod powoduje **zaktualizowanie** zbioru pierwszego, na rzecz którego wywołana została określona metoda:

In [None]:
z = {1, 2, 3}
z1 = {2, 3, 4}
nowy = z.difference(z1)  # utworzenie zbioru `nowy` i umieszczenie w nim różnicy zbiorów z - z1
z.difference_update(z1)  # wykonanie operacji różnicy "w miejscu", zmodyfikowano zbiór z
print(z)

{1}


In [None]:
# kopiowanie zbioru
z = {1, 2, 3}
z1 = z.copy()
print( z1 )
print( z == z1 )

{1, 2, 3}
True


In [7]:
# czyszczenie zbioru (usuwanie wszystkich jego elementów)
z = {1, 2, 3}
print(z)
z.clear()
print(z)

{1, 2, 3}
set()


## Konwersje

In [8]:
zbior = {1, 2, 3}
print(zbior)
lista = list(zbior)
print(lista)
lista[0] = 10
print(lista)
zbior = set(lista)
print(zbior)

zbior1 = zbior.copy()
zbior1.remove(10)
zbior1.add(1)
print(zbior1)

zbior = {1, 2, 3}
print( zbior == zbior1)

{1, 2, 3}
[1, 2, 3]
[10, 2, 3]
{3, 10, 2}
{3, 1, 2}
True


## Zamrożony zbiór (`frozenset`)

Python dostarcza wbudwany typ danych o nazwie `frozenset`, będący wariantem typu `set` ale całkowicie niezmienniczym (_immutable_). Nie tylko nie można zmienić wartości elementów, ale również nie można do takiego zbioru dodawać ani usuwać elementów.

Ponieważ `frozenset` jest niezmienniczy, można go wykorzystać do budowy zbioru zbiorów oraz słowników (klucz słownika musi być niezmienniczy).

In [9]:
a = set( [1, 2, 3] )
b = set( ['a', 'b', 'c'] ) 
c = set() # zbiór pusty
c.add(a)  # błąd, nie można dodać zbioru do zbioru
c.add(b)
print(c)

TypeError: ignored

In [10]:
a = frozenset( [1, 2, 3] )
b = frozenset(['a', 'b', 'c']) 
c = set() # zbiór pusty
c.add(a)
c.add(b)
print(c)
print(type(c))

{frozenset({1, 2, 3}), frozenset({'c', 'b', 'a'})}
<class 'set'>


## Zadania

### Zadanie 1

Utwórz zbiory imion A, B, C tak, aby zbiory te zawierały elementy wspólne ale również nie występujące w pozostałych.

Następnie utwórz i wypisz:

* wszystkie imiona z sumy trzech zbiorów, posortowane malejąco
* imiona wystepujące równocześnie we wszystkich trzech zbiorach, posortowane malejąco
* imiona, które są w zbiorze A, ale nie ma ich w zbiorze B ani w zbiorze C

In [None]:
# tu napisz swoje rozwiązanie

## Uwagi dotyczące sortowania

* Funkcja `sorted` dla zbioru i krotki zwraca posortowaną listę wartości.
* metoda `sort` wykonuje sortowanie **w miejscu**, ale tylko dla list

In [16]:
zbior = {2, 10, 3, 4, 102, 8}
print("Wydruk zbioru:", zbior)
x = sorted(zbior)   # funkcja `sorted` zwraca listę posortowaną
print("Wydruk listy:", x)
print( type(x) )

l = list(zbior)  # jawna konwersja zbioru do listy
l.sort()         # sortowanie listy
print("Wydruk listy posortowanej:", l)

krotka = (1, 101, 10)
print("Wydruk krotki przed sortowaniem:", krotka)
y = sorted(krotka)
print("Wydruk listy posortowanej:", y)
krotka = tuple( y )  # konwersja wsteczna listy na krotkę
print("Wydruk krotki:", krotka)

Wydruk zbioru: {2, 3, 4, 102, 8, 10}
Wydruk listy: [2, 3, 4, 8, 10, 102]
<class 'list'>
Wydruk listy posortowanej: [2, 3, 4, 8, 10, 102]
Wydruk krotki przed sortowaniem: (1, 101, 10)
Wydruk listy posortowanej: [1, 10, 101]
Wydruk krotki: (1, 10, 101)
