# Zbiory w języku Python

### Statystyczna analiza danych
**dr inż. Wojciech Artichowicz**

**Katedra Geotechniki i Inżynierii Wodnej PG**

## Praca ze zbiorami w języku Python

Jednym z wbudowanych obiektów języka Python jest zbiór [`set`](https://docs.python.org/3/tutorial/datastructures.html#sets). Zbiory można utworzyć przy użyciu nawiasów klamrowych `{}` lub konstruktora [`set()`](https://docs.python.org/3/library/stdtypes.html#set). Zbiory mogą zawierać dowolne obiekty, każdy obiekt może się znaleźć w zbiorze tylko raz, natomiast kolejność elementów nie ma znaczenia.

#### Tworzenie pustego zbioru
Aby utworzyć zbiór pusty nalezy użyć funkcji [`set()`](https://docs.python.org/3/library/stdtypes.html#set). Użycie nawiasów klamrowych utworzy pusty słownik, nie zbiór.

In [1]:
empty_set = set() 
print( empty_set )

set()


Utworzenie zbioru zawierającego elementy może zostać zrealizowane z użyciem funkcji [`set()`](https://docs.python.org/3/library/stdtypes.html#set) lub nawiasów klamrowych. Dwie poniższe instrukcje tworzą identyczne zbiory:

In [2]:
set([1,2,3,"x"]) == {1,2,3,"x"}

True

Poniżej utworzony został zbiór i przypisany zmiennej `A`:

In [3]:
A = {1,2,3,"x"} 
A

{1, 2, 3, 'x'}

Aby sprawdzić czy element znajduje się w zbiorze należy użyć operatora `in`.

In [4]:
"x" in A # czy "x" jest w zbiorze A?

True

Do sprawdzania czy danego elementu nie ma w zbiorze nalezy użyć operatora `not in`.

In [5]:
"x" not in A # czy "x"'a nie ma w zbiorze A?

False

Dodawanie elementów do zbioru realizuje się przy użyciu metody `add()`.

In [6]:
A.add("y")
A

{1, 2, 3, 'x', 'y'}

Wielokrotne dodanie elementu do zbioru nie powoduje dodania kopii tego elementu.

In [7]:
A.add("a")
A.add("y")
A.add("x")

A

{1, 2, 3, 'a', 'x', 'y'}

Usuwanie elementu ze zbioru realizuje się przy użyciu funkcji `remove()`. Instrukcja poniżej usuwa element `"x"` ze zbioru `A`.

**Uwaga**: Próba usunięcia elementu, którego nie ma w zbiorze spowoduje błąd.

In [8]:
A.remove('x')
A

{1, 2, 3, 'a', 'y'}

W celu uniknięcia zgłaszania błędów, przed usunięciem elementu można sprawdzić czy znajduje się on w zbiorze.

In [9]:
element = 1
if element in A:
    A.remove(element)

### Operacje na zbiorach

Na zbiorach można realizować następujące operacje:
 - liczba elementów  $|A|$
 - suma $A \cup B$
 - iloczyn: $A \cap B$
 - różnica: $A - B$
 - różnica symetryczna: $A \Delta B$

In [10]:
A = {"a","b","c"}
B = {"b","c","d"}

c =len(A)
print("liczebność (moc) zbioru A=  " + str(c))

AuB = A | B # suma
print("suma = " + str(AuB) )

AiB = A & B # iloczyn
print("iloczyn = " + str(AiB) )

A_B = A - B # różnica
print("różnica = " + str(A_B) )

AdB = A ^ B # różnica symetryczna
print("różnica symetryczna (albo) = " + str(AdB) )

liczebność (moc) zbioru A=  3
suma = {'b', 'd', 'a', 'c'}
iloczyn = {'b', 'c'}
różnica = {'a'}
różnica symetryczna (albo) = {'a', 'd'}


### Zautomatyzowane tworzenie zbiorów

Jest wiele metod automatyzacji tworzenia zbiorów. Jednym z podstawowych jest użycie obiektów iterowalnych oraz pętli.

In [11]:
Z = {i for i in range(0,10,3)}
Z

{0, 3, 6, 9}

In [12]:
Z1 = {str(i)+j for i in range(0,10,3) for j in "abc"}
Z1

{'0a', '0b', '0c', '3a', '3b', '3c', '6a', '6b', '6c', '9a', '9b', '9c'}

### Biblioteka [`itertools`](https://docs.python.org/3/library/itertools.html)
Do generowania zbiorów na podstawie zależności kombinatorycznych można wykorzystać moduł **itertools**:
 - product(A,B) : tworzy iloczyn kartezjański dwóch zbiorów $A \times B$
 - permutation(A,N) : tworzy wszystkie $N$ elementowe permutacje zbioru $A$
 - combination(A,N) : tworzy wszystkie $N$ elementowe kombinacje zbioru $A$
 - combination_with_replacement(A,N) : tworzy wszystkie $N$ elementowe kombinacje zbioru $A$ z powtórzniami

In [13]:
from itertools import product, permutations, combinations, combinations_with_replacement

In [14]:
productAB = set( product(A,B) )# tworzy iloczyn kartezjański dwóch zbiorów
print(productAB)

permutation_3_out_of_A = set( permutations(A,3) )
print(permutation_3_out_of_A)

combination_2_out_of_A = set( combinations(A,2) )
print(combination_2_out_of_A)

combination_wr_2_out_of_A = set( combinations_with_replacement(A,2) )
print(combination_wr_2_out_of_A)

{('a', 'd'), ('a', 'b'), ('a', 'c'), ('c', 'd'), ('c', 'b'), ('b', 'd'), ('b', 'b'), ('c', 'c'), ('b', 'c')}
{('c', 'a', 'b'), ('b', 'a', 'c'), ('a', 'b', 'c'), ('a', 'c', 'b'), ('c', 'b', 'a'), ('b', 'c', 'a')}
{('a', 'b'), ('a', 'c'), ('b', 'c')}
{('a', 'b'), ('a', 'c'), ('c', 'c'), ('b', 'b'), ('b', 'c'), ('a', 'a')}
