# Kolekcje w Python

Kolekcje służą do przechowywania wielu obiektów w jednej strukturze. 
W Python mamy kila typów kolekcji:
* list - lista
* dictionary - słownik
* set - zbiór 
* tuple - niezmienialna lista (immutable list)

Kolekcja | Kolejność | Możliwa zmiana | Możliwe duplikaty
---|---|---|---
list | T | T | T
dictionary | T | T | N
set | N | T | N
tuple | T | N | T


## List

Lista służy do przechowywania wielu wartości w jednej zmiennej.

Lista w kodzie reprezentowana jest przez nawiasy kwadratowe `[]`, poniżej inicjalizacja pustej listy.

In [1]:
empty_list = []

In [2]:
empty_list

[]

 W przeciwieństwie do javy czy c++ wartości listy mogą być różnych typów.

In [None]:
mixed_list = [1, 2.0, "three", False]

In [4]:
mixed_list

[1, 2.0, 'three', False]

## Operacje na listach

## Dodawanie elementów

Dodawać elementy można na kilka sposobów:

* metoda `append` w klasie list: 
metoda przyjmuje jeden argument, którym jest obiekt do dodania do listy; obiekt zostanie dodany na końcu

In [13]:
mixed_list.append("I was appended!")

In [14]:
mixed_list

[1, 2.0, 'three', False, 'I was appended!']

* metoda `insert` klasy list:
metoda przyjmujedwa argumenty, pierwszy to pozycja na której obiekt ma zostać wstawiony, druga to obiekt do wstawienia; elementy listy od podanego indeksu do konca listy zostają przesunięte w prawo:

In [15]:
mixed_list.insert(2, "two and a half?")

In [16]:
mixed_list

[1, 2.0, 'two and a half?', 'three', False, 'I was appended!']

* operacja dodawania: `lista + lista`: uwaga! operacja nie zmienia oyginalnego obiektu w przeciwieństwie do w/w metod:


In [18]:
mixed_list + ["I won't be here"]

[1,
 2.0,
 'two and a half?',
 'three',
 False,
 'I was appended!',
 "I won't be here"]

sprawdźmy, czy mamy nowy element na liście:


In [19]:
mixed_list

[1, 2.0, 'two and a half?', 'three', False, 'I was appended!']

Żeby utrwalić zmianę należy wynik operacji przypisać z powrotem do zmiennej:

In [21]:
mixed_list = mixed_list + ['I was added']

In [22]:
mixed_list

[1, 2.0, 'two and a half?', 'three', False, 'I was appended!', 'I was added']

### Dodawanie list

Jak widać na przykładzie powyżej, można dodawać do siebie listy. Powyżej na drugiej liście był tylko jeden element, ale może być ich więcej:

In [24]:
mixed_list = mixed_list + [8, 9.0, "ten"]

In [27]:
mixed_list

[1,
 2.0,
 'two and a half?',
 'three',
 False,
 'I was appended!',
 'I was added',
 8,
 9.0,
 'ten']

Pytanie, czy możemy dodać drugą listę do pierwszej używają w/w metod? 
Możemy, ale cała lista zostanie dodana jako pojedynczy element:
    

In [28]:
mixed_list.append(["my", "new", "list"])

In [33]:
mixed_list

[1,
 2.0,
 'two and a half?',
 'three',
 False,
 'I was appended!',
 'I was added',
 8,
 9.0,
 'ten',
 ['my', 'new', 'list'],
 'I',
 'was',
 'extended']

Aby poprawnie dodać wszystkie elementy listy do drugiej używamu metody `extend`:

In [31]:
mixed_list.extend(["I", "was", "extended"])

In [4]:
list1 = [1, 2, 3]
list2 = [4, 5, 6]
list1.extend(list2)

In [5]:
print(list1)

[1, 2, 3, 4, 5, 6]


In [32]:
mixed_list

[1,
 2.0,
 'two and a half?',
 'three',
 False,
 'I was appended!',
 'I was added',
 8,
 9.0,
 'ten',
 ['my', 'new', 'list'],
 'I',
 'was',
 'extended']

### Usuwanie elementów listy

Klasa `list` ma dwie metody do usuwania elementów:
* `pop` - przyjmuje (opcjonalnie) indeks elementu do usunięcia, zwraca element; jeśli nie podano indeksu zwraca ostatni element (index = -1)
* `remove` - przyjmuje obiekt do usunięcia, usuwa pierwsze wystąpienie, nie zwraca wartości; jesli obiektu nie ma na liście rzucany jest wyjątek `ValueError`

Istnieje też operacja `del` po której podajemy zakres do usunięcia.

In [34]:
# pobieramy pierwszy element
element = mixed_list.pop(0) 

In [35]:
print(f"element == {element}, lista == {mixed_list}")

element == 1, lista == [2.0, 'two and a half?', 'three', False, 'I was appended!', 'I was added', 8, 9.0, 'ten', ['my', 'new', 'list'], 'I', 'was', 'extended']


In [36]:
# usuwamy element o wartości 'three', funkcja nie zwróci wartości
element = mixed_list.remove('three') 

In [37]:
print(f"element == {element}, lista == {mixed_list}")

element == None, lista == [2.0, 'two and a half?', False, 'I was appended!', 'I was added', 8, 9.0, 'ten', ['my', 'new', 'list'], 'I', 'was', 'extended']


In [38]:
# spróbujmy usunąć nieistniejący element:
element = mixed_list.remove('three') 

ValueError: list.remove(x): x not in list

In [39]:
# usuwamy elementy od 10 do końca
del mixed_list[10:]

In [40]:
mixed_list

[2.0,
 'two and a half?',
 False,
 'I was appended!',
 'I was added',
 8,
 9.0,
 'ten',
 ['my', 'new', 'list'],
 'I']

In [41]:
# jeśli podany zakres jest niepoprawny nic się nie dzieje
del mixed_list[12:]

In [42]:
mixed_list

[2.0,
 'two and a half?',
 False,
 'I was appended!',
 'I was added',
 8,
 9.0,
 'ten',
 ['my', 'new', 'list'],
 'I']

### Inne metody klasy `list`

* `clear()` - usuwa wszystkie elementy listy
* `count(x)` - zwraca liczbę wystąpień x na liście
* `sort()` - sortuje elementy in-place (tzn. sortuje listę na której wywoływana jest metoda), nie zwraca wartości, można podać argument `reverse=True`
* `reverse()` - odwraca listę in-place
* `copy()` - zwraca kopię listy

Tutaj: [pełna lista metod ](https://docs.python.org/3/tutorial/datastructures.html#more-on-lists)

In [43]:
[1,2,3,1,3,2,5].count(1)

2

In [44]:
# sort nic nie zwróci, trzeba użyć zmiennej
print([1,2,3,1,3,2,5].sort())

None


In [45]:
to_be_sorted = [1,2,3,1,3,2,5]
to_be_sorted.sort(reverse=True)
print(to_be_sorted)

[5, 3, 3, 2, 2, 1, 1]


In [46]:
to_be_sorted.reverse()
print(to_be_sorted)

[1, 1, 2, 2, 3, 3, 5]


Aby losowo zmienić kolejność elementów na liście ("przetasować") używamy funkcji:
* `random.shuffle(lista)` - zmienia kolejność elementów na liście podanej w argumecie wywołania, nie zwraca wyniku
* `random.sample(lista, dlugosc)` - zwraca losową próbkę z listy o podanej długości, nie zmienia listy podanej w argumencie

In [6]:
import random
lst = [1,2,3,4,5,6]
print(random.shuffle(lst))
print(lst)
lst = [1,2,3,4,5,6]
print(random.sample(lst, len(lst)))
print(lst)

None
[6, 4, 5, 3, 2, 1]
[6, 5, 2, 4, 1, 3]
[1, 2, 3, 4, 5, 6]


### inne operacje na listach

* `len(list)` - zwraca długość listy
* `enumerate(list)` - zwraca obiekt enumerate - tj. pary (indeks, wartość)
* `zip(list_1, list_2, .. list_n, strict=False)` - zwraca kombinacje wartości z każdej listy: (list_1[0], list_2[0], .., list_n[0]) dopóki każda z list ma wartości

In [5]:
print(len([1,2,3]))

3


In [48]:
print(list(enumerate(['eins', 'zwei', 'drei'])))

[(0, 'eins'), (1, 'zwei'), (2, 'drei')]


In [4]:
names = ['Alice', 'Bob', 'Charlie', 'David']
pets = ['cats', 'dogs', 'python']
print(list(zip(names, pets)))

[('Alice', 'cats'), ('Bob', 'dogs'), ('Charlie', 'python')]


## Tuple
Tuple to kolekcja zachowująca kolejność, w której mogą pojawić się duplikaty, natomiast nie ona niezmienna (immutable). Oznacza to, że nie można dodawać, usuwać ani modyfikować składowych tuple'a.



In [2]:
my_tuple = (1, 2, 3, 4)
print(my_tuple[2])
print(my_tuple[1:3])

3
(2, 3)


Przydatną funcjonalnością jest tzw. tuple unpacking, tj rozpakownanie tuple'a do zmiennych:

In [3]:
coords = (10, -3)
(x, y) = coords
print(f"My coordinates are:  ({x}, {y})")

My coordinates are:  (10, -3)


## Set

Obiekt set służy do przchowywania zbiorów, tzn. jest kolekcją, w której element może wystąpić conajwyżej raz.
Kolejność nie jest zachowana, można modyfikować obiekt, tzn. dodawać i usuwać elementy.

Obiekt set zapisujemy używając nawiasów "wąsatych" `{}`


In [1]:
my_empty_set = {}

In [2]:
print(f"{my_empty_set} is of type {type(my_empty_set)}")

{} is of type <class 'dict'>


In [3]:
odds_set = {1,3,7}

In [4]:
print(f"{odds_set} is of type {type(odds_set)}")

{1, 3, 7} is of type <class 'set'>


Elementami zbioru mogą być obiekty różnych typów:

In [6]:
pi_set = {3, "pi", 3.14}

In [7]:
pi_set

{3, 3.14, 'pi'}

### Operacje na setach

Dodawanie i usuwanie elementów:

* `set.add(elem)` - dodaje element, operacja jest idempotentna
* `set.remove(elem)` - usuwa element, jeśli brak rzuca `KeyError`, nie zrwaca wartości
* `set.pop()` - zwraca losowy element zbioru (brak sortowania!) i usuwa element ze zbioru
* `set.update(another_set)` - dodaje elementy `another_set` do zbioru

Logika zbiorów:

* `A.union(B)` - zwraca sumę zbiorów `A ∪ B` 
* `A.interset(B)` - zwraca przecięcie zbiorów `A ∩ B`
* `A.diffrence(B)` - zwraca różnicę zbiorów `A \ B`
* `A.issubset(B)` - zwraca True jeśli A jest podzzbiorem B
* `A.issuperset(B)` - zwraca True jeśli A zawiera zbiór B


In [9]:
odds_set.add(5)

In [10]:
odds_set

{1, 3, 5, 7}

In [11]:
odds_set.add(5)

In [12]:
odds_set

{1, 3, 5, 7}

In [13]:
odds_set.remove(7)

In [15]:
odds_set

{1, 3, 5}

In [16]:
odds_set.remove(7)

KeyError: 7

In [17]:
elem = odds_set.pop()

In [18]:
print(f"elem = {elem}, set =  {odds_set}")

elem = 1, set =  {3, 5}


### Operatory działające na zbiorach

Zbiory można dodawać, przecinać itd używając operatorów:

Sprawdzenia logiczne:
* `key in A` - czy zbiór A zawiera element key
* `key not in A` -  czy zbiór A nie zawiera element key
* `A == B` - czy zniory są  równe
* `A != B` - czy zbiory są rózne
* `A <= B` - czy A jest podzbioreem  B  
* `A > B` -  czy B jest podzbiorem A

Operacje:
* `A | B` - zwraca sumę zbiorów `A ∪ B`
* `A & B` - zwraca przecięcie zbiorów `A ∩ B`
* `A – B` - zwraca różnicę zbiorów `A \ B`
* `A ˆ B` - zwraca alternatywę rozłączną (xor) zbiorów, tj.  elementy które są w  dokładnie jednym  ze zbiorów

Operacje nie modyfikują zbiorów, na których operują, w przeciwieństwie do metod `union()`, `intersect()`. Aby zachować wynik operacji, naley go podstawić pod zmienną:
`C = A | B`
lub jeśli chcemy nadpisać jeden ze zbiorów:
`A = A|B`
lub notacja skrócona:
`A |= B` co jest równowane z `A.union(B)`

In [1]:
set_1 = {1, 2,3, 4, 5, 6}
set_2 = {5, 6, 7, 8, 9, 10}
print("set_1 = ", set_1) 
print("set_2 = ", set_2) 

print(f"Suma zbiorów set_1 i set_2 = {set_1| set_2} ") 
print(f"Przecięcie zbiorów set_1 i set_2 = {set_1 & set_2} ")
print(f"Róznica zbiorów set_1 i set_2 = {set_1- set_2} ")
print(f"xor zbiorów set_1 i set_2 = {set_1 ^ set_2} ")

set_1 =  {1, 2, 3, 4, 5, 6}
set_2 =  {5, 6, 7, 8, 9, 10}
Suma zbiorów set_1 i set_2 = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10} 
Przecięcie zbiorów set_1 i set_2 = {5, 6} 
Róznica zbiorów set_1 i set_2 = {1, 2, 3, 4} 
xor zbiorów set_1 i set_2 = {1, 2, 3, 4, 7, 8, 9, 10} 


## Dictionary

Dictionary jest strukturą przechowującą wiele elementów, w której zamiast indeksów używamy kluczy, tzn. każdy element zzamiast pozycji w koklekcji ma unikalny identyfikator zwany kluczem, każdy element słownika jest więc parą `klucz:wartość`. Wartości mogą być dowo
Dictionary zapisywany jest podobnie jak set w nawiasach wąsatych `{}`.

In [1]:
empty_dict = {}
print(f"{empty_dict} is of typy {type(empty_dict)}")

{} is of typy <class 'dict'>


In [3]:
favourites = {'pet': 'dog', 'food': 'pizza', 'number': 3.14}
print(favourites)

{'pet': 'dog', 'food': 'pizza', 'number': 3.14}


In [10]:
another_dict = {1:2, 3:4, 3.14:'pi', 'e': 2.71828}
print(another_dict)

{1: 2, 3: 4, 3.14: 'pi', 'e': 2.71828}


### Operacje na słownikach

Do elementów słownika odwołujemy się za pomocą kluczy:
```python
value = my_dict[key]
my_dict[key] = value
```
Przy instrukcji podstawienia `my_dict[key] = value` jeśli klucz istnieje to zostanie dodana nowa para `klucz:wartość`, jeśli istnieje, wartość zostanie zastąpiona:

In [13]:
favourites['food'] = 'kebab'
favourites['sport'] = 'curling'
print(favourites)

My. fav pet is dog
{'pet': 'dog', 'food': 'kebab', 'number': 3.14, 'sport': 'curling'}


w przypadku pobierania wartości, jeśli klucza nie ma, zostanie rzucony wyjątek:

In [20]:
print(f"My favourite pet is {favourites['pet']}")
print(f"My favourite programmig language is {favourites['programming_language']}")

My favourite pet is dog


KeyError: 'programming_language'

### Metody klasy dict

* `d.update(another_dict)` - dokleja słownik `another_dict` do `d`
* `d.pop(key)` - usuwa element o podanym kluczu ze słownika
* `d.popitem()` - usuwa ostatnio dodany element (od Pythona 3.7)
* `d.clear()` - usuwa wszystkie elementy
* `d.copy()` - zwraca kopię słownika

In [3]:
d1 = {"a": 1, "b": 2}
d2 = {"c": 3, "d": 4}
d1.update(d2)
print(f"after update: {d1}")
d1.pop("d")
print(f"After pop: {d1}")
d1.popitem()
print(f"After popitem: {d1}")

after update: {'a': 1, 'b': 2, 'c': 3, 'd': 4}
After pop: {'a': 1, 'b': 2, 'c': 3}
After popitem: {'a': 1, 'b': 2}


### Przeglądanie słowników

Często potrzebujemy przejrzeć cały słownik, nie wiemy jakie są klucze (a chcemy uniknąć `KeyError`)

In [14]:
for i in favourites:
    print(i)

pet
food
number
sport


In [16]:
for i in favourites.keys():
    print(i)

pet
food
number
sport


In [17]:
for i in favourites.values():
    print(i)

dog
kebab
3.14
curling


In [19]:
for (k, v) in favourites.items():
    print(f"{k} == {v}")

pet == dog
food == kebab
number == 3.14
sport == curling
