### Materiały do zajęć laboratoryjnych nr 10

# Python – kolekcje

Język Python, oprócz prostych typów danych, jak liczby całkowite (`int`) i zmiennoprzecinkowe (`float`), dostarcza kilka typów danych umożliwiających przechowywanie kolekcji. Wyróżniamy:

1. Listy – uporządkowane sekwencje obiektów (liczb, łańcuchów itp.), których wartość może być zmieniana (ang. _mutable_).
2. Krotki – jak wyżej, ale elementy nie mogą zostać zmodyfikowane po utworzeniu krotki (ang. _immutable_).
3. Słowniki – nieuporządkowane zbiory par `key:value`, czyli `klucz:wartość`.

**Uwaga!** Łańcuchy, czyli zmienne typu `str`, są w rzeczywistości krotkami znaków.

W razie wątpliwości, z jakim typem danych mamy do czynienia, możemy użyć funkcji `type`:

In [30]:
print(type(1))
print(type(1.0))
print(type('1.0'))
print(type(['1.0']))

<class 'int'>
<class 'float'>
<class 'str'>
<class 'list'>


Listy, krotki i *strings* (łańcuchy, czyli ciągi znaków) współdzielą pewien zbiór funkcjonalności.

# Listy

Listy definiujemy używając nawiasów kwadratowych i przecinków.

Definiowanie pustej listy:

In [None]:
first_list = []
print(len(first_list))

0


Definiowanie listy z zawartością:

In [None]:
second_list=['a', 5, 3.1415, [1, 2]]
print(second_list)

['a', 5, 3.1415, [1, 2]]


Jak widać, elementy listy nie muszą mieć tego samego typu. Zauważmy też, że ostatni element powyższej listy sam jest listą. Stworzyliśmy więc strukturę hierarchiczną.

Do elementów listy można się odwoływać używając wyrażenia `lista[indeks]`. Numeracja elementów zaczyna od `0`, a ostatni element ma indeks równy `len(list)-1`.

Można używać również indeksów o wartościach ujemnych:

* indeks `[-1]` oznacza odwołanie do ostatniego elementu listy,
* indeks `[-2]` oznacza odwołanie do przedostatniego elementu listy,
* itd.

Poniżej przykład ilustrujący te właściwości:

In [6]:
print(second_list[0])
print(second_list[1])
print(second_list[-1])
print(second_list[-2])

a
5
[1, 2]
3.1415


Ponieważ ostatni element listy, tj. `second_list[-1]`, sam jest listą, do jego elementów można odwoływać się w identyczny sposób, tj. podając kolejny indeks w nawiasach kwadratowych:

In [7]:
print(second_list[-1][0])
print(second_list[-1][-1])

1
2


Ponieważ listy mogą zawierać w sobie inne listy, to tworzenie macierzy jest w Pythonie stosunkowo proste:

In [None]:
matrix_2D = [[1,2], [3,4]]
print(matrix_2D[0][0])
print(matrix_2D[1][1])

1
4


(W praktyce preferowane jest jednak korzystanie z macierzy zdefiniowanych w bibliotece numerycznej `numpy`, którą poznamy na kolejnym ćwiczeniu.)

Zmiana wartości elementu listy odbywa się również z użyciem notacji indeksowej.

In [None]:
print(second_list)
second_list[0] = 'b'
second_list[1] = 'b'
second_list[-1] = [2, 3, 1]
print(second_list)

['a', 5, 3.1415, [1, 2]]
['b', 'b', 3.1415, [2, 3, 1]]


## Metody list

Python udostępnia pewien zbiór funkcji (**metod**), które można **wywołać na rzecz** zmiennej typu `list`. 

* `list.append(x)` dodaje element `x` na końcu listy `list`:

In [None]:
# first_list została stworzona jako pusta lista
first_list.append('1')
print(first_list)

['1']


* `list.extend(sekwencja)` dołącza na koniec `list` po kolei wszystkie elementy `sekwencji`.

In [11]:
first_list.extend(second_list)
print(first_list)

['1', 'b', 'b', 3.1415, [2, 3, 1]]


   **Uwaga**: Jeżeli do listy dołączymy inną listę _wieloelementową_ używając metody `append` (zamiast `extend`), to ta pierwsza zwiększy swą długość o `1`, bo potraktuje dołączane dane jako jeden element typu `list`:

In [31]:
first = [1, 2]
second = [3, 4]
first.append(second)
print(first, 'długość:', len(first))

[1, 2, [3, 4]] długość: 3


   Natomiast jeśli zamiast `append` użyjemy `extend`:

In [32]:
first = [1, 2]
second = [3, 4]
first.extend(second)
print(first, 'długość:', len(first))

[1, 2, 3, 4] długość: 4


* `list.count(x)` zwraca informację, ile razy element o wartości `x` wystąpił w ramach `list`:

In [14]:
print(first_list.count('b'))

2


* `list.insert(i, x)` wstawia element `x` na `i`-tą pozycję, przesuwając wszystkie kolejne elementy o jedną pozycję w prawo. Pamiętajmy, że indeksowanie list i krotek rozpoczynamy od zera:

In [33]:
first_list.insert(1, 'a')
print(first_list)

[1, 'a', 2, 3, 4]


* `list.pop(i)` usuwa element spod indeksu `i` i zwraca ten element:

In [16]:
print(first_list.pop(1))
print(first_list)

a
['1', 'b', 'b', 3.1415, [2, 3, 1]]


* `list.remove(x)` usuwa z `list` pierwszy element, którego wartość wynosi `x`:

In [17]:
first_list.remove('b')
print(first_list)

['1', 'b', 3.1415, [2, 3, 1]]


* `list.reverse()` odwraca kolejność elementów `list`:

In [18]:
first_list.reverse()
print(first_list)

[[2, 3, 1], 3.1415, 'b', '1']


* `list.sort()` sortuje zawartość `list`. Elementy muszą być porównywalne: posortować można np. listę liczb czy listę łańcuchów, ale nie listę zawierającą elementy obu tych typów:

In [34]:
first_list = [1, 4, 2, 11, 0.12, 0.44]
first_list.sort()
print(first_list)

[0.12, 0.44, 1, 2, 4, 11]


**UWAGA!** Metody `reverse` i `sort` modyfikują listę, na rzecz której są wywoływane, lecz nie zwracają żadnego wyniku. Dlatego wywołanie `print(first_list.sort())` nie miałoby sensu.

* `list.index(x)` zwraca indeks pierwszego elementu `list`, którego wartość wynosi `x`:

In [20]:
print(second_list.index('b'))

0


* `list.clear()` usuwa wszystkie elementy z `list`:

In [21]:
first_list.clear()
second_list.clear()
print(first_list,second_list)

[] []


**UWAGA!** Kopiowanie zmiennych typu lista w języku Python może być zwodnicze. Zastosowanie **operatora przypisania** `=` nie tworzy kopii i prowadzi do wystąpienia efektów ubocznych, co ilustruje poniższy przykład:

In [35]:
first_list = [1, 2, 3, 4]
second_list = first_list # Czy wiemy, co robimy?
second_list[0] = 5
print(first_list)
print(second_list)

[5, 2, 3, 4]
[5, 2, 3, 4]


Jak widać, zmiana wprowadzona w `second_list` jest widoczna również w `first_list`. To dlatego, że operacja `second_list = first_list` spowodowała wyłącznie utworzenie nowej **referencji** do istniejącej listy, czyli (w uproszczeniu) przypisanie do niej nowej nazwy. Innymi słowy, nazwy `first_list` i `second_list` wskazują na ten sam obszar pamięci, w którym przechowywane są cztery liczby. W celu utworzenia nowej, niezależnej od oryginału kopii należy wykorzystać metodę:

* `list.copy()` zwracającą kopię `list`:

In [None]:
first_list = [1, 2, 3, 4]
second_list=first_list.copy()
second_list[0] = 5
print(first_list)
print(second_list)

[1, 2, 3, 4]
[5, 2, 3, 4]


## Listy składane (ang. _list comprehensions_)

Jest to mechanizm, który umożliwia zwięzłe i szybkie tworzenie list z wybranych i/lub poddanych pewnym operacjom elementów innych kolekcji. Składnia w podstawowej wersji ma postać:

```python
   [ expression(element) for element in collection ]
```

Pętla `for` przebiega przez wszystkie elementy `collection` i dla każego z nich, chwilowo przechowywanego w zmiennej `element`, wykonuje operację `expression`, a jej wynik umieszcza w nowej liście. Na przykład:

In [None]:
print([ i for i in range(10) ])
print([ i**2 for i in range(10) ])

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]


Bardziej rozbudowana postać pozwala zawęzić zbiór elementów do tych spełniających podany warunek:
```python
   [ expression(name) for name in collection if condition ]
```
Na przykład tworzenie listy zawierającej kwadraty _parzystych_ elementów innej listy:


In [37]:
print([ i**2 for i in range(10) if i%2 == 0 ])

[0, 4, 16, 36, 64]


Inny przykład – wyszukiwanie polskich znaków w zadanym zdaniu:

In [38]:
sentence = "Zażółć gęślą jaźń"
print([ char for char in sentence if char in "ĄąĆćĘęŁłŃńÓóŚśŹźŻż" ])

['ż', 'ó', 'ł', 'ć', 'ę', 'ś', 'ą', 'ź', 'ń']


Instrukcja warunkowa `if element in sequence` zwraca `True`, gdy `element` występuje w zbiorze `sequence` lub `False` w przeciwnym przypadku.

# Krotki (ang. _tuples_)

Krotki definiujemy, używając nawiasów okrągłych i przecinków:

In [39]:
first_tuple = ('a', 5, 3.1415, (1, 2))
print(first_tuple)

('a', 5, 3.1415, (1, 2))


Podobnie jak do elementów listy, do elementów krotki można się odwoływać, używając wyrażenia `krotka[indeks]`:

In [28]:
print(first_tuple[0])
print(first_tuple[-1])

a
(1, 2)


Zmiana elementów krotki **nie jest możliwa**. Przy próbie wykonania takiej czynności otrzymamy komunikat:

In [None]:
first_tuple[0] = 'b'

TypeError: 'tuple' object does not support item assignment

Ponieważ krotki są niezmienne (ang. _immutable_), dlatego też zbiór funkcji (metod), które można wywołać na rzecz zmiennej typu `krotka` jest bardzo krótki:

* `krotka.count(element)`,
* `krotka.index(element)`.

Ich działanie jest identyczne jak w przypadku zmiennych typu `lista`.

Czasem zachodzi konieczność utworzenia **krotki jednoelementowej**. Okazuje się, że umieszczenie pojedynczego elementu w nawiasach okrągłych nie jest dobrym pomysłem. Nawiasy te zostaną wtedy zignorowane, a cała konstrukcja zostanie zinterpretowana jako "wyłuskany" z tych nawiasów element:

In [42]:
x = (1)
print(type(x))

<class 'int'>


Rozwiązaniem jest umieszczenie przecinka za jedynym elementem krotki:

In [43]:
y = (1,)
print(type(y))

<class 'tuple'>


# Operacje wycinania (ang. _slicing_)

W języku Python dostępna jest składnia, która w znaczny sposób ułatwia pobieranie "podsekwencji" ze zmiennych typu lista, krotka czy też łańcuch. Ma ona postać: `Any_Sequence[start:end]` i zwraca kopię sekwencji elementów. Kopiowanie odbywa się od elementu wskazywanego przez indeks `start` aż do _elementu poprzedzającego_ element wskazywany przez indeks `end`.

In [44]:
first_list = [1, 2, 3, 4]
first_tuple =(5, 6, 7, 8)
first_string = "abcdefgh"
print(first_list[1:3])
print(first_tuple[1:3])
print(first_string[3:6])

[2, 3]
(6, 7)
def


Jeżeli pominiemy parametr `start`, to otrzymamy kopię rozpoczynającą się od początkowego ("zerowego") elementu sekwencji:

In [None]:
print(first_string[:6])

Jeżeli natomiast pominiemy parametr `end`, to otrzymamy kopię rozpoczynającą się od elementu wskazywanego indeksem `start` aż do ostatniego elementu sekwencji:

In [None]:
print(first_string[4:])

Pominięcie obu parametrów tworzy kopię całej sekwencji:

In [None]:
second_list=first_list[:] # ekwiwalent first_list.copy()
print(second_list)

# Extended slices

Dostępna jest też forma składni "wycinania" w postaci: `Any_Sequence[start:end:step]`, która przy kopiowaniu pobiera elementy z zadanym krokiem:

In [45]:
first_list = [1, 2, 3, 4, 5, 7, 8, 9]
print(first_list[3:7:2])

[4, 7]


Przy braku podania parametrów `start` i `end` kopiowana jest cała sekwencja z krokiem `step`, począwszy od elementu o indeksie `0`:

In [None]:
first_list = range(11)
first_string = "abcdefghij"
print(first_list[::2], first_string[::3])

: 

Dopuszczalne jest nadawanie parametrowi `step` wartości ujemnych. Wówczas elementy kopiowane są zaczynając od końca sekwencji

In [None]:
print(first_list[::-2], first_string[::-3])

Użycie `step=-1` powoduje odwrócenie kolejności elementów:

In [None]:
print(first_string[::-1])

# Słowniki (ang. _dictionaries_)

Słowniki są jedną z najbardziej uniwersalnych struktur danych w języku Python. Typ ten pozwala na mapowanie zbioru unikatowych `kluczy` na zbiór `wartości`. Słowniki definiujemy, używając nawiasów klamrowych i przecinków, podając pary `key:value`.

In [None]:
empy_dict = {} # Pusty słownik
print(empy_dict)
numbers = {'one': 1, 'two': 2} # Mapowanie napisów na liczby. 
print(numbers)
colors = { # Mapowanie napisów na krotki.
   'red': (255, 0, 0), 
   'green': (0, 255, 0), 
   'blue': (0, 0, 255)
}
print(colors)

{}
{'one': 1, 'two': 2}
{'red': (255, 0, 0), 'green': (0, 255, 0), 'blue': (0, 0, 255)}


Odwołanie się do wartości związanej z danym kluczem odbywa się przy użyciu wyrażenia `słownik[klucz]`.

In [None]:
print(colors['blue'])

Dodanie nowej pary `key:value` odbywa się również przy użyciu notacji indeksowej:

In [None]:
colors['yellow'] = (255, 255, 0)
print(colors)

Zmiana wartości przywiązanej do klucza odbywa się z użyciem identycznej składni:

In [None]:
colors['yellow']=(255,255,1)
print(colors)

Python udostępnia pewien zbiór funkcji (metod), które można wywołać na rzecz zmiennej typu `dict`:

Możemy je wyświetlić, stosując mechanizm list składanych.


In [None]:
print([name for name in  dir(dict) if name.startswith('__')==False])

Warunek `name.startswith('__')==False` odfiltrowuje wszyskie tzw. "magiczne" funkcje, których użytkownik nigdy nie wywołuje bezpośrednio. 

Funkcje:`keys()`, `values()` i `items()` wyświetlają odpowiednio:

In [None]:
print(colors.values())
print(colors.keys())
print(colors.items())

**Słowniki składane**

Podobnie jak w przypadku list, także w przypadku słowników możemy używać składni w postaci:

`{key: value for key, value in some_dict.items() (option if condition)}`

In [None]:
print({v:k for k,v in colors.items()}) # zamiana wartości z kluczem
print({k:v for k,v in colors.items() if v[2]>0}) # wyszukanie wszystkich kolorów dla których trzecia składowa>0
print({k:v for k,v in colors.items() if v[0]>0 and v[1]>0})

------------------------------------------------------------------------------------------------------------------

Informacje na temat języka najlepiej czerpać z oficjalnej strony [z dokumentacją języka Python](https://docs.python.org/)