# Struktury danych

Inna nazwa - kolekcje.

## `list`

Jeśli chcemy przechować w pamięci treść wielu zadań, możemy stworzyć *n* niezależnych zmiennych:

In [None]:
task_1 = "Learn Python"
task_2 = "Do exercises"
task_3 = "Drink coffee"
task_4 = "Finish my work"

Jednak takie podejście sprawi, że dla każdego nowego zadania musimy stworzyć osobną zmienną i w konsekwencji będziemy mieć ich bardzo wiele.

Zamiast tego, możemy stworzyć **jedną zmienną**, która przechowa całą **listę** zadań:

In [None]:
tasks = ["Learn Python", "Do exercises", "Drink coffee", "Finish my work"]
tasks

In [None]:
type(tasks)

Listę możemy indeksować podobnie jak stringa.

In [None]:
tasks[0]

In [None]:
tasks[1]

In [None]:
tasks[-1]

In [None]:
tasks[-2]

Modyfikacja elementów listy:

In [None]:
tasks

In [None]:
tasks[2] = "Drink tea"
tasks

Listy mogą składać się z elementów różnych typów, np:

In [None]:
mixed_list = ["a", 1, 2.34, True, None]
mixed_list

Tworzenie pustej listy

In [None]:
empty_list = []
empty_list

In [None]:
empty_list = list()
empty_list

**`list` – podsumowanie:**

- Lista to szereg wartości zorganizowanych w ramach jednej struktury danych, jednej zmiennej
- Do elementów listy możemy się dostać poprzez podanie ich indeksów. Indeksacja zaczyna się od 0 (idąc od początku do końca listy) lub od -1 (idąc od końca do początku)
- Aby zmodyfikować wartość elementu listy (lub przedziału elementów) należy odwołać się do niego po indeksie a następnie przypisać nową wartość
- Listy mogą składać się z obiektów różnych typów

## `tuple`

Tupla jest strukturą podobną do listy, jednak nie można jej modyfikować.

In [None]:
possible_priorities = (1, 2, 3)

In [None]:
type(possible_priorities)

In [None]:
possible_priorities[0]

In [None]:
possible_priorities[1]

In [None]:
possible_priorities[1] = 20

In [None]:
1, 2, 3

In [None]:
1,

In [None]:
(1)

In [None]:
("a", 1, 2.34, True, None)

In [None]:
empty_tuple = ()
empty_tuple

In [None]:
empty_tuple = tuple()
empty_tuple

**`tuple` – podsumowanie:**

- Tuple działają podobnie jak listy, ale są niemutowalne - to znaczy że nie możemy modyfikować ich zawartości
- Tworząc tuplę możemy użyć do jej zapisu nawiasów okrągłych, ale to przecinek jest niezbędny do tego aby powstała tupla
- Tuple mogą składać się z obiektów różnych typów

## `dict`

Słownik (*dictionary*) jest zestawem par klucz-wartość. Oznacza to, że do wartości w nim dostajemy się po kluczu, a nie pozycji.

In [None]:
task = {
    "description": "Learn Python",
    "assignee": "Andrzej",
    "priority": 1,
    "time_logged": 6.75,
    "is_complete": False,
    "due_date": None
}

task

In [None]:
task["description"]

In [None]:
task["is_complete"]

---

In [None]:
comment = {
    "text": "Good luck!",
    "author": "Andżela",
    "date": "2023-04-25"
}
comment

In [None]:
comment["date"]

---
**Wartościami** w słowniku moga być **dowolne obiekty**.

**Klucze** słownika muszą być **obiektami hashowalnymi**. O tym później.

**`dict` – podsumowanie:**
- Słownik to zestaw par klucz-wartość. Odwołując się do poszczególnych kluczy, możemy dostać się do wartości, które znajdują się pod nimi
- Dowolny obiekt może być wartością w słowniku, kluczami mogą być tylko obiekty hashowalne

## `set`

Zbiór (*set*) jest zestawem unikalnych wartości, których kolejność jest nieistotna.

In [None]:
available_categories = {"dev", "work", "home"}
available_categories

In [None]:
{"dev", "work", "home"} == {"dev", "home", "work"}

In [None]:
{"dev", "dev", "dev"}

In [None]:
list_with_duplicates = ["dev", "dev", "work"]

In [None]:
set(list_with_duplicates)

In [None]:
unique_items_list = list(set(list_with_duplicates))
unique_items_list

**`set` – podsumowanie:**

- `set` to struktura danych przechowująca zbiór unikalnych wartości
- Kolejność elementów w zbiorze nie ma znaczenia. Po jej zamianie mamy do czynienia z dokładnie tym samym zbiorem
- `set` może zostać użyty do wyznaczenia unikalnych elementów w liście/tupli

> **ZADANIA**

## Operacje na strukturach danych

### `list`

In [None]:
tasks = ["Learn Python", "Do exercises", "Drink coffee", "Finish my work"]
tasks

###### len

Funkcja wbudowana `len()` zwraca długość listy.

In [None]:
len(tasks)

###### append

Metoda `append()` dodaje nowy elementu **na końcu** listy.

In [None]:
tasks.append("Make food")

In [None]:
tasks

###### split

Metoda `split()` wywołana **na stringu** dzieli go i zwraca **listę stringów**.

In [None]:
task = "Finish my work"

task.split()

In [None]:
task.split("i")

###### join

Do metody `join()` wywołanej **na stringu** przekazujemy **listę stringów**. Zwraca ona stringa.

In [None]:
" - ".join(["Finish", "my", "work"])

###### sorted

Funkcja wbudowana `sorted()` **przyjmuje listę** oraz zwraca ją **posortowaną rosnąco**. 

Zmiana kolejności nie nadpisuje się trwale na liście.

Możemy odwrócić kolejność sortowania.

In [None]:
priorities_of_tasks = [2, 3, 1]

sorted(priorities_of_tasks)

In [None]:
sorted(priorities_of_tasks, reverse=True)

In [None]:
priorities_of_tasks

###### pop

Metoda `pop()` **usuwa oraz zwraca** element listy. Domyślnie jest to **ostatni** element, ale możemy przekazać indeks innego.

In [None]:
tasks

In [None]:
tasks.pop()

In [None]:
tasks

In [None]:
tasks.pop(1)

In [None]:
tasks

***dodawanie i mnożenie list***

Listy możemy do siebie **dodawać** a także **mnożyć** je przez liczby całkowite.

In [None]:
[0] * 8

In [None]:
[1, 2, 3] * 5

In [None]:
["a", "b", "c"] + ["d", "e"]

Jeżeli lista będzie w zmiennej, wykonanie na niej powyższych operacji nie zmodyfikuje zmiennej:

In [None]:
a = [0]
a

In [None]:
a * 8

In [None]:
a

In [None]:
a + [1, 2]

In [None]:
a

### `tuple`

In [None]:
possible_priorities

###### len

Funkcja wbudowana `len()` zwraca długość tupli.

In [None]:
len(possible_priorities)

###### index

Metoda `index()` przyjmuje element tupli i zwraca jego indeks.

Jeśli element ten nie występuje, pojawi się błąd.

In [None]:
possible_priorities.index(1)

###### count

Metoda `count()` przyjmuje element tupli i zwraca informację o liczbie jego wystąpień.

In [None]:
possible_priorities.count(2)

### `dict`

In [None]:
task = {"description": "Learn Python"}

task

###### len

Funkcja wbudowana `len()` zwraca informację o liczbie par klucz-wartość.

In [None]:
len(task)

###### update

Aby dodać do słownika nową parę klucz-wartość, należy **odwołać się** do klucza, który nie istnieje a następnie **przypisać mu wartość**.

Istnieje również metoda `update()`, która działa podobnie.

In [None]:
task["assignee"] = "Andrzej"

task

---
Istniejące wartości możemy również nadpisywać:

In [None]:
task["assignee"] = "Andżela"
task

###### get

Aby **wyciągnąć wartość** ze słownika, należy wpisać **nazwę** odpowiedniego **klucza** do nawiasów kwadratowych.

Istnieje również metoda `get()`, która **działa podobnie**. Pozwala ona obsłużyć sytuację, w której odnosimy się do klucza, który **nie istnieje**.

In [None]:
task["description"]

In [None]:
task["assignee"]

In [None]:
task.get("assignee")

In [None]:
task["priority"]

In [None]:
task.get("priority")

In [None]:
task.get("priority", -1)

###### pop

Metoda `pop()` **usuwa** wartość pod wskazanym kluczem.

In [None]:
task

In [None]:
task.pop("assignee")

In [None]:
task

###### fromkeys()

In [None]:
dict().fromkeys(["description", "assignee", "priority", "time_logged", "is_complete", "due_date"])

In [None]:
dict().fromkeys(["a", "b", "c"], 1)

### Operacje matematyczne

Działają na tuplach oraz listach

In [None]:
n_of_comments_in_tasks = [2, 0, 6, 0, 0, 9]

In [None]:
min(n_of_comments_in_tasks)

In [None]:
max(n_of_comments_in_tasks)

In [None]:
sum(n_of_comments_in_tasks)

In [None]:
sum(n_of_comments_in_tasks) / len(n_of_comments_in_tasks)

---

In [None]:
tasks_statuses = [True, False, False, True, False]
tasks_statuses

In [None]:
any(tasks_statuses)

In [None]:
all(tasks_statuses)

In [None]:
any([0, 1, 2])

In [None]:
all(["a", "b", "c"])

**Operacje na strukturach danych – podsumowanie:**

- Każda ze struktur danych posiada zbiór metod, które możemy stosować na obiektach ich typu. Służą one m.in. do takich operacji jak dodawanie nowych elementów, usuwanie ich czy wyciąganie wartości pod danym kluczem
- Na listach oraz tuplach możemy stosować również szereg funkcji matematycznych, m.in. `min`, `max` czy `sum`
- Funkcje `any` oraz `all` rzutują elementy listy/tupli na typ `bool` po czym sprawdzają czy którykolwiek lub wszystkie elementy mają wartość *True*

> **ZADANIA**

## Slicing

Slicing/indeksacja polega na wyciąganiu pojedynczych elementów lub podzbiorów z listy na podstawie ich pozycji.

In [None]:
simple_list = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [None]:
simple_list

In [None]:
simple_list[2]

In [None]:
simple_list[0]

In [None]:
simple_list[-1]

In [None]:
simple_list[-2]

Dla przedziałów:

```
a[start:stop]  
a[start:]      
a[:stop]       
a[start:stop:step]

default start - 0
default stop - None
default step - 1
```

In [None]:
simple_list[0:None:1]

In [None]:
simple_list[::]

In [None]:
simple_list[:]

In [None]:
simple_list[1:4]

In [None]:
simple_list[2:]

In [None]:
simple_list[:3]

In [None]:
simple_list[1:6:2]

In [None]:
simple_list[:4:]

In [None]:
simple_list[::2]

In [None]:
simple_list[::-1]

In [None]:
simple_list[::-2]

> *ERROR ALERT*

Czasami próbujemy wyciągnąć indeks z obiektu, który nie jest listą/tuplą. Wówczas dostajemy następujący błąd:

In [None]:
my_variable = [1, 2, 3]

my_variable = 123  # overwriting a variable!

my_variable[0]

Zdarza się również, że próbujemy wyciągnąć indeks, który wykracza poza rozmiary listy/tupli. To również spowoduje błąd.

In [None]:
my_variable = [1, 2, 3]

my_variable[3]

**Slicing – podsumowanie:**

- Aby wyciągnąć z listy/tupli pojedynczy element podajemy jego indeks w nawiasach kwadratowych
- Numeracja elementów zaczyna się od 0
- Ujemne indeksy oznaczają pozycję liczoną od końca
- Aby wyciągnąć zakres używając *start*, *stop* i *step* używamy notacji z dwukropkami, tzn. dla listy a: a[start:stop:step]. Nie musimy podawać wszystkich trzech znaczników jeśli odpowiednio użyjemy dwukropków
- Ujemny *step* oznacza odwrotną kolejność wyciąganych elementów

## Zagnieżdżone struktury

Listy, słowniki i tuple możemy w sobie dowolnie zagnieżdżać.

In [None]:
list_of_tasks = [
    {
        "description": "Learn Python",
        "assignee": "Andrzej",
        "priority": 1,
        "is_complete": False
    },
    
    {
        "description": "Learn JavaScript",
        "assignee": "Andżela",
        "priority": 3,
        "is_complete": True
    },
    
    {
        "description": "Finish my work",
        "assignee": "Andżela",
        "priority": 2,
        "is_complete": False
    }
]

In [None]:
list_of_tasks

In [None]:
list_of_tasks[1]["is_complete"]

---

In [None]:
list_of_tasks = [
    {
        'description': "Learn Python",
        "assignee": "Andrzej",
        "priority": 3,
        "is_complete": False,
        "comments": ["Good luck!", "Thank you"]
        # "comments": [{"author": "Andżela", "text": "Good luck!"}, {"author": "Andrzej", "text": "Thank you"}]
    },
    
    {
        "description": "Learn JavaScript",
        "assignee": "Andżela",
        "priority": 2,
        "is_complete": True,
        "comments": []
    },
    
    {
        "description": "Finish my work",
        "assignee": "Andżela",
        "priority": 1,
        "is_complete": False,
        "comments": []
    }
]

In [None]:
list_of_tasks[0]["comments"][1]["text"]

### JSON

Dla podobnych struktury często używa się nazwy JSON. Oznacza to JavaScript Object Notation a nazwa bierze się z języka JavaScript, w którym struktura analogiczna do Pythonowego słownika nazywa się "obiekt" i również może się łączyć oraz zagnieżdżać z listami (zwanymi w JS arrayami). JSON to jeden z najpopularniejszych i najprostszych standardów przechowywania i wymiany danych. Jest powszechnie używany w szeroko pojętym web developmencie, ale nie tylko. Można również stworzyć plik o rozszerzeniu .json, który jest plikiem tekstowym ale takim, w którym przestrzegamy reguł formatowania JSONów. Format JSON jest niezależny od języka programowania. W związku z tym nie może on zawierać obiektów charakterystycznych dla Pythona, np. tupli a jedynie słowniki (JS - obiekt), listy (JS - array), liczby, tekst, boole i nulle. Stringi w JSONie powinny być otoczone cudzysłowami a nie apostrofami.

**Inne przykłady zastosowania JSONów**:
- dane o ofercie sprzedaży nieruchomości

![image.png](attachment:image.png)

- prognoza pogody

![image.png](attachment:image.png)

- wpis na blogu, artykuł prasowy

![image.png](attachment:image.png)

![image.png](attachment:image.png)

**Zagnieżdżone struktury – podsumowanie:**

- Elementami struktur danych mogą być inne struktury danych
- Pozwala to przechowywać złożone dane, które mogą posiadać wiele stopniów zagnieżdżenia
- Struktury będące połączeniem list i słowników w dowolnej konfiguracji często nazywamy JSON (*JavaScript Object Notation*)

> **ZADANIA**

## Mutowalność, hashowalność i kopiowanie obiektów
### Mutowalność
Mutowalność - zdolność obiektu do bycia zmodyfikowanym 

| Typ danych    | Mutowalny  |
| ------------- | ---------- |
| str   | Nie  |
| int   | Nie  |
| float | Nie  |
| bool  | Nie  |
| list  | Tak  |
| tuple | Nie  |
| dict  | Tak  |
| set   | Tak  |

In [1]:
x = True
id(x)

8883552

In [2]:
x = False
id(x)

8883104

---

In [3]:
y = 1
id(y)

8885320

In [4]:
y += 1
id(y)

8885352

---

In [5]:
z = [1, 2, 3]
id(z)

124104793930752

In [6]:
z.append(4)
id(z)

124104793930752

In [7]:
z

[1, 2, 3, 4]

### Hashowalność

Funkcja haszująca – funkcja przyporządkowująca dowolnie dużej liczbie krótką wartość o stałym rozmiarze, tzw. skrót nieodwracalny

In [None]:
hash(1)

In [None]:
hash(12)

In [None]:
hash(True)

In [None]:
hash(1.23)

In [None]:
hash("abc")

In [None]:
hash((1, 2, 3))

In [None]:
hash([1, 2, 3])

In [None]:
hash({1, 2, 3})

In [None]:
hash({"a": 1})

Obiekty hashowalne mogą być kluczami słownika i elementami zbioru a niehashowalne nie mogą nimi być

### Kopiowanie obiektów

In [None]:
a = 1

new_a = a

print(id(a))
print(id(new_a))

In [None]:
new_a = 10

print(new_a)
print(a)

In [None]:
print(id(a))
print(id(new_a))

---

In [None]:
b = 1, 2
new_b = b

print(id(b))
print(id(new_b))

In [None]:
new_b = 10, 11

print(new_b)
print(b)

In [None]:
print(id(b))
print(id(new_b))

---
Tak było dla obiektów niemutowalnych. Natomiast dla mutowalnych

In [None]:
c = [1, 2]
new_c = c

print(id(c))
print(id(new_c))

In [None]:
new_c.append("new_item")

print(new_c)   
print(c)

In [None]:
print(id(c))
print(id(new_c))

Jak stworzyć niezależną kopię listy?

In [None]:
d = [1, 2, 3]
new_d = d.copy()

In [None]:
print(id(d))
print(id(new_d))

In [None]:
print(d)
print(new_d)

In [None]:
new_d.append(4)

In [None]:
print(d)
print(new_d)

### `copy` vs. `deepcopy`

Powyższy sposób kopiowania sprawdza się dla niezagnieżdżonych struktur. Kopia utworzona według powyższego sposobu to tzw. *shallow copy*. Inaczej jest jednak jeśli chcemy skopiować zagnieżdżone struktury.

In [None]:
import copy

In [None]:
groups = [["A", "B", "C"], [1, 2, 3]]
copied_groups = groups.copy()

print(groups)
print(copied_groups)

In [None]:
copied_groups.append([10, 20])

print(groups)
print(copied_groups)

In [None]:
copied_groups[0].append("D")

print(groups)
print(copied_groups)

Modyfikując zewnętrzną listę, obie kopie zachowują się rzeczywiście jak niezależne kopie. Ale kiedy modyfikujemy wewnętrzną listę to zachowują się one jak te same obiekty. Aby tego uniknąć stosujemy tzw. *deepcopy*

---

In [None]:
# shallow copy

groups = [["A", "B", "C"], [1, 2, 3]]
copied_groups = copy.copy(groups)

print(groups)
print(copied_groups, '\n\n')

copied_groups.append([10, 20])

print(groups)
print(copied_groups, '\n\n')


copied_groups[0].append("D")

print(groups)
print(copied_groups)

In [None]:
# deep copy

groups = [["A", "B", "C"], [1, 2, 3]]
copied_groups = copy.deepcopy(groups)

print(groups)
print(copied_groups, '\n\n')

copied_groups.append([10, 20])

print(groups)
print(copied_groups, '\n\n')


copied_groups[0].append("D")

print(groups)
print(copied_groups)

**Mutowalność, hashowalność i kopiowanie obiektów – podsumowanie:**
 - Obiekty w Pythonie mogą być mutowalne (możliwe do modyfikacji) albo niemutowalne (niemożliwe do modyfikacji)
 - Obiekty w Pythonie mogą być hashowalne (da się z nich policzyć hash) albo niehashowalne. Klucze słownika oraz elementy setu muszą być hashowalne
 - Kiedy tworzymy nową referencję do tego samego - mutowalnego - obiektu, jego modyfikacja za pomocą jednej z referencji będzie widoczna również kiedy odniesiemy się do drugiej. W celu utworzenia niezależnej kopii listy czy słownika możemy skorzystać z metody `.copy()`