# Zajęcia 3

Słowa kluczowe: <em> zmienne w Pythonie, slicing, copy, deepcopy, struktury danych: zbiory, słowniki</em>

## Slicing

Natrafiliśmy na ciekawe wykorzystanie wycinania (ang. slicing).

Składnia: 
* ciąg[skąd : dokąd]  
    lub 
* ciąg[skąd : dokąd : krok]

In [None]:
s = "Ala ma kota."

In [None]:
# Od znaku o indeksie 2 do znaku o indeksie 4

Dlaczego wycinki i zakresy wykluczają ostatni element? Związane jest to z indeksowaniem od 0. `range(3)` oraz `my_list[:3]` wytworzą `3` elementy.

Gdy krok jest ujemny, idziemy od tyłu.

Stwórz odwróconą kopię napisu 'Ala' znajdującego się w s.

Cały napis?

In [None]:
# Co oznacza s[skąd:dokąd], gdy pominiemy `skąd` lub `dokąd`?
# Odpowiedź:
# Pominięcie `skąd` oznacza że wskazujemy wycinek zaczynający się na początku napisu s
# (innymi słowy domyślną wartością `skąd` jest 0), zaś pominięcie `dokąd` oznacza wycinek
# rozciągający się do samego końca napisu (innymi słowy domyślną wartością `dokąd` jest len(s)).
# Oznacza to na przykład, że s[:] daje kopię całego napisu s.

Slicing działa też na listach.

In [None]:
l = [1,2,3,4]
l[::-1]

Wrócimy do jego możliwości i ograniczeń przy funkcyjnym Pythonie.

## Zmienne w Pythonie

Funkcja `id(object)` - jest liczbą identyfikującą obiekt (wartość, nie: zmienną) w pamięci. Python gwarantuje, że ta liczba jest unikatowa i nie zmieni się w trakcie życia tej wartości (obiektu).

Czy `id(obiect)` to adres zmiennej? Hmm...

**nie**, to nie jest adres wartości (obiektu)

**tak**, w CPythonie to jest adres

https://docs.python.org/2/library/functions.html#id

In [None]:
x = 7
id(x)

Możemy, zrobić tak, że `y` i `x` wskazują na ten sam obiekt.

In [None]:
y = x
id(x), id(y) 

Możemy wprowadzić tutaj słowo kluczowe `is` - jest ono używane do porównywania tożsamości obiektów. 
Oznacza to, że `is` sprawdza, czy dwie zmienne wskazują na ten sam obiekt w pamięci, a nie czy mają takie same wartości.

In [None]:
x is y

**Porównanie** `is` i `==`

In [None]:
a = [7]
b = a
b is a, b == a

In [None]:
a = [7]
b = a[:] # tu tworzona jest nowa kopia listy a
b is a, b == a

Sprawdźmy po zmianie `y` czy zmieni się `x`. 

In [None]:
y = y + 1
x, y

Nie. Jak widzimy zmienne teraz wskazują na inne miejsca w pamięci.

In [None]:
id(x), id(y)

In [None]:
# Sprawdźmy is
x is y

Jeszcze raz analogicznie

In [None]:
x = 7
y = x
x = x + 1
x, y, id(x), id(y)

Tworzony jest nowy obiekt `8` i na niego wskazuje `x`.

Może też zmienić się typ zmiennej.

In [None]:
x = 7
x, type(x), id(x)

In [None]:
x = x / 2
x, type(x), id(x)

### A co z przekazywaniem do funkcji?

Warto przeczytać https://docs.python.org/3/tutorial/controlflow.html#defining-functions

Wywołanie funkcji wprowadza nową tablicę symboli dla zmiennych lokalnych funkcji. Odwołania najpierw przeszukują tą właśnie tablicę lokalną, potem tablice lokalne otaczających funkcji, tablicę poziomu *global* i na końcu tablicę built-in names.

**Podsumowując, przekazywanie argumentów jest przez wartość, gdzie tą wartością jest zawsze referencja do obiektu, a nie wartość tego obiektu.**

In [None]:
def lucky(n):
    n = n + '7' # interesująca linia
    print("Wartość w funkcji " + n)
    return n

In [None]:
n = '7'
print("Przed " + n)
lucky(n)
print("Po " + n)
type(n)

Przypomnijmy. Zaznaczona w komentarzu interesująca linia, nie zmienia wartości obiektu `n`, a tworzy nowy obiekt o wartości `77` i następnie przypisuje mu etykietę `n`.

**W praktyce oznacza to, że w przypadku niezmiennych typów danych (ang. immutable; np. str) funkcje w
Pythonie działają tak, jakby ich argumenty przekazywane były przez wartość.**

In [None]:
def lucky_list(l):
    if len(l) > 0: # if l: jak chcemy jeszcze krótszy kod
        l[0] = 7

In [None]:
l = [1,2,3]
lucky_list(l)
l, type(l)

**Tymczasem, w przypadku typów zmiennych (ang. mutable; np list) na ogół jak przez referencję.**

In [None]:
def lucky_list(l):
    if len(l) > 0:
        l = l[:] # interesująca linia
        l[0] = 7

In [None]:
l = [1,2,3]
lucky_list(l)
l

Poprzez interesującą linię stworzyliśmy nowy, lokalny obiekt w pamięci. I po wywołaniu metody lista `l` pozostaje bez zmian.

### Zmienne globalne

Zmienne zdefiniowane poza ciałem funkcji są globalne. W funkcji można je modyfikować dzięki `global`. 

In [None]:
n = '7'
def lucky():
    global n
    n = n + '7'
lucky()
n   

Tym razem funkcja `lucky` zmodyfikowała zmienną globalną `n`. Zauważ, że ten sam identyfikator nie może być jednocześnie użyty jako nazwa parametru i zmiennej na liście zmiennych globalnych (global).

In [None]:
n = '7'
def lucky(n):
    global n
    n = n + '7'
lucky()
n   

### Instrukcja nonlocal

Pozwala na powiązanie zmiennych z zakresu "wyżej", z wyłączeniem zakresu globalnego.

In [None]:
n = 1
def lucky():
    n = 2
    def luke():
        nonlocal n
        n = 3
    luke()    # zmieni wartość n w tym zakresie na 3
    print(n)
lucky()
n 

## Jeszcze o listach - copy i deepcopy

In [None]:
# Omawiając semantykę typów danych warto pokazać:
# https://pythontutor.com/

In [None]:
# Zadanie: proszę utworzyć listę zawierającą liczby parzyste z zakresu 1 do 10 włącznie.

In [None]:
# List comprehension - elegancki sposób tworzenia list. 
# Składnia podstawowa: lista = [wyrażenie for element in stuktura_danych if warunek] # if warunek jest tu opcjonalne
# Przykład:
list_x = [x for x in range(1, 6)]

In [None]:
list_x

In [None]:
# Oczywiście mogą istnieć bardziej złożone 

In [None]:
# Proszę wybrać liczby parzyste od 1 do 10

In [None]:
list_x2

In [None]:
s[:]

In [None]:
# a teraz podobnie z warunkiem if

In [None]:
# Oczywiście mogą istnieć bardziej złożone 

In [None]:
even_numbers

copy i deepcopy są funkcjami z modułu copy, które służą do tworzenia kopii obiektów. Różnią się głównie tym, jak obsługują zagnieżdżone struktury danych.

* copy

- copy tworzy płytką kopię obiektu. Oznacza to, że kopiowane są same obiekty, ale nie ich wnętrze.
- w przypadku list, tuple, czy słowników, tworzona jest nowa struktura danych, ale jeśli te struktury zawierają obiekty (np. listy wewnątrz list), to te obiekty nie są kopiowane, a jedynie referencje do nich są kopiowane.
- Jeśli zmienisz zagnieżdżony obiekt w kopii, to zmiany będą widoczne w oryginalnym obiekcie, ponieważ obiekt ten jest współdzielony między kopią a oryginałem.

In [None]:
import copy

original_list = [1, 2, [3, 4]]
shallow_copy = copy.copy(original_list)

shallow_copy[2][0] = 99
print(original_list)  # Output: [1, 2, [99, 4]]

* deepcopy

- deepcopy tworzy głęboką kopię obiektu. Oznacza to, że kopiowane są zarówno obiekty, jak i ich zagnieżdżone obiekty.
- Wszystkie obiekty w strukturze danych są rekurencyjnie kopiowane, co oznacza, że zmiany wprowadzone w jednej kopii nie wpływają na oryginalną strukturę danych ani na inne kopie.

In [None]:
import copy

original_list = [1, 2, [3, 4]]
deep_copy = copy.deepcopy(original_list)

deep_copy[2][0] = 99
print(original_list)  # Output: [1, 2, [3, 4]]

Podsumowując, użyj copy, jeśli chcesz tylko kopii struktury danych, ale nie zależy ci na niezmienności wewnętrznych obiektów. Natomiast jeśli potrzebujesz zupełnie niezależnych kopii, które nie zmieniają oryginalnych danych, użyj deepcopy.

## Struktury danych - ciąg dalszy

Struktury danych są kluczowym elementem każdego języka programowania. Na poprzednich zajęciach poznaliśmy listy. Dla przypomnienia - listy są modyfikowalne, mają zachowaną kolejność elementów, podlegają indeksowaniu oraz "slicingowi" elementów i pozwalają na przechowywanie duplikatów. To jednak nie jedyne z dostępnych w Pythonie struktur danych. Na dzisiejszych zajęciach poznamy kolejne struktury, które wyróżniają się swoją wszechstronnością i użytecznością: słowniki i zbiory.

Ale najpierw przypomnijmy sobie krotki.

In [None]:
# Krotki (tuples)
# Nie są modyfikowalne! 

In [None]:
first_tuple = (0, 1, 222, 3)

In [None]:
print(first_tuple[2])

In [None]:
# Dostęp do elementów
print(first_tuple[0:2])

In [None]:
# Błąd ! Krotki nie są modyfikowalne
first_tuple[2] = 220

In [None]:
# Ale zobaczmy
tup = (1,2,[3,4])

In [None]:
tup[2][0]=42

In [None]:
tup

In [None]:
# Jeśli element kroki jest modyfikowalny - możemy go modyfikować. W naszym przykładzie sama
# krotka się nie zmieniła, dalej zawiera te same trzy elementy, tylko ostatni z nich zmienił swój stan.

In [None]:
tup2 = (1,2,(3,4))

In [None]:
tup2[2]

In [None]:
tup2[2][0]=42

In [None]:
# Tak nie zmodyfikujemy

**Zaleta krotek: niezmienność**

In [None]:
# Długosc krotki - analogia do list
print(len(tup2))

In [None]:
# Krotki nie są modyfikowalne, ale... 

In [None]:
# Konwersja między listą a krotką
simple_list = [2, 3, 10]
sec_tuple = tuple(simple_list)

In [None]:
sec_tuple

In [None]:
# Konwersja między krotką a listą
list_from_tuple = list(sec_tuple)
list_from_tuple[2] = 123 # Możemy teraz zamienić wartość pod indeksem 2

In [None]:
# Wygenerowanie krotki o innej wartości wybranego elementu: konwersja na listę, zmiana elementu, konwersja na krotkę.
mod_tuple = tuple(list_from_tuple)
mod_tuple

In [None]:
# Łączenie krotek
third_tuple = first_tuple + sec_tuple
third_tuple

In [None]:
# Zliczanie wystąpień elementu
print(third_tuple.count(3))

In [None]:
# Indeks szukanej wartosci
print(third_tuple.index(3))

In [None]:
# Przypisania

In [None]:
krotka = ((1,2), (3,4))

In [None]:
kro, (t,k) = krotka

In [None]:
kro, t, k

In [None]:
# Podobnie w przypadku list

In [None]:
# Działa zarówno to:
l1 = [[1,2],[3,4]]

In [None]:
kro, (t,k) = l1 

In [None]:
kro, t, k

In [None]:
# Jak również to:

In [None]:
kro, [t,k] = l1 

In [None]:
kro, t, k 

Zbiory natomiast są idealne, gdy potrzebujemy przechować unikalne elementy bez duplikatów. Zbiory eliminują powtarzające się wartości i pozwalają na szybkie operacje matematyczne, takie jak przecięcia, różnice i sumy zbiorów.

In [None]:
# Kolejnosc moze nie byc zachowana (unordered), nie są indeksowane (unindexed), 
# nie możemy mieć duplikatów (no duplicate memebers), możemy usuwać i dodawać elementy.

In [None]:
# Tworzenie zbioru (set)

In [None]:
# Podejście 1
first_set = set([1, 2, 3])

In [None]:
# Podejście 2
first_set = {1, 2, 3, 23, 54, 2131}

In [None]:
# Spróbujmy utworzyć zbiór, którego elementem jest lista

In [None]:
third_set = {'a', 'b', 'abab', 12, 7.34, 98, [1, 2]}

Nie możemy przechowywac elementow typu lista itd. Tylko elementy "hashowalne" int, float.
Nie możemy przechowywac list: unhashable type: 'list'

Więcej o hashowaniu będzie na Algorytmach i Strukturach Danych, ale teraz krótki wstęp:
Haszowanie to technika, która umożliwia efektywne tworzenie zbiorów i słowników. Używa funkcji hashującej (po polsku powinno być "mieszającej", ale trudno...) która oblicza się w miarę szybko, deterministycznie (czyli bez żadnej losowości czy patrzenia na zegarek) i przypisuje danym (np. napisom) liczby (np. 64 bitowe) w taki sposób aby możliwie rzadko się zdarzało, żeby dwa różne zestawy danych (np. dwa napisy) miały ten sam hash. I potem wstawiamy napisy do tablicy o rozmiarze np. 100 do komórki hash(napisu) % 100. Oczywiście może się zdarzyć, że dwa napisy będą miały ten sam hash%100, więc te tzw kolizje trzeba jakoś rozwiązywać (są na to sposoby), ale jeśli w strukturze jest niezbyt dużo napisów, to prawdopodobieństwo takiej kolizji jest małe, więc zdarza się rzadko i dlatego sprawdzanie czy dany napis jest w tej tablicy działa szybko, praktycznie w czasie stałym. 

W Pythonie, elementy hashowalne (hashable objects) to obiekty, dla których zdefiniowano równość i operację hash. Wartość operacji hash nie może się zmieniać podczas życia obiektu, zaś obiekty równe muszą mieć tę
samą wartość operacji hash. Większość niemodyfikowalnych standardowych typów w Pythonie spełnia te warunki.

### Zadanie
Porównaj hash("ala"), hash("al"+"a"), hash("alb"), hash("alc"). Skorzystaj z funkcji hash()

In [None]:
# Wyniki są znacząco różne dla nieznacznie różnych danych!

In [None]:
x = 5  # liczba całkowita (niemutowalna)
hash(x)

In [None]:
# Obiekt mutowalny (lista) - nie jest hashowalny
hash([1, 2, 3]) # Spowoduje błąd TypeError: unhashable type: 'list'

Python za hashowalne uznaje te obiekty, które mają zdefiniowane równość i hash.

In [None]:
# Utwórzmy zbiór
third_set = {'a', 'b', 'abab', 12, 7.34, 98} # , [1, 2]}

In [None]:
# Brak indeksacji
third_set[0:2]

In [None]:
# Brak duplikatów
simple_list = [1, 1, 1, 99, 87, 99, 43, 23, 100, 4, 3, 3, 3]

In [None]:
# Szukamy unikalnych
# Podejście 1


In [None]:
l

In [None]:
# Podjeście 2


In [None]:
l

In [None]:
# Dodawanie elementu do zbioru:
add_set = {2, 4, 1, 77}

In [None]:
add_set.add(123)

In [None]:
add_set

In [None]:
# Dodawanie elementów do zbioru:
add_set.update([1, 2, 3, 4])

In [None]:
add_set

In [None]:
# Usuwanie elementów zbioru - posługujemy się nie indeksami, tylko wskazujemy konkretnie jaką wartosc 
# chcemy usunąć

In [None]:
add_set.remove(123) # Metoda "in place"

In [None]:
add_set

In [None]:
add_set.remove(1234)

Uwaga: alternatywna metoda

In [None]:
# Metoda do usuwania - jezeli brak elementu, to nie zwraca błędu
add_set.discard(2)

In [None]:
add_set

In [None]:
add_set.discard(2)

In [None]:
add_set

In [None]:
# Usuwanie któregoś elementu
rnd_elemet = add_set.pop()
print(rnd_elemet)

In [None]:
add_set

In [None]:
# Czyszczenie zbioru
add_set.clear()

In [None]:
add_set

In [None]:
# Suma zbiorów (unia)
first_set = {1, 2, 3, 4}
second_set = {3, 4, 5, 6, 7}

In [None]:
union = first_set | second_set
#union = first_set.union(second_set)

In [None]:
union

In [None]:
# Intersection (częsc wspolna)
first_set = {1, 2, 3, 4}
second_set = {3, 4, 5, 6, 7}
third_set = {4, 5, 9, 1}

In [None]:
# Dwa zbiory
inter = first_set.intersection(second_set)
# Inny zapis:
# inter = first_set & second_set 

In [None]:
inter

In [None]:
# Więcej niz dwa
inter = first_set & second_set & third_set

In [None]:
inter

In [None]:
# Różnica zbiorow (difference)
diff = first_set - second_set
# diff = first_set.difference(second_set)

In [None]:
diff

In [None]:
# Różnica symetryczna (symmetric_difference) - wszystko poza częscia wspólną
sym_diff = first_set ^ second_set
# sym_diff = first_set.symmetric_difference(second_set)

In [None]:
sym_diff

Jeśli chcesz mieć zbiór zbiorów, to - ponieważ elementy zbiorów mają być niezmienialne - musisz użyć specjalnego niezmienialnego typu frozenset, np:

In [None]:
zbzb = { {1,2,3}, {1,2,4} }  # błąd

In [None]:
zbzb = { frozenset((1,2,3)), frozenset((1,2,4)) } # OK
zbzb

In [None]:
# Poza tym, że nie można ich zmieniać:
x = frozenset({1,2,3})
x.add(5) # błąd

In [None]:
# Zachowują się tak jak zbiory:
zbzb.pop() & zbzb.pop()

In [None]:
zbzb

In [None]:
# Ciekawostka. Skoro frozenset-y są niezmienialne, to to powinno nie działać, a działa:
x = frozenset({1,2,3})
x |= {1,4}
x

In [None]:
# Co się stało??? Czy frozenset jednak się zmienił? 

In [None]:
x = y = frozenset({1,2,3})

In [None]:
x, y, x is y

In [None]:
x |= {1,4}

In [None]:
# NIE! To zmienna się zmieniła :)
x, y, x is y

In [None]:
# Dla standardowych zbiorów

In [None]:
x = y = {1,2,3}
x, y, x is y

In [None]:
x |= {1,4}
# Tutaj widoczna jest różnica - x is y zwróciło True
x, y, x is y

Analogiczne sytuacje są też pomiędzy innymi podobnymi typami, np krotka i lista. "Przypisanie zmieniające" zmienia obiekt - w przypadku obiektów zmienialnych - albo wartość zmiennej - w przypadku obiektów niezmienialnych (tu również są stringi czy liczby).

## SŁOWNIKI

Słowniki to dynamiczne kolekcje, które pozwalają na przechowywanie danych w formie par klucz-wartość. Klucze są unikalne i pozwalają na efektywne indeksowanie i dostęp do wartości. Słowniki są używane do organizowania i zarządzania danymi w sposób elastyczny i czytelny.

In [None]:
# Kolenjnosc zachowana (3.7 - wczesniej nie), można zmieniać (changeable), nie ma duplikatów (w kluczach)

In [None]:
# Pusty słownik
empty_dict= {} 

In [None]:
# To pusty słownik, a nie pusty zbiór!
type(empty_dict) 

In [None]:
# A jak w takim razie zdefiniować pusty zbiór?

In [None]:
# Pusty zbiór:
empty_set = set()
type(empty_set)

In [None]:
# Dla przyponienia - pusta krotka
s = ()
type(s)

In [None]:
# Uwaga! Klucze w słowniku muszą być hashowalne - tak jak elementy zbiorów.

In [None]:
# Tworzenie słownika - pary klucz: wartość
first_dict = {
    "marka": "Samsung",
    "aparat": 21,
    "rok": 2021
    }

In [None]:
first_dict

In [None]:
# Można tez tak
first_dict = dict(marka="Samsung", aparat=21, rok=2021)

In [None]:
first_dict

In [None]:
# Wypisanie wartosci znajdujacej sie pod okreslonym kluczem
print(first_dict['marka'])

In [None]:
# Przeglądanie wartosci:
for value in first_dict.values():
     print(value)   

In [None]:
# Przeglądanie kluczy:
for key in first_dict.keys():
     print(key) 

In [None]:
# Przegladanie zawartosci slownika: wartosci i klucze:

In [None]:
# Podejście 1
for key in first_dict.keys():
    print(key, first_dict[key])

In [None]:
# Podejście 2
for key, value in zip(first_dict.keys(), first_dict.values()):
    print(key, value)

In [None]:
# Podejście 3
for key, value in first_dict.items():
    print(key, value)

In [None]:
# Metoda get

In [None]:
print(first_dict.get('marka'))

In [None]:
# Dodawanie elementów do słownika
first_dict['kolor'] = "Czarny"

In [None]:
first_dict

In [None]:
# Bezpiecznie dodawanie (jeżeli klucz jeszcze nie istnieje w słowniku):

In [None]:
# Podejście 1
if 'kolor' not in first_dict:
    first_dict['kolor'] = "Niebieski"
else:
    print('kolor in dict')

In [None]:
# Podejście 2
first_dict.setdefault('kolor', "Niebieski")

In [None]:
first_dict

In [None]:
# Usuwanie elementu dla konkretnego klucza
first_dict.pop('kolor') # Zwraca wartosc dla klucza i wyrzuca parę klucz: wartosc
print(first_dict)

In [None]:
# Usuwanie elementu dla konkretnego klucza
del first_dict['aparat'] # Nic nie zwraca - tylko usuwanie (to nie metoda słownika)

In [None]:
first_dict

In [None]:
# Usuwanie ostatniego elementu z słownika
first_dict.popitem() # Zwraca wyrzucany item (patrz wyżej .items())

In [None]:
first_dict

In [None]:
# Czyszczenie słownika
first_dict.clear()
print(first_dict)

In [None]:
# Łączenie słowników:
first_dict = {
    "marka": "Samsung",
    "aparat": 21,
    "rok": 2021,
    "kolor": "Czarny"
    }

second_dict = {
    "marka": "Samsung",
    "aparat": 30,
    "rok": 2022
    }

In [None]:
# Podejście 1
first_dict.update(second_dict)

In [None]:
first_dict

In [None]:
newest_dict

In [None]:
# Różne typy jako wartosci
second_dict = {
    "marka": {'2021': 'Samsung',
              '2022': 'Sam'
        },
    "aparat": [12, 20, 30],
    "rok": [2021, 2022],
    "kolor": ['Czarny', 'Czerwony']
    }

In [None]:
second_dict

In [None]:
# Odczyt elementów
second_dict['aparat'][2]

In [None]:
second_dict['marka']['2021']

In [None]:
# Dictionary comprehension
odds = {i: i*2 for i in range(5)} # klucz: wartosc

In [None]:
odds