<a href="https://colab.research.google.com/github/chrispi21/python-dataeng/blob/main/02_funkcje_zaawansowane.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Funkcje - przypomnienie

Docs:
1. https://www.w3schools.com/python/python_functions.asp
2. https://realpython.com/defining-your-own-python-function/
3. https://docs.python.org/3/reference/compound_stmts.html#function-definitions
4. https://docs.python.org/3/tutorial/controlflow.html#defining-functions

Ćwiczenia:
1. https://www.geeksforgeeks.org/python-functions-coding-practice-problems/?

In [None]:
def dodaj_jeden(x):
  return x + 1

In [None]:
dodaj_jeden(10)

Możemy również tworzyć funkcje z wartością domyślną:

In [None]:
def dodaj_n(x, n=5):
  return x + n

In [None]:
dodaj_n(2)

Możemy również korzystać z argumentów nazwanych:

In [None]:
dodaj_n(x=1, n=100)

Umożliwia nam to zamianę kolejności przekazywania argumentów:

In [None]:
dodaj_n(n=100, x=1)

# Rozpakowanie list, krotek i słowników jako argumentów funkcji

Python umożliwia również rozpakowanie (ang. *unpacking*) listy, krotki albo słownika argumentów podczas wywoływania funkcji:

In [None]:
# Używamy * do rozpakowania elementów
lista_argumentow = [1, 100]
dodaj_n(*lista_argumentow)

In [None]:
krotka_argumentow = (1, 100)
dodaj_n(*krotka_argumentow)

In [None]:
# Korzystamy z ** do rozpakowania par klucz-wartość w przypadku słowników
slownik_argumentow = {"x": 1, "n": 100}
dodaj_n(**slownik_argumentow)

# Funkcje przyjmujące dowolną liczbę elementów

W przypadku, gdy nazwa argumentu jest poprzedzona `*`, możemy przekazać dowolną krotkę zawierającą nienazwane argumenty. Możemy przykładowo utworzyć funkcję, która sumuje dowolne elementy:

In [None]:
def dodaj_elementy(*args):
  suma = 0
  for arg in args:
    suma += arg
  return suma

In [None]:
dodaj_elementy(1, 2, 4)

Nazwa argumentu `*args` jest konwencją nazewniczą - dobrze jest jej przestrzegać.

W podobny sposób możemy przekazywać nazwane argumenty jako słownik. Skorzystamy z `**` przed nazwą argumentu. Dla przykładu utworzymy funkcję, która zwróci minimum:

In [None]:
def minimum(**kwargs):
  if len(kwargs) == 0:
    return None
  minimum = float("inf")
  for value in kwargs.values():
    if value < minimum:
      minimum = value
  return minimum

In [None]:
minimum(a=1, b=10, c=-5)

Konwencja nazewnicza zaleca stosowanie `**kwargs` w tym przypadku.

Możemy tworzyć funkcje, które będą wykorzystywały `*args`, `**kwargs` oraz inne argumenty. Przykładowo:

In [None]:
def minimum(x=0, *args, **kwargs):
  minimum = x
  all_args = args + tuple(kwargs.values())
  for value in all_args:
    if value < minimum:
      minimum = value
  return minimum

In [None]:
minimum(1, 22, 2, a=3, b=15)

In [None]:
# To nie zadziała!
minimum(a=3, 1, 22, 2, b=15)

## Ciekawostka - łączenie słowników

Sprawdźmy sygnaturę funkcji `dict`, która tworzy słownik:

In [None]:
dict?

Za pomocą poznanej przed chwilą techniki możemy połączyć dwa słowniki:

In [None]:
d1 = {"a": 1, "b": 2}
d2 = {"abc": -1}
d3 = {"b": 13, "abc": -1}

In [None]:
dict(**d1, **d2)

In [None]:
# Nie zadziała
dict(**d1, **d3)

In [None]:
# Na szczęście to zadziała
{**d1, **d3}

In [None]:
# Kolejność ma znaczenie
{**d3, **d1}

Ćwiczenie


Utwórz funkcję `filtruj`, która będzie filtrowała rekordy w tabeli z pracownikami na podstawie przekazanych warunków.

In [None]:
pracownicy = [
    {"imie": "Jan", "nazwisko": "Kowalski", "stanowisko": "Inżynier Danych"},
    {"imie": "Jan", "nazwisko": "Nowak", "stanowisko": "Analityk Danych"},
    {"imie": "Janina", "nazwisko": "Nowak", "stanowisko": "Inżynier Danych"},
]

Przykładowo:

`filtruj(pracownicy, imie="Jan", nazwisko="Nowak")`

zwróci:

`[{"imie": "Jan", "nazwisko": "Nowak", "stanowisko": "Analityk Danych"}]`




In [None]:
# @title Rozwiązanie

In [None]:
# @title Podpowiedź 1

def filtruj(pracownicy, **kwargs):
  wynik = []
  for pracownik in pracownicy:
    licznik = 0
    for nazwa_kolumny, wartosc in kwargs.items():
      if pracownik[nazwa_kolumny] == wartosc:
        licznik += 1

    if licznik == len(kwargs):
      wynik.append(pracownik)
  return wynik

In [None]:
# @title Podpowiedź 2

def filtruj(pracownicy, **kwargs):
  wynik = []
  for pracownik in pracownicy:
    for nazwa_kolumny, wartosc in kwargs.items():
      if pracownik[nazwa_kolumny] != wartosc:
        break
    # for-else
    else:
      wynik.append(pracownik)
  return wynik

In [None]:
# @title Podpowiedź 3 - ciekawostka

def filtruj(pracownicy, **kwargs):
    return [
        pracownik
        for pracownik in pracownicy
        if all(pracownik[nazwa] == wartosc for nazwa, wartosc in kwargs.items())
      ]


In [None]:
filtruj(pracownicy, imie="Jan", nazwisko="Nowak")

# Funkcje zwracające wiele wartości

Utworzymy funkcję, która zwraca minimum i maksimum dla danych argumentów wejściowych:

In [None]:
def min_max(*args):
  return min(args), max(args)

In [None]:
min_, max_ = min_max(1, 2, 3, 4, 5)

In [None]:
min_, max_

Ćwiczenie

Utwórz funkcję, która dla dowolnych nazwanych argumentów zwróci nazwę argumentu i wartość, dla argumentu którego wartość jest najniższa

In [None]:
# @title Rozwiązanie

In [None]:
# @title Podpowiedź
def minimum(**kwargs):
  if len(kwargs) == 0:
    return None
  minimum = float("inf")
  for nazwa, wartosc in kwargs.items():
    if wartosc < minimum:
      minimum = wartosc
      nazwa_min = nazwa
  return nazwa_min, minimum

In [None]:
minimum(a=1, b=25, c=-1)

# Wymuszanie użycia nienazwanych i nazwanych argumentów funkcji

Przeanalizujmy następującą definicję funkcji:

In [None]:
def funkcja(imie, nazwisko, /, stanowisko, *, firma):
  print(imie, nazwisko, stanowisko, firma)

W jaki sposób wywołać tę funkcję? Spróbujmy kilku sposobów:

In [None]:
# nienazwane argumenty
funkcja("Janina", "Nowak", "Inżynier Danych", "Big Data Sp. z o.o.")

In [None]:
# nazwane argumenty
funkcja(imie="Janina", nazwisko="Nowak", stanowisko="Inżynier Danych", firma="Big Data Sp. z o.o.")

In [None]:
# argumenty przed / muszą być nienazwane
# argumenty po * muszą być nazwane
# argumenty pomiędzy mogą być przekazywane w dowolny sposób
funkcja("Janina", "Nowak", stanowisko="Inżynier Danych", firma="Big Data Sp. z o.o.")

In [None]:
# również działa:
funkcja("Janina", "Nowak", "Inżynier Danych", firma="Big Data Sp. z o.o.")

Uwaga:

`/` oraz `*` mogą, ale nie muszą być użyte razem. Tzn. poniższe definicje są również poprawne (ale działają inaczej):

In [None]:
# imie, nazwisko muszą być przekazane jako argumenty nienazwane
def funkcja(imie, nazwisko, /, stanowisko, firma):
  print(imie, nazwisko, stanowisko, firma)

In [None]:
# stanowisko, firma muszą być przekazane jako argumenty nazwane
def funkcja(imie, nazwisko, *, stanowisko, firma):
  print(imie, nazwisko, stanowisko, firma)

# Przestrzeń nazw i zagnieżdżanie funkcji (ang. `namespaces`, `nested functions`)

Docs:
1. https://realpython.com/python-namespaces-scope/

## Lokalna przestrzeń nazw

Aby wyjaśnić to pojęcie posłużymy się przykładem:

In [None]:
zmienna_wejsciowa = 1
zmienna_poza_zakresem_funkcji = 2
def funkcja(parametr):
  zmienna_lokalna = parametr
  print("zmienna_poza_zakresem_funkcji", zmienna_poza_zakresem_funkcji)
  print("zmienna_lokalna", zmienna_lokalna)
  # ! To nie zadziała po odkomentowaniu
  # zmienna_poza_zakresem_funkcji += 1

zmienna_poza_zakresem_funkcji += 1
funkcja(zmienna_wejsciowa)

# ! próba odwołania się do zakresu lokalnego funkcji - nie zadziała po odkomentowaniu
# zmienna_lokalna

In [None]:
zmienna_poza_zakresem_funkcji

## Globalna przestrzeń nazw

Możemy zadeklarować zmienną globalną, która jest tworzona w globalnej przestrzeni nazw. Sprawdźmy jej działanie na przykładzie:

In [None]:
def funkcja():
  global x
  x = 10
  print(x)

In [None]:
funkcja()

In [None]:
x

Korzystanie ze zmiennych globalnych jest niezalecane!

## Funkcje zagnieżdżone

Możemy deklarować funkcje zagnieżdżone w funkcjach.

Posłużymy się przykładem - zadeklarujemy funkcję, która wylicza premię w oparciu o ocenę roczną pracownika, aktualne wynagrodzenie oraz o kategorię zaszeregowania:

In [None]:
def oblicz_premie(ocena_roczna, wynagroczenie_roczne, kategoria):
  wspolczynnik_premii = 1 / 20
  def podstawa_premii():
    return wynagroczenie_roczne * kategoria * wspolczynnik_premii

  def wspolczynnik_za_ocene():
    return 2 if ocena_roczna == 5 else 1

  return podstawa_premii() * wspolczynnik_za_ocene()



In [None]:
oblicz_premie(4, 12 * 10000, 2)

Zakres lokalny zmiennych obowiązuje osobno na każdym poziomie zagnieżdżenia funkcji.

Możemy skorzystać ze słowa kluczowego `nonlocal`, aby nadpisać zmienną z zewnętrznego zakresu nazw (nie będziemy się tym zajmować).

# Obiekty mutowalne jako argumenty funkcji

Tym razem również posłużymy się przykładem:

In [None]:
nazwisko = "Nowak"

def zmien_nazwisko(nazwisko):
  nazwisko = "Kowalski"
  return nazwisko

In [None]:
zmien_nazwisko(nazwisko)

In [None]:
nazwisko

Tym razem zamienimy `string` na słownik:

In [None]:
dane_pracownika = {"imie": "Jan", "nazwisko": "Nowak"}

def zmien_nazwisko_2(dane):
  # aktualizujemy słownik
  dane["nazwisko"] = "Kowalski"
  return dane

In [None]:
dane_pracownika

In [None]:
zmien_nazwisko_2(dane_pracownika)

In [None]:
dane_pracownika

Co się stanie, gdy zamiast aktualizować słownik utworzymy nowy?

In [None]:
dane_pracownika = {"imie": "Jan", "nazwisko": "Nowak"}

def zmien_nazwisko_2(dane):
  # tworzymy nowy słownik
  dane = {"imie": "Jan", "nazwisko": "Kowalski"}
  return dane

In [None]:
zmien_nazwisko_2(dane_pracownika)

In [None]:
dane_pracownika

W Pythonie działa mechanizm przekazywania argumentów opisywany jest jako przekazywanie przez referencję obiektów (ang. *Pass By Object Reference*). Oznacza to, że referencja do obiektu jest przekazywana przez wartość. Dla typów niemutowalnych (np. `int`) modyfikacja jest tak naprawdę utworzeniem nowego obiektu. Dla obiektów mutowalnych nie jest tworzony nowy obiekt. Możemy jednak utworzyć nowy obiekt (wykorzystanie tej samej nazwy nie ma znaczenia). Wtedy działamy na odrębnych obiektach niezależnie.

Dodatkowe wyjaśnienie:

https://python.plainenglish.io/pass-by-object-reference-in-python-79a8d92dc493

Dodatkowe zasoby:
1. https://docs.python-guide.org/writing/gotchas/#mutable-default-arguments
2. https://www.geeksforgeeks.org/use-mutable-default-value-as-an-argument-in-python/


Ćwiczenie

Napisz funkcję, która będzie miała dwa argumenty wejściowe:
1. Lista pracowników
2. Nowy pracownik

Bez używania instrukcji `return` utwórz funkcję, która doda nowego pracownika.

In [None]:
pracownicy = [
    ("Jan", "Kowalski", "Inżynier Danych"),
    ("Janina", "Nowak", "Analityk Danych"),
]
nowy_pracownik = ("Katarzyna", "Nowak", "Inżynier Danych")

In [None]:
# @title Rozwiązanie

In [None]:
# @title Podpowiedź

def dodaj_pracownika(pracownicy, nowy_pracownik):
  pracownicy.append(nowy_pracownik)

dodaj_pracownika(pracownicy, nowy_pracownik)
pracownicy

## Dygresja o mutowalności

Docs:
1. https://docs.python.org/3/library/copy.html
2. https://realpython.com/copying-python-objects/

Rebus :)

Jaka będzie zawartość listy `koszyk_a`? Jaka będzie zawartość listy `koszyk_b`?

In [None]:
koszyk_a = []

koszyk_b = koszyk_a

koszyk_a.extend(["Bułka", "Masło", "Ser"])
koszyk_b.extend(["Piwo", "Zupka chińska"])

In [None]:
# @title Spoiler
print(koszyk_a)
print(koszyk_b)

Wyjaśnienie

`koszyk_a` i `koszyk_b` wskazują na ten sam obiekt w pamięci:

In [None]:
id(koszyk_a) == id(koszyk_b)

Chcemy to naprawić!

Rebus 2 :)

In [None]:
from copy import copy

koszyk_a = []

koszyk_b = copy(koszyk_a)

koszyk_a.extend(["Bułka", "Masło", "Ser"])
koszyk_b.extend(["Piwo", "Zupka chińska"])

In [None]:
# @title Spoiler

print(koszyk_a)
print(koszyk_b)

Wyjaśnienie:

In [None]:
id(koszyk_a) == id(koszyk_b)

Rebus 3

Mamy koszyk produktów:

In [None]:
koszyk_a = [
    {"nazwa": "Bułka", "cena": 1.69},
    {"nazwa": "Zupka chińska", "cena": 3.99},
]

koszyk_b = copy(koszyk_a)

# Aktualizujemy cenę bułki:
koszyk_a[0]["cena"] = 2.99

Co zawiera `koszyk_b[0]["cena"]`?

In [None]:
# @title Spoiler

koszyk_b[0]["cena"]

`copy` kopiuje referencje przy tworzeniu nowego obiektu:

In [None]:
id(koszyk_a) == id(koszyk_b)

Skopiowane referencje:

In [None]:
id(koszyk_a[0]) == id(koszyk_b[0])

Jak sobie z tym poradzić?

In [None]:
from copy import deepcopy

koszyk_a = [
    {"nazwa": "Bułka", "cena": 1.69},
    {"nazwa": "Zupka chińska", "cena": 3.99},
]

koszyk_b = deepcopy(koszyk_a)

# Aktualizujemy cenę bułki:
koszyk_a[0]["cena"] = 0.99

In [None]:
koszyk_b[0]["cena"]

Tym razem tworzony jest nowy obiekt:

In [None]:
id(koszyk_a[0]) == id(koszyk_b[0])

Uzasadnienie dla takiego zachowania:
1. Oszczędność pamięci operacyjnej
2. Kopiowanie referencji jest szybsze niż tworzenie nowych obiektów

## Dobre praktyki dot. wartości domyślnych dla obiektów mutowalnych

Zacznijmy od złych praktyk i problemów, które przysparzają:

In [None]:
# UWAGA: antyprzykład!
def dodaj_pracownika(nowy_pracownik, pracownicy=[]):
  print(id(pracownicy))
  pracownicy.append(nowy_pracownik)
  return pracownicy

In [None]:
dodaj_pracownika(("Jan", "Kowalski", "Inżynier Danych"))

In [None]:
dodaj_pracownika(("Janina", "Kowalska", "Inżynier Danych"))

In [None]:
dodaj_pracownika(("Jan", "Nowak", "Analityk Danych"), [
    ("Paweł", "Nowak", "Inżynier Danych"),
    ("Paulina", "Nowak", "Inżynier Danych"),
])

In [None]:
dodaj_pracownika(("Zofia", "Mickiewicz", "Manager"))

Dobrą praktyką jest przypisanie wartości `None` jako domyślnej, a następnie utworzenie nowego obiektu z oczekiwaną wartością, jak w poniższym przykładzie:

In [None]:
def dodaj_pracownika(nowy_pracownik, pracownicy=None):
  print("#1: ", id(pracownicy))
  if pracownicy is None:
    pracownicy = []
  print("#2: ", id(pracownicy))
  pracownicy.append(nowy_pracownik)
  return pracownicy

In [None]:
dodaj_pracownika(("Jan", "Kowalski", "Inżynier Danych"))

In [None]:
dodaj_pracownika(("Janina", "Kowalska", "Inżynier Danych"))

In [None]:
dodaj_pracownika(("Jan", "Nowak", "Analityk Danych"), [
    ("Paweł", "Nowak", "Inżynier Danych"),
    ("Paulina", "Nowak", "Inżynier Danych"),
])

In [None]:
dodaj_pracownika(("Jan", "Nowak", "Analityk Danych"), [
    ("Paweł", "Nowak", "Inżynier Danych"),
    ("Paulina", "Nowak", "Inżynier Danych"),
])

In [None]:
dodaj_pracownika(("Zofia", "Mickiewicz", "Manager"))

# Generatory

Docs:
1. https://wiki.python.org/moin/Generators
2. https://realpython.com/introduction-to-python-generators/
3. https://docs.python.org/3/reference/expressions.html#yield-expressions

Ćwiczenia:
1. https://www.w3resource.com/python-exercises/generators-yield/index.php

Przykładem generatora jest funkcja `range`. Przyjrzyjmy się jej działaniu:

In [None]:
range(1_000_000_000)

I porównajmy wynik z poniższym kodem:

In [None]:
# Skończy nam się pamięć operacyjna
x = list(range(1_000_000_000))

Generator jest przykładem tzw. leniwego wykonania. Tworząc generator nie materializujemy jego w pamięci operacyjnej (jak w przypadku list). Jest to przepis na to jak uzyskać kolejne elementy w kolekcji.

Generatory mają olbrzymie znaczeniew pracy ze dużymi zbiorami danych. Dzięki nim możemy przetwarzać zbiory, które nie mieszczą się w pamięci. Przykładem takich danych są ogromne pliki lub nieskończony strumień danych.

Tworzymy pierwszy generator, który utworzy liczby podniesione do kwadratu i doda stałą liczbę. Na przykładzie generatora `range` widzimy, że można używać generatorów w pętli `for`:

In [None]:
def generator_kwadratow(n, stala=1):
  for i in range(n):
    yield i ** 2 + stala

In [None]:
gen = generator_kwadratow(10)

In [None]:
gen

In [None]:
list(gen)

Porównajmy wynik z wynikiem funkcji, w której użyto `return`

In [None]:
def kwadraty(n, stala=1):
  for i in range(n):
    return i ** 2 + stala

In [None]:
kwadraty(10)

Powyższy przykład ilustruje jak działa generator. Wykonanie funkcji nie jest kończone, ale wstrzymywane. Postarajmy się to wyjaśnij na prostszym przykładzie. Najpierw poznajmy jednak jak zwrócić pojedynczy element:

In [None]:
gen = generator_kwadratow(3)

Wywołajmy kilkukrotnie poniższe polecenie:

In [None]:
next(gen)

Zwracany jest wyjątek `StopIteration`, który informuje o wyczerpaniu wartości generatora. W przypadku pętli `for`, konwersji na listę itd. jest on automatycznie obsługiwany i zapewnia poprawne działanie generatorów.

Utwórzmy kolejną funkcję:

In [None]:
def hello_world_generator():
  numer_wyrazenia = 0
  yield "Hello", numer_wyrazenia
  numer_wyrazenia += 1
  yield "World", numer_wyrazenia
  numer_wyrazenia += 1
  yield "!", numer_wyrazenia

Prześledźmy działanie `next`:

In [None]:
hello_world = hello_world_generator()

Wywołamy kilka razy `next`:

In [None]:
next(hello_world)

Możemy również utworzyć listę:

In [None]:
list(hello_world_generator())

Rebus:

A co zwróci wielokrotne wywołanie?

In [None]:
next(hello_world_generator())

Dlaczego?

In [None]:
# wykonajmy kilkukrotnie
id(hello_world_generator())

vs.:

In [None]:
gen = hello_world_generator()

In [None]:
# wykonajmy kilkukrotnie
id(gen)

vs. wartość zwrócona za pomocą generatora:

In [None]:
# wykonajmy kilkukrotnie
id(next(gen))

Do wykonania ćwiczenia, będzie potrzebna nam znajomość modułu `random` i funkcji `randint`, która zwraca liczby pseudo-losowe z danego zakresu liczb:

In [None]:
from random import randint

randint(1, 10)

In [None]:
randint(1, 10)

Potrzebna nam będzie również funkcja `random_choice`, która zwraca losowy element z sekwencji:

In [None]:
from random import choice

choice([1, 2, 3, 4, 5])

In [None]:
choice([1, 2, 3, 4, 5])

Dzięki tym funkcjom możemy utworzyć losowy strumień wartości pomiarów czujników:

In [None]:
CZUJNIKI = ["CZUJNIK_1", "CZUJNIK_2", "CZUJNIK_3", "CZUJNIK_4"]

def zwroc_pomiary(n):
  for _ in range(n):
    yield choice(CZUJNIKI), randint(-30, 30)


Sprawdźmy, czy wszystko działa zgodnie z oczekiwaniem:

In [None]:
pomiary = zwroc_pomiary(2)

In [None]:
next(pomiary)

Ćwiczenie

Napisz generator, który zwróci nazwę sensoru i pomiary, gdy pomiar większy od `0`. Sprawdź działanie funkcji.

In [None]:
# @title Rozwiązanie

In [None]:
# @title Podpowiedź

def filtruj(pomiary):
  for sensor, wartosc in pomiary:
    if wartosc > 0:
      yield sensor, wartosc

pomiary = zwroc_pomiary(10)
wynik = filtruj(pomiary)
list(wynik)

Możemy w prosty sposób zasymulować nieskończony strumień danych - np. nowy element co sekundę:

In [None]:
from time import sleep

CZUJNIKI = ["CZUJNIK_1", "CZUJNIK_2", "CZUJNIK_3", "CZUJNIK_4"]


def zwroc_pomiary():
  while True:
    yield choice(CZUJNIKI), randint(-30, 30)
    sleep(1)

In [None]:
nieskonczone_pomiary = zwroc_pomiary()

Wywołanie funkcji `list` oczywiście skończy się błędami związanymi z dostępną pamięcią operacyjną. Możemy jednak podejrzeć wartości w następujący sposób:

In [None]:
for _ in range(10):
  print(next(nieskonczone_pomiary))

Albo tak (w notebook Colab, aby zatrzymać poniższe wykonanie trzeba wybrać `Środowisko wykonawcze -> Przerwij wykonanie kodu`):

In [None]:
while True:
  print(next(nieskonczone_pomiary))

Możemy skorzystać z naszej funkcji filtruj z poprzedniego ćwiczenia:

In [None]:
def filtruj(pomiary):
  for sensor, wartosc in pomiary:
    if wartosc > 0:
      yield sensor, wartosc

In [None]:
nieskonczone_pomiary = zwroc_pomiary()
odfiltrowane_pomiary = filtruj(nieskonczone_pomiary)

while True:
  print("Pomiar: ", next(odfiltrowane_pomiary))

Ćwiczenie

Napisz generator, który wyświetli na ekran wartość a następnie ją zwróci. Dodaj parametr, który będzie wyświetlany jako prefiks. Użyj nowej funkcji, aby zastąpić poniższy kod:

```python
while True:
  print("Pomiar: ", next(odfiltrowane_pomiary))

```

In [None]:
# @title Rozwiązanie

nieskonczone_pomiary = zwroc_pomiary()
odfiltrowane_pomiary = filtruj(nieskonczone_pomiary)

In [None]:
# @title Podpowiedź

def wyswietl(generator, prefiks):
  for wartosc in generator:
    print(prefiks, wartosc)
    yield wartosc

nieskonczone_pomiary = zwroc_pomiary()
odfiltrowane_pomiary = filtruj(nieskonczone_pomiary)
wyswietlone_pomiary = wyswietl(odfiltrowane_pomiary, "Pomiar: ")

while True:
  next(wyswietlone_pomiary)

Dla chętnych:

1. Porównanie wydajności generator vs. np. lista: https://realpython.com/introduction-to-python-generators/#profiling-generator-performance

2. Wykonanie poniższego ćwiczenia :)

Ćwiczenie dla chętnych

Wykorzystaj z `zwroc_pomiary`, `filtruj` oraz `wyswietl` jako źródło danych. Utwórz dodatkowy generator zwracający statystyki dot. wartości minimalnej, maksymalnej oraz średniej wartości pomiaru dla 5 ostatnich pomiarów (bez podziału na nazwę sensora). Wykorzystaj ponowinie `wyswietl` do wyświetlenia statystyk.

In [None]:
# @title Rozwiązanie

In [None]:
# @title Mała podpowiedź

# skorzystaj z
from collections import deque

def zwroc_statystyki(pomiary):
  # Miejsce na implementację
  pass

nieskonczone_pomiary = zwroc_pomiary()
odfiltrowane_pomiary = filtruj(nieskonczone_pomiary)
wyswietlone_pomiary = wyswietl(odfiltrowane_pomiary, "Pomiar: ")
statystyki = zwroc_statystyki(wyswietlone_pomiary)
wyswietlone_statystyki = wyswietl(statystyki, "Statystyki: ")

while True:
  next(wyswietlone_statystyki)

In [None]:
# @title Podpowiedź
from collections import deque


def zwroc_statystyki(pomiary):
  print("Inicjalizacja zmiennej stan - ten tekst wyświetli się tylko raz!")
  stan = deque(maxlen=5)
  for _, wartosc in pomiary:
    stan.append(wartosc)
    yield min(stan), max(stan), sum(stan) / len(stan) #, id(stan) <-


nieskonczone_pomiary = zwroc_pomiary()
odfiltrowane_pomiary = filtruj(nieskonczone_pomiary)
wyswietlone_pomiary = wyswietl(odfiltrowane_pomiary, "Pomiar: ")
statystyki = zwroc_statystyki(wyswietlone_pomiary)
wyswietlone_statystyki = wyswietl(statystyki, "Statystyki: ")

while True:
  next(wyswietlone_statystyki)

# Funkcje wyższego rzędu (ang. `higher order functions)`
Docs:
1. https://docs.python.org/3/library/functools.html
2. https://www.geeksforgeeks.org/higher-order-functions-in-python/

Ćwiczenia:
1. https://www.w3resource.com/python-exercises/lambda/index.php

Funkcje w Pythonie są obiektami. Oznacza to, że możemy je przekazywać tak jak każde inne argumenty!

Posłużmy się prostym przykładem. Mamy dane listę z premiami:

In [None]:
premie = [10000, 20000, 5000, 3000]

Listę możemy posortować w następujący sposób:

In [None]:
premie.sort()

In [None]:
premie

Co się stanie jeśli nasza lista będzie bardziej skomplikowana?

In [None]:
premie = [
    {"stanowisko": "Inżynier danych", "premia": 10000},
    {"stanowisko": "Analityk danych", "premia": 20000},
    {"stanowisko": "Manager", "premia": 5000},
    {"stanowisko": "Stażysta", "premia": 3000},
]

In [None]:
premie.sort()

Metoda `sort` przyjmuje dodatkowy parametr - `key`. Umożliwia on przekazywania funkcji, która ma służyć do sortowania:

In [None]:
def klucz_sortowania_po_premii(premia):
  return premia["premia"]

In [None]:
premie.sort(key=klucz_sortowania_po_premii)

In [None]:
premie

Ćwiczenie

Posortuj elementy w liście premie po nazwie stanowiska.

In [None]:
# @title Rozwiązanie

## Wyrażenia lambda (ang. `lambda expressions`)

Tworzenie funkcji do jednokrotnego użycia nie jest dobrą praktyką. Z pomocą przychodzą nam wyrażenia lambda nazywane również funkcjami anonimowymi.

In [None]:
premie.sort(key=lambda p: p["premia"])

Po słowie kluczowym `lambda` umieszczamy opcjonalną listę argumentów, a po `:` ciało funkcji.

Czasami można spotkać wyrażenia lambda w połączeniu z funkcjami `map`, `filter`, `reduce`. Nadają się one idealnie do tego, żeby przećwiczyć ich tworzenie - jednak zamiast nich korzysta się częściej z operacji składania (ang. `comprehension`).

Funkcja `map` tworzy nowy obiekt generatora, po przekształceniu każdego elementu kolekcji za pomocą przekazanej funkcji. W poniższym przykładzie zwracamy wartość premii po podwyżce 10%:


In [None]:
list(map(lambda p: p["premia"] * 1.1, premie))

Ćwiczenie

1. Zamiast listy premii trzeba utworzyć listę stanowisk
2. Z listy premii zawierającej słowniki należy utworzyć listę krotek. Np.:
```python
premie = [
    ("Inżynier danych", 10000),
    ...
]
```

In [None]:
# @title Rozwiązanie

In [None]:
# @title Podpowiedź 1
list(map(lambda p: p["stanowisko"], premie))

In [None]:
# @title Podpowiedź 2
list(map(lambda p: tuple(p.values()), premie))

`filter`

Do wyjaśnienia jak działa ta funkcja potrzebne nam będzie rozwiązanie poprzedniego zadania:

In [None]:
lista_krotek = list(map(lambda p: tuple(p.values()), premie))

Znajdźmy premię większe od 7000:

In [None]:
list(filter(lambda p: p[1] > 7000, lista_krotek))

Wyrażenie lambda służy do określenia warunku, po którym mają być filtrowane elementy kolekcji.

`reduce`

Służy do kumulowania elementów kolekcji. Za pomocą funkcji `map` możemy utworzyć listę z wartościami premii na poszczególnych stanowiskach:

In [None]:
wartosci_premii = list(map(lambda p: p[1], lista_krotek))

Chcemy policzyć sumę a następnie średnią wartość premii na poszczególnych stanowiskach:

In [None]:
from functools import reduce
# suma
suma = reduce(lambda p1, p2: p1 + p2, wartosci_premii)
# średnia
suma / len(wartosci_premii)

Prościej jest oczywiście skorzystać z:

In [None]:
sum(wartosci_premii) / len(wartosci_premii)

Ćwiczenie dla chętnych

Funkcja `reduce` przyjmuje opcjonalny argument `initial` ([docs](https://docs.python.org/3/library/functools.html#functools.reduce)). Dzięki temu można zainicjalizować akumulator po to, aby zmienić zwracany typ. Korzystając z tych informacji, oblicz sumę premii korzystając bezpośrednio z `premie` (bez żadnych dodatkowych przekształceń):

In [None]:
# @title Rozwiązanie

In [None]:
# @title Podpowiedź

from functools import reduce

reduce(lambda acc, elem: acc + elem["premia"], premie, 0)

# Dekoratory (ang. `decorators`)

Docs:
1. https://realpython.com/primer-on-python-decorators/
2. https://docs.python.org/3/glossary.html#term-decorator

Ćwiczenia:
1. https://www.w3resource.com/python-exercises/decorator/index.php

Załóżmy, że chcemy, aby nasze funkcje posiadały wspólne właściwości. Nie chcemy jednak duplikować kodu. W takich przypadkach często wykorzystywanym wzorcem jest dekorator.

Posłużmy się przykładem. Chcemy mierzyć czas wykonania funkcji `filtruj` i `sredni_wiek`:

In [None]:
dane = [
    {"imie": "Jan", "nazwisko": "Kowalski", "wiek": 30},
    {"imie": "Janina", "nazwisko": "Nowak", "wiek": 25},
    {"imie": "Zofia", "nazwisko": "Mickiewicz", "wiek": 17},
]

def filtruj(dane):
  wynik = []
  for rekord in dane:
    if rekord["wiek"] >= 18:
      wynik.append(rekord)
  return wynik

def sredni_wiek(dane):
  suma = 0
  for rekord in dane:
    suma += rekord["wiek"]
  return suma / len(dane)

Bez użycia dekoratorów nasz kod wyglądałby w taki sposób:

In [None]:
from time import time

start_filtruj = time()
dane = filtruj(dane)
print(time() - start_filtruj)

start_sredni_wiek = time()
wynik = sredni_wiek(dane)
print(time() - start_sredni_wiek)
print(wynik)

Poprawmy go!

In [None]:
def zmierz_czas(funkcja):
  def wrapper(*args, **kwargs):
    start = time()
    wynik = funkcja(*args, **kwargs)
    print(time() - start)
    return wynik
  return wrapper

Moglibyśmy naszą funkcję wywołać jak w przykładzie poniżej:

In [None]:
zmierz_czas(filtruj)(dane)

Albo utworzyć nową funkcję, żeby nie duplikować kodu:

In [None]:
def zmierz_filtruj(dane):
  return zmierz_czas(filtruj)(dane)

In [None]:
zmierz_filtruj(dane)

Ale bardziej powszechnym podejściem jest dekorowanie funkcji za pomocą `@nazwa_dekoratora` jak w przykładzie poniżej:

In [None]:
@zmierz_czas
def filtruj(dane):
  wynik = []
  for rekord in dane:
    if rekord["wiek"] >= 18:
      wynik.append(rekord)
  return wynik

@zmierz_czas
def sredni_wiek(dane):
  suma = 0
  for rekord in dane:
    suma += rekord["wiek"]
  return suma / len(dane)

Sprawdźmy jak to działa:

In [None]:
dane = [
    {"imie": "Jan", "nazwisko": "Kowalski", "wiek": 30},
    {"imie": "Janina", "nazwisko": "Nowak", "wiek": 25},
    {"imie": "Zofia", "nazwisko": "Mickiewicz", "wiek": 17},
]

dane = filtruj(dane)
wynik = sredni_wiek(dane)
print(wynik)

Przykładowe zastosowania dekoratorów:
1. Pamięć podręczna
2. Logowanie
3. Uwierzytelnianie
4. Ponowienia wykonania funkcji
5. Walidacja argumentów wejściowych



Ćwiczenie

Przygotuj dwa dekoratory, które będą służyły do dekorowania następującej funkcji:

```
# no-op (no operation)
def noop(x):
  return x
```

1. Doda `!!!` do wartości zwracanej przez funkcję (na koniec)
2. Doda `???` do wartości zwracanej przez funkcję (na koniec)

Następnie spróbuj zadeklarować kilka wariantów funkcji `noop` (za każdym razem używając innej nazwy):
1. Z dekoratorem #1
2. Z dekoratorem #2
3. Z dekoratorem #1 i #2 w różnej kolejności

Czy kolejność dekorowania ma znaczenie?

In [None]:
# @title Rozwiązanie

In [None]:
# @title Podpowiedź

def wykrzyknik(fun):
  def wrapper(*args, **kwargs):
    return fun(*args, **kwargs) + "!!!"
  return wrapper

def znak_zapytania(fun):
  def wrapper(*args, **kwargs):
    return fun(*args, **kwargs) + "???"
  return wrapper

@wykrzyknik
def noop_1(x):
  return x

@znak_zapytania
def noop_2(x):
  return x

@znak_zapytania
@wykrzyknik
def noop_3(x):
  return x

@wykrzyknik
@znak_zapytania
def noop_4(x):
  return x

print("noop_1", noop_1("Cześć"))
print("noop_2", noop_2("Cześć"))
print("noop_3", noop_3("Cześć"))
print("noop_4", noop_4("Cześć"))

## Dekoratory z parametrami

**Blok materiału dla chętnych**

Możliwe jest tworzenie bardziej skomplikowanych dekoratorów, które przyjmują dodatkowe parametry modyfikujące ich działanie.

In [None]:
from time import time

def zmierz_czas(print_args=True, print_kwargs=True, print_name=True):
  def decorator(funkcja):
    def wrapper(*args, **kwargs):
      if print_name:
        print(f"Wywołanie funkcji: {funkcja.__name__}")
      if print_args:
        print(f"Argumenty pozycyjne: {args}")
      if print_kwargs:
        print(f"Argumenty klucz-wartość: {kwargs}")
      start = time()
      wynik = funkcja(*args, **kwargs)
      print(time() - start)
      return wynik
    return wrapper
  return decorator

Zauważmy, że w przypadku dekoratorów z parametrami wywołujemy funkcję, która zwraca dekorator (chodzi o użycie nawiasów - `@zmierz_czas()`):

In [None]:
@zmierz_czas()
def filtruj(dane):
  wynik = []
  for rekord in dane:
    if rekord["wiek"] >= 18:
      wynik.append(rekord)
  return wynik

@zmierz_czas(print_args=False, print_kwargs=False)
def sredni_wiek(dane):
  suma = 0
  for rekord in dane:
    suma += rekord["wiek"]
  return suma / len(dane)

In [None]:
dane = filtruj(dane)
wynik = sredni_wiek(dane)
print(wynik)

Możemy temu zapobiec wymuszając przekazywanie argumentów nazwanych (`*`) oraz dodając warunek w jaki sposób ma zostać zwrócony dekorator w zależności od przypadku:

In [None]:
from time import time

def zmierz_czas(funkcja_=None, *,print_args=True, print_kwargs=True, print_name=True):
  def decorator(funkcja):
    def wrapper(*args, **kwargs):
      if print_name:
        print(f"Wywołanie funkcji: {funkcja.__name__}")
      if print_args:
        print(f"Argumenty pozycyjne: {args}")
      if print_kwargs:
        print(f"Argumenty klucz-wartość: {kwargs}")
      start = time()
      wynik = funkcja(*args, **kwargs)
      print(time() - start)
      return wynik
    return wrapper

  if funkcja_ is None:
    # przy dekorowaniu z argumentami nazwa funkcji jest przekazywana do funkcji zwracanej przez decorator
    return decorator
  else:
    # przy dekorowaniu bez argumentów funkcja jest przekazywana jako 1. argument
    return decorator(funkcja_)

In [None]:
@zmierz_czas
def filtruj(dane):
  wynik = []
  for rekord in dane:
    if rekord["wiek"] >= 18:
      wynik.append(rekord)
  return wynik

@zmierz_czas(print_args=False, print_kwargs=False)
def sredni_wiek(dane):
  suma = 0
  for rekord in dane:
    suma += rekord["wiek"]
  return suma / len(dane)

In [None]:
dane = filtruj(dane)
wynik = sredni_wiek(dane)
print(wynik)

Gdy zależy nam, żeby dekorator nie przysłaniał nam szczegółów dot. dekorowanej funkcji jak w przykładzie:

In [None]:
sredni_wiek?

In [None]:
def sredni_wiek_org(dane):
  suma = 0
  for rekord in dane:
    suma += rekord["wiek"]
  return suma / len(dane)

In [None]:
sredni_wiek_org?

Możemy skorzystać ze specjalnego dekoratora `@functools.wraps`:

In [None]:
import functools
from time import time

def zmierz_czas(funkcja_=None, *,print_args=True, print_kwargs=True, print_name=True):
  def decorator(funkcja):
    @functools.wraps(funkcja)
    def wrapper(*args, **kwargs):
      if print_name:
        print(f"Wywołanie funkcji: {funkcja.__name__}")
      if print_args:
        print(f"Argumenty pozycyjne: {args}")
      if print_kwargs:
        print(f"Argumenty klucz-wartość: {kwargs}")
      start = time()
      wynik = funkcja(*args, **kwargs)
      print(time() - start)
      return wynik
    return wrapper

  if funkcja_ is None:
    return decorator
  else:
    return decorator(funkcja_)

In [None]:
@zmierz_czas(print_args=False, print_kwargs=False)
def sredni_wiek(dane):
  suma = 0
  for rekord in dane:
    suma += rekord["wiek"]
  return suma / len(dane)

In [None]:
sredni_wiek_org?

In [None]:
dane = filtruj(dane)
wynik = sredni_wiek(dane)
print(wynik)

## Dekoratory dla wartości zwracanych przez generator i korutyn (ang. `coroutines`)

**Dla bardzo chętnych**

1. Jak utwórzyć dekorator, który operuje na wartościach zwracanych przez dekorator?
2. Jak napisać generator dla korutyn (`async def`)?
3. Jak napisać uniwersalny dekorator dla wszystkich w/w przypadków i standardowej funkcji?

# Kolejność ma znaczenie!

W poniższym przykładzie mamy bardzo długo wykonującą się funkcję, która symuluje sprawdzanie złożonego warunku:

In [None]:
from time import sleep

def bardzo_zasobozerna_funkcja_ktora_sie_dlugo_wykonuje(element):
  sleep(3)
  return element > 0

W naszym przypadku jest to sprawdzenie, czy liczba jest większa od `0`. Przykładami relatywnie kosztownych wyrażeń są wyrażenia regularne, albo inne operacje wiążące się z tworzeniem licznych/złożonych obiektów.

<br>


Mamy jednak dostępna funkcję, która działa szybko, jest warunkiem koniecznym dla warunku wyrażonego powyżej i filtruje relatywnie dużą część rekordów:

In [None]:
def szybki_test(element):
  return element > -10
  # return element > -200 # <- to nie dałoby nam nic


rekordy = [-11, 20, 30, -50, 0, -100, 2]

Stwórzmy funkcję, która filtruje dane w oparciu o `bardzo_zasobozerna_funkcja_ktora_sie_dlugo_wykonuje`:

In [None]:
@zmierz_czas
def filtruj_wolno(rekordy):
  wynik = []
  for r in rekordy:
    if bardzo_zasobozerna_funkcja_ktora_sie_dlugo_wykonuje(r):
      wynik.append(r)
  return wynik

Zmierzmy czas wykonania:

In [None]:
filtruj_wolno(rekordy)

Wykorzystajmy dodatkowy warunek:

In [None]:
@zmierz_czas
def filtruj_szybko(rekordy):
  wynik = []
  for r in rekordy:
    if  szybki_test(r) and bardzo_zasobozerna_funkcja_ktora_sie_dlugo_wykonuje(r):
      wynik.append(r)
  return wynik

In [None]:
filtruj_szybko(rekordy)

Wnioski:
1. Kolejność warunków ma znaczenie.
2. Najczęściej nie ma potrzeby tworzenia dodatkowych warunków. Czasami wystarczy zmiana kolejności tych, które mamy. Czasami można skorzystać z praw logicznych De Morgana.
3. Stosuj powyższą technikę adekwatnie do potrzeby (tj. z umiarem ;) ).
4. Powyższa zasada obowiązuje w innych językach programowania (gdzie kod wyrażamy w sposób imperatywny). W językach deklaratywnych - np. SQL - optymalizator może (ale nie musi) dokonać zmiany kolejności warunków (trzeba znać dobre praktyki dla danego silnika zapytań/bazy danych).