# Funkcje i obiekty
## Funkcje
Pisanie prostych funkcji, na potrzeby organizacji kodu i unikania dublowania niepotrzebnej pracy, to chleb powszedni przy analizie danych. Funkcje w Pythonie wyróżniają na tle innych języków programowania dwa aspekty:
* automatyczne pakowanie wielu zwracanych wartości,
* przekazywanie argumentów po ich nazwie.

Zobaczmy to na przykładach począwszy od najprostszej funkcji:

In [1]:
from math import pi
# prosta funkcja z jednym niezbędnym argumentem i jednym opcjonalnym, zwracająca liczbę jako wynik
def circle_surface(radius, pi = pi):
    return pi * radius ** 2

print(circle_surface(3))

28.274333882308138


In [2]:
# Możemy chcieć, żeby nasza funkcja automatycznie liczyła pole powierzchni i obwód.
def circle(radius, pi = pi):
    return 2 * pi * radius, pi * radius ** 2
print("Obwód i pole koła o promieniu 3: ", circle(3))
# kiedy podajemy argumenty wraz z ich nazwami możemy je podać w dowolnej kolejności
print("To samo z odwrotnie podanymi argumentami: ", circle(pi = 3.1415, radius = 3))
# automatycznie spakowane wyniki możemy łatwo rozpakować
perimiter, surface = circle(pi = 3.1415, radius = 3)
print("Obwód koła o promieniu 3, to:", perimiter, "a pole wynosi: ", surface)

Obwód i pole koła o promieniu 3:  (18.84955592153876, 28.274333882308138)
To samo z odwrotnie podanymi argumentami:  (18.849, 28.273500000000002)
Obwód koła o promieniu 3, to: 18.849 a pole wynosi:  28.273500000000002


Jak widać wszystko nastawione jest na wygodę i szybkość pisania skryptu. Podawanie argumentu wraz z nazwą jest szczególnie przydatne, kiedy funkcja ma bardzo wiele argumentów z domyślnymi wartościami, a my chcemy ustalić tylko jeden z nich.

## Funkcje lambda (anonimowe)
Czasami definiowanie funkcji i umieszczanie jej na początku naszego skryptu wydaje się nam niepotrzebne, np. dlatego, że operacja jest bardzo prosta i nie będziemy jej wykonywali wielokrotnie. Ten typ funkcji nie ma żadnej przewagi nad standardową funkcją, a ich wykorzystanie jest często kwestią stylistyczną. Warto się z nimi zapoznać chociażby dlatego, że dosyć często możemy je spotkać w kodzie innych programistów.

In [3]:
f = lambda r: pi * r ** 2
print(f(3))

28.274333882308138


Może się zdarzyć sytuacja, że funkcja będzie zwracać inną funkcję. W tym przypadku wykorzystanie funkcji lambda będzie wygodne, a kod czytelny.

In [4]:
def switchBMI(sex = "M"):
    if sex == "M":
        return lambda weight, height: (weight+2) / height ** 2
    else:
        return lambda weight, height: weight / height ** 2
BMI = switchBMI("M")
print(BMI(75, 1.90))
BMI = switchBMI("F")
print(BMI(75, 1.90))

20.775623268698062
20.221606648199447


## Zakresy zmiennych
Kiedy korzystamy z funkcji warto pamiętać, że w Pythonie argumenty są przekazywane przez przypisanie (operatorem "="). Oznacza to, że musimy pamiętać o tym, jak zadziała ten operator dla danego argumentu (czy będzie to kopia obiektu czy tylko referencja). Porównajmy działanie takich dwóch fragmentów:

In [5]:
def change_arg(lista):
    print('Na wejściu wewnątrz funkcji: ', lista)
    lista.append('black')
    print('Zmiana wewnątrz funkcji: ', lista)

kolory = ["red", "blue", "green"]

print('Zmienna przed uruchomieniem funkcji: ', kolory)
change_arg(kolory)
print('Zmienna po uruchomieniu funkcji: ', kolory)

Zmienna przed uruchomieniem funkcji:  ['red', 'blue', 'green']
Na wejściu wewnątrz funkcji:  ['red', 'blue', 'green']
Zmiana wewnątrz funkcji:  ['red', 'blue', 'green', 'black']
Zmienna po uruchomieniu funkcji:  ['red', 'blue', 'green', 'black']


In [6]:
def change_arg(lista):
    print('Na wejściu wewnątrz funkcji: ', lista)
    lista = ['cyan', 'magenta', 'yellow']
    print('Zmiana wewnątrz funkcji: ', lista)

kolory = ["red", "blue", "green"]

print('Zmienna przed uruchomieniem funkcji: ', kolory)
change_arg(kolory)
print('Zmienna po uruchomieniu funkcji: ', kolory)

Zmienna przed uruchomieniem funkcji:  ['red', 'blue', 'green']
Na wejściu wewnątrz funkcji:  ['red', 'blue', 'green']
Zmiana wewnątrz funkcji:  ['cyan', 'magenta', 'yellow']
Zmienna po uruchomieniu funkcji:  ['red', 'blue', 'green']


W pierwszym przykładzie przekazaliśmy do funkcji referencję. Korzystając z metody append() zmieniliśmy zawartość tego, co było pod podanym adresem. Nie próbowaliśmy jednak zmienić samego argumentu (referencji/adresu). Funkcja zmieniła więc de facto zawartość tego, co było poza nią.

W drugim przypadku, kiedy do argumentu "lista" przypisaliśmy nową listę, czyli próbowaliśmy zmienić przekazany do funkcji argument, było to działanie niemożliwe. Funkcja nie może bowiem zmienić samego argumentu na zewnątrz funkcji. Zmiana miała więc jedynie charakter lokalny.  

Każda funkcja w Pythonie ma dostęp (w trybie odczytu) do zmiennych zdefiniowanych do tej pory w ramach skryptu. Poniższy przykład NIE jest zgodny z najlepszymi praktykami progamowania. Niemniej znajomość tej własności może nam czasem oszczędzić czasu, kiedy chcemy uzyskać jakiś efekt "na szybko".

In [7]:
multiplier = 5
def circle_surface(radius, pi = pi):
    return multiplier * pi * radius ** 2

print(circle_surface(3))

141.3716694115407


## Dynamiczna lista argumentów
Python umożliwia nam napisanie funkcji, która przyjmie dowolną, nieokreśloną liczbę argumentów. Może być to dokonane za pomocą listy (operator - \*) lub słownika (operator - \*\*). Przyjęło się, że wykorzystuje się do tego celu \*args i \*\*kwargs. O ile w programowaniu strukturalnym nie przyda nam się to zbyt często, to w obiektowym, kiedy np. chcemy rozszerzyć istniejącą klasę, jest to już bardzo przydatne. Z tego też powodu możemy się z tym często spotkać patrząc na kod istniejących bibliotek. 

In [8]:
def printArgs(*args):
    for arg in args:
        print(arg)

printArgs("red", "blue", "green")

red
blue
green


In [9]:
def printKwargs(**kwargs):
    for name, value in kwargs.items():
        print(name, value)

printKwargs(wzrost = 1.92, wiek = 32, imie = "Maciej")

wzrost 1.92
wiek 32
imie Maciej


## Profilowanie
Kiedy okazuje się, że napisany przez nas kod działa wolno lub wolniej niż się spodziewamy, dobrze jest zmierzyć to precyzyjnie, a w przypadku bardziej złożonych funkcji profilować jej elementy. Notebook ma zaimplementowane wygodne do tego celu narzędzia: %timeit, %%timeit, %prun (istnieją też inne komendy, ale nie są bezpośrednio wbudowane w notebooki).

Przyjrzyjmy się im na przykładach.

In [8]:
import math
# Jakaś funkcja, która wykonuje kilka kroków.
x = list(range(10000))
def complexFunction(x):
    results = []
    for k in x:
        if k >= 500:
            results.append(math.sin(k))
        else:
            results.append(math.cos(k))
    for i in results:
        i = math.pow(i, 2)
        
    for i in range(len(results)):
        results[i] = math.pow(results[i], 2)
    return results

In [11]:
# Sprawdzanie średniego czasu wykonania
%timeit complexFunction(x)
# Sprawdzanie średniego czasu wykonania z ręcznie ustaloną liczbą testów
%timeit -n 57 complexFunction(x)

4.68 ms ± 118 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
4.95 ms ± 139 µs per loop (mean ± std. dev. of 7 runs, 57 loops each)


In [12]:
%%timeit
# %%timeit pozwala nam mierzyć całej komórki notebook'a
x = list(range(10000))
complexFunction(x)

4.6 ms ± 23.4 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


In [13]:
%prun complexFunction(x)
# to polecenie powinno nam otworzyć okno na dole strony ze szegółową informacją o tym, co ile razy zostało wywołane i jak czasochłonne było

 

In [9]:
%%prun
# Możemy profilować całą komórkę, kiedy nasz kod ma kilka linijek.
# Nie musimy opakowywać kodu w funkcje, żeby zbadać jego wydajność.
y = complexFunction(x)
complexFunction(y)

 

Możemy też zobaczyć jakie inne magiczne komendy mamy dostępne w notebooku, a więcej na ten temat przeczytać tutaj:
http://ipython.readthedocs.io/en/stable/interactive/magics.html

In [15]:
%lsmagic

Available line magics:
%alias  %alias_magic  %autocall  %automagic  %autosave  %bookmark  %cat  %cd  %clear  %colors  %config  %connect_info  %cp  %debug  %dhist  %dirs  %doctest_mode  %ed  %edit  %env  %gui  %hist  %history  %killbgscripts  %ldir  %less  %lf  %lk  %ll  %load  %load_ext  %loadpy  %logoff  %logon  %logstart  %logstate  %logstop  %ls  %lsmagic  %lx  %macro  %magic  %man  %matplotlib  %mkdir  %more  %mv  %notebook  %page  %pastebin  %pdb  %pdef  %pdoc  %pfile  %pinfo  %pinfo2  %popd  %pprint  %precision  %profile  %prun  %psearch  %psource  %pushd  %pwd  %pycat  %pylab  %qtconsole  %quickref  %recall  %rehashx  %reload_ext  %rep  %rerun  %reset  %reset_selective  %rm  %rmdir  %run  %save  %sc  %set_env  %store  %sx  %system  %tb  %time  %timeit  %unalias  %unload_ext  %who  %who_ls  %whos  %xdel  %xmode

Available cell magics:
%%!  %%HTML  %%SVG  %%bash  %%capture  %%debug  %%file  %%html  %%javascript  %%js  %%latex  %%markdown  %%perl  %%prun  %%pypy  %%python  %%python

## Obiekty
Dla osób początkujących w Pythonie oraz średnio zaawansowanych dokładna znajomość klas/obiektów nie jest niezbędna. Warto jednak zapoznać się z tym tematem chociaż pobieżnie, żeby potrafić analizować kod napisany przez innych w podejściu obiektowym.

Większość popularnych języków progamowania to obecnie języki obiektowe (ang. object oriented programming). Jest kilka zalet działania na obiekatach. Pierwsza o której wspomnieliśmy na początku kursu to możliwość tworzenia elementów, które posiadają stan (podobnie jak zmienne), ale posiadających więcej predefiniowanych atrybutów (wiele zmiennych) oraz przynależących do nich funkcji. Ponieważ możliwe jest równoczesne tworzenie kilku obiektów tej samej klasy programowanie obiektowe bardzo ułatwia sytuację gdzie potrzebujemy wiele instancji (np. użytkowników), co w programowaniu strukturalnym jest znacznie bardziej uciążliwe.

Dodatkowo programowanie obiektowe narzuca pewną organizację kodu i jego separację (ang. encapsulation). Staje się to bardzo praktyczne gdy nasz projekt się rozrośnie, ponieważ zdecydowanie ułatwia to zarządzanie kodem i rozwiązywanie problemów. Więcej o wadach i zaletach programowania obiektowego można przeczytać pod poniższymi adresami:
* https://www.roberthalf.com/blog/salaries-and-skills/4-advantages-of-object-oriented-programming
* https://softwareengineering.stackexchange.com/a/120038
* http://www.freekpaans.nl/2015/06/exploring-the-essence-of-object-oriented-programming/

Poniżej przykład prostej klasy, który pozwoli nam zrozumieć różnicę pomiędzy atrybutami klasy, a atrybutami pojedynczych jej instancji (obiektów).

In [3]:
class prostaKlasa:
    # Atrybut klasy
    i = 3
    def __init__(self):
        # Atrybut instancji klasy
        self.j = 7

Możemy zmieniać atrybuty pojedynczego obiektu, w sposób, który nie wpłynie na pozostałe instancje.

In [4]:
a = prostaKlasa()
b = prostaKlasa()
print(a.i, b.i)
# Mo
a.j = 8
print(a.i, b.i, a.j, b.j)

3 3
3 3 8 7


Poniższa linia zmienia definicję klasy. Zmienione zostaną wszystkie już istniejące instancje (obiekty).

In [6]:
prostaKlasa.i = 5
print(a.i, b.i, a.j, b.j)

# Nowe obiekty będą już tworzone zgodnie ze zmodyfikowanym wzorcem.
c = prostaKlasa()
print(c.i, c.j)

5 5 8 7
5 7


Jeżeli jednak przypiszemy do tej samej nazwy zmiennej (atrybutu instancji) wartość, "i" stanie się atrybutem instancji dla obiektu "a", ale dla pozostałych obiektów dalej będzie atrybutem klasy.

In [19]:
a.i = 1
prostaKlasa.i = 17
d = prostaKlasa()
print(a.i, b.i, c.i, d.i)

1 17 17 17


Warto wiec zapamiętać, że atrybuty instancji są nadrzędne względem atrybutów klasy i je nadpisują.

Przyjrzyjmy się teraz słowu "self" i zobaczmy jak wywołane są metody klasy.

In [20]:
class nowaKlasa:
    def __init__(self):
        # Atrybut instancji klasy
        self.imie = "Maciej"
    # Funkcja statyczna
    def powitanie():
        # Atrybut instancji klasy
        print("Witaj")
    
    # Funkcja statyczna
    def powitanie2(self):
        # Atrybut instancji klasy
        print("Witaj")
    
    def personalnie(self):
        print("Witaj", self.imie)

In [21]:
uczen = nowaKlasa()

Obydwie linie kodu w poniższej komórce działają w dokładnie ten sam sposób. Zwykle używamy pierwszej formy jako formy skróconej. W praktyce za każdym razem, kiedy wywołujemy *instancja.metoda()* wywołujemy zapytanie *klasa.metoda(instancja)*. Tzn, kiedy wywołujemy metodę jakiejś instancji, to tak naprawdę wywołujemy metodę klasy i przekazujemy tam utworzony obiekt.

In [22]:
uczen.personalnie()
nowaKlasa.personalnie(uczen)

Witaj Maciej
Witaj Maciej


Z tego powodu poniższy kod nie zadziała:

In [23]:
uczen.powitanie()

TypeError: powitanie() takes 0 positional arguments but 1 was given

Wywołanie statycznej funkcji może zostać wykonane wyłącznie poprzez wywołanie metody klasy bez podawania argumentów.

In [None]:
nowaKlasa.powitanie()

Możemy jednak identyczną funkcję utworzyć (zobaczmy definicję powitanie2 powyżej) z argumentem self, a później z niego nie korzystać.

In [None]:
uczen.powitanie2()

To spowoduje jednak, że nie zadziała poniższy kod.

In [None]:
nowaKlasa.powitanie2()

W praktyce, zwykle nie stosuje się raczej statycznych funkcji bez przekazywania instancji klasy.
Warto też zauważyć, że "self" nie jest słowem kluczowym Pythona, ale mocno utartym standardem. Co prawda poniższy kod jest poprawny, ale jest to zdecydowanie niezalecane. Wykorzystanie słowa self w Pythonie jest tak silne, że o jego istnienia opierają się nawet niektóre IDE.

In [None]:
class brzydkaKlasa:
    def __init__(self):
        self.imie = "Maciej"
    def personalnie(dowolneSlowo):
        print("Witaj", dowolneSlowo.imie)
test = brzydkaKlasa()
test.personalnie()

Szczegóły dotyczące klas, takie jak np. dziedziczenie pozostawiamy na później, kiedy już mocniej zaprzyjaźnimy się z Pythonem.

Więcej o obiektach możemy przeczytać np. tutaj:
http://python-textbok.readthedocs.io/en/1.0/Classes.html