# Podstawy programowania w Pythonie
## Pamięć i adresowanie
Z punktu widzenia analityka Python jest atrakcyjnym językiem progamowania, między innymi ze względu na swoją wydajność. Skoro jesteśmy zorientowani na wydajność/efektywność musimy chociaż w podstawowym zakresie zrozumieć istotę zarządzania pamięcią i adresowania w programowaniu, a w szczególności w Pythonie. Zrozumienie tego zagadnienia ma znaczenie nie tylko dla szybkości naszych programów, ale przede wszystkim ich poprawności. Poniżej postaram się przybliżyć to zagadnienie w pewnym uproszczeniu, ale możliwie przystępnie.

Efektywne zarządzanie pamięcią jest dla nas bardzo ważne z dwóch powodów: **pamięć jest wolna**, a dodatkowo w czasach dużych zbiorów danych **pamięć jest cenna**. Z tych powodów za wszelką cenę unikać będziemy kopiowania elementów w pamięci i przepisywania ich z miejsca na miejsce. Może wydawać nam się, że pamięć RAM jest "szybka", ponieważ jest znacznie szybsza niż dyski HDD i dużo szybsza niż SSD. Jest jednak dużo wolniejsza niż dzisiejsze CPU (stąd obeność pamięci podręcznej CPU, link na ten temat poniżej). Z punktu widzenia efektywności większości naszych programów pamięć jest wolna, dlatego będziemy unikać kopiowania, ale również odczytu i zapisu.

Każdy obiekt przechowywany w pamięci, niezależnie od tego jak duży, ma swój adres. Dotyczy to zarówno małych obiektów (np. pojedynczy int) jak i dużych obiektów (nasz ogromny zbiór danych na którym chcemy pracować). Adresy obiektów zawsze są "małe", nawet jeżeli sam obiekt jest bardzo duży. Z tego powodu dużo łatwiej jest przekazać informację o adresie obiektu niż cały obiekt - utworzyć jego drugą kopię w pamięci.

Spójrzmy na prosty przykład:

In [1]:
a = 3
b = a
print(a, b)
b = 4
print(a, b)

3 3
3 4


Jak widać dla liczby, operator przypisania "=" skutkuje skopiowaniem obiektu. Jak zachowa się ten operator w przypadku listy?

In [2]:
kolory = ["red", "blue", "green"]
kolory2 = kolory
kolory2.append("black")
print(kolory)

['red', 'blue', 'green', 'black']


Po "stworzeniu" zmiennej kolory2 moglibyśmy spodziewać się skopiowanego obiektu. Wydawać by się mogło, że dodanie "black" do kolory2 nie powinno wpłynąć na kolory. W praktyce jednak, dla obiektu jakim jest lista operator "=" kopiuje adres (referencję/alias) do obiektu. Po linii:

kolory2 = kolory

zarówno zmienna kolory, jak i kolory2 zawierają adres tej samej listy. Możemy o tym pomyśleć jak o zapisywaniu adresu budynku na dwóch różnych kartkach. Kiedy powiemy do listy pod pewnym adresem (czytając adres z drugiej kartki - kolory2) dodaj "black", to wracając pod ten sam adres (który przeczytamy z pierwszej kartki - kolory), zobaczymy tę jedyną listę (ten sam budynek), która istnieje w pamięci.

Wróćmy teraz do wcześniejszego przykładu i spróbujmy zrozumieć, co się tutaj dzieje. Przykład ten doskonale pokazuje jak trudne do wychwycenia błędy możemy spowodować, jeżeli będziemy pisać kod bez zrozumienia referencji.

In [3]:
kolory = ["red", "blue", "green"]
liczby = [4, 5, 6]

listaMieszana1 = kolory
listaMieszana1.append(liczby)
print(listaMieszana1)

listaMieszana2 = []
listaMieszana2.append(kolory)
listaMieszana2.append(liczby)
print(listaMieszana2)

['red', 'blue', 'green', [4, 5, 6]]
[['red', 'blue', 'green', [4, 5, 6]], [4, 5, 6]]


Kiedy napiszemy: *listaMieszana1 = kolory*, zamiast: *listaMieszana1 = list(kolory)*, to zmienna listaMieszana1 nie jest adresem kopii, a jedynie nowym adresem starego obiektu. Z tego powodu pisząc:

listaMieszana2.append(kolory)

Na pierwszym miejscu nowej listy listaMieszana2 wstawiamy już listę mieszaną (zmodyfikowaliśmy wcześniej listę, która była pod "adresem" kolory).

Spójrzmy ponownie na poprawnie napisany kod, który na dwa sposoby pokazuje jak stworzyć nowy obiekt (kopię):

In [4]:
kolory = ["red", "blue", "green"]
liczby = [4, 5, 6]

listaMieszana1 = list(kolory)
# lub alternatywnie
listaMieszana1 = kolory.copy()

listaMieszana1.append(liczby)
print(listaMieszana1)

listaMieszana2 = []
listaMieszana2.append(kolory)
listaMieszana2.append(liczby)
print(listaMieszana2)

['red', 'blue', 'green', [4, 5, 6]]
[['red', 'blue', 'green'], [4, 5, 6]]


* Wprowadzenie 64-bitowych procesorów jest bezpośrednio powiązane z adresowaniem pamięci: https://www.youtube.com/watch?v=KgiMzKb8dD0
* Materiał, dla zainteresowanych, o tym jak istotne są rodzaje pamięci operacyjnej i podręcznej:
https://www.extremetech.com/extreme/188776-how-l1-and-l2-cpu-caches-work-and-why-theyre-an-essential-part-of-modern-chips
* Materiał, dla bardzo zainteresowanych, o niskopoziomowym działaniu pamięci RAM:
https://www.youtube.com/watch?v=cNN_tTXABUA
* Osoby mocniej zainteresowane programowaniem powinny dobrze rozumieć różnicę pomiędzy obiektem, referencją i wskaźnikiem.

## Kontrola przepływu

### For, zakresy i iteratory
Python umożliwia nam bardzo łatwe tworzenie zakresów liczb. Zobaczmy kilka przykładów z wykorzystaniem "for" i iteratora "range":

In [5]:
# Kiedy będziemy chcieli wyświetlić zakres liczb, dostaniemy "dziwny" wynik:
print(range(4))
# Output: "range(0, 4)" informuje nas o tym, jaki iterator został stworzony.
# Nie informuje jednak o wszystkich elementach, które potrafi wyświetlić.
print("Wyświetlmy wszystkie elementy range(4): ")
for i in range(4):
    print(i)
# Zobaczmy dwa inne przykłady:
print("Wyświetlmy wszystkie elementy range(2, 10, 2): ")
for i in range(2, 10, 2):
    print(i)

print("Wyświetlmy wszystkie elementy range(0, -11, -3): ")
for i in range(0, -11, -3):
    print(i)

range(0, 4)
Wyświetlmy wszystkie elementy range(4): 
0
1
2
3
Wyświetlmy wszystkie elementy range(2, 10, 2): 
2
4
6
8
Wyświetlmy wszystkie elementy range(0, -11, -3): 
0
-3
-6
-9


Iteratory umożliwiają nam łatwe poruszanie się po naszych obiektach, kiedy chcemy zajrzeć do każdego elementu.

In [6]:
kolory = ["red", "blue", "green"]
for kolor in kolory:
    print(kolor)

red
blue
green


Kiedy zastosujemy podobny manewr dla elementów słownika nasz iterator zwróci nam pary ze słownika zwrócone w postaci dwuelementowych krotek (tuple). W praktyce nie jest to bardzo wygodne.

Jeżeli nie chcemy, żeby nasz wynik był krotką, a po prostu dwoma zmiennymi, z którymi chcemy coś zrobić, możemy wykorzystać ciekawą własność Pythona - automatyczne rozpakowywanie krotek. Jak widać poniżej, kiedy podaliśmy liczbę argumentów równą liczbie elementów pojedynczej krotki, Python od razu je rozpakował.

In [9]:
autor = {'imie': 'Maciej', 'nazwisko':'Wilamowski', 'wiek': 32}
for element in autor.items():
    print(element)
print("\nRozpakowane krotki: ")
for klucz, wartosc in autor.items():
    print(klucz, wartosc)

('imie', 'Maciej')
('nazwisko', 'Wilamowski')
('wiek', 32)

Rozpakowane krotki: 
imie Maciej
nazwisko Wilamowski
wiek 32


In [8]:
for element in autor.:
    print(element)

imie
nazwisko
wiek


### Enumerate
W niektórych przypadkach możemy potrzebować informacji nie tylko  o zawartości kolejnych elementów listy, ale również ich indeksach. W tym celu możemy wykorzystać iterator numerujący, enumerate():

In [10]:
for i, kolor in enumerate(kolory):
    print(i, kolor)

0 red
1 blue
2 green


### Zip
Czasami możemy być w sytuacji, w której mamy dwie listy po których chcielibyśmy równolegle iterować. Przydaje się do tego zip(), który połączy listy i kolejne ich elementy zwróci w formie krotki (tuple). Liczba elementów zwróconych przez zip() będzie równa długości najkrótszej z list.

In [11]:
kolory = ["red", "blue", "green"]
liczby = [4, 5, 6, 7]
imiona = ["Matt", "Ben", "John", "Adam", "Jim"]

for kolor, liczba in zip(kolory,liczby):
    print(kolor, liczba)

print("\nZip dla 3 elementów")
for kolor, liczba, imie in zip(kolory,liczby,imiona):
    print(kolor, liczba, imie)

red 4
blue 5
green 6

Zip dla 3 elementów
red 4 Matt
blue 5 Ben
green 6 John


### List Comprehensions
Wykonywanie operacji/funkcji na wszystkich elementach list jest tak często wykorzystywane, że w Pythonie jest do tego celu specjalna instrukcja/składnia (List Comprehensions), której celem jest stworzenie listy na podstawie innej już istniejącej listy. Jest to jednoliniowy for, który ma następującą składnię:

[co_zrobić(x) for x in jakas_lista opcjonalny_test_logiczny]

Przykładowo:

In [12]:
lista1 = list(range(5))
print([x**2 for x in lista1])
# Możemy wykonać tę operację np. tylko dla liczb parzystych.
print([x**2 for x in lista1 if x % 2 == 0])
# Nasza operacja może być więcej niż jednoargumentowa
lista2 = list(range(2, 12, 2))
print([x * y for (x, y) in zip(lista1, lista2)])

[0, 1, 4, 9, 16]
[0, 4, 16]
[0, 4, 12, 24, 40]


### If oraz while
W ramach kontroli przepływu pozostały jescze dwa podstawowe elementy: if oraz while. Ich implementacja jest w pełni analogiczna do innych językow programowania.

In [13]:
x = 3
if x < 2:
    print("Wartość poniżej")
elif x > 10:
    print("Wartość powyżej")
else:
    print("Wartość w przedziale (2, 10)")

Wartość w przedziale (2, 10)


In [17]:
import math
# Opis pozostałych funkcji dostępnych w module math.
# https://docs.python.org/3/library/math.html
math.pow(2, 3)
tol = 0.1
diff = 1
k = 1
while(diff > tol):
    diff = math.e - abs(math.pow((1 + 1 / k), k))
    print(k, math.pow((1 + 1 / k), k), diff)
    k += 1

1 2.0 0.7182818284590451
2 2.25 0.4682818284590451
3 2.37037037037037 0.3479114580886753
4 2.44140625 0.2768755784590451
5 2.4883199999999994 0.22996182845904567
6 2.5216263717421135 0.19665545671693163
7 2.546499697040712 0.17178213141833298
8 2.565784513950348 0.1524973145086972
9 2.5811747917131984 0.13710703674584668
10 2.5937424601000023 0.12453936835904278
11 2.6041990118975287 0.11408281656151642
12 2.613035290224676 0.10524653823436925
13 2.6206008878857308 0.09768094057331433


### Continue
Czasami  chcemy zrezygnować z wykonywania kodu w tej konkretnej iteracji pętli. Możemy wykorzystać do tego polecenie continue. Przykładowo:

In [18]:
for i in range(11):
    if i % 3 == 0:
        continue
    else:
        print(i)

1
2
4
5
7
8
10


### Break
Każdą z pętli (for i while) możemy też przerwać przy pomocy komendy break.

In [19]:
import math
# Opis pozostałych funkcji dostępnych w module math.
# https://docs.python.org/3/library/math.html
math.pow(2, 3)
tol = 0
diff = 1
k = 1
while(diff > tol):
    diff = math.e - abs(math.pow((1 + 1 / k), k))
    print(k, math.pow((1 + 1 / k), k), diff)
    k += 1
    if k > 15:
        print("Chyba zagapiliśmy się z tolerancją ... przerywamy.")
        break

1 2.0 0.7182818284590451
2 2.25 0.4682818284590451
3 2.37037037037037 0.3479114580886753
4 2.44140625 0.2768755784590451
5 2.4883199999999994 0.22996182845904567
6 2.5216263717421135 0.19665545671693163
7 2.546499697040712 0.17178213141833298
8 2.565784513950348 0.1524973145086972
9 2.5811747917131984 0.13710703674584668
10 2.5937424601000023 0.12453936835904278
11 2.6041990118975287 0.11408281656151642
12 2.613035290224676 0.10524653823436925
13 2.6206008878857308 0.09768094057331433
14 2.6271515563008685 0.0911302721581766
15 2.6328787177279187 0.08540311073112639
Chyba zagapiliśmy się z tolerancją ... przerywamy.


## Obsługa błędów
Gdy wykorzystujemy Pythona do analizy danych względnie często znajdziemy się  sytuacji, w której nasz kod będzie zwracał błędy. Najprostszym tego typu przykładem może być praca z brakującymi danymi lub wykonywanie operacji dzielenia przez zero. W tej sytuacji nie chcemy, aby cały progam przestawał działać.

W poniższym kodzie nasz program się "wysypie" w trzeciej linii i nie wykona czwartej (co można łatwo sprawdzić wykonując od razu kolejną komórkę).

In [20]:
a = 0
b = 4
c = b / a
d = a + b

ZeroDivisionError: division by zero

In [21]:
d

NameError: name 'd' is not defined

In [22]:
a = 0
b = 4
try:
    c = b / a
# Przy operacji dzielenia dwóch liczb jedyny błąd jakiego mogę się spodziewać, to:
except ZeroDivisionError as e:
    print("Próbowaliśmy dzielić przez zero!")
    c = b * float('inf')
# Tutaj nie spodziewam się błędu.
d = a + b
print (c, d)

Próbowaliśmy dzielić przez zero!
inf 4


Ze względu na fakt, iż chcemy wiedzieć jak obsłużyć dany błąd (wiedzieć co zrobić, gdy wystąpi, np. przypisując "inf") nie powinniśmy starać się łapać wszystkich błędów (w poniższej komórce nie wykona się ostatnie polecenie). Niemniej w niektórych przypadkach, szczególnie w momencie tworzenia/testowania kodu wyłapywanie wszystkich błędów może być przydatne.

In [23]:
a = 0
b = 4
try:
    f = b / a
except Exception as e:
    print (e.__doc__)
    
g = a + b
print (f, g)

Second argument to a division or modulo operation was zero.


NameError: name 'f' is not defined

Z tego powodu możemy chcieć znaleźć błąd, wykonać dodatkowy kod (np. logowanie), a potem mimo wszystko zatrzymać skrypt.

In [24]:
a = 0
b = 4
try:
    f = b / a
except Exception as e:
    print (e.__doc__)
    print ("Mamy błąd, zatrzymuję skrypt.")
    raise 
    
g = a + b
print (f, g)

Second argument to a division or modulo operation was zero.
Mamy błąd, zatrzymuję skrypt.


ZeroDivisionError: division by zero

In [37]:
import sys, traceback
a = 0
b = 4
try:
    f = b / a
except Exception as e:
    ex_type, ex, tb = sys.exc_info()
    print(ex)
    traceback.print_tb(tb)
    print (e.__doc__)

    
g = a + b
print (f, g)

division by zero
Second argument to a division or modulo operation was zero.


  File "<ipython-input-37-f3347cdea6b6>", line 5, in <module>
    f = b / a


NameError: name 'f' is not defined

W praktyce obsługa błędów może być bardziej rozbudowana. Na tym etapie nie musimy jednak wiedzieć nic więcej. Zainteresowani mogą chcieć zapoznać się z poniższymi linkami:
* https://docs.python.org/3/tutorial/errors.html
* https://jeffknupp.com/blog/2013/02/06/write-cleaner-python-use-exceptions/
* http://www.pythonforbeginners.com/error-handling/exception-handling-in-python
* http://eli.thegreenplace.net/2008/08/21/robust-exception-handling/