![](imgs/logo.png)

# Przetwarzanie Big Data z użyciem Apache Spark

Autor notebooka: Jakub Nowacki.

## Język

Ogólna struktura i użycie [języka Python](https://www.python.org/). Inspirowane tutorialem [Learn Python in 10 minutes](https://www.stavros.io/tutorials/python/).

## Zmienne

Jako, że Python jest dynamicznie typowany, zmienne definiujemy bardzo prosto:

In [4]:
zmienna = 2
zmienna += 5
print("Zmienna ma warto")

7

In [None]:
zmienna -= 13
zmienna

In [None]:
# Komentarz w jednej lini
# Teraz zmienna tekstowa
tekst = "Hello"
tekst += " world."
# Tylko Python 2
print tekst
# Python 2(.7) i 3
print(tekst)
# albo w notebookach
tekst

In [None]:
"""
Komentarz w
wie-
lu
linia-
ch...
Zamiana zmiennych, bo można
"""
tekst, zmienna = zmienna, tekst
tekst, zmienna

## Typy

Python jest dynamicznie typowany, jak widać powyżej, niemniej ma typy. Podstawowe typy w Pythonie to (do rozpoznawania typów używamy komendy *type*):

In [None]:
print(type(1))
print(type(1.))
print(type("1"))
print(type(u"s")) # W pythonie 3 str to unicode
print(type(1l)) # W Pythonie 3 jest tylko int który ma zakres taki jak long
print(type(1+2j))
print(type(True))
print(type(None))

Ponadto Python ma typy złożone:

In [None]:
print(type([1, "dwa", 3.0, 4l]))
print(type((1, "dwa", 3.0, 4l)))
print(type({1, "dwa", 3.0, 4l}))
print(type({1: "dwa", 3.0: 4l}))

Można też wymuszać typy, np:

In [None]:
i = int(1.2)
print(i, type(i))
i = int('1')
print(i, type(i))
i = float('1')
print(i, type(i))
i = float('1.2')
print(i, type(i))
# ... ale już nie ...
i = int('1.2')
print(i, type(i))

## Kontrola przepływu

Jak wiele języków Python posiada wyrażenia warunkowe *if ... else ...*, jak i pętle *while ...* i *for ...*

In [None]:
zakres = range(10)
print(zakres)

for numer in zakres:
    # Sprawdź czy numer jest na liście
    if numer in (3, 4, 7, 9):
        # "Break" kończy pętle
        break
    else:
        # "Continue" zaczyna kolejną iteracje
        continue
else:
    # "else" jest opcjonalne i wykonywane tylko jak nie pojawi się "break".
    pass # Nic nie rób

if zakres[1] == 2:
    print "Drugi element listy to 2"
elif zakres[1] == 3:
    print "Drugi element listy to 3"
else:
    print "Nie wiem"

i = 0
while i in zakres:
    print(i)
    i += 1

## Funkcje

Jak większość języków Python posiada funkcje. Podstawowa definicja funkcji to:

In [None]:
def funkcja(argument, opcjonalny=2):
    print(u"Funkcja ma argument {} (opcjonalny: {})".format(argument, opcjonalny))

funkcja(u"mój argument")
funkcja(1)
funkcja(1.0, "op")

Dostępne są też funkcje anonimowe, tzw. lambdy:

In [None]:
l = lambda x: x+1
print(l(1))
print(l(1l))
print(l(1+1j))
print(l(1.2))
# ... ale już nie ...
print(l('1'))

Można też przekazywać funkcje jako argumenty:

In [None]:
def funkcja_w_funkcji(wartosc, fun):
    print("Wynik funkcji to {}".format(fun(wartosc)))

funkcja_w_funkcji(1, lambda x: x+1)
funkcja_w_funkcji(1, lambda x: x+1j)
funkcja_w_funkcji(1, lambda x: float(x))

W funkcjach można używać zmiennych globalnych jak pokazujemy poniżej:

In [None]:
globalna = 1

def funkcja_1():
    print("Zmienna globalna to {}".format(globalna))

funkcja_1() 
    
def funkcja_2():
    global globalna
    print("Zmienna globalna to {}".format(globalna))
    # Zmieniamy zmienna globalną
    globalna = 2

funkcja_2()
print("Ile? {}".format(globalna))

def funkcja_3():
    print("Zmienna globalna to {}".format(globalna))
    # Zmieniamy zmienna globalną
    globalna = 2

funkcja_3()
print("Ile? {}".format(globalna))

## Operacje na tekście

Python zawiera dość bogaty zakres operacji na tekscie. Poniżej przedstawione są podstawowe metody typu *str*:

In [None]:
s = "tekst   "
print(s.capitalize())
print(s.lower())
print(s.upper())
print(s.count("t"))
print(s.encode('utf-8'))
print(s.startswith('t'))
print(s.endswith('t'))
print(s.find('k'))
print(len(s), len(s.strip()))
print(s.isalnum())
print(s.isdigit())
print(s.islower())
print(s.isspace())
print(s.isupper())
print(s.join(['1','2','3']))

## Klasy

Python posiada klasy i dziedziczenie. Klasę definiujemy jak poniżej:

In [None]:
class MojaKlasa(object):
    statyczna = 1

    def __init__(self, w):
        self.klasowa = w
        
    def suma(self, cos):
        return self.statyczna + self.klasowa + cos

c1 = MojaKlasa(4)
c2 = MojaKlasa(33)


print(c1)
print(c2)
print(c1.statyczna)
print(c2.statyczna)
print(c1.klasowa)
print(c2.klasowa)
print(c1.suma(1))
print(c2.suma(1))

## Wyjątki

Jak coś pójdzie nie tak, Python najczęściej rzuca wyjątkiem. Wyjątki to klasy. Możemy obsługiwać wyjątki jak poniżej:

In [None]:
try:
    1/0
except ZeroDivisionError:
    print(u"Przez zero?!?")
else:
    # Nie było wyjątku
    pass
finally:
    print(u"Tu znajdziemy się niezależnie od wyniku")

## Importowanie

Python zawiera bardzo dużo przydatnych bibliotek, w tym bardzo rozbudowaną [bibliotekę standardową](https://docs.python.org/2/library/index.html). Biblioteki można importować jak poniżej:

In [None]:
# Cała biblioteka
import re 
re.findall('\d', "1a32vs")

In [None]:
# Pojedyncze elementy
from re import findall 
findall('\d', "1a32vs")