![](imgs/logo.png)

# Przetwarzanie Big Data z użyciem Apache Spark

Autor notebooka: Jakub Nowacki.

## Język

Ogólna struktura i użycie [języka Python](https://www.python.org/). Inspirowane tutorialem [Learn Python in 10 minutes](https://www.stavros.io/tutorials/python/).

## Zmienne

Jako, że Python jest dynamicznie typowany, zmienne definiujemy bardzo prosto:

In [5]:
zmienna = 2
zmienna += 5
print("Zmienna ma wartosc {}".format(zmienna))

Zmienna ma wartosc 7


In [6]:
zmienna -= 13
print("Zmienna ma wartosc {}".format(zmienna))

Zmienna ma wartosc -6


In [7]:
# Komentarz w jednej lini
# Teraz zmienna tekstowa
tekst = "Hello"
tekst += " world."
# Tylko Python 2
print tekst
# Python 2(.7) i 3
print(tekst)
# albo w notebookach
tekst

Hello world.
Hello world.


'Hello world.'

In [8]:
"""
Komentarz w
wie-
lu
linia-
ch...
Zamiana zmiennych, bo można
"""
tekst, zmienna = zmienna, tekst
tekst, zmienna

(-6, 'Hello world.')

## Typy

Python jest dynamicznie typowany, jak widać powyżej, niemniej ma typy. Podstawowe typy w Pythonie to (do rozpoznawania typów używamy komendy *type*):

In [9]:
print(type(1))
print(type(1.))
print(type("1"))
print(type(u"s")) # W pythonie 3 str to unicode
print(type(1l)) # W Pythonie 3 jest tylko int który ma zakres taki jak long
print(type(1+2j))
print(type(True))
print(type(None))

<type 'int'>
<type 'float'>
<type 'str'>
<type 'unicode'>
<type 'long'>
<type 'complex'>
<type 'bool'>
<type 'NoneType'>


Ponadto Python ma typy złożone:

In [10]:
print(type([1, "dwa", 3.0, 4l]))
print(type((1, "dwa", 3.0, 4l)))
print(type({1, "dwa", 3.0, 4l}))
print(type({1: "dwa", 3.0: 4l}))

<type 'list'>
<type 'tuple'>
<type 'set'>
<type 'dict'>


Można też wymuszać typy, np:

In [11]:
i = int(1.2)
print(i, type(i))
i = int('1')
print(i, type(i))
i = float('1')
print(i, type(i))
i = float('1.2')
print(i, type(i))
# ... ale już nie ...
i = int('1.2')
print(i, type(i))

(1, <type 'int'>)
(1, <type 'int'>)
(1.0, <type 'float'>)
(1.2, <type 'float'>)


ValueError: invalid literal for int() with base 10: '1.2'

## Kontrola przepływu

Jak wiele języków Python posiada wyrażenia warunkowe *if ... else ...*, jak i pętle *while ...* i *for ...*

In [16]:
zakres = range(10)
print(zakres)

for numer in zakres:
    # Sprawdź czy numer jest na liście
    if numer in (3, 4, 7, 9):
        # "Break" kończy pętle
        continue
    else:
        # "Continue" zaczyna kolejną iteracje
        print(numer)
else:
    # "else" jest opcjonalne i wykonywane tylko jak nie pojawi się "break".
    print("petla sie zakonczyla i wypisala co powyzej")

if zakres[1] == 2:
    print "Drugi element listy to 2"
elif zakres[1] == 3:
    print "Drugi element listy to 3"
else:
    print "Nie wiem"

i = 0
while i in zakres:
    print(i)
    i += 1

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
0
1
2
5
6
8
petla sie zakonczyla i wypisala co powyzej
Nie wiem
0
1
2
3
4
5
6
7
8
9


## Funkcje

Jak większość języków Python posiada funkcje. Podstawowa definicja funkcji to:

In [17]:
def funkcja(argument, opcjonalny=2):
    print(u"Funkcja ma argument {} (opcjonalny: {})".format(argument, opcjonalny))

funkcja(u"mój argument")
funkcja(1)
funkcja(1.0, "op")

Funkcja ma argument mój argument (opcjonalny: 2)
Funkcja ma argument 1 (opcjonalny: 2)
Funkcja ma argument 1.0 (opcjonalny: op)


Dostępne są też funkcje anonimowe, tzw. lambdy:

In [21]:
l = lambda x,y: x*y
print(l(4,5))
print(l(16l,15l))
#print(l(1+1j))
#print(l(1.2))
# ... ale już nie ...
#print(l('1'))

20
240


Można też przekazywać funkcje jako argumenty:

In [22]:
def funkcja_w_funkcji(wartosc, fun):
    print("Wynik funkcji to {}".format(fun(wartosc)))

funkcja_w_funkcji(1, lambda x: x+1)
funkcja_w_funkcji(1+3j, lambda x: x+1j)
funkcja_w_funkcji(1, lambda x: float(x))

Wynik funkcji to 2
Wynik funkcji to (1+4j)
Wynik funkcji to 1.0


W funkcjach można używać zmiennych globalnych jak pokazujemy poniżej:

In [23]:
globalna = 1

def funkcja_1():
    print("Zmienna globalna to {}".format(globalna))

funkcja_1() 
    
def funkcja_2():
    global globalna
    print("Zmienna globalna to {}".format(globalna))
    # Zmieniamy zmienna globalną
    globalna = 2

funkcja_2()
print("Ile? {}".format(globalna))

def funkcja_3():
    globalna = 6
    print("Zmienna globalna to {}".format(globalna))
    # Zmieniamy zmienna globalną
    

funkcja_3()
print("Ile? {}".format(globalna))

Zmienna globalna to 1
Zmienna globalna to 1
Ile? 2
Zmienna globalna to 6
Ile? 2


## Operacje na tekście

Python zawiera dość bogaty zakres operacji na tekscie. Poniżej przedstawione są podstawowe metody typu *str*:

In [37]:
s = "tekst   "
print(s.capitalize())
print(s.lower())
print(s.upper())
print(s.count("t"))
print(s.encode('utf-8'))
print(s.startswith('t'))
print(s.endswith('t'))
print(s.find('k'))
print(len(s), len(s.strip()))
print(s.isalnum())
print(s.isdigit())
print(s.islower())
print(s.isspace())
print(s.isupper())
print(";".join(['1','2','3']))

Tekst   
tekst   
TEKST   
2
tekst   
True
False
2
(8, 5)
False
False
True
False
False
1;2;3


## Klasy

Python posiada klasy i dziedziczenie. Klasę definiujemy jak poniżej:

In [44]:
class MojaKlasa(object):
    statyczna = 1
    nazwa = "nazwa klasy MojaKlasa"
    
    def __init__(self, w):
        self.klasowa = w
                
    def suma(self, cos):
        return self.statyczna + self.klasowa + cos
    
    def __str__(self):
        return self.nazwa

c1 = MojaKlasa(4)
c2 = MojaKlasa(33)


print(c1)
print(c2)
print(c1.statyczna)
print(c2.statyczna)
print(c1.klasowa)
print(c2.klasowa)
print(c1.suma(1))
print(c2.suma(1))

nazwa klasy MojaKlasa
nazwa klasy MojaKlasa
1
1
4
33
6
35


## Wyjątki

Jak coś pójdzie nie tak, Python najczęściej rzuca wyjątkiem. Wyjątki to klasy. Możemy obsługiwać wyjątki jak poniżej:

In [None]:
try:
    1/0
except ZeroDivisionError:
    print(u"Przez zero?!?")
else:
    # Nie było wyjątku
    pass
finally:
    print(u"Tu znajdziemy się niezależnie od wyniku")

## Importowanie

Python zawiera bardzo dużo przydatnych bibliotek, w tym bardzo rozbudowaną [bibliotekę standardową](https://docs.python.org/2/library/index.html). Biblioteki można importować jak poniżej:

In [None]:
# Cała biblioteka
import re 
re.findall('\d', "1a32vs")

In [46]:
# Pojedyncze elementy
from re import findall 
findall('\d', "1a32vs")

['1', '3', '2']

##Zadanie

Napisac funkcje, ktora dodaje liczbe do z z zakresu n do stringa:

```
def funkcja(tekst,n):
    ...
```

In [54]:
def funkcja(tekst):
    for i in range(len(tekst)):
        print("{}: {}".format(i,tekst[i]))
        
funkcja("Wojtek")

0: W
1: o
2: j
3: t
4: e
5: k
