# Definicia funkcie

In [2]:
def fib(n): # Fibonacciho cisla
    """Print a Fibonacci series up to n."""
    result = []
    a, b = 0, 1
    while a < n:
        result.append(a)
        a, b = b, a + b
    return(result)

In [3]:
fib(5)

[0, 1, 1, 2, 3]

# Pomenovane atributy a prednastavene hodnoty

In [18]:
def ask_ok(prompt, retries=4, complaint='Yes or no, please!'):
    while True:
        ok = input(prompt)
        if ok in ('y', 'ye', 'yes'):
            return True
        if ok in ('n', 'no', 'nop', 'nope'):
            return False
        retries = retries - 1
        if retries < 0:
            raise OSError('uncooperative user')
        print(complaint)


In [19]:
ask_ok('Do you really want to quit?', complaint='What?')

Do you really want to quit?grrr
What?
Do you really want to quit?grrrrrr
What?
Do you really want to quit?hhhhee
What?
Do you really want to quit?ererer
What?
Do you really want to quit?ererer


OSError: uncooperative user

# Pozor, v Pythone sa parametre funkcie predavaju referenciou
Pri mutable objektoch to moze sposobit necakane veci ak neviete, co sa vo funkcii deje

In [17]:
def func(val):
    val += 'bar'

x = 'foo'
print(x)
func(x)
print(x)

foo
foo


In [18]:
def func(val):
    val += [3, 2, 1]

x = [1, 2, 3]
print(x)
func(x)
print(x)

[1, 2, 3]
[1, 2, 3, 3, 2, 1]


# Funkcie vyssej urovne sa daju velmi dobre pouzit na spracovanie zoznamu

Najcastejsie operacie so zoznamom:
* zobrazenie
* filter
* redukcia

# Zobrazenie

Aplikovanie funkcie na vsetky prvky zoznamu a vytvorenie noveho zoznamu z transformovanych prvkov

In [96]:
def process_item(x):
    return x*x
item_list = [1,2,3,4,5,6]

In [97]:
# impertivny zapis 
collection = []
for item in item_list:
    partial_result = process_item(item)
    collection.append(partial_result)
collection

[1, 4, 9, 16, 25, 36]

In [99]:
#  C-like zapis
collection = []
index = 0
while index < len(item_list):
    partial_result = process_item(item_list[index])
    collection.append(partial_result)
    index += 1
collection

[1, 4, 9, 16, 25, 36]

# Zobrazenie pomocou funkcie vyssej urovne je prehladnejsie

In [52]:
def process_item(x):
    return x*x
item_list = [1,2,3,4,5,6]

In [56]:
# funkcionalny zapis
collection = map(process_item, item_list)
collection

1
4
9


# Dalsi priklad pouzitia funkcie map

In [63]:
def fahrenheit(T):
    return ((float(9)/5)*T + 32)

def celsius(T):
    return (float(5)/9)*(T-32)
 
temperatures = (36.5, 37, 37.5, 38, 39)
F = list(map(fahrenheit, temperatures))
C = list(map(celsius, F))
print(F)
print(C)

[97.7, 98.60000000000001, 99.5, 100.4, 102.2]
[36.5, 37.00000000000001, 37.5, 38.00000000000001, 39.0]


# Alebo este iny

In [16]:
list(map(len, open('data/morho.txt')))

[8, 1, 42, 39, 40, 40]

In [17]:
list(map(print, open('data/morho.txt')))

Mor ho!



Zleteli orly z Tatry, tiahnu na podolia, 

ponad vysoké hory, ponad rovné polia; 

preleteli cez Dunaj, cez tú šíru vodu, 

sadli tam za pomedzím slovenského rodu.



[None, None, None, None, None, None]

# Funkcia *map* odstranuje potrebu udrzovat si stav

* nepotrebujem ziadnu kolekciu, ktora je v nejakom case ciastocne naplnena
* nepotrebujem ziadny index, ktory sa inkrementuje
* nestaram sa o to, ako map funguje
  * iterativne, rekurziou, paralelne, distribuovane, pomocou indexu?
* nestaram sa o vnutornu strukturu kolekcie
  * staci aby sa cez nu dalo iterovat 

# Funkcia map by mohla byt implementovana napriklad takto

In [66]:
def my_map(f, seq): # Takto by to mohlo byt v pythone 2 a nie 3. Tam map vracia iterator.
    result = []
    for x in seq:
        result.append(f(x))
    return result 

# Filter

Zo zoznamu sa vytvara novy zoznam s tymi prvkami, ktore splnaju podmienku

In [67]:
item_list = [1,2,3,4,5,6]
def condition(x):
    return(x % 2 == 0)

In [68]:
collection = []
for item in item_list:
    if condition(item):
        collection.append(item)
collection

[2, 4, 6]

# Filter pomocou funkcie vyssej urovne

In [69]:
item_list = [1,2,3,4,5,6]
def condition(x):
    return(x % 2 == 0)

In [70]:
collection = filter(condition, item_list)
list(collection)

[2, 4, 6]

# Dalsi priklad pouzitia funkcie *Filter*

In [71]:
fibonacci = [0,1,1,2,3,5,8,13,21,34,55]
def is_even(x):
    return x % 2 == 0

list(filter(is_even, fibonacci))

[0, 2, 8, 34]

# Redukcia

reduce(func, seq, init) 

func(a, b)

Opakovane aplikuje funkciu na sekvenciu. 

*func* prijma dva argumenty: hodnotu akumulatora a jeden prvok mnoziny

Atributom *func* moze byt prvok sekvencie alebo navratova hodnota inej *func*

![reduce](http://www.python-course.eu/images/reduce.png)

# Typicky priklad je suma prvkov zoznamu

In [72]:
item_list = [47,11,42,13]
def add(a,b):
    return(a+b)

In [73]:
from functools import reduce

reduce(add, item_list)

113

![reduce1](http://www.python-course.eu/images/reduce_diagram.png)

In [100]:
total = 0 # Takto by to bolo imperativne
for item in item_list:
    total = add(total, item)
total

21

# Dalsi priklad - nasobenie prvkov zoznamu

In [75]:
from functools import reduce
def mul(a,b):
    return a * b

reduce(mul, [1,2,3,4,5])

120

# Vela funkcii uz je predpripravenych

In [None]:
from operator import add

In [None]:
from operator import mul

# Da sa spracovavat aj nieco ine ako cisla

In [15]:
from functools import reduce
from operator import add

print(reduce(add, open('data/morho.txt')))

Mor ho!

Zleteli orly z Tatry, tiahnu na podolia, 
ponad vysoké hory, ponad rovné polia; 
preleteli cez Dunaj, cez tú šíru vodu, 
sadli tam za pomedzím slovenského rodu.



# Da sa napriklad pracovat s mnozinami

In [78]:
from operator import or_
reduce(or_, ({1}, {1, 2}, {1, 3}))  # union

{1, 2, 3}

In [79]:
from operator import and_
reduce(and_, ({1}, {1, 2}, {1, 3}))

{1}

# Lambda funkcia

anonymna funkcia

In [80]:
my_sum = lambda x, y: x + y
my_sum(1,2)

3

* obemdzenie na jediny riadok
* nepotrebuje return

# Lambda je celkom prakticka ako parameter funkcie

In [81]:
item_list = [1,2,3,4,5]
print(list(map(lambda x: x**2, item_list)))

[1, 4, 9, 16, 25]


In [102]:
item_list = ["auto", "macka", "traktor"]
list(map(lambda x: x.upper(), item_list))

['AUTO', 'MACKA', 'TRAKTOR']

# Spracovanie zoznamu (list comprehension)

In [90]:
print(list(map(lambda x: x**2, [1,2,3,4,5])))
print([x**2 for x in [1,2,3,4,5]])

[1, 4, 9, 16, 25]
[1, 4, 9, 16, 25]


In [95]:
print(list(filter(lambda x: x % 2 == 0, [1,2,3,4,5])))
print([x for x in [1,2,3,4,5] if x % 2 == 0])

[2, 4]
[2, 4]


# Na co je to cele dobre - MapReduce

* je programovací model (framework) vyvinutý a patentovaný spoločnosťou Google, Inc. v roku 2004
* hlavným cieľom jeho vývoja bolo uľahčiť programátorom vytváranie paralelných aplikácií, ktoré spracovávajú veľké objemy dát
* zložité výpočty nad veľkým objemom dát musia byť vykonávané paralelne, niekedy až na stovkách alebo tisíckach počítačov súčasne
* pri takomto spracovaní sa treba okrem samotného výpočtu sústrediť napríklad aj na
  * rovnomerné rozdelenie záťaže všetkým dostupným počítačom
  * kontrolovanie výpadkov a porúch spolu s ich následným riešením
* MapReduce prináša ďalšiu vrstvu abstrakcie medzi výpočet, ktorý sa má realizovať paralelne a jeho vykonanie na konkrétnom hardvéri
* Keď napíšem program správne, tak sa nemusím starať na koľkých počítačoch bude bežať