# Podstawy programowania w analizie danych

## Tomasz Rodak

2017/2018, semestr letni

Wykład XI

# Przegląd funkcji generatora z biblioteki standardowej

Na podstawie L. Ramahlo, *Fluent Python*, rozdz. 14

Moduł | Funkcja | Opis
--- | --- | ---
`itertools` | `compress(it, selector_it)` | Zwraca element z `it`, gdy równoległy element z `selector_it` jest `True`
`itertools` | `dropwhile(predicate, it)` | Pomija początkowe elementy `item` z `it`, dla których `predicate(item)` zwraca `True`. Resztę elementów zwraca bez względu na wartość `predicate`.
wbudowana | `filter(predicate, it)` | Zwraca elementy `item` z `it`, dla których `predicate(item)` jest `True`.
`itertools` | `islice(it, stop)` lub `islice(it, start, stop[, step])` | Produkuje wycinek `it[:stop]` lub `it[start:stop:step]`.
`itertools` | `takewhile(predicate, it)` | Zwraca elementy `item` z `it` dopóki `predicate(item)` jest `True`.


### `compress(it, selector_it)`

In [None]:
from itertools import compress

# reszty z dzielenia przez 2
g = (k % 2 for k in range(10))

list(compress(range(10), g))

Długości `it` i `selector_it` mogą być różne; `compress()` produkuje wartości do wyczerpania pierwszego z nich.

### `dropwhile(predicate, it)`

In [71]:
from itertools import dropwhile

lst = list(range(10)) + list(reversed(range(10)))
lst

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 9, 8, 7, 6, 5, 4, 3, 2, 1, 0]

In [None]:
list(dropwhile(lambda x: x < 5, lst))

### `takewhile(predicate, it)`

In [72]:
from itertools import takewhile

lst = list(range(10)) + list(reversed(range(10)))
lst

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 9, 8, 7, 6, 5, 4, 3, 2, 1, 0]

In [None]:
list(takewhile(lambda x: x < 5, lst))

### `islice(it, start)`, `islice(it, start, stop[, step])`

In [None]:
def kwadraty():
    k = 1
    while True:
        yield k ** 2
        k += 1

In [None]:
from itertools import islice

kw = kwadraty()
list(islice(kw, 10))

In [None]:
kw = kwadraty()
list(islice(kw, 10, 20))

Moduł | Funkcja | Opis
--- | --- | ---
`itertools` | `accumulate(it, [func])` | Produkuje sumy zakumulowane; jeśli podano `func`, produkuje wynik stosując `func` wobec pierwszej pary elementów, następnie względem pierwszego wyniku i następnego elementu itd.
wbudowana | `enumerate(it, start=0)` | Numeruje elementy `item` z `it` zwracając krotki `(indeks, item)`.
wbudowana | `map(func, it1, [it2, it3, ...])` | Stosuje `func` wobec każdego elementu `it1`. Jeśli podano N obiektów iterowalnych, to `func` musi przyjmować N argumentów; obiekty pobierane są równolegle.

### `accumulate(it, [func])`

In [None]:
from itertools import accumulate

list(accumulate([3, 1, 4, -5]))

In [None]:
list(accumulate([2, 1, 3, 5], lambda x, y: x * y))

Moduł | Funkcja | Opis
--- | --- | ---
`itertools` | `chain(it1, it2, ...)` | Łączy `it1`, `it2`, ... w jeden ciąg.
`itertools` | `chain.from_iterable(it)` | To samo co `chain()`, tyle że łączone obiekty iterowalne same pochodzą z obiektu iterowalnego `it`.
`itertools` | `product(it1, ..., itN, repeat=1)` | Iloczyn kartezjański `it1`, ..., `itN` powtórzonych `repeat` razy.
wbudowana | `zip(it1, it2, ...)` | Konsumuje równolegle obiekty, aż pierwszy zostanie wyczerpany.
`itertools` | `zip_longest(it1, it2, ..., fill_value=None)` | Konsumuje równolegle obiekty, aż do wyczerpania ostatniego. W brakujące wartości wstawia `fill_value`.

### `chain(it1, it2, ...)`

In [None]:
from itertools import chain

list(chain([1, 2, 3], 'abc'))

### `chain.from_iterable(it)`

**Zadanie.** Wypisujemy obok siebie bez odstępów kolejne liczby naturalne
```
12345678910111213141516...
```
Jaka cyfra znajduje się na miejscu tysięcznym?

In [73]:
def liczby_naturalne_str():
    '''Zwraca generator z kolejnymi liczbami naturalnymi
    w formie łańcuchów.'''
    
    c = 1
    while True:
        yield str(c)
        c += 1

Tak wygląda 100 pierwszych cyfr.

In [74]:
cyfry = chain.from_iterable(liczby_naturalne_str())

''.join(islice(cyfry, 100))

'1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545'

A tak uzyskamy rozwiązanie zadania.

In [75]:
cyfry = chain.from_iterable(liczby_naturalne_str())

N = 1000

for k in range(N - 1):
    next(cyfry)

next(cyfry)

'3'

### `product(it1, ..., itN, repeat=1)`

In [76]:
from itertools import product

list(product([1, 2], 'abc'))

[(1, 'a'), (1, 'b'), (1, 'c'), (2, 'a'), (2, 'b'), (2, 'c')]

In [77]:
list(product('abc', repeat=2))

[('a', 'a'),
 ('a', 'b'),
 ('a', 'c'),
 ('b', 'a'),
 ('b', 'b'),
 ('b', 'c'),
 ('c', 'a'),
 ('c', 'b'),
 ('c', 'c')]

Te funkcje pochodzą z `itertools`:

Funkcja | Opis
--- | ---
`combinations(it, k)` | `k`-elementowe kombinacje bez powtórzeń z elementów `it`
`combinations_with_replacement(it, k)` | `k`-elementowe kombinacje z powtórzeniami z elementów `it`
`count(start=0, step=1)` | liczby od `start` co `step` bez końca
`cycle(it)` | elementy z `it` powtarzane bez końca.
`permutations(it, k=None)` | Permutacje `k`-elementowe z elementów `it`. Domyślnie `k` jest długością `it`.
`repeat(item, [times])` | `item` jest powtarzany bez końca, ewentualnie `times` razy.

### `combinations(it, k)`

In [78]:
from itertools import combinations

list(combinations('abcd', 2))

[('a', 'b'), ('a', 'c'), ('a', 'd'), ('b', 'c'), ('b', 'd'), ('c', 'd')]

In [79]:
len(list(combinations('abcdef', 3)))

20

In [80]:
list(combinations('aab', 2))

[('a', 'a'), ('a', 'b'), ('a', 'b')]

### `combinations_with_replacement(it, k)`

In [81]:
from itertools import combinations_with_replacement

list(combinations_with_replacement('abcd', 2))

[('a', 'a'),
 ('a', 'b'),
 ('a', 'c'),
 ('a', 'd'),
 ('b', 'b'),
 ('b', 'c'),
 ('b', 'd'),
 ('c', 'c'),
 ('c', 'd'),
 ('d', 'd')]

### `count(start=0, step=1)`

In [82]:
from itertools import count, islice

list(islice(count(), 10))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [83]:
list(islice(count(start=-10, step=2), 11))

[-10, -8, -6, -4, -2, 0, 2, 4, 6, 8, 10]

### `cycle(it)`

In [None]:
from itertools import cycle, islice

''.join(islice(cycle('cycle'), 22))

### `permutations(it, k=None)`

In [85]:
from itertools import permutations

list(permutations('abc'))

[('a', 'b', 'c'),
 ('a', 'c', 'b'),
 ('b', 'a', 'c'),
 ('b', 'c', 'a'),
 ('c', 'a', 'b'),
 ('c', 'b', 'a')]

In [86]:
list(permutations('abc', 2))

[('a', 'b'), ('a', 'c'), ('b', 'a'), ('b', 'c'), ('c', 'a'), ('c', 'b')]

Funkcje wbudowane:

Funkcja | Opis
--- | ---
`reversed(seq)` | Zwraca elementy w odwrotnej kolejności. `seq` musi być sekwencją lub implementować `__reversed__()`.
`sorted(it [,key=][,reverse=])` | Zwraca posortowaną listę elementów `it`. Jeśli występuje `key=func`, to `func` jest funkcją wywoływaną na elementach `it`; zwrócone wartości stanowią klucz sortowania. `reverse=True` oznacza porządek malejący.

Funkcje wbudowane:

Funkcja | Opis
--- | ---
`all(it)` | Zwraca `True`, gdy wszystkie elementy są wyliczane na `True`.
`any(it)` | Zwraca `True`, gdy pewien element jest wyliczany na `True`.
`max(it, [key=])` | Zwraca wartość maksymalną, `key` jest funkcją porządkującą,
`min(it, [key=])` | Zwraca wartość minimalną, `key` jest funkcją porządkującą,
`sum(it, start=0)` | Suma elementów z `it` z opcjonalną wartością `start`.

## `reduce(func, it, [initial])` z modułu `functools`

Zwraca wynik zastosowania `func` wobec pierwszej pary elementów, następnie wobec tego wyniku i trzeciego elementu itd.; jeśli podana jest wartość `initial`, to tworzy ona początkową parę z pierwszym elementem.

In [None]:
from functools import reduce

reduce(lambda x, y: x + y, [1, 2, 3, 4])

In [None]:
reduce(lambda x, y: x * y, [1, 2, 3, 4])

## Przykład

Zadanie z Kangura 2017, kl II szkoły podstawowej :-)

Za każdą literę **A B C D E** wstawiamy liczbę o cztery większą, lub dwa razy większą niż poprzednia. Jeżeli A=1, to która z liczb nigdy nie będzie równa E?

A) 16 B) 17 C) 22 D) 30 E) 36

In [88]:
from itertools import product
from functools import reduce

FUNKCJE = [lambda x: x + 4, lambda x: 2 * x]
LICZBA_LITER = 5
A = 1

wartości_końcowe = set()

for f_iter in product(funkcje, repeat=LICZBA_LITER - 1):
    wartości_końcowe.add(reduce(lambda x, f: f(x), f_iter, A))
    
wartości_końcowe

{12, 14, 16, 17, 18, 20, 22, 24, 26, 28, 36, 40}

## CalculatorTheGame

**Zadanie.** Napisz program znajdujący rozwiązania w grze [CalculatorTheGame.](https://play.google.com/store/apps/details?id=com.sm.calculateme&hl=pl)

Każdy etap to plansza kalkulatora z przyciskami, wartością startową, dopuszczalną liczbą ruchów i wartością, którą należy uzyskać. Każdy przycisk jest jednoargumentową funkcją zmieniającą wartość w okienku kalkulatora.

Przykładowy etap: 

* wartość początkowa = `36`,
* cel = `20`,
* liczba ruchów = `5`
* przyciski:
  * `+ 3`
  * `/ 3`
  * `1 => 2`, czyli zamień jedynki na dwójki.

Szkic rozwiązania na przykładzie podanego etapu.

Zaczynamy od zdefiniowania funkcji pod przyciskami.

In [None]:
def plus_trzy(n):
    return n + 3

def przez_trzy(n):
    if n % 3:
        raise Exception

    return n // 3

def jeden_w_dwa(n):
    return int(str(n).replace('1', '2'))

Piszemy funkcję `oblicz(start, funkcje)`. Funkcja zwraca wartość uzyskaną z wartości `start` po naciśnięciu sekwencji przycisków.

In [None]:
def oblicz(start, funkcje):
    return reduce(lambda x, f: f(x), funkcje, start)

Definiujemy dane dla naszego etapu.

In [117]:
PRZYCISKI = {'+3': plus_trzy,
             '/3': przez_trzy,
             '1=>2': jeden_w_dwa}

LICZBA_RUCHÓW = 5
START = 36
CEL = 20

Znajdujemy rozwiązanie.

In [118]:
for przyciski in product(PRZYCISKI, repeat=LICZBA_RUCHÓW):
    funkcje = [PRZYCISKI[przycisk] for przycisk in przyciski]
    try:
        wynik = oblicz(START, funkcje)
    except Exception:
        continue
    else:
        if wynik == CEL:
            print(przyciski)

('/3', '/3', '+3', '+3', '1=>2')
('+3', '+3', '/3', '+3', '+3')


## Kolorowanie kwadratów

Kolejne zadanie z Kangura -- poziom Junior, 2000 r.

**Zadanie.** Z dziewięciu jednakowych kwadratów tworzymy jeden o wymiarach `3x3`. Każdy z dziewięciu kwadratów kolorujemy jedną z trzech barw. Na ile różnych sposobów można to zrobić, aby w każdym wierszu i w każdej kolumnie występowały wszystkie trzy kolory?
```
A) 4  B) 6  C) 8  D) 10  E) 12
```

Definiujemy kolory. Piszemy funkcję sprawdzającą poprawność kolorowania.

In [137]:
KOLORY = 'abc'

def kolorowanie_jest_poprawne(kwadrat):
    for w in kwadrat:
        if set(w) != set(KOLORY):
            return False
        
    for w in zip(*kwadrat):
        if set(w) != set(KOLORY):
            return False
    
    return True

Sprawdzamy wszystkie te kolorowania, których wiersze są permutacjami kolorów.

In [138]:
kwadraty = set()

for w1, w2, w3 in product(permutations(KOLORY), repeat=3):
    kwadrat = (w1, w2, w3)
    if kolorowanie_jest_poprawne(kwadrat):
        kwadraty.add(kwadrat)

In [145]:
len(kwadraty)

12