# Spotkanie 5 - preliminaria

Zaczniemy od przypomnienia sobie działania matematyki i funkcji w Pythonie. Jaka będzie wartość `x` po przekształceniach?

In [1]:
x = 5
x += 2
x *= 3
x %= 8

A jaka będzie wartość `y`?

In [2]:
y = 0
for i in range(5):
    if i % 2 == 0:
        y += i

Jeśli chcemy wykonać pętlę która doda do siebie kolejne liczby od 1 do N, piszemy:

In [3]:
N = 10
suma = 0
for i in range(N):
    suma += i

Powiedzmy, że chcemy stworzyć tablicę liczb parzystych od 0 do 50. Napiszemy wtedy:

In [4]:
%pprint #musiałem dopisać tę linię aby lista była zapisana w jednej linii
[2*i for i in range(0, 26)] #od zera do 26, bez 26

Pretty printing has been turned OFF


[0, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50]

Teraz zadanie: mamy do napisania funkcję, która zwróci wszystkie liczby podzielne przez 7 ale nie będące wielokrotnością 5, z przedziału 2000 do 3200 (włącznie):

In [5]:
def funkcja():
    tab = []
    for i in range(2000,3201):
        if i%7 == 0 and i%5 != 0:
            tab.append(i)
    return tab

Pamiętamy definicję silni, prawda? Bezpośrednio ma postać:

$$n! = 1\cdot2\cdot...\cdot(n-1)\cdot n,$$

natomiast postać rekurencyjna:

$$0! = 1$$
$$1! = 1$$
$$n! = n\cdot (n-1)!$$

Napiszemy teraz funkcje zwracające wartości silni z liczb naturalnych w sposób bezpośredni i rekurencyjny:

In [6]:
def silnia_bezp(n):
    silnia = 1
    for i in range(1,n+1):
        silnia *= i
    return silnia

def silnia_rek(n):
    if n==0:return 1
    else:
        return n*silnia_rek(n-1)

## Żółw

Dla przypomnienia, żółwiowe metody:

### Poruszanie

    Podstawy
        forward() | fd()
        backward() | bk() | back()
        right() | rt()
        left() | lt()
    
    Dodatkowe komendy
        home()
        circle()
        dot()
        stamp()
        undo()
        speed()

### Kontrola pisaka

    Stan pisaka
        pendown() | pd() | down()
        penup() | pu() | up()
        pensize() | width()
        pen()
        isdown()
    
    Kolor
        color()
        pencolor()
        fillcolor()
    
    Wypełnienie
        fill()
        begin_fill()
        end_fill()

### Kontrola stanu
        showturtle() | st()
        hideturtle() | ht()
        isvisible()
        done()

# Spotkanie 5 - zbiory i sortowanie

Na naszym spotkaniu po wakacjach omówimy kilka użytecznych algorytmów zaimplementowanych na stałe w Pythonie. Zaczniemy od prostego problemu - mamy n-elementową tablicę liczb i musimy policzyć, ile jest w niej **różnych** elementów. Na przykład, w tablicy:

In [7]:
[1,2,1,3,2,2]

[1, 2, 1, 3, 2, 2]

mamy trzy różne liczby. Wymyślimy teraz na parę różnych sposobów jak policzyć elementy.

## Podejście pierwsze

W tym przykładzie będę korzystał z losowo wygenerowanej tablicy. Losujemy liczby od 1 do 50 sto razy - mamy zatem pewność, że liczby będą się powtarzać. Funkcja `randint(a,b)` z biblioteki random losuje liczbę z zakresu od a do b (łącznie z a, b), tablica ponawia działanie 100 razy.

Pewnym pomysłem może być podejście typu ***brute-force*** - bez nadmiernego myślenia liczymy 'na palcach' ile pojawiło się różnych liczb. Przy każdym elemencie tablicy sprawdzamy, czy liczba już się pojawiła przy użyciu osobnej tablicy - jeśli nie, dopisujemy ją do owej tablicy. Na końcu zwracamy długość tablicy liczb.

In [8]:
from random import randint
tab = [randint(1,50) for i in range(100)]

numbers = []

for x in tab: #dla kazdego elementu x z tablicy tab
    nowaLiczba = True
    for y in numbers: #porownujemy x z kazdym elementem z numbers
        if x is y: #jesli x jest rowny y, przerywamy sprawdzanie
            nowaLiczba = False #flaga jest opuszczona, nie mamy nowej liczby
            break
    if nowaLiczba is True: #jesli mamy nowa liczbe dopisujemy ja
        numbers.append(x)
            
len(numbers)

45

## Podejscie drugie

Możemy również zastosować składnię `if x in X` do sprawdzenia obecności liczby na liście:

In [9]:
X = [1,2,3]
if 1 in X:
    print("1 jest w liście", X)
if 4 in X:
    print("4 jest w liście", X)

1 jest w liście [1, 2, 3]


Wtedy powyższy kod przyjmuje postać:

In [10]:
numbers = []

for x in tab: #dla kazdego elementu x z tablicy tab
    nowaLiczba = True
    if x in numbers: #jesli x jest w numbers
        nowaLiczba = False #nie mamy nowej liczby
    if nowaLiczba is True: #jesli mamy nowa liczbe dopisujemy ja
        numbers.append(x)
            
len(numbers)

45

Możemy nawet zaszaleć i skrócić kod jeszcze bardziej:

In [11]:
def rozneLiczby(tab):
    numbers = []
    for x in tab: #dla kazdego elementu x z tablicy tab
        if x not in numbers: #jesli x nie jest w numbers
            numbers.append(x) #dopisujemy nowa liczbe
    return len(numbers)

rozneLiczby(tab)

45

Jednakowoż, pojawia się teraz następujący problem: składnia `x in X` lub `x not in X` w istocie nie skraca wykonywania skryptu.

In [12]:
from timeit import timeit
%timeit rozneLiczby(tab)

10000 loops, best of 3: 44.8 µs per loop


In [13]:
tab2 = [randint(0,1000) for i in range(1000)]
%timeit rozneLiczby(tab2)

100 loops, best of 3: 5.24 ms per loop


In [14]:
tab2 = [randint(0,20000) for i in range(20000)]
%timeit rozneLiczby(tab2)

1 loop, best of 3: 1.96 s per loop


Przy relatywnie niskiej liczbie 20000 elementów mamy już strasznie długi czas wykonywania skryptu 2 sekund. Być może zatem jest jakaś inna metoda która pozwalałaby na skrócenie czasu wykonywania?

## Podejście trzecie - sortowanie

Owszem, jest - bardzo prosty. Załóżmy teraz, że nasza tablica losowych elementów jest posortowana - tj. dalej mamy te same elementy, ale są one w ściśle ustalonej kolejności, od najmniejszego do największego. Aby dać lepszy obraz sytuacji, tablica:

In [15]:
x = [randint(1, 5) for i in range(10)]
x

[4, 2, 4, 3, 2, 2, 1, 5, 4, 3]

po posortowaniu przyjmuje postać:

In [16]:
sorted(x)

[1, 2, 2, 2, 3, 3, 4, 4, 4, 5]

(moglibyśmy również użyć metody `x.sort()` aby trwale posortować tablicę `x`). W tym momencie pozbywamy się problemu, w którym jakiś element powtarza się po długim czasie nieobecności - jeśli mamy jakiś potwarzającą się liczbę, będzie ona zgrupowana razem z innymi elementami o tej samej wartości. Nasza funkcja zliczająca różne elementy może zatem przyjąć postać:

In [17]:
def rozneLiczbyV2(tab):
    Tab2 = sorted(tab) #Tab2 to posortowana wersja tab
    y = Tab2[0] #zmienna pomocnicza zaczyna jako pierwszy element
    n = 1 #zliczamy rozne liczby - na pewno mamy jedną
    for x in Tab2:
        if x is not y:
            n += 1 #za każdym razem gdy x nie jest równe y, 
                    #licznik się zwiększa
            y = x #zmienna do porównania przyjmuje nową wartość
    return n

rozneLiczby(tab)
rozneLiczbyV2(tab)

45

Sprawdźmy teraz, jak nowa funkcja poradzi sobie z dużą tablicą 20000 elementów:

In [18]:
%timeit(rozneLiczbyV2([randint(1,20000) for i in range(20000)]))

10 loops, best of 3: 38.7 ms per loop


In [19]:
%timeit(rozneLiczby([randint(1,20000) for i in range(20000)]))

1 loop, best of 3: 2.06 s per loop


## Podejście czwarte - set container

Do tej pory korzystaliśmy z listy jako bardzo naturalnego obiektu. W ogólności, lista jest jednym z dostępnych pojemników (nazywanych *kolekcjami*). Jeśli weźmiemy jakąś gromadę elementów, np. parę lub trójkę, i wrzucimy ją do listy, otrzymamy:

In [20]:
list((1,2,3))

[1, 2, 3]

W podobny sposób możemy używać innej kolekcji, *zbioru* `set`. W matematyce zbiór jest pojęciem pierwotnym, bez żadnych definicji - określa się natomiast zakres używalności zbioru. Wiemy, że elementy mogą należeć lub nie należeć do zbioru:

$$x \in X$$
$$y \not\in X$$

możemy również określać liczbę elementów w zbiorze, porównywać zbiory itd. Co istotne, jeśli mamy np. zbiór trzyelementowy, do którego należą liczby 1,2,3:

$$X = \{ 1,2,3\}$$ 

to nawet gdy napiszemy dwa razy $1\in X$, jedynka jest zawarta w zbiorze *tylko raz*.

In [21]:
X = set()
X.add(1)
X.add(2)
X.add(1)
print(X)

{1, 2}


Do zbioru możemy dodawać również całe listy elementów:

In [22]:
set([1,1,1,2,2,3])

{1, 2, 3}

In [23]:
set(["ciastko", "karmel", "czekolada", "ciastko"])

{'czekolada', 'karmel', 'ciastko'}

Jeśli zastanawiasz się do czego to zmierza, to już mówię - zaczęliśmy to spotkanie od pytania o liczbę różnych elementów w liście. Przez cały czas rozwiązanie było do zapisania w jednej linijce:

In [24]:
len(set(tab))

45