# Język Python - Wykład 2.

## PEP 8 - Zasady formatowania kodu

 **,,code is read much more often than it is written''** (BDFL)
 
 Po co wytyczne do formatowania kodu?
   * spójność stylu wewnątrz modułów i projektu
   * wytyczne to nie wyrocznia, można je pominąć, gdy:
      * czyni to kod mniej czytelnym
      * aby być spójnym z istniejącym kodem
      * jest ryzyko utraty kompatybilności wstecz

* http://www.python.org/dev/peps/pep-0008/
* 4 spacje na jedno wcięcie kodu 
* Nie używać znaków tabulacji (``\t``)
* Nigdy nie mieszać znaków tabulacji ze spacjami do robienia wcięć jednym kodzie
* Jedna pusta linia pomiędzy kodem funkcji i metod
* Dwie puste linie pomiędzy kodem klas
* Maksymalna długość linii kodu to 79 znaków
* Nie używać ``from <module> import *`` - zatrucie przestrzeni nazw
* starać się nie używać zmiennych ``l`` (małe L, podobne do 1), ``O`` (duże o, podobne do zero), ``I`` (duże i, podobne do 1)
* Znak spacji po znaku ``,`` w słownikach, zbiorach, listach, krotkach, argumentach oraz po znaku ``:`` w słownikach (nie przed!)

    Dobrze:
        [1, 2, 3, 4]
        {'black': 5, 'orange': 10}
        f(1, 4)
    
    Źle:
        [1,2,3,4]
        [ 1,2,3,4 ]
        { 'black' : 5, 'orange' : 10 }
        f(1,4)
        f( 1 , 4 )
    
* Znaki spacji przed i po wyrażeniach przypisania i porównania (z wyjątkiem listy argumentów)

    Dobrze:
        a = 5
        b = [1, 2, 3, 4]
        f(a=5, b=10)
    
    Źle:
        a=5
        a= 5
        a =5
        f(a = 5, b = 10)
        f(a= 5, b= 10)

* Bez spacji na brzegach nawiasowania i listy argumentów

    Dobrze:
        (a + 3) * (5 - b)
        
    Źle:
        (a+3)*(5-b)
        ( a + 3 ) * ( 5 - b )
        

* Bez spacji na brzegach jednoliniowych komentarzy docstring (więcej w PEP 257 http://www.python.org/dev/peps/pep-0257/)

    Dobrze:
        def make_squares(key, value=0):
            """Return a dictionary and a list..."""
            d = {key: value}
            l = [key, value]
            return d, l
    Źle:
        def make_squares(key, value=0):
            """
                Return a dictionary and a list...
            """
            d = {key: value}
            l = [key, value]
            return d, l
            

## Kilka słów o logicznych typach danych

Słowa kluczowe - traktowane specjalnie przez parser

In [1]:
from keyword import kwlist
print(kwlist)

['False', 'None', 'True', 'and', 'as', 'assert', 'break', 'class', 'continue', 'def', 'del', 'elif', 'else', 'except', 'finally', 'for', 'from', 'global', 'if', 'import', 'in', 'is', 'lambda', 'nonlocal', 'not', 'or', 'pass', 'raise', 'return', 'try', 'while', 'with', 'yield']


Nie można użyć słów kluczowych do nazywania zmiennych i funkcji

In [2]:
for = 8
while = "aaa"

SyntaxError: invalid syntax (<ipython-input-2-edd6b49ae404>, line 1)

Wbudowane - typy, funkcje, wyjątki. Traktowane przez parser jak identyfikatory tworzone przez programistę. Można (o zgrozo) używać ich w przypisaniach.

In [3]:
print(dir(__builtins__))



In [4]:
int = "ojej"
len = lambda x : 137

In [11]:
len([0,1,2,3])

4

In [7]:
'True' in dir(__builtins__)

True

* Porównania

  * Python2 (od 2.3): wbudowany typ `bool`, dwie wartości ``True`` i ``False`` **nie będące słowami kluczowymi**
  * Python3: wbudowana klasa `bool`, dwie możliwe wartości będące obiektami tej klasy: ``True`` i ``False`` - **słowa kluczowe**
  
  http://python-history.blogspot.com/2013/11/story-of-none-true-false.html

In [16]:
def guess(number=23):
    running = True

    while running:
        guess = int(input('Enter an integer : '))

        if guess == number:
            print('Congratulations, you guessed it.')
            running = False # this causes the while loop to stop
        elif guess < number:
            print('No, it is a little higher than that.')
        else:
            print('No, it is a little lower than that.')
    else:
        print('The while loop is over.')
        # Do anything else you want to do here
    print('Done')

# True = 0
guess()

Enter an integer : 23
Congratulations, you guessed it.
The while loop is over.
Done


In [10]:
%reset

Once deleted, variables cannot be recovered. Proceed (y/[n])? y


Porównania:

* nie używać "``== True``" ani "`is True`" do sprawdzania prawdziwości

     * Dobrze: ``if greeting:``
     * Żle:    ``if greeting == True:``
     * Jeszcze gorzej: ``if greeting is True:``

## Listy - zaawansowane użycie

In [20]:
help(list)

Help on class list in module builtins:

class list(object)
 |  list() -> new empty list
 |  list(iterable) -> new list initialized from iterable's items
 |  
 |  Methods defined here:
 |  
 |  __add__(self, value, /)
 |      Return self+value.
 |  
 |  __contains__(self, key, /)
 |      Return key in self.
 |  
 |  __delitem__(self, key, /)
 |      Delete self[key].
 |  
 |  __eq__(self, value, /)
 |      Return self==value.
 |  
 |  __ge__(self, value, /)
 |      Return self>=value.
 |  
 |  __getattribute__(self, name, /)
 |      Return getattr(self, name).
 |  
 |  __getitem__(...)
 |      x.__getitem__(y) <==> x[y]
 |  
 |  __gt__(self, value, /)
 |      Return self>value.
 |  
 |  __iadd__(self, value, /)
 |      Implement self+=value.
 |  
 |  __imul__(self, value, /)
 |      Implement self*=value.
 |  
 |  __init__(self, /, *args, **kwargs)
 |      Initialize self.  See help(type(self)) for accurate signature.
 |  
 |  __iter__(self, /)
 |      Implement iter(self).
 |  
 |  __l

<slot wrapper '__str__' of 'object' objects>

### Przedłużanie listy

In [21]:
extend_list = [1, 2, 3]
extend_list.extend([4, 5, 6])
extend_list

[1, 2, 3, 4, 5, 6]

### Usuwanie z listy

In [22]:
del extend_list[2]
extend_list

[1, 2, 4, 5, 6]

In [23]:
del extend_list[1:3]
extend_list

[1, 5, 6]

In [24]:
del extend_list
print(extend_list)

NameError: name 'extend_list' is not defined

### Lista jako stos

In [25]:
stack = [3, 4, 5, 6, 7]
stack.pop()

7

In [26]:
stack.pop()

6

In [27]:
stack

[3, 4, 5]

In [28]:
stack.append(10)

In [29]:
stack

[3, 4, 5, 10]

### Lista jako kolejka

Listy można używać jak kolejki, ale operacje na początku listy są nieefektywne:

In [30]:
queue = [3, 4, 5, 6, 7]
queue.pop(0)

3

In [31]:
queue.append(10)
queue

[4, 5, 6, 7, 10]

Zamiast tego lepiej użyć specjalnie do tego przeznaczonej struktury deque z modułu standardowego collections:

In [32]:
from collections import deque
queue = deque(["Eric", "John", "Michael"])
queue.append("Terry")           # Terry arrives
queue.append("Graham")          # Graham arrives
queue.popleft()                 # The first to arrive now leaves

'Eric'

In [33]:
queue.popleft()                 # The second to arrive now leaves

'John'

In [34]:
queue                           # Remaining queue in order of arrival

deque(['Michael', 'Terry', 'Graham'])

### List comprehension

Rozwijanie listy jest idiomem zastępujacym wyrażenia pętli for budującej listę:

In [35]:
squares = []
for x in range(10):
    squares.append(x**2)

squares

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

To samo można zapisać prościej:

In [36]:
[x**2 for x in range(10)]

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

Można też tworzyć pętle zagnieżdzone i używać konstrukcji warunkowych:

In [37]:
[(x, y) for x in [1, 2, 3] for y in [3, 1, 4] if x != y]

[(1, 3), (1, 4), (2, 3), (2, 1), (2, 4), (3, 1), (3, 4)]

Trójki pitagorejskie

In [38]:
n = 30
[(x,y,z) for x in range(1,n) for y in range(x,n) for z in range(y,n) if x**2 + y**2 == z**2]

[(3, 4, 5),
 (5, 12, 13),
 (6, 8, 10),
 (7, 24, 25),
 (8, 15, 17),
 (9, 12, 15),
 (10, 24, 26),
 (12, 16, 20),
 (15, 20, 25),
 (20, 21, 29)]

In [39]:
words = 'The quick brown fox jumps over the lazy dog'.split()
[(w.upper(), w.lower(), len(w)) for w in words]

[('THE', 'the', 3),
 ('QUICK', 'quick', 5),
 ('BROWN', 'brown', 5),
 ('FOX', 'fox', 3),
 ('JUMPS', 'jumps', 5),
 ('OVER', 'over', 4),
 ('THE', 'the', 3),
 ('LAZY', 'lazy', 4),
 ('DOG', 'dog', 3)]

Set comprehension

In [42]:
a = { x**2 for x in range(10)}
b = { x**3 for x in range(10)}
a,b

({0, 1, 4, 9, 16, 25, 36, 49, 64, 81},
 {0, 1, 8, 27, 64, 125, 216, 343, 512, 729})

Operacje na zbiorach:

In [43]:
a & b  # intersection

{0, 1, 64}

In [44]:
a | b  # union

{0, 1, 4, 8, 9, 16, 25, 27, 36, 49, 64, 81, 125, 216, 343, 512, 729}

In [45]:
a - b  # difference

{4, 9, 16, 25, 36, 49, 81}

In [46]:
b - a

{8, 27, 125, 216, 343, 512, 729}

In [47]:
a ^ b  # symmetric difference

{4, 8, 9, 16, 25, 27, 36, 49, 81, 125, 216, 343, 512, 729}

In [50]:
a <= b  # is subset

False

Dictionary comprehension

In [51]:
mcase = {'a':10, 'b': 34, 'A': 7, 'Z':3}
mcase_frequency = { k.lower() : mcase.get(k.lower(), 0) + mcase.get(k.upper(), 0) for k in mcase.keys() }
mcase_frequency

{'a': 17, 'b': 34, 'z': 3}

## Set comprehension

In [52]:
new_set = {i for i in ['ala', 'ma', 'kota', 'kota']}
new_set

{'ala', 'kota', 'ma'}

## Lambda wyrażenia

* Funkcja nienazwana utworzona w miejscu (anonimowa)
* Można ją przypisać do zmiennej 
* Najczęściej używamy jej przy programowaniu funkcyjnym (wstrzykujemy logikę kodu do funkcji jako argument, np. patrz sortowanie)
* Ciało funkcji lambda składa się z pojedynczego wyrażenia, którego ewaluacja zwracana jest jako wynik funkcji
* Historia http://python-history.blogspot.com/2009/04/origins-of-pythons-functional-features.html

In [53]:
lambda x: x + 1

<function __main__.<lambda>>

In [54]:
operator_dodaj = lambda x, y: x + y
operator_dodaj(1, 2)

3

In [57]:
lambda x: "big" if x > 100 else "small"

'big'

In [58]:
f = lambda s : " ".join(s.split())
text = '''bla bla
bli      blu
blurp
'''
f(text)

'bla bla bli blu blurp'

### Sortowanie

Sortowanie przez tworzenie nowej listy:

In [60]:
sta = (5, 2, 3, 1, 4)
sorted(sta)

[1, 2, 3, 4, 5]

Sortowanie w miejscu:

In [61]:
a = [5, 2, 3, 1, 4]
a.sort(reverse=True)
a

[5, 4, 3, 2, 1]

Sortowaniem z użyciem klucza:

In [62]:
fruits = [('apple', 3), ('orange', 1), ('banana', 2)]
sorted(fruits, key=lambda fruit: fruit[0])

[('apple', 3), ('banana', 2), ('orange', 1)]

In [63]:
sorted(fruits, key=lambda fruit: fruit[1])

[('orange', 1), ('banana', 2), ('apple', 3)]

Kluczem może być nawet callable, który go wygeneruje:

In [64]:
chars = ['Z', 'z', 'C', 'c', 'A', 'a']
sorted(chars)

['A', 'C', 'Z', 'a', 'c', 'z']

In [65]:
sorted(chars, key=str.lower)

['A', 'a', 'C', 'c', 'Z', 'z']

Python implementuje stabilne sortowanie:

In [69]:
from operator import itemgetter
sorted([('red', 1), ('blue', 1), ('red', 2), ('blue', 2)], key=itemgetter(1))

IndexError: tuple index out of range

## Programowanie funkcyjne

* filter - filtrowanie kolekcji
* map - zmiana formatu kolekcji
* reduce - redukowanie kolekcji (wyliczanie wartości z jej elementów), w Python3 w module functools

Policzyć, ile owoców wspólnie mają Merry i Tom:

In [70]:
fruits = {
    'Merry': [
        ('apple', 5),
        ('orange', 3),
    ],
    'John': [
        ('berries', 1),
        ('orange', 10),
    ],
    'Tom' : [
        ('peaches', 2),
    ],
}
fruits.items()

dict_items([('Merry', [('apple', 5), ('orange', 3)]), ('Tom', [('peaches', 2)]), ('John', [('berries', 1), ('orange', 10)])])

Filtrujemy "bazę" z owoców Johna:

In [71]:
f = filter(lambda x: x[0] in ['Merry', 'Tom'], fruits.items())
[it for it in f]

[('Merry', [('apple', 5), ('orange', 3)]), ('Tom', [('peaches', 2)])]

Usuwamy imiona, nie są nam już potrzebne:

In [74]:
mapa1 = map(lambda y: y[1], 
        filter(lambda x: x[0] in ['Merry', 'Tom'], fruits.items())
)
[it for it in mapa1]

[[('apple', 5), ('orange', 3)], [('peaches', 2)]]

Alternatywnie

In [75]:
[item[1] for item in fruits.items() if item[0] in {'Merry','Tom'}]

[[('apple', 5), ('orange', 3)], [('peaches', 2)]]

Sklejamy listę list w jedną listę:

In [76]:
from itertools import chain
list(chain(
    *map(lambda y: y[1], 
        filter(lambda x: x[0] in ['Merry', 'Tom'], fruits.items())
    )
))

[('apple', 5), ('orange', 3), ('peaches', 2)]

In [77]:
list(chain(*[item[1] for item in fruits.items() if item[0] in {'Merry','Tom'}]))

[('apple', 5), ('orange', 3), ('peaches', 2)]

Mapujemy listę tupli na listę liczb

In [78]:
mapa2 = map(lambda f: f[1], 
    chain(
        *map(lambda y: y[1], 
            filter(lambda x: x[0] in ['Merry', 'Tom'], fruits.items())
        )
    )
)
[it for it in mapa2]

[5, 3, 2]

Finalnie redukujemy listę do sumy elementów:

In [79]:
sum( 
    map(lambda f: f[1], 
        chain(
            *map(lambda y: y[1], 
                filter(lambda x: x[0] in ['Merry', 'Tom'], fruits.items())
            )
        )
    )
)

10

In [80]:
sum(it[1] for it in chain(*[item[1] for item in fruits.items() if item[0] in {'Merry','Tom'}]))

10

Możemy także użyć gotowego operatora dodawania z modułu operator:

In [81]:
import operator
import functools
functools.reduce(operator.add, 
    map(lambda f: f[1], 
        chain(
            *map(lambda y: y[1], 
                filter(lambda x: x[0] in ['Merry', 'Tom'], fruits.items())
            )
        )
    )
)

10

## Słowniki (dict) - zaawansowane użycie

### Aktualizacja słownika innym słownikiem:

In [None]:
def some_function(**kwargs):
    defaults = {
        'apple': 1,
        'orange': 2,
        'peach': 3,
    }
    defaults.update(kwargs)
    print(defaults)
    print('banana' in defaults)

some_function()
some_function(apple=10)
some_function(banana=4)

## Dict Comprehension

In [None]:
new_dict = {key: value for key, value in [('k1', 'v1'), ('k2', 'v2'), ('k3', 'v3')]}
new_dict

## Generatory i iteratory

* Generatorów i iteratorów używamy, aby oszczędzić pamięć (a także czas potrzebny na jej alokację). 
* Zysk wydajności powstaje przez ominięcie potrzeby tworzenia tymczasowych struktur pośrednich w pamięci, gdy zamiast tego możemy przeiterować kolejno po elementach i finalnie zapisać tylko te, które są potrzebne.
* Iterable - obiekt posiadający metodę ``__iter__()`` zwracającą iterator. Przykłady:
    * kolekcje: lista, krotka, słownik
    * generatory (tutaj metoda ``__iter()__`` jest generowana automatycznie)
* Iteratorem jest dowolny obiekt (kolekcja), dostarczający interfejs o następujących metodach:
    * ``__iter__()`` - zwraca obiekt iteratora (jeśli wywołana na kolekcji)
    * ``__next__()`` - zwraca kolejny element iteratora lub rzuca wyjątkiem StopIteration 
* Interfejsu iteratorów nie używamy najczęściej sami w kodzie, obiekty iteratorów pojawiają się w kontekstach iteracji i są używane automatycznie
* Każda funkcja posiadająca wyrażenie yield jest generatorem

### Iteratory

In [None]:
l = [1,"X",3.14]

In [None]:
# czy obiekt l (lista) ma atrybut __iter__ ?
'__iter__' in dir(l)

In [None]:
# pobieramy iterator
it = iter(l) 
# it = l.__iter__() # alternatywnie
type(it)

In [None]:
# iterujemy
next(it)
# it.__next__() # alternatywnie

In [None]:
r = range(10)
dir(r)

In [None]:
it = iter(r)
type(it)

In [None]:
next(it)

### Generator expression

Generator można także wyrazić za pomocą konstrukcji ``(wyrażenie for zmienne in sekwencja)``:

In [None]:
g = (i*i for i in range(10))

In [None]:
type(g)

In [None]:
dir(g)

In [None]:
next(g)

### metoda ``yield``

In [None]:
def fib(n=100):
    a, b = 0, 1
    while b < n:
        yield b
        a, b = b, a+b
    else:
        raise StopIteration

In [None]:
fib()

In [None]:
it = iter(fib())

In [None]:
next(it)

In [None]:
list(it)

### List comprehension (jeszcze raz)

Technicznie więc ujmując **list comprehension = lista + wyrażenie generatora**:

In [None]:
[i*i for i in range(10)]

### Moduł itertools

Szczególnie wart uwagi jest moduł itertools, który dostarcza bardzo wiele ciekawych narzędzi pracujących na iteratorach, pomocnych przy zaawansowanym programowaniu funkcyjnym. Wybrane ciekawe funkcje:

In [None]:
from itertools import * # normalnie tak nie importujemy 
list(chain([1, 2, 3], [4, 5, 6]))

In [None]:
list(combinations('ABCD', 2))

In [None]:
list(permutations('ABCD', 2))

In [None]:
list(combinations_with_replacement('ABCD', 2))

In [None]:
list(product('ABC', 'XY'))

In [None]:
iterator = permutations('ABC', 2)
print(iterator)
print(list(iterator))
print(list(iterator))

In [None]:
iterator = permutations('ABC', 2)
iterator1, iterator2 = tee(iterator, 2)
print(iterator1, iterator2)
print(list(iterator1))
print(list(iterator2))
print(list(iterator))