
# Cvičení 03 - Seznamy, n-tice, množiny, slovníky. Generátorová notace 



## Seznamy - připomenutí

Seznamy (list) jsou uspořádané posloupnosti hodnot.



In [1]:
s = [1, 2, 3]
print(s[-2])
print(s[0:2])

2
[1, 2]


In [2]:
# spojování seznamů: operátor +
s2 = [4, 5, 6]
s + s2

[1, 2, 3, 4, 5, 6]

In [None]:
# opakování seznamu: operátor *
s2 * 3

[4, 5, 6, 4, 5, 6, 4, 5, 6]

In [3]:
# přidávání, vkládání mazání hodnot
s = [1, 2, 3, 1]
print(s)

s.append(7) # prida 7 na konec
print(s)

s.insert(2, 4) # vlozi 4 na pozici s indexem 2
print(s)

s.remove(1) # odstrani JEN PRVNI vyskyt hodnoty 1
print(s)

del s[0] # odstrani hodnotu na pozici 0
print(s)

print(s.count(7)) # spocitani poctu vyskytu prvku

[1, 2, 3, 1]
[1, 2, 3, 1, 7]
[1, 2, 4, 3, 1, 7]
[2, 4, 3, 1, 7]
[4, 3, 1, 7]
1


### Řazení
Řazení pomocí `.sort()` (nebo `sorted()`) je stabilní, teda prvkům se stejným klíčem zachová jejich původní pořadí.

In [7]:
# řazení seznamu - metoda sort()

s = [4, 5, 3, 6, 2, 8, 1, 3]
s.sort()
print(s)

s.sort(reverse=True)
print(s)

def is_odd(x):
  return x % 2

print(is_odd(3))
print(is_odd(2))

s.sort(key=is_odd)
print(s)

[1, 2, 3, 3, 4, 5, 6, 8]
[8, 6, 5, 4, 3, 3, 2, 1]
1
0
[8, 6, 4, 2, 5, 3, 3, 1]


In [8]:
# co bylo dřív: vejce nebo slepice?
q = ['🥚', '🐔']
q.sort()
print(f'{q} ... {q[0]}: {ord(q[0])}, {q[1]}: {ord(q[1])}, A: {ord("A")}')

['🐔', '🥚'] ... 🐔: 128020, 🥚: 129370, A: 65





https://www.pythoncheatsheet.org/#Lists

## N-tice

N-tice (tuple) jsou uspořádané, neměnné (**immutable**) posloupnosti hodnot.

In [11]:
# definice n-tice (dvojice)
c = (1, 2)
# prirazeni n-tice do samostatnych promennych
a, b = c
print(a, b, sep=', ')

1, 2


Pro n-tice je možné používat výřezovou notaci

In [12]:
n = (1, 2, 3, 4, 5, 6)

n[:3]

(1, 2, 3)

In [13]:
# pokus upravit n-tici neprojde, je immutable!
n[2] = 5

TypeError: ignored

❗**n-tice je neměnný typ, nelze tedy vkládat, přidávat ani řadit.**❗


## Množiny
Množiny (sets) jsou **neuspořádané** kolekce hodnot. S výhodou se dají použít na unifikaci (ponechání pouze unikátních hodnot == odstranění duplicit) seznamu.

In [15]:
# definice množiny
m = {3, 2, 1, 1, 2, 3}
print(m)
# test, zda je 1 prvkem množiny m
1 in m

{1, 2, 3}


True

In [16]:
# množiny jsou neuspořádané (neni definovane poradi)
m[2]

TypeError: ignored

In [17]:
# každý prvek množiny je v množině jen jednou
m2 = {1, 1, 4, 5, 6, 6, 6, 7, 1}
m2

{1, 4, 5, 6, 7}

In [18]:
# s uspechem jde vyuzit pro ziskani seznamu unikatnich hodnot
sez = [1, 2, 3, 3, 5]
list(set(sez))

[1, 2, 3, 5]

Operace s množinami:

In [19]:
# prostredky hromadne dopravy
set1 = {'tramvaj', 'vlak', 'metro', 'autobus'} 
# silnicni dopravni prostredky
set2 = {'auto', 'autobus'}

In [20]:
# průnik (prvky v obou množinách)
set1 & set2 # nebo set1.intersection(set2)

{'autobus'}

In [21]:
# sjednocení (všechny prvky z obou množin)
set1 | set2 # nebo set1.union(set2)

{'auto', 'autobus', 'metro', 'tramvaj', 'vlak'}

In [22]:
# rozdíl (prvky první množiny, ktere nejsou v druhé)
set1 - set2 # nebo set1.difference(set2)

{'metro', 'tramvaj', 'vlak'}

In [23]:
# symetrický rozdíl (prvky, které jsou pouze v první a pouze v druhé)
set1 ^ set2 # nebo set1.symmetric_difference(set2)

{'auto', 'metro', 'tramvaj', 'vlak'}

In [24]:
# převod seznamu na množinu a zpět
s = [8, 1, 2, 3, 3, 4, 1, 2, 3, 4, 6, 9]
print(s)
print(set(s))
print(list(set(s)))

[8, 1, 2, 3, 3, 4, 1, 2, 3, 4, 6, 9]
{1, 2, 3, 4, 6, 8, 9}
[1, 2, 3, 4, 6, 8, 9]


In [25]:
# pozor! prázdnou množinu inicializujeme vždy takto:
prazdna = set() # nejde: prazdna = {}
print(type(prazdna))

# protože následující kód vytvoří slovník (viz níže)
p = {}
print(type(p))

<class 'set'>
<class 'dict'>


In [26]:
# prvky mnoziny musi byt hashovatelne
a = {['A'], ['B']}

TypeError: ignored

Python sets cheatsheet https://www.pythoncheatsheet.org/#sets

## Slovníky

Slovníky (dictionaries) jsou **neuspořádané kolekce dvojic klíč-hodnota**.

In [27]:
di = {
    1: "ahoj",
    2: "nazdar",
    's': "cau",
}
print(di[2])
print(di['s'])

nazdar
cau


Prvkem slovníku může být jakýkoliv objekt, například funkce:

In [28]:
d = {'tisk': print, 'delka': len}
d['tisk'](s)

[8, 1, 2, 3, 3, 4, 1, 2, 3, 4, 6, 9]


In [30]:
d['delka'](s)

12

Takto lze pomocí slovníku nahradit (jinak v pythonu do verze 3.10 neexistující) switch. [Jak na switch?](https://jaxenter.com/implement-switch-case-statement-python-138315.html)

Více k zavedení *structural pattern matching* (aneb switch): [PEP 634](https://www.python.org/dev/peps/pep-0634), [PEP 635](https://www.python.org/dev/peps/pep-0635), [PEP 636](https://www.python.org/dev/peps/pep-0636)

In [32]:
# keys(), values(), items()
print(di.keys()) # seznam klíčů
print(di.values()) # seznam hodnot
print(di.items()) # seznam dvojic klíč, hodnota
print(type(di.items()))

# metoda get a neexistující klíč
print(di.get(1))
print(di.get(0))
print(di.get(1, 'neumim'))
print(di.get(0, 'neumim'))

di[0] # KeyError

dict_keys([1, 2, 's'])
dict_values(['ahoj', 'nazdar', 'cau'])
dict_items([(1, 'ahoj'), (2, 'nazdar'), ('s', 'cau')])
<class 'dict_items'>
ahoj
None
ahoj
neumim


KeyError: ignored

In [33]:
# procházení slovníku:
for k, v in di.items():
  print(f'{k} = {v}')

print('-' * 40)
# s iterací přes klíče
for k in di.keys():
  print(f'{k} = {di[k]}')

1 = ahoj
2 = nazdar
s = cau
----------------------------------------
1 = ahoj
2 = nazdar
s = cau


https://www.pythoncheatsheet.org/#Dictionaries-and-Structuring-Data

## Mutable vs. Immutable

Immutable (neměnné) objekty se na rozdíl od mutable objektů po založení nedají měnit. Co to znamená? Například toto (str je immutable):


In [34]:
string = "Ahoj"
string[0] = "B"

TypeError: ignored

Na rozdíl od například seznamů, které jsou mutable:

In [36]:
seznam = [x for x in string]
print(seznam)
seznam[0] = "B"
print("".join(seznam))

['A', 'h', 'o', 'j']
Bhoj



Zároveň je třeba dodat, že **immutable objekty se předávají hodnotou, mutable odkazem**. Proto pozor:


In [37]:
s = ["A", "B", ["C"], "D"]
for x in s:
  x += "x"
print(s)

['A', 'B', ['C', 'x'], 'D']


Tabulka níže uvádí přehled něktrých základních objektů a zda jsou mutable/immutable.

<img src="https://miro.medium.com/max/1316/1*uFlTNY4W3czywyU18zxl8w.png" />

Pokud si zakládáte vlastní objekty, tak defaultně budou mutable.

Poznámka: n-tice je immutable, ale ...

In [38]:
ntice = (1, [2, 3], 4)
ntice[1] = [3, 4] # nelze

TypeError: ignored

In [43]:
ntice[1].append(3) # ajaj 
ntice

(1, [2, 3, 3, 3, 3, 3, 3], 4)

In [44]:
ntice[1] += [3, 4] # vyhodi sice vyjimku, ale 

TypeError: ignored

In [46]:
# wtf? vysvetleni pro pokrocilejsi na konci clanku zde: 
# https://lerner.co.il/2019/06/06/why-do-python-lists-let-you-a-tuple-when-you-cant-a-tuple/
print(ntice)
help(ntice)

(1, [2, 3, 3, 3, 3, 3, 3, 3, 4], 4)
Help on tuple object:

class tuple(object)
 |  tuple(iterable=(), /)
 |  
 |  Built-in immutable sequence.
 |  
 |  If no argument is given, the constructor returns an empty tuple.
 |  If iterable is specified the tuple is initialized from iterable's items.
 |  
 |  If the argument is a tuple, the return value is the same object.
 |  
 |  Built-in subclasses:
 |      asyncgen_hooks
 |      UnraisableHookArgs
 |  
 |  Methods defined here:
 |  
 |  __add__(self, value, /)
 |      Return self+value.
 |  
 |  __contains__(self, key, /)
 |      Return key in self.
 |  
 |  __eq__(self, value, /)
 |      Return self==value.
 |  
 |  __ge__(self, value, /)
 |      Return self>=value.
 |  
 |  __getattribute__(self, name, /)
 |      Return getattr(self, name).
 |  
 |  __getitem__(self, key, /)
 |      Return self[key].
 |  
 |  __getnewargs__(self, /)
 |  
 |  __gt__(self, value, /)
 |      Return self>value.
 |  
 |  __hash__(self, /)
 |      Return hash(

## Generátorová notace

Minule jsme si ukazovali generátorovou notaci seznamu (list comprehensions) a jak ji číst:

Jak číst list comprehensions?

1. Vždy si výrazu najděte prostřední část **`for prvek in iterable`**
2. V levé části pak uvidíte co se prvkem stane před tím než je vložen do nového seznamu, např. **`prvek / 2`**
3. v pravé části najdete podmínku pomocí inline if, která říká kdy prvek projde do levé části výrazu, např. **`if prvek % 2 == 0`**. Tato část je nepovinná 

In [48]:
iterable = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
print([prvek for prvek in iterable])
print([prvek / 2 for prvek in iterable])
print([prvek / 2 for prvek in iterable if prvek % 2 == 0])

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
[0.5, 1.0, 1.5, 2.0, 2.5, 3.0, 3.5, 4.0, 4.5, 5.0]
[1.0, 2.0, 3.0, 4.0, 5.0]


In [49]:
[[(x, y) for y in list('abc')] for x in range(3)]

[[(0, 'a'), (0, 'b'), (0, 'c')],
 [(1, 'a'), (1, 'b'), (1, 'c')],
 [(2, 'a'), (2, 'b'), (2, 'c')]]

In [50]:
matrix = [[1, 2], [3, 4]]
print([col for row in matrix for col in row])
print([col for row in matrix if row[0] == 1 for col in row])

[1, 2, 3, 4]
[1, 2]


Proč generátorová notace?

In [53]:
sez = [x**2 for x in range(10)]
gen = (x**2 for x in range(10))

print(sez, type(sez))
print(gen, type(gen))

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81] <class 'list'>
<generator object <genexpr> at 0x7fa1f16d1740> <class 'generator'>


`sez` je seznam vytvořený pomocí generátorové notace seznamu (list comprehension).

`gen` je něco jiného - je to iterovatelný objekt, jehož prvky se vytvoří v momentě, kdy budou potřeba (při iterování přes jeho prvky) - tento objekt se nazývá **generátor** a generátorová notace (generator expression) je první ze tří způsobů jak generátor vytvořit.

Generátor můžeme procházet pomocí `for`

In [54]:
for x in gen:
  print(x)

0
1
4
9
16
25
36
49
64
81


Přímo přistupovat k jeho prvkům však nelze.

In [None]:
gen[0]

TypeError: ignored

Proč používat generátory? 

Představme si, že potřebujeme sečíst druhé mocnicny nějaké dlouhé řady.

In [55]:
import timeit

# vytvoří seznam do paměti 
l = [x**2 for x in range(1000000)]
print(sum(l))

# vytvoří generátor
g = (x**2 for x in range(1000000))
print(sum(g))
print(type(g))

print(f'{timeit.timeit(lambda: [x**2 for x in range (1000000)], number=10):0.6f} sec')
print(f'{timeit.timeit(lambda: (x**2 for x in range (1000000)), number=10):0.6f} sec')

333332833333500000
333332833333500000
<class 'generator'>
3.055274 sec
0.000026 sec


Z toho výplývá důležité pravidlo - nepoužívejte seznamy když nemusíte.

Generátorovou notací lze vytvořit i množinu

In [56]:
{x % 2 for x in range(100)}

{0, 1}

nebo slovník (používáno velmi často)

In [None]:
d = {1: "ahoj", 2: "nazdar", 3: "čau"}

reverse_d = {val: key for key, val in d.items()}
reverse_d

{'ahoj': 1, 'nazdar': 2, 'čau': 3}

## zip

`zip(iterable0, ...)` spojí iterovatelné objekty do jednoho iterovatelného objektu. Zastaví se jakmile skončí nejkratší z jeho parametrů.

In [57]:
a = [1, 3, 5, 7, 9]
b = (2, 4, 6, 8)

print(zip(a, b)) # vysledek je generator typu zip 'ahoj': 1, 'nazdar': 2, 'cau': 3}

z = [x for x in zip(a, b)]
z

<zip object at 0x7fa1f1736fc0>


[(1, 2), (3, 4), (5, 6), (7, 8)]

## starred operator

starred operator předá jednotlivé prvky seznamu jako parametry funkci

In [59]:
w = ["ahoj", "jak", "se", "mas"]
print(w)

print(*w) # stejne jako bychom volali: print(w[0], w[1], ...)

# spojeni dvou seznamu
w2 = ['auto', 'letadlo', 'vlak']

[*w, *w2] # stejne jako w + w2


['ahoj', 'jak', 'se', 'mas']
ahoj jak se mas


['ahoj', 'jak', 'se', 'mas', 'auto', 'letadlo', 'vlak']

poznámka: v pythonu není funkce unzip, místo toho lze použít opět zip v kombinaci s * operátorem.


In [60]:
print(*z)

licha, suda = zip(*z)

print(licha)
print(suda)

(1, 2) (3, 4) (5, 6) (7, 8)
(1, 3, 5, 7)
(2, 4, 6, 8)


použití se slovníky pomocí dvou hvězdičkového operátoru ******

In [61]:
d = {1: "ahoj", 2: "nazdar", 3: "cau"}
print(*d)

d2 = {val: key for key, val in d.items()}

{**d, **d2} #spojeni dvou slovniku

1 2 3


{1: 'ahoj', 2: 'nazdar', 3: 'cau', 'ahoj': 1, 'nazdar': 2, 'cau': 3}

## map

`map(callable, iterable)` aplikuje funkci na všechny prvky iterovatelného objektu (výsledkem je opět generátor).

In [63]:
def f(x):
  return x**2
  
t = (1, 2, 3, 4)

print(map(f, t))

print([x for x in map(f, t)])
print(list(map(f, t)))

<map object at 0x7fa1f16ccdc0>
[1, 4, 9, 16]
[1, 4, 9, 16]


## lambda

Lambda umožňuje použít funkci ad-hoc bez definice pomocí `def foo(): ...` .

In [64]:
# f = lambda x: x**2
list(map(lambda x: x**2, t))

[1, 4, 9, 16]

In [65]:
# lze ji zapsat i na vice radku, ale vzpomente na "Beautiful is better than ugly."
funkce = lambda x: x**2 + \
            2

In [66]:
print(funkce(3))

11


In [None]:
# razeni podle vlastniho klice pomoci lambda funkce
s = [4, 5, 3, 6, 2, 8, 1, 3]
s.sort()
print(s)

s.sort(key=lambda x: x % 2)
print(s)

[1, 2, 3, 3, 4, 5, 6, 8]
[2, 4, 6, 8, 1, 3, 3, 5]
