In [None]:
Na dnešní hodině budeme pracovat s důležitou vlastností listu, tzv. list comprehension. Nejdříve je však potřeba vysvětlit klasické smyčky (for loops).

In [None]:
Pokud bych měl list, u kterého provést určitou operaci s každým elementem, tak to můžu udělat následnovně.

In [9]:
L=[1,2,3,4,5]
for i in range(len(L)): # v tomto řádku se nejprve evaluuje výraz len(L), jehož výsledek je 5 a potom se evaluuje výraz range(5)
    L[i]=L[i]**2  # každý element umocním na druhou.
print(L)

[1, 4, 9, 16, 25]


In [None]:
List comprehension je jiná syntaxe, jak dosáhnout stejného cíle.

## List comprehensions: vytváření listů pomocí for smyček
Jednoduchý způsob jak inicializovat list je skrze list comprehension. List comprehension je analogií matematického formalismu pro definování množin. Na příklad:  
$$ L=\lbrace x^2 : x \in \lbrace 0, 1, 2, 3, 4\rbrace \rbrace.$$  
Se v pythonu zapíše jako:
    

In [3]:
L = [x**2 for x in range(0,5)]

print(L)

[0, 1, 4, 9, 16]


Také je možno zakombinovat různé podmínky. Na příklad:  
$$S = \lbrace x : x \in L \text{ and } x > 0\rbrace.$$
Lze zapsat pomocí:        

In [4]:
S=[x for x in L if x>0]
print(S)

[1, 4, 9, 16]


Další příklad:  
$$ M = \lbrace x : x \in S \text{ and } x \text{ even} \rbrace$$    

In [6]:
M = [x for x in S if x % 2 == 0] # % je operátor pro modulus

Také je možno kombinovat dvě smyčky dohromady:  
$$\lbrace (x,y) : \forall x \in \lbrace 1, 2\rbrace, \forall y \in \lbrace 1, 2\rbrace \rbrace$$

In [7]:
[(x,y) for x in [1,2] for y in [1,2]]

[(1, 1), (1, 2), (2, 1), (2, 2)]

Další příklad:
$$\lbrace (x,y) : x \in \lbrace 1, 2, 3\rbrace, y \in \lbrace 1, 3, 4\rbrace \text{ and } x\neq y \rbrace $$    

In [27]:
mylist1=[(x, y) for x in [1,2,3] for y in [3,1,4] if x != y]
print(mylist1)

10000 loops, best of 3: 1.26 µs per loop
[(1, 3), (1, 4), (2, 3), (2, 1), (2, 4), (3, 1), (3, 4)]


Pomocí klasických smyček by to šlo realizovat takto:

In [42]:
mylist2=[]
for x in [1,2,3]:
    for y in [3,1,4]:
        if x!=y:
            mylist2.append((x,y))
mylist2

10000 loops, best of 3: 2.64 µs per loop


## Měření rychlosti kódu
V jupyter notebooku (prostředí, ve kterém se právě nacházíme) existují tzv. magic functions, které poskytují mnoho užitečných funkcí.  
Jedna z nich je funkce %timeit, která měří výpočetní čas daného výrazu.  
Funkce %%timeit (s dvěma %) měří výpočetní čas celé buňky, na rozdíl od výpočetního času výrazu, který je na jednom řádku.
Obě tyto funkce mají volitelný argument, kterým se nastaví, kolikrát se má měření provézt. Vysledek je pak průměr přes všechny měření. %timeit -n 1000 znamená že se měření provede 1000 krát.

In [68]:
%timeit -n 10000 L = [x**2 for x in range(0,5)]

10000 loops, best of 3: 2.34 µs per loop


## Cvičení
Pomocí %timeit změřte výpočetní čas pro vytvoření listu mylist1 a pomocí %%timeit pro vytvoření listu mylist2. Je jedna z verzí rychlejší?

Také je možno vnořit jeden list comprehension do druhého. Cvičení: popište co provede následující kód.


In [None]:
mylist1=[x+1 for x in [y**3 for y in [-3,1,4]] if x > 0]
mylist1

Následující kód provede to samé, akorát pomocí for smyček.

In [None]:
M=[]
for y in [-3,1,4]:
    temp=y**3
    M.append(temp)
print M ## this is like the set written in the formulas above

mylist1=[]
for x in M:
    if x>0:
        mylist1.append(x+1)
print mylist1

Zde je matematický zápis:
$$M=\lbrace y^3 : y \in \lbrace -3, 1, 4\rbrace \rbrace$$
$$\text{mylist1}= \lbrace x+1 : x \in M \text{ and } x>0 \rbrace.$$

In [None]:
List comprehension lze použít pro jakýkoliv datový typ. Následující příklad používá řetězec.

In [69]:
strs = ['hello', 'and', 'goodbye']
strs2 = [ s.upper()+'!!!' for s in strs if s=='hello']
print(strs2)

['HELLO!!!']


In [70]:
ovoce = ['jablko', 'třešeň', 'banán', 'citrón']
ovoce_s_a = [ s for s in ovoce if 'a' in s ]
print(ovoce_s_a)

['jablko', 'banán']


## Cvičení
Vyberte všechny ovoce, které obsahují písmeno n a změnte je na velká písmena.

## Třízení listu
Nejjednodušší způsob jak utřídit list je pomocí funkce sorted()

In [74]:
a = [5, 1, 4, 3]
print(sorted(a))

[1, 3, 4, 5]


funkce sorted() má volitelný argument, který lze použít pokud chci list uspořád v opačném pořadí.

In [76]:
mystrs = ['aa', 'BB', 'zz', 'CC']
print(sorted(mystrs))
print(sorted(mystrs, reverse=True))

['BB', 'CC', 'aa', 'zz']
['zz', 'aa', 'CC', 'BB']


## Vlastní typ třízení
Pro vlastní typ třízení lze u funkce sorted() využít volitelný argument "key". Argument key specifikuje funkci, která slouží pro provnávání elementů. Můžu použít jakoukoliv funkci, která má jeden argument a vrací hodnotu, která může sloužit k porovnávání.  
  
Například i listu řetězců můžeme použít funkci len(), která má jeden argument (samotný řetězec len("ahoj")) a vratí délku řetězce. Tato délka je použita k porovnání řetězců a jejich následného setřízení.

In [78]:
strs = ['ccc', 'aaaa', 'd', 'bb']
print(sorted(strs, key=len))  # pozor!!! používám jen název funkce (len) a ne len(), což by znamenalo, že se má funkce provézt.

['d', 'bb', 'ccc', 'aaaa']


Jako další příklad. Pokud použiji funkci str.lower() pro třízení, tak se mi řetezce utřídí podle abecedy, bez ohledu na velké a malé písmena.

In [80]:
strs2=['ccc', 'aAaa', 'D', 'bb']
print(sorted(strs2, key=str.lower))

['aAaa', 'bb', 'ccc', 'D']


In [None]:
K třízení můžeme použít i vlastní funkci

In [81]:
strs = ['xc', 'zb', 'yd' ,'wa']

def MyFn(s):
    return s[-1]

print(sorted(strs, key=MyFn))

['wa', 'zb', 'xc', 'yd']


Cvičení: popište slovy, jak utřídí list funkce MyFn.

## Zvládnutí listů a řetězců je zásadní pokud, chcete být dobrým Pythonistou. Zde následuje pár další cvičení.

Dotvořte funkce, které jsou specifikovány v buňkách níže. Jakmile budete mít řešení, zkontrolujte si je pomocí instrukcí, které jsou uvedeny za buňkami s kódem.

In [None]:
# Funkce match_ends
#Tato funkce má na vstupu list řetězců a vrací počet řetězců, 
#které mají délku 2 a více a jejich první písmeno je stejné jako jejich posldní písmeno.
# Poznámka : pro zvýšení počtu proměnné se vy pythonu používá operátor += .. i+=1 je to samé jako i=i+1
#Příklad: u listu ["aha","b","cc","ahoj"] tato funkce vyhodí hodnotu 2

def match_ends(words):
  # +++váš kód+++
  return

In [None]:
# Funkce front_x
# Given a list of strings, return a list with the strings
# in sorted order, except group all the strings that begin with 'x' first.
# e.g. ['mix', 'xyz', 'apple', 'xanadu', 'aardvark'] yields
# ['xanadu', 'xyz', 'aardvark', 'apple', 'mix']
# Hint: this can be done by making 2 lists and sorting each of them
# before combining them.
def front_x(words):
  # +++váš kód+++
  return

In [None]:
# Funkce sort_last
# Given a list of non-empty tuples, return a list sorted in increasing
# order by the last element in each tuple.
# e.g. [(1, 7), (1, 3), (3, 4, 5), (2, 2)] yields
# [(2, 2), (1, 3), (3, 4, 5), (1, 7)]
# Hint: use a custom key= function to extract the last element form each tuple, as in some example above
def sort_last(tuples):
  # +++váš kód+++
  return

### To check the solution
* Open the file list1.py with a text editor (notepad or textedit are fine, but we recommend you install Sublime - more professional!)
* Copy your solutions in the appropriate place (you will see once you open the files). 
* Execute the file in your Jupyter notebook with the command ```%run list1.py```. Make sure that list1.py is in the same folder as your notebook!
* If you did everything correctly, you will see as below output

In [None]:
%run list1.py

### Exercise &#x1F4D7;
* Do the exercise in the following cells. Check the solution as explained for the previous exercise, by running file ```script1.py```.

In [None]:
# donuts
# Given an int count of a number of donuts, return a string
# of the form 'Number of donuts: <count>', where <count> is the number
# passed in. However, if the count is 10 or more, then use the word 'many'
# instead of the actual count.
# So donuts(5) returns 'Number of donuts: 5'
# and donuts(23) returns 'Number of donuts: many'
def donuts(count):
  # +++váš kód+++
  return

In [None]:
# both_ends
# Given a string s, return a string made of the first 2
# and the last 2 chars of the original string,
# so 'spring' yields 'spng'. However, if the string length
# is less than 2, return instead the empty string.
def both_ends(s):
  # +++your code here+++
  return

In [None]:
#fix_start
# Given a string s, return a string
# where all occurences of its first char have
# been changed to '*', except do not change
# the first char itself.
# e.g. 'babble' yields 'ba**le'
# Assume that the string is length 1 or more.
# Hint: s.replace(stra, strb) returns a version of string s
# where all instances of stra have been replaced by strb.
def fix_start(s):
  # +++váš kód+++
  return

In [None]:
#MixUp
# Given strings a and b, return a single string with a and b separated
# by a space '<a> <b>', except swap the first 2 chars of each string.
# e.g.
#   'mix', pod' -> 'pox mid'
#   'dog', 'dinner' -> 'dig donner'
# Assume a and b are length 2 or more.
def mix_up(a, b):
  # +++váš kód+++
  return

If all functions are correct, you will see an ouput as the one below:

In [None]:
%run string1.py

## Exercise &#x1F4D9;
Create a list of n lists, each having N elements. The values of the first list should go from 1 to N, the elements of the second list from N+1 to 2N,... the elements of the last list, should go from $N^2-N+1$ to $N^2$. In other words, this is like creating a matrix

 \begin{pmatrix}
  1 & 2 & \cdots & N \\
  N+1 & N+2 & \cdots & 2N \\
  \vdots  & \vdots  & \ddots & \vdots  \\
  N^2-N+1 & N^2-N+2 & \cdots & N^2 
 \end{pmatrix}
 Can you create it with only one line of code?