# Datové typy - třídy

* Python je **silně typový** jazyk, nelze sčítat nekompatibilní typy (např. číslo + řetězec bez konverze).
* Python je zároveň **dynamicky typovaný**. Typ proměnné se určuje podle hodnoty při prvním přiřazení, kontrola typů probíhá až za běhu programu, je možné použít explicitní přetypování.

```
    x = "123"
    y = int(x) 
```

* Vše je objekt – i čísla, funkce, typy jsou objekty určité třídy.

Základní vestavěné typy jsou následující:
* Číselné typy:
   * int – celá čísla, nejsou omezená na pevný počet bitů, lze pracovat i s velmi velkými čísly: x = 451654872154787894564156475645564654
   * float – desetinná čísla, podporují speciální hodnoty: inf, -inf, NaN (Not a Number)
   * complex – komplexní čísla, např. 2 + 3i
* Řetězce:
   * str – řetězce se ukládají v unicode. Pozor pokud budete pracovat s texty s národními znaky, někdy nemusí mít správnou kódovou stránku.
   * bytes - binární data, např. b'\x68\x65\x6c\x6c\x6f' (představuje text "hello")
* Logické hodnoty:
   * bool – hodnoty True a False
   * None - prázdná hodnota, v jiných jazycíh třeba null
* Sekvence a kolekce:
   * list – seznam,
   * tuple – n-tice (neměnná),
   * set – množina,
   * dict – slovník (klíč–hodnota).

Zde jsou nějaké příklady zadávání hodnot.

In [None]:
int1 = 1
int2 = int1 + 1
int3 = 1_000_000
float1 = 1.0
float2 = float1 + 1
string1='0'

Protože typ proměnné se určuje dynamicky při prvním přiřazení, může být někdy vhodné zjistit, jakého typu je vlastně proměnná. K tomu slouží příkaz **type**.

In [None]:
print (type(int1))
print (type(int2))
print (type(float1))
print (type(float2))
print (type(string1))

Lze i použít funkci **isinstance**, pro otestování, zda je proměnná nějakého typu.

In [None]:
print (isinstance(int2, int))
print (isinstance(float1, str))

Typ proměnné se určuje podle zadané hodnoty podle pravidel. Někdy, abychom se vyhnuly chybám v programu může být vhodné datový typ definovat explicitně.

Nebo může chtít vstupní hodnotu přetypovat.

In [None]:
int3 = int (1.0)
float3 = float(1)
string2 = str (int3)
print (type(int3))
print (type(float2))
print (type(string2))

**U neměnných datových typů se při přiřazení udělá kopie dat.**
* bool
* int
* float
* complex
* str
* bytes
* tupple
* None


In [None]:
x = 1
y = x
x = 2
print ("x:", x)
print ("y:", y)

## Celá čísla
Velmi často budeme pracovat s celými čísly, tak si představíme základní operace.

Při převodech na  celé číslo Python osekává, nezaokrouhluje.

In [None]:
print (int(3.9))
print (int(-2.9))

Pokud chceme zaokrouhlit, tak musíme použít funkci round. Funkce round() používá bankéřské zaokrouhlování – na nejbližší sudé číslo.

In [None]:
print (round(6.5))        # 6
print (round(7.5))        # 8
print (round(3.14, 1))    # 3.1  (na 1 desetinné místo)
print (round(2737, -2))   # 2700 (na stovky)

Pro práci s celými čísli se používají standardní operátory +, -, *, / a pak tyto

* // – celočíselné dělení, u kladných čísel „osekne“ desetinou část, u záporných čísel vrací nižší hodnotu (např. -7 // 2 == -4), pokud je člen typu float, výsledek je také float
* ** – mocnění
* % – modulo (zbytek po dělení)

In [None]:
print(7 // 2)   # 3
print(-7 // 2)  # -4
print(2 ** 3)   # 8
print(7 % 3)    # 1

Někdy budete chtít převádět mezi číselnými soustavami.

In [None]:
print(int("FF", base=16))     # 255
print(int("0b10010", base=2)) # 18

print(bin(99))   # '0b1100011'
print(hex(99))   # '0x63'
print(oct(99))   # '0o143'

## Řetězce

* Python používá pro text Unicode (UTF-8).
* Jeden znak může být uložen v 1–3 bajtech (někdy i 4).
* Zdrojový soubor programu (program.py) musí být uložen v UTF-8.
* Řetězce lze psát pomocí uvozovek:
   * dvojitých "..."
   * nebo jednoduchých '...'

Řetězec lze rozdělit do proměnných.

In [None]:
s = 'cool'
a, b, c, d = 'cool'   # rozdělí jednotlivé znaky do proměnných
print (d)

Mezi základní operace s řetězci patří zjištění délky řetězce, přístup k n-tému znaku, spojení řetězců, opakování znaků


In [None]:
string_length = len(s) 
first_char = s[0]           
string_joing = 'abc' + 'def'     
multiple_a = 'a' * 4             
print (string_length)
print (first_char)
print (string_joing)
print (multiple_a)

Někdy budete chtít, aby řetězec obsahoval více řádků. Pro oddělení se používá zvlážtní znak **\n**.

In [None]:
                 
multiline='first\nsecond\nthird\n'
print (multiline)


Pokud budete chtít v řetězci použít sekvenci znaků jako \n, \t, ..., tak aby se neinterptovaly, můžete použít funkci **repr**. Nebo použít dvojité \\\\

In [None]:
print (repr("string\n"))
print ("string\\n")

### Formátování řetězců
Při vypisování proměnných budete chtít ovlivnit jejich podobu.

Starší způsob formátování používá metodu .format(), která má jako první vstup formátovací řetězec a pak následují vypisované proměnné. 

* Na místě, kde se má vypsat proměnná se uvádí v {} pořadí proměnné číslované od 0. 
* Pokud je pořadí jasné, lze ho vynechat.
* Proměnné si lze i pojmenovat.

In [None]:
a = [1, 2, 3]
b = 'xxx'
c = 1.222342

print("b {0} a {1[0]}".format(b, a))
print("b {} a[0] {}".format(b, a[0]))
print("b {b} a {a}".format(b=b, a=a[0]))

Pro hezčí výpis lze určit zarovnávání a délku řetězce.

In [None]:
print ('{:<30}'.format('left aligned'))             
print ('{:>30}'.format('right aligned'))            
print ('{:^30}'.format('centered'))                 
print ('{:*^30}'.format('centered'))                

Při vypisování čísel je dobré definovat jejich formát.
* Datový typ (**f**loat, **d**ecimal)
* Počet čísel před a za desetinou čárkou
* Oddělovač tisíců

In [None]:
print ('{0:.1f}'.format(c))                          
print ('{0:03d}'.format(10))
print ('{0:,}'.format(123456789))

Pro přehlednější formátování se používá novější, přehlednější způsob: **f-string**. Před řetězcem je f a uvnitř řetězce můžeme používat proměnné, ale i funkce, metody apod.


* f'...' – uvnitř můžeme přímo používat proměnné {b}, {c}
* str.format() – vhodné pro složitější formátování nebo opakované použití

In [None]:
print (f'Hodnota b je {b}, hodnota c je {c}')

In [None]:
text = 'Python'
print(f'{text:>10}')  # vpravo: '    Python'
print(f'{text:^10}')  # na střed: '  Python  '
print(f'{text:*^10}') # střed s hvězdičkami: '**Python**'

In [None]:
x = 42
print(f'{x:05d}')   # doplní nulami: 00042
print(f'{x:,}')     # oddělení tisíců čárkou: 42

In [None]:
y = 12345.6789
print(f'{y:.2e}')   # 1.23e+04

In [None]:
a = 5
b = 3
print(f'{a} + {b} = {a+b}')  # 5 + 3 = 8

Při vypisování více proměnných lze změnit oddělovač místo mezery. To se může hodit například při vytváření textových souborů.

In [None]:
print ("A", "B", "C", sep="|")

Lze předefinovat i vypisovaný znak na konci.

In [None]:
print ("A", end=",")              # na konci příkazu se vytiskne ,
print ("B")                       # na konci příkazu se standardně vytiskne \n, nový řádek

### Metody pro práci řetězci
Třída str má mnoho metod pro práci s řetězci.

Často je potřeba řetězec **rozdělit** na podřetězce podle nějakého oddělovače. Metoda splitlines vrací seznam řetězců.

In [None]:
s = ''' line1
line2
line3'''
print (s.splitlines())            

In [None]:
# splitting and joining string
query='password=Secret&login=user00'
params_list=query.split('&')   
string5=" ".join(params_list)
print (string5)

Práce s velkými a malými písmeny je důležitá.

In [None]:
string = "Hello world"
print (string.lower())                 
print (string.upper())
print (string.isupper())

Někdy je třeba počítat specifické znaky.

In [None]:
print (string.lower().count('l'))

Ověření, zda v řetězci je nějaký substring.

In [None]:
print ("he" in string)                 # vrací True, False, je rychlejší než find
print (string.index('w'))              # pozice prvního výskytu, jinak vrací výjimku
print (string.find('substr'))          # pozice prvního výskytu
print (string.find('wo'))              # pozice prvního výskytu

Někdy je potřeba něco nahradit nebo smazat.

In [None]:
print (string.replace('world','universe', 3)) # náhrada řetězce, kolikrát je nepovinné
print (string.strip())                 # odstranění mezery(znaky) na začátku a konci řetězce

Kontrola, zda lze řetězec převést na číslo.

In [None]:
number="5684"
print (number.isdecimal())
print (string.isdecimal())

Každý znak v řetězci má svoji pozici. Začíná se číslovat zleva od 0. Zprava se čísluje zápornými čísly.
* 0 - první znak
* 1 - druhý znak
* -1 - poslední znak
* -2 - předposlední znak

Lze vypisovat části řetězců určení počáteční a koncovou pozicí. Pokud nějaká pozice není určena, doplní se pozice začátku nebo konce.

In [None]:
# substringy
a_string='abcdefghijklmnopqrstuvwxyz'
print (a_string[3:11])
print (a_string[3:-3])
print (a_string[0:2])
print (a_string[:18])
print (a_string[20:])

# Měnitelné (mutable) datové typy
Na rozdíl od neměnných typů (int, str, tuple …) lze měnitelné datové typy po vytvoření upravovat.

* list - seznam, uspořádaná kolekce prvků, které mohou být různých typů. Prvky lze přidávat, odebírat nebo měnit.
- set - množina, neuspořádaná kolekce unikátních prvků. Hodí se pro práci s množinovými operacemi (sjednocení, průnik).
- dict - slovník, kolekce páru klíč : hodnota. Klíče musí být neměnné (např. čísla, řetězce, n-tice). Hodnoty mohou být i měnitelné.

**U měnitelných datových typů se při přiřazení hodnoty nedělá kopie dat jako neměnitelných typů.** Předává se ukazatel na datovou strukturu.

In [None]:
a=[1,2,3]
b=a        # creating a copy of the reference, pointer
b[2]=4     # and[2] will also be 4

print (a)
print (b)

## Seznam, list
* Seznam libovolných proměnných, ale je vhodné používat stejný datový typ nebo aby hodnoty byly stejného významu.
* Prvky lze v čase měnit, přidávat a odebírat.

**Pro klasické vícerozměrná pole budeme používat knihovnu numpy.** Numpy probereme později.

### Vytvoření seznamu

In [None]:
value = 6
a_list = ['c', 'd', 1, True]

### Přístup k prvkům
* Indexuje se od 0
* Indexování zápornými čísly začíná odzadu

In [None]:
print (a_list[0])    # první prvek
print (a_list[-1])   # poslední prvek
print (a_list[0:3])  # první 3 prvky
print (a_list[0:6:2]) # každý druhý prvek od indexu 0 do 5
print (a_list[:])     # kopie seznamu
print (a_list[::-1])  # reverze seznamu

a_list[2:4]='ab'                       # přiřazení hodnoty do řezu seznamu
print (a_list)

### Přidávání prvků

In [None]:
a_list.append(8)           # přidá jeden prvek nakonec
a_list.append([3,4])       # přidá seznam jako jeden prvek
a_list.extend([3,4])       # přidá všechny prvky seznamu
a_list.insert(0, 6)        # vloží prvek na index 0

print (a_list)

### Spojování seznamů

In [None]:
a_list = a_list + [1, 2.0]
print (a_list)

### Odstranění prvků

In [None]:
del a_list[1]           # podle indexu
print (a_list)
a_list.remove(6)        # podle hodnoty (první výskyt)
print (a_list)
print (a_list.pop())            # odstraní a vrátí poslední prvek
print (a_list.pop(1))           # odstraní prvek na indexu 1 a vrátí ho
print (a_list)

### Informace o seznamu

In [None]:
print (len(a_list))             # délka seznamu
print (a_list.count(1))         # počet výskytů hodnoty
print (6 in a_list)             # True/False
print (a_list.index('d'))         # index prvku, pokud není, vyvolá výjimku

### Další operace

In [None]:
num_list = [56, 8, 0, -5]
num_list.sort()            # seřazení seznamu (prvky musí být stejného typu)
print (f'Sorted list {num_list}')

head, *middle, tail = [1,2,3,4,5]  # rozdělení seznamu
print (f'Head {head}')
print (f'Middle {middle}')
print (f'Tail {tail}')

### Cyklický průchod seznamem

In [None]:
for hodnota in a_list:
    print (hodnota)

In [None]:
# Průchod seznamem s počítadlem
for index, value in enumerate(a_list):
    print (f'index:{index}, value:{value}')

### Porovnání seznamu
Porovnani záleží na pořadí. Pokud při porovnání nemá nezáležet na pořadí, tak si seznam před porovnáním musíme setřídit.

In [None]:
# 
l1 = [10, 20, 30, 40, 50]
l2 = [20, 30, 50, 40, 70]
l3 = [50, 10, 30, 20, 40]

if l1 == l2:
    print ("The lists l1 and l2 are the same")
else:
    print ("The lists l1 and l2 are not the same")

if l1 == l3:
    print ("The lists l1 and l3 are the same")
else:
    print ("The lists l1 and l3 are not the same")


In [None]:
l1 = [10, 20, 30, 40, 50]
l2 = [20, 30, 50, 40, 70]
l3 = [50, 10, 30, 20, 40]

l1_sorted = sorted(l1)
l2_sorted = sorted(l2)
l3_sorted = sorted(l3)

if l1_sorted == l2_sorted:
    print ("The lists l1 and l2 are the same")
else:
    print ("The lists l1 and l2 are not the same")

if l1_sorted == l3_sorted:
    print ("The lists l1 and l3 are the same")
else:
    print ("The lists l1 and l3 are not the same")

### Kopie seznamu
Protože je list měnitelný datový typ, tak přiřazením do nové proměnné nevytvoříme jeho kopii, ale pouze uděláme nový ukazatel.


In [None]:
a=[1,2,3]
b=a        
b[2]=4     

print (a)
print (b)

In [None]:
a=[1, 2]
b=[a, a, a]   # b obsahuje 3 ukazatele na a, pokud změním a, tak se změna promítne 3x do b.
print (b)

Někdy se může hodit vytvořit kopii datové struktury. První možnost kopie může být trochu divná.

In [None]:
c=a[:]
c[0]=0
print (a)
print (c)

Pro vytvoření kopie seznamu můžeme použít funkci **copy**

In [None]:
a=[1, 2]
b=a.copy()  
b[0]=3
print (a)
print (b)

Pozor, copy dělá kopii pouze do první úrovně seznamu. 

In [None]:
a=[[1,2], 3]
b=a.copy()   
b[0][0]=5
print (a)
print (b)

Pokud je struktura složitější musíme použít **deepcopy**

In [None]:
import copy
a=[[1,2], 3]
b=copy.deepcopy(a)  
b[0][0]=5
print (a)
print (b)

## Tupple, N-tice

* Podobné seznamům (list), ale neměnitelné – obsah nelze měnit po vytvoření.
* Jsou rychlejší než seznamy, vhodné pro data, která se nemají měnit.
* 

### Vytvoření

In [None]:
t1 = (1, 2, 3)
t2 = ('a', 'b', 'c')
t3 = ()          # prázdná n-tice
t4 = (1,)        # n-tice s jedním prvkem, pozor na čárku

### Vlastnosti
* Prázdná n-tice je False
* N-tice alespoň s jedním prvkem je True

In [None]:
print (bool(()))
print (bool((1,)))

### Přístup k prvkům

In [None]:
t1[0]      # první prvek
t1[-1]     # poslední prvek
t1[0:2]    # výřez prvních dvou prvků
(x,y,z)=t1  # přiřazení prvků n-tice do proměnných, lze to použít u funkcí, které vrací více hodnot
print (z)

### Spojení


In [None]:
t1 + t2

### Opakování prvků

In [None]:
t2 * 3

### Převod n-tice a seznamu

In [None]:
a_list= list (t1)                 # vytvoření seznamu z n-tice          
a_tuple= tuple (a_list)           # vytvoření n-tice ze seznamu


### Testování

In [None]:
print (1 in t1)                          # test, zda n-tice obsahuje hodnotu
print (t1==t2)                       # testuje, zda postupně rovnají prvky entice
print (t1 < t4)                      # postupně se testuje platnost porovnání po prvcích

### Vyhledávání

In [None]:
print (a_tuple.count(2))                       # kolikrát se hodnota v n-tici vyskytuje
print (a_tuple.index(3))                       # index, kde se nachází hodnota. Pokud je vícekrát, tak se vrací první výskyt
print (len(a_tuple))                           # délka n-tice
print (sum(a_tuple))                           # suma hodnot
print (min(a_tuple))
print (max(a_tuple))

### Změna hodnoty
Pozor tupple je neměnitelný typ. Toto skončí chybou

In [None]:
x = (1, 2)
x[0] = 3

## Množiny, set

* Neuspořádaná kolekce jedinečných hodnot – každý prvek se může vyskytovat jen jednou.
* Hodí se pro operace typu průnik, sjednocení, rozdíl.

### Vytvoření

In [None]:
s = {1, 2, 3, 4}
s2 = set([3, 4, 5, 6])   # převod ze seznamu
empty_set = set() 
print (s) 
print (s2)

### Přidání a odstranění prvků

In [None]:
s.add(5)       # přidá prvek
s.update ({3, 4, 5})   # přidání více hodnot do množiny, lze zadat jako množinu nebo jako seznam
s.update ([3, 4, 5])   # přidání více hodnot do množiny, lze zadat jako množinu nebo jako seznam, je to jedno
s.remove(2)    # odstraní prvek, pokud neexistuje -> vyvolá chybu
s.discard(10)  # odstraní prvek, pokud existuje, jinak nic
s.pop()        # odebere náhodně jednu hodnotu a vrátí ji
print (s)

### Operace s množinami

In [None]:
print (f"Union {s.union(s2)}")                                  # sjednocení
print (f"Intersecion {s.intersection(s2)}")                     # průnik
print (f"Difference {s.difference(s2)}")                        # rozdíl (prvky v s, které nejsou v s2)
print (f"Symetric difference {s.symmetric_difference(s2)}")     # prvky, které jsou v jedné nebo druhé množině, ale ne v obou
print (f"subset {s.issubset(s2)}")
print (f"upperset {s.issuperset(s2)}")
print (f"Lengh of s {len(s)}")

### Kopie
Kopie množiny stejně jako u seznamu nelze dělat přiřazením, ale **copy**.

In [None]:
s3 = s 
s.add(10)
print (s)
print (s3)

In [None]:
s4 = s.copy()
s.add(11)
print (s)
print (s4)

### Porovnání
Nezáleží na pořadí

In [None]:
a = {1, 2}
b = {2, 1}
a==b

## Dictionary, slovník

* Slovník je kolekce párů klíč : hodnota.
* Klíče musí být jedinečné a neměnitelné (např. čísla, řetězce, n-tice).
* Hodnoty mohou být libovolného typu, včetně seznamů a dalších slovníků.

### Vytvoření

In [None]:
a_dict = {'key1':'value', 'key2':'value'}
a_dict['key3'] = "value2"
c_dict = dict([("key99", "value99")])
print (a_dict)

### Přístup a kontrola

In [None]:
key = 'key2'
value = 'value'

if key in a_dict.keys():       # kontrola existence klíče
    print(key, a_dict[key])

### Kopie

In [None]:
b_dict= a_dict.copy()
a_dict["key1"]="VALUE"
print (a_dict)
print (b_dict)

### Základní operace

In [None]:
print (len(a_dict))             # počet klíčů
print (a_dict.items())          # seznam párů klíč : hodnota

### Iterace přes slovník

In [None]:
for key in sorted(a_dict.keys()):
    print(key)

In [None]:
for value in a_dict.values():
    print(value)      

In [None]:
for key, value in a_dict.items():
    print(key, value)  

### Převod mezi slovníkem a seznamy

In [None]:
v = list(a_dict.values())  # seznam hodnot
k = list(a_dict.keys())    # seznam klíčů
n = list(a_dict.items())   # seznam n-tic (klíč, hodnota)
d=dict([("key","value"), ("key2","value2")] ) # převod listu na dictionary

# Binding objektů a jmen
* Objekt může mít jedno nebo více jmen (proměnných), která na něj odkazují.
* Jméno neoznačuje paměťovou lokaci – je jen odkazem na objekt.
* Do proměnné lze přiřadit libovolný objekt a později změnit typ přiřazeného objektu.

In [None]:
x=10
x='python'
print (x)

* V Pythonu do verze 3.5 nejsou explicitní deklarace typu.
* Od Python 3.5 lze používat type hints (volitelně), které pomáhají při dodatečných kontrolách a čitelnosti kódu:
* Type hints neblokují přiřazení jiného typu, slouží jen pro kontrolu (např. v IDE nebo linteru).

In [None]:
def greetings(name: str) -> str:
    return f"Hello, {name}!"

# Smazání proměnné
Smazání proměnné odstraní vazbu mezi jménem a objektem, nikoli samotný objekt.

In [None]:
x = 10
del x   # x už neexistuje

Pokud objekt nemá žádné odkazy (žádná jména na něj neukazují), garbage collector jej automaticky odstraní a uvolní paměť.

Python spravuje paměť automaticky, takže není nutné explicitně uvolňovat objekty.

In [None]:
y = [1, 2, 3]
z = y        # nyní existují dva odkazy na list
del y        # zůstává odkaz z proměnné z, objekt není smazán
del z        # žádné odkazy → garbage collector uvolní paměť

# Cvičení 1
Napište program, který:
* Zeptá se uživatele na jeho jméno.
* Vypíše počet znaků v jménu.
* Vypíše první a poslední písmeno jména.
* Vypíše jméno velkými písmeny a malými písmeny.

In [98]:
jmeno = input("Zadej své jméno: ")

# Cvičení 2
* Vytvoř seznam čísel [1, 2, 3, 4, 5].
* Přidej číslo 6 na konec seznamu.
* Odstraň číslo 3 ze seznamu.
* Vypíš seznam pozpátku.
* Spočítá, kolikrát se v seznamu vyskytuje číslo 2.

In [None]:
#

# Cvičení 3
* Vytvoř slovník se jmény a věkem, např. {'Jan': 20, 'Eva': 22, 'Petr': 19}.
* Přidej nového člena 'Anna': 25.
* Odstraň člena 'Petr'.
* Vypíš všechny klíče, všechny hodnoty a všechny páry klíč:hodnota.
* Zjistí, zda ve slovníku existuje klíč 'Eva' a vypíš její věk.

In [None]:
#

# Cvičení 4
Napišt program, který:
* Vytvoří množinu a = {1, 2, 3, 4} a b = {3, 4, 5, 6}.
* Spočítá a vypíše sjednocení, průnik a rozdíl množin a - b.
* Přidá číslo 7 do množiny a.
* Odstraní číslo 2 z množiny a.