<a href="https://colab.research.google.com/github/hrbolek/learning/blob/master/ais/02_datastr.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Datové struktury

- Datové struktury
    - Elementární datové struktury
        - Znak
        - Číslo (IEEE 754)
        - Bool
    - Komplexní datové struktury
        - List (Python)
        - Dict (Python)
        - Tree
        - Graph
    - Principiální algoritmy pro práci s datovými strukturami
        - Třídění
        - Vyhledávání 
        - Výpočetní složitost

## Elementární datové struktury

### Čísla

Pravděpodobně historicky první datová prvek ukládaný v počítači. Rozlišujeme celá čísla a čísla s desetinnou čárkou (tečkou). Obecně je vhodné mít na paměti, že jakákoliv data jsou v paměti počítači zakódována v posloupnosti bitů (bytů). Celá čísla se aktuálně používají v podobě, která je adekvátní 2, 4, či 8 bytům.

Čísla s desetinnou čárkou definuje norma IEEE 754 v podobě 4, 8 a 10 bytů.

> Kolik možných kombinací odpovídá 8 bytům?
>
> Kolik různých desetinných čísel znáte?
> 
> Jaké komplikace z této skutečnosti vyplývají?

In [9]:
end = 0.8
start = 0
delta = 0.1

currentValue = start
index = 0
while currentValue < end:
    print(index, '\t', currentValue)
    currentValue = currentValue + delta
    index = index + 1 

0 	 0
1 	 0.1
2 	 0.2
3 	 0.30000000000000004
4 	 0.4
5 	 0.5
6 	 0.6
7 	 0.7
8 	 0.7999999999999999


Čísla s periodickým vyjádřením

$\frac{1}{3}=0.3333$ ?

> Jaký tvar má číslo 0.1 paměti za předpokladu, že se jedná o implementaci podle IEEE 754, varianta 8 bytů?
> 

### Znak

Potřeba ukládat text v počítači vedla k vytvoření datového typu znak. Historicky byl znak reprezentován 1 bytem.

> Kolik možných kombinací odpovídá 1 bytu?
> 
> Kolik znaků znáte?
> 
> Jaké komplikace z této skutečnosti vyplývají?
> 
> Jaké řešení bylo implementováno?



In [15]:
import sys

print(sys.getsizeof(''))
print(sys.getsizeof('A'))
print(sys.getsizeof('Á'))

53
50
74


In [19]:
print(sys.getsizeof('Á'))
print(sys.getsizeof('ÁB'))
print(sys.getsizeof('ÁČ'))
print(sys.getsizeof('ÁČĎ'))
print(sys.getsizeof('ÁČĎÉ'))

74
75
78
80
82


In [23]:
text = '\U00000394'
print(sys.getsizeof(text))
print(sys.getsizeof(text + 'Á'))

76
78


## Komplexní datové struktury

### List

In [None]:
data = [0, 1]

Implementace / organizace v paměti počítače. 

### Dictionary

In [None]:
data = {'value': 0}

### Strom

[Wiki](https://en.wikipedia.org/wiki/Tree_(data_structure))

Knihovna implementující datovou strukturu strom v jazyku Python [anytree](https://github.com/c0fec0de/anytree).


In [27]:
!pip install anytree

Collecting anytree
  Downloading anytree-2.8.0-py2.py3-none-any.whl (41 kB)
[?25l[K     |███████▉                        | 10 kB 21.0 MB/s eta 0:00:01[K     |███████████████▊                | 20 kB 28.0 MB/s eta 0:00:01[K     |███████████████████████▋        | 30 kB 15.0 MB/s eta 0:00:01[K     |███████████████████████████████▍| 40 kB 11.3 MB/s eta 0:00:01[K     |████████████████████████████████| 41 kB 405 kB/s 
Installing collected packages: anytree
Successfully installed anytree-2.8.0


In [28]:
from anytree import Node, RenderTree
udo = Node("Udo")
marc = Node("Marc", parent=udo)
lian = Node("Lian", parent=marc)
dan = Node("Dan", parent=udo)
jet = Node("Jet", parent=dan)
jan = Node("Jan", parent=dan)
joe = Node("Joe", parent=dan)




In [34]:
from anytree.exporter import DotExporter
# graphviz needs to be installed for the next line!
result = DotExporter(udo)#.to_picture("udo.png")
dir(result)
result.graph

'digraph'

### Graf

[Wiki](https://en.wikipedia.org/wiki/Graph_(abstract_data_type))

### Koncept Immutable

Immutable datová struktura je datová struktura, kterou nelze změnit. V programu tedy (v extrému) existují jen konstanty.

**Redux** - knihovna, která na konceptu staví řešení pro správu dat ve webové aplikaci.

Příklad, který je konceptem řešen.

In [24]:
def changeName(data, value):
    data['name'] = value
    return data

input = {'name': 'John'}
result = changeName(input, 'Julie')
print('result', result)
print('input', input)

result {'name': 'Julie'}
input {'name': 'Julie'}


Řešení v duchu konceptu immutable

In [25]:
def changeName(data, value):
    result = {**data, 'name': value}
    return result

input = {'name': 'John'}
result = changeName(input, 'Julie')
print('result:', result)
print('input:', input)

result {'name': 'Julie'}
input {'name': 'John'}


Side effect functions - funkce s vedlejšími efekty je funkce, při svém běhu změní i hodnoty mimo tělo funkce.

## Principiální algoritmy pro práci s datovými strukturami

### Předávání parametrů funkci

In [26]:
def inc(value):
    value = value + 1
    return value

input = 5
result = inc(input)
print('result:', result)
print('input:', input)

result: 6
input: 5


Srovnejte s funkcí `changeName` definované výše. 

>
> **Jak si vysvětlíte skutečnost, že obdobné funkce fungují odlišně?**
>

### Algoritmus třídění

### Přístup k rozsáhlým datovým strukturám

Hra / sázka. Pomocí deseti otázek, na které lze odpovědět ano/ne, zjistím jaké číslo z rozsahu 0-1000 (1023) si protivník myslí. Jakým způsobem?

**Důsledek**

> 
> Datové struktury v databázi mají primární, unikátní klíč
> 

**Otázka**

>
> Kolik "otázek" je potřeba pro nalezení záznamu pomocí jeho ID v databázi o velikosti 4TB s očekávanou délkou záznamu 1kB?
>