# Abstraktní datové typy

**Datový typ** je jeden ze ze základních pojmů ve světě programovacích jazyků a to již od jejich počátků.

Datový typ je množina hodnot, pro níž jsou definovány operace, které s příslušnými hodnotami operují. 

Z hlediska vymezení datového typu jsou proto rozhodující tři (vzájemně) související charakteristiky:

* **representace**: jak jsou v paměti dané hodnoty representovány (kolik bytů zaujímají, jak jsou interpretovány jednotlivé byty či jejích skupiny)

* **množina přípustných hodnot (stavů)**: všechny stavy (tj. přípustné) hodnoty dasného datového typu

* **specifikace (podporovaných) operací**

Ve většině nízkoúrovňových jazyků jsou klíčové první dvě charakteristiky. Například ve většině implementací jazyka C je definováno, že hodnoty typu `int` zaujímaji čtyři nebo osm (souvislých) bytů, které jsou interpretovány jako binární representace danách čísel v tzv.
dvojkovém doplňku (https://en.wikipedia.org/wiki/Two%27s_complement). Počet bytů a především 
jejich počet závisí na hardwarové či softwarové platformě, ale je pro danou platformu fixní a jednoznačně definuje množinu přípustných hodnot (od $-2^{n-1}$ do $2^{n-1}-1$).

Na druhou stranu množina přípustných není tak jasně určena. Jejím jádrem jsou přirozeně běžné číselné operace. Hodnoty typu `int` však lze používat i jako adresy paměti nebo jako hodnoty výčtových typů.

U vysokoúrovňových jazyků je hlavním aspektem množina operací (ta je v Pythonu určena primárně pomocí speciálních metod s dvěma podtržítky) a až poté interní representace či z ní vyplývající množina přípustných hodnot. 

Lze to ilustrovat na příkladě stejnojmenné třídy (třída je jedinou representací datového typu v Pythonu). Operace s celými čísly jsou jasně definovány rozhraním třídy a všechny souvisí s její (celo)číselnou interpretací. Interní representace není všeobecně známa (a nemusí téměř žádného programátora zajímat). Rozsah (a tím množina přípustných hodnot) není určena a je dána pouze velikostí dostupné paměti.

Typ `int` je proto typickým zástupcem tzv. **abstraktního datového typu** tj. datového typu, který je primárně určen přípustnými operacemi a sekundárně i množinou přípustných hodnot (ty jsou dány možnými výsledky přípustných operací nikoliv omezeními representace).

>**Poznámka**: Abstraktní datové typy nabízejí velmi podobný koncept jako třídy objektově orientovaného programování, nejsou však zcela zaměnitelné. Základní rozdíly:
> * abstraktní datové typy jsou abstraktnější koncept, který není vázán na konkrétní realizaci (dají se vytvářet i v jazycích bez tříd a bez přímé podpory OOP)
> * objektové programování zavádí i koncepty, které nejsou součástí ADT (dědičnost, apod.)
> * abstraktní datové typy jsou využívány v teorii algoritmů (tj. v matematické popisu)


Abstraktní datové typy, lze v Pythonu implementovat buď pomocí modulů nebo (snadněji a přirozeněji) pomocí tříd.

Peo začátek si vytvoříme abstraktní datový typ pro modulární aritmetiku na množině $\mathbb{Z}_7$, kde. Viz https://cs.wikipedia.org/wiki/Modul%C3%A1rn%C3%AD_aritmetika.

In [7]:
class Z7:
    def __init__(self,i):
        assert 0 <= i < 7, "Number out of range"
        self.i = i
    def __add__(self, other): # speciální metoda volaná při aplikaci operace sčítání
        return Z7((self.i + other.i)%7)
    def __str__(self): # aby bylop mořno hodnoty vypisovat (převádí hodnotu na číselnou repr.)
        return str(self.i)

In [8]:
x = Z7(3)
y = Z7(5)
print(x+y)

1


> **Úkol**:  Vypište sčítací tabulku pro všechny přípustné dvojice sčítanců.

In [12]:
for i in range(7):
    for j in range(7):
        print( Z7(i)+Z7(j), end="\t")
    print("\n")

0	1	2	3	4	5	6	

1	2	3	4	5	6	0	

2	3	4	5	6	0	1	

3	4	5	6	0	1	2	

4	5	6	0	1	2	3	

5	6	0	1	2	3	4	

6	0	1	2	3	4	5	



Pro  přehlednost lze využít výstup v podobě HTML tabulky (ta to však lze využít jen v Jupyter noteboocích).

In [25]:
from IPython.core.display import display, HTML
lines = "<tr><th/>" + "".join(f"<th>{hj}</th>" for hj in range(7)) + "</tr>"
for i in range(7):
    lines += f"<th>{i}</th>"
    for j in range(7):
        lines += f"<td>{Z7(i)+Z7(j)}</td>"
    lines += "</tr>"
display(HTML(f"<table>{lines}</table>"))

Unnamed: 0,0,1,2,3,4,5,6


> **Úkol**: Doplňte další operace modulární aritmetiky): násobení, opačná hodnota (unární minus, vrací takové číslo, že jeho přičtením získáme 0), resp. odečítání (= přičtení opačného čísla).

## Kolekce jako abstraktní datové typy

Typickým příkladem abstraktních datových typů jsou kolekce například seznam a slovník.

>**Otázka**: Jaké operace definují seznam a množinu. Jaké mají minimální požadavky na časovou složitost?

Klasickým ADT (abstraktní datový typ) je dvojice dvou kolekcí s jednoduchým, ale velmi užitečným rozhraním — zásobník a fronta (*stack* a *queue*). Python tyto ADT přímo nepodporuje, lze je však snadno realizovat pomocí vestavěných kolekcí (pro frontu modul, který však implementuje speciální verzi fronty vhodnou pro paralelní programování).

### Zásobník

Zásobník (angl. *stack*) je datová struktura, která ve své klasické podobě podporuje jen dvě základní operace pro vkládání a vyjímání prvků a jednu (nepovinnou ale užitečnou) vlastnost, která testuje zda je zasobník prázdný:

1. operace `push`: vkládá do zásobníku libovolný objekt (ta je parametrem metody)
2. operace `pop`: vyjímá ze zásobníku **naposledy** vložený objekt. Pokud je zásobník prázdný, tak je chování této operace nedefinované (metody by mělě vyhodit výjimku)
3. vlastnost `isEmpty`: vrací `true`, pokud je zásobník prázdný (což platí i bezprostředně po jeho vytvoření), jinak `false`.

Pro zásobník je tedy typické že poslední vložená hodnota je jako první vyjímána a proto se běžně označuje zkratkou **LIFO** (*last in first out*).

![Operace nad zásobníkem](https://upload.wikimedia.org/wikipedia/commons/b/b4/Lifo_stack.png)

Implementace zásobníku v Pythonu je snadná, neboť příslušné metody jsou již podporovány nad seznamem. Vytvořením vlastní třídy, ale zakryjeme implementaci a zpřístupníme jen ty správné opaerace (pod klasickými jmény).

In [29]:
class Stack:
    def __init__(self):
        self.data = [] # zásobník je prázdný
    def push(self, value): # vložení
        self.data.append(value) # přidáme na konec seznamu
    def pop(self): # vyjmutí posledního vloženého
        return self.data.pop() # vyjímá poslední prvek = naposledy vložený
    def isEmpty(self):
        return not self.data 
    # seznam se v kontextu, kdy je očekávána log. hodnota vyhodnotí na `true` je-li neprázdný

In [34]:
s = Stack()
s.push(2)
s.push(5)

print(s.isEmpty())

print(s.pop())
print(s.pop())

print(s.isEmpty())


False
5
2
True


> **Úkol**: Ověřte, jak se chová metoda `pop` nad prázdným zásobník (opravte definici zásobníku, tak aby vznikla výjimka se lepší sémantikou tj. lepším popisem důvodu vzniku výjimky)

Implementace je efektivní, neboť všechny metody mají časovou složitost $O(1)$.

Kromě zákaldních metod implementace zásobníku podporují i další (výsledkem je mírně pozměněné ADT, které lze označit jako *rozšířený zásobník*).

* metoda `top` vracející horní (= naposledy vloženou) hodnotu, aniž by ji vyjmula ze zásobníku
* vlastnost `length` vracející počet aktuálně uložených prvků (někdy je implementována namísto vlastnosti `isEmpty`).

> **Úkol**: Implementujte tyto dodatečné operace (vlastnost `length` pomocí speciálné metody `__len__`, která je volána při použití vestavěné metody `len`). 

### Fronta

Fronta (angl. *queue*, výslovnoat *kjú*) je abstraktní datový typ, jejíž rozhraní je podobné zásobníku. Operace pro vkládání se běžně nazývá `enqueue`, operace vyjímání `dequeue` (názvy nejsou tak zažité jako u zásobníku). Hlavním rozdílem je sémantika operace vyjímání, která vyjímá první (ještě nevyjmutou hodnotu), tj. realizuje strategii **FIFO** (*first in first out*).

Fronta tudíž skutečně odpovídá frontám známým z obchodů apod. I ve frontě je první obsloužen ten, kdo jako první přišel.

![Fronta](https://upload.wikimedia.org/wikipedia/commons/thumb/5/52/Data_Queue.svg/500px-Data_Queue.svg.png)

Implementace fronty v Pythonu není tak přímočará jako u zásobníku. Naivní implementace je obdobná zásobníku (jedinou změnou kromě změn jmen metod je jiná implementace vyjímání).

In [36]:
class Queue:
    def __init__(self):
        self.data = [] # fronta je prázdná
    def enqueue(self, value): # vložení
        self.data.append(value) # přidáme na konec seznamu
    def dequeue(self): # vyjmutí posledního vloženého
        return self.data.pop(0) # vyjímá první prvek = nejdříve vložený
    def isEmpty(self):
        return not self.data 
    # seznam se v kontextu, kdy je očekávána log. hodnota vyhodnotí na `true` je-li neprázdný

In [37]:
q = Queue()
q.enqueue(1)
q.enqueue(2)

print(q.isEmpty())

print(q.dequeue())
print(q.dequeue())

print(q.isEmpty())

False
1
2
True


Implementace funguje, ale časová složitost operace `dequeu` není optimální, neboť je rovna $O(n)$, kde $n$ je v tomto případě rovno průměrné délce fronty (= aktuálnímu počtu prvků).
Nezáleží tudíž na celkovém počtu vložených hodnot, ale jen na počtu uchovávaných (= vložených a ještě nevybraných). 

V zásadě existují dvě řešení tohoto problému:

1. použití lineární datové struktury, která zajišťuje časovou složitost $O(1)$ na onou koncích kolekce. V Pythonu je to primárně tzv. oboustranná fronta angl. *deque* (vyslovnost *dek*), Výhodou je použití téměř identického kódu (mění se jen volání konstruktoru interní kolekce a odebrání prvku se začátku),
2. Použití tzv. kruhové fronty. Výhodou je nezávislost na další (a obecně komplikovanější) datové struktuře. Hlavní nevýhodou je omezená maximální velikost fronty, která musí být známa předem (je tak nutno řešit přeplnění fronty).

In [40]:
import collections

class FQueue:
    def __init__(self):
        self.data = collections.deque() # prázdná obousměrná fronta
    def enqueue(self, value): # vložení
        self.data.append(value) # přidáme na konec seznamu
    def dequeue(self): # vyjmutí posledního vloženého
        return self.data.popleft() # vyjímá první prvek = nejdříve vložený
    def isEmpty(self):
        return not self.data 
    # seznam se v kontextu, kdy je očekávána log. hodnota vyhodnotí na `true` je-li neprázdný

In [41]:
q = FQueue()
q.enqueue(1)
q.enqueue(2)

print(q.isEmpty())

print(q.dequeue())
print(q.dequeue())

print(q.isEmpty())

False
1
2
True


>**Úkol**: Implementujte cyklickou (kruhovou) frontu.  Popis jehí funkce najdete např. na https://en.wikipedia.org/wiki/Circular_buffer.