# Úvod do problematiky

---

* [Úvod k datům](#Úvod-k-datům),
* [Pracovní prostředí](#Pracovní-prostředí),
* [Notebooky feat. SQL](),
* [spojovací objekty Python s DB]().

<br>

## Úvod k datům

---

(doplnit-intro-data)

---

Cílem toho kurzu **není** udělat z vás bezchybné a profesionální **datové analytiky** nebo **datové inženýry**.

<br>

Cílem je obohatit tvůj stack, nebo portfolio nástrojů, které ti umožní:
* rozmýšlet, jaká **pracovní prostředí** máš k dispozici a kdy je použít,
* uchopit **efektivnější datové typy**, kde je získat a jak je používat,
* manipulovat lépe **s různými zdroji dat**,
* **načítání, validování** a procházení dat,
* **vizualizovat data**.

Než se ale vůbec začneš nástroje, bude vhodné, seznámit tě **s prostředími**, kde budeš moct posléze pracovat.

<img src="https://external-content.duckduckgo.com/iu/?u=https%3A%2F%2Ftse3.mm.bing.net%2Fth%3Fid%3DOIP.H2BkU9bqGfzRSMZ3S3Sx0QHaHa%26pid%3DApi&f=1&ipt=4cf9116d27fba72ce0224dba99b4ff36a1867aa0351c892e1c8ede5793e267e7&ipo=images" width="100"/>

## Pracovní prostředí

---

Konkrétních variant je spousta, ale jako dobrý základ můžeš použít následující:

* Interpret, interaktivní interpret,
* editor/IDE,
* Hub/Notebooky,
* (pokročilé) docker kontejnery.

<img src="https://external-content.duckduckgo.com/iu/?u=https%3A%2F%2Ftse1.mm.bing.net%2Fth%3Fid%3DOIP.tzfIjIrb-x4w5Rr-6GQKZQHaGn%26pid%3DApi&f=1&ipt=c295ddf9634cf8a936cad9d98a3e7d6cb131bce35f810e3f6e8930739b98ffdd&ipo=images" width="100"/>

## Konzole, příkazový řádek

---

Klasický *Pythonní interpret* a *interaktivní interpret* jsou jednoduchá, přesto všestranná pracovní prostředí.

Jejich hlavní síla spočívá **v přenositelnosti**.

<br>

Ne všude budeš mít k dispozici nějaké grafické prostředí (GUI). Přesto se ti může hodit pomocník, které ti dovede lehké debugování nebo ověřování usnadnit.

Instalaci *interaktivního interpreta* IPythonu je možné provést pomocí příkazu:

In [None]:
!pip install ipython

..s následnou kontrolou pomocí výpisu verze **IPythonu**:

In [None]:
!ipython --version

Pokud chceš používat přímo *Hub* nebo Notebooky, stačí nainstalovat ty a **IPython** nainstaluješ jako jejich součást.

### Základní nástroje, vypiš mi nápovědu

V rámci *interpreta* můžeš pracovat s nápovědou pomocí funkce `help()`:

In [None]:
help(list.copy)

U *interaktivního interpreta* můžeš používat nápovědů také a daleko elegantněji:

In [None]:
list.copy?

K tomu ti postačí za libovolný výraz dopsat otazník `?`.

Výsledek bude praktický stejný s tím, že podle verze IPythonu se místo textového výstupu objeví **vyskakovací okno**.

In [None]:
len?

In [None]:
jmena = ["Matouš", "Lukáš", "Marek"]
jmena.append?

Stejně jako funkce `help` můžeš nápovědu používat pro *uživ. funkce*:

In [None]:
import datetime

In [None]:
def vypis_zpravu_s_casem(cas: str, zprava: str) -> str:
    """
    Vrať výstup jako naformátovanou zprávu s aktuálním časem.
    
    :param cas: údaj s časem.
    :type cas: str
    :param zprava: zadaný text.
    :type zprava: str
    
    :Example:
    >>> import datetime
    >>> vypis_zpravu(
    ...     "18:43:15",
    ...     "Ahoj na první lekci"
    ... )
    18:43:15, Ahoj na první lekci
    """
    return f"{cas}, {zprava}"

In [None]:
vypis_zpravu_s_casem(
    datetime.datetime.now().strftime("%H:%M:%S"),
    "Ahoj na první lekci"
)

In [None]:
vypis_zpravu_s_casem?

Takže směle do psaní *docstringů* a zobrazování dokumentace.

Pokud budeš mít zájem dohledat nejen popis, ale i podobu objektu..

### Základní nápověda, zobraz zdrojový kód

Někdy může být nápomocné, získat kromě popisku také náhled na objekt samotný:

In [None]:
vypis_zpravu_s_casem??

U takových jednoduchých uživ. funkcí je zdroj poměrně přímočarý.

U jiných knihoven může být naopak trochu upovídaný:

In [None]:
import pandas

In [None]:
pandas.read_csv??

A někdy nápověda pomocí `??` nezobrazí vůbec nic.

Obecně řečeno je to zapříčiněné tím, že objekt, na který chceš vidět nápovědu není v Pythonu zavedený (implementovaný), ale je používaný objekt z jiného jazyku (v případě tohoto *interpreta* v C).

In [None]:
len??

### Základní nápověda, našeptávání

Pokud se ti občas stane, že si nepamatuješ jméno různých objektů, můžeš vyzkoušet nápovědu.

Občas ti vypadne jméno známého datového typu:

In [None]:
prijmeni = list()

In [None]:
prijmeni.

In [None]:
prijmeni.c

Stačí napsat jméno objektu, `prijmeni` a tečku.

Následně stačí stisknout klávesu `TAB` a IPython ti zobrazovazí skrollovací nabídku.

<br>

Někdy je potřeba doplnit **méně patrnou metodu** nebo **konstantu** *z knihoven třetích stran*:

In [None]:
from collections import OrderedDict

In [None]:
mesta = OrderedDict()

In [None]:
mesta.

Další pomůckou může být doplňování při nahrávání jak knihoven, tak konkrétních modulů:

In [None]:
from itertools import 

In [None]:
from typing import 

##### Demo, importování v IPythonu

## Magické příkazy

%paste and %cpaste

%run

%timeit

%lsmagic

%history

%prun

<image>

## Integrace SQL v rámci notebooků

---

In [3]:
# sql-extensions

<image>

## Chystání connection v rámci Pythonu

---

mssql, resp. pyodbc, obecně

Chystání [connection objektů](https://realpython.com/python-sql-libraries/#sqlite) pro Python,
    - Creating Tables,
    - Inserting Records,
    - Selecting Records,
    - Updating Table Records,
    - Deleting Table Records.

v rámci kontextového manažeru

v rámci knihovny pand

<img src="https://external-content.duckduckgo.com/iu/?u=https%3A%2F%2Ftse4.mm.bing.net%2Fth%3Fid%3DOIP.W2N7dQ3O6Ap5P9j5ySALFgHaHa%26pid%3DApi&f=1&ipt=7281764d1fc68c062b10965458a6f0ba9c4c28b1cebcd949afa0d57907cd2bbe&ipo=images" width="200"/>

### Notebooky, Hub, Google Colaboratory

---

In [1]:
!pip install ipython-sql

Collecting ipython-sql
  Downloading ipython_sql-0.4.1-py3-none-any.whl (21 kB)
Collecting sqlparse
  Downloading sqlparse-0.4.3-py3-none-any.whl (42 kB)
[K     |████████████████████████████████| 42 kB 2.0 MB/s eta 0:00:01
Collecting prettytable<1
  Downloading prettytable-0.7.2.zip (28 kB)
Building wheels for collected packages: prettytable
  Building wheel for prettytable (setup.py) ... [?25ldone
[?25h  Created wheel for prettytable: filename=prettytable-0.7.2-py3-none-any.whl size=13699 sha256=a1a25fcc577a065777b0f346bfb18dffbbab03ee638b0fd55e39324bea5f9b03
  Stored in directory: /home/jovyan/.cache/pip/wheels/48/6d/77/9517cb933af254f51a446f1a5ec9c2be3e45f17384940bce68
Successfully built prettytable
Installing collected packages: sqlparse, prettytable, ipython-sql
Successfully installed ipython-sql-0.4.1 prettytable-0.7.2 sqlparse-0.4.3


### Druhá lekce
1. `numpy`,
    - intro ke knihovně, jak s ní pracovat, kde, verze,
    - rozdíl datových typů, list a integer,
    - datové typy v Numpy,
    - array v Pythonu, array v numpy, základy,jejich atributy,
    - operace s maticemi, array,
    - Ufunks,
    - agregace.
    
2. Knihovna `numpy`.
    - Co je to za knihovnu, proč ji mám znát?
    - Základní datové typy, numpy array, co jsou zač, kde je jich potřeba?
    - Performance rozdíly. Agregace, výpočty, srovnávání.

### třetí lekce

2. `pandas` I.,
    - Úvod do frameworku, proč je dobré jej ovládat, kde s ním pracovat?
    - jaké jsou základní datové typy? (Dframe, series, časové řady)
    - základní orientace, indexování,

### čtvrtá lekce

2. `pandas` II.,
    - file io, encoding, chybějící data,
    - kombinace datasetů, concat, append, merge, join,
    - časové řady, možná?
    - eval() a query() jako high-perf operace.

### pátá lekce

3. `matplotlib` a `seaborn`.
    - Úvod do knihovny, její výhody a kdy ji potřebuji?
    - jednoduché grafy, nastavení, stdout,
    - scatter grafy, nastavení, stdout,
    - customizace výstupů, rozvržení, organizace.