# Užitečné balíčky

## Práce s cestami

### os.path

- low-level funkcionální přístup

In [None]:
import os

root = "/data/unicorn/uc-python"
full_path = os.path.join(root, "22_23_zs", "mipy")

print(full_path)

### pathlib

- high-level objektový přístup

In [None]:
from pathlib import Path

root =  Path("/data/unicorn/uc-python")

full_path = root / "22_23_zs" / "mipy"
print(full_path)
for file in full_path.iterdir():
    if not file.is_dir(): print(file)
    
for file in full_path.glob("*_live*"):
    print(file)

### shutil

>High-level file operations

- kopírování
- přesouvání
- přístup k právům
- atd

## modul `os`

In [None]:
print(os.getcwd())
os.chdir("/data/codebase")
print(os.getcwd())

In [None]:
os.getenv("PYTHONPATH")
os.getenv("PATH")

## modul `sys`

Modul `sys` je vestavěný modul, který poskytuje jistý interface mezi systémem a pythoním interpretem. Mezi nejčastější využití patří

### Přebírání commad-line argumentů předaných skriptu.

In [None]:
import sys

print(sys.argv)

Toto je mimořádně matoucí tady v prostředí Jupyter. Pro lepší pochopení uložte předchozí kód do souboru a `main.py` a z příkazové řádky jej spusťte s několik argumenty navíc. Uvidíte toto:    
```bash
$ python3 main.py arg1 arg2
['main.py', 'arg1', 'arg1']
```
Je to běžný způsob, jakým se programům předávají dodatečné argumenty. Pro složitější sadu argumentů se vyplací použít např. vestavěný modul `argparse`.

### Ukončení programu s konkrétním exit code:
```python
import sys

sys.exit(0)
```

### Přístup k informacím o interpretu či systému

In [None]:
import sys

print(sys.version)
print(sys.version_info)
print(sys.platform)

## Modul `datetime`

Vestavěný model poskytující běžné funkce pro práci s datem. Asi nejčastší operace, které budete s tímto balíkem provádět, jsou tyto:

1. aktuální datum a čas

In [None]:
from datetime import datetime

now = datetime.now()
print(now)

2. reprezentace konkrétního data

In [None]:
from datetime import datetime

specific_date = datetime(year=2023, month=10, day=22, hour=5)
print(specific_date)

3. formátování data 

In [None]:
from datetime import datetime

specific_date = datetime(year=2023, month=10, day=22, hour=5, minute=30, second=3)
formatted_date = specific_date.strftime("%Y%m%d%H%M%S")
print(formatted_date)

4. parsování data

In [None]:
date_string = "2023-10-22"
parsed_date = datetime.strptime(date_string, "%Y-%m-%d")
print(parsed_date)

5. práce s rozdíly (k tomu slouží samostatný objekt `timedelta`)

In [None]:
from datetime import datetime, timedelta

now = datetime.now()
future = now + timedelta(minutes=45)

print(now, future)

## Logging

Python poskytuje prostřednitvím modulu `logging` poměrně širokou podporu logování. V modulu existují různé úrovně logování, které určují závažnost logovacích zpráv: `DEBUG`, `INFO`, `WARNING`, `ERROR` a `CRITICAL`. Nižší úrovně (např. `DEBUG`) jsou určeny pro detailní informace, zatímco vyšší úrovně (např. `CRITICAL`) slouží pro označení vážných problémů, které vyžadují okamžitou pozornost. Obecně je lepší používat pořádný logging než sérii printů - v případě potřeby lze míru logování změnit volbou log level. Základní použití si ukažmě na příkladu

In [None]:
import logging

logging.basicConfig(
    format='%(asctime)s - %(levelname)s - %(message)s',
    level=logging.INFO,
    # filename='example.log'
)

logging.info("This is an info message")
logging.debug("This message will be ignored")
logging.warning("This is a warning")

logging.getLogger().setLevel(logging.DEBUG)
logging.debug("This message will not be ignored anymore")

Modul `logging` standardně vypisuje všechno do `stderr` (proto to Jupyter označuje červeně). `stdout` (standardní výstup) a `stderr` (standardní chybový výstup) jsou dva datové toky, které jsou běžně používány pro interakci mezi programem a jeho vnějším prostředím. Zatímco `stdout` se obvykle používá pro běžný výstup programu, `stderr` se používá pro výpis chybových a diagnostických zpráv.

Velmi detailní a vtipný rozbor logování v Pythonu naleznete na kanále [mCoding](https://www.youtube.com/@mCoding) na YouTube ve videu nazvaném [Modern Python logging](https://www.youtube.com/watch?v=9L77QExPmI0). Následující pasáž a diagram níže je výtažkem nejdůležitějšího z onoho videa.

Logování je v pythonu rozděleno mezi několik rolí.

![Architektura logging modulu, diagram od mCoding](../../images/murphy_logging.png)

1. **logger** je hlavní objekt, se kterým interagujeme. Na něm voláme metody jako `.info` nebo `.warning`. Tím vznikají *log records*, které jsou předávány ostatním objektům k dalšímu zpracování.
2. **handler** řídí, kam se vlastně *log records* zapisují. Tím "kam" mohou být soubory, standardní výstup `stdout` nebo např. email. Každý logger může mít libovolné množství handlers (i žádný).
3. **filter** slouží k odfiltrování zpráv dle různých kritérií, např. s využitím regulárních výrazů. Filter lze definovat jak pro logger, tak pro handler, přičemž každý může mít více filterů.
4. **formatter** určuje výslednou podobu zprávy - zda obsahuje čas, v jakém formátu, kde jsou jaké závorky atd.

Klíčovým prvkem logování je samozřejmě filtrování podle **LEVEL**. Jak handler, tak loggger zpracovávají pouze zprávy vyšší nebo stejné závažnosti, jako je jejich nastavený **LEVEL**.

Kromě toho Python ve svém logging modulu uspořádává loggery do stromové hierarchie, která může být principiálně velmi komplikovaná. My si z toho zatím vezmeme jedno ponaučení:

```{tip}
Nikdy nebudeme používat *root logger*, tedy logování prostřednictvím globáních funcí jako `logging.info` apod. Zejména pokud bychom měnili chování root loggeru, mohli bychom se dočkat nepříjemné interakce s logováním ostatních modulů.

Budeme vždy vytvářet vlastní loggery pomocí metody `logging.getLogger(name)`.
```
```{note}
Logger je implementován jako singleton - to znamená, že pokud logger s názvem `name` neexistuje, funkce `getLogger` jej vytvoří. Pokud existuje, dostaneme referenci k existující instanci.
```

### Detailní nastavení

Logging lze podrobně konfigurovat pomocí slovníků. Dokumentace je v tomto ohledu mírně nepřehledná a tajemná. Ukažme si proto dva jednoduché příklady. Více příkladů s detailním výkladem najdete v zmiňovaném video z mCoding.

In [17]:
log_config = {
    "version": 1,
    "disable_existing_logger": False,
    "formatters": {
        "simple": {
            "format": "%(levelname)s: %(message)s"
        }
    },
    "handlers": {
        "stdout": {
            "class": "logging.StreamHandler",
            "level": "INFO",
            "formatter": "simple",
            "stream": "ext://sys.stdout"
        },
        "file": {
            "class": "logging.handlers.RotatingFileHandler",
            "level": "DEBUG",
            "formatter": "simple",
            "filename": "my_app.log",
            "maxBytes": 10000,
            "backupCount": 2
        }
    },
    "loggers": {
        "sample": {
            "level": "DEBUG",
            "handlers": [
                "stdout",
                "file"
            ]
        }
    }
}

In [18]:
import logging

logging.config.dictConfig(config=log_config)

logger = logging.getLogger("sample")
logger.warning("some warning")
logger.debug("some debug info")




Pokud bychom chtěli logging pouze do `stdout`, musíme nastavit loggin handler. Těch je možné i více najednou. Následující příklad loguje do `stdout` a do souboru zároveň (a ukazuje alternativní cestu, jak nastavit logování).

In [None]:
import logging
import sys

logger = logging.getLogger('my_logger')
logger.setLevel(logging.DEBUG)

# create a StreamHandler for stdout
stdout_handler = logging.StreamHandler(sys.stdout)
logger.addHandler(stdout_handler)

# Log a message
logger.info("This message will go to stdout")

```{warning}
Kniha je napsaná a kompilovaná pomocí Jupyter Book. Protože logging používá singleton a Jupyter startuje jeden kernel per notebook, je pravděpodobné, že poslední příklad se v knize stále vypíše do `stderr`. Aby to prošlo správně, je nutné v mezičase kernel restartovat.
```