<a href="https://colab.research.google.com/github/hrbolek/learning/blob/master/notebooks/introduction/python_programming.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Python

## Základ: číselné výpočty a pole

- **NumPy** — základní n-rozměrná pole, vektorizace, lineární algebra, náhodná čísla.
Kdy: všude; většina knihoven na něm stojí.

- **SciPy** — „švýcarák“ pro vědu: optimize, integrate, signal, fft, linalg, sparse, interpolate, stats.
Kdy: řešení ODE, optimalizace, filtrace, speciální funkce.

- **CuPy** — NumPy-like API na GPU (CUDA).
Kdy: velká pole/FFT/LA na NVIDIA GPU bez přepisování kódu.

- **JAX** — NumPy API + auto-diferenciace, JIT kompilace (XLA) na CPU/GPU/TPU.
Kdy: diferenciovatelné simulace, ML, optimalizace.

## Data tabulková, mřížová a IO

- **pandas** — tabulky, groupby, spojování, časové řady.
Kdy: analýzy, ETL, agregace.

- **xarray** — n-rozměrná pole s pojmenovanými osami (čas, šířka, výška…), skvělé pro vědy o Zemi a mřížová data.
Kdy: netCDF, zpracování klimatických/meteorologických polí.

- **h5py**, **netCDF4**, **Zarr** — formáty velkých dat (HDF5/netCDF/Zarr), lazy-loading, chunking.

- **Polars** — rychlé DataFrame (Rust backend).
Kdy: větší tabulky, výkon nad pandas.

## Vizualizace

- **Matplotlib** — základní 2D/3D grafy; nízkoúrovňový a všudypřítomný.

- **Seaborn** — statistická vizualizace na Matplotlibu (distribuce, relace).

- **Plotly**, **Bokeh**, **Altair** — interaktivní grafy do notebooku i webu.

- **PyVista**/**Mayavi** — 3D vědecká vizualizace (mřížky, objemy, isoplochy).

- **py3Dmol**, **nglview** — molekulární 3D vizualizace (chemie/MD).

## Optimalizace, statistika, pravděpodobnost

- **SciPy.optimize** — nelineární optimalizace, fitování.

- **CVXPY** — konvexní programování, sdružené solvery (SCS, ECOS, OSQP, GUROBI…).

- **Pyomo** — obecné matematické programování (LP/QP/MIP/NLP) s externími solvery.

- **statsmodels** — klasická statistika, GLM, časové řady (ARIMA), inference.

- **Pingouin** — rychlé statistiky (t-testy, ANOVA, korelace) s hezkým API.

- **PyMC**, **NumPyro**, **Stan** (CmdStanPy) — bayesovské modelování, MCMC/VI.

## Strojové učení a autodiferenciace

- **scikit-learn** — klasické ML (regrese, klasifikace, clustering, model selection).

- **PyTorch**, **TensorFlow**/**Keras** — deep learning, automatická diferenciace, GPU.

- **JAX** + **Flax**/**Haiku** — moderní DL stack s JIT a vektorizací.

## Symbolika, CAS, přesné výpočty

- **SymPy** — symbolická matematika (algebra, rovnice, derivace, integrály), physics moduly (mechanika, kvantovka), Beam pro nosníky.

- **mpmath** — libovolná přesnost, speciální funkce (čistě numericky).

## Diferenciální rovnice a kontrola

- **SciPy.integrate** — ODE/PDE prototypování (odeint/solve_ivp).

##DifferentialEq ekosystémy v Pythonu:

- **Diffrax** (na JAX) — vysoce výkonné ODE/SDE se sazebníky a adjointy.

- **torchdiffeq** — ODE v PyTorch (diferenciovatelné).

- **python-control** — klasická teorie řízení (LTI, Bode, Nyquist, kořenové lokusy).

## Signál, obraz, časové řady

- **SciPy.signal** — filtry, spektrum, konvoluce, STFT.

- **scikit-image** — zpracování obrazu (segmentace, filtry, feature engineering).

- **OpenCV** — počítačové vidění, rychlé C++ jádro, IO videa.

- **tsfresh**, **sktime** — feature extrakce a ML nad časovými řadami.

## Geovědy, mapy, GIS

- **GeoPandas** — geoprostorové DataFrame (shapely, fiona, PROJ).

- **Rasterio**, **rioxarray** — rastry (GeoTIFF), práce s projekcemi.

- **PyProj** — transformace souřadnic, datumy.

- **PyKrige**, **verde** — geostatistika, kriging, gridding.

## Chemie, fyzika, materiály a MD

- **ASE** (Atomic Simulation Environment) — stavba buněk, interfacing k DFT kódům, IO.

- **pymatgen** — materiálová věda, krystalografie, phase diagrams.

- **OpenMM** — molekulová dynamika na CPU/GPU, snadné skriptování v Pythonu.

- **MDAnalysis**, **MDTraj** — analýza trajektorií MD.

- **RDKit**, **Open Babel** — cheminformatika (SMILES, 2D/3D, deskriptory).

- **Psi4**, **PySCF** — kvantová chemie (HF/DFT/post-HF).

- **Astropy** — astronomie (čas, souřadnice, FITS, jednotky).

## Numerická lineární algebra, řídké matice, PDE/FEM

- **SciPy.sparse** — řídké matice, iterativní řešiče.

- **PETSc** for Python (petsc4py) — škálovatelné řešiče LA/PDE na HPC.

- **FEniCS**, **Firedrake**, **SfePy** — FEM pro PDE (slabé formulace, mesh, BC).

- **PyAMG** — algebraické multigridy.

## Zrychlení, paralelizace a škálování

- **Numba** — JIT kompilace (LLVM) pro NumPy-like kód, včetně paralelu a CUDA.

- **Cython** — statické typování + C rozšíření pro kritické smyčky.

- **multiprocessing**, **concurrent.futures**, **joblib** — lokální paralelizace.

- **Dask** — škálování nad NumPy/pandas/xarray (lokálně i cluster), lazy graf.

- **Ray** — distribuované tasky/aktory, škálovatelné ML a simulace.

- **mpi4py** — MPI pro HPC klastry.

## Jednotky, fyzikální konstanty, metadata

- **pint**, **unyt** — fyzikální jednotky s kontrolou dimenzí.

- **scipy.constants**, **astropy.constants** — standardní konstanty (SI, astronomické).

## Reprodukovatelnost, testy, dokumentace

- **conda**/**mamba**, **Poetry**, **pip-tools** — správa prostředí a závislostí.

- **pytest**, **hypothesis** — testování a property-based tests.

- **Sphinx**, **mkdocs** — dokumentace s napojením na docstringy a příklady.

- **Jupyter**, **Jupytext**, **nbclient** — notebooky, skript/notebook dualita, CI běhy.

# Základy programování v Pythonu

In [4]:
import sys
print(sys.version)

7.34.0
3.12.12 (main, Oct 10 2025, 08:52:57) [GCC 11.4.0]


Alternativa k tomuto průvodci je dostupná ve formě videa (anglicky) **[zde](https://youtu.be/dT_XDTarsjw?t=45)**, dokument si můžete otevřít **[zde](https://colab.research.google.com/drive/19QLO7-6Uu5PSRKZuSbpVzXzsdUcvyvPI)**.

Stejný autor zpracoval i úvod do Pandas a Numpy **[video](https://www.youtube.com/watch?v=oxEak3HHUOM)** a **[dokument](https://colab.research.google.com/drive/1YgT8zlXjsPmGRAHfAa0GiVgs6WzZxPap)**.

## Jednoduché datové struktury

In [None]:
# cele cislo
a = 4
print(a)

4


In [None]:
# desetinne cislo
b = 1.4
print(b)

1.4


In [None]:
# textovy retezec
cstr = "Ahoj"
print(cstr)
dstr = 'Nazdar'
print(dstr)

Ahoj
Nazdar


In [None]:
# logicka promenna
cbool = True
dbool = False
print(cbool)
print(dbool)

True
False


### Operátory

In [None]:
# plus
print('soucet cisel', a + b)
print('soucet retezcu', cstr + ' ' + dstr)

soucet cisel 5.4
soucet retezcu Ahoj Nazdar


In [None]:
# minus
print('rozdil cisel', a - b)

rozdil cisel 2.6


In [None]:
# krat
print('soucin', a * b)
print('=' * 30)

soucin 5.6


In [None]:
# deleni
print('podil', a / b)

podil 2.857142857142857


In [None]:
print('podil', a / 2)
print('celociselny podil', a // 2)

podil 2.0
celociselny podil 2


In [None]:
# zbytek
print('zbytek po deleni', a % 3)

zbytek po deleni 1


## Složené datové struktury

In [None]:
# list / vektor
e = [1, 2, 3]
print(e)
f = ['Nazdar', "svete"]
print(f)

[1, 2, 3]
['Nazdar', 'svete']


In [None]:
# dictionary
g = {'name': 'Josef', 'age': 5}
print(g)
print(g['name'])

{'name': 'Josef', 'age': 5}
Josef


In [None]:
e = [1, 2, 3]
print(e)

# tuple
et = (1, 2, 3)
print(et)

[1, 2, 3]
(1, 2, 3)


In [None]:
# tridy
# jsou ponekud komplexnejsi

In [None]:
# kombinace
e = [1, 2, 3]
gx = {'name': 'Josef', 'age': 5, 'indexes': e}
print(gx)

{'name': 'Josef', 'age': 5, 'indexes': [1, 2, 3]}


In [None]:
ex = [{'name': 'Josef', 'age': 5}, {'name': 'Petr', 'age': 4}, {'name': 'Jan', 'age': 6}]
print(ex)

[{'name': 'Josef', 'age': 5}, {'name': 'Petr', 'age': 4}, {'name': 'Jan', 'age': 6}]


### Operátory

In [None]:
e = [1, 2, 3]
print(e + [4])

[1, 2, 3, 4]


In [None]:
print(e * 4)

[1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3]


In [None]:
# operator rozvinuti
print(*e)

1 2 3


In [None]:
e = [1, 2, 3]
print(e + [4])
print([*e, 4])

[1, 2, 3, 4]
[1, 2, 3, 4]


In [None]:
# dictionary
g = {'name': 'Josef', 'age': 5}
g2 = {**g, 'value': 12}
print(g2)

{'name': 'Josef', 'age': 5, 'value': 12}


## JSON

In [None]:
import uuid
for i in range(10):
    print(f'{uuid.uuid1()}')

3f1e7720-561a-11ee-9e47-0242ac140004
3f1e8152-561a-11ee-9e47-0242ac140004
3f1e81b6-561a-11ee-9e47-0242ac140004
3f1e81f2-561a-11ee-9e47-0242ac140004
3f1e8224-561a-11ee-9e47-0242ac140004
3f1e824c-561a-11ee-9e47-0242ac140004
3f1e8274-561a-11ee-9e47-0242ac140004
3f1e829c-561a-11ee-9e47-0242ac140004
3f1e82c4-561a-11ee-9e47-0242ac140004
3f1e82ec-561a-11ee-9e47-0242ac140004


In [None]:
data = {
    "users": [
        {"id": "3f1e7720-561a-11ee-9e47-0242ac140004"},
        {"id": "3f1e8152-561a-11ee-9e47-0242ac140004"}
    ],
    "groups": [
        {"id": "3f1e81b6-561a-11ee-9e47-0242ac140004", "name": "G1"},
        {"id": "3f1e81f2-561a-11ee-9e47-0242ac140004", "name": "G2"}
    ]

}

In [None]:
import json
with open("./data.json", "w") as jf:
    json.dump(data, jf)

In [None]:
with open("./data.json", "r") as jf:
    data2 = json.load(jf)
print(data2)

{'users': [{'id': '3f1e7720-561a-11ee-9e47-0242ac140004'}, {'id': '3f1e8152-561a-11ee-9e47-0242ac140004'}], 'groups': [{'id': '3f1e81b6-561a-11ee-9e47-0242ac140004', 'name': 'G1'}, {'id': '3f1e81f2-561a-11ee-9e47-0242ac140004', 'name': 'G2'}]}


## Třídy

### Dataclasses

`dataclasses` je modul v Pythonu (od verze 3.7), který pomocí dekorátoru `@dataclass` výrazně zjednodušuje psaní tříd nesoucích data: automaticky vygeneruje metody jako `__init__`, `__repr__`, `__eq__` a volitelně i porovnávání `(order=True)`, podporuje neměnné objekty `(frozen=True)`, úsporné uložení atributů `(slots=True)`, výchozí hodnoty a “default factory” přes `field(default=..., default_factory=...)`, i validace/konverze typů při použití type hints. K dispozici jsou i utility asdict/astuple pro převod na běžné struktury a replace pro vytvoření modifikované kopie. Dataclasses tak nahrazují boilerplate běžný u “POJO”/“DTO” tříd a udržují kód čitelný a typově jasný.

In [5]:
import dataclasses

@dataclasses.dataclass
class User:
    name: str
    familyname: str

u = User(name="John", familyname="Newbie")
print(u)
print(u.name)
u.name = "Julia"
print(u)

User(name='John', familyname='Newbie')
John
User(name='Julia', familyname='Newbie')


## Soubory

## Řídící struktury

### Podmínky

In [None]:
# if
b = 1.4
if b < 2:
  print(b, ' < 2')
else:
  print(b, '>= 2')

1.4  < 2


In [None]:
# "multi" if
b = 1.4
if b < 1:
  print(b, ' < 1')
elif b < 2:
  print(b, ' < 2')
else:
  print(b, '>= 2')

1.4  < 2


### Cykly

In [None]:
# for
data = [1, 2, 3, 4]
for item in data:
  print(item)

1
2
3
4


In [None]:
# for s indexem, porovnej s predchazejicim
for index, item in enumerate(data):
  print(index, item)

0 1
1 2
2 3
3 4


In [None]:
# https://docs.python.org/3/reference/compound_stmts.html?highlight=while#the-while-statement
# while
item = 0
while item < 3:
  item = item + 1
  print(item)

1
2
3


In [None]:
# while with break
item = 0
while True:
  item = item + 1
  print(item)
  if item >= 3:
    break


1
2
3


## Funkce

In [None]:
def secti(x, y):
    return x + y

p = 2
q = 3
print(secti(p, q))

pstr = '2'
qstr = '3'
print(secti(pstr, qstr)) # scitani textu

5
23


### Lambda

In [None]:
secti = lambda x, y: x + y

p = 2
q = 3
print(secti(p, q))

pstr = '2'
qstr = '3'
print(secti(pstr, qstr)) # scitani textu

5
23
