# 🛰️ Stiahnutie a spracovanie Sentinel-2 dát pre Slovensko (2024)

Tento notebook demonštruje, ako spracovať terabyte satelitných dáta zo systému Sentinel-2 (konkrétne Level-2A – povrchové odrazy), bez nutnosti ich sťahovania
- vyhľadáme satelitné snímky Sentinel-2 cez Planetary Computer,
- odstránime oblačnosť a tiene pomocou masky `SCL`,
- ponecháme len RGB + NIR + SWIR pásma,
- prevzorkujeme všetko na jednotné rozlíšenie 10 m.

🎯 Územie: Slovensko  
🗓️ Obdobie: rok 2024

In [2]:
# 🔧 Najskôr nainštalujeme potrebné knižnice
# Spustite len raz v Jupyter notebooku
!pip install pystac-client stackstac planetary-computer geopandas rioxarray --quiet

In [1]:
# 📚 Importujeme knižnice
import stackstac
import pystac_client
import xarray as xr
import numpy as np
from shapely.geometry import box
import datetime
import planetary_computer

## 🗺️ Definovanie územia a časového rozsahu

Zameriame sa na celé územie Slovenska a vyberieme dáta zo Sentinel-2 za celý rok 2024.

In [2]:
# 🗓️ Nastavíme dátumový rozsah – celý rok 2024
start_date = "2024-01-01"
end_date = "2024-12-31"

# 📦 Nastavíme hranice Slovenska (v stupňoch – WGS84)
bbox = [16.83, 47.73, 22.56, 49.60]  # [západ, juh, východ, sever]

## 🔍 Vyhľadanie Sentinel-2 dát cez STAC API

Použijeme tzv. STAC katalóg – štandardizovaný spôsob, ako vyhľadávať a sťahovať satelitné dáta z cloudu.
Dáta sú hostované na AWS (Amazon Web Services).

In [3]:
# 🌍 Pripojíme sa ku katalógu Planetary Computer
catalog = pystac_client.Client.open("https://planetarycomputer.microsoft.com/api/stac/v1")

# Vyhľadáme Sentinel-2 Level-2A snímky nad Slovenskom
search = catalog.search(
    collections=["sentinel-2-l2a"],
    bbox=bbox,
    datetime=f"{start_date}/{end_date}",
    query={"eo:cloud_cover": {"lt": 80}},  # oblačnosť menej než 80 %
    max_items=500  # obmedzenie na rýchlu ukážku
)

# Autorizujeme každú položku pre použitie v Planetary Computer
items = [planetary_computer.sign(item) for item in search.items()]
print(f"Počet nájdených snímok: {len(items)}")

Počet nájdených snímok: 500


## 🎨 Výber pásiem a načítanie pomocou stackstac

Vyberieme len RGB (B02–B04), NIR (B08), SWIR (B11, B12) a SCL (klasifikácia scény pre maskovanie).

In [4]:
# Vybrané spektrálne pásma + SCL (na maskovanie)
bands = ["B02", "B03", "B04", "B08", "B11", "B12", "SCL"]

# Načítanie stacku
stack = stackstac.stack(
    items,
    assets=bands,
    resolution=10,  # všetky pásma (aj 20m) prevzorkujeme na 10m
    chunksize=1024,
    bounds_latlon=bbox,
    epsg = 32634
)
stack

Unnamed: 0,Array,Chunk
Bytes,23.53 TiB,8.00 MiB
Shape,"(500, 7, 21505, 42964)","(1, 1, 1024, 1024)"
Dask graph,3234000 chunks in 3 graph layers,3234000 chunks in 3 graph layers
Data type,float64 numpy.ndarray,float64 numpy.ndarray
"Array Chunk Bytes 23.53 TiB 8.00 MiB Shape (500, 7, 21505, 42964) (1, 1, 1024, 1024) Dask graph 3234000 chunks in 3 graph layers Data type float64 numpy.ndarray",500  1  42964  21505  7,

Unnamed: 0,Array,Chunk
Bytes,23.53 TiB,8.00 MiB
Shape,"(500, 7, 21505, 42964)","(1, 1, 1024, 1024)"
Dask graph,3234000 chunks in 3 graph layers,3234000 chunks in 3 graph layers
Data type,float64 numpy.ndarray,float64 numpy.ndarray


## ☁️ Odstránenie oblakov, tieňov a iných artefaktov pomocou masky `SCL`

In [6]:
# Funkcia na maskovanie oblakov a tieňov
def mask_clouds(ds):
    scl = ds.sel(band="SCL")
    mask = xr.where(scl.isin([3, 8, 9, 10, 11]), 0, 1)  # tiene, oblačnosť, cirrus, saturácia
    return ds.drop_sel(band="SCL") * mask

# Aplikujeme masku
masked = mask_clouds(stack)

# Zmeníme typ dát a nahradíme nulu ako NaN
masked = masked.where(masked != 0).astype("float32") * 1e-4
masked

Unnamed: 0,Array,Chunk
Bytes,10.08 TiB,4.00 MiB
Shape,"(500, 6, 21505, 42964)","(1, 1, 1024, 1024)"
Dask graph,2772000 chunks in 17 graph layers,2772000 chunks in 17 graph layers
Data type,float32 numpy.ndarray,float32 numpy.ndarray
"Array Chunk Bytes 10.08 TiB 4.00 MiB Shape (500, 6, 21505, 42964) (1, 1, 1024, 1024) Dask graph 2772000 chunks in 17 graph layers Data type float32 numpy.ndarray",500  1  42964  21505  6,

Unnamed: 0,Array,Chunk
Bytes,10.08 TiB,4.00 MiB
Shape,"(500, 6, 21505, 42964)","(1, 1, 1024, 1024)"
Dask graph,2772000 chunks in 17 graph layers,2772000 chunks in 17 graph layers
Data type,float32 numpy.ndarray,float32 numpy.ndarray


## 📊 Výpočet priemerného obrazu pre mesian september

Ako príklad vypočítame priemer všetkých snímok pre každé pásmo.

In [17]:
# 📅 Vyfiltrujeme len snímky zo september 2024
sep_masked = masked.sel(time=masked.time.dt.month == 9)

# ❗ Kontrola počtu dostupných snímok
print(f"Počet snímok v septemberi: {sep_masked.time.size}")

# 📊 Vypočítame priemer len za september
sep_mean = sep_masked.mean(dim="time", skipna=True)

# 🔍 Zobrazíme informácie o výsledku
sep_mean

Počet snímok v septemberi: 59


Unnamed: 0,Array,Chunk
Bytes,20.65 GiB,4.00 MiB
Shape,"(6, 21505, 42964)","(1, 1024, 1024)"
Dask graph,5544 chunks in 22 graph layers,5544 chunks in 22 graph layers
Data type,float32 numpy.ndarray,float32 numpy.ndarray
"Array Chunk Bytes 20.65 GiB 4.00 MiB Shape (6, 21505, 42964) (1, 1024, 1024) Dask graph 5544 chunks in 22 graph layers Data type float32 numpy.ndarray",42964  21505  6,

Unnamed: 0,Array,Chunk
Bytes,20.65 GiB,4.00 MiB
Shape,"(6, 21505, 42964)","(1, 1024, 1024)"
Dask graph,5544 chunks in 22 graph layers,5544 chunks in 22 graph layers
Data type,float32 numpy.ndarray,float32 numpy.ndarray


## ✅ Záver

V tomto notebooku sme:
- použili Planetary Computer na vyhľadanie a prístup k Sentinel-2 dátam,
- aplikovali masku na odstránenie oblakov a tieňov,
- vybrali relevantné pásma a všetko prevzorkovali na 10m,
- vypočítali priemerný obraz za rok 2024.

🎯 Tento prístup má demonštrovať ako budeme v ďaľších krokoch pracovať zo satelitnými snímkami bez nutnosti ich sťahovania a ukladania.