# Geospatial Big Data Analytics

DSML NTUA MSc
Vasileios Depastas
AM: 03400131

## Question 1
Αφού επιλέξετε περιοχή μελέτης, αναζητήστε δεδομένα raster, vector και δεδομένα χρονοσειρών για την συγκεκριμένη περιοχή. Χρησιμοποιήστε τουλάχιστον 2 διαφορετικές πηγές, καθώς και την υπηρεσία WFS.
[ενδεικτικές βιβλιοθήκες Python]: rasterio (για τα δεδομένα raster, εικόνες, κοκ), geopandas (δεδομένα vector, σημεία, πολύγωνα, κοκ και WFS υπηρεσία μεταμόρφωσης), pandas (εισαγωγή flat αρχείων)
[ενδεικτικά βήματα]:
✓ Πραγματοποιήστε λήψη διαχρονικών δεδομένων Sentinel-2 που απεικονίζουν την ευρύτερη περιοχή της Καστοριάς (https://pithos.okeanos.grnet.gr/public/fBSNLJeNxerluMj2MVDqF). Παρατηρήστε το συνοδευτικό PDF της εικόνας και τις αντιστοιχίες καναλιών και ημερομηνιών.
✓ Δημιουργήστε ένα vector αρχείο (π.χ GeoJSON, ESRI Shapefile) μέσω QGIS ή και στο geojson.io (https://geojson.io/) με την περιοχή μελέτης (πολύγωνο) πάνω στα δεδομένα Sentinel-2 της Καστοριάς και πραγματοποιήστε εισαγωγή του στην Python.
✓ Κάντε λήψη χρονοσειράς μετεωρολογικών δεδομένων από το portal της NASA (https://power.larc.nasa.gov/data-access-viewer/) για ένα σημείο εντός της περιοχής μελέτης και εισάγετε τα δεδομένα στην Python.
✓ Αναζητήστε τη WFS υπηρεσία για το Corine Land Cover 2018 και εισάγετε τα δεδομένα σας.

## Question 2

Sentinel 2 data loading from the broader Katoria region in Greece (<a href="https://pithos.okeanos.grnet.gr/public/fBSNLJeNxerluMj2MVDqF">Link to download data</a>). According to the pdf accompanying the data, there are two `.tif` large files:
- `Kastoria.tif`: 24 raster images spanning from 25-01-2016 until 30-12-2016 (corresponding doy range: 25 - 365) with 10 bands per image. This results in a spectro-temporal cube of dimension 240 x 2017 x 2281.
- `Kast_RefData_26Classes.tif`: image with 26 class codes for different land usages classification.

In [1]:
# imports
import os
import rasterio

In [2]:
# constants
KASTORIA_DATA_PATH = '/Kastoria/Kastoria.tif/'

In [7]:
full_kastoria_tiff_path = os.getcwd() + KASTORIA_DATA_PATH # combine current working directory with KASTORIA_DATA_PATH

# open Kastoria.tif dataset of 240 images (24 images with 10 bands each = 240)
with rasterio.open(fp=full_kastoria_tiff_path, mode='r') as kastoria_tif:
    print(f'The Kastoria dataset: {kastoria_tif}')
    print(f'Dataset shape: {kastoria_tif.read().shape}')

    bands_dtypes = set()
    nodatavalues = 0
    for i, dtype, nodataval in zip(kastoria_tif.indexes, kastoria_tif.dtypes, kastoria_tif.nodatavals):
        bands_dtypes.add(dtype) # add dtype element if not already in set
        if not nodataval: nodataval = 0
        nodatavalues += nodataval # sum of number of no data values
    print(f'The data types of the bands are: {bands_dtypes}')
    print(f'There are {nodatavalues} no data values in the dataset')

The Kastoria dataset: <open DatasetReader name='C:/Users/User/Downloads/DSML MsC/2nd semester/Γεωχωρικα/Geospatial_Lab Exercises/Lab02/Kastoria/Kastoria.tif' mode='r'>
Dataset shape: (240, 2017, 2281)
The data types of the bands are: {'float32'}
There are 0 no data values in the dataset


In [8]:
with rasterio.open(fp=full_kastoria_tiff_path, mode='r') as kastoria_tif:
    img1 = kastoria_tif.read(240) # get the last image of the dataset

In [9]:
img1

array([[0.5021895 , 0.49184346, 0.49501204, ..., 0.33218345, 0.3101828 ,
        0.24442597],
       [0.59707993, 0.5894163 , 0.53658056, ..., 0.3066161 , 0.2654999 ,
        0.25338012],
       [0.54432225, 0.5634399 , 0.47678217, ..., 0.23632368, 0.27445713,
        0.38671494],
       ...,
       [0.62269396, 0.6333919 , 0.62778646, ..., 0.63925993, 0.64900243,
        0.70858073],
       [0.6396357 , 0.6465692 , 0.6525834 , ..., 0.6252223 , 0.6468441 ,
        0.6601583 ],
       [0.6325571 , 0.6174326 , 0.6066973 , ..., 0.6199472 , 0.6577537 ,
        0.6858217 ]], dtype=float32)

## Question 3
Υλοποιήστε και εξασκηθείτε με διάφορα χωρικά ερωτήματα και πράξεις με την βοήθεια της βιβλιοθήκης Geopandas στα vector δεδομένα σας. Δημιουργήστε στατικούς χάρτες με αυτά. Παρουσιάστε γραφήματα της χρονοσειράς δεδομένων.
[ενδεικτικές βιβλιοθήκες Python]: geopandas, pandas, matplotlib
[ενδεικτικά βήματα ερωτήματος]:
✓ Κατεβάστε vector δεδομένα από το https://geodata.gov.gr/, όπως διοικητικά όρια νομών, σιδηροδρομικό δίκτυο, τοποθεσίες νοσοκομείων κλπ.
✓ Χρησιμοποιήστε την βιβλιοθήκη geopandas για υλοποίηση χωρικών ερωτημάτων (όπως within, intersect, buffer, spatial join)
✓ Πραγματοποιήστε εξαγωγή από τη WFS υπηρεσία για το Corine Land Cover 2018 και τα δεδομένα που αφορούν την περιοχή μελέτης κλπ.
✓ Στατικοί χάρτες 1) Corine Land Cover στη περιοχή μελέτης, 2) του πολυγώνου της περιοχής μελέτης καθώς και 3) του σημείου των μετεωρολογικών δεδομένων κλπ.
✓ Γραφήματα με την εξέλιξη μετεωρολογικών μεταβλητών (πχ θερμοκρασία, υγρασία, κα) στον χρόνο.

In [None]:
#import pandas, matplotlib, geopandas