# Geodatenanalyse 2


## Termin 5 - Modul 1

## Was ist "big data"? Datenformate und Umgang

In [1]:
import xarray as xr
import numpy as np
import cartopy.crs as ccrs
import matplotlib.pyplot as plt
import pandas as pd

## Übung 1

Ein globaler Datensatz wurde erstellt und soll voruntersucht werden. **ACHTUNG**: Die Daten müssen unbedingt vertraulich behandelt werden! Sie können auf ILIAS herunter geladen werden (*SMBM_global_means.nc*). Die Daten stammen aus einer Publikation, welche gerade begutachtet wird:

> [Cuthbert et al. (under review) *Global climate-driven trade-offs between the water retention and cooling benefits of urban greening*](https://eartharxiv.org/repository/view/2100/)

- **Aufgabe 1**: Untersuche welch Eigenschaften (z.B., Dimensionen, Koordinaten, Variable, Attribute, etc.) der Datensatz hat. 

- **Aufgabe 2**: Wie groß ist die Auflösung eines einzelnen Pixels in Kilometer Erdoberfläche in Richtung Längengrad und Breitengrad? Warum sind die Werte unterschiedlich? Der Erdradius beträgt ca. 6.371 km.

- **Aufgabe 3**: Extrahiere den Wert der Variable *p_av* (durchschnittlicher Niederschlag) für Karlsruhe (49.0069° N, 8.4037° E).


In [11]:
# Aufgabe 1

data = xr.open_dataset('data/SMBM_global_means.nc')
print(data)

<xarray.Dataset>
Dimensions:    (latitude: 601, longitude: 1440)
Coordinates:
  * longitude  (longitude) float32 -180.0 -179.8 -179.5 ... 179.2 179.5 179.8
  * latitude   (latitude) float32 90.0 89.75 89.5 89.25 ... -59.5 -59.75 -60.0
Data variables:
    pet_av     (latitude, longitude) float64 ...
    p_cov      (latitude, longitude) float64 ...
    p_av       (latitude, longitude) float64 ...
    aet_av     (latitude, longitude) float64 ...
    Ret_av     (latitude, longitude) float64 ...
    Ret_cov    (latitude, longitude) float64 ...
Attributes:
    created:      2020-03-10T09:23:43.213265
    hostname:     9CB6D0D97E12
    script_name:  Get_ERA5__global_means.py
    username:     sbimc2


In [12]:
# Aufgabe 2

earth_radius = 6371
circumference = 2*np.pi*earth_radius

lon_res = circumference / len(data.longitude)
print(lon_res)

lat_res = circumference / len(data.latitude) / 2
print(lat_res)

27.798731661139684
33.30297303830378


In [19]:
# Aufgabe 3

ka_lat = 49.0069
ka_lon = 8.4037

lat_id = np.argmin(np.abs(data.latitude.values - ka_lat))
print(lat_id)
lon_id = np.argmin(np.abs(data.longitude.values - ka_lon))
print(lon_id)

ka_p_av = data['p_av'][lat_id, lon_id]
ka_p_av.values

164
754


array(2.34079117)

## Übung 2

Ein historischer und globaler Klimadatensatz der [Global Precipitation Climatology Centre (GPCC )](https://prism.oregonstate.edu/) soll untersucht werden. Er liegt auf dem folgenden Server:  *https://psl.noaa.gov/thredds/dodsC/Datasets/gpcc/full_v7/precip.mon.total.v7.nc*. Die Erklärung zum Datensatz ist auf der Webseite von [NOAA](https://psl.noaa.gov/data/gridded/data.gpcc.html).

- **Aufgabe 1**: Öffne den Datensatz und untersuche die Eigenschaften (z.B., Dimensionen, Koordinaten, Variable, Attribute, etc.). 

- **Aufgabe 2**: Lade eine Zeitreihe des durchschnittlichen monatlichen Niederschlags für das Gebiet von Karlsruhe herunter und spiechere diese als CSV-Datei. *ACHTUNG*: Das kann eine Weile dauern!


In [5]:
# Aufgabe 1
remote_data = xr.open_dataset(
    "https://psl.noaa.gov/thredds/dodsC/Datasets/gpcc/full_v7/precip.mon.total.v7.nc",
    decode_times = False,
)
remote_data

In [6]:
# Aufgabe 2

remote_data = xr.open_dataset(
    "https://psl.noaa.gov/thredds/dodsC/Datasets/gpcc/full_v7/precip.mon.total.v7.nc",
    decode_times = False,
)
remote_data

In [7]:
# find the right latitude and longitude locations
at_id = np.argmin(np.abs(remote_data.lat.values - 49))
lon_id = np.argmin(np.abs(remote_data.lon.values - 8.4))

# download the dataset
ka_precip = remote_data.precip.isel(lat=lat_id, lon=lon_id)
ka_precip

In [8]:
# create a Dataframe
ka_ppt_data = pd.DataFrame({'Date': pd.date_range(start='1901-01', freq='MS', periods=len(ka_precip)), 'Precipitation [mm]': ka_precip.values})

# Save the data to CSV
ka_ppt_data.to_csv('data/GPCC_Karlsruhe.csv')