<a href="https://colab.research.google.com/github/costpetrides/Air-pollution-COVID-19-impact/blob/main/Untitled746.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [2]:
pip install pykrige



In [None]:
import numpy as np
import pandas as pd
import xarray as xr
from scipy.spatial import cKDTree
from pykrige.ok import OrdinaryKriging
import matplotlib.pyplot as plt
import matplotlib.colors as mcolors

# --- Φόρτωση και προεπεξεργασία δεδομένων ---
# Φόρτωση δεδομένων από το αρχείο NetCDF του μοντέλου
model_data = xr.open_dataset('/content/BaseCase_PERT_PM25_rh50_YEARLY.nc')

# Λήψη των συντεταγμένων του μοντέλου και των τιμών PM2.5
model_lons = model_data['lon'].values
model_lats = model_data['lat'].values
model_values = model_data['SURF_ug_PM25_rh50'].values[0]  # Επιλέγουμε τη χρονική στιγμή (το 0 για τον χρόνο)

# Φόρτωση των σταθμών δεδομένων
data = pd.read_csv('basePM25nearest_grid.csv')

# Αφαίρεση NaN τιμών για αποφυγή σφαλμάτων
stations_data = data[['lon', 'lat', 'SURF_ug_PM25_rh50']].dropna().copy()
grid_data = data[['nearest_grid_lon', 'nearest_grid_lat', 'nearest_SURF_ug_PM25_rh50']].dropna().copy()

# Δημιουργία KDTree για γρήγορη εύρεση γειτόνων
grid_coords = grid_data[['nearest_grid_lon', 'nearest_grid_lat']].values
grid_tree = cKDTree(grid_coords)
station_coords = stations_data[['lon', 'lat']].values

distances, indices = grid_tree.query(station_coords, k=1)

# Αντιστοίχιση τιμών ρύπανσης στους σταθμούς
stations_data.loc[:, 'nearest_SURF_ug_PM25_rh50'] = grid_data.iloc[indices.flatten()]['nearest_SURF_ug_PM25_rh50'].values

# --- Υπολογισμός Bias (Διαφορά) ---
stations_data['bias'] = stations_data['SURF_ug_PM25_rh50'] - stations_data['nearest_SURF_ug_PM25_rh50']

# --- Επιλογή βέλτιστου μοντέλου Kriging ---
def best_kriging_model(lon, lat, values):
    models = ['spherical', 'linear', 'exponential', 'gaussian']
    best_model = 'spherical'
    best_score = float('inf')

    for model in models:
        try:
            OK = OrdinaryKriging(lon, lat, values, variogram_model=model, verbose=False, enable_plotting=False)
            _, error = OK.execute('grid', np.linspace(lon.min(), lon.max(), 10), np.linspace(lat.min(), lat.max(), 10))
            score = np.mean(error)
            if score < best_score:
                best_score = score
                best_model = model
        except:
            continue

    return best_model

best_model = best_kriging_model(stations_data['lon'].values, stations_data['lat'].values, stations_data['bias'].values)

# --- Kriging της Bias ---
OK_bias = OrdinaryKriging(
    stations_data['lon'].values,
    stations_data['lat'].values,
    stations_data['bias'].values,  # Χρησιμοποιούμε τη bias αντί για το μοντέλο
    variogram_model=best_model,
    verbose=False,
    enable_plotting=False
)

# Δημιουργία πλέγματος για την παρεμβολή
gridx = model_lons
gridy = model_lats

# Παρεμβολή της bias σε όλο το πλέγμα
z_bias, ss_bias = OK_bias.execute('grid', gridx, gridy)

# --- Διόρθωση Bias στο Μοντέλο ---
# Προσθήκη της bias στις τιμές του μοντέλου
corrected_values = model_values + z_bias

# Δημιουργία του νέου διορθωμένου NetCDF αρχείου
corrected_data = model_data.copy()

# Δημιουργία νέας μεταβλητής με τις διορθωμένες τιμές
corrected_data['SURF_ug_PM25_rh50_corrected'] = (['time', 'lat', 'lon'], corrected_values[np.newaxis, :, :])

# Αποθήκευση του διορθωμένου αρχείου
corrected_data.to_netcdf('BaseCase_PERT_PM25_rh50_YEARLY_corrected.nc')

# --- Οπτικοποίηση ---
fig, ax = plt.subplots(1, 2, figsize=(14, 6))

# Οπτικοποίηση του διορθωμένου μοντέλου
norm = mcolors.LogNorm(vmin=1, vmax=1000)

# Kriging Διόρθωση
c1 = ax[0].pcolormesh(gridx, gridy, corrected_values[0], cmap='plasma', shading='auto', norm=norm)
plt.colorbar(c1, ax=ax[0], label='Corrected PM2.5 Concentration')
ax[0].set_title(f'Corrected Kriging Interpolation ({best_model} model)')
ax[0].set_xlabel('Longitude')
ax[0].set_ylabel('Latitude')

plt.tight_layout()
plt.show()

# France

In [None]:
import numpy as np
import pandas as pd
import xarray as xr
from scipy.spatial import cKDTree
from pykrige.ok import OrdinaryKriging
import matplotlib.pyplot as plt
import matplotlib.colors as mcolors

# --- Φόρτωση και προεπεξεργασία δεδομένων ---
print("[10%] Φόρτωση δεδομένων...")

# Φόρτωση δεδομένων από το αρχείο NetCDF του μοντέλου
model_data = xr.open_dataset('/content/BaseCase_PERT_PM25_rh50_YEARLY.nc')

# Λήψη των συντεταγμένων του μοντέλου και των τιμών PM2.5
model_lons = model_data['lon'].values
model_lats = model_data['lat'].values
model_values = model_data['SURF_ug_PM25_rh50'].values[0]  # Επιλέγουμε τη χρονική στιγμή (το 0 για τον χρόνο)

# Φόρτωση των σταθμών δεδομένων
data = pd.read_csv('basePM25nearest_grid.csv')

# Αφαίρεση NaN τιμών για αποφυγή σφαλμάτων
stations_data = data[['lon', 'lat', 'SURF_ug_PM25_rh50']].dropna().copy()

print("[20%] Φιλτράρισμα δεδομένων για τη Γαλλία...")

# Γεωγραφικά όρια της Γαλλίας
france_lon_min, france_lon_max = -5, 10  # Περίπου longitudes της Γαλλίας
france_lat_min, france_lat_max = 41, 51  # Περίπου latitudes της Γαλλίας

# Φιλτράρουμε μόνο τα δεδομένα εντός της Γαλλίας
stations_data = stations_data[
    (stations_data['lon'] >= france_lon_min) & (stations_data['lon'] <= france_lon_max) &
    (stations_data['lat'] >= france_lat_min) & (stations_data['lat'] <= france_lat_max)
].copy()

print("[30%] Δημιουργία KDTree...")

# Δημιουργία KDTree για γρήγορη εύρεση γειτόνων
grid_data = data[['nearest_grid_lon', 'nearest_grid_lat', 'nearest_SURF_ug_PM25_rh50']].dropna().copy()
grid_coords = grid_data[['nearest_grid_lon', 'nearest_grid_lat']].values
grid_tree = cKDTree(grid_coords)
station_coords = stations_data[['lon', 'lat']].values

distances, indices = grid_tree.query(station_coords, k=1)

# Αντιστοίχιση τιμών ρύπανσης στους σταθμούς
stations_data.loc[:, 'nearest_SURF_ug_PM25_rh50'] = grid_data.iloc[indices.flatten()]['nearest_SURF_ug_PM25_rh50'].values

# --- Υπολογισμός Bias (Διαφορά) ---
print("[40%] Υπολογισμός Bias...")
stations_data['bias'] = stations_data['SURF_ug_PM25_rh50'] - stations_data['nearest_SURF_ug_PM25_rh50']

# --- Kriging της Bias ---
print("[50%] Εκτέλεση Kriging...")
OK_bias = OrdinaryKriging(
    stations_data['lon'].values,
    stations_data['lat'].values,
    stations_data['bias'].values,  # Χρησιμοποιούμε τη bias αντί για το μοντέλο
    variogram_model='spherical',
    verbose=False,
    enable_plotting=False
)

# Παρεμβολή της bias σε όλο το πλέγμα
print("[70%] Παρεμβολή δεδομένων...")
z_bias, ss_bias = OK_bias.execute('grid', model_lons, model_lats)

# --- Διόρθωση Bias στο Μοντέλο ---
print("[80%] Διόρθωση τιμών...")
corrected_values = model_values + z_bias

# Δημιουργία του νέου διορθωμένου NetCDF αρχείου
corrected_data = model_data.copy()
corrected_data['SURF_ug_PM25_rh50_corrected'] = (['time', 'lat', 'lon'], corrected_values[np.newaxis, :, :])
corrected_data.to_netcdf('BaseCase_PERT_PM25_rh50_YEARLY_corrected.nc')

# --- Οπτικοποίηση ---
print("[90%] Δημιουργία γραφήματος...")
fig, ax = plt.subplots(figsize=(8, 6))
norm = mcolors.LogNorm(vmin=1, vmax=1000)
c = ax.pcolormesh(model_lons, model_lats, corrected_values[0], cmap='plasma', shading='auto', norm=norm)
plt.colorbar(c, ax=ax, label='Corrected PM2.5 Concentration')
ax.set_title(f'Corrected Kriging Interpolation for France')
ax.set_xlabel('Longitude')
ax.set_ylabel('Latitude')
plt.show()

print("[100%] Ολοκληρώθηκε!")


[10%] Φόρτωση δεδομένων...
[20%] Φιλτράρισμα δεδομένων για τη Γαλλία...
[30%] Δημιουργία KDTree...
[40%] Υπολογισμός Bias...
[50%] Εκτέλεση Kriging...
[70%] Παρεμβολή δεδομένων...
