### Albeno effekt
---
Vi har idendifisert **EUMETSAT**, The European Organisation for the Exploitation of Meteorological Satellites som en relevant kilde med høy **kildeautoritet, datakvalitet tilgjenglighet og brukervennlighet**. 

EUMETSAT:
- Er en velkjent organisasjon og leverer presise data til nasjonale metrologiske institutt. (**Kildeautoritet**)
- De har tilhørende feilmarginer til vær enkel data i vært eneste dataset. Målingene er basert på 1 måneds historikk som gjør dataen mer pålitelig. (**Datakvalitet**)
- De har egne dokumenter for bruk og følger standarisert dataformar som de aller fleste metroloiske institutt.
 (**Tilgjenglighet**)
- Dataformatet NETCDF4 gir stor frihet i bruk. (**Brukervennlighet**)

#### Kode 1
**Kommentarer:**

I koden nedenfor  bruker vi intigrerte pyton bibloteker og request. 

Vi har laget en bruker på EUMETSAT som student og bruker username og passord for å sende en HTTP-forespørsel/API-forespørsel for få tilgang til data

Filene som lastes ned blir så plassert i felles data-folderen "data" og inn i egen albedo_effekt_data folder. Dette gjør vi for å ha fil- og katalogadministrasjon.


In [None]:
import os
import requests
from datetime import datetime, timedelta
from requests.auth import HTTPBasicAuth

# Brukernavn og passord for autentisering
username = 'matsgulbrandsen'
password = 'V2.ShXbmWRZ!S9a'

# Start- og sluttdato
start_date = datetime(2004, 6, 25)  # 4 dager etter sommersolverv, 
end_date = datetime(2024, 6, 25)    # 21. juni siden det er dette EUMETSAT tilbyr

# Base URL
base_url = "https://datalsasaf.lsasvcs.ipma.pt/PRODUCTS/MSG/MDALv2/NETCDF"

# Sett download_folder til å lagre filene i data-mappen
download_folder = os.path.join("..", "data", "netcdf_downloads")
os.makedirs(download_folder, exist_ok=True)

# Funksjon for å laste ned filene
def download_file(current_date):
    # Formatter datoene riktig
    date_path = current_date.strftime("%Y/%m/%d")  # gjør om dato til tekst Eks: 2004/06/21
    date_filename = current_date.strftime("%Y%m%d0000")  #-||- Eks: 200406210000

    # Full URL til filen
    file_url = f"{base_url}/{date_path}/NETCDF4_LSASAF_MSG_ALBEDOv2_MSG-Disk_{date_filename}.nc"

    # Lokalt filnavn
    file_name = f"NETCDF4_LSASAF_MSG_ALBEDOv2_MSG-Disk_{date_filename}.nc"
    file_path = os.path.join(download_folder, file_name)

    try:
        # Bruker Basic Authentication for å laste ned filen
        response = requests.get(file_url, auth=HTTPBasicAuth(username, password))

        if response.status_code == 200:
            with open(file_path, "wb") as file:
                file.write(response.content)
            print(f"Lastet ned: {file_name}")
        else:
            print(f"Feil {response.status_code}: Kan ikke laste ned {file_url}")

    except requests.exceptions.RequestException as e:
        print(f"Feil ved nedlasting: {e}")

# Last ned filer én etter én
current_date = start_date
while current_date <= end_date:
    download_file(current_date)  # Kall funksjonen direkte uten parallellitet
    current_date = current_date.replace(year=current_date.year + 1) # Laster ned årlige filer


print("Alle tilgjengelige filer er forsøkt lastet ned.")

In [None]:
import os
import requests
from datetime import datetime, timedelta
from requests.auth import HTTPBasicAuth

# Brukernavn og passord for autentisering
username = 'matsgulbrandsen'
password = 'V2.ShXbmWRZ!S9a'

# Start- og sluttdato
start_date = datetime(2004, 6, 25)  # 25. juni er 4 dager etter sommersolverv
end_date = datetime(2024, 6, 25)

# Felles Base URL for albedo effekt data
base_url = "https://datalsasaf.lsasvcs.ipma.pt/PRODUCTS/MSG/MTALv2/NETCDF"

# Sett download_folder til å lagre filene i albedo_effekt_data-mappen
download_folder = os.path.join("..", "data", "albedo_effekt_data")
os.makedirs(download_folder, exist_ok=True)

# Funksjon for å laste ned filene
def download_file(current_date):
    # Formatter datoene riktig
    date_path = current_date.strftime("%Y/%m/%d")  # Eks: 2004/06/25
    date_filename = current_date.strftime("%Y%m%d0000")  # Eks: 200406250000

    # Full URL til filen
    file_url = f"{base_url}/{date_path}/NETCDF4_LSASAF_MSG_ALBEDO-D10v2_MSG-Disk_{date_filename}.nc"

    # Lokalt filnavn
    file_name = f"NETCDF4_LSASAF_MSG_ALBEDO-D10v2_MSG-Disk_{date_filename}.nc"
    file_path = os.path.join(download_folder, file_name)

    try:
        # Bruker Basic Authentication for å laste ned filen
        response = requests.get(file_url, auth=HTTPBasicAuth(username, password))

        if response.status_code == 200:
            with open(file_path, "wb") as file:
                file.write(response.content)
            print(f"Lastet ned: {file_name}")
        else:
            print(f"Feil {response.status_code}: Kan ikke laste ned {file_url}")

    except requests.exceptions.RequestException as e:
        print(f"Feil ved nedlasting: {e}")

# Last ned filer én etter én (årlig nedlasting)
current_date = start_date
while current_date <= end_date:
    download_file(current_date)
    current_date = current_date.replace(year=current_date.year + 1)

print("Alle tilgjengelige filer er forsøkt lastet ned.")


Lastet ned: NETCDF4_LSASAF_MSG_ALBEDO-D10v2_MSG-Disk_200406250000.nc
Lastet ned: NETCDF4_LSASAF_MSG_ALBEDO-D10v2_MSG-Disk_200506250000.nc
Lastet ned: NETCDF4_LSASAF_MSG_ALBEDO-D10v2_MSG-Disk_200606250000.nc
Lastet ned: NETCDF4_LSASAF_MSG_ALBEDO-D10v2_MSG-Disk_200706250000.nc
Lastet ned: NETCDF4_LSASAF_MSG_ALBEDO-D10v2_MSG-Disk_200806250000.nc
Lastet ned: NETCDF4_LSASAF_MSG_ALBEDO-D10v2_MSG-Disk_200906250000.nc
Lastet ned: NETCDF4_LSASAF_MSG_ALBEDO-D10v2_MSG-Disk_201006250000.nc
Lastet ned: NETCDF4_LSASAF_MSG_ALBEDO-D10v2_MSG-Disk_201106250000.nc
Lastet ned: NETCDF4_LSASAF_MSG_ALBEDO-D10v2_MSG-Disk_201206250000.nc
Lastet ned: NETCDF4_LSASAF_MSG_ALBEDO-D10v2_MSG-Disk_201306250000.nc
Lastet ned: NETCDF4_LSASAF_MSG_ALBEDO-D10v2_MSG-Disk_201406250000.nc
Lastet ned: NETCDF4_LSASAF_MSG_ALBEDO-D10v2_MSG-Disk_201506250000.nc
Lastet ned: NETCDF4_LSASAF_MSG_ALBEDO-D10v2_MSG-Disk_201606250000.nc
Lastet ned: NETCDF4_LSASAF_MSG_ALBEDO-D10v2_MSG-Disk_201706250000.nc
Lastet ned: NETCDF4_LSASAF_MSG_ALB

---
### Utforskning av data

### Kode 2
Åpner dataen og ser på hvilke variabler den inneholder

### Konklusjon av data

Dataen har 3 dimmensjoner, men egt bare 2 siden den ser på 1 tidsøyeblikk per dag.

Ved undersøkelse av de ulike variablene:

Finner vi ut at AL-BB-BH er bedre for en årlig analyse, men siden vi ser på sommersolverv og vi kan filtrere ut dårlig data. Konkluderer vi AL-BB-DH som best siden den gir bedre data for skyfrie dager.



In [None]:
import netCDF4

# Åpne en NetCDF-fil
file_path = '../data/albedo_effekt_data/NETCDF4_LSASAF_MSG_ALBEDO-D10v2_MSG-Disk_200406250000.nc'
dataset = netCDF4.Dataset(file_path, 'r')
# Skriv ut alle tilgjengelige variabler i datasetet
print(dataset.variables)


### Kode 3

Denne koden koprimer dataen vi trenger basert på kode 2 sin informasjon til csv slikt at vi kan bruke sql for å undersøke data.

Lagrer dataen i "data" med navnet csv_albedo_effekt


In [None]:
import os
import xarray as xr
import pandas as pd

# Lat og lon for alpene
y_min, y_max = 640, 715
x_min, x_max = 1700, 1900

# Fil plassering csv
csv_folder = os.path.join("..", "data", "csv_albedo_effekt")
os.makedirs(csv_folder, exist_ok=True)

# For løkke fra årene fra 2004 til 2024
for year in range(2004, 2025):
    # Filnavn og filsti.
    file_name = f"NETCDF4_LSASAF_MSG_ALBEDO-D10v2_MSG-Disk_{year}06250000.nc"
    file_path = os.path.join("..", "data", "albedo_effekt_data", file_name)
    
    # Åpne NetCDF-filen
    ds = xr.open_dataset(file_path)
    
    # Utsnitt av datasettet for å fokusere på regionen av interesse
    ds_utsnitt = ds.isel(lat=slice(y_min, y_max), lon=slice(x_min, x_max))
    
    # Ønskede variabler: AL-BB-DH, AL-BB-DH-ERR og quality_flag
    variables = ["AL-BB-DH", "AL-BB-DH-ERR", "quality_flag"]
    
    # Konverter de valgte variablene til en DataFrame
    df = ds_utsnitt[variables].to_dataframe().reset_index()
    
    # Sett sammen CSV-filnavnet med årstall
    csv_file_name = f"Albedo effekt {year}.csv"
    csv_file_path = os.path.join(csv_folder, csv_file_name)
    
    # Lagre DataFrame til CSV
    df.to_csv(csv_file_path, index=False)
    print(f"Data for {year} lagret som {csv_file_path}")


### Kode 4
I koden undersøker vi data kordinater som gir nøyaktig informasjon i alle de 21 årene.  
Vi bruker : 
Query, fra pandassql  
List comprehension for years og coords   
Og en Iterator i filtered_coords

Totalt antall områder med feil < 0.01 (1% feil) i alle år: 11573 kordinater.    
Koordinatene med best data lagret i ..\data\csv_albedo_effekt\data_m-lavfeilmargin.csv


In [None]:
import os
import pandas as pd
import pandasql as psql

# Fil path til CSV-filene
csv_folder = os.path.join("..", "data", "csv_albedo_effekt")

# Liste over årstall
years = [year for year in range(2004, 2025)]

# Variabel for å lagre de felles kvalifiserte koordinatene (lat, lon)
qualified_coords = None

# Funksjon som gir en iterator over filtrerte koordinater fra en fil
def filtered_coords(file_path):
    df = pd.read_csv(file_path)

    # SQL-spørring for å hente ut lat og lon med feil < 0.01
    query = """
    SELECT lat, lon
    FROM df
    WHERE `AL-BB-DH-ERR` < 0.01
    """
    result = psql.sqldf(query, locals())

    # Bruk en generator for å levere koordinater en etter en 
    for lat, lon in zip(result["lat"], result["lon"]):
        yield lat, lon

# Samle alle kvalifiserte koordinater fra hvert år
for year in years:
    file_path = os.path.join(csv_folder, f"Albedo effekt {year}.csv")

    # Bygger settet med koordinater
    coords = {coord for coord in fetch_filtered_coords(file_path)}
    print(f"{year}: {len(coords)} områder med feil < 0.01")
    
    # Finner felles koordinater mellom år
    qualified_coords = coords if qualified_coords is None else qualified_coords.intersection(coords)

print(f"\nTotalt antall områder med feil < 0.01 i alle år: {len(qualified_coords)}")

# Lagre resultatet i en CSV-fil i samme folder
output_file = os.path.join(csv_folder, "data_m-lavfeilmargin.csv")
df_result = pd.DataFrame(list(qualified_coords), columns=["lat", "lon"])
df_result.to_csv(output_file, index=False)
print(f"Koordinatene med best data lagret i {output_file}")


---
# Oppgave 2 konklusjon

Vi har funnet en pålitlig kilde med god datakvalitet, undersøkt dataen ved hjelp av list comprehensions, iteratorer og Pandas SQL og request for å få tilgang til dataen.
