# Practice Problem - Temperatures

Use the [data/munich_temperatures_average.txt](data/munich_temperatures_average.txt) data file, which gives the temperature in Munich every day for several years. Read in the data, and print out the minimum, average maximum temperature for each year, e.g:

    1995: -3C  10C  35C
    1996: ...
    
You can also try and print out the same values, but for each month (averaged over years), e.g.:

    January: -15C 0C 3C
    February: ...

# Solution

## STEP 1: Import Data
Importa il file con i dati.

In [189]:
with open("data/munich_temperatures_average.txt", "r") as file:
    lines = file.readlines()

## STEP 2: Data analysis and manipulation
Osservando il file dati si osserva che ci soon 2 colonne:
- La prima colonna contiene le date in format decimal.
- La seconds colonna continue la temperature in gradi celsius.

Di seguito vengono riportaate tre colonne di esempio:

In [190]:
for line in lines[0:3]:
    print(line)

1995.00274 0.944444

1995.00548 -1.61111

1995.00821 -3.55556



Al fine di rendere intellegibili le date creiamo una funzioni che trasformi le date dal formato **'decimal'** al formato **'date'**, chiamiamo la funzione **_decimal_year_to_date_**.

Per costruire la funzione utiliziamo il modulo built-in **datetime**.

In [191]:
# Funzione decimal_year_to_date

from datetime import datetime, timedelta

def decimal_year_to_date(decimal_year):
    year = int(decimal_year)  # Estrai l'anno intero
    fraction = decimal_year - year  # Estrai la parte decimale

    # Calcola il numero di giorni nell'anno (considerando gli anni bisestili)
    days_in_year = 365 + (1 if (year % 4 == 0 and (year % 100 != 0 or year % 400 == 0)) else 0)

    # Calcola il numero di giorni trascorsi nell'anno
    days_elapsed = fraction * days_in_year

    # Aggiungi i giorni al 1° gennaio dello stesso anno
    start_date = datetime(year, 1, 1)
    final_date = start_date + timedelta(days=days_elapsed)

    return final_date

Analiziamo ora l'output della funzione creata utilizzando il pacchetto **datetime** si può osservare che l'output di **datetime** è un parametro con type = **<class 'datetime.datetime'>**.

In [192]:
# Test con il tuo valore
decimal_year = 1995.01643
result = decimal_year_to_date(decimal_year)

# Stampa risultato in formato completo
print(result)
print(type(result))
print()
# Stampa il risultato in formato leggibile
print(result.strftime("%Y-%m-%d"))  # Output: 1995-01-01
print(result.strftime("%Y"))
print(result.strftime("%B"))
print(result.strftime("%b"))
print()
print(result.year)
print(result.month)
print()
print(type(result.month))

1995-01-06 23:55:36.479997
<class 'datetime.datetime'>

1995-01-06
1995
January
Jan

1995
1

<class 'int'>


## STEP 3: Riorganizzare i dati una struttura filtrabile

Al fine di risolvere i due quesiti richiesti è necessario ordinare i dati in una struttura che abbia la possibilità di essere filtrata e manipolata. 

Una buona soluzione per rendere filtrabili i dati è quella di riordinarli in una **lista di dizionari**.

In [193]:
# Crea una list con tutti i dati necessari
list_of_dict = []

# Loop over lines and extract variables of interest
for line in lines:
    line = line.strip()
    columns = line.split()
    decimal_year = float(columns[0])
    temp = float(columns[1])
    date = decimal_year_to_date(decimal_year)
    year = date.year
    month = date.month
    day = date.day
    hour = date.hour
    d = {"year":year, "month":month, "day":day, "temp":temp}

    list_of_dict.append(d)

Di seguito viene stampato il risultato della lista di dizionari e la sua architettura.

In [194]:
for i in range(5):
    print(list_of_dict[i])

{'year': 1995, 'month': 1, 'day': 2, 'temp': 0.944444}
{'year': 1995, 'month': 1, 'day': 3, 'temp': -1.61111}
{'year': 1995, 'month': 1, 'day': 3, 'temp': -3.55556}
{'year': 1995, 'month': 1, 'day': 4, 'temp': -9.83333}
{'year': 1995, 'month': 1, 'day': 5, 'temp': -10.2222}


## STEP 4: CALCOLA e PRINTA minimum, average maximum temperature for each year
    1995: -3C  10C  35C 
    1996: ...


In [195]:
import numpy as np

# calcola il range di anni
year_min = min(y["year"] for y in list_of_dict)
year_max = max(y["year"] for y in list_of_dict)

# calcola e printa la temp min avg e max per ogni anno
for year in range(year_min, year_max+1):
    
    temp_min = min(sample["temp"] for sample in list_of_dict if sample["year"] == year)
    temp_mean = np.mean(list(sample["temp"] for sample in list_of_dict if sample["year"] == year))
    temp_max = max(sample["temp"] for sample in list_of_dict if sample["year"] == year)

    print(f"{year}: {temp_min:.1f}C, {temp_mean:.1f}C, {temp_max:.1f}") 

1995: -13.3C, 8.8C, 25.9
1996: -15.5C, 7.2C, 23.8
1997: -12.9C, 8.5C, 21.6
1998: -12.2C, 9.2C, 25.5
1999: -9.8C, 9.1C, 25.3
2000: -16.8C, 9.8C, 24.8
2001: -12.2C, 9.0C, 24.6
2002: -11.1C, 9.9C, 25.1
2003: -14.3C, 9.4C, 27.7
2004: -10.8C, 8.9C, 23.0
2005: -14.1C, 8.2C, 25.1
2006: -11.3C, 9.2C, 25.9
2007: -8.8C, 9.8C, 26.3
2008: -5.1C, 9.7C, 24.1
2009: -10.8C, 9.4C, 23.3
2010: -9.3C, 8.3C, 25.7
2011: -9.3C, 9.7C, 25.5
2012: -15.4C, 9.2C, 24.7
2013: -7.4C, 0.6C, 11.2


## STEP 5: CALCOLA E PRINTA minimum, average maximum temperature for each month averaged over years
    January: -15C 0C 3C
    February: ...


In [196]:
import numpy as np
import calendar

# calcola e printa min avg e max per ogni mese
for month in range(1,12+1):
    
    temp_min = min(sample["temp"] for sample in list_of_dict if sample["month"] == month)
    temp_mean = np.mean(list(sample["temp"] for sample in list_of_dict if sample["month"] == month))
    temp_max = max(sample["temp"] for sample in list_of_dict if sample["month"] == month)

    print(f"{calendar.month_name[month]}: {temp_min:.1f}C {temp_mean:.1f}C {temp_max:.1f}C")

January: -16.8C -0.9C 12.2C
February: -15.4C 0.7C 11.9C
March: -14.1C 4.3C 16.3C
April: -2.1C 9.1C 20.7C
May: 5.2C 14.0C 23.2C
June: 7.3C 17.1C 25.1C
July: 10.5C 18.4C 26.3C
August: 9.5C 18.2C 27.7C
September: 3.9C 13.7C 22.7C
October: -1.4C 9.4C 20.5C
November: -7.1C 3.7C 14.2C
December: -15.5C 0.2C 11.3C


# NOTA - Ciclo for vs Pythonist

## confronto della soluzione for vs pythonist per step 4

In [197]:
# con il ciclo for
list_of_years = []
for sample in list_of_dict:
    y = sample["year"]
    list_of_years.append(y)

year_min = min(list_of_years)
year_max = max(list_of_years)

# versione Pythonic
list_of_years = [y["year"] for y in list_of_dict] # nel caso mi servisse la list of years

year_min = min(y["year"] for y in list_of_dict)
year_max = max(y["year"] for y in list_of_dict)

In [198]:
import numpy as np

# con il ciclo for
list_of_temp = []
for sample in list_of_dict:
    if sample["year"] == 1995:
        list_of_temp.append(sample["temp"])

temp_min = min(list_of_temp)
temp_mean = np.mean(list_of_temp)
temp_max = max(list_of_temp)

# versione Pythonic
list_of_temp = [sample["temp"] for sample in list_of_dict if sample["year"] == 1995]

temp_min = min(sample["temp"] for sample in list_of_dict if sample["year"] == 1995)
# temp_mean = np.mean(sample["temp"] for sample in list_of_dict if sample["year"] == 1995)
# np.mean() si aspetta un array, lista o altra struttura iterabile,
# ma se gli passi un generatore lo tratta come un singolo oggetto iterabile invece di iterarlo.
temp_mean = np.mean(list(sample["temp"] for sample in list_of_dict if sample["year"] == 1995))
temp_max = max(sample["temp"] for sample in list_of_dict if sample["year"] == 1995)

## confronto della soluzione for vs pythonist per step 5

In [199]:
import numpy as np

# con il ciclo for
list_of_temp = []
for sample in list_of_dict:
    if sample["month"] == 1:
        list_of_temp.append(sample["temp"])

temp_min = min(list_of_temp)
temp_mean = np.mean(list_of_temp)
temp_max = max(list_of_temp)

# versione Pythonic
list_of_temp = [sample["temp"] for sample in list_of_dict if sample["month"] == 1]

temp_min = min(sample["temp"] for sample in list_of_dict if sample["month"] == 1)
# temp_mean = np.mean(sample["temp"] for sample in list_of_dict if sample["month"] == 1)
# np.mean() si aspetta un array, lista o altra struttura iterabile,
# ma se gli passi un generatore lo tratta come un singolo oggetto iterabile invece di iterarlo.
temp_mean = np.mean(list(sample["temp"] for sample in list_of_dict if sample["month"] == 1))
temp_max = max(sample["temp"] for sample in list_of_dict if sample["month"] == 1)