# Esame Laboratorio di Programmazione I
**Data: 15/03/2025**

Il file `WorldPopulationData.csv` contiene la serie temporale della popolazione mondiale registrata per diversi paesi dal 1960 al 2020. Il file ha le seguenti colonne:

• **Year**: Anno in formato numerico (es. 1960, 1961, ...)
• **Population**: Popolazione totale del paese 
• **Country**: Nome del paese (tutti i nomi sono in inglese)

Dobbiamo estrarre e analizzare i dati relativi ad un paese dato come input (ad esempio il "Brazil") e calcolare la variazione percentuale della popolazione tra due serie temporali di diversi paesi.

## Svolgimento

Chiamate il file in cui scrivere il vostro codice `esame_matricola.py` (la matricola è SMnumeri o ECnumeri). All'inizio del file scrivete un commento con il vostro nome e numero di matricola.

**Consegnate un codice che compila, se il codice non compila non sarà valutato!!!** Commentate bene il codice descrivendo quello che fate!!!

---

## 1. (10 punti) Lettura dei dati

Create la classe `CSVPopulationFile`:

• **(2 punti)** La classe deve essere istanziata con il nome del file tramite la variabile `filename`.

• **(8 punti)** Deve avere un metodo `get_population_data(country="Brazil")` che prende in input il nome di un paese, ad esempio il Brasile, e che restituisce una lista di liste, dove il primo elemento è l'anno (sotto forma di intero) e il secondo la popolazione (sotto forma di intero), per tutti e SOLO i valori del paese in input.

**Esempio d'uso:**
```python
population_file = CSVPopulationFile(filename="WorldPopulationData.csv")
brazil_data = population_file.get_population_data(country="Brazil")
```

---

## 2. (10 punti) Calcolo delle variazioni percentuali tra due serie temporali

Definire la funzione `calculate_growth_rates`, che prende in input due serie temporali di popolazione, un intervallo di anni e restituisce il dizionario delle variazioni percentuali annuali tra le due serie. **Attenzione**: possono esserci anni interi senza valori per un paese e non per un altro. Se ad una serie temporale manca un anno dell'intervallo, l'anno viene saltato nel calcolo delle variazioni. Gli anni dell'intervallo sono inseriti come tipi interi.

```python
calculate_growth_rates(population_series_1, population_series_2, start_year, end_year)
```

La funzione deve:

• **(2 punti)** Estrarre le popolazioni per ciascun anno nell'intervallo.

• **(2 punti)** Verificare che entrambe le serie abbiano dati per lo stesso anno.

• **(4 punti)** Calcolare la variazione percentuale tra le popolazioni delle due serie. Nel calcolo delle variazioni mantenere come ordine: 
   ```
   variazione_percentuale_2000 = ((popolazione_2000_serie_2 - popolazione_2000_serie_1) / popolazione_2000_serie_1) * 100
   ```

• **(2 punti)** Restituire un dizionario con le variazioni percentuali.

**Output atteso:**
```python
{
    2000: variazione_percentuale_2000,
    2001: variazione_percentuale_2001,
    2002: variazione_percentuale_2002,
    ...
}
```

**Hint:** Potete costruirvi una funzione a parte che estragga i dati per un anno specifico da una serie temporale, di modo da non dover scrivere due volte lo stesso codice.

---

## 3. (10 punti) Eccezioni e Controllo dell'input

Le eccezioni da alzare in caso di input non corretti o casi limite devono essere istanze di una specifica classe `ExamException`, che dovete definire nel codice come segue, senza modifica alcuna (copia-incollate le due righe):

```python
class ExamException(Exception):
    pass
```

... e che poi userete come una normale eccezione, ad esempio:
```python
raise ExamException("Errore: impossibile leggere il file")
```

Per l'esame dovete gestire le seguenti cose:

• **(2 punti)** La classe `CSVPopulationFile` deve controllare l'esistenza del file e deve controllare che non sia vuoto nell'`__init__()` (non in `get_population_data`) e, nel caso il file non esista alza un'eccezione (`"Errore: impossibile leggere il file"`) e nel caso non sia leggibile, alza un'eccezione (`"Errore: il file è vuoto o danneggiato"`).

• **(2 punti)** Se il nome del paese dato in input non è presente nel file, si deve alzare una eccezione in cui viene detto `"Errore: il paese specificato non è presente nel dataset"`.

• **(2 punti)** I valori che leggete dal file CSV sono da aspettarsi di tipo numerico, un valore non numerico, oppure vuoto non deve essere accettato, ma tutto deve procedere comunque senza alzare eccezioni.

• **(2 punti)** I valori inseriti dell'intervallo devono essere dei numeri interi, altrimenti bisogna alzare un'eccezione che dice `"Errore: gli anni devono essere numeri interi"`.

• **(2 punti)** L'intervallo selezionato deve contenere almeno un anno con dati validi per entrambe le serie, altrimenti alzare un'eccezione che dice `"Errore: nessun dato valido trovato nell'intervallo specificato"`.

---

## Parte opzionale (per la Lode)

Aggiungere un test che verifichi la correttezza del risultato della funzione `calculate_growth_rates`. Il test deve:

• Creare due serie temporali di esempio con valori noti.
• Chiamare la funzione `calculate_growth_rates` con questi dati.
• Confrontare i risultati ottenuti con quelli attesi (calcolati manualmente).
• Stampare un messaggio di successo se il test è superato o un errore in caso contrario.

**Esempio di test suggerito:**
```python
# Serie 1: [2020, 1000], [2021, 1100]
# Serie 2: [2020, 1200], [2021, 1320]  
# Variazione attesa 2020: ((1200-1000)/1000)*100 = 20.0%
# Variazione attesa 2021: ((1320-1100)/1100)*100 = 20.0%
```

In [7]:
class ExamException(Exception):
    """Custom exception for exam-related errors."""
    pass

class CSVPopulationFile:
	def __init__ (self, filename):
		self.name=filename
		try:
			with open(self.name, 'r') as file:
				# Check if the file can be opened and read
				file.readline()
		except:
			raise ExamException('non si apre')


	def get_population_data(self, country="Brazil"):
		""" prende country e ritorna una lista di liste  con come primo elemento [l'anno (int) , popolazione (int)] per tutti e solo i paesi in input vabbe è una query """
		try:
			with open(self.name, 'r') as file:
				data=[]
				for line in file:
					element=line.strip().split(',')
					if not element[0]=='year' and element[2]==country:
						try:
							anno=int(element[0])
							pop=int(element[1])
							data.append([anno,pop])
						except:
							continue
				return data
		except:
			raise ExamException("cant open the godamm file")
		
population_file = CSVPopulationFile(filename="WorldPopulationData.csv")
brazil_data = population_file.get_population_data(country="Brazil")
for year, population in brazil_data:
	print(f"Year: {year}, Population: {population}")



Year: 1960, Population: 72757000
Year: 1961, Population: 74890000
Year: 1962, Population: 77134000
Year: 1963, Population: 79493000
Year: 1964, Population: 81972000
Year: 1965, Population: 84571000
Year: 1966, Population: 87293000
Year: 1967, Population: 90142000
Year: 1968, Population: 93123000
Year: 1969, Population: 96242000
Year: 1970, Population: 99507000
Year: 1971, Population: 102935000
Year: 1972, Population: 106523000
Year: 1973, Population: 110273000
Year: 1974, Population: 114186000
Year: 1975, Population: 118264000
Year: 1976, Population: 122510000
Year: 1977, Population: 126926000
Year: 1978, Population: 131515000
Year: 1979, Population: 136280000
Year: 1980, Population: 141225000
Year: 1981, Population: 146352000
Year: 1982, Population: 151666000
Year: 1983, Population: 157176000
Year: 1984, Population: 162888000
Year: 1985, Population: 168809000
Year: 1986, Population: 174944000
Year: 1987, Population: 181298000
Year: 1988, Population: 187877000
Year: 1989, Population: 1