**Pandas** è il "coltellino svizzero" per eccellenza per manipolare i dati che ci sono dentro.

---
## 0. Installazione
```bash
# installazione il modulo Pandas 
pip install pandas

# installazione includendo la dipendenza per la lettura di file Excel:
pip install "pandas[excel]"
```
---

## 1. Il cuore di Pandas: Il DataFrame

Immagina il DataFrame come una tabella Excel, ma potenziata. Ha righe, colonne e indici.

```python
import pandas as pd
from pathlib import Path

# Usiamo quello che abbiamo imparato con pathlib!
BASE_DIR = Path(__file__).resolve().parent
file_input = BASE_DIR / "europe.xlsx"

# Caricare i dati
df = pd.read_excel(file_input)

```

---

## 2. Ispezionare i dati (Cosa c'è dentro?)

Prima di lavorare, devi capire cosa hai caricato.

* `df.head()`: Mostra le prime 5 righe.
* `df.info()`: Ti dice i nomi delle colonne, quanti dati mancano e il tipo di dati (numeri, stringhe, date).
* `df.describe()`: Calcola statistiche veloci (media, minimo, massimo) per le colonne numeriche.
* `df.columns`: Ti restituisce la lista dei nomi delle colonne.

---

## 3. Selezionare e Filtrare

Questa è la parte dove Pandas brilla.

```python
# Selezionare una colonna specifica
nazioni = df['Country']

# Filtrare: prendi solo le righe dove la popolazione è maggiore di 10 milioni
grandi_nazioni = df[df['Population'] > 10_000_000]

# Selezionare più colonne
sotto_tabella = df[['Country', 'Capital', 'GDP']]

```

---

## 4. Manipolare e Pulire (Data Cleaning)

Spesso i dati sono "sporchi". Ecco come sistemarli:

* **Rinominare colonne:**
`df.rename(columns={'OldName': 'NewName'}, inplace=True)`
* **Gestire i dati mancanti:**
`df.dropna()` (elimina righe con valori vuoti) o `df.fillna(0)` (sostituisce i vuoti con 0).
* **Creare nuove colonne:**
`df['GDP_pro_capite'] = df['GDP'] / df['Population']`

---

## 5. Ordinare e Raggruppare (Aggregazioni)

Se vuoi analizzare i dati come faresti con una Tabella Pivot:

```python
# Ordinare per una colonna
df_ordinato = df.sort_values(by='Population', ascending=False)

# Raggruppare (es. media del PIL per ogni Regione)
media_per_regione = df.groupby('Region')['GDP'].mean()

```

---

## 6.1 Esportare i risultati (.csv)

Una volta finita la manipolazione, puoi salvare il tuo lavoro...

```python
file_output = BASE_DIR / "europe_pulito.csv"

# Esportare in CSV (senza l'indice numerico a sinistra)
df.to_csv(file_output, index=False, sep=';', encoding='utf-8')

```
## 6.2 Esportare i risultati in file Excel (.xlsx)

Una volta finita la manipolazione, puoi salvare il tuo lavoro...

```python
# costruiamo il path del file excel mergiato
OUTPUT = os.path.join(FOLDER, 'output') 
file_name = 'merged.xlsx'
merged_path = os.path.join(OUTPUT, file_name)

# ---- ESPORTIAMO IN MERGE DATA FRAME -----
dataframes = [pd.read_excel(filepath) for filepath in filepaths]
merged_df = pd.concat(dataframes, ignore_index=True)
merged_df.to_excel(merged_path, index=False)

```
---

### Tabella dei Comandi Rapidi

| Operazione | Comando |
| --- | --- |
| **Leggi Excel** | `pd.read_excel('file.xlsx')` |
| **Leggi CSV** | `pd.read_csv('file.csv')` |
| **Filtra righe** | `df[df['colonna'] == valore]` |
| **Elimina colonna** | `df.drop(columns=['nome_colonna'])` |
| **Salva in CSV** | `df.to_csv('nome.csv')` |