**Guida all’uso di Pandas Profiling**

Pandas Profiling è una libreria Python che semplifica l'analisi esplorativa dei dati (EDA). Genera automaticamente report dettagliati su un DataFrame Pandas, includendo statistiche descrittive, distribuzioni delle variabili, rilevamento di valori mancanti e molto altro.

---

### **Installazione**

Prima di utilizzare Pandas Profiling, è necessario installarlo:

```bash
pip install pandas-profiling
```

---

### **Come Utilizzare Pandas Profiling**

#### **Importazione della libreria**

```python
import pandas as pd
from pandas_profiling import ProfileReport
```

#### **Creazione di un DataFrame di esempio**

```python
data = {
    'Nome': ['Anna', 'Luca', 'Marta', 'Paolo', 'Giulia'],
    'Età': [25, 32, 29, 40, 22],
    'Reddito': [50000, 60000, 75000, 90000, 45000],
    'Città': ['Milano', 'Roma', 'Napoli', 'Roma', 'Milano']
}

df = pd.DataFrame(data)
```

#### **Generazione del Report**

Per generare un report:

```python
profile = ProfileReport(df, title="Profilo del DataFrame", explorative=True)
profile.to_file("report.html")
```

Questo codice salva un report HTML completo.

---

### **Metodi Principali di Pandas Profiling**

#### **1. ProfileReport**

- **Sintassi**: `ProfileReport(df, title="Titolo", explorative=True)`
- Genera un oggetto report dal DataFrame fornito.
- Parametri principali:
  - `df`: il DataFrame Pandas da analizzare.
  - `title`: titolo del report (opzionale).
  - `explorative`: se impostato a `True`, include funzionalità aggiuntive come la correlazione avanzata.

#### **2. to_file**

- **Sintassi**: `profile.to_file("nome_file.html")`
- Salva il report in un file HTML o JSON.

#### **3. to_notebook_iframe**

- **Sintassi**: `profile.to_notebook_iframe()`
- Mostra il report direttamente in un Jupyter Notebook.

#### **4. to_widgets**

- **Sintassi**: `profile.to_widgets()`
- Visualizza il report come widget interattivo in un notebook Jupyter.

#### **5. get_description**

- **Sintassi**: `profile.get_description()`
- Restituisce un dizionario contenente le statistiche del report.
- Esempio:

```python
description = profile.get_description()
print(description)
```

---

### **Funzionalità del Report**

#### **1. Panoramica Generale**
- Numero di variabili
- Numero di osservazioni
- Valori mancanti
- Tipo di variabili (numeriche, categoriche, booleane, etc.)

#### **2. Statistiche Descrittive**
- Media, mediana, deviazione standard, valori minimi e massimi per variabili numeriche.
- Conteggio delle categorie per variabili categoriche.

#### **3. Correlazioni**
- Analisi delle correlazioni utilizzando Pearson, Spearman o Kendall.
- Matrice di correlazione visiva.

#### **4. Valori Mancanti**
- Conteggio e percentuale di valori nulli per ogni colonna.
- Visualizzazioni come heatmap per identificare schemi di valori mancanti.

#### **5. Distribuzioni delle Variabili**
- Istogrammi per variabili numeriche.
- Diagrammi a torta per variabili categoriche.

#### **6. Rilevamento di Valori Anomali**
- Identificazione di outlier utilizzando tecniche statistiche.

#### **7. Report Interattivo**
- Possibilità di esplorare ogni variabile cliccando sul suo nome.

---

### **Esempio Completo**

```python
import pandas as pd
from pandas_profiling import ProfileReport

# Creazione del DataFrame
data = {
    'Nome': ['Anna', 'Luca', 'Marta', 'Paolo', 'Giulia'],
    'Età': [25, 32, 29, 40, 22],
    'Reddito': [50000, 60000, 75000, 90000, 45000],
    'Città': ['Milano', 'Roma', 'Napoli', 'Roma', 'Milano']
}

df = pd.DataFrame(data)

# Creazione del profilo
profile = ProfileReport(df, title="Profilo del DataFrame", explorative=True)

# Salvataggio del report
profile.to_file("report.html")

# Visualizzazione in un notebook
profile.to_notebook_iframe()
```

---

### **Vantaggi di Pandas Profiling**

1. **Semplicità**: Non richiede configurazioni complesse.
2. **Automatizzazione**: Genera automaticamente una panoramica dettagliata del dataset.
3. **Interattività**: I report sono ricchi di grafici e statistiche visive.
4. **Esportazione**: Puoi salvare i report per condividerli o consultarli successivamente.

---

Con Pandas Profiling, è possibile eseguire un'analisi esplorativa dei dati completa in pochi passaggi, risparmiando tempo e aumentando l'efficienza del flusso di lavoro.