# **Pandas: Esempi e Test Interattivi**

Questo notebook contiene esempi pratici su Pandas con test e commenti.

Esegui ogni cella per esplorare le funzionalità di Pandas.

In [1]:
import pandas as pd
import numpy as np
import ipywidgets as widgets
from IPython.display import display

## **1. Creazione di DataFrame e Series**
Creiamo un DataFrame e una Series.

In [2]:
data = {'Nome': ['Alice', 'Bob', 'Charlie'], 'Età': [25, 30, 35], 'Salario': [50000, 60000, 70000]}
df = pd.DataFrame(data)
print("DataFrame Creato:")
print(df)

serie = pd.Series([10, 20, 30], index=['a', 'b', 'c'])
print("Series Creata:")
print(serie)

DataFrame Creato:
      Nome  Età  Salario
0    Alice   25    50000
1      Bob   30    60000
2  Charlie   35    70000
Series Creata:
a    10
b    20
c    30
dtype: int64


## **2. Caricamento e Salvataggio Dati**
Salviamo e carichiamo i dati in CSV.

In [3]:
df.to_csv("data.csv", index=False)
print("DataFrame salvato come data.csv")

DataFrame salvato come data.csv


## **3. Selezione e Filtraggio Dati**
Estraiamo dati specifici dal DataFrame.

In [4]:
print("Colonna Nome:", df['Nome'])
print("Riga con Età > 28:")
print(df[df['Età'] > 28])

Colonna Nome: 0      Alice
1        Bob
2    Charlie
Name: Nome, dtype: object
Riga con Età > 28:
      Nome  Età  Salario
1      Bob   30    60000
2  Charlie   35    70000


## **4. Operazioni sui Dati**
Eseguiamo operazioni matematiche sulle colonne.

In [5]:
df['Salario Aumentato'] = df['Salario'] * 1.10
print("DataFrame con Salario aggiornato:")
print(df)

DataFrame con Salario aggiornato:
      Nome  Età  Salario  Salario Aumentato
0    Alice   25    50000            55000.0
1      Bob   30    60000            66000.0
2  Charlie   35    70000            77000.0


## **5. Statistiche e Aggregazioni**
Calcoliamo statistiche di base sui dati.

In [6]:
print("Media Età:", df['Età'].mean())
print("Massimo Salario:", df['Salario'].max())
print("Raggruppamento per Età:")
print(df.groupby('Età').sum())

Media Età: 30.0
Massimo Salario: 70000
Raggruppamento per Età:
        Nome  Salario  Salario Aumentato
Età                                     
25     Alice    50000            55000.0
30       Bob    60000            66000.0
35   Charlie    70000            77000.0


## **6. Unione e Join**
Esempio di join tra DataFrame.

In [8]:
data2 = {'Nome': ['Alice', 'Bob', 'Charlie'], 'Dipartimento': ['HR', 'IT', 'Finance']}
df2 = pd.DataFrame(data2)
df_merge = pd.merge(df, df2, on='Nome')
print("DataFrame Merge:")
print(df_merge)

DataFrame Merge:
      Nome  Età  Salario  Salario Aumentato Dipartimento
0    Alice   25    50000            55000.0           HR
1      Bob   30    60000            66000.0           IT
2  Charlie   35    70000            77000.0      Finance


## **7. Pulizia Dati**
Eliminiamo dati nulli o duplicati.

In [20]:
# Introduco valori NA
df_na = df.mask(np.random.random(df.shape) < 0.2)  # Replace 20% of data with NA

print("DataFrame con valori nulli:")
print(df_na)

DataFrame con valori nulli:
      Nome   Età  Salario  Salario Aumentato
0    Alice  25.0  50000.0                NaN
1      Bob   NaN  60000.0            66000.0
2  Charlie   NaN      NaN            77000.0


In [16]:
df_pulito = df_na.dropna()
print("DataFrame senza valori nulli:")
print(df_pulito)

DataFrame senza valori nulli:
    Nome  Età  Salario  Salario Aumentato
0  Alice   25    50000            55000.0
1    Bob   30    60000            66000.0


In [21]:
# Sostituisci i valori nulli
df_fill = df_na.fillna({'Nome': 'Sconosciuto', 'Età': 50, 'Salario': 0})

print("DataFrame dopo sostituzione:")
print(df_fill)

DataFrame dopo sostituzione:
      Nome   Età  Salario  Salario Aumentato
0    Alice  25.0  50000.0                NaN
1      Bob  50.0  60000.0            66000.0
2  Charlie  50.0      0.0            77000.0


## **8. Esempio Interattivo**
Seleziona una colonna per vedere le statistiche.

In [10]:
col = widgets.Dropdown(options=df.columns, description="Colonna:")
button = widgets.Button(description="Mostra Statistiche")

def on_button_click(b):
    print(f"Statistiche di {col.value}:")
    print(df[col.value].describe())

button.on_click(on_button_click)
display(col, button)

Dropdown(description='Colonna:', options=('Nome', 'Età', 'Salario', 'Salario Aumentato'), value='Nome')

Button(description='Mostra Statistiche', style=ButtonStyle())

Statistiche di Età:
count     3.0
mean     30.0
std       5.0
min      25.0
25%      27.5
50%      30.0
75%      32.5
max      35.0
Name: Età, dtype: float64
Statistiche di Salario Aumentato:
count        3.0
mean     66000.0
std      11000.0
min      55000.0
25%      60500.0
50%      66000.0
75%      71500.0
max      77000.0
Name: Salario Aumentato, dtype: float64
Statistiche di Età:
count     3.0
mean     30.0
std       5.0
min      25.0
25%      27.5
50%      30.0
75%      32.5
max      35.0
Name: Età, dtype: float64
