# 📊 Guida completa a Pandas 


In [1]:
import pandas as pd
import numpy as np

## 📌 Series e DataFrame
Pandas lavora principalmente con due strutture dati:
- `Series`: array unidimensionale con etichette
- `DataFrame`: tabella bidimensionale (tipo Excel)

In [None]:
# Serie
s = pd.Series([10, 20, 30], index=['a', 'b', 'c'])
print(s)

# DataFrame
df = pd.DataFrame({'Nome': ['Anna', 'Luca', 'Marco'], 'Età': [22, 35, 28]})
print(df)

## 🏗️ Creazione e ispezione di DataFrame

In [None]:
# Info, forma e prime righe
print(df.info())
print(df.shape)
print(df.head())

## 📥 Importazione / esportazione dati

In [None]:
# CSV
# df = pd.read_csv('dati.csv')

# Excel
# df = pd.read_excel('dati.xlsx')

# Salvataggio
# df.to_csv('output.csv', index=False)
# df.to_excel('output.xlsx', index=False)

## 🔎 Selezione e filtraggio

In [None]:
# Colonna
df['Età']

# Righe
df.loc[0]        # per etichetta
df.iloc[1]       # per posizione

# Filtro
df[df['Età'] > 25]

## ✏️ Manipolazione di righe e colonne

In [None]:
# Aggiunta colonna
df['Senior'] = df['Età'] > 30

# Rimozione
df = df.drop(columns='Senior')

# Rinominare
df.rename(columns={'Età': 'Eta'}, inplace=True)

## ❓ Valori mancanti

In [None]:
df2 = pd.DataFrame({'A': [1, np.nan, 3], 'B': [4, 5, np.nan]})

# Controllo
df2.isnull()

# Rimozione o riempimento
df2.dropna()
df2.fillna(0)

## 🔗 Groupby e aggregazioni

In [None]:
df_group = pd.DataFrame({
    'Categoria': ['A', 'A', 'B', 'B'],
    'Valore': [10, 20, 30, 40]
})

df_group.groupby('Categoria').sum()

<pandas.core.groupby.generic.DataFrameGroupBy object at 0x13ccad810>

## 🔁 Merge e Join

In [None]:
df1 = pd.DataFrame({'ID': [1, 2], 'Nome': ['Anna', 'Luca']})
df2 = pd.DataFrame({'ID': [1, 2], 'Età': [22, 35]})

pd.merge(df1, df2, on='ID')

## 🔃 Ordinamento e trasformazioni

In [None]:
df.sort_values(by='Eta', ascending=False)
df['Eta'].apply(lambda x: x * 2)

## 🔄 Pivot, Melt, Stack, Unstack

In [None]:
df_pivot = pd.DataFrame({
    'Data': ['2023-01', '2023-01', '2023-02'],
    'Categoria': ['A', 'B', 'A'],
    'Valore': [10, 20, 30]
})

# Pivot
df_pivot.pivot(index='Data', columns='Categoria', values='Valore')

# Melt
pd.melt(df_pivot, id_vars='Data')

# Stack / Unstack
df_pivot.set_index(['Data', 'Categoria']).unstack()

## 🕒 Date e orari

In [None]:
date_rng = pd.date_range(start='2023-01-01', end='2023-01-10', freq='D')
df_dates = pd.DataFrame(date_rng, columns=['data'])

# Aggiunta colonna giorno
df_dates['giorno'] = df_dates['data'].dt.day_name()
print(df_dates.head())

## ✅ Suggerimenti utili e best practices
- Usa `.copy()` quando modifichi porzioni di DataFrame
- Controlla sempre `.info()` per avere una panoramica
- Combina Pandas con Matplotlib o Seaborn per analisi visiva