# Gestione di file CSV con Python
Questo notebook fornisce una guida dettagliata su come gestire i file CSV con Python utilizzando le librerie standard e Pandas.

In [None]:
## 1. Installazione delle librerie necessarie
pip install --upgrade pip
pip install pandas

Defaulting to user installation because normal site-packages is not writeable
Note: you may need to restart the kernel to use updated packages.
Defaulting to user installation because normal site-packages is not writeableNote: you may need to restart the kernel to use updated packages.



In [16]:
# Importazione delle librerie necessarie
import csv
import pandas as pd

## Caratteristiche della libreria [Pandas](https://pandas.pydata.org/)

Pandas è una libreria open-source per il linguaggio di programmazione Python, ampiamente utilizzata per la manipolazione e l'analisi dei dati:

1. **Strutture Dati Potenti**: Pandas fornisce due strutture dati principali: `Series` (per dati unidimensionali) e `DataFrame` (per dati bidimensionali), che sono altamente efficienti e facili da usare.
2. **Manipolazione dei Dati**: Pandas permette di eseguire operazioni di manipolazione dei dati come selezione, filtraggio, raggruppamento, fusione e aggregazione in modo semplice e intuitivo.
3. **Gestione dei Dati Mancanti**: Pandas offre strumenti per gestire i dati mancanti, come la rimozione o la sostituzione di valori nulli.
4. **Operazioni su Indici**: Pandas supporta operazioni avanzate sugli indici, come la reindicizzazione, l'impostazione e il reset degli indici.
5. **Input/Output**: Pandas supporta la lettura e la scrittura di dati da e verso vari formati di file, tra cui CSV, Excel, SQL, JSON e molti altri.
6. **Integrazione con Altre Librerie**: Pandas si integra bene con altre librerie scientifiche e di analisi dei dati in Python, come NumPy, SciPy, Matplotlib e scikit-learn.
7. **Prestazioni**: Pandas è ottimizzato per le prestazioni e può gestire grandi quantità di dati in modo efficiente.
Queste caratteristiche rendono Pandas uno strumento essenziale per chiunque lavori con i dati in Python.

## 1. Lettura di un file CSV utilizzando il modulo `csv`

In [17]:
# Creazione di un file CSV di esempio
with open('esempio.csv', mode='w', newline='', encoding='utf-8') as file:
    writer = csv.writer(file)
    writer.writerow(["Nome", "Età", "Città"])
    writer.writerow(["Alice", 25, "Roma"])
    writer.writerow(["Bob", 30, "Milano"])
    writer.writerow(["Charlie", 22, "Napoli"])

# Lettura del file CSV con il modulo `csv`
with open('esempio.csv', mode='r', encoding='utf-8') as file:
    reader = csv.reader(file)
    for row in reader:
        print(row)

['Nome', 'Età', 'Città']
['Alice', '25', 'Roma']
['Bob', '30', 'Milano']
['Charlie', '22', 'Napoli']


## 2. Scrittura di un file CSV utilizzando il modulo `csv`

In [18]:
# Scrittura di un nuovo file CSV
with open('nuovo_esempio.csv', mode='w', newline='', encoding='utf-8') as file:
    writer = csv.writer(file)
    writer.writerow(["ID", "Prodotto", "Prezzo"])
    writer.writerow([1, "Laptop", 1200])
    writer.writerow([2, "Smartphone", 800])
    writer.writerow([3, "Tablet", 300])

## 3. Lettura di un file CSV utilizzando Pandas

In [19]:
df = pd.read_csv('esempio.csv')
print(df)

df2 = pd.read_csv('nuovo_esempio.csv')
print(df2)

      Nome  Età   Città
0    Alice   25    Roma
1      Bob   30  Milano
2  Charlie   22  Napoli
   ID    Prodotto  Prezzo
0   1      Laptop    1200
1   2  Smartphone     800
2   3      Tablet     300


## 4. Scrittura di un DataFrame Pandas in un file CSV

In [20]:
dati = {
    "Nome": ["David", "Emma", "Francesco"],
    "Età": [28, 32, 25],
    "Città": ["Torino", "Genova", "Bologna"]
}

df_nuovo = pd.DataFrame(dati)

df_nuovo.to_csv('output.csv', index=False)

## 5. Aggiunta di dati a un file CSV esistente

In [21]:
with open('output.csv', mode='a', newline='', encoding='utf-8') as file:
    writer = csv.writer(file)
    writer.writerow(["Giorgio", 27, "Firenze"])

## 6. Lettura selettiva di colonne da un file CSV con Pandas

In [22]:
df_lettura = pd.read_csv('output.csv', usecols=["Nome", "Città"])
print(df_lettura)

        Nome    Città
0      David   Torino
1       Emma   Genova
2  Francesco  Bologna
3    Giorgio  Firenze


## 7. Filtrare i dati in un DataFrame Pandas

In [23]:
# Filtrare persone con età superiore a 25 anni
df_filtrato = df_nuovo[df_nuovo['Età'] > 25]
print(df_filtrato)

    Nome  Età   Città
0  David   28  Torino
1   Emma   32  Genova


## 8. Modifica di un file CSV esistente

In [24]:
df_modificato = pd.read_csv('output.csv')
df_modificato.loc[df_modificato['Nome'] == 'David', 'Età'] = 29
df_modificato.to_csv('output_modificato.csv', index=False)

## 9. Lettura di un file CSV direttamente da un URL con Pandas

Pandas permette di leggere file CSV direttamente da un URL utilizzando la funzione `pd.read_csv()`. Questo è particolarmente utile quando i dati sono ospitati online e non si desidera scaricarli manualmente. Ecco un esempio di come leggere un file CSV da un URL:

In [27]:
url = 'https://people.sc.fsu.edu/~jburkardt/data/csv/airtravel.csv'
df_url = pd.read_csv(url)
print(df_url.head())

  Month   "1958"   "1959"   "1960"
0   JAN      340      360      417
1   FEB      318      342      391
2   MAR      362      406      419
3   APR      348      396      461
4   MAY      363      420      472


In questo esempio, il file CSV contenente i dati di viaggio aereo viene letto direttamente dall'URL e caricato in un DataFrame Pandas. La funzione `head()` viene utilizzata per visualizzare le prime righe del DataFrame.