# CSV-Dateien mit Pandas

In diesem Notebook werden alle wichtigen Möglichkeiten für den Import, Export und die Bearbeitung von CSV-Dateien mit Pandas gezeigt.

## 1. CSV-Dateien einlesen

Verwenden Sie `pd.read_csv()` zum Importieren von CSV-Dateien.

In [None]:
import pandas as pd

# Beispiel: Einfache CSV-Datei einlesen
df = pd.read_csv('https://people.sc.fsu.edu/~jburkardt/data/csv/airtravel.csv')
print("Eingelesene CSV-Datei:")
print(df.head())

### 1.1. Bestimmte Spalten einlesen

Man kann mit dem Argument `usecols` gezielt Spalten importieren.

In [None]:
# Nur bestimmte Spalten einlesen
df_selected = pd.read_csv('https://people.sc.fsu.edu/~jburkardt/data/csv/airtravel.csv', usecols=[0, 1])
print("CSV mit bestimmten Spalten:")
print(df_selected.head())

### 1.2. Kopfzeilen und Index anpassen

Mit `header` und `index_col` kann die Kopfzeile und der Index definiert werden.

In [None]:
# Kopfzeile und Indexspalte anpassen
df_indexed = pd.read_csv('https://people.sc.fsu.edu/~jburkardt/data/csv/airtravel.csv', header=0, index_col=0)
print("CSV mit benutzerdefiniertem Index:")
print(df_indexed.head())

## 2. CSV-Dateien exportieren

Verwenden Sie `df.to_csv()` zum Exportieren von DataFrames in eine CSV-Datei.

In [None]:
# DataFrame in eine CSV-Datei exportieren
df.to_csv('example_export.csv', index=False)
print("DataFrame wurde als 'example_export.csv' gespeichert.")

### 2.1. Ohne Index exportieren

Standardmäßig exportiert Pandas den Index. Setzen Sie `index=False`, um das zu verhindern.

In [None]:
# Exportieren ohne Index
df_selected.to_csv('example_no_index.csv', index=False)
print("DataFrame ohne Index exportiert.")

### 2.2. Komprimierte CSV-Dateien exportieren

Man kann CSV-Dateien komprimieren, z.B. mit gzip oder zip.

In [None]:
# Komprimierte CSV-Datei exportieren
df.to_csv('example_compressed.csv.gz', compression='gzip', index=False)
print("Komprimierte CSV-Datei wurde gespeichert.")

## 3. CSV-Dateien mit Trennzeichen

CSV-Dateien können unterschiedliche Trennzeichen haben, z.B. Semikolon oder Tabulator.

In [None]:
# CSV-Datei mit Semikolon als Trennzeichen exportieren
df.to_csv('example_semicolon.csv', sep=';', index=False)
print("CSV-Datei mit Semikolon wurde gespeichert.")

## 4. Umgang mit fehlenden Werten

Fehlende Werte können beim Import oder Export behandelt werden.

In [None]:
# Fehlende Werte beim Einlesen ersetzen
df_with_na = pd.read_csv('https://people.sc.fsu.edu/~jburkardt/data/csv/airtravel.csv', na_values=[''])
print("Daten mit fehlenden Werten:")
print(df_with_na.head())

# Fehlende Werte beim Export ignorieren
df_with_na.to_csv('example_no_na.csv', na_rep='NA', index=False)
print("Fehlende Werte wurden mit 'NA' ersetzt und exportiert.")

## 5. Große CSV-Dateien einlesen

Verwenden Sie `chunksize`, um große CSV-Dateien in Teilen einzulesen.

In [None]:
# Große Datei in Teilen einlesen
chunk_iter = pd.read_csv('https://people.sc.fsu.edu/~jburkardt/data/csv/airtravel.csv', chunksize=2)
print("Erste zwei Zeilen des ersten Chunks:")
print(next(chunk_iter))

## 6. Zusammenfassung

- **Import**: `pd.read_csv()`
- **Export**: `to_csv()`
- **Index**: Mit `index_col` oder `index=False` arbeiten
- **Kompression**: Mit `compression` komprimieren
- **Große Dateien**: `chunksize` verwenden