# Excel-Dateien mit Pandas

In diesem Notebook werden alle wichtigen Möglichkeiten für den Import, Export und die Bearbeitung von Excel-Dateien mit Pandas gezeigt. Jede Codezeile wird detailliert erklärt.

## 1. Excel-Dateien einlesen

### `pd.read_excel()`
- Liest Excel-Dateien in einen Pandas DataFrame ein.
- Argument `sheet_name` erlaubt das Einlesen eines bestimmten Tabellenblatts.

In [2]:
import pandas as pd

# Excel-Datei von einer URL einlesen
# 'sheet_name' gibt das gewünschte Tabellenblatt an.
url = "data/testframe.xlsx"
df = pd.read_excel(url, sheet_name='Sheet1')
print("Eingelesene Excel-Datei - erste 5 Zeilen:")
print(df.head())

Eingelesene Excel-Datei - erste 5 Zeilen:
  Geschlecht      Größe     Gewicht
0       Male  73.847017  241.893563
1       Male  68.781904  162.310473
2       Male  74.110105  212.740856
3       Male  71.730978  220.042470
4       Male  69.881796  206.349801


### 1.1. Bestimmte Spalten und Zeilen einlesen
- Mit `usecols` werden nur bestimmte Spalten geladen.
- `nrows` begrenzt die Anzahl der Zeilen, die importiert werden.

In [3]:
# Nur bestimmte Spalten (A bis E) und die ersten 10 Zeilen einlesen
df_selected = pd.read_excel(url, sheet_name='Sheet1', usecols='A:B', nrows=10)
print("Excel-Datei mit bestimmten Spalten und Zeilen:")
print(df_selected)

Excel-Datei mit bestimmten Spalten und Zeilen:
  Geschlecht      Größe
0       Male  73.847017
1       Male  68.781904
2       Male  74.110105
3       Male  71.730978
4       Male  69.881796
5       Male  67.253016
6       Male  68.785081
7       Male  68.348516
8       Male  67.018950
9       Male  63.456494


## 2. Excel-Dateien exportieren

### `df.to_excel()`
- Exportiert einen Pandas DataFrame in eine Excel-Datei.
- Das Argument `sheet_name` gibt den Namen des Tabellenblatts an.

In [6]:
# DataFrame in eine Excel-Datei exportieren
# 'index=False' verhindert das Exportieren des Index
df_selected.to_excel('data/example_export.xlsx', index=False, sheet_name='Daten')
print("DataFrame wurde als 'example_export.xlsx' gespeichert.")

DataFrame wurde als 'example_export.xlsx' gespeichert.


### 2.1. Mehrere Tabellenblätter exportieren
- Verwenden Sie `pd.ExcelWriter`, um mehrere Tabellenblätter in derselben Excel-Datei zu speichern.

In [7]:
# Mehrere Tabellenblätter exportieren
# Erstelle eine Excel-Datei mit zwei Tabellenblättern
with pd.ExcelWriter('data/example_multi_sheet.xlsx') as writer:
    df.head(10).to_excel(writer, sheet_name='Tabelle_1', index=False)
    df.tail(10).to_excel(writer, sheet_name='Tabelle_2', index=False)
print("Excel-Datei mit mehreren Tabellenblättern exportiert.")

Excel-Datei mit mehreren Tabellenblättern exportiert.


## 3. Index und Kopfzeilen anpassen
- `index` steuert, ob der Index exportiert wird.
- Mit `header` können benutzerdefinierte Spaltennamen verwendet werden.

In [None]:
# Export ohne Index und mit benutzerdefinierten Spaltennamen
df_selected.to_excel('example_no_index.xlsx', index=False, header=['ID', 'Datum', 'Region', 'Produkt', 'Umsatz'])
print("Excel-Datei ohne Index und mit angepassten Kopfzeilen exportiert.")

## 4. Arbeiten mit mehreren Tabellenblättern
- Das Argument `sheet_name` ermöglicht das Einlesen spezifischer Tabellenblätter.

In [None]:
# Ein bestimmtes Tabellenblatt lesen
df_sheet2 = pd.read_excel(url, sheet_name='Returns')
print("Eingelesenes Tabellenblatt 'Returns' - erste 5 Zeilen:")
print(df_sheet2.head())

## 5. Fehlende Werte behandeln
- Mit `na_values` können fehlende Werte beim Import definiert werden.
- `na_rep` gibt den Ersatzwert für fehlende Werte beim Export an.

In [None]:
# Fehlende Werte beim Einlesen durch definierte Werte ersetzen
df_with_na = pd.read_excel(url, sheet_name='Orders', na_values=[''])
print("Daten mit fehlenden Werten (NA):")
print(df_with_na.head())

# Fehlende Werte beim Export durch 'N/A' ersetzen
df_with_na.to_excel('example_no_na.xlsx', na_rep='N/A', index=False)
print("Fehlende Werte wurden durch 'N/A' ersetzt und exportiert.")

## 6. Zusammenfassung

In diesem Notebook haben Sie gelernt:

1. **Excel-Dateien importieren** mit `pd.read_excel()` und `usecols`, `nrows`.
2. **Excel-Dateien exportieren** mit `df.to_excel()`.
3. Mehrere Tabellenblätter speichern mit `ExcelWriter`.
4. **Index und Kopfzeilen** anpassen.
5. Fehlende Werte behandeln mit `na_values` und `na_rep`.

Pandas bietet umfassende Werkzeuge zur effizienten Arbeit mit Excel-Dateien.