
# Frage 2 – Notebook 01: Daten einlesen

Dieses Notebook lädt die **Rohdaten** für die Zahlungsarten-Analyse (online & stationär) und die Umfrage.
Es speichert die unbearbeiteten Tabellen als CSV-Zwischenstände für die weiteren Notebooks.


## Pfade & Imports

In [1]:

from pathlib import Path
import pandas as pd

# Projekt-Root ermitteln (ggf. anpassen)
project_root = Path("D:/JupyterProject")

# Datenordner
data_path = project_root / "data"

pd.set_option("display.width", 140)
pd.set_option("display.max_rows", 10)


## 1) Online-Zahlungsarten (2019/2021/2023)

In [2]:

df2019 = pd.read_excel(data_path / "Online Zahlungsarten 2019.xlsx",
                       skiprows=4, sheet_name=1, usecols="B:C",
                       names=["Methode", "Prozent"])
df2021 = pd.read_excel(data_path / "Online Zahlungsarten 2021.xlsx",
                       skiprows=4, sheet_name=1, usecols="B:C",
                       names=["Methode", "Prozent"])
df2023 = pd.read_excel(data_path / "Online Zahlungsarten 2023.xlsx",
                       skiprows=4, sheet_name=1, usecols="B:C",
                       names=["Methode", "Prozent"])

print("2019:", df2019.shape, "2021:", df2021.shape, "2023:", df2023.shape)
df2019.head(), df2021.head(), df2023.head()


2019: (7, 2) 2021: (8, 2) 2023: (16, 2)


(                                        Methode  Prozent
 0  Über einen Bezahldienstleister (z.B. Paypal)     42.1
 1                                      Rechnung     28.5
 2                                   Kreditkarte     10.1
 3                               Per Überweisung      7.8
 4                               Per Lastschrift      5.7,
                      Methode  Prozent
 0                  E-Wallets       39
 1               Auf Rechnung       23
 2  Bezahlung mit Kreditkarte       10
 3          SEPA-Direktmandat        8
 4            Online-Transfer        6,
                                             Methode  Prozent
 0                         E-Wallet (Paypal, Alipay)       65
 1                     Per Rechnung (und Zahlschein)       43
 2                                            Klarna       28
 3  Kreditkarte einer inländischen Bank / Debitkarte       28
 4                                 Visa / Mastercard       26)

## 2) Stationärer Handel – Anteile Zahlungsarten

In [3]:

stationär = pd.read_excel(
    data_path / "Anteile von Zahlungsarten.xlsx",
    skiprows=4, sheet_name=1, usecols="B:J",
    names=["Jahr","Bar","Girocard","Kreditkarte","Lastschrift","Sonstige","Rechnung","Maestro/V-Pay","Handelskarte"]
)
stationär.head(3)


Unnamed: 0,Jahr,Bar,Girocard,Kreditkarte,Lastschrift,Sonstige,Rechnung,Maestro/V-Pay,Handelskarte
0,2016,51.3,24.3,6.1,13.4,0.6,2.5,0.9,0.6
1,2017,50.0,26.3,6.5,12.6,0.6,2.5,0.9,0.6
2,2018,48.3,30.1,6.9,10.0,0.6,2.5,1.0,0.6


## 3) Umfrage – Zahlungsarten & BNPL-Veränderung

In [4]:

umf = pd.read_excel(
    data_path / "Umfrage.xlsx",
    usecols="AP:AQ",
    names=["Zahlungsarten","BNPL_Veraenderung"]
)
umf.head(5)


Unnamed: 0,Zahlungsarten,BNPL_Veraenderung
0,PayPal;Sofortüberweisung;,Ich habe BNPL noch nie genutzt
1,PayPal;Kreditkarte;,Ich habe BNPL noch nie genutzt
2,PayPal;Apple Pay;,Ich habe BNPL noch nie genutzt
3,Rechnung;Kreditkarte;PayPal;,Ich habe BNPL noch nie genutzt
4,PayPal;Lastschrift;,Ich habe BNPL noch nie genutzt


## 4) Persistieren (roh)

In [5]:

out = project_root / "Frage2"
out.mkdir(exist_ok=True, parents=True)

df2019.to_csv(out / "online2019_raw.csv", index=False)
df2021.to_csv(out / "online2021_raw.csv", index=False)
df2023.to_csv(out / "online2023_raw.csv", index=False)
stationär.to_csv(out / "stationaer_raw.csv", index=False)
umf.to_csv(out / "umfrage_raw.csv", index=False)

print("Gespeichert nach:", out)


Gespeichert nach: D:\JupyterProject\Frage2
